Descripción
Los temas 'basura' en Twitter

twitter-spam.jpg

Que se utilicen los trending topic o temas más populares de Twitter para difundir contenido "basura" (spam) se ha convertido en una práctica bastante habitual. Para solventarlo, investigadores de la UNED han desarrollado un método estadístico que permite detectar el contenido basura en esta conocida plataforma de microblogging. Para demostrar su eficacia, han analizado 20 millones de mensajes, 34.000 trending topics y seis millones de direcciones webs.

De todo el contenido analizado, la herramientaclasificó correctamente el 93,7% de los mensajes maliciosos y el 89,3% de los mensajes válidos. “Solo el 6,3% de tuits válidos fueron clasificados erróneamente como basura”, explica Juan Martínez-Romo, investigador del departamento de Lenguajes y Sistemas Informáticos de la UNED y coautor del trabajo. 

La investigación, que se publica en la revista Expert Systems with Applications, utiliza modelos del lenguaje para detectar el spam y, a diferencia de otros métodos, no analiza perfiles de usuarios sino tuits. “La creación de nuevos usuarios es muy sencilla, lo que provoca que la eliminación de los perfiles de spammers sea una tarea infructuosa, porque inmediatamente o en paralelo, la misma persona dispone de otras cuentas de usuario desde las que enviar contenido basura”, comenta Martínez-Romo. 

Los modelos del lenguaje utilizados por los investigadores son herramientas estadísticas que definen la estructura del lenguaje y que resultan muy útiles en aplicaciones con una sintaxis o semántica compleja, como ocurre con Twitter. Puesto que los trending topics tratan temas concretos, los investigadores han construido un modelo con los mensajes que se refieren a ese tema. “De esta forma, podemos detectar aquellos nuevos mensajes que no se correspondan con ese modelo y, por tanto, sean spam”, asegura Lourdes Araujo,coautora del estudio. 

Para afinar más la herramienta, como algunos mensajes maliciosos tienen apariencia de válidos, el método analiza también el contenido de las páginas webs que se enlazan en el mensaje. Por ejemplo, si un tema popular es David Bowie, y el enlace de la página web de un tuit lleva a un portal de productos farmacéuticos, ese mensaje sería clasificado como spam. 

El método puede ser implementado en tiempo real y de forma sencilla en los servidores de Twitter, algo a lo que están abiertos los investigadores, en el caso de que la compañía norteamericana quisiera incluir su algoritmo.

Fuente:muyinteresante.es

Fotos
Comentarios
Ordenar por: 
Por página :
 
  • Aún no hay comentarios
Artículos Relacionados
La famosa red social es conocida por haber censurado mas de una foto de nuestras estrellas favoritas entre otros posts. Aquí te damos un ejemplo.
08.05.2015 · De Claudia_fb2
Google+ no ha finalizado de despegar como red social y la salida de Vic Gundotra, su creador, pone en riesgo su continuidad.
04.26.2014 · De Rosy
El cantante mexicano, Cristian Castro, publicó una foto donde sale vestido de mujer después de la grabación de su nuevo video. "Ayer por fin pude salir del closet" escribió el cantante quién también se refirió a Ricky Martin de una forma irónica.
04.07.2014 · De armando
Lucero escribio en Twitter un mensaje de apoyo para los paises donde se habían alertado de un posible Tsunami.
04.07.2014 · De armando
La compañía californiana Google está desarrollando una tecnología que será capaz de crear conexiones a internet de 10 gigabits por segundo, mil veces más veloces que la media actual de tasa de transferencia de datos a través de la red en EE.UU., según publicó hoy Los Angeles Times.
02.15.2014 · De wenalo
Autor
SuperTigeroLIVH
Me Siento Como Diario :D
05.28.2013 21:26 (05.28.2013)
374 Vista(s)
0 Suscriptor(es)
Ver todos los Artículos de SuperTigeroLIVH
Calificación
0 votos
Recomiendalo