Metodología para extracción de tópicos relevantes de la red social Twitter

Rubén Carvajal, Carmen Vaca, Charlie Medina, Cesar Madrid

Resumen


Existe un rápido incremento en la producción de información y datos de manera virtual, debido a sitios de microblogging como Twitter, red social que produce en promedio 6,000 tweets por segundo, y hasta 500 millones de tweets al día. Razón por la cual esta y muchas otras redes sociales presentan una sobrecarga de contenidos, dificultando a los usuarios la identificación de tópicos de información por la gran cantidad de tweets hablando de diferentes temas. Debido a esta incertidumbre que perjudica a los mismos usuarios que han creado el contenido, se propone un método que a través de la selección de perfiles de usuarios expertos en deportes y política, infiere cuáles son los tópicos más representativos que han ocurrido en un marco de tiempo de 1 día. Esto se calcula tomando en consideración la cantidad de veces que este tópico ha sido mencionado por los expertos en sus timelines. Este experimento incluyó un dataset extraído de Twitter, que contiene 5,815 tweets referentes a deportes y 4,648 tweets referentes a política. Todos los tweets fueron obtenidos de timelines de usuarios seleccionados por los investigadores, que fueron considerados como expertos en sus respectivos temas debido al contenido de sus tweets. Los resultados muestran que la selección efectiva de los usuarios junto con el índice de relevancia implementado para los tópicos puede ayudar a encontrar con mayor facilidad tópicos importantes tanto en tema deportivo, como político

Palabras clave


Redes sociales; microblogging; twitter; tópicos; LDA

Texto completo:

.PDF

Enlaces refback

  • No hay ningún enlace refback.


Una publicación de la Escuela Superior Politécnica del Litoral (ESPOL).

Revista Tecnológica ESPOL - ISSN 1390-3659