Publication:
Extracción, análisis y visualización de información social desde Twitter

Loading...
Thumbnail Image
Official URL
Full text at PDC
Publication Date
2014
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citations
Google Scholar
Research Projects
Organizational Units
Journal Issue
Abstract
Hoy en día, cada vez tiene más importancia que el contenido de la web sea accesible en el mismo momento de su creación. Al mismo tiempo, Twitter es una red social ampliamente utilizada para acceder a información en tiempo real ya que la gran mayoría de su contenido es accesible de forma pública. El objetivo de este proyecto es la extracción y análisis de información accesible a través de Twitter, así como la investigación de las posibilidades existentes para su procesamiento y posterior visualización. En este proyecto se hace una revisión tanto de artículos de investigación como de servicios relacionados con el uso de información que provee Twitter, seguida de la definición de un marco teórico que clasifique toda esa información. Se presenta el diseño de un sistema orientado en la extracción y procesamiento de información obtenida desde Twitter en español. Se han determinado tres estrategias de generación de información: la detección de género de los usuarios, la categorización de tweets por contenido y el posicionamiento de tweets por áreas geográficas. Adicionalmente, el sistema ofrece a aplicaciones externas la posibilidad de acceder a la información generada. Por último, se describe como ejemplo de uso una aplicación web que permite visualizar la información recogida y procesada por el sistema de diferentes formas. En ella se puede tanto interactuar con información en tiempo real como visualizar de forma gráfica la información almacenada.
Nowadays, there is an increment on the need of real-time data. As a result of his policy of allowing access to the large majority of its content, Twitter is a social network widely used to obtain real-time information. This project aims to extract and to analyze information accessible via Twitter, as well as to research on the existing opportunities for its processing and subsequent graphical display. We have made an extensive review of research papers and Twitter-based services related to the information provided by Twitter, in addition to the definition of a theoretical framework that classifies this information. We have designed a system to digest data extracted and processed from Twitter in spanish. We determined three data generation strategies: detection of user's gender, categorization by content of tweets and geospatial display of tweets. The system also offers to external applications the possibility of accessing this generated data. Lastly, we have built a web application as an example of how to display information extracted and processed by the system. The application interacts with real-time information in addition to displaying graphically stored data.
Description
Proyecto de Sistemas Informáticos (Facultad de Informática, Curso 2013-2014)
Keywords
Citation