Universidad Complutense de Madrid
E-Prints Complutense

Extracción, análisis y visualización de información social desde Twitter

Impacto

Downloads

Downloads per month over past year



Artero Anguita, Manuel and Marcos Lorenzo, Raúl (2014) Extracción, análisis y visualización de información social desde Twitter. [Coursework] (Unpublished)

[img]
Preview
PDF
2MB


Abstract

Hoy en día, cada vez tiene más importancia que el contenido de la web sea accesible en el mismo momento de su creación. Al mismo tiempo, Twitter es una red social ampliamente utilizada para acceder a información en tiempo real ya que la gran mayoría de su contenido es accesible de forma pública. El objetivo de este proyecto es la extracción y análisis de información accesible a través de Twitter, así como la investigación de las posibilidades existentes para su procesamiento y posterior visualización. En este proyecto se hace una revisión tanto de artículos de investigación como de servicios relacionados con el uso de información que provee Twitter, seguida de la definición de un marco teórico que clasifique toda esa información. Se presenta el diseño de un sistema orientado en la extracción y procesamiento de información obtenida desde Twitter en español. Se han determinado tres estrategias de generación de información: la detección de género de los usuarios, la categorización de tweets por contenido y el posicionamiento de tweets por áreas geográficas.
Adicionalmente, el sistema ofrece a aplicaciones externas la posibilidad de acceder a la información generada.
Por último, se describe como ejemplo de uso una aplicación web que permite visualizar la información recogida y procesada por el sistema de diferentes formas. En ella se puede tanto interactuar con información en tiempo real como visualizar de forma gráfica la información almacenada.

Resumen (otros idiomas)

Nowadays, there is an increment on the need of real-time data. As a result of his policy of allowing access to the large majority of its content, Twitter is a social network widely used to obtain real-time information. This project aims to extract and to analyze information accessible via Twitter, as well as to research on the existing opportunities for its processing and subsequent graphical display. We have made an extensive review of research papers and Twitter-based services related to the information provided by Twitter, in addition to the definition of a theoretical framework that classifies this information. We have designed a system to digest data extracted and processed from Twitter in spanish. We determined three data generation strategies: detection of user's gender, categorization by content of tweets and geospatial display of tweets. The system also offers to external applications the possibility of accessing this generated data. Lastly, we have built a web application as an example of how to display information extracted and processed by the system. The application interacts with real-time information in addition to displaying graphically stored data.

Item Type:Coursework
Additional Information:

Proyecto de Sistemas Informáticos (Facultad de Informática, Curso 2013-2014)

Uncontrolled Keywords:Twitter streaming API, Minería de datos, Recuperación de información, Visualización geoespacial, Procesamiento en tiempo real, Detección de género, Categorización textual
Palabras clave (otros idiomas):Data mining, Information retrieval, Geospatial display, Realtime processing, Gender detection, Text categorization
Subjects:Sciences > Computer science > Databases
Sciences > Computer science > Internet
Sciences > Computer science > Expert systems (Computer science)
ID Code:26486
Deposited On:05 Aug 2014 12:05
Last Modified:17 Mar 2016 11:59

Origin of downloads

Repository Staff Only: item control page