Biblioteca de la Universidad Complutense de Madrid

Mejora de la precisión para el análisis de dependencias usando Maltparser para el castellano

Impacto



Ballesteros Martínez, Miguel (2010) Mejora de la precisión para el análisis de dependencias usando Maltparser para el castellano. [Trabajo Fin de Máster]

[img]
Vista previa
PDF
2MB


Resumen

Maltparser es un generador de analizadores de dependencias contemporáneo basado en aprendizaje automático mediante el que se obtiene una gran precisión. Actualmente los resultados rondan el 80% de precisión (Labelled Attachment Score{LAS) para el castellano y parece que estos resultados son un límite que no se puede superar. En este trabajo se han realizado una serie de estudios sobre generadores de analizadores de dependencias en búsqueda de técnicas para mejorar este límite de facto de la precision. En primer lugar, se muestran una serie de ideas y experimentos basados en el tamaño del corpus de entrenamiento y/o longitud de las frases, y en segundo lugar se aborda la idea fundamental de este trabajo: el Analizador de
N-Versiones, que consiste en combinar la acción de diferentes analizadores entrenados específicamente para diversas tareas y conseguir de esta manera mejorar la
calidad overall en el análisis de dependencias sintáctico.
[ABSTRACT]
Maltparser is a contemporary dependency parsing machine learning-based system that shows a great accuracy. Nowadays the results are around 80%(Labelled Attachment Score{LAS) for Spanish parsing and it seems that is not posible to beat these results. In this work we did a few studies about
dependency parsers to Find some techniques to improve this de facto limit of the accuracy. Firstly, we show some ideas and experiments based on the corpus size and/or sentences length, and finally we show the main idea of this work: the N-Version dependency parser, that is the idea to mix the action of some specific trained parsers, each parser is trained to achieve better accuracy in a specific task, and finally obtain better results in global dependency
accuracy.


Tipo de documento:Trabajo Fin de Máster
Información Adicional:

Máster en Sistemas Inteligentes, Facultad de Informática, Departamento de Ingeniería del Software e Inteligencia Artificial, curso 2009-2010

Directores (o tutores):
NombreEmail del director (o tutor)
Gervás-Gómez Navarro, Pablo
Francisco Gilmartín, Virginia
Herrera de la Cruz, Jesús
Palabras clave:Procesamiento de Lenguaje Natural (PLN), Aprendizaje Automático, Análisis sintáctico de dependencias, Entrenamiento basado en corpus, Maltparser, Análisis Sintáctico del Castellano, Natural Language Processing (NLP), Machine learning, Dependency parsing, Corpus-based training, Maltparser, Spanish parsing
Materias:Ciencias > Informática > Sistemas expertos
Código ID:11311
Depositado:01 Nov 2010 18:20
Última Modificación:06 Feb 2014 09:01

Sólo personal del repositorio: página de control del artículo