Complutense University Library

Mejora de la precisión para el análisis de dependencias usando Maltparser para el castellano

Ballesteros Martínez, Miguel (2010) Mejora de la precisión para el análisis de dependencias usando Maltparser para el castellano. Tesis Master's thesis.

[img]
Preview
PDF
2MB
View download statistics for this eprint

==>>> Export to other formats

Abstract

Maltparser es un generador de analizadores de dependencias contemporáneo basado en aprendizaje automático mediante el que se obtiene una gran precisión. Actualmente los resultados rondan el 80% de precisión (Labelled Attachment Score{LAS) para el castellano y parece que estos resultados son un límite que no se puede superar. En este trabajo se han realizado una serie de estudios sobre generadores de analizadores de dependencias en búsqueda de técnicas para mejorar este límite de facto de la precision. En primer lugar, se muestran una serie de ideas y experimentos basados en el tamaño del corpus de entrenamiento y/o longitud de las frases, y en segundo lugar se aborda la idea fundamental de este trabajo: el Analizador de
N-Versiones, que consiste en combinar la acción de diferentes analizadores entrenados específicamente para diversas tareas y conseguir de esta manera mejorar la
calidad overall en el análisis de dependencias sintáctico.
[ABSTRACT]
Maltparser is a contemporary dependency parsing machine learning-based system that shows a great accuracy. Nowadays the results are around 80%(Labelled Attachment Score{LAS) for Spanish parsing and it seems that is not posible to beat these results. In this work we did a few studies about
dependency parsers to Find some techniques to improve this de facto limit of the accuracy. Firstly, we show some ideas and experiments based on the corpus size and/or sentences length, and finally we show the main idea of this work: the N-Version dependency parser, that is the idea to mix the action of some specific trained parsers, each parser is trained to achieve better accuracy in a specific task, and finally obtain better results in global dependency
accuracy.

Item Type:Thesis (Master's thesis)
Additional Information:Máster en Sistemas Inteligentes, Facultad de Informática, Departamento de Ingeniería del Software e Inteligencia Artificial, curso 2009-2010
Directors:
DirectorsDirector email
Gervás-Gómez Navarro, PabloUNSPECIFIED
Francisco Gilmartín, VirginiaUNSPECIFIED
Herrera de la Cruz, JesúsUNSPECIFIED
Uncontrolled Keywords:Procesamiento de Lenguaje Natural (PLN), Aprendizaje Automático, Análisis sintáctico de dependencias, Entrenamiento basado en corpus, Maltparser, Análisis Sintáctico del Castellano, Natural Language Processing (NLP), Machine learning, Dependency parsing, Corpus-based training, Maltparser, Spanish parsing
Subjects:Sciences > Computer science > Expert systems (Computer science)
ID Code:11311
Deposited On:01 Nov 2010 18:20
Last Modified:06 Feb 2014 09:01

Repository Staff Only: item control page