Publication:
Mejora de la precisión para el análisis de dependencias usando Maltparser para el castellano

Loading...
Thumbnail Image
Official URL
Full text at PDC
Publication Date
2010
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citations
Google Scholar
Research Projects
Organizational Units
Journal Issue
Abstract
Maltparser es un generador de analizadores de dependencias contemporáneo basado en aprendizaje automático mediante el que se obtiene una gran precisión. Actualmente los resultados rondan el 80% de precisión (Labelled Attachment Score{LAS) para el castellano y parece que estos resultados son un límite que no se puede superar. En este trabajo se han realizado una serie de estudios sobre generadores de analizadores de dependencias en búsqueda de técnicas para mejorar este límite de facto de la precision. En primer lugar, se muestran una serie de ideas y experimentos basados en el tamaño del corpus de entrenamiento y/o longitud de las frases, y en segundo lugar se aborda la idea fundamental de este trabajo: el Analizador de N-Versiones, que consiste en combinar la acción de diferentes analizadores entrenados específicamente para diversas tareas y conseguir de esta manera mejorar la calidad overall en el análisis de dependencias sintáctico. [ABSTRACT] Maltparser is a contemporary dependency parsing machine learning-based system that shows a great accuracy. Nowadays the results are around 80%(Labelled Attachment Score{LAS) for Spanish parsing and it seems that is not posible to beat these results. In this work we did a few studies about dependency parsers to Find some techniques to improve this de facto limit of the accuracy. Firstly, we show some ideas and experiments based on the corpus size and/or sentences length, and finally we show the main idea of this work: the N-Version dependency parser, that is the idea to mix the action of some specific trained parsers, each parser is trained to achieve better accuracy in a specific task, and finally obtain better results in global dependency accuracy.
Description
Máster en Sistemas Inteligentes, Facultad de Informática, Departamento de Ingeniería del Software e Inteligencia Artificial, curso 2009-2010
Unesco subjects
Keywords
Citation