Publication:
Diseño de un nuevo clasificador supervisado para minería de datos

Loading...
Thumbnail Image
Official URL
Full text at PDC
Publication Date
2009
Advisors (or tutors)
Pajares Martinsanz, Gonzalo
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citations
Google Scholar
Research Projects
Organizational Units
Journal Issue
Abstract
Este trabajo se presenta como un estudio comparativo entre una gran variedad de clasificadores utilizados en la minería de datos. Hay diversos métodos aplicados por los distintos clasificadores, no obstante, este trabajo no finaliza puesto que cada clasificador ofrece buenos resultados con un número muy limitado de clases. El objetivo de este trabajo consiste en constatar que actualmente no existe ningún modelo que permita la clasificación de cualquier conjunto de muestras dado, y que simultáneamente obtenga nos resultados satisfactorios. Al mismo tiempo se ha propuesto un nuevo modelo de clasificación que mejora algunos resultados al compararlos con los mejores resultados ofrecidos por los demás clasificadores, y aunque dista de ser un clasificador generalizado, se plantea la combinación de clasificadores como una técnica rometedora dentro de la tendencia actual en clasificación por los mejores resultados que ofrece. Asimismo en la preparación de los datos, con la finalidad de definir una óptima estrategia de prueba, se han utilizado tanto el algoritmo de estratificación, con el fin de heterogeneizar los conjuntos de datos, como las técnicas basadas en validación cruzada “cross-validation” para dividir dichos datos. Con estas técnicas se pretende mejorar los resultados obtenidos por los tres métodos de clasificación clásicos Agrupamiento borroso, Bayes y Vecinos más cercanos (nearest-neighbours). [Abstract] This work appears as a comparative study between a great variety of classifiers used in the data mining. There are diverse methods applied by the different classifiers, nevertheless, this work does not finish since every classifier offers proved with a limited number of classes. The aim of this work consists of stating that nowadays there does not exist any model who allows the classification of any set of samples in view of, and that simultaneously obtains a few satisfactory results. At the same time in this work we have proposed a new model of classification who improves some results on having compared them with the best results offered by other classifiers, and though it is far from being a widespread classifier, the combination of classifiers appears as a promising technology inside the current trend in classification for the best results that it offers. Likewise in the preparation of the information, with the purpose of defining an ideal strategy of test, it have been used the algorithm of stratification, in order to divide the sets of information as the technologies based on crossed validation, for dividing the above mentioned information. With these technologies one tries to improve the results obtained by three classic methods of classification Fuzzy Clustering, Bayes and Nearest Neighbors
Description
Master en Investigación en Informática, Facultad de Informática, Departamento de Ingeniería del Software e Inteligencia Artificial , curso 2008-2009
Keywords
Citation