Complutense University Library

Diseño de un nuevo clasificador supervisado para minería de datos

Piorno Campo, Juan (2009) Diseño de un nuevo clasificador supervisado para minería de datos. Tesis Master's thesis.

[img]
Preview
PDF
926kB
View download statistics for this eprint

==>>> Export to other formats

Abstract

Este trabajo se presenta como un estudio comparativo entre una gran variedad de clasificadores utilizados en la minería de datos. Hay diversos métodos aplicados por los
distintos clasificadores, no obstante, este trabajo no finaliza puesto que cada clasificador ofrece buenos resultados con un número muy limitado de clases. El objetivo de este trabajo consiste en constatar que actualmente no existe ningún modelo que permita la
clasificación de cualquier conjunto de muestras dado, y que simultáneamente obtenga nos resultados satisfactorios. Al mismo tiempo se ha propuesto un nuevo modelo de clasificación que mejora algunos resultados al compararlos con los mejores resultados ofrecidos por los demás clasificadores, y aunque dista de ser un clasificador
generalizado, se plantea la combinación de clasificadores como una técnica rometedora dentro de la tendencia actual en clasificación por los mejores resultados que ofrece. Asimismo en la preparación de los datos, con la finalidad de definir una óptima estrategia de prueba, se han utilizado tanto el algoritmo de estratificación, con el
fin de heterogeneizar los conjuntos de datos, como las técnicas basadas en validación cruzada “cross-validation” para dividir dichos datos. Con estas técnicas se pretende
mejorar los resultados obtenidos por los tres métodos de clasificación clásicos Agrupamiento borroso, Bayes y Vecinos más cercanos (nearest-neighbours).
[Abstract]
This work appears as a comparative study between a great variety of classifiers used in the data mining. There are diverse methods applied by the different classifiers,
nevertheless, this work does not finish since every classifier offers proved with a limited number of classes. The aim of this work consists of stating that nowadays there does not exist any model who allows the classification of any set of samples in view of, and that
simultaneously obtains a few satisfactory results. At the same time in this work we have proposed a new model of classification who improves some results on having compared
them with the best results offered by other classifiers, and though it is far from being a widespread classifier, the combination of classifiers appears as a promising technology inside the current trend in classification for the best results that it offers. Likewise in the
preparation of the information, with the purpose of defining an ideal strategy of test, it have been used the algorithm of stratification, in order to divide the sets of information as the technologies based on crossed validation, for dividing the above mentioned information. With these technologies one tries to improve the results obtained by three classic methods of classification Fuzzy Clustering, Bayes and Nearest Neighbors

Item Type:Thesis (Master's thesis)
Additional Information:Master en Investigación en Informática, Facultad de Informática, Departamento de Ingeniería del Software e Inteligencia Artificial , curso 2008-2009
Directors:
DirectorsDirector email
Pajares Martinsanz, GonzaloUNSPECIFIED
Guijarro Mata-García, MaríaUNSPECIFIED
Uncontrolled Keywords:Clasificación, Lógica Fuzzy, Clasificador Fuzzy, Clasificador Bayesiano, Clasificador de nearest-neighbours (vecinos más cercanos), Estratificación, Ten fold cross-validation (validación cruzada), Classification, Fuzzy logic, Fuzzy classifier, Bayesian classifier, Knearest-neighbours, Stratification, Ten fold cross-validation
Subjects:Sciences > Mathematics > Logic, Symbolic and mathematical
ID Code:10143
Deposited On:15 Feb 2010 15:51
Last Modified:06 Feb 2014 08:38

Repository Staff Only: item control page