Publication:
Data mining con árboles de decisión en Bioinformática

No Thumbnail Available
Full text at PDC
Publication Date
2013-06-19
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citations
Google Scholar
Research Projects
Organizational Units
Journal Issue
Abstract
La clasificación de observaciones multivariantes es un problema común a muchas disciplinas. Los procedimientos clásicos para abordarlo, que forman parte del contenido de cualquier curso introductorio de Estadística Multivariante, se remontan al Análisis Discriminante de Fisher y sus conclusiones son fiables siempre que sean ciertas las hipótesis estadísticas en que se apoyan. En la práctica, sobre todo al abordar un problema de minería de datos, el conjunto de variables predictoras es grande y variado, la validación de estas hipótesis es una tarea tediosa y su cumplimiento se antoja imposible. Como alternativa, gracias a la creciente capacidad de almacenamiento y cálculo de los ordenadores, se han desarrollado procedimientos de clasificación cuyos resultados y conclusiones no descansan en hipótesis estadísticas y modelos paramétricos preestablecidos; entre ellos se encuentran los árboles de decisión. El objeto de la charla es presentar la manera en que los algoritmos CHAID y CART resuelven el problema de clasificación mediante árboles de decisión, mostrando sus similitudes y diferencias. También se hará énfasis en las ventajas de las técnicas de clasificación con árboles frente a los métodos clásicos a la hora de abordar la modelización de los datos en un problema de Data Mining.
Description
Ciclo de conferencias de la Facultad de Informática 2012/2013 , coordinado por Narciso Martí Oliet
Keywords
Citation