Universidad Complutense de Madrid
E-Prints Complutense

Data mining con árboles de decisión en Bioinformática

Impacto

Downloads

Downloads per month over past year



Martín Arevalillo, Jorge (2013) Data mining con árboles de decisión en Bioinformática. In Ciclo de conferencias de la Facultad de Informática 2012/2013, 18 de junio de 2013, Sala de Grados de la Facultad de Informática de la Universidad Complutense de Madrid. (Submitted)

Official URL: http://complumedia.ucm.es/resultados.php?contenido=Qh0CUZOW7HDv7ixdCUCocg==



Abstract

La clasificación de observaciones multivariantes es un problema común a muchas disciplinas. Los procedimientos clásicos para abordarlo, que forman parte del contenido de cualquier curso introductorio de Estadística Multivariante, se remontan al Análisis Discriminante de Fisher y sus conclusiones son fiables siempre que sean ciertas las hipótesis estadísticas en que se apoyan. En la práctica, sobre todo al abordar un problema de minería de datos, el conjunto de variables predictoras es grande y variado, la validación de estas hipótesis es una tarea tediosa y su cumplimiento se antoja imposible. Como alternativa, gracias a la creciente capacidad de almacenamiento y cálculo de los ordenadores, se han desarrollado procedimientos de clasificación cuyos resultados y conclusiones no descansan en hipótesis estadísticas y modelos paramétricos preestablecidos; entre ellos se encuentran los árboles de decisión. El objeto de la charla es presentar la manera en que los algoritmos CHAID y CART resuelven el problema de clasificación mediante árboles de decisión, mostrando sus similitudes y diferencias. También se hará énfasis en las ventajas de las técnicas de clasificación con árboles frente a los métodos clásicos a la hora de abordar la modelización de los datos en un problema de Data Mining.


Item Type:Conference or Workshop Item (Other)
Additional Information:

Ciclo de conferencias de la Facultad de Informática 2012/2013 , coordinado por Narciso Martí Oliet

Uncontrolled Keywords:Minería de datos, Árboles de decisión, Algoritmo CHAID, Algoritmo CART, Bioinformática, Data minning, Decission trees, CHAID algorithm, CART algorithm, Bioinformatics
Subjects:Sciences > Mathematics > Bayesian statistical decision theory
Sciences > Computer science > Bioinformatics
ID Code:22663
Deposited On:08 Aug 2013 11:20
Last Modified:10 Sep 2013 12:45

Origin of downloads

Repository Staff Only: item control page