Tratamiento de variables categóricas en modelos de Machine Learning

Impacto

Downloads

Downloads per month over past year



Barragán, Rodrigo Kraus (2022) Tratamiento de variables categóricas en modelos de Machine Learning. [Trabajo Fin de Máster]

[thumbnail of TFM_Rodrigo_Kraus_Barragan.pdf]
Preview
PDF
1MB


Abstract

Este Trabajo de Fin de Máster tiene como principal propósito estudiar diferentes formas de codificar variables categóricas diferenciando entre ordinales y nominales, mostrando la teoría que hay detrás de cada método, detallando las ventajas e inconvenientes de estos y en qué situaciones es conveniente un codificador u otro. Se hará también una clara distinción entre métodos clásicos para tratar estas variables y codificadores supervisados, los cuales se apoyan en la variable a predecir para sustituir cada categoría por un valor que represente la influencia que tienen sobre esta. Se utilizará además un conjunto de datos real para apoyar la teoría con ejemplos y finalmente se aplicará lo estudiado sobre este conjunto de datos y poder comprobar qué tal funcionan los diferentes codificadores sobre estos datos con varios modelos distintos.

Resumen (otros idiomas)

The aim of this Master´s Thesis is to study differents ways to encoder categorical variables, including ordinal and nominal variables. Different encoders are studied, showing the advantages and disadvantages and in wich situations it is appropiate to us each of them. It is made a distinction between classic and supervised encoders, this type of encoders replace the feature value with the influence it has over the target variable. It is used a real dataset for putting examples of each encoder and finally the study is applicated to this dataset, showing wich encoder is better for this case.

Item Type:Trabajo Fin de Máster
Directors:
Directors
Gregorio Rodríguez, Carlos
Uncontrolled Keywords:Variables categóricas; Minería de datos; Machine Learning; Codificadores clásicos; Codificadores supervisados
Palabras clave (otros idiomas):Categorical Variables; Data Mining; Machine Learning; Classic Encoders; Supervised Encoders
Subjects:Sciences > Computer science > Artificial intelligence
Sciences > Mathematics > Operations research
Título del Máster:Tratamiento estadístico computacional de la información
ID Code:75311
Deposited On:28 Oct 2022 16:27
Last Modified:04 Nov 2022 12:47

Origin of downloads

Repository Staff Only: item control page