Publication:
Aplicación y comparación de modelos de machine learning destinados a la puntuación del riesgo de crédito

Loading...
Thumbnail Image
Official URL
Full text at PDC
Publication Date
2019-09
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Facultad de Estudios Estadísticos (UCM)
Citations
Google Scholar
Research Projects
Organizational Units
Journal Issue
Abstract
En este trabajo de investigación se estudian y comparan modelos que se emplean actualmente en el ámbito del scoring, como son la regresión logística, junto con otros modelos de machine learning que también se podrían implementar como son las redes neuronales, el Support Vector Machine (SVM) y técnicas basadas en árboles como son Bagging, Random Forest y Gradient Boosting. Otros estudios ya han demostrado la superioridad en técnicas de clasificación de las redes neuronales frente a la regresión logística. En esta investigación queremos comprobar si logramos unos resultados acordes a estas otras investigaciones, sobre todo fijándonos en dos objetivos en particular. En primer lugar, encontrar el modelo que mejor resultados obtenga en función de su capacidad predictiva, y en segundo lugar, lograr encontrar, si existe, una diferencia significativa tanto en términos de predicción como en tiempos de ejecución a la hora de utilizar las habituales variables categóricas binarias frente a sus homólogas tipo WOE. Los resultados demuestran que el modelo que mejores resultados obtiene es el SVM; y que las diferencias en calidad de predicción no son tan relevantes entre variables binarias y de tipo WOE, mientras que el tiempo de ahorro en ejecución por parte de este segundo tipo de variables es del todo significativo
Description
Keywords
Citation