Publication:
Detección de fraude bancario en tiempo real utilizando tecnologías de procesamiento distribuido

Loading...
Thumbnail Image
Official URL
Full text at PDC
Publication Date
2016
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citations
Google Scholar
Research Projects
Organizational Units
Journal Issue
Abstract
En este Trabajo de Fin de Máster se desarrollará un sistema de detección de fraude en pagos con tarjeta de crédito en tiempo real utilizando tecnologías de procesamiento distribuido. Concretamente se considerarán dos tecnologías: TIBCO, un conjunto de herramientas comerciales diseñadas para el procesamiento de eventos complejos, y Apache Spark, un sistema abierto para el procesamiento de datos en tiempo real. Además de implementar el sistema utilizando las dos tecnologías propuestas, un objetivo, otro objetivo de este Trabajo de Fin de Máster consiste en analizar y comparar estos dos sistemas implementados usados para procesamiento en tiempo real. Para la detección de fraude en pagos con tarjeta de crédito se aplicarán técnicas de aprendizaje máquina, concretamente del campo de anomaly/outlier detection. Como fuentes de datos que alimenten los sistemas, haremos uso de tecnologías de colas de mensajes como TIBCO EMS y Kafka. Los datos generados son enviados a estas colas para que los respectivos sistemas puedan procesarlos y aplicar el algoritmo de aprendizaje máquina, determinando si una nueva instancia es fraude o no. Ambos sistemas hacen uso de una base de datos MongoDB para almacenar los datos generados de forma pseudoaleatoria por los generadores de mensajes, correspondientes a movimientos de tarjetas de crédito. Estos movimientos posteriormente serán usados como conjunto de entrenamiento para el algoritmo de aprendizaje máquina.
In this Master’s final dissertation a fraud detection system for real-time payments via credit card by using distributed processing technologies will be shown. More precisely, two technologies will be studied: “TIBCO”, a set of commercial tools designed for complex events processing; and “Apache Spark” an open system to process real-time data. Apart from adding the system by using the abovementioned technologies, another objective of this Master’s final dissertation consists of analyzing and comparing these two implemented systems used to real-time processes. Machine learning techniques will be applied to detect fraud in credit card payments, specifically from the field “anomaly/outlier detection”. Message queues technologies like “TIBCO”, “EMS” and “Kafka” will be used as data source to supply the data source. The generated data are sent to these queues for the mentioned systems to process and apply the machine learning algorithm determining whether or not the new instance is a fraud. Both systems use MongoDB to store pseudorandom generated data by the message generator corresponding to credit card transactions. These transactions will be used later on as a set of training to the machine learning algorithm.
Description
Máster en Ingeniería Informática, Facultad de Informática, Departamento de Sistemas Informáticos y Computación, curso 2015-2016
Keywords
Citation