Universidad Complutense de Madrid
E-Prints Complutense

Detección de fraude bancario en tiempo real utilizando tecnologías de procesamiento distribuido

Impacto

Downloads

Downloads per month over past year



Mansilla Montero, Javier (2016) Detección de fraude bancario en tiempo real utilizando tecnologías de procesamiento distribuido. [Trabajo Fin de Máster]

[img]
Preview
PDF
1MB


Abstract

En este Trabajo de Fin de Máster se desarrollará un sistema de detección de fraude en pagos con tarjeta de crédito en tiempo real utilizando tecnologías de procesamiento distribuido. Concretamente se considerarán dos tecnologías: TIBCO, un conjunto de herramientas comerciales diseñadas para el procesamiento de eventos complejos, y Apache Spark, un sistema abierto para el procesamiento de datos en tiempo real. Además de implementar el sistema utilizando las dos tecnologías propuestas, un objetivo, otro objetivo de este Trabajo de Fin de Máster consiste en analizar y comparar estos dos sistemas implementados usados para procesamiento en tiempo real.
Para la detección de fraude en pagos con tarjeta de crédito se aplicarán técnicas de aprendizaje máquina, concretamente del campo de anomaly/outlier detection. Como fuentes de datos que alimenten los sistemas, haremos uso de tecnologías de colas de mensajes como TIBCO EMS y Kafka. Los datos generados son enviados a estas colas para que los respectivos sistemas puedan procesarlos y aplicar el algoritmo de aprendizaje máquina, determinando si una nueva instancia es fraude o no.
Ambos sistemas hacen uso de una base de datos MongoDB para almacenar los datos generados de forma pseudoaleatoria por los generadores de mensajes, correspondientes a movimientos de tarjetas de crédito. Estos movimientos posteriormente serán usados como conjunto de entrenamiento para el algoritmo de aprendizaje máquina.

Resumen (otros idiomas)

In this Master’s final dissertation a fraud detection system for real-time payments via credit card by using distributed processing technologies will be shown. More precisely, two technologies will be studied: “TIBCO”, a set of commercial tools designed for complex events processing; and “Apache Spark” an open system to process real-time data. Apart from adding the system by using the abovementioned technologies, another objective of this Master’s final dissertation consists of analyzing and comparing these two implemented systems used to real-time processes. Machine learning techniques will be applied to detect fraud in credit card payments, specifically from the field “anomaly/outlier detection”. Message queues technologies like “TIBCO”, “EMS” and “Kafka” will be used as data source to supply the data source. The generated data are sent to these queues for the mentioned systems to process and apply the machine learning algorithm determining whether or not the new instance is a fraud. Both systems use MongoDB to store pseudorandom generated data by the message generator corresponding to credit card transactions. These transactions will be used later on as a set of training to the machine learning algorithm.

Item Type:Trabajo Fin de Máster
Additional Information:

Máster en Ingeniería Informática, Facultad de Informática, Departamento de Sistemas Informáticos y Computación, curso 2015-2016

Directors:
DirectorsDirector email
Martín Martín, Enrique
Uncontrolled Keywords:Apache Kafka, Apache Spark, TIBCO, Aprendizaje máquina, Java Message Service, Detección de anomalías, Procesamiento de eventos complejos, Procesamiento en tiempo real, MongoDB
Palabras clave (otros idiomas):Apache Kafka, Apache Spark, TIBCO, Machine learning, Java Message Service, Anomaly detection, complex event processing, real-time processing, MongoDB
Subjects:Sciences > Computer science > Computer programming
Sciences > Computer science > Expert systems (Computer science)
Sciences > Computer science > Computer security
Título del Máster:Máster en Ingeniería Informática
ID Code:38647
Deposited On:28 Jul 2016 11:58
Last Modified:28 Jul 2016 11:58

Origin of downloads

Repository Staff Only: item control page