Universidad Complutense de Madrid
E-Prints Complutense

Predicción de series temporales con k-NN sobre Spark

Impacto

Downloads

Downloads per month over past year



Águila Sánchez, Sebastián and Montero Cobo de Guzmán, Sergio (2018) Predicción de series temporales con k-NN sobre Spark. [Trabajo Fin de Grado]

[img]
Preview
PDF
2MB


Abstract

Este trabajo ha tenido como objetivo la implementación de un algoritmo de predicción k-NN para series temporales, haciendo uso del paradigma de procesamiento distribuido Spark, con el fin conseguir una solución Big Data.
Conseguir esta solución es muy interesante, puesto que es un algoritmo de aprendizaje basado en instancias no genera un modelo para realizar las predicciones, sino que se apoya de un histórico. Un histórico lo suficientemente grande podría desbordar la memoria de cualquier computador. Con el uso del algoritmo distribuido, se puede procesar sin limitaciones este histórico por muy grande que sea, permitiendo tener en cuenta más datos para componer la solución, obteniendo mejores predicciones que las que se obtendrían usando una solución mono-máquina con un histórico limitado.

Resumen (otros idiomas)

The objective of this work was to implement a k-NN forecasting algorithm for time series, using the distributed processing paradigm Spark, in order to achieve a Big Data solution. This solution is very useful, since it’s an instance based learning algorithm and it does not generate a model to make predictions, instead it uses historical data. With enough historical data, it is possible to overflow the memory of any computer.. With the use of the distributed algorithm, this historical can be processed without limitations, no matter how big it is, allowing to have more data to compose the solution, obtaining better predictions than what would be obtained using a mono-machine solution with a limited historical.

Item Type:Trabajo Fin de Grado
Additional Information:

Universidad Complutense, Facultad de Informática. Departamento de Ingeniería del Software e Inteligencia Artificial, curso 2017/2018

Directors:
DirectorsDirector email
Arroyo Gallardo, Javier
Meco Alías, Albert
Uncontrolled Keywords:Regresión, Predicción, k-NN, Series temporales, Spark, RDD
Palabras clave (otros idiomas):Regression, Prediction, k-NN, Time Series, Spark, RDD
Subjects:Sciences > Computer science
Título de Grado:Grado en Ingeniería del Software
ID Code:50214
Deposited On:26 Nov 2018 10:00
Last Modified:26 Nov 2018 10:00

Origin of downloads

Repository Staff Only: item control page