Universidad Complutense de Madrid
E-Prints Complutense

Aprendizaje por refuerzo profundo aplicado a juegos sencillos

Impacto

Downloads

Downloads per month over past year



Arranz Janeiro, Ricardo and Concepción Echeverría, Lidia and Caño Vega, Juan Ramón del and Ponce Belmonte, Francisco and Romero Sánchez, Juan Luis (2019) Aprendizaje por refuerzo profundo aplicado a juegos sencillos. [Trabajo Fin de Grado]

[img]
Preview
PDF
Creative Commons Attribution Non-commercial.

3MB



Abstract

En este proyecto estudiaremos el campo del aprendizaje por refuerzo profundo, con el objetivo de lograr una aplicación estable en problemas clásicos de control. Para lograrlo investigaremos sus bases: el aprendizaje por refuerzo y las redes neuronales, comprobando cuáles son sus puntos fuertes y débiles. Después combinaremos lo aprendido para, progresivamente, mejorar el rendimiento y la estabilidad de nuestros agentes.
En busca de una mayor comprensión de su funcionamiento, todas las implementaciones de los agentes y algoritmos serán hechas por nosotros mismos. Todo ello será puesto a prueba a través del conocido sistema OpenAI Gym.
Todo el código fuente referente a este proyecto puede encontrarse en: https://github.com/delcanovega/TFG-DRL

Resumen (otros idiomas)

In this project we will study the Deep Reinforcement Learning field in order to achieve an stable application for classic control problems. To do this we will investigate its fundamentals: Reinforcement Learning and Neural Networks, learning which are their strengths and weaknesses. Finally, we will merge both to progressivly improve our agent’s performance and stability. In order to gain a better insight we will personally implement the agents and algorithms. All of this will be tested through the popular framework OpenAI Gym. This project’s source code can be found in the repository: https://github.com/delcanovega/TFG-DRL

Item Type:Trabajo Fin de Grado
Additional Information:

Todo el código fuente referente a este proyecto puede encontrarse en: https://github.com/delcanovega/TFG-DRL

Trabajo de Fin de Grado, Universidad Complutense, Facultad de Informática, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2018/2019

Directors:
DirectorsDirector email
Sánchez Ruiz-Granados, Antonio Alejandro
Uncontrolled Keywords:Aprendizaje por refuerzo, Q-Learning, Proceso de Márkov, Redes neuronales, Aprendizaje por refuerzo profundo, DeepMind, OpenAI
Palabras clave (otros idiomas):Reinforcement Learning, Q-Learning, Markov decision process, Neural Networks, Deep Reinforcement Learning, DeepMind, OpenAI
Subjects:Sciences > Computer science
Título de Grado:Grado en Ingeniería Informática
ID Code:56648
Deposited On:01 Aug 2019 09:41
Last Modified:09 Mar 2020 12:17

Origin of downloads

Repository Staff Only: item control page