Deep learning applied to turn-based board games
Aprendizaje profundo aplicado a juegos de tablero por turnos

Impacto

Downloads

Downloads per month over past year



Sanz Sanz, Pablo and Villanueva Quirós, Juan Carlos (2021) Deep learning applied to turn-based board games. [Trabajo Fin de Grado]

[thumbnail of SANZ SANZ 75354_PABLO_SANZ_SANZ_Aprendizaje_profundo_aplicado_a_juegos_de_tablero_por_turnos_784051_1794016224.pdf] PDF
Creative Commons Attribution Non-commercial.

2MB


Abstract

Due to the astonishing growth rate in computational power, artificial intelligence is achieving milestones that were considered as inconceivable just a few decades ago. One of them is AlphaZero, an algorithm capable of reaching superhuman performance in chess, shogi and Go, with just a few hours of self-play and given no domain knowledge except the game rules.
In this paper, we review the fundamentals, explain how the algorithm works, and develop our own version of it, capable of being executed on a personal computer. Despite the lack of available computational resources, we have managed to master less complex games such as Tic-Tac-Toe and Connect 4. To verify learning, we test our implementation against other strategies and analyze the results obtained.

Resumen (otros idiomas)

Gracias al ritmo vertiginoso al que crece la capacidad computacional, la inteligencia artificial está ́logrando hitos que hace tan solo unas décadas se consideraban impensables. Uno de ellos es AlphaZero, un algoritmo capaz de alcanzar un nivel de juego sobrehumano en ajedrez, shogi y Go, mediante unas pocas horas de autoaprendizaje y sin conocimiento del dominio excepto las reglas del juego. En este trabajo, revisamos los fundamentos, explicamos cómo funciona el algoritmo y desarrollamos nuestra propia versión de este, capaz de ser ejecutada en un ordenador personal. A pesar de la escasez de recursos computacionales disponibles, hemos conseguido dominar juegos menos complejos como el Tres en Raya y el Conecta 4. Para verificar el aprendizaje, probamos nuestra implementación contra otras estrategias y analizamos los resultados obtenidos.

Item Type:Trabajo Fin de Grado
Additional Information:

Trabajo fin de Grado en Doble Grado en Ingeniería Informatica-Matemáticas, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2020-2021

Directors:
Directors
Sánchez Ruiz-Granados, Antonio Alejandro
Uncontrolled Keywords:Inteligencia artificial, AlphaZero, Árboles de búsqueda de Monte Carlo, Aprendizaje por refuerzo, Aprendizaje profundo, Juegos combinacionales. Artificial intelligence, AlphaZero, Monte Carlo tree search, Reinforcement learning, Deep learning, Combinational games.
Palabras clave (otros idiomas):Inteligencia artificial, AlphaZero, Árboles de búsqueda de Monte Carlo, Aprendizaje por refuerzo, Aprendizaje profundo, Juegos combinacionalesCombinational games.
Subjects:Sciences > Computer science
Título de Grado:Doble Grado en Ingeniería Informatica-Matemáticas
ID Code:66895
Deposited On:14 Jul 2021 14:55
Last Modified:14 Jul 2021 14:55

Origin of downloads

Repository Staff Only: item control page