Publication:
Extendiendo Darmok, un sistema de planificación basada en casos, mediante Árboles de comportamiento

Loading...
Thumbnail Image
Official URL
Full text at PDC
Publication Date
2010
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citations
Google Scholar
Research Projects
Organizational Units
Journal Issue
Abstract
La combinación de aprendizaje automático y planificación ha demostrado ser una buena solución para los juegos de estrategia en tiempo real. Sin embargo, aprender planes jerárquicos a partir de trazas (demostraciones) de expertos tiene también sus limitaciones, en particular el número de trazas de entrenamiento necesitadas, así como la ausencia de mecanismos para reaccionar rápidamente ante objetivos de alta prioridad. En este trabajo proponemos que el diseñador defina de manera explícita conocimiento para la toma de decisiones en forma de árboles de comportamiento, para así complementar el conocimiento obtenido a partir de las trazas. Proporcionando un mecanismo natural para que los diseñadores inyecten conocimiento en la librería de planes, pretendemos integrar lo mejor de ambos enfoques: aprendizaje de trazas y reglas codificadas a mano. En este trabajo extendemos un sistema de planificación basada en casos, Darmok, para resolver algunos de sus problemas más importantes. Darmok, que fue diseñado para jugar a juegos de estrategia en tiempo real, tiene algunas deficiencias en lo que respecta a su capacidad de reactividad. En concreto, puede ser o demasiado reactivo cuando ejecuta algunos planes, o demasiado no-reactivo en la ejecución de algunas acciones de bajo nivel, lo cual en su conjunto hace que su rendimiento se deteriore en algunos escenarios bastante frecuentes. Mediante el uso de conocimiento experto en forma de árboles de comportamiento, pretendemos solventar estos problemas. [ABSTRACT] The combination of learning and planning has proved an efective solution for real-time strategy games. Nevertheless, learning hierarchical plans from expert traces also has its limitations, regarding the number of training traces required, and the absence of mechanisms for rapidly reacting to high priority goals. We propose to bring the game designer back into the loop, by allowing him to explicitly inject decision making knowledge, in the form of behavior trees, to complement the knowledge obtained from the traces. By providing a natural mechanism for designers to inject knowledge into the plan library, we intend to integrate the best of both worlds: learning from traces and hardcoded rules. In this work we extend a well known case-based planning system, Darmok, to overcome some of its most important aws. Darmok, initially designed to play real-time strategy games, does have some problems concerning its reactivity capabilities. In particular, it can be either too reactive when executing some plans, or too non-reactive when executing some low level actions, which makes its performance greately deteriorate in some scenarios. By using expert knowledge in the form of behaviour trees, we intend to overcome these problems.
Description
Máster en Investigación en Informática, Facultad de Informática, Departamento de Ingeniería del Software e Inteligencia Artificial, curso 2009-2010
Unesco subjects
Keywords
Citation