• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tese de Doutorado
DOI
https://doi.org/10.11606/T.55.2021.tde-21122021-111842
Documento
Autor
Nome completo
Julian Ricardo Hernandez Mariño
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Carlos, 2021
Orientador
Banca examinadora
Toledo, Cláudio Fabiano Motta (Presidente)
Karpas, Erez
Nakamura, Ricardo
Osório, Fernando Santos
Título em inglês
Synthesizing interpretable strategies for real-time planning in zero-sum games
Palavras-chave em inglês
Artificial intelligence
Evolutionary algorithm
Games
Program synthesis
RTS
Search algorithm
Self-play
Zero-sum
Resumo em inglês
Interpretable and explainable Artificial Intelligence (AI) is projected as one of the most important topics for the community in the next years. In addition to developing effective AI approaches that can help humans solving problems, it might be necessary to understand the reasons behind the decisions of such approaches to finally trust in their behavior. Search and learning-based algorithms represent the current state-of-the-art approaches for planning in zero-sum real-time games. The problem with those approaches is that usually the behavior of their resulting agents is not interpretable. On the other hand, hard-coded programs usually are not as effective as searchbased methods but have an important vantage; they can be more easily interpretable. In this thesis, we present a collection of works where we approach the problem of synthesizing effective interpretable scripts for planning in zero-sum real-time domains. First, we approach the problem of generating a set of scripts that can be used as an action abstraction to reduce search action spaces in zero-sum real-time strategy games. Namely, we present an evolutionary approach that can generate action abstractions that search-based algorithms can use for planning. Search-based systems that use action abstractions generated by our system outperformed the state-of-the-art search-based methods we use for experiments and won the 2018 mRTS competition. We also present Gesy and LS2, two systems focused on synthesizing scripts that can plan by themselves in zero-sum real-time strategy games. Gesy is a system that uses a Genetic Programming (GP) approach to synthesize interpretable scripts. LS2 is a system that combines a novel method to reduce Domain-Specific Languages (DSLs), and a local-search algorithm that uses self play to synthesize interpretable scripts. The scripts Gesy and LS2 synthesize are competitive with complex search-based methods and scripts designed by professional programmers. We also show that the scripts synthesized by both systems can be used to discover possible optimizations that programmers could include in their implementations.
Título em português
Sintetizando estratégias interpretáveis para o planejamento em tempo real em jogos de suma zero
Palavras-chave em português
Algoritmo de busca
Algoritmo evolutivo
Inteligência artificial
Jogos
RTS
Self play
Síntese de programas
Soma zero
Resumo em português
A Inteligência Artificial (IA) interpretável e explicável é projetada como um dos temas mais importantes para a comunidade nos próximos anos. Além de desenvolver abordagens eficazes de IA que possam ajudar aos humanos a resolver problemas, pode ser necessário entender as razões por trás das decisões de tais abordagens para finalmente confiar em seu comportamento. Os algoritmos baseados em busca e aprendizagem representam o estado da arte para o planejamento em jogos de soma zero em tempo real. O problema com essas abordagens é que geralmente o comportamento de seus agentes resultantes não é interpretável. Por outro lado, scripts geralmente não são tão eficazes quanto os métodos de busca, mas têm uma vantagem importante; eles podem ser mais facilmente interpretáveis. Nesta tese, apresentamos uma coleção de trabalhos onde abordamos o problema de sintetizar scripts interpretáveis e eficazes para o planejamento em domínios de tempo real de soma zero. Primeiro, abordamos o problema de gerar um conjunto de scripts que pode ser usado como uma abstração de ação para reduzir os espaços de busca de ações em jogos em tempo real de soma zero. Apresentamos uma abordagem evolutiva que pode gerar abstrações de ação que algoritmos baseados em busca podem usar para o planejamento. Sistemas baseados em busca que usam abstrações de ação geradas por nosso sistema superaram os métodos de busca do estado da arte que usamos nos experimentos, e venceram a competição mRTS do 2018. Também apresentamos o Gesy e o LS2, dois sistemas focados em sintetizar scripts que podem ser usados por si sós para planejamento em jogos em tempo real de soma zero. Gesy é um sistema que usa uma abordagem de Programação Genética (GP) para sintetizar scripts interpretáveis. LS2 é um sistema que combina um novo método para reduzir Linguagens Específicas de Domínio (DSLs) e um algoritmo de busca local que usa a self-play para sintetizar scripts interpretáveis. Os scripts que Gesy e LS2 sintetizam são competitivos com métodos complexos baseados em busca e scripts codificados por programadores profissionais. Também mostramos que os scripts sintetizados pelos dois sistemas podem ser usados para descobrir possíveis otimizações que os programadores poderiam incluir em suas implementações.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2021-12-21
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2024. Todos os direitos reservados.