Piloto baseado em aprendizagem por reforço para o simulador de corridas TORCS

Daros, Vinícius Kiwi

doi:10.11606/D.45.2016.tde-18032016-134549

Inicío

Serviços

Trabalhos decorrentes

Como citar

Formato MARC

Formato OAI DC

Dissertação de Mestrado

DOI

https://doi.org/10.11606/D.45.2016.tde-18032016-134549

Documento

Dissertação de Mestrado

Autor

Daros, Vinícius Kiwi (Catálogo USP)

Nome completo

Vinícius Kiwi Daros

E-mail

Unidade da USP

Instituto de Matemática e Estatística

Área do Conhecimento

Ciência da Computação

Data de Defesa

2015-08-06

Imprenta

São Paulo, 2015

Orientador

Silva, Flavio Soares Correa da (Catálogo USP)

Banca examinadora

Silva, Flavio Soares Correa da (Presidente)
Chaimowicz, Luiz
Vasconcelos, Wamberto Weber Miranda Peixoto de

Título em português

Piloto baseado em aprendizagem por reforço para o simulador de corridas TORCS

Palavras-chave em português

Aprendizagem por reforço
Corrida
IA
Jogos
TORCS

Resumo em português

Corrida de carros e um gênero popular de jogos eletrônicos e um domínio com vários desafios a serem explorados no âmbito da Inteligência Artificial (IA), tendo recebido atenção crescente nos últimos anos. Naturalmente, um desses desafios e criar pilotos virtuais capazes de aprender sozinhos a correr nas pistas. Neste projeto de mestrado, nos adaptamos e aplicamos técnicas de Aprendizagem por Reforço (Reinforcement Learning) no desenvolvimento de um agente completamente autônomo capaz de correr em pistas de vários formatos dentro do simulador TORCS. Esse jogo de código aberto possui um sistema de física muito elaborado e permite a criação de módulos de IA para controlar os carros, sendo assim um ambiente de testes frequentemente adotado para pesquisas nesse contexto. O objetivo do nosso agente e encontrar ações de controle do acelerador e freio a fim de gastar o menor tempo possível em cada volta. Para atingir tal meta, ele coleta dados na primeira volta, gera um modelo do circuito, segmenta e classifica cada trecho da pista e, finalmente, da voltas no percurso ate atingir um comportamento consistente. Além das questões relacionadas a aprendizagem, este trabalho explora conceitos de Sistemas de Controle, em especial controladores PID (Proporcional, Integrativo, Derivativo), usados para a implementação da heurística do manejo do volante. Também abordamos os fundamentos de alguns assistentes de direção, tais como ABS (Anti-lock Braking System) e controle de estabilidade. Esses princípios são de grande importância para tornar o agente capaz de guiar o carro dentro de um ambiente com simulação física tão próxima a realidade. Nesse ponto e no emprego do sensoriamento para a aquisição de dados, nosso trabalho flerta com a área de Robótica Móvel. Por fim, avaliamos o desempenho de nosso piloto virtual comparando seus resultados com os de controladores baseados em outras técnicas.

Título em inglês

Reinforcement learning driver for TORCS car racing simulator

Palavras-chave em inglês

AI
Game
Learning
Race
Reinforcement
TORCS

Resumo em inglês

Reinforcement learning driver for TORCS car racing simulator.

AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.

RL_Driver.pdf (4.66 Mbytes)

Data de Publicação

2016-03-21

Trabalhos decorrentes

AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.