Um agente autônomo baseado em aprendizagem por reforço direcionado à meta

Braga, Arthur Plínio de Souza

doi:10.11606/D.18.2017.tde-31102017-111839

Inicío

Serviços

Trabalhos decorrentes

Como citar

Formato MARC

Formato OAI DC

Dissertação de Mestrado

DOI

https://doi.org/10.11606/D.18.2017.tde-31102017-111839

Documento

Dissertação de Mestrado

Autor

Braga, Arthur Plínio de Souza (Catálogo USP)

Nome completo

Arthur Plínio de Souza Braga

Unidade da USP

Escola de Engenharia de São Carlos

Área do Conhecimento

Engenharia Elétrica

Data de Defesa

1998-12-16

Imprenta

São Carlos, 1998

Orientador

Araújo, Aluízio Fausto Ribeiro (Catálogo USP)

Banca examinadora

Araújo, Aluízio Fausto Ribeiro (Presidente)
Carvalho, André Carlos Ponce de Leon Ferreira de
Simões, Marcelo Godoy

Título em português

Um agente autônomo baseado em aprendizagem por reforço direcionado à meta

Palavras-chave em português

Agente autônomo
Aprendizagem por reforço
Comportamento reativo
Inteligência artificial
Navegação de robô móvel
Planejamento
Problema de aprendizagem por reforço direcionada à meta
Taxa de aprendizagem variável

Resumo em português

Uma meta procurada em inteligência artificial (IA) é o desenvolvimento de mecanismos inteligentes capazes de cumprir com objetivos preestabelecidos, de forma totalmente independente, em ambientes dinâmicos e complexos. Uma recente vertente das pesquisas em IA, os agentes autônomos, vem conseguindo resultados cada vez mais promissores para o cumprimento desta meta. A motivação deste trabalho é a proposição e implementação de um agente que aprenda a executar tarefas, sem a interferência de um tutor, em um ambiente não estruturado. A tarefa prática proposta para testar o agente é a navegação de um robô móvel em ambientes com diferentes configurações, e cujas estruturas são inicialmente desconhecidas pelo agente. O paradigma de aprendizagem por reforço, através de variações dos métodos de diferença temporal, foi utilizado para implementar o agente descrito nesta pesquisa. O resultado final obtido foi um agente autônomo que utiliza um algoritmo simples para desempenhar propriedades como: aprendizagem a partir de tabula rasa, aprendizagem incremental, planejamento deliberativo, comportamento reativo, capacidade de melhoria do desempenho e habilidade para gerenciar múltiplos objetivos. O agente proposto também apresenta um desempenho promissor em ambientes cuja estrutura se altera com o tempo, porém diante de certas situações seus comportamentos em tais ambientes tendem a se tornar inconsistentes.

Título em inglês

An autonomous agent based on goal-directed reinforcement learning

Palavras-chave em inglês

Artificial intelligence
Autonomous agent
Goal-directed reinforcement learning problem
Mobile robot navigation
Planning
Reactive behavior
Reinforcement learning
Variable learning rate

Resumo em inglês

One of the current goals of research in Artificial Intelligence is the proposition of intelligent entities that are able to reach a particular target in a dynamic and complex environment without help of a tutor. This objective has been becoming reality through the propositions of the autonomous agents. Thus, the main motivation of this work is to propose and implement an autonomous agent that can match the mentioned goals. This agent, a mobile robot, has to navigate in environments which are initially unknown and may have different structures. The agent learns through one of the main reinforcement learning strategies: temporal difference. The proposed autonomous employs a simple learning mechanisms with the following features: learns incrementally from tabula rasa, executes deliberative and reactive planning, improves its performance through interactions with the environment, and manages multiple objectives. The agent presented promising results when moving in a dynamic environment. However, there are situations in which the agent do not follow this last property.

AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.

Dissert_Braga_ArthurPS.pdf (27.79 Mbytes)

Data de Publicação

2017-10-31

Trabalhos decorrentes

AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.