Dissertação de Mestrado

Documento
Dissertação de Mestrado
Nome completo
Alan Assis Pennacchio
E-mail
Unidade da USP
Instituto de Matemática e Estatística
Programa ou Especialidade
Data de Defesa
2025-02-20
Imprenta
São Paulo, 2025
Banca examinadora
Barros, Leliane Nunes de (Presidente)
Gimelfarb, Michael
Silva, Valdinei Freire da
Título em inglês
Risk-sensitive differentiable planning
Palavras-chave em inglês
Differentiable planning, Risk measures, Stochastic optimization
Resumo em inglês
Automated planning, a subfield of Artificial Intelligence focused on sequential decision-making, involves synthesizing a plan to reach a specified goal by an agent operating in a descriptive model of an environment. While significant progress has been made in discrete and deterministic planning, continuous and stochastic environments present challenges due to infinite action spaces and branching factors. Differentiable planning addresses these challenges by framing planning as an optimization problem that can be solved using gradient-based optimization techniques. This approach allows for the synthesis of plans in complex, nonlinear stochastic continuous environments without problem simplification. Risk is an inherent aspect of decision-making under uncertainty, and decisions made without considering potential adverse outcomes can lead to undesirable consequences. This thesis introduces a formal framework for risk-sensitive differentiable planning that applies to various stochastic continuous environments. It discusses theoretical convergence properties, practical implementation considerations, and provides an empirical evaluation of the proposed method on an illustrative navigation problem, a benchmark control problem, and a real-world financial application. Risk-averse policies were observed to favor safer paths over shorter ones in the navigation problem, closely approximate optimal solutions in the control benchmark, and yield competitive decision strategies in the financial application. These results confirm that the proposed method works effectively in practice, producing robust, risk-sensitive solutions across domains and demonstrating its practical applicability in complex real-world scenarios.
Título em português
Planejamento diferenciável sensível ao risco
Palavras-chave em português
Medidas de risco, Otimização estocástica, Planejamento diferenciável
Resumo em português
Planejamento é a área da Inteligência Artificial que estuda problemas de tomada de decisão sequencial da perspectiva de um agente que busca atingir um certo objetivo. Embora avanços significativos tenham sido feitos em planejamento discreto e determinístico, ambientes contínuos e estocásticos apresentam inúmeros desafios. O planejamento diferenciável aborda esses desafios ao enquadrar a tarefa de planejamento como um problema de otimização que pode ser resolvido usando técnicas de otimização baseadas em gradientes. Esta abordagem permite a síntese de planos em ambientes contínuos e estocásticos, complexos e não lineares, sem simplificação do problema. O risco é um aspecto inerente à tomada de decisão em condições de incerteza, e decisões tomadas sem considerar possíveis resultados adversos podem levar a consequências indesejáveis. Este trabalho introduz uma estrutura formal para o planejamento diferenciável sensível ao risco que se aplica a vários problemas contínuos e estocásticos. São discutidas propriedades teóricas de convergência e considerações práticas de implementação, além de realizada uma avaliação empírica do método proposto em um problema ilustrativo de navegação, um \\textit de controle e uma aplicação financeira do mundo real. Observou-se que políticas avessas ao risco tendem a priorizar rotas com menor variância no problema de navegação, aproximam-se de forma consistente de soluções ótimas no \\textit de controle e apresentam estratégias de decisão competitivas na aplicação financeira. Esses resultados confirmam o bom desempenho do método proposto na prática, gerando soluções robustas e sensíveis ao risco em diferentes domínios e demonstrando sua aplicabilidade em cenários reais complexos.

AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso: Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.

Data de Publicação
2025-04-09

Trabalhos decorrentes

AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.

Serviços

Carregando...