Tese de Doutorado
Documento
Tese de Doutorado
Autor
Nome completo
Marcel Rodrigues de Barros
E-mail
Unidade da USP
Escola Politécnica
Programa ou Especialidade
Data de Defesa
2024-11-12
Imprenta
São Paulo, 2024
Orientador
Banca examinadora
Costa, Anna Helena Reali (Presidente)
Júnior, Amauri Holanda de Souza
Mauá, Denis Deratani
Siqueira, Fabio Levy
Tinós, Renato
Título em português
Incorporando as irregularidades de dados em séries temporais multivariadas.
Palavras-chave em português
Análise de séries temporais, Aprendizado computacional, Maré (Previsão), Redes neurais
Resumo em português
Incorporando as Irregularidades de Dados em Séries Temporais Multivariadas. Dados de séries temporais multivariadas (MTS) são predominantes em diversos domínios, como ciência climática, saúde, finanças e operações industriais, desempenhando papel crucial no monitoramento e na previsão do comportamento de sistemas. No entanto, MTS do mundo real frequentemente apresentam irregularidades, como dados ausentes, observações assíncronas e taxas de amostragem variáveis, que impõem desafios significativos aos modelos convencionais de aprendizado de máquina. Métodos tradicionais geralmente regularizam os dados de MTS, introduzindo ineficiências e ignorando o valor inerente dessas irregularidades. Esta tese propõe novas definições e abordagens para processar irregularidades em MTS de forma direta, sem a necessidade de extenso pré-processamento, melhorando, assim, o desempenho do modelo e simplificando os fluxos de dados. A questão central desta pesquisa é saber se uma arquitetura unificada de aprendizado de máquina pode lidar de maneira eficaz tanto com MTS regulares quanto irregulares. Para esse fim, apresentamos a nova arquitetura de aprendizado de máquina GAMR, que integra redes neurais recorrentes (RNNs) e redes neurais baseadas em grafos (GNNs), permitindo capturar dependências tanto temporais quanto entre diferentes sensores. Um dos principais avanços é o desenvolvimento do mecanismo GATE, projetado para lidar com intervalos irregulares entre observações, o que aprimora a capacidade do modelo de gerenciar dados ausentes e taxas de amostragem variáveis. A arquitetura foi validada em colaboração com dois grupos de pesquisa: a equipe Neural Motion Estimation (NeMo), que foca na previsão do comportamento dinâmico de plataformas de petróleo offshore, e a iniciativa Oceanography-Informed Machine Learning (OceanML), dedicada à detecção precoce de marés de tempestade extremas a partir de dados multimodais. Os resultados demonstram que o modelo supera abordagens tradicionais ao usar as irregularidades como informações relevantes, em vez de pré-processá-las. As descobertas têm implicações significativas para o avanço da análise de MTS em aplicações complexas do mundo real, onde irregularidades são a regra, e não a exceção.
Título em inglês
Embracing data irregularities in multivariate time series.
Palavras-chave em inglês
Data irregularities, Multivariate time series, Nachine learning, Time encoding
Resumo em inglês
Multivariate time series (MTS) data are prevalent in numerous domains, including climate science, healthcare, finance, and industrial operations, where they play a crucial role in monitoring and forecasting system behavior. However, real-world MTS often exhibits irregularities, such as missing data, asynchronous observations, and varying sampling rates, which pose significant challenges for conventional machine learning models. Traditional methods frequently regularize MTS data, introducing inefficiencies, and overlooking the inherent value of these irregularities. This thesis proposes new definitions and approaches to process irregularities in MTS directly, without the need for extensive preprocessing, thus improving model performance and streamlining data pipelines. The central research question addressed is whether a unified machine learning architecture can handle regular and irregular MTS effectively. To this end, we introduce a novel machine learning architecture GAMR, which integrates recurrent neural networks (RNNs) and graph neural networks (GNNs), allowing the capture of both temporal and cross-sensor dependencies. A key contribution is the development of the GATE mechanism, designed to handle irregular intervals between observations, which enhances the models ability to manage missing data and variable sampling rates. The architecture is validated through collaborations with two research groups: the Neural Motion Estimation (NeMo) team, which focuses on predicting the dynamic behavior of offshore oil platforms, and the Oceanography-Informed Machine Learning (OceanML) initiative, which targets the early detection of extreme storm tides using multimodal data. The results demonstrate that this model outperforms traditional approaches by using irregularities as informative features rather than preprocessing them. The findings have significant implications for the advancement of the analysis of MTS in complex real-world applications, where irregularities are the norm rather than the exception.
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso: Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2025-08-21
Trabalhos decorrentes
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.