• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tesis Doctoral
DOI
https://doi.org/10.11606/T.18.2023.tde-20092023-105645
Documento
Autor
Nombre completo
Talysson Manoel de Oliveira Santos
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Carlos, 2023
Director
Tribunal
Silva, Ivan Nunes da (Presidente)
Achcar, Jorge Alberto
Bessani, Michel
Fernandes, Ricardo Augusto Souza
Nepomuceno, Erivelton Geraldo
Título en inglés
Evolving discrete dynamic bayesian networks: an approach for time series
Palabras clave en inglés
CO2 emissions forecasting
evolving dynamic bayesian network
learning of robust structures
missing data
time series
Resumen en inglés
Knowledge discovery in time series datasets is a subject of great interest and importance in academics and industry. For such purpose, a set of theories and computational tools have been proposed and used to extract useful information from time series to assist in decision-making in different areas. Among the possibilities, Bayesian network is a probabilistic graphical model representing a set of random variables and their conditional statistical dependencies via a directed acyclic graph (DAG). This doctoral research proposes a methodology for dealing with time series based on evolving discrete Dynamic Bayesian Networks (EDBN) by an analytical threshold for selecting directed edges by the occurrence frequency as new datasets are collected. In this proposal, as new datasets are collected, the algorithm learns the structure of a DBN by using a score metric and the hill-climbing method and then uses the analytical threshold for selecting the directed edges between the nodes by the occurrence frequency. The developed method smoothly converges to a robust model and constantly adapts to the arrival of new data, obtaining more reliable network models. The discrete model is chosen to be a non-parametric approach that can be adequate for different data behaviour without manual modifications, i.e., totally data-driven. The proposal was evaluated by dealing with real datasets of time series in data imputation and CO2 emissions forecasting during energy generation, which are two contexts that have received a lot of attention from researchers in recent years. Evaluating the results against widely used imputation methods, the proposed approach proved capable of handling data imputation in time series datasets for missing completely at random and for missing not at random. In the context of CO2 emissions forecasting in multi-source power generation systems, real datasets of Belgium, Germany, Portugal, and Spain were used. The proposed approach showed to be capable of dealing with CO2 emissions forecasting in the systems evaluated in this study. Comparing the results against a traditional DBN that not evolve the structure over time, the proposal developed was superior highlighting a contribution of performance improvement. The proposed method was also better when compared to other traditional methods. Moreover, the model also is computationally efficient, making the proposal a good option for embedding such an approach for dealing with time series in online applications.
Título en portugués
Evolução de redes bayesianas dinâmicas discretas: uma abordagem para lidar com séries temporais
Palabras clave en portugués
aprendizado de estruturas robustas
dados faltantes
previsão de emissões de CO2
rede bayesiana dinâmica evolutiva
séries temporais
Resumen en portugués
A descoberta de conhecimento em conjuntos de dados de séries temporais é um assunto de grande interesse e importância tanto na academia quanto na indústria. Para tal, um conjunto de teorias e ferramentas computacionais foram propostas e utilizadas para extrair informações úteis de séries temporais para auxiliar na tomada de decisões em diferentes áreas. Dentre as possibilidades, a rede bayesiana é um modelo gráfico probabilístico que representa um conjunto de variáveis aleatórias e suas dependências estatísticas condicionais por meio de um grafo acíclico direcionado (DAG). Nesta pesquisa de doutorado, propõe-se uma metodologia para lidar com séries temporais baseada na evolução de Redes Bayesianas Dinâmicas (EDBN) discretas por um limiar analítico para selecionar arestas direcionadas pela frequência de ocorrência à medida que novos conjuntos de dados são coletados. Assim, nesta proposta, à medida que novos conjuntos de dados são coletados, o algoritmo aprende a estrutura de um DBN usando uma métrica de pontuação e o método hill-climbing e então usa o limite analítico para selecionar as arestas direcionadas entre os nós pela frequência de ocorrência. O método desenvolvido converge suavemente para um modelo robusto e se adapta constantemente à chegada de novos dados, obtendo modelos de rede mais confiáveis. Escolhe-se o modelo discreto por ser uma abordagem não paramétrica que pode ser adequada para diferentes comportamentos de dados sem modificações manuais, ou seja, totalmente orientado a dados. Avaliou-se essa proposta lidando com conjuntos de dados reais de séries temporais em imputação de dados e previsão de emissões de CO2 durante a geração de energia, que são dois contextos que receberam muita atenção de pesquisadores nos últimos anos. Avaliando os resultados em relação aos métodos de imputação amplamente utilizados, a abordagem proposta provou ser capaz de lidar com a imputação de dados em conjuntos de dados de séries temporais para faltas completamente aleatórias e para faltas não aleatórias. No contexto da previsão de emissões de CO2 em sistemas de geração de energia de várias fontes, foi utilizado conjuntos de dados reais da Bélgica, Alemanha, Portugal e Espanha. A abordagem proposta mostrou-se capaz de lidar com a previsão de emissões de CO2 nos sistemas avaliados neste estudo. Comparando os resultados com um DBN tradicional que não evolui a estrutura ao longo do tempo, a proposta desenvolvida foi superior destacando uma contribuição de melhoria de desempenho. O método proposto também foi melhor quando comparado a outros métodos tradicionais. Além disso, o modelo também é computacionalmente eficiente, tornando a proposta desenvolvida uma boa opção para incorporar tal abordagem para lidar com séries temporais em aplicações online.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2023-09-21
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2024. Todos los derechos reservados.