• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.55.2021.tde-21012022-175531
Document
Author
Full name
Antonio Luiz Tonissi Migliato
Institute/School/College
Knowledge Area
Date of Defense
Published
São Carlos, 2021
Supervisor
Committee
Ponti, Moacir Antonelli (President)
Carvalho, André Carlos Ponce de Leon Ferreira de
Masili, Mauro
Peres, Sarajane Marques
Title in Portuguese
Detecção de Outliers em Dados não Vistos de Séries Temporais por meio de Erros de Predição com SARIMA e Redes Neurais Recorrentes LSTM e GRU
Keywords in Portuguese
Detecção de outliers
GRU
LSTM
Predição de séries temporais
SARIMA
Abstract in Portuguese
A atividade de identificar padrões nos dados que não estejam em conformidade com o comportamento esperado, ou detecção de outliers, como é conhecida, é um problema relevante em diversas áreas do conhecimento, como financeira, saúde, detecção de fraudes, entre outras. Em diversas dessas áreas, os dados apresentam-se em forma de séries temporais. Esse tipo de dado exige métodos que considerem a natureza sequencial das observações, visto que os valores em séries temporais são correlacionados e dependentes. Nesses casos, sistemas de detecção de outliers precisam lidar com situações nas quais os valores estão temporalmente associados. Visando encontrar respostas mais apropriadas para a detecção de outliers nessas situações, sistemas baseados em erros de predições realizadas com redes recorrentes LSTM tem sido propostos. Neste trabalho, foi estudado um modelo de detecção de outliers em dados não vistos baseado nas capacidades preditivas das redes neurais LSTM e GRU. A diferença entre os valores preditos e os valores observados foram calculados como erros de predição e utilizados para detectar outliers em três séries temporais univariadas de contexto econômico. Como linha de base para comparações, foi utilizado o modelo estatístico SARIMA. Primeiramente, utilizou-se um valor limite específico para detecção de outliers, calculado a partir dos erros de predição do conjunto de treinamento. Num segundo momento, os modelos foram testados com todos os valores limites possíveis para detecção de outliers. Os resultados mostraram que o modelo SARIMA obteve melhor desempenho no geral, mas os desempenhos apresentados pelas redes neurais LSTM e GRU foram satisfatórios e merecem mais estudos.
Title in English
Outlier Detection in Unseen Time Series Data via Prediction Errors with SARIMA and Recurrent Neural Networks LSTM and GRU
Keywords in English
GRU
LSTM
Outliers detection
SARIMA
Time series prediction
Abstract in English
The activity of identifying patterns in data that do not comply with expected behavior, or detection of outliers, as it is known, is a relevant problem in several areas of knowledge, such as finance, health, fraud detection, among others. In several of these areas, data are presented in the form of time series. This type of data requires methods that consider the sequential nature of the observations, as the values in time series are correlated and dependent. In these cases, outlier detection systems need to deal with situations in which values are temporally associated. Aiming to find more appropriate answers for the detection of outliers in these situations, systems based on prediction errors with LSTM recurrent networks have been proposed. In this work, an outlier detection model in unseen data based on the predictive capabilities of LSTM and GRU neural networks was studied. The difference between predicted values and observed values were calculated as prediction errors and used to detect outliers in three univariate time series of economic context. As a baseline for comparisons, the SARIMA statistical model was used. First, a specific threshold was used to detect outliers, calculated from the training set prediction errors. Secondly, the models were tested with all possible thresholds for detecting outliers. The results showed that the SARIMA model had better overall performance, both in predicting and detecting outliers, but the performances achieved by the LSTM and GRU neural networks were satisfactory and deserve further studies.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2022-01-21
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.