• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.100.2021.tde-02122021-144602
Document
Author
Full name
Rafael Gaspar de Sousa
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2021
Supervisor
Committee
Peres, Sarajane Marques (President)
Carvalho, André Carlos Ponce de Leon Ferreira de
Lopes, Hélio Côrtes Vieira
Title in English
Trace clustering approach for detection and locatization of concept drift in business processes
Keywords in English
Clustering
Concept drift
Data mining
Data stream
Process mining
Trace clustering
Abstract in English
Business processes are constantly subject to changes over time due to the need for adaptation and flexibility in the complex environment they operate, such as new clients demands, competition, or legislation. Process models are one of the fundamental tools when understanding a process behavior, which is key for business success. However, these process models are usually not documented and updated to agree with eventual changes in process behavior over time, leading to misconceptions in the understanding of the actual process. Although process mining aims to provide techniques that discover, analyze, and enhance process automatically based on event logs, most techniques assume that the process is stationary, which is not often the case. Handling the problem of processes changing over time, known as concept drift, leads to the capability of detecting drift as soon as possible and localizing the entities involved in them, providing a much better comprehension of the process behavior that can be a competitive advantage for businesses. Most of the work on dealing with concept drift in the process mining literature focuses on providing a framework that is able to detect drifts, but are generally not adequate to simultaneously localize the change inside the process behavior and exhibit information on the entities involved. Applying clustering techniques to data from event logs, known as trace clustering, supports the identification of patterns in the process behavior that enable simplification and segregation of similar behaviors that produces a model of the process behavior as clusters. However, although common in general process mining, trace clustering has not been widely explored in the context of the concept drift problem. This research presents a method to simultaneously perform concept drift detection and localization based on the same clusters obtained by online trace clustering. The clusters are able to reflect changes in complex process behavior in a simplified manner that serves as a platform for performing effective drift detection and localization online with no additional data structures. Experiments with synthetic and real-world event logs with different types of control-flow changes have shown that, although our method has not outperformed the baseline for drift detection in all cases, our approach was able to correctly detect drifts in most cases according to parameters configuration while also providing information about the entities involved in the drift from the business process perspective
Title in Portuguese
Abordagem baseada em agrupamento de traços para detecção e localização de concept drift em processos de negócios
Keywords in Portuguese
Agrupamento
Agrupamento de traços
Concept drift
Mineração de dados
Mineração de processos
Stream de dados
Abstract in Portuguese
Processos de negócios estão constantemente em mudança ao longo do tempo devido à necessidade de adaptação e flexibilidade nos ambientes complexos em que eles operam, como novas demandas de clientes, competição ou legislação. Modelos de processos são uma das principais ferramentas utilizadas para se entender o funcionamento de processo. Entretanto, esses modelos costumam não serem documentados ou atualizados frequentemente para se adequarem a eventuais mudanças no comportamento do processo, gerando equívocos no entendimento do processo real. Embora a área de mineração de processos tem por objetivo desenvolver técnicas para descobrir, analisar e melhorar processos automaticamente a partir de logs de eventos, a maioria dos métodos assumem que o processo é estacionário, o que frequentemente não é o caso. Lidar com esse problema de processos variando ao longo do tempo, conhecido como concept drift, busca prover a capacidade de detectar o quanto antes um drift e localizar as entidades envolvidas nele, levando a uma compreensão muito melhor do processo de negócio em questão, o que pode ser uma vantagem competitiva para o negócio. A maioria dos trabalhos que lida com concept drift em processos de negócios foca no desenvolvimento de métodos capazes de realizar a detecção de drifts, mas geralmente não são capazes de simultaneamente localizar o drift dentro do comportamento do processo e revelar as entidades envolvidas no drift. Aplicando técnicas de clusterização em dados de logs de eventos, conhecido como trace clustering, é possível identificar padrões dentro do comportamento do processo que possibilitam a simplificação e segregação de comportamentos similares que produzem um modelo que representa o comportamento do processo em forma de clusters. Contudo, embora comum em mineração de processos no geral, trace clustering ainda não foi amplamente explorado dentro do contexto de concept drift. Este trabalho apresenta um método que realiza detecção e localização de drifts simultaneamente de forma online baseada nos mesmos clusters obtidos por trace clustering. Esses clusters são capazes de refletir as mudanças que ocorrem em processos de comportamento complexo de forma simplificada, servindo como uma plataforma para a execução de detecção e localização de drifts de forma efetiva sem necessidade de estrutura de dados adicional. Experimentos com logs de eventos sintéticos e do mundo real com diferentes tipos de mudanças de fluxo-controle demonstram que, embora nosso método não tenha superado o baseline em todos os casos na tarefa de detecção, nossa abordagem foi capaz de detectar drifts corretamente na maioria dos casos de acordo com a configuração de parâmetros utilizada, enquanto também foi capaz de prover informações sobre as entidades envolvidas no drift do ponto de vista do processo de negócio
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2022-01-20
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.