• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Mémoire de Maîtrise
DOI
https://doi.org/10.11606/D.100.2021.tde-02122021-144602
Document
Auteur
Nom complet
Rafael Gaspar de Sousa
Adresse Mail
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
São Paulo, 2021
Directeur
Jury
Peres, Sarajane Marques (Président)
Carvalho, André Carlos Ponce de Leon Ferreira de
Lopes, Hélio Côrtes Vieira
Titre en anglais
Trace clustering approach for detection and locatization of concept drift in business processes
Mots-clés en anglais
Clustering
Concept drift
Data mining
Data stream
Process mining
Trace clustering
Resumé en anglais
Business processes are constantly subject to changes over time due to the need for adaptation and flexibility in the complex environment they operate, such as new clients demands, competition, or legislation. Process models are one of the fundamental tools when understanding a process behavior, which is key for business success. However, these process models are usually not documented and updated to agree with eventual changes in process behavior over time, leading to misconceptions in the understanding of the actual process. Although process mining aims to provide techniques that discover, analyze, and enhance process automatically based on event logs, most techniques assume that the process is stationary, which is not often the case. Handling the problem of processes changing over time, known as concept drift, leads to the capability of detecting drift as soon as possible and localizing the entities involved in them, providing a much better comprehension of the process behavior that can be a competitive advantage for businesses. Most of the work on dealing with concept drift in the process mining literature focuses on providing a framework that is able to detect drifts, but are generally not adequate to simultaneously localize the change inside the process behavior and exhibit information on the entities involved. Applying clustering techniques to data from event logs, known as trace clustering, supports the identification of patterns in the process behavior that enable simplification and segregation of similar behaviors that produces a model of the process behavior as clusters. However, although common in general process mining, trace clustering has not been widely explored in the context of the concept drift problem. This research presents a method to simultaneously perform concept drift detection and localization based on the same clusters obtained by online trace clustering. The clusters are able to reflect changes in complex process behavior in a simplified manner that serves as a platform for performing effective drift detection and localization online with no additional data structures. Experiments with synthetic and real-world event logs with different types of control-flow changes have shown that, although our method has not outperformed the baseline for drift detection in all cases, our approach was able to correctly detect drifts in most cases according to parameters configuration while also providing information about the entities involved in the drift from the business process perspective
Titre en portugais
Abordagem baseada em agrupamento de traços para detecção e localização de concept drift em processos de negócios
Mots-clés en portugais
Agrupamento
Agrupamento de traços
Concept drift
Mineração de dados
Mineração de processos
Stream de dados
Resumé en portugais
Processos de negócios estão constantemente em mudança ao longo do tempo devido à necessidade de adaptação e flexibilidade nos ambientes complexos em que eles operam, como novas demandas de clientes, competição ou legislação. Modelos de processos são uma das principais ferramentas utilizadas para se entender o funcionamento de processo. Entretanto, esses modelos costumam não serem documentados ou atualizados frequentemente para se adequarem a eventuais mudanças no comportamento do processo, gerando equívocos no entendimento do processo real. Embora a área de mineração de processos tem por objetivo desenvolver técnicas para descobrir, analisar e melhorar processos automaticamente a partir de logs de eventos, a maioria dos métodos assumem que o processo é estacionário, o que frequentemente não é o caso. Lidar com esse problema de processos variando ao longo do tempo, conhecido como concept drift, busca prover a capacidade de detectar o quanto antes um drift e localizar as entidades envolvidas nele, levando a uma compreensão muito melhor do processo de negócio em questão, o que pode ser uma vantagem competitiva para o negócio. A maioria dos trabalhos que lida com concept drift em processos de negócios foca no desenvolvimento de métodos capazes de realizar a detecção de drifts, mas geralmente não são capazes de simultaneamente localizar o drift dentro do comportamento do processo e revelar as entidades envolvidas no drift. Aplicando técnicas de clusterização em dados de logs de eventos, conhecido como trace clustering, é possível identificar padrões dentro do comportamento do processo que possibilitam a simplificação e segregação de comportamentos similares que produzem um modelo que representa o comportamento do processo em forma de clusters. Contudo, embora comum em mineração de processos no geral, trace clustering ainda não foi amplamente explorado dentro do contexto de concept drift. Este trabalho apresenta um método que realiza detecção e localização de drifts simultaneamente de forma online baseada nos mesmos clusters obtidos por trace clustering. Esses clusters são capazes de refletir as mudanças que ocorrem em processos de comportamento complexo de forma simplificada, servindo como uma plataforma para a execução de detecção e localização de drifts de forma efetiva sem necessidade de estrutura de dados adicional. Experimentos com logs de eventos sintéticos e do mundo real com diferentes tipos de mudanças de fluxo-controle demonstram que, embora nosso método não tenha superado o baseline em todos os casos na tarefa de detecção, nossa abordagem foi capaz de detectar drifts corretamente na maioria dos casos de acordo com a configuração de parâmetros utilizada, enquanto também foi capaz de prover informações sobre as entidades envolvidas no drift do ponto de vista do processo de negócio
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Date de Publication
2022-01-20
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
CeTI-SC/STI
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2024. Tous droits réservés.