Master's Dissertation
DOI
https://doi.org/10.11606/D.100.2020.tde-22032020-104801
Document
Author
Full name
Thais Rodrigues Neubauer
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2020
Supervisor
Committee
Peres, Sarajane Marques (President)
Barbon Júnior, Sylvio
Prati, Ronaldo Cristiano
Title in Portuguese
Agrupamento interativo aplicado à mineração de processos de negócio
Keywords in Portuguese
Agrupamento de traços
Agrupamento de traços interativo
Agrupamento interativo
Gerenciamento de processos de negócio
Mineração de dados
Mineração de processos
Abstract in Portuguese
Os modelos de processos são ferramentas essenciais para alcançar o sucesso no gerenciamento de negócio. No entanto, devido diversos fatores, é comum que as organizações não formalizem esses modelos e, portanto, desconheçam o real processo executado. Em vista disso, a mineração de processo desempenha um papel central e estratégico, pois fornece meios para que os processos organizacionais sejam descobertos, analisados e aprimorados automaticamente. Contudo, a complexidade inerente dos processos organizacionais - especialmente aqueles que não são estruturados - impede que a mineração de processos automatizada seja realizada com total sucesso. Para ajudar na minimização dessa complexidade, a tarefa de agrupamento, denominada agrupamento de traces na área de mineração de processos, fornece uma maneira de identificar padrões existentes nos dados mesmo sem informações prévias sobre eles. Os padrões encontrados podem contribuir com a obtenção de resultados de maior qualidade ou mais aderentes a determinados aspectos organizacionais, pois podem auxiliar na redução de um problema grande e complexo em problemas menores e mais simples, referentes a cada perfil de comportamento encontrado. Embora seja claro que muitos avanços têm sido obtidos com agrupamento de traces, seu potencial ainda não está totalmente explorado. Por um lado, as soluções trazidas ainda não atendem a todas as expectativas e, por outro, é possível identificar iniciativas para melhoria da aplicação da tarefa de agrupamento na área de mineração de dados que ainda são pouco exploradas na área de mineração de processos. Um exemplo disso é a inserção de conhecimento de um ou mais especialistas humanos diretamente nas decisões tomadas no processo de agrupamento de dados, iniciativa denominada agrupamento interativo. O resultado da união de agrupamento interativo e agrupamento de traces está sendo chamado neste trabalho de agrupamento de traces interativo. Este trabalhou explorou como a inclusão do conhecimento de especialistas afeta a qualidade do agrupamento de traces, tanto do ponto de vista de índices de avaliação da área de mineração de dados, quanto da área de mineração de processos. Para tanto, a abordagem de agrupamento interativo utilizada foi de restrições must-link/cannot-link e foram consideradas representações de traces baseadas em modelos semânticos de contagem. Diferentes cenários de experimento no contexto de log de eventos sintéticos e de log de eventos reais provenientes de um processo de gerenciamento de incidentes foram elaborados. A abordagem proposta demonstrou que, apesar de ser observada queda em algumas métricas de qualidade de mineração de processos, é possível obter resultados em que as expectativas de especialistas são atendidas sem causar degradação significativa na qualidade dos grupos resultantes do ponto de vista de mineração de dados e sem perda no aprendizado do algoritmo com a aplicação das restrições. Ainda, no contexto do log de eventos reais, alguns dos resultados de agrupamento de traces interativo obtidos demonstraram capacidade de auxiliar no aumento da precisão na tarefa de predição de tempo de resolução de incidentes
Title in English
Interactive clustering applied in process mining
Keywords in English
Business process management
Data mining
Interactive clustering
Interactive trace clustering
Process mining
Trace clustering
Abstract in English
Process models are essential tools for achieving business management success. However, due to several factors, it is common for organizations not to formalize these models and thus to be unware of the actual process being performed. In view of this, process mining plays a central and strategic role as it provides the means for organizational processes to be discovered, analyzed, and improved automatically. However, the inherent complexity of organizational processes - especially those that are unstructured - prevents automated process mining from being performed with complete success. To assist in minimizing this complexity, the clustering task, called trace clustering in the process mining area, provides a way to identify existing patterns in the data without the need for prior information about them. These patterns can contribute to the achievement of higher quality results or more adherents to certain aspects of an organizational process, they can help to reduce a large and complex problem in smaller and simpler problems, referring to each behavioral profile encountered. Although it is clear that many advances have been obtained in the area of trace clustering, the potential of the area is not yet fully exploited. On the one hand, it can be seen in the literature in the area that the solutions brought by the trace clustering implementation still do not meet all expectations. On the other hand, it is possible to identify initiatives to improve the application of the clustering task in the area of data mining that are still little explored in the area of process mining, such as the interactive clustering, which inserts the knowledge of one or more human specialists in decision-making process. The result of the union of interactive clustering and trace clustering is here called interactive trace clustering. This paper explored how inserting expert knowledge affects the quality of the trace clustering, both from a data mining and process mining evaluation point of view. To this end, the interactive clustering approach used was a constrained clustering, with must-link/cannot-link constrains, and representations of traces based on semantic counting models were considered. Different experiment scenarios in the context of a synthetic event log and an real event log from an incident management process were elaborated. The proposed approach has shown that while some process mining quality metrics were worse, it is possible to achieve results where expert expectations are met without causing significant degradation in the quality of the resulting clusters from data mining perspective and without loss in algorithm learning by applying the constraints. Also, in the context of the real event log, some of the interactive trace clustering results obtained demonstrated the ability to assist in increasing the accuracy of the incident resolution time prediction task
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2020-04-30