• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.55.2021.tde-15032022-143926
Document
Author
Full name
Jose Maria Clementino Junior
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Carlos, 2021
Supervisor
Committee
Traina, Agma Juci Machado (President)
Marcacini, Ricardo Marcondes
Rittner, Letícia
Silva, Diego Furtado
Title in Portuguese
Integrando técnicas de aprendizado de máquina para descoberta de conhecimento interpretável de prontuários eletrônicos de pacientes
Keywords in Portuguese
Agrupamento
Inteligência artificial explicável
Reconhecimento de padrões
Registros médicos eletrônicos
Abstract in Portuguese
Um desafio a ser superado na área de Aprendizado de Máquina (AM) é a capacidade dos modelos serem explicáveis e apresentarem um alto nível de interpretabilidade e transparência. É possível observar que grande parte dos métodos preocupam-se somente com métricas quantitativas, deixando de explorar a interpretabilidade dos resultados obtidos. Em algumas áreas, tal como a medicina, além da acurácia obtida pelos métodos computacionais é importante que os profissionais compreendam o porquê de uma decisão foi tomada. A importância dada à explicabilidade da decisão do método se justifica por se tratar de áreas críticas, onde uma decisão errada pode causar uma grande perda financeira, a privacidade ou a saúde. Ao encontro desse cenário um campo de pesquisa denominado Explainable Artificial Intelligence (XAI) tem surgido com interesse de desenvolver métodos que priorizam explicabilidade, tanto do funcionamento do modelo quanto da explicação das decisões indicadas. Portanto, este trabalho, tem por objetivo a criação de métodos capazes de extrair conhecimento em registros médicos eletrônicos priorizando a explicabilidade dos resultados obtidos. O primeiro método denominado Bag-of-Attributes Representation (BOAR) proporciona uma representação capaz de superar o problema de interoperabilidade de bases de dados médicas e servir como entrada para diversos algoritmos de agrupamento. Após o processo de descoberta de padrões por meio dos algoritmos de agrupamento, o segundo método Multilevel Clustering Explainer (MCE) tem como ideia principal reunir informações descritivas e visuais sobre a composição dos padrões encontrados, por meio da apresentação das variáveis que mais influenciaram na decisão do algoritmo. O MCE tem a flexibilidade de fornecer explicações em dois níveis: no global apresentando as principais características dos objetos que determinaram a formação de um determinado cluster e no local a influência considerando um único objeto. O MCE possui uma grande capacidade de modularização de seus parâmetros em relação a estrutura de funcionamento e de apresentação dos resultados, proporcionando ao profissional de saúde um melhor entendimento das informações e padrões encontrados.O MCE mostrou ser capaz de fornecer informações explicativas que permitem uma análise top-down na compreensão da composição, relacionamento e inconsistências dos clusters Neste trabalho. O MCE permitiu a compreensão de quais procedimentos médicos mais influenciaram para a caracterização de diferentes clusters.
Title in English
Towards integration of machine learning techniques and interpretable knowledge discovery from electronic health records
Keywords in English
Clustering
Electronic patient records
Explainable artificial intelligence
Pattern recognition
Abstract in English
An important challenge that is still hard to overcome, is the ability of machine learning models being explicable and having a high level of interpretability and transparency. However, there is a lack of research on models that address the interpretability of knowledge discovery. In areas, such as Medicine, besides the accuracy that computational methods should present, it is essential for medical professionals to understand the reason for a certain decision. The importance of the explicability of the decision suggested by the method is based on the critical nature of these areas. A wrong decision may cause serious consequences on health. In that context, in order to overcome these problems, a new field, Explainable Artificial Intelligence (XAI), has emerged. The goal of XAI is to develop methods that prioritize the explicability. Considering both the model functionality and the explanation of the suggested decisions. In this work, the objective was to create methods capable of extracting knowledge from electronic medical records, prioritizing the results explanability. The first method called Bag-of-Attributes Representation (BOAR) provides a representation capable of overcoming the problem of interoperability of medical databases and serving as an input to several clustering algorithms. After the process of discovering patterns using clustering algorithms, the second method Multilevel Clustering Explainer (MCE), has as the main idea to gather descriptive and visual information about the composition of the patterns found by presenting the variables that most influenced the decision of the algorithm. Thus, MCE has the flexibility to provide explanations on two levels: globally offering the main characteristics of the objects that determined the formation of a given cluster and on the spot the influence considering a single object. In addition, the MCE has a great capacity to modularize its parameters concerning the operating structure and presentation of results, providing the health professional with a better understanding of the information and patterns found. The MCE proved to provide explanatory information that allows for top-down analysis of clusters composition, relationship, and inconsistencies. In this work, the MCE allowed understanding of which medical procedures most influenced the characterization of different clusters.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2022-03-15
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.