• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.3.2022.tde-16082023-091934
Document
Author
Full name
Miguel Diaz Iturry
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2022
Supervisor
Committee
Souza, Solange Nice Alves de (President)
Barra, Claudia Maria Cabral Moro
Digiampietri, Luciano Antonio
Title in Portuguese
Avaliação da qualidade de dados de laudos de procedimentos para a codificação automática de diagnósticos secundários.
Keywords in Portuguese
Mineração de dados
Abstract in Portuguese
O pagamento referente ao custo de um paciente se baseia no consumo dos recursos utilizados nos procedimentos realizados e itens consumidos pelo paciente, bem como no código principal e secundário da doença diagnosticada para o paciente. Atualmente a classificação da doença é feita utilizando a Classificação Internacional de Doenças (CID). Nesse processo, a identificação dos códigos de diagnósticos secundários é realizada por especialistas que revisam os diagnósticos lançados pelo médico no resumo de alta, no prontuário do paciente e nos resultados presentes nos laudos de procedimentos. Tal processo, em geral, é manual e, devido à grande quantidade de laudos, é uma tarefa cansativa e suscetível a erros. Adicionalmente a essa dificuldade, pesquisas prévias identificaram problemas na Qualidade dos Dados (QD), o que prejudica na identificação dos códigos de doenças. O presente trabalho avalia e trata a qualidade dos dados para a aplicação de algoritmos de Aprendizagem de Máquina (AM) para a codificação automática de doenças relativas ao capítulo de neoplasias da CID, as quais são identificadas nos laudos de exames anatomopatológicos. As dimensões de QD identificadas pelos problemas encontrados nos laudos foram a acessibilidade e a acurácia dos textos. A outra contribuição do trabalho é a proposta de um modelo hierárquico para melhoria do desempenho do modelo de Aprendizagem de Máquina (AM) aplicado para a codificação automática dos diagnósticos secundários. Os resultados mostraram que o modelo hierárquico incrementa em 15% o desempenho do modelo clássico, comprovando que explorar a organização do padrão CID para a criação de modelos é uma vantagem na codificação automática. Adicionalmente, demostrou-se que o tratamento dos textos e o balanceamento das classes melhoram o desempenho dos modelos de codificação e os tornam mais robustos à distribuição dos códigos.
Title in English
Untitled in english
Keywords in English
Automatic coding
Data quality
International Classification of Diseases (ICD)
Machine learning
Medical record
Abstract in English
The reimbursement concerning a patients cost is based in the medical resources employed, as well as in the principal and secondary disease code. Currently the classification of the diseases is based on the International Classification of Diseases (ICD). In this process, the identification of secondary disease codes is done by specialists that review the diagnoses written by the doctor in the patients medical records and laboratory results. Such process is done manually and, because of the large quantity of medical records, it is a tiring task and susceptible to errors. Additionally to this difficulty, previous researches identified problems in the Data Quality (DQ), which jeopardize the identification of disease codes. In the present research, the DQ is assessed and treated to develop a Machine Learning (ML) model for automatic neoplasm disease coding found in the anatomopathological reports. The DQ dimenssions identified in the problems are text accessibility and accuracy. A contribution in the present project is a hierarchical model to improve the performance of the ML model for disease coding. The results showed that the hierarchical model outperforms by a 15% the performance of a classic model, proving that employing the organization of the ICD standard is a leverage in the automatic coding. Additionally, it was demostrated that text treatment and class balancing improve the performance of the models and make them more robust to the dataset class distribution.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2023-08-16
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.