• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Disertación de Maestría
DOI
https://doi.org/10.11606/D.3.2022.tde-16082023-091934
Documento
Autor
Nombre completo
Miguel Diaz Iturry
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Paulo, 2022
Director
Tribunal
Souza, Solange Nice Alves de (Presidente)
Barra, Claudia Maria Cabral Moro
Digiampietri, Luciano Antonio
Título en portugués
Avaliação da qualidade de dados de laudos de procedimentos para a codificação automática de diagnósticos secundários.
Palabras clave en portugués
Mineração de dados
Resumen en portugués
O pagamento referente ao custo de um paciente se baseia no consumo dos recursos utilizados nos procedimentos realizados e itens consumidos pelo paciente, bem como no código principal e secundário da doença diagnosticada para o paciente. Atualmente a classificação da doença é feita utilizando a Classificação Internacional de Doenças (CID). Nesse processo, a identificação dos códigos de diagnósticos secundários é realizada por especialistas que revisam os diagnósticos lançados pelo médico no resumo de alta, no prontuário do paciente e nos resultados presentes nos laudos de procedimentos. Tal processo, em geral, é manual e, devido à grande quantidade de laudos, é uma tarefa cansativa e suscetível a erros. Adicionalmente a essa dificuldade, pesquisas prévias identificaram problemas na Qualidade dos Dados (QD), o que prejudica na identificação dos códigos de doenças. O presente trabalho avalia e trata a qualidade dos dados para a aplicação de algoritmos de Aprendizagem de Máquina (AM) para a codificação automática de doenças relativas ao capítulo de neoplasias da CID, as quais são identificadas nos laudos de exames anatomopatológicos. As dimensões de QD identificadas pelos problemas encontrados nos laudos foram a acessibilidade e a acurácia dos textos. A outra contribuição do trabalho é a proposta de um modelo hierárquico para melhoria do desempenho do modelo de Aprendizagem de Máquina (AM) aplicado para a codificação automática dos diagnósticos secundários. Os resultados mostraram que o modelo hierárquico incrementa em 15% o desempenho do modelo clássico, comprovando que explorar a organização do padrão CID para a criação de modelos é uma vantagem na codificação automática. Adicionalmente, demostrou-se que o tratamento dos textos e o balanceamento das classes melhoram o desempenho dos modelos de codificação e os tornam mais robustos à distribuição dos códigos.
Título en inglés
Untitled in english
Palabras clave en inglés
Automatic coding
Data quality
International Classification of Diseases (ICD)
Machine learning
Medical record
Resumen en inglés
The reimbursement concerning a patients cost is based in the medical resources employed, as well as in the principal and secondary disease code. Currently the classification of the diseases is based on the International Classification of Diseases (ICD). In this process, the identification of secondary disease codes is done by specialists that review the diagnoses written by the doctor in the patients medical records and laboratory results. Such process is done manually and, because of the large quantity of medical records, it is a tiring task and susceptible to errors. Additionally to this difficulty, previous researches identified problems in the Data Quality (DQ), which jeopardize the identification of disease codes. In the present research, the DQ is assessed and treated to develop a Machine Learning (ML) model for automatic neoplasm disease coding found in the anatomopathological reports. The DQ dimenssions identified in the problems are text accessibility and accuracy. A contribution in the present project is a hierarchical model to improve the performance of the ML model for disease coding. The results showed that the hierarchical model outperforms by a 15% the performance of a classic model, proving that employing the organization of the ICD standard is a leverage in the automatic coding. Additionally, it was demostrated that text treatment and class balancing improve the performance of the models and make them more robust to the dataset class distribution.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2023-08-16
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2024. Todos los derechos reservados.