• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Dissertação de Mestrado
DOI
https://doi.org/10.11606/D.3.2022.tde-16082023-091934
Documento
Autor
Nome completo
Miguel Diaz Iturry
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Paulo, 2022
Orientador
Banca examinadora
Souza, Solange Nice Alves de (Presidente)
Barra, Claudia Maria Cabral Moro
Digiampietri, Luciano Antonio
Título em português
Avaliação da qualidade de dados de laudos de procedimentos para a codificação automática de diagnósticos secundários.
Palavras-chave em português
Mineração de dados
Resumo em português
O pagamento referente ao custo de um paciente se baseia no consumo dos recursos utilizados nos procedimentos realizados e itens consumidos pelo paciente, bem como no código principal e secundário da doença diagnosticada para o paciente. Atualmente a classificação da doença é feita utilizando a Classificação Internacional de Doenças (CID). Nesse processo, a identificação dos códigos de diagnósticos secundários é realizada por especialistas que revisam os diagnósticos lançados pelo médico no resumo de alta, no prontuário do paciente e nos resultados presentes nos laudos de procedimentos. Tal processo, em geral, é manual e, devido à grande quantidade de laudos, é uma tarefa cansativa e suscetível a erros. Adicionalmente a essa dificuldade, pesquisas prévias identificaram problemas na Qualidade dos Dados (QD), o que prejudica na identificação dos códigos de doenças. O presente trabalho avalia e trata a qualidade dos dados para a aplicação de algoritmos de Aprendizagem de Máquina (AM) para a codificação automática de doenças relativas ao capítulo de neoplasias da CID, as quais são identificadas nos laudos de exames anatomopatológicos. As dimensões de QD identificadas pelos problemas encontrados nos laudos foram a acessibilidade e a acurácia dos textos. A outra contribuição do trabalho é a proposta de um modelo hierárquico para melhoria do desempenho do modelo de Aprendizagem de Máquina (AM) aplicado para a codificação automática dos diagnósticos secundários. Os resultados mostraram que o modelo hierárquico incrementa em 15% o desempenho do modelo clássico, comprovando que explorar a organização do padrão CID para a criação de modelos é uma vantagem na codificação automática. Adicionalmente, demostrou-se que o tratamento dos textos e o balanceamento das classes melhoram o desempenho dos modelos de codificação e os tornam mais robustos à distribuição dos códigos.
Título em inglês
Untitled in english
Palavras-chave em inglês
Automatic coding
Data quality
International Classification of Diseases (ICD)
Machine learning
Medical record
Resumo em inglês
The reimbursement concerning a patients cost is based in the medical resources employed, as well as in the principal and secondary disease code. Currently the classification of the diseases is based on the International Classification of Diseases (ICD). In this process, the identification of secondary disease codes is done by specialists that review the diagnoses written by the doctor in the patients medical records and laboratory results. Such process is done manually and, because of the large quantity of medical records, it is a tiring task and susceptible to errors. Additionally to this difficulty, previous researches identified problems in the Data Quality (DQ), which jeopardize the identification of disease codes. In the present research, the DQ is assessed and treated to develop a Machine Learning (ML) model for automatic neoplasm disease coding found in the anatomopathological reports. The DQ dimenssions identified in the problems are text accessibility and accuracy. A contribution in the present project is a hierarchical model to improve the performance of the ML model for disease coding. The results showed that the hierarchical model outperforms by a 15% the performance of a classic model, proving that employing the organization of the ICD standard is a leverage in the automatic coding. Additionally, it was demostrated that text treatment and class balancing improve the performance of the models and make them more robust to the dataset class distribution.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2023-08-16
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2024. Todos os direitos reservados.