• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tese de Doutorado
DOI
https://doi.org/10.11606/T.17.2013.tde-26032014-103153
Documento
Autor
Nome completo
Flavio Barbosa
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
Ribeirão Preto, 2013
Orientador
Banca examinadora
Muglia, Valdair Francisco (Presidente)
Elias Júnior, Jorge
Oliveira, Harley Francisco de
Rangel, Alexandre Leite
Traina, Agma Juci Machado
Título em português
Metodologia para estruturação de informações de laudos radiológicos
Palavras-chave em português
estruturação da informação
Laudo radiológico
ontologia
terminologia
texto livre
Resumo em português
Introdução: O laudo radiológico com entrada de dados estruturada proporciona precisão na recuperação de informações, todavia, é menos abrangente que o texto-livre e pode impedir o especialista de descrever um achado importante, não contemplado pela estrutura pré-definida. Portanto, a solução está em interpretar o texto escrito pelo especialista e os transportar para uma estrutura computacional ontológica formalizando o conhecimento. Objetivos: Elaborar e avaliar uma metodologia para estruturação de informações de laudos radiológicos em texto livre que contemple as especificidades brasileiras, incluindo a terminologia empregada. Métodos: Coleta de 1701 laudos radiológicos de ressonância magnética da coluna lombossacra em três instituições distintas. Para estruturar a informação, foram utilizadas técnicas de mineração de texto e conceituação ontológica das unidades lexicais. Dez radiologistas especialistas avaliaram a superestrutura textual e a terminologia extraída e conceituada, por meio de questionário eletrônico onde foram sugeridas 3 superestruturas textuais e 30 termos com a descrição do respectivo conceito. Resultados: A metodologia criada é constituída por 6 passos: 1) coleta dos laudos radiológicos de determinado tipo de exame; 2) decomposição textual; 3) normalização das unidades lexicais; 4) identificação das superestruturas textuais; 5) conceituação dos termos candidatos; 6) avaliação das superestruturas identificadas e da terminologia extraída e conceituada pelos especialistas na linguagem de especialidade estudada. Foram identificadas três superestruturas textuais diferentes. Após processamento automático inicial, 6129 unidades lexicais foram normalizadas obtendo 4568 termos candidatos dos quais 4183 foram conceituados e originaram 727 conceitos. Foram estabelecidas 13963 relações entre termos candidatos e conceitos, e 789 relações entre conceitos. Quanto a adequada descrição dos termos, 40% dos avaliadores concordam plenamente que estão adequados, 60% concordam parcialmente que estão adequados e nenhum avaliador discordou que os termos são adequados. Em relação a quantidade de termos utilizados pelos avaliadores, em sua respectiva instituição, 70% utilizam de 24 a 30 termos e 30% de 16 a 23 termos. A conceituação de um termo foi considerada inadequada por dois avaliadores. Conclusão: A metodologia proposta foi avaliada por radiologistas especialistas que identificaram as diferenças das superestruturas textuais entre as instituições e os termos com a descrição do respectivo conceito. Portanto, foi possível estruturar a informação de laudos radiológicos da coluna lombossacra a partir do texto livre identificando as superestruturas textuais, extraindo as unidades lexicais, normalizando as unidades lexicais e conceituando ontologicamente os termos candidatos preservando a referência com as respectivas partes constituintes dos laudos radiológicos produzidos no contexto brasileiro.
Título em inglês
Methodology for structuring information from radiological reports
Palavras-chave em inglês
free-text
ontology
Radiological report
structuring information
terminology
Resumo em inglês
Introduction: The radiological report with structured data entry provides precision in information retrieval, however, is less comprehensive than the text-free and may prevent the expert to describe an important finding, not covered by the pre-defined structure. So the solution is to interpret the text written by expert and carry for a computational framework formalizing the ontological knowledge. Objectives: Develop and evaluate a methodology for structuring information in free text radiology reports that contemplates the Brazilian specifications, including terminology. Methods: 1701 radiological reports of lumbosacral MRI were collected in three different institutions. To structure the information we used techniques of text mining and ontological conceptualization of lexical units extracted. Ten dedicated radiologists evaluated the textual superstructure and terminology extracted by the electronic questionnaire which were suggested textual 3 superstructures and 30 terms with the description of its concept. Results: The established methodology consisted of six steps: 1) collection of radiology reports of certain type of examination; 2) textual decomposition; 3) lexical units normalization; 4) textual superstructures identification ; 5) conceptualization of candidate terms; 6) evaluation of identified superstructures and terminology extracted by experts in the specialized language study. We identified three different textual superstructures. After automatic processing initial 6129 lexical units were normalized getting 4568 candidate terms of which 4183 were conceptualized and originated 727 concepts. 13963 were established relations between candidate terms and concepts and 789 relations between concepts. As for adequate description of the terms, 40% of the evaluators agree fully that are appropriate, 60% somewhat agree that they are adequate and no evaluator disagreed that the terms are adequate. Regarding the number of words used by evaluators in their respective institution using 70% between 24 and 30 terms and 30% from 16 to 23 terms. The conceptualization of a term was considered inadequate by two evaluators. The established methodology consisted of six steps: 1) collection of radiology reports of certain type of examination; 2) textual decomposition; 3) lexical units normalization; 4) textual superstructures identification ; 5) conceptualization of candidate terms; 6) evaluation of identified superstructures and terminology extracted by experts in the specialized language study. Conclusions: The proposed methodology was evaluated by radiologists who identified the differences between the textual superstructures institutions and the terms describing the relevant concept. Therefore, it was possible to structure the information of the lumbosacral spine radiology reports from free text by identifying textual superstructures, extracting lexical units, normalizing the lexical units and conceptualizing the terms ontologically candidates preserving the reference to the respective constituent parts of radiology reports produced in the Brazilian context.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2014-04-07
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2024. Todos os direitos reservados.