Dissertação de Mestrado
Documento
Dissertação de Mestrado
Nome completo
Daniella Lúmara Pereira Mendes de Oliveira Peres
E-mail
Unidade da USP
Instituto de Pesquisas Energéticas e Nucleares
Área do Conhecimento
Data de Defesa
2025-05-08
Imprenta
São Paulo, 2025
Orientador
Banca examinadora
Zezell, Denise Maria (Presidente)
Felipe, Joaquim Cezar
Pereira, Thiago Martini
Título em inglês
Hyperspectral image analysis of oral squamous cell carcinoma using machine learning techniques
Palavras-chave em inglês
FTIR spectroscopy, hyperspectral imaging, machine learning, oral cancer, vibrational spectroscopy
Resumo em inglês
Oral squamous cell carcinoma (OSCC) remains one of the most aggressive malignancies of the head and neck region, with prognosis heavily dependent on early detection. Hyperspectral imaging (HSI) combined with Fourier Transform Infrared (FTIR) spectroscopy is capable of capturing detailed biochemical information from tissue samples. In this study, we investigated the performance of four machine learning (ML) models - Linear Discriminant Analysis (LDA), Partial Least Squares Discriminant Analysis (PLS-DA), Random Forest (RF), and Feed Forward Neural Networks (FNNs) - for the classification of FTIR hyperspectral images of OSCC and healthy oral tissue. Human tissue microarray samples, comprising 48 OSCC and 48 control specimens, were preprocessed using spectral trimming, smoothing, Extended Multiplicative Signal Correction (EMSC), and Standard Normal Variate (SNV) normalization. Spectra were unfolded for pixel-level analysis, and classification performance was evaluated through 10-fold cross-validation (CV) using metrics such as accuracy, F1-score, and the area under the ROC curve (AUC). LDA achieved robust results at both pixel and image levels, with an AUC of 0.9465 and 91.7% image-level accuracy. PLS-DA demonstrated strong pixel-level classification (AUC = 0.8686) but showed decreased performance at the image level. Random Forest outperformed the other models in pixel-level analysis (AUC = 0.9864) and maintained satisfactory image-level performance. FNNs achieved balanced accuracy (80%) and high-lighted spectral regions related to protein secondary structures as key discriminators. These findings confirm the potential of FTIR-HSI coupled with ML as a powerful tool for the early diagnosis of OSCC, with LDA and RF models offering particularly favorable performance in both interpretability and predictive capability.
Título em português
Análise de imagens hiperespectrais do carcinoma espinocelular oral utilizando técnicas de aprendizado de máquina
Palavras-chave em português
aprendizado de máquina, câncer oral, espectroscopia FTIR, espectroscopia vibracional, imagem hiperespectral
Resumo em português
O carcinoma espinocelular oral (OSCC) continua sendo uma das neoplasias mais agressivas da região de cabeça e pescoço, com um prognóstico fortemente dependente do diagnóstico precoce. A imagem hiperespectral (HSI), combinada com a espectroscopia no infravermelho por Transformada de Fourier (FTIR), é capaz de captar informações bioquímicas detalhadas a partir de amostras de tecido. Neste estudo, foi investigado o desempenho de quatro modelos de aprendizagem de máquina (ML) - Análise Discriminante Linear (LDA), Análise Discriminante por Mínimos Quadrados Parciais (PLS-DA), Floresta Aleatória (RF) e Redes Neurais Feedforward (FNNs) - na classificação de imagens hiperespectrais FTIR de OSCC e tecido oral saudável. Amostras humanas de microarranjos teciduais (TMA), compostas por 48 espécimes de OSCC e 48 controles, foram pré-processadas por meio de corte espectral, suavização, Correção Estendida do Sinal Multiplicativo (EMSC) e normalização por Variável Normal Padrão (SNV). Os espectros foram reorganizados para análise em nível de pixel, e o desempenho dos modelos foi avaliado por validação cruzada de 10 vezes (10-fold CV), utilizando métricas como acurácia, F1-score e a área sob a curva ROC (AUC). O modelo LDA apresentou resultados robustos tanto em nível de pixel quanto de imagem, com AUC de 0,9465 e acurácia de 91,7% em nível de imagem. O PLS-DA demonstrou bom desempenho na classificação por pixel (AUC = 0,8686), mas teve desempenho reduzido na avaliação por imagem. O modelo de Floresta Aleatória superou os demais na análise por pixel (AUC = 0,9864) e manteve desempenho satisfatório em nível de imagem. As FNNs alcançaram acurácia equilibrada (80%) e destacaram regiões espectrais relacionadas à estrutura secundária de proteínas como discriminadores importantes. Esses resultados confirmam o potencial da combinação entre FTIR-HSI e modelos de aprendizagem de máquina como uma ferramenta poderosa para o diagnóstico precoce de OSCC, sendo os modelos LDA e RF particularmente eficazes em termos de interpretabilidade e capacidade preditiva.
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso: Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2025-12-19
Trabalhos decorrentes
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.