Hyperspectral image analysis of oral squamous cell carcinoma using machine learning techniques

Peres, Daniella Lúmara Pereira Mendes de Oliveira

doi:10.11606/D.85.2025.tde-11122025-123821

Dissertação de Mestrado

DOI

10.11606/D.85.2025.tde-11122025-123821

Documento

Dissertação de Mestrado

Autor

Peres, Daniella Lúmara Pereira Mendes de Oliveira ( )

Nome completo

Daniella Lúmara Pereira Mendes de Oliveira Peres

E-mail

Unidade da USP

Instituto de Pesquisas Energéticas e Nucleares

Área do Conhecimento

Tecnologia Nuclear - Materiais

Data de Defesa

2025-05-08

Imprenta

São Paulo, 2025

Orientador

Zezell, Denise Maria ( )

Banca examinadora

Zezell, Denise Maria (Presidente)

Felipe, Joaquim Cezar

Pereira, Thiago Martini

Título em inglês

Hyperspectral image analysis of oral squamous cell carcinoma using machine learning techniques

Palavras-chave em inglês

FTIR spectroscopy, hyperspectral imaging, machine learning, oral cancer, vibrational spectroscopy

Resumo em inglês

Oral squamous cell carcinoma (OSCC) remains one of the most aggressive malignancies of the head and neck region, with prognosis heavily dependent on early detection. Hyperspectral imaging (HSI) combined with Fourier Transform Infrared (FTIR) spectroscopy is capable of capturing detailed biochemical information from tissue samples. In this study, we investigated the performance of four machine learning (ML) models - Linear Discriminant Analysis (LDA), Partial Least Squares Discriminant Analysis (PLS-DA), Random Forest (RF), and Feed Forward Neural Networks (FNNs) - for the classification of FTIR hyperspectral images of OSCC and healthy oral tissue. Human tissue microarray samples, comprising 48 OSCC and 48 control specimens, were preprocessed using spectral trimming, smoothing, Extended Multiplicative Signal Correction (EMSC), and Standard Normal Variate (SNV) normalization. Spectra were unfolded for pixel-level analysis, and classification performance was evaluated through 10-fold cross-validation (CV) using metrics such as accuracy, F1-score, and the area under the ROC curve (AUC). LDA achieved robust results at both pixel and image levels, with an AUC of 0.9465 and 91.7% image-level accuracy. PLS-DA demonstrated strong pixel-level classification (AUC = 0.8686) but showed decreased performance at the image level. Random Forest outperformed the other models in pixel-level analysis (AUC = 0.9864) and maintained satisfactory image-level performance. FNNs achieved balanced accuracy (80%) and high-lighted spectral regions related to protein secondary structures as key discriminators. These findings confirm the potential of FTIR-HSI coupled with ML as a powerful tool for the early diagnosis of OSCC, with LDA and RF models offering particularly favorable performance in both interpretability and predictive capability.

Título em português

Análise de imagens hiperespectrais do carcinoma espinocelular oral utilizando técnicas de aprendizado de máquina

Palavras-chave em português

aprendizado de máquina, câncer oral, espectroscopia FTIR, espectroscopia vibracional, imagem hiperespectral

Resumo em português

O carcinoma espinocelular oral (OSCC) continua sendo uma das neoplasias mais agressivas da região de cabeça e pescoço, com um prognóstico fortemente dependente do diagnóstico precoce. A imagem hiperespectral (HSI), combinada com a espectroscopia no infravermelho por Transformada de Fourier (FTIR), é capaz de captar informações bioquímicas detalhadas a partir de amostras de tecido. Neste estudo, foi investigado o desempenho de quatro modelos de aprendizagem de máquina (ML) - Análise Discriminante Linear (LDA), Análise Discriminante por Mínimos Quadrados Parciais (PLS-DA), Floresta Aleatória (RF) e Redes Neurais Feedforward (FNNs) - na classificação de imagens hiperespectrais FTIR de OSCC e tecido oral saudável. Amostras humanas de microarranjos teciduais (TMA), compostas por 48 espécimes de OSCC e 48 controles, foram pré-processadas por meio de corte espectral, suavização, Correção Estendida do Sinal Multiplicativo (EMSC) e normalização por Variável Normal Padrão (SNV). Os espectros foram reorganizados para análise em nível de pixel, e o desempenho dos modelos foi avaliado por validação cruzada de 10 vezes (10-fold CV), utilizando métricas como acurácia, F1-score e a área sob a curva ROC (AUC). O modelo LDA apresentou resultados robustos tanto em nível de pixel quanto de imagem, com AUC de 0,9465 e acurácia de 91,7% em nível de imagem. O PLS-DA demonstrou bom desempenho na classificação por pixel (AUC = 0,8686), mas teve desempenho reduzido na avaliação por imagem. O modelo de Floresta Aleatória superou os demais na análise por pixel (AUC = 0,9864) e manteve desempenho satisfatório em nível de imagem. As FNNs alcançaram acurácia equilibrada (80%) e destacaram regiões espectrais relacionadas à estrutura secundária de proteínas como discriminadores importantes. Esses resultados confirmam o potencial da combinação entre FTIR-HSI e modelos de aprendizagem de máquina como uma ferramenta poderosa para o diagnóstico precoce de OSCC, sendo os modelos LDA e RF particularmente eficazes em termos de interpretabilidade e capacidade preditiva.

AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso: Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.

DaniellaLumaraPereiraMendesDeOliveiraPeres_M.pdf

Data de Publicação

2025-12-19

Trabalhos decorrentes

AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.