Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.

Hayashi, Victor Takashi

doi:10.11606/T.3.2025.tde-06052025-090853

Tese de Doutorado

DOI

10.11606/T.3.2025.tde-06052025-090853

Documento

Tese de Doutorado

Autor

Hayashi, Victor Takashi ( )

Nome completo

Victor Takashi Hayashi

E-mail

Unidade da USP

Escola Politécnica

Programa ou Especialidade

Engenharia de Computação

Data de Defesa

2025-03-11

Imprenta

São Paulo, 2025

Orientador

Ruggiero, Wilson Vicente ( )

Banca examinadora

Ruggiero, Wilson Vicente (Presidente)

Barreto, Paulo Sergio Licciardi Messeder

Bressan, Graça

Santos, Ana Cristina dos

Venturini, Yeda Regina

Título em português

Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.

Palavras-chave em português

Aprendizado computacional, Código aberto, Hardware, Processamento de linguagem natural, Segurança

Resumo em português

A globalização da cadeia de suprimentos de hardware reduz custos, mas aumenta os desafios de segurança com a possível inserção de hardware trojans por terceiros. Métodos tradicionais de detecção apresentam limitações de escalabilidade ao usar apenas exemplos simples (e.g., AES). Embora o hardware de código aberto promova transparência, ele não garante segurança. Nesta pesquisa, técnicas de Processamento de Linguagem Natural (PLN) e Machine Learning (ML) foram aplicadas para identificar hardware trojans em designs complexos (e.g., RISC-V). Usando dados de benchmarks existentes (ISCAS85-89, TrustHub) e dados sintéticos gerados com Large Language Models (LLM), foi utilizado um conjunto de 3808 instâncias nesta pesquisa. A abordagem com TF-IDF e Decision Tree alcançou 97,26% de acurácia com este conjunto de dados, superando o estado da arte. O uso de LLMs com prompt optimization atingiu recall de 99%, minimizando falsos negativos. Como principais contribuições, foi desenvolvido um novo framework integrando PLN, ML e LLMs para aumentar a segurança em hardwares de código aberto, contemplando a geração e detecção de hardware trojans complexos e os conjuntos de dados abertos resultantes.

Título em inglês

Hardware trojan detection in open-source hardware designs using machine learning.

Palavras-chave em inglês

Hardware, Machine learning, Natural language processing, Open hardware, Opensource, Security

Resumo em inglês

The globalization of the hardware supply chain reduces costs but increases security challenges with the potential insertion of hardware trojans by third parties. Traditional detection methods face scalability limitations by relying solely on simple examples (e.g., AES). Although open-source hardware promotes transparency, it does not guarantee security. In this research, Natural Language Processing (NLP) and Machine Learning (ML) techniques were applied to identify hardware trojans in complex designs (e.g., RISC-V). Using data from existing benchmarks (ISCAS85-89, TrustHub) and synthetic data generated with Large Language Models (LLM), a dataset of 3,808 instances was used in this research. The approach using TF-IDF and Decision Tree achieved 97.26% accuracy with this dataset, surpassing the state of the art. The use of LLMs with prompt optimization achieved a recall of 99%, minimizing false negatives. As main contributions, a novel framework was developed integrating NLP, ML and LLMs to increase security in open source hardware, including new methods for generation and detection of complex hardware trojans and the resulting open datasets.

AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso: Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.

VictorTakashiHayashiCorr25.pdf

Data de Publicação

2025-05-07

Trabalhos decorrentes

AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.