Tese de Doutorado
Documento
Tese de Doutorado
Autor
Nome completo
Victor Takashi Hayashi
E-mail
Unidade da USP
Escola Politécnica
Programa ou Especialidade
Data de Defesa
2025-03-11
Imprenta
São Paulo, 2025
Orientador
Banca examinadora
Ruggiero, Wilson Vicente (Presidente)
Barreto, Paulo Sergio Licciardi Messeder
Bressan, Graça
Santos, Ana Cristina dos
Venturini, Yeda Regina
Título em português
Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.
Palavras-chave em português
Aprendizado computacional, Código aberto, Hardware, Processamento de linguagem natural, Segurança
Resumo em português
A globalização da cadeia de suprimentos de hardware reduz custos, mas aumenta os desafios de segurança com a possível inserção de hardware trojans por terceiros. Métodos tradicionais de detecção apresentam limitações de escalabilidade ao usar apenas exemplos simples (e.g., AES). Embora o hardware de código aberto promova transparência, ele não garante segurança. Nesta pesquisa, técnicas de Processamento de Linguagem Natural (PLN) e Machine Learning (ML) foram aplicadas para identificar hardware trojans em designs complexos (e.g., RISC-V). Usando dados de benchmarks existentes (ISCAS85-89, TrustHub) e dados sintéticos gerados com Large Language Models (LLM), foi utilizado um conjunto de 3808 instâncias nesta pesquisa. A abordagem com TF-IDF e Decision Tree alcançou 97,26% de acurácia com este conjunto de dados, superando o estado da arte. O uso de LLMs com prompt optimization atingiu recall de 99%, minimizando falsos negativos. Como principais contribuições, foi desenvolvido um novo framework integrando PLN, ML e LLMs para aumentar a segurança em hardwares de código aberto, contemplando a geração e detecção de hardware trojans complexos e os conjuntos de dados abertos resultantes.
Título em inglês
Hardware trojan detection in open-source hardware designs using machine learning.
Palavras-chave em inglês
Hardware, Machine learning, Natural language processing, Open hardware, Opensource, Security
Resumo em inglês
The globalization of the hardware supply chain reduces costs but increases security challenges with the potential insertion of hardware trojans by third parties. Traditional detection methods face scalability limitations by relying solely on simple examples (e.g., AES). Although open-source hardware promotes transparency, it does not guarantee security. In this research, Natural Language Processing (NLP) and Machine Learning (ML) techniques were applied to identify hardware trojans in complex designs (e.g., RISC-V). Using data from existing benchmarks (ISCAS85-89, TrustHub) and synthetic data generated with Large Language Models (LLM), a dataset of 3,808 instances was used in this research. The approach using TF-IDF and Decision Tree achieved 97.26% accuracy with this dataset, surpassing the state of the art. The use of LLMs with prompt optimization achieved a recall of 99%, minimizing false negatives. As main contributions, a novel framework was developed integrating NLP, ML and LLMs to increase security in open source hardware, including new methods for generation and detection of complex hardware trojans and the resulting open datasets.
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso: Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2025-05-07
Trabalhos decorrentes
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.