Caracterização de falhas em sistemas de aprendizado de máquina

Martins, Alexandre Locci

doi:10.11606/T.45.2025.tde-10022026-162320

Tese de Doutorado

DOI

10.11606/T.45.2025.tde-10022026-162320

Documento

Tese de Doutorado

Autor

Martins, Alexandre Locci ( )

Nome completo

Alexandre Locci Martins

E-mail

Unidade da USP

Instituto de Matemática e Estatística

Programa ou Especialidade

Ciência da Computação

Data de Defesa

2025-12-15

Imprenta

São Paulo, 2025

Orientador

Melo, Ana Cristina Vieira de ( )

Banca examinadora

Melo, Ana Cristina Vieira de (Presidente)

Chaim, Marcos Lordello

Hirata Junior, Roberto

Souza, Simone do Rocio Senger de

Vijaykumar, Nandamudi Lankalapalli

Título em português

Caracterização de falhas em sistemas de aprendizado de máquina

Palavras-chave em português

Machine Learning Testing, Ontologia, SPRQL

Resumo em português

A crescente adoção de sistemas baseados em aprendizado de máquina em domínios críticos intensifica a necessidade de métodos rigorosos de teste e validação. Contudo, a complexidade e a natureza opaca desses modelos, aliadas à dependência de dados, dificultam a aplicação de técnicas tradicionais de teste de software. A literatura revela uma lacuna significativa no entendimento da caracterização de falhas reais nesses sistemas, limitando o desenvolvimento de estratégias eficazes de teste. Para superar esse desafio, este trabalho propõe a construção de um modelo formal de conhecimento, na forma de uma ontologia, capaz de organizar e unificar o domínio das falhas em sistemas de aprendizado de máquina. O modelo foi desenvolvido por meio de um ciclo iterativo com foco na generalização, e sua formalização seguiu padrões semânticos amplamente adotados. A validação funcional foi realizada por meio de consultas específicas destinadas a responder questões de competência, demonstrando a capacidade do modelo de representar e recuperar informações relevantes. Os resultados obtidos são significativos: a ontologia amplia a compreensão dos elementos e relações no domínio de falhas em aprendizado de máquina, facilitando a tomada de decisão dos envolvidos com testes. Serve como base para a generalização de abordagens de teste, possibilitando a construção de conjuntos de dados para pesquisas e benchmarks industriais, além de oferecer subsídios essenciais para o desenvolvimento de soluções automatizadas de teste. Em suma, este trabalho fornece uma fundamentação semântica sólida para a engenharia da qualidade em sistemas de aprendizado de máquina, abrindo caminho para testes mais eficazes e confiáveis.

Título em inglês

Characterizing failures in machine learning systems

Palavras-chave em inglês

Machine Learning Testing, Ontology, SPRQL

Resumo em inglês

The growing adoption of machine learning systems in critical domains intensifies the need for rigorous testing and validation methods. However, the opaque and complex nature of these models, combined with their dependence on data, poses challenges to the application of traditional software testing techniques. The literature highlights a significant gap in understanding the characterization of real-world failures in such systems, hindering the development of effective testing strategies. To address this challenge, this work proposes the construction of a formal knowledge model, in the form of an ontology, capable of organizing and unifying the domain of failures in machine learning systems. The model was developed through an iterative lifecycle focused on generalization, and its formalization followed widely adopted semantic standards. Functional validation was conducted through targeted queries designed to answer competency questions, demonstrating the models ability to represent and retrieve relevant information. The results are noteworthy: the ontology deepens the understanding of the elements and relationships within the failure domain of machine learning, facilitating decision-making for testing stakeholders. It serves as a foundation for generalizing testing approaches, enabling the creation of datasets for research and industrial benchmarks, and providing essential support for the development of automated testing solutions. In summary, this work offers a robust semantic foundation for quality engineering in machine learning systems, paving the way for more effective and reliable testing practices.

AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso: Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.

tese.pdf

Data de Publicação

2026-02-10

Trabalhos decorrentes

AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.