Avaliação do uso de agrupamento de dados de desempenho para apoiar o teste de software no domínio de aprendizagem de máquina

Braga, Diego

doi:10.11606/D.55.2022.tde-09112022-160513

Inicío

Serviços

Trabalhos decorrentes

Como citar

Formato MARC

Formato OAI DC

Dissertação de Mestrado

DOI

https://doi.org/10.11606/D.55.2022.tde-09112022-160513

Documento

Dissertação de Mestrado

Autor

Braga, Diego (Catálogo USP)

Nome completo

Diego Braga

E-mail

Unidade da USP

Instituto de Ciências Matemáticas e de Computação

Área do Conhecimento

Ciências de Computação e Matemática Computacional

Data de Defesa

2022-09-14

Imprenta

São Carlos, 2022

Orientador

Souza, Paulo Sergio Lopes de (Catálogo USP)

Banca examinadora

Souza, Paulo Sergio Lopes de (Presidente)
Delbem, Alexandre Cláudio Botazzo
Durelli, Vinicius Humberto Serapilha
Eler, Marcelo Medeiros

Título em português

Avaliação do uso de agrupamento de dados de desempenho para apoiar o teste de software no domínio de aprendizagem de máquina

Palavras-chave em português

Agrupamento de dados
Aprendizagem de máquina
Monitoração de desempenho
Teste de software

Resumo em português

Inteligência Artificial (IA) é um dos campos mais novos da ciência e engenharia. A grande quantidade de dados disponíveis tornou possível o desenvolvimento da Aprendizagem de Máquina (AM), disciplina de IA que é capaz de criar aplicações com a habilidade de se otimizar a partir da análise de dados. Sistemas de AM têm sido utilizados em cada vez mais domínios, mas apesar de sua crescente popularidade, a garantia de qualidade neste campo de IA ainda é um desafio. Para se buscar a qualidade de aplicações de AM são necessárias abordagens de Verificação, Validação e Teste (VV&T) de software capazes de detectar defeitos nesses tipos de software. Testes em sistemas de software de IA tendem a ser desafiadores pois estas aplicações geram resultados difíceis de se prever, alcançados a partir de algoritmos e modelos de aprendizado criados pelos próprios sistemas de software de AM. Dadas essas características, o uso de técnicas de teste que tratam tais sistemas de software como caixas-pretas e não precisam verificar suas saídas, tornam-se bem atrativas. A metodologia Tricorder demonstra ser promissora neste domínio como uma técnica de teste complementar às técnicas de teste já conhecidas, permitindo estender os testes aplicados sem que sejam necessários acessos ao código-fonte ou a criação de casos de teste tradicionais. A metodologia Tricorder utiliza dados de monitoramento para definir um perfil de desempenho da aplicação sendo monitorada. Ao criar o perfil de desempenho de uma nova versão desta mesma aplicação, a Tricorder é capaz de comparar os dois e acusar possíveis defeitos com base no uso de recursos do sistema computacional. Estes perfis de desempenho são criados com o agrupamento de dados de desempenho monitorados, seguindo a metodologia DAMICORE. Apesar de promissora, a metodologia Tricorder ainda se encontra em fase de desenvolvimento e validação, tendo sido proposta apenas nos últimos anos. O estudo reportado nesta dissertação analisa a aplicação da metodologia Tricorder em sistemas de AM. Este estudo verifica se Tricorder pode ser empregada como uma abordagem complementar de teste à detecção de defeitos inseridos em aplicações deste ramo de IA. Resultados dos experimentos demonstram que a Tricorder detectou automaticamente defeitos que não afetam as saídas das aplicações selecionadas, demonstrando ser eficaz nas condições definidas neste estudo. Estes resultados contribuem para o estado da arte de VV&T de aplicações de AM, por permitir que uma nova metodologia de teste complementar e automatizada possa ser empregada em um futuro próximo.

Título em inglês

Assessing the Use of Performance Data Clustering for Supporting Software Testing in the Machine Learning Domain

Palavras-chave em inglês

Data grouping
Machine learning
Performance monitoring
Software testing

Resumo em inglês

Artificial Intelligence (AI) is one of the newest fields in science and engineering. Large amounts of available data made it possible to develop Machine Learning (ML), the AI discipline capable of creating applications that can optimize themselves through data analysis. Due to their capabilities, ML software has been used in more and more domains, but quality assurance in this field of AI still is a challenge despite its growing popularity. For quality assurance of ML applications, it is necessary to find software Verification, Validation, and Test (VV&T) approaches capable of detecting defects in this type of software. Tests in AI software tend to be challenging because these applications have the characteristic of generating results that are difficult to predict, calculated by algorithms and learning models created by the ML software itself. Due to these characteristics, the use of test techniques that treat these software as black boxes and do not require checking their outputs, become very attractive. The Tricorder methodology is promising as a complementary technique for already known software testing approaches, allowing the extension of tests without requiring access to the source code or creating traditional test cases. The Tricorder methodology uses monitoring data to define a performance profile of the application being monitored. When creating the performance profile of a new version of the same application, Tricorder can compare the two and point out possible defects based on the resource usage of the computational system. These performance profiles are created by grouping monitored performance data, following the DAMICORE methodology. Although promising, the Tricorder methodology is still under development and validation, having been proposed only in recent years. This study analyzes the behavior of the Tricorder methodology when applied in systems based in ML, generating data that shows if it can be employed as a complementary approach for the detection of defects in applications of this AI field. The results obtained demonstrate that the methodology was able to achieve great results in the conditions stablished in this study, being able to detect defects that do not affect the outputs of the selected projects. These results contribute to the state of the art of VV&T of ML applications, by proposing a new, complementary and automatic methodology that could be employed in a close future.

AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.

DiegoBraga_ME_revisada.pdf (4.86 Mbytes)

Data de Publicação

2022-11-09

Trabalhos decorrentes

AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.