• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Dissertação de Mestrado
DOI
https://doi.org/10.11606/D.3.2023.tde-21092023-082915
Documento
Autor
Nome completo
Pedro Henrique Hauy Netto de Araujo
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Paulo, 2023
Orientador
Banca examinadora
Kofuji, Sergio Takeo (Presidente)
Azevedo, Marcelo Teixeira de
Rosa, Pedro Frosi
Título em português
Impacto de métodos de seleção de variáveis na classificação de ataques DDoS utilizando XGBoost.
Palavras-chave em português
Aprendizado computacional
Ataques DDoS
Inteligência artificial
Segurança de computadores
Seleção de variáveis
Resumo em português
Distributed Denial of Service (DDoS) Attacks - Ataques de Negação de Serviço Distribuídos - impõem um grande desafio para os sistemas de segurança atuais, dadas a variedade de suas implementações e as grandes escalas que podem atingir. Uma abordagem para a sua detecção precoce é o uso de técnicas de Machine Learning (ML), que criam regras de classificação do tráfego a partir de dados históricos. Contudo, diferentes tipos de dados contribuem de forma desigual para a assertividade do modelo treinado. O uso de métodos de Feature Selection (FS) - Seleção de Variáveis - como etapa de pré-processamento permite a identificação dos atributos mais relevantes para o problema em questão. Essa ação diminui o tempo de treinamento e pode melhorar o desempenho de classificadores de ataques quando variáveis ruidosas são eliminadas. Este trabalho toma como base um conjunto de dados público e o algoritmo XGBoost para mensurar o impacto de técnicas de FS no problema de classificação de ataques DDoS. São consideradas tanto técnicas independentes dos rótulos das amostras, como também métodos que se utilizam dessa informação para ranquear as variáveis em ordem de importância. O problema é analisado do ponto de vista da classificação binária e multiclasse. Também é criado um benchmark de métricas de classificação e tempos de execução. As comparações envolvem as métricas de Acurácia, Precisão, Recall e F1-score para diversos métodos de FS, além dos tempos para realização de FS e tempos para treinamento do modelo.
Título em inglês
Impact of feature selection methods on the classification of DDoS attacks using XGBoost.
Palavras-chave em inglês
Binary classifier
DDoS
Feature Selection (FS)
Multiclass classifier
XGBoost
Resumo em inglês
Distributed Denial of Service (DDoS) attacks impose a major challenge for todays security systems, given the variety of its implementations and the scale that the attacks can achieve. One approach for their early detection is the use of Machine Learning (ML) techniques, which create rules for classifying traffic from historical data. However, different types of data contribute unequally to the assertiveness of the trained model. The use of Feature Selection (FS) techniques as a pre-processing step allows identification of the most relevant features for the problem in question. This action reduces training time and can improve performance when noisy variables are eliminated. The current work is based on a public dataset and the XGBoost algorithm to measure the impact of FS techniques on the DDoS attack classification problem. Techniques that are independent of sample labels are considered, as well as methods that use this label information to rank the variables in order of importance. The problem is analyzed from the point of view of binary and multiclass classification. A benchmark of classification metrics and execution times is also created. The comparisons involve the metrics of Accuracy, Precision, Recall and F1-score for different FS methods, in addition to the times to perform FS and model training.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2023-09-22
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2024. Todos os direitos reservados.