• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Disertación de Maestría
DOI
https://doi.org/10.11606/D.3.2023.tde-21092023-082915
Documento
Autor
Nombre completo
Pedro Henrique Hauy Netto de Araujo
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Paulo, 2023
Director
Tribunal
Kofuji, Sergio Takeo (Presidente)
Azevedo, Marcelo Teixeira de
Rosa, Pedro Frosi
Título en portugués
Impacto de métodos de seleção de variáveis na classificação de ataques DDoS utilizando XGBoost.
Palabras clave en portugués
Aprendizado computacional
Ataques DDoS
Inteligência artificial
Segurança de computadores
Seleção de variáveis
Resumen en portugués
Distributed Denial of Service (DDoS) Attacks - Ataques de Negação de Serviço Distribuídos - impõem um grande desafio para os sistemas de segurança atuais, dadas a variedade de suas implementações e as grandes escalas que podem atingir. Uma abordagem para a sua detecção precoce é o uso de técnicas de Machine Learning (ML), que criam regras de classificação do tráfego a partir de dados históricos. Contudo, diferentes tipos de dados contribuem de forma desigual para a assertividade do modelo treinado. O uso de métodos de Feature Selection (FS) - Seleção de Variáveis - como etapa de pré-processamento permite a identificação dos atributos mais relevantes para o problema em questão. Essa ação diminui o tempo de treinamento e pode melhorar o desempenho de classificadores de ataques quando variáveis ruidosas são eliminadas. Este trabalho toma como base um conjunto de dados público e o algoritmo XGBoost para mensurar o impacto de técnicas de FS no problema de classificação de ataques DDoS. São consideradas tanto técnicas independentes dos rótulos das amostras, como também métodos que se utilizam dessa informação para ranquear as variáveis em ordem de importância. O problema é analisado do ponto de vista da classificação binária e multiclasse. Também é criado um benchmark de métricas de classificação e tempos de execução. As comparações envolvem as métricas de Acurácia, Precisão, Recall e F1-score para diversos métodos de FS, além dos tempos para realização de FS e tempos para treinamento do modelo.
Título en inglés
Impact of feature selection methods on the classification of DDoS attacks using XGBoost.
Palabras clave en inglés
Binary classifier
DDoS
Feature Selection (FS)
Multiclass classifier
XGBoost
Resumen en inglés
Distributed Denial of Service (DDoS) attacks impose a major challenge for todays security systems, given the variety of its implementations and the scale that the attacks can achieve. One approach for their early detection is the use of Machine Learning (ML) techniques, which create rules for classifying traffic from historical data. However, different types of data contribute unequally to the assertiveness of the trained model. The use of Feature Selection (FS) techniques as a pre-processing step allows identification of the most relevant features for the problem in question. This action reduces training time and can improve performance when noisy variables are eliminated. The current work is based on a public dataset and the XGBoost algorithm to measure the impact of FS techniques on the DDoS attack classification problem. Techniques that are independent of sample labels are considered, as well as methods that use this label information to rank the variables in order of importance. The problem is analyzed from the point of view of binary and multiclass classification. A benchmark of classification metrics and execution times is also created. The comparisons involve the metrics of Accuracy, Precision, Recall and F1-score for different FS methods, in addition to the times to perform FS and model training.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2023-09-22
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2024. Todos los derechos reservados.