• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Mémoire de Maîtrise
DOI
https://doi.org/10.11606/D.100.2022.tde-07122022-101230
Document
Auteur
Nom complet
Diego Bezerra Lira
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
São Paulo, 2022
Directeur
Jury
Digiampietri, Luciano Antonio (Président)
Fernandez Tuesta, Esteban
Mena-Chalco, Jesús Pascual
Titre en portugais
Detecção de bots no Twitter: uma abordagem utilizando agrupamento
Mots-clés en portugais
Agrupamento
Detecção de bots
Twitter
Resumé en portugais
O Twitter é uma importante mídia social, mas sofre com a presença constante de bots, perfis controlados por algoritmos. Esses bots podem ser malignos, se passando por usuários humanos e distorcendo o discurso da rede. Para possibilitar sua detecção, sistemas baseados em aprendizado de máquina são a solução mais comum. Entretanto, esses sistemas geralmente são limitados, pois só detectam tipos de bots muito próximos aos encontrados nos conjuntos de treinamento utilizados. Para remediar essa situação, a literatura explorou algumas opções, mas o uso de agrupamento para melhorar o desempenho nessa tarefa ainda é pouco difundido. O presente projeto avaliou alguns tipos de pré-processamento, utilizando um algoritmo de agrupamento, e conseguiu mostrar uma melhora nos resultados em parcela razoável dos testes. Neste trabalho também foi avaliado como os detectores mais comuns se comportam num cenário de mudança entre os dados de treino e o uso do modelo em outras bases de dados, justificando uma forma diferente de avaliar os resultados. Como conclusões, foi observado que uma avaliação em vários conjuntos de dados é necessária para um correto entendimento da performance, e os pré-processamentos avaliados são alternativas válidas que podem ser testadas para melhorar a performance dos modelos
Titre en anglais
Bot detection on Twitter: an alternative using clustering
Mots-clés en anglais
Bots detection
Clustering
Twitter
Resumé en anglais
Twitter is an important social media, but suffers from the constant presence of bots, profiles controlled by algorithms. These bots may be malign, passing themselves as humans and distorting general discourse in the network. To allow for their detection, systems based on machine learning are the most common solution. However, those systems are generally fragile, as they only detect the kinds of bots that are very similar to the ones found in the training set. To remedy this situation, the literature has explored a few options, but the use of clustering for optimizing performance is still uncommon. This project evaluated some types of preprocessing based on clustering algorithms, and achieved a marked improvement in a reasonable portion of the tests. We also evaluated how the most common detectors behave in a scenario of change between training data and live data, justifying a new method for evaluating results. As conclusions, it was observed that an evaluation in many datasets is necessary for a correct understanding of the performance, and the preprocessing alternatives proposed are valid techniques that might be tested to improve model performance.
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Date de Publication
2023-02-17
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
CeTI-SC/STI
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2024. Tous droits réservés.