• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Mémoire de Maîtrise
DOI
https://doi.org/10.11606/D.3.2022.tde-25112022-091647
Document
Auteur
Nom complet
Sarah Pires Pérez
Adresse Mail
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
São Paulo, 2022
Directeur
Jury
Cozman, Fabio Gagliardi (Président)
Hirata Junior, Roberto
Patricio, Vitor Hugo Louzada
Titre en anglais
Improving art style classification with synthetic images from self-attention generative adversarial network.
Mots-clés en anglais
Computer Vvsion
Generative adversarial networks
Image classification
Resumé en anglais
Art is the means by which humanity has always expressed itself, as art oers a record of humanitys feelings, its ways of life and its conception of the world. Although we are fortunate to have a vast store of cultural wealth from past generations, the sheer number of artworks has become an obstacle to their categorization into styles. This research explores a strategy that maximizes the performance of style classifiers applied to works of art. Automatically classifying artworks into styles is quite challenging due to the relative lack of tagged data and the complexity of the class definitions. This complexity is manifested by the fact that some image augmentation techniques not only do not improve performance but may also degrade performance. We propose to resort to Adversary Generating Networks (GANs). Originally, GANs set out to create images capable of deceiving the human eye and making us believe that generated images are true images. The proposal here is not to create art, but rather to use this architecture as a data augmentation tool. To assess the impact of using GANs on image augmentation, we have studied performance improvements over EfficientNet B0, a state-of-the-art image classifier. In addition, we present a Class-by-Class Performance Analysis that can be useful in the study of other high-complexity image datasets.
Titre en portugais
Melhorando a classificação de estilo de obras de arte com imagens sintéticas geradas a partir de redes adversárias generativas com mecanismo de autoatenção.
Mots-clés en portugais
Imagem(Classificação)
Redes adversárias geradoras
Visão computacional
Resumé en portugais
Arte é o meio pelo qual a humanidade sempre usou para se expressar, tornando-a um registro de seus sentimentos, seus modos de vida e sua concepção de mundo. No entanto, embora tenhamos a sorte de ter uma vasta riqueza cultural proveniente de várias gerações, a quantidade de obras de arte tornou-se um impedimento para sua categorização em estilos. Esta pesquisa se propõe a estudar uma estratégia para maximizar o desempenho dos classificadores de estilo em obras de arte. A classificação automática das obras de arte em seus estilos é bastante desafiadora devido à relativa falta de dados rotulados e à complexidade das classes envolvidas. Essa complexidade é refletida no fato que algumas técnicas de augmentação de imagens não só não agregam ao desempenho do modelo mas também podem degradar seu desempenho. Por isso, introduzimos neste trabalho o estudo de Redes Adversárias Geradoras (GANs). Originalmente, as GANs foram propostas para criar imagens capazes de enganar o olho humano e nos fazer acreditar que as imagens geradas são imagens verdadeiras. Essa pesquisa não se propõe a criar arte, mas pretende usar essa arquitetura como uma ferramenta de ampliação de dados. Para avaliar o impacto do uso de GANs na augmentação das imagens, treinamos a EfficientNet B0 para verificar a melhoria no desempenho do EfficientNet B0, um classificador de ´ultima geração. Além disso, apresentamos a Análise de Desempenho de Classe por Classe, que deve ser útil no estudo de outros conjuntos de imagens de alta complexidade.
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Date de Publication
2022-11-30
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
CeTI-SC/STI
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2024. Tous droits réservés.