• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.3.2020.tde-24052021-102438
Document
Author
Full name
Bruno Tinen
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2020
Supervisor
Committee
Okamoto Junior, Jun (President)
Bianchi, Reinaldo Augusto da Costa
Gomi, Edson Satoshi
Title in Portuguese
Classificação estética de fotografias por aprendizagem de máquina.
Keywords in Portuguese
Aprendizagem computacional
Processamento de imagens
Reconhecimento de padrões
Redes neurais
Abstract in Portuguese
A classificação estética de fotografias é um problema de separação de imagens como boas ou ruins esteticamente. Na fotografia, a qualidade e beleza de uma foto podem ser descritas segundo uma série de fatores, não só de cunho técnico, mas também de cunho emocional. Por se tratar de um processo trabalhoso mas que é baseado em regras estruturadas, pode-se considerar a utilização de algoritmos de aprendizado de máquina para automatizar a resolução do problema. Esses algoritmos possibilitam a avaliação da qualidade estética de uma fotografia através da extração e classificação de atributos. Para resolver este problema um sistema proposto consistindo numa rede neural profunda convolucional (DCNN) e uma máquina de vetores de suporte (SVM), numa abordagem denominada aprendizagem profunda usando L2-SVM (DLSVM) foi utilizado. A avaliação de diferentes arquiteturas de redes neurais e de camadas de saída foi feita com o intuito de encontrar a arquitetura de melhor desempenho e de avaliar se o uso de uma DLSVM leva a resultados superiores. As redes foram pré-treinadas usando o ImageNet Large Scale Visual Recognition Challenge no desafio de classificação de objetos em imagens para melhorar ainda mais o desempenho final do modelo, usando duas abordagens de transferência de conhecimento diferentes. Os resultados finais obtidos se comparam com os da literatura recente e as análises feitas formam uma base sobre a qual estudos futuros poderão ser feitos.
Title in English
Aesthetic classification of photographies using machine learning.
Keywords in English
Aesthetics (Art)
Image processing
Machine learning
Neural networks
Pattern recognition
Abstract in English
The aesthetic classification of photographies is a problem of separating images as aesthetically good or bad. In photography the quality and beauty of a photograph can be described under a series of factors, not only technical ones but also emotional ones. As this is a time consuming process that is based on structured rules, it is possible to consider machine learning algorithms to automatize the problem resolution. These algorithms enable the aesthetic quality evaluation of a photograph through the extraction and classification of attributes. To solve this problem a system is proposed consisting of a deep convolutional neural network (DCNN) and a support vector machine (SVM), in an approach named deep learning using a L2-SVM (DLSVM) was used. The evaluation of different DCNN architectures and final layers was done with the objective of finding the architecture with the best performance and evaluate if the use of a DLSVM leads to supperior results. The networks were pre-trained using the ImageNet Large Scale Visual Recognition Challenge in the object classification challenge to improve even more the final performance of the model, using two different approaches to transfer learning. The final results are comparable to state-of-art ones and form a basis over which more studies can be done.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
BrunoTinenCorr20.pdf (6.75 Mbytes)
Publishing Date
2021-05-24
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.