• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Disertación de Maestría
DOI
https://doi.org/10.11606/D.3.2020.tde-24052021-102438
Documento
Autor
Nombre completo
Bruno Tinen
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Paulo, 2020
Director
Tribunal
Okamoto Junior, Jun (Presidente)
Bianchi, Reinaldo Augusto da Costa
Gomi, Edson Satoshi
Título en portugués
Classificação estética de fotografias por aprendizagem de máquina.
Palabras clave en portugués
Aprendizagem computacional
Processamento de imagens
Reconhecimento de padrões
Redes neurais
Resumen en portugués
A classificação estética de fotografias é um problema de separação de imagens como boas ou ruins esteticamente. Na fotografia, a qualidade e beleza de uma foto podem ser descritas segundo uma série de fatores, não só de cunho técnico, mas também de cunho emocional. Por se tratar de um processo trabalhoso mas que é baseado em regras estruturadas, pode-se considerar a utilização de algoritmos de aprendizado de máquina para automatizar a resolução do problema. Esses algoritmos possibilitam a avaliação da qualidade estética de uma fotografia através da extração e classificação de atributos. Para resolver este problema um sistema proposto consistindo numa rede neural profunda convolucional (DCNN) e uma máquina de vetores de suporte (SVM), numa abordagem denominada aprendizagem profunda usando L2-SVM (DLSVM) foi utilizado. A avaliação de diferentes arquiteturas de redes neurais e de camadas de saída foi feita com o intuito de encontrar a arquitetura de melhor desempenho e de avaliar se o uso de uma DLSVM leva a resultados superiores. As redes foram pré-treinadas usando o ImageNet Large Scale Visual Recognition Challenge no desafio de classificação de objetos em imagens para melhorar ainda mais o desempenho final do modelo, usando duas abordagens de transferência de conhecimento diferentes. Os resultados finais obtidos se comparam com os da literatura recente e as análises feitas formam uma base sobre a qual estudos futuros poderão ser feitos.
Título en inglés
Aesthetic classification of photographies using machine learning.
Palabras clave en inglés
Aesthetics (Art)
Image processing
Machine learning
Neural networks
Pattern recognition
Resumen en inglés
The aesthetic classification of photographies is a problem of separating images as aesthetically good or bad. In photography the quality and beauty of a photograph can be described under a series of factors, not only technical ones but also emotional ones. As this is a time consuming process that is based on structured rules, it is possible to consider machine learning algorithms to automatize the problem resolution. These algorithms enable the aesthetic quality evaluation of a photograph through the extraction and classification of attributes. To solve this problem a system is proposed consisting of a deep convolutional neural network (DCNN) and a support vector machine (SVM), in an approach named deep learning using a L2-SVM (DLSVM) was used. The evaluation of different DCNN architectures and final layers was done with the objective of finding the architecture with the best performance and evaluate if the use of a DLSVM leads to supperior results. The networks were pre-trained using the ImageNet Large Scale Visual Recognition Challenge in the object classification challenge to improve even more the final performance of the model, using two different approaches to transfer learning. The final results are comparable to state-of-art ones and form a basis over which more studies can be done.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
BrunoTinenCorr20.pdf (6.75 Mbytes)
Fecha de Publicación
2021-05-24
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2024. Todos los derechos reservados.