• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Mémoire de Maîtrise
DOI
https://doi.org/10.11606/D.100.2022.tde-06032023-141417
Document
Auteur
Nom complet
Milton dos Santos
Adresse Mail
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
São Paulo, 2022
Directeur
Jury
Rodrigues Neto, Camilo (Président)
Amaral, Amaury de Souza
Crepaldi, Antonio Fernando
Fernández Tuesta, Esteban
Titre en portugais
Classificação de áudio musical a partir dos coeficientes da Transformada Wavelet utilizando Redes Neurais Convolucionais
Mots-clés en portugais
Coeficientes Wavelet
MIR
Processamento de Sinais
Rede Neural Convolucional
Transformada Wavelet
Resumé en portugais
A identificação do estilo musical a que pertence uma música é uma tarefa relativamente simples para um humano, mesmo com pouco treinamento musical. Entretanto, é uma tarefa bastante difícil de ser realizada de forma automatizada. Neste trabalho utilizamos a Transformada Wavelet, que consegue representar uma música em suas componentes de frequência em função do tempo, gerando uma imagem denominada espectrograma. A partir do espectrograma, geramos imagens para treinar uma Rede Neural Convolucional com o objetivo de classificar os sinais de áudio em seus estilos musicais. Apenas os primeiros 15 segundos de cada música são utilizados para gerar o espectrograma, 6.075 músicas no conjunto de treinamento e 2.025 no conjunto de teste, pertencentes a 10 estilos musicais Blues, Clássico, Country, Disco, Hip Hop, Jazz, Metal, Pop, Reggae e Rock. O procedimento é repetido 10 vezes, com o conjunto de treinamento e teste escolhidos aleatoriamente. A média das taxas de acerto ficou entre 70% e 94%, bem acima dos 10% esperados se a classificação fosse por puro acaso.
Titre en anglais
Classification of musical audio from the coefficients of the Wavelet Transform using Convolutional Neural Networks
Mots-clés en anglais
Convolutional Neural Network
MIR
Signal Processing
Wavelet Coefficient
Wavelet Transform
Resumé en anglais
Identifying the musical style to which a song belongs is a relatively simple for a human, even with little musical training. However, it is a task quite difficult to be performed in an easy way. In this work we use the Wavelet Transform, which manages to represent a song in its frequency as a function of time, generating an image called spectrogram. From grass, we generate images of the behavior spectrum a Convolutional Neural Network with the purpose of classifying audio signals into their musical styles. only the first 15 seconds of each song used to generate the spectrogram, 6,075 songs in training set and 2025 in the test set, belonging to 10 musical styles Blues, Classical, Country, Disco, Hip Hop, Jazz, Metal, Pop, Reggae and Rock. The procedure Repetition 10 times, with the training and test set randomly chosen. One average hit rates were between 70% and 94%, well above the 10\% expected if the classification were by pure chance.
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Date de Publication
2023-07-10
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
CeTI-SC/STI
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2024. Tous droits réservés.