• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Dissertação de Mestrado
DOI
https://doi.org/10.11606/D.45.2020.tde-12052020-005232
Documento
Autor
Nome completo
Guilherme Jun Yoshimura
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Paulo, 2020
Orientador
Banca examinadora
Queiroz, Marcelo Gomes de (Presidente)
Tavares, Tiago Fernandes
Wertzner, Haydée Fiszbein
Título em português
Processamento de fala para triagem de distúrbios fonológicos
Palavras-chave em português
Classificação
Coeficientes Mel-Cepstrais
Distúrbio do som da fala
Dynamic Time Warping
Processamento de fala
Resumo em português
Este trabalho apresenta dois classificadores originais para sinais de voz que objetivam auxiliar profissionais da fonoaudiologia no diagnóstico de pessoas com alterações de fala. Comparamos os classificadores propostos com três técnicas conhecidas: Modelos de Markov Escondidos (HMM), bag-of-words e classificador baseado em Earth Mover's Distance (EMD). Utilizamos três bases de dados, sendo duas disponibilizadas pelo Departamento de Fisioterapia, Fonoaudiologia e Terapia Ocupacional (FOFITO) da Faculdade de Medicina da Universidade de São Paulo (FMUSP) que contêm gravações de crianças que têm alterações de fala que ocorrem durante o desenvolvimento da fala, e a terceira é a base pública UA-Speech que contém gravações de indíviduos adultos com disartria. O intuito deste trabalho é criar classificadores de fala capazes de distinguir um áudio sem alteração de fala de um áudio com alteração de fala. Além de estudar as técnicas conhecidas citadas anteriormente, propusemos dois classificadores baseados em Coeficientes Mel-Cepstrais (MFCC). O primeiro utiliza uma reformulação da distância DTW entre registros de fala e conjuntos de gravações sem alteração de fala, enquanto o outro combina a informação de curvas de dissimilaridades construídas a partir da comparação do registro de fala a ser classificado com as gravações de referência (sem alterações de fala).
Título em inglês
Speech processing for screening off phonological disorders
Palavras-chave em inglês
Classification
Dynamic Time Warping
Mel Frequency Cepstral Coefficients
Speech processing
Speech sound disorder
Resumo em inglês
This work presents two novel speech classifiers which aim to aid speech therapy professionals in the diagnosis of individuals with speech disorders. We compared the proposed classifiers with three well-known techniques: Hidden Markov Models (HMM), Bag-of-Words (BoW) and a classifier based on the Earth Mover's Distance. In this work we used three databases, two of which were provided by the School of Medicine at the University of São Paulo, and a third one which is a public database (UA-Speech) containing recordings of individuals with dysarthria. The goal of this project is to develop speech classifiers which are able to distinguish recordings from patients with and without speech disturbances. Besides studying the well-known techniques mentioned above, we proposed two techniques that are based on Mel Frequency Cepstral Coefficients (MFCC). The first one defines the classification problem over relative embeddings based on point-to-set distances, while the second one combines information from dissimilarity curves built from the comparison of the speech recording to be classified and the reference recordings (without speech disorders).
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2020-05-27
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2024. Todos os direitos reservados.