Segmentação de voz baseada na análise fractal e na transformada wavelet.

Fantinato, Paulo César

doi:10.11606/D.76.2008.tde-11122008-194055

Inicío

Serviços

Trabalhos decorrentes

Como citar

Formato MARC

Formato OAI DC

Dissertação de Mestrado

DOI

https://doi.org/10.11606/D.76.2008.tde-11122008-194055

Documento

Dissertação de Mestrado

Autor

Fantinato, Paulo César (Catálogo USP)

Nome completo

Paulo César Fantinato

E-mail

Unidade da USP

Instituto de Física de São Carlos

Área do Conhecimento

Física Aplicada

Data de Defesa

2008-12-02

Imprenta

São Carlos, 2008

Orientador

Guido, Rodrigo Capobianco (Catálogo USP)

Banca examinadora

Guido, Rodrigo Capobianco (Presidente)
Martins, Mateus Jose
Pereira, Aledir Silveira

Título em português

Segmentação de voz baseada na análise fractal e na transformada wavelet.

Palavras-chave em português

1. Voz. 2. Fractais. 3. Wavelets.

Resumo em português

Ultimamente, a análise fractal (AF) vem sendo utilizada com sucesso na área de processamento digital de voz, especialmente para fins de segmentação de palavras e fonemas, que é uma das etapas fundamentais dos sistemas de reconhecimento automático de fala (Automatic Speech Recognition - ASR ) e identificação automática de locutor (Automatic Speaker Identification - ASI). O uso prático da AF para ASR e ASI depende de dois fatores básicos: baixo custo computacional, para permitir o uso em tempo-real, e precisão nos resultados, para produzir a segmentação correta e entregar dados coerentes à etapa de classificação. Visando atender a esses objetivos, o presente trabalho propõe uma técnica de segmentação de sinais de voz baseada na dimensão do fractal, obtida com o uso da transformada wavelet discreta (DWT). Diversas famílias de wavelets são testadas e comparadas, sendo que os testes foram realizados com algumas sentenças extraídas da base de dados TIMIT do Linguistic Data Consortium (LDC).

Título em inglês

Speech segmentation based on fractal analysis and wavelet transform.

Palavras-chave em inglês

1. Speech 2. Fractals 3. Wavelets

Resumo em inglês

Nowadays, fractal analysis has been successfully applied to digital speech processing, particularly for words and phonemes segmentation, which represents one of the fundamental steps in automatic speech recognition and speaker identification systems. The practical use of fractal analysis for these purposes should match two principles: low computational cost, to allow use in real-time, and accuracy in the results, to produce a correct segmentation, delivering consistent data to the classifier. Aiming at meeting these two requirements, this work proposes a technique for speech segmentation based on the fractal dimension, obtained by using the discrete wavelet transform (DWT). Many families of wavelets were tested and compared, being the experiments performed with speech data collected from TIMIT corpus provided by the Linguistic Data Consortium.

AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.

Dissertacao_msc_final_Paulo_Cesar_Fantinato.pdf (1.04 Mbytes)

Data de Publicação

2008-12-18

Trabalhos decorrentes

AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.