Efeito de diferentes estratégias de codificação dos processadores de fala na voz de crianças usuárias de implante coclear

Coelho, Ana Cristina de Castro

doi:10.11606/D.25.2011.tde-27092011-103625

Home

Facilities

Master's Dissertation

DOI

https://doi.org/10.11606/D.25.2011.tde-27092011-103625

Document

Master's Dissertation

Author

Coelho, Ana Cristina de Castro (Catálogo USP)

Full name

Ana Cristina de Castro Coelho

Institute/School/College

Faculdade de Odontologia de Bauru

Knowledge Area

Speech Language Pathology and Audiology

Date of Defense

2011-06-29

Published

Bauru, 2011

Supervisor

Bevilacqua, Maria Cecilia (Catálogo USP)

Committee

Bevilacqua, Maria Cecilia (President)
Camargo, Zuleica Antonia de
Moret, Adriane Lima Mortari

Title in Portuguese

Efeito de diferentes estratégias de codificação dos processadores de fala na voz de crianças usuárias de implante coclear

Keywords in Portuguese

Implante coclear
Qualidade da voz
Voz

Abstract in Portuguese

O implante coclear tem como objetivo promover a percepção auditiva de indivíduos com deficiência auditiva de grau severo e profundo. Seu uso resulta na otimização do desenvolvimento da linguagem, da fala e da produção vocal de seus usuários. Esse dispositivo tem se mostrado uma das tecnologias mais efetivas e promissoras para remediar a perda auditiva, sendo que seus resultados são altamente dependentes da estratégia de codificação selecionada no processador de fala. O objetivo deste trabalho foi comparar as características perceptivas e acústicas da voz de crianças deficientes auditivas usuárias de implante coclear que utilizam as estratégias de codificação de fala Advanced Combination Encoder (ACE) e Fine Structure Processing (FSP), bem como investigar se as vozes dessas crianças se diferenciam das de crianças ouvintes. Crianças de 3 anos a 5 anos e 11 meses de idade foram selecionadas. Foi realizada análise acústica da vogal /a/ por meio do Multi Dimentional Voice Program (MDVP), da fala encadeada e da conversa espontânea por meio do Real Time Pitch (RTP), e análise perceptiva das mesmas emissões por meio de escalas visuais analógicas de parâmetros pré-selecionados. Em comparação com os usuários da estratégia ACE, os usuários da estratégia FSP apresentaram maior valor da frequência fundamental (F0) na vogal sustentada (p=0,004), maior desvio padrão da F0 na vogal sustentada (p=0,008), maior coeficiente de variação da amplitude também na vogal sustentada (p= 0,019), e maior desvio do pitch para o agudo na conversa espontânea (0,011). Em relação ao grupo controle os usuários da estratégia FSP apresentaram, na vogal sustentada, maior valor da F0 (p=0,012), maior desvio padrão da F0 (p=0,000), maior coeficiente de variação da frequência (p=0,039), maior coeficiente de variação da amplitude (p= 0,039), maior desvio de ressonância (p=0,027), maior instabilidade (p=0,001) e maior desvio da loudness para o forte (p=0,029). Apresentaram também na fala encadeada maior média da F0 (p=0,002), maior frequência máxima (p=0,009), maior grau geral do impacto negativo da voz (p=0,003) e maior tensão (p=0,001). Na conversa espontânea apresentaram maior grau geral do impacto negativo da voz (p=0,001), maior tensão (p=0,012), maior desvio do pitch para o agudo (0,000) e maior desvio de ressonância (p=0,010). Em comparação com os usuários da estratégia FSP, os usuários da estratégia ACE apresentaram maior valor do índice de fonação suave (SPI) na vogal sustentada (p=0,013). Em relação ao grupo controle os usuários da estratégia ACE apresentaram maior instabilidade na vogal sustentada (p=0,001), maior extensão da frequência em Hertz (p=0,004) e em semitons (p=0,048) na fala encadeada, maior frequência máxima (p=0,011) também na fala encadeada, maior grau geral do impacto negativo da voz na conversa espontânea (p=0,009) e maior desvio da ressonância na conversa espontânea (p=0,021). A partir dos dados concluiu-se que os usuários da estratégia FSP apresentaram vozes mais agudas e instáveis do que os usuários da estratégia ACE, que apresentaram produção vocal mais suave. Em relação ao grupo controle, os usuários da estratégia ACE apresentaram valor mais elevado do grau geral do impacto negativo da voz, maior grau de desvio da ressonância e maior extensão vocal para o agudo. Os usuários da estratégia FSP apresentaram vozes com maior valor do desvio global do impacto da voz, voz mais aguda, com maior desvio de ressonância, maior grau de tensão, maior desvio da loudness e maior extensão vocal.

Title in English

Effect of different speech processors coding strategies on the voice of children with cochlear implants

Keywords in English

Cochlear implant
Quality of voice
Voice

Abstract in English

The cochlear implant has the pupose of providing hearing perception for individuals with severe and profound hearing loss. The implants use result on optimization of development of language, speech and voice production of its users. This device is one of the most promissing and effective technologies to remedy hearing loss, and its results depend highly on the speech coding strategy selected in the speech processor. The pupose of this study was to compare perceptual and acoustic characteristics of the voices of children who use the Advanced Combination Encoder (ACE) or Fine Structure Processing (FSP) speech coding strategies, and to investigate whether these characteristics differ from children with normal hearing. Children between 3 and 5 years and 11 months of age participated. Acoustic analysis of the sustained vowel /a/ was performed using the Multi Dimentional Voice Program. Analysis of sequential speech and spontaneous speech were performed using the Real Time Pitch. Perceptual analysis of these speech samples were performed using visual-analogic scales of pre-selected parameters. In comparison with the users of the ACE strategy, the users of the FSP strategy presented greater value of fundamental frequency (F0) for the sustained vowel (p=0,004), greater standard deviation of the F0 for the sustained vowel (p=0,008), greater amplitude variation coheficient, also for the sustaned vowel (p= 0,019), and greater pitch deviation for the spontaneous speech (p=0,011). In relation to the control group, the users of the FSP strategy presented, for the sustained vowel, greater F0 value (p=0,012), greater standard deviation of the F0 (p=0,000), greater frequency variation coheficient (p=0,039), grater amplitude variation coheficient (p= 0,039), greater ressonance deviation (p=0,027), greater instability (p=0,001) and greater loudness deviation (p=0,029). They also presented, for the sequential speech, greater F0 average (p=0,002), greater maximum frequency (p=0,009), greater overall severity of the voice (p=0,003) and greater strain (p=0,001). For the spontaneous speech, they presented greater overall severity (p=0,001), greater strain (p=0,012), greater pitch deviation (0,000) and greater ressonance deviation (p=0,010). In comparison the users of the FSP strategy, the users of the ACE strategy presented greater value of the Soft Phonation Index (SPI) for the sustained vowel (p=0,013). In relation to the control group, the users of the ACE strategy presented greater instability for the sustained vowel (p=0,001), greater frequency range in Hertz (p=0,004) and in semitones (p=0,048) for the sequential speech, greater maximum frequency (p=0,011) also for the sequential speech, greater overall severity for the spontaneous speech (p=0,009) and greater ressonance deviation for the spontaneous speech. (p=0,021). The study concluded that the users of the FSP strategy presented more high pitched and unstable voices than the users of the ACE strategy, who presented softer phonation. In relation to the control group, the users of the ACE strategy presented greater value of overall severity, greater ressonance deviation and greater frequency range. The users of the FSP strategy presented greater value of overall severity, more high pitched voices, greater ressonance deviation, greater vocal strain e and greater frequency range.

WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.

AnaCristinaCastroCoelho.pdf (2.63 Mbytes)

Publishing Date

2011-10-03

Derived works

WARNING: Learn what derived works are clicking here.