Efeito da idade e da taxa de modulação no reconhecimento da fala intermitente

Silva, Rayane Ferreira da; Advíncula, Karina Paes; Gonçalves, Priscila Aliança; Leite, Gabrielle Araújo; Pereira, Liliane Desgualdo; Griz, Silvana Maria Sobral; Menezes, Denise Costa

RESUMO

Objetivo:

investigar o reconhecimento auditivo da fala intermitente em função de diferentes taxas de modulação e em função da idade.

Métodos:

participaram do estudo vinte jovens, vinte adultos de meia idade, e dezesseis idosos, todos com limiares auditivos iguais ou menores que 25 dB NA até a frequência de 4000 Hz. Os participantes foram submetidos a testes de reconhecimento da fala intermitente apresentada em três condições de modulação: 4 Hz, 10 Hz e 64 Hz. Percentuais de acerto foram comparados entre grupos etários e taxas de modulação. Para a investigação do efeito da taxa de modulação foi realizada ANOVA e testes Post Hoc, enquanto para a investigação do efeito da idade, utilizou-se o modelo de regressão linear misto (p<0,001).

Resultados:

sobre o efeito da idade, os dados mostram diferença significante entre jovens e idosos, e entre adultos de meia idade e idosos. Sobre o efeito da taxa de modulação, os índices de acerto da taxa mais lenta (4Hz) foram significantemente menores nos três grupos etários.

Conclusão:

foi verificado um efeito da idade no reconhecimento da fala intermitente: idosos apresentaram maior dificuldade. Percebeu-se também um efeito de taxa de modulação nos três grupos etários: quanto maior a taxa, melhor o desempenho.

Descritores:
Audição; Idoso; Teste de Discriminação de Fala; Percepção da Fala; Fala

ABSTRACT

Purpose:

to investigate the auditory recognition of intermittent speech in relation to different modulation rates and ages.

Methods:

20 young people, 20 middle-aged adults, and 16 older adults, all of them with auditory thresholds equal to or lower than 25 dB HL up to the frequency of 4000 Hz. The participants were submitted to intermittent speech recognition tests presented in three modulation conditions: 4 Hz, 10 Hz, and 64 Hz. The percentages of correct answers were compared between age groups and modulation rates. ANOVA and post hoc tests were conducted to investigate the modulation rate effect, and the mixed linear regression model (p < 0.001).

Results:

regarding the age effect, the data showed a significant difference between young people and older adults, and between middle-aged and older adults. As for the modulation rate effect, the indexes of correct answers were significantly lower at the slower rate (4 Hz) in the three age groups.

Conclusion:

an age effect was verified on intermittent speech recognition: older adults have greater difficulty. A modulation rate effect was also noticed in the three age groups: the higher the rate, the better the performance.

Keywords:
Hearing; Aged; Speech Discrimination Tests; Speech Perception; Speech

Introdução

Em muitas interações sociais permeadas por comunicação oral, a fala do interlocutor é apenas um dos sons contidos no ambiente. Outros sons, também presentes, podem mascarar, mesmo que parcialmente, o estímulo de fala que se deseja ouvir. Isso acontece quando o ruído ambiental coincide em tempo e/ou em espectro de frequência com a fala. Nessa situação, caracterizada por condição de escuta em baixa redundância, o ouvinte passa a perceber apenas os segmentos da fala que não coincidem, em características acústicas e temporais, com o ruído mascarante. O resultado é a percepção de uma fala intermitente (segmentada em intervalos de tempo) e/ou distorcida (segmentada em espectro de frequência). O reconhecimento adequado da fala em situações dessa natureza demanda que o ouvinte seja capaz de atribuir um significado à fala que contêm inúmeras janelas de tempo, ou inúmeras frequências faltando. É dessa forma que, em situações de escuta da fala em presença concomitante de ruído, a mensagem do interlocutor será percebida e interpretada pelo ouvinte¹1. Carhart R, Tillman TW, Greetis ES. Perceptual masking in multiple sound background. J Acoust Soc Am. 1969;45(3):694-703.^,²2. Caporali AS, Silva JA. Reconhecimento de fala no ruído em jovens e idosos com perda auditiva. Rev Bras Otorrinolaringol. 2004;70(4):525-32..

A dificuldade em reconhecer sons da fala em ambientes ruidosos aumenta com o avanço da idade. A perda auditiva sensorial, comum na população idosa, é referida como uma das causas de dificuldade do idoso em reconhecer sons da fala²2. Caporali AS, Silva JA. Reconhecimento de fala no ruído em jovens e idosos com perda auditiva. Rev Bras Otorrinolaringol. 2004;70(4):525-32.^,³3. Humes LE, Christopherson L. Speech identification difficulties in hearing-impaired elderly persons: the contribution of auditory processing deficits. J Speech Hear Res. 1991;34(3):686-93.. No entanto, estudos apontam que independentemente de qualquer déficit na sensibilidade auditiva, idosos com audição dentro dos padrões de normalidade, quando comparados a jovens ouvintes, apresentam maior dificuldade no reconhecimento da fala em ambientes ruidosos²2. Caporali AS, Silva JA. Reconhecimento de fala no ruído em jovens e idosos com perda auditiva. Rev Bras Otorrinolaringol. 2004;70(4):525-32.^,⁴4. Versfeld N, Dreschler W. The relationship between time-compressed speech and speech in noise in young and elderly listeners. J Acoust Soc Am. 2002;111(1):401-8.

5. Gordon-Salant S. Speech perception and auditory temporal processing performance by older listeners: implications for real-world communication. Seminars in Hearing. 2006;27(4):264-8.^-⁶6. Desloge JG, Reed CM, Braisa LD, Perez ZD, Delhorn LA. Speech reception by listeners with real and simulated impairment: effects of continuous and interrupted noise. J Acoust Soc Am. 2010;128(1):342-59..

Sabe-se que o mascaramento temporal está relacionado à dificuldade em reconhecer a fala em ambientes ruidosos⁷7. Grose J, Mamo S. Processing of temporal fine structure as a function of age. Ear Hear. 2010;31(6):755-60.^,⁸8. Hall JW, Buss E, Grose JH, Roush PA. Effects of age and hearing impairment on the ability to benefit from temporal and spectral modulation. Ear Hear. 2012;33(3):340-4.. O mascaramento temporal caracteriza-se pela mudança de limiar de um som na presença de outro estímulo subsequente. Isto ocorre quando um estímulo é apresentado com duração e intensidade suficientes para reduzir a sensibilidade de um outro estímulo⁹9. Shinn JB. Temporal processing: the basics. Hear J. 2003;56(7):52._.

Estudos mostram que o efeito do mascaramento é maior em idosos com limiares auditivos normais, quando comparados a jovens, também de audição normal¹⁰10. George EL, Zekveld AA, Kramer SE, Goverts ST, Festen JM, Houtgast T. Auditory and nonauditory factors affecting speech reception in noise by older listeners. J Acoust Soc Am. 2007;121(4):2362-75.

11. Gifford RH, Bacon SP, Williams EJ. An examination of speech recognition in a modulated background and of forward masking in younger and older listeners. J Speech Lang Hear Res. 2007;50(4):857-64.

12. Grose JH, Mamo SK, Hall JW. Age effects in temporal envelope processing: speech unmasking and auditory steady-state responses. Ear Hear. 2009;30(5):568-75.^-¹³13. Wilson RH, McArdle R, Betancourt MB, Herring K, Lipton T, Chisolm TH. Word-recognition performance in interrupted noise by young listeners with normal hearing and older listeners with hearing loss. J Am Acad Audiol. 2010;21(2):90-109.. Percebe-se, portanto, que o mascaramento temporal está relacionado à maior dificuldade do idoso em reconhecer a fala em ambientes ruidosos¹⁴14. Grose JH, Porter HL, Buss E. Aging and spectro-temporal integration of speech. Trends Hear. 2016;20:1-11.. No entanto, uma questão que ainda não é compreendida é se algum outro fator, além do efeito do mascaramento temporal, está relacionado a essa dificuldade.

Uma possibilidade seria o declínio natural da habilidade de reconhecer a fala em baixa redundância. Mais especificamente, nesse caso, a fala intermitente (segmentada em tempo), semelhante à fala percebida por ouvintes em ambientes ruidosos. Surge, então, a pergunta condutora do presente estudo: será que a habilidade de reconhecer a fala intermitente naturalmente declina em função da idade?

A hipótese é que a habilidade de reconhecer a fala intermitente decline com o avanço da idade. Talvez, uma queda no desempenho dessa habilidade possa, inclusive, ser identificada em adultos de meia idade, que ainda não atingiram a senescência. Essa hipótese é testada nesse estudo por meio da comparação do desempenho de três grupos etários (jovens, adultos de meia idade e idosos) em testes de reconhecimento da fala intermitente (segmentada em tempo).

O estudo justifica-se por ser a audição peça fundamental para comunicação das pessoas em ambientes de interação social, e principalmente, pelo aumento das dificuldades auditivas e desafios relacionados à sociabilização dos idosos. Esses fatores aumentaram, nos últimos anos, o interesse de estudiosos sobre o assunto⁷7. Grose J, Mamo S. Processing of temporal fine structure as a function of age. Ear Hear. 2010;31(6):755-60.^,⁸8. Hall JW, Buss E, Grose JH, Roush PA. Effects of age and hearing impairment on the ability to benefit from temporal and spectral modulation. Ear Hear. 2012;33(3):340-4.^,¹⁵15. Grose JH, Mamo S. Electrophysiological measurement of binaural beats: effects of primary tone frequency and observer age. Ear Hear. 2012;32(2):187-94.^,¹⁶16. Calais LL, Lima-Gregio AM, Costa MJ, Gil D, Borges ACLC. Speech recognition by the elderly: test proposal concerning word predictability. Audiol., Commun. Res. 2016;21:1-9.. Dessa forma, o presente estudo teve como objetivo investigar o reconhecimento auditivo da fala intermitente em função de diferentes taxas de modulação e em função da idade.

Métodos

Trata-se de um estudo observacional, analítico e transversal, aprovado pelo Comitê de Ética e Pesquisa envolvendo Seres Humanos do Centro de Ciências da Saúde da Universidade Federal de Pernambuco, Brasil, sob o número 2.532.384.

A amostra foi composta por 56 participantes, recrutados por conveniência, e dividida em três grupos: Grupo 01: composto por vinte jovens com idade entre 18 e 25 anos (idade média de 21 anos), ambos os gêneros (sendo 12 do gênero feminino); Grupo 02: composto por vinte adultos de meia idade com idade entre 45 e 55 anos (idade média de 48 anos), ambos os gêneros (sendo 16 do gênero feminino); Grupo 03: composto por 16 idosos com idade entre 60 e 77 anos (idade média de 65 anos), ambos os gêneros (sendo 14 do gênero feminino).

Para atender aos critérios de inclusão, os participantes apresentaram limiares audiométricos iguais ou menores que 25 dB NA, nas frequências de 250 a 4000 Hz, em pelo menos uma orelha. Todos os participantes do grupo de jovens e adultos de meia idade apresentaram limiares audiométricos iguais ou menores que 25 dB NA, nas frequências de 250 a 8000 Hz, e no grupo de idosos, apenas dois participantes apresentaram limiares piores que 25 dB NA (entre 35 a 45 dB) nas frequências de 6000 e 8000 Hz. A Figura 1 mostra a representação gráfica das médias dos limiares audiométricos das orelhas testada para os três grupos participantes.

Figura 1:
Representação gráfica das médias dos limiares audiométricos das orelhas testada para os três grupos etários

Foram excluídos do estudo indivíduos que apresentaram diagnóstico ou queixa de qualquer alteração no sistema auditivo, neurológica, psiquiátrica ou cognitiva que pudesse interferir em qualquer grau na comunicação oral.

Os indivíduos convidados a participar do estudo foram apresentados a todos os objetivos e procedimentos da pesquisa, incluindo explicação dos riscos e benefícios de sua participação. Após aceitarem participar da pesquisa, os participantes assinaram um Termo de Consentimento Livre e Esclarecido (TCLE) e, em data agendada, foram submetidos a audiometria tonal para verificar se apresentavam limiares audiométricos de acordo com o critério de inclusão estabelecido.

Os participantes que atenderam ao critério de inclusão foram convidados a prosseguir e realizar os testes com a fala intermitente. Para a realização do teste de fala, o participante foi posicionado sentado dentro de uma cabina acústica. O estímulo de fala foi apresentado através de fone auricular Sennheiser HD580. A apresentação foi monoaural, e a orelha escolhida para o teste foi a orelha direita. Nos casos em que a média tritonal (500, 1000 e 2000 Hz) da orelha esquerda foi menor que a média tritonal da orelha direita em 10 dB ou mais, optou-se por fazer na orelha esquerda. Dessa forma, a melhor orelha dos participantes foi testada. Optou-se por se testar apenas a melhor orelha para minimizar a influência da fadiga e da aprendizagem nos resultados.

As sentenças utilizadas no estudo fazem parte da versão brasileira do Hearing in Noise Test (HINT)¹⁷17. Bevilacqua MC, Banhara M, Costa E, Vignoly A, Alvarenga KF. The Brazilian Portuguese hearing in noise test. Int J Audiol. 2008;47(6):364-5._. Essa versão do HINT é composta por sentenças em Português Brasileiro de uso cotidiano. São doze listas com vinte sentenças cada (240 no total), todas foneticamente balanceadas.

As sentenças foram acusticamente modificadas por meio do processador de fala da marca Tucker Davis Technology, modelo RZ6 e do programa MATLAB^TM (Matrix Laboratory). A segmentação temporal foi realizada por meio da modulação da amplitude do sinal acústico, realizada por um modulador de onda quadrática (square-wave modulator). As sentenças foram moduladas em 100% (limitação total de amplitude), resultando em um som de fala interrompida, ou intermitente. A fala intermitente foi apresentada na intensidade de 65 dB, de forma randomizada, em três condições de teste. Em cada condição a taxa de modulação da amplitude foi diferente. Foram testadas as taxas de modulação em 4 Hz, 10 Hz e 64 Hz. A taxa de modulação é a quantidade de vezes na qual a amplitude diminui 100% em intensidade durante o período de um segundo. Por exemplo, na condição de modulação em 4 Hz, a cada segundo da sentença apresentada houve quatro períodos nos quais a amplitude foi diminuída em 100% (ciclo de modulação). Cada um dos ciclos de modulação durou 250 ms, e por ter sido modulado em uma onda quadrática, metade desse tempo (125 ms) foi caraterizado com ausência de informação acústica. Portanto, para cada segundo de fala, apenas metade desse tempo (500 ms) conteve a informação verbal da sentença. A Figura 2 ilustra a segmentação em 4Hz: os blocos retangulares representam o período de tempo com presença de informação verbal, e os espaços vazios representam os períodos de tempo sem informação acústica.

Figura 2:
Ilustração da fala segmentada em 4 Hz

Nas demais taxas de modulação, seguiu-se a mesma programação. Na modulação de 10Hz, houve dez períodos de baixa de amplitude (ausência de informação acústica), e cada um durou 50 ms. Em 64 Hz, os sessenta e quatro períodos de ausência de informação duraram 8 milissegundos, cada um. Percebe-se que o tempo total de ausência de informação é o mesmo nas três condições de teste (500 ms para cada segundo), no entanto, o que difere é a distribuição entre os períodos com e sem ausência de som.

Os participantes foram instruídos a repetir as sentenças da forma como escutaram, e foram alertados que em alguns momentos as palavras poderiam ser ininteligíveis. Os pesquisadores, localizados fora da cabina acústica, controlaram a apresentação das sentenças e registraram os erros e omissões cometidos pelos participantes.

Na medida em que cada sentença era apresentada, o texto aparecia na tela do computador do pesquisador, com todas as palavras em destaque num retângulo sombreado sensível à marcação. Por meio do uso do mouse, as palavras da sentença que não eram repetidas pelo participante, ou que eram repetidas incorretamente, eram marcadas e contabilizadas no programa.

Os participantes foram testados três vezes para cada taxa de modulação (4, 10 e 64Hz), resultando em três percentuais de acerto para cada taxa. Em cada modulação foram utilizadas 25 sentenças (equivalente a uma lista inteira do HINT, mais 5 sentenças da lista posterior). Portanto, a sequência de teste aconteceu da seguinte maneira: a) sorteava-se a taxa de modulação a ser testada; b) iniciava-se o teste na lista 1, sentença 1; Após 25 sentenças, quando a lista 1 já tinha sido completamente utilizada, assim como, cinco sentenças da lista 2, encerrava-se o primeiro teste, obtendo-se o primeiro percentual de acerto; c) novo sorteio da taxa de modulação era realizado; d) iniciava-se o teste utilizando a lista 2, sentença 6; Após 25 sentenças apresentadas (quinze da lista 2 e dez da lista 3), obtinha-se mais um percentual de acerto; e assim sucessivamente. Dessa forma, houve apresentação randômica das sentenças entre as taxas de modulação, assim como randomização da sequência de apresentação das taxas, eliminando viés de cansaço associado às últimas apresentações, e um possível viés causado por alguma lista ser mais ou menos fácil na realização da tarefa. Além disso, a quantidade de sentenças disponíveis no HINT (240) possibilitou não haver repetição, eliminando viés de aprendizagem.

Durante o teste, o pesquisador não forneceu qualquer pista ao participante em relação a seu desempenho. Intervalos para descanso foram realizados sempre que necessário.

Os índices percentuais de acerto foram computados usando-se o programa MATLAB. O cálculo foi realizado de acordo com a quantidade de palavras utilizadas nas vinte e cinco sentenças testadas (o total de palavras variou entre as sentenças). Posteriormente, para cada taxa de modulação foi realizada a média aritmética dos três índices percentuais de acerto obtidos, e essa média foi o resultado considerado para análise estatística. O objetivo de se obter três índices percentuais de acerto foi alcançar uma melhor representatividade do desempenho do participante na taxa de modulação testada.

A análise dos dados foi realizada pelos softwares STATA/SE 12.0 e Excel 2010. Todos os testes foram aplicados com 95% de confiança (p<0,05). Para verificar a normalidade dos dados, utilizou-se o teste de Kolmogorov-Smirnov para variáveis quantitativas, e como resultados, obteve-se: em 4Hz as variáveis estão normalmente distribuídas, e em 10 e 64Hz as variáveis apresentam distribuição não normal.

Portanto, para investigação do efeito da taxa de modulação foi realizada a análise de variância (ANOVA) com Post Hoc de Tukey (Distribuição Normal) e Kruskal Wallis com comparação múltipla de Dunn’s (para a Distribuição não Normal). Para a investigação do efeito da idade, utilizou-se um método para medidas repetidas: o modelo de regressão linear misto, que leva em consideração a possível relação entre os valores da variável resposta que constituem medidas repetidas.

Resultados

Os percentuais de reconhecimento para fala intermitente foram descritos em função dos grupos etários e em função da taxa de modulação. Para fins de investigação do efeito da idade, os dados foram comparados entre os três grupos etários de acordo com as diferentes taxas de modulação. Esses resultados estão descritos na Tabela 1.

Thumbnail

Tabela 1:
Comparação entre as médias dos percentuais de reconhecimento de fala entre as diferentes faixas etárias para cada taxa de modulação (N=56)

Os dados mostram diferença significante entre jovens e idosos, e entre adultos de meia idade e idosos. Observa-se que o grupo de jovens teve desempenho semelhante ao grupo de adultos de meia idade em todas as condições de teste (4Hz, 10Hz e 64Hz).

No que diz respeito a escolaridade dos participantes, no grupo de jovens todos relataram ter ensino médio completo. O grupo de adultos de meia idade foi composto por 15 participantes com ensino superior completo, 4 com ensino médio completo e apenas 1 com ensino médio incompleto. No grupo de idosos, 4 apresentaram ensino superior completo, 5 apresentaram ensino médio completo, 5 relataram ensino fundamental completo e 2 com ensino fundamental incompleto.

O grupo que apresentou maior escolaridade foi o grupo de adultos de meia idade. No entanto, esse grupo apresentou índices percentuais inferiores ao grupo de jovens na modulação de 4Hz. Esses resultados mostram que o fator escolaridade dos participantes não pareceu influenciar nos resultados obtidos. Isso porque as sentenças utilizadas na tarefa auditiva são sentenças simples, comuns do uso coloquial da Português Brasileiro¹⁷17. Bevilacqua MC, Banhara M, Costa E, Vignoly A, Alvarenga KF. The Brazilian Portuguese hearing in noise test. Int J Audiol. 2008;47(6):364-5..

Os resultados da análise do efeito da taxa de modulação no reconhecimento da fala intermitente estão descritos na Tabela 2.

Thumbnail

Tabela 2:
Comparação das médias dos percentuais de reconhecimento de fala intermitente entre as diferentes taxas de modulação para cada faixa etária (N=56)

Ao se comparar as médias do desempenho no teste para cada taxa de modulação entre todos os participantes (grand average) percebe-se diferença significante entre as três taxas testadas. Especificamente, quando se compara os resultados entre as taxas de modulação em cada grupo etário isoladamente, percebe-se que apenas para os adultos de meia idade não houve diferença significante entre as taxas de 10Hz e 64Hz.

Discussão

Umas das hipóteses do presente estudo é a influência da idade no reconhecimento da fala intermitente. Ou seja, a hipótese é que, devido ao declínio em habilidades do processamento temporal, indivíduos idosos apresentem maior dificuldade em reconhecer a fala intermitente. Os achados aqui encontrados confirmam essa hipótese. Em todas as taxas de modulações testadas, as médias de percentual de acerto diminuem com o aumento da idade.

Shafiro e colaboradores¹⁸18. Shafiro V, Sheft S, Risley R, Gygi B. Effects of age and hearing loss on the intelligibility of interrupted speech. J Acoust Soc Am. 2015;137(2):745-56. investigaram a influência da idade e da perda auditiva na inteligibilidade da fala interrompida. As sentenças foram moduladas em taxas entre 0,5 e 24 Hz, e os resultados demonstraram existir relação entre o reconhecimento da fala, a idade e a perda auditiva. Kidd e Humes¹⁹19. Kidd GR, Humes LE. Effects of age and hearing loss on the recognition of interrupted words in isolation and in sentences. J Acoust Soc Am. 2012;131(2):1434-48._, também investigaram o efeito da idade e da perda auditiva no reconhecimento da fala intermitente. Apresentaram, a jovens de audição normal e a idosos com e sem perda auditiva, palavras-alvo isoladamente e dentro do contexto de uma sentença, utilizando uma série de padrões de interrupção em que partes da fala foram substituídas por silêncio. Os resultados demonstraram que tanto a idade quanto a perda auditiva afetam a percepção da fala intermitente.

Os dados do presente estudo corroboram com os achados de Shafiro e colaboradores¹⁸18. Shafiro V, Sheft S, Risley R, Gygi B. Effects of age and hearing loss on the intelligibility of interrupted speech. J Acoust Soc Am. 2015;137(2):745-56. e Kidd e Humes¹⁹19. Kidd GR, Humes LE. Effects of age and hearing loss on the recognition of interrupted words in isolation and in sentences. J Acoust Soc Am. 2012;131(2):1434-48. no que se refere à variável idade. Em ambos os estudos, assim como os dados aqui apresentados, os resultados foram melhores para os grupos de jovens quando comparado aos idosos.

O efeito da idade na audição periférica e central de idosos é amplamente documentado. Alterações fisiológicas no sistema auditivo do idoso, assim como dificuldades cognitivas e de memória, explicam o declínio em habilidades no processamento de sons, especialmente, no reconhecimento da fala em ambientes ruidosos⁵5. Gordon-Salant S. Speech perception and auditory temporal processing performance by older listeners: implications for real-world communication. Seminars in Hearing. 2006;27(4):264-8.^,²⁰20. Gordon-Salant S, Fitzgibbons PJ. Recognition of multiply degraded speech by young and elderly listeners. J Speech Hear Res. 1995;38(5):1150-6.^,²¹21. Parra VM, Iório MCM, Mizahi MM, Baraldi GS. Testes de padrão de frequência e de duração em idosos com sensibilidade auditiva normal. Rev Bras Otorrinolaringol. 2004;70(4):517-23..

Saija et al.²²22. Saija JD, Akyurek EG, Angringa TC, Baskente D. Perceptual restoration of degraded speech is preserved with advancing age. J Assoc Res Otolaryngol. 2014;15(1):139-48., observaram dificuldade na população idosa nas tarefas cognitivas utilizando fonemas degradados. Porém a população estudada apresentava presbiacusia e por esta razão não foi possível determinar se a dificuldade se deu em função das limitações periféricas ou centrais. Os idosos aqui estudados não apresentaram perda auditiva, porém, ainda assim, obtiveram desempenho inferior quando comparados aos jovens e adultos de meia idade.

Sabe-se que o declínio na sensibilidade auditiva decorrente da presbiacusia tem papel significante no reconhecimento de fala, principalmente quando se trata de fala de baixa redundância. No entanto, os dados da população idosa do presente estudo mostram que o sistema auditivo central também deve estar relacionado ao declínio na habilidade de reconhecer fala intermitente. No grupo estudado, apenas dois idosos apresentaram configuração audiométrica descendente, chegando a limiares entre 35 e 45 dB NA nas frequências de 6000 e 8000 Hz, podendo-se considerar que, em termos de audição periférica, os grupos aqui comparados estavam em equivalência. Acredita-se, portanto, que alterações nas habilidades da audição central tenham um papel importante nesses resultados.

Outro aspecto que pode estar relacionado ao desempenho do grupo de idosos aqui estudado é o nível de escolaridade. Este foi o único grupo contendo participantes com ensino médio e fundamental incompletos. Embora as sentenças da versão brasileira do teste HINT sejam consideradas simples, de uso coloquial, para o nativo do Português Brasileiro, não se pode descartar a possibilidade de influência da escolaridade no reconhecimento da fala. Estudos com amostras mais robustas podem investigar essa variável.

Por outro lado, existem aspectos decorrentes do avanço da idade que podem contribuir de forma positiva. Estudos mostram que pessoas idosas podem superar, nem que seja parcialmente, suas dificuldades auditivas, devido a competência linguística adquirida ao longo da vida. A experiência na pragmática e semântica da sua língua, promovem mecanismos compensatórios que ajudam na comunicação em ambientes sonoros complexos e de baixa redundância²²22. Saija JD, Akyurek EG, Angringa TC, Baskente D. Perceptual restoration of degraded speech is preserved with advancing age. J Assoc Res Otolaryngol. 2014;15(1):139-48.

23. Benard MR, Mensink JS, Baskent D. Individual differences in top-down restoration of interrupted speech: Links to linguistic and cognitive abilities. J Acoust Soc Am. 2014:135(2):88-94.^-²⁴24. Jin SH, Nelson PB. Interrupted speech perception: the effects of hearing sensitivity and frequency resolution. J Acoust Soc Am. 2010;128(2):881-9.. Isso é consistente com a ideia de que processos top-down (termo utilizado para caracterizar a contribuição na qual processos corticais podem exercer na recepção de estímulos) podem ajudar a preencher informações acústicas perdidas, facilitar o foco de atenção e o processamento do sinal de fala²⁵25. Gary RK, Larry EH. Effects of age and hearing loss on the recognition of interrupted words in isolation and in sentences. J Acoust Soc Am. 2012;131(2):1434-48.. Os dados do presente estudo não mostram evidências de que esses processos tenham contribuído no reconhecimento da fala degradada, intermitente. Isso porque os idosos apresentaram desempenho inferior aos demais grupos quando a taxa de modulação foi apresentada em 4Hz. Porém, não se pode afirmar a ausência dessa contribuição.

A dificuldade no reconhecimento da fala intermitente pode estar também relacionada ao declínio de processos cognitivos²⁶26. Pichora-Fuller MK, Souza PE. Effects of aging on auditory processing of speech. Int J Audiol. 2003;42(Suppl 2):2S11.. Em entrevista inicial, os participantes idosos do presente estudo relataram não haver queixas ou sintomas possivelmente relacionados a aspectos cognitivos, no entanto, não foram submetidos a testes específicos que pudessem descartar alterações em habilidades cognitivas. Certamente, a ausência de conhecimento sobre o desempenho cognitivo desse grupo, decorrente de uma limitação metodológica, torna-se um viés na interpretação dos dados. Sugere-se, portanto, que estudos futuros investiguem a relação entre o desempenho no reconhecimento da fala intermitente e aspectos cognitivos, principalmente na população idosa.

Não se sabe exatamente quando, ou em que faixa etária, as dificuldades provocadas pela idade começam a acontecer. Nesse sentido, os resultados aqui encontrados para o grupo de adultos de meia idade caracterizam um achado interessante. Nas três condições de teste, esse grupo apresentou resultados semelhantes aos encontrados no grupo de jovens, e diferentes dos resultados encontrados no grupo de idosos. A proximidade desse grupo com o grupo de jovens, em termos de desempenho no reconhecimento da fala intermitente, levanta a ideia de que possivelmente um declínio nas habilidades necessárias para o fechamento das informações acústicas ausentes numa fala intermitente não tenha início até pouco antes da senescência.

Ao contrário do que foi encontrado aqui, Grose, Mamo e Hall¹²12. Grose JH, Mamo SK, Hall JW. Age effects in temporal envelope processing: speech unmasking and auditory steady-state responses. Ear Hear. 2009;30(5):568-75. apontam para o surgimento de declínio no processamento temporal relativamente cedo no processo de envelhecimento. Os autores comentam estudos realizados com adultos de meia idade cuja audição periférica é normal, e conclui que alterações no processamento auditivo se iniciam antes da senescência.

A segunda hipótese dessa pesquisa foi a existência de um efeito da taxa de modulação no reconhecimento da fala intermitente. Para investigação desse efeito, foi feita uma comparação das médias percentuais de acerto entre as taxas testadas em todos os participantes (grand average). O padrão de respostas encontrado confirma a hipótese. À medida em que a taxa de modulação aumenta, os percentuais de acerto aumentam nos três grupos testados.

A melhora no reconhecimento da fala intermitente com uma frequência maior de taxa de modulação pode ser explicada pelo menor intervalo de tempo com ausência de informação acústica provocada em taxas mais altas. Ou seja, à medida em que a taxa aumenta, o número de cortes de informação acústica aumenta num mesmo intervalo de tempo (1 segundo). Por exemplo, em 4 Hz ocorrem quatro ‘cortes’ em um segundo, e em 64 Hz, ocorrem sessenta e quatro cortes. Embora nas taxas mais altas exista maior quantidade de cortes de informação acústica, esses cortes são mais breves, e por isso, menos informação acústica é retirada da frase, facilitando a compreensão. Por outro lado, mais informação acústica é retirada da frase segmentada em taxas de modulação mais baixas.

Esse efeito parece ser mais significante em taxas menores que 10 Hz, no caso aqui investigado, em 4 Hz. Isso porque em 10Hz e em 64 Hz os percentuais de acerto foram elevados (de 88,72% a 99,69%), próximos de uma situação ideal de escuta, e os valores obtidos em 4 Hz foram inferiores a 74%, chegando a 55,92% (reconhecimento de pouco mais que a metade do que foi dito) no grupo de idosos. O desempenho tende a ser menor em taxas de interrupção lenta, nesse caso 4 Hz, quando os ouvintes contam com trechos mais longos de ausência de informação acústica. Essa ausência pode resultar em maior incerteza lexical e tornar mais difícil o benefício de pistas contextuais.

A tarefa de reconhecer a fala em presença de ruído mascarante que oscila em amplitude pode ser semelhante à tarefa de reconhecer a fala intermitente. Em ambas as situações o ouvinte se depara com ausência de informações acústicas da frase alvo. No entanto, embora exista uma semelhança na situação de escuta de baixa redundância entre as duas condições de teste, a presença do ruído mascarante provoca o efeito de pós-mascaramento (forward masking) e pré-mascaramento (backward masking), onde as informações acústicas da fala nos intervalos de tempo de baixa amplitude do ruído ainda recebem interferência do ruído mascarante. Nessa situação, os intervalos de tempo com presença de informação de fala ficam ainda mais diminuídos do que o presumido ao se analisar apenas a taxa de modulação.

Advíncula e colaboradores²⁷27. Advíncula KP, Menezes DC, Pacífico FA, Griz SMS. Effect of modulation rate on masking release for speech. Audiol., Commun. Res. 2013;18(4):238-44. investigaram o desempenho de jovens ouvintes no reconhecimento de sentenças (teste HINT na versão brasileira) em presença de ruído mascarante oscilando em diferentes taxas de modulação: 4Hz, 8Hz, 10Hz, 16Hz, 32Hz e 64Hz. Os achados mostram desempenho semelhante para as taxas de 4Hz até 32Hz, e os resultados na condição de 64Hz foi pior que as demais taxas investigadas. Importante notar que o padrão encontrado por eles é inverso ao padrão encontrado no presente estudo, pois a modulação ocorreu no ruído mascarante e não na fala propriamente dita. Portanto, em presença de ruído modulado, o desempenho no reconhecimento da fala piora na medida em que a taxa de modulação aumenta.

Embora os padrões sejam inversos, a lógica é a mesma. Os autores explicam que a taxa maior (64 Hz) torna o ruído modulado fisicamente mais próximo ao ruído estável. Ou seja, os intervalos de tempo nos quais o ruído diminui em amplitude são menores, dificultando a percepção dos sinais acústicos da fala. Os resultados aqui encontrados seguem essa mesma linha de raciocínio. Melhores percentuais de reconhecimento de fala são encontrados para as condições de teste com menor perda de informação acústica.

É importante esclarecer que, embora os resultados do grupo de idosos, principalmente na taxa de 4Hz, tenham sido inferiores aos resultados dos demais grupos, os índices percentuais aqui encontrados não representam, necessariamente, dificuldades na escuta social. A investigação do quanto os percentuais aqui encontrados interferem na comunicação diária requer estudos com metodologia adequada para tal fim. Outro fator não explorado no presente estudo foi se existe um lado do córtex auditivo predominante na tarefa de reconhecimento da fala intermitente. Sugere-se a realização de pesquisas que explorem esse assunto.

Conclusão

Os achados mostram um efeito da idade no reconhecimento da fala segmentada: idosos apresentaram maior dificuldade em reconhecer a fala intermitente. Percebeu-se, também, um efeito de taxa de modulação nos três grupos etários: quanto maior a taxa, melhor o desempenho.

REFERENCES

¹
Carhart R, Tillman TW, Greetis ES. Perceptual masking in multiple sound background. J Acoust Soc Am. 1969;45(3):694-703.
²
Caporali AS, Silva JA. Reconhecimento de fala no ruído em jovens e idosos com perda auditiva. Rev Bras Otorrinolaringol. 2004;70(4):525-32.
³
Humes LE, Christopherson L. Speech identification difficulties in hearing-impaired elderly persons: the contribution of auditory processing deficits. J Speech Hear Res. 1991;34(3):686-93.
⁴
Versfeld N, Dreschler W. The relationship between time-compressed speech and speech in noise in young and elderly listeners. J Acoust Soc Am. 2002;111(1):401-8.
⁵
Gordon-Salant S. Speech perception and auditory temporal processing performance by older listeners: implications for real-world communication. Seminars in Hearing. 2006;27(4):264-8.
⁶
Desloge JG, Reed CM, Braisa LD, Perez ZD, Delhorn LA. Speech reception by listeners with real and simulated impairment: effects of continuous and interrupted noise. J Acoust Soc Am. 2010;128(1):342-59.
⁷
Grose J, Mamo S. Processing of temporal fine structure as a function of age. Ear Hear. 2010;31(6):755-60.
⁸
Hall JW, Buss E, Grose JH, Roush PA. Effects of age and hearing impairment on the ability to benefit from temporal and spectral modulation. Ear Hear. 2012;33(3):340-4.
⁹
Shinn JB. Temporal processing: the basics. Hear J. 2003;56(7):52.
¹⁰
George EL, Zekveld AA, Kramer SE, Goverts ST, Festen JM, Houtgast T. Auditory and nonauditory factors affecting speech reception in noise by older listeners. J Acoust Soc Am. 2007;121(4):2362-75.
¹¹
Gifford RH, Bacon SP, Williams EJ. An examination of speech recognition in a modulated background and of forward masking in younger and older listeners. J Speech Lang Hear Res. 2007;50(4):857-64.
¹²
Grose JH, Mamo SK, Hall JW. Age effects in temporal envelope processing: speech unmasking and auditory steady-state responses. Ear Hear. 2009;30(5):568-75.
¹³
Wilson RH, McArdle R, Betancourt MB, Herring K, Lipton T, Chisolm TH. Word-recognition performance in interrupted noise by young listeners with normal hearing and older listeners with hearing loss. J Am Acad Audiol. 2010;21(2):90-109.
¹⁴
Grose JH, Porter HL, Buss E. Aging and spectro-temporal integration of speech. Trends Hear. 2016;20:1-11.
¹⁵
Grose JH, Mamo S. Electrophysiological measurement of binaural beats: effects of primary tone frequency and observer age. Ear Hear. 2012;32(2):187-94.
¹⁶
Calais LL, Lima-Gregio AM, Costa MJ, Gil D, Borges ACLC. Speech recognition by the elderly: test proposal concerning word predictability. Audiol., Commun. Res. 2016;21:1-9.
¹⁷
Bevilacqua MC, Banhara M, Costa E, Vignoly A, Alvarenga KF. The Brazilian Portuguese hearing in noise test. Int J Audiol. 2008;47(6):364-5.
¹⁸
Shafiro V, Sheft S, Risley R, Gygi B. Effects of age and hearing loss on the intelligibility of interrupted speech. J Acoust Soc Am. 2015;137(2):745-56.
¹⁹
Kidd GR, Humes LE. Effects of age and hearing loss on the recognition of interrupted words in isolation and in sentences. J Acoust Soc Am. 2012;131(2):1434-48.
²⁰
Gordon-Salant S, Fitzgibbons PJ. Recognition of multiply degraded speech by young and elderly listeners. J Speech Hear Res. 1995;38(5):1150-6.
²¹
Parra VM, Iório MCM, Mizahi MM, Baraldi GS. Testes de padrão de frequência e de duração em idosos com sensibilidade auditiva normal. Rev Bras Otorrinolaringol. 2004;70(4):517-23.
²²
Saija JD, Akyurek EG, Angringa TC, Baskente D. Perceptual restoration of degraded speech is preserved with advancing age. J Assoc Res Otolaryngol. 2014;15(1):139-48.
²³
Benard MR, Mensink JS, Baskent D. Individual differences in top-down restoration of interrupted speech: Links to linguistic and cognitive abilities. J Acoust Soc Am. 2014:135(2):88-94.
²⁴
Jin SH, Nelson PB. Interrupted speech perception: the effects of hearing sensitivity and frequency resolution. J Acoust Soc Am. 2010;128(2):881-9.
²⁵
Gary RK, Larry EH. Effects of age and hearing loss on the recognition of interrupted words in isolation and in sentences. J Acoust Soc Am. 2012;131(2):1434-48.
²⁶
Pichora-Fuller MK, Souza PE. Effects of aging on auditory processing of speech. Int J Audiol. 2003;42(Suppl 2):2S11.
²⁷
Advíncula KP, Menezes DC, Pacífico FA, Griz SMS. Effect of modulation rate on masking release for speech. Audiol., Commun. Res. 2013;18(4):238-44.

Datas de Publicação

Publicação nesta coleção
25 Jan 2021
Data do Fascículo
2021

Histórico

Recebido
26 Abr 2020
Aceito
02 Dez 2020

This is an open-access article distributed under the terms of the Creative Commons Attribution License

[1] ¹
Carhart R, Tillman TW, Greetis ES. Perceptual masking in multiple sound background. J Acoust Soc Am. 1969;45(3):694-703.

[2] ²
Caporali AS, Silva JA. Reconhecimento de fala no ruído em jovens e idosos com perda auditiva. Rev Bras Otorrinolaringol. 2004;70(4):525-32.

[3] ³
Humes LE, Christopherson L. Speech identification difficulties in hearing-impaired elderly persons: the contribution of auditory processing deficits. J Speech Hear Res. 1991;34(3):686-93.

[4] ⁴
Versfeld N, Dreschler W. The relationship between time-compressed speech and speech in noise in young and elderly listeners. J Acoust Soc Am. 2002;111(1):401-8.

[5] ⁵
Gordon-Salant S. Speech perception and auditory temporal processing performance by older listeners: implications for real-world communication. Seminars in Hearing. 2006;27(4):264-8.

[6] ⁶
Desloge JG, Reed CM, Braisa LD, Perez ZD, Delhorn LA. Speech reception by listeners with real and simulated impairment: effects of continuous and interrupted noise. J Acoust Soc Am. 2010;128(1):342-59.

[7] ⁷
Grose J, Mamo S. Processing of temporal fine structure as a function of age. Ear Hear. 2010;31(6):755-60.

[8] ⁸
Hall JW, Buss E, Grose JH, Roush PA. Effects of age and hearing impairment on the ability to benefit from temporal and spectral modulation. Ear Hear. 2012;33(3):340-4.

[9] ⁹
Shinn JB. Temporal processing: the basics. Hear J. 2003;56(7):52.

[10] ¹⁰
George EL, Zekveld AA, Kramer SE, Goverts ST, Festen JM, Houtgast T. Auditory and nonauditory factors affecting speech reception in noise by older listeners. J Acoust Soc Am. 2007;121(4):2362-75.

[11] ¹¹
Gifford RH, Bacon SP, Williams EJ. An examination of speech recognition in a modulated background and of forward masking in younger and older listeners. J Speech Lang Hear Res. 2007;50(4):857-64.

[12] ¹²
Grose JH, Mamo SK, Hall JW. Age effects in temporal envelope processing: speech unmasking and auditory steady-state responses. Ear Hear. 2009;30(5):568-75.

[13] ¹³
Wilson RH, McArdle R, Betancourt MB, Herring K, Lipton T, Chisolm TH. Word-recognition performance in interrupted noise by young listeners with normal hearing and older listeners with hearing loss. J Am Acad Audiol. 2010;21(2):90-109.

[14] ¹⁴
Grose JH, Porter HL, Buss E. Aging and spectro-temporal integration of speech. Trends Hear. 2016;20:1-11.

[15] ¹⁵
Grose JH, Mamo S. Electrophysiological measurement of binaural beats: effects of primary tone frequency and observer age. Ear Hear. 2012;32(2):187-94.

[16] ¹⁶
Calais LL, Lima-Gregio AM, Costa MJ, Gil D, Borges ACLC. Speech recognition by the elderly: test proposal concerning word predictability. Audiol., Commun. Res. 2016;21:1-9.

[17] ¹⁷
Bevilacqua MC, Banhara M, Costa E, Vignoly A, Alvarenga KF. The Brazilian Portuguese hearing in noise test. Int J Audiol. 2008;47(6):364-5.

[18] ¹⁸
Shafiro V, Sheft S, Risley R, Gygi B. Effects of age and hearing loss on the intelligibility of interrupted speech. J Acoust Soc Am. 2015;137(2):745-56.

[19] ¹⁹
Kidd GR, Humes LE. Effects of age and hearing loss on the recognition of interrupted words in isolation and in sentences. J Acoust Soc Am. 2012;131(2):1434-48.

[20] ²⁰
Gordon-Salant S, Fitzgibbons PJ. Recognition of multiply degraded speech by young and elderly listeners. J Speech Hear Res. 1995;38(5):1150-6.

[21] ²¹
Parra VM, Iório MCM, Mizahi MM, Baraldi GS. Testes de padrão de frequência e de duração em idosos com sensibilidade auditiva normal. Rev Bras Otorrinolaringol. 2004;70(4):517-23.

[22] ²²
Saija JD, Akyurek EG, Angringa TC, Baskente D. Perceptual restoration of degraded speech is preserved with advancing age. J Assoc Res Otolaryngol. 2014;15(1):139-48.

[23] ²³
Benard MR, Mensink JS, Baskent D. Individual differences in top-down restoration of interrupted speech: Links to linguistic and cognitive abilities. J Acoust Soc Am. 2014:135(2):88-94.

[24] ²⁴
Jin SH, Nelson PB. Interrupted speech perception: the effects of hearing sensitivity and frequency resolution. J Acoust Soc Am. 2010;128(2):881-9.

[25] ²⁵
Gary RK, Larry EH. Effects of age and hearing loss on the recognition of interrupted words in isolation and in sentences. J Acoust Soc Am. 2012;131(2):1434-48.

[26] ²⁶
Pichora-Fuller MK, Souza PE. Effects of aging on auditory processing of speech. Int J Audiol. 2003;42(Suppl 2):2S11.

[27] ²⁷
Advíncula KP, Menezes DC, Pacífico FA, Griz SMS. Effect of modulation rate on masking release for speech. Audiol., Commun. Res. 2013;18(4):238-44.

Faixa Etária	Taxa de Modulação (Hz)	Média ± DP	p-valor
Jovens (n=20)	4 Hz	73,98 ± 7,43	0,001*
	10 Hz	94,80 ± 3,27	0,013**
	64 Hz	99,69 ± 0,39	0,008**
Adultos (n=20)	4 Hz	69,54 ± 15,53	0,001*
	10 Hz	90,36 ± 17,31	0,013**
	64 Hz	98,98 ± 2,38	0,008**
Idosos (n=16)	4 Hz	55,92 ± 16,06 ^AB	0,001*
	10 Hz	88,72 ± 10,27 ^AB	0,013**
	64 Hz	98,61 ± 1,30 ^AB	0,008**

Faixa Etária	Taxa de Modulação (Hz)	Média ± DP	p-valor
Jovens (n=20)	4 Hz	73,98 ± 7,43	< 0,001
	10 Hz	94,80 ± 3,27	< 0,001
	64 Hz	99,69 ± 0,39	< 0,001
Adultos (n=20)	4 Hz	69,54 ± 15,53	< 0,001
	10 Hz	90,36 ± 17,31	< 0,001
	64 Hz	98,98 ± 2,38	< 0,001
Idosos (n=16)	4 Hz	55,92 ± 16,06 ^AB	< 0,001
	10 Hz	88,72 ± 10,27 ^AB	< 0,001
	64 Hz	98,61 ± 1,30 ^AB	< 0,001
Todos Participantes	4 Hz	67,24 ± 15,11	< 0,001
	10 Hz	91,48 ± 11,95 ^A	< 0,001
	64 Hz	99,13 ± 1,63 ^AB	< 0,001