Publicação em atas de evento científico
Speaker age estimation for elderly speech recognition in European Portuguese
Miguel Sales Dias (Dias, J.); Thomas Pellegrini (Pellegrini, T); Vahid Hedayati (Hedayati, V.); Isabel Trancoso (Trancoso, I.); Annika Hämäläinen (Hämäläinen, A.);
15th Annual Conference of the International Speech Communication Association (INTERSPEECH 2014)
Ano (publicação definitiva)
2014
Língua
Inglês
País
França
Mais Informação
--
Web of Science®

Esta publicação não está indexada na Web of Science®

Scopus

N.º de citações: 8

(Última verificação: 2024-11-15 01:16)

Ver o registo na Scopus


: 0.5
Google Scholar

N.º de citações: 9

(Última verificação: 2024-11-17 09:28)

Ver o registo no Google Scholar

Abstract/Resumo
Phone-like acoustic models (AMs) used in large-vocabulary automatic speech recognition (ASR) systems are usually trained with speech collected from young adult speakers. Using such models, ASR performance may decrease by about 10% absolute when transcribing elderly speech. Ageing is known to alter speech production in ways that require ASR systems to be adapted, in particular at the level of acoustic modeling. In this study, we investigated automatic age estimation in order to select age-specific adapted AMs. A large corpus of read speech from European Portuguese speakers aged 60 or over was used. Age estimation (AE) based on i-vectors and support vector regression achieved mean error rates of about 4.2 and 4.5 years for males and females, respectively. Compared with a baseline ASR system with AMs trained using young adult speech and a WER of 13.9%, the selection of five-year-range adapted AMs, based on the estimated age of the speakers, led to a decrease in WER of about 9.3% relative (1.3% absolute). Comparable gains in ASR performance were observed when considering two larger age ranges (60-75 and 76-90) instead of six five-year ranges, suggesting that it would be sufficient to use the two large ranges only.
Agradecimentos/Acknowledgements
--
Palavras-chave
Automatic speech recognition,Elderly speech,Automatic age estimation,I-vector extraction
  • Ciências da Computação e da Informação - Ciências Naturais
  • Engenharia Eletrotécnica, Eletrónica e Informática - Engenharia e Tecnologia
  • Línguas e Literaturas - Humanidades
Registos de financiamentos
Referência de financiamento Entidade Financiadora
UID/MULTI/0446/2013 Fundação para a Ciência e a Tecnologia

Com o objetivo de aumentar a investigação direcionada para o cumprimento dos Objetivos do Desenvolvimento Sustentável para 2030 das Nações Unidas, é disponibilizada no Ciência-IUL a possibilidade de associação, quando aplicável, dos artigos científicos aos Objetivos do Desenvolvimento Sustentável. Estes são os Objetivos do Desenvolvimento Sustentável identificados pelo(s) autor(es) para esta publicação. Para uma informação detalhada dos Objetivos do Desenvolvimento Sustentável, clique aqui.