Speaker age estimation for elderly speech recognition in European Portuguese

Miguel Sales Dias; Thomas Pellegrini; Vahid Hedayati; Isabel Trancoso; Annika Hämäläinen

Ciência_Iscte Publicações Descrição Detalhada da Publicação

Publicação em atas de evento científico

Speaker age estimation for elderly speech recognition in European Portuguese

Miguel Sales Dias (Dias, J.); Thomas Pellegrini (Pellegrini, T); Vahid Hedayati (Hedayati, V.); Isabel Trancoso (Trancoso, I.); Annika Hämäläinen (Hämäläinen, A.);

15th Annual Conference of the International Speech Communication Association (INTERSPEECH 2014)

Ano (publicação definitiva)

2014

Língua

Inglês

País

França

Mais Informação

Web of Science®

Esta publicação não está indexada na Web of Science®

Scopus

N.º de citações: 8

(Última verificação: 2026-02-19 21:30)

Ver o registo na Scopus

Índice de Impacto do Artigo: 0.5

Ver Mais

Google Scholar

N.º de citações: 9

(Última verificação: 2026-02-26 00:27)

Ver o registo no Google Scholar

Overton

Esta publicação não está indexada no Overton

Abstract/Resumo

Phone-like acoustic models (AMs) used in large-vocabulary automatic speech recognition (ASR) systems are usually trained with speech collected from young adult speakers. Using such models, ASR performance may decrease by about 10% absolute when transcribing elderly speech. Ageing is known to alter speech production in ways that require ASR systems to be adapted, in particular at the level of acoustic modeling. In this study, we investigated automatic age estimation in order to select age-specific adapted AMs. A large corpus of read speech from European Portuguese speakers aged 60 or over was used. Age estimation (AE) based on i-vectors and support vector regression achieved mean error rates of about 4.2 and 4.5 years for males and females, respectively. Compared with a baseline ASR system with AMs trained using young adult speech and a WER of 13.9%, the selection of five-year-range adapted AMs, based on the estimated age of the speakers, led to a decrease in WER of about 9.3% relative (1.3% absolute). Comparable gains in ASR performance were observed when considering two larger age ranges (60-75 and 76-90) instead of six five-year ranges, suggesting that it would be sufficient to use the two large ranges only.

Agradecimentos/Acknowledgements

Palavras-chave

Automatic speech recognition,Elderly speech,Automatic age estimation,I-vector extraction

Classificação Fields of Science and Technology

Ciências da Computação e da Informação - Ciências Naturais
Engenharia Eletrotécnica, Eletrónica e Informática - Engenharia e Tecnologia
Línguas e Literaturas - Humanidades

Registos de financiamentos

Referência de financiamento	Entidade Financiadora
UID/MULTI/0446/2013	Fundação para a Ciência e a Tecnologia

Contribuições para os Objetivos do Desenvolvimento Sustentável das Nações Unidas

Com o objetivo de aumentar a investigação direcionada para o cumprimento dos Objetivos do Desenvolvimento Sustentável para 2030 das Nações Unidas, é disponibilizada no Ciência_Iscte a possibilidade de associação, quando aplicável, dos artigos científicos aos Objetivos do Desenvolvimento Sustentável. Estes são os Objetivos do Desenvolvimento Sustentável identificados pelo(s) autor(es) para esta publicação. Para uma informação detalhada dos Objetivos do Desenvolvimento Sustentável, clique aqui.

Identificadores da Publicação

ISSN (fonte: Externo)	1990-9770
Scopus (fonte: autor)	2-s2.0-84910028544
Scopus (fonte: Ciência_Iscte)	2-s2.0-84910028544
Handle (fonte: Ciência-IUL)	http://hdl.handle.net/10071/25451
Scopus (fonte: Externo)	2-s2.0-84910028544
Outro ID (fonte: Externo)	cv-prod-id-1809772
ID Ciência_Iscte	ci-pub-22986

Outros Detalhes da Publicação

Ano Publicação Online	2014
Editora	International Speech and Communication Association
Indexação	Scopus;
ISSN	2308-457X (print)
ISBN	9781634394352 (print)
Volume
Número Artigo
Páginas	--	Total Páginas	5
Avaliado Cientificamente	Sim
Meio de Divulgação	Ambos (impresso e digital)
Editores	Chng E.S. and Li H. and Meng H. and Ma B. and Xie L
Título do Evento	Celebrating the Diversity of Spoken Languages
Organizador do Evento	ISCA International Speech and Communication Association
Cidade	Singapura
Tipo de Evento	Conferência
Classificação do Evento	Internacional
Ano do Evento	2014
Tipo de Publicação no Evento	Artigo Completo
Repositório ISCTE-IUL	Link para o repositório
Data Publicação (online)	2014-01-01
Data Publicação (print)	2014-01-01

Altmetric

PlumX Metrics