The EASR corpora of European Portuguese, French, hungarian and polish elderly speech

Annika Hämäläinen; Jairo Avelar; Silvia Rodrigues; Miguel Sales Dias; Artur Kolesiski; Tibor Fegyó; Géza Németh; Petra Csobánka; Karine Lan Hing Ting; David Hewson

Ciência_Iscte Publicações Descrição Detalhada da Publicação

Publicação em atas de evento científico

The EASR corpora of European Portuguese, French, hungarian and polish elderly speech

Annika Hämäläinen (Hämäläinen, A.); Jairo Avelar (Avelar, J.); Silvia Rodrigues (Rodrigues, S.); Miguel Sales Dias (Dias, J.); Artur Kolesiski (Kolesinski, A.); Tibor Fegyó (Fegyó, T.); Géza Németh (Németh, G.); Petra Csobánka (Csobánka, P.); Karine Lan Hing Ting (Ting, K. L. H.); David Hewson (Hewson, D.); et al.

Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC 2014)

Ano (publicação definitiva)

2014

Língua

Inglês

País

França

Mais Informação

Visitar Link

Web of Science®

N.º de citações: 6

(Última verificação: 2026-06-09 15:50)

Ver o registo na Web of Science®

Scopus

N.º de citações: 10

(Última verificação: 2026-06-09 20:12)

Ver o registo na Scopus

Google Scholar

N.º de citações: 1

(Última verificação: 2026-06-02 16:06)

Ver o registo no Google Scholar

Overton

Esta publicação não está indexada no Overton

Abstract/Resumo

Currently available speech recognisers do not usually work well with elderly speech. This is because several characteristics of speech (e.g. fundamental frequency, jitter, shimmer and harmonic noise ratio) change with age and because the acoustic models used by speech recognisers are typically trained with speech collected from younger adults only. To develop speech-driven applications capable of successfully recognising elderly speech, this type of speech data is needed for training acoustic models from scratch or for adapting acoustic models trained with younger adults’ speech. However, the availability of suitable elderly speech corpora is still very limited. This paper describes an ongoing project to design, collect, transcribe and annotate large elderly speech corpora for four European languages: Portuguese, French, Hungarian and Polish. The Portuguese, French and Polish corpora contain read speech only, whereas the Hungarian corpus also contains spontaneous command and control type of speech. Depending on the language in question, the corpora contain 76 to 205 hours of speech collected from 328 to 986 speakers aged 60 and over. The final corpora will come with manually verified orthographic transcriptions, as well as annotations for filled pauses, noises and damaged words.

Agradecimentos/Acknowledgements

Palavras-chave

Automatic speech recognition,Corpus,Elderly speech

Classificação Fields of Science and Technology

Ciências da Computação e da Informação - Ciências Naturais
Engenharia Eletrotécnica, Eletrónica e Informática - Engenharia e Tecnologia
Línguas e Literaturas - Humanidades

Registos de financiamentos

Referência de financiamento	Entidade Financiadora
AAL2009-2-068	Fundação para a Ciência e a Tecnologia

Contribuições para os Objetivos do Desenvolvimento Sustentável das Nações Unidas

Com o objetivo de aumentar a investigação direcionada para o cumprimento dos Objetivos do Desenvolvimento Sustentável para 2030 das Nações Unidas, é disponibilizada no Ciência_Iscte a possibilidade de associação, quando aplicável, dos artigos científicos aos Objetivos do Desenvolvimento Sustentável. Estes são os Objetivos do Desenvolvimento Sustentável identificados pelo(s) autor(es) para esta publicação. Para uma informação detalhada dos Objetivos do Desenvolvimento Sustentável, clique aqui.

Identificadores da Publicação

WoS (fonte: Ciência_Iscte)	WOS:000355611003011
Scopus (fonte: autor)	2-s2.0-84977583701
ISBN (fonte: Externo)	978-2-9517408-8-4
Scopus (fonte: Ciência_Iscte)	2-s2.0-84977583701
WoS (fonte: Externo)	000355611003011
Handle (fonte: Ciência-IUL)	http://hdl.handle.net/10071/25544
Scopus (fonte: Externo)	2-s2.0-84977583701
WoS (fonte: autor)	WOS:000355611003011
Outro ID (fonte: Externo)	cv-prod-id-1809861
ID Ciência_Iscte	ci-pub-96270

Outros Detalhes da Publicação

Ano Publicação Online	2014
Editora	European Language Resources Association (ELRA)
Indexação	Web of Science©; Scopus; ERIH; IBSS; Scielo;
ISSN	--
ISBN	978-2-9517408-8-4 (print) 978-2-9517408-8-4 (online)
Volume
Número Artigo
Páginas	1458 - 1464	Total Páginas	7
Avaliado Cientificamente	Sim
Meio de Divulgação	Ambos (impresso e digital)
Editores	Nicoletta Calzolari, Khalid Choukri, Thierry Declerck, Hrafn Loftsson, Bente Maegaard, Joseph Mariani, Asuncion Moreno, Jan Odijk, Stelios Piperidis
Título do Evento	9th International Conference on Language Resources and Evaluation, LREC 2014
Organizador do Evento	European Language Resources Association (ELRA)
Cidade	Reykjavik
Tipo de Evento	Conferência
Classificação do Evento	Internacional
Ano do Evento	2014
Tipo de Publicação no Evento	Artigo Completo
Repositório ISCTE-IUL	Link para o repositório
Data Publicação (online)
Data Publicação (print)

Altmetric

PlumX Metrics