A multimodal educational game for 3-10-year-old children: Collecting and automatically recognising European Portuguese children’s speech

Annika Hämäläinen; Fernando Miguel Pinto; Silvia Rodrigues; Ana Júdice; Sandra Morgado Silva; António Calado; Miguel Sales Dias

Ciência-IUL Publicações Descrição Detalhada da Publicação

Publicação em atas de evento científico

A multimodal educational game for 3-10-year-old children: Collecting and automatically recognising European Portuguese children’s speech

Annika Hämäläinen (Hämäläinen, A.); Fernando Miguel Pinto (Pinto, F. M.); Silvia Rodrigues (Rodrigues, S.); Ana Júdice (Júdice, A.); Sandra Morgado Silva (Silva, S. M.); António Calado (Calado, A.); Miguel Sales Dias (Dias, M. S.); et al.

2013 ISCA International Workshop on Speech and Language Technology in Education (SLaTE 2013)

Ano (publicação definitiva)

2013

Língua

Inglês

País

Estados Unidos da América

Mais Informação

Visitar Link

Web of Science®

Esta publicação não está indexada na Web of Science®

Scopus

N.º de citações: 7

(Última verificação: 2024-05-07 03:18)

Ver o registo na Scopus

Google Scholar

N.º de citações: 17

(Última verificação: 2024-05-04 13:54)

Ver o registo no Google Scholar

Abstract/Resumo

Speech interfaces have tremendous potential in education. In this paper, we present our work in the Contents for Next Generation Networks project, an ongoing Portuguese industry-academia collaboration developing a multimodal educational game aimed at improving the physical coordination and the basic mathematical and musical skills of 3-10- year-old children. We focus on our work in the area of children's speech recognition: designing, collecting, transcribing and annotating a 21-hour corpus of prompted European Portuguese children's speech, as well as our first experiments with different acoustic modelling approaches. Our speech recognition results suggest that training children's speech models from scratch is a more promising approach than retraining adult speech models using children's speech when a sufficient amount of training data is available from the targeted age group. This finding also holds for adult female speech models retrained using children's speech. As compared with a baseline recogniser comprising gender-dependent adult speech models, the best-performing children's speech models that we have trained so far – genderindependent cross-word triphones trained with 17.5 hours of speech from 3-10-year-old children – resulted in a 45-percent (relative) decrease in word error rate in a task expecting isolated cardinal numbers, sequences of cardinal numbers or musical notes as speech input

Agradecimentos/Acknowledgements

Palavras-chave

Acoustic modelling,ASR,Child-computer interaction,Corpus,Educational game,European Portuguese

Classificação Fields of Science and Technology

Ciências da Computação e da Informação - Ciências Naturais
Engenharia Eletrotécnica, Eletrónica e Informática - Engenharia e Tecnologia
Línguas e Literaturas - Humanidades

Registos de financiamentos

Referência de financiamento	Entidade Financiadora
QREN 7943 CNG	Comissão Europeia

Contribuições para os Objetivos do Desenvolvimento Sustentável das Nações Unidas

Com o objetivo de aumentar a investigação direcionada para o cumprimento dos Objetivos do Desenvolvimento Sustentável para 2030 das Nações Unidas, é disponibilizada no Ciência-IUL a possibilidade de associação, quando aplicável, dos artigos científicos aos Objetivos do Desenvolvimento Sustentável. Estes são os Objetivos do Desenvolvimento Sustentável identificados pelo(s) autor(es) para esta publicação. Para uma informação detalhada dos Objetivos do Desenvolvimento Sustentável, clique aqui.

Identificadores da Publicação

Scopus (fonte: autor)	2-s2.0-85035074210
Scopus (fonte: Ciência-IUL)	2-s2.0-85035074210
Handle (fonte: Ciência-IUL)	http://hdl.handle.net/10071/29215
ID Ciência-IUL	ci-pub-96466

Outros Detalhes da Publicação

Ano Publicação Online	2013
Editora	The International Society for Computers and Their Applications (ISCA)
Indexação	Scopus; ERIH; IBSS; Scielo;
ISSN	2311-4975 (online)
ISBN	--
Volume
Número Artigo
Páginas	31 - 36	Total Páginas	6
Avaliado Cientificamente	Sim
Meio de Divulgação	Digital
Editores	Badin, P., Hueber, T., Bailly, G., Demolin, D., and Raby, F.
Título do Evento	2013 ISCA International Workshop on Speech and Language Technology in Education (SLaTE 2013)
Organizador do Evento	GIPSA-lab and LIDILEM with the ISCA-SLaTE group
Cidade	Grenoble, France
Tipo de Evento	Workshop
Classificação do Evento	Internacional
Ano do Evento	2013
Tipo de Publicação no Evento	Artigo Completo
Repositório ISCTE-IUL	Link para o repositório
Data Publicação (online)
Data Publicação (print)

Altmetric

PlumX Metrics