Transcribing and annotating speech corpora for speech recognition: A three-step crowdsourcing approach with quality control

Annika Hämäläinen; Fernando Pinto Moreira; Jairo Avelar; Daniela Braga; Miguel Sales Dias

Ciência_Iscte Publicações Descrição Detalhada da Publicação

Publicação em atas de evento científico

Transcribing and annotating speech corpora for speech recognition: A three-step crowdsourcing approach with quality control

Annika Hämäläinen (Hämäläinen, A.); Fernando Pinto Moreira (Moreira, F. P.); Jairo Avelar (Avelar, J.); Daniela Braga (Braga, D.); Miguel Sales Dias (Dias, M. S.);

Proceedings of the 1st AAAI Conference on Human Computation and Crowdsourcing, HCOMP 2013

Ano (publicação definitiva)

2013

Língua

Inglês

País

Estados Unidos da América

Mais Informação

Visitar Link

Web of Science®

Esta publicação não está indexada na Web of Science®

Scopus

N.º de citações: 2

(Última verificação: 2026-07-08 13:14)

Ver o registo na Scopus

Google Scholar

N.º de citações: 6

(Última verificação: 2026-07-21 09:37)

Ver o registo no Google Scholar

Overton

Esta publicação não está indexada no Overton

Abstract/Resumo

Large speech corpora with word-level transcriptions annotated for noises and disfluent speech are necessary for training automatic speech recognisers. Crowdsourcing is a lower-cost, faster-turnaround, highly scalable alternative for expert transcription and annotation. In this paper, we showcase our three-step crowdsourcing approach motivated by the importance of accurate transcriptions and annotations.

Agradecimentos/Acknowledgements

Palavras-chave

Automatic speech recognition,Speech corpora,Transcription,Annotation,Crowdsourcing

Classificação Fields of Science and Technology

Ciências da Computação e da Informação - Ciências Naturais
Engenharia Eletrotécnica, Eletrónica e Informática - Engenharia e Tecnologia
Línguas e Literaturas - Humanidades

Contribuições para os Objetivos do Desenvolvimento Sustentável das Nações Unidas

Com o objetivo de aumentar a investigação direcionada para o cumprimento dos Objetivos do Desenvolvimento Sustentável para 2030 das Nações Unidas, é disponibilizada no Ciência_Iscte a possibilidade de associação, quando aplicável, dos artigos científicos aos Objetivos do Desenvolvimento Sustentável. Estes são os Objetivos do Desenvolvimento Sustentável identificados pelo(s) autor(es) para esta publicação. Para uma informação detalhada dos Objetivos do Desenvolvimento Sustentável, clique aqui.

Identificadores da Publicação

Scopus (fonte: autor)	2-s2.0-84899503030
DOI (fonte: autor)	10.1609/hcomp.v1i1.13102
Scopus (fonte: Ciência_Iscte)	2-s2.0-84899503030
Handle (fonte: Ciência-IUL)	http://hdl.handle.net/10071/27869
ID Ciência_Iscte	ci-pub-16895

Outros Detalhes da Publicação

Ano Publicação Online	2013
Editora	AAAI Press
Indexação	Scopus;
ISSN	--
ISBN	978-1-57735-607-3 (print)
Volume	WS-13-18
Número Artigo
Páginas	30 - 31	Total Páginas	2
Avaliado Cientificamente	Sim
Meio de Divulgação	Ambos (impresso e digital)
Editores	Hartmann, B., and Horvitz, E.
Título do Evento	1st AAAI Conference on Human Computation and Crowdsourcing, HCOMP 2013
Organizador do Evento	Association for the Advancement of Artificial Intelligence
Cidade	Palm Springs, California, USA
Tipo de Evento	Conferência
Classificação do Evento	Internacional
Ano do Evento	2013
Tipo de Publicação no Evento	Resumo Alargado
Repositório ISCTE-IUL	Link para o repositório
Data Publicação (online)
Data Publicação (print)

Altmetric

Dimensions

PlumX Metrics