Publicação em atas de evento científico
Transcribing and annotating speech corpora for speech recognition: A three-step crowdsourcing approach with quality control
Annika Hämäläinen (Hämäläinen, A.); Fernando Pinto Moreira (Moreira, F. P.); Jairo Avelar (Avelar, J.); Daniela Braga (Braga, D.); Miguel Sales Dias (Dias, M. S.);
Proceedings of the 1st AAAI Conference on Human Computation and Crowdsourcing, HCOMP 2013
Ano (publicação definitiva)
2013
Língua
Inglês
País
Estados Unidos da América
Mais Informação
Web of Science®

Esta publicação não está indexada na Web of Science®

Scopus

N.º de citações: 2

(Última verificação: 2024-12-15 00:16)

Ver o registo na Scopus

Google Scholar

N.º de citações: 4

(Última verificação: 2024-12-21 08:18)

Ver o registo no Google Scholar

Abstract/Resumo
Large speech corpora with word-level transcriptions annotated for noises and disfluent speech are necessary for training automatic speech recognisers. Crowdsourcing is a lower-cost, faster-turnaround, highly scalable alternative for expert transcription and annotation. In this paper, we showcase our three-step crowdsourcing approach motivated by the importance of accurate transcriptions and annotations.
Agradecimentos/Acknowledgements
--
Palavras-chave
Automatic speech recognition,Speech corpora,Transcription,Annotation,Crowdsourcing
  • Ciências da Computação e da Informação - Ciências Naturais
  • Engenharia Eletrotécnica, Eletrónica e Informática - Engenharia e Tecnologia
  • Línguas e Literaturas - Humanidades

Com o objetivo de aumentar a investigação direcionada para o cumprimento dos Objetivos do Desenvolvimento Sustentável para 2030 das Nações Unidas, é disponibilizada no Ciência-IUL a possibilidade de associação, quando aplicável, dos artigos científicos aos Objetivos do Desenvolvimento Sustentável. Estes são os Objetivos do Desenvolvimento Sustentável identificados pelo(s) autor(es) para esta publicação. Para uma informação detalhada dos Objetivos do Desenvolvimento Sustentável, clique aqui.