Artigo em revista científica Q1
Automatic transcription system for parliamentary debates in the context of assembly of the republic of Portugal
Pedro Nascimento (Nascimento, P.); Joao C Ferreira or Joao Ferreira (Ferreira, J. C.); Fernando Batista (Batista, F.);
Título Revista
International Journal of Speech Technology
Ano (publicação definitiva)
2024
Língua
Inglês
País
Reino Unido
Mais Informação
Web of Science®

Esta publicação não está indexada na Web of Science®

Scopus

N.º de citações: 0

(Última verificação: 2024-12-22 19:47)

Ver o registo na Scopus

Google Scholar

N.º de citações: 0

(Última verificação: 2024-12-21 15:16)

Ver o registo no Google Scholar

Abstract/Resumo
The transcription of parliamentary proceedings is essential for democratic governance. Traditional methods are manual and time-consuming. This work introduces an Automatic Transcription System for the Assembly of the Republic of Portugal (STAAR) that uses an automatic speech recognition model and speaker diarization technologies. STAAR was developed after analyzing existing technologies and the Assembly’s specific needs, leading to an effective solution that integrates with current processes. STAAR stands out for its efficiency in transcribing debates and adapting to parliamentary language nuances. It significantly exceeded expectations by presenting a low transcription error rate, ranging from 1.7 to 11.3%, depending on the context and speech style, reducing the time required to produce the official parliamentary debates journal, and improving overall transcription efficiency. Additionally, STAAR enabled the transcription of previously undocumented parliamentary committee meetings, enhancing the documentation of parliamentary activities. This achievement marks a significant step in modernizing parliamentary processes, increasing transparency and accessibility of political information, and positions the Portuguese Parliament at the forefront of technological innovation in parliamentary debates transcription.
Agradecimentos/Acknowledgements
--
Palavras-chave
Automatic transcription,Parliamentary debates,Automatic speech recognition,Natural language processing,Machine learning,Large language model,Speaker diarization
  • Ciências da Computação e da Informação - Ciências Naturais
  • Línguas e Literaturas - Humanidades

Com o objetivo de aumentar a investigação direcionada para o cumprimento dos Objetivos do Desenvolvimento Sustentável para 2030 das Nações Unidas, é disponibilizada no Ciência-IUL a possibilidade de associação, quando aplicável, dos artigos científicos aos Objetivos do Desenvolvimento Sustentável. Estes são os Objetivos do Desenvolvimento Sustentável identificados pelo(s) autor(es) para esta publicação. Para uma informação detalhada dos Objetivos do Desenvolvimento Sustentável, clique aqui.