Ciência-IUL
Publicações
Descrição Detalhada da Publicação
Information Processing and Management of Uncertainty in Knowledge-Based Systems
Ano (publicação definitiva)
2020
Língua
Inglês
País
Portugal
Mais Informação
Web of Science®
Esta publicação não está indexada na Web of Science®
Scopus
Google Scholar
Abstract/Resumo
This paper describes an approach for automatic capitalization of text without case information, such as spoken transcripts of video subtitles, produced by automatic speech recognition systems. Our approach is based on pre-trained contextualized word embeddings, requires only a small portion of data for training when compared with traditional approaches, and is able to achieve state-of-the-art results. The paper reports experiments both on general written data from the European Parliament, and on video subtitles, revealing that the proposed approach is suitable for performing capitalization, not only in each one of the domains, but also in a cross-domain scenario. We have also created a versatile multilingual model, and the conducted experiments show that good results can be achieved both for monolingual and multilingual data. Finally, we applied domain adaptation by finetuning models, initially trained on general written data, on video subtitles, revealing gains over other approaches not only in performance but also in terms of computational cost.
Agradecimentos/Acknowledgements
supported by national funds through FCT, Fundação para a Ciência e a Tecnologia, under project UIDB/50021/2020 and by PT2020 funds, under the project “Unbabel Scribe: AI-Powered Video Transcription and Subtitle” with the contract number: 038510.
Palavras-chave
Classificação Fields of Science and Technology
- Outras Engenharias e Tecnologias - Engenharia e Tecnologia
- Engenharia Eletrotécnica, Eletrónica e Informática - Engenharia e Tecnologia
- Línguas e Literaturas - Humanidades
Registos de financiamentos
Referência de financiamento | Entidade Financiadora |
---|---|
UIDB/50021/2020 | FCT |
038510 | PT2020 |
Contribuições para os Objetivos do Desenvolvimento Sustentável das Nações Unidas
Com o objetivo de aumentar a investigação direcionada para o cumprimento dos Objetivos do Desenvolvimento Sustentável para 2030 das Nações Unidas, é disponibilizada no Ciência-IUL a possibilidade de associação, quando aplicável, dos artigos científicos aos Objetivos do Desenvolvimento Sustentável. Estes são os Objetivos do Desenvolvimento Sustentável identificados pelo(s) autor(es) para esta publicação. Para uma informação detalhada dos Objetivos do Desenvolvimento Sustentável, clique aqui.