Dissertação de Mestrado
Anotação Morfossintáctica Desambiguada do Português
Ricardo Ribeiro (Ribeiro, R.);
Ano (publicação definitiva)
2003
Língua
Português
País
Portugal
Mais Informação
Web of Science®

Esta publicação não está indexada na Web of Science®

Scopus

Esta publicação não está indexada na Scopus

Google Scholar

N.º de citações: 34

(Última verificação: 2024-12-01 08:52)

Ver o registo no Google Scholar

Abstract/Resumo
In this thesis we present the development of a part-of-speech tagging system for Portuguese. The main motivation for the development of the system was the intention of using it as a component of a text-to-speech synthesis system. The architecture of the tagger comprehends a morphological analysis module and a morphossyntactic disambiguation module. The importance of the morphological analysis module draws from the fact that neolatin languages, such as Portuguese, are highly inflectional, which results in the lack of the necessary examples to develop reliable language models – the data sparseness problem. The morphossyntactic disambiguation module combines two different approaches: linguistic-oriented rule-based disambiguation and probabilistic disambiguation. The system was trained and tested using the annotated PAROLE corpus. The results achieved show that the presented architecture is well suited for European Portuguese. Although it is difficult to do a fundamented comparison between this and other taggers addressing the Portuguese language – since, for example, the tagsets are different and the used corpora were not the same – this system seems to achieve a better performance. Additionally, it is important to stress the efforts made to ensure the modularity of the system, allowing an easy interchange of modules and simplicity of integration in other systems.
Agradecimentos/Acknowledgements
--
Palavras-chave
Natural language processing,Part-of-speech tagging,Morphossyntax,Corpus-based language modeling,Rule-based approach,Probabilistic approach
  • Ciências da Computação e da Informação - Ciências Naturais
  • Engenharia Eletrotécnica, Eletrónica e Informática - Engenharia e Tecnologia

Com o objetivo de aumentar a investigação direcionada para o cumprimento dos Objetivos do Desenvolvimento Sustentável para 2030 das Nações Unidas, é disponibilizada no Ciência-IUL a possibilidade de associação, quando aplicável, dos artigos científicos aos Objetivos do Desenvolvimento Sustentável. Estes são os Objetivos do Desenvolvimento Sustentável identificados pelo(s) autor(es) para esta publicação. Para uma informação detalhada dos Objetivos do Desenvolvimento Sustentável, clique aqui.