Artigo em revista científica Q1
Enriching Portuguese medieval texts with named entity recognition
Maria Inês Bico (Bico, M. I.); Jorge Baptista (Baptista, J.); Fernando Batista (Batista, F.); Esperança Cardeira (Cardeira, E.);
Título Revista
International Journal of Humanities and Arts Computing
Ano (publicação definitiva)
2024
Língua
Inglês
País
Reino Unido
Mais Informação
Web of Science®

N.º de citações: 0

(Última verificação: 2024-11-20 23:37)

Ver o registo na Web of Science®

Scopus

N.º de citações: 0

(Última verificação: 2024-11-18 17:15)

Ver o registo na Scopus

Google Scholar

N.º de citações: 0

(Última verificação: 2024-11-22 02:46)

Ver o registo no Google Scholar

Abstract/Resumo
Historical data poses unique challenges to natural language processing (NLP) and information retrieval (IR) tools, including digitization errors, lack of annotated data, and diachronic-specific issues. However, the increasing recognition of the value in historical documents has promoted efforts to semantically enrich and optimize their analysis. This article contributes to this endeavour by enriching the Corpus de Textos Antigos through NLP tools and techniques to enhance its usability and support research. The corpus undergoes linguistic annotation, including part-of-speech tagging, lemma annotation and named entity recognition (NER). Subsequently, the article delves into the tasks of entity disambiguation and entity linking, which involve identifying and disambiguating named entities by referring to a knowledge base (KB). Addressing the challenges posed by factors such as text state, epoch and the chosen KB, the article presents insights into related work, annotation results and the linguistic interest of a medieval annotated corpus for named entities. It concludes by discussing the challenges and providing avenues for future research in this domain.
Agradecimentos/Acknowledgements
--
Palavras-chave
Corpus analysis,Named entity disambiguation,Named entity linking,Natural language processing,Information retrieval,Portuguese medieval texts
  • Línguas e Literaturas - Humanidades

Com o objetivo de aumentar a investigação direcionada para o cumprimento dos Objetivos do Desenvolvimento Sustentável para 2030 das Nações Unidas, é disponibilizada no Ciência-IUL a possibilidade de associação, quando aplicável, dos artigos científicos aos Objetivos do Desenvolvimento Sustentável. Estes são os Objetivos do Desenvolvimento Sustentável identificados pelo(s) autor(es) para esta publicação. Para uma informação detalhada dos Objetivos do Desenvolvimento Sustentável, clique aqui.