Ciência_Iscte
Publicações
Descrição Detalhada da Publicação
Workshop on Discontinuous Structures in Natural Language Processing (DiscoNLP 2016)
Ano (publicação definitiva)
2016
Língua
Inglês
País
Estados Unidos da América
Mais Informação
Web of Science®
Esta publicação não está indexada na Web of Science®
Scopus
Esta publicação não está indexada na Scopus
Google Scholar
Esta publicação não está indexada no Overton
Abstract/Resumo
Non-adjacent linguistic phenomena such as non-contiguous multiwords and other phrasal units containing insertions, i.e., words that are not part of the unit, are difficult to process and remain a problem for NLP applications. Non-contiguous multiword units are common across languages and constitute some of the most important challenges to high quality machine translation. This paper presents an empirical analysis of non-contiguous multiwords, and highlights our use of the Logos Model and the Semtab function to deploy semantic knowledge to align non-contiguous multiword units with the goal to translate these units with high fidelity. The phrase level manual alignments illustrated in the paper were produced with the CLUE-Aligner, a Cross-Language Unit Elicitation alignment tool.
Agradecimentos/Acknowledgements
--
Palavras-chave
Registos de financiamentos
| Referência de financiamento | Entidade Financiadora |
|---|---|
| UID/CEC/50021/2013 | Fundação para a Ciência e Tecnologia |
| SFRH/BPD/91446/2012 | Fundação para a Ciência e Tecnologia |
| EXPL/MHC-LIN/2260/2013 | project eSPERTo |
English