Exportar Publicação

A publicação pode ser exportada nos seguintes formatos: referência da APA (American Psychological Association), referência do IEEE (Institute of Electrical and Electronics Engineers), BibTeX e RIS.

Exportar Referência (APA)
Ribeiro, E., Mamede, N. & Baptista, J. (2024). Avaliação automática do nível de complexidade de textos em Português Europeu. Linguamática. 16 (2), 121-145
Exportar Referência (IEEE)
E. A. Ribeiro et al.,  "Avaliação automática do nível de complexidade de textos em Português Europeu", in Linguamática, vol. 16, no. 2, pp. 121-145, 2024
Exportar BibTeX
@article{ribeiro2024_1782143956674,
	author = "Ribeiro, E. and Mamede, N. and Baptista, J.",
	title = "Avaliação automática do nível de complexidade de textos em Português Europeu",
	journal = "Linguamática",
	year = "2024",
	volume = "16",
	number = "2",
	doi = "10.21814/lm.16.2.449",
	pages = "121-145",
	url = "https://linguamatica.com/index.php/linguamatica/about"
}
Exportar RIS
TY  - JOUR
TI  - Avaliação automática do nível de complexidade de textos em Português Europeu
T2  - Linguamática
VL  - 16
IS  - 2
AU  - Ribeiro, E.
AU  - Mamede, N.
AU  - Baptista, J.
PY  - 2024
SP  - 121-145
SN  - 1647-0818
DO  - 10.21814/lm.16.2.449
UR  - https://linguamatica.com/index.php/linguamatica/about
AB  - A avaliação da inteligibilidade de textos e a sua classificação por níveis de complexidade é essencial para o ensino de língua e para indústrias relacionadas com a linguagem que dependem de uma comunicação eficaz. O Quadro Europeu Comum de Referência para as Línguas (CEFR) é uma referência amplamente reconhecida para a classificação dos níveis de proficiência linguística. Este quadro pode ser utilizado não apenas para avaliar a proficiência de aprendentes de uma língua, mas também, de uma perspetiva de inteligibilidade, como um meio de identificar a proficiência necessária para compreender um texto. O objetivo deste estudo é desenvolver e avaliar modelos automáticos capazes de classificar textos em português europeu de acordo com os níveis de complexidade definidos pelo CEFR. Para tal, exploramos o ajuste de vários modelos de base pré-treinados em dados textuais utilizados para fins de avaliação de proficiência e exploramos abordagens que tiram partido da natureza ordinal dos níveis. Realizamos ainda uma análise preliminar da capacidade de base que modelos baseados em instruções têm para desempenhar esta tarefa. Nas experiências, os melhores modelos conseguem atingir mais de 80% de taxa de acerto e 75% de medida F1 mas têm dificuldade em generalizar para diferentes tipos de texto, o que revela a necessidade de dados de treino adicionais e mais diversificados.
ER  -