Publicação em atas de evento científico
Early Detection of At-Risk University Students Using Machine Learning: a Study of Model Performance in Evolving Academic Environments
David Rodrigues (Rodrigues, D.); António Luís Lopes (Lopes, A. L.); Rosário Mauritti (Mauritti, R); Mariana Roque Ferreira (Roque Ferreira, M.); Sónia Pintassilgo (Pintassilgo, S.);
EDULEARN 2025
Ano (publicação definitiva)
2025
Língua
Inglês
País
Espanha
Mais Informação
Web of Science®

Esta publicação não está indexada na Web of Science®

Scopus

Esta publicação não está indexada na Scopus

Google Scholar

N.º de citações: 0

(Última verificação: 2025-12-04 23:43)

Ver o registo no Google Scholar

Esta publicação não está indexada no Overton

Abstract/Resumo
This study explores the early detection of at-risk students using machine learning (ML) models trained on historical academic data. We constructed two datasets from university enrollment records spanning the 2016/2017 to 2022/2023 academic years, focusing on first-time enrollees in their first curricular year. The first dataset included only pre-enrollment information available at the start of the academic year, while the second incorporated first-semester performance data. Each dataset was used to predict two target outcomes: academic success and dropout. We evaluated multiple ML models, including Random Forest, Support Vector Machine (SVM), Naïve Bayes, Decision Tree, AdaBoost, K-Nearest Neighbors (KNN), and Logistic Regression. To optimize model performance, we employed Optuna for hyperparameter tuning, conducting hundreds of trials per algorithm. The best-performing models were tested on two datasets: one from historical student data (2016/2017–2022/2023) and another from the 2023/2024 academic year, reflecting a real-world shift due to a newly implemented university intervention strategy aimed at providing personalized support for at-risk students. Although the intervention itself was not included as a model variable, it may have influenced student success and dropout rates in 2023/2024, potentially impacting model predictions. By comparing performance on pre- and post-intervention data, this study assesses the robustness and generalizability of ML-based early warning systems in dynamically evolving academic environments.
Agradecimentos/Acknowledgements
--
Palavras-chave
Machine Learning,Early Warning Systems,Student Dropout Prediction,Academic Performance Analysis,Intervention Impact.
  • Ciências da Computação e da Informação - Ciências Naturais
  • Ciências da Educação - Ciências Sociais

Com o objetivo de aumentar a investigação direcionada para o cumprimento dos Objetivos do Desenvolvimento Sustentável para 2030 das Nações Unidas, é disponibilizada no Ciência_Iscte a possibilidade de associação, quando aplicável, dos artigos científicos aos Objetivos do Desenvolvimento Sustentável. Estes são os Objetivos do Desenvolvimento Sustentável identificados pelo(s) autor(es) para esta publicação. Para uma informação detalhada dos Objetivos do Desenvolvimento Sustentável, clique aqui.