Artigo em revista científica Q1
SA-MAIS: Hybrid automatic sentiment analyser for stock market
Bruno Taborda (Taborda, B.); Ana de Almeida (de Almeida, A.); José Carlos Dias (Dias, J. C.); Fernando Batista (Batista, F.); Ricardo Ribeiro (Ribeiro, R.);
Título Revista
Journal of Information Science
Ano (publicação definitiva)
N/A
Língua
Inglês
País
Reino Unido
Mais Informação
Web of Science®

N.º de citações: 0

(Última verificação: 2024-04-27 09:18)

Ver o registo na Web of Science®

Scopus

N.º de citações: 0

(Última verificação: 2024-04-25 10:37)

Ver o registo na Scopus

Google Scholar

N.º de citações: 0

(Última verificação: 2024-04-26 17:31)

Ver o registo no Google Scholar

Abstract/Resumo
Sentiment analysis of stock-related tweets is a challenging task, not only due to the specificity of the domain but also because of the short nature of the texts. This work proposes SA-MAIS, a two-step lightweight methodology, specially adapted to perform sentiment analysis in domain-constrained short-text messages. To tackle the issue of domain specificity, based on word frequency, the most relevant words are automatically extracted from the new domain and then manually tagged to update an existing domain-specific sentiment lexicon. The sentiment classification is then performed by combining the updated domain-specific lexicon with VADER sentiment analysis, a well-known and widely used sentiment analysis tool. The proposed method is compared with other well-known and widely used sentiment analysis tools, including transformer-based models, such as BERTweet, Twitter-roBERTa and FinBERT, on a domain-specific corpus of stock market-related tweets comprising 1 million messages. The experimental results show that the proposed approach largely surpasses the performance of the other sentiment analysis tools, reaching an overall accuracy of 72.0%. The achieved results highlight the advantage of using a hybrid method that combines domain-specific lexicons with existing generalist tools for the inference of textual sentiment in domain-specific short-text messages.
Agradecimentos/Acknowledgements
This work was partially supported by national funds through Fundação para a Ciência e a Tecnologia (FCT) with references UIDB/50021/2020 and UIDB/00315/2020
Palavras-chave
Sentiment analysis,Sentiment classification,Sentiment lexicon,Stock market,Tweets
  • Ciências da Computação e da Informação - Ciências Naturais
  • Ciências da Comunicação - Ciências Sociais
  • Outras Ciências Sociais - Ciências Sociais
Registos de financiamentos
Referência de financiamento Entidade Financiadora
UIDB/50021/2020 Fundação para a Ciência e a Tecnologia
UIDB/00315/2020 Fundação para a Ciência e a Tecnologia

Com o objetivo de aumentar a investigação direcionada para o cumprimento dos Objetivos do Desenvolvimento Sustentável para 2030 das Nações Unidas, é disponibilizada no Ciência-IUL a possibilidade de associação, quando aplicável, dos artigos científicos aos Objetivos do Desenvolvimento Sustentável. Estes são os Objetivos do Desenvolvimento Sustentável identificados pelo(s) autor(es) para esta publicação. Para uma informação detalhada dos Objetivos do Desenvolvimento Sustentável, clique aqui.