Artigo em revista científica Q2
Deobfuscating leetspeak with deep learning to improve spam filtering
Iñaki Velez de Mendizabal (Mendizabal, I. V.); Xabier Vidriales (Vidriales, X.); Vitor Basto-Fernandes (Basto-Fernandes, V.); Enaitz Ezpeleta (Ezpeleta, E.); José Ramón Méndez (Méndez, J. R.); Urko Zurutuza (Zurutuza, U.);
Título Revista
International Journal of Interactive Multimedia and Artificial Intelligence
Ano (publicação definitiva)
2023
Língua
Inglês
País
Espanha
Mais Informação
Web of Science®

N.º de citações: 0

(Última verificação: 2024-04-27 13:58)

Ver o registo na Web of Science®

Scopus

N.º de citações: 0

(Última verificação: 2024-04-20 19:38)

Ver o registo na Scopus

Google Scholar

N.º de citações: 0

(Última verificação: 2024-04-27 07:37)

Ver o registo no Google Scholar

Abstract/Resumo
The evolution of anti-spam filters has forced spammers to make greater efforts to bypass filters in order to distribute content over networks. The distribution of content encoded in images or the use of Leetspeak are concrete and clear examples of techniques currently used to bypass filters. Despite the importance of dealing with these problems, the number of studies to solve them is quite small, and the reported performance is very limited. This study reviews the work done so far (very rudimentary) for Leetspeak deobfuscation and proposes a new technique based on using neural networks for decoding purposes. In addition, we distribute an image database specifically created for training Leetspeak decoding models. We have also created and made available four different corpora to analyse the performance of Leetspeak decoding schemes. Using these corpora, we have experimentally evaluated our neural network approach for decoding Leetspeak. The results obtained have shown the usefulness of the proposed model for addressing the deobfuscation of Leetspeak character sequences. © 2023, Universidad Internacional de la Rioja.
Agradecimentos/Acknowledgements
--
Palavras-chave
Convolutional neural networks,Deep learning,Leetspeak,Spam filtering,Text deobfuscation
  • Ciências da Computação e da Informação - Ciências Naturais
  • Engenharia Eletrotécnica, Eletrónica e Informática - Engenharia e Tecnologia
Registos de financiamentos
Referência de financiamento Entidade Financiadora
TIN2017-84658-C2-1-R Universities and Research of the Basque Country
UIDP/04466/2020 Fundação para a Ciência e a Tecnologia
UIDB/04466/2020 Fundação para a Ciência e a Tecnologia
TIN2017-84658-C2-2-R Universities and Research of the Basque Country
Projetos Relacionados

Esta publicação é um output do(s) seguinte(s) projeto(s):

Com o objetivo de aumentar a investigação direcionada para o cumprimento dos Objetivos do Desenvolvimento Sustentável para 2030 das Nações Unidas, é disponibilizada no Ciência-IUL a possibilidade de associação, quando aplicável, dos artigos científicos aos Objetivos do Desenvolvimento Sustentável. Estes são os Objetivos do Desenvolvimento Sustentável identificados pelo(s) autor(es) para esta publicação. Para uma informação detalhada dos Objetivos do Desenvolvimento Sustentável, clique aqui.