Comunicação em evento científico
Processamento de língua natural e os novos desafios no estudo da opinião pública
Jorge Louçã (Louçã, Jorge);
Título Evento
INCT 2024
Ano (publicação definitiva)
2024
Língua
Português
País
Brasil
Mais Informação
--
Web of Science®

Esta publicação não está indexada na Web of Science®

Scopus

Esta publicação não está indexada na Scopus

Google Scholar

Esta publicação não está indexada no Google Scholar

Esta publicação não está indexada no Overton

Abstract/Resumo
O grupo de investigação “The Observatorium”, fundado em 2008, é dedicado à recolha e análise de dados de comunicação textual a partir da Internet. Artigos de mais de cem jornais, de várias origens no Globo, são recolhidos de forma sistemática. Este corpo de dados tem sido utilizado para investigação, nomeadamente em ciência política, para monitorar a dinâmica da opinião pública e para entender a evolução das ideias na sociedade. O Observatorium desenvolveu ferramentas de software baseadas em Processamento de Língua Natural e na Teoria das Redes. Os últimos anos assistiram ao desenvolvimento rápido de novas ferramentas em Inteligência Artificial, que vieram criar novos desafios para o domínio de estudo do Observatorium. A Inteligência Artificial Generativa é baseada na ideia de que a partir do processamento de enormes quantidades de textos, sobretudo recolhidos da Internet, os modelos de IA podem responder a consultas de forma coerente, como se de um agente realmente inteligente se tratasse. Os novos modelos LLM – Large Language Models, em que o mais popular é neste momento o ChatGPT, tornaram-se acessíveis para todos. Estes modelos podem ainda ser enriquecidos com utilização de ferramentas de RAG – Retrieval-Augmented Generation, associadas às bases de dados vetoriais. Estas novas bases de dados permitem guardar e consultar embeddings (palavras, imagens e vídeos preparados para processamento nos novos sistemas de Inteligência Artificial). Nesta palestra apresentarei brevemente o Observatorium, abordarei com um pouco mais de detalhe o funcionamento, alcance e limites dos modelos LLM, e finalmente que soluções podemos ambicionar para os novos desafios abertos ao estudo da opinião pública. Nomeadamente serão sugeridas novas arquitecturas, suportadas por modelos de linguagem e por algoritmos de aprendizagem automática, permitindo detectar padrões na opinião pública e desta forma entender a evolução da sociedade.
Agradecimentos/Acknowledgements
--
Palavras-chave