Processamento de língua natural e os novos desafios no estudo da opinião pública

Jorge Louçã

Ciência_Iscte Comunicações Descrição Detalhada da Comunicação

Comunicação em evento científico

Processamento de língua natural e os novos desafios no estudo da opinião pública

Jorge Louçã (Louçã, Jorge);

Título Evento

INCT 2024

Ano (publicação definitiva)

2024

Língua

Português

País

Brasil

Mais Informação

Web of Science®

Esta publicação não está indexada na Web of Science®

Scopus

Esta publicação não está indexada na Scopus

Google Scholar

Esta publicação não está indexada no Google Scholar

Overton

Esta publicação não está indexada no Overton

Abstract/Resumo

O grupo de investigação “The Observatorium”, fundado em 2008, é dedicado à recolha e análise de dados de comunicação textual a partir da Internet. Artigos de mais de cem jornais, de várias origens no Globo, são recolhidos de forma sistemática. Este corpo de dados tem sido utilizado para investigação, nomeadamente em ciência política, para monitorar a dinâmica da opinião pública e para entender a evolução das ideias na sociedade. O Observatorium desenvolveu ferramentas de software baseadas em Processamento de Língua Natural e na Teoria das Redes. Os últimos anos assistiram ao desenvolvimento rápido de novas ferramentas em Inteligência Artificial, que vieram criar novos desafios para o domínio de estudo do Observatorium. A Inteligência Artificial Generativa é baseada na ideia de que a partir do processamento de enormes quantidades de textos, sobretudo recolhidos da Internet, os modelos de IA podem responder a consultas de forma coerente, como se de um agente realmente inteligente se tratasse. Os novos modelos LLM – Large Language Models, em que o mais popular é neste momento o ChatGPT, tornaram-se acessíveis para todos. Estes modelos podem ainda ser enriquecidos com utilização de ferramentas de RAG – Retrieval-Augmented Generation, associadas às bases de dados vetoriais. Estas novas bases de dados permitem guardar e consultar embeddings (palavras, imagens e vídeos preparados para processamento nos novos sistemas de Inteligência Artificial). Nesta palestra apresentarei brevemente o Observatorium, abordarei com um pouco mais de detalhe o funcionamento, alcance e limites dos modelos LLM, e finalmente que soluções podemos ambicionar para os novos desafios abertos ao estudo da opinião pública. Nomeadamente serão sugeridas novas arquitecturas, suportadas por modelos de linguagem e por algoritmos de aprendizagem automática, permitindo detectar padrões na opinião pública e desta forma entender a evolução da sociedade.

Agradecimentos/Acknowledgements

Palavras-chave

Identificadores da Publicação

ID Ciência_Iscte

ci-pub-115153

Outros Detalhes da Publicação

Avaliado Cientificamente	Sim
Meio de Divulgação	Outro
Cidade	São Paulo
Tipo de Evento	Outro
Classificação do Evento	Internacional
Tipo de Apresentação no Evento	Keynote Speaker
Data Publicação (online)
Data Publicação (print)