Ciência_Iscte Comunicações Descrição Detalhada da Comunicação Exportar

Exportar Publicação

A publicação pode ser exportada nos seguintes formatos: referência da APA (American Psychological Association), referência do IEEE (Institute of Electrical and Electronics Engineers), BibTeX e RIS.

Exportar Referência (APA)

Louçã, Jorge (2024). Processamento de língua natural e os novos desafios no estudo da opinião pública . INCT 2024.

Exportar Referência (IEEE)

J. M. Louçã,  "Processamento de língua natural e os novos desafios no estudo da opinião pública ", in INCT 2024, São Paulo, 2024

Exportar BibTeX

@misc{louçã2024_1776126085309,
	author = "Louçã, Jorge",
	title = "Processamento de língua natural e os novos desafios no estudo da opinião pública ",
	year = "2024",
	howpublished = "Outro"
}

Exportar RIS

TY - CPAPER
TI - Processamento de língua natural e os novos desafios no estudo da opinião pública
T2 - INCT 2024
AU - Louçã, Jorge
PY - 2024
CY - São Paulo
AB - O grupo de investigação “The Observatorium”, fundado em 2008, é dedicado à recolha e análise de dados de comunicação textual a partir da Internet. Artigos de mais de cem jornais, de várias origens no Globo, são recolhidos de forma sistemática. Este corpo de dados tem sido utilizado para investigação, nomeadamente em ciência política, para monitorar a dinâmica da opinião pública e para entender a evolução das ideias na sociedade. O Observatorium desenvolveu ferramentas de software baseadas em Processamento de Língua Natural e na Teoria das Redes. Os últimos anos assistiram ao desenvolvimento rápido de novas ferramentas em Inteligência Artificial, que vieram criar novos desafios para o domínio de estudo do Observatorium.
A Inteligência Artificial Generativa é baseada na ideia de que a partir do processamento de enormes quantidades de textos, sobretudo recolhidos da Internet, os modelos de IA podem responder a consultas de forma coerente, como se de um agente realmente inteligente se tratasse. Os novos modelos LLM – Large Language Models, em que o mais popular é neste momento o ChatGPT, tornaram-se acessíveis para todos. Estes modelos podem ainda ser enriquecidos com utilização de ferramentas de RAG – Retrieval-Augmented Generation, associadas às bases de dados vetoriais. Estas novas bases de dados permitem guardar e consultar embeddings (palavras, imagens e vídeos preparados para processamento nos novos sistemas de Inteligência Artificial).
Nesta palestra apresentarei brevemente o Observatorium, abordarei com um pouco mais de detalhe o funcionamento, alcance e limites dos modelos LLM, e finalmente que soluções podemos ambicionar para os novos desafios abertos ao estudo da opinião pública. Nomeadamente serão sugeridas novas arquitecturas, suportadas por modelos de linguagem e por algoritmos de aprendizagem automática, permitindo detectar padrões na opinião pública e desta forma entender a evolução da sociedade.
ER -