Enhancing Mammogram-Based Breast Cancer Prediction From Pretrained Vision-Language Models: the Role of Soft Prompts and Bidirectional Fusion

Fareeha Sarwar; Nuno Miguel de Figueiredo Garrido; Margarida Silveira

Ciência_Iscte Publicações Descrição Detalhada da Publicação

Publicação em atas de evento científico

Enhancing Mammogram-Based Breast Cancer Prediction From Pretrained Vision-Language Models: the Role of Soft Prompts and Bidirectional Fusion

Fareeha Sarwar (Sarwar, F.); Nuno Miguel de Figueiredo Garrido (Garrido, N.); Margarida Silveira (Margarida Silveira);

2026 IEEE 23rd International Symposium on Biomedical Imaging (ISBI)

Ano (publicação definitiva)

2026

Língua

Inglês

País

Reino Unido

Mais Informação

Visitar Link

Web of Science®

Esta publicação não está indexada na Web of Science®

Scopus

Esta publicação não está indexada na Scopus

Google Scholar

N.º de citações: 0

(Última verificação: 2026-06-09 03:54)

Ver o registo no Google Scholar

Overton

Esta publicação não está indexada no Overton

Abstract/Resumo

Recent advances in vision-language models (VLMs) such as CLIP and BLIP have demonstrated strong generalization in visual reasoning tasks. However, their potential for medical image analysis, especially breast cancer prediction from mammograms, remains underexplored. This study investigates how a pretrained VLM can be adapted for full mammographic classification. Unlike prior approaches that rely on costly region-of-interest (ROI) annotations, we process entire mammograms and adapt a general-purpose VLM (EVACLIP) using soft prompts, selective fine-tuning, and bidirectional fusion strategies. We compare different fusion methods, including Concatenation, Gated-Residual, Cross-Modal, Co-Weighted and Bi-Attention. Experiments on the CBISDDSM dataset show that bidirectional fusion methods consistently outperform other fusion approaches, while providing enhanced explainability through improved attention localization. Results also demonstrate that our adapted generalpurpose VLM significantly outperforms a mammographyspecific model (Mammo-CLIP), under domain-shift, in both zero-shot and linear-probe settings. This suggests that largescale general-purpose VLMs, when properly adapted, can outperform domain-specific models, reducing the need for extensive annotation and paired image-text training.

Agradecimentos/Acknowledgements

This work was supported by LARSyS FCT funding (DOI: 10.54499/LA/P/0083/2020, 10.54499/UIDP/ 672 50009/2020, 10.54499/UIDB/50009/2020). F. Sarwar gratefully acknowledges the invaluable support of ISCTE-IUL and Instituto de Telecomunicações

Palavras-chave

Vision-Language Models,Fusion Techniques,Breast Cancer Prediction,Multimodal Learning

Classificação Fields of Science and Technology

Ciências da Computação e da Informação - Ciências Naturais
Engenharia Eletrotécnica, Eletrónica e Informática - Engenharia e Tecnologia

Contribuições para os Objetivos do Desenvolvimento Sustentável das Nações Unidas

Com o objetivo de aumentar a investigação direcionada para o cumprimento dos Objetivos do Desenvolvimento Sustentável para 2030 das Nações Unidas, é disponibilizada no Ciência_Iscte a possibilidade de associação, quando aplicável, dos artigos científicos aos Objetivos do Desenvolvimento Sustentável. Estes são os Objetivos do Desenvolvimento Sustentável identificados pelo(s) autor(es) para esta publicação. Para uma informação detalhada dos Objetivos do Desenvolvimento Sustentável, clique aqui.

Identificadores da Publicação

DOI (fonte: autor)	10.1109/ISBI61048.2026.11515820
ID Ciência_Iscte	ci-pub-118478

Outros Detalhes da Publicação

Ano Publicação Online	2026
Editora	IEEE
Indexação	--
ISSN	1945-7928 (print) 1945-8452 (online)
ISBN	979-8-3315-7764-3 (print) 979-8-3315-7763-6 (online)
Volume
Número Artigo
Páginas	1 - 5	Total Páginas	--
Avaliado Cientificamente	Sim
Meio de Divulgação	Ambos (impresso e digital)
Editores
Título do Evento	2026 IEEE 23rd International Symposium on Biomedical Imaging (ISBI)
Organizador do Evento
Cidade	London, United Kingdom
Tipo de Evento	Conferência
Classificação do Evento	Internacional
Ano do Evento	2026
Tipo de Publicação no Evento	Poster
Data Publicação (online)
Data Publicação (print)

Altmetric

Dimensions

PlumX Metrics