Entity

CMAP: Cross-Modal Adaptive Prompting for Multi-Domain Task-Incremental Learning

Multi-domain task-incremental learning requires a model to sequentially acquire knowledge across visually diverse domains without forgetting prior tasks, and without access to task identity at inference. Parameter-efficient methods built on frozen vision-language models have made strong progress, yet all existing approaches rely exclusively on visual features for task routing, confidence estimation, and encoder adaptation, leaving CLIP's cross-modal text embedding space entirely unexploited. We

Paper · arXiv

cs.CV

Authors: Sriram Mandalika
Published: 2026-05-25
Categories: cs.CVcs.CLcs.ET

Abstract ↗

via arXiv · 2605.25708