Search Results for author: Naman Deep Singh

Found 1 papers, 1 papers with code

Robust CLIP: Unsupervised Adversarial Fine-Tuning of Vision Embeddings for Robust Large Vision-Language Models

1 code implementation • 19 Feb 2024 • Christian Schlarmann, Naman Deep Singh, Francesco Croce, Matthias Hein

The CLIP model, or one of its variants, is used as a frozen vision encoder in many vision-language models (VLMs), e. g. LLaVA and OpenFlamingo.

Adversarial Defense Multimodal Deep Learning +1

56

Paper
Code

Cannot find the paper you are looking for? You can Submit a new open access paper.