⏩ An Inverse Scaling Law for CLIP TrainingCLIP, the first foundation model that connects images and text, has enabled many recent breakthroughs in computer vision. As a result of this finding, we are able to successfully train CLIP even by using academic resources.
CLIP, первая фундаментальная модель, которая связывает изображения и текст, которая помогла совершить множество прорывов в компьютерном зрении. Проект показывает спопобы снижения вычислительных затрат на работу CLIP.
🖥 Github: https://github.com/UCSC-VLAA/CLIPA
⏩ Paper: https://arxiv.org/abs/2305.07017v1
📌 Dataset: paperswithcode.com/dataset…t-sketchai_machinelearning_big_data