Caption-Anything
Универсальный инструмент для обработки изображений, сочетающий в себе возможности SAM, Visual Captioning и ChatGPT.
Решение создает описательные подписи для любого объекта на любом изображении, предлагая различные языковые стили для удовлетворения различных предпочтений пользователей.
Он поддерживает визуальные элементы управления (щелчок мышью) и языковые элементы управления.
https://github.com/ttengwang/Caption-Anything
HuggingFace: huggingface.co/spaces/…Anything