Обложка канала

Кремниевая Галина

20095 @kremgalya

Кассир Галя и гик Гриша - гиды по всяким там диджитал-шмиджитал. Самые свежие новости вот этого самого. Гриша шарит, Галя нет. Вот и вся любовь

Кремниевая Галина

3 года назад
Открыть в
А "Сбер", а точнее их подразделение Sber AI представило свою новую text-to-image модель Kandinsky 2.1 — такой вам "миджорни" на минималках", но не в плане мощности (3,3 млрд параметров для такого формата генеративных моделей вполне рабочая история). Гик скорее говорит о его производительности, ведь, например, тг-бот, привязанные к нейросети, >10 минут не отдавал мне пикчу по запросу — у Kandinsky, кстати, есть разные фичи: из них я решил использовать смешение картинки и запроса. И да, в отличие от MJ, "Кандинский" отлично понимает русский, поэтому результатом, несмотря на долгое ожидания, ваш нейросетолог-испытатель доволен :]
Complete AI

🚀Kandinsky 2.1🚀 Наступил день, которого ждала вся команда (вовсе не тот, который стал всплывать в разных каналах на прошлой неделе😂). Сегодня мы официально выпускаем новую лучшую версию нашей диффузионной генеративной модели, которая претерпела существенные изменения относительно предшественницы 2.0. Отличительные особенности включают: 📌3.3B параметров 📌Разрешение генераций - 768x768 📌Image prior трансформер 📌Новый автоэнкодер изображений MoVQ 📌Дообучение на очень чистом сете из 172M пар «текст-изображение» 📌Режимы работы: генерация по тексту, смешивание изображение, генерация изображений по образцу, изменение изображений по тексту, inpainting/outpainting Всё это позволило добиться впечатляющего качества на различных доменах генераций. FID на датасете COCO_30k достигает значения 8.21🔥 По публичным данным на сегодняшний день лучше только eDiffI (NVidia) и Imagen (Google Reseacrh). Детально о модели можно прочитать в статье на Хабре, а протестировать Kandinsky 2.1 можно тут: 📍Телеграм-бот…

Telegram