Тем временем Nvidia показала новую крышесносную штуку — eDiff-I: новый генеративный ИИ для синтеза текста и изображения с мгновенной передачей стилей и «рисованием словами»
Похоже на GauGAN, только работает с разными объектами, а не ландшафтами. А сами объекты задаются словами.
Быстрее бы выкатили исходники, руки чешутся поюзать.
тут подробнее
а тут статья на архиве