☝🏻Nvidia представила еще одну нейросеть для создания видео из текста
Эта нейросетевая модель позволяет создавать видео длиной до 4 секунд и разрешения до 1280x2048 пикселей с частотой 24 кадра в секунду.
Для создания text2video корпорация использовала наработки Stable Diffusion, но доработали алгоритм для получения видео в высоком качестве.🤔
Text2video имеет в общей сложности 4,1 млрд параметров, что является достаточно скромным объемом по сравнению с другими конкурирующими решениями.
Хотя продукт пока находится на стадии исследовательской работы, он уже привлекает внимание специалистов в области искусственного интеллекта и видеопроизводства. 🤖