🔥 NVIDIA врывается на рынок нейросетей //
Компания представила свою модель text2video. Она может генерировать видео до 4 секунд на основе текстового описания.
За основу были взяты наработки нейросети Stable Diffusion, разработчики которой, к слову, также представили собственный ИИ-генератор видео, однако его качество заметно уступает по сравнению с текущим решением от NVIDIA.
Нейросеть может генерировать видео в разрешении до 1280x2048 пикселей с частотой 24 кадра в секунду. В общей сложности модель имеет 4,1 млрд параметров, что достаточно скромно и даже меньше, чем у конкурентов. Однако это только начало и оно уже впечатляет.
Пока что это только исследовательская работа, поэтому никаких сроков о появлении этого в публичном доступе нет.
@d_code