TANGO
TANGO — это модель скрытой диффузии для преобразования текста в аудио.
TANGO может генерировать реалистичные звуки, включая человеческую речь, звуки животных, естественные и искусственные звуки, а также звуковые эффекты из текстовых подсказок.
https://github.com/declare-lab/tango
Site: https://tango-web.github.io/
▫️Пример генерации выше☝🏻
▫️Сгенерировано по подсказке: «Человек говорит, за ним блеет коза, затем металлические ворота захлопываются, при этом утки крякают, а ветер дует в микрофон.»