Нейросеть генерирует любые звуки из текста. Модель TANGO из промтов генерирует человеческую речь, звуки животных, природы, искусственные звуки, звуковые эффекты и музыку.
Например, в один клик можно добавить аудио «человек говорит с эхо, за ним блеет коза, металлические ворота захлопываются, а ветер дует». Справится с любыми сложностями и последовательностями, даже когда все звуки одновременно.
GitHub — тут.@bugnotfeature