Нейросетки стремительной скоростью захватывают все области творчества и теперь очередь дошла до подкастов.
Абоб выпустили бесплатный инструмент, который с помощью нейросетей убирает фоновые шумы и улучшает голос.
Загрузить можно MP3 или WAV продолжительностью до 1 часа или размером до 1гб.
Увидев новость, я, как целевая аудитория сервиса, уже было обрадовался, что гостей можно спокойно записывать в онлайне и не придется корячится со звуком, чистить шумы и поднимать дыцыбелы. Но оказалось, что не все так идеально.
В сети уже есть видео, как сервис идеально воссоздает голос, делает его вполне слушательным (в комментах будет пример), но у меня не вышло. Видимо всё-таки нужны идеальные условия для записи.
На примере выше, записанный на диктофон айфона голос в условиях эхо, немного отдаленный от микрофона. Результат — проглоченные буквы и голос как из под одеяла 🤔