Обложка канала

Литагенты существуют

2132 @litagents

О книжном рынке и литературном мире. Пусть будет больше счастливых авторов и хороших книг!

Литагенты существуют

3 года назад
Открыть в
Российские дикторы заявляют, что у них воруют голоса Неожиданное продолжение сюжета с озвучиванием книг искусственным интеллектом. Союз дикторов заявил, что у них воруют голоса, которые потом используют для синтеза речи. Один из дикторов записал свой голос для научной работы на кафедре фонетики в одном из питерских вузов, а затем обнаружил, что его голос продают на нескольких платформах в виде синтеза. Другой диктор неожиданно встретил свой голос на сайте информ-агентства — им говорили новости. Союз дикторов бьет тревогу (дословная цитата) — и требует не только прекратить воровство голосов, но и разработать специальное регулирование синтеза голосов. Дикторы написали письмо Александру Хинштейну (тот самый депутат, который борется с Popcorn Books). Они предлагают ввести лицензии на голоса, а также запретить использования «роботизированного некачественного» звучания синтезированного голоса на телевидении и радио, а также в любом виде художественного озвучивания — в том числе для книг. Дикторы знают, на какие мозоли депутатов нужно давить. В письме есть положение о том, что западные страны высасывают российские голоса: «Зарубежные IT-компании активно записывают российских дикторов, чтобы позже продавать их голоса на наш же рынок. <…> Получается, что на русский язык будут оказывать влияние иноязычные компании?» Тут нужно прояснить несколько моментов. Как разработчики ИИ получают голоса? Сначала проводится кастинг голосов – подбираются потенциальные дикторы, записываются их голоса, и на основании определенных критериев происходит выбор подходящего. После этого происходит запись самого датасета, на основании которого обучается модель и создается голос, объясняет Дмитрий Теплицкий, руководитель VS Robotics (занимается речевыми технологиями). Для создания качественного датасета требуется около пяти часов читки. Можно ли своровать голос? Да. Можно не тратить пять часов и создать датасет на основе записей спектаклей, отрывков из фильмов, публичных выступлений. В норме у владельца\разработчика ИИ должен быть договор на использование голоса. Однако от прямого пиратства никто не застрахован, объясняет Николай Боронин, руководитель аудиопроектов Alpina Digital. Голос невозможно защитить от «копирования», если имитирование само по себе совершается без преступного умысла (например, с целью мошенничества) и без причинения ущерба репутации диктора, то за такое использование не предусмотрено ответственности, объясняют юристы. ИИ действительно угрожает дикторам, и им можно было посочувствовать, и даже занять их сторону, но после этого письма не хочется — слишком уж резкий тон выбрали дикторы, а точнее этот их конкретный союз. Хинштейн письма еще не видел, юристы уверены, что закон, запрещающий озвучку с помощью ИИ, не примут. А вот запрет на использование российских голосов иностранным компаниям — это вполне реальная перспектива.