Обложка канала

Tech Crunch

Tech Crunch на русском.

Tech Crunch

5 лет назад
Открыть в
Как работают голосовые технологии Яндекса Яндекс рассказал историю голосового синтеза Алисы. Внутри много подробностей, описания моделей, схем и примеров синтеза — можно послушать, как Алиса звучала на разных этапах своей эволюции. Оказывается, современная архитектура синтеза позволяет за одну секунду работы генерировать несколько сотен секунд звука. Это очень быстро. За некоторые аспекты синтеза отвечают решения из других областей машинного обучения — например, модель машинного перевода помогла Алисе научиться правильно ставить ударения в парах «зАмок» и «замОк», «белкИ» и «бЕлки». Чтобы научить Алису понимать шёпот, пришлось обучить нейросеть различать спектры звука для обычного голоса и шёпота. Система смотрит на спектр звука и решает, когда говорят шёпотом, а когда — голосом. https://habr.com/ru/company/yandex/blog/593681/
Шёпот и эмоции в Алисе: история развития голосового синтеза Яндекса

Четыре года назад мы запустили Алису. С самого начала она обладала собственным, узнаваемым голосом. Хотя проблемы тоже были: интонации хромали, эмоции скакали от слова к слову, а омонимы и вовсе...

Хабр