Штаб-квартира Яндекса(@yandexhq). 🙍| 🤖Отличить человеческую речь от синтезированной непросто, но вы можете попробовать. Пройдите этот

🙍| 🤖Отличить человеческую речь от синтезированной непросто, но вы можете попробовать. Пройдите этот тест и поделитесь в комментариях, сколько раз вы приняли алгоритм за человека. 🎤🔊 А вот что такое SpeechKit — единый инструмент для синтеза и распознавания речи на базе Yandex Cloud: • SpeechKit — это технология, которую Яндекс начал развивать в 2013 году. Сегодня она используется во многих сервисах компании, и именно она подарила Алисе голос и умение слушать. • До недавнего времени синтез речи был доступен на пяти языках — английском, иврите, казахском, немецком и русском, а на прошлой неделе добавился узбекский • SpeechKit позволяет придать голосу максимальную схожесть с естественной речью. Можно расставить интонационные паузы или ударения в словах, которые одинаково пишутся, но произносятся по-разному (бе́лок и бело́к) • Распознавание речи доступно на 16 языках — среди них русский, английский, немецкий, польский, турецкий, финский. SpeechKit также может распознавать речь в режиме полиглота — когда говорящий использует несколько языков • Синтез речи делится на четыре основных этапа. Первые два предсказывают длительность и интонацию для каждой буквы в конкретном случае. Третий предсказывает акустические признаки, а четвёртый конвертирует результат в аудиодорожку • SpeechKit активно используют сторонние компании, например Skyeng и Додо Пицца. А при помощи SpeechKit Brand Voice можно создавать собственные уникальные голоса. Такая речь может синтезироваться по шаблонам, а может учитывать разные переменные, такие как имена, номера карт и другое • Использование синтеза и распознавания речи помогает бизнесу автоматизировать колл-центры, создавать голосовые интерфейсы и умных помощников. Помимо этого SpeechKit решает важную социальную проблему — позволяет озвучивать любой текст для слабовидящих людей Подписывайтесь 👉 @techno_yandex Не пропускайте новости Яндекса тут @@yandex