🙍| 🤖Отличить человеческую речь от синтезированной непросто, но вы можете попробовать. Пройдите этот тест и поделитесь в комментариях, сколько раз вы приняли алгоритм за человека.
🎤🔊 А вот что такое SpeechKit — единый инструмент для синтеза и распознавания речи на базе Yandex Cloud:
• SpeechKit — это технология, которую Яндекс начал развивать в 2013 году. Сегодня она используется во многих сервисах компании, и именно она подарила Алисе голос и умение слушать.
• До недавнего времени синтез речи был доступен на пяти языках — английском, иврите, казахском, немецком и русском, а на прошлой неделе добавился узбекский
• SpeechKit позволяет придать голосу максимальную схожесть с естественной речью. Можно расставить интонационные паузы или ударения в словах, которые одинаково пишутся, но произносятся по-разному (бе́лок и бело́к)
• Распознавание речи доступно на 16 языках — среди них русский, английский, немецкий, польский, турецкий, финский. SpeechKit также может распознавать речь в режиме полиглота — когда говорящий использует несколько языков
• Синтез речи делится на четыре основных этапа. Первые два предсказывают длительность и интонацию для каждой буквы в конкретном случае. Третий предсказывает акустические признаки, а четвёртый конвертирует результат в аудиодорожку
• SpeechKit активно используют сторонние компании, например Skyeng и Додо Пицца. А при помощи SpeechKit Brand Voice можно создавать собственные уникальные голоса. Такая речь может синтезироваться по шаблонам, а может учитывать разные переменные, такие как имена, номера карт и другое
• Использование синтеза и распознавания речи помогает бизнесу автоматизировать колл-центры, создавать голосовые интерфейсы и умных помощников. Помимо этого SpeechKit решает важную социальную проблему — позволяет озвучивать любой текст для слабовидящих людей
Подписывайтесь 👉 @techno_yandexНе пропускайте новости Яндекса тут @@yandex