Hey Machine Learning – это новости и события из отрасли искусственного интеллекта и машинного обучения. Мы описываем свои (и не только) кейсы, и делимся качественным контентом с вами!
Microsoft создал доступную систему преобразования текста в речь
Инженеры компании Microsoft и команда китайских исследователей разработали ИИ, который преобразовывает текст в реалистичную речь. Для этого алгоритм использует 200 образцов голоса, общей продолжительностью 20 минут, и соответствующие транскрипции.
Проект частично основан на трансформерах – глубоких нейросетях, имитирующих работу мозговых нейронов. Они обрабатывают каждый ввод и вывод моментально, позволяя системе очень эффективно воспроизводить даже длинные речевые конструкции.
Результаты работы алгоритма пока неидеальны, например, иногда слышна незначительная роботизированная интонация, однако точность разборчивости воспроизводимых слов составляет 99,84%.