Microsoft представила искусственный интеллект VALL-E, который способен имитировать любой человеческий голос на основе примера длительностью всего в три секунды.
При этом голос имитируется очень достоверно, с сохранением как тембра, так и эмоциональной окраски оригинала.
В отличие от других методов преобразования текста, VALL-E использует обучающие данные, чтобы сопоставить свои «знания» о том, как этот голос будет звучать, если ИИ произнесёт другие фразы.