Недавно мы обсуждали с Романом Куцевым (CTO TrainingData) в нашем подкасте кейсы по определению тональности голоса человека, звонящего в колл-центр. Так вот в США взялись за голос очень серьезно. А конкретнее – за акцент. Ребята придумали чудо алгоритм, который может превратить "слегка" непонятный голос оператора – индуса в голос обычного белого американца.
Разработчики объясняют, что такой алгоритм поможет европейцам и американцам снять языковые барьеры при общении с коллегами из Индии.
«Это нетривиальная задача: чтобы голос звучал реалистично, требуются огромные массивы аудио данных, которые трудно найти, так как в основном все записи в колл-центрах находятся под NDA», ― комментирует для фабрички Роман.
Дальше-больше. Скоро еще появится новый алгоритм, который сможет подменить любой непонравившийся вам акцент. Ждем. Не терпится протестировать это на нашем "русском" акценте.
#новости