В MIT научили нейросеть воссоздавать лицо по голосу человека
Учёные из Массачусетского технологического института создали нейросеть Speech2Face, которая может создавать примерное изображение лица человека по голосу.
Для обучения нейросети учёные использовали более миллиона коротких видео. Чтобы создать лицо нейросеть сначала определяет пол и возраст человека, а также выясняет национальность по наличию акцента.
Алгоритм работает не слишком точно: например, он определяет возраст с точностью до десяти лет. А из-за особенностей обучающей выборки, лучше всего нейросеть изображает людей с европеоидной и азиатской внешностью.