Обложка канала

#TechCrunch #Silicon_Valley #Хайтек 🦄 PRO стартапы, бизнес и технологии.

Новости из мира высоких технологий для бизнеса

#TechCrunch #Silicon_Valley #Хайтек 🦄 PRO стартапы, бизнес и технологии.

4 года назад
Открыть в
Прикольненько. Искусственный интеллект может создать ваш жутковато точный портрет, используя только ваш голос. Исследователи ИИ работают над созданием изображения лица человека, используя только короткую аудиозапись его речи, и результаты оказались довольно впечатляющими. Товарищи из Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL) впервые опубликовали информацию об алгоритме искусственного интеллекта под названием Speech2Face еще в 2019 году (https://arxiv.org/abs/1905.09773). Исследователи разработали и обучили глубокую нейронную сеть, используя миллионы видеороликов с YouTube и Интернета, на которых изображены разговаривающие люди. В процессе обучения ИИ изучил корреляции между звуком голоса и внешним видом говорящего. Эти взаимосвязи позволили ему сделать лучшие предположения о возрасте, поле и этнической принадлежности говорящего. В процессе обучения не участвовал человек, поскольку исследователям не нужно было вручную маркировать какие-либо подмножества данных - ИИ просто предоставили огромный массив видеозаписей и поставили перед ним задачу выявить корреляции между особенностями голоса и чертами лица. После обучения ИИ оказался на удивление хорош в создании портретов, основанных только на голосовых записях. Для дальнейшего анализа точности реконструкции по голосу и сравнению методик, исследователи создали "декодер лица", который создает стандартную реконструкцию лица человека лишь по одному неподвижному кадру, игнорируя при этом "несущественные вариации", такие как разворот и освещение. Это позволило ученым сравнить реконструкцию голоса с реальными чертами лица говорящего. И снова результаты ИИ были поразительно близки к реальным лицам в большом проценте случаев. Не все так, безусловно, радужно. В некоторых случаях ИИ с трудом определял, как выглядит говорящий. Такие факторы, как акцент, язык и высота голоса, вызывали "несоответствие речи и лица", при котором пол, возраст или этническая принадлежность оказывались неверными. Люди с высоким голосом (включая мальчиков младшего возраста) часто идентифицировались как женщины, а люди с низким голосом - как мужчины. Азиатский мужчина, говорящий по-английски, выглядел менее азиатским, чем когда он говорил по-китайски. "В некотором смысле эта система похожа на вашего дядю-расиста", - пишет фотограф Томас Смит. "Ей кажется, что она всегда может определить расовую или этническую принадлежность человека по его голосу - но часто она ошибается". Как это все использовать? Во-первых, это кладезь для полиции, силовых органов, государственных структур и коммерческих структур, которые будут вас определять и “видеть” по голосу. Во-вторых, одним из возможных применений этого ИИ в реальном мире может быть создание мультяшного изображения человека во время телефонного разговора или видеоконференции, или в виде аватара в метавселенной, когда личность человека неизвестна и он не хочет делиться своим реальным лицом. В третьих, реконструированные лица могут также использоваться для присвоения лиц машинным голосам, используемым в домашних устройствах и виртуальных помощниках. ** Гонка за первенство на рынке голосовых помощников https://fastsalttimes.com/smart-speaker-race/ Голосовые ИИ-помощники пожирают мир? fastsalttimes.com/voice-a…he-world Alexa и игры, в которых вы контролируете действия голосом https://fastsalttimes.com/alexa-voice-games/ Поколение «голоса» или к чему приведет взросление с технологией fastsalttimes.com/voice-a…neration Как технологии меняют шпионаж https://fastsalttimes.com/tech-and-espionage/