Ну что, все готовы проснуться в Black Mirror наяву?
Ученые смогли реконструировать звуки на основе мозговой активности с помощью генеративного AI и fMRI.
Раньше это было возможно только с визуальными элементами, а вот со звуками все было не так просто из-за сложных временных последовательностей и ограничений в методах нейровизуализации.
Прорыв случился, когда исследователи обнаружили сходство между аудитивной системой человека и моделями глубоких нейронных сетей (DNN), которые используются в ML.
В исследовании использовались данные функциональной магнитно-резонансной томографии (fMRI) для измерения активности мозга в ответ на различные звуки.
Для восстановления звуков была использована специальная модель, способная преобразовывать сжатые представления обратно в высококачественные звуки.
Интересно, что восстановленные звуки были очень похожи на фактические звуки, что подтверждает распределенную природу аудитивных представлений в мозге.
Конечно, до прослушивания внутренних монологов пока далеко, но это открытие позволит очень сильно продвинуться в понимании того, как устроено аудио-восприятие человека, и возможно создать какие-то революционные продукты.
@startupnews