Обложка канала

Блуждающий нерв

3230 @dtulinov

Исследования мозга, нейротехнологии, генная инженерия и др. смежные темы -- что происходит в этой области. Ссылки на научные источники.

Блуждающий нерв

4 года назад
Открыть в
Мозг человека и обученная нейросеть GPT2-XL (1.5 млрд параметров), если заглянуть им внутрь, вплоть до слоев и нейронов, обрабатывают один и тот же текст схожим образом. Об этом нам сообщают в свежей работе авторы из Принстона, Нью-Йорка и Google Research. Это не первый результат такого рода, и исследования на эту тему будут множится: мозг человека и DLMs богаты разными данными, и сопоставлять их можно по-всякому. В этот раз показали, что послойные преобразования текста в GPT2-XL соответствуют временной последовательности обработки в языковых областях мозга людей, которые слушали тот же текст (им снимали ЭКоГ). Как пишут авторы, «учитывая явные архитектурные различия на уровне схем между DLM и мозгом, сходство их внутренних вычислительных последовательностей может показаться удивительным». Полагаю, такие сопоставления станут отдельным направлением исследований. Если оно окажется плодотворным — т.е. если между DLMs и мозгом действительно есть глубокие интересные гомологии — это и повлияет на разработку архитектур нейросетей, и прольет дополнительный свет на работу мозга человека. Впрочем, понравится это не всем.
Correspondence between the layered structure of deep language models and temporal structure of natural language processing in the human brain

Deep language models (DLMs) provide a novel computational paradigm for how the brain processes natural language. Unlike symbolic, rule-based models from psycholinguistics, DLMs encode words and their context as continuous numerical vectors. These "embeddings" are constructed by a sequence of layered computations to ultimately capture surprisingly sophisticated representations of linguistic structures. How does this layered hierarchy map onto the human brain during natural language comprehension? In this study, we used ECoG to record neural activity in language areas along the superior temporal gyrus and inferior frontal gyrus while human participants listened to a 30-minute spoken narrative. We supplied this same narrative to a high-performing DLM (GPT2-XL) and extracted the contextual embeddings for each word in the story across all 48 layers of the model. We next trained a set of linear encoding models to predict the temporally-evolving neural activity from the embeddings at each layer. We found a striking…

bioRxiv