Обложка канала

Блуждающий нерв

3230 @dtulinov

Исследования мозга, нейротехнологии, генная инженерия и др. смежные темы -- что происходит в этой области. Ссылки на научные источники.

Блуждающий нерв

3 года назад
Открыть в
Интригующее от MIT & Google Research: массивные модели трансформеры, похожие на LLMs, содержат в скрытых слоях другие модели, как бы меньшие версии самих себя. И обучают их. Только недавно увидел, и это крайне любопытно в контексте пространства состояний психики, множественных личностей, скрытых состояний мозга и т.п. Среди авторов препринта Андреас из MIT CSAIL, о котором я уже упоминал. Он копает в верном направлении, надо бы присмотреться. [кстати, есть видео-обзор на эту работу]
Solving a machine-learning mystery

MIT researchers have explained how large language models like GPT-3 are able to learn new tasks without updating their parameters, despite not being trained to perform those tasks. They found that these large language models write smaller linear models inside their hidden layers, which the large models can train to complete a new task using simple learning algorithms.

MIT News