Блуждающий нерв(@dtulinov). Интригующее от MIT & Google Research: массивные модели трансформеры, похожие на LLMs, содержат в

Интригующее от MIT & Google Research: массивные модели трансформеры, похожие на LLMs, содержат в скрытых слоях другие модели, как бы меньшие версии самих себя. И обучают их. Только недавно увидел, и это крайне любопытно в контексте пространства состояний психики, множественных личностей, скрытых состояний мозга и т.п. Среди авторов препринта Андреас из MIT CSAIL, о котором я уже упоминал. Он копает в верном направлении, надо бы присмотреться. [кстати, есть видео-обзор на эту работу]