Вышло исследование, о том, что нейронки могут улучшать себя без новых данных🧠 (в том числе и GPT-4). Подход называется Reflexion, который позволяет ИИ учиться на своих ошибках, как это делают люди. Что в очередной раз доказывает неактуальность призывов к тому, что разработку ИИ следует приостановить, так как ИИ может улучшаться даже без новых данных. Reflexion предоставляет ИИ динамическую память и возможность саморефлексии для принятия более взвешенных решений. Он может распознавать галлюцинации, избегать повторения действий и создавать карты памяти. Подход был протестирован в средах AlfWorld и HotPotQA с показателями успеха 97% и 51% соответственно (в тестах использовался GPT 3.5)
AlfWorld - это текстовая среда, основанная на решения проблем в виртуальном мире. Она предоставляет искусственному интеллекту серию задач, которые требуют выполнения различных последовательностей действий для достижения конечной цели. Это позволяет оценить способность агента к планированию и решению задач.
HotPotQA - это среда для вопросов и ответов, в которой агенту предоставляется набор вопросов, требующих поиска и анализа информации из разных источников для получения правильных ответов. Задачи в HotPotQA оценивают способность агента к поиску, пониманию и использованию знаний для решения сложных вопросов.
Обе среды предоставляют различные вызовы и позволяют оценить разные аспекты производительности искусственного интеллекта.
Интересно будет посмотреть на результаты подобных тестов с использованием GPT-4🤓