Насколько GPT4 превосходит предшественников и насколько сравнима со способностями человека?
В двух таблицах приведены сравнительные результаты на академических и профессиональных экзаменах
В каждом случае моделировались условия и выставление оценок как в реальном экзамене. В таблице окончательный результат GPT-4, оцененный в соответствии с экзаменом
Экзамены упорядочены от низкого к высокому в зависимости от производительности GPT-3.5. GPT-4 превосходит GPT-3.5 на большинстве протестированных экзаменов, как и другие существующие языковые модели, даже самые современные
GPT-4 демонстрирует результаты на уровне человека в большинстве этих экзаменов. Примечательно, что ИИ проходит смоделированную версию единого экзамена на адвоката с результатом в 10% лучших участников теста (см таблицу)