Обложка канала

Кремниевая Галина

20305 @krem_galya

Кассир Галя и гик Гриша - гиды по всяким там диджитал-шмиджитал. Самые свежие новости вот этого самого. Гриша шарит, Галя нет. Вот и вся любовь

Кремниевая Галина

3 года назад
Открыть в
Сейчас пытаются раздуть новость из исследования с очень узкой выборкой тестов GPT-4. Мол, главная нейросеть прямо сейчас глупеет на глазах, уже не работает как надо, а юзеры через одного жалуются на качество генераций и проч. Но вот что говорят специалисты: произошел некорректный анализ, а ИИ только лучше стал! Да-да, такое бывает, когда люди гонятся за громкими заголовками. Ну и прувы, конечно, ищите здесь.
Сиолошная

How is ChatGPT's behavior changing over time? Исследование подтвердило — GPT-4 потупела! Или нет..? Давайте разбираться в нашумевшей статье — мне уже даже в личку пишут, спрашивают, мол, правда ли. Наш старый знакомый (я бы даже сказал мой подпищек) Matei Zaharia со своими падаванами из Stanford и UC Berkley пытались сравнить ChatGPT и GPT-4 версии марта и июня 2023го года (да, для каждой из них существует по два варианта). А то люди в последнее время начали жаловаться (например, вот на Reddit), мол, модель стала работать хуже, ответы менее полезные! Для тестирования взяли 4 задачи: 1) математика, или ответ на вопрос, является ли число простым или составным? (если забыли, то простые числа — это такие, которые делятся только на 1 и на само себя) 2) кодинг, или возможность модели выдавать осмысленный код 3) ответы на чувствительные ("токсичные") вопросы 4) задачи на visual reasoning (для тех кто знает - это бенчмарк ARC. Нужно по нескольким картинкам выявить паттерн и применить его для нового примера, см. картинку…

Telegram