Обложка канала

Neural Shit

35268 @NeuralShit

Проклятые нейронные сети

Neural Shit

3 года назад
Открыть в
Утекли подробности про GPT-4. Говорят, что это смесь из 8 экспертов, каждый по 220 млрд параметров. То есть в сумме 1.760 триллиона параметров! Соумит Чинтала (один из создателей PyTorch) тоже подтвердил слух. Эксперты в этом случае — это просто копии модели GPT, на 220B параметров, которые тренировались отдельно и скорее всего на различных данных. Во время инференса у них там какие-то хитрые трюки для того, чтобы выбрать ответы каких экспертов выдавать юзеру. @ai_newz