NeuroHive - Нейронные сети(@neurohive). DeepMind представила языковую модель RETRO, в которой реализована схема обучения, основанная на ис

NeuroHive - Нейронные сети

3406 @neurohive

Открыть

Канал про нейронные сети и новые методы решения задач в машинном обучении

NeuroHive - Нейронные сети

@neurohive 5 лет назад

DeepMind представила языковую модель RETRO, в которой реализована схема обучения, основанная на использовании внешней памяти. RETRO демонстрирует сравнимые с GPT-3 результаты несмотря на то, что она имеет в 25 раз меньше параметров. #StateoftheArt