Крупнейшая свободная языковая модель поможет NLP-разработчикам со всего мира
Проще говоря, NLP (обработка естественного языка) — направление в машинном обучении, посвященное генерации и обработке обычного текста. В этой области существует множество нейросетевых решений. Например, YaLM, семейство языковых моделей Яндекса. Его активно применяют в Поиске, Алисе и других проектах компании.
Самая большая нейросетка из семейства YaLM — на 100 млрд параметров — обучена на 2 ТБ английских и русских текстов с помощью суперкомпьютеров. До недавнего времени доступ к ней был только у разработчиков Яндекса. Но сейчас компания поделилась ей и опубликовала модель YaLM 100B на Github. Это значит, что у исследователей и разработчиков со всего мира появился к ней свободный доступ для применения в любом своём проекте.