Обложка канала

NeuroHive - Нейронные сети

3406 @neurohive

Канал про нейронные сети и новые методы решения задач в машинном обучении

NeuroHive - Нейронные сети

5 лет назад
Открыть в
​​Pile — это датасет с разнообразными текстами на 825 гигабайт для обучения языковых моделей. Датасет состоит из 22 датасетов меньшего размера, которые объединили в один. Ключевое отличие Pile — разнообразие типов текстовых данных: научные статьи, веб-страницы, GitHub репозитории, логи чатов и книги.