Practical Weak Supervision: Doing More with Less Data
Авторы: Wee Hyong Tok, Amit Bahree, Senja Filipi (2021)
Большинство специалистов по обработке данных и инженеров сегодня полагаются на качественные размеченные данные для обучения моделей машинного обучения. Но создание обучающего набора вручную занимает много времени и само по себе дорого, поэтому многие компании остаются с незавершенными проектами из области машинного обучения. Есть более практичный подход. В этой книге авторы показывают, как создавать продукты, используя модели обучения со слабым учителем.
Во время чтения книги вы:
✔️Научитесь использовать Snorkel AI;
✔️Получите примеры кода для использования Snorkel для маркировки наборов данных из текста и изображений;
✔️Используете слабо помеченный набор данных для классификации текста и изображений;
✔️Изучите практические рекомендации по использованию Snorkel с большими наборами данных и использованию кластеров Spark для масштабирования меток.