Обложка канала

Developer Starter pack

4518 @devsp

Начинаешь свой путь в разработку? Или ты гуру и хочешь узнать новое? Тогда тебе стоит взглянуть на @devsp ✔️Английские термины(без него никуда) ✔️Бесплатные ресурсы для получения основ различных языков программирования ✔️Ресурсы - помощники ✔️Интересны

Developer Starter pack

6 лет назад
Открыть в
На VC.ru вышла интересная колонка руководителя Яндекс.Толоки Ольги Мегорской. В ней Ольга рассказала про самые распространенные гипотезы о разметке для машинного обучения и опровергла их на наглядных примерах из опыта команды Толоки.

Ключевые поинты:
качество модели зависит от количества и качества данных, на которых она тренируется. Разметка данных заслуживает и внимания, и ресурсов.
разметку данных можно и нужно делегировать. Это освободит время и ресурсы на разработку
в зависимости от задач и объёмов данных, заказчик может выбрать аутсорсинговое или краудсорсинговое решение. Разметку с помощью краудсорсинга можно организовать самостоятельно, а можно использовать автоматизированные процессы или обратиться к опытным специалистам.

Основной вывод: Не пренебрегайте разметкой данных. Не бойтесь делегировать. Пробуйте, ищите подходы, которые устроят именно вас.