Индустрия 4.0.(@the4industry). A/B-тесты, аудит и кастомизация: как данные помогают улучшать продуктПравильная интерпретация данных

A/B-тесты, аудит и кастомизация: как данные помогают улучшать продукт

Правильная интерпретация данных может помочь не просто усовершенствовать продукт, а сделать это в соответствии с ожиданиями и потребностями пользователей.
Илья Колчин, руководитель отдела анализа данных «Учи.ру», рассказал, как Data Science используется в их компании и работает на благо продукта.

Многие компании применяют подход data-driven для принятия решений, влияющих на бизнес. Для нас такой подход — часть корпоративной культуры и всех рабочих процессов.
Мы накапливаем много данных — более пяти миллионов человек пользуется нашей онлайн-платформой, из которых около 3,6 млн — школьники, которые регулярно решают задания по 12 предметам, участвуют в олимпиадах и играют в обучающие игры.
Около десяти наших продуктовых команд еженедельно запускают новые олимпиады и курсы, делают задания более понятными и интересными, а процесс обучения — продуктивным. В этом помогают данные. На примере трех кейсов мы хотим показать, как data-driven работает на качество продукта.

🔔Data science контролирует достоверность А/В-тестов
А/В-тестирование — это мощный инструмент для оценки улучшений в продукте. С его помощью можно достоверно измерить эффект от атомарных изменений продукта и принять решение о внедрении для всех пользователей. К тому же А/В-тесты дают компании объективную дополнительную информацию о предпочтениях пользователей.
Мы запускаем по несколько А/В-тестов в неделю, десятки из них идут параллельно. При запуске важно заранее определить дату подведения итогов, чтобы избежать так называемой проблемы подглядывания. Она заключается в том, что между тестируемыми группами периодически возникает статистически значимая разница, даже если группы не отличаются.
Появляется соблазн завершить тест досрочно или, наоборот, подождать подольше, если эффекта не видно. Оба варианта приводят к резкому росту ложноположительных результатов (разницы нет, но мы ее увидели), поэтому мы принимаем решение об успешности теста только один раз — в заранее выбранную дату.
При этом, если заложить на А/В-тест слишком мало времени, то, скорее всего, он будет признан неудачным, если слишком много — потеряем время.
Достаточное для А/В-теста время зависит от ожидаемого прироста метрики и целого ряда факторов:
♦️запускаем тест на первый класс или на всех школьников,
♦️на всех пользователей или только на новых,
♦️на учеников или на учителей,
♦️в какое именно время учебного года.
Причем в зависимости от аудитории теста срок его проведения может отличаться в разы.
Для оценки времени проведения мы разработали калькулятор А/В-тестов, который работает на основе большого количества уже накопленных данных и учитывает специфику каждого теста. С его помощью каждый менеджер может мгновенно получить оценку необходимого на А/В-тест времени с учетом всех факторов.
Data science ускоряет аудит продукта
В интерактивных уроках наших курсов нет разделения на теорию и практику — дети учатся в процессе выполнения заданий. Поэтому они должны быть спроектированы так, чтобы понятно объяснить тему и одновременно тренировать навыки решения.
Задания обычно проходят тестирование в школах, где методисты могут пронаблюдать, насколько ученикам понятны условия задачи, формат ожидаемого ответа, интерфейс. Но некоторые проблемы на малых выборках могут остаться незамеченными.
Здесь приходит на помощь изучение данных о детальных действиях учеников внутри заданий: куда кликнули, какие числа ввели, какой ответ выбрали.
Так, например, с помощью анализа данных мы выявили, что в заданиях с элементом «‎барабан» дети ошибаются часто. Дети нажимают на стрелки и меняют варианты ответов, пока не найдут нужный. Смена вариантов анимирована — барабан прокручивается вверх или вниз.
Мы изучили, какие события в этом задании происходили чаще всего:
♦️что делали дети на странице этого задания,
♦️какие действия совершали,
♦️как долго и насколько интенсивно это происходило.