Канал, посвященный анализу данных с помощью Python. Не столько про машинное обучение, сколько про подготовку/очистку/предобработку данных, использование Python для получения данных из API, парсинга веб-сайтов, автоматизации различной рутины
Python meetup (Online)
1. Методы защиты кластера Hadoop в большой ML команде — Мария Изофатова / Мегафон (Мегатех)
Из этого доклада слушатели узнают способы борьбы с уязвимостями кластера hadoop: репартиционирование (проблема мелких файлов), автоочищение таблиц на кластере, настройка конфигурации pyspark, анализ запущенных spark application и внутреннего кода.
2. Feature engineering для пространственных данных — Александр Мещеряков / Сinimex
В этом видео мы обсудим как получить нужные данные и погрузимся в анализ формы объектов, взаимного отношения геометрий и паттернов их расположения.
3. Как мы предсказывали платежи в мобильных играх — Дмитрий Савостьянов / Artifactory
В рамках доклада я расскажу о дизайне системы предсказания платежей в мобильных играх. Акцент будет сделан на Data Engineering, MLOps и мониторинг
➖➖➖🗓 28 июня, начало в 19:00 мск, Среда
🌐 ОНЛАЙН✅Регистрация на мероприятие