Обложка канала

Datalytics

5840 @datalytx

Канал, посвященный анализу данных с помощью Python. Не столько про машинное обучение, сколько про подготовку/очистку/предобработку данных, использование Python для получения данных из API, парсинга веб-сайтов, автоматизации различной рутины

Datalytics

3 года назад
Открыть в
Python meetup (Online) 1. Методы защиты кластера Hadoop в большой ML команде — Мария Изофатова / Мегафон (Мегатех) Из этого доклада слушатели узнают способы борьбы с уязвимостями кластера hadoop: репартиционирование (проблема мелких файлов), автоочищение таблиц на кластере, настройка конфигурации pyspark, анализ запущенных spark application и внутреннего кода. 2. Feature engineering для пространственных данных — Александр Мещеряков / Сinimex В этом видео мы обсудим как получить нужные данные и погрузимся в анализ формы объектов, взаимного отношения геометрий и паттернов их расположения. 3. Как мы предсказывали платежи в мобильных играх — Дмитрий Савостьянов / Artifactory В рамках доклада я расскажу о дизайне системы предсказания платежей в мобильных играх. Акцент будет сделан на Data Engineering, MLOps и мониторинг ➖➖➖ 🗓 28 июня, начало в 19:00 мск, Среда 🌐 ОНЛАЙН Регистрация на мероприятие