Обложка канала

Datalytics

5840 @datalytx

Канал, посвященный анализу данных с помощью Python. Не столько про машинное обучение, сколько про подготовку/очистку/предобработку данных, использование Python для получения данных из API, парсинга веб-сайтов, автоматизации различной рутины

Datalytics

4 года назад
Открыть в
Тренды в сфере работы с данными 2022. Основной пост 3️ Reverse ETL ETL – это аббревитуара для Extract-Transform-Load. Извлекаем данные из источников, трансформируем (производим определенную предобработку, строим агрегаты, обогащаем) и затем записываем в некоторое хранилище. Reverse ETL не означает, что мы всё это делаем задом наперём Reverse ETL – это подход, при котором есть унифицированный процесс/инструмент/регламент, позволяющий извлекать данные из внутреннего хранилища организации и передавать эти данные в сервисы (чаще всего сторонние) с целью операционализировать эти данные. Под «операционализировать» тут понимается практическое применение данных для принятия решений в регулярных операционных процессах управления (клиентской базой, продажами). Надеюсь, не запутал. На примере: вы определели на основе данных, что пользователь давно не заходил в ваше приложение, вам нужно отправить ему пуш, а делаете вы это через стороннее приложение — в этом случае вы «операционализируете» данные о последнем заходе пользователя для принятия решения о его возвращении в приложение Например, вам нужно передавать в Facebook данные об аудитории, базируясь на поведении пользователей в приложении, передавать данные о клиентах в CRM, передавать офлайн-транзакции в Universal Analytics. Reverse ETL решения позволяют сохранять консистентность данных между разными платформами, а также тратить меньше ресурсов на разработку коннекторов к API, так как уже содержат встроенные. Хорошо про Reverse ETL описано в статье сервиса Hightouch