Обложка канала

Datalytics. Страница 10

5840 @datalytx

Канал, посвященный анализу данных с помощью Python. Не столько про машинное обучение, сколько про подготовку/очистку/предобработку данных, использование Python для получения данных из API, парсинга веб-сайтов, автоматизации различной рутины

  • Datalytics

    Тренинг Russian BI vs Power BI. 23 июля в Москве Что ждёт Power BI в России? Стоит ли его изучать/внедрять или же пора подыскивать ему замену? 23 июля в Москве будет очный тренинг Алексея Колоколова, на котором за 1 день вы научитесь строить дашборд в Power BI уровня топ корпораций. И попрактикуетесь на отечественном BI. ЧТО БУДЕТ: 1. Лучшие практики бизнес-дашбордов. Для заказчика не имеет значения платформа, ему нужны удобные и понятные отчеты. Алексей поделится принципами, которые одинаково работают во всех BI-системах. 2. Продвинутая визуализация и интерактивные сценарии в Power BI. Многие продолжают развивать на нем аналитику. А тем, у кого импортозамещение - будет образец, чего хотеть от русских BI. Чтобы равнялись не на таблицы Excel, и даже при миграции сделали шаг вперед. 3. Независимый обзор рынка и практика с отечественными BI. Вы на практике убедитесь, что можно сделать своими руками стандартными средствами, а где нужна кастомная разработка, и какова цена вопроса. Будет кейс с подготовкой данных на Loginom от нас симулятор принятия решений на Visiology и сборка дашборда на DataLens. 4. Обмен обпытом и нетворкинг. В перерывах мы делимся неформальными историями и заводим полезные знакомства. Вечером будет фуршет, а спустя неделю онлайн-сессия с разбором домашних заданий. До встречи в субботу 23 июля, 10:00 - 19:00. УЦ Технопрогресс (м. Технопарк) Для подписчиков канала Скидка 10% по промокоду: DL-10 Регистрация: https://bit.ly/3NZ5qqV
    Как заставить данные говорить: курс для аналитиков и менеджеров

    Russian BI v/s Power BI. Тренинг по дашбордам в разных системах за один день!

    Alexkolokolov
  • Datalytics

    Как на ваши шансы стать аналитиком влияют пол, возраст, регион и образование? Узнайте на вебинаре. → Бесплатно, 14 июля в 19:30 Вебинар будут вести наши выпускники. Они знают, что освоить цифровую профессию может каждый. Возможно, их пример убедит и вас. ◾️ Нил Новиков, 43 года, Липецк. Работал видеомонтажёром ВГТРК. Стал аналитиком отдела безопасности металлургической компании НЛМК. ◾️ Мария Новожилова, мама троих детей, 40 лет, Москва. Работала продакт-менеджером. Училась во время декрета. Стала ревьюером на курсе по аналитике данных в Практикуме. Опираясь на свой опыт, спикеры расскажут: — можно ли сменить профессию, если, нет опыта в IT, аналитике и программировании; — можно ли успешно совмещать обучение, работу и семью; — как справляться со сложностями в учёбе; — влияют ли пол, возраст и регион на трудоустройство. Зарегистрироваться на вебинар
  • Datalytics

    Интересная статья в блоге Бюро Сервисного Дизайна про различие бизнесов, которые разговаривают только на языке показателей, и бизнесов, говорящих на языке логики Автор приводит и рассматривает формулировку закона Гудхарта: Как только статистический показатель становится целью, он перестаёт отражать реальность. Бизнесы, где менеджмент помешан на метриках, склонны выстраивать между метриками несуществующие казуальные связи, например, выстраивая взаимосвязь между NPS и выручкой. Взаимосвязь действительно есть, но это не линейная зависимость, а значит в её рассмотрении важно понимать как построены процессы, осознавать благодаря каким действиям (проектам) будет осуществлен рост одной метрики (например, NPS) и как изменение клиентского опыта будет влиять на рост другой метрики (в данном случае, выручки) Для управления действительно нужно обращать внимание на метрики, но этого не достаточно. Управляющее воздействие должно быть обращено не на метрику, а на логику, которая лежит в основе процесса. А метрика – всего лишь показатель, по изменению которой мы судим правильно ли наше управляющее воздействие или его нужно корректировать Автор находит и ответ на вопрос «Почему так популярна data-driven методология в управлении?». Часто этот подход позволяет закрыть дыры в управленческой компетенции, потому что data-driven подход выигрывает у подхода, когда менеджмент не опирается ни какие данные, а принимает решения интуитивно. Таким образом, метрики часто используются как способ «систематизировать бардак». Но выигрывает подход, при котором есть и метрики, и принятие решений, основанное на понимании логики процессов компании blog.buro.cx/govorim…-loghiki
    Говорим с бизнесом на языке логики

    Есть бизнесы, которые говорят на языке метрик. А есть, которые говорят на языке логики. Первых больше, но они часто попадают в ловушку, которая описывается законом Гудхарта

    Блог Бюро Сервисного Дизайна
  • Реклама

  • Datalytics

  • Datalytics

    Продолжая тему DataLens, затронутую в предыдущем посте Недавно ребята из DataLens проводили вебинар, посвященный безопасности и разграничении прав доступа в DataLens. Делюсь записью этого вебинара В рамках вебинара менеджеры по развитию Павел Дубинин и Рами Мулейс осветили такие вопросы: - DataLens как часть облака в организациях; - какие бывают учётные записи: федеративные, доменные, социальные и @yandex.ru; - необходимые роли Yandex Cloud и как их задавать; - внутренние каталоги объектов DataLens и логика прав; - как безопасно поделиться дашбордом и что нужно знать о «публикации»; - как настроить Row-Level Security вручную и через БД; - общие вопросы безопасности в Yandex DataLens; - планы развития сервиса. Сразу спойлерну про планы. В планах развития сервиса Павел Дубинин подсветил появление: - Групп в Identity ans Access Management - Групповых операций с объектами - Рекурсивное назначение прав через папки - Воркбуков (это мне показалось наиболее интересным, потому что воркбуки объединят между собой подключения, датасеты, чарты, дашборды в единую сущность, к которой можно предоставлять доступ) https://www.youtube.com/watch?v=NXEiPMfXwPo
    Yandex DataLens: безопасность и разграничение прав доступа

    Всё, что нужно знать о безопасности и разграничении прав доступа в Yandex DataLens. На вебинаре рассказали, как обеспечить комфортную и безопасную работу вашей команды с аналитикой, разобрались в текущих нюансах. Спикеры поделились лучшими практиками и ответили на часто задаваемые вопросы. Обсудили подробно: * DataLens как часть облака в организациях; * какие бывают учётные записи: федеративные, доменные, социальные и @yandex.ru; * необходимые роли Yandex Cloud и как их задавать; * внутренние каталоги объектов DataLens и логика прав; * как безопасно поделиться дашбордом и что нужно знать о «публикации»; * как настроить Row-Level Security вручную и через БД; * общие вопросы безопасности в Yandex DataLens; * планы развития сервиса; * сессия вопросов и ответов. Полезные ссылки: Как начать работу с Yandex DataLens https://www.youtube.com/watch?v=kqYiMYpgBNQ Безопасность Yandex Cloud https://cloud.yandex.ru/security Таймкоды: 00:00 Интро 00:05 Yandex DataLens: безопасность и разграничение прав доступа 03:14 Общие вопросы безопасности 18:45 Безопасная работа в Yandex DataLens 44:08 Планы 47:50 Сессия Q&A

    YouTube
  • Datalytics

    На vc.ru вышел подробный гайд про создание дашборда в DataLens Гайд освещает все шаги в процессе: - Создание подключения к базе данных - Создание датасета - Настройка полей - Создание визуализаций (в том числе визуализаций с иерархиями, сводных таблиц, а также визуализаций на карте) - Формирование дашборда - Фильтрация данных дашборда Как по мне, то получилось хорошее пошаговое руководство, которое может быть хорошим первым шагом в изучении DataLens vc.ru/service…trukciya
  • Datalytics

    Узнайте, чем занимаются инженеры данных в fintech-компаниях и как начать карьеру в этой сфере. → Бесплатный вебинар 6 июля в 19:00 О профессии расскажут эксперты: ◾️ Анатолий Бардуков, ML Engineer в Яндекс Дзене; ◾️ Антон Поляков, руководитель группы в компании ГлоуБайт Аналитические Решения; ◾️ Сергей Виноградов, руководитель службы машинного обучения и анализа данных Финансовых сервисов Яндекса Вы узнаете: — как дата-инженеры помогают бизнесу расти; — задачи и зоны ответственности инженера данных; — стандарты, регуляторы и безопасность работы в финтехе; — какие навыки и технологии нужны, чтобы начать карьеру; — сколько готовы платить начинающим дата-инженерам и сколько опытным; — чем будут заниматься дата-инженеры через 5—15 лет в банках. А ещё — разберётесь, какие особенности обработки и хранения данных есть в финансовых компаниях. Спикеры поделятся реальными кейсами со своих проектов. → Зарегистрироваться на вебинар
  • Datalytics

    ☕️ Под утренний кофе: еженедельный дайджест о технологиях, данных и аналитике 🗞 📖 Подробный гайд по кластеризации Школа анализа данных (ШАД) написали отличную и весьма подробную практическую главу в рамках учебника по ML. Крайне приятно, что погузиться в тему можно даже тем, кто никогда не слышал о кластеризации раньше, ведь все термины вводятся и объясняются постепенно, а также гайд полон визуализаций. В нем разобраны самые современные методы: метод К-средних, DBSCAN и другие. Большое спасибо автору, ждем новых глав! 🙊 DALL-E Mini нашли неожиданное применение: генератор мемов В начале июня в соцсетях «завирусился» сервис DALL-E Mini: первая версия нейросети от OpenAI, доступная всем пользователям. В результате любого запроса сервис генерирует коллаж из 9 наиболее релевантны изображений и... получается довольно забавно, а иногда и крипово. Этим воспользовался один из пользователей, который в итоге завел отдельную страницу в Twitter и раздел в Reddit, где начал собирать созданные DALL-E Mini изображения. В ленте твиттера вы можете увидеть коллажи и текст запроса, которые не иначе кроме как "мем" зачастую и не назовешь)) 🚫 Современные трудности и способ их преодоления Ребята из iPhones нашли способ установки удаленных из AppStore приложений (Альфа-Банк, Сбербанк Онлайн и другие), который может помочь установить их на новый телефон, если есть такая необходимость. Важных условий всего два: нужно установить программу iMazing (бесплатного демо-периода будет вполне достаточно), а также приложение, которое вам нужно, должно было быть уже загружено раньше под вашей учетной записью. Пишите в комментариях, если проверяли этот способ или знаете какие-то другие! 👾 Что нового появится в Python 3.11? Недавно появилась первая бета-версия Python 3.11, в которой есть несколько интересных функций: указание точного места возникновения ошибки (например, в какой части вычисления), добавление примечаний к объектам исключений, встроенная поддержка форматов toml библиотекой tomllib и многие другие более узкоиспользуемые функции. Вдобавок ко всему вышеперечисленному есть еще один плюс: в этой версии Python также стал в среднем на 22% быстрее. К октябрю, когда выйдет финальный релиз, он, возможно, станет работать еще быстрее. Ждете выход новой версии? #weekly #дайджест
    Учебник по ML от ШАД

    Онлайн-учебник по машинному обучению от ШАД — для тех, кто не боится математики и хочет разобраться в технологиях ML. Вы изучите классическую теорию и тонкости реализации алгоритмов, пройдя путь от основ машинного обучения до тем, которые поднимаются в свежих научных статьях.

    ml-handbook.ru
  • Datalytics

    ⚡️ Аналитика данных - блог ведущего Дата саентиста, работающего с данными в Uber, одного из авторов легендарного🔥 Machine Learning. Материал канала поможет реально вырасти до профессионала по работе с данными и получить самую высокоплачиваю ит-профессию. 1 канал вместо тысячи учебников и курсов, подписывайтесь: 👇👇👇 @data_analysis_ml
  • Datalytics

    💥29 июня (среда) 17:00 (мск) Онлайн-встреча: Определение трендов развития цифровых проектов в 2022 году Спикеры встречи: ✅Крупенин Дмитрий - Владелец портфеля продуктов в ПАО «Первая Грузовая Компания» Константинова Диана - e-com эксперт & основатель первого в РФ toy-sharing стартапа Tidi Садыков Артем - старший владелец продукта по направлению УЦП & Логистика «СИБУР Диджитал» Мы поговорим о трендах, которые сформировались в 2022 году в сфере управления и развития цифровых продуктов. Все подробности по ссылке: 👉🏻 РЕГИСТРАЦИЯ👈🏻 Ссылку на трансляцию выложим в канал + отправим на почту за 1 час до ивента. Регистрируйся и присоединяйся! Бесплатно. Онлайн
  • Datalytics

    Как прояснять интересы бизнес-заказчиков перед запуском новых продуктов? Как подготовиться к интервью с пользователями продукта, чтобы результаты приносили пользу? Мы в крупном EdTech проекте разрабатываем новый курс про интервью и кастдевы. И в рамках подготовки к нему, проводим бесплатный воркшоп «Как вопросы и гипотезы помогают достичь целей интервью». 👉 Если вы сталкиваетесь с задачей проведения интервью и кастдевов в своей работе и испытываете сомнения в своих действиях — этот воркшоп для вас. Когда? 28 июня в 19.00 в зуме Кому будет полезно? * продакт-менеджерам * бизнес-аналитикам * маркетологам О чем будем говорить: 🔸 как сформулировать правильные вопросы и гипотезы для интервью 🔸как применять инструменты на практике и избежать ошибок Что будем делать: 🔸формулировать цели и гипотезы интервью 🔸тренироваться формулировать вопросы, которые помогут достичь цели интервью Воркшоп ведёт Наталья Эйсмант Product manager с 6-летним опытом создания продуктов. 🔮 Регистрируйтесь и зовите коллег ❗️Участие в воркшопе бесплатное
  • Datalytics

    Немного про аналитику in real life, не применительно к цифрам и фактам, а больше к самому себе как объекту наблюдений, обладающим внутренними свойствами, которые подчас кажутся рациональными, но бывают очень тонки и неоднозначны Неоднозначны наши внутренние свойства благодаря такому явлению как рефлексия, которое в свою очередь опирается как на объективную действительность, так и на субъективную Чудо рефлексии состоит в том, что с её помощью мы можем выбирать интерпретацию. К сожалению, в раннем детстве большинство из нас лишены этой привелегии: из-за этого не оставляем внутри себя пространства между стимулом и суждением. Многие из нас не находят этого пространства и во взрослом возрасте. Как итог очень часто наши суждения становятся тем, что мы будто бы выбираем единожды и идём с этим всю свою сознательную жизнь Воля выбирать интерпретацию исходит из мышления. Мышление, которое дарует нам узкий (и почти сходящийся к нулю) зазор между стимулом и реакцией. Именно этот зазор драматически расширяет пространство неопределённости решений, но вместе с тем дарует свободу Используйте этот зазор часто, но не слишком, на своё усмотрение
  • Datalytics

    📈 Grammar of graphics in a nutshell 📖 Вас когда-нибудь интересовало как работают такие фреймворки, как Observable Plot, ggplot2 или Vega-Lite? Автора этой статьи всерьез заинтересовал этот вопрос, поэтому он посмотрел множество реализаций, прочитал кучу статей, и кое-что придумал. Пересказывать изучение визуализации целиком было бы глупо (важную чсть исследования составляют примеры и код), поэтому мы вкратце пройдемся по самым важным моментам, а полную цепочку преобразований лучше увидеть своими глазами на сайте. 🤔 Что вообще такое грамматика графики (GoG)? Грамматика графики (GoG) — это язык для определения статистической графики, такой как гистограммы, диаграммы рассеяния и линейные графики из составных частей. Возможно, вы слышали или даже использовали библиотеку, построенную на GoG, такую ​​как Observable Plot, ggplot2, Vega-Lite и Swift Charts. 🔗 Конвейер GoG Грубо говоря, GoG разделяет визуализацию данных на два отдельных этапа: данные - кодировки + метки -> абстрактное пространство - масштабы-> экранное пространство. ⚪ Все начинается с формы Прежде чем мы сможем перейти к реальным компонентам GoG, нам нужен способ рендеринга элемнтов на экране. Для этого используется SVG и создается несколько простых основных элементов: прямоугольник и круг. С помощью этих элементов, впоследствии, будет выстроена вся визуализация. Кстати, некоторое время назад я частично рассказывал про d3.js и даже делился примером. ⚖️ Веса и абстрактное пространство Чтобы сопоставить абстрактное визуальное пространство и пространство пикселей экрана, используются шкалирование. В чем разница между абстрактным и экранным пространством? Экранное пространство — (во всех смыслах и целях) декартова система координат, а абстрактное пространство не обязательно должно быть таковым. Шкалы используются для построения отображений из абстрактного пространства в пространство экрана, чтобы точно передавать информацию, которая заключается в данных. ⏭ Затем в статье объясняются нюансы меток, кодировок, осей и легенды графика, но тут без визуальных объяснений не обойтись, поэтому переходите на сайт. 🚀 В целом, это, конечно, маленькая и неполная версия грамматики графики. Тем не менее, она позволяет рассмотреть весь путь создания визуализации: от исходных данных до графика на экране.
    A Very, Very Tiny Grammar of Graphics

    If you've ever wondered how frameworks like Observable Plot, ggplot2, or Vega-Lite work, you've come to the right place! I was wondering the same thing, so I looked at a bunch of implementations, read a bunch of papers, and this is what I came up with. Below, you'll find a walkthrough of the Grammar of Graphics and how you might implement data viz framework based on it. My implementation most closely follows Observable Plot's. First, some dataset imports The Grammar of Graphics (GoG) is a language for defin

    Observable
  • Datalytics

    Знаете базу SQL, но для работы этого мало? Курс «Аналитик данных» научит вас говорить с аналитиками на одном языке. Изучите все инструменты для работы с данными: Python, SQL, Tableau, теорию вероятностей, статистику, бизнес-метрики и визуализацию данных. Даже если вы никогда не программировали или не разбираетесь в математике. Теория и практика кода будет в интерактивном тренажёре. А ещё — на проектах, учебных и реальных. 170+ наших студентов работали над задачами в НКО и коммерческих компаниях. Поддерживать вас будет целая команда сопровождения. Специалисты помогут со сложными темами, проверят код и не дадут прокрастинировать. Оплачивать учёбу можно помесячно. Если сомневаетесь, подойдёт ли вам курс — попробуйте бесплатную вводную часть. В ней можно посмотреть, как работает тренажёр и какие задания предстоит выполнять. → Старт потока — 23 июня Попробуйте курс бесплатно
  • Datalytics

    Вам надоело просто читать твиты Илона Маска, и вы сами хотите прикоснуться к миру IT-технологий? 🚀 Академия Аналитиков Авито запустила набор на бесплатный курс по обучению профессиям «Аналитик данных» и «DS-инженер». 💪 3 причины подать заявку на курс: 🔹 востребованные специальности, в которых нуждаются IT-компании; 🔹 вас будут учить топовые специалисты Авито, которые покажут на примере реальных задач, как осуществляется работа; 🔹 шанс получить оффер. Успейте оставить заявку на участие 👉 clc.to/E4zuGw
  • Реклама

  • Datalytics

    Интересная статья про разбор преимуществ языка R перед Python для задач анализа данных и data science Основная мысль статьи, как мне кажется, вертится вокруг того, что R изначально был задуман как язык для различных манипуляций с данными, в итоге в нём предусмотрены необходимые типы данных, векторизация, удобная работа с табличными данными, пайплайны обработки данных и многое другое. В Python это всё тоже есть, но в виде «наворачиваемых» сверху пакетов, таких как numpy и pandas, но им неминуемо приходится адаптироваться к ООП-шной архитектуре Python, от чего возникает ряд решений, которые кто-то может назвать костыльными Лично для меня Python всё-таки остаётся основным языком в анализе данных, так как уже слишком много времени и ресурсов затрачено на то, чтобы его изучить. Но для кого-то эта статья может быть хорошим набором аргументов для того, чтобы изучить R https://habr.com/ru/post/670250/
    Кто за всех решил, что python удобен для «гражданской» аналитики?

    «Гарри Поттер и философский камень», (2001) ИТ-шником (программистом) нынче быть привлекательно. Дата саентистом тоже неплохо. Создаются и множатся курсы. Только вот они все однобокие. Несмотря на...

    Хабр
  • Datalytics

    Kuber Conf — конференция по контейнерной разработке от Yandex Cloud — возвращается в 2022! 23 июня (чт) в 14:00 Мск, в онлайн или офлайн-формате. Мы расскажем, как не тратить на разработку месяцы, а проверять гипотезы и применять фичи на лету на всех этапах — от проектирования до эксплуатации и защиты. Поделимся опытом из первых рук — от авторов, создающих контейнерные проекты с Kubernetes®. Будет интересно DevOps и DevSecOps, архитекторам и разработчикам. Количество мест ограничено, регистрируйтесь
  • Datalytics

    Яндекс Практикум ищет наставников на курсы по Data Science и Аналитик данных Ждём специалистов с такими навыками: ▪️Python для анализа данных; ▪️библиотеки pandas, NumPy, Matplotlib, sklearn; ▪️основы математического анализа, линейной алгебры, теории вероятности и статистики. ▪️Мы также ценим опыт преподавания и наставничества. Мы предлагаем: → Частичную занятость. → Доход от 30 000 ₽ в месяц. → Удалённую работу с гибким графиком от 8 часов в неделю. → Сильный опыт менторства: научим давать развивающую обратную связь начинающим аналитикам, работать с критикой и возращениями и учить их совершенствовать проекты. → Бесплатное обучение в Школе наставников. → Доступ к курсу Практикума по Data Science или Аналитик данных и скидки на остальные курсы. → Углубление знаний и развитие софт скиллов. Помогайте новичкам развиваться и учитесь сами — каждый день. Если вам интересно поработать с нами — оставьте заявку.