Обложка канала

LEFT JOIN. Страница 15

5709 @leftjoin

Канал Николая Валиотти об аналитике и визуализации данных, data science и BI

  • LEFT JOIN

    👨‍🏭 Пояснительная бригада к предыдущему посту подъехала! Дело в том, что почти на все вопросы о сроках, я получаю ответ «завтра»: будь то открытие счета в банке (которое по итогу длилось 2 месяца), вызов электрика, оформление документов, обслуживание авто. Завтрамэны повсюду! 🦸🏻
  • LEFT JOIN

    рубрика #ЖизньнаКипре 🇨🇾 Что больше всего бесит на Кипре? Ответ «завтра».
  • LEFT JOIN

    🧑‍💻Как проанализировать всю свою жизнь и найти ответы на важные вопросы? 📊 Этот проект начался как локальная шутка Феликса Краузе и его друзей, чтобы у них всегда был ответ на вопрос “Когда же Феликс вернется в Нью-Йорк или Сан-Франциско?” Вместо того, чтобы отвечать всем, он просто создал сайт, на котором была вся нужная информация о нем. На сегодняшний день Феликс собирает данные о себе ежедневно на протяжении 2,5 лет. Он записывает практически все что делает с невероятной точностью: рост, вес, время сна, калорийность еды (с разбивкой на белки, жиры и углеводы), время за компьютером, спорт, медитации и многое-многое другое. На сайте вы можете увидеть где Феликс сейчас, сколько он сегодня поспал и что поел (понятия не имею, зачем вам эта информация, но понаблюдать за этим интересно). На самом деле целью его проекта было ответить на вопросы о своей жизни, такие как: 🔹 Как жизнь в разных городах влияет на спорт, производительность труда и ощущение счастья? 🔸 Как сон влияет на то, как пройдет день или качество занятия спортом? 🔹 Как погода и разные времена года влияют на мою жизнь? 🔸 Есть ли какие-либо тенденции за последние несколько лет? 🔹 Как время проведенное за компьютером, работа и рабочие встречи влияют на мою личную жизнь? Думаю, что он старается сделать выводы исходя из данных и внедрить их в свою жизнь. На его сайте есть 42 визуализации данных, которые вы тоже можете просмотреть (не заинтересоваться просто невозможно) и заметить какие-то существенные закономерности🙃
  • Реклама

  • LEFT JOIN

    Автор этого канала каждый день читает зарубежные источники и публикует новости про технологии и стартапы, которые все пропустили. • Как Илон Маск собирается улучшить климат на Земле? • Какие решения ищет Netflix после потерь подписчиков? • Почему нейросети могут заменить дизайнеров? Канал уже почти три года читают тысячи айтишников и экспертов по бизнесу. Присоединяйтесь к ним — подписывайтесь на @notboring_tech #promo
    Not Boring Tech

    Пишу про мир технологий и стартапов 🤖💖 Кто я и о чём канал: t.me/notboring_tech/2063 Чат канала: @neural_chat Связь/сотрудничество: @fraizy_qwerty

    Telegram
  • LEFT JOIN

    🚨 Справочник по каналу 🚨 Немного очевидного: меня зовут Николай Валиотти, LEFT JOIN – телеграм-канал, который я веду вместе со своей командой Valiotti Analytics. Меня увлекает тема анализа, инжиниринга и визуализации данных, а также машинного обучения. Этот канал появился в ноябре 2018 года и довольно стремительно развивается все это время от заметок автора по теме интересных инструментов и приемов в Python/SQL к полноценному медиа со своим подкастом, дайджестами и примечательными проектами. Мне бы хотелось, чтобы у всех специалистов была возможность разобраться в сложной информации об анализе данных, поэтому мы рассказываем об этом простым языком с яркими примерами. Чаще всего в канале можно встретить именно такой контент. Однако иногда я просто публикую интересные новости IT-сферы, поэтому не удивляйтесь. Например, у нас есть рубрика Новостной Дайджест, где информация далеко не только о данных. 🙋 Немного обо мне: ▫️С 2009 года работаю в области анализа данных и даже защитил кандидатскую диссертацию в СПбГУ по теме использования нейронных сетей ▫️Сейчас я учусь на программе Master of Analytics в американском ВУЗе Georgia Tech ▫️Работал в ряде крупных компаний: Лента, Yota, Балтика, Юлмарт, Tapcore, Airpush ▫️Увлекался программированием на разных языках: PHP, JS, C++ (в универе), Java, R, Python, а потом переключился на создание бизнеса, и так в 2019 году появилась компания Valiotti Analytics ▫️Развиваю c партнером стартап Mprove – self-service BI-платформа. ▫️Занимаюсь ангельским инвестированием в технологичные проекты преимущественно в области данных. Если вы – такой проект, то скорее пишите мне. ▫️Интересуюсь криптовалютой и проектами в этой области (особенно здорово, когда они на стыке с данными/аналитикой). ▫️Живу на Кипре с женой и дочкой, увлекаюсь теннисом 🎾, периодически рублю в плойку 🎮 😇 🛠 Услуги 🔹В рамках Valiotti Analytics мы помогаем компаниям строить аналитический стек: процессы инжиниринга, хранилища данных, отчетность, внедрение BI-инструментов на всем, что называется избитым "modern data stack" 🔹Для нас это означает, что мы работаем с современными цифровыми заказчиками, использующими облачные технологии, и совсем не работаем с несколько устаревшим стеком, где, например, присутствует 1С 🔹Также иногда я помогаю в персональном менторинге и консультирую владельцев компаний/топ-менеджеров ❕ Важные материалы 📝 Полезные посты из блога LeftJoin Аналитические метрики здорового маркетолога Лонгрид про выбор цветов для визуализации данных Мануал по Yandex.Datasphere Поиск интересных новых мест по геотегам в Instagram Граф телеграм-каналов по теме аналитики Дашборд первых 8 месяцев жизни малыша Как посчитать Retention? 👫 Совместные проекты Дашборд с анализом рынка вакансий аналитиков c hh.ru с @revealthedata 📚 Статьи на Хабре Используем serverless для построения аналитики на данных из AmoCRM в Yandex.Cloud Подробный анализ телеграм-канала Артемия Лебедева и кое-что еще 🔬 Исследования Исследование рынка онлайн-образования по анализу данных в России 📰 Интересные новости Партнерство Tableau и Looker Десять open-source аналогов Google Analytics Игра, которая навела много шума: Wordle Современные тренды веб-парсинга Snowflake купил Streamlit: почему это важно? Список альтернатив Slack 🎞 Канал на YouTube Все, что нужно знать про поступление в магистратуру Georgia Tech Гайд по современным BI-инструментам 🎤 Интервью и выступления Выступление на SmartData: Self-Service BI Выступление на Матемаркетинге Интервью для @start_ds Интервью для @revealthedata 🎧 Подкаст Data Heroes 👾 Эпизод 1: Как получить профессию аналитика данных и не выкинуть деньги на ветер? Эпизод 2: Обучение аналитике без денег — миф или реальность? 📧 Контакты и ссылки С удовольствием знакомлюсь и общаюсь с новым и интересными людьми! Если у вас что-то есть по делу, пишите. Телеграм — @valiotti Почта — [email protected] Valiotti Analytics | Блог Left Join | Tableau Public | YouTube Подкаст Data Heroes | Твиттер | LinkedIn
  • LEFT JOIN

    Ура! 🎉 Мы пробили отметку в 10К подписчиков! Спасибо всем и каждому, кто подписан, вы невероятно мотивируете меня и всю команду продолжать делать интересный контент. 😎😎 Иногда вспоминаю времена, когда в канале было 100 человек и некоторые мои знакомые удивлялись для чего я все это делаю! Конечно же, в большей степени для себя, но очень рад, что посты, контент и любые другие медийные материалы, которые мы выпускаем, принимаются коммьюнити с интересом 😇 Поэтому огромная благодарность за ваши реакции и репосты 👍👍👍 Пробив отметку в 10К собираюсь написать краткий пост с основными ссылками на публикации в этом канале и блоге, а также с информацией об авторе, чтобы все вновь прибывшие сразу могли узнать, что мы тут публикуем ☺️
  • LEFT JOIN

    👨‍🎨 Как работает DALL-E 2? 🖼 В одном из последних постов рассказали вам про новую AI-модель и поделились кучей ссылок с примерами её работы. Давайте попробуем разобраться, что за магия происходит в модели и как она создает совершенно новые изображения с помощью короткого текстового описания. 💭 Итак, если объяснять процессы, которые происходят в модели простым языком, то глобально их три: модель получает текстовое описание, которое декодируется и попадает в пространство текстовых эмбедингов (математический способ представления информации). Затем они попадают в пространство эмбедингов изображений, где идет поиск наилучшего совпадения. После этого полученный эмбединг декодируется и мы получаем изображение. Вуаля! 📺 В основе модели лежит модель CLIP, которая занимается прямо противоположным: подбирает наиболее точное описание к каждому изображению. Как вы понимаете, для обеих моделей совершенно необходимо огроменное количество данных, а именно пар (изображение–точное описание). Вручную такое сделать достаточно трудно (руки и глаза точно устанут), поэтому данные собраны со всего Интернета. 🧪 Также, при построении DALL-E 2 использовались диффузионные модели. Сейчас мы быстро постараемся это понять, если к этому моменту вы еще не перегружены информацией. Эти модели берут изображение и постепенно добавляют к нему различные шумы до тех пор пока изображение не меняется до неузнаваемости. Затем, они пытаются провернуть этот процесс задом наперед: воссоздать исходное изображение. Таким образом, модель учится самостоятельно генерировать изображения (или любую другую информацию, например, музыку). 🔗 Сила DALL-E 2 заключается в большом количестве парных данных (естественного языка–изображения), которые доступны в Интернете. Использование таких данных не только устраняет недочеты, вызванные трудоемким процессом ручной маркировки данных. В первую очередь, шумный и даже неконтролируемый характер таких данных лучше всего отражает реальные данные, к которым должны быть устойчивы модели глубокого обучения. Если все эти выводы кажутся вам непонятными или недостаточными, то в этом видео девушка еще более подробно (на примере схем и изображений) рассказывает о том, как именно работает DALL-E 2 и почему каждый этап обработки важен и незаменим.
    LEFT JOIN

    Совершенно удивительные достижения из мира AI Еще одна новость про AI-модель: DALL·E 2 — новая система искусственного интеллекта, которая может создавать реалистичные изображения и рисунки исходя из описания на естественном языке. Ну, то есть, вы даете на вход модели данные: “An astronaut riding a horse in a photorealistic style”, а получаете вот такое изображение ⚡️ А еще модель может: ▫️ добавлять и удалять элементы, принимая во внимание тени, отражения и текстуры ▫️ вдохновиться оригиналом картины, рисунка или фотографии и создать изображение в похожем стиле Модель уже очень занимательно повертели в этой статье. Брам Адамс тоже проверил, как работает модель: особенно интересно, как она придумывает постеры и обложки для музыкальных альбомов. Музыканты теперь могут вообще не тратить на то время, а лишь набрасывать идеи и поручать DALL·E всю креативную работу. У меня и моей команды совершенно нет слов, это настоящий прорыв в мире AI. Не терпится пощупать и проверить все своими руками (подали заявку, ждем)!

    Telegram
  • LEFT JOIN

    Помните историю про утечку данных Яндекс.Еды? А вот какое наказание понесла «Яндекс.Еда»: 60 тысяч рублей за наши с вами данные. SRSLY?? На минутку, в этом датасете как минимум 148 тыс. юзеров имеют общую сумму заказов больше чем на 60 тыс. рублей. ❗️А сумма в 60 тысяч рублей это всего лишь 0.0001163% от всей выручки за период в датасете (51,567 миллиардов рублей). Так вот здорово охраняются наши с вами персональные данные🛡 ❓Риторический вопрос: эта статья и наказание означает, что в РФ вообще больше никому нельзя оставлять валидные ПД?
    LEFT JOIN

    🍟 Яндекс, который не оправдал доверия пользователей Наверное, вы уже в курсе: Яндекс конкретно облажался. Весь рунет не первый день разглядывает карту заказов Яндекс.Еды, где и мы с вами, и ваши соседи, и все-все-все. Как минимум, все это крипово. Чем это опасно? В публичный доступ попали наши с вами персональные данные, которые обожают мошенники. Поэтому будьте бдительны, если вам теперь в точности назовут ваш адрес, смогут озвучить сумму ваших трат, назовут вас по имени и даже смогут сказать дату вашего заказа. Это прекрасно работает в социальной инженерии. Искренне считаю это позором службы безопасности Яндекса и крайне неудовлетворен официальным объяснением инцидента. Личный совет: по возможности, не указывайте свои реальные данные там, где нет необходимости это делать и не сохраняйте свои платежные данные во имя удобства оплаты. Раз хакерам удалось украсть эти данные, то значит и кража платежных данных тоже возможна. И в этом уж точно ничего хорошего не будет. Прекращаем нагонять ужас Раз так уже произошло…

    Telegram
  • LEFT JOIN

    В течение десятилетий центральное место в разработке приложений занимала реляционная модель данных, которая используется в таких реляционных СУБД, как Oracle, DB2, SQL Server, MySQL и PostgreSQL. Но в последнее время большое распространение стали получать и другие модели данных - нереляционные / NoSQL. NoSQL — это вид нетабличных баз данных, которые помогают хранить большие массивы данных без определённой структуры. NoSQL стали популярным решением из-за простоты и гибкости разработки, широкого функционала, высокой производительности и возможности горизонтального масштабирования.   В зависимости от модели данных и подходов к распределённости и репликации в NoSQL выделяют четыре основных типа систем: ▪️ключ - значение (Redis, Memcached) ▪️колоночные (SAP IQ, Vertica, ClickHouse, Google BigTable, InfoBright, Cassandra) ▪️документо-ориентированные (CouchDB, MongoDB, Amazon DocumentDB) ▪️графовые (Neo4j, Amazon Neptune, InfiniteGraph, InfoGrid) Данные типы систем используются для решения задач кэширования, машинного обучения, хранения time-series данных или данных различающихся по структуре, размеру и содержанию. Подробнее о преимуществах и недостатках применения различных типов NoSQL-систем и многом другом можете узнать на канале Базы данных и SQL Подписывайтесь: @db_in_it
  • LEFT JOIN

    Вопрос личного характера: может ли кто-то поменять мои Tinkoff USD на крипту (стейбл / любые другие монеты), если можете, напишите в ЛС @valiotti
  • LEFT JOIN

    🦸🏻 Ура! Второй эпизод подкаста DataHeroes уже в сети 🚀 Судя по тому, что многие из вас послушали первый выпуск подкаста, мы движемся в верном направлении! У нас вышел второй выпуск, в котором мы продолжаем говорить об онлайн-образовании в России. Обучение аналитике без денег — миф или реальность? Сегодня мы поговорим о том, почему бесплатно не значит плохо, как найти в себе мотивацию на самообучение и зачем вообще нужны бесплатные курсы их создателям. Наши спикеры — те, кому удалось получить новую профессию без финансовых вложений, а также руководители известных онлайн-платформ и образовательных центров Computer Science Center, DataYoga и DataLearn. Если вы до сих пор считаете, что бесплатный сыр только в мышеловке, то скорее включайте подкаст, мы вас в этом разубедим! Слушайте подкаст на платформах: Spotify, Anchor, Apple Podcasts, Castbox, Overcast, Google, Telegram (↓) #DataHeroes #подкаст
  • LEFT JOIN

    Все что вам может понадобиться во время работы с Yandex.Datalens Павел Дубинин собрал в один пост все (вообще все!) ссылки, которые могут вам пригодиться при работе с Yandex.DataLens. Тут и демо-дашборды, и ссылки на сообщества, и гайды по работе с сервисом, и примеры аналитики реальных данных и многое-многое другое. 💪
    Pavel Dubinin in Yandex DataLens

    Полезные ссылки для знакомства и работы с DataLens Большой функциональный демо дашборд: - datalens.yandex/demo - публичный, только чтение - Развернуть дашборд в своем DataLens для редактирования Сообщество: - Телеграм чат (вы сейчас тут) - Предложить и проголосовать за новую фичу - Плейлист официальных мероприятий на YouTube Обучение: - Быстрый старт, пошаговая инструкция - Более детальные пошаговые инструкции по сценариям - Туториалы по аналитическим функциям: агрегации, оконные функции, Level-of-Detail выражения - Создание SQL-чартов (если вам нужно больше гибкости модели данных) - Образовательные проекты FAQ в документации: - https://cloud.yandex.ru/docs/datalens/qa/ Публичные кейсы использования DataLens: - КазаньЭкспресс - Аналитика retail маркетплейса - Правительство С.-Петербурга - Аналитика городских сервисов - Окраина - Аналитика на мясоперерабатывающем заводе - МВидео - Платформа данных в облаке, геоаналитика - Rubetek - Аналитика IOT по датчикам домов и квартир застройщика ПИК - Moneycare…

    Telegram
  • LEFT JOIN

    Шиншилла, которая всех победила Продолжаем новости из мира AI: недавно было проведено исследование-сравнение различных современных языковых моделей. В результате, новая языковая модель Chinchilla 70B значительно превосходит результаты таких моделей, как Gopher (280B), GPT-3 (175B), Jurassic-1 (178B) и Megatron-Turing NLG (530B). Исследователи обнаружили, что, несмотря на использование различных процедур подбора и обученных моделей, эти три подхода дают сопоставимые прогнозы для оптимального масштабирования параметров и токенов с помощью FLOP. В общем, если вы работаете с языковыми моделями, то пора пробовать новую.
  • LEFT JOIN

    🎉 Finally, we are on Twitter! 🎉 Друзья, хочу поделиться с вами ссылкой на свой твиттер, подпишитесь прямо сейчас, если интересен контент на английском. Сейчас у нас в планах море англоязычного контента, которым я буду делиться там, плюс периодически собираюсь скидывать туда полезные ссылки на тему аналитики, BI, AI и так далее. А еще планирую периодически разбавлять контент юмором, который мне по душе, может он и вас заставит улыбнуться 😉 Конечно, этот телеграм-канал также будет пополняться новыми интересными постами, но если вы хотите видеть новости и контент чаще, то подписывайтесь! P.S. Вчера в Twitter я уже опубликовал ссылку на наш первый материал на Medium.
    Nikolay Valiotti (@nvaliotti) | Twitter

    The latest Tweets from Nikolay Valiotti (@nvaliotti). Founder of https://t.co/hnmXUntDJL Co-founder of https://t.co/iPdkDhKR88 Ph.D. in Data Science @ SPBU Master of Analytics @ US Georgia Tech (in progress). Cyprus

    Twitter
  • LEFT JOIN

    Самая скучная профессия? Исследование Университета Эссекса определило портрет самого скучного человека в мире — это религиозный специалист по вводу данных, который любит смотреть телевизор и живет в городе. А самой скучной профессией стал Data Analysis.
  • Реклама

  • LEFT JOIN

    Совершенно удивительные достижения из мира AI Еще одна новость про AI-модель: DALL·E 2 — новая система искусственного интеллекта, которая может создавать реалистичные изображения и рисунки исходя из описания на естественном языке. Ну, то есть, вы даете на вход модели данные: “An astronaut riding a horse in a photorealistic style”, а получаете вот такое изображение ⚡️ А еще модель может: ▫️ добавлять и удалять элементы, принимая во внимание тени, отражения и текстуры ▫️ вдохновиться оригиналом картины, рисунка или фотографии и создать изображение в похожем стиле Модель уже очень занимательно повертели в этой статье. Брам Адамс тоже проверил, как работает модель: особенно интересно, как она придумывает постеры и обложки для музыкальных альбомов. Музыканты теперь могут вообще не тратить на то время, а лишь набрасывать идеи и поручать DALL·E всю креативную работу. У меня и моей команды совершенно нет слов, это настоящий прорыв в мире AI. Не терпится пощупать и проверить все своими руками (подали заявку, ждем)!
  • LEFT JOIN

    Децентрализованный Twitter? Что? Уже некоторое время популярной темой для обсуждения считается Web3.0 (клевая статья у вастрика на этот счет). Недавно на просторах сети я наткнулся на новую open-source социальную сеть – Mastodon. Ее основное отличие – децентрализованность. Каждый пользователь может развернуть эту соцсеть на своем сервере со своими правилами, целями и так далее. Личные данные в полной безопасности, ведь они не передаются на общий сервер, а остаются лишь у вас. Можно подписываться как на пользователей внутри одного сервера, так и на любых других пользователей сети, делиться контентом, выкладывать фотографии и оставлять коменты. Поскольку в этой соцсети нет услуг для монетизации контента, она не может обанкротиться или быть заблокированной (сейчас это кажется весьма актуальным!). А еще там нет рекламы (ну, пока), в общем, сплошные плюсы 😎

    Mastodon is an open source decentralized social network - by the people for the people. Join the federation and take back control of your social media!

    joinmastodon.org
  • LEFT JOIN

    Сервис онлайн-обучения цифровым профессиям Яндекс Практикум запускает программу обучения по специальности «Инженер данных». Курс предназначен для студентов с как минимум базовым знанием SQL и Python — перед стартом необходимо пройти тест. Авторы и преподаватели – практикующие эксперты ведущих российских IT-компаний. Длительность — 6,5 месяцев. Курс на 75% состоит из практических занятий – по окончании программы в вашем портфолио будет не менее 10 проектов. Вы научитесь: - работать с технологиями Python, SQL, Metabase, Airflow, PostgreSQL, MongoDB, ClickHouse, Celery, Kafka, Hadoop, Apache Spark, Spark Streaming и Yandex.Cloud - извлекать, очищать и сохранять данные - создавать и поддерживать хранилища типов Data Warehouse и Data Lake - работать со стриминговой обработкой данных и облаками Претендовать на работу по новой специальности студенты курса смогут уже в ходе обучения – с поиском вакансии помогут специалисты карьерного центра Яндекс Практикум. Запись на курс открыта, старт занятий для ближайшего потока студентов – 18 апреля. Стоимость курса: 95 000 рублей при разовой оплате, при оплате в рассрочку – 17 000 рублей в месяц. По завершении программы студенты получат диплом о профессиональной переподготовке. Запись на бесплатную вводную часть и подробности по ссылке. #реклама
    Курс «Data Engineer» — онлайн-обучение профессии инженер данных от сервиса Яндекс Практикум

    Онлайн-курс «Data Engineer» от сервиса Яндекс Практикум. 6.5 месяцев обучения на инженера данных с выдачей диплома о профессиональной переподготовке.

    Яндекс.Практикум