LEFT JOIN, страница 15, все посты канала

LEFT JOIN

👨‍🏭 Пояснительная бригада к предыдущему посту подъехала! Дело в том, что почти на все вопросы о сроках, я получаю ответ «завтра»: будь то открытие счета в банке (которое по итогу длилось 2 месяца), вызов электрика, оформление документов, обслуживание авто. Завтрамэны повсюду! 🦸🏻

LEFT JOIN

рубрика #ЖизньнаКипре 🇨🇾 Что больше всего бесит на Кипре? Ответ «завтра».

LEFT JOIN

🧑‍💻Как проанализировать всю свою жизнь и найти ответы на важные вопросы? 📊 Этот проект начался как локальная шутка Феликса Краузе и его друзей, чтобы у них всегда был ответ на вопрос “Когда же Феликс вернется в Нью-Йорк или Сан-Франциско?” Вместо того, чтобы отвечать всем, он просто создал сайт, на котором была вся нужная информация о нем. На сегодняшний день Феликс собирает данные о себе ежедневно на протяжении 2,5 лет. Он записывает практически все что делает с невероятной точностью: рост, вес, время сна, калорийность еды (с разбивкой на белки, жиры и углеводы), время за компьютером, спорт, медитации и многое-многое другое. На сайте вы можете увидеть где Феликс сейчас, сколько он сегодня поспал и что поел (понятия не имею, зачем вам эта информация, но понаблюдать за этим интересно). На самом деле целью его проекта было ответить на вопросы о своей жизни, такие как: 🔹 Как жизнь в разных городах влияет на спорт, производительность труда и ощущение счастья? 🔸 Как сон влияет на то, как пройдет день или качество занятия спортом? 🔹 Как погода и разные времена года влияют на мою жизнь? 🔸 Есть ли какие-либо тенденции за последние несколько лет? 🔹 Как время проведенное за компьютером, работа и рабочие встречи влияют на мою личную жизнь? Думаю, что он старается сделать выводы исходя из данных и внедрить их в свою жизнь. На его сайте есть 42 визуализации данных, которые вы тоже можете просмотреть (не заинтересоваться просто невозможно) и заметить какие-то существенные закономерности🙃

LEFT JOIN

Автор этого канала каждый день читает зарубежные источники и публикует новости про технологии и стартапы, которые все пропустили. • Как Илон Маск собирается улучшить климат на Земле? • Какие решения ищет Netflix после потерь подписчиков? • Почему нейросети могут заменить дизайнеров? Канал уже почти три года читают тысячи айтишников и экспертов по бизнесу. Присоединяйтесь к ним — подписывайтесь на @notboring_tech #promo

Not Boring Tech

Пишу про мир технологий и стартапов 🤖💖 Кто я и о чём канал: t.me/notboring_tech/2063 Чат канала: @neural_chat Связь/сотрудничество: @fraizy_qwerty

Telegram

LEFT JOIN

🚨 Справочник по каналу 🚨 Немного очевидного: меня зовут Николай Валиотти, LEFT JOIN – телеграм-канал, который я веду вместе со своей командой Valiotti Analytics. Меня увлекает тема анализа, инжиниринга и визуализации данных, а также машинного обучения. Этот канал появился в ноябре 2018 года и довольно стремительно развивается все это время от заметок автора по теме интересных инструментов и приемов в Python/SQL к полноценному медиа со своим подкастом, дайджестами и примечательными проектами. Мне бы хотелось, чтобы у всех специалистов была возможность разобраться в сложной информации об анализе данных, поэтому мы рассказываем об этом простым языком с яркими примерами. Чаще всего в канале можно встретить именно такой контент. Однако иногда я просто публикую интересные новости IT-сферы, поэтому не удивляйтесь. Например, у нас есть рубрика Новостной Дайджест, где информация далеко не только о данных. 🙋 Немного обо мне: ▫️С 2009 года работаю в области анализа данных и даже защитил кандидатскую диссертацию в СПбГУ по теме использования нейронных сетей ▫️Сейчас я учусь на программе Master of Analytics в американском ВУЗе Georgia Tech ▫️Работал в ряде крупных компаний: Лента, Yota, Балтика, Юлмарт, Tapcore, Airpush ▫️Увлекался программированием на разных языках: PHP, JS, C++ (в универе), Java, R, Python, а потом переключился на создание бизнеса, и так в 2019 году появилась компания Valiotti Analytics ▫️Развиваю c партнером стартап Mprove – self-service BI-платформа. ▫️Занимаюсь ангельским инвестированием в технологичные проекты преимущественно в области данных. Если вы – такой проект, то скорее пишите мне. ▫️Интересуюсь криптовалютой и проектами в этой области (особенно здорово, когда они на стыке с данными/аналитикой). ▫️Живу на Кипре с женой и дочкой, увлекаюсь теннисом 🎾, периодически рублю в плойку 🎮 😇 🛠 Услуги 🔹В рамках Valiotti Analytics мы помогаем компаниям строить аналитический стек: процессы инжиниринга, хранилища данных, отчетность, внедрение BI-инструментов на всем, что называется избитым "modern data stack" 🔹Для нас это означает, что мы работаем с современными цифровыми заказчиками, использующими облачные технологии, и совсем не работаем с несколько устаревшим стеком, где, например, присутствует 1С 🔹Также иногда я помогаю в персональном менторинге и консультирую владельцев компаний/топ-менеджеров ❕ Важные материалы 📝 Полезные посты из блога LeftJoin Аналитические метрики здорового маркетолога Лонгрид про выбор цветов для визуализации данных Мануал по Yandex.Datasphere Поиск интересных новых мест по геотегам в Instagram Граф телеграм-каналов по теме аналитики Дашборд первых 8 месяцев жизни малыша Как посчитать Retention? 👫 Совместные проекты Дашборд с анализом рынка вакансий аналитиков c hh.ru с @revealthedata 📚 Статьи на Хабре Используем serverless для построения аналитики на данных из AmoCRM в Yandex.Cloud Подробный анализ телеграм-канала Артемия Лебедева и кое-что еще 🔬 Исследования Исследование рынка онлайн-образования по анализу данных в России 📰 Интересные новости Партнерство Tableau и Looker Десять open-source аналогов Google Analytics Игра, которая навела много шума: Wordle Современные тренды веб-парсинга Snowflake купил Streamlit: почему это важно? Список альтернатив Slack 🎞 Канал на YouTube Все, что нужно знать про поступление в магистратуру Georgia Tech Гайд по современным BI-инструментам 🎤 Интервью и выступления Выступление на SmartData: Self-Service BI Выступление на Матемаркетинге Интервью для @start_ds Интервью для @revealthedata 🎧 Подкаст Data Heroes 👾 Эпизод 1: Как получить профессию аналитика данных и не выкинуть деньги на ветер? Эпизод 2: Обучение аналитике без денег — миф или реальность? 📧 Контакты и ссылки С удовольствием знакомлюсь и общаюсь с новым и интересными людьми! Если у вас что-то есть по делу, пишите. Телеграм — @valiotti Почта — [email protected] Valiotti Analytics | Блог Left Join | Tableau Public | YouTube Подкаст Data Heroes | Твиттер | LinkedIn

Valiotti Analytics – We build effective analytics

Valiotti Analytics

LEFT JOIN

Ура! 🎉 Мы пробили отметку в 10К подписчиков! Спасибо всем и каждому, кто подписан, вы невероятно мотивируете меня и всю команду продолжать делать интересный контент. 😎😎 Иногда вспоминаю времена, когда в канале было 100 человек и некоторые мои знакомые удивлялись для чего я все это делаю! Конечно же, в большей степени для себя, но очень рад, что посты, контент и любые другие медийные материалы, которые мы выпускаем, принимаются коммьюнити с интересом 😇 Поэтому огромная благодарность за ваши реакции и репосты 👍👍👍 Пробив отметку в 10К собираюсь написать краткий пост с основными ссылками на публикации в этом канале и блоге, а также с информацией об авторе, чтобы все вновь прибывшие сразу могли узнать, что мы тут публикуем ☺️

LEFT JOIN

👨‍🎨 Как работает DALL-E 2? 🖼 В одном из последних постов рассказали вам про новую AI-модель и поделились кучей ссылок с примерами её работы. Давайте попробуем разобраться, что за магия происходит в модели и как она создает совершенно новые изображения с помощью короткого текстового описания. 💭 Итак, если объяснять процессы, которые происходят в модели простым языком, то глобально их три: модель получает текстовое описание, которое декодируется и попадает в пространство текстовых эмбедингов (математический способ представления информации). Затем они попадают в пространство эмбедингов изображений, где идет поиск наилучшего совпадения. После этого полученный эмбединг декодируется и мы получаем изображение. Вуаля! 📺 В основе модели лежит модель CLIP, которая занимается прямо противоположным: подбирает наиболее точное описание к каждому изображению. Как вы понимаете, для обеих моделей совершенно необходимо огроменное количество данных, а именно пар (изображение–точное описание). Вручную такое сделать достаточно трудно (руки и глаза точно устанут), поэтому данные собраны со всего Интернета. 🧪 Также, при построении DALL-E 2 использовались диффузионные модели. Сейчас мы быстро постараемся это понять, если к этому моменту вы еще не перегружены информацией. Эти модели берут изображение и постепенно добавляют к нему различные шумы до тех пор пока изображение не меняется до неузнаваемости. Затем, они пытаются провернуть этот процесс задом наперед: воссоздать исходное изображение. Таким образом, модель учится самостоятельно генерировать изображения (или любую другую информацию, например, музыку). 🔗 Сила DALL-E 2 заключается в большом количестве парных данных (естественного языка–изображения), которые доступны в Интернете. Использование таких данных не только устраняет недочеты, вызванные трудоемким процессом ручной маркировки данных. В первую очередь, шумный и даже неконтролируемый характер таких данных лучше всего отражает реальные данные, к которым должны быть устойчивы модели глубокого обучения. Если все эти выводы кажутся вам непонятными или недостаточными, то в этом видео девушка еще более подробно (на примере схем и изображений) рассказывает о том, как именно работает DALL-E 2 и почему каждый этап обработки важен и незаменим.

LEFT JOIN

Совершенно удивительные достижения из мира AI Еще одна новость про AI-модель: DALL·E 2 — новая система искусственного интеллекта, которая может создавать реалистичные изображения и рисунки исходя из описания на естественном языке. Ну, то есть, вы даете на вход модели данные: “An astronaut riding a horse in a photorealistic style”, а получаете вот такое изображение ⚡️ А еще модель может: ▫️ добавлять и удалять элементы, принимая во внимание тени, отражения и текстуры ▫️ вдохновиться оригиналом картины, рисунка или фотографии и создать изображение в похожем стиле Модель уже очень занимательно повертели в этой статье. Брам Адамс тоже проверил, как работает модель: особенно интересно, как она придумывает постеры и обложки для музыкальных альбомов. Музыканты теперь могут вообще не тратить на то время, а лишь набрасывать идеи и поручать DALL·E всю креативную работу. У меня и моей команды совершенно нет слов, это настоящий прорыв в мире AI. Не терпится пощупать и проверить все своими руками (подали заявку, ждем)!

Telegram

LEFT JOIN

Помните историю про утечку данных Яндекс.Еды? А вот какое наказание понесла «Яндекс.Еда»: 60 тысяч рублей за наши с вами данные. SRSLY?? На минутку, в этом датасете как минимум 148 тыс. юзеров имеют общую сумму заказов больше чем на 60 тыс. рублей. ❗️А сумма в 60 тысяч рублей это всего лишь 0.0001163% от всей выручки за период в датасете (51,567 миллиардов рублей). Так вот здорово охраняются наши с вами персональные данные🛡 ❓Риторический вопрос: эта статья и наказание означает, что в РФ вообще больше никому нельзя оставлять валидные ПД?

LEFT JOIN

🍟 Яндекс, который не оправдал доверия пользователей Наверное, вы уже в курсе: Яндекс конкретно облажался. Весь рунет не первый день разглядывает карту заказов Яндекс.Еды, где и мы с вами, и ваши соседи, и все-все-все. Как минимум, все это крипово. Чем это опасно? В публичный доступ попали наши с вами персональные данные, которые обожают мошенники. Поэтому будьте бдительны, если вам теперь в точности назовут ваш адрес, смогут озвучить сумму ваших трат, назовут вас по имени и даже смогут сказать дату вашего заказа. Это прекрасно работает в социальной инженерии. Искренне считаю это позором службы безопасности Яндекса и крайне неудовлетворен официальным объяснением инцидента. Личный совет: по возможности, не указывайте свои реальные данные там, где нет необходимости это делать и не сохраняйте свои платежные данные во имя удобства оплаты. Раз хакерам удалось украсть эти данные, то значит и кража платежных данных тоже возможна. И в этом уж точно ничего хорошего не будет. Прекращаем нагонять ужас Раз так уже произошло…

Telegram

LEFT JOIN

В течение десятилетий центральное место в разработке приложений занимала реляционная модель данных, которая используется в таких реляционных СУБД, как Oracle, DB2, SQL Server, MySQL и PostgreSQL. Но в последнее время большое распространение стали получать и другие модели данных - нереляционные / NoSQL. NoSQL — это вид нетабличных баз данных, которые помогают хранить большие массивы данных без определённой структуры. NoSQL стали популярным решением из-за простоты и гибкости разработки, широкого функционала, высокой производительности и возможности горизонтального масштабирования. В зависимости от модели данных и подходов к распределённости и репликации в NoSQL выделяют четыре основных типа систем: ▪️ключ - значение (Redis, Memcached) ▪️колоночные (SAP IQ, Vertica, ClickHouse, Google BigTable, InfoBright, Cassandra) ▪️документо-ориентированные (CouchDB, MongoDB, Amazon DocumentDB) ▪️графовые (Neo4j, Amazon Neptune, InfiniteGraph, InfoGrid) Данные типы систем используются для решения задач кэширования, машинного обучения, хранения time-series данных или данных различающихся по структуре, размеру и содержанию. Подробнее о преимуществах и недостатках применения различных типов NoSQL-систем и многом другом можете узнать на канале Базы данных и SQL Подписывайтесь: @db_in_it

LEFT JOIN

Вопрос личного характера: может ли кто-то поменять мои Tinkoff USD на крипту (стейбл / любые другие монеты), если можете, напишите в ЛС @valiotti

LEFT JOIN

🦸🏻 Ура! Второй эпизод подкаста DataHeroes уже в сети 🚀 Судя по тому, что многие из вас послушали первый выпуск подкаста, мы движемся в верном направлении! У нас вышел второй выпуск, в котором мы продолжаем говорить об онлайн-образовании в России. Обучение аналитике без денег — миф или реальность? Сегодня мы поговорим о том, почему бесплатно не значит плохо, как найти в себе мотивацию на самообучение и зачем вообще нужны бесплатные курсы их создателям. Наши спикеры — те, кому удалось получить новую профессию без финансовых вложений, а также руководители известных онлайн-платформ и образовательных центров Computer Science Center, DataYoga и DataLearn. Если вы до сих пор считаете, что бесплатный сыр только в мышеловке, то скорее включайте подкаст, мы вас в этом разубедим! Слушайте подкаст на платформах: Spotify, Anchor, Apple Podcasts, Castbox, Overcast, Google, Telegram (↓) #DataHeroes #подкаст

LEFT JOIN

Все что вам может понадобиться во время работы с Yandex.Datalens Павел Дубинин собрал в один пост все (вообще все!) ссылки, которые могут вам пригодиться при работе с Yandex.DataLens. Тут и демо-дашборды, и ссылки на сообщества, и гайды по работе с сервисом, и примеры аналитики реальных данных и многое-многое другое. 💪

Pavel Dubinin in Yandex DataLens

Полезные ссылки для знакомства и работы с DataLens Большой функциональный демо дашборд: - datalens.yandex/demo - публичный, только чтение - Развернуть дашборд в своем DataLens для редактирования Сообщество: - Телеграм чат (вы сейчас тут) - Предложить и проголосовать за новую фичу - Плейлист официальных мероприятий на YouTube Обучение: - Быстрый старт, пошаговая инструкция - Более детальные пошаговые инструкции по сценариям - Туториалы по аналитическим функциям: агрегации, оконные функции, Level-of-Detail выражения - Создание SQL-чартов (если вам нужно больше гибкости модели данных) - Образовательные проекты FAQ в документации: - https://cloud.yandex.ru/docs/datalens/qa/ Публичные кейсы использования DataLens: - КазаньЭкспресс - Аналитика retail маркетплейса - Правительство С.-Петербурга - Аналитика городских сервисов - Окраина - Аналитика на мясоперерабатывающем заводе - МВидео - Платформа данных в облаке, геоаналитика - Rubetek - Аналитика IOT по датчикам домов и квартир застройщика ПИК - Moneycare…

Telegram

LEFT JOIN

Шиншилла, которая всех победила Продолжаем новости из мира AI: недавно было проведено исследование-сравнение различных современных языковых моделей. В результате, новая языковая модель Chinchilla 70B значительно превосходит результаты таких моделей, как Gopher (280B), GPT-3 (175B), Jurassic-1 (178B) и Megatron-Turing NLG (530B). Исследователи обнаружили, что, несмотря на использование различных процедур подбора и обученных моделей, эти три подхода дают сопоставимые прогнозы для оптимального масштабирования параметров и токенов с помощью FLOP. В общем, если вы работаете с языковыми моделями, то пора пробовать новую.

Check Out This DeepMind's New Language Model, Chinchilla (70B Parameters), Which Significantly Outperforms Gopher (280B) and GPT-3 (175B) on a Large Range of Downstream Evaluation Tasks

MarkTechPost

LEFT JOIN

🎉 Finally, we are on Twitter! 🎉 Друзья, хочу поделиться с вами ссылкой на свой твиттер, подпишитесь прямо сейчас, если интересен контент на английском. Сейчас у нас в планах море англоязычного контента, которым я буду делиться там, плюс периодически собираюсь скидывать туда полезные ссылки на тему аналитики, BI, AI и так далее. А еще планирую периодически разбавлять контент юмором, который мне по душе, может он и вас заставит улыбнуться 😉 Конечно, этот телеграм-канал также будет пополняться новыми интересными постами, но если вы хотите видеть новости и контент чаще, то подписывайтесь! P.S. Вчера в Twitter я уже опубликовал ссылку на наш первый материал на Medium.

Nikolay Valiotti (@nvaliotti) | Twitter

The latest Tweets from Nikolay Valiotti (@nvaliotti). Founder of https://t.co/hnmXUntDJL Co-founder of https://t.co/iPdkDhKR88 Ph.D. in Data Science @ SPBU Master of Analytics @ US Georgia Tech (in progress). Cyprus

Twitter

LEFT JOIN

Самая скучная профессия? Исследование Университета Эссекса определило портрет самого скучного человека в мире — это религиозный специалист по вводу данных, который любит смотреть телевизор и живет в городе. А самой скучной профессией стал Data Analysis.

LEFT JOIN

Совершенно удивительные достижения из мира AI Еще одна новость про AI-модель: DALL·E 2 — новая система искусственного интеллекта, которая может создавать реалистичные изображения и рисунки исходя из описания на естественном языке. Ну, то есть, вы даете на вход модели данные: “An astronaut riding a horse in a photorealistic style”, а получаете вот такое изображение ⚡️ А еще модель может: ▫️ добавлять и удалять элементы, принимая во внимание тени, отражения и текстуры ▫️ вдохновиться оригиналом картины, рисунка или фотографии и создать изображение в похожем стиле Модель уже очень занимательно повертели в этой статье. Брам Адамс тоже проверил, как работает модель: особенно интересно, как она придумывает постеры и обложки для музыкальных альбомов. Музыканты теперь могут вообще не тратить на то время, а лишь набрасывать идеи и поручать DALL·E всю креативную работу. У меня и моей команды совершенно нет слов, это настоящий прорыв в мире AI. Не терпится пощупать и проверить все своими руками (подали заявку, ждем)!

LEFT JOIN

Децентрализованный Twitter? Что? Уже некоторое время популярной темой для обсуждения считается Web3.0 (клевая статья у вастрика на этот счет). Недавно на просторах сети я наткнулся на новую open-source социальную сеть – Mastodon. Ее основное отличие – децентрализованность. Каждый пользователь может развернуть эту соцсеть на своем сервере со своими правилами, целями и так далее. Личные данные в полной безопасности, ведь они не передаются на общий сервер, а остаются лишь у вас. Можно подписываться как на пользователей внутри одного сервера, так и на любых других пользователей сети, делиться контентом, выкладывать фотографии и оставлять коменты. Поскольку в этой соцсети нет услуг для монетизации контента, она не может обанкротиться или быть заблокированной (сейчас это кажется весьма актуальным!). А еще там нет рекламы (ну, пока), в общем, сплошные плюсы 😎

Mastodon is an open source decentralized social network - by the people for the people. Join the federation and take back control of your social media!

joinmastodon.org

LEFT JOIN

Сервис онлайн-обучения цифровым профессиям Яндекс Практикум запускает программу обучения по специальности «Инженер данных». Курс предназначен для студентов с как минимум базовым знанием SQL и Python — перед стартом необходимо пройти тест. Авторы и преподаватели – практикующие эксперты ведущих российских IT-компаний. Длительность — 6,5 месяцев. Курс на 75% состоит из практических занятий – по окончании программы в вашем портфолио будет не менее 10 проектов. Вы научитесь: - работать с технологиями Python, SQL, Metabase, Airflow, PostgreSQL, MongoDB, ClickHouse, Celery, Kafka, Hadoop, Apache Spark, Spark Streaming и Yandex.Cloud - извлекать, очищать и сохранять данные - создавать и поддерживать хранилища типов Data Warehouse и Data Lake - работать со стриминговой обработкой данных и облаками Претендовать на работу по новой специальности студенты курса смогут уже в ходе обучения – с поиском вакансии помогут специалисты карьерного центра Яндекс Практикум. Запись на курс открыта, старт занятий для ближайшего потока студентов – 18 апреля. Стоимость курса: 95 000 рублей при разовой оплате, при оплате в рассрочку – 17 000 рублей в месяц. По завершении программы студенты получат диплом о профессиональной переподготовке. Запись на бесплатную вводную часть и подробности по ссылке. #реклама

Курс «Data Engineer» — онлайн-обучение профессии инженер данных от сервиса Яндекс Практикум

Онлайн-курс «Data Engineer» от сервиса Яндекс Практикум. 6.5 месяцев обучения на инженера данных с выдачей диплома о профессиональной переподготовке.

Яндекс.Практикум

LEFT JOIN. Страница 15

LEFT JOIN

LEFT JOIN

LEFT JOIN

Реклама

LEFT JOIN

LEFT JOIN

LEFT JOIN

LEFT JOIN

LEFT JOIN

LEFT JOIN

LEFT JOIN

LEFT JOIN

LEFT JOIN

LEFT JOIN

LEFT JOIN

LEFT JOIN

Реклама

LEFT JOIN

LEFT JOIN

LEFT JOIN