Обложка канала

LEFT JOIN. Страница 2

5709 @leftjoin

Канал Николая Валиотти об аналитике и визуализации данных, data science и BI

  • LEFT JOIN

    Музыка, подкасты и аудиокниги от HiFi-стриминга Звук 👀 Сегодня и все выходные у вас есть шанс оформить подписку СберПрайм на 60 дней всего за 1 рубль! Вы получите: 🔵 Доступ ко всем сервисам СберПрайм 🔵 Миллионы треков, подкастов и аудиокниг, удобно разделенные по жанрам и настроениям 🔵 Волну «Сила Звука» — сервис по подбору персональных аудио-рекомендаций 🔵 Возможность слушать музыку всегда и везде, скачивая треки на телефон 🔥 Все подробности и ссылка на подписку — на сайте сервиса. Время ограничено, действуйте скорее! #Реклама. Рекламодатель ООО «Звук». ОГРН 5177746117005, г. Москва, Erid: LdtCKRo1T 12+
  • LEFT JOIN

    ☕️ Под утренний кофе: еженедельный дайджест о технологиях, данных и аналитике 🗞 🔵 LakehouseIQ – движок на основе генеративного ИИ, который понимает локальные мемы вашей компании На этой неделе компания Databricks объявила о релизе нового корпоративного продукта, LakehouseIQ. Благодаря тому, что с платформой можно общаться с помощью естественного языка, пользователь может получить инсайты из базы знаний вашей компании, не прибегая к коду. Сфера применения: поиск информации в базе Databricks, автоматические предложения по улучшению запроса Spark или SQL, интеграция через API с другими приложениями. 🔵 Инженеры данных, новость для вас: динамические таблицы в Snowflake Платформа Snowflake обзавелась новой фичей, которая существенно упростит трансформацию данных. Выстраивание последовательности задач, контроль зависимостей и расписания – задачи прошлого! С помощью динамических таблиц вам достаточно указать финальный вид трансформации, и, в то время как данные в них будут автоматически обновлятся, таблицы в самой базе данных не будут претерпевать никаких изменений. 🔵 Можно ли предсказать рейтинг фильма на основе данных? Учебный кейс с Rotten Tomatoes Кинопроизводство – это многомиллионный ($) бизнес. И ИИ может стать подспорьем продюсерам и другим заинтересованным в успехе проката лицам. Тестовый проект, использованный при трудоустройстве в Meta (Facebook), предлагает два варианта определения рейтинга: (1) предсказание рейтинга на основе числовых показателей и данных о категории и (2) сентимент-анализ обзоров и отзывов. Подробный разбор работы на KDnuggets может пригодится любителям data science и машинного обучения. #дайджест
  • LEFT JOIN

    GPT-4 на страже порядка: больше никакого временного хаоса! ⏳ Любители фильмов «Довод» и «Интерстеллар» Кристофера Нолана наверняка часто ловили себя на мысли, что следить за ходом сюжетного времени не всегда так уж и легко. Исследователи художественной литературы, в частности, конечно, студенты-филологи, часто сталкиваются с подобной проблемой при написании курсовых и дипломных. Профессор Университета штата Иллинойс Тэд Ундервуд решил подойти к данной задаче новаторским путем: с помощью языковой модели GPT-4. В ходе экспериментов стало ясно, что использование ИИ, чтобы рассчитать сюжетное время в романе или другом литературном произведении, – это довольно успешное предприятие. Языковая модель, поясняя логику своих суждений, дает исследователю возможность найти в тексте временные скачки или определить время нахождения персонажа в определенной локации. А какие способы применения ИИ в академической среде кажутся вам наиболее перспективными, помимо полного делегирования написания научной работы ChatGPT?
  • Реклама

  • LEFT JOIN

    P-value в действии: Влияет ли стакан молока на ночь на сон? В прошлом посте рубрики мы вспомнили про одну из самых важных тем, а именно про центральную предельную теорему, на которой держится вся статистика. Теперь давайте шлифанем ваши знания о p-value — метрике, которая помогает принять оценить тот или иной эксперимент и сделать вывод не просто каким-то выводом, а статистически значимым! P.S. Давайте соберем 100 ⚡под этим постом и мы продолжим нашу рубрику #основы_статистики карточками про критерий Стьюдента и сравнение выборок!
  • LEFT JOIN

    А стоит ли вообще учиться одной из IT-профессий, если придётся конкурировать с нейросетями? Если вы задаётесь этим вопросом, приходите на вебинар. Команда Яндекс Практикума пригласит экспертов, которые на своём примере покажут: с нейросетями нужно не конкурировать, а брать их в помощники. 🔜 Бесплатный вебинар — 27 июня в 19:00 по Москве Эксперты, которые расскажут, как повысить свою ценность на рынке с помощью нейросетей: 🔵 Алексей Мартынов, технический директор Akil.io, проекта в области ИИ. Ведущий эксперт на курсах программирования в Яндекс Практикуме. 🔵 Катерина Поль, старший дизайнер интерфейсов, наставница на курсе «Дизайнер интерфейсов» в Яндекс Практикуме. Работала продуктовым дизайнером в «Ростелеком ИТ». 🔵 Артём Исакин, руководитель трудоустройства в направлении анализа данных Яндекс Практикума. На вебинаре вы узнаете: — что нейросети умеют уже сегодня и в каких проектах им можно делегировать рутину; — какие профессии могут исчезнуть, а в каких AI-сервисы просто станут рабочими инструментами; — кем стать, чтобы самому работать над нейросетями; — как искусственный интеллект будет развиваться в будущем, и чему учиться уже сегодня. Приходите, делитесь своими сомнениями и задавайте вопросы! 🔜 Зарегистрироваться на вебинар #реклама Реклама АНО ДПО "Образовательные технологии Яндекса", ИНН:7704282033, erid:LjN8K659h
  • LEFT JOIN

    HEROES 3 — немного ностальгии по лучшей игре нулевых Кажется, невозможно встретить человека старше 25, который не слышал бы об этой игре (хотя, если вы — именно такой человек — мы вам страшно завидуем, у вас все впереди!). А если на словах «ифриты», «архангелы» и «архидьяволы» ваше воображение точно рисует образы магических существ и хочется вновь ощутить вкус победы, то читайте дальше. Что такое VCMI? Простыми словами, это ремейк Heroes of Might and Magic 3, то есть ребята переписывают всем известную игру (которая выходила лишь на Windows) на MacOS, iOS, Android и Linux. 🔵 Ребята используют оригинальные графические, звуковые и текстовые ресурсы Heroes 3 и создают новую игру, которая должна работать на 100% так же, как H3. 🔵 Новые версии ремейка появляются несколько раз в год, но текущая (вышедшая в конце 2022 и слегка доработанная) практически полностью воссоздает оригинал. 🔵 В VCMI все сделано с нуля — загрузка игровых файлов, прорисовка графики, ИИ, игровая механика и т.д. 🔵 Проект совершенно альтруистичный — ребятам на данный момент (даже при желании) нельзя задонатить (на сайте они честно пишут «we do not have any good idea how to spend potential money from donation»). Краткий гайд по установке на Mac, если у вас уже чешутся руки нанять архангелов и начать бой 1. Заходите на сайт VCMI и выбираете нужную операционку 2. Скачиваете архив с последней версией 3. Разрешаете запуск программы в Системных настройках 4. Скачиваете данные оригинальной игры (тут кроется спорный момент относительно авторских прав на графику и звук, поэтому решение за вами!) 5. Запускаете игру Если вам интересно, как разработчики адаптировали игру, то весь код лежит на GitHub в открытом доступе. Делитесь в комментариях, какие замки или игровые мобы вам нравились больше всего?
  • LEFT JOIN

    Грант до 500 000 ₽ на облачные сервисы #CloudMTS Можно применить на: – Готовые мощности в публичном облаке и простое управление виртуальными машинами – Сервисы для управления кластерами K8s и брокером сообщений Apache Kafka в облаке – Хранение данных нужного объема и формата с доступом через интернет – Сервисы управления сетью в облаке Воплощайте крутые цифровые проекты в облаке #CloudMTS 💥 Узнать подробности условий Акции и ознакомиться с сервисами, которые доступны в рамках Акции, можно на офицальном сайте. Оставляйте заявку, получите подтверждение, и команда #CloudMTS рассчитает Грант под ваш проект! Реклама. Рекламодатель ПАО «МТС», ИНН 7740000076
  • LEFT JOIN

    «Lost at SQL»: игра для прокачки SQL 🎮 Считается, что самое лучшее обучение — на практике. Будь то наш «Data Марафон», бесплатные онлайн тренажеры или использование ChatGPT как персонального инструктора — любой способ освоить навыки, нужные для аналитика данных, будет работать, если вы вложите в него свое усердие и внимание. Но среди всего богатства ресурсов и инструментов часто забывается еще один эффективный метод — игровой формат обучения, а ведь он тоже учит нас использовать новые знания в нетривиальных условиях и даже может быть более приятным, так как получение «ачивок» положительно сказывается на выработке дофамина, гормона удовольствия. «Lost at SQL» от разработчика Робина Лорда — это браузерная игра, действие которой разворачивается на тонущей подводной лодке. Помимо абзацев, раскрывающих сюжетную линию, и самих задач, она включает развернутые описания решений и общие теоретические блоки. Не «The Last of Us», но все равно достойный внимания инструмент для тех, кому нравится игровой формат обучения.
  • LEFT JOIN

    111101111011110, GPT, прием! 👀 Есть любители математики? Для вас контент подъехал! Андрей Карпатый, ныне разработчик в OреոΑӏ, а в прошлом директор по ИИ в Tesla, выложил в своем твиттере препримечательную заметку про малюсенькую модель GPT, которая использует всего два токена: 0/1. Что имеем? 🔵 Секвенцию 111101111011110 🔵 50 итераций 🔵 Длина контекста: 3 🔵 PyTorch Рассмотрев GPT как цепь Маркова с конечным числом состояний, Андрей пришел к ряду выводов, с которыми пригласил познакомиться всех любознательных. По его мнению, исследуя такие маленькие модели, можно лучше представить себе, как ИИ функционирует в динамике.
  • LEFT JOIN

    «Все, что может провалиться, проваливается» — закрываем проект «FULL JOIN» строчками СБПЧ Чуть меньше чем полгода назад мы с командой запустили закрытый канал FULL JOIN — аналитический контент по подписке, а неделю назад мы приняли решение его закрыть и поделиться этой историей с вами (не все же рассказывать о своих успехах! #bestfails). Что случилось? Всегда хочется понять, что пошло не так, чтобы в будущем не наделать таких ошибок, поэтому мы поразмышляли и пришли к ряду умозаключений. Скорее всего, причин неуспеха несколько: 🔵 Неудачный выбор платформы — похоже, подобный проект стоило подавать не в закрытом Telegram-канале, а на другом ресурсе. 🔵 Отсутствие культуры получать контент по подписке в русскоговорящем сегменте аудитории. 🔵 Низкая вовлеченность читателей и частые отмены подписок — тут, скорее всего, дело в том, что мы даем сложный технический материал, в который нет времени или возможности погружаться, либо же тем, кто подписался, эти темы не близки и не интересны. 🔵 Подписчики не те, кем кажутся — изначально, канал создавался и анонсировался как хардскилловый, но, надеясь найти лайфхаки и полезные инсайты, на него подписывались начинающие специалисты. И остались разочарованы, ведь контент предполагал наличие базы и опыта в аналитике и инжиниринге. 🔵 Слишком высокие издержки на создание контента по сравнению с профитом от проекта — так бывает, но продолжать производить контент себе в убыток не хочется. Что дальше? 🔵 Глядя на закрытый канал, мы с командой не стали сидеть сложа руки. Посмотрев на текущий проект и весь созданный контент, мы приняли решение показать его более широкой аудитории, а не списывать в утиль (там много красивого и полезного!). 🔵 Постепенно мы трансформируем созданный контент в более удачный информационный формат (расскажем, когда продумаем все детали!). А также мы начнем в скором времени начать выпускать статьи и гайды по аналитическим инструментам в блоге leftjoin.ru, с надеждой создать “Хабр” в мире данных и аналитики на базе LEFT JOIN. 🔜 Признавать свои провалы больно, но необходимо, ведь никому не хочется, чтобы они случались. Однако без ошибок и тактических просчетов не бывает больших успехов и роста. 👀 Зато, если меня когда-нибудь позовут на подкаст “Это провал”, я точно знаю, что буду им рассказывать!
  • LEFT JOIN

    Эффект ламы: как одна языковая модель, слитая в сеть, подхлестнула развитие индустрии 🦙 Пару недель назад мы уже писали об Alpaca — проекте Стэндфордского института на основе разработанной Meta AI модели Llama, которую кто-то слил на форум 4chan. И вот, всего лишь за такое короткое время, другие укротители ИИ, воспользовавшись все той же моделью Llama, разработали и подарили миру множество других проектов с открытым кодом. Давайте-ка познакомимся с самыми яркими из них: 🔵 Vicuna — чат-бот на основе Llama, который почти идентичен по качеству ChatGPT; 🔵 Koala — версия Llama, донастроенная с помощью диалогов из интернета; 🔵 ColossalChat — клон ChatGPT, в обучении которого использовалось подкрепление на основе отзывов людей; 🔵 ChatLLaMA — фреймворк для создания идентичных ChatGPT ассистентов на основе своих данных; 🔵 FreedomGPT — модель, которую можно вот прям сейчас взять с github. Кажется, или open source — это IT-пандемия 2023?
  • LEFT JOIN

    Скучали? Это ваш любимый Data Heroes и мы начинаем третий сезон! 🚀 В нем мы будем много говорить о том, как построить карьеру в аналитике и развивать личный бренд. В пилотном выпуске сезона мы приготовили гайд о том, как человеку без опыта в аналитике можно примерить на себя профессию 👨‍💻 Наши эксперты — авторы онлайн-курсов, которые очень хорошо знакомы каждому аналитику, ведь именно с них тысячи настоящих мидлов и сеньоров начинали свой путь. Они ответят на самые важные вопросы: ▪️Как почувствовать себя в шкуре аналитика до того, как будут затрачены деньги и время на обучение? ▪️Какие важные софт-скиллы должны быть у аналитика? ▪️Как не ошибиться с курсом? На что обратить внимание при выборе? ▪️Кому точно не подойдет профессия аналитика? И, как всегда, мы приготовили крутые советы для тех, кто только начинает свое погружение в аналитику! Скорее включайте подкаст и пробуйте себя в новой профессии! 👍 СПИКЕРЫ: Михаил Карпов (курс “Профессия аналитик”), Галина Озерова (курс “Интерактивный тренажер по SQL”), Сурен Погосян (курс “Марафон данных”), Павел Дубинин (курс “Основы работы с DataLens”) БОНУС: Скидка 25% на полную версию курса “Профессия аналитик” от Product Star по промокоду "LEFTJOIN" — он будет суммироваться со всеми текущими скидками✌️ Слушайте подкаст на платформах: Spotify, Anchor, Apple Podcasts<i>, Google<i>, Yandex<i>, Overcast, Mave, Castbox, Telegram (↓) #подкаст #DataHeroes
  • LEFT JOIN

    Datatonic + Montreal Analytics | Datatonic

    Datatonic is pleased to announce the acquisition of Montreal Analytics, a leading Canadian-based Cloud Analytics consultancy, and key partner to cloud data technologies, including: Google Cloud, Looker, dbt Labs, and Snowflake.  

    Datatonic
  • LEFT JOIN

    Как стать аналитиком, у которого не отберет работу нейросеть? 19 апреля стартует онлайн-программа дополнительного профессионального образования «Профессия аналитика данных» от школы аналитики Changellenge >> Education, на которой можно с легкостью освоить незаменимые навыки аналитика. Нейросети перестанут вас пугать, ведь есть очень много креативных, творческих и технических задач, которые им пока что неподвластны. Зато помочь со скучными рутинными задачами или найти противную ошибку в коде они могут быстрее. А еще, у нас для вас есть скидка на курс (аж 41%!) #leftjoin_партнерство
  • LEFT JOIN

    Знаете SQL? Можете стать композитором! Мы живем в очень интересное время, когда компьютерные программы способны создавать предметы искусства. То, что нейронные сети могут создавать картины, поэмы и музыкальные композиции, уже стало для нас обыденностью. Но, что если мы вам скажем, что ClickHouse тоже умеет творить? Совсем недавно разработчики этой замечательной СУБД смогли при помощи SQL-запросов создать mp4 файлы, которые можно послушать. Ознакомиться с проектом можно в репозитории GitHub. Как это работает? В репозитории есть несколько примеров запросов для создания музыки. Их структура сделана так, чтобы в результате получалась таблица с набором параметров звуковой дорожки. Громкость звука, частота звуковых волн разной формы (синусоидальная, прямоугольная, пилаобразная и треугольная), шумы различной формы и так далее. Результат переводится в бинарный формат и подается в стандартный поток ввода программе aplay, которая воспринимает результат запроса, как будто это медиа файл CD формата, и проигрывает его. Конечно, это очень упрощенный способ генерации звука, но все ограничения сводятся к разнообразию математических функций в ClickHouse. Однако, в будущем мы наверняка сможем создавать более сложные музыкальные композиции всего лишь при помощи SQL-запроса к одной очень-не-тормозящей-СУБД.
  • Реклама

  • LEFT JOIN

    GPT-4 генерировал, генерировал, да cгенерировал…новый язык программирования 🐍 Кратко: языковая модель сгенерировала язык программирования, который может (теоретически) использоваться для создания и обучения новых языковых моделей. Подлиннее: TenetLang — это язык, полностью придуманный бета-версией ChatGPT-4. По словам Люка Бечтела, автора статьи и самой затеи, TenetLang похож на дитя любви Typescript и Python 💚 Потратив одну бессонную ночь и все еще продолжая допиливать язык, Люк верит, что у подобных авантюр могут быть весьма продуктивные результаты, ведь если языковая модель может править код и предлагать решения задач, то что мешает ей придумать идеальный язык программирования? Конечно, идея создания новых языков с помощью GPT-4 и, вероятно, последующих за ней моделей, — это вектор исследования и экспериментов, который найдет своих последователей. Люк, тем не менее, не забывает и о существующих языках и задается вопросом, может ли GPT-4, например, усовершенствовать Python до такой степени, чтобы разработчики стали в 2 раза быстрее?
  • LEFT JOIN

    Джин, сбежавший из бутылки, или как языковые модели захватят мир 🧞‍♂️ Лоз Блейн, соавтор New Atlas, написал небольшую, но очень резонирующую статью, в которой, рассматривая прецедент создания исследовательским центром Стэндфордского института собственной языковой модели за каких-то 600$, ставит крайне актуальные вопросы о прогрессе, который уже не остановить. С чего все началось? Alpaca – это проект на основе LLaMA 7B, модели с открытым кодом от Meta. Ученые исследовательского центра натренировали ее с помощью всего лишь 52К инструкций, сгенерированных ИИ. Несмотря на простоту образовательного портфолио «альпаки» и скромности бюджета, вложенного в ее обучение, ее способности, судя по тестам, ничем не уступают ChatGPT. И в чем проблема? Автор статьи отмечает, что такая низкая «себестоимость» и доступность сотворения собственной языковой модели – это, с одной стороны, очень здорово, а с другой – попросту опасно. И дело скорее не в потенциальной катастрофе, которая может перевернуть мир офисных сотрудников, если ИИ перетянет одеялко профессиональных обязанностей в свою сторону, а в угрозе превращения языковых моделей в инструмент мошенников, спамеров и «авторитарных режимов» (прямая цитата). К тому же, если многочисленные разработчики, окрыленные успехом ChatGPT, с конца прошлого года в поте лица подкручивают винтики своих ИИ-продуктов, чтобы успеть покорить цифровой Олимп в ближайшее время, то не является ли успех Alpaca предвестником скорого провала их коммерческих начинаний? Впрочем, загнать джина обратно в бутылку уже не получится, поэтому нам остается только адаптироваться к новой реальности и изучать ML и DL.
  • LEFT JOIN

    Конец прокрастинации — краткий пересказ Недавно в канале FULL JOIN мы запустили рубрику с краткими пересказами основных тезисов докладов на темы аналитики, баз данных и инжиниринга и… нам жутко понравилось! Теперь мы будем регулярно находить стоящие доклады и рассказывать о них, чтобы вы не терялись в бесконечном потоке информации и держали нос по ветру. Например, сейчас мы подыскиваем современные доклады про микросервисную архитектуру и рассказываем, где и зачем она применяется. А здесь мы в похожем формате будем делиться более общими, но все такими же стоящими выступлениями! Переходим к теме доклада Прокрастинация — проблема, знакомая каждому, но бороться с ней можно как успешно, так и совершенно безуспешно. Как же все-таки побороть прокрастинацию? Об этом можно узнать из доклада Петра Людвига «Конец прокрастинации», ведь врага нужно знать в лицо, чтобы его победить. Но если вам не хочется тратить целых полтора часа на доклад, то вот основные мысли: 🔹Каждая секунда, которая тратится на прокрастинацию потеряна навсегда — стоит периодически держать эту мысль в голове во время. 🔹Мир становится легче и доступнее, что в свою очередь создает проблему слишком широкого выбора действий — это можно только принять. 🔹Один из ключевых элементов, который необходим для победы над прокрастинацией — это умение перевести внешнюю мотивацию (например, горящий дедлайн) во внутреннюю (напимер, точку роста для себя) — а вот это уже один из ключиков к решению проблемы. С одной стороны, это все просто как день, с другой стороны — все мы прокрастинируем, а значит иногда нам нужно услышать простые истины, вспомнить о них, сфокусироваться и стать чуточку лучше, не так ли?