Обложка канала

LEFT JOIN. Страница 14

5709 @leftjoin

Канал Николая Валиотти об аналитике и визуализации данных, data science и BI

  • LEFT JOIN

    Итак, модели DALL-E удалось запутать большую часть наших подписчиков! На самом деле, изображение сгенерировала именно она, получив на вход следующую инструкцию: "A photograph of a saguaro cactus wearing a sun hat and aviator sunglasses in a sunny desert". Мы тоже по-началу ей поверили, ведь получилось весьма похоже на настоящую фотографию. Следите за нашими постами, мы планируем и дальше делиться новостями и статьями о лучшей современной AI-модели 🤖
  • LEFT JOIN

    🛢SQL hub - без баз даных программирование невозможно. Узучи SQL быстро и легко. В канале собраны самые доступые и понятные гайды для освоения SQL. Полная ит-библиотека вместо тысячи платных курсов и книг.
  • LEFT JOIN

    🎨 Is it real or is it fake? 🤖 За последние несколько недель мы часто рассказывали вам про AI-модель DALL-E: про ее устройство и ограничения. Теперь пришла пора проверить, насколько внимательно вы читали наши посты и насколько хорошо модель создает реалистичные изображения. This Image Does Not Exist – простой тест, в котором вам показываются настоящие и сгенерированные моделью изображения, а вам нужно предположить, кто его создал. Например, изображение выше: как думаете, кто его создал? Ставьте ❤️, если вы думаете, что изображение реальное и 🔥, если думаете, что его создала DALL-E
  • Реклама

  • LEFT JOIN

    Georgia Tech: Summer Term 2022 Любопытное совпадение: Роман Зыков (автор книги Роман с Data Science) у себя в канале написал про курс Reinforcement Learning от Coursera, а я только что в этом летнем семестре Georgia Tech взял аналогичный курс: CS 7642: Reinforcement Learning. Будет очень интересно сравнить контент. Мне курс из Georgia Tech пока очень нравится: живой и крайне доступный, даже думаю сюда intro-видео запостить, потому что лекторы умудряются регулярно шутить и вовлекать в весьма не самую простую тему 🥸 #gatech
    Книга "Роман с Data Science: Как монетизировать большие данные"

    Роман Зыков написал книгу "Роман с Data Science: Как монетизировать большие данные"

    topdatalab.ru
  • LEFT JOIN

    👨‍🎨 DALL-E не всемогущ? 🖌 Мы уже рассказывали вам про AI-модель, которая генерирует удивительные (и очень точные!) изображения на основе текстового описания. Сегодня нам хочется чуть поумерить всеобщие восторги и разобрать некоторые ограничения модели, которые не видны на первый взгляд. 📍Недостаток информации: Иногда модели нужно давать очень много уточнений, чтобы получить то, что нужно 📍Трудности в понимании контекста: В то же время, когда описание слишком длинное, модель чаще ошибается и хуже оценивает контекст (особенно, со словами, которые имеют несколько разных значений) 📍Никто не может знать всего: DALL-E может попросту не знать (не иметь никаких данных) о том, что вы хотите получить 📍У всего есть предел: Модель не может работать со слишком длинными описаниями с большим количеством дополнений 📍Все смешалось в доме Облонских: Модель может смешивать описания и присваивать определенные черты не тем объектам, которым нужно 📍Странные изображения: Если вы хотите создать изображение с совершенно разными (несочетающимися) деталями, то модель вероятнее всего вас не поймет 📍Художник, а не писатель: если вы хотите сгенетировать изображение с текстом или подписью, буквы могут быть ненастоящими 📍И, точно, не математик: Если вы хотите получить более 4 обьектов на изображении, то по мере роста числа обьектов, вероятность получить нужное количество неуклонно падает 📍Лица всем художникам даются с трудом: Зачастую лица людей на изображениях выглядят неправдоподобно, как у сломанной куклы или робота Если какое-то из ограничений осталось не вполне понятным и вообще таковым не кажется, то в этом треде есть визуальные объяснения, которые помогают понять, в чем же все-таки дело. Конечно, все эти нюансы никак не отменяют того, что это самая качетсвенная современная модель для создания и преобразования изображений. Просто всегда есть куда стремиться и что улучшить, не так ли?
    LEFT JOIN

    👨‍🎨 Как работает DALL-E 2? 🖼 В одном из последних постов рассказали вам про новую AI-модель и поделились кучей ссылок с примерами её работы. Давайте попробуем разобраться, что за магия происходит в модели и как она создает совершенно новые изображения с помощью короткого текстового описания. 💭 Итак, если объяснять процессы, которые происходят в модели простым языком, то глобально их три: модель получает текстовое описание, которое декодируется и попадает в пространство текстовых эмбедингов (математический способ представления информации). Затем они попадают в пространство эмбедингов изображений, где идет поиск наилучшего совпадения. После этого полученный эмбединг декодируется и мы получаем изображение. Вуаля! 📺 В основе модели лежит модель CLIP, которая занимается прямо противоположным: подбирает наиболее точное описание к каждому изображению. Как вы понимаете, для обеих моделей совершенно необходимо огроменное количество данных, а именно пар (изображение–точное описание). Вручную такое сделать достаточно…

    Telegram
  • LEFT JOIN

    Не секрет, что для того чтобы прокачиваться в нашей профессиональной области мы должны изучать очень много информации из разных источников у которых могут быть свои плюсы и минусы. По видео хорошо изучать основы за короткие сроки. По книгам обучение идет не столь быстро, но зато можно получить больше детальной и прикладной информации. Вчера на канале Data Science вышла подборка книг, которые могут быть полезны для желающих развиваться в аналитике данных. Надеемся, она будет вам полезна.
    Data science [ru]

    ​​Подборка книг по Data Sciense 👉 Практическая статистика для специалистов Data Science Авторы: Питер Брюс, Эндрю Брюс Описание: как: В книге рассказывается о таких штуках как: разведочный анализ данных, статистические эксперименты, проверка значимости, регрессия, классификация, машинное обучение. Но для прочтения вам понадобятся знания математической статистики и языка R. 👉 Data Science Авторы: Кэти О’Нил, Рэйчел Шатт Описание: Книга основана на курсе Колумбийского университета по анализу данных. В процессе обучения вы узнаете о байесовском методе, визуализации данных, статистических алгоритмах, рекомендательных движках, MapReduce и финансовом моделировании. 👉 Теоретический минимум по Big Data Авторы: Анналин Ын, Кеннет Су Описание: Издание не ориентировано только на профессионалов, заняться образованием могут начать аналитики, бизнесмены, программисты и непрофильные специалисты. На страницах этого труда рассматривается масса алгоритмов, каждому из которых посвящена отдельная глава, с картинками и примерами…

    Telegram
  • LEFT JOIN

    Все знают, какие запросы аналитики пишут на языке SQL, но с какими запросами они чаще всего приходят в кабинет психолога? Разберемся в четвертом эпизоде DataHeroes! 🚀 Мы решили обсудить не только науку о данных, но и внутренний мир человека, который её изучает. Иногда мы будем делать выпуски о психологии и приглашать специалистов этой области. Сегодня мы поговорим о таком явлении, как синдром самозванца, который присутствует аж у 70% людей! Надеемся, что вы не попадаете в эти 70%, однако никогда не бывает лишним проверить себя. Скорее включайте подкаст, чтобы узнать, как распознать в себе самозванца и, главное, как с ним бороться! 🦸🏻‍♀️ Спикеры: Виктория Коппер, Ринат Акчурин, Анастасия Калашникова Слушайте подкаст на плафтормах: Spotify, Anchor, Apple Podcasts, Google, Yandex, Telegram (↓) #подкаст #DataHeroes
  • LEFT JOIN

    Когда написал SELECT * FROM табличка #мем
  • LEFT JOIN

    BI-гайд по современным инструментам возвращается, чтобы вновь рассказать о самом нужном Не знаю как вы, а мы очень ждали возвращения цикла видео-обзоров BI-инструментов, которые есть на рынке, ведь в мире data-аналитики стоит активно следить за стремительными изменениями и стараться подобрать самый подходящий. В сегодняшнем видео мы поговорим про обновленный и улучшенный Apache Superset — open-source инструмент с множеством опций, которые позволяют пользователям с любым опытом изучать и визуализировать данные, от простых линейных графиков до высокодетализированных геопространственных диаграмм (ух!). Посмотрите на финальный дашборд в материале блога и ответьте на два небольших вопроса ниже 🤔 Автор дашборда, член команды Valiotti Analytics — Егор Сатюков
  • LEFT JOIN

    🐙 Airbyte: рассказываем и показываем наглядно все тонкости 🔍 Многие инструменты аналитиков уже давно подробно разобраны и описаны в разных тематических блогах. Однако, когда мы искали качественный гайд по Airbyte, то нам не удалось найти ничего по-настоящему полезного, кроме официальной документации. Поэтому мы решили написать свой 🙂 Плюс ко всему, мы разобрали кейс подключения Facebook Marketing API и расписали все шаги, которые нужно выполнить для начала работы с ним. В общем, читайте, комментируйте, задавайте вопросы, если (ну, вдруг) мы что-то упустили!
  • LEFT JOIN

    📊 Supabase выходит на новый уровень 💰 Я часто рассказываю вам про интересные open-source альтернативы известных сервисов. На этой неделе появилась весьма важная новость о компании Supabase, которая позиционирует себя как альтернатива open-source сервисам, таким как Firebase от Google. В среду эта компания объявила о привлечении раунда финансирования серии B на сумму 80 млн долларов под руководством Felicis Ventures. 🤔 В чем они хороши? Supabase, конечно, не может конкурировать с Firebase по набору предлагаемых функций, но у них есть отличный пакет базовых инструментов, которые необходимы разработчикам для качественной работы: база данных, хранилище и служба аутентификации. Также они запустили Supabase Edge Functions – serverless оффер “функция как сервис“. 📈 Почему это важно? Благодаря огромному финансированию Supabase планирует удвоить свою команду, чтобы создать свою платформу (с упором на корпоративные функции) и стратегию выхода на рынок. Кстати, до сих пор большая часть роста компании была органической, что явно подтверждает высокое качество их сервиса. Теперь стоит активно следить за улучшениями сервиса, думаю, они не заставят себя ждать! 🚀
    Supabase raises $80M Series B for its open source Firebase alternative

    Supabase, an open source alternative to services like Google's Firebase, announced it has raised an $80 million Series B funding round led by Felicis Ventures.

    TechCrunch
  • LEFT JOIN

    GRAND THEFT AUTO 1996 Making Of - GTA - | Retro Gaming | BBC Archive

    Rory Cellan Jones visits the Dundee studios of DMA Design - fresh from the success of Lemmings, but before they became Rockstar Games - where artists, level designers, musicians and video game testers are hard at work developing an ambitious, and tonally very different follow-up: Grand Theft Auto. The original, 2D Grand Theft Auto was released in 1997 on Playstation and PC. Clip taken from Working Lunch, originally broadcast 15 May 1996. You have now entered the BBC Archive, a time machine that will transport you back to the golden age of tv to educate, entertain and enlighten you with classic tv clips from the BBC vaults. Make sure you subscribe so that you never miss a single stop on our amazing journey through the BBC Archive - https://www.youtube.com/c/BBCArchive?sub_confirmation=1 Blow the dust off those cartridges, put another coin in the cabinet and stare patiently at that interminable loading screen, as we take you down the retro gaming wormhole in our vintage gaming playlist - https://www.youtube.com/playlist?list=PLp5kxJAhpetmcS2Qg7I16RVRx8ecCOw0H

    YouTube
  • LEFT JOIN

    Забавный сервис: вбиваешь какую-то текстовую строку на выбранном языке, затем она 10 раз переводится на разные языки и потом возвращается обратно на исходный. Из фразы: «Утром придумал новый пост в свой канал и опубликовал» у меня получилось: «На следующее утро я пошел на свой канал и был опубликован» #ссылка
  • LEFT JOIN

    GitHub - lucidrains/DALLE2-pytorch: Implementation of DALL-E 2, OpenAI's updated text-to-image synthesis neural network, in Pytorch

    Implementation of DALL-E 2, OpenAI's updated text-to-image synthesis neural network, in Pytorch - GitHub - lucidrains/DALLE2-pytorch: Implementation of DALL-E 2, OpenAI's updated t...

    GitHub
  • LEFT JOIN

    Новые чувствительные данные оказались доступными в интернете. На этот раз отличился, предположительно, Гемотест. Наверное, любопытный датасет для анализа. Ждем штрафа в 60 т.р.? 😉
    Утечки информации

    На теневом форуме выставили на продажу базу данных клиентов предположительно медицинской лаборатории «Гемотест». 👇 По заявлению продавца в базе 31 млн строк, содержащих: ФИО, дату рождения, адрес, телефон, адрес эл. почты, серию/номер паспорта и т.п. По нашей информации эта база появилась в закрытом доступе у очень ограниченного числа лиц в начале весны. Данные (точное количество меньше, чем заявлено продавцом - 30,5 млн строк) получены "благодаря" уязвимости в ИТ-системе лаборатории. 😎 Судя по приведенному продавцом образцу данных, эта база была выгружена не раньше 22.04.2022, что может говорить о наличии до сих пор открытой уязвимости.

    Telegram
  • Реклама

  • LEFT JOIN

    🚀 Релокейт: куда валить и что делать? Ответим в третьем эпизоде DataHeroes 🦸🏻 Принять быстрое решение о релокейте в другую страну и переехать за считанные дни? ✈️ Добавим к этому последние события в мире, закрытые границы и заблокированные банковские счета — получается неплохой квест! Только происходит это не в игре, а в реальной жизни. Наши спикеры поделились своими захватывающими историями релокейта и ответили на главные вопросы: где просить помощи в вопросах переезда? Как распорядиться деньгами? Можно ли справиться с тревогой и что делать тем, кто пока не может переехать? Включайте подкаст и узнаете прямо сейчас! БОНУС 🔥 В конце выпуска вас ждут подробные рекомендации по релокейту 😎 А также полезные советы и немного мотивации тем, кто остаётся в России! Наши спикеры — Беслан Курашов, Павел Комаровский, Валерий Бабушкин, Виталий Емельянцев Подкаст доступен на платформах: Spotify, Anchor, Apple Podcasts, Castbox, Overcast, Google, Yandex, Telegram (↓) #DataHeroes #подкаст
  • LEFT JOIN

    Прикольный фреймворк для любителей поизвращаться: PyScript, позволяющий запустить .py-скрипт из .html-странички.
  • LEFT JOIN

    US plans campaign to attract Russian scientists, engineers to America

    The Biden Administration is planning a campaign to attract Russian scientists and engineers to the US, in an effort to further weaken Russia’s science and technology base. It also plans to help Russian physicists at the CERN nuclear lab continue working there, rather than return home when their normal visas expire, if they wish. The plan, first reported 29 April by Bloomberg News and confirmed to Science|Business, is part of a $33 billion supplemental spending bill for the Ukraine war that President Biden sent to Congress 28 April, officials said. The legislation includes language that would permit technically qualified Russians with masters or doctoral degrees in a range of fields to immigrate to the US without the usual visa requirement that they have a job lined up in advance. They would have to pass a US security background check. And for Russians working at CERN, the world’s premier high-energy physics lab near Geneva, the US in consultation with other G7 countries plans to help them keep working there if…

    Science|Business