Обложка канала

Библиотека data scientist’а. Страница 2

14419 @dsproglib

Полезные материалы по всему, что может быть интересно дата сайентисту.

  • Библиотека data scientist’а

    Кто еще не подписан на наш главный канал — очень рекомендуем! В «Библиотеке программиста» вас ждут фундаментальные IT-темы, Git, рынок труда, главные новости и, конечно же, мемы😎 Вот вам топ недавних постов: 🔍про коммиты в ветках Git 🔍новость о создании сверхразумного ИИ 🔍подборка инфографик на фундаментальные темы 🔍дайджест нейросетей для разработки 👉Подписаться👈
  • Библиотека data scientist’а

    🐍 Самоучитель по Python для начинающих. Часть 25: Основы анализа данных с Pandas Покажем основные приемы работы с DataFrame и Series, которые нужно знать начинающему дата-аналитику. В конце статьи – 10 мини-проектов по анализу и визуализации многомерных данных. 🔗 Основной сайт 🔗 Зеркало
  • Библиотека data scientist’а

    В каких задачах оглупел ChatGPT и как это исправить В относительно короткой истории программного обеспечения немало примеров, когда разработчикам удавалось настолько ухудшить продукты, что теми переставали пользоваться. Например, Windows ME (2000) или RealPlayer. Возможно, сейчас на эти старые «грабли» наступила и компания OpenAi. В результате последних обновлений ChatGPT-4 стал работать объективно хуже, что подтверждается не только жалобами на Reddit, но и результатами научного исследования специалистов из Стэнфордского университета в Беркли. Читать статью
  • Реклама

  • Библиотека data scientist’а

    Разбираем особенности алгоритмов CatBoost и LightGBM: какой от них профит Статья про особенности алгоритмов CatBoost и LightGBM. Для чего они нужны, в чём их фишки и как они облегчают нам работу с данными. Читать статью
  • Библиотека data scientist’а

    Очередной #дайджест по Python: ✍️ python-mastery: продвинутое владение Python Курс по продвинутому программированию на Python, основанный на упражнениях, который был протестирован несколько сотен раз в рамках корпоративного обучения на протяжении более десяти лет. ✍️ Как Netflix выполняет отказоустойчивость всего за 7 минут Netflix сократил время, необходимое для реагирования на сбой, с 45 минут до семи без каких-либо дополнительных затрат. В этой статье рассказывается о том, как они осуществляют горячую замену процессов и резервируют вычислительное время, чтобы обеспечить быстрое реагирование на сбои. ✍️ Вкус итерации в Python Любой объект, реализующий интерфейс итератора, можно использовать в цикле for, но как это работает? В этой статье показано, как используется протокол итератора и как можно писать собственные совместимые объекты. ✍️ Практическое руководство по метапрограммированию в Python Эта статья представляет собой общий обзор различных типов метапрограммирования, доступных в Python, включая декораторы, метаклассы, встроенные ключевые слова самоанализа и динамическую генерацию кода. ✍️ Практическое руководство по метапрограммированию в Python Эта статья представляет собой общий обзор различных типов метапрограммирования, доступных в Python, включая декораторы, метаклассы, встроенные ключевые слова самоанализа и динамическую генерацию кода.
  • Библиотека data scientist’а

    Психология ChatGPT Сообщение в блоге исследователя продуктов из Microsoft, который исследует алгоритмические предубеждения ChatGPT. Читать статью
  • Библиотека data scientist’а

    Сколько всего курсов по программированию вы купили? #интерактив
  • Библиотека data scientist’а

    ❗️Один из важнейших инструментов MLOps — это MLFlow. ▶️ 10 августа в 20:00 мск в рамках онлайн-курса MLOps от OTUS пройдёт открытый урок «MLflow версии 2. Рецепты и пайплайны в машинном обучении». ✅ На открытом уроке вы узнаете: 🔹 О развитии MLFlow и о том, какие усовершенствования вошли в новые релизы (2.x) 🔹 О роли пайплайнов в организации процессов машинного обучения 🔹 Что такое MLFlow recipes и как их использовать для повышения эффективности работы DS 🧑‍💻 Спикером выступит преподаватель OTUS Данила Слепов. Он проектирует AI-системы, разрабатывает архитектуру MLOps платформ. 👉 РЕГИСТРАЦИЯ https://otus.pw/HJ2F/ Нативная интеграция. Информация о продукте www.otus.ru
  • Библиотека data scientist’а

    Облачная платформа Nvidia DGX теперь доступна и предлагает мгновенный доступ к генеративной инфраструктуре искусственного интеллекта Nvidia объявила о широкой доступности Nvidia DGX Cloud, предоставляя компаниям доступ к тысячам графических процессоров в Oracle Cloud Infrastructure и собственным облачным серверам. Читать статью
  • Библиотека data scientist’а

    Если вы собираетесь переходить в сферу Data Science, вам обязательно стоит начать вспоминать или изучать с нуля вышмат. Начать с бесплатного демо-доступа можно здесь – https://proglib.io/w/d3978686 Сейчас лучшее время для начала обучения, потому что только до 31 июля у Proglib Academy скидка 33% на любой тариф – https://proglib.io/w/3925c76a 🔹 Доступ к курсу – бессрочный 🔹 Преподаватели – кандидаты физико-математических наук Оставить заявку на консультацию или купить со скидкой 33% – https://proglib.io/w/3925c76a
  • Библиотека data scientist’а

    Как рассчитать точность прогноза, используя матрицу ошибок? В матрице ошибок есть значения для общего количества данных, истинных значений и прогнозируемых значений. #вопросы_с_собеседований
  • Библиотека data scientist’а

    Наверное, многие уже видели новость о том, что ChatGPT якобы стала глупее. Давайте соберем статистику — заметили ли вы это явление?
  • Библиотека data scientist’а

    Какой ноутбук считаете наиболее подходящим для программирования и почему? #интерактив
  • Библиотека data scientist’а

    Очередной #дайджест статей по Python: 🐍 Как создать голосового ассистента В данной статье автор рассказал, как можно сделать простого голосового ассистента. Все это в Python при помощи некоторых библиотек. 🐍 Ray Casting 3D игра на Python + PyGame 🐍 Использование python-docx-template для динамического создания закладок и ссылок на них в документах Word Модуль содержит функционал для вставки в документ внешних ссылок, но когда автору понадобилось создавать по шаблону внутренние ссылки (на конкретное место в документе), такого функционала не нашлось, поиск в сети тоже ничего не дал. В статье он предложил свой способ вставки закладок и ссылок на них при помощи python-docx-template. 🐍 Измерение покрытия python сервисов для end-to-end тестов Как измерить покрытие автотестами? Данный вопрос всегда вызывает жаркие дискуссии в рядах тестировщиков. 🐍 Под капотом Python. Тонкости популярных конструкций with и contextmanager В этой статье описано, как написать менеджер контекста, как создать функцию-генератор для декоратора contextmanager. Опытные разработчики могут узнать что-то новенькое или дополнить статью ценными комментариями. 🐍 Как правильно написать калькулятор на питоне с помощью eval() О том, почему eval стоит использовать с осторожностью. 🐍 Пишем микро-shellcode в формате ELF вручную Уже не раз публиковались статьи про устройство формата ELF и написание файлов в таком формате вручную, но здесь представлено другое решение. В результате получился файл, вызывающий /bin/sh и занимающий всего 76 байт (что на 8 байт меньше, чем сумма длин заголовков ELF, необходимых для запуска).
  • Библиотека data scientist’а

    Data Engineering: концепции, процессы и инструменты Data science, машинное обучение и искусственный интеллект — не просто громкие слова: многие организации стремятся их освоить. Но прежде чем создавать интеллектуальные продукты, необходимо собрать и подготовить данные, которые станут топливом для ИИ. Фундамент для аналитических проектов закладывает специальная дисциплина — data engineering. Связанные с ней задачи занимают первые три слоя иерархии потребностей data science, предложенной Моникой Рогати. Читать статью
  • Реклама

  • Библиотека data scientist’а

    Перспективы диффузионных моделей Перспективы диффузии, или как модели диффузии являются автокодировщиками, моделями с глубокими неявными переменными, предикторами функции оценки, обратными решателями SDE, моделями на основе потоков, RNN и авторегрессионными моделями, все сразу! Читать статью
  • Библиотека data scientist’а

    Учебник по амортизированной оптимизации В этом руководстве представлено введение в основы амортизированной оптимизации, лежащие в основе ее достижения, и приведен обзор их применения в вариационном выводе, разреженном кодировании, градиентном метаобучении, управлении, обучении с подкреплением, выпуклой оптимизации, оптимальном транспорте и сетях глубокого равновесия. Читать статью
  • Библиотека data scientist’а

    Что такое нормализация данных и зачем она нам нужна? Нормализация данных — очень важный этап предварительной обработки, используемый для изменения масштаба значений, чтобы они соответствовали определенному диапазону, чтобы обеспечить лучшую сходимость во время обратного распространения ошибки. В общем случае она сводится к вычитанию среднего значения и делению на стандартное отклонение. Если этого не сделать, некоторые признаки будут иметь более высокий вес в функции стоимости. Нормализация позволяет сделать все признаки одинаково взвешенными. #вопросы_с_собеседований