Библиотека data scientist’а, страница 2, все посты канала

Библиотека data scientist’а

10 месяцев назад

Кто еще не подписан на наш главный канал — очень рекомендуем! В «Библиотеке программиста» вас ждут фундаментальные IT-темы, Git, рынок труда, главные новости и, конечно же, мемы😎 Вот вам топ недавних постов: 🔍про коммиты в ветках Git 🔍новость о создании сверхразумного ИИ 🔍подборка инфографик на фундаментальные темы 🔍дайджест нейросетей для разработки 👉Подписаться👈
Библиотека data scientist’а

10 месяцев назад

🐍 Самоучитель по Python для начинающих. Часть 25: Основы анализа данных с Pandas Покажем основные приемы работы с DataFrame и Series, которые нужно знать начинающему дата-аналитику. В конце статьи – 10 мини-проектов по анализу и визуализации многомерных данных. 🔗 Основной сайт 🔗 Зеркало
Библиотека data scientist’а

10 месяцев назад

В каких задачах оглупел ChatGPT и как это исправить В относительно короткой истории программного обеспечения немало примеров, когда разработчикам удавалось настолько ухудшить продукты, что теми переставали пользоваться. Например, Windows ME (2000) или RealPlayer. Возможно, сейчас на эти старые «грабли» наступила и компания OpenAi. В результате последних обновлений ChatGPT-4 стал работать объективно хуже, что подтверждается не только жалобами на Reddit, но и результатами научного исследования специалистов из Стэнфордского университета в Беркли. Читать статью

Читать дальше
Реклама

Рекламный пост
Библиотека data scientist’а

10 месяцев назад

Разбираем особенности алгоритмов CatBoost и LightGBM: какой от них профит Статья про особенности алгоритмов CatBoost и LightGBM. Для чего они нужны, в чём их фишки и как они облегчают нам работу с данными. Читать статью
Библиотека data scientist’а

10 месяцев назад

Очередной #дайджест по Python: ✍️ python-mastery: продвинутое владение Python Курс по продвинутому программированию на Python, основанный на упражнениях, который был протестирован несколько сотен раз в рамках корпоративного обучения на протяжении более десяти лет. ✍️ Как Netflix выполняет отказоустойчивость всего за 7 минут Netflix сократил время, необходимое для реагирования на сбой, с 45 минут до семи без каких-либо дополнительных затрат. В этой статье рассказывается о том, как они осуществляют горячую замену процессов и резервируют вычислительное время, чтобы обеспечить быстрое реагирование на сбои. ✍️ Вкус итерации в Python Любой объект, реализующий интерфейс итератора, можно использовать в цикле for, но как это работает? В этой статье показано, как используется протокол итератора и как можно писать собственные совместимые объекты. ✍️ Практическое руководство по метапрограммированию в Python Эта статья представляет собой общий обзор различных типов метапрограммирования, доступных в Python, включая декораторы, метаклассы, встроенные ключевые слова самоанализа и динамическую генерацию кода. ✍️ Практическое руководство по метапрограммированию в Python Эта статья представляет собой общий обзор различных типов метапрограммирования, доступных в Python, включая декораторы, метаклассы, встроенные ключевые слова самоанализа и динамическую генерацию кода.

Читать дальше
Библиотека data scientist’а

10 месяцев назад

Психология ChatGPT Сообщение в блоге исследователя продуктов из Microsoft, который исследует алгоритмические предубеждения ChatGPT. Читать статью
Библиотека data scientist’а

10 месяцев назад

Сколько всего курсов по программированию вы купили? #интерактив
Библиотека data scientist’а

10 месяцев назад

❗️Один из важнейших инструментов MLOps — это MLFlow. ▶️ 10 августа в 20:00 мск в рамках онлайн-курса MLOps от OTUS пройдёт открытый урок «MLflow версии 2. Рецепты и пайплайны в машинном обучении». ✅ На открытом уроке вы узнаете: 🔹 О развитии MLFlow и о том, какие усовершенствования вошли в новые релизы (2.x) 🔹 О роли пайплайнов в организации процессов машинного обучения 🔹 Что такое MLFlow recipes и как их использовать для повышения эффективности работы DS 🧑‍💻 Спикером выступит преподаватель OTUS Данила Слепов. Он проектирует AI-системы, разрабатывает архитектуру MLOps платформ. 👉 РЕГИСТРАЦИЯ https://otus.pw/HJ2F/ Нативная интеграция. Информация о продукте www.otus.ru

Читать дальше
Библиотека data scientist’а

10 месяцев назад

Облачная платформа Nvidia DGX теперь доступна и предлагает мгновенный доступ к генеративной инфраструктуре искусственного интеллекта Nvidia объявила о широкой доступности Nvidia DGX Cloud, предоставляя компаниям доступ к тысячам графических процессоров в Oracle Cloud Infrastructure и собственным облачным серверам. Читать статью
Библиотека data scientist’а

10 месяцев назад

Если вы собираетесь переходить в сферу Data Science, вам обязательно стоит начать вспоминать или изучать с нуля вышмат. Начать с бесплатного демо-доступа можно здесь – https://proglib.io/w/d3978686 Сейчас лучшее время для начала обучения, потому что только до 31 июля у Proglib Academy скидка 33% на любой тариф – https://proglib.io/w/3925c76a 🔹 Доступ к курсу – бессрочный 🔹 Преподаватели – кандидаты физико-математических наук Оставить заявку на консультацию или купить со скидкой 33% – https://proglib.io/w/3925c76a

Читать дальше
Библиотека data scientist’а

10 месяцев назад

Как рассчитать точность прогноза, используя матрицу ошибок? В матрице ошибок есть значения для общего количества данных, истинных значений и прогнозируемых значений. #вопросы_с_собеседований
Библиотека data scientist’а

10 месяцев назад

Наверное, многие уже видели новость о том, что ChatGPT якобы стала глупее. Давайте соберем статистику — заметили ли вы это явление?
Библиотека data scientist’а

10 месяцев назад

Какой ноутбук считаете наиболее подходящим для программирования и почему? #интерактив
Библиотека data scientist’а

10 месяцев назад

Очередной #дайджест статей по Python: 🐍 Как создать голосового ассистента В данной статье автор рассказал, как можно сделать простого голосового ассистента. Все это в Python при помощи некоторых библиотек. 🐍 Ray Casting 3D игра на Python + PyGame 🐍 Использование python-docx-template для динамического создания закладок и ссылок на них в документах Word Модуль содержит функционал для вставки в документ внешних ссылок, но когда автору понадобилось создавать по шаблону внутренние ссылки (на конкретное место в документе), такого функционала не нашлось, поиск в сети тоже ничего не дал. В статье он предложил свой способ вставки закладок и ссылок на них при помощи python-docx-template. 🐍 Измерение покрытия python сервисов для end-to-end тестов Как измерить покрытие автотестами? Данный вопрос всегда вызывает жаркие дискуссии в рядах тестировщиков. 🐍 Под капотом Python. Тонкости популярных конструкций with и contextmanager В этой статье описано, как написать менеджер контекста, как создать функцию-генератор для декоратора contextmanager. Опытные разработчики могут узнать что-то новенькое или дополнить статью ценными комментариями. 🐍 Как правильно написать калькулятор на питоне с помощью eval() О том, почему eval стоит использовать с осторожностью. 🐍 Пишем микро-shellcode в формате ELF вручную Уже не раз публиковались статьи про устройство формата ELF и написание файлов в таком формате вручную, но здесь представлено другое решение. В результате получился файл, вызывающий /bin/sh и занимающий всего 76 байт (что на 8 байт меньше, чем сумма длин заголовков ELF, необходимых для запуска).

Читать дальше
Библиотека data scientist’а

10 месяцев назад

Data Engineering: концепции, процессы и инструменты Data science, машинное обучение и искусственный интеллект — не просто громкие слова: многие организации стремятся их освоить. Но прежде чем создавать интеллектуальные продукты, необходимо собрать и подготовить данные, которые станут топливом для ИИ. Фундамент для аналитических проектов закладывает специальная дисциплина — data engineering. Связанные с ней задачи занимают первые три слоя иерархии потребностей data science, предложенной Моникой Рогати. Читать статью

Читать дальше
Реклама

Рекламный пост
Библиотека data scientist’а

10 месяцев назад

Перспективы диффузионных моделей Перспективы диффузии, или как модели диффузии являются автокодировщиками, моделями с глубокими неявными переменными, предикторами функции оценки, обратными решателями SDE, моделями на основе потоков, RNN и авторегрессионными моделями, все сразу! Читать статью
Библиотека data scientist’а

10 месяцев назад

Учебник по амортизированной оптимизации В этом руководстве представлено введение в основы амортизированной оптимизации, лежащие в основе ее достижения, и приведен обзор их применения в вариационном выводе, разреженном кодировании, градиентном метаобучении, управлении, обучении с подкреплением, выпуклой оптимизации, оптимальном транспорте и сетях глубокого равновесия. Читать статью
Библиотека data scientist’а

11 месяцев назад

Что такое нормализация данных и зачем она нам нужна? Нормализация данных — очень важный этап предварительной обработки, используемый для изменения масштаба значений, чтобы они соответствовали определенному диапазону, чтобы обеспечить лучшую сходимость во время обратного распространения ошибки. В общем случае она сводится к вычитанию среднего значения и делению на стандартное отклонение. Если этого не сделать, некоторые признаки будут иметь более высокий вес в функции стоимости. Нормализация позволяет сделать все признаки одинаково взвешенными. #вопросы_с_собеседований

Читать дальше