🐍 Самоучитель по Python для начинающих. Часть 25: Основы анализа данных с Pandas
Покажем основные приемы работы с DataFrame и Series, которые нужно знать начинающему дата-аналитику. В конце статьи – 10 мини-проектов по анализу и визуализации многомерных данных.
🔗 Основной сайт
🔗 Зеркало
В каких задачах оглупел ChatGPT и как это исправить
В относительно короткой истории программного обеспечения немало примеров, когда разработчикам удавалось настолько ухудшить продукты, что теми переставали пользоваться. Например, Windows ME (2000) или RealPlayer. Возможно, сейчас на эти старые «грабли» наступила и компания OpenAi. В результате последних обновлений ChatGPT-4 стал работать объективно хуже, что подтверждается не только жалобами на Reddit, но и результатами научного исследования специалистов из Стэнфордского университета в Беркли.
Читать статью
Разбираем особенности алгоритмов CatBoost и LightGBM: какой от них профит
Статья про особенности алгоритмов CatBoost и LightGBM. Для чего они нужны, в чём их фишки и как они облегчают нам работу с данными.
Читать статью
Очередной #дайджест по Python:
✍️ python-mastery: продвинутое владение Python
Курс по продвинутому программированию на Python, основанный на упражнениях, который был протестирован несколько сотен раз в рамках корпоративного обучения на протяжении более десяти лет.
✍️ Как Netflix выполняет отказоустойчивость всего за 7 минут
Netflix сократил время, необходимое для реагирования на сбой, с 45 минут до семи без каких-либо дополнительных затрат. В этой статье рассказывается о том, как они осуществляют горячую замену процессов и резервируют вычислительное время, чтобы обеспечить быстрое реагирование на сбои.
✍️ Вкус итерации в Python
Любой объект, реализующий интерфейс итератора, можно использовать в цикле for, но как это работает? В этой статье показано, как используется протокол итератора и как можно писать собственные совместимые объекты.
✍️ Практическое руководство по метапрограммированию в Python
Эта статья представляет собой общий обзор различных типов метапрограммирования, доступных в Python, включая декораторы, метаклассы, встроенные ключевые слова самоанализа и динамическую генерацию кода.
✍️ Практическое руководство по метапрограммированию в Python
Эта статья представляет собой общий обзор различных типов метапрограммирования, доступных в Python, включая декораторы, метаклассы, встроенные ключевые слова самоанализа и динамическую генерацию кода.
❗️Один из важнейших инструментов MLOps — это MLFlow.
▶️ 10 августа в 20:00 мск в рамках онлайн-курса MLOps от OTUS пройдёт открытый урок «MLflow версии 2. Рецепты и пайплайны в машинном обучении».
✅ На открытом уроке вы узнаете:
🔹 О развитии MLFlow и о том, какие усовершенствования вошли в новые релизы (2.x)
🔹 О роли пайплайнов в организации процессов машинного обучения
🔹 Что такое MLFlow recipes и как их использовать для повышения эффективности работы DS
🧑💻 Спикером выступит преподаватель OTUS Данила Слепов. Он проектирует AI-системы, разрабатывает архитектуру MLOps платформ.
👉 РЕГИСТРАЦИЯ
https://otus.pw/HJ2F/
Нативная интеграция. Информация о продукте www.otus.ru
Облачная платформа Nvidia DGX теперь доступна и предлагает мгновенный доступ к генеративной инфраструктуре искусственного интеллекта
Nvidia объявила о широкой доступности Nvidia DGX Cloud, предоставляя компаниям доступ к тысячам графических процессоров в Oracle Cloud Infrastructure и собственным облачным серверам.
Читать статью
Если вы собираетесь переходить в сферу Data Science, вам обязательно стоит начать вспоминать или изучать с нуля вышмат.
Начать с бесплатного демо-доступа можно здесь – https://proglib.io/w/d3978686
Сейчас лучшее время для начала обучения, потому что только до 31 июля у Proglib Academy скидка 33% на любой тариф – https://proglib.io/w/3925c76a
🔹 Доступ к курсу – бессрочный
🔹 Преподаватели – кандидаты физико-математических наук
Оставить заявку на консультацию или купить со скидкой 33% – https://proglib.io/w/3925c76a
Как рассчитать точность прогноза, используя матрицу ошибок?
В матрице ошибок есть значения для общего количества данных, истинных значений и прогнозируемых значений.
#вопросы_с_собеседований
Data Engineering: концепции, процессы и инструменты
Data science, машинное обучение и искусственный интеллект — не просто громкие слова: многие организации стремятся их освоить. Но прежде чем создавать интеллектуальные продукты, необходимо собрать и подготовить данные, которые станут топливом для ИИ. Фундамент для аналитических проектов закладывает специальная дисциплина — data engineering. Связанные с ней задачи занимают первые три слоя иерархии потребностей data science, предложенной Моникой Рогати.
Читать статью
Перспективы диффузионных моделей
Перспективы диффузии, или как модели диффузии являются автокодировщиками, моделями с глубокими неявными переменными, предикторами функции оценки, обратными решателями SDE, моделями на основе потоков, RNN и авторегрессионными моделями, все сразу!
Читать статью
Учебник по амортизированной оптимизации
В этом руководстве представлено введение в основы амортизированной оптимизации, лежащие в основе ее достижения, и приведен обзор их применения в вариационном выводе, разреженном кодировании, градиентном метаобучении, управлении, обучении с подкреплением, выпуклой оптимизации, оптимальном транспорте и сетях глубокого равновесия.
Читать статью
Что такое нормализация данных и зачем она нам нужна?
Нормализация данных — очень важный этап предварительной обработки, используемый для изменения масштаба значений, чтобы они соответствовали определенному диапазону, чтобы обеспечить лучшую сходимость во время обратного распространения ошибки. В общем случае она сводится к вычитанию среднего значения и делению на стандартное отклонение.
Если этого не сделать, некоторые признаки будут иметь более высокий вес в функции стоимости. Нормализация позволяет сделать все признаки одинаково взвешенными.
#вопросы_с_собеседований