Обложка канала

Библиотека data scientist’а

14419 @dsproglib

Полезные материалы по всему, что может быть интересно дата сайентисту.

  • Библиотека data scientist’а

    ИИ и мощность: этические проблемы автоматизации, централизации и масштабирования За последнее десятилетие такие темы, как объяснимость (компьютеры генерируют объяснение того, почему они вычисляют результаты, которые они делают) и справедливость/предвзятость (решение проблемы, когда алгоритмы имеют худшую точность для одних групп людей, чем для других) привлекли больше внимания в этой области. Читать статью
  • Библиотека data scientist’а

    «Библиотека программиста» в поиске контент-менеджера для ведения телеграм-каналов Ищем человека, который грамотно пишет, разбирается в контенте и в одной из этих трех тем: 👉Data Science 👉Frontend 👉мобильная разработка Мы предлагаем частичную занятость и полностью удаленный формат работы — можно совмещать с основной и находиться в любом месте🌴 Подробнее о вакансии и форма для отклика — по ссылке. Ждем вас в команде!
  • Библиотека data scientist’а

    OnnxStream: минимизация потребления памяти при генерации изображений Задача — запустить Stable Diffusion, включающую большую трансформирующую модель c почти 1 миллиардом параметров, на Raspberry Pi Zero 2 с 512 МБ RAM, не добавляя дополнительного пространства подкачки и не выгружая промежуточные результаты на диск. Рекомендуемый минимальный объём RAM/VRAM для Stable Diffusion составляет 8 ГБ. Читать статью
  • Реклама

  • Библиотека data scientist’а

    💬🦙 LlamaIndex: создаем чат-бота без боли и страданий В этой статье рассмотрим мощный фреймворк для работы с большими языковыми моделями LlamaIndex: узнаем, как настроить и использовать LlamaIndex, и увидим его в действии на примере поиска ответа в заданном тексте 🔗 Читать статью 🔗 Зеркало
  • Библиотека data scientist’а

    ⚡️OTUS приглашает посетить открытый урок по Machine Learning для начинающих. Тема: Разведочный анализ данных на Python для Machine Learning. Вебинар приурочен к старту онлайн-курса "Специализация Machine Learning". Дата: 9 августа, 18:00 На занятии мы поговорим о том как проводить первичный анализ данных с использованием фреймворка Pandas. Расскажем об основных аспектах анализа данных. Научимся обрабатывать признаки и заполнять пропущенные значения. 🙎🙎‍♀️Кому подходит урок: - IT-специалисту, который хочет перейти в Data Science; - Начинающему Data Scientist, желающему углубиться в профессию; - Тому, кто самостоятельно изучает Data Science; - Для того, кто хочет войти в IT, но не знает что выбрать. После урока будет открыт доступ ко второму занятию "Введение в Machine Learning", а курс можно будет приобрести в рассрочку по спец.цене. 👉Регистрация: https://otus.pw/9kSA/
  • Библиотека data scientist’а

    Откажитесь от хардкодинга в новом проекте по науке о данных  — вместо этого используйте файлы конфигурации Как эффективно взаимодействовать с файлами конфигурации в Python. Читать статью
  • Библиотека data scientist’а

    Представьте, что вы за час можете научиться чему угодно — что бы это было? #интерактив
  • Библиотека data scientist’а

    📖 ТОП-10 книг, без которых не обойтись ни одному программисту Мы подготовили для вас подборку из 10 книг, без которых не обойтись ни одному профессионалу в IT. Эти книги станут для вас настольными на долгие годы. 🔗 Основной сайт 🔗 Зеркало
  • Библиотека data scientist’а

    Более простой метод обучения управлению роботом Исследователи из Массачусетского технологического института и Стэнфорда создали метод машинного обучения, который может создать контроллер для робота, дрона или автономного транспортного средства, более эффективный, чем другие методы. Читать статью
  • Библиотека data scientist’а

    В чем разница между машинным обучением с учителем и без учителя? Для обучения с учителем требуются данные, помеченные для обучения. Например, чтобы провести классификацию (задача обучения с учителем), вам нужно сначала пометить данные, которые вы будете использовать для обучения модели, для классификации данных по помеченным группам; в то же время обучение без учителя не требует явной маркировки данных. #вопросы_с_собеседований
  • Библиотека data scientist’а

    Секреты создания качественных ML-систем Серия из двух статей про планирование, документацию и жизненный цикл ML-проекта, Data-centric ИИ, данные для обучения, Data Engineering и ETL. Как и зачем определять ценность для бизнеса, собирать требования и трезво оценивать, действительно ли в данном случае нужно именно машинное обучение. Читать первую часть Читать вторую часть
  • Библиотека data scientist’а

    Комплексные приложения для работы с данными с SQL и Jupyter Этот всеобъемлющий курс дает пошаговое введение в создание приложений для работы с данными с использованием блокнотов Python, SQL и Jupyter. Он даже включает в себя введение в визуализацию с использованием plotly и других. Читать курс
  • Библиотека data scientist’а

    Про какой учебный проект вы рассказывали/показывали его на первом собеседовании? #интерактив
  • Библиотека data scientist’а

    Очередной #дайджест по Python: ✍️ Монетизация фреймворков Маленькая заметка о монетизации aiogram. ✍️ Протоколы в Python Обучающий материал о протоколах, сравнение абстрактных базовых классов и протоколов, подтипизация на практике. ✍️ Книга по Open Source процессору спутниковой интерферометрии PyGMTSAR (Python InSAR) Необычная статья от харизматичного автора. ✍️ Аналитика небольших данных: как совместить Excel, Python и SQL с помощью инструментов с открытым исходным кодом ✍️ Пример уменьшения размерности данных с помощью линейных и нелинейных методов в Python По мере того, как данные растут и становятся более сложными, извлекать информацию становится все труднее, а визуализация становится более накладной. Методы уменьшения размерности данных решают эту проблему, предоставляя меньшее количество измерений (столбцов) при сохранении наиболее важной информации. Мы можем потерять некоторые детали, но получить более простое представление данных, которое легче обрабатывать и сравнивать.
  • Библиотека data scientist’а

    Нейронные сети, графы и эмерджентность Автор пробует осветить некоторые интересные области науки, с которыми он сталкивался в контексте работы с нейронными сетями, и найти между ними взаимосвязь. Данная статья не претендует на истину в последней инстанции и является всего лишь попыткой посмотреть на нейронные сети под другим углом. Читать статью
  • Реклама

  • Библиотека data scientist’а

    Что мы знаем о LLM (учебник) Если оставить в стороне безумие толпы, стоит задуматься о том, что мы конкретно знаем о LLM на данный момент и как эти идеи вызвали недавний энтузиазм про ИИ. Это поможет оценить актуальность текущих исследований и возможности. Читать статью
  • Библиотека data scientist’а

    🐍🎸 Курс Django. Часть 1: Django — что это? Обзор и установка фреймворка, структура проекта Рассмотрим особенности, принцип работы, плюсы и минусы Django. Покажем, как установить фреймворк в виртуальное окружение, создать, настроить и запустить первый проект. 🔗 Основной сайт 🔗 Зеркало
  • Библиотека data scientist’а

    Что такое аугментация данных? Можете привести примеры? Под аугментацией данных понимается увеличение выборки данных для обучения через модификацию существующих данных. Компьютерное зрение — одна из областей, где очень полезно увеличение объема данных. Есть много модификаций, которые мы можем сделать с изображениями: — Изменить размер — Горизонтально или вертикально перевернуть — Добавить шум — Деформировать — Изменить цвета #вопросы_с_собеседований