Обложка канала

Библиотека data scientist’а. Страница 3

14419 @dsproglib

Полезные материалы по всему, что может быть интересно дата сайентисту.

  • Библиотека data scientist’а

    Темный лес исследований и разработок и капиталовложений в ИИ В то время как на первый взгляд мы в основном просто видим большие раунды инвестиций, в действительности компании ИИ, возможно, являются одними из самых сложных бизнесов, которые мы когда-либо создавали в сфере технологий. Выполнение основных исследований и разработок модели ИИ требует игры в 4D-шахматы с исследовательскими сообществами, накопления и использования капитала, привлечения талантов, понимания конкуренции и коммерциализации…. Читать статью
  • Библиотека data scientist’а

    🔍 ТОП-12 джоб-сайтов: где программисту разместить резюме и найти работу Рассказываем про мир job-сайтов: где программисту опубликовать резюме, чтобы быстрее найти работу в IT. Читать статью
  • Библиотека data scientist’а

    🚩 5 красных флагов: как из текста вакансии понять, что компания — не очень Как определить работодателя-абьюзера в АйТи? Объясняем на реальных примерах. Читать статью
  • Реклама

  • Библиотека data scientist’а

    Подборка бесплатных курсов по Python и машинному обучению. Сохраняй, чтобы не потерять и когда-нибудь пройти! 1. Ускоренный курс по машинному обучению — основы машинного обучения, включает видеолекции от исследователей из Google. 2. Основы Python для анализа данных — программирование на Python. 3. Введение в Data Science и аналитику — все основы Data Science и Data Science Life Cycle. 4. Линейная регрессия — как использовать R для реализации линейной регрессии, одного из наиболее распространенных подходов к статистическому моделированию 5. Основы R — как обрабатывать, анализировать и визуализировать данные. 6. Визуализация — основные принципы визуализации данных и способы их применения с помощью ggplot2. 7. Введение CS50 в программирование на Python, май 2023 г.
  • Библиотека data scientist’а

    Отношение разработчиков к AI/ML Stack Overflow дополнительно исследует мнение технологов об использовании инструментов ИИ. Читать статью
  • Библиотека data scientist’а

    В работе используете linux, macOS или Windows? Расскажите в комментариях ⬇️ #интерактив
  • Библиотека data scientist’а

    Утечка данных в машинном обучении: виды, последствия, варианты предотвращения на примерах реальных датасетов. habr.com/ru/comp…s/746360
  • Библиотека data scientist’а

    Виджеты Jupyter стали проще с anywidget anywidget — это библиотека Python, которая упрощает создание пользовательских виджетов Jupyter. Это позволяет быстро создавать прототипы, а поскольку это Python, её можно использовать в разных средах. Читать статью
  • Библиотека data scientist’а

    7 способов совместного использования массива NumPy между процессами Если вы выполняете многопроцессорную обработку с помощью NumPy, вам нужно будет передавать массивы между процессами. В этой статье рассматриваются различные способы сделать это. Читать статью
  • Библиотека data scientist’а

    Что такое ансамбль методов? Ансамбль методов — это использование нескольких алгоритмов с целью получения более высокой эффективности прогнозирования, чем можно было бы получить, используя эти алгоритмы отдельно. #вопросы_с_собеседований
  • Библиотека data scientist’а

    panflute: Фильтры для Pandoc panflute — это пакет Python, который делает создание фильтров Pandoc увлекательным. Подробное руководство пользователя, документацию и инструкции по установке см. на странице. Открыть репозиторий
  • Библиотека data scientist’а

    Какой средой разработки пользуетесь? #интерактив
  • Библиотека data scientist’а

    Очередной #дайджест статей по машинному обучению: ✍️ Линейная регрессия: прямая, разделяющая плоскость на точки 2 классов ✍️ Эволюция метрик качества машинного перевода ✍️ Визуализация реальных масштабов проклятия размерности ✍️ Вышел Savant 0.2.4: компьютерное зрение на базе глубокого обучения для Nvidia Jetson и dGPU ✍️ Графовые нейронные сети GNN в самообучающемся искусственном интеллекте ✍️ Нейронные сети врываются в медицину ✍️ Как с помощью ChatGPT писать SQL-запросы. Несколько кейсов
  • Библиотека data scientist’а

    PINN (Physics-informed neural networks) и с чем их едят Реальные физические системы обсчитываются сложными численными методами за очень большое время на суперкомпьютерах. Но есть нейронные сети, которые делают это быстрее (пусть и с меньшей точностью). Читать статью
  • Библиотека data scientist’а

    Наборы данных временных рядов спутниковых изображений На этой странице представлен список наборов данных спутниковых изображений с временным измерением и спутниковых видео для различных задач компьютерного зрения и глубокого обучения. Читать статью
  • Реклама

  • Библиотека data scientist’а

    Аналитика хорошо, а предиктивная аналитика — вдвое лучше. Это доказывает Авито: благодаря качественным прогнозам эффективность их рекламы выросла на 22%, стоимость привлечения снизилась на 12%, а новых пользователей в тестовых кампаниях было 60%. Как этого добились? Тщательно анализируя клиентов, их поведение и путь к целевому событию. Чтобы построить прогноз на 90 дней, пользователей поделили на группы, определили ценность контакта, выбрали события и фичи, которые нужно предсказать, и сделали большую аналитическую работу. Кампании с предиктивными моделями нужны в нескольких случаях. Если у вас долгие циклы продаж, у товаров в продукте циклы разной длины или продукт предназначен не для разовой покупки, а для длительного использования. Если это про ваш бизнес — открывайте кейс, там исполняющая обязанности тимлида в аналитике маркетинга Авито Ирина Гутман очень подробно объясняется каждый шаг на пути к успеху.
  • Библиотека data scientist’а

    Интересно понять, как нейросети работают изнутри? Есть наглядный учебник Здесь представлена интерактивная визуализация устройства нейросетей. Всё объясняется по порядку от структуры, вычислительных узлов, до нейронов и слоёв. Пояснения очень доступные, хоть и на английском. Сохраняй и делись с другом: https://mlu-explain.github.io/neural-networks/
  • Библиотека data scientist’а

    Почему ReLU лучше и чаще используется в нейронных сетях, чем сигмоида? Представьте сеть со случайно проинициализированными весами (или нормализованными). Почти 50% сети дает 0 после активации из-за ReLu (вывод 0 для отрицательных значений x). Это означает, что срабатывает меньше нейронов и сама сеть легче. #вопросы_с_собеседований