Библиотека data scientist’а, страница 7, все посты канала

Библиотека data scientist’а

Scikit-learn Scikit-learn — это библиотека для машинного обучения. Scikit-learn может быть использована для решения различных задач машинного обучения, включая классификацию, регрессию, кластеризацию, а также для обработки данных и выбора наилучших признаков. Она также может использоваться для предобработки данных, визуализации и выбора модели. В этом примере мы загружаем данные Iris и разделяем их на обучающую и тестовую выборки. Набор данных Iris - это классический набор данных в машинном обучении и статистике. Объект Iris, возвращаемый load_iris, является объектом Bunch, который очень похож на словарь (подробнее о данных здесь). Затем мы создаем классификатор K ближайших соседей и обучаем его на обучающей выборке. Наконец, мы оцениваем точность модели на тестовой выборке. #код

Библиотека data scientist’а

Иммерсивный 3D-рендеринг из обычных видео В статье представлен алгоритм восстановления поля яркости крупномасштабной сцены из одного случайно снятого видео. Читать статью

Библиотека data scientist’а

Мечтали о космосе, а работаете в опенспейсе? Мы тоже… Но мечты же должны сбываться! Поэтому мы создали свои мультивселенные и решили провести там настоящие соревнования по спортивному хакингу IT’s Tinkoff CTF. Путешественников ждут 30 порталов в новые измерения. Там предстоит пройти миссии, набрать максимальное количество баллов и, конечно, разгадать все пасхалки. Задания будут интересны разработчикам, SRE- и QA-инженерам, аналитикам и другим ИТ-специалистам. А еще вы сможете потренироваться на тестовых заданиях и выбрать лигу по своим скиллам. Лучшим командам — вселенский почет и денежные призы до 360 000 рублей! Покорять мультивселенные отправимся 15 и 16 июля. Участвовать можно онлайн и очно в 14 ИТ-хабах Тинькофф по всей России. Офлайн-участников ждут квизы, настолки, крутой мерч и нетворкинг с экспертами. 🚀Переходите на IT’s Tinkoff CTF, читайте подробности и регистрируйтесь! Да пребудут с вами силы мультивселенной капибары! (Упс… кажется, мы спалили первую пасхалку, Хьюстон) Ерид: LdtCKZmzw

Библиотека data scientist’а

Трансформеры ручной работы Трансформер — это своего рода виртуальная машина, у которой выбирают веса, чтобы заставить ее выполнять сложение форм так, как это делают люди. Открыть ноутбук

Библиотека data scientist’а

#вопросы_с_собеседований Что такое Random Forest? Random Forest, или случайный лес, — это один из немногих универсальных алгоритмов обучения, который способен выполнять задачи классификации, регрессии и кластеризации. Случайный лес состоит из большого количества отдельных деревьев решений, которые по сути являются ансамблем методов. Каждое дерево в случайном лесу возвращает прогноз класса, и класс с наибольшим количеством голосов становится прогнозом леса.

Библиотека data scientist’а

Почему профессора так плохо дают советы Недавно я был на докладе с несколькими другими профессорами, и нас попросили дать несколько советов аспирантам по машинному обучению. Это заставило меня задуматься о том, почему профессора так плохо дают советы. Итак, вот несколько причин, по которым вам не следует слушать советы профессоров… Читать тред

Библиотека data scientist’а

🎲 Теория вероятностей: где она используется и нужна ли она рядовому разработчику Расскажем, где может пригодиться теория вероятностей, и как базовое понимание теорвера могло бы в свое время спасти разработчиков iPod от серьезного конфуза. 🔗 Основной сайт 🔗 Зеркало

Библиотека data scientist’а

Comet сотрудничает со Snowflake для повышения воспроизводимости наборов данных машинного обучения Платформа MLOps Comet объявила о стратегическом партнерстве со Snowflake, целью которого является расширение возможностей специалистов по данным для создания превосходных моделей машинного обучения (ML) в ускоренном темпе. Читать статью

Библиотека data scientist’а

Сейчас сложно представить сайт без базовой onsite-персонализации. Показывать релевантные для пользователя сообщения в нужное время и удобном для него канале, направляя его к совершению целевого действия, — аксиома успешного бизнеса. Под onsite-персонализацией обычно понимают продуктовые и навигационные подсказки, отзывы, соцдоказательства, виджеты со скидкой и мотивацией. Они помогают бизнесу увеличить количество заказов, вырастить лояльность, выручку, собрать лиды, снизить количество брошенных корзин. Flocktory запустили продукт-конструктор, в который можно добавить комбинацию готовых механик. Базовый пакет из пяти механик стоит 50 000₽ и закроет большую часть запросов бизнеса. Продукт подойдет новичкам: у Flocktory есть клиент-сервис, который поддержит на этапе запуска и в дальнейшей работе. Если уже используете персонализацию: в библиотеке у ребят более 100 готовых механик — вы точно найдете новый виджет, который можно потестить за приятную стоимость. Получить 5 механик за 50 000₽

Библиотека data scientist’а

Представляем безопасный AI Framework от Google Потенциал ИИ, особенно генеративного ИИ, огромен. Однако в погоне за прогрессом в рамках этих новых границ инноваций необходимы четкие отраслевые стандарты безопасности для ответственного создания и развертывания этой технологии. Вот почему сегодня мы рады представить Secure AI Framework (SAIF), концептуальную основу для безопасных систем искусственного интеллекта. Читать статью

Библиотека data scientist’а

Spark UDAF — мощный инструмент для анализа данных и обработки сложных операций агрегации в Apache Spark. Как с помощью него разработать свой агрегатор? 📆Поговорим об этом 27 июня в 20:00 с Вадимом Заигриным, ведущим эксперт по технологиям в Сбербанке и преподавателем OTUS. Вебинар «Spark UDAF: разрабатываем свой агрегатор» приурочен к старту онлайн-курса «Spark Developer» в OTUS. 💻На открытом уроке рассмотрим агрегирование данных в Spark, стандартные агрегатные функции и создание собственных агрегатные функции (UDAF). После вебинара вы научитесь создавать собственные агрегатные функции. Урок предназначен для разработчиков Spark, которые хотят выйти за рамки стандартных функций и узнать, как создавать собственные агрегатные функции. Не упустите возможность получить ценные знания, продолжить обучение вы сможете на курсе, доступном в рассрочку. ➡Для участия пройдите вступительный тест: https://otus.pw/H94qZ/ Нативная интеграция информация о продукте www.otus.ru

Библиотека data scientist’а

Что такое рекуррентные нейронные сети (RNN)? Рекуррентные нейронные сети — это вид нейросетей, в которых связи между элементами образуют направленную последовательность. Это позволяет обрабатывать серии событий во времени или последовательные пространственные цепочки. Они используются преимущественно для задач, где нечто цельное состоит из ряда объектов, например при распознавании рукописного текста или речи. #вопросы_с_собеседований

Библиотека data scientist’а

Чем больший объем данных используют на проекте, чем выше нагрузка на систему – тем более продвинутый SQL нужен разработчикам. Изучить SQL и свободно использовать его в работе поможет курс Практикума. После 3 месяцев курса разработчики смогут: — уверенно пользоваться простыми селектами, джоинами, индексами и оконными функциями; — отладить запрос, который сгенерирован через ORM; — составить сложные запросы на нативном SQL; — применить продвинутый SQL, чтобы писать код для высоконагруженных систем, — чувствовать себя спокойно на собеседованиях. Записывайтесь и растите в карьере.

Библиотека data scientist’а

Почему не нужно советовать «просто» использовать pyenv, poetry или anaconda В этой статье рассказывается о проблемах, которые часто возникают у начинающих программистов на Python при адаптации к сложным механизмам управления пакетами, и о том, почему использование pip часто является лучшим выбором. Читать статью

Библиотека data scientist’а

Чем вам нравится Data Science? Расскажите в комментариях ⬇️ #интерактив

Библиотека data scientist’а

Пост-дайджест с актуальными статьями по машинному обучению и искусственному интеллекту: 🤖 Заметки про увеличение картинок нейронными сетями 🤖 Как поговорить с компьютером, если у вас не поехала крыша 🤖 Сквозная оптимизация в промышленности 🤖 Меня нанял робот, или рекрутинг сотрудников как продукт 🤖 Форматы данных и файлов: руководство для архитекторов 🤖 Распознавание документов на Steam Deck. А нужен ли мне мой ноутбук? 🤖 Геолоцировать пользователя по Tweet-у: машинное обучение, часть I #дайджест

Библиотека data scientist’а

Строим многорядные столбчатые диаграммы с помощью Python Как и в случае с линейными графиками, matplotlib предоставляет возможность представлять объекты Dataframe с результатами анализа данных в форме столбчатых диаграмм.

Библиотека data scientist’а

🐍 Самоучитель по Python для начинающих. Часть 22: Основы работы с SQLite Разберем основные запросы к базе данных SQLite и обсудим альтернативу реляционным СУБД – модули dbm, pickle и shelves. В конце статьи – решения 10 практических задач, связанных с выборкой данных по различным критериям, редактированием записей и удалением дубликатов. 🔗 Основной сайт 🔗 Зеркало

Библиотека data scientist’а. Страница 7

Библиотека data scientist’а

Библиотека data scientist’а

Библиотека data scientist’а

Реклама

Библиотека data scientist’а

Библиотека data scientist’а

Библиотека data scientist’а

Библиотека data scientist’а

Библиотека data scientist’а

Библиотека data scientist’а

Библиотека data scientist’а

Библиотека data scientist’а

Библиотека data scientist’а

Библиотека data scientist’а

Библиотека data scientist’а

Библиотека data scientist’а

Реклама

Библиотека data scientist’а

Библиотека data scientist’а

Библиотека data scientist’а