Scikit-learn
Scikit-learn — это библиотека для машинного обучения. Scikit-learn может быть использована для решения различных задач машинного обучения, включая классификацию, регрессию, кластеризацию, а также для обработки данных и выбора наилучших признаков. Она также может использоваться для предобработки данных, визуализации и выбора модели.
В этом примере мы загружаем данные Iris и разделяем их на обучающую и тестовую выборки. Набор данных Iris - это классический набор данных в машинном обучении и статистике. Объект Iris, возвращаемый load_iris, является объектом Bunch, который очень похож на словарь (подробнее о данных здесь). Затем мы создаем классификатор K ближайших соседей и обучаем его на обучающей выборке. Наконец, мы оцениваем точность модели на тестовой выборке.
#код
Иммерсивный 3D-рендеринг из обычных видео
В статье представлен алгоритм восстановления поля яркости крупномасштабной сцены из одного случайно снятого видео.
Читать статью
Мечтали о космосе, а работаете в опенспейсе?
Мы тоже… Но мечты же должны сбываться! Поэтому мы создали свои мультивселенные и решили провести там настоящие соревнования по спортивному хакингу IT’s Tinkoff CTF.
Путешественников ждут 30 порталов в новые измерения. Там предстоит пройти миссии, набрать максимальное количество баллов и, конечно, разгадать все пасхалки.
Задания будут интересны разработчикам, SRE- и QA-инженерам, аналитикам и другим ИТ-специалистам. А еще вы сможете потренироваться на тестовых заданиях и выбрать лигу по своим скиллам.
Лучшим командам — вселенский почет и денежные призы до 360 000 рублей!
Покорять мультивселенные отправимся 15 и 16 июля. Участвовать можно онлайн и очно в 14 ИТ-хабах Тинькофф по всей России. Офлайн-участников ждут квизы, настолки, крутой мерч и нетворкинг с экспертами.
🚀Переходите на IT’s Tinkoff CTF, читайте подробности и регистрируйтесь!
Да пребудут с вами силы мультивселенной капибары!
(Упс… кажется, мы спалили первую пасхалку, Хьюстон)
Ерид: LdtCKZmzw
Трансформеры ручной работы
Трансформер — это своего рода виртуальная машина, у которой выбирают веса, чтобы заставить ее выполнять сложение форм так, как это делают люди.
Открыть ноутбук
#вопросы_с_собеседований
Что такое Random Forest?
Random Forest, или случайный лес, — это один из немногих универсальных алгоритмов обучения, который способен выполнять задачи классификации, регрессии и кластеризации.
Случайный лес состоит из большого количества отдельных деревьев решений, которые по сути являются ансамблем методов. Каждое дерево в случайном лесу возвращает прогноз класса, и класс с наибольшим количеством голосов становится прогнозом леса.
Почему профессора так плохо дают советы
Недавно я был на докладе с несколькими другими профессорами, и нас попросили дать несколько советов аспирантам по машинному обучению. Это заставило меня задуматься о том, почему профессора так плохо дают советы. Итак, вот несколько причин, по которым вам не следует слушать советы профессоров…
Читать тред
🎲 Теория вероятностей: где она используется и нужна ли она рядовому разработчику
Расскажем, где может пригодиться теория вероятностей, и как базовое понимание теорвера могло бы в свое время спасти разработчиков iPod от серьезного конфуза.
🔗 Основной сайт
🔗 Зеркало
Comet сотрудничает со Snowflake для повышения воспроизводимости наборов данных машинного обучения
Платформа MLOps Comet объявила о стратегическом партнерстве со Snowflake, целью которого является расширение возможностей специалистов по данным для создания превосходных моделей машинного обучения (ML) в ускоренном темпе.
Читать статью
Сейчас сложно представить сайт без базовой onsite-персонализации. Показывать релевантные для пользователя сообщения в нужное время и удобном для него канале, направляя его к совершению целевого действия, — аксиома успешного бизнеса.
Под onsite-персонализацией обычно понимают продуктовые и навигационные подсказки, отзывы, соцдоказательства, виджеты со скидкой и мотивацией. Они помогают бизнесу увеличить количество заказов, вырастить лояльность, выручку, собрать лиды, снизить количество брошенных корзин. Flocktory запустили продукт-конструктор, в который можно добавить комбинацию готовых механик. Базовый пакет из пяти механик стоит 50 000₽ и закроет большую часть запросов бизнеса.
Продукт подойдет новичкам: у Flocktory есть клиент-сервис, который поддержит на этапе запуска и в дальнейшей работе.
Если уже используете персонализацию: в библиотеке у ребят более 100 готовых механик — вы точно найдете новый виджет, который можно потестить за приятную стоимость.
Получить 5 механик за 50 000₽
Представляем безопасный AI Framework от GoogleПотенциал ИИ, особенно генеративного ИИ, огромен. Однако в погоне за прогрессом в рамках этих новых границ инноваций необходимы четкие отраслевые стандарты безопасности для ответственного создания и развертывания этой технологии. Вот почему сегодня мы рады представить Secure AI Framework (SAIF), концептуальную основу для безопасных систем искусственного интеллекта.Читать статью
Spark UDAF — мощный инструмент для анализа данных и обработки сложных операций агрегации в Apache Spark. Как с помощью него разработать свой агрегатор?
📆Поговорим об этом 27 июня в 20:00 с Вадимом Заигриным, ведущим эксперт по технологиям в Сбербанке и преподавателем OTUS.
Вебинар «Spark UDAF: разрабатываем свой агрегатор» приурочен к старту онлайн-курса «Spark Developer» в OTUS.
💻На открытом уроке рассмотрим агрегирование данных в Spark, стандартные агрегатные функции и создание собственных агрегатные функции (UDAF). После вебинара вы научитесь создавать собственные агрегатные функции.
Урок предназначен для разработчиков Spark, которые хотят выйти за рамки стандартных функций и узнать, как создавать собственные агрегатные функции. Не упустите возможность получить ценные знания, продолжить обучение вы сможете на курсе, доступном в рассрочку.
➡Для участия пройдите вступительный тест: https://otus.pw/H94qZ/
Нативная интеграция информация о продукте www.otus.ru
Что такое рекуррентные нейронные сети (RNN)?
Рекуррентные нейронные сети — это вид нейросетей, в которых связи между элементами образуют направленную последовательность. Это позволяет обрабатывать серии событий во времени или последовательные пространственные цепочки.
Они используются преимущественно для задач, где нечто цельное состоит из ряда объектов, например при распознавании рукописного текста или речи.
#вопросы_с_собеседований
Чем больший объем данных используют на проекте, чем выше нагрузка на систему – тем более продвинутый SQL нужен разработчикам. Изучить SQL и свободно использовать его в работе поможет курс Практикума.
После 3 месяцев курса разработчики смогут:
— уверенно пользоваться простыми селектами, джоинами, индексами и оконными функциями;
— отладить запрос, который сгенерирован через ORM;
— составить сложные запросы на нативном SQL;
— применить продвинутый SQL, чтобы писать код для высоконагруженных систем,
— чувствовать себя спокойно на собеседованиях.
Записывайтесь и растите в карьере.
Почему не нужно советовать «просто» использовать pyenv, poetry или anaconda
В этой статье рассказывается о проблемах, которые часто возникают у начинающих программистов на Python при адаптации к сложным механизмам управления пакетами, и о том, почему использование pip часто является лучшим выбором.
Читать статью
Строим многорядные столбчатые диаграммы с помощью Python
Как и в случае с линейными графиками, matplotlib предоставляет возможность представлять объекты Dataframe с результатами анализа данных в форме столбчатых диаграмм.
🐍 Самоучитель по Python для начинающих. Часть 22: Основы работы с SQLite
Разберем основные запросы к базе данных SQLite и обсудим альтернативу реляционным СУБД – модули dbm, pickle и shelves. В конце статьи – решения 10 практических задач, связанных с выборкой данных по различным критериям, редактированием записей и удалением дубликатов.
🔗 Основной сайт
🔗 Зеркало