MeDAL — это датасет для расшифровки медицинских аббревиатур. Датасет собирали для предобучения моделей обработки естественного языка для медицинского домена. Данные опубликовали на воркшопе ClinicalNLP на конференции EMNLP.
CML (Continuous Machine Learning) — это библиотека для непрерывной интеграции и доставки (CI/CD) проектов машинного обучения. Библиотеку разрабатывали создатели DVC, открытой библиотеки для версионирования ML моделей и экспериментов.
MMTracking — это опенсорсная библиотека для обработки видео на PyTorch. MMTracking является первым открытым инструментом, который унифицирует процесс решения задач обработки видеозаписей. Библиотека является частью проекта OpenMMLab.
Исследователи из University of Washington опубликовали нейросетевую модель, которая меняет задний фон на фотографии. Модель выдает итоговые изображения со скоростью 30 кадров в секунду для разрешения 4K и 60 кадров в секунду — для HD. В сравнении с state-of-the-art подходами модель выдает более точные результаты. Кроме точности предсказаний, модель обходит альтернативные подходы в разрешении генерируемых изображений и скорости предсказания.
Исследователи из Cornell Tech и Adobe Research опубликовали нейросетевую модель, которая генерирует динамические сцены на основе видеозаписей. Модель принимает на вход видео, снятое с одного ракурса. На выходе модель отдает динамическую 3D модель сцены, в которой можно регулировать угол обзора и параметр времени. Модель обходит state-of-the-art архитектуры для генерации сцены из одноракурсного видео.
RLax — это опенсорсная библиотека от DeepMind для имплементации RL-агентов. Библиотека базируется на JAX и содержит в себе модули для разработки RL-агентов.
Polars — это открытая библиотека для обработки массивов данных на Python. По скорости работы библиотека обходит самый популярный инструмент для работы с данными, — Pandas. Кроме того, библиотека более эффективно работает с памятью при работе с данными. Polars написана на Rust.
Исследователи из Tencent Lightspeed & Quantum Studios, Adobe Research, Dalian University of Technology и Johns Hopkins University предложили новый функционал ошибки для моделей, которые решают задачу дополнения пустых частей на изображении. По результатам экспериментов, модель с предложенным функционалом ошибки обходит state-of-the-art-подходы.
Newprolab - лаборатория профессионального развития для дата-сайентистов, дата-инженеров и руководителей в области анализа больших данных объявляет программу курсов на 2021 год. Интенсивные программы Big Data, Data Engineering, Deep Learning ориентированы на обучение на практике: самые актуальные инструменты и подходы, преподаватели-практики, кейсы и датасеты из реальной жизни. 🎄До 31 декабря действует специальная цена, выбирайте траектории своего развития уже сейчас: https://clck.ru/SSFVG
🌎Готовы к выходу на европейский рынок? Выпускники Newprolab работают в ведущих международных и российских компаниях в более, чем 20-ти странах мира.
Отдельное направление: корпоративное обучение - программы обучения под задачи любого бизнеса, требующего грамотных специалистов в области работы с данными.
Как мы существуем в онлайн-пространстве сегодня? Как презентовать себя в виртуальной реальности и как она способна изменить нашу идентичность? Какую роль в современных коммуникациях играют виртуальные артисты и блогеры? Как технологический прогресс влияет на наше ментальное здоровье? На эти и другие вопросы в рамках фестиваля ответят представители дизайн-индустрии, науки и искусства.
Вопросы спикерам можно будет задать в чате комьюнити Bang Bang Education Дизайн начинается с ⚫️.
Исследователи из University of Washington и Facebook опубликовали нейросетевую модель, которая анимирует изображения. Модель принимает на вход изображение в 2D. На выходе модель отдает короткое видео, где объекты на изображении двигаются. Нейросеть способна анимировать изображения пляжей, водопадов и рек.
Исследователи из NVIDIA предлагают нейросетевой подход для генерации видеозаписей с говорящими головами людей. Модель выучивается синтезировать видеозапись с говорящей головой на основе референсного изображения с целевой персоной и видео с целевыми движениями. Исследователи предлагают использовать модель в приложениях для видеоконференций.
11 декабря пройдет NeurIPS 2020 – крупнейшая конференция в области искусственного интеллекта. Ребята из Яндекс.Толоки, одного из лидеров индустрии краудсорсинга, организуют там свой воркшоп “Crowd Science Workshop: Remoteness, Fairness, and Mechanisms as Challenges of Data Supply by Humans for Automation”.
Вместе с другими спикерами со всего мира обсудят, какое будущее у рынка краудсорсинга и поднимут темы, которые ранее не обсуждались профессиональным сообществом: — Удалённая работа. Поговорят о том, насколько эффективна может быть удалённая работа на краудсорсинговых платформах. — Справедливость. Расскажут, как краудсорсинговая платформа может обеспечивать исполнителям гибкость в выборе задач и рабочих часов. — Механизмы. Обсудят двусторонние механизмы, которые не только обеспечивают гибкость исполнителям, но и гарантируют качество результата и эффективность процесса заказчикам.
MoGaze — это датасет с передвижениями тела и движениями взгляда. Датасет включает в себя 180 минут видео движений тела с 1627 действиями поднять-поставить. MoGaze собирали для обучения моделей предсказания действия людей. Такие модели можно использовать в роботизированных системах, тесно взаимодействующих с людьми.
CompressAI — это опенсорсная библиотека для оценки моделей сжатия данных. Инструмент основан на фреймворке для глубокого обучения PyTorch. Задача сжатия данных состоит в том, что бы минимизировать размер данных и при этом максимально сохранить информацию.
EvoStrat — это опенсорсная библиотека для обучения эволюционных алгоритмов. Библиотека предоставляет интерфейс для применения эволюционных стратегий в задачах обучения с подкреплением.
Группа исследователей из Google Research предложила нейросетевой метод для генерации изображений из текстов. Исследователи разработали последовательную нейронную сеть, которую обучали на датасете Lozalized Narratives. Датасет является мультимодальным и содержит пары изображений и текстовых описаний. По результатам экспериментов, модель обходит state-of-the-art подходы.
Исследователи из Binghampton University и Intel Corporation разработали модель, которая распознает дипфейки по предсказанному сердцебиению. Классификатор использует данные фотоплетизмограмм для распознавания фейковых видео. Важным допущением в модели является то, что она обучается распознавать дипфейки, которые были сгенерированы с помощью набора публично доступных архитектур. Это накладывает ограничения на использование модели в реальных приложениях. Подход детектирует фейковые видео с точностью 97.27% и генеративную модель дипфейков — с точностью в 93.39%.