DeText — это фреймворк для обучения моделей обработки естественного языка. DeText позволяет решать задачи ранжирования, классификации и генерации с помощью state-of-the-art нейросетевых архитектур. Разработкой фреймворка занимались исследователи из LinkedIn.
Соберите портфолио своих проектов по Машинному обучению под руководством опытных дата саентистов. Онлайн-курс «Machine Learning. Professional» научит вас, как решать разные рабочие задачи: - Построить полный пайплайн работы с данными - Грамотно подбирать и адаптировать модель - Критически оценивать результаты и вовремя выявлять ошибки
За 5 месяцев вы освоите базовые и продвинутые методы машинного обучения, сбор данных, рекомендательные системы, анализ текстовых данных и временных рядов, а также подготовитесь к соревнованиям Kaggle. Процесс обучения — насыщенные кейсами и практикой вебинары, полезные домашние задания и проекты, которые потом можно демонстрировать на собеседовании. Оставьте заявку и узнайте, как поступить на курс по спец.цене https://otus.pw/LYmr/
CelebA-Spoof — это датасет для антиспуфинга, который состоит из 625,537 изображений 10,177 людей. Антиспуфинг лица — это методы борьбы с обманом систем по распознаванию лиц. CelebA-Spoof создали на основе датасета CelebA.
CFBI — это нейросеть, которая сегментирует объекты на заднем и переднем планах видеозаписи. Нейросеть обучалась частично с привлечением размеченных данных. Модель обходит state-of-the-art подходы на датасетах DAVIS 2016, DAVIS 2017 и YouTube-VOS.
WordCraft — это среда для тестирования общих знаний о мире у RL-агентов. Среда основывается на видеоигре Little Alchemy 2. Little Alchemy 2 — это простая ассоциативная игра. Игрок получает начальный набор из четырех предметов. Из этого начального набора игрок должен собрать как можно больше новых предметов. Каждый новый предмет может быть создан через объединение двух других предметов. Всего 700 предметов и 3,417 возможных комбинаций предметов. Интерфейс у среды текстовый, а не графический, как в Little Alchemy 2.
SipMask — это одноступенчатая нейросеть для instance сегментации. Модель обходит предыдущие одноступенчатые state-of-the-art подходы на датасете COCO test-dev. В сравнении с TensorMask, SipMask дает прирост AP в 1%. При этом модель выдает предсказания в 4 раза быстрее. Модель обходит YOLACT на 3% по AP.
COCO-WholeBody — это первый датасет для оценки позы всего тела. COCO-WholeBody является расширением датасета COCO 2017. Для каждого человека доступны 4 типа разметки: границы человека, лица, левой руки и правой руки. Кроме того, 133 ключевые точки: 17 для тела, 6 для ног, 68 для лица и 42 для рук. Датасет доступен исключительно для исследовательских целей. Коммерческое использование запрещено.
Pantomime — это сервис для создания дипфейк-стикеров. Система использует нейросеть для анимации входного изображения с лицом. С помощью Pantomime можно анимировать фотографии людей, картины и животных. На текущий момент сервис на стадии MVP.
Исследователи из ETH Zurich разработали нейросеть, которая позволяет контролировать генерируемое изображение с помощью высокоуровневых атрибутов и текстовых описаний. В список возможных действий входят перемещение, удаление или добавление объектов.
Model Card Toolkit (MCT) — это набор инструментов для поддержки разработчиков в сборе информации для карточек моделей. Карточка модели описывает ML-модель на разных уровнях, чтобы повысить прозрачность используемых подходов. В карточку модели входит такая информация, как цели использования модели, описание архитектуры, метрики, ограничения модели и оценка работы модели. MCT включает в себя базовый интерфейс для карточки модели.
TransCoder — это нейросеть, которая переводит код программы с одного языка на другой. Модель не нуждается в размеченных параллельных данных для обучения. На данный момент TransCoder успешно переносит функции на C++, Java и Python 3. Нейросеть обходит существующие открытые и коммерческие программы по переводу кодовой базы.
REVISE — это инструмент для оценки смещений в датасетах с изображениями. REVISE позволяет пользователю учесть неравномерность данных и оценить, насколько уместно использовать тот или иной датасет в рамках целевой задачи. Инструмент также предлагает действия для избавления от существующих смещений. REVISE учитывает смещения трех уровней: на уровне объекта, гендера и географии изображения.
AViD — это публичный датасет с анонимизированными видеозаписями из разных стран. Датасет предназначен для задачи распознавания действий. Основной целью AViD является предоставить возможность обучать универсальные модели распознавания действий, а не специфичные для отдельных стран. Все лица на видеозаписях были анонимизированы для защиты приватности.
Исследователи предлагают мультизадачный фреймворк, который решает задачи оценки 2D и 3D поз из изображений и классификации действий по видеозаписи. Одна архитектура справляется с обеими задачами на уровне state-of-the-art подходов. При этом модель на инференсе обрабатывает более 100 кадров в секунду.
Исследователи из University of Rochester опубликовали нейросеть, которая генерирует видеозаписи с говорящими людьми на основе аудиозаписи с речью. Предложенная модель генерирует более реалистичные видеозаписи, чем state-of-the-art подходы. При этом в нейросети эксплицитно генерируются движения головы человека.
FAIR обучили нейросетевую модель, которая повышает разрешение изображения в 16 раз. Нейросеть принимает на вход изображение из игрового движка с разрешением в 960×540. Затем модель трансформирует изображение до разрешения в 3840×2160 в реальном времени. Использование нейросети позволяет сократить траты на рендеринг для дисплеев с высоким разрешением.
ContraCode — это нейросеть для поиска функционально схожего кода программ. Модель предобучали с помощью contrastive pre-training подхода. Предобученную нейросеть затем дообучили на задачах вывода типов и суммаризации кода. ContraCode улучшает точность суммаризации на 7.9% в сравнении с supervised подходами и на 4.8% в сравнении с RoBERTa.
NVIDIA опубликовали нейросетевой подход для генерации видеозаписей. Модель генерирует кадры так, что бы сцена на видеозаписи была последовательна во времени и с разных углов обзора камеры.