Обложка канала

Малоизвестное интересное

Рассказы, анализ и аннотации происходящего на стыке науки, технологий, бизнеса и общества. Поскольку переделать мир мы не можем, то давайте попробуем его понять.

Малоизвестное интересное

5 лет назад
Открыть в
Meta AI + Google AI cоздают единую модель понимания всей человеческой речи. В 2021 это уже не фантастика, а чисто инженерная задача. Под дымовую завесу пустопорожней полемики о реализуемости сильного ИИ (AGI), БигТех проявляет бульдожью хватку при решении самых востребованных для бизнеса задач. И пока ширнармассы всюду где попало щеголяют знанием в реальности уже устаревшего термина «Большие Данные», БигТех уже сделал ставку на понятие нового поколения - «Большие Модели». В новой системе самостоятельного обучения речи на 128 языках используется очень большая модель. XLS-R – это нейронная сеть для распознавания речи, определения языка и перевода. Она использует 2 млрд параметров и почти полумиллиона часов общедоступной речевой аудиозаписи на 128 языках, что почти в 10 раз больше, чем в предыдущей системе Facebook, созданной в прошлом году. Результат уже впечатляет - снижение уровеня ошибок в среднем на 14-34%. Бизнес цель планируемого прорыва двойная: • Окончательное решение вопроса синхронного перевода человеческой речи, с помощью мобильных гаджетов (мечта фантастов 20го века) • Голосовое общение человеко-машинных сущностей в виртуальных средах Метавселенной (на что фантастам не хватило фантазии, а вот БигТеху хватило) Объявление Подробное описание #NLP
XLS-R: Self-supervised speech processing for 128 languages

We are releasing XLS-R, a new self-supervised multilingual model trained on 128 languages for a variety of speech tasks. XLS-R sets a new state of the art on several speech recognition benchmarks, foreign-to-English speech translation, and language identification.

Facebook