Любопытно наблюдать как стираются языковые барьеры с развитием лингвистических технологий: команда Яндекс Браузера рассказала о том, как команда обучала нейросеть, которая переводит видео с китайского на русский.
Язык поднебесной — очень многогранный и состоит из множества диалектов и имеет тоны, которые влияют на смысл слов. Кроме того, в нём нет алфавита, язык состоит из десятков тысяч иероглифов, а отсутствие пробелов в тексте и вовсе вызвало при разработке несколько трудностей.
А с тонами, кстати, вышло достаточно просто: модель сама научилась распознавать тоны по обучающим данным и ничего дополнительного делать не пришлось. Материал в целом насыщен техническими подробностями создания проекта, но всё написано понятным для пользователя языком — рекомендую к прочтению.
habr.com/ru/comp…s/711082