🔥 Сложности при создании перевода видео с китайского на русский
Яндекс Браузер научился переводить видео с китайского на русский. В статье на Хабр рассказали, как для нейросети создавался новый датасет, как использовалась библиотека субтитров от GitHub и модель Hugging Face, обученная на мандаринском диалекте языка.
Из статьи вы узнаете, как язык переводился в текст с помощью словаря токенов по алгоритму PBE, как решали проблему с неправильным распознаванием этого текста в ASR, а также то, как модель училась распознавать тоны по обучающим данным.
habr.com/ru/comp…s/711082