🔊 Audio-Visual Efficient Conformer for Robust Speech Recognition Улучшенный метод чтения по губам, с помощью архитектуры Conformer Connectionist Temporal Classification (CTC) для обработки аудио и видео. 🖥 Github ✔️ Paper 🔥Notebook 🚀 Models @ai_machinelearning_big_data