Machinelearning(@ai_machinelearning_big_data). 🚀 Unified Model for Image, Video, Audio and Language Tasks UnIVAL is a 0.25B-parameter unified mode

🚀 Unified Model for Image, Video, Audio and Language Tasks UnIVAL is a 0.25B-parameter unified model that is multitask pretrained on image and video-text data and target image, video and audio-text downstream tasks. Унифицированная модель с для задач обработки изображений, видео, аудио и языка. 🖥 Github: https://github.com/mshukor/unival 📕 Paper: https://arxiv.org/abs/2307.16184 ⭐️Project: https://unival-model.github.io/ ☑️ Demo: https://huggingface.co/spaces/mshukor/UnIVAL ai_machinelearning_big_data