Microsoft представляет ИИ,который понимает любой контент и решает тест IQ🤖
Kosmos-1, мультимодальную модель Microsoft, которая,как сообщается, может анализировать изображения на наличие контента, решать визуальные головоломки, выполнять визуальное распознавание текста, проходить визуальные тесты IQ и понимать инструкции на естественном языке.
Корпорация считает, что мультимодальный ИИ, который объединяет различные режимы ввода, такие как текст, аудио, изображения и видео,является ключевым шагом к созданию искусственного общего интеллекта,который может выполнять общие задачи на уровне человека.
Kosmos-1— проект только Microsoft, без участия OpenAI.🤷🏼♀️
Особый интерес представляет результат Kosmos-1 в тесте Raven's Progressive Reasoning, который измеряет визуальный IQ, представляя последовательность форм и предлагая испытуемому завершить последовательность.
☝🏻Kosmos-1 может пройти тест лишь с точностью только 22‒26 %. Что намного хуже человека, но лучше других машин и более высокий показатель чем случайный выбор.
🔻В настоящий момент модель делает только первые шаги в сфере мультимодальной обработки данных, но нетрудно предположить, что дальнейшие улучшения позволят добиться намного более впечатляющих результатов, позволяя ИИ взаимодействовать с любыми формами информации, что невероятно расширит возможности цифровых ассистентов.
В будущем Microsoft обещает масштабировать модель и добавить ей возможность вести голосовые беседы.