С интересом наблюдаю за движениями Гугла в области обработки изображений и ИИ. Вот, например, на прошлой неделе Google Maps обновили технологию Immersive View.
Immersive View использует машинное обучение (ML) и компьютерное зрение для объединения миллиардов изображений Street View и аэрофотоснимков для создания богатой визуальной модели мира, позволяя накладывать на неё сверху разную информацию, такую как погоду, пробки и т.п.
С новым обновлением модель теперь также работает с помещениям, позволяя создавать и дорабатывать полноценные 3D сцены.
(Насчет накладываний поверх - вы же заметили, что с этими эпловскими очками и гонкой вокруг визуализаций изображений назревает старый новый тренд – floating UI и floating UX.)
В основе работы лежит NeRF, недавно разработанный метод трехмерной реконструкции и нового синтеза изображений.
Получив набор фотографий, описывающих сцену, NeRF преобразует эти фотографии в нейронное поле, которое затем можно использовать для визуализации фотографий с точек зрения, отсутствующих в исходной коллекции.
P.S. Привет, сгенеренные миры и вселенные в очках? Нет, это «ещё не Матрица» (но похоже на ее MVP на коленке).
С технической стороны, реализация виртуального мира с таким уровнем детализации, ввода, обработки и вывода таких объемов данных в реальном времени в онлайне требуют громадных ресурсов для каждого клиента (либо на устройстве, либо на облачных вычислениях).
P.S. А еще Гугл запустил публичные курсы и уроки по AI, рекомендую изучить.