DragGAN, генеративный инструмент искусственного интеллекта, позволяющий манипулировать изображениями с помощью щелчков и перетаскивания
Инструменты генеративных адверсарных сетей опираются на данные ручного обучения или предыдущие 3D-модели, но DragGAN - это новый вид инструмента искусственного интеллекта, который позволяет пользователям манипулировать изображениями, просто нажимая и перетаскивая их. Он был разработан исследователями из Google, Института информатики Макса Планка, а также MIT CSAIL и в основном использует предварительно обученную GAN для синтеза изображений, которые не только точно следуют введенным пользователем данным, но и остаются реалистичными.
Этот подход не опирается на моделирование конкретных областей или вспомогательные сети, поскольку он использует оптимизацию скрытых кодов, которые постепенно перемещают несколько точек управления к их целевым местоположениям. В итоге они получили метод отслеживания по точкам, значительно превосходящий другие стратегии отслеживания по точкам.