Обложка канала

Сингулярность

Параноидальные заметки об Искусственном Интеллекте. Обсуждаем влияние Искусственного Интеллекта и машинного обучения на наше настоящее и будущее.

Сингулярность

7 лет назад
Открыть в
Искусственный интеллект снова одержал победу.

Программа AlphaStar, разработанная DeepMind, смогла обыграть двух профессиональных игроков в стратегию в реальном времени StarCraft  II. Каждого из игроков-людей нейросеть победила в пяти матчах.

Для обеих частей StarCraft уже достаточно давно разрабатываются боты и даже проводятся соревнования подобных программ, однако до сих пор таким алгоритмам не удавалось победить человека. Дело в том, что несмотря на победу программы AlphaGo в настольной игре го (которая долгое время считалось слишком сложной для машин) со стратегией в реальном времени все обстоит иначе — это игра с закрытой информацией, в которой нужно решать большое количество задач одновременно. Компания Blizzard объявила о создании открытого API для StarCraft  II еще летом 2017 года, но с тех пор заметного прогресса почти не было — даже нейросеть DeepMind долгое время не могла показать блестящего результата и проигрывала легкому уровню сложности встроенных алгоритмов.

Теперь DeepMind продемонстрировала, что их новая программа AlphaStar способна обыграть профессиональных игроков. При создании AlphaStar использовался метод глубокого обучения с подкреплением, а также обучение с учителем, в качестве тренировочного датасета разработчики использовали предоставленные компанией Blizzard анонимизированные записи игр настоящих людей. Обученная на этих играх нейросеть научилась побеждать встроенные алгоритмы StarCraft  II на самой высокой сложности в 95 процентах случаев, после чего специалисты DeepMind заставили программу играть с самой собой.

Сначала нейросеть выиграла пять матчей из пяти против TLO (Дарио Вунш, Германия), а затем другая версия нейросети победила пять раз подряд игрока MaNa (Гжегож Коминч, Польша). Оба профессионала входят в сотню сильнейших игроков в StarCraft  II. Интересно, что средний APM (количество действий в минуту) нейросети оказался значительно меньше, чем у ее противников.

https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/?amp=1