Компьютерная программа AlphaStar, которая была создана в лаборатории Google DeepMind, занимающейся разработками в области искусственного интеллекта, впервые в истории одержала победу над профессиональным игроком в StarCraft II. Ранее стратегия в режиме реального времени считалась слишком сложной для освоения алгоритмами.
Google и студия Blizzard начали обучать ИИ игре в легендарную стратегию, требующей быстрой реакции и тактического мышления, в 2016 году. Разработанный инженерами DeepMind компьютерный "мозг" раскладывает карту на различные "слои", что позволяет ему контролировать мельчайшие детали игрового процесса: сколько выпустить юнитов, сперва провести апгрейд оружия или брони, когда остановить добычу газа и т.д.
AlphaStar — вариация алгоритма AlphaGo, который прославился обыгрышем чемпиона мира по игре в го. Однако для компьютера StarCraft II сложнее, чем го или шахматы: в ней ИИ не может дожидаться своего хода, анализируя фигуры на доске, действия соперника скрыты, и ему приходится реагировать в режиме реального времени.
В серии StarCraft и раньше был предусмотрен режим игры против компьютера, однако встроенные алгоритмы считались слишком слабыми и предсказуемыми, особенно по части микроконтроля (управления отдельные боевыми единицами в сражении).
Как сообщили в Google, в серии матчей AlphaStar одолел профессиональных киберспортсменов со счетом 10:0. Бит был в том числе Гжегож MaNa Коминч — один из сильнейших игроков в StarCraft II. Однако в последнем, одиннадцатом матче Коминч смог отстоять честь человечества, единожды обыграв алгоритм.
Наблюдатели описывали игру AlphaStar как "феноменальную" и "сверхчеловеческую". ИИ было запрещено делать больше кликов в минуту, чем может человек, однако он мог просматривать всю карту целиком, в то время как людям приходилось перемещаться по ней вручную. Как утверждали инженеры DeepMind, это не дает алгоритму никакого преимущества, так как он фокусируется только на одной части карты.
Но в ходе матчей выяснилось, что это не так: например, AlphaStar мог управлять юнитами одновременно в трех разных областях, что человеку не под силу. В последнем противостоянии, именно когда MaNa обыграл программу, ИИ было запрещено совершать действия вне области активного экрана.