Механизм и мозг
 

Новые стратегии игры Го

На проходящем европейском Го конгрессе в Санкт-Петербурге выступил с лекцией Фан Хуэй. Судя по всему, он стал частью команды DeepMind и сейчас исследует записи поединков искусственного интеллекта Google. Он показал несколько примеров внутренних расчетов AlphaGo во время матча с чемпионом Ли Седолем и одно из новых решений, которое AlphaGo изобрела в играх сама с собой. Я выбрал из его лекции два красивых примера. Они интересны тем, что открывают перед нами новые горизонты для творчества и не очень сложны для понимания.

Искусственный интеллект пересматривает базовые концепции, на которых держится современная теория Го XX века. А она уходит корнями в золотой век японского Го эпохи Сюсаку. Правда, тогда не было коми (либо оно составляло не более 2-х очков), что важно для оценки эффективности стратегий игры.

Пример 1. Поединок AlphaGo против AlphaGo

стратегия AlphaGo

рис. 1 Начало поединка AlphaGo vs AlphaGo

Необычное решение  — прилипнуть камнем 1 к углу было выбрано AlphaGo как лучшее для таких позиций. Обычно учителя ругают новичков за такие подходы. Это действие усилит черных, но позволит белым получить позицию в этом районе. Вопрос, какой ценой? Само по себе прилипание не является чем-то совершенно неожиданным. Считается, что оно уместно в следующем контексте:

стратегия AlphaGo

рис.2

 После того, как поставлен отмеченный белый и отмеченный черный, мы можем выбрать прилипание к угловому черному камню. Прилипание в предыдущем примере взято AlphaGo как бы из будущего и поставлено сразу, без подготовки. Фан Хуэй не раскрыл всех подробностей этой игры, анонсировав свою новую книгу. Но можно предположить, что гугловский AI посчитал появление отмеченных камней лишним усилением черных.  Нельзя гарантировать, что решение 1 не будет пересмотрено в будущем, так как AlphaGo продолжает учиться.

рис. 3. Пример гипотетически возможного решения

рис. 3. Пример гипотетически возможного решения

 Такой подход камнем 1 к стороне черных выглядит действительно странно. И пока AlphaGo не рассматривает  этот вариант в качестве игрового. Я придумал этот пример для контраста с предыдущим. Но эта постановка в принципе возможна, хоть и выглядит как удар по пустоте (бессмысленный ход). Она взята из еще более далекого будущего. Камень мог бы здесь появиться по итогам дележа угла слева. А что если поставить ее сразу? Пока что такое решение считается плохим. Но, похоже, мы будем сталкиваться с изобретением подобных решений всё чаще. Ведь его идея в том, чтобы глобально управлять позицией черных ценой наименьших усилий. А поиск такой эффективности в стиле стратегии AlphaGo.

Пример 2. Поединок AlphaGo против Ли Седоля.

стратегия AlphaGo

рис. 4. Поединок AlphaGo vs Ли Седоль

AlphaGo не только ищет новые большие стратегии, но и совершенствует локальные построения. В частности, она посчитала стандартную достройку угла белыми в А ошибкой. Именно так (в А) и сыграл Ли Седоль во второй игре. Это стандарт. По мнению AI белым следует немедленно подходить к черному камню в углу наверху слева. Конечно, отказ от выхода на сторону в А возможен. Но такое решение считается инновационным. Это нарушение правила построений: конкретный результат (владение или влияние), выход на сторону (в А) и «дыхание в центр». Другими словами, отряд не должен быть полностью заблокирован, сохраняя перспективы и влияние.

В книге Го Сэйгена «Игра Го XXI век» рассматривается пример, когда выгодно поступить так, как рекомендует AlphaGo — не развивать угловой отряд на сторону. Кстати, в похожей ситуации. Однако мастер там рекомендует пресекать развертывание черного отряда на нижней стороне.  AlphaGo  предлагает иное. «Не определяйся без необходимости» — одно из золотых правил стратегии. Не известно, какое решение за белых будет лучшим в нижнем правом углу. А раз так, оставим эту позицию дозревать. Видимо, такова логика искусственного интеллекта.  

На следующем рисунке показано продолжение, которое AlphaGo считает оптимальным за обе стороны: 

стратегия AlphaGo

рис.5 стратегический план AlphaGo

Программа выбирает одно из современных угловых построений в верхнем левом углу, позволяет черным заблокировать нижний правый угол и стремится победить черных с помощью мягкой силы: гасит влияние, занимает свободные зоны на сторонах. Камень 45 — это пример «дыхания в центр». Такую позицию программа считает перспективной для белых. Зажатый белый угол справа позволил бы белым получить слабый черный отряд внизу слева (у черной цепи пока нет двух глаз).

Будем следить за новостями из мира искусственного интеллекта. Как отмечал один из мастеров японского Го: мы понимаем эту игру не более, чем на 10 процентов. И видимо, предстоящие игры между AlphaGo и еще неповерженными чемпионами смогут многому нас научить. Главное, желание учиться! 

Метки: , , ,

Comments are closed.

© Русская Школа Го и Стратегии, 2016. Все права защищены