Master AlphaGo против сильнейших игроков Го Азии

Date - 13.01.2017 / Author - admin / Category - AlphaGo, Без рубрики, интеллект, обучение игре Го, стратегия

В конце 2016 года Google сделал подарок любителям игры Го: выпустив на игровые серверы анонимную версию своего флагмана в области ИИ — AlphaGo. Кто скрывается под никами Master и Magister стало известно лишь после того, как программа обыграла всех оппонентов без исключения. Всего было сыграно 60 игр с малым контролем времени: 60 секунд основного времени плюс три периода по 30 секунд на постановку. Конечно, такого времени недостаточно для того, чтобы человек мог просчитать варианты на достаточную глубину, не говоря о выборе стратегии.

Например, до войны в Японии был принят следующий порядок, согласно которому на ключевых соревнованиях мастерам 5 дана и выше предоставлялось 11 часов времени каждому. Если же один из игроков был профессионал 4 дана, то общим давалось по 9 часов. Когда соперники оба были 4 данами, они получали по 8 часов времени. То есть, чем выше был дан, тем больше давалось времени на размышления (ист: Old Fuseki vs New Fuseki, J. Fairbairn). Ли Седоль в свежем интервью в январе 2017 года отметил: что на его взгляд справедливо дать человеку минимум 2 часа времени, сохранив машине контроль в 30 секунд. Он не видит шансов у человека, если даже уравнять контроль времени, предоставив машине тоже 2 часа.

Идеальные фусэки с хоси по версии AlphaGo

варианты фусэки с комоку по версии Alphago

AlphaGo удивила новыми идеями в развертывании камней (фусэки). На рисунке показаны два сценария, в котором за оба цвета показаны ходы нейросети. Единого дерева вариантов нет, программа выбирает разные решения в идентичных позициях. Также она регулярно использует прессинг и нестандартные решения в углах. Речь идет о самых разных случаях, даже тех, где подобные решения считались уделом новичков. В этой статье собраны варианты первых постановок в начале игры, когда ИИ играл белыми камнями. В большинстве позиций ответы AlphaGo повторяются из игры в игру. Значит за ними стоит высокая оценка шансов на победу. Есть примеры, когда программа выбирала разные решения в аналогичных позициях, но таких случаев немного.

AlphaGo играет белыми камнями

Пример 1

Восточные профессионалы в качестве первой ставки выбирали 4 указанных позиции. 1 — постановка в звезду, согласно теории Новых фусэки, это один из самых сбалансированных камней. 2 — наследние классической японской школы. Комоку (камень 3х4) нацелен на территорию и до эпохи коми считался фундаментом непобедимой стратегии за черный цвет. 3 — гибкая ставка 5х3 (мокухадзуси) нацелена не только на территорию, как комоку, но скорее, на динамичный рост. Одна игра с зеркальным продолжением была сыграна от центра — 4. AlphaGo пока не показала игр, где бы она делала первую ставку в центр.

Пример 2

На камень в звезде AlphaGo отвечала также в звезду: причем в соседнем углу. Есть мнение, что с точки зрения равновесия, верно занимать диагональ и избегать параллелизма. Пока мы видим, что AlphaGo не подтверждает эту гипотезу. Хотя, на черный камень 4х3 в этом углу программа уже была готова ставить и по-диагонали. Это случайность, или такая большая разница между хоси и комоку? Пока ответа на этот вопрос нет. Для удобства я свел все позиции из варианта В к А, развернув игры. Это не влияет на расклад, но упрощает сравнение вариантов фусэки.

Пример 3

На первый белый камень в звезде игроки отвечали тремя указанными способами. 1 приводит к развертыванию «две звезды» (нирэнсэй). Такой стиль игры пропагандировал Го Сэйгэн. Постановка 2 открывает большое китайское фусэки. Ставка 3 — малое китайское фусэки. Все три стратегии позиционирования популярны и хорошо изучены. Рассмотрим ответы AlphaGo на каждый вариант.

Пример 4

На черный во второй звезде AlphaGo всегда занимает звезду. Можно сделать вывод, что нейросеть считает эту позицию наилучшей для белых. В следующей статье можно посмотреть, как нейросеть предпочитает отвечать за черных в такой позиции. Среди опубликованных игр нет примеров, где бы она сама поставила две звезды за черных.

Пример 5

На китайское фусэки программа также всегда выбирала занять вторую звезду. То есть для белых нирэнсэй приемлем и хорош, по крайней мере по отношению к такому положению черных камней, как в примерах 4 и 5.

Пример 6

Малый китайский стиль AlphaGo всегда балансировала низким камнем 2.

Пример 7

Наиболее интригующий вариант с постановкой в центр. Здесь программа выбрала классическое китайское фусэки (сочетание белого в звезде с низким камнем в соседнем углу), а затем незамедлительно вторглась в сферу влияния черных. Игрок черными выбрал зеркальную стратегию, вынудив программу играть против себя самой почти 100 постановок. Я думаю, что ее анализ с точки зрения эффективности решений, баланса и гармонии был бы интересен.

Пример 8

Любопытно, что в необычном сейчас фусэки 1-3 AlphaGo вышла на перекрестную позицию 2-4. Выходит, что черная угловая крепость балансируется такой позицией (если конечно, AlphaGo не ошибается в своих оценках). Дальше мы видим классическое продолжение в духе эпохи Эдо, за исключением высокого камня 2.

Санрэнсэй

В одной из игр с Гу Ли китайский мастер поставил санрэнсэй за черных. Вы увидите, что программа не жалует высокие прыжки типа 4 и почти всегда на них набрасывается снаружи. Но в этой позиции она выбрала именно такой способ развития белого угла. Трудно сказать, является ли это самым лучшим решением или же здесь мы видим один из вариантов. Ведь нейросеть не может просчитать все варианты, а значит должна угадывать и выбирать. Игра очень интересная, в ней нейросеть провела успешное вторжение в область черных благодаря продаже второстепенного камня на стороне. Он был поставлен казалось бы совсем по иным причинам, но идеально вписался в позицию:

вторжение в санрэнсэй

Постановка 1 — стандартное развитие вторжения. Но здесь этот камень одновременно работает на спасение отмеченного белого наверху. Гу Ли был вынужден добить этот белый камень, за что нейросеть получила еще одну постановку внутри сферы влияния черных. В стратегии случайностей не бывает. Было ли это частью расчета? Люди вряд ли способны так далеко рассчитать сценарии, так как отмеченный камень появился на доске за 20 ходов до постановки 1 и был частью совсем иного сценария.

Гу Ли применяет новый ход AlphaGo

В последней опубликованной партии Гу Ли попробовал сыграть против нейросети в ее стиле — постановка 3. Фусэки этой партии получилось необычным, что вообще характерно для игр с нейросетью. Но кажется, что профессионалы пока не понимают, как следует развивать позиции, подобные черному камню 3. Сама нейросеть не всегда поддерживает эти камни. Продолжение фусэки:

продолжение борьбы

Высокие клещи 15-17 больше характерны для форовой игры, нечасто их встретишь в поединках мастеров. Теперь разберем примеры позиций с китайским стилем.

китайский стиль

Когда мастера ставили отмеченный черный камень в 4х3 нейросеть занимала вторую звезду. Дальше начинались разные сценарии. Например, здесь AlphaGo пробовала два разных решения А и В. Вопрос эквивалентны ли они или это творческий поиск? Тактика тоже оригинальная: подставить угловой камень под двойные клещи черных 1-3. Примеры таких игр есть, но это считается сложным маршрутом.

Низкий китай 1

На постановку 1 нейросеть всегда подходила к черному углу справа 2 и вторгалась в угол 4. Затем позиция развивалась согласно планам игроков. Это первый вариант, где нейросеть смело вторгается низким камнем 10 в плотную область черных. Продолжение лучше посмотреть в полной записи игры.

низкий китай 2

Второй сценарий: где черные сначала ставят камень 7, а потом 9. Опять низкий вход в зону черных камнем 16 и гибкая организация белых 18-20. Видимо, скоро такой способ игры станет новым стандартном.

низкий китай 3

Третий сценарий отличается положением камня 15. AlphaGo, несмотря на это, вторгается 16-18-20. Последний набор сценариев этой группы посвящен малому китайскому стилю. Напомню, что здесь его выбирают мастера, хотя и нейросеть любит такое расположение камней за черных.

малый китай 1

Вариантов этого сценария много. Три первых начинаются с обмена какари 1-2.

малый китай 2

Здесь камень 3 поставлен ближе к белому, то есть клещи жестче. В ответ иное положение камня 4, который как бы готовится помогать белым слева. А в предыдущем примере белые активно развиваются внизу, атакуя одинокий черный.

малый китай 3

новое дзёсэки?

Высокий подход к белому углу 1 привел к такому сценарию. В современном справочнике дзёсэки Такао Синдзи (2011 год) прорезание белых 20 рассматривается как маневр в пользу черных. Похоже, что эту оценку нужно теперь уточнять.

малый китай 4

Широкое развитие угла за черных AlphaGo встречала высоким камнем 2. Дальше снова начинались варианты: в зависимости от действий соперников нейросети. В этом примере черные строят большую сферу влияния.

малый китай 5

Этот кейс интересен тем, что у нейросети были разные варианты ответов в такой позиции: А и В. Первый путь укладывается в логику современной теории Го, а вариант В необычен. Это пример прессинга.

вариант А

Постановка 8 ожидаема, но пожалуй, необычна.

вариант В

В этом варианте показано как нейросеть организует отряд в зоне чужого влияния (по-японски эта техника называется сабаки).

малый китай 6

Эта позиция уже стала предметом дискуссий. Растяжка между белыми камнями 6 и 8 не вписывается в современные стандарты. Считается, что камни хорошо работают на дистанции 2, 3 или 5 шагов. Тут же белые ставят камни через 4. Противник нейросети попытался наказать ее за это сначала придав белому отряду «плохую» форму, так как от двух белых камень 8 стоит через четыре, а не через три шага. Затем мастер поджал белых с фланга 11. Что делает нейросеть? Как всегда поступает нестандартно: вторжение в плотную зону черных камнем 12!

малый китай 7

Еще одно оригинальное начало игры, где черные ставят высокий камень 1. Любопытно, что на низкий черный камень 1 белые меняют позицию камня 2:

малый китай 8

Снова ставший фирменным стилем прессинг 6: дальше два варианта. Похожую стратегию предлагал Го Сэйгэн в книге о стиле игры Го в 21 веке. Правда, он разбирал примеры иного контекста. В 2010 году я хотел изложить схожие идеи в первом томе Русского Учителя японского Го, но эта часть осталась в черновиках, так как оценить эффективность предлагаемых сценариев было очень нелегко. Так что идея не нова, и сейчас мы видим, как она работает.

Вариант А

Первый вариант демонстрирует радикальную стратегию белых по выстраиванию господства в центре. Пожалуй, похожих игр среди профессионалов не найти, разве что у Такэмии.

Вариант В начало

Второй вариант не менее интересен и заслуживает двух диаграмм:

Вариант В продолжение

Постановка 30 на шестую линию — изящный пример комплексной атаки: прямая атака на три черных под номерами 25, 27, 29, затем косвенная атака на три черных справа (где 23) и атака камня 19, прерывая облаву (лестницу). На этом варианты с первым черным камнем в звезду закончились.

Пример 9

На низкий камень комоку программа давала два ответа, оба в звезды: А и В. Когда она играла уже за черных, то мастера создавали схожие позиции, играя за белый цвет. Их можно сравнить с этими вариантами (см. примеры ниже).

Пример 10

Первое фусэки с диагональным белым камнем 1. Можем отметить, что такой ответ на комоку, видимо, хорошо сбалансирован. Но есть и вариант В! Почему? Это равные варианты, или программа экспериментирует в условиях дефицита информации? Далее белые ставят камень 3 (китайский стиль), и если черные подходят к белому камню № 4, то и белые в ответ подходят к черному углу № 5. Одно из классических начал.

Пример 11

Это второй вариант постановки 4. Здесь игрок черными решил развернуть свой угол. В ответ AlphaGo строит крепость в своем углу. Сравните положение камня 5 с примером «малый китай 4», где нейросеть поставила высокий камень. Можно сказать что постановки 4-5 в этом варианте и в предыдущем примере — миаи. Затем черные пробуют проверить технику AlphaGo на ней самой — камень 6. Обычно мастера отвечали в таких позициях на подобные «наезды». Искусственный интеллект его игнорирует и начинает долгую игру в нижней части доски. Возможно, что так и нужно действовать? Постановки подобные № 6 встречаются в партиях AlphaGo с завидной регулярностью.

Теперь посмотрим, как разворачивается игра, когда белые ставят камень не в диагональный угол, а параллельно черным.

Пример 12

Если черные ставят два смотрящих друг на друга комоку (изящный стиль), то белые занимают вторую звезду, а затем подходят к правому углу, так как там расстояние между черными наибольшее. Затем белые запускают дзёсэки под названием «малая лавина», и начинается сложная позиционная борьба, которую лучше посмотреть в полной записи игры.

Пример 13

Еще одна ветка. Отмеченные треугольником камни там же, а постановка № 3 иная. Черные быстро развивают позицию, а не выстраивают сторону, как в примере выше. Здесь белые как-то покорно укрепляются камнями 4 и 6, а затем подходят к тому углу, где у черных наибольший территориальный потенциал. Это согласуется со стандартной теорией игры Го. В примере с игрой Гу Ли нейросеть ставила камень 6 выше в схожей позиции. Видимо, здесь мы вновь видим несчетную вариативность игры Го. А это означает, что пока нет единого сценария игры даже для первых постановок.

Пример 14

Много вариантов было испробовано в такой конфигурации черных камней (классический территориальный стиль эпохи Сюсаку). Программа как обычно занимает звезды. Есть два примера такого фусэки за черных у ИИ Google. Оно показано ниже для сравнения. Сначала посмотрим, как действовал профессиональный игрок, а потом как AlphaGo.

Пример 15

Итак, человек поставил отмеченный треугольником камень, а затем подступил к белому углу по наиболее выгодной стороне для черных. В ответ на проникновение в углу 3 AlphaGo немедленно подступает к одному из углов черных, а затем и ко второму углу, сочетая низкий и высокий подходы. Трудно сказать, почему камень 4 поставлен низко. Камень 6, похоже, поставлен высоко для того, чтобы вся позиция белых не оказалось слишком низкой. Теперь второй пример стратегии черных со стороны человека:

Пример 16

Здесь мастер сразу отступил 3 и пресек подход белых, как в предыдущем примере. Программа подступила к свободному черному камню в правом углу высоким подходом (какари). Дальше обычная позиция развивалась в неожиданном ключе: белые форсировали укрепление черных 13, а затем вторглись 14, что уже стало привычным ходом AlphaGo. Сравним этот пример с тем, как действовала AlphaGo в аналогичном случае:

Пример 17

Тут программа уже за черных. ИИ выбирает подход 1, как и мастер, но затем действует иначе: гибче. Камень 3 меньше помогает черному 1, но больше нацелен на развитие зоны наверху, где у черных преимущество. Затем мы видим иной ход человека № 4 и как черные в ответ стремительно развивают свою зону, даже в ущерб камню 1. Стратегия белых в предыдущем примере была нацелена на то, чтобы пресечь такой сценарий в зародыше.

Пример 18

Возвращаемся к вариантам. Напомню, что программа за белый цвет поставила отмеченный треугольником камень. Теперь черные ставят гибкий камень 1 — его применила AlphaGo в похожем фусэки против Кэ Цзэ. Однако в отличие от чемпиона Китая белые ставят камень 2 (он занял точку, в которую здесь поставлен камень 3).

Пример 19

Это последнее фусэки, где AlphaGo играет за белых. Если черные строят крепость в углу, программа препятствует построить вторую крепость. Как по учебнику. Но она ставит низкий камень, хотя японские мастера не советуют так делать. Считается, что низкий камень 2 легко атаковать, у него будет тяжелая позиция. Либо AlphaGo так не считает, либо тут возможны варианты. Все-таки опубликовано всего 60 игр.

Метки: AlphaGo, DeepMind, Google, magister, master, игра Го, искусственный интеллект, искуственный интеллект, компьютерное Го, профессионалы, фусэки, чемпионы

Comments are closed.