WikiDer > Аргумент кражи стратегии

Strategy-stealing argument

В комбинаторная теория игр, то аргумент о краже стратегии генерал аргумент это показывает, для многих игры для двух игроков, что у второго игрока не может быть гарантированного выигрышная стратегия. Аргумент кражи стратегии применим к любому симметричная игра (тот, в котором любой игрок имеет одинаковый набор доступных ходов с одинаковыми результатами, так что первый игрок может «использовать» стратегию второго игрока), в котором дополнительный ход никогда не может быть недостатком.

Аргумент работает путем получения противоречие. Предполагается, что выигрышная стратегия существует для второго игрока, который ее использует. Но затем, грубо говоря, после того, как он сделает свой первый ход - что по приведенным выше условиям не является недостатком, - первый игрок может также играть в соответствии с этой выигрышной стратегией. В результате оба игрока гарантированно выиграют, что абсурдно и противоречит предположению о существовании такой стратегии.

Стратегическое воровство было изобретено Джон Нэш в 1940-х годах, чтобы показать, что игра шестнадцатеричный всегда выигрывает первый игрок, так как ничьи в этой игре невозможны.[1] Однако Нэш не опубликовал этот метод, и Бек (2008) отмечает свою первую публикацию Альфред В. Хейлз и Роберт И. Джуэтт в статье 1963 г. крестики-нолики в котором они также доказали Теорема Хейлза – Джеветта.[2] Другие примеры игр, к которым применим этот аргумент, включают м,п,k-игры Такие как гомоку. В игре Серебряная чеканка, стратегия кражи использовалась, чтобы показать, что первый игрок выигрывает, а не то, что игра заканчивается ничьей.[3]

Пример

Аргумент кражи стратегии можно использовать на примере игры крестики-нолики, для доски и выигрышных рядов любого размера.[1][2] Предположим, что второй игрок использует стратегию, S, что гарантирует им победу. Первый игрок ставит Икс в произвольной позиции, а второй игрок отвечает, помещая О в соответствии с S. Но если они проигнорируют первый случайный Икс что они разместили, первый игрок оказывается в той же ситуации, с которой второй игрок столкнулся на своем первом ходу; единственная фигура врага на доске. Следовательно, первый игрок может делать свои ходы в соответствии с S - то есть, если только S призывает к другому Икс быть помещенным туда, где игнорируется Икс уже размещен. Но в этом случае игрок может просто разместить свой Икс в другом случайном месте на доске, чистый эффект от которого будет таким Икс находится в положении, требуемом S, в то время как другой находится в случайном положении и становится новой игнорируемой фигурой, оставляя ситуацию прежней. Продолжая таким образом, S по гипотезе гарантированно приведет к выигрышной позиции (с дополнительным игнорируемым Икс не имеет значения). Но затем второй игрок проиграл, что противоречит предположению, что у него была гарантированная выигрышная стратегия. Таким образом, такой выигрышной стратегии для второго игрока не существует, а крестики-нолики - это либо принудительная победа для первого игрока, либо ничья. Дальнейший анализ показывает, что на самом деле это ничья.

То же доказательство справедливо для любого сильная позиционная игра.

Шахматы

Филидор, 1777 г.
абcdежграммчас
8
Chessboard480.svg
а4 белая королева
d3 белый король
b2 черная ладья
b1 черный король
8
77
66
55
44
33
22
11
абcdежграммчас
У черных цугцванг, так как они должны отвести ладью от своего короля.

Есть класс шахматы должности называются Цугцванг в котором игрок, обязанный двигаться, предпочел бы «пас», если бы это было разрешено. Из-за этого аргумент о краже стратегии неприменим к шахматам.[4] В настоящее время неизвестно, могут ли белые или черные форсировать победу при оптимальной игре или оба игрока могут форсировать ничью. Однако практически все изучающие шахматы считают первый ход белых преимуществом, а статистика современных высокоуровневых партий показывает, что процент победы белых примерно на 10% выше, чем у черных.

Идти

В Идти прохождение разрешено. Когда начальная позиция симметрична (пустая доска, ни один из игроков не имеет очков), это означает, что первый игрок может украсть выигрышную стратегию второго игрока, просто отказавшись от первого хода. Однако с 1930-х гг.[5] второй игрок обычно награждается точки компенсации, что делает начальную позицию асимметричной, и аргумент о краже стратегии больше не работает.

Элементарная стратегия в игре "зеркало идти", где второй игрок выполняет движения, которые по диагонали противоположны действиям этого противника. Этот подход может быть отклонен, используя лестничная тактика, ко бои, или успешно соревнуясь за контроль над центральной точкой доски.

Конструктивность

Аргумент кражи стратегии показывает, что второй игрок не может выиграть, путем вывода противоречия из любой гипотетической выигрышной стратегии для второго игрока. Аргумент обычно используется в играх, где не может быть ничьей, посредством закон исключенного среднего. Однако он не предоставляет явной стратегии для первого игрока, и из-за этого был назван неконструктивным.[4] Это поднимает вопрос о том, как на самом деле вычислить выигрышную стратегию.

Для игр с конечным числом доступных позиций, например чавкать, выигрышную стратегию можно найти путем тщательного поиска.[6] Однако это может оказаться непрактичным, если количество позиций велико.

В 2019 году Грег Бодвин и Офер Гроссман доказали, что проблема поиска выигрышной стратегии заключается в следующем. PSPACE-жесткий в двух типах игр, в которых использовались аргументы кражи стратегии: минимальная игра и симметричный Maker-Maker игра.[7]

Рекомендации

  1. ^ а б Бек, Йожеф (2008), Комбинаторные игры: теория крестиков-ноликов, Энциклопедия математики и ее приложений, 114, Кембридж: Издательство Кембриджского университета, стр.65, 74, Дои:10.1017 / CBO9780511735202, ISBN 9780511735202, МИСТЕР 2402857.
  2. ^ а б Хейлз, А.В.; Джуэтт, Р. И. (1963), "Регулярность и позиционные игры", Труды Американского математического общества, 106 (2): 222–229, Дои:10.2307/1993764, JSTOR 1993764, МИСТЕР 0143712.
  3. ^ Сичерман, Джордж (2002), "Теория и практика Sylver Coinage" (PDF), Целые числа, 2, G2
  4. ^ а б Бишоп, Дж. М .; Nasuto, S.J .; Танай, Т .; Roesch, E. B .; Спенсер, М. К. (2016), «HeX and the single anthill: Playing games with Aunt Hillary», в Müller, Vincent C. (ed.), Фундаментальные проблемы искусственного интеллекта (PDF), Synthese Library, 376, Springer, стр. 369–390, Дои:10.1007/978-3-319-26485-1_22. См., В частности, Раздел 22.2.2.2, Аргумент о краже стратегии, п. 376.
  5. ^ Фэйрбэрн, Джон, История Коми, получено 2010-04-09
  6. ^ rjlipton (2 октября 2013 г.). «Стратегии воровства». Потерянное письмо Гёделя и P = NP. Получено 2019-11-30.
  7. ^ Бодвин, Грег; Гроссман, Офер (15.11.2019). «Воровство стратегии неконструктивно». arXiv:1911.06907 [cs.DS].