WikiDer > Непрерывная игра

Continuous game

А непрерывная игра математическая концепция, используемая в теория игры, который обобщает идею обычной игры, такой как крестики-нолики (крестики-нолики) или шашки (шашки). Другими словами, он расширяет понятие дискретной игры, в которой игроки выбирают из конечного набора чистых стратегий. Концепция непрерывной игры позволяет играм включать более общие наборы чистых стратегий, которые могут быть бесчисленное множество.

В общем, игра с несчетным числом наборов стратегий не обязательно будет иметь равновесие по Нэшу решение. Если, однако, наборы стратегий должны быть компактный и вспомогательные функции непрерывный, то равновесие по Нэшу будет гарантировано; это обобщение Гликсбергом Теорема Какутани о неподвижной точке. По этой причине класс непрерывных игр обычно определяется и изучается как подмножество более широкого класса бесконечных игр (то есть игр с бесконечными наборами стратегий), в которых наборы стратегий компактны, а функции полезности непрерывны.

Формальное определение

Определить п-пользовательская непрерывная игра где

это набор игроки,
где каждый это компактный набор, в метрическое пространство, соответствующий th набор чистых стратегий игрока,
где функция полезности игрока
Мы определяем быть набором Бореля вероятностные меры на , давая нам пространство смешанной стратегии игрока я.
Определите профиль стратегии где

Позволять быть стратегическим профилем всех игроков, кроме игрока . Как и в случае с дискретными играми, мы можем определить лучший ответ переписка для игрока , . является отношением множества всех распределений вероятностей по профилям игроков соперника к множеству игроков стратегии, такие, что каждый элемент

лучший ответ на . Определить

.

Профиль стратегии это равновесие по Нэшу если и только еслиСуществование равновесия по Нэшу для любой непрерывной игры с непрерывными функциями полезности можно доказать, используя Ирвинг Гликсбергобобщение Теорема Какутани о неподвижной точке.[1] В общем, решения может не быть, если мы разрешим пространства стратегий, , которые не являются компактными, или если мы допускаем прерывистые функции полезности.

Раздельные игры

А отделяемая игра - непрерывная игра, в которой для любого i функция полезности может быть выражена в форме суммы произведений:

, где , , , а функции непрерывны.

А полиномиальная игра это отделимая игра, в которой каждый компактный интервал на и каждая функция полезности может быть записана как многомерный полином.

В общем, смешанные равновесия по Нэшу в разделимых играх вычислить легче, чем в неразделимых играх, как следует из следующей теоремы:

Для любой сепарабельной игры существует хотя бы одно равновесие по Нэшу, в котором игрок я смешивает самое большее чистые стратегии.[2]

В то время как стратегия равновесия для неотделимой игры может потребовать бесчисленное множество поддержка, сепарабельная игра гарантированно имеет по крайней мере одно равновесие по Нэшу со смешанными стратегиями с конечным носителем.

Примеры

Раздельные игры

Полиномиальная игра

Рассмотрим игру двух игроков с нулевой суммой. Икс и Y, с участием . Обозначим элементы и так как и соответственно. Определите служебные функции где

.

Отношения наилучшего отклика в чистой стратегии:

и не пересекаются, значит, есть

нет чистой стратегии равновесия по Нэшу, однако должно быть равновесие смешанной стратегии. Чтобы найти это, выразите ожидаемое значение, как линейный сочетание первого и второго моменты распределений вероятностей Икс и Y:

(где и аналогично для Y).

Ограничения на и (с аналогичными ограничениями для у,) даются Хаусдорф в качестве:

Каждая пара ограничений определяет компактное выпуклое подмножество на плоскости. поскольку линейно, любые экстремумы по отношению к первым двум моментам игрока будут лежать на границе этого подмножества. Стратегия равновесия игрока i будет лежать на

Обратите внимание, что первое уравнение допускает только смеси 0 и 1, тогда как второе уравнение допускает только чистые стратегии. Более того, если лучший ответ в определенный момент игроку i лежит на , он будет лежать на всей строке, так что и 0, и 1 являются лучшим ответом. просто дает чистую стратегию , так никогда не даст одновременно 0 и 1, однако дает как 0, так и 1, когда y = 1/2. Равновесие по Нэшу существует, когда:

Это определяет одно уникальное равновесие, в котором Игрок X играет случайную смесь из 0 1/2 времени и 1 1/2 времени. Игрок Y использует чистую стратегию 1/2. Стоимость игры - 1/4.

Неразделимые игры

Рациональная функция выплаты

Рассмотрим игру двух игроков с нулевой суммой. Икс и Y, с участием . Обозначим элементы и так как и соответственно. Определите служебные функции где

В этой игре нет чистой стратегии равновесия по Нэшу. Это можно показать[3] что существует единственная смешанная стратегия равновесия по Нэшу со следующей парой функции плотности вероятности:

Ценность игры .

Требование распределения Кантора

Рассмотрим игру двух игроков с нулевой суммой. Икс и Y, с участием . Обозначим элементы и так как и соответственно. Определите служебные функции где

.

Эта игра имеет уникальное равновесие смешанной стратегии, где каждый игрок играет смешанную стратегию с сингулярная функция кантора как кумулятивная функция распределения.[4]

дальнейшее чтение

  • Х. В. Кун и А. В. Такер, ред. (1950). Вклад в теорию игр: Vol. II. Анналы математических исследований 28. Издательство Принстонского университета. ISBN 0-691-07935-8.

Смотрите также

использованная литература

  1. ^ I.L. Гликсберг. Дальнейшее обобщение теоремы Какутани о неподвижной точке с применением к точкам равновесия по Нэшу. Труды Американского математического общества, 3 (1): 170–174, февраль 1952 г.
  2. ^ Н. Штейн, А. Оздаглар, П.А. Паррило. «Разделимые и непрерывные игры низкого ранга». Международный журнал теории игр, 37 (4): 475–504, декабрь 2008 г. https://arxiv.org/abs/0707.3462
  3. ^ Гликсберг И. и Гросс О. (1950). «Записки об играх над площадью». Кун, Х.В. И Такер, A.W. ред. Вклад в теорию игр: Том II. Анналы математических исследований 28, с.173–183. Издательство Принстонского университета.
  4. ^ Гросс, О. (1952). «Рациональная характеристика выигрыша распределения Кантора». Технический отчет D-1349, Корпорация РЭНД.