WikiDer > Модель Вальдса Максимина - Википедия

Walds maximin model - Wikipedia

В теория принятия решений и теория игры, Вальда Максимин модель представляет собой не вероятностную модель принятия решений, в соответствии с которой решения ранжируются на основе их наихудших исходов - оптимальное решение - это решение с наименее плохим наихудшим исходом. Это одна из самых важных моделей в принятие надежных решений в целом и надежная оптимизация особенно.

Он также известен множеством других названий, таких как правило максимина Вальда, принцип максимина Вальда, парадигма максимина Вальда и критерий максимина Вальда. Часто 'минимакс'используется вместо' maximin '.

Определение

Общая модель максимина Вальда выглядит следующим образом:

куда обозначает пространство решений; обозначает набор состояний, связанных с решением и обозначает выигрыш (результат), связанный с решением и государство .

Эта модель представляет собой игру для двух человек, в которой игрок играет первым. В ответ второй игрок выбирает худшее состояние в , а именно состояние в что минимизирует выигрыш над в . Во многих приложениях второй игрок представляет собой неопределенность. Однако есть полностью детерминированные максиминные модели.

Вышеупомянутая модель является классический формат модели максимина Вальда. Есть эквивалент математическое программирование (MP) формат:

куда обозначает реальную линию.

Как в теория игры, худший выигрыш, связанный с решением , а именно

называется уровень безопасности решения .

Минимаксный вариант модели получается путем обмена позициями и операции в классическом формате:

Эквивалентный формат MP выглядит следующим образом:

История

Вдохновленный максиминными моделями теории игр, Авраам Вальд разработал эту модель в начале 1940-х гг. [1][2][3] как подход к ситуациям, в которых есть только один игрок (лицо, принимающее решение). Второй игрок представляет пессимистический (наихудший) подход к неопределенности. В модели максимина Вальда игрок 1 ( игрок) играет первым, а игрок 2 ( player) знает решение игрока 1, когда он выбирает свое решение. Это серьезное упрощение классическая игра на двоих с нулевой суммой в котором два игрока выбирают свои стратегии, не зная о выборе другого игрока. Игра по модели максимина Уолда также рассчитана на двоих. игра с нулевой суммой, но игроки выбирают последовательно.

С созданием современной теории принятия решений в 1950-х годах эта модель стала ключевым ингредиентом в формулировке недовероятных моделей принятия решений в условиях серьезной неопределенности.[4][5] Он широко используется в различных областях, таких как теория принятия решений, теория управления, экономика, статистика, надежная оптимизация, исследование операций, философия, так далее.[6][7]

Пример

Одним из самых известных примеров модели Максимин / Минимакс является

куда обозначает реальную линию. Формально мы можем установить и . Картина такая

Saddle point.png

Оптимальное решение - (красный) точка перевала .

Таблицы решений

Есть много случаев, когда удобно «организовать» модель Maximin / Minimax в виде «таблицы». Согласно соглашению, строки таблицы представляют решения, а столбцы представляют состояния.

Пример

Анри идет на прогулку. Может светить солнце, а может пойти дождь. Следует ли Анри носить зонтик? Анри не любит носить зонтик, но еще больше не любит промокнуть. Его "матрица выплат", рассматривая это как игру Максимина, противопоставляющую Анри природе, выглядит следующим образом.

солнце Дождь
Без зонтика
5
−9
Зонтик
1
−5

Добавление Худшая выплата столбец и Наихудшая выплата столбца в таблицу выплат, получаем

солнце ДождьХудшая выплатаНаихудшая выплата
Без зонтика
5
−9
−9
Зонтик
1
−5
−5
−5

Худший случай, когда Анри выходит без зонта, определенно хуже, чем (лучший) худший случай, когда он носит зонтик. Поэтому Анри берет с собой зонтик.

Вариации на тему

За прошедшие годы было разработано множество связанных моделей, в первую очередь для смягчения пессимистического подхода, продиктованного наихудшей ориентацией модели.[4][5][8][9][10] Например,

Минимаксное сожаление Сэвиджа

Savage's минимаксная модель сожаления[11] представляет собой приложение минимаксной модели Уолда к «сожалениям», связанным с выплатами. Его можно сформулировать так:

куда

сожаление о расплате связанный с парой (решение, состояние) .

Детерминированные модели

Наборы состояний не обязательно представлять неопределенность. Они могут представлять (детерминированные) вариации значения параметра.

Пример

Позволять быть конечным набором, представляющим возможные местоположения «нежелательного» общественного объекта (например, свалки мусора), и пусть обозначают конечный набор мест по соседству с планируемым объектом, представляющий существующие жилища.

Возможно, желательно построить объект так, чтобы его кратчайшее расстояние от существующего жилища было как можно большим. Максиминная постановка задачи следующая:

куда обозначает расстояние из . Обратите внимание, что в этой задаче не зависит от .

В случаях, когда желательно жить близко к объекту, целью может быть минимизация максимального расстояния от объекта. Это дает следующую минимаксную задачу:

Это общие расположение объекта проблемы.

Замаскированные модели Максимина

Опыт показал, что формулировка максиминных моделей может быть тонкой в ​​том смысле, что задачи, которые «не похожи» на максиминные задачи, могут быть сформулированы как таковые.

Пример

Рассмотрим следующую проблему:

Учитывая конечное множество и действительная функция на , найдите наибольшее подмножество такой, что для каждого в этом подмножестве.

Максиминная формулировка этой задачи в формате MP такова:

Общие проблемы этого типа появляются при анализе устойчивости.[12][13]

Было показано, что радиус устойчивости модель и надежность информационного разрыва модель являются простыми примерами максиминной модели Вальда.[14]

Модели с ограничениями максимина

Ограничения могут быть явно включены в максиминные модели. Например, следующая задача ограниченного максимина сформулирована в классическом формате.

Его эквивалентный формат MP выглядит следующим образом:

Такие модели очень полезны в надежная оптимизация.

Цена надежности

Одна из «слабых сторон» модели Максимина заключается в том, что обеспечиваемая ею надежность обеспечивается цена.[10] Не рискуя, модель Максимина склонна генерировать консервативные решения, цена которых может быть высокой. Следующий пример иллюстрирует эту важную особенность модели.

Пример

Рассмотрим простой случай, когда есть два решения, d 'и d ", и где S (d') = S (d") = [a, b]. Тогда модель Максимина выглядит следующим образом:

Теперь рассмотрим пример, показанный

Maximin price.png

Отметим, что хотя выигрыш, связанный с решением d ', больше, чем выигрыш, связанный с решением d "по большей части пространства состояний S = [a, b], наилучший наихудший случай согласно модели Вальда обеспечивается решением d". Следовательно, согласно модели Вальда, решение d "лучше, чем решение d '.

Алгоритмы

Не существует универсальных алгоритмов решения максиминных задач. Некоторые проблемы решить очень просто, другие - очень сложно.[9][10][15][16]

Пример

Рассмотрим случай, когда переменная состояния является «индексом», например, пусть для всех . Тогда связанная проблема максимина выглядит следующим образом:

куда .

Если , все функции находятся линейный, и определяется системой линейный ограничения на , то эта проблема линейное программирование проблема, которую можно решить линейное программирование алгоритмы, такие как симплексный алгоритм.

Рекомендации

  1. ^ Вальд, А. (1939). Вклад в теорию статистического оценивания и проверки гипотез. Анналы математики, 10(4), 299-326.
  2. ^ Вальд, А. (1945). Статистические функции принятия решений, минимизирующие максимальный риск. Анналы математики, 46(2), 265-280.
  3. ^ Вальд, А. (1950). Статистические функции принятия решений, Джон Вили, штат Нью-Йорк.
  4. ^ а б Резник, доктор медицины (1987). Выбор: введение в теорию принятия решений, Университет Миннесоты, Миннеаполис.
  5. ^ а б Френч, С. (1986). Теория принятия решений: введение в математику рациональности, Эллис Хорвуд, Чичестер.
  6. ^ Сниедович, М. (2007). Искусство и наука моделирования принятия решений в условиях серьезной неопределенности. Принятие решений в сфере производства и услуг, 1(1-2), 111-136.
  7. ^ Снидович, М. (2008). Модель максимина Уолда: скрытое сокровище! Журнал риск-финансирования, 9(3), 287-91.
  8. ^ Кувелис П., Ю. Г. (1997). Робастная дискретная оптимизация и ее приложения, Клувер, Бостон.
  9. ^ а б Бен-Тал, А., Эль-Гауи, Л., Немировски, А. (2009). Надежная оптимизация. Издательство Принстонского университета, Принстон.
  10. ^ а б c Берцимас Д. и Сим М. (2004). Цена надежности. Исследование операций, 52(1), 35-53.
  11. ^ Сэвидж, Л. (1951). Теория статистического решения. Журнал Американской статистической ассоциации, 46, 55–67.
  12. ^ Л. Джо Моффит, Джон К. Странлунд и Крейг Д. Остин (2008). Надежные протоколы обнаружения неопределенных интродукций инвазивных видов. Журнал экологического менеджмента, 89(4), 293–299.
  13. ^ Джонатан Розенхед, Мартин Элтон, Шив К. Гупта. (1972). Устойчивость и оптимальность как критерии стратегических решений. Ежеквартальное исследование операций, 23(4), 413-431.
  14. ^ Снидович, М. (2010). Взгляд с высоты на теорию принятия решений по информационным пробелам. Журнал риск-финансирования, 11(3), 268-283.
  15. ^ Ремстем Р. и Рикманн Дж. (1998). Полубесконечное программирование, Клувер, Бостон.
  16. ^ Рустем, Б. и Хау, М. (2002). Алгоритмы для наихудшего сценария и приложения к управлению рисками, Издательство Принстонского университета, Принстон.