WikiDer > Байесовский оптимальный механизм
А Байесовский оптимальный механизм (BOM) - это механизм в котором разработчик не знает оценок агентов, для которых разработан механизм, но он знает, что они случайные переменные и он знает распределение вероятностей этих переменных.
Типичное приложение - это продавец, который хочет продать некоторые товары потенциальным покупателям. Продавец хочет установить цену на товары таким образом, чтобы получить максимальную прибыль. Оптимальные цены зависят от суммы, которую каждый покупатель готов платить за каждый товар. Продавец не знает этих сумм, но предполагает, что они взяты из некоего известного распределение вероятностей. Фраза «байесовская оптимальная конструкция механизма» имеет следующее значение:[1]:335–338
- Байесовский означает, что мы знаем распределение вероятностей, из которого выводятся оценки агентов (в отличие от бесприоритетная конструкция механизма, которые не предполагают никакого априорного распределения вероятностей).
- Оптимально означает, что мы хотим максимизировать ожидаемый доход аукциониста, где ожидание превышает случайность оценок агентов.
- Механизм означает, что мы хотим разработать правила, определяющие правдивый механизм, в котором каждый агент имеет стимул сообщить свою истинную ценность.
Пример
В продаже есть один товар. Есть два потенциальных покупателя. Оценка каждого покупателя проводится i.i.d. из равномерного распределения на [0,1].
В Викри аукцион является правдивым механизмом и его ожидаемая прибыль в этом случае составляет 1/3[нужна цитата] (в аукцион первой цены с запечатанными предложениями это неправдивый механизм и его ожидаемая прибыль такая же).
Этот аукцион не оптимален. Можно получить лучшую прибыль, установив резервная цена. Аукцион Викри с резервной ценой 1/2 приносит ожидаемую прибыль 5/12.[нужна цитата], что в данном случае является оптимальным[нужна цитата].
Обозначение
Мы предполагаем, что у агентов есть однопараметрическая утилита функции, такие как аукцион отдельных предметов. Каждый агент имеет ценность который представляет "выигрышную ценность" агента (например, оценку предмета агентом). Мы не знаем этих ценностей, но знаем, что каждый нарисован i.i.d. из определенного распределения вероятностей. Обозначим через то кумулятивная функция распределения:
и по то функция распределения вероятностей:
An распределение это вектор , так что для каждого , равно 1, если агент выигрывает и 0 в противном случае. Каждое распределение может иметь Стоимость аукционисту, .
В избыток распределения определяется как:
Это общая прибыль агентов за вычетом затрат на аукциониста.
Профицит - это максимально возможная прибыль. Если каждый выигравший агент платит точно свою стоимость , то прибыль аукциониста и есть излишек ; это означает, что аукционист забирает все излишки себе и оставляет агентам нулевую полезность.
Эта максимальная прибыль не может быть достигнута, потому что если аукционист попытается взимать с каждого выигравшего агента его стоимость , агенты будут лгать и сообщать о более низком значении, чтобы платить меньше. Механизм Майерсона решает эту проблему.
Механизм Майерсона
Роджер Майерсон разработал байесовский оптимальный механизм для однопараметрическая утилита агенты. Ключевой прием в механизме Майерсона - использовать виртуальные оценки. Для каждого агента , определите его виртуальную оценку как:
Обратите внимание, что виртуальная оценка обычно меньше фактической. Возможно даже, что виртуальная оценка будет отрицательной, а фактическая - положительной.
Определить виртуальный излишек распределения x как:
Обратите внимание, что виртуальный излишек обычно меньше фактического излишка.
Ключевая теорема Майерсона гласит:[1]:336[2]
- Ожидаемая прибыль любого правдивого механизма равна его ожидаемой виртуальной прибыли.
(ожидание берется из-за случайности оценок агентов).
Эта теорема предлагает следующий механизм:
- Спросите каждого агента сообщить его оценку
- На основании ответа и известных функций распределения , вычислить .
- Вычислите распределение x, которое максимизирует виртуальный излишек .
Чтобы завершить описание механизма, мы должны указать цену, которую должен заплатить каждый агент-победитель. Один из способов рассчитать цену - использовать Механизм VCG по виртуальным оценкам . Механизм VCG возвращает как распределение, которое максимизирует виртуальный излишек, так и вектор цен. Поскольку вектор цен соответствует виртуальным оценкам, мы должны преобразовать его обратно в пространство реальных оценок. Итак, последний шаг механизма:
- Взять с каждого агента-победителя Цена , куда цена определяется механизмом VCG.
Правдивость
Механизм Майерсона истинен, когда правило распределения удовлетворяет слабая монотонность свойство, т.е. функция распределения слабо возрастает в оценках агентов. Правило распределения VCG действительно слабо увеличивает оценки, но мы используем его с виртуальными оценками, а не с реальными. Следовательно, механизм Майерсона является истинным, если виртуальные оценки слабо возрастают в реальных оценках. Т.е. если для всех : является слабо возрастающей функцией .
Если не является слабо возрастающей функцией , тогда Майерсон гладильная может быть использован.
Механизм Майерсона можно применять в различных условиях. Ниже представлены два примера.
Отдельный аукцион
Предположим, мы хотим продать один товар и знаем, что оценки всех агентов основаны на одном и том же распределении вероятностей с функциями . Тогда все участники торгов имеют одинаковую функцию виртуальной оценки, . Предположим, что эта функция слабо возрастающая. В этом случае механизм ВКГ сводится к Викри аукцион: он передает элемент агенту с наибольшей оценкой (самой высокой ставкой). Но механизм Майерсона использует VCG с виртуальными оценками, которые могут быть отрицательными. Следовательно, механизм Майерсона в данном случае сводится к Аукцион Викри с резервной ценой. Он передает предмет агенту с наибольшей оценкой, но только если его виртуальная оценка не менее 0. Это означает, что резервная цена механизма Майерсона в точности равна:
Итак, если мы знаем функции распределения вероятностей , мы можем вычислить функцию , и по ней найти оптимальную цену бронирования.
Аукцион цифровых товаров
В аукцион цифровых товаров, у нас есть неограниченное количество идентичных товаров. Каждому агенту нужно не более одного предмета. Оценки агентов по предмету исходят из того же распределения вероятностей с функциями и функция виртуальной оценки . Механизм VCG распределяет элемент каждому агенту с неотрицательной виртуальной оценкой и взимает минимальную выигрышную цену, которая составляет:
Это в точности соответствует оптимальной цене продажи - цене, которая максимизирует ожидаемое значение прибыли продавца с учетом распределения оценок:
Альтернативы
Разработка байесовского оптимального механизма требует знания распределений, из которых выводятся оценки агентов. Это требование не всегда выполняется. Есть и другие альтернативы:
- Когда распределение неизвестно, предшествующий независимый механизм может быть использован.
- Когда нельзя даже предположить, что агенты взяты из некоторого распределения вероятностей, бесприоритетный механизм должен быть использован.
Рекомендации
- ^ а б Вазирани, Виджай В.; Нисан, Ноам; Roughgarden, Тим; Тардос, Ива (2007). Алгоритмическая теория игр (PDF). Кембридж, Великобритания: Издательство Кембриджского университета. ISBN 0-521-87282-0.
- ^ Майерсон, Роджер Б. (1981). «Оптимальный дизайн аукциона». Математика исследования операций. 6: 58. Дои:10.1287 / moor.6.1.58.