WikiDer > Утилита с несколькими атрибутами

Multi-attribute utility

В теория принятия решений, а утилита с несколькими атрибутами Функция используется для представления предпочтений агента по отношению к группам товаров либо в условиях уверенности в результатах любого потенциального выбора, либо в условиях неопределенности.

Предварительные мероприятия

Человеку приходится выбирать между двумя или более вариантами. Решение основано на атрибуты из вариантов.

Самый простой случай - это когда есть только один атрибут, например: деньги. Обычно предполагается, что все люди предпочитают больше денег меньшим деньгам; следовательно, проблема в этом случае тривиальна: выберите вариант, который принесет вам больше денег.

На самом деле есть два или более атрибутов. Например, человек должен выбрать один из двух вариантов трудоустройства: вариант А дает ему 12 тысяч долларов в месяц и 20 дней отпуска, а вариант Б дает ему 15 тысяч долларов в месяц и только 10 дней отпуска. Человек должен выбрать между (12К, 20) и (15К, 10). У разных людей могут быть разные предпочтения. При определенных условиях предпочтения человека могут быть представлены числовой функцией. Статья порядковая полезность описывает некоторые свойства таких функций и способы их вычисления.

Еще одно соображение, которое может усложнить задачу принятия решения: неуверенность. Эта сложность существует даже тогда, когда есть единственный атрибут, например деньги. Например, вариант A может быть лотереей с 50% шансом выиграть 2 доллара, а вариант B - точно выиграть 1 доллар. Человеку предстоит сделать выбор между лотереей <2: 0,5> и лотереей <1: 1>. Опять же, у разных людей могут быть разные предпочтения. Опять же, при определенных условиях предпочтения могут быть представлены числовой функцией. Такие функции называются кардинальная полезность функции. Статья Теорема о полезности фон Неймана – Моргенштерна описывает некоторые способы их расчета.

Самая общая ситуация такова, что есть и то и другое несколько атрибутов и неопределенность. Например, вариант A может быть лотереей с 50% шансом выиграть два яблока и два банана, а вариант B - обязательно выиграть два банана. Решение находится между <(2,2) :( 0.5,0.5)> и <(2,0) :( 1,0)>. Предпочтения здесь могут быть представлены кардинальная полезность функции, которые принимают несколько переменных (атрибутов).[1]:26–27 Таким функциям и посвящена данная статья.

Цель - вычислить функцию полезности который представляет предпочтения человека в лотереях пакетов. То есть лотерея A предпочтительнее лотереи B тогда и только тогда, когда ожидание функции выше под A, чем под B:

Оценка функции кардинальной полезности с несколькими атрибутами

Если количество возможных связок конечно, ты могут быть построены напрямую, как объясняется фон Нейман и Моргенштерн (VNM): упорядочьте пакеты от наименее предпочтительных к наиболее предпочтительным, назначьте полезность 0 первому и полезность 1 второму и назначьте каждому пакету между полезностью, равной вероятности эквивалентной лотереи.[1]:222–223

Если количество пакетов бесконечно, можно начать с игнорирования случайности и оценить порядковая полезность функция который представляет полезность человека на конечно связки. То есть связка x предпочтительнее связки y тогда и только тогда, когда функция для x больше, чем для y:

Эта функция, по сути, преобразует проблему с несколькими атрибутами в проблему с одним атрибутом: атрибут . Затем с помощью VNM можно построить функцию .[1]:219–220

Обратите внимание, что ты должно быть положительным монотонным преобразованием v. Это означает, что существует монотонно возрастающая функция , такое, что:

Проблема с этим подходом заключается в том, что нелегко оценить функцию р. При оценке функции кардинальной полезности с одним атрибутом с помощью VNM мы задаем такие вопросы, как: «Какая вероятность выиграть 2 доллара эквивалентна 1 доллару?». Итак, чтобы оценить функцию р, мы должны задать вопрос, например: «Какая вероятность выиграть 2 единицы стоимости эквивалентна 1 величине?». На последний вопрос ответить гораздо труднее, чем на первый, поскольку он включает в себя «ценность», которая является абстрактной величиной.

Возможное решение - вычислить п одномерные кардинальные функции полезности - по одной на каждый атрибут. Например, предположим, что есть два атрибута: яблоки () и бананы (), оба диапазона находятся в диапазоне от 0 до 99. Используя VNM, мы можем вычислить следующие одномерные функции полезности:

  • - кардинальная полезность по яблокам при отсутствии бананов (южная граница домена);
  • - кардинальная полезность бананов, когда яблоки максимальны (восточная граница домена).

Используя линейные преобразования, масштабируйте функции так, чтобы они имели одинаковое значение на (99,0).

Тогда для каждого пакета , найдите эквивалентную связку (связку с тем же v) которая имеет вид или формы , и установите его полезность на тот же номер.[1]:221–222

Часто определенные независимость свойства между атрибутами можно использовать для упрощения построения служебной функции.

Аддитивная независимость

Сильнейшее свойство независимости называется аддитивная независимость. Два атрибута, 1 и 2, называются аддитивно независимый, если предпочтение между двумя лотереями (определенное как совместное распределение вероятностей двух атрибутов) зависит только от их распределения предельной вероятности (маргинальная PD атрибута 1 и маргинальная PD атрибута 2).

Это означает, например, что следующие две лотереи эквивалентны:

  • : Лотерея с равными шансами между и ;
  • : Лотерея с равными шансами между и .

В обеих этих лотереях предельное PD по атрибуту 1 составляет 50% для и 50% для . Точно так же предельное PD по атрибуту 2 составляет 50% для и 50% для . Следовательно, если у агента есть независимые от аддитивов полезности, ему должно быть безразлично эти две лотереи.[1]:229–232

Фундаментальный результат теории полезности состоит в том, что два атрибута аддитивно независимы, если и только если их функция полезности с двумя атрибутами является аддитивной и имеет форму:

ДОКАЗАТЕЛЬСТВО:

Если атрибуты не зависят от аддитивности, то лотереи и , определенные выше, эквивалентны. Это означает, что их ожидаемая полезность такая же, то есть: . Умножение на 2 дает:

Это верно для Любые выбор и . Предположим теперь, что и фиксируются. Произвольно установлено . Написать: и Приведенное выше уравнение принимает следующий вид:

Если функция ты складывается, то по правилам ожидания для каждой лотереи :

Это выражение зависит только от предельных распределений вероятностей по двум атрибутам.

Этот результат можно обобщить на любое количество атрибутов: если предпочтения перед лотереями по атрибутам 1, ...,п зависят только от их предельных распределений вероятностей, то п-атрибутная функция полезности аддитивна:[1]:295

где и нормализованы к диапазону , а - константы нормализации.

Большая часть работы по аддитивной теории полезности была проделана Питер С. Фишберн.

Коммунальная независимость

Немного более слабое свойство независимости независимость от полезности. Атрибут 1 независимый от полезности атрибута 2, если условные предпочтения в лотереях по атрибуту 1 при постоянном значении атрибута 2 не зависят от этого постоянного значения.

Это означает, например, что предпочтение между лотереей и лотерея одинаково, независимо от значения .

Обратите внимание, что независимость полезности (в отличие от аддитивной независимости) не симметричный: возможно, что атрибут 1 не зависит от полезности атрибута 2, а не наоборот.[1]:224–229

Если атрибут 1 не зависит от полезности атрибута 2, то функция полезности для каждого значения атрибута 2 является линейным преобразованием функции полезности для любого другого значения атрибута 2. Следовательно, это можно записать как:

когда - постоянное значение для атрибута 2. Аналогично, если атрибут 2 не зависит от полезности атрибута 1:

Если атрибуты взаимно независимый, то функция полезности ты имеет следующие полилинейная форма:[1]:233–235

куда - константа, которая может быть положительной, отрицательной или 0.

  • Когда , функция ты является аддитивным, а атрибуты не зависят от аддитивности.
  • Когда , функция полезности мультипликативна, поскольку ее можно записать как:
где каждый член является линейным преобразованием функции полезности.

Эти результаты можно обобщить на любое количество атрибутов. Учитывая атрибуты 1, ...,п, если какое-либо подмножество атрибутов не зависит от полезности от своего дополнения, то п-атрибутная функция полезности является полилинейной и имеет одну из следующих форм:

где:

  • В и нормализованы к диапазону ;
  • В константы в ;
  • - константа, которая находится либо в или в (обратите внимание, что предел, когда - аддитивная форма).

Сравнение концепций независимости

Полезно сравнить три различных концепции, связанных с независимостью атрибутов: независимость от аддитивов (AI), независимость от полезности (UI) и независимость от предпочтений (PI).[1]:344

И ИИ, и пользовательский интерфейс имеют отношение к настройкам лотереи и объяснены выше. PI касается предпочтений по верные результаты и объясняется в статье о порядковая полезность.

Их порядок следования следующий:

AI ⇒ UI ⇒ PI

AI является симметричным отношением (если атрибут 1 является AI атрибута 2, тогда атрибут 2 является AI атрибута 1), а UI и PI - нет.

AI подразумевает взаимный интерфейс. Обратное, как правило, неверно; это правда, только если в мультилинейной формуле для атрибутов пользовательского интерфейса. Но если, помимо взаимного UI, существуют для чего две лотереи и , определенные выше, эквивалентны - тогда должно быть 0, а это означает, что отношение предпочтения должно быть ИИ.[1]:238–239

UI подразумевает PI. Обратное, как правило, неверно. Но если:

  • есть как минимум 3 обязательных атрибута и:
  • все пары атрибутов {1,я} являются ИП своего дополнения, и:
  • атрибут 1 - это UI его дополнения,

тогда все атрибуты взаимно являются UI. Более того, в этом случае существует простая связь между кардинальной функцией полезности представление предпочтений в лотереях и порядковая функция полезности представление предпочтений для определенных пакетов. Функция должен иметь одну из следующих форм:[1]:330–332[2]

  • Добавка:
  • Мультипликативный:

где .

ДОКАЗАТЕЛЬСТВО: Достаточно доказать, что ты имеет постоянное абсолютное неприятие риска относительно стоимости v.

  • Предположение PI с подразумевают, что функция цены аддитивна, то есть:
  • Позволять - два разных значения атрибута 1. Пусть быть уверенным эквивалентом лотереи . Предположение пользовательского интерфейса подразумевает, что для каждой комбинации значений других атрибутов имеет место следующая эквивалентность:
  • Два предыдущих утверждения подразумевают, что для каждого ш, в пространстве значений имеет место эквивалентность:
  • Это означает, что добавление любого количества к обеим сторонам лотереи (через термин ), увеличивает достоверность лотереи на ту же величину.
  • Последнее означает постоянное неприятие риска.

Смотрите также

использованная литература

  1. ^ а б c d е ж г час я j k л Кини, Ральф Л .; Райффа, Ховард (1993). Решения с несколькими целями. ISBN 0-521-44185-4.CS1 maint: ref = harv (ссылка на сайт)
  2. ^ Эту идею приписывают Ричард Ф. Мейер и Джон В. Пратт.