WikiDer > Динамический дискретный выбор
Модели с динамическим дискретным выбором (DDC), также известный как модели дискретного выбора динамическое программирование, смоделируйте выбор агента над отдельными вариантами, которые имеют значение в будущем. Вместо того, чтобы предполагать, что наблюдаемый выбор является результатом статической максимизации полезности, наблюдаемый выбор в моделях DDC предполагается результатом максимизации агентом приведенная стоимость полезности, обобщая теория полезности на которой дискретный выбор модели основаны.[1]
Цель методов DDC - оценить структурные параметры процесса принятия решения агентом. Как только эти параметры известны, исследователь может затем использовать оценки для моделирования того, как агент будет вести себя в контрфактическом состоянии мира. (Например, как изменится решение потенциального студента о зачислении в колледж в ответ на повышение платы за обучение.)
Математическое представление
Агент с проблема максимизации математически можно записать следующим образом:
куда
- находятся переменные состояния, с агент начальное состояние
- представляет решение из числа дискретные альтернативы
- это коэффициент дисконтирования
- это Утилита потока получает от выбора альтернативы в период , и зависит как от состояния и ненаблюдаемые факторы
- это временной горизонт
- Ожидание взят на себя как 'песок в . То есть агент не уверен в будущих переходах в состояниях, а также не уверен в будущих реализациях ненаблюдаемых факторов.
Упрощение предположений и обозначений
Стандартно налагаются следующие упрощающие предположения и обозначения задачи динамического принятия решений:
- 1. Полезность потока аддитивно разделима и линейна по параметрам.
Полезность потока может быть записана как аддитивная сумма, состоящая из детерминированных и стохастических элементов. Детерминированную составляющую можно записать как линейную функцию от структурные параметры.
- 2. Задачу оптимизации можно записать в виде Уравнение беллмана
Определить в ex ante функция ценности для индивидуального в период непосредственно перед раскрывается:
где оператор ожидания закончился и где представляет собой распределение вероятностей по при условии . Ожидание по переходам между состояниями достигается путем вычисления интеграла по этому распределению вероятностей.
Можно разложить на детерминированную и стохастическую составляющие:
куда ценность выбора альтернативы вовремя и записывается как
где теперь ожидание берется за .
- 3. Задача оптимизации следует за Марковский процесс принятия решений
Штаты следовать Цепь Маркова. То есть достижение состояния зависит только от государства и нет или любое предыдущее состояние.
Функции условного значения и вероятности выбора
Функция значения в предыдущем разделе называется функция условного значения, потому что это функция цены, обусловленная выбором альтернативы в период . Такая запись функции условного значения полезна при построении формул для вероятностей выбора.
Чтобы записать вероятности выбора, исследователь должен сделать предположение о распределении с. Как и в статических моделях дискретного выбора, это распределение можно считать iid Тип I экстремальное значение, обобщенное экстремальное значение, полиномиальный пробит, или же смешанный логит.
Для случая, когда является полиномиальным логитом (т. е. нарисованным iid от Распределение экстремальных значений типа I) формулы для вероятностей выбора будут такими:
Оценка
Оценка динамических моделей дискретного выбора является особенно сложной задачей из-за того, что исследователь должен решать задачу обратной рекурсии для каждого предположения о структурных параметрах.
Наиболее распространенные методы оценки структурных параметров: оценка максимального правдоподобия и метод моделирования моментов.
Помимо методов оценки, существуют также методы решения. В зависимости от сложности проблемы могут использоваться разные методы решения. Их можно разделить на методы полного решения и методы без решения.
Методы полного решения
Ярким примером метода полного решения является алгоритм вложенной фиксированной точки (NFXP), разработанный компанией Джон Раст в 1987 г.[2]Алгоритм NFXP подробно описан в его документации.[3]
Недавняя работа Че-Лин Су и Кеннет Джадд в 2012[4] реализует другой подход (отвергнутый Rust как неразрешимый в 1987 г.), который использует ограниченная оптимизация функции правдоподобия, частный случай математическое программирование с равновесными ограничениями В частности, функция правдоподобия максимизируется с учетом ограничений, накладываемых моделью, и выражается в терминах дополнительных переменных, которые описывают структуру модели. Этот подход требует мощного программного обеспечения для оптимизации, такого как Artelys Knitro из-за большой размерности задачи оптимизации. После ее решения находятся как структурные параметры, максимизирующие вероятность, так и решение модели.
В следующей статье[5] Rust и соавторы показывают, что преимущество MPEC в скорости по сравнению с NFXP незначительно. Тем не менее, поскольку вычисления, требуемые MPEC, не зависят от структуры модели, ее реализация намного менее трудоемка.
Несмотря на многочисленных претендентов, оценка максимального правдоподобия NFXP остается ведущим методом оценки для марковских моделей принятия решений.[5]
Методы без решения
Альтернативой методам полного решения являются методы без решения. В этом случае исследователь может оценить структурные параметры без полного решения задачи обратной рекурсии для каждого предположения параметра. Методы, не связанные с решением, обычно быстрее и требуют большего количества предположений, но дополнительные предположения во многих случаях реалистичны.
Ведущим методом без решения является условный выбор вероятностей, разработанный В. Джозефом Хотцем и Робертом А. Миллером.[6]
Примеры
Модель замены двигателя автобуса
Модель замены двигателя автобуса, разработанная в основополагающей статье Ржавчина (1987) является одной из первых динамических стохастических моделей дискретного выбора, оцениваемых с использованием реальных данных, и продолжает служить классическим примером задач этого типа.[4]
Модель простая регенеративная. оптимальная остановка стохастическая динамическая проблема, с которой столкнулся руководитель службы технического обслуживания Гарольд Цурчер. Мэдисон, Висконсин Столичная автобусная компания. Для каждого автобус в работе в каждый период времени Гарольд Цурчер должен решить, следует ли заменить двигатель и нести соответствующие затраты на замену, или продолжать эксплуатацию автобуса с постоянно растущими эксплуатационными расходами, которые включают страхование и стоимость потери пассажира в случае поломки.
Позволять обозначить одометр чтение (пробег) за период , стоимость эксплуатации автобуса, зависящая от вектора параметров , стоимость замены двигателя, и в коэффициент дисконтирования. Тогда полезность за период определяется как
куда обозначает решение (оставить или заменить) и и представляют собой компонент полезности, наблюдаемый Гарольдом Цурчером, но не Джоном Рустом. Предполагается, что и независимы и одинаково распределены с Распределение экстремальных значений типа I, и это не зависят от при условии .
Тогда оптимальные решения удовлетворяют Уравнение беллмана
куда и - соответственно плотности переходов для наблюдаемых и ненаблюдаемых переменных состояний. Индексы времени в уравнении Беллмана опускаются, потому что модель сформулирована в параметрах бесконечного горизонта, неизвестная оптимальная политика стационарный, т.е. не зависящие от времени.
Учитывая предположение о распределении , вероятность конкретного выбора дан кем-то
куда уникальное решение функциональное уравнение
Можно показать, что последнее функциональное уравнение определяет сжатие если пространство состояний ограничено, поэтому будет единственное решение для любого , и далее теорема о неявной функции держит, поэтому также гладкая функция из для каждого .
Оценка с помощью вложенного алгоритма с фиксированной точкой
Отображение сжатия, приведенное выше, может быть решено численно для фиксированной точки что дает вероятности выбора для любого заданного значения . В логарифмическая вероятность функция может быть сформулирована как
куда и представляют данные о переменных состояния (показания одометра) и решения (оставить или заменить) для отдельные автобусы, каждый в периоды.
Совместный алгоритм решения задачи о неподвижной точке при заданном значении параметра и максимизируя логарифмическую вероятность относительно был назван Джоном Растом вложенный алгоритм с фиксированной точкой (NFXP).
Реализация вложенного алгоритма с фиксированной точкой в Rust оптимизирована для решения этой проблемы с использованием Итерации Ньютона – Канторовича. вычислять и квазиньютоновские методы, такой как Алгоритм Берндта – Холла – Холла – Хаусмана, для максимизации правдоподобия.[5]
Оценка с MPEC
Во вложенном алгоритме с фиксированной точкой пересчитывается для каждого предположения параметров θ. Вместо этого метод MPEC решает ограниченная оптимизация проблема:[4]
Этот метод быстрее вычисляется, чем неоптимизированные реализации вложенного алгоритма с фиксированной точкой, и занимает примерно столько же времени, сколько и высокооптимизированные реализации.[5]
Оценка методами без решения
В этом случае можно применить метод вероятностей условного выбора Хотца и Миллера. Хотц, Миллер, Сандерс и Смит предложили более простую в вычислительном отношении версию метода и протестировали ее при изучении проблемы замены двигателя автобуса. Метод работает путем оценки вероятностей условного выбора с использованием симуляция, затем опровергая подразумеваемые различия в функции значения.[7][8]
Смотрите также
Рекомендации
- ^ Кин и Вулпин 2009.
- ^ Ржавчина 1987.
- ^ Ржавчина, Джон (2008). «Руководство по документации вложенного алгоритма фиксированной точки». Не опубликовано.
- ^ а б c Су, Че-Линь; Джадд, Кеннет Л. (2012). "Подходы с ограниченной оптимизацией к оценке структурных моделей". Econometrica. 80 (5): 2213–2230. Дои:10.3982 / ECTA7925. HDL:10419/59626. ISSN 1468-0262.
- ^ а б c d Исхаков, Федор; Ли, Джинхёк; Ржавчина, Джон; Шернинг, Бертель; Со, Кёнвон (2016). «Прокомментируйте» подходы условной оптимизации к оценке структурных моделей"". Econometrica. 84 (1): 365–370. Дои:10.3982 / ECTA12605. ISSN 0012-9682.
- ^ Хотц, В. Джозеф; Миллер, Роберт А. (1993). «Вероятности условного выбора и оценка динамических моделей». Обзор экономических исследований. 60 (3): 497–529. Дои:10.2307/2298122. JSTOR 2298122.
- ^ Агиррегабирия и Мира 2010.
- ^ Хотц, В. Дж .; Miller, R.A .; Sanders, S .; Смит, Дж. (1994-04-01). "Оценщик моделирования для динамических моделей дискретного выбора". Обзор экономических исследований. Издательство Оксфордского университета (ОУП). 61 (2): 265–289. Дои:10.2307/2297981. ISSN 0034-6527. JSTOR 2297981. S2CID 55199895.
дальнейшее чтение
- Агиррегабирия, Виктор; Мира, Педро (2010). «Структурные модели динамического дискретного выбора: обзор» (PDF). Журнал эконометрики. Elsevier BV. 156 (1): 38–67. Дои:10.1016 / j.jeconom.2009.09.007. ISSN 0304-4076.CS1 maint: ref = harv (связь)
- Кин, Майкл П.; Вулпин, Кеннет И. (2009). «Эмпирические приложения моделей динамического программирования с дискретным выбором». Обзор экономической динамики. 12 (1): 1–22. Дои:10.1016 / j.red.2008.07.001.CS1 maint: ref = harv (связь)
- Ржавчина, Джон (1987). "Оптимальная замена двигателей автобусов GMC: эмпирическая модель Гарольда Цурчера". Econometrica. 55 (5): 999–1033. Дои:10.2307/1911259. ISSN 0012-9682. JSTOR 1911259.CS1 maint: ref = harv (связь)
- Ржавчина, Джон (1994). «Глава 51 Структурная оценка марковских процессов принятия решений». Справочник по эконометрике. 4. Эльзевир. С. 3081–3143. Дои:10.1016 / с1573-4412 (05) 80020-0. ISBN 978-0-444-88766-5. ISSN 1573-4412.