WikiDer > Теория обновления

Renewal theory

Теория обновления это филиал теория вероятности это обобщает Пуассоновский процесс для произвольного времени выдержки. Вместо экспоненциально распределенный время ожидания, процесс продления может иметь любые независимые и одинаково распределенные (IID) времена выдержки с конечным средним значением. Процесс возобновления-вознаграждения дополнительно имеет случайную последовательность вознаграждений, полученных в каждый момент удержания, которые являются IID, но не обязательно должны быть независимыми от времени удержания.

Процесс восстановления обладает асимптотическими свойствами, аналогичными процессу восстановления. сильный закон больших чисел и Центральная предельная теорема. Функция обновления (ожидаемое количество прибывших) и функция вознаграждения (ожидаемая величина вознаграждения) имеют ключевое значение в теории обновления. Функция восстановления удовлетворяет рекурсивному интегральному уравнению, уравнению восстановления. Ключевое уравнение восстановления дает предельное значение свертка из с подходящей неотрицательной функцией. Суперпозицию процессов восстановления можно изучать как частный случай Марковские процессы обновления.

Приложения включают расчет наилучшей стратегии замены изношенного оборудования на заводе и сравнение долгосрочных преимуществ различных страховых полисов. Парадокс проверки связан с тем, что соблюдение интервала обновления во времени т дает интервал со средним значением, превышающим средний интервал обновления.

Процессы продления

Вступление

В процесс обновления является обобщением Пуассоновский процесс. По сути, процесс Пуассона - это марковский процесс с непрерывным временем на положительных целых числах (обычно начинающихся с нуля), которые имеют независимые экспоненциально распределенный время выдержки при каждом целом числе перед переходом к следующему целому числу, . В процессе обновления время ожидания не обязательно должно иметь экспоненциальное распределение; скорее, времена удержания могут иметь любое распределение по положительным числам, при условии, что времена удержания независимы и одинаково распределены (IID) и имеют конечное среднее.

Формальное определение

Пример эволюции процесса обновления с время выдержки Sя и время прыжка Jп.

Позволять последовательность положительных независимые одинаково распределенные случайные переменные такой, что

Мы говорим о случайной величине как "-я выдержка ».

это ожидание из .

Определите для каждого п > 0 :

каждый называется "время прыжка »и интервалы называются «интервалами обновления».

потом задается случайной величиной

куда это индикаторная функция

представляет количество прыжков, которые произошли за время т, и называется процессом обновления.

Интерпретация

Если рассматривать события, происходящие в случайное время, можно подумать о временах выдержки. как случайное время, прошедшее между двумя последовательными событиями. Например, если в процессе обновления моделируется количество поломок разных машин, то время выдержки представляет собой время между выходом из строя одной машины и выходом из строя другой.

Пуассоновский процесс - это уникальный процесс обновления с Марковская собственность,[1] поскольку экспоненциальное распределение является уникальной непрерывной случайной величиной со свойством без памяти.

Процессы возобновления и вознаграждения

Пример эволюции процесса вознаграждения за продление с время выдержки Sя, время прыжка Jп и награды Wя

Позволять быть последовательностью IID случайные переменные (награды) удовлетворение

Тогда случайная величина

называется процесс возобновления вознаграждения. Обратите внимание, что в отличие от , каждый может принимать как отрицательные, так и положительные значения.

Случайная величина зависит от двух последовательностей: времени выдержки и награды Эти две последовательности не обязательно должны быть независимыми. Особенно, может быть функцией .

Интерпретация

В контексте вышеупомянутой интерпретации времени ожидания как времени между последовательными сбоями в работе машины "вознаграждения" (которые в данном случае оказываются отрицательными) можно рассматривать как последующие затраты на ремонт, понесенные в результате последовательных неисправностей.

Альтернативная аналогия заключается в том, что у нас есть волшебный гусь, который откладывает яйца с интервалами (временем выдержки), распределенными как . Иногда он откладывает золотые яйца произвольного веса, а иногда - ядовитые яйца (также произвольного веса), которые требуют ответственной (и дорогостоящей) утилизации. "Награды" - последовательные (случайные) финансовые потери / прибыли в результате последовательных яиц (я = 1,2,3, ...) и записывает общую финансовую "награду" т.

Функция продления

Мы определяем функция обновления как ожидаемое значение количества скачков, наблюдаемых до некоторого времени :

Элементарная теорема восстановления

Функция восстановления удовлетворяет

Элементарная теорема восстановления для процессов вознаграждения за обновление

Мы определяем функция вознаграждения:

Функция вознаграждения удовлетворяет

Уравнение обновления

Функция восстановления удовлетворяет

куда - кумулятивная функция распределения и - соответствующая функция плотности вероятности.

Ключевая теорема восстановления

Позволять Икс быть процессом обновления с функцией обновления и среднее обновление . Позволять быть функцией, удовлетворяющей:

  • грамм монотонный и невозрастающий

Ключевая теорема восстановления утверждает, что, поскольку :[3]

Теорема возобновления

Учитывая для любого дает как частный случай теорему восстановления:[4]

в качестве

Результат может быть доказан с помощью интегральных уравнений или связь аргумент.[5] Хотя это частный случай ключевой теоремы о восстановлении, ее можно использовать для вывода полной теоремы, рассматривая ступенчатые функции и затем увеличивая последовательности ступенчатых функций.[3]

Асимптотические свойства

Процессы обновления и процессы вознаграждения за обновление обладают свойствами, аналогичными свойствам сильный закон больших чисел, которое можно получить из той же теоремы. Если это процесс обновления и это процесс вознаграждения за продление, то:

[6]

почти наверняка.

Процессы продления дополнительно обладают свойством, аналогичным Центральная предельная теорема:[6]

Парадокс осмотра

Интервал обновления определяется случайной точкой т (показан красным) стохастически больше, чем первый интервал обновления.

Любопытная особенность процессов обновления состоит в том, что если мы подождем некоторое заранее определенное время т а затем посмотрите, насколько велик интервал обновления, содержащий т есть, мы должны ожидать, что он обычно будет больше, чем интервал обновления среднего размера.

Математически парадокс проверки гласит: для любого t> 0 интервал обновления, содержащий t, равен стохастически больше чем первый интервал обновления. То есть для всех Икс > 0 и для всех т > 0:

куда FS - кумулятивная функция распределения времен удержания IID Sя.

Разрешение парадокса состоит в том, что наше выборочное распределение во времени т смещен по размеру, поскольку вероятность выбора интервала пропорциональна его размеру. Однако средний интервал обновления не зависит от размера.

Суперпозиция

Если процесс обновления не является пуассоновским, суперпозиция (сумма) двух независимых процессов обновления не является процессом обновления.[7] Однако такие процессы можно описать в рамках более широкого класса процессов, называемых Марковско-восстановительные процессы.[8] Тем не менее кумулятивная функция распределения первого межсобытийного времени в процессе суперпозиции определяется выражением[9]

куда рk(т) и αk > 0 - это функция распределения времени между событиями и скорость поступления процесса. k.[10]

Пример приложения

Эрик предприниматель п машины, срок эксплуатации каждой из которых равномерно распределен от нуля до двух лет. Эрик может позволить каждой машине поработать до тех пор, пока она не выйдет из строя, при стоимости замены 2600 евро; в качестве альтернативы он может заменить машину в любое время, пока она еще функционирует, по цене 200 евро.

Какова его оптимальная политика замены?

Смотрите также

Примечания

  1. ^ Гриммет и Стирзакер (1992), п. 393.
  2. ^ Гриммет и Стирзакер (1992), п. 390.
  3. ^ а б c Гриммет и Стирзакер (1992), п. 395.
  4. ^ Феллер (1971), п. 347–351.
  5. ^ Гриммет и Стирзакер (1992), п. 394–5.
  6. ^ а б Гриммет и Стирзакер (1992), п. 394.
  7. ^ Гриммет и Стирзакер (1992), п. 405.
  8. ^ Чинлар, Эрхан (1969). «Теория марковского восстановления». Достижения в прикладной теории вероятностей. Доверие прикладной вероятности. 1 (2): 123–187. Дои:10.2307/1426216. JSTOR 1426216.
  9. ^ Лоуренс, А. Дж. (1973). «Зависимость интервалов между событиями в процессах суперпозиции». Журнал Королевского статистического общества. Серия B (Методологическая). 35 (2): 306–315. Дои:10.1111 / j.2517-6161.1973.tb00960.x. JSTOR 2984914. формула 4.1
  10. ^ Чунгмо Фофак, Никайз; Наин, Филипп; Неглия, Джованни; Таусли, Дон. «Анализ сетей кэширования на основе TTL». Труды 6-й Международной конференции по методологиям и инструментам оценки эффективности. Получено 15 ноя, 2012.

Рекомендации