WikiDer > Неравенство Дворецкого – Кифера – Вулфовица.

Dvoretzky–Kiefer–Wolfowitz inequality

На приведенной выше диаграмме показан пример применения неравенства DKW при построении доверительных границ (фиолетовым цветом) вокруг эмпирической функции распределения (голубым цветом). В этом случайном розыгрыше истинный CDF (оранжевый) полностью содержится в границах DKW.

В теории вероятность и статистика, то Неравенство Дворецкого – Кифера – Вулфовица. границы, насколько близко эмпирически определенная функция распределения будет к функция распределения из которых взяты эмпирические образцы. Он назван в честь Арье Дворецки, Джек Кифер, и Джейкоб Вулфовиц, который в 1956 г. доказал неравенство с неопределенной мультипликативной постояннойC перед экспонентой в правой части.^[1] В 1990 г. Паскаль Массарт доказал неравенство с точной постоянной C = 2,^[2] подтверждая предположение из-за Бирнбаум и Маккарти.^[3]

Неравенство DKW

Учитывая натуральное число п, позволять Икс₁, Икс₂, …, Икс_п иметь реальную ценность независимые и одинаково распределенные случайные переменные с кумулятивная функция распределения F(·). Позволять F_п обозначим связанный эмпирическая функция распределения определяется

{displaystyle F_ {n} (x) = {frac {1} {n}} sum _ {i = 1} ^ {n} mathbf {1} _ {{X_ {i} leq x}}, qquad xin mathbb { Р} .}

Так ${displaystyle F (x)}$ это вероятность который Один случайная переменная ${displaystyle X}$ меньше чем ${displaystyle x}$ , и ${displaystyle F_ {n} (x)}$ это дробная часть случайных величин, меньших, чем ${displaystyle x}$ .

Неравенство Дворецкого – Кифера – Вулфовица ограничивает вероятность того, что случайная функция F_п отличается от F более чем на заданную константу ε > 0 в любом месте реальной строки. Точнее, есть односторонняя оценка

{displaystyle Pr {Bigl (} sup _ {xin mathbb {R}} {igl (} F_ {n} (x) -F (x) {igr)}> varepsilon {Bigr)} leq e ^ {- 2nvarepsilon ^ { 2}} qquad {ext {для каждого}} varepsilon geq {sqrt {{frac {1} {2n}} ln 2}},}

откуда также следует двусторонняя оценка^[4]

{displaystyle Pr {Bigl (} sup _ {xin mathbb {R}} | F_ {n} (x) -F (x) |> varepsilon {Bigr)} leq 2e ^ {- 2nvarepsilon ^ {2}} qquad {ext {для каждого}} варепсилон> 0.}

Это усиливает Теорема Гливенко – Кантелли. путем количественной оценки скорость сходимости в качестве п стремится к бесконечности. Он также оценивает хвостовую вероятность Статистика Колмогорова – Смирнова. Приведенные выше неравенства следуют из случая, когда F соответствует быть равномерное распределение на [0,1] ввиду того, что^[5]который F_п имеет те же распределения, что и грамм_п(F) куда грамм_п это эмпирическое распределениеU₁, U₂, …, U_п где они независимы и однородны (0,1), и учитывая, что

{displaystyle sup _ {xin mathbb {R}} | F_ {n} (x) -F (x) |; {stackrel {d} {=}}; sup _ {xin mathbb {R}} | G_ {n} (F (x)) - F (x) | leq sup _ {0leq tleq 1} | G_ {n} (t) -t |,}

с равенством тогда и только тогда, когда F непрерывно.

Создание групп CDF

Неравенство Дворецкого – Кифера – Вольфовица - это один из методов построения доверительных границ на основе CDF и получения группа уверенности. Цель этого доверительного интервала состоит в том, чтобы содержать всю CDF на заданном уровне достоверности, в то время как альтернативные подходы пытаются достичь уровня достоверности только в каждой отдельной точке, который может позволить более жесткие границы. Границы DKW параллельны эмпирическому CDF и равны выше и ниже него. Равномерно распределенный доверительный интервал вокруг эмпирического CDF допускает разную частоту нарушений в рамках поддержки распределения. В частности, CDF чаще оказывается за пределами границы CDF, оцененной с использованием неравенства DKW около медианы распределения, чем около конечных точек распределения.

Интервал, содержащий истинный CDF, ${displaystyle F (x)}$ , с вероятностью ${displaystyle 1-alpha}$ часто указывается как

{displaystyle F_ {n} (x) -varepsilon leq F (x) leq F_ {n} (x) + varepsilon; {ext {where}} varepsilon = {sqrt {frac {ln {frac {2} {alpha}}) } {2n}}}.}

Смотрите также

Неравенство концентраций - сводка оценок наборов случайных величин.

Navigation

Navigation

Themenportale

WikiDer > Неравенство Дворецкого – Кифера – Вулфовица.

Содержание

Неравенство DKW

Создание групп CDF

Смотрите также

Рекомендации