WikiDer > Дисперсия

Variance

Пример выборок из двух популяций с одинаковым средним значением, но с разными дисперсиями. Красная совокупность имеет среднее значение 100 и дисперсию 100 (SD = 10), в то время как синяя совокупность имеет среднее значение 100 и дисперсию 2500 (SD = 50).

В теория вероятности и статистика, отклонение это ожидание квадрата отклонение из случайная переменная из его иметь в виду. Неформально он измеряет, насколько набор чисел отличается от их среднего значения. Дисперсия играет центральную роль в статистике, и некоторые идеи, которые ее используют, включают: описательная статистика, статистические выводы, проверка гипотезы, степень соответствия, и Отбор проб Монте-Карло. Дисперсия - важный инструмент в науке, где статистический анализ данных является обычным явлением. Дисперсия - это квадрат стандартное отклонение, второй центральный момент из распределение, а ковариация случайной величины с самой собой, и она часто представлена ${displaystyle sigma ^ {2}}$ , ${displaystyle s ^ {2}}$ , или же ${displaystyle operatorname {Var} (X)}$ .

Определение

Дисперсия случайной величины ${displaystyle X}$ это ожидаемое значение квадрата отклонения от иметь в виду из ${displaystyle X}$ , ${displaystyle mu = имя оператора {E} [X]}$ :

{displaystyle operatorname {Var} (X) = operatorname {E} left [(X-mu) ^ {2} ight].}

Это определение охватывает случайные величины, которые генерируются процессами, которые дискретный, непрерывный, ни один, или смешанные. Дисперсию также можно рассматривать как ковариацию случайной величины с самой собой:

{displaystyle operatorname {Var} (X) = operatorname {Cov} (X, X).}

Дисперсия также эквивалентна второму кумулянт распределения вероятностей, которое порождает ${displaystyle X}$ . Дисперсия обычно обозначается как ${displaystyle operatorname {Var} (X)}$ , ${displaystyle sigma _ {X} ^ {2}}$ , или просто ${displaystyle sigma ^ {2}}$ (произносится "сигма в квадрате "). Выражение для дисперсии может быть расширено следующим образом:

{displaystyle {egin {выровнено} имя оператора {Var} (X) & = имя оператора {E} left [(X-operatorname {E} [X]) ^ {2} ight] [4pt] & = имя оператора {E} слева [X ^ {2} -2Xoperatorname {E} [X] + operatorname {E} [X] ^ {2} ight] [4pt] & = operatorname {E} left [X ^ {2} ight] -2operatorname { E} [X] имя оператора {E} [X] + имя оператора {E} [X] ^ {2} [4pt] & = имя оператора {E} left [X ^ {2} ight] -имя оператора {E} [X ] ^ {2} конец {выровнено}}}

Другими словами, дисперсия $Икс$ равно среднему квадрату $Икс$ минус квадрат среднего $Икс$ . Это уравнение не следует использовать для вычислений с использованием арифметика с плавающей запятой, потому что он страдает от катастрофическая отмена если два компонента уравнения схожи по величине. Для других численно стабильных альтернатив см. Алгоритмы расчета дисперсии.

Дискретная случайная величина

Если генератор случайной величины ${displaystyle X}$ является дискретный с функция массы вероятности ${displaystyle x_ {1} mapsto p_ {1}, x_ {2} mapsto p_ {2}, ldots, x_ {n} mapsto p_ {n}}$ , тогда

{displaystyle operatorname {Var} (X) = sum _ {i = 1} ^ {n} p_ {i} cdot (x_ {i} -mu) ^ {2},}

или эквивалентно,

{displaystyle operatorname {Var} (X) = left (sum _ {i = 1} ^ {n} p_ {i} x_ {i} ^ {2} ight) -mu ^ {2},}

куда ${displaystyle mu}$ ожидаемое значение. То есть,

{displaystyle mu = sum _ {i = 1} ^ {n} p_ {i} x_ {i}.}

(Когда такая дискретная взвешенная дисперсия определяется весами, сумма которых не равна 1, то делится на сумму весов.)

Дисперсия коллекции ${displaystyle n}$ равновероятные значения могут быть записаны как

{displaystyle operatorname {Var} (X) = {frac {1} {n}} sum _ {i = 1} ^ {n} (x_ {i} -mu) ^ {2} = left ({frac {1} {n}} сумма _ {i = 1} ^ {n} x_ {i} ^ {2} ight) -mu ^ {2},}

куда ${displaystyle mu}$ - среднее значение. То есть,

{displaystyle mu = {frac {1} {n}} sum _ {i = 1} ^ {n} x_ {i}.}

Дисперсия набора ${displaystyle n}$ равновероятные значения могут быть эквивалентно выражены без прямой ссылки на среднее значение в виде квадратов отклонений всех точек друг от друга:^[1]

{displaystyle operatorname {Var} (X) = {frac {1} {n ^ {2}}} sum _ {i = 1} ^ {n} sum _ {j = 1} ^ {n} {frac {1} {2}} (x_ {i} -x_ {j}) ^ {2} = {frac {1} {n ^ {2}}} sum _ {i} sum _ {j> i} (x_ {i} -x_ {j}) ^ {2}.}

Абсолютно непрерывная случайная величина

Если случайная величина ${displaystyle X}$ имеет функция плотности вероятности ${displaystyle f (x)}$ , и ${displaystyle F (x)}$ соответствующий кумулятивная функция распределения, тогда

{displaystyle {egin {выровнено} имя оператора {Var} (X) = sigma ^ {2} & = int _ {mathbb {R}} (x-mu) ^ {2} f (x), dx [4pt] & = int _ {mathbb {R}} x ^ {2} f (x), dx-2mu int _ {mathbb {R}} xf (x), dx + mu ^ {2} int _ {mathbb {R}} f (x), dx [4pt] & = int _ {mathbb {R}} x ^ {2}, dF (x) -2mu int _ {mathbb {R}} x, dF (x) + mu ^ { 2} int _ {mathbb {R}}, dF (x) [4pt] & = int _ {mathbb {R}} x ^ {2}, dF (x) -2mu cdot mu + mu ^ {2} cdot 1 [4pt] & = int _ {mathbb {R}} x ^ {2}, dF (x) -mu ^ {2}, конец {выровнен}}}

или эквивалентно,

{displaystyle operatorname {Var} (X) = int _ {mathbb {R}} x ^ {2} f (x), dx-mu ^ {2},}

куда ${displaystyle mu}$ ожидаемое значение ${displaystyle X}$ данный

{displaystyle mu = int _ {mathbb {R}} xf (x), dx = int _ {mathbb {R}} x, dF (x).}

В этих формулах интегралы по ${displaystyle dx}$ и ${displaystyle dF (x)}$ находятся Лебег и Лебег – Стилтьес интегралы соответственно.

Если функция ${displaystyle x ^ {2} f (x)}$ является Интегрируемый по Риману на каждом конечном интервале ${displaystyle [a, b] подмножество mathbb {R},}$ тогда

{displaystyle operatorname {Var} (X) = int _ {- infty} ^ {+ infty} x ^ {2} f (x), dx-mu ^ {2},}

где интеграл - это несобственный интеграл Римана.

Примеры

Экспоненциальное распределение

В экспоненциальное распределение с параметром $λ$ является непрерывным распределением, функция плотности вероятности дан кем-то

{displaystyle f (x) = lambda e ^ {- lambda x}}

на интервале $[0, \infty)$ . Его среднее значение можно показать как

{displaystyle operatorname {E} [X] = int _ {0} ^ {infty} lambda xe ^ {- lambda x}, dx = {frac {1} {lambda}}.}.}

С помощью интеграция по частям и используя уже рассчитанное ожидаемое значение, мы имеем:

{displaystyle {egin {выровнено} имя оператора {E} left [X ^ {2} ight] & = int _ {0} ^ {infty} lambda x ^ {2} e ^ {- lambda x}, dx & = left [-x ^ {2} e ^ {- lambda x} ight] _ {0} ^ {infty} + int _ {0} ^ {infty} 2xe ^ {- lambda x}, dx & = 0+ {frac {2} {лямбда}} имя оператора {E} [X] & = {frac {2} {лямбда ^ {2}}}. Конец {выровнено}}}

Таким образом, дисперсия $Икс$ дан кем-то

{displaystyle operatorname {Var} (X) = operatorname {E} left [X ^ {2} ight] -имя оператора {E} [X] ^ {2} = {frac {2} {lambda ^ {2}}} - left ({frac {1} {lambda}} ight) ^ {2} = {frac {1} {lambda ^ {2}}}.}.

Честная смерть

Ярмарка шестигранный кубик можно моделировать как дискретную случайную величину, $Икс$ с исходами от 1 до 6, каждый с равной вероятностью 1/6. Ожидаемая стоимость $Икс$ является ${displaystyle (1 + 2 + 3 + 4 + 5 + 6) / 6 = 7/2.}$ Следовательно, дисперсия $Икс$ является

{displaystyle {egin {выравнивается} имя оператора {Var} (X) & = sum _ {i = 1} ^ {6} {frac {1} {6}} left (i- {frac {7} {2}} ight ) ^ {2} [5pt] & = {frac {1} {6}} влево ((- 5/2) ^ {2} + (- 3/2) ^ {2} + (- 1/2) ^ {2} + (1/2) ^ {2} + (3/2) ^ {2} + (5/2) ^ {2} ight) [5pt] & = {frac {35} {12} } примерно 2,92. конец {выровнено}}}

Общая формула дисперсии результата, $Икс$ , из $п$ -сторонний умереть это

{displaystyle {egin {выровнено} имя оператора {Var} (X) & = имя оператора {E} left (X ^ {2} ight) - (имя оператора {E} (X)) ^ {2} [5pt] & = { frac {1} {n}} sum _ {i = 1} ^ {n} i ^ {2} -left ({frac {1} {n}} sum _ {i = 1} ^ {n} iight) ^ {2} [5pt] & = {frac {(n + 1) (2n + 1)} {6}} - слева ({frac {n + 1} {2}} ight) ^ {2} [4pt ] & = {гидроразрыв {n ^ {2} -1} {12}}. конец {выровнен}}}

Обычно используемые распределения вероятностей

В следующей таблице перечислены дисперсии для некоторых часто используемых распределений вероятностей.

Название вероятностного распределения	Функция распределения вероятностей	Иметь в виду	Дисперсия
Биномиальное распределение	${displaystyle Pr, (X = k) = {inom {n} {k}} p ^ {k} (1-p) ^ {n-k}}$	${displaystyle np}$	${displaystyle np (1-p)}$
Геометрическое распределение	${displaystyle Pr, (X = k) = (1-p) ^ {k-1} p}$	${displaystyle {frac {1} {p}}}$	${displaystyle {frac {(1-p)} {p ^ {2}}}}$
Нормальное распределение	${displaystyle fleft (xmid mu, sigma ^ {2} ight) = {frac {1} {sqrt {2pi sigma ^ {2}}}} e ^ {- {frac {(x-mu) ^ {2}} { 2сигма ^ {2}}}}}$	${displaystyle mu}$	${displaystyle sigma ^ {2}}$
Равномерное распределение (непрерывное)	${displaystyle f (xmid a, b) = {egin {case} {frac {1} {ba}} & {ext {for}} aleq xleq b, [3pt] 0 & {ext {for}} x изгиб {случаи}}}$	${displaystyle {frac {a + b} {2}}}$	${displaystyle {frac {(b-a) ^ {2}} {12}}}$
Экспоненциальное распределение	${displaystyle f (xmid lambda) = lambda e ^ {- lambda x}}$	${displaystyle {frac {1} {lambda}}}$	${displaystyle {frac {1} {lambda ^ {2}}}}$
распределение Пуассона	${displaystyle f (xmid lambda) = {frac {e ^ {- lambda} lambda ^ {x}} {k!}}}$	${displaystyle lambda}$	${displaystyle lambda}$

Характеристики

Основные свойства

Дисперсия неотрицательна, потому что квадраты положительные или нулевые:

{displaystyle operatorname {Var} (X) geq 0.}

Дисперсия константы равна нулю.

{displaystyle operatorname {Var} (a) = 0.}

И наоборот, если дисперсия случайной величины равна 0, то она равна почти наверняка константа. То есть всегда имеет одно и то же значение:

{displaystyle operatorname {Var} (X) = 0iff существует a: P (X = a) = 1.}

Дисперсия инвариантный относительно изменений в параметр местоположения. То есть, если ко всем значениям переменной добавить константу, дисперсия не изменится:

{displaystyle operatorname {Var} (X + a) = operatorname {Var} (X).}

Если все значения масштабируются константой, дисперсия масштабируется квадратом этой константы:

{displaystyle operatorname {Var} (aX) = a ^ {2} имя оператора {Var} (X).}

Дисперсия суммы двух случайных величин определяется выражением

{displaystyle operatorname {Var} (aX + bY) = a ^ {2} имя оператора {Var} (X) + b ^ {2} имя оператора {Var} (Y) + 2ab, имя оператора {Cov} (X, Y), }

{displaystyle operatorname {Var} (aX-bY) = a ^ {2} имя оператора {Var} (X) + b ^ {2} имя оператора {Var} (Y) -2ab, имя оператора {Cov} (X, Y), }

куда ${displaystyle operatorname {Cov} (X, Y)}$ это ковариация.

В общем, на сумму ${displaystyle N}$ случайные переменные ${displaystyle {X_ {1}, точки, X_ {N}}}$ , дисперсия становится:

{displaystyle operatorname {Var} left (sum _ {i = 1} ^ {N} X_ {i} ight) = sum _ {i, j = 1} ^ {N} operatorname {Cov} (X_ {i}, X_ {j}) = сумма _ {i = 1} ^ {N} имя оператора {Var} (X_ {i}) + сумма _ {ieq j} имя оператора {Cov} (X_ {i}, X_ {j}).}

Эти результаты приводят к дисперсии линейная комбинация в качестве:

{displaystyle {egin {align} operatorname {Var} left (sum _ {i = 1} ^ {N} a_ {i} X_ {i} ight) & = sum _ {i, j = 1} ^ {N} a_ {i} a_ {j} имя оператора {Cov} (X_ {i}, X_ {j}) & = sum _ {i = 1} ^ {N} a_ {i} ^ {2} имя оператора {Var} (X_ {i}) + sum _ {iot = j} a_ {i} a_ {j} имя оператора {Cov} (X_ {i}, X_ {j}) & = sum _ {i = 1} ^ {N} a_ {i} ^ {2} имя оператора {Var} (X_ {i}) + 2sum _ {1leq i

Если случайные величины ${displaystyle X_ {1}, точки, X_ {N}}$ такие, что

{displaystyle operatorname {Cov} (X_ {i}, X_ {j}) = 0, forall (ieq j),}

тогда их называют некоррелированный. Из приведенного ранее выражения сразу следует, что если случайные величины ${displaystyle X_ {1}, точки, X_ {N}}$ некоррелированы, то дисперсия их суммы равна сумме их дисперсий, или, выражаясь символически:

{displaystyle operatorname {Var} left (sum _ {i = 1} ^ {N} X_ {i} ight) = sum _ {i = 1} ^ {N} operatorname {Var} (X_ {i}).}

Поскольку независимые случайные величины всегда некоррелированы (см. Ковариация § Некоррелированность и независимость), приведенное выше уравнение выполняется, в частности, когда случайные величины ${displaystyle X_ {1}, точки, X_ {n}}$ независимы. Таким образом, независимость достаточна, но не обязательна, чтобы дисперсия суммы равнялась сумме дисперсий.

Проблемы конечности

Если распределение не имеет конечного ожидаемого значения, как в случае Распределение Коши, то и дисперсия не может быть конечной. Однако некоторые распределения могут не иметь конечной дисперсии, несмотря на конечное ожидаемое значение. Примером является Распределение Парето чей индекс ${displaystyle k}$ удовлетворяет ${displaystyle 1$

Сумма некоррелированных переменных (формула Биенайме)

Одна из причин использования дисперсии вместо других мер дисперсии заключается в том, что дисперсия суммы (или разницы) некоррелированный случайные величины - это сумма их дисперсий:

{displaystyle operatorname {Var} left (sum _ {i = 1} ^ {n} X_ {i} ight) = sum _ {i = 1} ^ {n} operatorname {Var} (X_ {i}).}

Это утверждение называется Bienaymé формула^[2] и был открыт в 1853 году.^[3]^[4] Часто делается с более сильным условием, что переменные независимый, но быть некоррелированным достаточно. Итак, если все переменные имеют одинаковую дисперсию σ², то, поскольку деление на п является линейным преобразованием, из этой формулы сразу следует, что дисперсия их среднего равна

{displaystyle operatorname {Var} left ({overline {X}} ight) = operatorname {Var} left ({frac {1} {n}} sum _ {i = 1} ^ {n} X_ {i} ight) = {frac {1} {n ^ {2}}} sum _ {i = 1} ^ {n} имя оператора {Var} left (X_ {i} ight) = {frac {1} {n ^ {2}}} nsigma ^ {2} = {frac {sigma ^ {2}} {n}}.}

То есть дисперсия среднего уменьшается, когда п увеличивается. Эта формула дисперсии среднего используется при определении стандартная ошибка выборочного среднего, которое используется в Центральная предельная теорема.

Чтобы доказать исходное утверждение, достаточно показать, что

{displaystyle operatorname {Var} (X + Y) = operatorname {Var} (X) + operatorname {Var} (Y).}

Общий результат следует тогда по индукции. Начиная с определения,

{displaystyle {egin {выровнено} имя оператора {Var} (X + Y) & = имя оператора {E} left [(X + Y) ^ {2} ight] - (имя оператора {E} [X + Y]) ^ {2 } [5pt] & = имя оператора {E} left [X ^ {2} + 2XY + Y ^ {2} ight] - (имя оператора {E} [X] + имя оператора {E} [Y]) ^ {2} .end {выровнено}}}

Используя линейность оператор ожидания и предположение о независимости (или некоррелированности) Икс и Y, это дополнительно упрощается следующим образом:

{displaystyle {egin {выровнено} имя оператора {Var} (X + Y) & = имя оператора {E} слева [X ^ {2} ight] + 2 имя оператора {E} [XY] + имя оператора {E} слева [Y ^ {2 } ight] -левый (имя оператора {E} [X] ^ {2} + 2 имя оператора {E} [X] имя оператора {E} [Y] + имя оператора {E} [Y] ^ {2} полет) [5pt] & = имя оператора {E} left [X ^ {2} ight] + имя оператора {E} left [Y ^ {2} ight] -имя оператора {E} [X] ^ {2} -имя оператора {E} [Y] ^ {2} [5pt] & = имя оператора {Var} (X) + имя оператора {Var} (Y) .end {выровнено}}}

Сумма коррелированных переменных

С корреляцией и фиксированным размером выборки

В общем, дисперсия суммы $п$ переменных - это сумма их ковариации:

{displaystyle operatorname {Var} left (sum _ {i = 1} ^ {n} X_ {i} ight) = sum _ {i = 1} ^ {n} sum _ {j = 1} ^ {n} operatorname { Cov} left (X_ {i}, X_ {j} ight) = sum _ {i = 1} ^ {n} operatorname {Var} left (X_ {i} ight) + 2sum _ {1leq i

(Примечание: второе равенство вытекает из того факта, что $Cov (Икс я, Икс я) = Вар (Икс я)$ .)

Здесь, $Cov (\cdot, \cdot)$ это ковариация, который равен нулю для независимых случайных величин (если он существует). Формула утверждает, что дисперсия суммы равна сумме всех элементов в ковариационной матрице компонентов. Следующее выражение эквивалентно утверждает, что дисперсия суммы - это сумма диагонали ковариационной матрицы плюс двойная сумма ее верхних треугольных элементов (или ее нижних треугольных элементов); это подчеркивает, что ковариационная матрица симметрична. Эта формула используется в теории Альфа Кронбаха в классическая теория тестирования.

Итак, если переменные имеют одинаковую дисперсию σ² и средний корреляция различных переменных ρ, то дисперсия их среднего равна

{displaystyle operatorname {Var} left ({overline {X}} ight) = {frac {sigma ^ {2}} {n}} + {frac {n-1} {n}} ho sigma ^ {2}.}

Это означает, что дисперсия среднего увеличивается с увеличением среднего значения корреляций. Другими словами, дополнительные коррелированные наблюдения не так эффективны, как дополнительные независимые наблюдения, для уменьшения неопределенность среднего. Более того, если переменные имеют единичную дисперсию, например, если они стандартизированы, то это упрощается до

{displaystyle operatorname {Var} left ({overline {X}} ight) = {frac {1} {n}} + {frac {n-1} {n}} ho.}

Эта формула используется в Формула предсказания Спирмена – Брауна классической теории тестирования. Это сходится к ρ если п стремится к бесконечности при условии, что средняя корреляция остается постоянной или также сходится. Итак, для дисперсии среднего значения стандартизованных переменных с равной корреляцией или сходящейся средней корреляцией мы имеем

{displaystyle lim _ {n o infty} имя оператора {Var} left ({overline {X}} ight) = ho.}

Следовательно, дисперсия среднего значения большого числа стандартизованных переменных приблизительно равна их средней корреляции. Это проясняет, что выборочное среднее коррелированных переменных обычно не сходится со средним генеральным, даже если закон больших чисел заявляет, что выборочное среднее будет сходиться для независимых переменных.

I.i.d. со случайным размером выборки

Бывают случаи, когда образец берут, не зная заранее, сколько наблюдений будет приемлемым по тому или иному критерию. В таких случаях размер выборки N случайная величина, вариация которой добавляет к вариации Икс, такое что,

Вар (∑Икс) = E (N) Вар (Икс) + Var (N) E²(Икс).^[5]

Если N имеет распределение Пуассона, то E (N) = Вар (N) с оценщиком N = п. Итак, оценка Var (∑Икс) становится нс²_Икс + пИкс² давая

стандартная ошибка(Икс) = √[(S²_Икс + Икс²)/п].

Матричная запись дисперсии линейной комбинации

Определять ${displaystyle X}$ как вектор-столбец ${displaystyle n}$ случайные переменные ${displaystyle X_ {1}, ldots, X_ {n}}$ , и ${displaystyle c}$ как вектор-столбец ${displaystyle n}$ скаляры ${displaystyle c_ {1}, ldots, c_ {n}}$ . Следовательно, ${displaystyle c ^ {mathsf {T}} X}$ это линейная комбинация этих случайных величин, где ${displaystyle c ^ {mathsf {T}}}$ обозначает транспонировать из ${displaystyle c}$ . Также позвольте ${displaystyle Sigma}$ быть ковариационная матрица из ${displaystyle X}$ . Дисперсия ${displaystyle c ^ {mathsf {T}} X}$ тогда дается:^[6]

{displaystyle operatorname {Var} left (c ^ {mathsf {T}} Xight) = c ^ {mathsf {T}} Sigma c.}

Это означает, что дисперсия среднего может быть записана как (с вектором-столбцом из единиц)

{displaystyle operatorname {Var} left ({ar {x}} ight) = operatorname {Var} left ({frac {1} {n}} 1'Xight) = {frac {1} {n ^ {2}}} 1'Sigma 1.}

Взвешенная сумма переменных

Свойство масштабирования и формула Биенайме, а также свойство ковариация $Cov (aX, к) = ab Cov (Икс, Y)$ вместе подразумевают, что

{displaystyle operatorname {Var} (aXpm bY) = a ^ {2} operatorname {Var} (X) + b ^ {2} operatorname {Var} (Y) pm 2ab, operatorname {Cov} (X, Y).}

Это означает, что во взвешенной сумме переменных переменная с наибольшим весом будет иметь непропорционально большой вес в дисперсии итога. Например, если Икс и Y не коррелированы, а вес Икс в два раза больше веса Y, то вес дисперсии Икс будет в четыре раза больше дисперсии Y.

Выражение выше может быть расширено до взвешенной суммы нескольких переменных:

{displaystyle operatorname {Var} left (sum _ {i} ^ {n} a_ {i} X_ {i} ight) = sum _ {i = 1} ^ {n} a_ {i} ^ {2} operatorname {Var } (X_ {i}) + 2sum _ {1leq i} sum _ {

Произведение независимых переменных

Если две переменные X и Y равны независимый, дисперсия их продукта определяется выражением^[7]

{displaystyle operatorname {Var} (XY) = [operatorname {E} (X)] ^ {2} operatorname {Var} (Y) + [operatorname {E} (Y)] ^ {2} operatorname {Var} (X ) + имя оператора {Var} (X) имя оператора {Var} (Y).}

Эквивалентно, используя основные свойства ожидания, он задается

{displaystyle operatorname {Var} (XY) = OperatorName {E} left (X ^ {2} ight) имя оператора {E} left (Y ^ {2} ight) - [Operatorame {E} (X)] ^ {2} [имя оператора {E} (Y)] ^ {2}.}

Произведение статистически зависимых переменных

В общем, если две переменные статистически зависимы, дисперсия их продукта определяется следующим образом:

{displaystyle {egin {выровнено} имя оператора {Var} (XY) = {} & имя оператора {E} left [X ^ {2} Y ^ {2} ight] - [имя оператора {E} (XY)] ^ {2} [5pt] = {} & имя оператора {Cov} слева (X ^ {2}, Y ^ {2} ight) + имя оператора {E} (X ^ {2}) имя оператора {E} слева (Y ^ {2} ight) - [имя оператора {E} (XY)] ^ {2} [5pt] = {} & имя оператора {Cov} left (X ^ {2}, Y ^ {2} ight) + left (имя оператора {Var} (X) + [имя оператора {E} (X)] ^ {2} ight) влево (имя оператора {Var} (Y) + [имя оператора {E} (Y)] ^ {2} право) [5pt] & - [имя оператора { Cov} (X, Y) + имя оператора {E} (X) имя оператора {E} (Y)] ^ {2} конец {выровнено}}}

Разложение

Общая формула для разложения дисперсии или закон полной дисперсии это: Если ${displaystyle X}$ и ${displaystyle Y}$ две случайные величины, а дисперсия ${displaystyle X}$ существует, тогда

{displaystyle имя оператора {Var} [X] = имя оператора {E} (имя оператора {Var} [Xmid Y]) + имя оператора {Var} (имя оператора {E} [Xmid Y]).}

В условное ожидание ${displaystyle operatorname {E} (Xmid Y)}$ из ${displaystyle X}$ данный ${displaystyle Y}$ , а условная дисперсия ${displaystyle operatorname {Var} (Xmid Y)}$ можно понимать следующим образом. Учитывая любую конкретную ценность у случайной величиныY, есть условное ожидание ${displaystyle operatorname {E} (Xmid Y = y)}$ учитывая событиеY = у. Это количество зависит от конкретного значенияу; это функция ${displaystyle g (y) = имя оператора {E} (Xmid Y = y)}$ . Та же самая функция оценивается по случайной величине Y это условное ожидание ${displaystyle operatorname {E} (Xmid Y) = g (Y).}$

В частности, если ${displaystyle Y}$ дискретная случайная величина, принимающая возможные значения ${displaystyle y_ {1}, y_ {2}, y_ {3} ldots}$ с соответствующими вероятностями ${displaystyle p_ {1}, p_ {2}, p_ {3} ldots,}$ , то в формуле для полной дисперсии первый член в правой части принимает вид

{displaystyle operatorname {E} (operatorname {Var} [Xmid Y]) = сумма _ {i} p_ {i} sigma _ {i} ^ {2},}

куда ${displaystyle sigma _ {i} ^ {2} = имя оператора {Var} [Xmid Y = y_ {i}]}$ . Точно так же второй член в правой части становится

{displaystyle operatorname {Var} (operatorname {E} [Xmid Y]) = сумма _ {i} p_ {i} mu _ {i} ^ {2} -left (sum _ {i} p_ {i} mu _ { i} ight) ^ {2} = sum _ {i} p_ {i} mu _ {i} ^ {2} -mu ^ {2},}

куда ${displaystyle mu _ {i} = имя оператора {E} [Xmid Y = y_ {i}]}$ и ${displaystyle mu = sum _ {i} p_ {i} mu _ {i}}$ . Таким образом, общая дисперсия определяется как

{displaystyle operatorname {Var} [X] = sum _ {i} p_ {i} sigma _ {i} ^ {2} + left (sum _ {i} p_ {i} mu _ {i} ^ {2} - mu ^ {2} ight).}

Аналогичная формула применяется в дисперсионный анализ, где соответствующая формула

{displaystyle {mathit {MS}} _ {ext {total}} = {mathit {MS}} _ {ext {between}} + {mathit {MS}} _ {ext {within}};}

здесь ${displaystyle {mathit {MS}}}$ относится к среднему квадрату. В линейная регрессия анализа соответствующая формула

{displaystyle {mathit {MS}} _ {ext {total}} = {mathit {MS}} _ {ext {regression}} + {mathit {MS}} _ {ext {остаток}}.}

Это также может быть получено из аддитивности дисперсии, поскольку общая (наблюдаемая) оценка представляет собой сумму прогнозируемой оценки и оценки ошибки, где последние два не коррелируют.

Подобные разложения возможны для суммы квадратов отклонений (сумма квадратов, ${displaystyle {mathit {SS}}}$ ):

{displaystyle {mathit {SS}} _ {ext {total}} = {mathit {SS}} _ {ext {between}} + {mathit {SS}} _ {ext {within}},}

{displaystyle {mathit {SS}} _ {ext {total}} = {mathit {SS}} _ {ext {regression}} + {mathit {SS}} _ {ext {остаток}}.}

Расчет из CDF

Дисперсия генеральной совокупности для неотрицательной случайной величины может быть выражена через кумулятивная функция распределения F с помощью

{displaystyle 2int _ {0} ^ {infty} u (1-F (u)), du-left (int _ {0} ^ {infty} (1-F (u)), duight) ^ {2}. }

Это выражение можно использовать для вычисления дисперсии в ситуациях, когда CDF, но не плотность, можно удобно выразить.

Характеристика собственности

Второй момент случайной величины достигает минимального значения, когда берется примерно в первый момент (т.е. среднее значение) случайной величины, т. е. ${displaystyle mathrm {argmin} _ {m}, mathrm {E} left (left (X-might) ^ {2} ight) = mathrm {E} (X)}$ . Наоборот, если непрерывная функция ${displaystyle varphi}$ удовлетворяет ${displaystyle mathrm {argmin} _ {m}, mathrm {E} (varphi (X-m)) = mathrm {E} (X)}$ для всех случайных величин Икс, то он обязательно имеет вид ${displaystyle varphi (x) = ax ^ {2} + b}$ , куда а > 0. То же верно и в многомерном случае.^[8]

Меры измерения

В отличие от ожидаемого абсолютного отклонения, дисперсия переменной имеет единицы измерения, которые являются квадратом единиц самой переменной. Например, переменная, измеряемая в метрах, будет иметь отклонение в метрах в квадрате. По этой причине описание наборов данных через их стандартное отклонение или же среднеквадратичное отклонение часто предпочтительнее использования дисперсии. В примере с игральными костями стандартное отклонение равно $\sqrt 2.9 \approx 1.7$ , немного больше ожидаемого абсолютного отклонения 1,5.

Стандартное отклонение и ожидаемое абсолютное отклонение могут использоваться как индикатор «разброса» распределения. Стандартное отклонение более поддается алгебраическим манипуляциям, чем ожидаемое абсолютное отклонение, и вместе с дисперсией и ее обобщением ковариация, часто используется в теоретической статистике; однако ожидаемое абсолютное отклонение обычно больше крепкий поскольку он менее чувствителен к выбросы вытекающие из аномалии измерений или неоправданно распределение с тяжелым хвостом.

Аппроксимация дисперсии функции

В дельта-метод использует второй порядок Разложения Тейлора для аппроксимации дисперсии функции одной или нескольких случайных величин: см. Разложения Тейлора для моментов функций случайных величин. Например, приблизительная дисперсия функции одной переменной определяется выражением

{displaystyle operatorname {Var} left [f (X) ight] примерно слева (f '(operatorname {E} left [Xight]) ight) ^ {2} operatorname {Var} left [Xight]}

при условии, что ж дважды дифференцируема и что среднее и дисперсия Икс конечны.

Дисперсия населения и дисперсия выборки

Реальные наблюдения, такие как измерения вчерашнего дождя в течение дня, обычно не могут быть полным набором всех возможных наблюдений, которые можно было бы сделать. Таким образом, дисперсия, вычисленная из конечного набора, в общем случае не будет соответствовать дисперсии, которая была бы рассчитана из полной совокупности возможных наблюдений. Это означает, что один оценки среднее значение и дисперсия, которые были бы рассчитаны на основе всеведущего набора наблюдений с использованием оценщик уравнение. Оценка является функцией образец из п наблюдения взяты без предвзятости наблюдений из всего численность населения потенциальных наблюдений. В этом примере этот образец будет набором фактических измерений вчерашних осадков с помощью доступных дождемеров в интересующей географии.

Простейшие оценки среднего и дисперсии генеральной совокупности - это просто среднее значение и дисперсия выборки, т.е. выборочное среднее и (нескорректированная) дисперсия выборки - это последовательные оценки (они сходятся к правильному значению по мере увеличения количества выборок), но могут быть улучшены. Оценка дисперсии совокупности путем взятия дисперсии выборки в целом близка к оптимальной, но ее можно улучшить двумя способами. Проще говоря, дисперсия выборки вычисляется как среднее значение квадратичные отклонения о (выборке) среднего, путем деления на п. Однако при использовании значений, отличных от п улучшает оценщик различными способами. Четыре общих значения знаменателя: п, п − 1, п + 1, и п − 1.5: п является самым простым (дисперсия совокупности выборки), п - 1 устраняет предвзятость, п + 1 минимизирует среднеквадратичная ошибка для нормального распределения и п - 1.5 в основном устраняет предвзятость объективная оценка стандартного отклонения для нормального распределения.

Во-первых, если всеведущее среднее неизвестно (и вычисляется как выборочное среднее), то дисперсия выборки является предвзятый оценщик: он занижает дисперсию в (п − 1) / п; корректируя этим фактором (делением на п - 1 вместо п) называется Поправка Бесселя. Результирующая оценка несмещена и называется (исправленная) выборочная дисперсия или же объективная дисперсия выборки. Например, когда п = 1, дисперсия отдельного наблюдения относительно выборочного среднего (самого), очевидно, равна нулю независимо от дисперсии генеральной совокупности. Если среднее значение определяется каким-либо другим способом, а не на основе тех же выборок, которые использовались для оценки дисперсии, тогда эта систематическая ошибка не возникает, и дисперсию можно безопасно оценить как дисперсию выборок относительно (независимо известного) среднего.

Во-вторых, дисперсия выборки обычно не минимизирует среднеквадратичная ошибка между дисперсией выборки и дисперсией генеральной совокупности. Исправление смещения часто ухудшает ситуацию: всегда можно выбрать масштабный коэффициент, который работает лучше, чем скорректированная дисперсия выборки, хотя оптимальный масштабный коэффициент зависит от избыточный эксцесс населения (см. среднеквадратическая ошибка: дисперсия) и вносит предвзятость. Это всегда заключается в уменьшении несмещенной оценки (делении на число больше, чем п - 1) и представляет собой простой пример оценщик усадки: один «сжимает» объективную оценку до нуля. Для нормального распределения, разделив на п + 1 (вместо п - 1 или п) минимизирует среднеквадратичную ошибку. Однако результирующая оценка смещена и известна как смещенная вариация выборки.

Дисперсия населения

В целом дисперсия населения из конечный численность населения размера N с ценностями Икс_я дан кем-то

{displaystyle {egin {align} sigma ^ {2} & = {frac {1} {N}} sum _ {i = 1} ^ {N} left (x_ {i} -mu ight) ^ {2} = { frac {1} {N}} sum _ {i = 1} ^ {N} left (x_ {i} ^ {2} -2mu x_ {i} + mu ^ {2} ight) [5pt] & = left ({frac {1} {N}} sum _ {i = 1} ^ {N} x_ {i} ^ {2} ight) -2mu осталось ({frac {1} {N}} sum _ {i = 1 } ^ {N} x_ {i} ight) + mu ^ {2} [5pt] & = left ({frac {1} {N}} sum _ {i = 1} ^ {N} x_ {i} ^ {2} ight) -mu ^ {2} конец {выровнено}}}

где среднее значение по совокупности

{displaystyle mu = {frac {1} {N}} sum _ {i = 1} ^ {N} x_ {i}.}

Дисперсию совокупности также можно рассчитать с помощью

{displaystyle sigma ^ {2} = {frac {1} {N ^ {2}}} sum _ {i

Это правда, потому что

{displaystyle {egin {align} & {frac {1} {2N ^ {2}}} sum _ {i, j = 1} ^ {N} left (x_ {i} -x_ {j} ight) ^ {2 } [5pt] = {} & {frac {1} {2N ^ {2}}} sum _ {i, j = 1} ^ {N} left (x_ {i} ^ {2} -2x_ {i} x_ {j} + x_ {j} ^ {2} ight) [5pt] = {} & {frac {1} {2N}} sum _ {j = 1} ^ {N} left ({frac {1} {N}} sum _ {i = 1} ^ {N} x_ {i} ^ {2} ight) -left ({frac {1} {N}} sum _ {i = 1} ^ {N} x_ { i} ight) left ({frac {1} {N}} sum _ {j = 1} ^ {N} x_ {j} ight) + {frac {1} {2N}} sum _ {i = 1} ^ {N} left ({frac {1} {N}} sum _ {j = 1} ^ {N} x_ {j} ^ {2} ight) [5pt] = {} & {frac {1} {2 }} left (sigma ^ {2} + mu ^ {2} ight) -mu ^ {2} + {frac {1} {2}} left (sigma ^ {2} + mu ^ {2} ight) [ 5pt] = {} & сигма ^ {2} конец {выровнено}}}

Дисперсия совокупности соответствует дисперсии генерирующего распределения вероятностей. В этом смысле понятие совокупности может быть расширено до непрерывных случайных величин с бесконечной совокупностью.

Выборочная дисперсия

Во многих практических ситуациях истинная дисперсия популяции неизвестна. априори и должно быть как-то вычислено. При работе с чрезвычайно большими популяциями невозможно подсчитать каждый объект в популяции, поэтому вычисления должны выполняться на образец населения.^[9] Дисперсия выборки также может применяться к оценке дисперсии непрерывного распределения по выборке этого распределения.

Мы берем образец с заменой из п значения Y₁, ..., Y_п от населения, где п < Nи оцените дисперсию на основе этой выборки.^[10] Непосредственный анализ дисперсии данных выборки дает среднее значение квадратичные отклонения:

{displaystyle sigma _ {Y} ^ {2} = {frac {1} {n}} sum _ {i = 1} ^ {n} left (Y_ {i} - {overline {Y}} ight) ^ {2 } = left ({frac {1} {n}} sum _ {i = 1} ^ {n} Y_ {i} ^ {2} ight) - {overline {Y}} ^ {2} = {frac {1 } {n ^ {2}}} сумма _ {i, j,:, i

Здесь, ${displaystyle {overline {Y}}}$ обозначает выборочное среднее:

{displaystyle {overline {Y}} = {frac {1} {n}} sum _ {i = 1} ^ {n} Y_ {i}.}

Поскольку Y_я выбираются случайным образом, оба ${displaystyle {overline {Y}}}$ и ${displaystyle sigma _ {Y} ^ {2}}$ случайные величины. Их ожидаемые значения можно оценить путем усреднения по ансамблю всех возможных выборок {Y_я} размера п от населения. За ${displaystyle sigma _ {Y} ^ {2}}$ это дает:

{displaystyle {egin {выровнено} имя оператора {E} [сигма _ {Y} ^ {2}] & = имя оператора {E} left [{frac {1} {n}} sum _ {i = 1} ^ {n} left (Y_ {i} - {frac {1} {n}} sum _ {j = 1} ^ {n} Y_ {j} ight) ^ {2} ight] [5pt] & = {frac {1} {n}} сумма _ {i = 1} ^ {n} имя оператора {E} осталось [Y_ {i} ^ {2} - {frac {2} {n}} Y_ {i} sum _ {j = 1} ^ {n} Y_ {j} + {frac {1} {n ^ {2}}} sum _ {j = 1} ^ {n} Y_ {j} sum _ {k = 1} ^ {n} Y_ { k} ight] [5pt] & = {frac {1} {n}} sum _ {i = 1} ^ {n} left [{frac {n-2} {n}} имя оператора {E} left [Y_ {i} ^ {2} ight] - {frac {2} {n}} sum _ {jeq i} operatorname {E} left [Y_ {i} Y_ {j} ight] + {frac {1} {n ^ {2}}} сумма _ {j = 1} ^ {n} сумма _ {keq j} ^ {n} имя оператора {E} left [Y_ {j} Y_ {k} ight] + {frac {1} {n ^ {2}}} сумма _ {j = 1} ^ {n} имя оператора {E} left [Y_ {j} ^ {2} ight] ight] [5pt] & = {frac {1} {n}} sum _ {i = 1} ^ {n} left [{frac {n-2} {n}} left (sigma ^ {2} + mu ^ {2} ight) - {frac {2} {n}} ( n-1) mu ^ {2} + {frac {1} {n ^ {2}}} n (n-1) mu ^ {2} + {frac {1} {n}} left (sigma ^ {2 } + mu ^ {2} ight) ight] [5pt] & = {frac {n-1} {n}} sigma ^ {2} .end {выровнено}}}

Следовательно ${displaystyle sigma _ {Y} ^ {2}}$ дает оценку дисперсии населения, которая смещена на коэффициент ${displaystyle {frac {n-1} {n}}}$ . По этой причине, ${displaystyle sigma _ {Y} ^ {2}}$ называется смещенная дисперсия выборки. Исправление этого смещения дает несмещенная дисперсия выборки, обозначенный ${displaystyle s ^ {2}}$ :

{displaystyle s ^ {2} = {frac {n} {n-1}} sigma _ {Y} ^ {2} = {frac {n} {n-1}} влево ({frac {1} {n} } sum _ {i = 1} ^ {n} left (Y_ {i} - {overline {Y}} ight) ^ {2} ight) = {frac {1} {n-1}} sum _ {i = 1} ^ {n} влево (Y_ {i} - {overline {Y}} ight) ^ {2}}

Любой оценщик можно просто назвать выборочная дисперсия когда версию можно определить по контексту. То же доказательство применимо и к выборкам, взятым из непрерывного распределения вероятностей.

Использование термина п - 1 называется Поправка Бесселя, и он также используется в выборочная ковариация и стандартное отклонение выборки (квадратный корень из дисперсии). Квадратный корень - это вогнутая функция и, таким образом, вносит отрицательный сдвиг (по Неравенство Дженсена), который зависит от распределения, и, таким образом, скорректированное стандартное отклонение выборки (с использованием поправки Бесселя) смещено. В объективная оценка стандартного отклонения технически сложная проблема, хотя для нормального распределения используется термин п - 1,5 дает почти беспристрастную оценку.

Несмещенная дисперсия выборки - это U-статистика для функции ƒ(у₁, у₂) = (у₁ − у₂)²/ 2, что означает, что он получается путем усреднения статистики из двух выборок по двухэлементным подмножествам генеральной совокупности.

Распределение выборочной дисперсии

Распределение и кумулятивное распределение S²/ σ², для различных значений ν = п - 1, когда у_я независимы, нормально распределены.

Являясь функцией случайные переменныедисперсия выборки сама по себе является случайной величиной, и ее распределение естественно изучить. В случае, если Y_я независимые наблюдения от нормальное распределение, Теорема Кохрана показывает, что s² следует масштабному распределение хи-квадрат:^[11]

{displaystyle (n-1) {frac {s ^ {2}} {sigma ^ {2}}} sim chi _ {n-1} ^ {2}.}

Как прямое следствие, следует, что

{displaystyle operatorname {E} left (s ^ {2} ight) = operatorname {E} left ({frac {sigma ^ {2}} {n-1}} chi _ {n-1} ^ {2} ight) = сигма ^ {2},}

и^[12]

{displaystyle operatorname {Var} left [s ^ {2} ight] = operatorname {Var} left ({frac {sigma ^ {2}} {n-1}} chi _ {n-1} ^ {2} ight) = {frac {sigma ^ {4}} {(n-1) ^ {2}}} имя оператора {Var} left (chi _ {n-1} ^ {2} ight) = {frac {2sigma ^ {4} } {n-1}}.}

Если Y_я независимы и одинаково распределены, но не обязательно нормально распределены, то^[13]

{displaystyle operatorname {E} left [s ^ {2} ight] = sigma ^ {2}, quad operatorname {Var} left [s ^ {2} ight] = {frac {sigma ^ {4}} {n}} left (kappa -1+ {frac {2} {n-1}} ight) = {frac {1} {n}} left (mu _ {4} - {frac {n-3} {n-1}} сигма ^ {4} ight),}

куда κ это эксцесс распределения и μ₄ это четвертый центральный момент.

Если условия закон больших чисел придерживаться квадрата наблюдений, s² это согласованная оценка изσ². Действительно, видно, что дисперсия оценки асимптотически стремится к нулю. Асимптотически эквивалентная формула была дана в Kenney and Keeping (1951: 164), Rose and Smith (2002: 264) и Weisstein (n.d.).^[14]^[15]^[16]

Неравенство Самуэльсона

Неравенство Самуэльсона - это результат, который устанавливает границы значений, которые могут принимать отдельные наблюдения в выборке, при условии, что среднее значение выборки и (смещенная) дисперсия были рассчитаны.^[17] Ценности должны находиться в пределах ${displaystyle {ar {y}} pm sigma _ {Y} (n-1) ^ {1/2}.}$

Связь с гармоническими и арифметическими средствами

Было показано^[18] что за образец {у_я} положительных действительных чисел,

{displaystyle sigma _ {y} ^ {2} leq 2y_ {max} (A-H),}

куда у_{Максимум} - максимум выборки, А - среднее арифметическое, ЧАС это гармоническое среднее образца и ${displaystyle sigma _ {y} ^ {2}}$ - (смещенная) дисперсия выборки.

Эта оценка была улучшена, и известно, что дисперсия ограничена

{displaystyle sigma _ {y} ^ {2} leq {frac {y_ {max} (A-H) (y_ {max} -A)} {y_ {max} -H}},}

{displaystyle sigma _ {y} ^ {2} geq {frac {y_ {min} (A-H) (A-y_ {min})} {H-y_ {min}}},}

куда у_мин - минимум выборки.^[19]

Тесты на равенство дисперсий

Проверка на равенство двух или более отклонений затруднительна. В F тест и тесты хи-квадрат оба являются ненормальными и не рекомендуются для этой цели.

Было предложено несколько непараметрических тестов: они включают тест Бартона – Дэвида – Ансари – Фрейнда – Зигеля – Тьюки, Каплон тест, Тест настроения, то Клотца тест и Сухатме тест. Тест Сухатме применяется к двум вариантам и требует, чтобы оба медианы быть известным и равным нулю. Тесты Настроение, Клотца, Капона и Бартона – Дэвида – Ансари – Фройнда – Зигеля – Тьюки также применимы к двум дисперсиям. Они позволяют неизвестной медиане, но требуют, чтобы две медианы были равны.

В Тест Лемана является параметрическим тестом двух дисперсий. Известно несколько вариантов этого теста.Другие тесты равенства дисперсий включают Коробочный тест, то Тест Бокса – Андерсона и Тест Моисея.

Методы повторной выборки, которые включают бутстрап и складной нож, может использоваться для проверки равенства дисперсий.

История

Период, термин отклонение был впервые представлен Рональд Фишер в его статье 1918 года Корреляция между родственниками на основе предположения о менделевской наследственности:^[20]

Большой объем доступной статистики показывает нам, что отклонения человеческое измерение очень внимательно следите за Нормальный закон ошибок, и, следовательно, что изменчивость может быть равномерно измерена стандартное отклонение соответствующий квадратный корень из среднеквадратичная ошибка. Когда есть две независимые причины изменчивости, способные привести к однородному распределению популяции со стандартными отклонениями ${displaystyle sigma _ {1}}$ и ${displaystyle sigma _ {2}}$ , обнаружено, что распределение, когда обе причины действуют вместе, имеет стандартное отклонение ${displaystyle {sqrt {sigma _ {1} ^ {2} + sigma _ {2} ^ {2}}}}$ . Поэтому при анализе причин изменчивости желательно иметь дело с квадратом стандартного отклонения в качестве меры изменчивости. Назовем эту величину Дисперсией ...

Геометрическая визуализация дисперсии произвольного распределения (2, 4, 4, 4, 5, 5, 7, 9):

Построено частотное распределение.
Центроид распределения дает среднее значение.
Для каждого значения формируется квадрат со сторонами, равными разнице каждого значения от среднего.
Объединяя квадраты в прямоугольник с одной стороной, равной количеству значений, п, приводит к тому, что другой стороной является дисперсия распределения, σ².

Момент инерции

Дисперсия распределения вероятностей аналогична момент инерции в классическая механика соответствующего распределения массы вдоль линии относительно вращения вокруг ее центра масс.^{[нужна цитата]} Именно из-за этой аналогии такие вещи, как дисперсия, называются моменты из распределения вероятностей.^{[нужна цитата]} Ковариационная матрица связана с тензор момента инерции для многомерных распределений. Момент инерции облака п точек с ковариационной матрицей ${displaystyle Sigma}$ дан кем-то^{[нужна цитата]}

{displaystyle I = nleft (mathbf {1} _ {3 imes 3} operatorname {tr} (Sigma) -Sigma ight).}

Эта разница между моментом инерции в физике и статистике очевидна для точек, собранных вдоль линии. Предположим, что многие точки близки к Икс оси и распределены по ней. Ковариационная матрица может выглядеть как

{displaystyle Sigma = {egin {bmatrix} 10 & 0 & 0 0 & 0.1 & 0 0 & 0 & 0.1end {bmatrix}}.}

То есть наибольшее расхождение в Икс направление. Физики сочли бы это низким моментом о то Икс ось, поэтому тензор момента инерции

{displaystyle I = n {egin {bmatrix} 0.2 & 0 & 0 0 & 10.1 & 0 0 & 0 & 10.1end {bmatrix}}.}

Полувариантность

В полувариантность рассчитывается таким же образом, как и дисперсия, но в расчет включаются только те наблюдения, которые ниже среднего:

{displaystyle {ext {Semivariance}} = {1 больше {n}} сумма _ {i: x_ {i}

Иногда его описывают как меру риск убытков в инвестиции контекст. Для асимметричных распределений полувариантность может предоставить дополнительную информацию, которой нет в дисперсии.^[21]

О неравенствах, связанных с полувариантностью, см. Неравенство Чебышева § Полуварианты.

Обобщения

Для сложных переменных

Если ${displaystyle x}$ скаляр сложный-значная случайная величина со значениями в ${displaystyle mathbb {C},}$ тогда его дисперсия ${displaystyle operatorname {E} left [(x-mu) (x-mu) ^ {*} ight],}$ куда ${displaystyle x ^ {*}}$ это комплексно сопряженный из ${displaystyle x.}$ Эта дисперсия - настоящий скаляр.

Для векторных случайных величин

Как матрица

Если ${displaystyle X}$ это вектор-значная случайная величина со значениями в ${displaystyle mathbb {R} ^ {n},}$ и рассматривается как вектор-столбец, тогда естественное обобщение дисперсии ${displaystyle operatorname {E} left [(X-mu) (X-mu) ^ {operatorname {T}} ight],}$ куда ${displaystyle mu = имя оператора {E} (X)}$ и ${displaystyle X ^ {имя оператора {T}}}$ это транспонирование ${displaystyle X,}$ и вектор-строка. В результате положительная полуопределенная квадратная матрица, обычно называемый ковариационная матрица (или просто как ковариационная матрица).

Если ${displaystyle X}$ - векторная и комплексная случайная величина со значениями в ${displaystyle mathbb {C} ^ {n},}$ затем ковариационная матрица ${displaystyle operatorname {E} left [(X-mu) (X-mu) ^ {dagger} ight],}$ куда ${displaystyle X ^ {dagger}}$ это сопряженный транспонировать из ${displaystyle X.}$ ^{[нужна цитата]} Эта матрица также является положительно полуопределенной и квадратной.

Как скаляр

Еще одно обобщение дисперсии для векторных случайных величин ${displaystyle X}$ , что приводит к скалярному значению, а не к матрице, является обобщенная дисперсия ${displaystyle det (C)}$ , то детерминант ковариационной матрицы. Можно показать, что обобщенная дисперсия связана с многомерным разбросом точек вокруг их среднего значения.^[22]

Другое обобщение получается при рассмотрении Евклидово расстояние между случайной величиной и ее средним значением. Это приводит к ${displaystyle operatorname {E} left [(X-mu) ^ {operatorname {T}} (X-mu) ight] = operatorname {tr} (C),}$ какой след ковариационной матрицы.

v т е Теория распределения вероятностей
функция массы вероятности (pmf) функция плотности вероятности (pdf) кумулятивная функция распределения (cdf) квантильная функция
грубый момент центральный момент иметь в виду отклонение стандартное отклонение перекос эксцесс L-момент
момент-производящая функция (мгс) характеристическая функция функция, генерирующая вероятность (пгф) кумулянт комбинант

Navigation