WikiDer > Нецентральное гипергеометрическое распределение Валлениуса - Википедия
В теория вероятности и статистика, Нецентральное гипергеометрическое распределение Валлениуса (названный в честь Кеннета Теда Валлениуса) является обобщением гипергеометрическое распределение где образцы отбираются с предвзятость.
Это распределение можно проиллюстрировать как модель урны с предвзятостью. Предположим, например, что урна содержит м1 красные шары и м2 белые шары, всего N = м1 + м2 мячи. Каждый красный шар имеет вес ω1 и каждый белый шар имеет вес ω2. Будем говорить, что отношение шансов ω = ω1 / ω2. Сейчас мы берем п шары, один за другим, таким образом, что вероятность взять конкретный шар при конкретном розыгрыше равна его доле от общего веса всех шаров, лежащих в урне в этот момент. Количество красных шаров Икс1 в этом эксперименте мы получаем случайную величину с нецентральным гипергеометрическим распределением Валлениуса.
Дело осложняется тем, что существует более одного нецентрального гипергеометрического распределения. Нецентральное гипергеометрическое распределение Валлениуса получается, если шары отбираются один за другим таким образом, чтобы конкуренция между шарами. Нецентральное гипергеометрическое распределение Фишера получается, если шары отбираются одновременно или независимо друг от друга. К сожалению, оба распределения известны в литературе как «нецентральное гипергеометрическое распределение». При использовании этого имени важно уточнить, какой дистрибутив имеется в виду.
Оба распределения равны (центральному) гипергеометрическое распределение когда отношение шансов равно 1.
Далеко не очевидно, почему эти два дистрибутива разные. См. Запись в Википедии о нецентральные гипергеометрические распределения для более подробного объяснения разницы между этими двумя распределениями вероятностей.
Одномерное распределение
Параметры | |||
---|---|---|---|
Поддерживать | |||
PMF | куда | ||
Иметь в виду | Приблизительно по решению к | ||
Дисперсия | , куда |
Распределение Валлениуса особенно сложно, потому что вероятность взятия каждого мяча зависит не только от его веса, но и от общего веса его соперников. А вес соревнующихся мячей зависит от результатов всех предыдущих розыгрышей.
Эта рекурсивная зависимость приводит к разностное уравнение с решением, приведенным в открытая форма интегралом в выражении функции массы вероятности в таблице выше.
Выражения закрытой формы для вероятностной функции массы существуют (Lyons, 1980), но они не очень полезны для практических расчетов из-за экстремальных числовая нестабильность, кроме вырожденных случаев.
Используются несколько других методов расчета, в том числе рекурсия, Расширение Тейлора и численное интегрирование (Туман, 2007, 2008).
Самый надежный метод расчета - это рекурсивное вычисление f (Икс,п) из f (Икс,п-1) и f (Икс-1,п-1), используя формулу рекурсии, приведенную ниже в разделе свойств. Вероятности всех (Икс,п) комбинации на всех возможных траектории ведущие к желаемой точке вычисляются, начиная с f (0,0) = 1, как показано на рисунке справа. Общее количество вероятностей для вычисления равно п(Икс+1)-Икс2. Другие методы расчета необходимо использовать, когда п и Икс настолько велики, что этот метод слишком неэффективен.
Вероятность того, что все шары одного цвета, вычислить проще. См. Формулу ниже в разделе многомерного распределения.
Точная формула для среднего неизвестна (за исключением полного перечисления всех вероятностей). Приведенное выше уравнение достаточно точное. Это уравнение можно решить относительно μ следующим образом: Итерация Ньютона-Рафсона. Это же уравнение можно использовать для оценки шансов на основе экспериментально полученного значения среднего.
Свойства одномерного распределения
Распределение Валлениуса имеет меньше соотношений симметрии, чем Нецентральное гипергеометрическое распределение Фишера имеет. Единственная симметрия касается смены цветов:
В отличие от распределения Фишера, распределение Валлениуса не имеет симметрии относительно количества шаров. нет взятый.
Следующая формула рекурсии полезна для вычисления вероятностей:
Также известна другая формула рекурсии:
Вероятность ограничена
где подчеркнутый верхний индекс указывает падающий факториал .
Многовариантное распределение
Распределение можно расширить до любого количества цветов. c шаров в урне. Многовариантное распределение используется при наличии более двух цветов.
Параметры | |||
---|---|---|---|
Поддерживать | |||
PMF | куда | ||
Иметь в виду | Приблизительно по решению к | ||
Дисперсия | Приблизительно по дисперсии Нецентральное гипергеометрическое распределение Фишера с таким же средним. |
Функция массы вероятности может быть вычислена с помощью различных Расширение Тейлора методы или численное интегрирование (Туман, 2008).
Вероятность того, что все шары одного цвета, j, можно рассчитать как:
за Иксj = п ≤ мj, где подчеркнутый верхний индекс обозначает падающий факториал.
Достаточно хорошее приближение к среднему можно рассчитать с помощью приведенного выше уравнения. Уравнение можно решить, определив θ так, чтобы
и решение
для θ на Итерация Ньютона-Рафсона.
Уравнение для среднего также полезно для оценки шансов на основании экспериментально полученных значений среднего.
Нет никаких хороших способов вычисления дисперсии. Самый известный метод - аппроксимировать многомерное распределение Валлениуса многомерным Нецентральное гипергеометрическое распределение Фишера с тем же средним значением и вставьте среднее значение, рассчитанное выше, в приблизительную формулу для дисперсии последнего распределения.
Свойства многомерного распределения
Порядок цветов произвольный, поэтому любые цвета можно менять местами.
Веса можно масштабировать произвольно:
- для всех .
Цвета с нулевым числом (мя = 0) или нулевого веса (ωя = 0) можно не включать в уравнения.
Можно сочетать цвета с одинаковым весом:
куда - (одномерная, центральная) вероятность гипергеометрического распределения.
Дополнительное нецентральное гипергеометрическое распределение Валлениуса
Шары, которые нет полученные в эксперименте с урной, имеют распределение, которое отличается от нецентрального гипергеометрического распределения Валлениуса из-за отсутствия симметрии. Распределение невнятных мячей можно назвать дополнительное нецентральное гипергеометрическое распределение Валлениуса.
Вероятности в дополнительном распределении вычисляются из распределения Валлениуса путем замены п с N-п, Икся с мя - Икся, а ωя с 1 / ωя.
Доступное программное обеспечение
- Валлениус Гипергеометрическое Распределение в Mathematica.
- Реализация для Язык программирования R доступен как пакет с именем BiasedUrn. Включает одномерные и многомерные вероятностные массовые функции, функции распределения, квантили, случайная переменная производящие функции, среднее значение и дисперсия.
- Реализация в C ++ доступен из www.agner.org.
Смотрите также
- Нецентральные гипергеометрические распределения
- Нецентральное гипергеометрическое распределение Фишера
- Предвзятая выборка
- Предвзятость
- Популяционная генетика
- Точный тест Фишера
Рекомендации
- Chesson, J. (1976). «Нецентральное многомерное гипергеометрическое распределение, возникающее из-за смещения выборки с применением к избирательному хищничеству». Журнал прикладной теории вероятностей. 13 (4). Доверие прикладной вероятности. С. 795–797. Дои:10.2307/3212535. JSTOR 3212535.
- Туман, А. (2007). «Теория случайных чисел».
- Туман, А. (2008). "Методы расчета нецентрального гипергеометрического распределения Валлениуса". Коммуникации в статике, моделировании и вычислениях. 37 (2): 258–273. Дои:10.1080/03610910701790269. S2CID 9040568.
- Johnson, N.L .; Кемп, А. В .; Коц, С. (2005). Одномерные дискретные распределения. Хобокен, Нью-Джерси: Wiley and Sons.
- Лайонс, Н. И. (1980). «Замкнутые выражения для нецентральных гипергеометрических вероятностей». Коммуникации в статистике - моделирование и вычисления. 9 (3). С. 313–314. Дои:10.1080/03610918008812156.
- Мэнли, Б. Ф. Дж. (1974). «Модель для некоторых типов селекционных экспериментов». Биометрия. 30 (2). Международное биометрическое общество. С. 281–294. Дои:10.2307/2529649. JSTOR 2529649.
- Валлениус, К. Т. (1963). Смещенная выборка: нецентральное гипергеометрическое распределение вероятностей. Кандидат наук. Тезис (Тезис). Стэнфордский университет, статистический факультет.