WikiDer > Оценка Хорвица – Томпсона - Википедия
В статистика, то Оценка Хорвица – Томпсона, названный в честь Дэниела Г. Хорвица и Донована Дж. Томпсона,[1] это метод оценки общей[2] и среднее значение псевдопопуляция в стратифицированная выборка. Взвешивание обратной вероятности применяется для учета различных пропорций наблюдений внутри слоев целевой популяции. Оценка Хорвица – Томпсона часто применяется в обзорный анализ и может использоваться для учета отсутствующие данные.
Метод
Формально пусть быть независимый образец из п из N ≥ n отдельные слои с общим средним значениемμ. Предположим далее, что это вероятность включения что случайно выбранная особь в суперпопуляции принадлежит к яй слой. Оценка Хорвица – Томпсона общей суммы определяется следующим образом:
а оценка среднего значения определяется как:
В Байесовский вероятностная структура считается доля лиц в целевой популяции, принадлежащих к яй слой. Следовательно, можно рассматривать как оценку полной выборки лиц в яй слой. Оценка Хорвица – Томпсона также может быть выражена как предел взвешенного бутстрап повторная выборка оценка среднего. Его также можно рассматривать как частный случай нескольких вменение подходы.[3]
За пост-стратифицированный дизайн исследования, оценка и выполняются отдельными шагами. В таких случаях вычисление дисперсии не однозначно. Для получения согласованных оценок дисперсии оценки Хорвица – Томпсона можно применять методы повторной выборки, такие как бутстрап или складной нож.[4] Пакет "Обзор" для р проводит анализ постстратифицированных данных с использованием оценки Хорвица – Томпсона.[5]
Доказательство объективной оценки Хорвица-Томпсона среднего
Можно показать, что оценка Хорвица – Томпсона несмещена при оценке математического ожидания оценки Хорвица – Томпсона, , следующее:
Рекомендации
- ^ Horvitz, D.G .; Томпсон, Д. Дж. (1952) "Обобщение выборки без замены из конечной вселенной", Журнал Американской статистической ассоциации, 47, 663–685, . JSTOR 2280784
- ^ Уильям Дж. Кокран (1977), Методы отбора проб, 3-е издание, Wiley. ISBN 0-471-16240-X
- ^ Родерик Дж. А. Литтл, Дональд Б. Рубин (2002) Статистический анализ с отсутствующими данными, 2-е изд., Wiley. ISBN 0-471-18386-5
- ^ Кватембер, А. (2014). «Конечная популяция начальной загрузки - от максимального правдоподобия к подходу Хорвица-Томпсона». Австрийский статистический журнал. 43: 93–102.
- ^ https://cran.r-project.org/web/packages/survey/