WikiDer > Лучший линейный объективный прогноз
В статистика, лучший линейный несмещенный прогноз (BLUP) используется в линейных смешанные модели для оценки случайные эффекты. BLUP был получен Чарльз Рой Хендерсон в 1950 году, но термин «лучший линейный непредвзятый предсказатель» (или «предсказание»), похоже, не использовался до 1962 года.[1] «Лучшие линейные несмещенные прогнозы» (BLUP) случайных эффектов аналогичны лучшим линейным несмещенным оценкам (BLUE) (см. Теорема Гаусса – Маркова) фиксированных эффектов. Различие возникает потому, что принято говорить о оценка фиксированные эффекты, но предсказание случайные эффекты, но в остальном эти два термина эквивалентны. (Это немного странно, поскольку случайные эффекты уже «реализованы»; они уже существуют. Использование термина «предсказание» может быть связано с тем, что в области селекции животных, в которой работал Хендерсон, случайные эффекты обычно были генетическими достоинствами. , который можно использовать для прогнозирования качества потомства (Робинсон[1] стр.28)). Однако уравнения для «фиксированных» эффектов и для случайных эффектов различны.
На практике часто бывает, что параметры, связанные с термином (ами) случайного эффекта (ами), неизвестны; эти параметры представляют собой дисперсии случайных эффектов и остатков. Обычно параметры оцениваются и вводятся в предсказатель, что приводит к Эмпирический лучший линейный непредвзятый предсказатель (EBLUP). Обратите внимание, что при простом добавлении оцененного параметра в предсказатель не учитывается дополнительная изменчивость, что приводит к чрезмерно оптимистичным отклонениям предсказания для EBLUP.[нужна цитата]
Лучшие линейные несмещенные прогнозы похожи на эмпирический байесовский оценки случайных эффектов в линейных смешанных моделях, за исключением того, что в последнем случае, когда веса зависят от неизвестных значений компонентов дисперсии, эти неизвестные дисперсии заменяются оценками на основе выборки.
Пример
Предположим, что модель для наблюдений {Yj; j = 1, ..., п} записывается как
куда ξj и εj представляют случайный эффект и ошибку наблюдения для наблюдения j, и предположим, что они некоррелированы и имеют известные дисперсии σξ2 и σε2, соответственно. Дальше, Иксj вектор независимые переменные для j-е наблюдение и β - вектор параметров регрессии. Проблема BLUP для оценки безошибочного значения наблюдения для k-е наблюдение,
можно сформулировать как требование, чтобы коэффициенты линейного предиктора, определенного как
следует выбирать так, чтобы минимизировать дисперсию ошибки прогнозирования,
при условии, что предсказатель непредвзят,
BLUP vs СИНИЙ
В отличие от случая лучшая линейная несмещенная оценка, "количество для оценки", , имеет вклад не только от случайного элемента, но и от одной из наблюдаемых величин, в частности что способствует , также имеет вклад от того же случайного элемента.
В отличие от BLUE, BLUP учитывает известные или предполагаемые отклонения.[2]
История БЛУП в селекции
Хендерсон исследовал разведение со статистической точки зрения. Его работа помогла разработать Индекс селекции (SI) и оценочную племенную ценность (EBV). Эти статистические методы повлияли на рейтинги производителей искусственного осеменения, используемые в США. Эти ранние статистические методы путают с BLUP, широко распространенным в животноводстве.
Фактический термин BLUP возник из-за работы в Университете Гвельфа в Канаде. В статье «Оценка реакции на выбор с использованием методологии наименьших квадратов и смешанной модели», январь 1984 г., Journal of Animal Science 58 (5) DOI: 10.2527 / jas1984.5851097x, Д. Соренсен и Б. В. Кеннеди, они расширили результаты Хендерсона на модель, которая включает несколько циклов. выбора. Эта модель была популяризирована Университетом Гвельфа в молочной промышленности как BLUP. Дальнейшая работа университета показала превосходство BLUP над EBV и SI, что привело к тому, что он стал основным генетическим предиктором.
Таким образом, существует путаница между популяризованной выше моделью BLUP и лучшим статистическим методом линейного несмещенного прогнозирования, который был слишком теоретическим для общего использования. Модель поставлялась фермерам для использования на компьютерах.
В Канаде все молочные предприятия отчитываются на национальном уровне. Генетика в Канаде была общей, что сделало ее крупнейшим генетическим пулом и, следовательно, источником улучшений. Это и BLUP привели к быстрому увеличению Голштинский скот качественный.
Смотрите также
Примечания
- ^ а б Робинсон, Г. (1991). "Этот BLUP - хорошая вещь: оценка случайных эффектов". Статистическая наука. 6 (1): 15–32. Дои:10.1214 / сс / 1177011926. JSTOR 2245695. МИСТЕР 1108815. Zbl 0955.62500.
- ^ Станек, Эдвард Дж. III; Что ж, Арнольд; Окене, Ира (1999). «Почему бы обычно не использовать лучшие линейные объективные предикторы (BLUP) для оценки холестерина, процента жира от ккал и физической активности?». Статистика в медицине. 18 (21): 2943–2959. Дои:10.1002 / (sici) 1097-0258 (19991115) 18:21 <2943 :: aid-sim241> 3.0.co; 2-0.
Рекомендации
- Хендерсон, К. (1975). «Лучшая линейная объективная оценка и прогноз по модели выбора». Биометрия. 31 (2): 423–447. Дои:10.2307/2529430. JSTOR 2529430. PMID 1174616.
- Лю, Сюй-Цин; Ронг, Цзянь-Инь; Лю, Сю-Инь (2008). «Лучший линейный несмещенный прогноз для линейных комбинаций в общих смешанных линейных моделях». Журнал многомерного анализа. 99 (8): 1503–1517. Дои:10.1016 / j.jmva.2008.01.004.