WikiDer > Модель Tobit
В статистике тобит модель любой из класса регрессионные модели в котором наблюдаемый диапазон зависимая переменная является подвергнутый цензуре каким-то образом.[1] Термин был придуман Артур Голдбергер в отношении Джеймс Тобин,[2][а] который разработал модель в 1958 году, чтобы смягчить проблему нулевой надутый данные для наблюдений за расходами домашних хозяйств на товары длительного пользования.[3][b] Поскольку метод Тобина можно легко расширить для обработки усеченный и другие неслучайно выбранные образцы,[c] некоторые авторы принимают более широкое определение модели тобит, которое включает эти случаи.[4]
Идея Тобина состояла в том, чтобы изменить функция правдоподобия так что он отражает неравное вероятность выборки для каждого наблюдения в зависимости от того, скрытая зависимая переменная упал выше или ниже определенного порога.[5] Для выборки, которая, как и в исходном случае Тобина, была подвергнута цензуре снизу на нуле, вероятность выборки для каждого неограниченного наблюдения - это просто высота соответствующего функция плотности. Для любого предельного наблюдения это кумулятивное распределение, т.е. интеграл ниже нуля соответствующей функции плотности. Таким образом, функция правдоподобия тобита представляет собой смесь плотностей и кумулятивных функций распределения.[6]
Функция правдоподобия
Ниже приведены вероятность и регистрировать функции правдоподобия для тобита типа I. Это тобит, который подвергается цензуре снизу на когда скрытая переменная . Записывая функцию правдоподобия, мы сначала определяем индикаторную функцию :
Далее пусть быть стандартным нормальным кумулятивная функция распределения и быть стандартным нормальным функция плотности вероятности. Для набора данных с N наблюдения функция правдоподобия для тобита типа I равна
а логарифмическая вероятность дается выражением
Репараметризация
Логарифмическая вероятность, указанная выше, не является глобальной вогнутой, что усложняет оценка максимального правдоподобия. Ольсен предложил простую репараметризацию и , что приводит к преобразованию логарифма правдоподобия,
который является глобально вогнутым по преобразованным параметрам.[7]
Для усеченной модели (тобит II) Орм показал, что, хотя логарифм правдоподобия не является глобально вогнутым, он является вогнутым в любом стационарная точка при вышеуказанном преобразовании.[8][9]
Последовательность
Если параметр отношения оценивается путем регрессии наблюдаемых на , получившаяся обыкновенная наименьших квадратов оценка регрессии непоследовательный. Это даст смещенную вниз оценку коэффициента наклона и смещенную вверх оценку точки пересечения. Такеши Амемия (1973) доказал, что оценщик максимального правдоподобия предложенное Тобином для этой модели согласуется.[10]
Интерпретация
В коэффициент не следует интерпретировать как эффект на , как и с модель линейной регрессии; это обычная ошибка. Вместо этого его следует интерпретировать как комбинацию (1) изменения из тех, кто превысил лимит, взвешенные по вероятности превышения лимита; и (2) изменение вероятности превышения предела, взвешенное на ожидаемое значение если выше.[11]
Варианты модели тобита
Варианты модели тобита могут быть произведены путем изменения места и времени цензура происходит. Амемия (1985, п. 384) классифицирует эти варианты по пяти категориям (тобит типа I - тобит типа V), где тобит типа I обозначает первую модель, описанную выше. Schnedler (2005) предлагает общую формулу для получения согласованных оценок правдоподобия для этих и других вариантов модели тобит.[12]
Тип I
Модель тобита - это частный случай цензурированная регрессионная модель, потому что скрытая переменная не всегда можно наблюдать, в то время как независимая переменная наблюдается. Распространенным вариантом модели тобит является цензура по значению отличное от нуля:
Другой пример - цензура значений выше. .
Еще одна модель возникает, когда подвергается цензуре сверху и снизу одновременно.
Остальные модели будут представлены как ограниченные снизу в 0, хотя это можно обобщить, как это сделано для типа I.
Тип II
В моделях тобита типа II вводится вторая скрытая переменная.[13]