WikiDer > Данные подсчета

Count data

В статистика, подсчитывать данные это тип статистических данных, тип данные в котором наблюдения могут принимать только неотрицательные целое число значения {0, 1, 2, 3, ...}, и где эти целые числа возникают из подсчет скорее, чем рейтинг. Статистическая обработка данных подсчета отличается от обработки двоичные данные, в котором наблюдения могут принимать только два значения, обычно представленные 0 и 1, и из порядковые данные, который также может состоять из целых чисел, но где отдельные значения попадают в произвольную шкалу и важен только относительный рейтинг

Подсчет переменных

Отдельный фрагмент данных подсчета часто называют счетная переменная. Когда такая переменная рассматривается как случайная переменная, то Пуассон, биномиальный и отрицательный бином дистрибутивы обычно используются для представления его распределения.

Графическая экспертиза

Графическому исследованию данных подсчета может помочь использование преобразование данных выбран, чтобы иметь свойство стабилизации выборочной дисперсии. В частности, квадратный корень преобразование может использоваться, когда данные могут быть аппроксимированы распределение Пуассона (хотя другие преобразования имеют несколько улучшенные свойства), а обратное преобразование синуса доступно, когда биномиальное распределение является предпочтительным.

Связь данных подсчета с другими переменными

Здесь переменная count будет рассматриваться как зависимая переменная. Статистические методы, такие как наименьших квадратов и дисперсионный анализ предназначены для работы с непрерывно зависимыми переменными. Их можно адаптировать для работы с данными подсчета с помощью преобразования данных такой как квадратный корень трансформация, но у таких методов есть ряд недостатков; они в лучшем случае приблизительны и оценивают параметры которые часто трудно интерпретировать.

В распределение Пуассона может служить основой для некоторого анализа данных подсчета и в этом случае Регрессия Пуассона может быть использовано. Это частный случай класса обобщенные линейные модели который также содержит конкретные формы модели, способные использовать биномиальное распределение (биномиальная регрессия, логистическая регрессия) или отрицательное биномиальное распределение где предположения модели Пуассона нарушаются, в частности, когда диапазон значений счета ограничен или когда чрезмерная дисперсия настоящее.

Смотрите также

дальнейшее чтение

  • Кэмерон, А.С.; Триведи, П. К. (2013). Регрессионный анализ книги учетных данных (Второе изд.). Издательство Кембриджского университета. ISBN 978-1-107-66727-3.
  • Хильбе, Джозеф М. (2011). Отрицательная биномиальная регрессия (Второе изд.). Издательство Кембриджского университета. ISBN 978-0-521-19815-8.
  • Винкельманн, Райнер (2008). Эконометрический анализ данных подсчета (Пятое изд.). Springer. Дои:10.1007/978-3-540-78389-3. ISBN 978-3-540-77648-2.