WikiDer > Коррелограмма

Correlogram
График, показывающий 100 случайных чисел со скрытым синус функция, и автокорреляция (коррелограмма) ряда внизу.
Пример коррелограммы

При анализе данных коррелограмма это Диаграмма из корреляция статистика. Например, в анализ временных рядов, график образца автокорреляции против (время задержки) автокоррелограмма. Если взаимная корреляция нанесен, результат называется кросс-коррелограмма.

Коррелограмма - часто используемый инструмент для проверки случайность в набор данных. Если он случайный, автокорреляция должна быть близка к нулю для всех без исключения разделений по времени. Если неслучайно, то одна или несколько автокорреляций будут значительно отличны от нуля.

Кроме того, коррелограммы используются в идентификация модели сцена для Бокс – Дженкинс авторегрессионная скользящая средняя Временные ряды модели. Автокорреляция должна быть близкой к нулю для случайности; если аналитик не проверяет случайность, тогда достоверность многих статистических выводов становится сомнительной. Коррелограмма - отличный способ проверить такую ​​случайность.

Иногда, Corrgrams, цветные матрицы сил корреляции в многомерный анализ,[1] также называются коррелограммами.[2][3]

Приложения[4]

Коррелограмма может помочь ответить на следующие вопросы:

  • Данные случайны?
  • Связано ли наблюдение с соседним наблюдением?
  • Дважды удаляется наблюдение, связанное с наблюдением? (так далее.)
  • Наблюдаемый временной ряд белый шум?
  • Является ли наблюдаемый временной ряд синусоидальным?
  • Является ли наблюдаемый временной ряд авторегрессией?
  • Какая модель подходит для наблюдаемых временных рядов?
  • Модель
действительный и достаточный?
  • Формула действительный?

Важность

Случайность (наряду с фиксированной моделью, фиксированной вариацией и фиксированным распределением) - одно из четырех предположений, которые обычно лежат в основе всех процессов измерения. Предположение о случайности критически важно по следующим трем причинам:

  • Самый стандартный статистические тесты зависят от случайности. Достоверность выводов теста напрямую связана с достоверностью предположения о случайности.
  • Многие часто используемые статистические формулы зависят от предположения о случайности, наиболее распространенной формулой является формула для определения стандартного отклонения выборочного среднего:

куда s это стандартное отклонение данных. Несмотря на интенсивное использование, результаты использования этой формулы не имеют ценности, если не выполняется предположение о случайности.

  • Для одномерных данных модель по умолчанию

Если данные не случайны, эта модель неверна и недействительна, а оценки параметров (например, константы) становятся бессмысленными и недействительными.

Оценка автокорреляций

Коэффициент автокорреляции при запаздывании час дан кем-то

куда cчас это функция автоковариации

и c0 это функция дисперсии

Результирующее значение рчас будет находиться в диапазоне от -1 до +1.

Альтернативная оценка

Некоторые источники могут использовать следующую формулу для функции автоковариации:

Хотя в этом определении меньше предвзятость, (1 /N) имеет некоторые желательные статистические свойства и является формой, наиболее часто используемой в статистической литературе. См. Подробности на страницах 20 и 49–50 в Chatfield.

Статистический вывод с коррелограммами

На этом же графике можно провести верхнюю и нижнюю границы автокорреляции с уровнем значимости :

с как предполагаемая автокорреляция с запаздыванием .

Если автокорреляция выше (ниже), чем эта верхняя (нижняя) граница, нулевая гипотеза об отсутствии автокорреляции при заданном лаге и за его пределами отклоняется при уровне значимости . Этот тест является приблизительным и предполагает, что временной ряд Гауссовский.

В приведенном выше описании z1−α/2 квантиль нормальное распределение; SE - стандартная ошибка, которую можно вычислить Бартлеттформула для MA () процессы:

за

На картинке выше мы можем отклонить нулевая гипотеза что нет автокорреляции между соседними временными точками (лаг = 1). Для остальных периодов нельзя отказаться от нулевая гипотеза без автокорреляции.

Обратите внимание, что есть две различные формулы для создания доверительных интервалов:

1. Если коррелограмма используется для проверки случайности (т. Е. Нет временная зависимость в данных) рекомендуется следующая формула:

куда N это размер образца, z это квантильная функция из стандартное нормальное распределение а α - уровень значимости. В этом случае доверительные интервалы имеют фиксированную ширину, которая зависит от размера выборки.

2. Коррелограммы также используются на этапе идентификации модели для подгонки ARIMA модели. В этом случае модель скользящего среднего предполагается для данных, и должны быть созданы следующие доверительные интервалы:

куда k это отставание. В этом случае доверительные интервалы увеличиваются с увеличением задержки.

Программного обеспечения

Коррелограммы доступны в большинстве статистических библиотек общего назначения.

Коррелограммы:

Коррограммы:

Связанные методы

Рекомендации

  1. ^ Дружелюбный, Майкл (19 августа 2002 г.). «Коррограммы: поисковые дисплеи для корреляционных матриц» (PDF). Американский статистик. Тейлор и Фрэнсис. 56 (4): 316–324. Дои:10.1198/000313002533. Получено 19 января 2014.
  2. ^ а б «КРАН - Пакет исправлений». cran.r-project.org. 29 августа 2013 г.. Получено 19 января 2014.
  3. ^ а б «Quick-R: коррелограммы». statmethods.net. Получено 19 января 2014.
  4. ^ «1.3.3.1. График автокорреляции». www.itl.nist.gov. Получено 2018-08-20.
  5. ^ «Визуализация § Автокорреляционный график».

дальнейшее чтение

  • Ханке, Джон Э .; Reitsch, Arthur G .; Уичерн, Дин В. Бизнес-прогнозирование (7-е изд.). Река Аппер Сэдл, Нью-Джерси: Prentice Hall.
  • Box, G.E.P .; Дженкинс, Г. (1976). Анализ временных рядов: прогнозирование и контроль. Холден-Дэй.
  • Чатфилд, К. (1989). Анализ временных рядов: введение (Четвертое изд.). Нью-Йорк, Нью-Йорк: Чепмен и Холл.

внешняя ссылка

Эта статья включаетматериалы общественного достояния от Национальный институт стандартов и технологий интернет сайт https://www.nist.gov.