WikiDer > Многовариантная статистика
Многовариантная статистика является подразделением статистика охватывающий одновременное наблюдение и анализ более чем одной переменной результата. Применение многомерной статистики многомерный анализ.
Многомерная статистика касается понимания различных целей и основ каждой из различных форм многомерного анализа и того, как они соотносятся друг с другом. Практическое применение многомерной статистики к конкретной проблеме может включать несколько типов одномерного и многомерного анализа, чтобы понять отношения между переменными и их отношение к изучаемой проблеме.
Кроме того, многомерная статистика связана с многомерными распределения вероятностей, с точки зрения как
- как их можно использовать для представления распределения наблюдаемых данных;
- как их можно использовать как часть статистические выводы, особенно если для одного анализа представляют интерес несколько разных величин.
Некоторые типы проблем, связанных с многомерными данными, например простая линейная регрессия и множественная регрессия, находятся нет обычно считается частным случаем многомерной статистики, поскольку анализ проводится путем рассмотрения (одномерного) условного распределения одной переменной результата с учетом других переменных.
Виды анализа
Существует много разных моделей, каждая из которых имеет свой тип анализа:
- Многомерный дисперсионный анализ (MANOVA) расширяет дисперсионный анализ чтобы охватить случаи, когда необходимо одновременно анализировать более одной зависимой переменной; смотрите также Многомерный анализ ковариации (МАНКОВА).
- Многомерная регрессия пытается определить формулу, которая может описывать, как элементы вектора переменных одновременно реагируют на изменения в других. Для линейных отношений регрессионный анализ здесь основан на формах общая линейная модель. Некоторые предполагают, что многомерная регрессия отличается от многомерной регрессии, однако это обсуждается и не всегда верно в разных областях науки.[1]
- Анализ основных компонентов (PCA) создает новый набор ортогональных переменных, которые содержат ту же информацию, что и исходный набор. Он вращает оси вариации, чтобы получить новый набор ортогональных осей, упорядоченных так, чтобы они суммировали уменьшающиеся пропорции вариации.
- Факторный анализ аналогичен PCA, но позволяет пользователю извлекать указанное количество синтетических переменных, меньшее, чем исходный набор, оставляя оставшееся необъяснимое изменение как ошибку. Извлеченные переменные известны как скрытые переменные или факторы; Предполагается, что каждый из них учитывает ковариацию в группе наблюдаемых переменных.
- Канонический корреляционный анализ находит линейные отношения между двумя наборами переменных; это обобщенная (т.е. каноническая) версия двумерной[2] корреляция.
- Анализ избыточности (RDA) аналогичен каноническому корреляционному анализу, но позволяет пользователю получить указанное количество синтетических переменных из одного набора (независимых) переменных, которые объясняют как можно большую дисперсию в другом (независимом) наборе. Это многомерный аналог регресс.
- Анализ корреспонденции (CA), или взаимное усреднение, находит (как и PCA) набор синтетических переменных, которые суммируют исходный набор. Базовая модель предполагает несходство хи-квадрат среди записей (наблюдений).
- Канонический (или "ограниченный") анализ соответствия (CCA) для резюмирования совместной вариации двух наборов переменных (например, анализ избыточности); сочетание анализа соответствия и многомерного регрессионного анализа. Базовая модель предполагает несходство хи-квадрат среди записей (наблюдений).
- Многомерное масштабирование содержит различные алгоритмы для определения набора синтетических переменных, которые наилучшим образом представляют попарные расстояния между записями. Оригинальный метод анализ главных координат (PCoA; на основе PCA).
- Дискриминантный анализ, или канонический вариативный анализ, пытается установить, можно ли использовать набор переменных для различения двух или более групп наблюдений.
- Линейный дискриминантный анализ (LDA) вычисляет линейный предиктор из двух наборов нормально распределенных данных для классификации новых наблюдений.
- Системы кластеризации назначать объекты в группы (называемые кластерами), чтобы объекты (случаи) из одного кластера были более похожи друг на друга, чем объекты из разных кластеров.
- Рекурсивное разбиение создает дерево решений, которое пытается правильно классифицировать членов совокупности на основе дихотомической зависимой переменной.
- Искусственные нейронные сети распространить методы регрессии и кластеризации на нелинейные многомерные модели.
- Статистическая графика такие как туры, графики в параллельных координатахматрицы диаграммы рассеяния могут использоваться для исследования многомерных данных.
- Модели одновременных уравнений включают более одного уравнения регрессии с разными зависимыми переменными, оцениваемыми вместе.
- Векторная авторегрессия предполагает одновременную регрессию различных Временные ряды переменные сами по себе и значения друг друга с запаздыванием.
- Основные кривые отклика Анализ (PRC) - это метод, основанный на RDA, который позволяет пользователю сосредоточиться на эффектах лечения с течением времени, корректируя изменения в контрольных обработках с течением времени.[3]
Важные распределения вероятностей
Есть набор распределения вероятностей используется в многомерном анализе, который играет роль, аналогичную соответствующему набору распределений, используемых в одномерный анализ когда нормальное распределение подходит для набора данных. Вот эти многомерные распределения:
В Обратное распределение Уишарта важно в Байесовский вывод, например в Байесовская многомерная линейная регрессия. Кроме того, Распределение Т-квадрата Хотеллинга - многомерное распределение, обобщающее Распределение Стьюдента, который используется в многомерном проверка гипотезы.
История
Учебник Андерсона 1958 года, Введение в многомерный анализ,[4] воспитал поколение теоретиков и прикладных статистиков; В книге Андерсона подчеркивается проверка гипотезы через тесты отношения правдоподобия и свойства степенные функции: допустимость, непредвзятость и монотонность.[5][6]
Программное обеспечение и инструменты
Существует огромное количество программных пакетов и других инструментов для многомерного анализа, в том числе:
- JMP (статистическое программное обеспечение)
- MiniTab
- Calc
- PSPP
- р[7]
- SAS (программное обеспечение)
- SciPy за Python
- SPSS
- Stata
- СТАТИСТИКА
- Расшифровщик
- WarpPLS
- SmartPLS
- MATLAB
- Eviews
Смотрите также
- Оценка ковариационных матриц
- Важные публикации по многомерному анализу
- Многовариантное тестирование в маркетинге
- Анализ структурированных данных (статистика)
- Структурное моделирование уравнение
- Коэффициент RV
Рекомендации
- ^ Идальго, B; Гудман, М. (2013). "Многомерная или многомерная регрессия?". Am J Public Health. 103: 39–40. Дои:10.2105 / AJPH.2012.300897. ЧВК 3518362. PMID 23153131.
- ^ Неискушенные аналитики двумерных гауссовских задач могут найти полезными грубые, но точные метод точной оценки вероятности, просто взяв сумму S из N квадраты остатков, вычитая сумму См как минимум, разделив эту разницу на См, умножая результат на (N - 2) и взяв обратное анти-ln половины этого произведения.
- ^ тер Браак, Кахо Й.Ф. и Шмилауэр, Петр (2012). Справочное руководство и руководство пользователя Canoco: программное обеспечение для ординации (версия 5.0), стр.292. Microcomputer Power, Итака, штат Нью-Йорк.
- ^ T.W. Андерсон (1958) Введение в многомерный анализ, Нью-Йорк: Wiley ISBN 0471026409; 2e (1984) ISBN 0471889873; 3e (2003) ISBN 0471360910
- ^ Сен, Пранаб Кумар; Андерсон, Т. У .; Арнольд, С. Ф .; Eaton, M. L .; Giri, N.C .; Gnanadesikan, R .; Kendall, M. G .; Kshirsagar, A.M .; и другие. (Июнь 1986 г.). «Обзор: Современные учебники по многомерному статистическому анализу: панорамная оценка и критика». Журнал Американской статистической ассоциации. 81 (394): 560–564. Дои:10.2307/2289251. ISSN 0162-1459. JSTOR 2289251.(Страницы 560–561)
- ^ Шервиш, Марк Дж. (Ноябрь 1987 г.). «Обзор многомерного анализа». Статистическая наука. 2 (4): 396–413. Дои:10.1214 / сс / 1177013111. ISSN 0883-4237. JSTOR 2245530.
- ^ КРАН содержит подробную информацию о пакетах, доступных для многомерного анализа данных
дальнейшее чтение
- Джонсон, Ричард А .; Уичерн, Дин В. (2007). Прикладной многомерный статистический анализ (Шестое изд.). Прентис Холл. ISBN 978-0-13-187715-3.CS1 maint: ref = harv (связь)
- КВ Мардиа; Дж. Т. Кент; Дж. М. Бибби (1979). Многомерный анализ. Академическая пресса. ISBN 0-12-471252-5.
- А. Сен, М. Шривастава, Регрессионный анализ - теория, методы и приложения, Springer-Verlag, Берлин, 2011 (4-е издание).
- Кук, Суэйн (2007). Интерактивная графика для анализа данных.
- Малакути, Б. (2013). Операционные и производственные системы с множеством целей. Джон Вили и сыновья.
внешняя ссылка
Викискладе есть медиафайлы по теме Многовариантная статистика. |