WikiDer > Анализ соответствия без тренда - Википедия

Detrended correspondence analysis - Wikipedia

Анализ соответствия без тренда (DCA) многомерный статистический техника, широко используемая экологи найти основные факторы или градиенты в больших, богатых видами, но обычно разреженных матрицах данных, которые типизируют экологическое сообщество данные. DCA часто используется для подавления артефактов, присущих большинству других многомерный анализ когда применяется к градиент данные.^[1]

История

DCA была создана в 1979 году Марком Хиллом из Соединенного Королевства Институт экологии суши (ныне объединен в Центр экологии и гидрологии) и реализован в FORTRAN кодовый пакет под названием DECORANA (Анализ соответствия без тренда), анализ корреспонденции метод. DCA иногда ошибочно называют DECORANA; однако DCA - это базовый алгоритм, а DECORANA - инструмент, реализующий его.

Решенные проблемы

По словам Хилла и Гауча,^[2] DCA подавляет два артефакта, присущих большинству других многомерных анализов, когда применяется к градиент данные. Примером может служить временной ряд видов растений, заселяющих новую среду обитания; рано сукцессионные виды сменяются среднесукцессионными видами, затем поздними сукцессионными (см. пример ниже). Когда такие данные анализируются стандартным рукоположение например, анализ соответствия:

оценки ординации образцов будут демонстрировать «краевой эффект», то есть дисперсия оценок в начале и в конце регулярной последовательности видов будет значительно меньше, чем в середине,
при представлении в виде графика будет видно, что точки следуют подкова в форме кривой, а не в виде прямой линии («эффект дуги»), даже если анализируемый процесс представляет собой устойчивое и непрерывное изменение, которое человеческая интуиция предпочла бы рассматривать как линейный тренд.

За пределами экологии одни и те же артефакты возникают при анализе данных градиента (например, свойства почвы вдоль разреза, проходящего между двумя разными геологическими условиями, или данные о поведении на протяжении жизни человека), потому что криволинейная проекция является точным представлением формы данных в многомерное пространство.

Тер Браак и Прентис (1987, с. 121) цитируют симуляция исследование, в котором анализируются двумерные модели упаковки видов, приводящие к лучшей производительности DCA по сравнению с CA.

Метод

DCA - это итерационный алгоритм это зарекомендовало себя как высоконадежный и полезный инструмент для исследования и обобщения данных в области экологии сообщества (Shaw 2003). Он начинается с выполнения стандартной ординации (CA или обратного усреднения) для данных, чтобы получить начальную кривую подковы, в которой первая ось ординации искажается на вторую ось. Затем он делит первую ось на сегменты (по умолчанию = 26) и масштабирует каждый сегмент так, чтобы среднее значение на второй оси было равно нулю - это фактически сжимает кривую. Он также изменяет масштаб оси, чтобы концы больше не были сжаты относительно середины, так что 1 единица DCA приближается к той же скорости оборота на всем протяжении данных: практическое правило состоит в том, что 4 единицы DCA означают, что есть был общий оборот в сообществе. Тер Браак и Прентис (1987, стр. 122) предостерегают от нелинейного изменения масштаба осей из-за проблем с надежностью и рекомендуют использовать только устранение тренда по полиномам.

Недостатки

Нет тесты значимости доступны с DCA, хотя существует ограниченная (каноническая) версия под названием DCCA, в которой оси принудительно Множественная линейная регрессия оптимально коррелировать с линейная комбинация других (обычно окружающих) переменных; это позволяет протестировать нулевую модель методом Монте-Карло. перестановка анализ.

Пример

В примере показан идеальный набор данных: данные о видах представлены в строках, образцы - в столбцах. Для каждой пробы вдоль градиента вводится новый вид, но другого вида больше нет. В результате получается разреженная матрица. Единицы указывают на присутствие вида в образце. За исключением краев, каждый образец содержит пять видов.

Сравнение анализа соответствия и анализа соответствия без тренда на примере (идеальных) данных. Посмотрите на эффект дуги в CA и его решение в DCA.

Идеальные данные о рукоположении
	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20
SP1	1	1	1	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0
SP2	1	1	1	1	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0
SP3	1	1	1	1	1	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0
SP4	0	1	1	1	1	1	0	0	0	0	0	0	0	0	0	0	0	0	0	0
SP5	0	0	1	1	1	1	1	0	0	0	0	0	0	0	0	0	0	0	0	0
SP6	0	0	0	1	1	1	1	1	0	0	0	0	0	0	0	0	0	0	0	0
SP7	0	0	0	0	1	1	1	1	1	0	0	0	0	0	0	0	0	0	0	0
SP8	0	0	0	0	0	1	1	1	1	1	0	0	0	0	0	0	0	0	0	0
SP9	0	0	0	0	0	0	1	1	1	1	1	0	0	0	0	0	0	0	0	0
SP10	0	0	0	0	0	0	0	1	1	1	1	1	0	0	0	0	0	0	0	0
SP11	0	0	0	0	0	0	0	0	1	1	1	1	1	0	0	0	0	0	0	0
SP12	0	0	0	0	0	0	0	0	0	1	1	1	1	1	0	0	0	0	0	0
SP13	0	0	0	0	0	0	0	0	0	0	1	1	1	1	1	0	0	0	0	0
SP14	0	0	0	0	0	0	0	0	0	0	0	1	1	1	1	1	0	0	0	0
SP15	0	0	0	0	0	0	0	0	0	0	0	0	1	1	1	1	1	0	0	0
SP16	0	0	0	0	0	0	0	0	0	0	0	0	0	1	1	1	1	1	0	0
SP17	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1	1	1	1	1	0
SP18	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1	1	1	1	1
SP19	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1	1	1	1
SP20	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1	1	1

График первых двух осей результата анализа соответствия с правой стороны ясно показывает недостатки этой процедуры: краевой эффект, то есть точки сгруппированы по краям первой оси, и эффект дуги.

Смотрите также

Собственный анализ
Рукоположение (статистика)
Сериация (археология) - включая дополнительные примеры арочного эффекта
Анализ главных компонентов

внешняя ссылка

ПРОШЛОЕ (ПАЛЕонтологическая статистика) - бесплатное программное обеспечение, включая DCA с модификациями по Оксанену и Минчину (1997)
WINBASP - бесплатное программное обеспечение, включая DCA с изменением тренда по полиномам согласно Тер Брааку и Прентису (1988)
веганский: Экологический пакет сообщества за р - бесплатное программное обеспечение, включая функцию decorana: анализ соответствия без тренда и базовое взаимное усреднение от Hill and Gauch (1980)

[1] Хилл и Гаух (1980)

[2] Хилл и Гаух (1980)

[1]

[2]

Navigation