WikiDer > Мажоризация стресса
Мажоризация стресса является стратегия оптимизации используется в многомерное масштабирование (MDS) где для набора п м-мерные элементы данных, конфигурация Икс из п указывает в г (<< м)-мерное пространство, минимизирующее так называемое стресс функция . Обычно р равно 2 или 3, т.е. (п Икс р) матрица Икс перечисляет точки в 2- или 3-мерном Евклидово пространство так что результат может быть визуализирован (т.е. Участок МДС). Функция это стоимость или функция потерь который измеряет квадраты разностей между идеальными (-мерные) расстояния и фактические расстояния в р-мерное пространство. Это определяется как:
куда это вес для измерения между парой точек , это Евклидово расстояние между и и идеальное расстояние между точками (их разнесение) в -мерное пространство данных. Обратите внимание, что может использоваться для указания степени уверенности в сходстве между точками (например, можно указать 0, если нет информации для конкретной пары).
Конфигурация что сводит к минимуму дает график, на котором точки, которые находятся близко друг к другу, соответствуют точкам, которые также находятся близко друг к другу в исходном -мерное пространство данных.
Есть много способов можно свести к минимуму. Например, Краскал[1] рекомендовал итеративный крутой спуск подход. Однако значительно лучший (с точки зрения гарантий и скорости сходимости) метод минимизации напряжения был введен Ян де Леув.[2] Де Леу итеративное мажорирование метод на каждом шаге минимизирует простую выпуклую функцию, которая обе границы сверху и касается поверхности в какой-то момент , называется опорная точка. В выпуклый анализ такая функция называется мажоритарный функция. Этот итеративный процесс мажорирования также называется алгоритмом SMACOF («Масштабирование путем мажорирования сопряженной функции»).
Алгоритм SMACOF
Функция стресса может быть расширен следующим образом:
Обратите внимание, что первый член - это постоянная а второй член квадратичен по X (т. е. для Матрица Гессе V второй член эквивалентен tr) и поэтому относительно легко решается. Третий член ограничен:
куда имеет:
- за
и за
и .
Доказательство этого неравенства Коши-Шварц неравенство, см. Борг[3] (стр. 152–153).
Таким образом, мы имеем простую квадратичную функцию который усиливает стресс:
Тогда итеративная процедура минимизации:
- в kth шаг мы устанавливаем
- остановись, если в противном случае повторить.
Было показано, что этот алгоритм монотонно снижает напряжение (см. De Leeuw[2]).
Использование в рисовании графиков
Мажоризация стресса и алгоритмы, подобные SMACOF, также имеют применение в области рисунок графика.[4][5] То есть можно найти достаточно эстетически привлекательную компоновку для сети или графа, минимизируя функцию напряжения по позициям узлов в графе. В этом случае обычно устанавливаются на теоретико-графовые расстояния между узлами я и j и веса считаются . Здесь, выбирается как компромисс между сохранением идеальных расстояний на больших или малых расстояниях. Хорошие результаты были показаны для .[6]
Рекомендации
- ^ Крускал, Дж. Б. (1964), «Многомерное масштабирование путем оптимизации согласия неметрической гипотезы», Психометрика, 29 (1): 1–27, Дои:10.1007 / BF02289565.
- ^ а б de Leeuw, J. (1977), "Применение выпуклого анализа к многомерному масштабированию", в Barra, J. R .; Brodeau, F .; Romie, G .; и другие. (ред.), Последние изменения в статистике, стр. 133–145.
- ^ Borg, I .; Гроенен, П. (1997), Современное многомерное масштабирование: теория и приложения, Нью-Йорк: Springer-Verlag.
- ^ Michailidis, G .; де Леу, Дж. (2001), "Визуализация данных посредством рисования графиков", Стат. Вычислений., 16 (3): 435–450, CiteSeerX 10.1.1.28.9372, Дои:10.1007 / s001800100077.
- ^ Gansner, E .; Корен, Й .; Норт, С. (2004), «Рисование графика по мажоризации напряжения», Материалы 12-й Междунар. Symp. Графический рисунок (GD'04), Конспект лекций по информатике, 3383, Springer-Verlag, стр. 239–250..
- ^ Коэн, Дж. (1997), «Рисование графиков для передачи близости: метод возрастающей компоновки», Транзакции ACM о взаимодействии компьютера и человека, 4 (3): 197–229, Дои:10.1145/264645.264657.