WikiDer > Распространение веры

Belief propagation

Распространение веры, также известный как передача сообщения сумма-произведение, это передача сообщений алгоритм для выполнения вывод на графические модели, Такие как Байесовские сети и Марковские случайные поля. Он вычисляет предельное распределение для каждого ненаблюдаемого узла (или переменной), обусловленного любыми наблюдаемыми узлами (или переменными). Распространение убеждений обычно используется в искусственный интеллект и теория информации и продемонстрировал эмпирический успех во многих приложениях, включая коды с низкой плотностью проверки четности, турбокоды, свободная энергия приближение и выполнимость.[1]

Алгоритм был впервые предложен Жемчужина Иудеи в 1982 г.,[2] кто сформулировал его как алгоритм точного вывода на деревья, который позже был расширен до многодеревья.[3] Хотя он не является точным для общих графиков, он оказался полезным приближенным алгоритмом.[4]

Если Икс={Икся} - это набор дискретный случайные переменные с соединение функция массы п, то предельное распределение одного Икся это просто сумма п по всем остальным переменным:

Однако это быстро становится невыполнимым с вычислительной точки зрения: если имеется 100 двоичных переменных, то нужно суммировать более 299 ≈ 6.338 × 1029 возможные значения. Используя структуру многодерева, распространение убеждений позволяет намного более эффективно вычислять маргинальные значения.

Описание алгоритма сумм-произведений

Варианты алгоритма распространения убеждений существуют для нескольких типов графических моделей (Байесовские сети и Марковские случайные поля[5] особенно). Мы описываем здесь вариант, который действует на факторный график. Факторный граф - это двудольный граф содержащие узлы, соответствующие переменным V и факторы F, с ребрами между переменными и факторами, в которых они фигурируют. Мы можем написать совместную функцию масс:

куда Икса - вектор соседних переменных узлов к факторному узлу а. Любой Байесовская сеть или же Марковское случайное поле может быть представлен как факторный граф, используя фактор для каждого узла с его родителями или фактор для каждого узла с его окрестностями соответственно.[6]

Алгоритм работает, передавая вещественные функции, называемые Сообщения вместе с краями между скрытыми узлами. Точнее, если v является переменным узлом и а факторный узел, связанный с v на факторном графике сообщения от v к а, (обозначается ) и из а к v (), являются действительными функциями, область определения которых есть Dom (v), набор значений, которые может принимать случайная величина, связанная с v. Эти сообщения содержат «влияние», которое одна переменная оказывает на другую. Сообщения вычисляются по-разному в зависимости от того, является ли узел, получающий сообщение, узлом переменной или узлом фактора. Сохраняя те же обозначения:

  • Сообщение от переменной узла v к факторному узлу а является продуктом сообщений от всех других соседних узлов-факторов (кроме получателя; в качестве альтернативы можно сказать, что получатель отправляет в качестве сообщения постоянную функцию, равную "1"):
куда N(v) - множество соседних (факторных) узлов к v. Если пусто, то установлен на равномерное распределение.
  • Сообщение от факторного узла а к переменному узлу v является продуктом фактора с сообщениями от всех других узлов, маргинальными по всем переменным, кроме той, которая связана с v:
куда N(а) - множество соседних (переменных) узлов к а. Если тогда пусто , поскольку в этом случае .

Как показывает предыдущая формула: полная маргинализация сводится к сумме произведений более простых условий, чем те, которые фигурируют в полном совместном распределении. По этой причине он называется алгоритмом сумм-произведений.

При типичном запуске каждое сообщение будет обновляться итеративно из предыдущего значения соседних сообщений. Для обновления сообщений можно использовать другое расписание. В случае, когда графическая модель представляет собой дерево, оптимальное планирование позволяет достичь сходимости после вычисления каждого сообщения только один раз (см. Следующий подраздел). Когда у факторного графа есть циклы, такого оптимального расписания не существует, и типичный выбор - обновлять все сообщения одновременно на каждой итерации.

После сходимости (если сходимость произошла) предполагаемое маржинальное распределение каждого узла пропорционально произведению всех сообщений от смежных факторов (без константы нормализации):

Точно так же предполагаемое совместное предельное распределение набора переменных, принадлежащих одному фактору, пропорционально произведению фактора и сообщений от переменных:

В случае, когда фактор-граф является ациклическим (то есть является деревом или лесом), эти оцененные маргиналы фактически сходятся к истинным маргиналам за конечное число итераций. Это может быть показано математическая индукция.

Точный алгоритм для деревьев

В случае, когда факторный график это дерево, алгоритм распространения уверенности вычислит точные маргиналы. Кроме того, при правильном планировании обновлений сообщения оно прекратится после 2 шагов. Это оптимальное расписание можно описать следующим образом:

Перед тем как начать, граф ориентируется путем обозначения одного узла как корень; любой некорневой узел, который подключен только к одному другому узлу, называется лист.

На первом этапе сообщения передаются внутрь: начиная с листьев, каждый узел передает сообщение вдоль (уникального) края к корневому узлу. Древовидная структура гарантирует, что можно получить сообщения от всех других смежных узлов до передачи сообщения. Это продолжается до тех пор, пока корень не получит сообщения от всех своих соседних узлов.

Второй шаг включает передачу сообщений обратно: начиная с корня, сообщения передаются в обратном направлении. Алгоритм завершается, когда все листья получили свои сообщения.

Приближенный алгоритм построения общих графиков

Любопытно, что хотя изначально он был разработан для ациклических графических моделей, было обнаружено, что алгоритм распространения убеждений может использоваться в целом. графики. Затем алгоритм иногда называют шаткое распространение убеждений, потому что графики обычно содержат циклы, или петли. Инициализация и планирование обновлений сообщений должны быть немного скорректированы (по сравнению с ранее описанным расписанием для ациклических графов), потому что графы могут не содержать листьев. Вместо этого каждый инициализирует все сообщения переменных в 1 и использует те же определения сообщений, что и выше, обновляя все сообщения на каждой итерации (хотя сообщения, поступающие из известных листьев или подграфов с древовидной структурой, могут больше не нуждаться в обновлении после достаточных итераций). Легко показать, что в дереве определения сообщений этой модифицированной процедуры сходятся к набору определений сообщений, приведенных выше, в течение количества итераций, равных диаметр дерева.

Точные условия, при которых будет сходиться неуместное распространение веры, все еще не совсем понятны; известно, что на графах, содержащих один цикл, в большинстве случаев он сходится, но полученные вероятности могут быть неверными.[7] Существует несколько достаточных (но не необходимых) условий для сходимости зацикленного распространения убеждений к единственной фиксированной точке.[8] Существуют графики, которые не могут сойтись или которые будут колебаться между несколькими состояниями при повторении итераций. Такие методы, как Графики выхода может предоставить приблизительную визуализацию прогресса распространения убеждений и приблизительный тест на сходимость.

Существуют и другие приблизительные методы маргинализации, в том числе вариационные методы и Методы Монте-Карло.

Один из методов точной маргинализации в общих графах называется алгоритм дерева соединений, который является простым распространением убеждений на модифицированном графе, который гарантированно является деревом. Основная предпосылка - исключить циклы путем их кластеризации в отдельные узлы.

Связанный алгоритм и проблемы сложности

Подобный алгоритм обычно называют Алгоритм Витерби, но также известен как частный случай алгоритма max-product или min-sum, который решает связанную проблему максимизации или наиболее вероятного объяснения. Вместо того, чтобы пытаться решить маргинальное значение, цель здесь - найти значения которая максимизирует глобальную функцию (т.е. наиболее вероятные значения в вероятностной настройке), и ее можно определить с помощью arg max:

Алгоритм, который решает эту проблему, почти идентичен распространению убеждений, с суммами, замененными максимумами в определениях.[9]

Стоит отметить, что вывод такие проблемы, как маргинализация и максимизация NP-жесткий решить точно и приблизительно (хотя бы для относительная ошибка) в графической модели. Точнее, определенная выше проблема маргинализации # P-complete и максимизация НП-полный.

Использование памяти при распространении убеждений может быть уменьшено за счет использования Алгоритм острова (при небольших затратах по времени).

Отношение к свободной энергии

Алгоритм сумм-произведений связан с вычислением свободная энергия в термодинамика. Позволять Z быть функция распределения. Распределение вероятностей

(согласно представлению факторного графа) можно рассматривать как меру внутренняя энергия присутствует в системе, вычисляется как

Тогда свободная энергия системы равна

Затем можно показать, что точки сходимости алгоритма сумм-произведений представляют собой точки, где свободная энергия в такой системе минимизирована. Точно так же можно показать, что фиксированная точка итеративного алгоритма распространения уверенности в графах с циклами является стационарной точкой приближения свободной энергии.[10]

Распространение обобщенных убеждений (GBP)

Алгоритмы распространения убеждений обычно представлены в виде уравнений обновления сообщений на факторном графе, включая сообщения между переменными узлами и соседними с ними факторными узлами и наоборот. Рассмотрение сообщений между регионы в графе - это один из способов обобщения алгоритма распространения убеждений.[10] Есть несколько способов определить набор регионов на графе, которые могут обмениваться сообщениями. Один метод использует идеи, представленные Кикучи в физической литературе,[11][12][13] и известен как Кикучи метод кластерной вариации.[14]

Улучшения в производительности алгоритмов распространения убеждений также достижимы путем нарушения симметрии реплик в распределении полей (сообщений). Это обобщение приводит к новому виду алгоритма, который называется распространение обзора (SP), которые оказались очень эффективными в НП-полный проблемы вроде выполнимость[1]и раскраска графика.

Кластерный вариационный метод и алгоритмы распространения опроса - это два различных улучшения распространения убеждений. Название распространение обобщенного обзора (GSP) ожидает присвоения алгоритму, объединяющему оба обобщения.

Распространение веры по Гауссу (GaBP)

Распространение веры по Гауссу - это вариант алгоритма распространения веры, когда лежащий в основе распределения гауссовы. Первой работой, посвященной анализу этой специальной модели, была основополагающая работа Вайсса и Фримена.[15]

Алгоритм GaBP решает следующую проблему маргинализации:

где Z - нормировочная постоянная, А симметричный положительно определенная матрица (матрица обратной ковариации или матрица точности) и б - вектор сдвига.

Равным образом можно показать, что с использованием гауссовой модели решение проблемы маргинализации эквивалентно решению проблемы маргинализации. КАРТА проблема назначения:

Эта задача также эквивалентна следующей задаче минимизации квадратичной формы:

Что также эквивалентно линейной системе уравнений

Сходимость алгоритма GaBP легче анализировать (по сравнению с общим случаем BP), и есть два известных достаточных условия сходимости. Первый был сформулирован Weiss et al. в 2000 году, когда информационная матрица A диагонально доминирующий. Второе условие сходимости сформулировано Johnson et al.[16] в 2006 году, когда спектральный радиус матрицы

куда D = диаг (А). Позже Су и Ву установили необходимые и достаточные условия сходимости для синхронного GaBP и затухающего GaBP, а также другое достаточное условие сходимости для асинхронного GaBP. Для каждого случая условие сходимости включает проверку 1) непустого набора (определяемого A), 2) спектрального радиуса определенной матрицы меньше единицы и 3) проблемы сингулярности (при преобразовании сообщения BP в убеждение ) не происходит.[17]

Алгоритм GaBP был связан с областью линейной алгебры,[18] и было показано, что алгоритм GaBP можно рассматривать как итерационный алгоритм решения линейной системы уравненийТопор = б куда А информационная матрица и б - вектор сдвига. Эмпирически показано, что алгоритм GaBP сходится быстрее, чем классические итерационные методы, такие как метод Якоби. Метод Гаусса – Зейделя, последовательное чрезмерное расслабление, и другие.[19] Кроме того, показано, что алгоритм GaBP невосприимчив к численным проблемам предварительно обусловленного метод сопряженных градиентов[20]

Синдромное декодирование АД

Предыдущее описание алгоритма BP называется декодированием на основе кодовых слов, которое вычисляет приблизительную предельную вероятность , учитывая полученное кодовое слово . Есть эквивалентная форма,[21] которые вычисляют , куда это синдром полученного кодового слова и это декодированная ошибка. Декодированный входной вектор . Эта вариация меняет только интерпретацию функции масс . В явном виде сообщения

куда вероятность априорной ошибки для переменной

Этот синдромный декодер не требует информации о полученных битах, поэтому может быть адаптирован к квантовым кодам, где единственной информацией является синдром измерения.

В двоичном случае , эти сообщения можно упростить, чтобы вызвать экспоненциальное сокращение в сложности[22][23]

Определите логарифмическое отношение правдоподобия , , тогда

куда

Отношение апостериорного логарифмического правдоподобия можно оценить как

Рекомендации

  1. ^ а б Браунштейн, А .; Mézard, M .; Zecchina, R. (2005). «Обзор распространения: алгоритм выполнения». Случайные структуры и алгоритмы. 27 (2): 201–226. arXiv:cs / 0212002. Дои:10.1002 / rsa.20057.
  2. ^ Жемчужина, Иудея (1982). «Преподобный Байес о машинах логического вывода: распределенный иерархический подход» (PDF). Труды Второй Национальной конференции по искусственному интеллекту. AAAI-82: Питтсбург, Пенсильвания. Менло-Парк, Калифорния: AAAI Press. стр. 133–136. Получено 28 марта 2009.
  3. ^ Kim, Jin H .; Жемчужина, Иудея (1983). «Вычислительная модель для комбинированных причинно-следственных и диагностических рассуждений в системах вывода» (PDF). Материалы восьмой международной совместной конференции по искусственному интеллекту. IJCAI-83: ​​Карлсруэ, Германия. 1. стр. 190–193. Получено 20 марта 2016.
  4. ^ Жемчужина, Иудея (1988). Вероятностное мышление в интеллектуальных системах: сети правдоподобных выводов (2-е изд.). Сан-Франциско, Калифорния: Морган Кауфманн. ISBN 978-1-55860-479-7.
  5. ^ Yedidia, J.S .; Freeman, W.T .; Ю. (январь 2003 г.). "Понимание распространения убеждений и их обобщений". В Лакемейере, Герхард; Небель, Бернхард (ред.). Изучение искусственного интеллекта в новом тысячелетии. Морган Кауфманн. С. 239–236. ISBN 978-1-55860-811-5. Получено 30 марта 2009.
  6. ^ Wainwright, M. J .; Джордан, М. И. (2007). «2.1 Распределения вероятностей на графах». Графические модели, экспоненциальные семейства и вариационный вывод. Основы и тенденции в машинном обучении. 1. С. 5–9. Дои:10.1561/2200000001.
  7. ^ Вайс, Яир (2000). "Корректность локального распространения вероятности в графических моделях с петлями". Нейронные вычисления. 12 (1): 1–41. Дои:10.1162/089976600300015880. PMID 10636932.
  8. ^ Mooij, J; Каппен, Х (2007). «Достаточные условия сходимости алгоритма сумма – произведение». IEEE Transactions по теории информации. 53 (12): 4422–4437. arXiv:cs / 0504030. Дои:10.1109 / TIT.2007.909166.
  9. ^ Лёлигер, Ханс-Андреа (2004). «Введение в факторные графы». Журнал IEEE Signal Processing Magazine. 21 (1): 28–41. Bibcode:2004ISPM ... 21 ... 28L. Дои:10.1109 / msp.2004.1267047.
  10. ^ а б Yedidia, J.S .; Freeman, W.T .; Weiss, Y .; Ю. (июль 2005 г.). «Построение приближений свободной энергии и обобщенных алгоритмов распространения убеждений». IEEE Transactions по теории информации. 51 (7): 2282–2312. CiteSeerX 10.1.1.3.5650. Дои:10.1109 / TIT.2005.850085. Получено 28 марта 2009.
  11. ^ Кикучи, Рёичи (15 марта 1951 г.). «Теория кооперативных явлений». Физический обзор. 81 (6): 988–1003. Bibcode:1951ПхРв ... 81..988К. Дои:10.1103 / PhysRev.81.988.
  12. ^ Курата, Мичио; Кикучи, Рёичи; Ватари, Тацуро (1953). "Теория кооперативных явлений. III. Подробное обсуждение метода вариации кластеров". Журнал химической физики. 21 (3): 434–448. Bibcode:1953ЖЧФ..21..434К. Дои:10.1063/1.1698926.
  13. ^ Кикучи, Рёичи; Кисть, Стивен Г. (1967). «Усовершенствование метода вариации кластеров». Журнал химической физики. 47 (1): 195–203. Bibcode:1967ЖЧФ..47..195К. Дои:10.1063/1.1711845.
  14. ^ Пелиццола, Алессандро (2005). «Кластерный вариационный метод в статистической физике и вероятностные графические модели». Журнал физики A: математические и общие. 38 (33): R309 – R339. arXiv:cond-mat / 0508216. Bibcode:2005JPhA ... 38R.309P. Дои:10.1088 / 0305-4470 / 38/33 / R01. ISSN 0305-4470.[постоянная мертвая ссылка]
  15. ^ Вайс, Яир; Фриман, Уильям Т. (октябрь 2001 г.). "Корректность распространения убеждений в гауссовских графических моделях произвольной топологии". Нейронные вычисления. 13 (10): 2173–2200. CiteSeerX 10.1.1.44.794. Дои:10.1162/089976601750541769. PMID 11570995.
  16. ^ Малиутов, Дмитрий М .; Джонсон, Джейсон К .; Вилски, Алан С. (октябрь 2006 г.). «Прогулочные суммы и распространение убеждений в гауссовских графических моделях». Журнал исследований в области машинного обучения. 7: 2031–2064. Получено 28 марта 2009.
  17. ^ Су, Циньлян; Ву, Ик-Чунг (март 2015 г.). «Об условиях сходимости распространения гауссовских убеждений». IEEE Trans. Сигнальный процесс. 63 (5): 1144–1155. Bibcode:2015ITSP ... 63.1144S. Дои:10.1109 / TSP.2015.2389755.
  18. ^ Решатель распространения веры по Гауссу для систем линейных уравнений. Авторы О. Шентал, Д. Биксон, П. Х. Сигель, Дж. К. Вольф и Д. Долев, IEEE Int. Symp. по Информ. Theory (ISIT), Торонто, Канада, июль 2008 г. http://www.cs.huji.ac.il/labs/danss/p2p/gabp/ В архиве 14 июня 2011 г. Wayback Machine
  19. ^ Линейное обнаружение через распространение убеждений. Дэнни Биксон, Дэнни Долев, Ори Шентал, Пол Х. Сигел и Джек К. Вольф. На 45-й ежегодной конференции Allerton по коммуникациям, управлению и вычислениям, Allerton House, штат Иллинойс, 7 сентября. http://www.cs.huji.ac.il/labs/danss/p2p/gabp/ В архиве 14 июня 2011 г. Wayback Machine
  20. ^ Максимизация распределенной крупномасштабной сетевой утилиты. Д. Биксон, Ю. Ток, А. Зимнис, С. Бойд и Д. Долев. На Международном симпозиуме по теории информации (ISIT), июль 2009 г. http://www.cs.huji.ac.il/labs/danss/p2p/gabp/ В архиве 14 июня 2011 г. Wayback Machine
  21. ^ Дэйв, Маулик А. (1 декабря 2006 г.). "Обзор" теории информации, логических выводов и алгоритмов обучения Дэвида Дж. К. Маккея ", Cambridge University Press, 2003". Новости ACM SIGACT. 37 (4): 34. Дои:10.1145/1189056.1189063. ISSN 0163-5700.
  22. ^ Филлер, Томас (17 ноября 2009 г.). «Упрощение алгоритма распространения веры» (PDF).
  23. ^ Лю, Е-Хуа; Пулен, Дэвид (22 мая 2019 г.). "Нейронные декодеры распространения веры для квантовых кодов исправления ошибок". Письма с физическими проверками. 122 (20). arXiv:1811.07835. Дои:10.1103 / Physrevlett.122.200501. ISSN 0031-9007. PMID 31172756.

дальнейшее чтение