WikiDer > Многофакторное снижение размерности

Multifactor dimensionality reduction

Многофакторное уменьшение размерности (MDR) статистический подход, также используемый в машинное обучение автоматические подходы,[1] для обнаружения и характеристики комбинаций атрибуты или независимые переменные которые взаимодействуют, чтобы влиять на зависимую переменную или переменную класса.[2][3][4][5][6][7][8] MDR был разработан специально для выявления неаддитивных взаимодействия среди дискретный переменные, влияющие на двоичный результат и считается непараметрический и безмодельная альтернатива традиционным статистическим методам, таким как логистическая регрессия.

В основе метода МДР лежит конструктивная индукция или разработка функций алгоритм, преобразующий две или более переменных или атрибутов в один атрибут.[9] Этот процесс создания нового атрибута изменяет пространство представления данных.[10] Конечная цель - создать или открыть представление, которое облегчает обнаружение нелинейный или неаддитивные взаимодействия между атрибутами, так что предсказание переменной класса улучшается по сравнению с предсказанием исходного представления данных.

Наглядный пример

Рассмотрим следующий простой пример, используя Эксклюзивный или (XOR) функция. XOR - это логический оператор который обычно используется в интеллектуальном анализе данных и машинное обучение как пример функции, которая не является линейно разделимой. В таблице ниже представлен простой набор данных, в котором связь между атрибутами (X1 и X2) и переменной класса (Y) определяется функцией XOR, такой что Y = X1 XOR X2.

Таблица 1

X1X2Y
000
011
101
110

А машинное обучение Алгоритм должен обнаружить или аппроксимировать функцию XOR, чтобы точно предсказать Y, используя информацию о X1 и X2. Альтернативной стратегией было бы сначала изменить представление данных с помощью конструктивной индукции для облегчения прогнозного моделирования. Алгоритм MDR изменит представление данных (X1 и X2) следующим образом. MDR начинается с выбора двух атрибутов. В этом простом примере выбраны X1 и X2. Каждая комбинация значений для X1 и X2 проверяется, и подсчитывается количество раз, когда Y = 1 и / или Y = 0. В этом простом примере Y = 1 встречается ноль раз, а Y = 0 встречается один раз для комбинации X1 = 0 и X2 = 0. С помощью MDR соотношение этих подсчетов вычисляется и сравнивается с фиксированным порогом. Здесь соотношение подсчетов составляет 0/1, что меньше нашего фиксированного порога 1. Поскольку 0/1 <1, мы кодируем новый атрибут (Z) как 0. Когда соотношение больше единицы, мы кодируем Z как 1. Этот процесс повторяется для всех уникальных комбинаций значений X1 и X2. Таблица 2 иллюстрирует наше новое преобразование данных.

Таблица 2

ZY
00
11
11
00

Алгоритму машинного обучения теперь нужно сделать гораздо меньше работы, чтобы найти хорошую прогностическую функцию. Фактически, в этом очень простом примере функция Y = Z имеет точность классификации 1. Приятной особенностью методов конструктивной индукции, таких как MDR, является возможность использовать любой метод интеллектуального анализа данных или машинного обучения для анализа нового представления данные. Деревья решений, нейронные сети, или наивный байесовский классификатор может использоваться в сочетании с показателями качества модели, такими как сбалансированная точность[11][12] и взаимная информация.[13]

Машинное обучение с MDR

Как показано выше, основной алгоритм конструктивной индукции в MDR очень прост. Однако его реализация для шаблонов интеллектуального анализа реальных данных может быть сложной в вычислительном отношении. Как и в случае с любым алгоритмом машинного обучения, всегда есть опасения переоснащение. То есть алгоритмы машинного обучения хороши для поиска закономерностей в полностью случайных данных. Часто бывает трудно определить, является ли заявленный паттерн важным сигналом или просто случайностью. Один из подходов - оценить возможность обобщения модели на независимые наборы данных с использованием таких методов, как перекрестная проверка.[14][15][16][17] Модели, описывающие случайные данные, обычно не обобщают. Другой подход состоит в том, чтобы сгенерировать множество случайных перестановок данных, чтобы увидеть, что обнаружит алгоритм интеллектуального анализа данных, когда ему будет предоставлена ​​возможность переобучения. Перестановочное тестирование позволяет генерировать эмпирический p-значение за результат.[18][19][20][21] Репликация в независимых данных может также предоставить доказательства для модели MDR, но может быть чувствительной к различиям в наборах данных.[22][23] Все эти подходы оказались полезными для выбора и оценки моделей MDR. Важным шагом в машинном обучении является интерпретация. С MDR использовалось несколько подходов, включая энтропийный анализ.[9][24] и анализ путей.[25][26] Были рассмотрены советы и подходы к использованию МЛУ для моделирования взаимодействия генов.[7][27]

Расширения к MDR

Были введены многочисленные расширения MDR. К ним относятся семейные методы,[28][29][30] нечеткие методы,[31] ковариантная корректировка,[32] отношения шансов,[33] оценки риска,[34] методы выживания,[35][36] надежные методы,[37] методы количественных признаков,[38][39] и многие другие.

Приложения MDR

МЛУ в основном применялся для обнаружения взаимодействий ген-ген или эпистаз в генетических исследованиях распространенных заболеваний человека, таких как мерцательная аритмия,[40][41] аутизм,[42] Рак мочевого пузыря,[43][44][45] рак молочной железы,[46] сердечно-сосудистые заболевания,[14] гипертония,[47][48][49] ожирение,[50][51] панкреатический рак,[52] рак простаты[53][54][55] и туберкулез.[56] Он также был применен к другим биомедицинским проблемам, таким как генетический анализ фармакология результаты.[57][58][59] Центральная проблема - масштабирование МЛУ до большое количество данных например, из полногеномные ассоциации исследований (GWAS).[60] Было использовано несколько подходов. Один из подходов - отфильтровать признаки перед анализом MDR.[61] Это можно сделать, используя биологические знания с помощью таких инструментов, как BioFilter.[62] Это также можно сделать с помощью вычислительных инструментов, таких как ReliefF.[63] Другой подход - использовать стохастический поиск такие алгоритмы как генетическое программирование исследовать пространство поиска комбинаций функций.[64] Еще один подход - это перебор с использованием высокопроизводительные вычисления.[65][66][67]

Реализации

Смотрите также

использованная литература

  1. ^ McKinney, Brett A .; Рейф, Дэвид М .; Ричи, Мэрилин Д .; Мур, Джейсон Х. (1 января 2006 г.). «Машинное обучение для обнаружения взаимодействий генов: обзор». Прикладная биоинформатика. 5 (2): 77–88. Дои:10.2165/00822942-200605020-00002. ISSN 1175-5636. ЧВК 3244050. PMID 16722772.
  2. ^ Ричи, Мэрилин Д .; Hahn, Lance W .; Руди, Нади; Бейли, Л. Рене; Дюпон, Уильям Д .; Parl, Fritz F .; Мур, Джейсон Х. (1 июля 2001 г.). «Снижение многофакторной размерности выявляет взаимодействия высокого порядка между генами метаболизма эстрогена при спорадическом раке молочной железы». Американский журнал генетики человека. 69 (1): 138–147. Дои:10.1086/321276. ISSN 0002-9297. ЧВК 1226028. PMID 11404819.
  3. ^ Ричи, Мэрилин Д .; Hahn, Lance W .; Мур, Джейсон Х. (1 февраля 2003 г.). «Сила многофакторного снижения размерности для обнаружения взаимодействий ген-ген при наличии ошибки генотипирования, отсутствующих данных, фенокопии и генетической гетерогенности». Генетическая эпидемиология. 24 (2): 150–157. Дои:10.1002 / gepi.10218. ISSN 1098-2272. PMID 12548676.
  4. ^ Hahn, L.W .; Ritchie, M.D .; Мур, Дж. Х. (12 февраля 2003 г.). «Программное обеспечение для многофакторного уменьшения размерности для обнаружения взаимодействий ген-ген и ген-среда». Биоинформатика. 19 (3): 376–382. Дои:10.1093 / биоинформатика / btf869. ISSN 1367-4803. PMID 12584123.
  5. ^ W., Hahn, Lance; Х., Мур, Джейсон (1 января 2004 г.). «Идеальное различение дискретных клинических конечных точек с использованием мультилокусных генотипов». В биологии Silico. 4 (2). ISSN 1386-6338.
  6. ^ Мур, Джейсон Х. (1 ноября 2004 г.). «Вычислительный анализ взаимодействия генов с использованием многофакторного уменьшения размерности». Экспертный обзор молекулярной диагностики. 4 (6): 795–803. Дои:10.1586/14737159.4.6.795. ISSN 1473-7159. PMID 15525222.
  7. ^ а б Мур, Джейсон Х .; Эндрюс, Питер К. (1 января 2015 г.). Мур, Джейсон Х .; Уильямс, Скотт М. (ред.). Эпистаз. Методы молекулярной биологии. 1253. Springer Нью-Йорк. С. 301–314. Дои:10.1007/978-1-4939-2155-3_16. ISBN 9781493921546. PMID 25403539.
  8. ^ Мур, Джейсон Х. (1 января 2010 г.). Обнаружение, характеристика и интерпретация нелинейных взаимодействий генов с использованием многофакторного уменьшения размерности. Достижения в генетике. 72. С. 101–116. Дои:10.1016 / B978-0-12-380862-2.00005-9. ISBN 9780123808622. ISSN 0065-2660. PMID 21029850.
  9. ^ а б Мур, Джейсон Х .; Гилберт, Джошуа К.; Цай, Чиа-Ти; Чан, Фу-Тянь; Холден, Тодд; Барни, Нейт; Уайт, Билл К. (21 июля 2006 г.). «Гибкая вычислительная структура для обнаружения, характеристики и интерпретации статистических моделей эпистаза в генетических исследованиях восприимчивости человека к болезням». Журнал теоретической биологии. 241 (2): 252–261. Дои:10.1016 / j.jtbi.2005.11.036. PMID 16457852.
  10. ^ Михальский, Р. (февраль 1983 г.). «Теория и методология индуктивного обучения». Искусственный интеллект. 20 (2): 111–161. Дои:10.1016/0004-3702(83)90016-4.
  11. ^ Velez, Digna R .; Уайт, Билл С .; Motsinger, Alison A .; Буш, Уильям С .; Ричи, Мэрилин Д .; Уильямс, Скотт М .; Мур, Джейсон Х. (1 мая 2007 г.). «Функция сбалансированной точности для моделирования эпистазов в несбалансированных наборах данных с использованием многофакторного уменьшения размерности». Генетическая эпидемиология. 31 (4): 306–315. Дои:10.1002 / gepi.20211. ISSN 0741-0395. PMID 17323372.
  12. ^ Намкунг, Чонхён; Ким, Кюнга; Йи, Сунгон; Чанг, Вонил; Квон, Мин-Сок; Пак, Тэсон (1 февраля 2009 г.). «Новые методы оценки для многофакторных классификаторов уменьшения размерности в анализе взаимодействия генов». Биоинформатика. 25 (3): 338–345. Дои:10.1093 / биоинформатика / btn629. ISSN 1367-4811. PMID 19164302.
  13. ^ Буш, Уильям С .; Эдвардс, Тодд Л .; Дудек, Скотт М .; McKinney, Brett A .; Ричи, Мэрилин Д. (1 января 2008 г.). «Альтернативные таблицы непредвиденных обстоятельств улучшают мощность и обнаруживают многофакторное снижение размерности». BMC Bioinformatics. 9: 238. Дои:10.1186/1471-2105-9-238. ISSN 1471-2105. ЧВК 2412877. PMID 18485205.
  14. ^ а б Коффи, Кристофер С .; Hebert, Patricia R .; Ричи, Мэрилин Д .; Krumholz, Harlan M .; Газиано, Дж. Майкл; Ридкер, Пол М .; Браун, Нэнси Дж .; Vaughan, Douglas E .; Мур, Джейсон Х. (1 января 2004 г.). «Применение условной логистической регрессии и многофакторного уменьшения размерности для обнаружения взаимодействий генов с риском инфаркта миокарда: важность проверки модели». BMC Bioinformatics. 5: 49. Дои:10.1186/1471-2105-5-49. ISSN 1471-2105. ЧВК 419697. PMID 15119966.
  15. ^ Motsinger, Alison A .; Ричи, Мэрилин Д. (1 сентября 2006 г.). «Влияние сокращения интервалов перекрестной проверки на эффективность многофакторного снижения размерности». Генетическая эпидемиология. 30 (6): 546–555. Дои:10.1002 / gepi.20166. ISSN 1098-2272. PMID 16800004.
  16. ^ Гори, Джеффри Дж .; Суини, Холли С.; Рейф, Дэвид М .; Моцингер-Райф, Элисон А. (5 ноября 2012 г.). «Сравнение методов валидации внутренней модели для многофакторного снижения размерности в случае генетической гетерогенности». BMC Research Notes. 5: 623. Дои:10.1186/1756-0500-5-623. ISSN 1756-0500. ЧВК 3599301. PMID 23126544.
  17. ^ Уинхэм, Стейси Дж .; Слейтер, Эндрю Дж .; Моцингер-Райф, Элисон А. (22 июля 2010 г.). «Сравнение методов внутренней проверки для многофакторного снижения размерности». BMC Bioinformatics. 11: 394. Дои:10.1186/1471-2105-11-394. ISSN 1471-2105. ЧВК 2920275. PMID 20650002.
  18. ^ Паттин, Кристина А .; Уайт, Билл С .; Барни, Нейт; Гуй, Цзян; Нельсон, Хизер Х .; Келси, Карл Т .; Эндрю, Анджелина С .; Карагас, Маргарет Р .; Мур, Джейсон Х. (1 января 2009 г.). «Вычислительно эффективный метод проверки гипотез для анализа эпистаза с использованием многофакторного уменьшения размерности». Генетическая эпидемиология. 33 (1): 87–94. Дои:10.1002 / gepi.20360. ISSN 1098-2272. ЧВК 2700860. PMID 18671250.
  19. ^ Грин, Кейси С .; Himmelstein, Daniel S .; Нельсон, Хизер Х .; Келси, Карл Т .; Уильямс, Скотт М .; Эндрю, Анджелина С .; Карагас, Маргарет Р .; Мур, Джейсон Х. (1 октября 2009 г.). Биокомпьютинг 2010. Тихоокеанский симпозиум по биокомпьютингу. Тихоокеанский симпозиум по биокомпьютингу. МИРОВАЯ НАУЧНАЯ. С. 327–336. Дои:10.1142/9789814295291_0035. ISBN 9789814299473. ЧВК 2916690. PMID 19908385.
  20. ^ Дай, Хунъин; Бхандари, Мадхусудан; Беккер, Мара; Лидер, Дж. Стивен; Гедигк, Роджер; Моцингер-Райф, Элисон А. (22 мая 2012 г.). «Глобальные тесты P-значений для моделей многофакторного снижения размерности при выборе оптимального количества целевых генов». BioData Mining. 5 (1): 3. Дои:10.1186/1756-0381-5-3. ISSN 1756-0381. ЧВК 3508622. PMID 22616673.
  21. ^ Моцингер-Райф, Элисон А. (30 декабря 2008 г.). «Влияние альтернативных стратегий тестирования перестановок на производительность многофакторного уменьшения размерности». BMC Research Notes. 1: 139. Дои:10.1186/1756-0500-1-139. ISSN 1756-0500. ЧВК 2631601. PMID 19116021.
  22. ^ Грин, Кейси С .; Penrod, Nadia M .; Уильямс, Скотт М .; Мур, Джейсон Х. (2 июня 2009 г.). «Неспособность воспроизвести генетическую ассоциацию может дать важные ключи к разгадке генетической архитектуры». PLOS One. 4 (6): e5639. Bibcode:2009PLoSO ... 4.5639G. Дои:10.1371 / journal.pone.0005639. ISSN 1932-6203. ЧВК 2685469. PMID 19503614.
  23. ^ Piette, Elizabeth R .; Мур, Джейсон Х. (19 апреля 2017 г.). Повышение воспроизводимости результатов генетической ассоциации с использованием методов повторной выборки генотипа. Приложения эволюционных вычислений. Конспект лекций по информатике. 10199. С. 96–108. Дои:10.1007/978-3-319-55849-3_7. ISBN 978-3-319-55848-6.
  24. ^ Мур, Джейсон Х .; Ху, Тин (1 января 2015 г.). Анализ эпистазов с использованием теории информации. Методы молекулярной биологии. 1253. С. 257–268. Дои:10.1007/978-1-4939-2155-3_13. ISBN 978-1-4939-2154-6. ISSN 1940-6029. PMID 25403536.
  25. ^ Ким, Нора Чанг; Эндрюс, Питер С .; Asselbergs, Folkert W .; Фрост, Х. Роберт; Уильямс, Скотт М .; Харрис, Брент Т .; Читай, Синтия; Аскленд, Кэтлин Д .; Мур, Джейсон Х. (28 июля 2012 г.). «Анализ генной онтологии парных генетических ассоциаций в двух полногеномных исследованиях спорадического БАС». BioData Mining. 5 (1): 9. Дои:10.1186/1756-0381-5-9. ISSN 1756-0381. ЧВК 3463436. PMID 22839596.
  26. ^ Ченг, Саманта; Эндрю, Анджелина С .; Эндрюс, Питер С .; Мур, Джейсон Х. (1 января 2016 г.). «Комплексный системный анализ предрасположенности к раку мочевого пузыря показывает роль декарбоксилазы в двух полногеномных ассоциативных исследованиях». BioData Mining. 9: 40. Дои:10.1186 / s13040-016-0119-z. ЧВК 5154053. PMID 27999618.
  27. ^ Гола, Дамиан; Махачи Джон, Джестина М .; ван Стин, Кристель; Кениг, Инке Р. (1 марта 2016 г.). «Дорожная карта к методам многофакторного снижения размерности». Брифинги по биоинформатике. 17 (2): 293–308. Дои:10.1093 / bib / bbv038. ISSN 1477-4054. ЧВК 4793893. PMID 26108231.
  28. ^ Martin, E. R .; Ritchie, M.D .; Hahn, L .; Kang, S .; Мур, Дж. Х. (1 февраля 2006 г.). «Новый метод определения эффектов генов в нуклеарных семьях: MDR-PDT». Генетическая эпидемиология. 30 (2): 111–123. Дои:10.1002 / gepi.20128. ISSN 0741-0395. PMID 16374833.
  29. ^ Лу, Сян-Ян; Чен, Го-Бо; Ян, Лэй; Ма, Дженни З .; Mangold, Jamie E .; Чжу, Цзюнь; Элстон, Роберт С .; Ли, Мин Д. (1 октября 2008 г.). «Комбинаторный подход к обнаружению взаимодействий ген-ген и ген-окружающая среда в семейных исследованиях». Американский журнал генетики человека. 83 (4): 457–467. Дои:10.1016 / j.ajhg.2008.09.001. ISSN 1537-6605. ЧВК 2561932. PMID 18834969.
  30. ^ Каттаерт, Том; Урреа, Виктор; Naj, Adam C .; Де Лобель, Лиззи; Де Вит, Ванесса; Фу, Мао; Махачи Джон, Джестина М .; Шэнь, Хайцин; Калле, М. Луз (22 апреля 2010 г.). «FAM-MDR: гибкий семейный многофакторный метод уменьшения размерности для обнаружения эпистаза с использованием связанных лиц». PLOS One. 5 (4): e10304. Bibcode:2010PLoSO ... 510304C. Дои:10.1371 / journal.pone.0010304. ISSN 1932-6203. ЧВК 2858665. PMID 20421984.
  31. ^ Лим, Сангсоб; Пак, Тэсон (14 марта 2017 г.). «Эмпирический нечеткий многофакторный метод уменьшения размерности для обнаружения взаимодействий генов». BMC Genomics. 18 (Дополнение 2): 115. Дои:10.1186 / с12864-017-3496-х. ISSN 1471-2164. ЧВК 5374597. PMID 28361694.
  32. ^ Гуй, Цзян; Эндрю, Анджелина С .; Эндрюс, Питер; Нельсон, Хизер М .; Келси, Карл Т .; Карагас, Маргарет Р .; Мур, Джейсон Х. (1 января 2010 г.). «Простой и эффективный с точки зрения вычислений подход к выборке для ковариативной корректировки для многофакторного анализа уменьшения размерности эпистаза». Человеческая наследственность. 70 (3): 219–225. Дои:10.1159/000319175. ISSN 1423-0062. ЧВК 2982850. PMID 20924193.
  33. ^ Чанг, Юджин; Ли, Сын Ён; Элстон, Роберт С .; Пак, Тэсон (1 января 2007 г.). «Метод многофакторного снижения размерности на основе отношения шансов для обнаружения взаимодействий генов». Биоинформатика. 23 (1): 71–76. Дои:10.1093 / биоинформатика / btl557. ISSN 1367-4811. PMID 17092990.
  34. ^ Дай, Хунъин; Чарниго, Ричард Дж .; Becker, Mara L .; Лидер, Дж. Стивен; Моцингер-Райф, Элисон А. (8 января 2013 г.). «Моделирование оценок риска множественных взаимодействий генов с использованием агрегированного многофакторного уменьшения размерности». BioData Mining. 6 (1): 1. Дои:10.1186/1756-0381-6-1. ЧВК 3560267. PMID 23294634.
  35. ^ Гуй, Цзян; Мур, Джейсон Х .; Келси, Карл Т .; Марсит, Кармен Дж .; Карагас, Маргарет Р .; Эндрю, Анджелина С. (1 января 2011 г.). «Новый метод многофакторного снижения размерности выживаемости для обнаружения взаимодействий генов с применением для прогноза рака мочевого пузыря». Генетика человека. 129 (1): 101–110. Дои:10.1007 / s00439-010-0905-5. ISSN 1432-1203. ЧВК 3255326. PMID 20981448.
  36. ^ Ли, Сынён; Сын, Донхи; Ю, Вэньбао; Парк, Тэсон (1 декабря 2016 г.). «Анализ взаимодействия генов для модели ускоренного времени отказа с использованием унифицированного метода многофакторного уменьшения размерности на основе модели». Геномика и информатика. 14 (4): 166–172. Дои:10.5808 / GI.2016.14.4.166. ISSN 1598-866X. ЧВК 5287120. PMID 28154507.
  37. ^ Гуй, Цзян; Эндрю, Анджелина С .; Эндрюс, Питер; Нельсон, Хизер М .; Келси, Карл Т .; Карагас, Маргарет Р .; Мур, Джейсон Х. (1 января 2011 г.). «Надежный многофакторный метод уменьшения размерности для обнаружения взаимодействий генов с приложением к генетическому анализу предрасположенности к раку мочевого пузыря». Анналы генетики человека. 75 (1): 20–28. Дои:10.1111 / j.1469-1809.2010.00624.x. ISSN 1469-1809. ЧВК 3057873. PMID 21091664.
  38. ^ Гуй, Цзян; Мур, Джейсон Х .; Уильямс, Скотт М .; Эндрюс, Питер; Hillege, Hans L .; ван дер Харст, Пим; Навис, Гержан; Van Gilst, Wiek H .; Ассельбергс, Фолкерт В. (1 января 2013 г.). «Простой и эффективный с вычислительной точки зрения подход к многофакторному анализу снижения размерности генно-генетических взаимодействий для количественных характеристик». PLOS One. 8 (6): e66545. Bibcode:2013PLoSO ... 866545G. Дои:10.1371 / journal.pone.0066545. ISSN 1932-6203. ЧВК 3689797. PMID 23805232.
  39. ^ Лу, Сян-Ян; Чен, Го-Бо; Ян, Лэй; Ма, Дженни З .; Чжу, Цзюнь; Элстон, Роберт С .; Ли, Мин Д. (1 июня 2007 г.). «Обобщенный комбинаторный подход к обнаружению взаимодействий между генами и генами и средой, применимый к никотиновой зависимости». Американский журнал генетики человека. 80 (6): 1125–1137. Дои:10.1086/518312. ISSN 0002-9297. ЧВК 1867100. PMID 17503330.
  40. ^ Цай, Чиа-Ти; Лай, Линь-Пинг; Линь, Цзюнн-Ли; Чан, Фу-Тянь; Хван, Джуэй-Джен; Ричи, Мэрилин Д .; Мур, Джейсон Х .; Сюй, Куан-Ли; Ценг, Чуэн-Дэн (6 апреля 2004 г.). «Полиморфизмы генов ренин-ангиотензиновой системы и фибрилляция предсердий». Тираж. 109 (13): 1640–1646. Дои:10.1161 / 01.CIR.0000124487.36586.26. ISSN 0009-7322. PMID 15023884.
  41. ^ Asselbergs, Folkert W .; Мур, Джейсон Х .; van den Berg, Maarten P .; Римм, Эрик Б .; де Бур, Рудольф А .; Dullaart, Robin P .; Навис, Гержан; ван Гильст, Вик Х. (1 января 2006 г.). «Роль полиморфизма CETP TaqIB в определении предрасположенности к фибрилляции предсердий: вложенное исследование случай-контроль». BMC Medical Genetics. 7: 39. Дои:10.1186/1471-2350-7-39. ISSN 1471-2350. ЧВК 1462991. PMID 16623947.
  42. ^ Ma, D.Q .; Whitehead, P.L .; Menold, M.M .; Martin, E.R .; Ashley-Koch, A.E .; Mei, H .; Ричи, доктор медицины; DeLong, G.R .; Абрамсон, Р. (1 сентября 2005 г.). «Идентификация значительной ассоциации и взаимодействия генов с генами субъединиц рецептора ГАМК при аутизме». Американский журнал генетики человека. 77 (3): 377–388. Дои:10.1086/433195. ISSN 0002-9297. ЧВК 1226204. PMID 16080114.
  43. ^ Эндрю, Анджелина С .; Нельсон, Хизер Х .; Келси, Карл Т .; Мур, Джейсон Х .; Meng, Alexis C .; Casella, Daniel P .; Tosteson, Tor D .; Schned, Alan R .; Карагас, Маргарет Р. (1 мая 2006 г.). «Соответствие нескольких аналитических подходов демонстрирует сложную взаимосвязь между SNP генов репарации ДНК, курением и предрасположенностью к раку мочевого пузыря». Канцерогенез. 27 (5): 1030–1037. Дои:10.1093 / carcin / bgi284. ISSN 0143-3334. PMID 16311243.
  44. ^ Эндрю, Анджелина С .; Карагас, Маргарет Р .; Нельсон, Хизер Х .; Гуаррера, Симонетта; Полидоро, Сильвия; Гамберини, Сара; Сакердот, Карлотта; Мур, Джейсон Х .; Келси, Карл Т. (1 января 2008 г.). «Полиморфизмы репарации ДНК изменяют риск рака мочевого пузыря: многофакторная аналитическая стратегия». Человеческая наследственность. 65 (2): 105–118. Дои:10.1159/000108942. ISSN 0001-5652. ЧВК 2857629. PMID 17898541.
  45. ^ Эндрю, Анджелина С .; Ху, Тинг; Гу, Цзянь; Гуй, Цзян; Е, Юаньцин; Марсит, Кармен Дж .; Келси, Карл Т .; Schned, Alan R .; Таньос, Сэм А. (1 января 2012 г.). «HSD3B и взаимодействие генов в анализе генетической предрасположенности к раку мочевого пузыря». PLOS One. 7 (12): e51301. Bibcode:2012PLoSO ... 751301A. Дои:10.1371 / journal.pone.0051301. ISSN 1932-6203. ЧВК 3526593. PMID 23284679.
  46. ^ Цао, Цзинцзин; Ло, Чэнлинь; Ян, Руи; Пэн, Руи; Ван, Кайцзюань; Ван, Пэн; Йе, Хуа; Сонг, Чуньхуа (1 декабря 2016 г.). «rs15869 в сайте связывания miRNA в BRCA2 связан с восприимчивостью к раку груди». Медицинская онкология. 33 (12): 135. Дои:10.1007 / s12032-016-0849-2. ISSN 1357-0560. PMID 27807724.
  47. ^ Уильямс, Скотт М .; Ричи, Мэрилин Д .; III, Джон А. Филлипс; Доусон, Эллиот; Принц, Мелисса; Джура, Эльвира; Уиллис, Алеция; Семеня, Амма; Summar, Marshall (1 января 2004 г.). «Мультилокусный анализ гипертонии: иерархический подход». Человеческая наследственность. 57 (1): 28–38. Дои:10.1159/000077387. ISSN 0001-5652. PMID 15133310.
  48. ^ Санада, Хиронобу; Ятабэ, Джуничи; Мидорикава, Санаэ; Хашимото, Шигеацу; Ватанабэ, Цуёси; Мур, Джейсон Х .; Ричи, Мэрилин Д .; Уильямс, Скотт М .; Пецзулло, Джон К. (1 марта 2006 г.). «Однонуклеотидные полиморфизмы для диагностики гипертонии, чувствительной к соли». Клиническая химия. 52 (3): 352–360. Дои:10.1373 / Clinchem.2005.059139. ISSN 0009-9147. PMID 16439609.
  49. ^ Мур, Джейсон Х .; Уильямс, Скотт М. (1 января 2002 г.). «Новые стратегии для выявления взаимодействий генов при гипертонии». Анналы медицины. 34 (2): 88–95. Дои:10.1080/07853890252953473. ISSN 0785-3890. PMID 12108579.
  50. ^ Де, Ришика; Verma, Shefali S .; Хольцингер, Эмили; Холл, Молли; Берт, Эмбер; Каррелл, Дэвид С .; Кросслин, Дэвид Р .; Jarvik, Gail P .; Куйваниеми, Елена (1 февраля 2017 г.). «Выявление взаимодействий ген-ген, которые тесно связаны с четырьмя количественными липидными признаками в нескольких когортах» (PDF). Генетика человека. 136 (2): 165–178. Дои:10.1007 / s00439-016-1738-7. ISSN 1432-1203. PMID 27848076.
  51. ^ Де, Ришика; Verma, Shefali S .; Дренос, Фотиос; Хольцингер, Эмили Р .; Холмс, Майкл В .; Холл, Молли А .; Кросслин, Дэвид Р .; Каррелл, Дэвид С .; Хаконарсон, Хакон (1 января 2015 г.). «Выявление взаимодействий ген-ген, которые тесно связаны с индексом массы тела, с помощью количественного многофакторного уменьшения размерности (QMDR)». BioData Mining. 8: 41. Дои:10.1186 / s13040-015-0074-0. ЧВК 4678717. PMID 26674805.
  52. ^ Дуэлл, Эрик Дж .; Bracci, Paige M .; Мур, Джейсон Х .; Бурк, Роберт Д.; Келси, Карл Т .; Холли, Элизабет А. (1 июня 2008 г.). «Обнаружение взаимодействий ген-ген и ген-среда на основе пути при раке поджелудочной железы». Эпидемиология, биомаркеры и профилактика рака. 17 (6): 1470–1479. Дои:10.1158 / 1055-9965.EPI-07-2797. ISSN 1055-9965. ЧВК 4410856. PMID 18559563.
  53. ^ Сюй, Цзяньфэн; Лоуи, Джеймс; Виклунд, Фредрик; Солнце, Джилин; Линдмарк, Фредрик; Сюй, Фан-Чи; Димитров, Латчезар; Чанг, Баоли; Тернер, Обри Р. (1 ноября 2005 г.). «Взаимодействие четырех генов в пути воспаления достоверно предсказывает риск рака простаты». Эпидемиология, биомаркеры и профилактика рака. 14 (11): 2563–2568. Дои:10.1158 / 1055-9965.EPI-05-0356. ISSN 1055-9965. PMID 16284379.
  54. ^ Лаванда, Николь А .; Роджерс, Эрика Н .; Йеоду, Сьюзан; Радд, Джеймс; Ху, Тинг; Чжан, Цзе; Brock, Guy N .; Kimbro, Kevin S .; Мур, Джейсон Х. (30 апреля 2012 г.). «Взаимодействие между вариантами последовательности, ассоциированными с апоптозом, и совместные эффекты при агрессивном раке простаты». BMC Medical Genomics. 5: 11. Дои:10.1186/1755-8794-5-11. ISSN 1755-8794. ЧВК 3355002. PMID 22546513.
  55. ^ Лаванда, Николь А .; Benford, Marnita L .; VanCleave, Tiva T .; Brock, Guy N .; Киттлс, Рик А .; Мур, Джейсон Х .; Хайн, Дэвид В .; Кидд, Ла Крейс Р. (16 ноября 2009 г.). «Исследование генов полиморфной глутатион-S-трансферазы (GST), курения табака и риска рака простаты среди мужчин африканского происхождения: исследование случай-контроль». BMC Рак. 9: 397. Дои:10.1186/1471-2407-9-397. ISSN 1471-2407. ЧВК 2783040. PMID 19917083.
  56. ^ Коллинз, Райан Л .; Ху, Тинг; Вейсе, Кристиан; Сируго, Джорджио; Уильямс, Скотт М .; Мур, Джейсон Х. (18 февраля 2013 г.). «Многофакторное снижение размерности выявляет эпистатическое взаимодействие с тремя локусами, связанное с восприимчивостью к туберкулезу легких». BioData Mining. 6 (1): 4. Дои:10.1186/1756-0381-6-4. ЧВК 3618340. PMID 23418869.
  57. ^ Wilke, Russell A .; Рейф, Дэвид М .; Мур, Джейсон Х. (1 ноября 2005 г.). «Комбинаторная фармакогенетика». Обзоры природы Drug Discovery. 4 (11): 911–918. Дои:10.1038 / nrd1874. ISSN 1474-1776. PMID 16264434.
  58. ^ Motsinger, Alison A .; Ричи, Мэрилин Д .; Шафер, Роберт В .; Роббинс, Грегори К .; Морс, Джин Д .; Лаббе, Линия; Wilkinson, Grant R .; Клиффорд, Дэвид Б.; Д'Акуила, Ричард Т. (1 ноября 2006 г.). «Мультилокусные генетические взаимодействия и ответ на схемы, содержащие эфавиренц: исследование группы клинических испытаний СПИДа у взрослых». Фармакогенетика и геномика. 16 (11): 837–845. Дои:10.1097 / 01.fpc.0000230413.97596.fa. ISSN 1744-6872. PMID 17047492.
  59. ^ Ричи, Мэрилин Д .; Моцингер, Элисон А. (1 декабря 2005 г.). «Многофакторное снижение размерности для обнаружения взаимодействий ген-ген и ген-среда в исследованиях фармакогеномики». Фармакогеномика. 6 (8): 823–834. Дои:10.2217/14622416.6.8.823. ISSN 1462-2416. PMID 16296945.
  60. ^ Мур, Джейсон Х .; Asselbergs, Folkert W .; Уильямс, Скотт М. (15 февраля 2010 г.). «Проблемы биоинформатики для полногеномных ассоциативных исследований». Биоинформатика. 26 (4): 445–455. Дои:10.1093 / биоинформатика / btp713. ISSN 1367-4811. ЧВК 2820680. PMID 20053841.
  61. ^ Сунь, Сянцин; Лу, Цин; Мукерджи, Шубхабрата; Мукхирджи, Шубхабрата; Крейн, Пол К .; Элстон, Роберт; Ричи, Мэрилин Д. (1 января 2014 г.). «Анализатор для поиска эпистаза - статистическая фильтрация против биологической». Границы генетики. 5: 106. Дои:10.3389 / fgene.2014.00106. ЧВК 4012196. PMID 24817878.
  62. ^ Пендерграсс, Сара А .; Фразе, Алекс; Уоллес, Джон; Вулф, Дэниел; Катияр, Нирджа; Мур, Кэрри; Ричи, Мэрилин Д. (30 декабря 2013 г.). «Геномный анализ с помощью biofilter 2.0: фильтрация на основе знаний, аннотации и разработка моделей». BioData Mining. 6 (1): 25. Дои:10.1186/1756-0381-6-25. ЧВК 3917600. PMID 24378202.
  63. ^ Мур, Джейсон Х. (1 января 2015 г.). Анализ эпистаза с помощью ReliefF. Методы молекулярной биологии. 1253. С. 315–325. Дои:10.1007/978-1-4939-2155-3_17. ISBN 978-1-4939-2154-6. ISSN 1940-6029. PMID 25403540.
  64. ^ Мур, Джейсон Х .; Уайт, Билл К. (1 января 2007 г.). Риоло, Рик; Соул, Теренс; Ворзель, Билл (ред.). Теория и практика генетического программирования IV. Генетические и эволюционные вычисления. Springer США. С. 11–28. Дои:10.1007/978-0-387-49650-4_2. ISBN 9780387333755.
  65. ^ Грин, Кейси С .; Sinnott-Armstrong, Nicholas A .; Himmelstein, Daniel S .; Парк, Пол Дж .; Мур, Джейсон Х .; Харрис, Брент Т. (1 марта 2010 г.). «Многофакторное снижение размерности графических процессоров позволяет тестировать эпистаз в масштабе всего генома при спорадическом БАС». Биоинформатика. 26 (5): 694–695. Дои:10.1093 / биоинформатика / btq009. ISSN 1367-4811. ЧВК 2828117. PMID 20081222.
  66. ^ Буш, Уильям С .; Дудек, Скотт М .; Ричи, Мэрилин Д. (1 сентября 2006 г.). «Параллельное многофакторное снижение размерности: инструмент для масштабного анализа ген-генных взаимодействий». Биоинформатика. 22 (17): 2173–2174. Дои:10.1093 / биоинформатика / btl347. ISSN 1367-4811. ЧВК 4939609. PMID 16809395.
  67. ^ Sinnott-Armstrong, Nicholas A .; Грин, Кейси С .; Канкаре, Фабио; Мур, Джейсон Х. (24 июля 2009 г.). «Ускорение анализа эпистазов в генетике человека с помощью потребительского графического оборудования». BMC Research Notes. 2: 149. Дои:10.1186/1756-0500-2-149. ISSN 1756-0500. ЧВК 2732631. PMID 19630950.
  68. ^ Уинхэм, Стейси Дж .; Моцингер-Райф, Элисон А. (16 августа 2011 г.). «Реализация многофакторного уменьшения размерности в пакете R». BioData Mining. 4 (1): 24. Дои:10.1186/1756-0381-4-24. ISSN 1756-0381. ЧВК 3177775. PMID 21846375.
  69. ^ Calle, M. Luz; Урреа, Виктор; Малатс, Нурия; Ван Стин, Кристель (1 сентября 2010 г.). «mbmdr: пакет R для изучения взаимодействия генов, связанных с бинарными или количественными признаками». Биоинформатика. 26 (17): 2198–2199. Дои:10.1093 / биоинформатика / btq352. ISSN 1367-4811. PMID 20595460.

дальнейшее чтение

  • Михальски, Р. С., «Распознавание образов как компьютерная индукция, управляемая знаниями», Департамент компьютерных наук, № 927, Иллинойский университет, Урбана, июнь 1978 г.