WikiDer > Выбор хита

Hit selection

В высокопроизводительный скрининг (HTS), одной из основных целей является выбор соединений (в том числе маленькие молекулы, миРНК, shRNA, гены, et al.) с желаемым размером эффектов ингибирования или активации. Соединение с желаемым размером эффектов на экране HTS называется хитом. Процесс отбора хитов называется выбор попаданий.

Методы выбора попаданий в целом

Эксперименты HTS позволяют быстро проверять десятки тысяч (или даже миллионы) соединений. Следовательно, сложно определить химическое / биохимическое значение из множества данных в процессе отбора попаданий. Для решения этой проблемы были приняты соответствующие аналитические методы для выбора попаданий. Есть две основные стратегии выбора хитов с большими эффектами.[1] Один из них - использовать определенные метрики для ранжирования и / или классификации соединения по их эффектам, а затем выбрать наибольшее количество сильнодействующих соединений, которые практичны для проверки анализы.[2][3] Другая стратегия состоит в том, чтобы проверить, обладает ли соединение достаточно сильным действием, чтобы достичь заданного уровня. В этой стратегии необходимо контролировать частоту ложноотрицательных (FNR) и / или ложноположительных (FPR).[4][5][6][7][8][9][10][11]

Существует два основных типа экспериментов HTS: один без повторов (обычно на первичных экранах) и один с повторениями (обычно на подтверждающих экранах). Аналитические методы выбора попаданий различаются в этих двух типах HTS-экспериментов. Например, метод z-оценки подходит для экранов без реплик, тогда как t-статистика подходит для экранов с репликацией. Расчет ССМД для экранов без реплик также отличается от экранов с репликами.[1]

Экраны без реплик

Для выбора совпадений на первичных экранах без повторений используется множество показателей. Легко интерпретируемыми являются кратное изменение, средняя разница, процент подавления и процент активности. Однако общий недостаток всех этих показателей заключается в том, что они не позволяют эффективно фиксировать изменчивость данных. Чтобы решить эту проблему, исследователи обратились к методу z-оценки или ССМД, который может фиксировать изменчивость данных в отрицательных ссылках.[12][13]

Метод z-оценки основан на предположении, что измеренные значения (обычно интенсивность флуоресценции в логарифмической шкале) всех исследованных соединений в планшете имеют нормальное распределение. SSMD также лучше всего работает в предположении нормальности. Однако настоящие попадания с большими эффектами должны сильно отличаться от поведения большинства соединений и, таким образом, являются выбросами. Сильные артефакты анализа также могут вести себя как выбросы. Таким образом, выбросы в экспериментах HTS не редкость. Обычные версии z-score и SSMD чувствительны к выбросам и могут быть проблематичными. Следовательно, надежные методы, такие как метод z * -score, ССМД* Для выбора совпадений на первичных экранах без повторений были предложены и приняты метод B-оценки и метод на основе квантилей.[14][15]

При первичном скрининге без повторов каждое соединение измеряется только один раз. Следовательно, мы не можем напрямую оценить изменчивость данных для каждого соединения. Вместо этого мы косвенно оцениваем изменчивость данных, делая сильное предположение, что каждое соединение имеет такую ​​же изменчивость, как и отрицательный эталон на пластине на экране. Z-оценка, z *-оценка и B-оценка основаны на этом сильном предположении; таковы SSMD и SSMD * для случаев без реплик.

Экраны с репликами

На экране с репликами мы можем напрямую оценить изменчивость данных для каждого соединения, и, таким образом, мы можем использовать более мощные методы, такие как SSMD для случаев с репликами и t-статистика, которая не полагается на строгое предположение, что z-оценка и z * -счет полагается. Одна проблема с использованием t-статистики и связанных p-значений заключается в том, что на них влияет как размер выборки, так и размер эффекта.[16] Они получены в результате тестирования на отсутствие средней разницы, поэтому не предназначены для измерения размера малых молекул или эффектов миРНК. Для выбора попаданий наибольший интерес представляет размер эффекта в тестируемой малая молекула или же миРНК. ССМД непосредственно оценивает размер эффектов.[17] ССМД также было показано, что он лучше, чем другие обычно используемые размеры эффекта.[18] Численность населения ССМД сопоставима по экспериментам, и поэтому мы можем использовать одно и то же ограничение для значения совокупности ССМД для измерения размера эффектов миРНК.[19]

SSMD может преодолеть недостаток среднего кратного изменения, неспособного уловить изменчивость данных. С другой стороны, поскольку SSMD - это отношение среднего значения к стандартному отклонению, мы можем получить большое значение SSMD, когда стандартное отклонение очень мало, даже если среднее значение мало. В некоторых случаях слишком маленькое среднее значение может не иметь биологического воздействия. Таким образом, соединения с большими значениями SSMD (или дифференциациями), но слишком маленькими средними значениями могут не представлять интереса. Концепция чего-либо сюжет с двойным фонариком было предложено решить эту проблему. В сюжет с двойным фонариком, мы строим ССМД по сравнению со средним логарифмическим кратным изменением (или средним процентом ингибирования / активации) по осям y и x, соответственно, для всех соединений, исследованных в эксперименте.[19] С помощью графика с двойным фонариком мы можем увидеть, как гены или соединения распределяются по каждой категории по величине эффекта, как показано на рисунке. Между тем, мы также можем увидеть среднюю кратность изменения для каждого соединения.[19][20]

Смотрите также

дальнейшее чтение

Рекомендации

  1. ^ а б Чжан XHD (2011). Оптимальный высокопроизводительный скрининг: практический экспериментальный план и анализ данных для исследования РНКи в масштабе генома. Издательство Кембриджского университета. ISBN 978-0-521-73444-8.
  2. ^ Бирмингем А., Селфорс Л.М., Форстер Т., Вробель Д., Кеннеди С.Дж., Шанкс Е., Сантойо-Лопес Дж., Дуникан Д.Д., Лонг А., Келлехер Д., Смит К., Бейерсберген Р.Л., Газаль П., Шаму К.Э. (2009). «Статистические методы анализа высокопроизводительных экранов интерференции РНК». Методы природы. 6 (8): 569–75. Дои:10.1038 / nmeth.1351. ЧВК 2789971. PMID 19644458.
  3. ^ Чжан XHD (2010). «Полногеномный скрининг эффективных миРНК посредством оценки размера эффектов миРНК». BMC Research Notes. 1: 33. Дои:10.1186/1756-0500-1-33. ЧВК 2526086. PMID 18710486.
  4. ^ Мало Н., Хэнли Дж. А., Черкоцци С., Пеллетье Дж., Надон Р. (2006). «Статистическая практика в высокопроизводительном скрининговом анализе данных». Природа Биотехнологии. 24 (2): 167–75. Дои:10.1038 / nbt1186. PMID 16465162.
  5. ^ Чжан XH, Куан П.Ф., Феррер М., Шу X, Лю Ю.С., Гейтс А.Т., Кунапули П., Стец Э.М., Сюй М., Марин С.Д., Держатель Д.Д., Стуловичи Б., Хейсе Дж.Ф., Эспесет А.С. (2009). «Отбор совпадений с контролем ложной скорости обнаружения на экранах РНКи в масштабе генома». Исследования нуклеиновых кислот. 36 (14): 4667–79. Дои:10.1093 / nar / gkn435. ЧВК 2504311. PMID 18628291.
  6. ^ Клингхоффер Р.А., Фрейзер Дж., Аннис Дж., Берндт Дж. Д., Робертс Б.С., Артур В. Т., Лаксон Р., Чжан Х. Х., Феррер М., Мун РТ, Клири М. А. (2010). «Опосредованный лентивирусом генетический скрининг идентифицирует дигидрофолатредуктазу (DHFR) как модулятор передачи сигналов бета-катенин / GSK3». PLoS ONE. 4 (9): e6892. Дои:10.1371 / journal.pone.0006892. ЧВК 2731218. PMID 19727391.
  7. ^ Чжан XHD (2010). «Эффективный метод контроля ложных открытий и ложных необнаружений на экранах РНКи в масштабе генома». Журнал биомолекулярного скрининга. 15 (9): 1116–22. Дои:10.1177/1087057110381783. PMID 20855561.
  8. ^ Мало Н., Хэнли Дж. А., Карлайл Дж., Лю Дж., Пеллетье Дж., Томас Д., Надон Р. (2010). «Экспериментальный дизайн и статистические методы для улучшенного обнаружения попаданий при высокопроизводительном скрининге». Журнал биомолекулярного скрининга. 15 (8): 990–1000. Дои:10.1177/1087057110377497. PMID 20817887.
  9. ^ Чжан XH, Лаксон Р., Ян Р., Марин С.Д., Маккэмпбелл, Тулан Д.М., Харе Т.Р., Кайдас Дж., Бергер Дж. П., Холдер Д. Д., Хейз Дж. Ф., Феррер М. (2010). «Использование основанных на SSMD ложных показателей обнаружения и ложных невыявлений при скринингах РНКи в масштабе генома». Журнал биомолекулярного скрининга. 15 (9): 1123–31. Дои:10.1177/1087057110381919. PMID 20852024.
  10. ^ Quon K, Kassner PD (2009). «Скрининг РНК-интерференции для обнаружения онкологических целей». Мнение экспертов о терапевтических целях. 13 (9): 1027–35. Дои:10.1517/14728220903179338. PMID 19650760.
  11. ^ Чжан XH, Марин С.Д., Феррер М. (2009). «Частота ошибок и мощность при сканировании РНКи в масштабе генома». Журнал биомолекулярного скрининга. 14 (3): 230–38. Дои:10.1177/1087057109331475. PMID 19211781.
  12. ^ Чжан XHD (2007). «Новый метод с гибким и сбалансированным контролем ложноотрицательных и ложноположительных результатов для отбора попаданий в высокопроизводительных скрининговых анализах РНК-интерференции». Журнал биомолекулярного скрининга. 12 (5): 645–55. Дои:10.1177/1087057107300645. PMID 17517904.
  13. ^ Zhang XH, Ferrer M, Espeseth AS, Marine SD, Stec EM, Crackower MA, Holder DJ, Heyse JF, Strulovici B (2007). «Использование строго стандартизированной разницы средних для отбора попаданий в высокопроизводительных скрининговых экспериментах с первичной интерференцией РНК». Журнал биомолекулярного скрининга. 12 (4): 645–55. Дои:10.1177/1087057107300646. PMID 17435171.
  14. ^ Чжан XH, Ян XC, Чунг Н., Гейтс А, Стец Э, Кунапули П., Держатель Д.Д., Феррер М., Эспесет А.С. (2006). «Надежные статистические методы для отбора попаданий в экспериментах по высокопроизводительному скринингу РНК-интерференции». Фармакогеномика. 7 (3): 299–09. Дои:10.2217/14622416.7.3.299. PMID 16610941.
  15. ^ Бридо С., Гюнтер Дж., Пикунис Б., Лиав А. (2003). «Улучшенные статистические методы отбора попаданий при высокопроизводительном скрининге». Журнал биомолекулярного скрининга. 8 (6): 634–47. Дои:10.1177/1087057103258285. PMID 14711389.
  16. ^ Коэн Дж (1994). «Земля круглая (P-Less Than.05)». Американский психолог. 49 (12): 997–1003. Дои:10.1037 / 0003-066X.49.12.997. ISSN 0003-066X.
  17. ^ Чжан XHD (2009). «Метод эффективного сравнения эффектов генов в различных условиях в РНКи и исследования профилей экспрессии». Фармакогеномика. 10 (3): 345–58. Дои:10.2217/14622416.10.3.345. PMID 20397965.
  18. ^ Чжан XHD (2010). «Строго стандартизированная разница средних, стандартизованная разница средних и классический t-тест для сравнения двух групп». Статистика в биофармацевтических исследованиях. 2 (2): 292–99. Дои:10.1198 / сбр.2009.0074.
  19. ^ а б c Чжан XHD (2010). «Оценка размера гена или эффектов РНКи в многофакторных высокопроизводительных экспериментах». Фармакогеномика. 11 (2): 199–213. Дои:10.2217 / PGS.09.136. PMID 20136359.
  20. ^ Чжао В.К., Сантини Ф., Бриз Р., Росс Д., Чжан XD, Стоун DJ, Феррер М., Таунсенд М., Вулф А.Л., Сигер М.А., Кинни Г.Г., Шугруе П.Дж., Рэй В.Дж. (2010). «Ингибирование опосредованного кальциневрином эндоцитоза и рецепторов альфа-амино-3-гидрокси-5-метил-4-изоксазолепропионовой кислоты (AMPA) предотвращает синаптическое разрушение, вызванное амилоидным бета-олигомером». Журнал биологической химии. 285 (10): 7619–32. Дои:10.1074 / jbc.M109.057182. ЧВК 2844209. PMID 20032460.