WikiDer > Мутация принята в точке - Википедия
А точка принятая мутация - также известный как PAM - это замена одного аминокислота в первичная структура из белок с другой единственной аминокислотой, которая принимается процессами естественный отбор. Это определение не включает все точечные мутации в ДНК организма. Особенно, тихие мутации не являются точечно принятыми мутациями, равно как и мутациями, которые не являются летальными или которые отвергаются естественным отбором другими способами.
А Матрица PAM это матрица где каждый столбец и строка представляют одну из двадцати стандартных аминокислот. В биоинформатика, Матрицы PAM регулярно используются как матрицы замещения набрать выравнивание последовательностей для белков. Каждая запись в матрице PAM указывает вероятность того, что аминокислота в этой строке будет заменена аминокислотой из этого столбца в результате серии из одной или нескольких точечных принятых мутаций в течение указанного эволюционного интервала, а не эти две аминокислоты будут выровнены должным образом. к случаю. Разные матрицы PAM соответствуют разным временам эволюции белковой последовательности.
Биологический фон
Генетические инструкции каждой репликации клетка в живом организме содержатся в его ДНК.[1] На протяжении всей жизни клетки эта информация транскрибируется и реплицируется клеточными механизмами для производства белков или предоставления инструкций дочерним клеткам во время деление клеток, и существует вероятность того, что ДНК может быть изменена во время этих процессов.[1][2] Это известно как мутация. На молекулярном уровне существуют регуляторные системы, которые корректируют большую часть - но не все - этих изменений в ДНК до того, как она будет реплицирована.[2][3]
Одна из возможных мутаций - это замена одного нуклеотид, известная как точечная мутация. Если точечная мутация происходит в экспрессируемой области ген, экзон, то это изменит кодон определение конкретной аминокислоты в белке, продуцируемом этим геном.[2] Несмотря на избыточность в генетический код, есть вероятность, что эта мутация изменит аминокислоту, которая вырабатывается во время перевод, и, как следствие, изменится структура белка.
Функциональность протеина сильно зависит от его структуры.[4] Изменение одной аминокислоты в белке может снизить его способность выполнять эту функцию, или мутация может даже изменить функцию, которую выполняет белок.[2] Подобные изменения могут серьезно повлиять на важную функцию клетки, потенциально вызывая смерть клетки, а в крайних случаях и организма.[5] И наоборот, изменение может позволить клетке продолжать функционировать, хотя и по-другому, и мутация может быть передана потомству организма. Если это изменение не приведет к какому-либо значительному физическому ущербу для потомства, существует вероятность того, что эта мутация сохранится в популяции. Также существует возможность того, что изменение функции станет выгодным. В любом случае, подвергаясь процессам естественного отбора, точечная мутация была принята в генетический пул.
20 аминокислот, транслируемых генетическим кодом, сильно различаются по физическим и химическим свойствам их боковых цепей.[4] Однако эти аминокислоты можно разделить на группы со схожими физико-химическими свойствами.[4] Замена аминокислоты другой из той же категории с большей вероятностью окажет меньшее влияние на структуру и функцию белка, чем замена аминокислотой из другой категории. Следовательно, принятие точечных мутаций сильно зависит от аминокислоты, заменяемой в мутации, и заменяемой аминокислоты. Матрицы PAM представляют собой математический инструмент, который учитывает эти различные скорости принятия при оценке сходства белков во время выравнивания.
Терминология
Период, термин принятая точечная мутация изначально использовался для описания феномена мутации. Однако аббревиатура PAM была предпочтительнее APM из-за удобочитаемости, поэтому термин точка принятая мутация используется более регулярно.[6] Потому что ценность в PAMп матрица представляет собой количество мутаций на 100 аминокислот, которое можно сравнить с процентом мутаций, термин процент принятых мутаций иногда используется.
Важно различать точечные принятые мутации (PAM), точечно принятые матрицы мутаций (PAM-матрицы) и PAM.п матрица. Термин «точечная принятая мутация» относится к самому событию мутации. Однако «матрица PAM» относится к одной из семейства матриц, которые содержат оценки, представляющие вероятность выравнивания двух аминокислот из-за серии событий мутации, а не из-за случайной случайности. 'PAMп matrix '- матрица PAM, соответствующая временному кадру, достаточно длинному для события мутации происходят на 100 аминокислот.
Построение матриц PAM
Матрицы PAM были введены Маргарет Дейхофф в 1978 г.[7] Расчет этих матриц был основан на 1572 наблюдаемых мутациях в филогенетические деревья из 71 семейства близкородственных белков. Исследуемые белки были отобраны на основе их высокого сходства со своими предшественниками. Включенные белковые выравнивания должны были показать идентичность по крайней мере на 85%.[6][8] В результате разумно предположить, что любые выровненные несоответствия были результатом одного события мутации, а не нескольких в одном месте.
Каждая матрица PAM состоит из двадцати строк и двадцати столбцов, по одному представлению каждой из двадцати аминокислот, транслируемых генетическим кодом. Значение в каждой ячейке матрицы PAM связано с вероятностью того, что аминокислота строки до мутации впоследствии будет выровнена с аминокислотой столбца.[6][7][8] Из этого определения матрицы PAM являются примером матрица замещения.
Сбор данных с филогенетических деревьев
Для каждой ветви филогенетических деревьев семейств белков регистрировалось количество наблюдаемых несоответствий и велись записи для двух задействованных аминокислот.[7] Эти подсчеты использовались как записи ниже главной диагонали матрицы . Поскольку подавляющее большинство образцов белка поступает от организмов, которые живы сегодня (существующие виды), «направление» мутации не может быть определено. То есть аминокислоту, присутствующую до мутации, нельзя отличить от аминокислоты, которая заменила ее после мутации. Из-за этого матрица предполагается симметричный, а записи выше главной диагонали вычисляются на этой основе. Записи по диагонали не соответствуют мутациям и могут быть оставлены незаполненными.
В дополнение к этим подсчетам были получены данные об изменчивости и частоте аминокислот.[6][7] Изменчивость аминокислоты - это соотношение количества мутаций, в которых она участвует, и количества раз, когда она встречается в выравнивании.[7] Мутабельность измеряет вероятность приемлемой мутации аминокислоты. Аспарагин, аминокислота с небольшим полярный боковая цепь, как было обнаружено, является наиболее изменчивой из аминокислот.[7] Цистеин и триптофан оказались наименее изменчивыми аминокислотами.[7] Боковые цепи цистеина и триптофана имеют менее распространенные структуры: боковая цепь цистеина содержит серу, которая участвует в дисульфидные связи с другими молекулами цистеина, а боковая цепь триптофана большая и ароматный.[4] Поскольку существует несколько небольших полярных аминокислот, эти крайности предполагают, что аминокислоты более склонны к приемлемой мутации, если их физические и химические свойства более распространены среди альтернативных аминокислот.[6][8]
Построение матрицы мутаций
Для -я аминокислота, значения и его изменчивость и частота. Частоты аминокислот нормализованы так, чтобы они в сумме равнялись 1. Если общее количество вхождений -я аминокислота , и - общее количество всех аминокислот, тогда
На основе определения изменчивости как отношения мутаций к количеству встречаемости аминокислоты.
или же
Матрица мутаций построен так, что запись представляет собой вероятность -я аминокислота мутирует в -я аминокислота. Недиагональные элементы вычисляются по уравнению[7]
куда - константа пропорциональности. Однако это уравнение не вычисляет диагональные элементы. Каждый столбец в матрице перечисляет каждый из двадцати возможных результатов для аминокислоты - она может мутировать в одну из 19 других аминокислот или оставаться неизменной. Поскольку недиагональные записи, перечисляющие вероятности каждой из 19 мутаций, известны, а сумма вероятностей этих двадцати исходов должна быть равна 1, эту последнюю вероятность можно рассчитать следующим образом:
что упрощает[7]
Расчет диагональных входов Подставляя выражение для матрицы мутаций недиагональных элементов:
Поскольку значения и константы, которые не изменяются со значением
Таким образом, отмена показывает, что
Особенно важным результатом является то, что для недиагональных элементов
Это означает, что для всех записей в матрице мутаций
Выбор константы пропорциональности
Вероятности, содержащиеся в варьируются как некоторая неизвестная функция количества времени, в течение которого белковой последовательности позволяют мутировать. Вместо того, чтобы пытаться определить эту взаимосвязь, значения рассчитываются для короткого периода времени, а матрицы для более длительных периодов времени рассчитываются исходя из предположения, что мутации следуют Цепь Маркова модель.[9][10] Базовая единица времени для матриц PAM - это время, необходимое для возникновения 1 мутации на 100 аминокислот, иногда называемое «единицей PAM» или «PAM» времени.[6] Это как раз продолжительность мутации, предполагаемая PAM.1 матрица.
Постоянная используется для контроля доли неизмененных аминокислот. Используя только выравнивания белков, которые имели сходство не менее 85%, можно было разумно предположить, что наблюдаемые мутации были прямыми, без каких-либо промежуточных состояний. Это означает, что уменьшение этих подсчетов с помощью общего фактора обеспечило бы точную оценку количества мутаций, если бы сходство было ближе к 100%. Это также означает, что количество мутаций на 100 аминокислот, в ПАМп равно количеству мутировавших аминокислот на 100 аминокислот.
Чтобы найти матрицу мутаций для PAM1 матрице предъявляется требование, чтобы 99% аминокислот в последовательности были консервативными. Количество равно количеству консервативной аминокислоты единиц, и поэтому общее количество консервативных аминокислот составляет
Значение необходимо выбрать, чтобы получить 99% идентичности после мутации, затем задается уравнением
Этот значение затем можно использовать в матрице мутаций для PAM1 матрица.
Строительство PAMп матрицы
Модель мутации белков с марковской цепью связывает матрицу мутаций для PAMп, , в матрицу мутаций для PAM1 матрица простыми отношениями
ПАМп Матрица строится из отношения вероятностей точечных принятых мутаций, заменяющих -я аминокислота с -я аминокислота, к вероятности случайного выравнивания этих аминокислот.п матрицы задаются уравнением[11][12]
Обратите внимание, что в книге Гасфилда записи и связаны с вероятностью -я аминокислота мутирует в -я аминокислота.[11] Это источник различных уравнений для записей матриц PAM.
При использовании PAMп матрицы для оценки выравнивания двух белков делается следующее предположение:
- Если эти два белка связаны между собой, разделяющий их эволюционный интервал - это время, необходимое для указывают, что допустимые мутации происходят на 100 аминокислот.
Когда выравнивание й и th аминокислот, оценка показывает относительную вероятность выравнивания из-за того, что белки связаны или из-за случайной случайности.
- Если белки родственны, то должна была произойти серия точечных мутаций, которые привели к замене исходной аминокислоты. Предположим, что -я аминокислота является исходной. Основываясь на содержании аминокислот в белках, вероятность -я аминокислота является оригинальной . Учитывая любую конкретную единицу этой аминокислоты, вероятность быть замененным -я аминокислота в предполагаемом интервале времени равна . Таким образом, вероятность совмещения равна , числитель с точностью до логарифма.
- Если белки не связаны, то события, что две выровненные аминокислоты являются й и аминокислоты должны быть независимый. Вероятности этих событий равны и , что означает, что вероятность совмещения равна , знаменатель логарифма.
- Таким образом, логарифм в уравнении приводит к положительной записи, если выравнивание более вероятно из-за точечных мутаций, и к отрицательной записи, если выравнивание более вероятно из-за случайности.
Свойства матриц РАМ
Симметрия матриц РАМ
Тогда как матрица вероятности мутации не симметричен, каждая из матриц PAM.[6][7] Это несколько удивительное свойство является результатом связи, отмеченной для матрицы вероятности мутации:
Фактически это соотношение выполняется для всех положительных целых степеней матрицы :
Обобщение свойства на положительные целочисленные матричные степени Это обобщение можно доказать, используя математическая индукция. Предположим, что для матрицы
И это для положительного целого числа
Путем расширения матричный продукт ,
Используя принятое нами свойство матрицы
И используя свойство для матрицы
В этом случае сначала известно только, что результат верен для . Однако приведенный выше аргумент показывает, что это свойство также выполняется для . Это новое знание затем показывает, что это свойство также выполняется для и это повторяется, чтобы показать, что свойство выполняется для всех положительных целых чисел .
В результате записи PAMп матрицы симметричны, так как
Связь количества мутировавших аминокислот и количества мутаций
Значение представляет собой количество мутаций, которые происходят на 100 аминокислот, однако это значение редко доступно и часто оценивается. Однако при сравнении двух белков легко вычислить вместо этого, это количество мутировавших аминокислот на 100 аминокислот. Несмотря на случайный характер мутации, эти значения могут быть приблизительно связаны соотношением[13]
Вывод родства между и Мутации в первичной структуре белка могут происходить в любом месте последовательности. Если предположить, что распределение мутаций по позициям аминокислот является однородным, проблема аналогична распределению «шариков по корзинам», распространенной проблеме в комбинаторика. В случае, когда шары (т.е. мутации) распределяются между бины (позиции аминокислот), количество бункеров, содержащих хотя бы один шар, имеет распределение со средним значением[14]
Если скорость мутации мутации на 100 аминокислот, то
И если есть мутировавших аминокислот на 100 аминокислот, то это примерно равно
Сейчас же и может быть связано
Для больших значений , предположение, которое может быть разумно сделано для типичных белков, это выражение примерно равно
Достоверность этих оценок можно проверить, подсчитав количество аминокислот, которые остаются неизменными под действием матрицы. . Общее количество неизмененных аминокислот за временной интервал PAMп матрица
и поэтому доля неизмененных аминокислот составляет
Пример - PAM250
PAM250 - это обычно используемая матрица оценок для сравнения последовательностей. Требуется вычислить только нижнюю половину матрицы, поскольку по своему построению матрицы PAM должны быть симметричными. Каждая из 20 аминокислот показана сверху и сбоку матрицы с 3 дополнительными неоднозначные аминокислоты. Чаще всего аминокислоты перечислены в алфавитном порядке или перечислены в группах. Эти группы являются характеристиками, общими для аминокислот.[7]
Использование в биоинформатике
Определение времени дивергенции в филогенетических деревьях
В гипотеза молекулярных часов предсказывает, что скорость замены аминокислот в конкретном белке будет примерно постоянной во времени, хотя эта скорость может варьироваться в зависимости от семейства белков.[13] Это говорит о том, что количество мутаций на аминокислоту в белке увеличивается примерно линейно со временем.
Определение времени, когда два белка разошлись, является важной задачей в филогенетика. Летописи окаменелостей часто используются для определения положения событий на временной шкале эволюционной истории Земли, но применение этого источника ограничено. Однако, если известна скорость, с которой тикают молекулярные часы белкового семейства, то есть скорость, с которой увеличивается количество мутаций на аминокислоту, то знание этого количества мутаций позволит определить дату расхождения.
Предположим, что ищется дата расхождения двух родственных белков, взятых из организмов, живущих сегодня. Оба белка накапливали принятые мутации с момента расхождения, поэтому общее количество мутаций на одну аминокислоту, разделяющую их, примерно вдвое превышает то, что отделяет их от их общий предок. Если диапазон матриц PAM используется для выравнивания двух белков, о которых известно, что они связаны, то значение в PAMп матрица, которая дает лучший результат, скорее всего, соответствует мутациям на аминокислоту, разделяющую два белка. Уменьшение вдвое этого значения и деление на скорость, с которой принятые мутации накапливаются в семействе белков, дает оценку времени отклонения этих двух белков от их общего предка. То есть время расхождения в мир является[13]
Где - количество мутаций на аминокислоту, и - это скорость накопления принятых мутаций в мутациях на аминокислотный сайт за миллион лет.
Использование в BLAST
Матрицы PAM также используются в качестве оценочной матрицы при сравнении последовательностей ДНК или белковых последовательностей для оценки качества выравнивания. Эта форма системы подсчета очков используется в широком спектре программного обеспечения для выравнивания, включая ВЗРЫВ.[15]
Сравнение PAM и BLOSUM
Хотя матрицы логарифмических шансов PAM были первыми оценочными матрицами, используемыми с BLAST, матрицы PAM. были в значительной степени заменены BLOSUM матрицы. Хотя обе матрицы дают одинаковые результаты оценки, они были созданы с использованием разных методологий. Матрицы BLOSUM были созданы непосредственно из аминокислотных различий в выровненных блоках, которые разошлись в разной степени, матрицы PAM отражают экстраполяция эволюционной информации, основанной на тесно связанных последовательностях, в более длительных временных масштабах.[16] С момента оценки информации для матриц PAM и BLOSUM. были созданы очень разными способами; числа, связанные с матрицами, имеют принципиально разное значение; числа для матриц PAM увеличиваются для сравнения между более расходящимися белками, тогда как числа для матриц BLOSUM уменьшаются.[17] Однако все матрицы аминокислотных замен можно сравнить в рамках теоретической информации.[18] используя их относительную энтропию.
Матрица PAM | Эквивалентная матрица BLOSUM | Относительная энтропия (биты) |
---|---|---|
PAM100 | Blosum90 | 1.18 |
PAM120 | Blosum89 | 0.98 |
PAM160 | Blosum60 | 0.70 |
PAM200 | Blosum52 | 0.51 |
PAM250 | Blosum45 | 0.36 |
Смотрите также
Рекомендации
- ^ а б Кэмпбелл Н.А., Рис Дж. Б., Мейерс Н., Урри Л. А., Каин М. Л., Вассерман С. А., Минорский П. В., Джексон Р. Б. (2009). «Молекулярные основы наследования». Биология (8-е изд.). Pearson Education Australia. С. 307–325. ISBN 9781442502215.
- ^ а б c d Кэмпбелл Н.А., Рис Дж. Б., Мейерс Н., Урри Л. А., Каин М. Л., Вассерман С. А., Минорский П. В., Джексон Р. Б. (2009). «От гена к белку». Биология: австралийская версия (8-е изд.). Pearson Education Australia. С. 327–350. ISBN 9781442502215.
- ^ Пал Дж. К., Гаскадби СС (2009). «Повреждение, восстановление и рекомбинация ДНК». Основы молекулярной биологии (1-е изд.). Издательство Оксфордского университета. стр.187–203. ISBN 9780195697810.
- ^ а б c d Кэмпбелл Н.А., Рис Дж. Б., Мейерс Н., Урри Л. А., Каин М. Л., Вассерман С. А., Минорский П. В., Джексон Р. Б. (2009). «Структура и функции крупных биологических молекул». Биология: австралийская версия (8-е изд.). Pearson Education Australia. С. 68–89. ISBN 9781442502215.
- ^ Лобо I (январь 2008 г.). «Менделирующие соотношения и летальные гены». Природное образование. 1 (1): 138.
- ^ а б c d е ж грамм Певснер Дж (2009). «Попарное выравнивание последовательностей». Биоинформатика и функциональная геномика (2-е изд.). Вили-Блэквелл. стр.58–68. ISBN 978-0-470-08585-1.
- ^ а б c d е ж грамм час я j k Дайхофф МО, Шварц Р.М., Оркатт Британская Колумбия (1978). «Модель эволюционного изменения белков». Атлас последовательности и структуры белков (том 5, приложение 3-е изд.). Вашингтон, округ Колумбия: Национальный фонд биомедицинских исследований. С. 345–358. ISBN 978-0-912466-07-1.CS1 maint: дата и год (связь)
- ^ а б c Винг-Кин С (2010). Алгоритмы в биоинформатике: практическое введение. CRC Press. С. 51–52. ISBN 978-1-4200-7033-0.
- ^ Kosiol C, Goldman N (2005). «Различные версии матрицы ставок Dayhoff». Молекулярная биология и эволюция. 22 (2): 193–9. Дои:10.1093 / molbev / msi005. PMID 15483331.
- ^ Лио П., Гольдман Н. (1998). «Модели молекулярной эволюции и филогении». Геномные исследования. 8 (12): 1233–44. Дои:10.1101 / гр. 8.12.1233. PMID 9872979.
- ^ а б Гусфилд Д. (1997). Алгоритмы на струнах, деревьях и последовательностях - компьютерные науки и вычислительная биология. Издательство Кембриджского университета. С. 383–384. ISBN 978-0521585194.
- ^ Беккенхауэр Х., Бонгартц Д. (2010). Алгоритмические аспекты биоинформатики. Springer. С. 94–96. ISBN 978-3642091001.
- ^ а б c Певснер Дж (2009). «Молекулярная филогения и эволюция». Биоинформатика и функциональная геномика (2-е изд.). Вили-Блэквелл. стр.221–227. ISBN 978-0-470-08585-1.
- ^ Мотвани Р., Рагхаван П. (1995). Рандомизированные алгоритмы. Издательство Кембриджского университета. п. 94. ISBN 978-0521474658.
- ^ «Статистика оценок сходства последовательностей». Национальный центр биотехнологической информации. Получено 20 октября 2013.
- ^ Хеникофф С, Хеникофф JG (1992). «Матрицы аминокислотных замен из белковых блоков». Труды Национальной академии наук Соединенных Штатов Америки. 89 (22): 10915–10919. Bibcode:1992PNAS ... 8910915H. Дои:10.1073 / пнас.89.22.10915. ЧВК 50453. PMID 1438297.
- ^ Сауд О. (2009). «Матрицы замещения PAM и BLOSUM». Бирек. Архивировано из оригинал 9 марта 2013 г.. Получено 20 октября 2013.
- ^ а б Альтшул С.Ф. (июнь 1991 г.). «Матрицы аминокислотных замен с точки зрения теории информации». Журнал молекулярной биологии. 219 (3): 555–65. Дои:10.1016 / 0022-2836 (91) 90193-А. ЧВК 7130686. PMID 2051488.
внешняя ссылка
- http://www.inf.ethz.ch/personal/gonnet/DarwinManual/node148.html
- http://www.bioinformatics.nl/tools/pam.html Для быстрого расчета матрицы PAM.
- http://web.expasy.org/docs/relnotes/relstat.html Самая свежая статистика из базы знаний Swiss-Prot по белкам. Раздел 6.1 содержит самые последние частоты аминокислот.