WikiDer > Области низкой сложности в белках

Low complexity regions in proteins

Области низкой сложности в белковых последовательностях (LCR), также определяемые в некоторых контекстах как композиционно предвзятые регионы (CBR) - это участки в белковых последовательностях, которые отличаются по составу и сложности от большинства белков, которые обычно связаны с глобулярной структурой.[1][2] LCR имеют отличные от нормальных регионов свойства в отношении структура, функция и эволюция.

Структура

Первоначально считалось, что LCR представляют собой неструктурированные и гибкие линкеры, служащие для разделения структурированных (и функциональных) доменов сложных белков,[3] но они также способны образовывать вторичные структуры, такие как спирали (чаще) и даже листы.[4] Они могут играть структурную роль в таких белках, как коллагены, миозин, кератины, шелк, белки клеточной стенки.[5] Тандемные повторы коротких олигопептидов, богатых глицином, пролином, серином или треонином, способны образовывать гибкие структуры, которые связывают лиганды при определенных условиях pH и температуры.[6] Пролин является хорошо известным разрушителем альфа-спирали, однако аминокислотные повторы, состоящие из пролина, могут образовывать полипролиновые спирали.[7]

Функции

Изначально LCR считались `` мусорными '' областями или нейтральными линкерами между доменами, однако экспериментальные и вычислительные данные все чаще указывают на то, что они могут играть важные адаптивные и консервативные роли, имеющие отношение к биотехнологии, экспрессии гетерологичных белков, медицине, а также нашему пониманию эволюции белка.[8]

LCR эукариотических белков участвуют в заболеваниях человека,[9][10] особенно нейродегенеративные, где они имеют тенденцию образовывать амилоиды у людей и других эукариот.[11]

Сообщается, что у них есть клейкие роли,[12] функция выделяемых липких белков, используемых для поимки добычи,[13] или играют роль передатчиков молекулярного движения, например в прокариотических системах TonB / TolA.[14]

LCR могут образовывать поверхности для взаимодействия с фосфолипидными бислоями,[15] или как кластеры положительного заряда для связывания ДНК,[8][16][17] или как кластеры с отрицательным или даже гистидиновым зарядом для координации ионов кальция, магния или цинка.[8][16]

Они также могут играть важную роль в трансляции белка в качестве «губок» тРНК, замедляя трансляцию, чтобы дать время для правильного сворачивания растущей полипептидной цепи.[18] Они могут даже функционировать как контрольные точки сдвига рамки, сдвигаясь к необычному содержанию аминокислот, которое делает белок очень нестабильным или нерастворимым, что, в свою очередь, запускает быструю переработку до дальнейшего повреждения клеток.[19][20]

Анализы на модельных и немодельных эукариотических протеомах показали, что LCR часто обнаруживаются в белках, участвующих в связывании нуклеиновых кислот (ДНК или РНК), в транскрипции, активности рецепторов, развитии, репродукции и иммунитете, тогда как метаболические белки лишены LCR.[3][21][22][23] Биоинформатическое исследование аннотации Uniprot для белков, содержащих LCR, показало, что 44% (9751/22259) бактериальных и 44% (662/1521) архейных LCR обнаруживаются в белках с неизвестной функцией, однако значительное количество белков известных функция (от многих различных видов), особенно те, которые участвуют в трансляции и рибосоме, связывании нуклеиновых кислот, связывании ионов металла и сворачивании белка также содержат LCR.[8]

Свойства

LCR более распространены у эукариот, но они также значительно присутствуют у многих прокариот.[8] В среднем 0,05 и 0,07% протеомов бактерий и архей (общее количество аминокислот LCR в данном протеоме / общее количество аминокислот этого протеома) образуют LCR, тогда как для пяти модельных протеомов эукариот (человек, плодовая муха, дрожжи, делящиеся дрожжи, Арабидопсис) этот охват был значительно выше (в среднем 0,4%; от 2 до 23 раз выше, чем у прокариот).[8]

LCR эукариот обычно длиннее, чем LCR прокариот.[8] Средний размер LCR эукариот составляет 42 аминокислоты, тогда как LCR бактерий, архей и фагов имеют длину 38, 36 и 33 аминокислоты соответственно.[8]

В архее галобактерии Натриальба магадии имеет наибольшее количество LCR и наибольшее обогащение LCR.[8] У бактерий, Enhygromyxa salina, дельта-протеобактерии, принадлежащие к миксобактериям, имеют наибольшее количество LCR и наибольшее обогащение LCR.[8] Интересно, что четыре из пяти бактерий с наибольшим обогащением LCR также являются миксобактериями.[8]

Три наиболее обогащенных аминокислоты в LCR бактерий - это пролин, глицин и аланин, тогда как у архей это треонин, аспартат и пролин.[8] В фагах это аланин, глицин и пролин.[8] Глицин и пролин появляются как очень обогащенные аминокислоты во всех трех эволюционных линиях, тогда как аланин сильно обогащен бактериями и фагами, но не архей. С другой стороны, гидрофобные (M, I, L, V) и ароматические аминокислоты (F, Y, W), а также цистеин, аргинин и аспарагин в значительной степени недопредставлены в LCR.[8] Очень похожие тенденции для аминокислот с высоким (G, A, P, S, Q) и низким (M, V, L, I, W, F, R, C) присутствием в LCR также наблюдались у эукариот.[24][21] Этот наблюдаемый образец чрезмерного представительства (обогащения) или недостаточного представительства некоторых аминокислот в LCR можно частично объяснить затратами энергии на синтез или метаболизм каждой из аминокислот.[8] Другим возможным объяснением, которое не исключает предыдущее объяснение стоимости энергии, может быть реакционная способность определенных аминокислот.[8] Например, цистеин - это очень реактивная аминокислота, которую нельзя переносить в больших количествах в небольшом участке белка.[25] Точно так же чрезвычайно гидрофобные области могут образовывать неспецифические белок-белковые взаимодействия между собой и с другими умеренно гидрофобными областями.[26][27] в клетках млекопитающих. Таким образом, их присутствие может нарушить баланс сетей белок-белкового взаимодействия в клетке, особенно если белки-носители высоко экспрессируются.[8] Третье объяснение может быть основано на микроэволюционных силах и, более конкретно, на предвзятости проскальзывания ДНК-полимеразы для определенных ди-три- или тетра-нуклеотидов.[8]

Обогащение аминокислот для определенных функциональных категорий LCR

Биоинформатический анализ LCR прокариот выявил 5 типов обогащения аминокислотами для определенных функциональных категорий LCR.[8]:

  • Белки с GO-терминами, относящимися к связыванию и процессингу полисахаридов, были обогащены серином и треонином в их LCR.
  • Белки с GO-терминами, относящимися к связыванию и процессингу РНК, были обогащены аргинином в их LCR.
  • Белки с терминами GO, относящимися к связыванию и процессингу ДНК, были особенно обогащены лизином, но также и глицином, тирозином, фенилаланином и глутамином в их LCR.
  • Белки с GO-терминами, относящимися к связыванию металлов и, более конкретно, к связыванию с кобальтом или никелем, были обогащены в основном гистидином, но также и аспартатом в их LCR.
  • Белки с GO-терминами, относящимися к сворачиванию белков, были обогащены глицином, метионином и фенилаланином в их LCR.

На основе приведенных выше наблюдений и анализа был разработан веб-сервер нейронной сети под названием LCR-hound для прогнозирования LCR и их функции.[8]

Эволюция

LCR очень интересны с точки зрения микро- и макроэволюции.[8] Они могут возникать в результате проскальзывания, рекомбинации и ремонта ДНК.[28] Таким образом, они связаны с горячими точками рекомбинации и, возможно, даже могут способствовать кроссинговеру.[29][30] Происходя из генетической нестабильности, они могут на уровне ДНК вызывать расширение или сжатие определенной области белка и даже вызывать сдвиги рамки считывания (фазовые варианты), которые влияют на патогенность микробов или обеспечивают исходный материал для эволюции.[31] Что самое интересное, они могут открыть окно в самую раннюю эволюцию жизни.[8][32] Во время ранней эволюции, когда было доступно только несколько аминокислот, а первичный генетический код все еще расширял свой репертуар, первые белки считались короткими, повторяющимися и, следовательно, невысокой сложностью.[33][34] Таким образом, современные LCR могут представлять первичные аспекты эволюции в направлении белкового мира и могут давать подсказки о функциях ранних протопептидов.[8]

Большинство исследований было сосредоточено на эволюции, функциональной и структурной роли эукариотических LCR.[8] Однако всестороннее изучение прокариотических LCR из множества различных прокариотических линий дает уникальную возможность понять происхождение, эволюцию и природу этих регионов. Благодаря высокой эффективной численности популяции и короткому времени генерации прокариот, de novo появление умеренно или умеренно вредного аминокислотного повтора или LCR следует быстро отфильтровать с помощью сильных селективных сил.[8] Это должно быть особенно характерно для LCR, обнаруженных в высокоэкспрессируемых белках, поскольку они также должны иметь большое влияние на энергетическую нагрузку трансляции белков.[35][36] Таким образом, любые прокариотические LCR, которые представляют собой эволюционные случайности, не имеющие функционального значения, не должны фиксироваться генетическим дрейфом и, следовательно, не должны демонстрировать какие-либо уровни сохранения среди умеренно далеких эволюционных родственников.[8] Напротив, любой LCR, обнаруженный среди гомологов нескольких умеренно удаленных видов прокариот, весьма вероятно, должен сохранять функциональную роль.[8]

LCR и протопептиды раннего генетического кода

Аминокислоты с самой высокой частотой в LCR - это глицин и аланин, причем их соответствующие кодоны GGC и GCC являются наиболее частыми, а также комплементарными.[8] У эукариот и, более конкретно, у хордовых (таких как человек, мышь, курица, рыбка данио и морской брызг) LCR, богатые аланином и глицином, чрезмерно представлены в недавно сформированных LCR и, вероятно, лучше переносятся клеткой.[37] Интересно, что также было высказано предположение, что они представляют собой самые первые две аминокислоты.[38] и кодоны[34][39][40] раннего генетического кода. Таким образом, эти два кодона и соответствующие им аминокислоты должны были входить в состав самых ранних олигопептидов длиной от 10 до 55 аминокислот.[41] и очень низкая сложность. Основываясь на нескольких различных критериях и источниках данных, Хиггс и Пудриц[38] предлагают G, A, D, E, V, S, P, I, L, T как ранние аминокислоты генетического кода. Работа Трифонова в значительной степени согласуется с этой категоризацией и предполагает, что ранними аминокислотами в хронологическом порядке являются G, A, D, V, S, P, E, L, T, R. Эволюционный анализ показал, что многие из аминокислот Предполагаемые очень ранние генетические коды (за исключением гидрофобных) значительно обогащены бактериальными LCR.[8] Большинство более поздних дополнений к генетическому коду значительно недостаточно представлены в бактериальных LCR.[8] Таким образом, они выдвигают гипотезу и предполагают, что в бесклеточной среде ранний генетический код мог также производить олигопептиды низкой сложности из валина и лейцина.[8] Однако позже, в более сложной клеточной среде, эти высокогидрофобные LCR стали неуместными или даже токсичными с точки зрения взаимодействия с белками, и с тех пор их отбирали.[8] Кроме того, они также предполагают, что очень ранние протопептиды не имели связывающей роли нуклеиновых кислот,[8] поскольку ДНК и РНК-связывающие LCR сильно обогащены глюцином, аргинином и лизином, однако аргинин и лизин не входят в число аминокислот предложенного раннего генетического кода.

Методы обнаружения

Области низкой сложности в белках могут быть обнаружены с помощью вычислений из последовательности с использованием различных методов и определений, как описано в.[2] Среди самых популярных методологий определения LCR - измерение их энтропии Шеннона.[1] Чем ниже значение рассчитанной энтропии, тем более однородной является область с точки зрения содержания аминокислот. Кроме того, веб-сервер нейронной сети, LCR-hound, был разработан для прогнозирования функции LCR на основе его аминокислотного или диаминокислотного содержания.[8]

использованная литература

  1. ^ а б Вуттон, Джон С. (сентябрь 1994 г.). «Неглобулярные домены в белковых последовательностях: автоматическая сегментация с использованием мер сложности». Компьютеры и химия. 18 (3): 269–285. Дои:10.1016/0097-8485(94)85023-2. PMID 7952898.
  2. ^ а б Миер П., Паладин Л., Тамана С., Петросян С., Хайду-Солтес Б., Урбанек А., Груца А., Плевчински Д., Гринберг М., Бернадо П., Гаспари З, Узунис Ц.А., Промпонас В. Дж., Каява А. В., Хэнкок Д. М., Тосатто, СК, Dosztanyi Z, Andrade-Navarro MA (30 января 2019 г.). «Распутывая сложность белков низкой сложности». Краткий биоинформ. 21 (2): 458–472. Дои:10.1093 / bib / bbz007. ЧВК 7299295. PMID 30698641.
  3. ^ а б Хантли, Мелани А .; Голдинг, Дж. Брайан (01.07.2002). «Простые последовательности редко встречаются в банке данных по белкам». Белки: структура, функции и генетика. 48 (1): 134–140. Дои:10.1002 / prot.10150. ISSN 0887-3585. PMID 12012345. S2CID 42193081.
  4. ^ Кумари, Бандана; Кумар, Равиндра; Кумар, Маниш (2015). «Низкая сложность и неупорядоченные области белков имеют разные структурные и аминокислотные предпочтения». Молекулярные биосистемы. 11 (2): 585–594. Дои:10.1039 / C4MB00425F. ISSN 1742-206X. PMID 25468592.
  5. ^ Luo, H .; Нейвин, Х. (01.07.2014). «Понимание и идентификация аминокислотных повторов». Брифинги по биоинформатике. 15 (4): 582–591. Дои:10.1093 / bib / bbt003. ISSN 1467-5463. ЧВК 4103538. PMID 23418055.
  6. ^ Мацусима, Норио; Ёсида, Хитоши; Кумаки, Ясухиро; Камия, Масакацу; Танака, Таканори; Крецингер, Ёсинобу Идзуми и Роберт Х. (30 ноября 2008 г.). «Гибкие структуры и лигандные взаимодействия тандемных повторов, состоящих из пролина, глицина, аспарагина, серина и / или олигопептидов, богатых треонином в белках». Современная наука о белках и пептидах. 9 (6): 591–610. Дои:10.2174/138920308786733886. PMID 19075749. Получено 2020-11-03.
  7. ^ Аджубей, Алексей А .; Sternberg, Michael J.E .; Макаров, Александр Александрович (июнь 2013 г.). «Спираль полипролина-II в белках: структура и функции». Журнал молекулярной биологии. 425 (12): 2100–2132. Дои:10.1016 / j.jmb.2013.03.018. PMID 23507311.
  8. ^ а б c d е ж г час я j k л м п о п q р s т ты v ш Икс у z аа ab ac объявление ае аф аг ах Нтунтуми, Криса; Властаридис, Панайотис; Моссиалос, Димитрис; Статопулос, Константинос; Илиопулос, Иоаннис; Промпонас, Василиос; Оливер, Стивен Дж. Амуциас, Григорис Д. (04.11.2019). «Области низкой сложности в белках прокариот выполняют важные функциональные роли и являются высококонсервативными». Исследования нуклеиновых кислот. 47 (19): 9998–10009. Дои:10.1093 / нар / gkz730. ISSN 0305-1048. ЧВК 6821194. PMID 31504783. CC-BY icon.svg Текст был скопирован из этого источника, который доступен под Международная лицензия Creative Commons Attribution 4.0.
  9. ^ Карлин, С .; Brocchieri, L .; Бергман, А .; Mrazek, J .; Джентлз, А. Дж. (8 января 2002 г.). «Аминокислоты работают в протеомах эукариот и ассоциациях болезней». Труды Национальной академии наук. 99 (1): 333–338. Bibcode:2002PNAS ... 99..333K. Дои:10.1073 / pnas.012608599. ISSN 0027-8424. ЧВК 117561. PMID 11782551.
  10. ^ Миркин, Сергей М. (21.06.2007). «Расширяемые повторы ДНК и болезнь человека». Природа. 447 (7147): 932–940. Bibcode:2007Натура.447..932М. Дои:10.1038 / природа05977. ISSN 0028-0836. PMID 17581576. S2CID 4397592.
  11. ^ Кумари, Бандана; Кумар, Равиндра; Чаухан, Випин; Кумар, Маниш (30.10.2018). «Сравнительный функциональный анализ белков, содержащих предсказанные амилоидные области низкой сложности». PeerJ. 6: e5823. Дои:10.7717 / peerj.5823. ISSN 2167-8359. ЧВК 6214233. PMID 30397544.
  12. ^ Итак, Christopher R .; Страхи, Kenan P .; Лири, Дагмар Х .; Scancella, Jenifer M .; Ван, Чжэн; Лю, Джинни Л .; Ориуэла, Беатрис; Ритчоф, Дэн; Spillmann, Christopher M .; Уол, Кэтрин Дж. (8 ноября 2016 г.). «Последовательность в основе наноструктуры Barnacle Cement Nanostructure определяется белками с гомологией шелка». Научные отчеты. 6 (1): 36219. Bibcode:2016НатСР ... 636219С. Дои:10.1038 / srep36219. ISSN 2045-2322. ЧВК 5099703. PMID 27824121.
  13. ^ Haritos, Victoria S .; Ниранджане, Аджай; Вайсман, Сара; Trueman, Holly E .; Шрисканта, Алагакон; Сазерленд, Тара Д. (07.11.2010). «Нарушение использования: онихофораны для поимки добычи используют белки с высокой степенью неструктурированности, а не шелк». Труды Королевского общества B: биологические науки. 277 (1698): 3255–3263. Дои:10.1098 / rspb.2010.0604. ISSN 0962-8452. ЧВК 2981920. PMID 20519222.
  14. ^ Брюэр, С .; Толлей, М .; Trayer, I.P .; Barr, G.C .; Dorman, C.J .; Hannavy, K .; Higgins, C.F .; Evans, J.S .; Levine, B.A .; Wormald, M.R. (1990-12-20). «Структура и функция дипептидных повторов X-Pro в белках TonB Salmonella typhimurium и Escherichia coli». Журнал молекулярной биологии. 216 (4): 883–895. Дои:10.1016 / S0022-2836 (99) 80008-4. PMID 2266560.
  15. ^ Робисон, Аарон Д .; Солнце, Симоу; Пойтон, Мэтью Ф .; Джонсон, Грегори А .; Пеллуа, Жан-Филипп; Юнгвирт, Павел; Ваздар, Марио; Кремер, Пол С. (2016-09-08). «Полиаргинин более сильно и кооперативно, чем полилизин, взаимодействует с бислоями фосфолипидов». Журнал физической химии B. 120 (35): 9287–9296. Дои:10.1021 / acs.jpcb.6b05604. ISSN 1520-6106. ЧВК 5912336. PMID 27571288.
  16. ^ а б Zhu, Z. Y .; Карлин, С. (1996-08-06). «Кластеры заряженных остатков в трехмерных структурах белков». Труды Национальной академии наук. 93 (16): 8350–8355. Bibcode:1996PNAS ... 93.8350Z. Дои:10.1073 / пнас.93.16.8350. ISSN 0027-8424. ЧВК 38674. PMID 8710874.
  17. ^ Kushwaha, Ambuj K .; Гроув, Энн (01.02.2013). «С-концевые повторы последовательности низкой сложности Mycobacterium smegmatis Ku модулируют связывание ДНК». Отчеты по бионауке. 33 (1): 175–84. Дои:10.1042 / BSR20120105. ISSN 0144-8463. ЧВК 3553676. PMID 23167261.
  18. ^ Фругье, Магали; Бур, Таня; Аяч, Майя; Santos, Manuel A.S .; Рудингер-Тирион, Жоэль; Теобальд-Дитрих, Анна; Пицци, Элизабетта (21 января 2010 г.). «Области низкой сложности ведут себя как губки тРНК, помогая ко-трансляционному сворачиванию плазмодийных белков». Письма FEBS. 584 (2): 448–454. Дои:10.1016 / j.febslet.2009.11.004. PMID 19900443. S2CID 24172658.
  19. ^ Тайдмерс, Йенс; Могк, Аксель; Букау, Бернд (ноябрь 2010 г.). «Клеточные стратегии для контроля агрегации белков». Обзоры природы Молекулярная клеточная биология. 11 (11): 777–788. Дои:10.1038 / nrm2993. ISSN 1471-0072. PMID 20944667. S2CID 22449895.
  20. ^ Лин, Цзицян; Чо, Крис; Го, Ли-Тао; Aerni, Hans R .; Райнхарт, Джесси; Зёлль, Дитер (14 декабря 2012 г.). «Агрегация белков, вызванная действием аминогликозидов, предотвращается поглотителем перекиси водорода». Молекулярная клетка. 48 (5): 713–722. Дои:10.1016 / j.molcel.2012.10.001. ЧВК 3525788. PMID 23122414.
  21. ^ а б Хэрти, Вильфрид; Голдинг, Дж. Брайан (октябрь 2010 г.). Бонен, Линда (ред.). «Последовательности низкой сложности и одиночные аминокислотные повторы: не просто« мусорные »пептидные последовательности». Геном. 53 (10): 753–762. Дои:10.1139 / G10-063. ISSN 0831-2796. PMID 20962881.
  22. ^ Фокс, Н. Г. (21 марта 2005 г.). «Функциональное понимание распределения и роли белков, содержащих гомопептидные повторы». Геномные исследования. 15 (4): 537–551. Дои:10.1101 / гр.3096505. ISSN 1088-9051. ЧВК 1074368. PMID 15805494.
  23. ^ Albà, M.M .; Tompa, P .; Вейтия, Р.А. (2007), Вольф, Ж.-Н. (ред.), «Аминокислотные повторы, структура и эволюция белков», Геномная динамика, Базель: KARGER, стр. 119–130, Дои:10.1159/000107607, ISBN 978-3-8055-8340-4, получено 2020-11-03
  24. ^ Marcotte, Эдвард М .; Пеллегрини, Маттео; Йейтс, Тодд О .; Эйзенберг, Дэвид (1999-10-15). «Перепись белковых повторов». Журнал молекулярной биологии. 293 (1): 151–160. Дои:10.1006 / jmbi.1999.3136. PMID 10512723.
  25. ^ Марино, Стефано М .; Гладышев, Вадим Н. (2012-02-10). «Анализ и функциональное прогнозирование реактивных остатков цистеина». Журнал биологической химии. 287 (7): 4419–4425. Дои:10.1074 / jbc.R111.275578. ISSN 0021-9258. ЧВК 3281665. PMID 22157013.
  26. ^ Дорсман, Дж. К. (15.06.2002). «Сильная агрегация и повышенная токсичность полилейцина по сравнению с полиглутаминовыми участками в клетках млекопитающих». Молекулярная генетика человека. 11 (13): 1487–1496. Дои:10.1093 / hmg / 11.13.1487. PMID 12045202.
  27. ^ Ома, Йоко; Кино, Йошихиро; Сасагава, Нобору; Ишиура, Шоичи (2004-05-14). «Внутриклеточная локализация гомополимерных аминокислот, содержащих протеины, экспрессируемые в клетках млекопитающих». Журнал биологической химии. 279 (20): 21217–21222. Дои:10.1074 / jbc.M309887200. ISSN 0021-9258. S2CID 23798438.
  28. ^ Эллегрен, Ханс (01.06.2004). «Микроспутники: простые последовательности со сложной эволюцией». Природа Обзоры Генетика. 5 (6): 435–445. Дои:10.1038 / nrg1348. ISSN 1471-0056. PMID 15153996. S2CID 11975343.
  29. ^ Верстрепен, Кевин Дж; Jansen, An; Льюиттер, Фрэн; Финк, Джеральд Р. (2005-09-01). «Внутригенные тандемные повторы создают функциональную изменчивость». Природа Генетика. 37 (9): 986–990. Дои:10,1038 / ng1618. ISSN 1061-4036. ЧВК 1462868. PMID 16086015.
  30. ^ Сивах, Пратибха; Попхали, Саураб Дилип; Ганеш, Субраманиам (01.07.2006). «Геномные и эволюционные исследования генов, кодирующих белки с одиночными аминокислотными повторами». Молекулярная биология и эволюция. 23 (7): 1357–1369. Дои:10.1093 / molbev / msk022. ISSN 1537-1719. PMID 16618963.
  31. ^ Моксон, Ричард; Бейлисс, Крис; Худ, Дерек (01.12.2006). «Бактериальные непредвиденные локусы: роль простых последовательностей ДНК-повторов в бактериальной адаптации». Ежегодный обзор генетики. 40 (1): 307–333. Дои:10.1146 / annurev.genet.40.110405.090442. ISSN 0066-4197. PMID 17094739.
  32. ^ Толл-Риера, М .; Rado-Trilla, N .; Мартис, Ф .; Альба, М. М. (2012-03-01). «Роль последовательностей низкой сложности в формировании новых белковых кодирующих последовательностей». Молекулярная биология и эволюция. 29 (3): 883–886. Дои:10.1093 / molbev / msr263. ISSN 0737-4038. PMID 22045997.
  33. ^ Оно, С .; Эпплен, Дж. Т. (1 июня 1983 г.). «Примитивный код и повторы основных олигомеров как первичная последовательность, кодирующая белок». Труды Национальной академии наук. 80 (11): 3391–3395. Bibcode:1983PNAS ... 80.3391O. Дои:10.1073 / pnas.80.11.3391. ISSN 0027-8424. ЧВК 394049. PMID 6574491.
  34. ^ а б Трифонов, Эдвард Н. (сентябрь 2009 г.). «Происхождение генетического кода и самых ранних олигопептидов». Исследования в области микробиологии. 160 (7): 481–486. Дои:10.1016 / j.resmic.2009.05.004. PMID 19524038.
  35. ^ Акаши, Хироши; Годзобори, Такаши (19 марта 2002 г.). «Метаболическая эффективность и аминокислотный состав в протеомах Escherichia coli и Bacillus subtilis». Труды Национальной академии наук. 99 (6): 3695–3700. Bibcode:2002PNAS ... 99.3695A. Дои:10.1073 / pnas.062526999. ISSN 0027-8424. ЧВК 122586. PMID 11904428.
  36. ^ Бартон, Майкл Д .; Дельнери, Даниэла; Оливер, Стивен Дж .; Рэттрей, Магнус; Бергман, Кейси М. (17 августа 2010 г.). Bähler, Jürg (ред.). "Эволюционная системная биология стоимости биосинтеза аминокислот в дрожжах". PLOS ONE. 5 (8): e11935. Bibcode:2010PLoSO ... 511935B. Дои:10.1371 / journal.pone.0011935. ISSN 1932-6203. ЧВК 2923148. PMID 20808905.
  37. ^ Радо-Трилла, Нурия; Альба, MMar (2012). «Анализ роли регионов низкой сложности в эволюции белков позвоночных». BMC Эволюционная биология. 12 (1): 155. Дои:10.1186/1471-2148-12-155. ISSN 1471-2148. ЧВК 3523016. PMID 22920595.
  38. ^ а б Хиггс, Пол Дж .; Пудриц, Ральф Э. (июнь 2009 г.). "Термодинамические основы синтеза пребиотических аминокислот и природа первого генетического кода". Астробиология. 9 (5): 483–490. arXiv:0904.0402. Bibcode:2009AsBio ... 9..483H. Дои:10.1089 / аст.2008.0280. ISSN 1531-1074. PMID 19566427. S2CID 9039622.
  39. ^ Трифонов, Э.Н. (2000-12-30). «Согласованный временной порядок аминокислот и эволюция триплетного кода». Ген. 261 (1): 139–151. Дои:10.1016 / S0378-1119 (00) 00476-5. PMID 11164045.
  40. ^ Трифонов, Эдуард Н. (2004-08-01). «Тройной код из первых принципов». Журнал биомолекулярной структуры и динамики. 22 (1): 1–11. Дои:10.1080/07391102.2004.10506975. ISSN 0739-1102. PMID 15214800. S2CID 28509952.
  41. ^ Феррис, Джеймс П .; Hill, Aubrey R .; Лю, Рихэ; Оргел, Лесли Э. (1996-05-02). «Синтез длинных пребиотических олигомеров на минеральных поверхностях». Природа. 381 (6577): 59–61. Bibcode:1996Натура 381 ... 59F. Дои:10.1038 / 381059a0. ISSN 0028-0836. PMID 8609988. S2CID 4351826.