WikiDer > GenBank

GenBank
Содержание
Описание	Нуклеотидные последовательности для более чем 300 000 организмов с поддерживающей библиографической и биологической аннотацией.
Типы данных; захвачен	Нуклеотидная последовательность; Белковая последовательность;
Организмы	Все
Связаться с нами
Исследовательский центр	NCBI
Основное цитирование	PMID 21071399
Дата выхода	1982; 38 лет назад
Доступ
Формат данных	XML; ASN.1; Формат Genbank;
Интернет сайт	NCBI
Скачать URL	ncbi ftp
веб-сервис URL	Eutils; мыло;
инструменты
Интернет	ВЗРЫВ
Автономный	ВЗРЫВ
Разное
Лицензия	Не понятно

GenBank

В GenBank база данных последовательностей является открытый доступ, аннотированная коллекция всех общедоступных нуклеотид последовательности и их белок переводы. Он производится и поддерживается Национальный центр биотехнологической информации (NCBI; часть Национальные институты здоровья в Соединенные Штаты) как часть Сотрудничество с международными базами данных нуклеотидных последовательностей (INSDC).

GenBank и его сотрудники получают последовательности, произведенные в лабораториях по всему миру из более чем 100 000 различных организмы. База данных была создана в 1982 г. Уолтер Гоуд и Лос-Аламосская национальная лаборатория. GenBank стал важной базой данных для исследований в биологических областях и за последние годы вырос на экспоненциальная скорость удваивая примерно каждые 18 месяцев.^[2]^[3]

Выпуск 194, выпущенный в феврале 2013 года, содержал более 150 миллиардов нуклеотидных оснований в более чем 162 миллионах последовательностей.^[4] GenBank построен на основе прямых заявок от отдельных лабораторий, а также массовых заявок от крупных последовательность действий центры.

Представления

В GenBank можно отправлять только оригинальные последовательности. Прямая отправка в GenBank осуществляется с использованием BankIt, которая представляет собой веб-форму или автономную программу отправки, Блесток. После получения представления последовательности сотрудники GenBank проверяют оригинальность данных и назначают инвентарный номер последовательность и выполняет проверки качества. Затем представленные материалы отправляются в общедоступную базу данных, где записи могут быть найдены Entrez или скачать FTP. Массовое представление Выраженный тег последовательности (СТАНДАРТНОЕ ВОСТОЧНОЕ ВРЕМЯ), Сайт с тегами последовательностей (СТС), Последовательность исследования генома (GSS) и Последовательность генома с высокой пропускной способностью (HTGS) данные чаще всего предоставляются крупными центрами секвенирования. Группа прямых заявок GenBank также обрабатывает полные последовательности микробного генома.

История

Уолтер Гоуд из Группа теоретической биологии и биофизики в Лос-Аламосская национальная лаборатория и другие создали базу данных последовательностей в Лос-Аламосе в 1979 году, кульминацией которой стало создание общедоступного GenBank в 1982 году.^[5] Финансирование было предоставлено Национальные институты здоровья, Национальный научный фонд, Министерство энергетики и Министерство обороны. LANL сотрудничал по GenBank с фирмой Болт, Беранек и Ньюман, и к концу 1983 года в нем хранилось более 2000 последовательностей.

В середине 1980-х биоинформатическая компания Intelligenetics Стэндфордский Университет руководил проектом GenBank в сотрудничестве с LANL.^[6] Как один из первых биоинформатика общественных проектов в Интернете, стартовал проект GenBank BIOSCI/ Новостные группы Bionet для продвижения открытый доступ общение между учеными-биологами. В период с 1989 по 1992 год проект GenBank перешел во вновь созданный Национальный центр биотехнологической информации.^[7]

Genbank и EMBL: NucleotideSequences 1986/1987, тома с I по VII.

CDRom Genbank v100

Рост

Рост пар оснований GenBank с 1982 по 2018 гг. полулогарифмическая шкала

Генбанк примечания к выпуску в версии 162.0 (октябрь 2007 г.) указано, что «с 1982 г. по настоящее время количество баз в GenBank удваивается примерно каждые 18 месяцев».^[4]^[8] По состоянию на 15 июня 2019 г.^{[Обновить]}, GenBank версии 232.0 насчитывает 213,383,758 места329 835 282 370 оснований из 213 383 758 зарегистрированных последовательностей.^[4]

База данных GenBank включает дополнительные наборы данных, которые создаются механически из коллекции данных основной последовательности и поэтому исключаются из этого подсчета.

Основные организмы в GenBank (выпуск 191)^[9]
Организм	пар оснований
Homo sapiens	1.6310774187×10^¹⁰
Mus musculus	9.974977889×10^⁹
Раттус норвегикус	6.521253272×10^⁹
Bos taurus	5.386258455×10^⁹
Zea Mays	5.062731057×10^⁹
Sus scrofa	4.88786186×10^⁹
Данио Рерио	3.120857462×10^⁹
Стронгилоцентротус пурпуратус	1.435236534×10^⁹
Macaca mulatta	1.256203101×10^⁹
Oryza sativa Japonica Group	1.255686573×10^⁹
Nicotiana tabacum	1.197357811×10^⁹
Xenopus (Silurana) tropicalis	1.249938611×10^⁹
Drosophila melanogaster	1.11996522×10^⁹
Пан троглодиты	1.008323292×10^⁹
Arabidopsis thaliana	1.144226616×10^⁹
Обыкновенная волчанка	951,238,343
Vitis vinifera	999,010,073
Gallus gallus	899,631,338
Глицин макс	906,638,854
Triticum aestivum	898,689,329

Неполная идентификация

В общедоступных базах данных, в которых можно выполнять поиск с помощью инструмента поиска базового локального сопоставления Национального центра биотехнологической информации (NCBI BLAST), отсутствуют проверенные экспертами последовательности типовых штаммов и последовательности нетиповых штаммов. С другой стороны, хотя коммерческие базы данных потенциально содержат высококачественные данные отфильтрованных последовательностей, количество ссылочных последовательностей ограничено.

Бумага, выпущенная в Журнал клинической микробиологии^[10] оценил 16S рРНК результаты секвенирования генов анализируются с помощью GenBank в сочетании с другими общедоступными общедоступными базами данных в Интернете с контролем качества, такими как EzTaxon-e (https://web.archive.org/web/20130928154318/http://eztaxon-e.ezbiocloud.net/) и BIBI (https://web.archive.org/web/20151001000357/http://pbil.univ-lyon1.fr/bibi/) базы данных. Результаты показали, что анализы, выполненные с использованием GenBank в сочетании с EzTaxon-e (каппа = 0,79) были более разборчивыми, чем использование только GenBank (каппа = 0,66) или других баз данных.

Смотрите также

Ансамбль
Справочная база данных белков человека (HPRD)
Анализ последовательности
UniProt
Список секвенированных эукариотических геномов
Список секвенированных геномов архей
RefSeq - База данных эталонных последовательностей
Гениальный - включает инструмент отправки GenBank
Данные открытой науки

использованная литература

^ В страница загрузки в UCSC говорит "NCBI не накладывает ограничений на использование или распространение данных GenBank. Однако некоторые заявители могут требовать патент, авторские права или другие права интеллектуальной собственности на все или часть предоставленных данных. NCBI не может оценить обоснованность таких утверждений и, следовательно, не может предоставить комментарии или неограниченное разрешение на использование, копирование или распространение информации, содержащейся в GenBank ».
^ Benson D; Карш-Мизрахи, И .; Lipman, D. J .; Ostell, J .; Уиллер, Д. Л .; и другие. (2008). «ГенБанк». Исследования нуклеиновых кислот. 36 (База данных): D25 – D30. Дои:10.1093 / нар / гкм929. ЧВК 2238942. PMID 18073190.
^ Benson D; Карш-Мизрахи, И .; Lipman, D. J .; Ostell, J .; Sayers, E.W .; и другие. (2009). «ГенБанк». Исследования нуклеиновых кислот. 37 (База данных): D26 – D31. Дои:10.1093 / nar / gkn723. ЧВК 2686462. PMID 18940867.
^ ^а ^б ^c «Примечания к выпуску GenBank». NCBI.
^ Хэнсон, Тодд (2000-11-21). «Умер Уолтер Гоуд, основатель GenBank». Информационный бюллетень: некролог. Лос-Аламосская национальная лаборатория.
^ История LANL GenBank
^ Бентон Д. (1990). «Последние изменения в онлайн-сервисе GenBank». Исследования нуклеиновых кислот. 18 (6): 1517–1520. Дои:10.1093 / nar / 18.6.1517. ЧВК 330520. PMID 2326192.
^ Бенсон, Д. А .; Cavanaugh, M .; Кларк, К .; Карш-Мизрахи, И .; Lipman, D. J .; Ostell, J .; Сэйерс, Э. В. (2012). «ГенБанк». Исследования нуклеиновых кислот. 41 (Проблема с базой данных): D36 – D42. Дои:10.1093 / нар / gks1195. ЧВК 3531190. PMID 23193287.
^ Бенсон Д. А., Карш-Мизрахи И., Липман Д. Д., Остелл Дж., Сэйерс Е. В. (январь 2011 г.). «ГенБанк». Нуклеиновые кислоты Res. 39 (Выпуск базы данных): D32–37. Дои:10.1093 / nar / gkq1079. ЧВК 3013681. PMID 21071399.
^ Кён Сон Парка, Чанг-Сок Киа, Чхол-Ин Канг, Яэ-Жан Кимк, Ду Рён Чунгб, Кён Ран Пекб, Джэ-Хун Сонб и Нам Ён Ли (май 2012 г.). «Оценка услуг GenBank, EzTaxon и BIBI для молекулярной идентификации изолятов клинических культур крови, которые не были идентифицированы или были неправильно идентифицированы обычными методами». J. Clin. Микробиол. 50 (5): 1792–1795. Дои:10.1128 / JCM.00081-12. ЧВК 3347139. PMID 22403421.CS1 maint: использует параметр авторов (ссылка на сайт)

Эта статья включаетматериалы общественного достояния от Национальный центр биотехнологической информации документ: «Справочник NCBI».

внешние ссылки

GenBank
Пример записи последовательности для гемоглобина бета
BankIt
Блесток - автономный программный инструмент, разработанный NCBI для отправки и обновления записей в базе данных последовательностей GenBank.
EMBOSS - бесплатное программное обеспечение с открытым исходным кодом для молекулярной биологии
GenBank, RefSeq, TPA и UniProt: что в названии?

[1] В страница загрузки в UCSC говорит "NCBI не накладывает ограничений на использование или распространение данных GenBank. Однако некоторые заявители могут требовать патент, авторские права или другие права интеллектуальной собственности на все или часть предоставленных данных. NCBI не может оценить обоснованность таких утверждений и, следовательно, не может предоставить комментарии или неограниченное разрешение на использование, копирование или распространение информации, содержащейся в GenBank ».

[pmid18073190-2] Benson D; Карш-Мизрахи, И .; Lipman, D. J .; Ostell, J .; Уиллер, Д. Л .; и другие. (2008). «ГенБанк». Исследования нуклеиновых кислот. 36 (База данных): D25 – D30. Дои:10.1093 / нар / гкм929. ЧВК 2238942. PMID 18073190.

[pmid18940867-3] Benson D; Карш-Мизрахи, И .; Lipman, D. J .; Ostell, J .; Sayers, E.W .; и другие. (2009). «ГенБанк». Исследования нуклеиновых кислот. 37 (База данных): D26 – D31. Дои:10.1093 / nar / gkn723. ЧВК 2686462. PMID 18940867.

[ReleaseNotes-4] а ^б ^c «Примечания к выпуску GenBank». NCBI.

[lanl2000-5] Хэнсон, Тодд (2000-11-21). «Умер Уолтер Гоуд, основатель GenBank». Информационный бюллетень: некролог. Лос-Аламосская национальная лаборатория.

[lanl1994-6] История LANL GenBank

[pmid2326192-7] Бентон Д. (1990). «Последние изменения в онлайн-сервисе GenBank». Исследования нуклеиновых кислот. 18 (6): 1517–1520. Дои:10.1093 / nar / 18.6.1517. ЧВК 330520. PMID 2326192.

[8] Бенсон, Д. А .; Cavanaugh, M .; Кларк, К .; Карш-Мизрахи, И .; Lipman, D. J .; Ostell, J .; Сэйерс, Э. В. (2012). «ГенБанк». Исследования нуклеиновых кислот. 41 (Проблема с базой данных): D36 – D42. Дои:10.1093 / нар / gks1195. ЧВК 3531190. PMID 23193287.

[pmid21071399-9] Бенсон Д. А., Карш-Мизрахи И., Липман Д. Д., Остелл Дж., Сэйерс Е. В. (январь 2011 г.). «ГенБанк». Нуклеиновые кислоты Res. 39 (Выпуск базы данных): D32–37. Дои:10.1093 / nar / gkq1079. ЧВК 3013681. PMID 21071399.

[10] Кён Сон Парка, Чанг-Сок Киа, Чхол-Ин Канг, Яэ-Жан Кимк, Ду Рён Чунгб, Кён Ран Пекб, Джэ-Хун Сонб и Нам Ён Ли (май 2012 г.). «Оценка услуг GenBank, EzTaxon и BIBI для молекулярной идентификации изолятов клинических культур крови, которые не были идентифицированы или были неправильно идентифицированы обычными методами». J. Clin. Микробиол. 50 (5): 1792–1795. Дои:10.1128 / JCM.00081-12. ЧВК 3347139. PMID 22403421.CS1 maint: использует параметр авторов (ссылка на сайт)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

v т е Биоинформатика
Базы данных	Базы данных последовательностей: GenBank, Европейский архив нуклеотидов и Банк данных ДНК Японии Вторичные базы данных: UniProt, база данных белковых последовательностей, сгруппированных вместе Swiss-Prot, TrEMBL и Информационный ресурс о белках Другие базы данных: Банк данных белков, Ансамбль и ИнтерПро Специализированные геномные базы данных: СМЕЛЫЙ, База данных генома Saccharomyces, FlyBase, VectorBase, WormBase, База данных генома крысы, PHI-база, Информационный ресурс об арабидопсисе и Информационная сеть по рыбкам данио
Программного обеспечения	ВЗРЫВ Галстук-бабочка Clustal EMBOSS HMMER МЫШЦЫ SAMtools Набор SOAP TopHat
Другой	Сервер: ExPASy Онтология: Генная онтология Розалинд (образовательная платформа)
Учреждения	Broad Institute Китайский национальный генетический банк (CNGB) Кафедра вычислительной биологии (CBD) Microsoft Research - Центр вычислительной и системной биологии Университета Тренто (COSBI) Центр баз данных по наукам о жизни (DBCLS) Банк данных ДНК Японии (DDBJ) Европейский институт биоинформатики (EMBL-EBI) Европейская лаборатория молекулярной биологии (EMBL) Институт Флэтайрон Институт Дж. Крейга Вентера (JCVI) Институт молекулярной клеточной биологии и генетики Макса Планка (MPI-CBG) Национальный центр биотехнологической информации США (NCBI) Японский институт генетики Нидерландский центр биоинформатики (NBIC) Филиппинский центр генома (PGC) Scripps Research Швейцарский институт биоинформатики (SIB) Институт Wellcome Sanger Институт Уайтхеда
Организации	Африканское общество биоинформатики и вычислительной биологии (ASBCB) Ресурс по биоинформатике Австралии (EMBL-AR) Европейская сеть молекулярной биологии (EMBnet) Сотрудничество с международными базами данных нуклеотидных последовательностей (INSDC) Международное общество биодокументации (ЭТО Б) Международное общество вычислительной биологии (ISCB) Студенческий совет (ISCB-SC) Институт геномики и интегративной биологии (CSIR-IGIB) Японское общество биоинформатики (JSBi)
Встречи	Базельская конференция по вычислительной биологии ([ДО Н.Э²]) Европейская конференция по вычислительной биологии (ECCB) Интеллектуальные системы для молекулярной биологии (ISMB) Международная конференция по биоинформатике (InCoB) Конференция ISCB Africa ASBCB по биоинформатике Тихоокеанский симпозиум по биокомпьютингу (PSB) Исследования в области вычислительной молекулярной биологии (РЕКОМБ)
Форматы файлов	Формат CRAM Формат FASTA Формат FASTQ Формат NeXML Формат Nexus Формат Pileup Формат SAM Стокгольмский формат
похожие темы	Вычислительная биология Список биобанков Список биологических баз данных Молекулярная филогенетика Последовательность действий База данных последовательностей Выравнивание последовательности
Категория Commons

Navigation