WikiDer > Apache HBase
Оригинальный автор (ы) | Powerset |
---|---|
Разработчики) | Фонд программного обеспечения Apache |
изначальный выпуск | 28 марта 2008 г. |
Стабильный выпуск | |
Предварительный выпуск | 2.3.3 / 2 ноября 2020[1] |
Репозиторий | Репозиторий HBase |
Написано в | Ява |
Операционная система | Кроссплатформенность |
Тип | Распределенная база данных |
Лицензия | Лицензия Apache 2.0 |
Интернет сайт | hbase |
HBase является Открытый исходный код нереляционный распределенная база данных по образцу Google Большой стол и написано в Ява. Он разработан как часть Фонд программного обеспечения Apacheс Apache Hadoop проект и работает поверх HDFS (Распределенная файловая система Hadoop) или же Alluxio, предоставляя возможности, подобные Bigtable, для Hadoop. То есть он обеспечивает отказоустойчивой способ хранения большого количества редкий данные (небольшие объемы информации, попавшие в большую коллекцию пустых или неважных данных, например, поиск 50 самых больших элементов в группе из 2 миллиардов записей или поиск ненулевых элементов, представляющих менее 0,1% огромной коллекции).
HBase поддерживает сжатие, работу в памяти и Фильтры Блума по столбцам, как указано в исходной статье Bigtable.[2] Таблицы в HBase могут служить входом и выходом для Уменьшение карты задания выполняются в Hadoop, и к ним можно получить доступ через API Java, а также через ОТДЫХ, Авро или же Бережливость API шлюза. HBase - это магазин с широкими колоннами и получил широкое распространение благодаря происхождению от Hadoop и HDFS. HBase работает поверх HDFS и хорошо подходит для более быстрых операций чтения и записи больших наборов данных с высокой пропускной способностью и низкой задержкой ввода / вывода.
HBase не является прямой заменой классическому SQL база данных, тем не мение Апач Феникс проект предоставляет уровень SQL для HBase, а также JDBC драйвер, который можно интегрировать с различными аналитика и бизнес-аналитика Приложения. В Apache Trafodion проект предоставляет механизм запросов SQL с ODBC и JDBC водители и распределенная защита транзакций ACID через несколько операторов, таблиц и строк, которые используют HBase в качестве механизма хранения.
HBase теперь обслуживает несколько веб-сайтов, управляемых данными[3] но FacebookПлатформа обмена сообщениями недавно перешла с HBase на MyRocks.[4][5] В отличие от реляционных и традиционных баз данных, HBase не поддерживает сценарии SQL; вместо этого эквивалент написан на Java, используя сходство с приложением MapReduce.
Говоря языком Эрика Брюера Теорема CAP, HBase - это система типа CP.
История
Apache HBase начинался как проект компании. Powerset из-за необходимости обрабатывать большие объемы данных для целей поиск на естественном языке. С 2010 года это проект Apache верхнего уровня.
Facebook в ноябре 2010 года она решила внедрить свою новую платформу обмена сообщениями с использованием HBase, но в 2018 году отказалась от HBase.[4]
Серия 2.2.z - это текущая стабильная линия выпуска, она заменяет предыдущие версии.
Варианты использования и производственные развертывания
Предприятия, использующие HBase
Ниже приводится список известных предприятий, которые использовали или используют HBase:
- 23andMe
- Adobe
- Airbnb использует HBase как часть своей структуры потоковых вычислений AirStream в реальном времени[6]
- Alibaba Group
- Amadeus IT Group, как его основная БД длительного хранения.
- Bloomberg, для хранения данных временных рядов
- Facebook использовал HBase для своей платформы обмена сообщениями с 2010 по 2018 год
- Flipkart использует HBase для своего поискового индекса[7] и мнения пользователей.[8]
- Шквал
- HubSpot
- Imgur использует HBase для работы своей системы уведомлений[9][10]
- Какао[11]
- Meesho
- Netflix[12]
- Pinterest[13]
- Quicken Loans
- Richrelevance
- Ракетное горючие
- Salesforce.com[14]
- Sears
- Sophos, для некоторых из своих серверных систем.
- Spotify использует HBase как основу для Hadoop и машинного обучения.[15]
- Tuenti использует HBase для своей платформы обмена сообщениями.[16][17]
- Xiaomi
- Yahoo!
Смотрите также
- NoSQL
- Магазин с широкой колонной
- Большой стол
- Apache Cassandra
- Oracle NOSQL
- Гипертаблица
- Apache Accumulo
- MongoDB
- Проект Волан-де-Морт
- Риак
- Sqoop
- Elasticsearch
- Апач Феникс
Рекомендации
- ^ а б c d «Apache HBase - Загрузки Apache HBase». Получено 8 декабря 2020.
- ^ Чанг и др. (2006). Bigtable: распределенная система хранения структурированных данных
- ^ «Apache HBase - на базе Apache HBase ™». hbase.apache.org. Получено 8 апреля 2018.
- ^ а б «Перенос хранилища Messenger для оптимизации производительности». www.facebook.com. Получено 5 июля 2018.
- ^ Facebook: почему наши комманды следующего поколения отказались от MySQL Дата обращения: 17 декабря 2010 г.
- ^ HBaseCon (2 августа 2016 г.). «Apache HBase на Airbnb». slideshare.net. Получено 8 апреля 2018.
- ^ «Индексирование поиска в режиме, близком к реальному времени».
- ^ «Всегда ли локализация данных в Hadoop нестандартна?».
- ^ «Почему Imgur отказался от MySQL в пользу HBase - база данных DZone». dzone.com. Получено 8 апреля 2018.
- ^ «Технический вторник: уведомления Imgur: от MySQL к HBase - блог Imgur». blog.imgur.com. Получено 8 апреля 2018.
- ^ Доён Юн. "S2Graph: база данных крупномасштабных графов с HBase".
- ^ Парк Чеолсу и Ашвин Шанкар. «Netflix: интеграция Spark в петабайтном масштабе».
- ^ Engineering, Pinterest (30 марта 2018 г.). «Повышение эффективности резервного копирования HBase в Pinterest». Середина. Получено 14 апреля 2020.
- ^ «Hbase на Salesforce.com».
- ^ Джош Баер. «Как Apache поддерживает музыкальные рекомендации Spotify».
- ^ «Групповой чат Tuenti: простой, но сложный».
- ^ "Tuenti Asyncthrift".
Библиография
- Димидук, Ник; Хурана, Амандип (28 ноября 2012 г.). HBase в действии (1-е изд.). Публикации Мэннинга. п. 350. ISBN 978-1617290527.
- Джордж, Ларс (20 сентября 2011 г.). HBase: полное руководство (1-е изд.). O'Reilly Media. п. 556. ISBN 978-1449396107.
- Цзян, Ифэн (16 августа 2012 г.). Поваренная книга администрирования HBase (1-е изд.). Packt Publishing. п. 332. ISBN 978-1849517140.