WikiDer > Расдаман
Оригинальный автор (ы) | Питер Бауманн |
---|---|
Разработчики) | rasdaman GmbH |
Стабильный выпуск | rasdaman v9.8.1 / 26 июля 2019 г. |
Репозиторий | |
Написано в | C ++[1] |
Операционная система | наиболее Unix-подобный операционные системы |
Тип | Массив СУБД |
Лицензия | GPL v3 (сервер) / LGPL v3 (клиент) или проприетарный[2] |
Интернет сайт | Расдаман |
Расдаман ("менеджер растровых данных") - это Массив СУБД, это Система управления базами данных который добавляет возможности для хранения и извлечения огромных многомерных массивы, например данные датчика, изображения, моделирования и статистики. Часто используемый синоним массивов - растровые данные, например, в 2-D растровая графика; это на самом деле мотивировало название Расдаман. Однако расдаман не имеет ограничений по количеству измерений - он может служить, например, для данных одномерных измерений, двухмерных спутниковых изображений, временных рядов трехмерных изображений x / y / t и данных разведки x / y / z. , 4-D данные об океане и климате, и даже за пределами пространственно-временных измерений.
История
В 1989 г. Питер Бауманн начал исследование поддержки изображений в базе данных, затем на Институт компьютерной графики Фраунгофера. После углубленного исследования формализации растровых данных при формировании изображений, в частности AFATL Image Algebra, он создал модель базы данных для многомерных массивов, включая модель данных и язык декларативных запросов.[3] новаторство в области Базы данных массивов. Сегодня многомерные массивы также известны как Кубы данных.
В TU Мюнхен, в проекте фундаментальных исследований, финансируемых ЕС Расдаман, первый прототип был установлен на вершине O2 объектно-ориентированная СУБДи протестированы в приложениях для наук о Земле и жизни.[4] В ходе последующих проектов, финансируемых ЕС, эта система была дополнена и расширена для поддержки реляционных СУБД. Специальное исследовательское подразделение, rasdaman GmbH,[5] была создана для оказания коммерческой поддержки в дополнение к исследованиям, которые впоследствии были продолжены в Университет Джейкобса.[6] С тех пор обе организации сотрудничают в дальнейшем развитии и использовании технологии расдамана.
Концепции
Модель данных
На основе алгебры массивов[7] Специально разработанный для баз данных, rasdaman добавляет в реляционную модель новый тип атрибута - массив. Поскольку это определение массива параметризовано, оно составляет второго порядка построить или шаблон; этот факт отражается функционалами второго порядка в алгебре и языке запросов.
По историческим причинам столы называются коллекции, поскольку первоначальный дизайн подчеркивал встраивание в стандарт объектно-ориентированной базы данных, ODMG. Предвидя полную интеграцию с SQL, коллекции rasdaman представляют бинарные отношения, в которых первый атрибут является идентификатор объекта а второй - массив. Это позволяет создать ссылки на внешние ключи между массивами и обычным реляционные кортежи.
Язык растровых запросов
Язык запросов rasdaman, rasql, встраивается в стандартный SQL и его обработку, ориентированную на наборы. Для нового типа атрибутов, многомерных массивов, предоставляется набор дополнительных операций, которые все основаны на минимальном наборе алгебраически определенных основных операторов. , конструктор массива (который устанавливает новый массив и заполняет его значениями) и конденсаторный массив (который, как и агрегаты SQL, извлекает скалярную сводную информацию из массива). Язык запросов является декларативным (и, следовательно, оптимизируемым) и безопасным при оценке, то есть каждый запрос гарантированно возвращается после конечного числа шагов обработки.
Руководство по запросам rasql[8] предоставляет подробности, здесь несколько примеров могут проиллюстрировать его использование:
- "Из всех кубов данных климатического моделирования 4-D x / y / z / t вырез, который содержит все в x, ay, извлекает от 100 до 200, все доступно вдоль z, и срез в позиции 42 (фактически приводит к 3 -D x / y / z куб) ":
Выбрать c[ *:*, 100:200, *:*, 42 ] из КлиматСимуляторы в качестве c
- «На всех спутниковых снимках Landsat исключить все незеленые зоны»:
Выбрать img * (img.зеленый > 130)из LandsatАрхив в качестве img
Примечание: это очень наивная формулировка поиска растительности; на практике можно было бы использовать NDVI формулу, используйте нулевые значения для маскировки облаков и еще несколько приемов.
- «Все изображения МРТ, где в некоторой области, определенной битовыми масками, интенсивность превышает пороговое значение 250»:
Выбрать imgиз МРТ в качестве img, Маски в качестве мкуда some_cells( img > 250 и м )
- «Двухмерный срез x / y из всех кубов данных четырехмерного моделирования климата, каждый из которых закодирован в формате PNG»:
Выбрать PNG( c[ *:*, *:*, 100, 42 ] )из КлиматСимуляторы в качестве c
Архитектура
Управление хранилищем
Растровые объекты хранятся в стандартной реляционной базе данных на основе разделения растрового объекта на плитка.[9] Помимо обычного разделения, возможно любое пользовательское или системное разделение. Поскольку листы образуют единицу доступа к диску, критически важно, чтобы шаблон листов соответствовал шаблонам доступа запроса; несколько стратегий мозаики помогают создать хорошо работающую мозаику. Геоиндекс используется для быстрого определения плиток, на которые влияет запрос. Необязательно, плитки сжимаются с использованием одного из различных вариантов, включая алгоритмы без потерь и с потерями (вейвлет); независимо от этого, результаты запроса могут быть сжаты для передачи клиенту. И стратегия листов, и сжатие содержат параметры настройки базы данных.
Плитки и индекс плитки хранятся как BLOB-объекты в реляционной базе данных, которая также содержит словарь данных, необходимый для системы динамических типов Расдамана. Адаптеры доступны для нескольких реляционных систем, в том числе с открытым исходным кодом. PostgreSQL.Для массивов, размер которых превышает дисковое пространство, была разработана поддержка иерархического управления хранением данных (HSM).
Обработка запросов
Запросы анализируются, оптимизируются и выполняются на сервере rasdaman. Парсер получает строку запроса и генерирует дерево операций. Кроме того, он применяет правила алгебраической оптимизации к дереву запроса, где это применимо; из 150 правил алгебраической перезаписи 110 фактически оптимизируют, а остальные 40 служат для преобразования запроса в каноническую форму. На портативном компьютере анализ и оптимизация занимают меньше миллисекунды.
Казнь следует за потоковое воспроизведение плитки парадигма: всякий раз, когда это возможно, плитки массива, адресованные запросом, выбираются последовательно, и каждая плитка отбрасывается после обработки. Это приводит к созданию архитектуры, масштабируемой до объемов данных, на порядки превышающих основную память сервера.
Выполнение запроса распараллелено. Во-первых, rasdaman предлагает параллелизм между запросами: диспетчер планирует запросы в пул серверных процессов для каждой транзакции. Внутризапросный параллелизм прозрачно распределяет поддеревья запросов по доступным ядрам, графическим процессорам или облачным узлам.
Клиентские API
Основным интерфейсом для rasdaman является язык запросов. Встраивания в C ++ и Java API позволяют вызывать запросы, а также использовать удобные клиентские функции для обработки массивов. Сами по себе массивы поставляются в формате основной памяти клиентского языка и архитектуры процессора, готовые для дальнейшей обработки. Кодеки формата данных позволяют получать массивы в распространенных растровых форматах, таких как CSV, PNG, и NetCDF.
Предоставляется набор инструментов веб-дизайна raswct, который упрощает создание интерфейсов веб-запросов, включая графические виджеты для параметризованной обработки запросов, такие как ползунки для пороговых значений в запросах.
Гео веб-службы
А Ява сервлет петаскоп, работающий как клиент rasdaman, предлагает интерфейсы веб-сервисов, специально предназначенные для доступа, обработки и фильтрации геоданных. Следующее OGC стандарты поддерживаются: WMS, WCS, WCPS, и WPS.
За WCS и WCPS, расдаман - это эталонная реализация.
Статус и модель лицензии
Сегодня rasdaman - это полноценная реализация, предлагающая функции запросов к массиву выбора / вставки / обновления / удаления. Он используется как в исследовательских, так и в коммерческих установках.
В сотрудничестве с первоначальным владельцем кода, rasdaman GmbH[5] и Университет Джейкобса, в 2008 - 2009 годах было выполнено разделение кода, в результате расдамское сообщество,[10] ан Открытый исходный код филиал, и расдаман предприятие, торговая отрасль. С того времени, расдамское сообщество поддерживается Университетом Джейкобса, тогда как расдаман предприятие остается собственностью rasdaman GmbH. Разница между обоими вариантами в основном состоит в повышении производительности (например, специальных методах оптимизации), предназначенных для поддержки особенно больших баз данных, количества пользователей и сложных запросов; Подробности доступны на расдамское сообщество интернет сайт.[11]
В расдамское сообщество лицензия освобождает сервер в GPL и все клиентские части в LGPL, что позволяет использовать систему в любой лицензионной среде.
Воздействие и использование
Будучи первой выпущенной СУБД Array (первый прототип был доступен в 1996 году), rasdaman сформировал эту недавнюю область исследования баз данных. Концепции модели данных и запросов (декларативность, иногда выбор операторов) находят свое отражение в более поздних подходах.
В 2008 г. Открытый геопространственный консорциум выпустил Служба обработки веб-материалов стандарт, который определяет язык растровых запросов на основе концепции покрытие. Семантика оператора[12] находится под влиянием алгебры расдамановых массивов.
Земля[13] это витрина для OGC покрытие стандарты в действии, предлагая варианты использования от 1-D до 4-D для доступа к растровым данным и специальной обработки. EarthLook построен на расдамане.
Пример большого проекта, в котором расдаман используется для масштабных услуг во всех Науки о Земле это EarthServer,[14] шесть сервисов объемом не менее 100 терабайт каждая были настроены для интегрированного поиска данных / метаданных и распределенной обработки запросов.
Рекомендации
- ^ «Проект с открытым исходным кодом rasdaman на Open Hub». Open Hub. Программное обеспечение Black Duck. Получено 2020-01-14.
- ^ «Лицензия Расдамана». rasdaman.org. Получено 2016-08-01.
- ^ Бауманн, П .: Об управлении многомерными дискретными данными. VLDB Journal 4 (3) 1994, специальный выпуск по системам пространственных баз данных, стр. 401 - 444
- ^ http://cordis.europa.eu/result/rcn/20754_en.html
- ^ а б http://www.rasdaman.com
- ^ https://web.archive.org/web/20150924084739/http://www.rasdaman.com/News/archive.php
- ^ Бауманн, П .: Алгебра массивов базы данных для пространственно-временных данных и не только. Proc. НГИЦ’99, LNCS 1649, Springer 1999, стр.76-93
- ^ n.n .: Руководство по языку запросов Rasdaman
- ^ Фуртадо П., Бауманн П. Хранение многомерных массивов на основе произвольной мозаики. Proc. ICDE'99, 23–26 марта 1999 г., Сидней, Австралия, стр. 328–336.
- ^ http://www.rasdaman.org
- ^ модель лицензии rasdaman
- ^ Бауманн, П .: Стандарт службы обработки веб-покрытия OGC (WCPS). Геоинформатика, 14 (4) 2010, с. 447-479
- ^ http://standards.rasdaman.com/
- ^ http://www.earthserver.eu