WikiDer > Аксиомы масштабного пространства
В обработка изображений и компьютерное зрение, а масштабное пространство framework может использоваться для представления изображения как семейства постепенно сглаженных изображений. Эта структура очень общая и включает множество представления масштабного пространства существовать. Типовой подход к выбору того или иного типа представление масштабного пространства состоит в том, чтобы установить набор аксиомы масштабного пространства, описывающий основные свойства желаемого представления в масштабном пространстве и часто выбираемый таким образом, чтобы сделать представление полезным в практических приложениях. После установки аксиомы сужают возможные представления в масштабном пространстве до меньшего класса, обычно с несколькими свободными параметрами.
Набор аксиом стандартного масштабного пространства, обсуждаемый ниже, приводит к линейному гауссовскому масштабному пространству, которое является наиболее распространенным типом масштабного пространства, используемым в обработке изображений и компьютерном зрении.
Аксиомы масштабного пространства для линейного представления масштабного пространства
Линейный масштабное пространство представление сигнала полученное сглаживанием гауссовым ядром удовлетворяет ряду свойств 'аксиомы масштабного пространства ' что делает его особой формой многомасштабного представления:
- линейность
куда и сигналы, пока и константы,
- инвариантность сдвига
куда обозначает оператор сдвига (перевода)
- то полугрупповая структура
с ассоциированным свойство каскадного сглаживания
- наличие бесконечно малый генератор
- отсутствие локальных экстремумов (нулевые переходы) в одном измерении,
- отсутствие усиления локальных экстремумов в любом количестве измерений
- в пространственных максимумах и в пространственных минимумах,
- вращательная симметрия
- для какой-то функции ,
- масштабная инвариантность
для некоторых функций и куда обозначает преобразование Фурье ,
- позитивность:
- ,
- нормализация:
- .
Фактически, можно показать, что гауссово ядро является уникальный выбор учитывая несколько различных комбинаций подмножеств этих аксиом масштабного пространства:[1][2][3][4][5][6][7][8][9][10][11]большинство аксиом (линейность, инвариантность к сдвигу, полугруппа) соответствуют масштабированию как полугруппе инвариантных к сдвигу линейных операторов, которым удовлетворяет ряд семейств интегральные преобразования, а «не создание локальных экстремумов»[4] для одномерных сигналов или «неусиление локальных экстремумов»[4][7][10] для многомерных сигналов являются ключевыми аксиомами, которые связывают масштабные пространства со сглаживанием (формально параболические уравнения в частных производных) и, следовательно, выберите гауссовский.
Ядро Гаусса также разделимо в декартовых координатах, т.е. . Однако разделимость не считается аксиомой пространства масштаба, поскольку это свойство, зависящее от координат, связанное с проблемами реализации. Кроме того, требование разделимости в сочетании с вращательной симметрией как таковое фиксирует, чтобы сглаживающее ядро было гауссовым.
Существует обобщение теории гауссовского масштабного пространства на более общие аффинные и пространственно-временные масштабные пространства.[10][11] В дополнение к изменчивости по сравнению с масштабом, для решения которой была разработана оригинальная теория масштабного пространства, это обобщенная теория масштабного пространства также включает другие типы изменчивости, включая деформации изображения, вызванные вариациями просмотра, аппроксимируемые локальными аффинными преобразованиями, и относительные движения между объектами в мире и наблюдателем, аппроксимируемые локальными преобразованиями Галилея. В этой теории вращательная симметрия не является необходимой аксиомой масштабного пространства и вместо этого заменяется требованиями аффинной и / или галилеевой ковариантности. Обобщенная теория масштабного пространства приводит к предсказаниям о профилях рецептивного поля в хорошем качественном согласии с профилями рецептивного поля, измеренными с помощью записей клеток в биологическом зрении.[12][13]
в компьютерное зрение, обработка изображений и обработка сигналов литературе есть много других многомасштабных подходов, использующих вейвлеты и множество других ядер, которые не используют и не требуют тех же требований, что и масштабное пространство описания делать; см. статью о связанных многомасштабные подходы. Также велась работа над концепциями дискретного масштабного пространства, которые переносят свойства масштабного пространства в дискретную область; см. статью о реализация масштабного пространства для примеров и ссылок.
Смотрите также
Рекомендации
- ^ Кендеринк, Ян "Структура образов", Биологическая кибернетика, 50: 363–370, 1984
- ^ Ж. Бабо, А. П. Виткин, М. Боден, Р. О. Дуда, Уникальность гауссовского ядра для фильтрации в масштабном пространстве. IEEE Trans. Pattern Anal. Machine Intell. 8 (1), 26–33, 1986.
- ^ А. Юилле, Т.А. Поджио: Теоремы о масштабировании для нулевых переходов. IEEE Trans. Анализ паттернов и машинный интеллект, Vol. ПАМИ-8, вып. 1. С. 15–25, январь 1986 г.
- ^ а б c Линдеберг, Т., "Масштабное пространство для дискретных сигналов", ПАМИ (12), № 3, март 1990 г., стр. 234–254.
- ^ Линдеберг, Тони, Теория масштабного пространства в компьютерном зрении, Kluwer, 1994.,
- ^ Пауэлс, Э., ван Гул, Л., Фидделаерс, П. и Мунс, Т .: Расширенный класс масштабно-инвариантных и рекурсивных масштабных пространственных фильтров, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 7, pp. 691–701, 1995.
- ^ а б Линдеберг, Т .: Об аксиоматических основах линейного масштабного пространства: сочетание структуры полугруппы с причинностью и масштабной инвариантностью. В: J. Sporring et al. (ред.) Гауссова теория масштабного пространства: Proc. Школа PhD по теории масштабного пространства (Копенгаген, Дания, май 1996 г.), страницы 75–98, Kluwer Academic Publishers, 1997.
- ^ Флорак, Люк, Структура изображения, Kluwer Academic Publishers, 1997.
- ^ Weickert, J. Пространство с линейным масштабом было впервые предложено в Японии. Журнал математической визуализации и зрения, 10 (3): 237–252, 1999.
- ^ а б c Линдеберг, Т. Обобщенная аксиоматика гауссовского масштабного пространства, включающая линейное масштабное пространство, аффинное масштабное пространство и пространственно-временное масштабное пространство, Journal of Mathematical Imaging and Vision, Volume 40, Number 1, 36-81, 2011.
- ^ а б Линдеберг Т. Обобщенная аксиоматическая теория масштабного пространства., Достижения в области визуализации и электронной физики, Elsevier, том 178, страницы 1-96, 2013.
- ^ Линдеберг, Т. Вычислительная теория зрительных рецептивных полей, Биологическая кибернетика, 107 (6): 589-635, 2013.
- ^ Линдеберг, Т. Инвариантность зрительных операций на уровне рецептивных полей, PLoS ONE 8 (7): e66990, 2013