WikiDer > Вес Хэмминга
Эта статья нужны дополнительные цитаты для проверка. (Январь 2009 г.) (Узнайте, как и когда удалить этот шаблон сообщения) |
Было высказано предположение, что Минимальный вес быть слился в эту статью. (Обсуждать) Предлагается с июля 2020 года. |
В Вес Хэмминга из нить - количество символов, отличных от нулевого символа алфавит использовал. Таким образом, это эквивалентно Расстояние Хэмминга из нулевой строки той же длины. В наиболее типичном случае строка биты, это количество единиц в строке или цифра сумма из двоичное представление заданного числа и ℓ₁ норма битового вектора. В этом двоичном случае он также называется подсчет населения,[1] popcount, боковая сумма,[2] или же битовое суммирование.[3]
Нить | Вес Хэмминга |
---|---|
11101 | 4 |
11101000 | 4 |
00000000 | 0 |
678012340567 | 10 |
График подсчета населения (вес Хэмминга для двоичных чисел) для (десятичных) чисел от 0 до 256.[4][5][6] |
История и использование
Вес Хэмминга назван в честь Ричард Хэмминг хотя это понятие не принадлежит ему.[7] Вес Хэмминга двоичных чисел уже использовался в 1899 г. Джеймс В. Л. Глейшер дать формулу для количество нечетных биномиальных коэффициентов в один ряд Треугольник Паскаля.[8] Ирвинг С. Рид ввел понятие, эквивалентное весу Хэмминга в двоичном случае, в 1954 г.[9]
Вес Хэмминга используется в нескольких дисциплинах, включая теория информации, теория кодирования, и криптография. Примеры применения веса Хэмминга:
- В модульном возведение в степень возведением в квадрат, количество модульных умножений, необходимых для экспоненты е журнал2 е + вес (е). Это причина того, что значение открытого ключа е используется в ЮАР обычно выбирается число с низким весом Хэмминга.
- Вес Хэмминга определяет длину пути между узлами в Распределенные хэш-таблицы по аккорду.[10]
- IrisCode поиск в биометрических базах данных обычно осуществляется путем расчета Расстояние Хэмминга к каждой сохраненной записи.
- В компьютерные шахматы программы, использующие битовая доска В представлении, вес Хэмминга битовой доски дает количество фишек данного типа, оставшихся в игре, или количество квадратов доски, контролируемых фишками одного игрока, и, следовательно, является важным термином, влияющим на значение позиции.
- Вес Хэмминга можно использовать для эффективного вычисления найти первый набор используя тождество ffs (x) = pop (x ^ (x-1)). Это полезно на таких платформах, как SPARC у которых есть аппаратные инструкции по весу Хэмминга, но нет аппаратной команды поиска первой установки.[11][1]
- Весовую операцию Хэмминга можно интерпретировать как преобразование из унарная система счисления к двоичные числа.[12]
- В реализации некоторых лаконичные структуры данных подобно битовые векторы и вейвлет-деревья.
Эффективное внедрение
Подсчет населения битовая строка часто требуется в криптографии и других приложениях. В Расстояние Хэмминга из двух слов А и B можно рассчитать как вес Хэмминга А xor B.[1]
Проблема того, как его эффективно реализовать, широко изучается. Одна операция для вычисления или параллельные операции над битовыми векторами: доступно на некоторых процессорах. Для процессоров, не имеющих этих функций, лучшие известные решения основаны на добавлении счетчиков в древовидной структуре. Например, чтобы подсчитать количество 1 бит в 16-битном двоичном числе a = 0110 1100 1011 1010, можно выполнить следующие операции:
Выражение | Двоичный | Десятичный | Комментарий | |||||||
---|---|---|---|---|---|---|---|---|---|---|
а | 01 | 10 | 11 | 00 | 10 | 11 | 10 | 10 | 27834 | Исходный номер |
b0 = (a >> 0) & 01 01 01 01 01 01 01 01 | 01 | 00 | 01 | 00 | 00 | 01 | 00 | 00 | 1, 0, 1, 0, 0, 1, 0, 0 | Каждый другой бит из |
b1 = (a >> 1) & 01 01 01 01 01 01 01 01 | 00 | 01 | 01 | 00 | 01 | 01 | 01 | 01 | 0, 1, 1, 0, 1, 1, 1, 1 | Остальные биты из |
с = b0 + b1 | 01 | 01 | 10 | 00 | 01 | 10 | 01 | 01 | 1, 1, 2, 0, 1, 2, 1, 1 | Подсчет единиц в каждом 2-битном срезе |
d0 = (c >> 0) & 0011 0011 0011 0011 | 0001 | 0000 | 0010 | 0001 | 1, 0, 2, 1 | Все остальные считают от c | ||||
d2 = (c >> 2) & 0011 0011 0011 0011 | 0001 | 0010 | 0001 | 0001 | 1, 2, 1, 1 | Остальные отсчеты от c | ||||
е = d0 + d2 | 0010 | 0010 | 0011 | 0010 | 2, 2, 3, 2 | Подсчет единиц в каждом 4-битном срезе | ||||
f0 = (e >> 0) & 00001111 00001111 | 00000010 | 00000010 | 2, 2 | Все остальные считают от е | ||||||
f4 = (e >> 4) & 00001111 00001111 | 00000010 | 00000011 | 2, 3 | Остальные отсчеты от e | ||||||
г = f0 + f4 | 00000100 | 00000101 | 4, 5 | Подсчет единиц в каждом 8-битном срезе | ||||||
h0 = (g >> 0) & 0000000011111111 | 0000000000000101 | 5 | Все остальные считают от g | |||||||
h8 = (g >> 8) & 0000000011111111 | 0000000000000100 | 4 | Остальные отсчеты от g | |||||||
я = h0 + h8 | 0000000000001001 | 9 | Подсчет единиц во всем 16-битном слове |
Здесь операции такие же, как в Язык программирования C, так X >> Y
означает сдвиг X вправо на биты Y, X & Y означает побитовое И для X и Y, а + - обычное сложение. Лучшие алгоритмы, известные для этой проблемы, основаны на концепции, проиллюстрированной выше, и приведены здесь:[1]
// типы и константы, используемые в функциях ниже// uint64_t - это беззнаковый 64-битный целочисленный тип переменной (определен в версии C99 языка C)const uint64_t m1 = 0x5555555555555555; // двоичный: 0101 ...const uint64_t m2 = 0x3333333333333333; // двоичный: 00110011 ..const uint64_t м4 = 0x0f0f0f0f0f0f0f0f; // двоичный: 4 нуля, 4 единицы ...const uint64_t m8 = 0x00ff00ff00ff00ff; // двоичный код: 8 нулей, 8 единиц ...const uint64_t m16 = 0x0000ffff0000ffff; // двоичный код: 16 нулей, 16 единиц ...const uint64_t m32 = 0x00000000ffffffff; // двоичный: 32 нуля, 32 единицыconst uint64_t h01 = 0x0101010101010101; // сумма 256 в степени 0,1,2,3 ...// Это наивная реализация, показанная для сравнения,// и помочь в понимании лучших функций.// Этот алгоритм использует 24 арифметических операции (сдвиг, сложение и).int popcount64a(uint64_t Икс){ Икс = (Икс & m1 ) + ((Икс >> 1) & m1 ); // помещаем количество каждых 2 бита в эти 2 бита Икс = (Икс & m2 ) + ((Икс >> 2) & m2 ); // помещаем количество каждых 4 бита в эти 4 бита Икс = (Икс & м4 ) + ((Икс >> 4) & м4 ); // помещаем количество каждых 8 бит в эти 8 бит Икс = (Икс & m8 ) + ((Икс >> 8) & m8 ); // помещаем количество каждых 16 бит в эти 16 бит Икс = (Икс & m16) + ((Икс >> 16) & m16); // помещаем количество каждых 32 бита в эти 32 бита Икс = (Икс & m32) + ((Икс >> 32) & m32); // помещаем количество каждых 64 бит в эти 64 бита возвращаться Икс;}// Здесь используется меньше арифметических операций, чем в любых других известных // реализация на машинах с медленным умножением.// Этот алгоритм использует 17 арифметических операций.int popcount64b(uint64_t Икс){ Икс -= (Икс >> 1) & m1; // помещаем количество каждых 2 бита в эти 2 бита Икс = (Икс & m2) + ((Икс >> 2) & m2); // помещаем количество каждых 4 бита в эти 4 бита Икс = (Икс + (Икс >> 4)) & м4; // помещаем количество каждых 8 бит в эти 8 бит Икс += Икс >> 8; // помещаем количество каждых 16 бит в самые младшие 8 бит Икс += Икс >> 16; // помещаем количество каждых 32 бита в самые младшие 8 бит Икс += Икс >> 32; // помещаем количество каждых 64 бит в самые младшие 8 бит возвращаться Икс & 0x7f;}// Здесь используется меньше арифметических операций, чем в любых других известных // реализация на машинах с быстрым умножением.// Этот алгоритм использует 12 арифметических операций, одна из которых - умножение.int popcount64c(uint64_t Икс){ Икс -= (Икс >> 1) & m1; // помещаем количество каждых 2 бита в эти 2 бита Икс = (Икс & m2) + ((Икс >> 2) & m2); // помещаем количество каждых 4 бита в эти 4 бита Икс = (Икс + (Икс >> 4)) & м4; // помещаем количество каждых 8 бит в эти 8 бит возвращаться (Икс * h01) >> 56; // возвращает 8 левых битов x + (x << 8) + (x << 16) + (x << 24) + ... }
Вышеупомянутые реализации имеют лучшее поведение в худшем случае из всех известных алгоритмов. Однако, когда ожидается, что значение будет иметь несколько ненулевых битов, вместо этого может быть более эффективным использовать алгоритмы, которые подсчитывают эти биты по одному. Как описал Вегнер в 1960 году,[13] в побитовое И из Икс с Икс - 1 отличается от Икс только при обнулении младшего значащего ненулевого бита: вычитание 1 изменяет крайнюю правую строку из 0 на 1 и заменяет крайнюю правую 1 на 0. Если Икс изначально имел п биты, которые были равны 1, то только после п итерации этой операции, Икс будет сведено к нулю. Следующая реализация основана на этом принципе.
// Это лучше, когда большинство бит в x равны 0// Этот алгоритм работает одинаково для всех размеров данных.// Этот алгоритм использует 3 арифметических операции и 1 сравнение / переход на 1 бит в x.int popcount64d(uint64_t Икс){ int считать; за (считать=0; Икс; считать++) Икс &= Икс - 1; возвращаться считать;}
Если разрешено большее использование памяти, мы можем вычислить вес Хэмминга быстрее, чем описанные выше методы. Имея неограниченную память, мы могли бы просто создать большую таблицу поиска веса Хэмминга для каждого 64-битного целого числа. Если мы можем сохранить таблицу поиска функции Хэмминга для каждого 16-битного целого числа, мы можем сделать следующее, чтобы вычислить вес Хэмминга для каждого 32-битного целого числа.
статический uint8_t биты слов[65536] = { / * количество битов целых чисел от 0 до 65 535 включительно * / };// Этот алгоритм использует 3 арифметических операции и 2 чтения из памяти.int popcount32e(uint32_t Икс){ возвращаться биты слов[Икс & 0xFFFF] + биты слов[Икс >> 16];}
// По желанию, таблица wordbits [] может быть заполнена с помощью этой функцииint popcount32e_init(пустота){ uint32_t я; uint16_t Икс; int считать; за (я=0; я <= 0xFFFF; я++) { Икс = я; за (считать=0; Икс; считать++) // заимствовано из popcount64d () выше Икс &= Икс - 1; биты слов[я] = считать; }}
Muła et al.[14] показали, что векторизованная версия popcount64b может работать быстрее, чем выделенные инструкции (например, popcnt на процессорах x64).
Языковая поддержка
Некоторые компиляторы C предоставляют встроенные функции, обеспечивающие подсчет битов. Например, GCC (начиная с версии 3.4 в апреле 2004 г.) включает встроенную функцию __builtin_popcount
который будет использовать инструкцию процессора, если она доступна, или эффективную реализацию библиотеки в противном случае.[15] LLVM-GCC включает эту функцию с версии 1.5 в июне 2005 года.[16]
В C ++ STL, структура данных битового массива битсет
имеет считать()
метод, который подсчитывает количество установленных битов. В C ++ 20, новый заголовок <bit>
был добавлен, содержащий функции std :: popcount
и std :: has_single_bit
, принимая аргументы беззнакового целого типа.
В Java структура данных растущего битового массива BitSet
имеет BitSet.cardinality ()
метод, который подсчитывает количество установленных битов. Кроме того, есть Integer.bitCount (число)
и Long.bitCount (длинный)
функции для подсчета битов в примитивных 32-битных и 64-битных целых числах соответственно. Так же BigInteger
целочисленный класс произвольной точности также имеет BigInteger.bitCount ()
метод, который считает биты.
В Python, то int
тип имеет bit_count ()
метод для подсчета количества установленных битов. Эта функция является новой в Python 3.10, выпуск которой запланирован на 2021 год.[17]
В Common Lispфункция logcount, заданная неотрицательным целым числом, возвращает количество битов, равное единице. (Для отрицательных целых чисел он возвращает количество 0 бит в нотации дополнения до 2.) В любом случае целое число может быть BIGNUM.
Начиная с GHC 7.4, Haskell базовый пакет имеет popCount
функция доступна для всех типов, которые являются экземплярами Биты
класс (доступен из Data.Bits
модуль).[18]
MySQL версия SQL язык обеспечивает BIT_COUNT ()
как стандартная функция.[19]
Фортран 2008 имеет стандартную внутреннюю элементарную функцию popcnt
возвращает количество ненулевых битов в целочисленном (или целочисленном массиве).[20]
Некоторые программируемые карманные научные калькуляторы имеют специальные команды для вычисления количества установленных бит, например #B
на HP-16C[3][21] и WP 43S,[22][23] # БИТЫ
[24][25] или же BITSUM
[26][27] на эмуляторах HP-16C и nBITS
на WP 34S.[28][29]
FreePascal реализует popcnt начиная с версии 3.0.[30]
Поддержка процессора
- В IBM STRETCH компьютер в 1960-х рассчитывал количество установленных битов, а также количество ведущих нулей как побочный продукт всех логических операций.[1]
- Cray суперкомпьютеры на раннем этапе показали подсчет населения машинная инструкция, по слухам, был специально запрошен правительством США Национальное Агенство Безопасности за криптоанализ Приложения.[1]
- Некоторые из Корпорация Control Data(CDC) Cyber 70/170 серийные машины включали инструкцию подсчета населения; в КОМПАС, эта инструкция была закодирована как
CXi
. - 64-битный SPARC архитектура версии 9 определяет
POPC
инструкция[11][1] но большинство реализаций не реализуют его, требуя, чтобы операционная система эмулировала его.[31] - Дональд Кнутмодель компьютера MMIX это заменит СМЕШИВАНИЕ в его книге Искусство программирования имеет
SADD
инструкция с 1999 года.САДД a, b, c
считает все биты, которые равны 1 в b и 0 в c, и записывает результат в a. - Compaqс Альфа 21264A, выпущенный в 1999 году, был первым процессором серии Alpha, который имел расширение count (
CIX
). - Аналоговые устройства' Blackfin процессоры оснащены
ОДИН
инструкция для выполнения 32-битного подсчета населения.[32] - AMDс Барселона архитектура представила расширенную обработку битов (ABM) ЭТО представляя
POPCNT
инструкция как часть SSE4a расширений в 2007 году. - Intel Core процессоры представили
POPCNT
инструкция с SSE4.2 Набор инструкций расширение, впервые доступное в Nehalem-основан Core i7 процессор, выпущенный в ноябре 2008 года. - В ARM архитектура представил
VCNT
инструкция как часть Расширенный SIMD (НЕОН) расширения. - В RISC-V архитектура представила
PCNT
инструкция как часть расширения Bit Manipulation (B).[33]
Смотрите также
Рекомендации
- ^ а б c d е ж грамм Уоррен-младший, Генри С. (2013) [2002]. Хакерское наслаждение (2-е изд.). Эддисон Уэсли - Pearson Education, Inc. С. 81–96. ISBN 978-0-321-84268-8. 0-321-84268-5.
- ^ Кнут, Дональд Эрвин (2009). «Побитовые приемы и методы. Диаграммы двоичных решений». Искусство программирования. Том 4, Часть 1. Эддисон – Уэсли Профессионал. ISBN 0-321-58050-8. (NB. Проект Пучок 1b доступны для скачивания.)
- ^ а б Руководство пользователя компьютерного ученого Hewlett-Packard HP-16C (PDF). Компания Hewlett-Packard. Апрель 1982 г. 00016-90001. В архиве (PDF) из оригинала от 28.03.2017. Получено 2017-03-28.
- ^ [1], написано на языке Frmulæ. Вики Сообщества. Проверено 30 сентября 2019.
- ^ Решение задачи Количество населения. Проверено 30 сентября 2019.
- ^ Розеттский код. Проверено 30 сентября 2019.
- ^ Томпсон, Томас М. (1983). От кодов с исправлением ошибок до сферических упаковок и простых групп. Математические монографии Каруса № 21. Математическая ассоциация Америки. п. 33.
- ^ Глейшер, Джеймс Уитбред Ли (1899). «О вычете коэффициента биномиальной теоремы относительно простого модуля». Ежеквартальный журнал чистой и прикладной математики. 30: 150–156. (NB. См., В частности, последний абзац на стр. 156.)
- ^ Рид, Ирвинг Стой (1954). «Класс кодов с множественными ошибками и схема декодирования». IRE Профессиональная группа по теории информации. Институт Радиоинженеров (IRE). ПГИТ-4: 38–49.
- ^ Stoica, I .; Morris, R .; Liben-Nowell, D .; Karger, D. R .; Kaashoek, M. F .; Дабек, Ф .; Балакришнан, Х. (февраль 2003 г.). «Chord: масштабируемый протокол однорангового поиска для интернет-приложений». Транзакции IEEE / ACM в сети. 11 (1): 17–32.
Раздел 6.3: «В общем, количество пальцев, по которым нам нужно следовать, будет количеством единиц в двоичном представлении расстояния от узла до запроса».
- ^ а б SPARC International, Inc. (1992). «A.41: Счетчик населения. Примечание по программированию». Руководство по архитектуре SPARC: версия 8 (Версия 8-е изд.). Энглвуд Клиффс, Нью-Джерси, США: Prentice Hall. стр.231. ISBN 0-13-825001-4.
- ^ Блакселл, Дэвид (1978). Хогбен, Дэвид; Файф, Деннис В. (ред.). «Связывание записи по битовому шаблону». Компьютерные науки и статистика - десятый ежегодный симпозиум по интерфейсу. Специальное издание NBS. Министерство торговли США / Национальное бюро стандартов. 503: 146–156.
- ^ Вегнер, Питер (Май 1960 г.). «Методика счета единиц в двоичном компьютере». Коммуникации ACM. 3 (5): 322. Дои:10.1145/367236.367286.
- ^ Мула, Войцех; Курц, Натан; Лемир, Даниэль (январь 2018). «Ускоренный подсчет населения с помощью инструкций AVX2». Компьютерный журнал. 61 (1). arXiv:1611.07612. Дои:10.1093 / comjnl / bxx046.
- ^ «Примечания к выпуску GCC 3.4». Проект GNU.
- ^ «Примечания к выпуску LLVM 1.5». LLVM проект.
- ^ «Что нового в Python 3.10». python.org.
- ^ «Примечания к выпуску GHC 7.4.1». Документация GHC.
- ^ "Глава 12.11. Битовые функции - Справочное руководство MySQL 5.0".
- ^ Меткалф, Майкл; Рид, Джон; Коэн, Малкольм (2011). Объяснение современного Фортрана. Oxford University Press. п. 380. ISBN 0-19-960142-9.
- ^ Шварц, Джейк; Гревелл, Рик (2003-10-20) [1993]. Библиотека эмулятора HP16C для HP48S / SX. 1.20 (1-е изд.). Получено 2015-08-15. (NB. Эта библиотека также работает на HP 48G/GX/G +. Помимо набора функций HP-16C этот пакет также поддерживает вычисления для двоичных, восьмеричных и шестнадцатеричных числа с плавающей запятой в научная нотация в дополнение к обычным десятичным числам с плавающей запятой.)
- ^ Бонин, Вальтер (2019) [2015]. WP 43S Руководство пользователя (PDF). 0,12 (черновик ред.). п. 135. ISBN 978-1-72950098-9. ISBN 1-72950098-6. Получено 2019-08-05. [2] [3] (314 стр.)
- ^ Бонин, Вальтер (2019) [2015]. Справочное руководство WP 43S (PDF). 0,12 (черновик ред.). С. xiii, 104, 115, 120, 188. ISBN 978-1-72950106-1. ISBN 1-72950106-0. Получено 2019-08-05. [4] [5] (271 стр.)
- ^ Martin, Ángel M .; МакКлюр, Грег Дж. (05.09.2015). «Модуль эмулятора HP16C для HP-41CX - Руководство пользователя и QRG» (PDF). В архиве (PDF) из оригинала от 27.04.2017. Получено 2017-04-27. (NB. За пределами HP-16C функция устанавливает эту настраиваемую библиотеку для HP-41CX расширяет функциональные возможности калькулятора примерно на 50 дополнительных функций.)
- ^ Мартин, Анхель М. (07.09.2015). «HP-41: доступен новый эмулятор HP-16C». В архиве из оригинала от 27.04.2017. Получено 2017-04-27.
- ^ Тёрнгрен, Хокан (10 января 2017 г.). "Божья коровка Документация" (выпуск 0А ред.). Получено 2017-01-29. [6]
- ^ «Доступен новый модуль HP-41: Божья коровка». 2017-01-10. В архиве из оригинала от 29.01.2017. Получено 2017-01-29.
- ^ Дейл, Пол; Бонин, Уолтер (2012) [2008]. «Руководство пользователя WP 34S» (PDF) (3,1 изд.). Получено 2017-04-27.
- ^ Бонин, Уолтер (2015) [2008]. WP 34S Руководство пользователя (3,3 изд.). ISBN 978-1-5078-9107-0.
- ^ "Free Pascal documentation popcnt". Получено 2019-12-07.
- ^ "JDK-6378821: bitCount () должен использовать POPC на процессорах SPARC и AMD + 10h". База данных ошибок Java. 2006-01-30.
- ^ Справочник по набору команд Blackfin (Предварительная ред.). Аналоговые устройства. 2001. С. 8–24. Каталожный номер 82-000410-14.
- ^ Вольф, Клиффорд (22 марта 2019 г.). "RISC-V" B "Расширение управления битами для RISC-V, проект v0.37" (PDF). Github.
дальнейшее чтение
- Schroeppel, Ричард С.; Орман, Хилари К. (1972-02-29). "сборник". HAKMEM. Билер, Майкл; Госпер, Ральф Уильям; Schroeppel, Ричард С. (отчет). Лаборатория искусственного интеллекта, Массачусетский Институт Технологий, Кембридж, Массачусетс, США. Записка Массачусетского технологического института по ИИ 239. (Штука 169: Код сборки подсчета населения для PDP / 6-10.)
внешняя ссылка
- Агрегированные магические алгоритмы. Оптимизированный подсчет населения и другие алгоритмы, объясненные в образце кода.
- Bit Twiddling Хаки Установлено несколько алгоритмов с кодом для подсчета битов.
- Необходимые и достаточные - Дэмиен Винтур - Имеет код на C # для различных реализаций Веса Хэмминга.
- Лучший алгоритм для подсчета количества установленных битов в 32-битном целом числе? - Переполнение стека