В индекс несходства это демографический мера равномерности, с которой две группы распределены по составляющим географическим областям, составляющим большую территорию. Показатель индекса также можно интерпретировать как процент одной из двух групп, включенных в расчет, которые должны были бы переместиться в разные географические области, чтобы получить распределение, соответствующее распределению в большей области. Индекс несходства может использоваться как мера сегрегации.
Основная формула
Основная формула индекса несходства:
где (например, сравнивая черно-белое население):
- ая = население группы А в яth площадь, например переписной тракт
- А = общая численность населения в группе А в крупном географическом объекте, для которого рассчитывается индекс несходства.
- бя = население группы B в яth площадь
- B = общая численность населения в группе B в крупном географическом объекте, для которого рассчитывается индекс несходства.
Индекс несходства применим к любому категориальная переменная (демографический или нет) и благодаря своим простым свойствам полезен для ввода в программы многомерного масштабирования и кластеризации. Он широко использовался при изучении социальная мобильность для сравнения распределения по профессиональным категориям происхождения (или назначения).
Перспектива линейной алгебры
Формулу для индекса несходства можно сделать гораздо более компактной и содержательной, если рассматривать ее с точки зрения Линейная алгебра. Предположим, мы изучаем распределение богатых и бедных людей в городе (например, Лондон). Допустим, в нашем городе есть блоки:
Создадим вектор который показывает количество богатых людей в каждом квартале нашего города:
Аналогично создадим вектор который показывает количество бедных в каждом квартале нашего города:
Теперь -норма вектора - это просто сумма (величина) каждой записи в этом векторе.[1] То есть для вектора , у нас есть -норма:
Если обозначить как общее количество богатых людей в нашем городе, чем компактный способ подсчитать было бы использовать -норма:
Аналогично, если обозначить как общее количество бедных в нашем городе, то:
Когда мы делим вектор по его норме мы получаем так называемый нормализованный вектор или Единичный вектор :
Нормализуем богатый вектор и бедный вектор :
Наконец, вернемся к формуле для индекса несходства (); он просто равен половине -норма разности векторов и :
Индекс несходства(в линейно-алгебраической записи)
Числовой пример
Рассмотрим город, состоящий из четырех кварталов по 2 человека в каждом. Один блок состоит из 2 богатых людей. Один блок состоит из 2 бедняков. Два блока состоят из 1 богатого и 1 бедного человека. Каков показатель непохожести этого города?
В нашем вымышленном городе 4 квартала: в одном - 2 богатых человека; в другом 2 бедных человека; и два блока, содержащие 1 богатого и 1 бедного человека.
Сначала найдем богатый вектор и плохой вектор :
Далее посчитаем общее количество богатых и бедных в нашем городе:
Далее, давайте нормализуем богатые и бедные векторы:
Теперь мы можем вычислить разницу :
Наконец, найдем индекс несходства ():
Эквивалентность формул
Мы можем доказать, что линейная алгебраическая формула для идентична основной формуле для . Начнем с формулы линейной алгебры:
Заменим нормализованные векторы и с:
Наконец, из определения -norm, мы знаем, что можем заменить его суммированием:
Таким образом, мы доказываем, что формула линейной алгебры для индекса несходства эквивалентна основной формуле для него:
Нулевая сегрегация
Когда индекс несходства равен нулю, это означает, что в изучаемом нами сообществе отсутствует сегрегация. Например, если мы изучаем сегрегацию богатых и бедных в городе, то если , это означает, что:
- В городе нет кварталов, которые были бы «богатыми кварталами», и в городе нет кварталов, которые были бы «бедными кварталами».
- Богатые и бедные люди равномерно распределены по всему городу.
Если мы установим в линейной алгебраической формуле мы получаем необходимое условие наличия нулевой сегрегации:
Например, предположим, что у вас есть город из двух кварталов. В каждом блоке 4 богатых и 100 бедных:
Тогда общее количество богатых людей будет , а общее количество бедных составляет . Таким образом:
Потому что , таким образом, в этом городе нет сегрегации.
В качестве другого примера предположим, что у вас есть город из 3 кварталов:
Тогда у нас есть богатые люди в нашем городе, и бедные люди. Таким образом:
Опять же, потому что , таким образом, в этом городе также отсутствует сегрегация.
Смотрите также
Рекомендации
внешняя ссылка