WikiDer > Четвертая нормальная форма

Fourth normal form

Четвертая нормальная форма (4NF) это нормальная форма используется в нормализация базы данных. Представлен Рональд Феджин в 1977 г. 4НФ - следующий уровень нормализации после Нормальная форма Бойса – Кодда (BCNF). В то время как второй, в третьих, и Бойс-Кодд нормальные формы связаны с функциональные зависимости, 4NF касается более общего типа зависимости, известной как многозначная зависимость. А Таблица находится в 4НФ если и только если, для каждой из его нетривиальных многозначных зависимостей Икс Y, Икс это суперключ-то есть, Икс является либо кандидат ключ или его надмножество.[1]

Многозначные зависимости

Если заголовки столбцов в таблице реляционной базы данных разделены на три непересекающиеся группы Икс, Y, и Z, то в контексте конкретной строки мы можем ссылаться на данные под каждой группой заголовков как Икс, у, и z соответственно. А многозначная зависимость Икс Y означает, что если мы выберем любой Икс фактически встречается в таблице (назовите этот выбор Иксc) и составить список всех Иксcyz комбинации, которые встречаются в таблице, мы обнаружим, что Иксc связан с тем же у записи независимо от z. Таким образом, по сути, наличие z не дает никакой полезной информации, чтобы ограничить возможные значения у.

А тривиальная многозначная зависимость Икс Y тот, где либо Y это подмножество Икс, или же Икс и Y вместе образуют весь набор атрибутов отношения.

А функциональная зависимость это частный случай многозначной зависимости. В функциональной зависимости ИксY, каждые Икс определяет ровно один год, не более одного.

пример

Рассмотрим следующий пример:

Варианты доставки пиццы
РесторанРазнообразие пиццыЗона доставки
А1 ПиццаТолстая коркаSpringfield
А1 ПиццаТолстая коркаShelbyville
А1 ПиццаТолстая коркаСтолица
А1 ПиццаФаршированная корочкаSpringfield
А1 ПиццаФаршированная корочкаShelbyville
А1 ПиццаФаршированная корочкаСтолица
Элитная пиццаТонкая коркаСтолица
Элитная пиццаФаршированная корочкаСтолица
Пицца ВинченцоТолстая коркаSpringfield
Пицца ВинченцоТолстая коркаShelbyville
Пицца ВинченцоТонкая коркаSpringfield
Пицца ВинченцоТонкая коркаShelbyville

Каждая строка указывает на то, что данный ресторан может доставить определенное разнообразие пиццы в определенное место.

Таблица не имеет неключевых атрибутов, потому что ее единственный ключ - {Ресторан, Разнообразие пиццы, Зона доставки}. Следовательно, он соответствует всем нормальным формам вплоть до BCNF. Если мы предположим, однако, что на разновидности пиццы, предлагаемые рестораном, не влияет зона доставки (т. Е. Ресторан предлагает все разновидности пиццы, которые он готовит, во все области, которые он поставляет), то он не соответствует 4NF. Проблема в том, что в таблице есть две нетривиальные многозначные зависимости от атрибута {Restaurant} (который не является суперключом). Зависимости:

  • {Ресторан} {Разнообразие пиццы}
  • {Ресторан} {Зона доставки}

Эти нетривиальные многозначные зависимости от не суперключей отражают тот факт, что разновидности пиццы, которые предлагает ресторан, не зависят от областей, в которые ресторан доставляет. Такое положение вещей приводит к избыточность в таблице: например, нам трижды сказали, что A1 Pizza предлагает фаршированное тесто, и если A1 Pizza начнет производить пиццу с сырной корочкой, нам нужно будет добавить несколько строк, по одной для каждой зоны доставки A1 Pizza. Более того, ничто не мешает нам сделать это неправильно: мы можем добавить строки Cheese Crust для всех областей доставки A1 Pizza, кроме одной, тем самым не соблюдая многозначную зависимость {Restaurant} {Разнообразие пиццы}.

Чтобы исключить возможность этих аномалий, мы должны поместить факты о предлагаемых разновидностях в другую таблицу, а не факты о регионах доставки, в результате чего получим две таблицы, которые обе находятся в 4NF:

Разновидности по ресторанам
РесторанРазнообразие пиццы
А1 ПиццаТолстая корка
А1 ПиццаФаршированная корочка
Элитная пиццаТонкая корка
Элитная пиццаФаршированная корочка
Пицца ВинченцоТолстая корка
Пицца ВинченцоТонкая корка
Районы доставки рестораном
РесторанЗона доставки
А1 ПиццаSpringfield
А1 ПиццаShelbyville
А1 ПиццаСтолица
Элитная пиццаСтолица
Пицца ВинченцоSpringfield
Пицца ВинченцоShelbyville

Напротив, если бы разновидности пиццы, предлагаемые рестораном, иногда действительно менялись от одной области доставки к другой, исходная таблица из трех столбцов удовлетворяла бы требованиям 4NF.

Рональд Феджин продемонстрировал, что всегда можно достичь 4НФ.[2] Теорема Риссанена также применимо к многозначные зависимости.

4NF на практике

В статье 1992 года Маргарет С. Ву отмечается, что обучение нормализации базы данных обычно не дотягивает до 4NF, возможно, из-за убежденности в том, что таблицы, нарушающие 4NF (но отвечающие всем нижним нормальным формам), редко встречаются в бизнес-приложениях. Однако это мнение может быть неточным. Ву сообщает, что в исследовании сорока баз данных организаций более 20% содержали одну или несколько таблиц, которые нарушали 4NF, но соответствовали всем более низким нормальным формам.[3]

Нормализация за пределами 4НФ

Только в редких случаях таблица 4NF не соответствует высшей нормальной форме. 5NF. Это ситуации, в которых сложное реальное ограничение, управляющее допустимыми комбинациями значений атрибутов в таблице 4NF, не подразумевается в структуре этой таблицы.

Смотрите также


Рекомендации

  1. ^ "Схема отношения R * находится в четвертой нормальной форме (4NF), если всякий раз, когда нетривиальная многозначная зависимость X Y выполняется для R *, а затем функциональная зависимость X → A для каждого имени столбца A в R *. Интуитивно все зависимости являются результатом ключей ". Феджин, Рональд (сентябрь 1977 г.). «Многозначные зависимости и новая нормальная форма для реляционных баз данных» (PDF). Транзакции ACM в системах баз данных. 2 (1): 262–278. CiteSeerX 10.1.1.69.1872. Дои:10.1145/320557.320571. Архивировано из оригинал (PDF) на 2007-11-29. Получено 2008-04-26.
  2. ^ Феджин, стр. 268
  3. ^ Ву, Маргарет С. (март 1992 г.). «Практическая потребность в четвертой нормальной форме». Бюллетень ACM SIGCSE. 24 (1): 19–23. Дои:10.1145/135250.134515.

дальнейшее чтение