В линейная алгебра и теория матрицы , то Дополнение Шура из блочная матрица определяется следующим образом.
Предположим п , q неотрицательные целые числа, и предположим А , B , C , D соответственно п × п , п × q , q × п , и q × q матрицы комплексных чисел. Позволять
M = [ А B C D ] { displaystyle M = left [{ begin {matrix} A&B C&D end {matrix}} right]} так что M это (п + q ) × (п + q ) матрица.
Если D обратима, то Дополнение Шура блока D матрицы M это п × п матрица определяется
M / D := А − B D − 1 C . { Displaystyle M / D: = A-BD ^ {- 1} C.} Если А обратима, Дополнение Шура блока А матрицы M это q × q матрица определяется
M / А := D − C А − 1 B . { displaystyle M / A: = D-CA ^ {- 1} B.} В случае, если А или D является единственное число , подставив обобщенно обратный для обратных на M / A и М / д дает обобщенное дополнение Шура .
Дополнение Шура названо в честь Иссай Шур кто использовал это, чтобы доказать Лемма Шура , хотя он использовался ранее.[1] Эмили Вирджиния Хейнсворт был первым, кто назвал это Дополнение Шура .[2] Дополнение Шура - ключевой инструмент в области численного анализа, статистики и матричного анализа.
Задний план
Дополнение Шура возникает в результате выполнения блока Гауссово исключение путем умножения матрицы M справа с блок нижний треугольный матрица
L = [ я п 0 − D − 1 C я q ] . { displaystyle L = { begin {bmatrix} I_ {p} & 0 - D ^ {- 1} C & I_ {q} end {bmatrix}}.} Вот яп обозначает п ×п единичная матрица . После умножения на матрицу L дополнение Шура появляется в верхнем п ×п блок. Матрица продуктов
M L = [ А B C D ] [ я п 0 − D − 1 C я q ] = [ А − B D − 1 C B 0 D ] = [ я п B D − 1 0 я q ] [ А − B D − 1 C 0 0 D ] . { displaystyle { begin {align} ML & = { begin {bmatrix} A&B C&D end {bmatrix}} { begin {bmatrix} I_ {p} & 0 - D ^ {- 1} C & I_ {q } end {bmatrix}} = { begin {bmatrix} A-BD ^ {- 1} C&B 0 & D end {bmatrix}} [4pt] & = { begin {bmatrix} I_ {p} & BD ^ {- 1} 0 & I_ {q} end {bmatrix}} { begin {bmatrix} A-BD ^ {- 1} C & 0 0 & D end {bmatrix}}. End {выравнивается}}} Это аналогично Разложение LDU . То есть мы показали, что
[ А B C D ] = [ я п B D − 1 0 я q ] [ А − B D − 1 C 0 0 D ] [ я п 0 D − 1 C я q ] , { displaystyle { begin {align} { begin {bmatrix} A&B C&D end {bmatrix}} & = { begin {bmatrix} I_ {p} & BD ^ {- 1} 0 & I_ {q} end {bmatrix}} { begin {bmatrix} A-BD ^ {- 1} C & 0 0 & D end {bmatrix}} { begin {bmatrix} I_ {p} & 0 D ^ {- 1} C & I_ { q} end {bmatrix}}, end {align}}} и инверсия M таким образом может быть выражено с участием D −1 и обратное дополнение Шура (если оно существует) только как
[ А B C D ] − 1 = [ я п 0 − D − 1 C я q ] [ ( А − B D − 1 C ) − 1 0 0 D − 1 ] [ я п − B D − 1 0 я q ] = [ ( А − B D − 1 C ) − 1 − ( А − B D − 1 C ) − 1 B D − 1 − D − 1 C ( А − B D − 1 C ) − 1 D − 1 + D − 1 C ( А − B D − 1 C ) − 1 B D − 1 ] = [ ( M / D ) − 1 − ( M / D ) − 1 B D − 1 − D − 1 C ( M / D ) − 1 D − 1 + D − 1 C ( M / D ) − 1 B D − 1 ] . { displaystyle { begin {align} & { begin {bmatrix} A&B C&D end {bmatrix}} ^ {- 1} = { begin {bmatrix} I_ {p} & 0 - D ^ {- 1} C & I_ {q} end {bmatrix}} { begin {bmatrix} left (A-BD ^ {- 1} C right) ^ {- 1} & 0 0 & D ^ {- 1} end { bmatrix}} { begin {bmatrix} I_ {p} & - BD ^ {- 1} 0 & I_ {q} end {bmatrix}} [4pt] = {} & { begin {bmatrix} left (A-BD ^ {- 1} C right) ^ {- 1} & - left (A-BD ^ {- 1} C right) ^ {- 1} BD ^ {- 1} - D ^ {- 1} C left (A-BD ^ {- 1} C right) ^ {- 1} & D ^ {- 1} + D ^ {- 1} C left (A-BD ^ {- 1 } C right) ^ {- 1} BD ^ {- 1} end {bmatrix}} [4pt] = {} & { begin {bmatrix} left (M / D right) ^ {- 1 } & - left (M / D right) ^ {- 1} BD ^ {- 1} - D ^ {- 1} C left (M / D right) ^ {- 1} & D ^ { -1} + D ^ {- 1} C left (M / D right) ^ {- 1} BD ^ {- 1} end {bmatrix}}. End {выравнивается}}} Ср. лемма об обращении матриц который иллюстрирует отношения между вышеупомянутым и эквивалентным выводом с ролями А и D поменялись местами.
Свойства
Если п и q оба равны 1 (т.е. А , B , C и D все являются скалярами), мы получаем знакомую формулу для обратной матрицы 2 на 2: M − 1 = 1 А D − B C [ D − B − C А ] { displaystyle M ^ {- 1} = { frac {1} {AD-BC}} left [{ begin {matrix} D & -B - C&A end {matrix}} right]} при условии, что ОБЪЯВЛЕНИЕ − до н.э не равно нулю. В общем, если А обратима, то M = [ я п 0 C А − 1 я q ] [ А 0 0 D − C А − 1 B ] [ я п А − 1 B 0 я q ] , M − 1 = [ А − 1 + А − 1 B ( M / А ) − 1 C А − 1 − А − 1 B ( M / А ) − 1 − ( M / А ) − 1 C А − 1 ( M / А ) − 1 ] { displaystyle { begin {align} M & = { begin {bmatrix} I_ {p} & 0 CA ^ {- 1} & I_ {q} end {bmatrix}} { begin {bmatrix} A & 0 0 & D -CA ^ {- 1} B end {bmatrix}} { begin {bmatrix} I_ {p} & A ^ {- 1} B 0 & I_ {q} end {bmatrix}}, [4pt] M ^ {- 1} & = { begin {bmatrix} A ^ {- 1} + A ^ {- 1} B (M / A) ^ {- 1} CA ^ {- 1} & - A ^ {- 1 } B (M / A) ^ {- 1} - (M / A) ^ {- 1} CA ^ {- 1} & (M / A) ^ {- 1} end {bmatrix}} end {выровнено}}} всякий раз, когда существует обратное. Когда А соответственно D , обратима, определитель M также ясно видно, что дано Det ( M ) = Det ( А ) Det ( D − C А − 1 B ) { Displaystyle Det (M) = Det (A) Det влево (D-CA ^ {- 1} B right)} соответственно Det ( M ) = Det ( D ) Det ( А − B D − 1 C ) { Displaystyle Det (M) = Det (D) Det left (A-BD ^ {- 1} C right)} , которое обобщает формулу детерминанта для матриц 2 × 2. (Формула аддитивности ранга Гутмана) Если D обратима, то ранг из M дан кем-то ранг ( M ) = ранг ( D ) + ранг ( А − B D − 1 C ) { Displaystyle OperatorName {ранг} (M) = OperatorName {rank} (D) + OperatorName {rank} left (A-BD ^ {- 1} C right)} (Формула аддитивности инерции Хейнсуорта ) Если А обратима, то инерция блочной матрицы M равна инерции А плюс инерция M /А . Приложение для решения линейных уравнений
Дополнение Шура возникает естественным образом при решении системы линейных уравнений, таких как
А Икс + B у = а C Икс + D у = б { displaystyle { begin {align} Ax + By & = a Cx + Dy & = b end {align}}} где Икс , а находятся п -размерный векторы-столбцы , у , б находятся q -мерные векторы-столбцы, А , B , C , D такие же, как указано выше, и D обратимо. Умножая нижнее уравнение на B D − 1 { textstyle BD ^ {- 1}} а затем вычитая из верхнего уравнения, получаем
( А − B D − 1 C ) Икс = а − B D − 1 б . { displaystyle left (A-BD ^ {- 1} C right) x = a-BD ^ {- 1} b.} Таким образом, если можно инвертировать D а также дополнение Шура D , можно решить для Икс , а затем с помощью уравнения C Икс + D у = б { textstyle Cx + Dy = b} можно решить для у . Это уменьшает проблему инвертирования ( п + q ) × ( п + q ) { textstyle (п + д) раз (р + д)} матрица к матрице инвертирования п × п матрица и q × q матрица. На практике требуется D быть хорошо кондиционированный чтобы этот алгоритм был численно точным.
В электротехнике это часто называют устранением узла или Снижение крон .
Приложения к теории вероятностей и статистике
Предположим, что случайные векторы-столбцы Икс , Y жить в р п и р м соответственно, а вектор (Икс , Y ) в р п + м имеет многомерное нормальное распределение ковариация которой является симметричной положительно определенной матрицей
Σ = [ А B B Т C ] , { Displaystyle Sigma = left [{ begin {matrix} A&B B ^ { mathsf {T}} & C end {matrix}} right],} где А ∈ р п × п { textstyle A in mathbb {R} ^ {п раз п}} ковариационная матрица Икс , C ∈ р м × м { textstyle C in mathbb {R} ^ {m times m}} ковариационная матрица Y и B ∈ р п × м { textstyle B in mathbb {R} ^ {п раз m}} ковариационная матрица между Икс и Y .
Тогда условная ковариация из Икс данный Y является дополнением Шура к C в Σ { textstyle Sigma} [3] :
Cov ( Икс ∣ Y ) = А − B C − 1 B Т E ( Икс ∣ Y ) = E ( Икс ) + B C − 1 ( Y − E ( Y ) ) { displaystyle { begin {align} operatorname {Cov} (X mid Y) & = A-BC ^ {- 1} B ^ { mathsf {T}} operatorname {E} (X mid Y) & = operatorname {E} (X) + BC ^ {- 1} (Y- operatorname {E} (Y)) end {выровнено}}} Если взять матрицу Σ { displaystyle Sigma} выше быть не ковариацией случайного вектора, а образец ковариантность, то она может иметь Распределение Уишарта . В этом случае дополнение Шура к C в Σ { displaystyle Sigma} также есть дистрибутив Уишарта.[нужна цитата ]
Условия положительной определенности и полуопределенности
Позволять Икс симметричная матрица действительных чисел, заданная формулой
Икс = [ А B B Т C ] . { displaystyle X = left [{ begin {matrix} A&B B ^ { mathsf {T}} & C end {matrix}} right].} потом
Если А обратима, то Икс положительно определен тогда и только тогда, когда А и его дополнение X / A оба положительно определены: Икс ≻ 0 ⇔ А ≻ 0 , Икс / А = C − B Т А − 1 B ≻ 0. { Displaystyle X succ 0 Leftrightarrow A succ 0, X / A = C-B ^ { mathsf {T}} A ^ {- 1} B succ 0.} [4] Если C обратима, то Икс положительно определен тогда и только тогда, когда C и его дополнение X / C оба положительно определены: Икс ≻ 0 ⇔ C ≻ 0 , Икс / C = А − B C − 1 B Т ≻ 0. { Displaystyle X succ 0 Leftrightarrow C succ 0, X / C = A-BC ^ {- 1} B ^ { mathsf {T}} succ 0.} Если А положительно определен, то Икс положительно полуопределено тогда и только тогда, когда дополнение X / A положительно полуопределенный: Если А ≻ 0 , тогда Икс ⪰ 0 ⇔ Икс / А = C − B Т А − 1 B ⪰ 0. { displaystyle { text {If}} A succ 0, { text {then}} X successq 0 Leftrightarrow X / A = CB ^ { mathsf {T}} A ^ {- 1} B successq 0.} [5] Если C положительно определен, то Икс положительно полуопределено тогда и только тогда, когда дополнение X / C положительно полуопределенный: Если C ≻ 0 , тогда Икс ⪰ 0 ⇔ Икс / C = А − B C − 1 B Т ⪰ 0. { displaystyle { text {If}} C succ 0, { text {then}} X successq 0 Leftrightarrow X / C = A-BC ^ {- 1} B ^ { mathsf {T}} successq 0.} Первое и третье утверждения могут быть получены[6] рассматривая минимизатор количества
ты Т А ты + 2 v Т B Т ты + v Т C v , { displaystyle u ^ { mathsf {T}} Au + 2v ^ { mathsf {T}} B ^ { mathsf {T}} u + v ^ { mathsf {T}} Cv, ,} как функция v (для фиксированных ты ).
Кроме того, поскольку
[ А B B Т C ] ≻ 0 ⟺ [ C B Т B А ] ≻ 0 { displaystyle left [{ begin {matrix} A&B B ^ { mathsf {T}} & C end {matrix}} right] succ 0 Longleftrightarrow left [{ begin {matrix} C & B ^ { mathsf {T}} B&A end {matrix}} right] succ 0} и аналогично для положительных полуопределенных матриц второе (соответственно четвертое) утверждение является непосредственным из первого (соответственно третьего) утверждения.
Также имеется достаточное и необходимое условие положительной полуопределенности Икс в терминах обобщенного дополнения Шура.[1] Точно,
Икс ⪰ 0 ⇔ А ⪰ 0 , C − B Т А г B ⪰ 0 , ( я − А А г ) B = 0 { displaystyle X successq 0 Leftrightarrow A successq 0, CB ^ { mathsf {T}} A ^ {g} B successq 0, left (I-AA ^ {g} right) B = 0 ,} и Икс ⪰ 0 ⇔ C ⪰ 0 , А − B C г B Т ⪰ 0 , ( я − C C г ) B Т = 0 , { displaystyle X successq 0 Leftrightarrow C successq 0, A-BC ^ {g} B ^ { mathsf {T}} successq 0, left (I-CC ^ {g} right) B ^ { mathsf {T}} = 0,} где А г { displaystyle A ^ {g}} обозначает обобщенно обратный из А { displaystyle A} .
Смотрите также
использованная литература
^ а б Чжан, Фучжэнь (2005). Дополнение Шура и его приложения . Springer. Дои :10.1007 / b105056 . ISBN 0-387-24271-6 . ^ Хейнсворт, Э. В., "О дополнении Шура", Базельские математические заметки , #BNB 20, 17 страниц, июнь 1968 г. ^ фон Мизес, Ричард (1964). «Глава VIII.9.3». Математическая теория вероятностей и статистика . Академическая пресса. ISBN 978-1483255385 . ^ Чжан, Фучжэнь (2005). Дополнение Шура и его приложения . Springer. п. 34. ^ Чжан, Фучжэнь (2005). Дополнение Шура и его приложения . Springer. п. 34. ^ Бойд, С. и Ванденберге, Л. (2004), «Выпуклая оптимизация», Cambridge University Press (Приложение A.5.5)