WikiDer > Линейно-квадратичный регулятор

Linear–quadratic regulator

Теория оптимальный контроль занимается управлением динамическая система по минимальной цене. Случай, когда динамика системы описывается набором линейные дифференциальные уравнения а стоимость описывается квадратичный функция называется проблемой LQ. Один из основных результатов теории состоит в том, что решение дает линейно-квадратичный регулятор (LQR), регулятор с обратной связью, уравнения которого приведены ниже. LQR - важная часть решения LQG (линейно-квадратично-гауссовская) задача. Как и сама проблема LQR, проблема LQG является одной из самых фундаментальных проблем в теория управления.

Общее описание

Настройки (регулирующего) контроллера, управляющего машиной или процессом (например, самолетом или химическим реактором), находятся с помощью математического алгоритма, который минимизирует функция стоимости с весовыми коэффициентами, предоставленными человеком (инженером). Функция стоимости часто определяется как сумма отклонений ключевых измерений, таких как высота над уровнем моря или температура процесса, от их желаемых значений. Таким образом, алгоритм находит те настройки регулятора, которые минимизируют нежелательные отклонения. Величина самого управляющего воздействия также может быть включена в функцию затрат.

Алгоритм LQR сокращает объем работы, выполняемой инженером по системам управления для оптимизации контроллера. Однако инженеру по-прежнему необходимо указать параметры функции затрат и сравнить результаты с заданными целями проектирования. Часто это означает, что построение контроллера представляет собой итеративный процесс, в котором инженер оценивает «оптимальные» контроллеры, созданные посредством моделирования, а затем регулирует параметры, чтобы создать контроллер, более соответствующий целям проектирования.

Алгоритм LQR - это, по сути, автоматический способ поиска подходящего контроллер с обратной связью по состоянию. Таким образом, инженеры по управлению нередко предпочитают альтернативные методы, например полная обратная связь, также известное как размещение полюсов, при котором существует более четкая взаимосвязь между параметрами контроллера и его поведением. Сложность поиска правильных весовых коэффициентов ограничивает применение синтеза контроллеров на основе LQR.

Конечный горизонт, непрерывное время LQR

Для линейной системы с непрерывным временем, определенной на ${displaystyle tin [t_ {0}, t_ {1}]}$ , описанный:

{displaystyle {точка {x}} = Ax + Bu}

с квадратичной функцией стоимости, определяемой как:

{displaystyle J = x ^ {T} (t_ {1}) F (t_ {1}) x (t_ {1}) + int limits _ {t_ {0}} ^ {t_ {1}} left (x ^ {T} Qx + u ^ {T} Ru + 2x ^ {T} Nuight) dt}

закон управления с обратной связью, который минимизирует стоимость затрат:

{displaystyle u = -Kx,}

куда ${displaystyle K}$ дан кем-то:

{displaystyle K = R ^ {- 1} (B ^ {T} P (t) + N ^ {T}),}

и ${displaystyle P}$ находится путем решения непрерывного времени Дифференциальное уравнение Риккати:

{displaystyle A ^ {T} P (t) + P (t) A- (P (t) B + N) R ^ {- 1} (B ^ {T} P (t) + N ^ {T}) + Q = - {точка {P}} (t),}

с граничным условием:

{displaystyle P (t_ {1}) = F (t_ {1}).}

Условия первого порядка для J_мин находятся:

1) Уравнение состояния

{displaystyle {точка {x}} = Ax + Bu}

2) Уравнение совместного состояния

{displaystyle - {точка {лямбда}} = Qx + Nu + A ^ {T} лямбда}

3) Стационарное уравнение

{displaystyle 0 = Ru + N ^ {T} x + B ^ {T} лямбда}

4) Граничные условия

{displaystyle x (t_ {0}) = x_ {0}}

и ${displaystyle lambda (t_ {1}) = F (t_ {1}) x (t_ {1})}$

Бесконечный горизонт, непрерывное время LQR

Для линейной системы с непрерывным временем, описываемой:

{displaystyle {точка {x}} = Ax + Bu}

с функцией стоимости, определенной как:

{displaystyle J = int _ {0} ^ {infty} left (x ^ {T} Qx + u ^ {T} Ru + 2x ^ {T} Nuight) dt}

закон управления с обратной связью, который минимизирует стоимость затрат:

{displaystyle u = -Kx,}

куда ${displaystyle K}$ дан кем-то:

{displaystyle K = R ^ {- 1} (B ^ {T} P + N ^ {T}),}

и ${displaystyle P}$ находится путем решения непрерывного времени алгебраическое уравнение Риккати:

{displaystyle A ^ {T} P + PA- (PB + N) R ^ {- 1} (B ^ {T} P + N ^ {T}) + Q = 0,}

Это также можно записать как:

{displaystyle {mathcal {A}} ^ {T} P + P {mathcal {A}} - PBR ^ {- 1} B ^ {T} P + {mathcal {Q}} = 0,}

с

{displaystyle {mathcal {A}} = A-BR ^ {- 1} N ^ {T} qquad {mathcal {Q}} = Q-NR ^ {- 1} N ^ {T},}

Конечный горизонт, дискретное время LQR

Для линейной системы с дискретным временем, описываемой:^[1]

{displaystyle x_ {k + 1} = Ax_ {k} + Bu_ {k},}

с индексом производительности, определяемым как:

{displaystyle J = x_ {N} ^ {T} Qx_ {N} + пределы суммы _ {k = 0} ^ {N-1} left (x_ {k} ^ {T} Qx_ {k} + u_ {k} ^ {T} Ru_ {k} + 2x_ {k} ^ {T} Nu_ {k} ight)}

оптимальная последовательность управления, минимизирующая показатель эффективности, определяется выражением:

{displaystyle u_ {k} = - F_ {k} x_ {k},}

куда:

{displaystyle F_ {k} = (R + B ^ {T} P_ {k + 1} B) ^ {- 1} (B ^ {T} P_ {k + 1} A + N ^ {T}),}

и ${displaystyle P_ {k}}$ находится итеративно назад во времени с помощью динамического уравнения Риккати:

{displaystyle P_ {k-1} = A ^ {T} P_ {k} A- (A ^ {T} P_ {k} B + N) влево (R + B ^ {T} P_ {k} Bight) ^ {-1} (B ^ {T} P_ {k} A + N ^ {T}) + Q}

из конечного состояния ${displaystyle P_ {N} = Q}$ . Обратите внимание, что ${displaystyle u_ {N}}$ не определено, так как ${displaystyle x}$ доведен до конечного состояния ${displaystyle x_ {N}}$ к ${displaystyle Ax_ {N-1} + Bu_ {N-1}}$ .

Бесконечный горизонт, дискретное время LQR

Для линейной системы с дискретным временем, описываемой:

{displaystyle x_ {k + 1} = Ax_ {k} + Bu_ {k},}

с индексом производительности, определяемым как:

{displaystyle J = сумма пределов _ {k = 0} ^ {infty} left (x_ {k} ^ {T} Qx_ {k} + u_ {k} ^ {T} Ru_ {k} + 2x_ {k} ^ { T} Nu_ {k} ight)}

оптимальная последовательность управления, минимизирующая показатель эффективности, определяется выражением:

{displaystyle u_ {k} = - Fx_ {k},}

куда:

{displaystyle F = (R + B ^ {T} PB) ^ {- 1} (B ^ {T} PA + N ^ {T}),}

и ${displaystyle P}$ является единственным положительно определенным решением дискретного времени алгебраическое уравнение Риккати (СМЕЙ):

{displaystyle P = A ^ {T} PA- (A ^ {T} PB + N) влево (R + B ^ {T} PBight) ^ {- 1} (B ^ {T} PA + N ^ {T} ) + Q}

.

Это также можно записать как:

{displaystyle P = {mathcal {A}} ^ {T} P {mathcal {A}} - {mathcal {A}} ^ {T} PBleft (R + B ^ {T} PBight) ^ {- 1} B ^ {T} P {mathcal {A}} + {mathcal {Q}}}

с:

{displaystyle {mathcal {A}} = A-BR ^ {- 1} N ^ {T} qquad {mathcal {Q}} = Q-NR ^ {- 1} N ^ {T}}

.

Обратите внимание, что одним из способов решения алгебраического уравнения Риккати является повторение динамического уравнения Риккати для случая конечного горизонта, пока оно не сходится.

внешняя ссылка

[1] Чоу, Грегори С. (1986). Анализ и управление динамическими экономическими системами. Krieger Publ. Co. ISBN 0-89874-969-7.

[1]

Navigation