Uniform optimization method for nonlinear control systems with distributed parameters

Cover Page


Cite item

Full Text

Abstract

The problem of optimization of a nonlinear controlled system with distributed parameters, and uniformly estimated target sets is reduced to controlling a linear model of the object. This linear model incorporates an additional, a priori unknown spatiotemporal disturbance that compensates for the influence of discrepancies between the linear and nonlinear differential operators in the corresponding initial-boundary value problems. Partial differential equations of the parabolic type describe these problems. The specific form of the disturbance’s dependence on its arguments is identified based on the initial approximation at each step of the proposed convergent iterative procedure. This procedure is based on the results obtained in the previous step from solving the linear-quadratic programming optimal control problem using the developed alternance method. This problem includes a deterministic external input and requires the intermediate computation of the controlled state function of the nonlinear object using a digital model.
It has been shown that the desired equations for the optimal regulators can be obtained from the known results of the iterative process used to find the program control. The control is represented as linear feedback algorithms based on the measured state of the object, which uses nonstationary transfer coefficients.

Full Text

Введение

Полное аналитическое решение задачи оптимального управления (ЗОУ) системами с распределенными параметрами (СРП) оказывается возможным лишь применительно к типовым линейным моделям управляемого объекта и критериям оптимальности простейшего вида. За рамками этих модельных представлений решения ЗОУ СРП могут быть получены только с помощью специальных численных методов, что в полной мере относится к СРП, описываемым нелинейными уравнениями в частных производных параболического типа. В настоящее время разработан целый ряд таких методов, общие схемы применения которых используются в ЗОУ объектами как с сосредоточенными, так и с распределенными параметрами [1–7].

Один из основных подходов в этом направлении заключается в применении различных модификаций метода вариаций в пространстве управлений [1–7], реализующих итерационную процедуру построения минимизирующих последовательностей малых изменений управляющих воздействий, которые обеспечивают на каждом шаге убывающие с учетом заданных ограничений значения линейных приближений соответствующих приращений минимизируемого критерия оптимальности, оцениваемых по величине его градиента. В итоге производится редукция исходной ЗОУ к пошаговой процедуре решения ряда специальных задач линейного программирования (ЛП) [6].

Реализация метода вариаций в пространстве управлений связана с необходимостью совместного численного интегрирования уравнений нелинейных моделей объекта и сопряженных систем в целях вычисления производных Фреше минимизируемого функционала по управляющему воздействию, выступающих в роли его градиента, а также со значительным возрастанием трудностей решения соответствующих задач ЛП в условиях фиксации требований к конечному состоянию объекта, учитываемых соответствующими ограничениями на искомые переменные [5–7]. Эти затруднения существенно увеличиваются в задачах равномерной оптимизации при характерных для приложений оценках заданных целевых множеств в равномерной метрике, учет которых приводит к необходимости использования специальных достаточно сложных способов решения ЗОУ ОРП даже применительно к задачам управления линейными моделями управляемого объекта [7–9].

В настоящей работе предлагается конструктивный метод равномерной оптимизации нелинейных управляемых СРП параболического типа с типовым квадратичным функционалом качества, сводимый к сходящейся итерационной процедуре аналитического решения линейных ЗОУ на каждом шаге итераций с промежуточным численным интегрированием уравнений нелинейной модели СРП при предварительно фиксируемом управляющем воздействии. Подобная технология оказывается свободной от ряда недостатков общего метода вариаций в пространстве управлений.

1. Математические модели объекта управления

Пусть объект управления (ОРП) описывается нелинейным пространственно-одномерным уравнением в частных производных параболического типа
\[ \begin{equation}
\cfrac{\partial Q}{\partial t}=L \big(Q(x,t) \big) + u_V (x,t), \quad x \in (x_0, x_1 ), \quad t>0
\end{equation} \tag{1} \]
относительно управляемой функции состояния $Q(x,t)$, изменяющейся в зависимости от пространственной координаты $x \in [x_0, x_1 ]$ и времени $t$, с начальными и граничными условиями 
\[ \begin{equation}
Q (x_0, 0 )=Q_0 (x)=Q_0={\rm const}\geqslant 0, \quad x \in [x_0, x_1 ];
\end{equation} \tag{2} \]
\[ \begin{equation}
\cfrac{\partial Q (x_0, t )}{\partial x}=0; \quad L_1 \bigl(Q (x_1, t ) \bigr)=u_S(t), \quad t>0,
\end{equation} \tag{3} \]
допустимыми в классе кусочно-непрерывных функций внутренним пространственно-распределенным $(u_V )$ и граничным сосредоточенным $(u_S )$ управляющими воздействиями. Всюду далее рассматривается общий случай одновременного использования $u_V$ и $u_S$.

В (1), (3) $L$ и $L_1$ — заданные нелинейные параболические дифференциальные операторы по пространственной координате, рассматриваемые далее для большей определенности и наглядности без потери общности основных последующих результатов в следующей характерной форме [9, 10]:
\[ \begin{equation}
 L \bigl(Q (x,t ) \bigr)=C(Q) \cfrac{\partial^2 Q}{\partial x^2}+
 B(Q)\cfrac{\partial Q}{\partial x} + B_1(Q) \Bigl(\cfrac{\partial Q}{\partial x} \Bigr)^2+D(Q)Q;
\end{equation} \tag{4} \]
\[ \begin{equation}
L_1 \bigl(Q(x_1, t ) \bigr)=\alpha_1 \bigl(Q (x_1, t ) \bigr) Q (x_1, t ) + 
\alpha_2 \bigl(Q(x_1, t ) \bigr) \cfrac{\partial Q (x_1, t )}{\partial x},
\end{equation} \tag{5} \]
где $C$, $B$, $B_1$, $D$, $\alpha_1$, $\alpha_2$ — заданные достаточно гладкие функции своих аргументов.

К виду (4) приводится, в частности, фундаментальное уравнение диффузии и теплопроводности в декартовых и цилиндрических координатах [10], а $L_1$ в виде (5) аналогичен по форме типовым граничным условиям в линейных уравнениях математической физики.

Всюду далее предполагается, что при заданных начальных условиях каждому допустимому управляющему воздействию соответствует единственное решение краевой задачи (1)–(3), понимаемое в обобщенном смысле [11–13].

Начально-краевая задача (1)–(5) может быть записана в следующем виде [9, 10]:
\[ \begin{equation}
\begin{cases}
\cfrac{\partial Q(x,t)}{\partial t}=L_0\bigl(Q(x, t)\bigr) +u_V (x,t) +F(x,t), \quad x \in (x_0, x_1), \quad t>0;\\
Q(x,0) =Q_0 (x)=Q_0={\rm const} \geqslant 0, \quad x \in [x_0, x_1 ];\\
\cfrac{\partial Q (x_0, t )}{\partial x}=0; \quad L_{10}\bigl(Q (x_1, t ) \bigr) =u_S (t) + F_1 (t), \quad t>0.
\end{cases}
\end{equation} \tag{6} \]
Здесь 
\[ \begin{equation}
L_0 \bigl(Q (x, t ) \bigr) =C_0\cfrac{\partial^2 Q}{\partial x^2} + B_0 \cfrac{\partial Q}{\partial x}+D_0 Q, \quad x \in (x_0, x_1), \quad t>0;
\end{equation} \tag{7} \]
\[ \begin{equation}
L_{10} \bigl(Q (x_1, t ) \bigr) =\alpha_{10} Q (x_1, t ) + \alpha_{20} \cfrac{\partial Q (x_1, t )}{\partial x},
\end{equation} \tag{8} \]
— линейные дифференциальные операторы, определяемые в форме линейных приближений к $L$, $L_1$ в (1), (3), где $C_0$, $B_0$, $D_0$, $\alpha_{10}$, $\alpha_{20}$ — некоторые константы, получаемые, например, путем усреднения соответствующих коэффициентов в (4), (5) и 
\[ \begin{equation}
F(x,t)=L\bigl(Q (x, t ) \bigr) - L_0\bigl(Q (x, t ) \bigr),
\end{equation} \tag{9} \]
\[ \begin{equation}
F_1(t)=L_{10}\bigl(Q (x_1, t ) \bigr) - L_1\bigl(Q (x_1, t ) \bigr).
\end{equation} \tag{10} \]

Всюду далее предполагается, что $F(x,t)$ и $F_1(t)$ являются кусочно-непрерывными функциями своих аргументов. Если их считать заданными в (6), где они фигурируют в роли детерминированных внешних возмущений, то модель ОРП (6)–(8) становится линейной и аналитическое решение краевой задачи (6)–(8) может быть получено известными способами [14, 15].

Однако согласно (9), (10), явная форма зависимостей $F(x,t)$, $F_1(t)$ от $x$ и $t$ априори неизвестна и к их определению в целях перехода от исходной к линейной модели (6)–(8) сводится дальнейшая проблема.

Применение метода конечных интегральных преобразований по пространственному аргументу $x\in [x_0, x_1 ]$ [16, 17] к уравнениям линейной начально-краевой задачи (6)–(8) с ядром, равным ее собственным функциям $\varphi_n (\mu_n, x )$, $n=1, 2, \ldots$, где $\mu_n^2$ — собственные числа, приводит к описанию рассматриваемого объекта бесконечной системой обыкновенных дифференциальных уравнений первого порядка для временных мод $\bar{Q}_n (t)$ разложения $Q(x,t)$ в сходящийся в среднем ряд по ортонормированной с весом $r(x)$ системе $\varphi_n (\mu_n, x )$ [7–9]:
\[ \begin{equation}
Q(x,t)=\sum\limits_{n=1}^{\infty} \bar{Q}_n (t) \varphi_n (\mu_n, x );
\end{equation} \tag{11} \]
\[ \begin{equation}
\cfrac{d\bar{Q}_n}{dt} =-\mu_n^2 \bar{Q}_n +\bar{u}_{Vn} (t) +\bar{F}_n (\mu_n, t ) +g_n u_S (t) + g_n F_1(t);
\end{equation} \tag{12} \]
\[ \begin{equation*}
\bar{Q}_n(0) =\bar{Q}_0 (\mu_n ), \quad n=1 ,2, \ldots,
\end{equation*} \]
с автономными сосредоточенными внутренними управляющими воздействиями $\bar{u}_{Vn} (t)$, $n=1, 2, \ldots$, и граничным управлением $u_S (t)$.
Здесь
\[ \begin{equation}
\begin{aligned}
&\bar{u}_{Vn} (t)=\int _{x_0}^{x_1}u_V (x,t) r(x) \varphi_n (\mu_n, x ) dx; 
\\
& \bar{F}_n (\mu_n, t )=\int _{x_0}^{x_1} F(x,t)r(x) \varphi_n (\mu_n, x ) dx, \quad n=1, 2, \ldots
\end{aligned}
\end{equation} \tag{13} \]
представляют собой модальные составляющие разложения в ряд вида (11) внутреннего управления $u_V (x,t)$ и функции $F(x,t)$:
\[ \begin{equation}
u_V (x,t)=\sum \limits_{n=1}^{\infty} \bar{u}_{Vn} (t) \varphi_n (\mu_n, x ), \quad
F(x,t)=\sum \limits_{n=1}^{\infty} \bar{F}_n (\mu_n, t ) \varphi_n (\mu_n, x ),
\end{equation} \tag{14} \]
$g_n$ — известные коэффициенты [17].

Подставляя $Q(x,t)$ в виде (11) в выражения (9), (10), где предполагается допустимым почленное дифференцирование ряда (11) по пространственной координате, и интегрируя в (13), получим $\bar{F}_n (\mu_n, t )$ и $F_1(t)$ в форме вполне определенных нелинейных зависимостей от $\bar{Q}= (\bar{Q}_n )$, $n=1, 2, \ldots$, что приводит к преобразованию соотношений (12) в замкнутую относительно $\bar{Q}$ бесконечную нелинейную систему уравнений объекта [9, 10]:
\[ \begin{equation}
\begin{aligned}
& \cfrac{d\bar{Q}_n}{dt}=-\mu_n^2\bar{Q}_n + \Phi_n (\bar{Q} ) +\bar{u}_{Vn} (t) +g_n u_S (t), \quad n=1, 2, \ldots,\\
& \Phi_n (\bar{Q} )=\bar{F}_n (\bar{Q} ) + g_n F_1 (\bar{Q} ).
\end{aligned}
\end{equation} \tag{15} \]

Последующие подстановки решения этой системы в (11) и выражения (11) для $Q(x,t)$ в правую часть равенств (9), (10) позволяют найти $F(x,t)$ и $F_1(t)$, однако такое решение может быть получено с требуемой точностью даже при использовании известных способов конечномерного усечения системы (15) [18–20] только численными методами, сложность реализации которых оказывается сравнимой с трудностями непосредственного применения численных методов вариаций в пространстве управлений в задачах оптимального управления исходной нелинейной моделью (1)–(5).

Значительно более простым и конструктивным оказывается предлагаемый в последующих разделах статьи итерационный алгоритм вычисления $F(x,t)$ и $F_1(t)$ по известному начальному приближению, реализуемый в процессе решения на каждом шаге итераций рассматриваемых задач оптимального управления с линейной моделью ОРП вида (6)–(8).

2. Постановка задачи оптимального управления

Пусть объект управления с распределенными параметрами описывается линейной начально-краевой задачей (6)–(8).

Управляющие воздействия в (6) стесняются ограничениями
\[ \begin{equation}
u_{V_{\min}}\leqslant u_V(x,t) \leqslant u_{V_{\max}}; \quad u_{S_{\min}}\leqslant u_S(t) \leqslant u_{S_{\max}}
\end{equation} \tag{16} \]
с заданными пределами их допустимых значений.

Будем считать, что, согласно типовым в приложениях требованиям, необходимо обеспечить за фиксируемое конечное время $t_1$ заданную точность $\varepsilon$ равномерного приближения пространственного распределения управляемой величины $Q (x, t_1)$ к требуемому $Q^{**} (x) >Q_0$ для всех $x \in [x_0, x_1 ]$ согласно соотношению
\[ \begin{equation}
\max_{x \in [x_0, x_1]} \bigl|Q (x, t_1 ) -Q^{**} (x) \bigr| \leqslant \varepsilon,
\end{equation} \tag{17} \]
определяющему оцениваемое в равномерной метрике целевое множество конечных состояний ОРП [7–9].

Пусть далее эффективность процесса управления объектом (6)–(8) оценивается квадратичным функционалом качества, определяемым в следующей типичной частной форме:
\[ \begin{equation}
I (u_V, u_S )=\int _0^{t_1} \int _{x_0}^{x_1}
\bigl[\rho_1(x) Q^2 (x,t) +\rho_2(x) u_V^2 (x,t) \bigr] dxdt+\int _0^{t_1} \rho_S u_S^2 (t) dt \to \min_{u_V,u_S}
\end{equation} \tag{18} \]
с заданными весовыми коэффициентами $\rho_1(x)$, $\rho_2(x)$ и $\rho_S={\rm const}>0$.

Переход к описанию объекта (11), (12) в терминах модальных переменных приводит при $\rho_1(x)=\rho_2(x)=r(x)$ в силу ортонормированности семейства собственных функций к представлению критерия (18) в следующем виде:
\[ \begin{equation}
\begin{aligned}
I_1 (\bar{u}_V, u_S )=&\int _0^{t_1} 
\biggl[\sum \limits_{n=1}^{\infty} \bar{Q}_n^2 (t) + \sum \limits_{n=1}^{\infty} \bar{u}_{Vn}^2 (t) +\rho_S u_S^2(t) \biggr] dt \to \min_{\bar{u}_V,u_S} ;\\
&\bar{u}_V= (\bar{u}_{Vn} ), \quad n=1, 2, \ldots ,
\end{aligned}
\end{equation} \tag{19} \]
а требования (17) к конечному состоянию ОРП представляются условием 
\[ \begin{equation}
\max_{x \in [x_0, x_1 ]} \biggl|\sum\limits_{n=1} ^{\infty} \bar{Q}_n (t_1 ) 
\varphi_n (\mu_n, x ) -Q^{**} (x) \biggr| \leqslant \varepsilon.
\end{equation} \tag{20} \]
Здесь и всюду далее в условиях выполнения усиленных условий Коши–Липшица [20] будем учитывать $N_1$ слагаемых бесконечных сумм в (19), (20), где $N_1=\infty$ или $N_1=N<\infty$ в зависимости от используемой схемы анализа и возможностей практической реализации исследуемых алгоритмов управления, ограничиваясь в случае $N_1=N$ с любой требуемой точностью решением «укороченной» системы $N$ первых уравнений в (12) при достаточно большой величине $N$ и полагая при этом $\bar{Q}_n(t)=0$ при $n>N$ [18–20]. При использовании усеченной модели объекта с $N_1=N<\infty$ все получаемые далее результаты следует считать субоптимальными. 

Теперь рассматриваемая линейно-квадратичная задача оптимизации сводится к определению программного оптимального управления $u_S^* (t)$ и $\bar{u}_V^* (t)$, по которому $u_V^* (x,t)$ восстанавливается в форме ряда (14), и алгоритмов обратной связи $u^* (\bar{Q}, x, t )=\bigl( u_V^* (\bar{Q}, x, t ), u_S^* (\bar{Q}, t ) \bigr)$, 
$\bar{Q}= ( \bar{Q}_n )$, $n=\overline{1, N_1}$, обеспечивающих при $N_1=\infty$ перевод объекта (11), (12) за заданное время $t_1$ в требуемое конечное состояние (20) при минимальном значении критерия оптимальности (19) в условиях ограничений (16).

3. Программное оптимальное управление при заданных зависимостях $\boldsymbol{F(x,t)}$ и $\boldsymbol{F_1(t)}$

3.1. Структура управляющего воздействия

На сформулированную бесконечномерную при $N_1=\infty$ задачу оптимального управления распространяется принцип максимума Понтрягина [7, 21].

Основное условие
\[ \begin{equation}
H\bigl(\bar{Q}^* (t), \bar{u}^* (t), \psi^*(t) \bigr)=
\max_{\bar{u}} H \bigl(\bar{Q}^*(t), \bar{u}, \psi^*(t) \bigr), \quad t \in [0, t_1 ]
\end{equation} \tag{21} \]
достижения на соответствующих оптимальному процессу величинах $\bar{Q}^*(t)$, $\bar{u}^*(t)$, $\psi^*(t)$ максимума функции Понтрягина 
\[ \begin{equation}
H\bigl(\bar{Q}(t),\bar{u}(t), \psi(t) \bigr)=
-\sum\limits_{n=1}^{N_1} \bar{Q}_n^2 (t)-\sum \limits_{n=1}^{N_1} \bar{u}_{Vn}^2 (t) -\rho_S u_S^2 (t)+\sum\limits_{n=1}^{N_1} \psi_n(t) \bigl(-\mu_n^2 \bar{Q}_n (t) +\bar{u}_{Vn} (t) + \bar{F}_n (\mu_n, t )+g_n u_S(t) +g_n F_1(t) \bigr)
\end{equation} \tag{22} \]
по векторному аргументу $\bar{u} (t)= (\bar{u}_V (t), u_S(t) )$ позволяет найти $\bar{u}^*(t)$ в форме явных функций от $\psi^*(t)$ для рассматриваемой задачи оптимизации (11), (12), (16), (19), (20). Здесь $\bar{Q}(t)=\big(\bar{Q}_n(t) \big)$ и вектор сопряженных переменных $\psi(t)=\big(\psi_n(t) \big)$ связаны системой уравнений
\[ \begin{equation}
\cfrac{d \psi_n}{dt}= -\cfrac{\partial H}{\partial\bar{Q}_n} =2\bar{Q}_n (t)+\mu_n^2 \psi_n(t), \quad n=\overline{1,N_1}.
\end{equation} \tag{23} \]

Ограничимся далее для простоты типичной постановкой линейно-квадратичной задачи оптимизации с не стесняемыми ограничениями (16) управляющими воздействиями в целях достижения максимального эффекта по величине критерия оптимальности (19) и последующего выбора предельно допустимых значений $u_S(t)$ и $\bar{u}_{Vn} (t)$, связываемых условиями (16), на основании получаемых результатов.

В открытой области изменения $\bar{u}(t)$ оптимальное управление $\bar{u}^*(t)$ при любой конкретной форме допустимых зависимостей $F(x,t)$ и $F_1(t)$ в (6) от своих аргументов и требований к конечному состоянию объекта принимает, согласно (21)–(23), следующий вид [15, 23]:
\[ \begin{equation}
\bar{u}_{Vn}^* (t)=\cfrac 12 \psi_n^*(t), \quad n=\overline{1, N_1}; 
\quad 
u_S^*(t)=\cfrac 1 {2 \rho_S} \sum \limits_{p=1}^{N_1} g_p \psi_p^* (t).
\end{equation} \tag{24} \]

3.2. Краевая задача принципа максимума

Уравнения (12) с подстановкой управляющих воздействий вида (24) образуют совместно с (23) линейную программно-управляемую систему (П-систему [6, 9]), замыкаемую относительно неизвестных $\bar{Q}(t)$ и $\psi(t)$ требованиями (20) к конечному состоянию объекта:
\[ \begin{equation}
\begin{aligned}
\cfrac{d\psi_n}{dt}&=2\bar{Q}_n +\mu_n^2 \psi_n, \qquad\qquad n=\overline{1, N_1};\\
\cfrac{d\bar{Q}_n}{dt}&=-\mu_n^2 \bar{Q}_n +\cfrac 12 \psi_n +\cfrac 1{2\rho_S} g_n \sum \limits_{p=1}^{N_1} g_p \psi_p +{}\\
{}&{}+ \bar{F}_n (\mu_n, t ) + g_n F_1(t), \quad n=\overline{1, N_1}.
\end{aligned}
\end{equation} \tag{25} \]
Решение этой системы может быть представлено в векторно-матричной форме:
\[ \begin{equation}
\begin{bmatrix}
\psi(t)\\
\bar{Q}(t)
\end{bmatrix} = e^{At} \begin{bmatrix}
\psi(0)\\
\bar{Q}(0)
\end{bmatrix} + \int _0^{t} e^{A(t-\tau)} \omega (\tau) d\tau.
\end{equation} \tag{26} \]
Здесь
\[ \begin{equation}
\begin{aligned}
&
\omega(\tau) = \begin{bmatrix}
0\\
\bar{F}(\tau)+g F_1(\tau)
\end{bmatrix}, \\
& \bar{F}(\tau) + g F_1(\tau) = \bigl(\bar{F}_n (\mu_n, \tau )+g_n F_1 (\tau) \bigr), \quad n=\overline{1, N_1};
\end{aligned}
\end{equation} \tag{27} \]
$\bar{F}(\tau) + g F_1(\tau)$ — вектор-столбец; $g= (g_n )$, $n=\overline{1,N_1}$; $A$ — матрица коэффициентов системы (25); $e^{At}$ — матричная экспонента, столбцами которой являются линейно независимые решения однородной системы (25) при $\bar{F}_n (\mu_n, t ) = F_1(t) =0$. 

Матричная экспонента представляется в блочном виде
\[ \begin{equation}
e^{At} = \begin{bmatrix}
A_{11}(t) & A_{12} (t)\\
A_{21}(t) & A_{22} (t)
\end{bmatrix},
\end{equation} \tag{28} \]
где блоки $A_{ij} (t)$ — известные $N_1 {\times} N_1$ матрицы в соответствии со структурой системы уравнений (25).

3.3. $\boldsymbol{\psi^{(M)}}$-параметризация управляющих воздействий

Согласно (26) $\psi(t)$, а следовательно, и программное управление (24) определяются при известной величине $\bar{Q}(0)$ с точностью до вектора $\psi(0)$ начальных значений сопряженных функций, выступающих, таким образом, в роли параметрического представления $\bar{u}^*(t)$ [2, 6]. Однако для СРП подобный способ параметризации оказывается неконструктивным в силу бесконечной размерности этого вектора при $N_1=\infty$. В работе [24] применительно к требованиям (20), предъявляемым к $\bar{Q}^* (t_1 )$, предложен метод последовательной конечномерной параметризации управляющих воздействий («$\psi$-параметризация») на множестве $M$-мерных векторов $\psi^{(M)}$ финишных значений $\psi_i (t_1 )$, $i=\overline{1, M}$, первых $M<N_1$ сопряженных функций в (25) при равных нулю остальных величинах $\psi_i (t_1 )=0$, $i>M$:
\[ \begin{equation}
\psi^{(M)}=\bigl(\psi_i (t_1 ) \bigr)= (\tilde{\psi}_i ), 
\quad i=\overline{1,M}; \qquad \psi_i (t_1 )=0, \quad i>M\geqslant 1.
\end{equation} \tag{29} \]

Интегрирование уравнений П-системы (25) в условиях $\psi$-параметризации (29) позволяет получить конечное состояние управляемой величины, управляющие воздействия и значения критерия оптимальности в форме явных функций $Q (x,\psi^{(M)} )$, $\bar{u}_{Vn} (t, \psi^{(M)} )$, $u_S (t,\psi^{(M)})$ и $I_1 (\psi^{(M)} )$ от своих аргументов.

При этом минимально достижимые в классе параметризуемых управлений $\bar{u} (t, \psi^{(M)} )$ значения $\varepsilon_{\min} ^{(M)}$ ошибки $\varepsilon$ равномерного приближения $Q (x, t_1 )$ к $Q^{**} (x)$ определяются в соответствии с (17) соотношением
\[ \begin{equation}
\varepsilon_{\min}^{(M)}=\min_{\psi^{(M)} \in E^M} \Bigl\{\max_{x\in [x_0, x_1 ]} \bigl|Q (x, \psi^{(M)} ) -Q^{**}(x) \bigr| \Bigr\}.
\end{equation} \tag{30} \]

Как показано в [22], в типичных условиях существования отрицательной производной функции максимума в (30) по некоторому направлению в $E^{(M+1)}$ ошибки минимакса в (30) уменьшаются с возрастанием $M$, образуя строго убывающую цепочку неравенств
\[ \begin{equation}
\varepsilon_{\min}^{(1)}>\varepsilon_{\min}^{(2)}>\cdots> \varepsilon_{\min}^{(j)} > \varepsilon_{\min}^{(j+1)} > \cdots > \varepsilon_{\min}^{(\rho)} = \varepsilon_{\rm inf},
\end{equation} \tag{31} \]
где $\varepsilon_{\rm inf}$ — точная нижняя грань возможных значений $\varepsilon$ в (17) и $\rho=\infty$ при $\varepsilon_{\rm inf}= 0$ и $\rho<\infty$ при $\varepsilon_{\rm inf} > 0$ соответственно для управляемых и неуправляемых относительно $Q^{**}(x)$ моделей объекта [8, 9]. При $\varepsilon<\varepsilon_{\rm \inf}$ решение рассматриваемой задачи оптимального управления не существует. Неравенства (31) характеризуют сужающиеся к $Q^{**}(x)$ с возрастанием $M$ семейства целевых множеств для $\varepsilon=\varepsilon_{\min}^{(j)}$ в (20), создавая возможности обеспечения достижимой точности равномерного приближения к $Q^{**}(x)$ при $\varepsilon\geq\varepsilon_{\rm inf}$ в (20) в процессе последовательной $\psi$-параметризации управляющих воздействий с конечномерным вектором параметров $\psi^{(M)}$, $M<N_1$, для ряда возрастающих значений $M$ в (29).

Искомое $\psi$-параметризуемое оптимальное управление $\bar{u} (t, \psi_*^{ (M_0 )})$ характеризуется вектором параметров $\psi_*^{(M_0)}=(\tilde{\psi}_i^* )$, $i=\overline{1,M_0}$, размерностью $M=M_0$, нижняя граница которой в силу определения (30) отвечает в условиях (31) в зависимости от величины $\varepsilon$ в (20) неравенствам
\[ \begin{equation}
M_0 \geqslant \upsilon \forall \varepsilon : \varepsilon_{\min}^{(\upsilon)}\leqslant \varepsilon < \varepsilon_{\min}^{(\upsilon-1)}, \quad \upsilon \in \{\overline{1,\rho} \}.
\end{equation} \tag{32} \]

Соотношения (29) представляют собой условия трансверсальности на правом конце траекторий в бесконечномерном фазовом пространстве переменных $\bar{Q}_n$, $n=1, 2,\ldots$, с некоторыми (заранее неизвестными для каждого вектора $\psi^{(M)}$) фиксированными конечными значениями $\bar{Q}_{nk}$, $n=\overline{1,M}$, первых $M$ мод $\bar{Q}_n (t_1 )$, $n=\overline{1,M}$, и свободными величинами $\bar{Q}_n (t_1 )$ при $n>M$ для остальных модальных переменных:
\[ \begin{equation}
\bar{Q}_n (t_1 ) =\bar{Q}_{nk}, \quad n=\overline{1,M}; \qquad 
\bar{Q}_n (t_1 ) \in E^1, \quad n>M.
\end{equation} \tag{33} \]

Заменим требование (20) к конечному состоянию объекта в рассматриваемой задаче оптимального управления краевыми условиями (33) для заданных величин $\bar{Q}_{nk}$, $n=\overline{1,M}$, при некотором фиксированном значении $M=M_1$. Пусть решение соответствующей П-системы (25), замыкаемой соотношениями (33), позволяет найти вектор $\psi^{(M_1 )} = (\tilde{\psi}_i )$, $i=\overline{1,M_1}$, сопряженных переменных, параметрические зависимости управляющего воздействия $\bar{u} (t, \psi^{(M_1 )})$ и отвечающие ему конечные значения $\bar{Q}_{nk}$ для $n>M_1$. Предположим, что на некотором множестве всех возможных по набору $M_1$ вариантов величин $\bar{Q}_{nk}$, $n=\overline{1,M_1}$, удовлетворяется условие (20), и выделим такой из этих вариантов, для которого достигается наименьшее значение $I_{1 {\min}} ( \psi^{ (M_1 )} )$ критерия оптимальности (19). В итоге оказывается решенной исходная задача оптимизации, если искомое управление $\bar{u}^* (t)$ действительно принадлежит классу $\psi^{ (M_1 )}$-параметризуемых функций $\bar{u} (t, \psi^{ (M_1 )} )$. 

Рассмотрим далее $\psi^{ (M_2 )}$-параметризованное управление $\bar{u} (t, \psi^{ (M_2 )})$ с $M  =M_2>M_1$ в (33), где $\psi^{ (M_2 )}= (\tilde{\psi}_i )$, $i=\overline{1,M_2}$, и $\tilde{\psi}_i\neq 0$ хотя бы для одного из значений $i \in \{\overline{M_1+1, M_2} \}$. 

В классе таких управляющих воздействий число фиксируемых в (33) величин $\bar{Q}_{nk}$ превышает $M_1$. Так как при $M=M_1$ согласно (29) $\tilde{\psi}_i = 0$ для всех $i \in \{\overline{M_1+1, M_2}\}$, достигаемое при рассматриваемом управлении $\bar{u} (t, \psi^{ (M_2 )} )$ значение $I_{1\min} (\psi^{ (M_2 )} )$ критерия оптимальности (19) для любого одинакового с $\bar{u} (t, \psi^{ (M_1 )})$ набора первых $M_1$ величин $\bar{Q}_{nk}$ отвечает неравенству $I_{1\min} (\psi^{ (M_1 )} ) < I_{1} (\psi^{ (M_2 )} )$ за счет свободы выбора большего числа составляющих $\bar{Q}_n (t_1 )$, $n>M$ в (33) при $M=M_1$ по сравнению со случаем $M=M_2$, которые автоматически устанавливаются из условий минимизации функционала качества (19). Если управление $u (t, \psi^{ (M_2 )} )$ реализуется в условиях $\tilde{\psi}_i =0$ для всех $i \in \{\overline{M_1+1, M_2} \}$, то в таком случае $\psi^{ (M_2 )}= \psi^{ (M_1 )}$ согласно определению (29), и последнее неравенство уточняется следующим образом: $I_{1\min} (\psi^{ (M_1 )} ) \leqslant I_{1} (\psi^{ (M_2 )} )$.

Отсюда следует, что размерность $M_0$ вектора $\psi_*^{ (M_0 )}$, характеризующего искомое оптимальное управление, совпадает со своей нижней границей в (32) и находится по правилу 
\[ \begin{equation}
M_0=\upsilon \forall \varepsilon : \varepsilon_{\min}^{(\upsilon)} \leqslant \varepsilon < \varepsilon_{\min}^{(\upsilon-1)}, \quad \upsilon \in \{1,\rho \},
\end{equation} \tag{34} \]
однозначно устанавливающему величину $M_0$ в зависимости от заданного значения $\varepsilon$ в (20) и характеризующему структуру оптимальных программных управлений минимальной сложности в условиях (20).

3.4. Явная форма $\boldsymbol{\psi^{(M)}}$-параметризуемых оптимальных управлений

Перенос («прогонка») начальных условий в (26) в конечный момент времени приводит к следующему выражению для сопряженных функций в оптимальном процессе в зависимости от конечной величины $\psi^* (t_1 )$, начального состояния объекта $\bar{Q}(0)$ и внешнего воздействия $\omega(\tau)$ в (26), (27) [15, 23]:
\[ \begin{equation}
\psi^*(t) =\bigl[
\hat{A}_{11} (t_1 -t ) + \hat{A}_{12} (t_1 -t ) K (t_1 )\bigr] \psi^* (t_1 ) +\hat{A}_{12} (t_1 -t ) K_1 (t_1 ) \bar{Q}(0) 
+\hat{A}_{12} (t_1 -t ) D_{\omega} (t_1 ) + D_{\omega 1} (t, t_1 ),
\end{equation} \tag{35} \]
где $\hat{A}_{ij}$ — подобные (28) блоки обратной матрицы $e^{-A (t_1 -t )}$,
\[ \begin{equation*}
K (t_1 )=A_{21} (t_1 ) A_{11}^{-1} (t_1 ),
\quad 
K_1 (t_1 )=A_{22} (t_1 )-A_{21} (t_1 ) A_{11}^{-1} (t_1 ) A_{12} (t_1 ),
\end{equation*} \]
\[ \begin{equation*}
 D_{\omega} (t_1 ) =\int _0^{t_1} A_{22} (t_1 -\tau ) \bigl( \bar{F} (\tau) + g F_1 (\tau)\bigr) d\tau - A_{21} (t_1 ) A_{11}^{-1} (t_1 ) \int _0^{t_1} A_{12} (t_1 -\tau ) \bigl( \bar{F} (\tau) + g F_1 (\tau)\bigr) d\tau,
\end{equation*} \]
\[ \begin{equation*}
D_{\omega 1} (t, t_1 )=-\int _t^{t_1} \hat{A}_{12} (\tau - t) \bigl(\bar{F}(\tau) +gF_1 (\tau) \bigr) d \tau.
\end{equation*} \]

Подстановка (35) в (24) приводит к явной форме $\psi$-параметризованных оптимальных программных управлений $\bar{u}^*_{V n} (t)$ и $u_S^*(t)$.

3.5. $\boldsymbol{\Delta^{(M)}}$-параметризация управляющих воздействий

В рассматриваемой ЗОУ искомые оптимальные управления находятся, согласно (24), непосредственно в терминах сопряженных переменных, позволяя получить в достаточно простом виде (24), (35) их $\psi^{(M)}$-параметризованное представление. Однако при отличном от (19) критерии оптимальности базовое условие оптимальности (21) приводит к гораздо более сложным зависимостям $\bar{u}^*(t)$ от $\psi^*(t)$, краевая задача принципа максимума становится нелинейной [7–9, 24] и задача определения в явной форме $\psi^{(M)}$-параметризованного управления $\bar{u}^*(t)$ оказывается трудноразрешимой. 

Тем не менее в подобной ситуации процедура принципа максимума в совокупности с базовыми закономерностями предметной области во многих случаях позволяет найти оптимальные управляющие воздействия с точностью до вектора $\Delta^{(M)}=(\Delta_i^{(M)})$, $i=\overline{1, M}$, параметров отличной от $\psi^{(M)}$ природы, который непосредственно характеризует их поведение в заданной пространственно-временной области ($\Delta^{(M)}$-параметризация $\bar{u}(t)$) [7–9, 24].

Типичным примером является классическая задача оптимального по быстродействию управления, для которой оптимальное управляющее воздействие заведомо определяется, согласно (21), в классе кусочно-постоянных функций с точностью до вектора $\Delta^{(M)}$ длительностей $\Delta_i^{(M)}$, $i=\overline{1, M}$, $M$ интервалов постоянства управляющих воздействий, попеременно принимающих только свои предельно допустимые максимальное и минимальное значения в соответствии с (16) [7–9]. Интегрирование системы уравнений (12) модели объекта с $\Delta^{(M)}$-параметризованным управлением $\bar{u} (t, \Delta^{(M)} )$ позволяет найти конечные значения модальных переменных $\bar{Q}_n (t_1, \Delta^{(M)} )$, $n=\overline{1, N_1}$, по которым $Q (x, t_1 )=Q (x, \Delta^{(M)} )$ восстанавливается в форме ряда (11), и значение критерия оптимальности $I_1 (\Delta^{(M)} )$ в форме явных функций от $\Delta^{(M)}$. Процедура $\Delta^{(M)}$-параметризации характеризуется величинами $\tilde{\varepsilon}_{\min}^{(j)}$ минимакса, определяемыми соотношениями (30), (31) после замены в них $\psi^{(M)}$ на $\Delta^{(M)}$.

Поскольку в результате $\psi^{(M)}$-параметризации рассматриваемая задача оптимизации сводится к управлению объектом (12) с заданными конечным состоянием $\bar{Q}_{nk}$, $n=\overline{1, M}$, первых $M$ мод управляемой величины при свободных значениях $\bar{Q}_n (t_1 )$, $n>M$ остальных модальных составляющих согласно (33), вектор $\Delta_*^{(M)}$, характеризующий оптимальное управление $u^* (t, \Delta_*^{(M)} )$, может быть найден путем решения системы $M$ уравнений
\[ \begin{equation}
\bar{Q}_{nk}=\bar{Q} _n (t_1, \Delta^{(M)} ), \quad n=\overline{1, M}
\end{equation} \tag{36} \]
относительно $M$ неизвестных $\Delta_i^{(M)}$, $i=\overline{1, M}$, при каждом заданном наборе $M$ величин $\bar{Q}_{nk}$, $n=\overline{1, M}$, и найденных зависимостях $\bar{Q}_n (t_1, \Delta^{(M)} )$, $n=\overline{1, M}$.

Ввиду полной управляемости укороченной модели объекта, описываемой первыми $M$ уравнениями в (12) для $n=\overline{1, M}$ [25], система уравнений (36) всегда имеет решение относительно $\Delta^{(M)}$, если искомое оптимальное управление существует в классе $\Delta^{(M)}$-параметризуемых управляющих воздействий.

Дальнейший анализ в этих условиях по схеме для $\psi^{(M)}$-параметризованного управления приводит к подобному (34) правилу выбора размерности $M_0$ вектора $\Delta_*^{ (M_0 )}$, характеризующего оптимальное управление $\bar{u}^* (x, \Delta_*^{ (M_0 )} )$ в зависимости от заданного $\varepsilon$ в (20):
\[ \begin{equation*}
M_0=\upsilon \forall \varepsilon : \tilde{\varepsilon}_{\min}^{(\upsilon)} \leqslant \varepsilon < \tilde{\varepsilon}_{\min}^{(\upsilon - 1)}, \quad \upsilon \in \{1,\rho \},
\end{equation*} \]
где значения $\tilde{\varepsilon}_{\min}^{(\upsilon)}$ отличаются от $\varepsilon_{\min}^{(\upsilon)}$ в (34).

Всюду далее продолжается исследование поставленной в разделе 2 задачи оптимизации с критерием оптимальности (19) применительно к поиску $\psi^{(M)}$-параметризованных управляющих воздействий.

3.6. Редукция к задаче полубесконечной оптимизации

После интегрирования уравнений системы (12) с $\psi$-параметризованным управлением $\bar{u}^* (t, \psi_*^{ (M_0 )} )$ вида (24), (35) находятся при заданном детерминированном воздействии $\omega(\tau)$ в (26), (27) зависимости $Q (x, \psi_*^{ (M_0 )} )$ управляемой величины в конце процесса управления для каждого значения $\bar{Q}(0)$ и критерия оптимальности $I_1 (\psi_*^{ (M_0 )} )$ в (11), (19) в форме явных функций своих аргументов. В результате осуществляется точная редукция исходной задачи оптимального управления к задаче полубесконечной оптимизации (ЗПО) [7–9, 24]:
\[ \begin{equation}
I_1 (\psi_*^{(M_0)} ) \to \min_{\psi_*^{ (M_0 )}}; 
\quad 
\max_{x\in [x_0, x_1 ]} \bigl|Q (x, \psi_*^{ (M_0 )} ) - Q^{**} (x)\bigr| \leqslant \varepsilon
\end{equation} \tag{37} \]
на экстремум функции $I_1 (\psi_*^{ (M_0 )} )$ конечного числа $M_0$ переменных $\tilde{\psi}_i^*$, $i =\overline{1, M_0}$, в (29) с бесконечным числом ограничений, порождаемых требованием выполнения условия (17) для всех $x \in [x_0, x_1 ]$ и заменяемых одним ограничением на функцию максимума в (37). Здесь размерность $M=M_0$ оптимального вектора параметров $\psi_*^{ (M_0 )}$ определяется согласно (30), (31), (34).

Решение ЗПО (37) относительно вектора параметров $\psi_*^{ (M_0 )}$, а также заведомо неизвестной величины $\varepsilon_{\min} ^{ (M_0 )}$ в случае, когда $\varepsilon = \varepsilon_{\min} ^{ (M_0 )}$ в (37), может быть получено альтернансным методом параметрической оптимизации в условиях малостеснительных для прикладных задач допущений [7–9].

Метод базируется на специальных альтернансных свойствах искомой оптимальной величины вектора $\psi_*^{ (M_0 )} = (\psi^*_i )$, $i=\overline{1, M_0}$, в (37), являющихся аналогом условий экстремума в теории нелинейных чебышевских приближений, и дополнительной информации о форме кривой пространственного распределения результирующего состояния $Q (x, \psi_*^{ (M_0 )} )$, определяемой закономерностями предметной области. Согласно альтернансным свойствам, равные допустимой величине $\varepsilon$ одинаковые значения максимальных отклонений $\max\limits_{x\in [x_0, x_1 ]} \bigl|Q (x, \psi_*^{ (M_0 )} ) - Q^{**} (x)\bigr|$ достигаются в некоторых точках $x_j^0$, $j=\overline{1, R}$, на отрезке $ [x_0, x_1 ]$. Общее число $R$ этих точек
\[ \begin{equation*}
R=\begin{cases}
M, & \text{если } \varepsilon_{\min} ^{ (M_0 )} <\varepsilon < \varepsilon_{\min} ^{ (M_0 -1 )};
\\
M+1, & \text{если } \varepsilon =\varepsilon_{\min} ^{ (M_0 )},
\end{cases}
\end{equation*} \]
согласно [7–9]
равно числу искомых неизвестных в ЗПО (37) и порождает замкнутую относительно этих неизвестных систему отношений
\[ \begin{equation}
\bigl|Q (x_j^0, \psi_*^{ (M_0 )} ) - Q^{**} (x_j^0 )\bigr| = \varepsilon, \quad j=\overline{1,R}.
\end{equation} \tag{38} \]
При наличии дополнительной информации из предметной области о форме кривой $Q (x, \psi_*^{ (M_0 )} ) - Q^{**} (x)$ на отрезке $ [x_0 ,x_1 ] \ni x$, позволяющей при известной функции $\omega(\tau)$ в (26), (27) идентифицировать координаты $x_j^0$ и знаки $Q (x_j^0, \psi_*^{(M_0 )} )$, равенства (38), дополненные условиями существования экстремума функции $Q (x, \psi_*^{ (M_0 )} )$ в точках $x_{jg}^0 \in \operatorname{int} [x_0, x_1 ]$, $g=\overline{1, R_1}$, где $R_1 \leqslant R$ и $x_{jg}^0 \in \{ x_j^0 \}$, переводятся в систему уравнений 
\[ \begin{equation} 
\begin{aligned}
& Q (x_j^0, \psi_*^{ (M_0 )} ) - Q^{**} (x_j^0 ) = \pm \varepsilon, \qquad\quad\, j=\overline{1,R};
\\
& \cfrac{\partial}{\partial x} \bigl[Q (x_{jg}^0, \psi_*^{ (M_0 )} ) - Q^{**} (x_{jg}^0 ) \bigr]=0, \quad g=\overline{1,R_1}
\end{aligned}
\end{equation} \tag{39} \]
с однозначно определяемым знаком $\varepsilon$ в каждой точке $x_j^0$, которая разрешается известными численными методами относительно $\psi_i^*$, $i=\overline{1, M_0}$, значений $x_{jg}^0$, $g=\overline{1, R_1}$, а также $\varepsilon_{\min} ^{ (M_0 )}$, если $\varepsilon=\varepsilon_{\min}^{(M_0 )}$ в (37).

Явное выражение для зависимости $Q (x_j^0, \psi_*^{(M_0 )} )$ от своих аргументов в системе уравнений (39) представляется в форме бесконечной или укороченной суммы вида (20) разложения в ряд (11):
\[ \begin{equation*}
Q (x_j^0, \psi_*^{ (M_0 )} )=
\sum\limits_{n=1}^{N_1} \bar{Q}_n (\psi_*^{(M_0 )} ) \varphi_n (\mu_n, x_j^0 ),
\end{equation*} \]
где значения модальных переменных $\bar{Q}_n (\psi_*^{(M_0 )} )$ в конце оптимального процесса находятся в подобном (35) виде [15, 23]:
\[ \begin{equation}
\bar{Q} (\psi_*^{(M_0 )} )= \bigl(\bar{Q}_n (\psi_*^{(M_0)} ) \bigr) =
K (t_1 ) \psi^* (t_1 ) +K_1 (t_1 ) \bar{Q}(0) +D_\omega (t_1 ).
\end{equation} \tag{40} \]

В итоге решение системы уравнений (39) относительно $\psi_*^{(M_0 )}$ определяет, согласно (29), вектор $\psi^* (t_1 )$, подстановка которого в (35) приводит к явной форме описания в оптимальном процессе сопряженных переменных $\psi^* (t)$ и управляющих воздействий $\bar{u}_{Vn}^* (t)$, $u_S^*(t)$ в (24), завершая тем самым решение задачи программного управления в условиях детерминированных воздействий $\omega(\tau)$ вида (27) в (26).

В исходных условиях неопределенности $\omega(\tau)$ далее предлагается итерационная процедура вычисления $F(x,t)$ и $F_1 (t)$ в (6), а следовательно, и $\omega(\tau)$ в (26), (27), по известному начальному приближению.

4. Численный метод решения задачи программного управления

Пусть $F^{(k)} (x,t)$, $F_1^{(k)}(t)$, $k=1, 2, \ldots$, — известные приближения к $F (x,t)$, $F_1(t)$ в (6) на $k$-том шаге итерационной процедуры поиска этих функций при заданных начальных значениях
\[ \begin{equation}
F^{(1)}(x,t)=F_1^{(1)} (t)=0.
\end{equation} \tag{41} \]
Тогда $k$-тое приближение $\bar{u}^{(k)}(t) = \bigl(\bar{u}_{Vn}^{(k)} (t), \, n=\overline{1,N_1}; \,u_S^{(k)} (t)\bigr)$ к оптимальному управлению $\bar{u}^*(t)$ в (24) находится при фиксируемых зависимостях $F^{(k)} (x,t)$, $F_1^{(k)} (t)$ по описанному в разд. 3 алгоритму, определяющему непрерывное отображение 
\[ \begin{equation}
\Lambda :
F^{(k)},\, F_1^{(k)} \to \bar{u}^{(k)} : 
\bar{u}^{(k)}(t)=\Lambda \bigl(F^{(k)}(x,t), F_1^{(k)}(t) \bigr), \quad k=1, 2, \ldots.
\end{equation} \tag{42} \]

Построим $(k+1)$-е приближение $F^{(k+1)}(x,t)$, $F_1^{(k+1)} (t)$ с учетом базовых соотношений (9), (10), позволяющих осуществить переход к линейно квадратичной задаче оптимизации (11), (12), (19), (20):
\[ \begin{equation}
\begin{aligned}
& F^{(k+1)} (x,t) = F^{(k)} (x,t) + \delta F^{(k)} (x,t);\\
& \delta F^{(k)} (x,t) = L \bigl( Q^{(k)}(x,t)\bigr) - L_0 \bigl(Q^{(k)} (x,t)\bigr);
\end{aligned}
\end{equation} \tag{43} \]
\[ \begin{equation}
\begin{aligned}
& F_1^{(k+1)} (t) = F_1^{(k)} (t) + \delta F_1^{(k)} (t);\\
& \delta F_1^{(k)} (t) = L_{10} \bigl( Q^{(k)} (x_1, t )\bigr) - L_1 \bigl(Q^{(k)} (x_1, t )\bigr).
\end{aligned}
\end{equation} \tag{44} \]
Здесь $Q^{(k)} (x,t)$ являются численным или аналитическим решением уравнений соответственно (1)–(3) или (6) при предварительно найденном управлении $\bar{u}^{(k)} (t)$ в (42), описываемым известным отображением $\Phi$: $\bar{u}^{(k)} \to Q^{(k)} (x,t)$ из множества $\bar{u}^{(k)}$:
\[ \begin{equation}
Q^{(k)}(x,t) = Q^{(k)} (x, t, u^{(k)} ) = \Phi (\bar{u^{(k)}} ).
\end{equation} \tag{45} \]

Ограничимся здесь и далее достаточно общим случаем возможности выбора отображения $\Phi ( \bar{u}^{(k)})$, обеспечивающего представление операторов $L$, $L_0$, $L_1$, $L_{10}$ с требуемой точностью в классе непрерывных функций переменных $x$ и $t$ с использованием применительно к нелинейным уравнениям (1)–(3) известных методов численного интегрирования, разностной аппроксимации пространственных производных ${\partial Q^{(k)}}/{\partial x}$, $ {\partial^2 Q^{(k)}}/{\partial x^2}$ и интерполяции сеточных функций на пространственно-временной плоскости при вычислении $L$ и $L_1$.

Рассмотрим далее типичную и наиболее характерную для приложений ситуацию, когда на компактном множестве переменных ($x \in [x_0, x_1]$; $t \in [0, t_1]$) в двумерном евклидовом пространстве $E^2$ операторы $\Lambda$ и $\Phi$ в (42), (45) вместе с $L$, $L_1$, $L_0$, $L_{10}$ являются ограниченными [1]. Ограниченные на этом основании последовательности $ \{F^{(k)} (x,t) \}$, $ \{F_1^{(k)} (t) \}$, $ \{\bar{u}^{(k)} (t) \}$, $\{Q^{(k)} (x,t) \}$, $k=1, 2, \ldots$, содержат в силу теоремы Больцано– Вейерштрасса [1, 26] подпоследовательности, сходящиеся к некоторым пределам, соответственно $\tilde{F}(x,t)$, $\tilde{F}_1 (t)$, $\tilde{\bar{u}} (t)$, $\tilde{Q}(x,t)$, единственность которых устанавливается по указанной в [1] схеме.

Тогда 
\[ \begin{equation*}
\tilde{\bar{u}}(t) = \Lambda \bigl(\tilde{F}(x,t), \tilde{F}_1(t)\bigr); \quad 
\tilde{Q}(x,t) = \Phi\bigl(\tilde{\bar{u}}(t) \bigr);
\end{equation*} \]
и для сходящихся последовательностей $ \{F^{(k)} (x,t) \}$, $ \{F_1^{(k)}(t) \}$ на основании (43), (44) будем иметь, что
\[ \begin{equation*}
\lim_{k\to \infty} \bigl(F^{(k+1)} (x,t) - F^{(k)} (x,t)\bigr)= 
\lim_{k\to \infty} \bigl(\delta F^{(k)} (x,t)\bigr)= \lim_{k\to \infty} \bigl(L ( Q^{(k)} (x,t) ) -L_0 (Q^{(k)} (x,t) ) \bigr)=
L\bigl( \tilde{Q}(x,t) \bigr) - L_0\bigl( \tilde{Q}(x,t) \bigr)=0,
\end{equation*} \]
\[ \begin{equation*}
\lim_{k\to \infty} \bigl(F_1^{(k+1)} (t) - F_1^{(k)} (t)\bigr)= 
\lim_{k\to \infty} \bigl(\delta F_1^{(k)} (t)\bigr)=\lim_{k\to \infty} \bigl(L_{10} ( Q^{(k)} (x_1,t ) ) -L_1 (Q^{(k)} (x_1,t ) ) \bigr)
=L_{10}\bigl( \tilde{Q} (x_1, t ) \bigr) - L_1\bigl( \tilde{Q} (x_1, t ) \bigr)=0,
\end{equation*} \]
и, следовательно,
\[ \begin{equation}
L\bigl(\tilde{Q}(x,t) \bigr) = L_0 \bigl(\tilde{Q}(x, t) \bigr), \quad 
L_1 \bigl(\tilde{Q} (x_1, t )\bigr)=L_{10} \bigl(\tilde{Q} (x_1, t ) \bigr).
\end{equation} \tag{46} \]

Полученные соотношения (46) с учетом (43), (44) означают, что нелинейные уравнения (1)–(3) объекта управления сводятся к линейной модели (6) в линейно-квадратичной задаче оптимизации (11)–(14), (19), (20) при зависимостях $F(x,t)=\tilde{F}(x,t)$, $F_1(t)=\tilde{F}_1(t)$, получаемых вместе с оптимальным программным управлением $\bar{u}^*(t) =\tilde{\bar{u}}(t)$ в сходящемся к $F(x,t)$, $F_1(t)$, $\bar{u}^*(t)$ итерационном процессе вычисления $F^{(k)}$, $F_1^{(k)}$ и $\bar{u}^{(k)}$.

В итоге предлагаемый итерационный алгоритм решения задачи оптимального управления нелинейной моделью ОРП реализуется путем выполнения следующей последовательности вычислительных операций.

  1. На первом шаге при начальном приближении $F^{(1)} (x,t)$, $F_1^{(1)} (t)$, выбираемом согласно (41) (или каким-либо другим способом при наличии дополнительной информации), определяется решение $\bar{u}^{(1)} (t)$ линейно-квадратичной задачи (11)–(14), (19), (20) по алгоритму, описанному в разд. 3.
  2. При найденном управлении $\bar{u}^{(1)}$ находятся аналитическое (в форме (11)) и численное решение соответственно линейной и нелинейной начально-краевых задач (1)–(3) и (6) по алгоритму (45) для $k=1$ с последующим вычислением операторов $L \bigl(Q^{(1)}(x,t) \bigr)$, $L_0 \bigl( Q^{(1)} (x,t)\bigr)$, $L_1\bigl(Q^{(1)} (x_1, t )\bigr)$, $L_{10}\bigl(Q^{(1)} (x_1, t )\bigr)$.
  3. На втором и последующих шагах при $k=2, 3, \ldots$ вычисляются по правилам (43), (44) следующие приближения $F^{(k)} (x,t)$, $F_1^{(k)} (t)$; находятся $\bar{u}^{(k)} (t)$ согласно (42); определяются $Q^{(k)}(x,t)$ по алгоритму (45) и на этом приближении фиксируются значения операторов $L$, $L_0$, $L_1$, $L_{10}$.
  4. Описанная процедура продолжается с возрастанием $k$ до некоторого значения $k^*$, при котором с требуемой точностью соблюдается приближенное равенство
    \[ \begin{equation*}
    F^{(k^* + 1 )} (x,t) \approx F^{(k^*)} (x,t), \quad
    F_1^{(k^* + 1 )} (t) \approx F_1^{(k^*)} (t),
    \end{equation*} \]
    выполнение которого гарантируется в силу сходимости рассматриваемого итерационного процесса.

Таким образом, известная технология численного решения задачи оптимизации нелинейной СРП заменяется более простой итерационной процедурой аналитического решения ряда линейно-квадратичных задач оптимального управления с внешними возмущениями, предварительно опознаваемыми на каждом шаге итерационного процесса, и промежуточными вычислениями управляемой функции состояния нелинейного объекта на его цифровой модели при известных управляющих воздействиях.

Преимуществом подобного подхода является возможность получения алгоритмов оптимального программного управления нелинейной СРП в аналитической форме решения линейно-квадратичной задачи оптимизации.

5. Аналитическое конструирование оптимального регулятора

Перенос граничных условий при $t=t_1$ в произвольный момент времени $t \in (0, t_1 )$ определяет в краевой задаче (25) по описанной в [15] схеме следующие зависимости конечных величин $\psi^* (t_1 )$, $\bar{Q}^* (t_1 )$ векторов сопряженных и управляемых переменных от их текущих значений $\psi^* (t)$, $\bar{Q}^*(t)$ в оптимальном процессе управления:
\[ \begin{equation}
\psi^* (t_1 )=A_{11} (t_1 -t ) \psi^* (t) +A_{12} (t_1 -t ) \bar{Q}^* (t) + D_{\omega 2} (t,t_1 ),
\end{equation} \tag{47} \]
\[ \begin{equation}
\bar{Q}^* (t_1 )=A_{21} (t_1 -t ) \psi^* (t) +A_{22} (t_1 -t ) \bar{Q}^* (t) + D_{\omega 3} (t,t_1 ).
\end{equation} \tag{48} \]
Здесь
\[ \begin{equation}
\begin{aligned}
&D_{\omega 2} (t, t_1 ) = \int _t^{t_1} A_{12} (t_1-\tau ) \bigl(\bar{F}(\tau) + g F_1 (\tau) \bigr) d\tau,
\\
&D_{\omega 3} (t, t_1 ) = \int _t^{t_1} A_{22} (t_1-\tau ) \bigl(\bar{F}(\tau) + g F_1 (\tau) \bigr) d\tau;
\end{aligned}
\end{equation} \tag{49} \]
$A_{ij} (t_1-\tau )$ — блоки матричной экспоненты $e^{A(t_1-\tau )}$ в (28); функции $F(x,t)$, $F_1(t)$ в (6) и вместе с ними $\omega(\tau)$ в (27) считаются уже найденными при предварительном решении задачи программного управления описанным в разд. 4 численным методом.

После умножения слева векторных равенств (47) и (48) соответственно на известные по результатам решения задачи программного управления $(N_1 {\times} N_1)$-матрицы $\operatorname{diag} \bigl[\bar{Q}_j^* (t_1 ) \bigr]$, $\bar{Q}^* (t_1 ) = \bigl( \bar{Q}_j^* (t_1 )\bigr)$, и $\operatorname{diag} \bigl[\psi_j^* (t_1 ) \bigr]$, 
$\psi^* (t_1 ) = \bigl( \psi_j^* (t_1 )\bigr)$, $j=\overline{1,N_1}$ (левые части соотношений (47) и (48)) становятся одинаковыми. Последующее вычитание этих уравнений приводит к следующему результату:
\[ \begin{multline}
\psi^* \bigl(t,\psi^* (t_1 ), \bar{Q}(0), \bar{Q}(t) \bigr) =
T_1 \bigl(t, t_1, \psi^* (t_1), \bar{Q}^* (t_1 ), \bar{Q}(0) \bigr)
T_2 \bigl(t, t_1, \psi^* (t_1), \bar{Q}^* (t_1 ), \bar{Q}(0) \bigr) \bar{Q}(t) + {}
\\
{}

T_1 \bigl(t, t_1, \psi^* (t_1), \bar{Q}^*(t_1), \bar{Q}(0) \bigr)
D_\Sigma \bigl(t, t_1, \psi^* (t_1), \bar{Q}^*(t_1), \bar{Q}(0), \omega(t) \bigr).
\end{multline} \tag{50} \]
Здесь
\[ \begin{equation}
\begin{aligned}
& T_1=\bigl[W_1 A_{11} (t_1 -t) - W_2 A_{21} (t_1 -t)\bigr]^{-1},
\\
& T_2=\bigl[W_2 A_{22} (t_1 -t) - W_1 A_{12} (t_1 -t)\bigr]; 
\\

W_1=\operatorname{diag} \bigl[\bar{Q}_j^* (t_1) \bigr], \quad 
W_2=\operatorname{diag} \bigl[\psi_j^* (t_1) \bigr]; \\
&
D_\Sigma=W_2 D_{\omega 3} - W_1 D_{\omega 2}
\end{aligned}
\end{equation} \tag{51} \]
и конечное состояние объекта $\bar{Q}^* (t_1) =\bar{Q}^* (\psi_*^{(M)} )$ находится в форме (40).

Подстановка (50) в выражения (24) для программного управления приводит к линейным алгоритмам синтеза оптимального регулятора с нестационарными коэффициентами обратных связей в системе управления с полным измерением состояния $\bar{Q}(t)$:
\[ \begin{equation}
\bar{u}_{Vn}^* (\bar{Q}, t ) = \cfrac 12 \bigl(T_1 T_2 \bar{Q}(t) +T_1 D_\Sigma \bigr)_n, 
\quad n=\overline{1, N_1};
\end{equation} \tag{52} \]
\[ \begin{equation}
\begin{aligned}
&
\bar{u}_{V}^* (\bar{Q}, t, x) = \sum \limits_{n=1} ^{N_1} \bar{u}_{Vn}^* (\bar{Q}, t ) \varphi_n (\mu_n, x ),
\\
&
u_{S}^* (\bar{Q}, t ) = \cfrac 1{2\rho_S} g \bigl(T_1 T_2 \bar{Q}(t) +T_1 D_\Sigma \bigr).
\end{aligned}
\end{equation} \tag{53} \]

Матрицы $T_1$ и $T_2$ вместе с $D_\Sigma$ представляются в (52), (53) известными функциями времени (49), (51) с фиксируемыми на протяжении процесса управления значениями $\bar{Q}(0)$, которые находятся по результатам наблюдения $\bar{Q}(t)$ в начальный момент $t=0$. 

Переход в (52), (53) от $\bar{Q}(t)$ к измеряемому выходу объекта $Q_u (x_u, t ) = \bigl( Q (x_{uj}, t)\bigr)$ в $h$ точках $x_{uj} \in [x_0, x_1]$, $j=\overline{1, h}$, определяется, согласно (11), векторно-матричным уравнением неполного наблюдения состояния объекта
\begin{equation}
Q (x_u, t) =S_u \bar{Q}(t), \quad 
S_u = \bigl[\varphi_n (\mu_n, x_{uj} ) \bigr], \quad 
n=\overline{1, N_1}, \; j=\overline{1, h},
\end{equation}
требующим построения наблюдателя полного или пониженного порядка [25]. Если по условиям необходимой точности моделирования объекта (11), (12) можно ограничиться учетом только $M$ первых составляющих $\bar{Q}(t)$ с минимальным их числом, необходимым для решения системы уравнений (39) относительно представляемого в форме (29) вектора $\psi^* (t_1)$, то $\bar{Q}(t)$ непосредственно определяется решением системы уравнений (54) при $h=M$, $N_1=N=M$:
\[ \begin{equation}
\bar{Q}(t) = S_u^{-1} Q_u (x_u, t).
\end{equation} \tag{55} \]

Подстановка (55) в (52), (53) приводит к линейному алгоритму синтеза оптимального регулятора с обратными связями по измеряемому выходу объекта:
\[ \begin{equation*}
\bar{u}_{Vn}^* (Q_u, t ) = \cfrac 12 \bigl(T_1 T_2 S_u^{-1} Q_u (x_u, t ) + T_1 D_\Sigma \bigr)_n, \quad n=\overline{1, N_1};
\end{equation*} \]
\[  \begin{equation*}
\begin{aligned}
& \bar{u}_{V}^* (Q_u, t, x) = \sum \limits_{n=1} ^{N_1} \bar{u}_{Vn}^* (Q_u, t ) \varphi_n (\mu_n, x),
\\
&
u_{S}^* (Q_u, t) = \cfrac 1{2\rho_S} g \bigl(T_1 T_2 S_u^{-1} Q_u (x_u, t ) +T_1 D_\Sigma \bigr).
\end{aligned}
\end{equation*} \]

Заключение

Предложен численный алгоритм решения задачи оптимального программного управления нелинейной системой с распределенными параметрами параболического типа в условиях равномерной оценки целевых множеств, сводимый к специальной итерационной процедуре решения на каждом ее шаге альтернансным методом линейно-квадратичной задачи оптимизации с определенным на предыдущей итерации внешним детерминированным пространственно-временным возмущением, компенсирующим влияние невязки между дифференциальными операторами уравнений линейной и нелинейной моделей объекта. На базе полученных результатов определены уравнения оптимальных регуляторов в форме линейных алгоритмов обратной связи по измеряемому состоянию системы с фиксируемыми предварительным расчетом нестационарными коэффициентами передачи. В отличие от известных численных методов вариаций в пространстве управляющих воздействий предлагаемый подход характеризуется аналитической формой представления искомых алгоритмов программного и позиционного управления.

Конкурирующие интересы. Конкурирующих интересов не имею.
Авторский вклад и ответственность. Я несу полную ответственность за предоставление окончательной версии рукописи в печать. Окончательная версия рукописи мною одобрена.
Финансирование. Исследование выполнено за счет гранта Российского научного фонда № 22–29–00180, https://rscf.ru/project/22-29-00180/, Самарский государственный технический университет.
Благодарность. Автор благодарен рецензенту за тщательное прочтение статьи и ценные предложения и комментарии.

×

About the authors

Edgar Ya. Rapoport

Samara State Technical University

Author for correspondence.
Email: edgar.rapoport@mail.ru
ORCID iD: 0000-0002-0604-8801
SPIN-code: 3642-2773
Scopus Author ID: 7007145205
ResearcherId: D-6111-2014
http://www.mathnet.ru/person38448

Dr. Techn. Sci., Professor; Dept. of Automation and Control in Technical Systems

Russian Federation, 443100, Samara, Molodogvardeyskaya st., 244

References

  1. Vasilev F. P. Metody optimizatsii [Optimization Methods]. Moscow, Faktorial Press, 2002, 824 pp. (In Russian)
  2. Moiseev N. N. Elementy teorii optimal’nykh sistem [Elements of the Theory of Optimal Systems]. Moscow, Nauka, 1975, 526 pp. (In Russian)
  3. Afanas’ev V. N., Kolmanovsky V. B., Nosov V. R. Matematicheskaia teoriia konstruirovaniia sistem upravleniia [Mathematical Theory of Control Systems Design]. Moscow, Vyssh. shk., 1998, 574 с. (In Russian)
  4. Tyatyushkin A. N. Mnogometodnaia tekhnologiia optimizatsii upravliaemykh sistem [Multimethod Technology for Optimization of Control Systems]. Novosibirsk, Nauka, 2006, 343 pp. (In Russian). EDN: QJQNJV
  5. Butkovsky A. G. Metody upravleniia sistemami s raspredelennymi parametrami [Methods of Control by Systems with Distributed Parameters]. Moscow, Nauka, 1975, 564 pp. (In Russian)
  6. Fedorenko R. P. Priblizhennoe reshenie zadach optimal’nogo upravleniia [Approximate Solution of Optimal Control Problems]. Moscow, Nauka, 1978, 488 pp. (In Russian)
  7. Rapoport E. Ya. Optimal’noe upravlenie sistemami s raspredelennymi parametrami [Optimal Control of Systems with Distributed Parameters]. Moscow, Vyssh. shk., 2009, 677 pp. (In Russian). EDN: QMTFRZ
  8. Rapoport E. Ya. Al’ternansnyi metod v prikladnykh zadachakh optimizatsii [Alternance Method in Applied Optimization Problems]. Moscow, Nauka, 2000, 336 pp. (In Russian). EDN: TTRVMB
  9. Rapoport E. Ya., Pleshivceva Yu. E. Metody polubeskonechnoi optimizatsii v prikladnykh zadachakh upravleniia sistemami s raspredelennymi parametrami [Methods of Semi-Infinite Optimization in Applied Problems of Control of Systems with Distributed Parameters]. Moscow, Nauka, 2021, 286 pp. (In Russian). EDN: QADDYA
  10. Rapoport E. Ya. Analytical construction of aggregated controllers in systems with distributed parameters, J. Comput. Syst. Sci. Int., 2012, vol. 51, no. 3, pp. 375–390. EDN: RGNSPF. DOI: https://doi.org/10.1134/S1064230712020104.
  11. Ladyzhenskaya O. A. Kraevye zadachi matematicheskoi fiziki [Boundary Value Problems of Mathematical Physics]. Moscow, Nauka, 1973, 407 pp. (In Russian)
  12. Vladimirov V. S. Uravneniia matematicheskoi fiziki [Equations of Mathematical Physics]. Moscow, Nauka, 1981, 512 pp. (In Russian)
  13. Egorov A. I., Znamenskaya L. N. Vvedenie v teoriiu upravleniia sistemami s raspredelennymi parametrami [Introduction to the Theory of Control Systems with Distributed Parameters]. St. Petersburg, Lan’, 2017, 292 pp. (In Russian). EDN: ZBUMBZ
  14. Polyanin A. D. Spravochnik po lineinym uravneniiam matematicheskoi fiziki [Handbook of Linear Equations of Mathematical Physics]. Moscow, Fizmatlit, 2001, 576 pp. (In Russian). EDN: MVANPN
  15. Rapoport E. Ya. Analytical design of the optimal controllers in linear-quadratic problems of controlling systems with distributed parameters under uniform estimates of target sets, J. Comput. Syst. Sci. Int., 2021, vol. 60, no. 3, pp. 364–378. EDN: BBXAQM. DOI: https://doi.org/10.1134/S1064230721030138.
  16. Koshliakov N. S., Gliner E. B., Smirnov M. M. Uravneniia v chastnykh proizvodnykh matematicheskoi fiziki [Partial Differential Equations of Mathematical Physics]. Moscow, Vyssh. shk., 1970, 712 pp. (In Russian)
  17. Rapoport E. Ya. Strukturnoe modelirovanie ob"ektov i sistem upravleniia s raspredelennymi parametrami [Structural Modeling of Objects and Control Systems with Distributed Parameters]. Moscow, Vyssh. shk., 2003, 302 pp. (In Russian). EDN: QMMNDD
  18. Valeev G. K., Zhautykov O. A. Beskonechnye sistemy differentsial’nykh uravnenii [Infinite Systems of Differential Equations]. Alma-Ata, Nauka, 1974, 415 pp. (In Russian)
  19. Persidsky K. P. On the stability of solutions of a countable system of differential equations, Izv. AN KazSSR. Ser. Mat. Mekh., 1948, no. 2, pp. 2–35 (In Russian).
  20. Koval’ V. A. Spektral’nyi metod analiza i sinteza raspredelennykh upravliaemykh sistem [Spectral Method of Analysis and Synthesis of Distributed Control Systems]. Saratov, Saratov State Techn. Univ., 1997, 192 pp. (In Russian)
  21. Egorov Yu. V. Necessary conditions for optimal control in Banach spaces, Mat. Sb. (N.S.), 1964, vol. 64(106), no. 1, pp. 79–101 (In Russian).
  22. Rapoport E. Ya. Uniform optimization of controlled systems with distributed parameters, Vestn. Samar. Gos. Tekhn. Univ., Ser. Fiz.-Mat. Nauki [J. Samara State Tech. Univ., Ser. Phys. Math. Sci.], 2022, vol. 26, no. 3, pp. 419–445 (In Russian). EDN: WJCOQD. DOI: https://doi.org/10.14498/vsgtu1943.
  23. Pleshivtseva Yu. E., Rapoport E. Yu. Spatiotemporal control of systems with distributed parameters in linear-quadratic optimization problems with uniform estimates of target sets, J. Comput. Syst. Sci. Int., 2022, vol. 61, no. 4, pp. 523–538. DOI: https://doi.org/10.1134/S106423072203011X.
  24. Pleshivtseva Yu. E., Rapoport E. Ya. The successive parameterization method of control actions in boundary value optimal control problems for distributed parameter systems, J. Comput. Syst. Sci. Int., 2009, vol. 48, no. 3, pp. 351–362. EDN: LLQZJH. DOI: https://doi.org/10.1134/S1064230709030034.
  25. Rapoport E. Ya. Analiz i sintez sistem avtomaticheskogo upravleniia s raspredelennymi parametrami [Analysis and Synthesis of Automatic Control Systems with Distributed Parameters]. Moscow, Vyssh. shk., 2005, 292 pp. (In Russian). EDN: QMOYRB
  26. Kudryavtsev L. D. Kurs matematicheskogo analiza [Course ofMathematical Analysis], vol. 1. Moscow, Vyssh. shk., 1988, 712 pp. (In Russian)

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2023 Authors; Samara State Technical University (Compilation, Design, and Layout)

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies