Two-channel time-optimal control of nonstationary heat conductive process with account for response time of boundary control actions

Cover Page


Cite item

Full Text

Abstract

The task of organization a closed time-optimal control system of linear object with distributed parameters of parabolic type is considered. The object has two lumped internal controls for the power of heat sources excited in the electromagnetic field of an inductor. The proposed method for the synthesis of optimal controllers uses an alternance method for calculating the optimal program controls for each of the control actions. An example of the construction of a quasi-optimal time control system for the process of periodic induction heating of a metal workpiece with constant values of the feedback coefficients calculated for the most characteristic initial spatial distribution is given.

Full Text

Введение

Проблема синтеза замкнутых систем оптимального управления с обратными связями является значительно более сложной, нежели решение задач оптимального программного управления. Классические методы [1–3] построения алгоритмов и систем управления динамическими объектами разработаны применительно к моделям управляемых процессов с одним управляющим воздействием. В связи с этим возникает актуальная задача синтеза управляющих алгоритмов в условиях многоканального управления. Большинство известных результатов относится к синтезу объектов с сосредоточенными параметрами, в то время как задача синтеза применительно к объектам с распределенными параметрами оказывается качественно более сложной главным образом из-за бесконечного порядка объекта управления.

Постановка задачи оптимального управления

В данной работе в качестве объекта управления рассматривается процесс индукционного нагрева металлической заготовки с двумя сосредоточенными управляющими воздействиями u1(t) и u2(t) по мощности внутреннего тепловыделения на обеих поверхностях нагреваемой неограниченной пластины.

Подобная постановка задачи была предложена и рассмотрена в работе [4], где объект описывается в зависимости от пространственной координаты x[0,R] и времени t[0,tкон] решением линейного одномерного неоднородного уравнения теплопроводности следующего вида:

Qx,tdt=a2Qx,tdx2+W1(x)u1(t)+W2(x)u2(t), (1)

Q(x,0)=Q0=const, Q00 (2)

с типовыми граничными условиями для модели объекта (1)–(2) вида

λQ(0,t)x=Qср(t)α1 Q(0,t),   t>0;λQ(R,t)x=Qср(t)α2 Q(R,t),   t>0, (3)

где a – коэффициент температуропроводности нагреваемого материала;

λ – коэффициент теплопроводности;

α1α2 – заданные теплофизические постоянные;

Qср(t) – температура окружающей среды, принимается равной Q0.

Функции пространственного распределения внутренних электромагнитных источников тепла W1(x),W2(x) определяются соотношениями:

W1(ξ,x)=ch2ξxRcos2ξxRsh2ξsin2ξ2ξ; W2(ξ,x)=W1(ξ,Rx), (4)

где ξ – характерный параметр, вычисляемый по формулам:

ξ=R2δ,  δ=2μωσ.

Здесь δ – глубина проникновения тока в металл;

ω – частота питающего тока;

σ – электропроводность нагреваемого материала;

μ - абсолютная магнитная проницаемость [5].

Начальное температурное распределение Q0 согласно (2) принимается равномерным по всему объему пластины.

На предельные значения сосредоточенных управляющих воздействий u1(t),u2(t) накладываются следующие ограничения:

0u1(t)u1max;0u2(t)u2max. (5)

Для дальнейшей постановки задачи управления необходимо определить критерий оптимальности и указать требования к конечному температурному состоянию объекта.

В качестве критерия оптимальности выступает общее время процесса нагрева в виде следующего интегрального функционала качества:

I=0tконdt=tконminu1(t),u2(t), (6)

где tкон – длительность процесса нагрева.

Требование к конечному температурному состоянию в момент tкон окончания процесса управления, как правило, связано с соблюдением допуска на отклонение ε0 конечной температуры Q(x,tкон) от требуемого температурного распределения Q*(x) по толщине пластины Q*(x)=Q*=const>Q0 и может быть записано в виде следующего неравенства [10, 11]:

maxx[0,R]Q(x,tкон)Q*ε0 (7)

для всех x[00,R1].

В рассматриваемой задаче оптимального по быстродействию управления требуется определить такие управляющие воздействия u1*(t),u2*(t), которые подчиняются заданным ограничениям (5) и переводят объект управления (1)–(4) в требуемое конечное состояние (7) за минимально возможное время согласно критерию оптимальности (6).

Алгоритмы оптимального по быстродействию программного управления с двумя сосредоточенными управляющими воздействиями

Применительно к базовому критерию быстродействия оптимальные программные управления u1*(t) и u2*(t) объектом (1)–(4) следует искать в классе релейных функций, попеременно принимающих на промежутке t[0,tкон] только свои предельно допустимые значения в (5) [6–10]. Тем самым u1*(t),u2*(t) определяются априори с точностью до числа N01,N02 и длительностей Δ1i(N01),i=1,N01¯, Δ2i(N02),i=1,N02¯ интервалов постоянства u1*(t),u2*(t) соответственно.

В работе [4] было найдено пространственное распределение температурного состояния Q(x,Δ¯) в конце процесса управления, задаваемое в виде явной зависимости от Δ1i(N01),Δ2i(N02), i=1,2 соответствующими решениями уравнений объекта с фиксированным начальным состоянием Q0 для воздействий u1*(t),u2*(t) в типичном двухинтервальном режиме нагрева при N01=N02=N0=2 (рис. 1):

 

Рис. 1. Оптимальное по быстродействию двухканальное двухинтервальное управление по мощности внутренних источников тепла

 

Q(x,Δ¯)=Q0+n=1 λR2aEnηn2cosηnxR+Bi1ηnsinηnxR××W¯1nu1maxeηn2aR2Δ12(2)eηn2aR2(Δ11(2)+Δ12(2))+W¯2nu2maxeηn2aR2Δ22(2)eηn2aR2(Δ21(2)+Δ22(2)), (8)

где Δ¯=(Δ11(2),Δ12(2),Δ21(2),Δ22(2)); μn2=aR2ηn2 – собственные числа;

ηn, n=1,2, – бесконечно возрастающая последовательность корней уравнения:

tgηn=Bi1+Bi2ηnBi1Bi2ηn,Bi1=α1Rλ,Bi2=α2Rλ;
Bi1,Bi2 – безразмерный критерий Био, характеризующий уровень тепловых потерь с поверхностей пластины в окружающую среду с температурой Qср=Q0 согласно (2);

R – толщина пластины; нормирующие множители En вычисляются по формуле:

 En2=λ2aR1Bi1ηn2ηn+sinηncosηn2ηn+Bi1ηn2+Bi12ηn2(1cos2ηn).

Моды функций (4) W¯1n,W¯2n определяются следующим образом:

W¯1n=0RW1(ξ,x)cosμnxRdx; W¯2n=0RW2(ξ,x)cosμnxRdx.

В условиях N0=2 требуемая величина ε0 в (7) должна удовлетворять требованию [11] ε0:εmin(2)ε0<εmin(1), где εmin(i),i=1,2 – предельно достижимая точность нагрева в классе i-интервальных управляющих воздействий релейной формы.

В таком случае рассматриваемая задача быстродействия сводится при требованиях (7) к задаче полубесконечной оптимизации следующего вида [10, 11]:

IΔ¯=Δ11(2)+Δ12(2)=Δ21(2)+Δ22(2)minΔsi(N0)Ω;Ω=Δsi(2):0<Δsi(2)<; s=1,2; i=1,2, (9)

Φ(Δ¯)=maxx[0,R]Qx,Δ¯Q*ε0,   ε0>0. (10)

Далее будет рассматриваться типовая задача с предельно достижимой в классе двухинтервальных (N0=2) управляющих воздействий релейной формы (рис. 1) абсолютной точностью ε0=εmin(2) [10, 11].

Решение задачи полубесконечной оптимизации (9)–(10) сводится по схеме альтернансного метода [10, 11] к решению системы уравнений, определенной в [4] в соответствии с формой кривой конечного температурного распределения (рис. 3):

 

Рис. 3. Кривая конечного температурного распределения при ε0=εmin(2)

 

Q0,Δ11(2),Δ12(2),Δ21(2),Δ22(2)Q=εmin(2);Qx20,Δ11(2),Δ12(2),Δ21(2),Δ22(2)Q=εmin(2);Qx30,Δ11(2),Δ12(2),Δ21(2),Δ22(2)Q=εmin(2);Qx40,Δ11(2),Δ12(2),Δ21(2),Δ22(2)Q=εmin(2);Qxj0,Δ11(2),Δ12(2),Δ21(2),Δ22(2)x=0,j=2,3,4, (11)

относительно неизвестных значений Δ¯ длительностей интервалов постоянства программного управления u1*(t),u2*(t), величины εmin(2) и координат xj0,j=2,3,4 точек достижения предельно допустимых отклонений Q(x,Δ¯) от Q*.

Синтез системы двухканального управления

Синтез оптимального регулятора по общему методу фазового пространства [10, 12] приводит к вполне реализуемой структуре замкнутой системы с неполным измерением температурного состояния объекта Q(x~j,t)=Qj(t), j=1,k¯ в некоторых k отдельных точках x~j[0,R] пространственной области его распределения и может быть выполнен путем выбора функции переключения hsQ¯, s=1,2 каждого из управляющих воздействий u1*(t),u2*(t) в форме линейной комбинации k сигналов обратных связей по измеряемым величинам Qj, j=1,k¯ с коэффициентами передачи ρsj, зависящими от начального состояния объекта [10]:

hsQ¯=j=1kρsjQj(x~j,tкон)Qj(t), s=1,2; j=1,k¯. (12)

Если теперь принять число k точек контроля управляемой величины в (12) равным числу N01=N02=N02 интервалов оптимального управления для заданного ε0 в (10), т. е. положить

hsQ¯=j=1N0ρsjQj(x~j,tкон)Qj(t), s=1,2; j=1,N0¯, (13)

то условия равенства нулю hsQ¯ в расчетные моменты времени tms, m=1,2,...,N01, s=1,2, переключения оптимальной программы соответственно u1*(t),u2*(t) при s=1 и s=2 выполняются для каждого Q0 в (2) в том случае (см. рис. 1), когда коэффициенты передачи ρsj,s=1,2; j=1,N0¯, опосредованно зависящие от Q0 через значения Qj(tms), являются нетривиальными решениями однородной системы N01 линейных уравнений с N0 неизвестными:

j=1N0ρsjQj(x~j,tкон)Qj(tms)=0, s=1,2; m=1,2,...,N01. (14)

Полагая здесь для определенности ρs1=1 при s=1,2 [10], получим из (14) систему из N01 линейных уравнений относительно N01 неизвестных коэффициентов обратных связей ρsj,j=2,N0¯ для s=1 и s=2.

Значения Δ11(2),Δ12(2),Δ21(2),Δ22(2) длительностей интервалов постоянства u1*(t),u2*(t), а значит, и моменты переключения tms вместе с оптимальной длительностью процесса управления, и величины Qj(x~j,tкон) могут быть найдены при расчете программного оптимального управления по ходу решения задачи альтернансным методом, описанным в [11]. При известных tms значения Qj(tms) находятся по решениям уравнений объекта, отвечающим программному управлению u1*(t),u2*(t). По полученным данным искомые коэффициенты ρsj находятся указанным выше способом из уравнений (14) с заданными элементами ее матрицы Qj(x~j,tкон)Qj(tms),j=1,N0¯.

В случае двухинтервального характера нагрева при N0=2 функции переключения (13) должны быть сформированы по сигналам обратной связи по температурам Q(x~1,t)=Q1, Q(x~2,t)=Q2 в двух точках x~1 и x~2[0,R] по толщине пластины:

h1(Q1,Q2)=ρ11Q*Q(x~1,t)+ρ12Q*Q(x~2,t),h2(Q1,Q2)=ρ21Q*Q(x~1,t)+ρ22Q*Q(x~2,t), (15)

в качестве которых удобно принять точки x~1,x~2 на множестве точек {xj0} в системе уравнений (11), например x~1=0,x~2=x30 (рис. 3), где результирующие значения температур Q(0,tкон)=Q(0,Δs1(2),Δs2(2)) и Q(x30,tкон)=Q(x30,Δs1(2),Δs2(2)), s=1,2 в конце оптимального процесса должны быть равны минимально допустимым величинам Q*εmin(2) согласно [4], что вытекает из альтернансных соотношений [11], независимо от начальной температуры Q0 применительно к рассматриваемому случаю ε0=εmin(2).

Тогда при ρs1=1 для s=1 и s=2 системы уравнений (14) сводятся к одному уравнению относительно ρs2, и функции переключения примут следующий вид:

h1(Q1,Q2)=Q*εmin(2)Q(0,t)+ρ12Q*εmin(2)Q(x30,t),h2(Q1,Q2)=Q*εmin(2)Q(0,t)+ρ22Q*εmin(2)Q(x30,t). (16)

В соответствии с полученными результатами алгоритм оптимального двухканального управления для каждого из управляющих воздействий определяется соотношениями

u1*(Q)=u1max21+signQ*εmin(2)Q(0,t)+ρ12Q*εmin(2)Q(x30,t),u2*(Q)=u2max21+signQ*εmin(2)Q(0,t)+ρ22Q*εmin(2)Q(x30,t) (17)

и реализуется в замкнутой системе управления, построенной по схеме (рис. 2), где коэффициенты передачи ос ро12 и ро22 вычисляются указанным выше способом.

 

Рис. 2. Структурная схема замкнутой системы оптимального по быстродействию управления процессом индукционного нагрева при ε0=εmin(2)

 

Для исходных номинальных данных, отвечающих процессу индукционного нагрева пластины из титанового сплава толщиной 0.2 м перед последующей операцией горячего прессования (ξ=4, λ=14 Вт/(м∙ºС), Q0=20ºС, Q*=960ºС, a=4,34106 м3/с, u1max=300 кВт/м3, u2max=393 кВт/м3, Bi1=0,57, Bi2=0,43), найдены путем решения системы уравнений (11) значения параметров оптимального процесса и коэффициентов обратной связи в (16):

Δ11(2)=1607 с, Δ12(2)=130 с, Δ21(2)=1475 с, Δ22(2)=262 с, x20=0,04 м, x30=0,01 м, x40=0,17 м, εmin(2)=19 °Cρ12=1,26, ρ22=0,07

и отвечающие этим результатам пространственные температурные распределения Q(x,Δ¯)Q* (рис. 3).

Моделирование замкнутой системы проводилось в среде программирования MATLAB/Simulink [14, 15]. При моделировании теплового объекта (1)–(3), (5) с граничными условиями третьего рода использовались методы конечномерного приближения [13], позволяющие представить объект в виде параллельного соединения достаточно большого числа типовых апериодических звеньев (рис. 4) с коэффициентами усиления Fn*(x) и постоянными времени Tn*, которые предварительно вычисляются по следующим выражениям:

k=λR2a; Tn*=R2aηn2;F1n*(x)=1Enηn2W¯1ncosηnxR+Bi1ηnsinηnxR;F2n*(x)=1Enηn2W¯2ncosηnxR+Bi1ηnsinηnxR.

 

Рис. 4. Структура объекта управления в виде параллельного соединения n-числа апериодических звеньев

 

На рис. 5 приведены некоторые результаты компьютерного моделирования процесса управления индукционным нагревом в замкнутой системе оптимального быстродействия, построенной по схеме рис. 2, с алгоритмами управления вида (17) для вышеуказанных значений параметров объекта.

 

Рис. 5. Оптимальный по быстродействию процесс управления нагревом пластины в замкнутой системе: а – температурное поле (1 – Q1(t), 2 – Q2(t)); б – оптимальное управление

 

Уравнения линий переключения для обоих управляющих воздействий на плоскости температур Q1=Q(0,t), Q2=Q(x30,t) вычисляются по значениям Q0,Δs1(2),Qx30,Δs1(2) в момент Δs1(2) переключения u1*(Q),u2*(Q) и записываются в зависимости от начальной температуры Q0 в параметрической форме:

Q1Q0,Δs1(2)(Q0)=Q0+n=1 λR2aEnηn2××W¯1nu1max1eηn2aR2Δs1(2)(Q0)+W¯2nu2max1eηn2aR2Δs1(2)(Q0);Q2Q0,Δs1(2)(Q0)=Q0+n=1 λR2aEnηn2cosηnx30R+Bi1ηnsinηnx30R××W¯1nu1max1eηn2aR2Δs1(2)(Q0)+W¯2nu2max1eηn2aR2Δs1(2)(Q0), (18)

где s=1,2¯.

Выбор функции переключения в форме (16) с постоянными коэффициентами обратной связи ρ11,ρ12,ρ21,ρ22, соответствующими только одному принятому на начальном этапе постановки задачи значению Q0, позволяет провести синтез квазиоптимальной системы управления [10] с заменой линий переключения (18) прямыми на плоскости температур Q1,Q2:

Q*εmin(2)(1+ρ12)Q1ρ12Q2=0,Q*εmin(2)(1+ρ22)Q1ρ22Q2=0. (19)

На рис. 6 изображены линии переключения (18), а также прямые (19) и фазовые траектории системы для принятого значения Q0. Переключения управляющего воздействия в системе управления происходят при этом в точках А, Б пересечения линий (18) с прямыми (19) (фазовая траектория 1, 2, 3 в плоскости Q1,Q2 на рис. 6), а окончание процесса управления фиксируется по моменту достижения равенства Q1=Q2 на втором интервале управления.

 

Рис. 6. Линии переключения и фазовые траектории в системе оптимального по быстродействию управления: 1, 2, 3 - фазовые траектории на первом и втором интервалах для Q0=201',2',3'- фазовые траектории на первом и втором интервалах для Q0=80; 4 - линии переключения (18); 5 - прямые переключения (19)

 

Следует отметить, что процесс в замкнутой системе с алгоритмом управления (17), построенной по схеме рис. 2, остается строго оптимальным по быстродействию с переключением управляющего воздействия на второй интервал в точках пересечения линий (18) с прямыми (19) только при равенстве начальной температуры Q0 ее расчетному значению, для которого находятся коэффициенты ρ11,ρ22 в (19). При отклонениях Q0 от этого значения, принятого в исходных данных для рассматриваемой задачи, конечное температурное распределение будет отличаться от температурного состояния при оптимальном режиме нагрева. В частности, на рис. 6 представлены фазовые траектории процесса нагрева при начальной температуре Q0=80, при которой траектории 1',2' не попадают в точки пересечения линий (18) с прямыми (19) и переключение происходит на прямых 5.

Таким образом, задача синтеза двухканального оптимального по быстродействию управления объектом (1)–(3) с сосредоточенными управляющими воздействиями вида (17) сводится к построению релейной системы автоматического регулирования (схема 2) для каждого из каналов управления с линейными обратными связями по значениям управляемой величины в некоторых точках пространственной области ее распределения, число которых должно быть равно числу интервалов постоянства оптимальных программных управляющих воздействий.

×

About the authors

Natalya A. Il’ina

Samara State Technical University

Author for correspondence.
Email: ilina.natalyaa@yandex.ru

Graduate student

Russian Federation, 244, Molodogvardeyskaya st., Samara, 443100

References

  1. Butkovskiy A.G., Malyy S.A., Andreev Yu.N. Upravlenie nagrevom metalla [Control of Metal Heating]. Moscow, Metallurgy Publ., 1981. 272 p. (In Russian).
  2. Yakovlev V.B. Teoriya avtomaticheskogo upravleniya: Uchebnik dlya vuzov / V.B. Yakovlev, S.Е. Dushin, N.S. Zotov, D.H. Imaev, N.N. Kuzmin. – Moscow: Vyssh. Shkola, 2003. (In Russian).
  3. Pupkov K.A., Faldin N.V., Yegupov N.D. Metody sinteza optimal’nykh system avtomaticheskogo upravleniya. Moscow: MGTU, 2000.
  4. Il’ina N.A. Dvukhkanal’noe optimal’noe po bystrodeystviyu upravlenie protsessom induktsionnogo nagreva s uchetom fazovogo ogranicheniya na maksimal’nuyu temperaturu [Two-channel time-optimal control of induction heating process with maximum temperature constraint] // Vestnik Samarskogo gosudarstvennogo tekhnicheskogo universiteta. Seriya Tekhnicheskiye nauki. 2020. No. 65(2). Pp. 41–58.
  5. Lykov А.В. Teoriya teploprovodnosti [Theory of heat conduction]. Moscow: Vyssh. Shkola, 1967. 600 p. (In Russian).
  6. Rapoport E.Ya. Metody parametricheskoy optimizatsii v zadachakh mnogokanal’nogo upravleniya sistemami s raspredelennymi parametrami [Parametric optimization methods for multichannel control of systems with distributed parameters] // Izvestiya RAN. Teoriya i sistemami upravleniya, 2019. No. 4. Pp. 36–50. (In Russian).
  7. Rapoport E.Ya., Il’ina N.A. Dvukhkanal’noe optimal’noe po bystrodeystviyu upravlenie protsessom nestatsionarnoy teploprovodnosti [Two-channel time-optimal control of the process of nonstationary heat conductivity] // Vestn. Samar. Gos. Tekhn. Un-ta. Ser. Tekhn. Nauki. 2018. No. 1(57). Pp. 7–18. (In Russian).
  8. Pontryagin L.S. Matematicheskaya teoriya optimalnykh protsessov [Mathematical theory of optimal processes] / L.S Pontryagin, V.G. Boltyanskiy, R.V. Gamkrelidze, E.F. Mischenko. Moscow: Nauka, 1969. 384 p. (In Russian).
  9. Rapoport E.Ya., Pleshivtseva Yu.E. Optimal’noe upravlenie temperaturnumi regimami induktsionnogo nagreva [Optimal Control of Induction Heating Processes]. Moscow: Nauka, 2012. 309 р. ISBN 978-5-02-037501-7 (In Russian).
  10. Rapoport E.Ya. Optimal’noe upravlenie sistem s raspredelennymi parametrami [Optimal Control for Systems with Distributed Parameters]. Moscow: Vyssh. Shkola, 2009. 677 p. (In Russian).
  11. Rapoport E.Ya. Al’ternansnyy metod v prikladnykh zadachakh optimizatsii [Alternance Method for Solving Applied Optimization Problems]. Moscow: Nauka, 2000. 336 p. (In Russian).
  12. Feldbaum A.A. Osnovi teorii optimalnikh avtomaticheskikh sistem. Moscow: Nauka, 1966. 623 p.
  13. Rapoport E.Ya. Strukturnoe modelirovanie obektov i sistem upravleniya s raspredelennimi parametrami. Moscow: Vyssh. Shkola, 2003. 299 p.
  14. Dyakonov V.P. MATLAB. Polnuy samouchitel’ [MATLAB.Full tutorial]. Moscow: DMK Press, 2012. 768 p. (In Russian).
  15. Rogachev G.N. Programmnye sredstva analiza i sinteza sistem upravleniya: Konspekt lektsii. Samara: Samar. Gos. Tekhn. Un-t, 2016. 111 p. (In Russian).

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Fig. 1

Download (50KB)
3. Fig. 3

Download (108KB)
4. Fig. 2

Download (81KB)
5. Fig. 4

Download (184KB)
6. Fig. 5

Download (127KB)
7. Fig. 6

Download (114KB)

Copyright (c) 2021 Samara State Technical University

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies