THEORY OF NONPARAMETRIC SYSTEMS. CONTROL - II

A. V. Medvedev; Медведев А. В.

ТЕОРИЯ НЕПАРАМЕТРИЧЕСКИХ СИСТЕМ. УПРАВЛЕНИЕ - II

Авторы: Медведев А.В.¹
Учреждения:
1. Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева
Выпуск: Том 14, № 3 (2013)
Страницы: 85-90
Раздел: Статьи
Статья опубликована: 15.06.2013
URL: https://journals.eco-vector.com/2712-8970/article/view/503697
ID: 503697

Цитировать

Полный текст

Аннотация
Полный текст
Об авторах
Список литературы
Дополнительные файлы
Статистика

Аннотация

Формулируются некоторые новые задачи управления, возникшие на основе анализа реально протекающих процессов. Обсуждается необходимость анализа оптимальных, или близких к ним, параметрических алгоритмов управления с целью их исследования на предмет «грубости» ранее высказанных гипотез, их соответствия реальности или полученных ранее оценок соответствующих параметров моделей и регуляторов. Предлагается путь управления сложными дискретно-непрерывными процессами в диалоговом режиме на основе изменяющихся сцен в трехмерном пространстве, характеризующих поведение управляемого процесса в многомерном пространстве. Рассматриваются некоторые алгоритмы управления и приводятся результаты вычислительных экспериментов.

Ключевые слова

дискретно-непрерывный процесс, прогноз, диалоговая система, дуальное управление, непараметрические алгоритмы управления, адаптивное управление

Полный текст

Традиции теории управления могут быть объединены в два больших направления. Первое из них состоит в выборе параметрической структуры модели исследуемого процесса и синтеза на его основе параметрической же структуры управляющего устройства. Исторически этот путь был пройден от теории аналитического конструирования регуляторов до теории оптимальных систем управления: детерминированных, стохастических, адаптивных и обучающихся. Второе направление составляют многочисленные задачи анализа систем управления, когда структура управляющего устройства каким-то образом найдена или предложена. Типичными являются в последнем случае законы регулирования П, ПИ, ПИД и др. Основная задача этого направления состоит в обеспечении устойчивости замкнутых схем и заданного качества регулирования. Ранее [1] уже обращалось внимание на формулировку задач управления при различных уровнях априорной информации, различной дискретности измеряемых переменных, сложности процесса и др. Конечно же, эти факторы, безусловно, влияют на окончательную формулировку задачи управления. Следует обратить внимание на то, что теория оптимальных систем управления по существу является теорией оптимального управления принятыми моделями управляемых процессов, которые, конечно же, в большей или меньшей степени отличаются от реальных. Отсюда, синтезированные алгоритмы оптимального управления отнюдь таковыми не являются по отношению к реальным процессам. Известны случаи, когда на практике оптимальные алгоритмы управления вообще оказывались неработоспособными. На этом пути возникает необходимость исследования новых задач, возникающих при традиционном взгляде на построение систем управления дискретно-непрерывными процессами. Ниже мы специально остановимся на формулировке этих задач. Исходя из того, что теория оптимального управления и, соответственно, алгоритмы оптимального управления следует считать оптимальными по отношению к принятым моделям, которые, конечно же, в той или иной степени отличаются от реальности. В этой связи возникает крайне важное направление исследований, связанное с компьютерным анализом Теория - в виду практики. Девиз конгрессов ^ЛС Сегодня всему наступает пора, Что бредом казалось вчера. Э. Верхарн оптимальных алгоритмов управления процессами, отличающимися от принятых на стадии синтеза оптимальных алгоритмов. Иными словами, такое исследование направлено на решение вопроса - как будут функционировать системы оптимального управления, если реально протекающий процесс отличается в большей или меньшей мере от того, который был положен в основу синтеза алгоритма оптимального управления. Если же управляемый процесс оказывается слишком сложным, зависящим от большого числа входных и выходных переменных, контролируемых в различные интервалы времени, а в ряде случаев просто неконтролируемых, то может быть предложена иная диалоговая система управления. Она может представлять собой «движущийся» сценарий в трехмерных изменяющихся пространствах, характеризующих поведение процесса в многомерном пространстве. Параметрическое дуальное управление. Ранее была изложена формулировка задачи дуального управления в постановке А. А. Фельдбаума [2]. Приведем систему параметрического дуального управления в постановке Я. З. Цыпкина [3]. Как и ранее, обозначим входную переменную объекта u(t), а выходную - x(t). В этом случае критерий оптимальности в задаче идентификации может быть определен в виде: JM (c) = M [WM (x[t] - F(x[t -1],u[t - 1])c)} . (1) Критерий оптимальности управляющего устройства можно записать в развернутой форме: Jy (b, c) = M {Wy (x*[t] - F(x[t -1], Y (x[t - 1])b)c)} .(2) * где x [t] - задающее воздействие; WM - критерий идентификации, сформированный на основании имеющейся априорной информации; Wy - критерий управления, сформированный на основании имеющейся априорной информации; Y - заданный закон управления. Оценка параметров c[t], b[t] осуществляется на основании метода стохастических аппроксимаций, в основу которого положены рекуррентные вероятностные процедуры оценки параметров в процессе функционирования замкнутой схемы, подробно изложенные в [3]. 86 Математика, механика, информатика Непараметрическая система дуального управления. В условиях непараметрической неопределенности предполагается, что априорной информации недостаточно для определения параметрической модели процесса. Тем не менее, предполагаются известными некоторые качественные свойства, характеризующие поведение объекта. Например, объект обладает взаимно однозначной или неоднозначной характеристикой процесса для безынерционых систем, является линейным или указан тип нелинейности для динамических систем и др. Рассмотрим схему, представленную на рис. 1. Возможно, некоторое отношение к обсуждаемой нами проблеме управления, имеет высказанная Г. Вейлем [5] идея симметрии, зеркальной симметрии. Может быть не случайно лекции, посвященные этой проблеме, прочитанные в Институте высших исследований Принстонского университета Г.Вейль назвал «моей лебединой песней». И далее: «Красота тесно связана с симметрией...ее синоним гармония...». Общая схема непараметрического дуального управления представлена ниже на рис. 2. Рис. 1 Из вышеприведенной схемы видно, что x(t) = A < u(t) > , u(t) = A-1 < x(t) = x*(t) > , (3) где A - неизвестный линейный оператор процесса; А- - оператор, обратный А. Из (3), с учетом, что АА— = I - единичный оператор, можно получить x(t) = AA-1 < x(t) = x*(t) >= x*(t). (4) Таким образом, вид идеального регулятора (□регулятор) может быть представлен в форме (3). Используя уравнение (4), можно, задавая желаемую траекторию x* (t), получить идеальное значение управления u*(t). Однако, ключевая проблема на этом пути состоит в том, что в большинстве случаев построить такую схему невозможно, тем более, что оператор A - неизвестен. Схема, показанная на рис. 1 требует пояснения. С математической точки зрения речь идет о преобразовании (отображении) u eU в x є X , где U и X -линейные векторные пространства, т. е. x = Au . Представление x = AAlx означает преобразование x в самого себя, т. е. U и X изоморфны. В реальности дело обстоит несколько иначе. Как справедливо заметил Н. Виннер: «Мы, математики, нуждаемся лишь в таких недорогих материалах, как бумага, и, быть может, типографская краска.». На самом деле нам приходится иметь дело с реальным объектом (турбина, реактор, плавильная печь и т. п.), а точнее с процессами, которые протекают в этих объектах, а не с оператором. В этой связи, если A для нас объект, то A-возможно назвать антиобъектом. Тогда можно сказать, что рис. 1 иллюстрирует «включение» на входе объекта антиобъекта, т. е. того, что в теории управления называют регулятором или управляющим устройством. Уместно вспомнить, что приставка анти уже встречалась в науке ранее. У Н. А. Власова [4] мы встречаем: «Открытие античастиц - одно из крупнейших открытий физики этого столетия. Оно, в сущности, нашло вторую половину мира.». Рис. 2 Здесь (рис. 2) в результате функционирования замкнутого контура управления происходит уточнение оценки обратного оператора объекта. Пусть линейный динамический процесс описывается разностным уравнением вида: x[t] = ^ amx[t - m] + a0u[t]. (5) где a0, am, m = 1, l - коэффициенты модели. Поступим, в связи с вышеизложенным, несколько «необычным образом». Перепишем уравнение (5) относительно u[t ]: ( і Л u[t ] = aj,1 x[t] -^ amx[t - m] (6) В этом случае выражение (6) играет роль обратного оператора по отношению к оператору А объекта. Вычислительный эксперимент. Для иллюстрации работы «включенного» обратного оператора на входе объекта (рис. 1) приведем следующий пример. При описании объекта была принята существенно нелинейная характеристика (рис. 3). По результатам измерения «входа-выхода» процесса была получена выборка (ui, xi, i = 1,100). Измерение выходной переменной объекта осуществлялось с 5-ти процентной аддитивной помехой. Далее, в соответствии с (4) находилось управляющее воздействие при изменяющихся значениях x (t) и это управление подавалось на вход объекта, который реагировал на входное управление u(t) соответствующими значениями выхода x(t). Результаты эти расчетов иллюстрируются на рис. 4. На вышеприведенных рисунках проиллюстрирован факт включения приближенного обратного оператора на входе объекта и в итоге оказывается, что xt « x* (4). m=1 87 Вестник СибГАУ. № 3(49). 2013 Рис. 3 Рис. 4 Рис. 5 Рис. 6 Рис. 7 Был взят объект, описываемый разностным уравнением третьего порядка, который был разрешен относительно управляющего воздействия, которое составляло содержание регулятора. В случае, если коэффициенты уравнения, описывающего объект, и коэффициенты модели совпадают, то естественно ожидать, что выход объекта, в соответствии с рис. 2, будут совпадать. Мы не будем иллюстрировать этот случай. В случае воздействия помех в канале связи переход объекта из одного состояния в другое иллюстрируется рис. 6. При не совпадающих значениях коэффициентов естественно ожидать, что при использовании разомкнутой системы управления процесс будет расходиться, что и иллюстрирует рис. 6. В последнем случае необходимо, во-первых, уточнять значения коэффициентов, а во-вторых, использовать обратную связь, то есть возвращаемся к схеме рис. 2. Рассмотрим достаточно детально схему локальной системы, представленную на рис. 7, где A - неизвестный оператор объекта; УУ - устройство управления; х(t) - выходная переменная процесса; и(t) -управляющее воздействие; |a(t) - входная контролируемая, но неуправляемая переменная процесса; ra(t) - переменная, характеризующая промежуточное состояние процесса, дающая дополнительную информацию о протекании процесса. Входная переменная X(t) не поддается контролю, |(t) - векторное слу 88 Математика, механика, информатика чайное воздействие, t - непрерывное время, Hц, Hu, Hx , Hю - каналы связи, соответствующие различным переменным, включающие в себя средства контроля, устройства для измерения наблюдаемых переменных, ц, ut, xt, rat - означает наблюдение |a(t), u (t), x(t), ro(t) в дискретное время t. Контроль переменных (x, и, ц, ю) осуществляется через некоторый интервал времени, т. е. xi, ui, ц, юі, i = 1, s - выборка измерений переменных процесса ( ии ю1) (x2 , и2 , ^ ю2 ),..., (xs , Us , Ц s , ®s ),..., s объем выборки, Нц (t), hx (t), hx (t), hw (t) со значком вверху - случайные помехи измерений соответствующих переменных процесса. В этом случае выходные переменные, как и ранее, зависят от входных и ra(t) (дополнительная информация), то есть следующим образом: х(0 = А^(0, |a(t),ra(t),X(t),|(t),t). (7) Обучающая выборка состоит из элементов «вход-ных-выходных» переменных, доступных для измерений, и может быть представлена в виде {xi, ui, ц }, i = 1, s, x = ^ x2,..., xn ), u = (u^ u2,..., uk ), Ц= (Цl, Ц 2,..., Ц m ). Безусловно, управляемый процесс следует отнести к категории сложных, находящихся под воздействием неуправляемых переменных. В частности, на рис. 7 -это вектор X(t). Отсюда, естественно считать, что процесс протекает в некоторой оболочке типа «облако» в многомерном пространстве «входных-выходных» переменных. Для того, чтобы визуализировать, иными словами, обеспечить «видение» управляемого процесса в пространстве «входных-выходных» переменных предлагается использование постоянно развивающегося во времени сценария, характеризующего поведение изменяющегося во времени процесса, иллюстрируемого в трехмерном пространстве изменяющихся координат, определяемых вектором «входных-выходных» переменных. Область нормального протекания исследуемого процесса показана на нижеследующем рисунке в виде точек, а текущее состояние процесса, оцениваемое ЛПР (оператор, диспетчер) - жирной точкой. В компьютерном диалоге возможно эту ситуацию реализовать в варианте «компьютерной игры», доступной для визуализации состояния процесса в многомерном пространстве. Естественно считать, что в случае, если состояние процесса принадлежит соответствующему облаку, то процесс протекает нормально, в случае, если он на границе или вне, то требуется вмешательство ЛПР в ход процесса. Таким образом, управление подобным сложным процессом может быть реализовано в диалоговом режиме. Ясно, что в этом случае возникают некоторые новые задачи, которые будут изложены ниже. Пусть управляемый процесс следует отнести к категории сложных, находящихся под воздействием векторных входных переменных. Отсюда, естествен но считать, что процесс протекает в некоторой оболочке типа «облако» в многомерном пространстве «входных-выходных» переменных. Для того, чтобы визуализировать, иными словами, обеспечить «видение» управляемого процесса в пространстве «вход-ных-выходных» переменных предлагается использование постоянно развивающегося во времени сценария, характеризующего поведение изменяющегося во времени процесса, иллюстрируемого в трехмерном пространстве изменяющихся координат, определяемых вектором «входных-выходных» переменных. Область нормального протекания исследуемого процесса показана на нижеследующем рисунке в виде точек, а текущее состояние процесса, оцениваемое ЛПР (оператор, диспетчер) - жирной точкой. В компьютерном диалоге возможно эту ситуацию реализовать в варианте «компьютерной игры», доступной для визуализации состояния процесса в многомерном пространстве. Естественно считать, что в случае, если состояние процесса принадлежит соответствующему облаку, то процесс протекает нормально, в случае, если он на границе или вне, то требуется вмешательство ЛПР в ход процесса. Таким образом, управление подобным сложным процессом может быть реализовано в диалоговом режиме. Ясно, что в этом случае возникают некоторые новые задачи, которые будут изложены ниже. Итак, предположим, что на вход объекта поступает управляющая переменная u (t) є Rm и неуправляемая, но контролируемая переменная |a(t) є Rk. Выход объекта, как и ранее, обозначим x(t) є Rn. В процессе измерения «входных-выходных» переменных объекта может быть сформирована обучающая выборка |ui, ці , xi, i = 1, s} . Поскольку мы не можем визуализировать эту обучающую выборку в многомерном пространстве, то воспользуемся следующим сценарием. Введем трехмерные пространства, координаты которых представляют собой компоненты u, д и х. Чередование этих компонент показано на нижеследующих рисунках. Точками показаны элементы обучающей выборки {ui, ц, xi, i = 1, s} . Жирная точка иллюстрирует положение текущего состояния управляемого процесса. Суть состоит в следующем: на экране монитора с некоторой заданной скоростью сцены сменяют друг друга (рис. 8, а, затем рис. 8, б и т. д.). При этом мы можем наблюдать, какое положение в многомерном пространстве принимает текущее состояние процесса (жирная точка) по отношению к ранее наблюдаемым «входным-выходным» переменным объекта. Из этого исследователь может сделать вывод о характере течения процесса. Если значения выходной переменной x (жирная точка) расположены внутри элементов обучающей выборки, то ход процесса можно считать удовлетворительным. Если значение x приближается к границе (находится на границе, либо за ее пределами), то необходимо вмешательство в процесс управления ЛПР. 89 Вестник СибГАУ. № 3(49). 2013 а Хг Цт б А , ;У;: & д Jl *л У-': -► v.»i —► в е А* -1 —► tki Рис. 8 Естественно, при разработке такой системы возникают некоторые специальные задачи, в частности, построение модели исследуемого процесса, если принять, что измерения выходной переменной x(t) є Rn или отдельных ее компонент осуществляются через значительные промежутки времени; восстановление «облака» в пространстве «входных-выходных» переменных по имеющейся обучающейся выборке {ui, {, xi, i = 1,5} . На этом пути неизбежно возникнет требование максимального упрощения соответствующих алгоритмов с целью достижения необходимого быстродействия. Таким образом, при движении вышеприведенных сцен и текущего состояния процесса (или его прогноза) можно судить о характере его протекания, а также о необходимости вмешательства в ход процесса в случае необходимости. На фоне традиционно используемых подходов при построении управляющих систем дискретно-непрерывными процессами, которые могут быть, в значительной степени, отнесены к категории параметрических, рассматриваются явно не традиционные направления. Один из них, как уже не однократно обращалось внимание ранее, тесно связан с восстановлением обратного оператора управляемого процесса. Другой путь состоит в разработке, исследовании и практическом применении обучающихся алгоритмов при ши роком использовании компьютерных технологий при управлении сложными процессами.

Об авторах

А. В. Медведев

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева

Email: Saor_medvedev@sibsau.ru
Россия, 660014, Красноярск, просп. им. газ. «Красноярский рабочий», 31

Список литературы

Медведев А. В. К теория непараметрических систем. Управление-I // Вестник СибГАУ. 2013. № 2 (48). С. 57-64.
Фельдбаум А. А. Основы теории оптимальных автоматических систем. М. : Физматгиз, 1963. 552 с.
Цыпкин Я. З. Адаптация и обучение в автоматических системах. М. : Наука, 1968. 320 с.
Власов Н. А. Антивещество. М. : Атомиздат, 1966. 184 с.
Вейль Г. Симметрия. М. : Наука, 1968. 191 с.

Дополнительные файлы

Доп. файлы

Действие

1. JATS XML

Скачать

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация