About the control of objects with the memory in a nonparametric uncertainty


Cite item

Full Text

Abstract

We consider the problem of identification and control of stochastic objects with discrete - continuous nature of the process. In this paper, we study more general class of dynamic objects in the future - objects with memory. The characteristic distinguishing feature of these processes is the fact that in the description the difference analogues of differential equations, taken in the classical theory of identification and control, are not used. The similar processes occur in many different kennels control of aerospace technology. For example, when vibration testing spacecraft channel “vibrator-sensor mounted on the spacecraft” can be described by difference equations. In this case, the lack of natural analogy between the equation in continuous time and difference is typical. This feature is the main difference with memory objects from the traditional dynamic processes. It leaves its mark in the modeling and management of such objects, and determines the urgency of the problem. This article discusses theoretical information about nonparametric algorithms of identification and control. Non-parametric model for objects with memory addresses are considered in two embodiments. One of them is closely related with the description of the object as the Duhamel integral. The second way is partial parameterization of the object, that is, to meet the conditions of both parametric and non-parametric uncertainties. The constructing nonparametric algorithms of dual control are based on the idea of A. A. Feldbaum. It states that the input object “on” its inverse counterpart, the language of mathematicians its inverse. Obviously, the description may not be accurate for some reasons, and then the inverse operator can only approximately describe the process in the direction of “exit-entry”. On this basis, both non-parametric models of objects with memory and nonparametric algorithms of dual control are lined up. The learning system of dual control with active accumulation of information is carefully analyzed. The detailed results of the numerical investigation of non-parametric models for multivariate processes with memory, as well as the results of numerical experiments applying the algorithm of nonparametric adaptive dual control are given.

Full Text

Введение. Проблемы моделирования и идентификации сложных промышленных объектов традиционно имеют высокую практическую значимость. В большинстве случаев реальные технологические процессы можно отнести к классу динамических. В частности, такого рода процессы типичны для космической отрасли, например, при изготовлении отдельных узлов и блоков КА и изделий электронной техники (транзисторы, диодные матрицы, микросхемы и др.). Традиционно динамические объекты описываются дифференциальными уравнениями или их разностными аналогами [1; 2], но следует отметить, что такого рода описание объектов с памятью не является единственным. Из-за недостатка априорной информации часто не удается выбрать параметризованную структуру модели исследуемого процесса. В этом случае оказывается эффективным использовать теорию непараметрических систем моделирования и управления [3; 4] . В ряде случаев исследователь находится в условиях, когда априорная информация об исследуемом объекте соответствует одновременно как параметрическому, так и непараметрическому уровням априорной информации [5]. Ранее [6; 7] были рассмотрены некоторые задачи моделирования и идентификации для объектов с памятью. Дальнейшее внимание будет сосредоточено на непараметрических алгоритмах дуального управления [8; 9]. Постановка задачи идентификации. Пусть объект представляет собой динамическую систему и описывается уравнением xt = f(xt-1,xt_2, ..., xt_k,ut), где f(.) - неизвестный функционал; xt - выходная переменная процесса; ut - управляющее воздействие; k - известная «глубина» памяти [8], так или иначе найденная на основании имеющейся априорной информации. Здесь существенным является то, что вид функционала не определен с точностью до параметров. Блок-схема рассматриваемого динамического процесса представлена на рис. 1, где приняты следующие обозначения: xt - выход модели объекта, (t) - непрерывное время, индекс t - дискретное время, hut , hxt - случайные помехи измерений соответствующих переменных процесса, ^(t) - векторная случайная помеха. Контроль переменных осуществляется через интервал времени At. Таким образом, можно получить исходную выборку входных-выходных переменных {xt, ut, i = 1, s}, где s - объем выборки, индекс h у переменных объекта из соображения простоты опущен. Следует отметить, что в данном случае параметрическая структура рассматриваемого процесса нам неизвестна, но можно говорить о частичной параметризации модели исследуемого процесса. Схема, изображенная на рис. 1, является близкой к классической схеме, рассматриваемой в теории управления [10]. Как было замечено ранее, рассмотрение динамического процесса с помощью данной схемы не является единственным, так как одна из переменных процесса, например xt-2, может отсутствовать, а конечное выходное воздействие может зависеть только от переменных xt-1, xt-3 и входного воздействия ut: xt = f (xt_1, xt_3, ut). Таким образом, схема примет вид, изображенный на рис. 2. Непараметрическая идентификация. В настоящее время наиболее развитой является теория параметрических систем, которая предполагает предварительную параметризацию модели [2; 10]. В случае недостатка априорной информации об исследуемом объекте, часто не представляется возможным обоснованно выбрать параметрическую структуру модели. В этом случае исследователь вынужден, обрабатывая имеющиеся выборки входных-выходных переменных, «добывать» дополнительную информацию, которая позволит более обоснованно выбрать параметрическую структуру модели. Рис. 1. Блок-схема моделирования объекта с памятью Рис. 2. Блок-схема моделирования объекта с памятью при фиксированных запаздывающих на соответствующее число тактов выходных переменных В случае, когда априорной информации недостаточно, естественно использовать теорию непараметрической идентификации [11]. Непараметрическая теория, в отличие от предыдущей, предполагает, что известны только качественные характеристики системы. Это позволяет полностью уйти от вопроса определения параметрической структуры объекта. В классическом случае, изображённом на рис. 1, задача идентификации состоит в оценивании класса операторов на основе выборки {xi,ui, i = 1,5}. В случае, когда динамический объект описывается дифференциальным уравнением при последовательной дискретизации, итоговое разностное уравнение будет содержать последовательно все переменные: xt-1, xt-2,..., xt-k. Тогда в качестве непараметрической модели объекта можно использовать модель, в которой все коэффициенты разностного уравнения будут учтены: RS = - У( - Xs (U))2, (5) У x • Ф(^-)Ф( Xs-1 X-1) х Xs (и, Д) = ^---------- -С------------- ----------- У ф(Us и )ф(Xs-1 X-1) х i=1 Cs Cs хф( Xs-2 - Xi-2 ).. .ф( Xs-k ~ Xi-k ) Cs_ Cs хф(Xs-2 ~ Xi_2 )...ф( Xs-k ~ Xi-k ) S i=1 где Xi - измеренное значение выходной переменной; Xs - полученная оценка; Rs - квадратичная ошибка. Также для каждой модели вычисляется относительная ошибка, равная отношению квадратичной ошибки к (1) дисперсии выходной переменной: W = Rs / Ds, (6) Xs (us ) (2) Если для первого случая (рис. 1) выбор непараметрической модели не представляет труда, то какой вид модели следует выбрать для второго случая? При выборе модели для процесса, представленного на рис. 2, мы можем применить модель следующего вида: ^ „w и - и ч xs-1 - х, У Xi • Ф(---- ^ф(^_і ) х j=1_ c_ cs У ф(Us _ и )ф(Xs-1 - Xi-1) х і=і С сг хф( Xs_2--------------------- Xi_2. )ф( Xs_3--- Xi_i_) хф( Xs_2--------------------- Xi_L )ф( Xs_3---- X_i_) где последовательно учтены все запаздывающие на соответствующие число тактов выходные переменные. Но, вообще говоря, динамические процессы могут описываться разностными уравнениями несколько другой природы: Xt = f (Xt:1, Xt_3, ut), и в этом случае модель может быть принята в виде (3), где учтены только выходные переменные, непосредственно от которых зависит выход процесса: - X • ф(--UL)ф(Xs_1-xl_L)Ф( Xs-3 X-3) Xs (Us ) = CCC--------------------- . (3) У Ф(М* Ui )ф( Xs_! X_1 )ф( Xs_3 Xi_3) В моделях (1)-(3) Ф(-) - ядерная колоколообразная функция [12], cs - коэффициент размытости ядра, которые удовлетворяют условиям сходимости [13]. В качестве колоколообразной функции Ф(-) [12] могут быть использованы различные ядра. Параметр размытости cs при наличии обучающей выборки находится из задачи минимизации показателя соответствия выхода объекта и выхода модели, основанного на методе скользящего экзамена, когда в модели (1)-(3) по индексу i исключается k-е наблюдение переменной, предъявляемой для экзамена: s 2 R (Cs) = У( (Uk) _ Xk) = min, k Ф i, (4) k=1 Cs где индекс i фигурирует в формулах (1)-(3). Для оценки полученных моделей была использована квадратичная ошибка: где Ds - дисперсия выходной переменной. Проверим различие двух представленных моделей в ходе численного исследования. Пусть исследуемый объект является динамическим и описывается уравнением вида X(t) = 0,1- X(t _ 1) _ 0,2 • X(t _ 3) + U(t) , (7) где x(t) - выходная переменных процесса; U(t) - входная переменная процесса. Переходная характеристика данного объекта имеет вид, представленный на рис. 3. Пусть входное воздействие имеет вид: u (t) = sin(0,5 • t). Модель объекта, полученная с помощью оценки (3), представлена на рис. 4. В данном эксперименте квадратичная ошибка моделирования равна 0,0089. Как можно увидеть из рис. 4 и значения квадратичной ошибки, полученная модель достаточна качественная и модели вида (3) могут эффективно использоваться при идентификации подобных процессов. На рис. 5 представлены выход объекта и выход модели объекта, полученной с помощью модели (2). Квадратичная ошибка в данном случае равна 0,156. Как видно из полученных графиков, данную модель также можно назвать удовлетворительной, хотя очевидно, что она уступает первой. На рис. 6 представлены выход объекта и модели объекта, полученной при использовании уравнения (3) при уровне помех 7 %. В эксперименте, представленном на рис. 6, квадратичная ошибка моделирования равна 0,07. Из рисунка 6 и значения квадратичной ошибки можно сделать вывод, что с помощью модели (3) можно получить адекватные модели даже при достаточно высоком уровне помех. На рис. 7 представлен выход модели объекта и модель объекта, полученная с помощью модели (2) при уровне помех 7 %. Непараметрическое дуальное управление. Недостаток априорной информации об объекте приводит к необходимости совмещать изучение объекта и управление им. При таком управлении управляющие воздействия носят двойственный характер. Они служат средством изучения, познавания объекта, но также и средством приведения объекта к требуемому состоянию. Такое управление называют дуальным управлением [8]. Дуальное управление было открыто А. А. Фельдбаумом и развито на основе теории статистических решений. Рис. 4. Результаты моделирования объекта с памятью при частично известной параметрической структуре с помощью оценки (3) Рис. 5. Результаты моделирования объекта с памятью при частично известной параметрической структуре с помощью оценки (2) Рис. 6. Результаты моделирования объекта с памятью при частично известной параметрической структуре модели при помехе 7 % с помощью оценки (3) Рис. 7. Результаты моделирования объекта с памятью при помехе 7 % при частично известной параметрической структуре модели с помощью оценки (2) Рис. 8. Схема управления объектом с памятью us (10) . (11) us Пусть объект представляет собой динамическую систему и описывается уравнением xt = f (xt_j, xt_3, ut). Схема управления представлена на рис. 8. Непараметрический алгоритм дуального управления, подробно описанный в [14; 15], имеет вид us+1 = u* + Aus+^ (8) где в □ us сосредоточены «знания» об объекте; Aus+i - «изучающие» поисковые шаги: Aus+1 = «x*+1 _ Xs ). (9) В этом и состоит дуализм алгоритма (8). Составляющая us из^ (8), также как и в случае непараметрической идентификации, представляет собой сложный вопрос. С одной стороны, мы также как и в (2) можем учитывать все переменные до высшего порядка: У ut •ф(х^±1-хС)ф(Хї_]-X_L) х i=i_ £*_ У ф( Xs±1-хс)ф(хї_1-XL±) х ф( Xs_2-X_L) ф( Xs^-X_3-) Cs_ Cs ф( Xs_2------------------------ х_2-) ф( З-3----- х_3 ) где x* - задающее воздействие, либо учитывать только переменные, непосредственно от которых зависит выход объекта: У u • ф(хї±1------ Xi-)Ф(Xs_1-х_1 )Ф(Xs_3-------- X_3) J=1_ сс_ cs У ф( X+1 _ X )Ф( Xs-1 _ X-1 )ф( X_3 _ X_3 ) Проанализируем характер дуализма алгоритма (8). На начальной стадии управления основная роль принадлежит второму слагаемому Aus+1 из формулы (8). Это случай активного накопления информации в системе дуального управления, который начинается с появления первого наблюдения входной и выходной переменных объекта. По мере процесса обучения (накопления информации) всё возрастающую роль при формировании управляющего воздействия us+1 начинает □ играть первое слагаемое, т. е. u*. Таким образом, в процессе дуального управления объектом фигурируют как этап изучения объекта, так и этап приведения его к цели. Исследуем различие между двумя подходами в ходе численного эксперимента. Пусть исследуемый объект является динамическим и описывается уравнением вида X(t) = 0,4 • X(t _ 1) _ 0,3 • X(t _ 3) + u (t) , (12) где X(t) - выходная переменных процесса; u(t) входная переменная процесса. Переходная характеристика данного процесса представлена на рис. 9. Пусть входное воздействие имеет вид u(t) = sin(0,5 • t), а управляющее воздействие, поступающее на вход объекта с управляющего устройства, * описывается уравнением (8), где us равно (11). Пусть задание имеет вид ступенчатой функции. В таком случае результат управления имеет вид, представленный на рис. 10. На рис. 11 представлены результаты управления при помехе 5 %. На рис. 10 квадратичная ошибка управления равна 0,072, на рис. 11 - 0,13. Сравним полученные результаты со случаем, когда us* будет равно (10) (рис. 12). Квадратичная ошибка управления для случая, представленного на рис. 11, равна 0,15. Как мы можем заметить, также как и в случае непараметрической идентификации, непараметрическое управление оказывается намного эффективней, тогда как в формуле управляющего воздействия, поступающего на объект, учитываются только переменные, которые формируют выходное воздействие. Рассмотрим работу непараметрического дуального алгоритма управления подробнее. Обучение управлению начинается с первой диады наблюдений. На начальной стадии управления необходимо некоторое время (накопление выборки) для приведения объекта в заданное состояние, но уже на следующих этапах работы алгоритм почти мгновенно достигает задания. На рис. 13 подробно представлено поведение слагаемых алгоритма дуального управления. На рис. 14 показано, как ведет себя алгоритм при случайном задании. Видно хорошее качество управления с помощью непараметрического регулятора даже при таком «экзотическом» варианте, когда задание носит случайный характер. С подобной задачей не справится ни один из известных регуляторов. На практике такой вариант задающего воздействия не встречается, однако это представляет интерес с теоретической точки зрения. Непараметрическая идентификация на основе интеграла Дюамеля. Пусть объект описывается линейным дифференциальным уравнением неизвестного порядка. В этом случае при нулевых начальных условиях X(t) [5] находится как t X (t) = I h (t _ T) u (T) dT, (13) 0 где h(t _ t) весовая функция системы, является производной переходной функции k(t), т. е. h(t) = к'(t). Известно, что обратным оператором (13) является оператор [5] t u (t) = |ѵ( t _ т) X ( t ) d t , (14) 0 (16) 1 Hcs t - t: где v(t - т) - весовая функция объекта в направлении «выход-вход» и v(t) = ra'(t), где a>(t) - переходная функция системы в том же направлении. В этом случае A представлен оператором (13), а A-1 - выражением (14). Следовательно, теперь проблема состоит в отыскании весовых функций h(t), v(t). Один из возможных путей решения этого вопроса состоит в снятии переходной характеристики на реальном объекте с последующей оценкой его весовой функции по результатам измерений {хг- = kt, tt,i = 1, s}. Непараметрическая модель (13) будет иметь вид t xs (t) = J hs (t - т, ks, ts) u (т) dт, (15) 0 где ks, ts - временные векторы: ks = (k1, ..., ks), ts = (tj, ..., ts); hs (•) равна hs(t) где H (•) - колоколообразные (ядерные) функции [12], cs - параметр размытости, удовлетворяющие некоторым условиям сходимости [13]. Предлагается переходную функцию v(t) получить на модели в направлении «выход-вход», т. е. «вспять». Таким образом, из соотношения t xs (t) = 1(t) = J hs (t - т, ks, ts) u (т) dт (17) 0 можно получить выборки {ui, tt, i = 1, s} . Пусть исследуемый объект является динамическим и описывается уравнением вида: x(t) = 0,9 • x(t - 1) - 0,25 • x(t - 3) + 0,19u(t). (18) Переходная характеристика данного процесса представлена на рис. 15. Пусть входное воздействие имеет вид u (t) = sin(0,5 • t). Модель объекта получена при использовании уравнения (15) (рис. 16). Рис. 9. Переходная характеристика процесса (12) Рис. 10. Результат управления при частично известной параметрической структуре при входном воздействии, описанном уравнением (11) Рис. 11. Результат управления при частично известной параметрической структуре, при помехе 5 % Рис. 12. Результат управления при неизвестной параметрической структуре Рис. 13. Поведение составляющих управляющего воздействия Рис. 14. Результаты управления при случайном задании Рис. 16. Результаты моделирования объекта с памятью при использовании интеграла Дюамеля Непараметрическое управление на основе интеграла Дюамеля. В условиях непараметрической неопределённости [15] уравнение процесса с точностью до вектора параметров неизвестно, но известны свойства объекта качественного характера, например, однозначность характеристик или неоднозначность для безынерционных процессов; линейность или тип нелинейности для динамических. Если вид уравнения, описывающего процесс, неизвестен, то известные параметрические методы теории управления не применимы для решения задач идентификации и управления. Введем оператор объекта A, описывающий процесс, т. е. х (t) = A < u (t) >, (19) где u (t) - управляющие воздействие; х(t) - выходная переменная объекта. Если существует оператор, обратный A, т. е. А~\ А-1 А = 1 - единичный оператор, то А-Іх(t) = А-1A < u (t) >, u (t) = A-1 х(t) . (20) Таким образом, учитывая, что выход объекта может описываться оценкой (15), непараметрический алгоритм управления линейной динамической системой примет вид us (t) = юs (0)х (t) + 1 t t / T + fy юФ ' t - T, - t, х ( t ) d t , (21) где х (t) - задающее воздействие. Ясно, что объемы выборок при определении переходных характеристик на реальном объекте и на модели могут не совпадать. Фрагмент работы алгоритма (18) представлен ниже. Пусть исследуемый объект является динамическим и описывается уравнением вида х(t) = 0,9 • х(t - 1) - 0,25 • х(t - 3) + 0,19u (t), (22) где х^) - выходная переменных процесса; u (t) - входная переменная процесса. Переходная характеристика данного процесса представлена на рис. 17. Пусть входное воздействие имеет вид u (t) = sin(0,5 • t), а задающие воздействие - ступенчатой функции (рис. 18). Пусть задание имеет вид траектории u(t) = sin(0,5 • t) (рис. 19). Рис. 17. Переходная характеристика процесса (22) Рис. 18. Результат управления при применении алгоритма, основанного на интеграле Дюамеля Рис. 19. Результаты управления Заключение. Подводя итог настоящей статьи, следует заметить, что рассматривается очень важная с практической точки зрения задача идентификации в замкнутом контуре для дискретно-непрерывных процессов в условиях непараметрической неопределенности. Одним из основных преимуществ непараметрической теории идентификации и управления по сравнению с доминирующей на сегодняшней день параметрической теорией является тот факт, что первая более применима к задачам практики, так как способна работать в условиях малой информации об объекте. Данные условия характерны для задач моделирования и идентификации в разных отраслях промышленности, в том числе и аэрокосмической индустрии. Актуальность рассмотренной задачи обусловлена тем, уравнение, описывающие динамичесский процесс, не имеет вид разностного аналога дифференциального уравнения. В этом случае исследование процесса построения модели представляет специальный самостоятельный процесс. В статье приводятся непараметрические модели для многомерных дискретно-непрерывных процессов, достаточно подробно изложены результаты численного исследования.
×

About the authors

Anastasia Vladimirovna Bannikova

Siberian Federal University

Email: stasy144@yandex.ru
postgraduate student of Institute of Space and Information Technologies 79, Svobodnyi Av., Krasnoyarsk, 660041, Russian Federation

Alexander Vasiljevich Medvedev

Siberian State Aerospace University named after аcademician M. F. Reshetnev

Email: stasy144@yandex.ru
Dr. Sc., Professor of Systems analysis and operations research department 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660014, Russian Federation

References

  1. Цыпкин Я. З. Адаптация и обучение в автоматических системах. М. : Наука, 1968. 400 с.
  2. Эйкхофф П. Основы идентификации систем управления. М. : Мир, 1975. 683 с.
  3. Медведев А. В. Теория непараметрических систем. Моделирование // Вестник СибГАУ. 2010. № 4 (30). С. 4-9.
  4. Медведев, А. В. Теория непараметрических систем. Общий подход // Вестник СибГАУ. 2008. № 3(20). С. 65-68.
  5. Медведев А. В. Непараметрические системы адаптации. Новосибирск : Наука, 1983. 174 с.
  6. Банникова А. В., Сергеева Н. А. О непараметрическом моделировании стохастических объектов с памятью // Вестник СибГАУ. № 2 (54). 2014. С. 6-10.
  7. О непараметрическом управлении стохастическими объектами с памятью / А. В. Банникова [и др.] / Вестник СибГАУ. № 3 (55). 2014. С. 28-35.
  8. Фельдбаум А. А. Основы теории оптимальных автоматических систем. М. : Физматгиз, 1963. 552 с.
  9. Медведев А. В. Теория непараметрических систем. Управление-I // Вестник СибГАУ. 2013. № 2 (48). С. 57-63.
  10. Цыпкин Я. З. Информационная теория идентификации. М. : Наука. Физматлит, 1995. 336 с.
  11. Медведев А. В. Теория непараметрических систем. Активные процессы - I / Вестник СибГАУ. 2011. № 4 (37). С. 52-57.
  12. Eddy W. F. Optimum kernel estimators of the mode // Ann. Math. Statist. 1980. Vol. 8. P. 870-882.
  13. Надарая Э. А. Непараметрические оценки плотности вероятности и кривой регрессии. Тбилиси : Изд. Тбилис. ун-та, 1983. 194 с.
  14. Медведев А. В. Теория непараметрических систем. Управление-II // Вестник СибГАУ. 2013. № 3 (49). С. 85-90.
  15. Medvedev A. V. Optimization Techniques IFIP Technical Conference (july 1-7, 1974, Novosibirsk). Springer-Verlag. Р. 48-55.

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2014 Bannikova A.V., Medvedev A.V.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies