TO THE PROBLEM OF GENERATION SAMPLE IN SOLVING THE PROBLEM OF NON INTERIAL PROCESSES IDENTIFICATION


Cite item

Full Text

Abstract

The problem of improving the quality of the original data in the identification of H-processes is considered. There is stochastic dependence between input variables of such processes so this process precedes not at all the regulated area but only at some of its subdomain. This fact leads to some features that must be considered when identifying. If there is large number of a priori data when building models, you can use the methods of identification in the “broad” sense. However, if there is sufficient a priori information about the object being studied, it is necessary to apply the methods of identification in the “narrow” sense. These methods include nonparametric estimation of regression function from observations. The quality of solving the problem of identification depends on the quality of input data. It is advisable to conduct a preliminary analysis of data to identify and address all the deficiencies in the sample. Under the preliminary analysis of the data is taken to mean filling gaps in observations and eliminating emissions. However, the sample may have other flaws, that will be discussed below, which adversely affect the accuracy of estimation, and, in some cases, lead to the fact that the resulting model will be inadequate to the investigated process. If the point of the original sample in the field of process located patchy, there are low-pressure range and lack of observations, in the areas of reconstruction accuracy is low. Due to the properties of nonparametric estimation, which belongs to the class of local approximations, projections can not be given at the lack of observations subdomain. To resolve all these shortcomings we propose an algorithm to obtain a working sample by generating new points in regions where the density is low in comparison with other areas. After generating new working sample, the quality of estimation is significantly improved, as evidenced by the results of numerical experiments. This kind of tasks are relevant and can be used in solving the problem of recognition in various fields, where the classification accuracy is important, for example, in the diagnosis of space propulsion, electrical, etc.

Full Text

Введение. Проблема идентификации статических систем с запаздыванием остается актуальной в настоящее время в связи с тем, что во многих технологических процессах основной показатель измеряется с большой дискретностью, причем дискретность может значительно превышать постоянную времени объекта. Другими словами, значение показателя может быть получено после того, как процесс уже закончился. Таким образом, данный показатель невозможно использовать при непосредственном управлении процессом, поэтому управление приходится осуществлять по косвенным показателям, измерения которых доступны, например, электрическими средствами. Это приводит к тому, что динамический объект часто следует рассматривать как статический или безынерционный с запаздыванием. Подобная ситуация типична для многих дискретно-непрерывных процессов металлургии, нефтепереработки, а также космической отрасли, в частности, при изготовлении и диагностике ракетных двигателей, изделий электронной техники (ИЭТ). Так, космический аппарат может содержать более 100 тыс. ИЭТ. При идентификации безынерционных объектов с запаздыванием часто возникает ситуация, когда компоненты вектора входных переменных стохастически зависимы, причем характер этой зависимости неизвестен. Это приводит к тому, что в гиперкубе, определяемом диапазонами изменения входных-выходных переменных объекта, реальный процесс имеет «трубчатую» структуру, т. е. является Н-процессом. При идентификации подобных объектов целесообразно использовать алгоритмы из класса локальных аппроксимаций. В этом случае важная роль принадлежит распределению элементов выборки в гиперкубе, которые часто обладают некоторыми особенностями, в частности, наличием подобластей, представляющих собой «сгущения» и «разрежения». Настоящая работа посвящена ослаблению влияния этих особенностей на решение задач идентификации. Постановка задачи. Задача идентификации состоит в построении оптимальной модели исследуемого объекта на основе всей доступной априорной информации [1; 2]. Однако прежде чем перейти к решению задачи идентификации, имеет смысл провести предварительный анализ данных для улучшения их качества. Рассмотрим общую схему исследуемого процесса (рис. 1). На рис. 1 приняты следующие обозначения: x(t)ÎW(x)ÌR1 - выходная переменная процесса, u(t)ÎW(u)ÌRm - векторное входное воздействие, x(t) - векторное случайное воздействие, Gui, , Gx - каналы связи для входных и выходных переменных. В каналах связи действуют случайные помехи gui(t), , gx(t) с нулевым математическим ожиданием и ограниченной дисперсией. Получая измерения входных и выходных переменных, имеем выборку наблюдений . По этой выборке необходимо получить модель изучаемого процесса. Особенность рассматриваемых процессов состоит в том, что между входными переменными существует стохастическая зависимость. Такого рода процессы будем называть «трубчатыми» или Н-процессами [3; 4]. Н-процессы. Из соображений простоты рассмотрим трехмерный объект: u1ÎW(u1)ÌR1, u2ÎW(u2)ÌR1, xÎW(x)ÌR1 (рис. 2). Входные переменные процесса связаны стохастической зависимостью, вид которой исследователю неизвестен. Интервалы изменения входных-выходных переменных (u1, u2, x) Î R3 всегда известны из технологического регламента, технических условий или из требований ГОСТ. Без нарушения общности выделим в R3 единичный куб. На рис. 2 куб - это область, ограниченная интервалами измерения переменных, область возможных значений согласно требованиям. Реально протекающий процесс же принадлежит подобласти WH(u1, u2, x)Î W(u1, u2, x), которая никогда не известна. Таким образом, u1Î[0;1], u2Î[0;1], xÎ[0;1], а триада (u1, u2, x)Î WH (u1, u2, x). Ясно, что каждое значение триады (u1, u2, x), полученной в эксперименте или измеренной на реальном процессе, будет принадлежать единичному кубу W(u1, u2, x). Следует отметить, что в теории идентификации области W(u1, u2, x), W(u1, u2), W(u1), W(u2), W(x) всегда известны, а область WH(u1, u2, x) не известна никогда. В случае стохастической независимости входных переменных процесса WH(u1, u2, x) совпадает с W(u1, u2, x), т. е. WH (u1, u2, x) = = W(u1, u2, x). Исходная выборка, полученная при измерении входных и выходных переменных, принадлежит области WH(u1, u2, x). Однако при управлении или получении прогноза для такого рода процессов необходимо задавать значения входных переменных, которые будут принадлежать области WH(u1, u2). Вид этой области WH(u1, u2), а также какие из компонент вектора входа являются зависимыми, а какие свободными - это априорно исследователю неизвестно, но должно быть учтено при идентификации. Рис. 1. Общая схема исследуемого процесса Рис. 2. Общая схема «трубчатого» процесса Идентификация в узком и широком смысле. Рассмотрим методы решения задачи идентификации. При идентификации в узком смысле делается предположение о виде математической модели с точностью до параметров. В этом случае необходим большой объем сведений об объекте, которым в большинстве случаев исследователь не располагает. Затем на основании матрицы наблюдений оцениваются параметры модели. Очевидно, что ошибка при выборе структуры в самом начале может привести к неадекватной модели, которую невозможно использовать в дальнейшем в целях получения прогноза желаемых характеристик или в задачах управления. При решении практических задач, идентификации производственных процессов исследователю известен лишь набор характеристик, влияющих на процесс, но каким образом связаны входные и выходные переменные, какие переменные являются существенными, а какие можно опустить - все это остается неизвестным. Исследователь располагает лишь матрицей наблюдений входных и выходных переменных, описанием переменных и качественными сведениями о процессе (однозначный или неоднозначный, динамический или статический и т. д.). В этом случае целесообразно использовать методы идентификации в широком смысле. В качестве такой модели может быть использована непараметрическая оценка функции регрессии по наблюдениям Надарая-Ватсона [5; 6]. Рассмотрим объект (рис. 1), имеющий m входных переменных u = u1,u2, …, um и одну выходную переменную x. Измеряя входные-выходные переменные, получим выборку наблюдений случайных величин x, u, распределенных с неизвестными плотностями вероятности p(x,u), p(u) > 0 "u Î W(u). Для восстановления используются непараметрические оценки [5; 6]: (1) где - ядерная колоколообразная функция и коэффициент размытости ядра cs удовлетворяют следующим условиям [5; 6]: (2) В качестве колоколообразной функции Ф(z), могут быть использованы ядерные функции. Ядерная функция - это непрерывная ограниченная симметричная вещественная функция с единичным интегралом [7]. Рассмотрим в качестве ядерной функции параболическое ядро (ядро Епанечникова): (3) Для получения прогноза выхода объекта в точке необходимо по определенному правилу усреднить значения выхода для всех соседних точек выборки. Качество восстановления непараметрической оценки функции регрессии напрямую зависит от равномерности распределения точек в исходной выборке. Недостатки в исходной выборке наблюдений. Для повышения точности решения задачи идентификации предлагается проводить предварительный анализ данных (устранение пробелов и выбросов) [8]. На сегодняшний день широко развиты параметрические методы заполнения пропусков, основанные на гипотезе о нормальном распределении выборки [9]. При решении реальных задач возникает проблема улучшения качества данных [10]. В космической отрасли, при проектировании ракет и летательных аппаратов, вопрос качества данных стоит наиболее остро. Игнорирование проблемы недостатков в исходных данных приводит к масштабным катастрофам, например, падение космического шаттла Challenger или ошибка, которая привела к тому, что иранский самолет Airbus был сбит ракетным крейсером USS Vincennes. Естественно, что причиной тому послужил ряд факторов, но некоторые авторы обращают внимание на очевидные проблемы в качестве данных [11]. Проблема качества возникает не только при решении задачи идентификации, но также при диагностике [12-15]. Кроме того, точки в исходной выборке могут располагаться неравномерно - существуют места разреженности и пропусков (рис. 3). Для простоты рассуждения и иллюстрации рассмотрим «трубчатый» объект, имеющий две входные переменные и одну выходную (рис. 2). Поле корреляции такого объекта может иметь вид, представленный на рис. 4. Как видно из рис. 4, выборка расположена неравномерно. Исходная выборка имеет изъяны - области разреженности и отсутствия наблюдений. В местах разреженности непараметрическая оценка будет давать неточный результат, т. е. прогноз в таких областях будет иметь малую точность. Этот факт связан с тем, что при рассмотрении точек из этих областей под колокол ядерной функции (3) при восстановлении оценки (2) будет попадать малое число точек. В областях отсутствия наблюдений или пропуска процесс существует. Если же необходимо получить значение прогноза в таких областях, то в результате восстановления непараметрической оценки получится неопределенность, так как под колокол не попадет ни одной точки. Для улучшения качества восстановления, получения адекватных оценок предлагается алгоритм, который позволит генерировать новые точки в областях разреженности и пропусков. Сгенерированные точки и исходная выборка будет представлять собой рабочую выборку, которую в дальнейшем будем использовать при восстановлении оценки (1). Рис. 3. Поле корреляции по входным переменным u1, u2 Алгоритм генерации рабочей выборки: 1. По исходной выборке вычисляем с помощью скользящего экзамена величину параметра размытости ядра cs. 2. Для каждой точки выборки считаем число точек ri, которое попадает под колокол с радиусом cs. Находим среднее число точек под колоколом rср. 3. Находим начальную точку u0 с минимальными значениями по каждой переменной. Данная точка будет начальным центром масс . 4. Находим точки выборки , которые попадут под колокол с центром в точке . Все найденные точки исключаем из выборки , получаем выборку . 5. Для полученных точек находим координаты центра масс. 6. Если координаты точки центра масс на текущей и предыдущей итерации совпадают, то переходим к шагу 7. Если не совпадают, то повторяем шаги 4, 5. 7. Находим для текущего центра ближайшую точку из выборки , т. е. точку, расстояние до которой минимально. 8. Относительно найденной точки проделываем шаги 4, 5. Полученный центр масс обозначим u¢. 9. Имеем два центра масс , u¢. Вычисляем евклидово расстояние d между этими точками: (4) 10. Вычислим коэффициент k: 11. Между точками , u¢ генерируем n точек, где 12. Если в выборке присутствуют точки, т. е. , то переходим к шагу 4, где в качестве точки берем точку u¢. Если , то поиск закончен, все пропуски заполнены. Вычислительный эксперимент. Для простоты иллюстрации и рассуждения рассмотрим Н-процесс, имеющий две входные переменные и выходную переменную x. Входные переменные распределены в интервале [0;3] и связаны следующей стохастической зависимостью: , (5) где f - случайная величина, распределенная по равномерному закону с нулевым математическим ожиданием. Математическое описание выхода объекта имеет следующий вид: , (6) где x - случайная величина, распределенная по равномерному закону с нулевым математическим ожиданием. Вид зависимости (5) и (6) задан лишь для получения исходной выборки, проведения экспериментов. В дальнейшем знание о структуре зависимости не используется. В качестве модели примем непараметрическую оценку (1). О качестве моделирования будем судить по относительной ошибке аппроксимации: (7) где - выход объекта (6); - выход модели (1). В качестве исходной выборки было взято 200 точек: . Поле корреляции по входным переменным имеет вид, представленный на рис. 3. По исходной выборке была вычислена ошибка (7): . Затем с помощью предложенного алгоритма было сгенерировано 40 точек. Таким образом, новая рабочая выборка имеет объем 240 точек (рис. 4, где крестиками показаны сгенерированные точки). Как видно из рис. 4, места разреженности и пропусков заполнены. Точки новой выборки расположены однородно, вследствие чего качество восстановления должно значительно улучшиться. В точках исходной выборки была восстановлена оценка (1), где в качестве обучающей выборки была использована рабочая выборка. В этом случае оценка уменьшилась почти в 3 раза и составила . Можно сделать вывод, что генерация новых точек в областях разреженности и пропусков приводит к увеличению точности построенной модели. Восстановления непараметрической оценки на границе. Данный алгоритм основан на генерации новых точек. Данные точки используются лишь при восстановлении оценки выхода модели в реальных точках исходной выборки. Эту идею можно использовать при вычислении прогноза выхода объекта, если стохастическая зависимость между входными переменными отсутствует: 1. По исходной выборке вычисляем с помощью скользящего экзамена величину параметра размытости ядра cs. 2. Для каждой точки выборки находим число точек rср, которое попадает под колокол с радиусом cs. 3. Из основной выборки выбираем 30 % точек с наибольшим числом точек под колоколом: ri(u¢,x¢) < rср(u¢, x¢). 4. Для точек выборки вычисляем rср. 5. Для всех точек выборки проверяем условие: ri < rср. Если условие выполняется, то генерируем k точек в cs окрестности точки i, где k = = rср - ri. 6. Для всех сгенерированных точек вычисляем выход модели по непараметрической оценке функции регрессии. Таким образом, будем генерировать точки в окрестности тех точек, которые имеют меньшее по сравнению с остальными точками выборки число соседей. Под это определение попадают точки, которые находятся на границе. Генерация новых точек осуществляется для использования их при восстановлении непараметрической оценки (1). При использовании новой рабочей выборки автоматически происходит улучшение оценки на границе. Вычислительный эксперимент. Рассмотрим результаты численных экспериментов. В качестве математического описания объекта примем формулу (6). Объект имеет 2 входные переменные и одну выходную, значения входных переменных распределены в интервале [0;3]. В данном случае входные переменные не связаны между собой. Таким образом, имеется выборка . Исходная выборка описывает поведение объекта, при построении моделей реальных процессов данная выборка может быть получена путем измерения значений входных и выходных переменных процесса. Поле корреляции по входным переменным будет иметь вид, представленный на рис. 5. В данном случае точки выборки расположены неоднородно, качество восстановления оценки регрессии будет низкое не только в граничных точках, но и в местах разреженности. По выборке восстановим непараметрическую оценку регрессии (1). Относительная ошибка восстановления по исходной выборке до генерации новых точек составила . Для данного двумерного случая область значения входных переменных W(u1, u2) представляет собой прямоугольник, стороны которого нам известны из области значения переменных u1 и u2. Прямоугольник - регламентированная область протекания процесса. Однако сами граничные точки могут и не принадлежать сторонам данного прямоугольника. Граничными точками будут являться те, которые находятся на минимальном расстоянии от сторон данного прямоугольника. Для улучшения восстановления оценки на границе нет необходимости специально выделять граничные точки, так как генерация происходит в тех областях, где при восстановлении непараметрической оценки под колоколом попадет небольшое число точек. Граничные точки такими и являются. Однако для того, чтобы убедиться, что восстановление в таких точках происходит с использованием новой рабочей выборки, посчитаем относительную ошибку (2) только для граничных точек: . Данная ошибка значительно хуже, чем ошибка аппроксимации для всей выборки. Рис. 4. Поле корреляции Н-процесса по входным переменным u1, u2 после заполнения Рис. 5. Поле корреляции по входным переменным u1, u2 до заполнения Рис. 6. Поле корреляции по входным переменным u1, u2 после заполнения Из рис. 6 видно, что в выборке присутствуют области разреженности и пустот. С помощью предложенного алгоритма дополним исходную выборку новыми точками. Поле корреляции по входным переменным после генерации новых точек представлено на рис. 6, где кружки - это точки исходной выборки, звездочки - сгенерированные точки. В данном случае после работы вышеописанного алгоритма были сгенерированы точки в тех областях, где их плотность была невелика по сравнению со всей выборкой. Таким образом, в новой рабочей выборке (рис. 6) отсутствуют места пустот и разреженности - при восстановлении оценки под колокол попадет большее количество точек, и оценка будет точнее. Используя новую рабочую выборку, будем восстанавливать оценку (1) в точках исходной выборки. Относительная ошибка уменьшилась в 2 раза: . Также по новой выборке восстановим выход модели в граничных точках: . Таким образом, алгоритм получения новой рабочей выборки позволит улучшить качество исходных данных. Заключение. Решение задачи идентификации затруд-няет как малый объем исходных данных, так и наличие в них изъянов. В данной работе рассмотрены такие недостатки, как подобласти разреженности и отсутствия наблюдения. Для их устранения предложен алгоритм генерации новой рабочей выборки, что позволит повысить качество восстановления.
×

About the authors

E. A. Chzhan

Siberian Federal University

Email: ekach@list.ru
79/10, Svobodny Av., Krasnoyarsk, 660041, Russian Federation

References

  1. Эйкхофф П. Основы идентификации систем управления. М. : Мир, 1975. 681 с.
  2. Цыпкин Я. З. Основы информационной теории идентификации. М. : Наука, 1984, 320 с.
  3. Медведев А. В. Некоторые замечания к Н-моделям безынерционных процессов с запаздыванием // Вестник СибГАУ. 2014. № 2 (54). С. 50-55.
  4. Корнеева А. А., Сергеев А. Н., Чжан Е. А. Исследование непараметрических моделей процессов трубчатого типа // Вестник СибГАУ. 2012. № 5 (45). С. 44-49.
  5. Медведев А. В. Непараметрические системы адаптации. Новосибирск : Наука, 1983. 174 с.
  6. Надарая Э. А. Непараметрические оценки плотности вероятности и кривой. Тбилиси : Изд-во Тбилис. ун-та, 1983. 194 с.
  7. Хардле В. Прикладная непараметрическая регрессия. М. : Мир, 1993. 352 с.
  8. Загоруйко Н. Г. Прикладные методы анализа данных и знаний. Новосибирск : Изд-во ИМ СО РАН, 1999. 264 с.
  9. Bayesian data analysis / A. Gelman [et al.]. CRC press, 2013.
  10. Kantardzic M. Data mining: concepts, models, methods, and algorithms. John Wiley & Sons, 2011.
  11. Fisher C. W., Kingma B. R. Criticality of data quality as exemplified in two disasters // Information & Management. 2001. Т. 39, № 2. С. 109-116.
  12. Gillies D., Thornley D., Bisdikian C. Probabilistic approaches to estimating the quality of information in military sensor networks // The Computer Journal. 2010. Т. 53, № 5. С. 493-502.
  13. Ваганов М. А., Москалец О. Д., Кулаков С. В. Многоканальный спектральный прибор для диагностики жидкостного ракетного двигателя // Информационно-управляющие системы. 2013. № 1 (62). С. 2-6.
  14. Мухин С. В., Ребенков А. В. Перспективы развития информационно-измерительных и управляющих систем для испытания жидкостного ракетного двигателя на стенде химзавода - филиала ОАО «КРАСМАШ» // Решетневские чтения : материалы XIV Междунар. науч. конф. (10-12 ноября 2010, г. Красноярск). Ч. 1. С. 261-266.
  15. Орлов В. И., Сергеева Н. А. О непараметрической диагностике и управлении процессом изготовления электрорадиоизделий // Вестник СибГАУ. 2013. № 2 (48). С. 70-75.
  16. Eykhoff P. Osnovy identifikatsii sistem upravleniya [System IdentificationParameter and State Estimation]. Moscow, Mir Publ., 1975, 683 p.
  17. sypkin Ya. Z. Osnovy informatsionnoy teorii identifikatsii[The foundation of information identification theory]. Moscow, Nauka Publ., 1984, 320 p.
  18. Medvedev A. V. [Some remarks on the H-model inertialess processes with delay]. Vestnik SibGAU. 2014, No. 2 (54), P. 50-55 (In Russ.).
  19. Korneeva A. A., Sergeev A. N., Chzhan E. A. [Investigation of nonparametric models of tubular type processes]. Vestnik SibGAU. 2012, No. 5 (45), P. 44-49 (In Russ.).
  20. Medvedev A. V. Neparametricheskie sistemy adaptatsii [Nonparametric adaptation systems]. Novosibirsk, Nauka Publ., 1983, 174 p.
  21. Nadaraya E. A. Neparametricheskie otsenki plotnosti veroyatnosti i krivoy regresii [Non-parametric estimation of the probability density and the regression curve]. Tbilisi, Tbilisi University Publ., 1983,194 p.
  22. Khardle V. Prikladnaya neparametricheskaya regressiya [Applied Nonparametric Regression]. Moscow, Mir Publ., 1993, 352 p.
  23. Zagoruyko N. G. Prikladnye metody analiza dannykh i znaniy [Applied methods of data and knowledge analysis]. Novosibirsk, IM SO RAN Publ., 1999. 264 p.
  24. Gelman A. et al. Bayesian data analysis. CRC press, 2013.
  25. Kantardzic M. Data mining: concepts, models, methods, and algorithms. John Wiley & Sons, 2011.
  26. Fisher C. W., Kingma B. R. Criticality of data quality as exemplified in two disasters. Information & Management. 2001, Vol. 39, No 2, P. 109-116.
  27. Gillies D., Thornley D., Bisdikian C. Probabilistic approaches to estimating the quality of information in military sensor networks. The Computer Journal. 2010, Vol. 53, No 5, P. 493-502.
  28. Vaganov M. A., Moskalets O. D., Kulakov S. V. [Multichannel spectral devices for the diagnosis of liquid rocket engines]. Informatsionno-upravlyayushchie sistemy, No 1 (62), P. 2-6 (In Russ.).
  29. Mukhin S. V., Rebenkov A. V. [Prospects for the development of information-measuring and control systems for liquid rocket engine test stand at the chemical plant-branch of “Krasmash”]. Reshetnevskie chteniya : materialy XIV Mezhdunar. nauch. konf. Reshetnev Readings: materials XIV Intern. scientific. Conf.]. Krasnoyarsk, 10-12, November 2010, Part 1. P. 261-266 (In Russ.).
  30. Orlov V. I., Sergeeva N. A. [Nonparametric diagnosis and control of the process of making electronic component]. Vestnik SibGAU. 2013, No. 2 (48), P. 70-75 (In Russ.).

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2015 Chzhan E.A.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies