Real-time evolution computation in mobile cyber-physical systems’ control

Abstract


Considered time-optimal controller for the cyber-physical system. The quality of solutions includes the total time of moving the object at a given point, including the time of the calculation of the control program. Considered online and offline versions of the numerical determination of controller as a system of rules "condition - action". As online variant any-time genetic algorithm was used. A comparison of online and offline methods was hold.

Full Text

Мир находится в начале новой технологической революции, которая кардинально его изменит. Перемен того масштаба, что несет четвертая промышленная революция, более известная как «Индустрия 4.0» [1], человечеству испытывать еще не доводилось. Ее суть - в повсеместном распространении киберфизических систем (CPS - cyber-physical systems), усиленной их интеграции в технологические процессы [2-4]. Существенной особенностью CPS является неразрывная связь между входящими в них физическими элементами и элементами, реализующими вычисления. Этот класс систем часто рассматривают как встроенные системы. Однако во встроенных системах акцент делается в большей степени на вычислительные аспекты, чем на неразрывную взаимосвязь между вычислительными и физическими компонентами системы. Сегодня киберфизические системы могут быть найдены в самых разнообразных областях - это космос, гражданская инфраструктура, энергетика, здравоохранение, производство, транспорт и бытовые устройства [5, 6]. Важной подкатегорией киберфизических систем являются мобильные CPS. Физическая часть таких систем обладает собственной мобильностью. Примеры мобильных CPS включают мобильную робототехнику и бортовую электронику. Использование цифровых процессоров даже в простейшей системе управления принципиально изменяет качество функционирования обслуживаемых системой устройств, позволяет оптимизировать режимы работы управляемых объектов или процессов, что существенно увеличивает адаптивность, автономность, эффективность, функциональность, надежность, безопасность, удобство использования таких систем. Вместе с тем при разработке киберфизических систем необходимо учитывать, что такая система - это единый комплекс взаимодействующих вычислительных, коммуникационных и физических процессов. Встроенные (в реальный физический мир) компьютеры непосредственно воздействуют на физические процессы и, в свою очередь, действуют под их влиянием. Вычисления и физический процесс становятся единым целым; предсказать и понять поведение любой из этих двух частей в отрыве от другой невозможно. Если части такой системы (датчики, контроллеры, исполнительные устройства) обмениваются друг с другом информацией, в указанное единство добавляется третий компонент: процесс коммуникации (все чаще сетевой). Тесная взаимосвязь дискретных процессов вычисления и передачи информации с непрерывными процессами в объектах управления требует создания принципиально новой технологии описания, анализа и синтеза встроенных цифровых систем управления. Определенным шагом в этом направлении является использование продукционной модели регулятора при моделировании киберфизической системы как системы цифрового управления непрерывным объектом. Динамическая часть системы, определяющая функционирование объекта управления, описывается дифференциальными уравнениями, а управляющая часть (контроллер, датчики, исполнительные устройства и сеть передачи информации от объекта к управляющей части и обратно) - алгоритмом ее работы (системой продукций, набором правил вида «условие - действие»). Продукционная (алгоритмическая) форма описания регуляторов позволяет унифицировать задачу их синтеза. Действительно, вне зависимости от конкретной задачи определению подлежит количество элементов системы продукций (пар типа «условие - действие») и ее наполнение. При этом на смену многоступенчатому синтезу, включающему выбор структуры регулятора, определение его параметров, разработку реализующих этот регулятор алгоритма и программного кода, приходит прямой синтез программы действий регулятора - системы правил, т. е. алгоритма его работы в виде псевдокода. Необходимость обеспечить достижение предельно возможных технико-экономических показателей работы промышленного оборудования требует разработки методов усовершенствования его конструкционных характеристик и соответствующей организации режимов функционирования, оптимальных по тем или иным критериям эффективности. При этом весь комплекс условий, требований и ограничений для проектируемой системы сводится к задаче поиска экстремума некоторого функционала на определенном допустимом множестве настраиваемых элементов. В основе оптимизационных подходов - формализация представления о качестве функционирования систем управления. Подобная формализация предполагает построение некоторой системы количественных характеристик качества функционирования, величины которых зависят от принимаемых проектных решений. Не менее существенным представляется вопрос задания и обеспечения ограничений. В процедуре продукционного синтеза регулятора необходим, естественно, учет традиционных видов ограничений на параметры управляемого процесса, управляющие воздействия и время регулирования. Однако помимо этого должна быть сформулирована система ограничений, выполнение которых обеспечит отсутствие дефектов системы продукций и корректность ее работы. Вместе с тем следует подчеркнуть, что в настоящее время общий формализованный метод решения задачи синтеза регуляторов в продукционной форме отсутствует. Можно указать лишь некоторые частные способы, в основе которых лежит процедура оптимизации. Первый из подходов - процедура синтеза системы продукций с использованием необходимых (и/или достаточных) условий оптимальности [7-9]. Второй подход - автоматизация процедуры синтеза системы продукций посредством эволюционных вычислений [10-12] как стохастического метода глобальной оптимизации. Этот подход позволит в перспективе создавать технические устройства, которые будут самостоятельно генерировать программное обеспечение своих систем управления и при необходимости модернизировать его. На базе этого подхода можно будет создать программные средства, которые автоматизируют весь процесс проектирования систем управления - от постановки задачи до моделирования их работы, включая проверку программного обеспечения. Эволюционные вычислительные методы - группа алгоритмов, использующих в своей основе идею эволюции Дарвина. Эти алгоритмы традиционно разделяют на генетические алгоритмы (ГА) и генетическое программирование. ГА в основном предназначены для поиска решения оптимизационных задач в виде набора параметров. Структуры данных (векторы вещественных или целых чисел), которыми они манипулируют, являются аналогами генов живых организмов. Алгоритм использует механизмы скрещивания, мутационной изменчивости и отбора для приспособления к условиям окружающей среды, критерием качества которого служит значение целевой функции исходной оптимизационной задачи. Этот алгоритм состоит из нескольких этапов: генерация случайным образом начальной популяции (набора решений), отбор родительских пар (особей с наилучшим значением критерия качества), их скрещивание и мутация (под скрещиванием понимается «обмен» родителей некоторой частью элементов массива, под мутацией - изменение случайным образом элементов массива какой-то особи). Если лучшее решение в популяции не удовлетворяет критериям поиска, то повторяем процесс, иначе - заканчиваем вычисления. ГА - стохастический метод глобальной параметрической оптимизации - позволяет определять при наличии линейных ; ; и нелинейных , ; ; ограничений. Алгоритм работы регулятора задается вектором параметров , формирующим систему продукций вида «если то », и, таким образом, определяющим порядок изменения алгоритма работы регулятора, последовательность смены и время действия каждого локального варианта управления. Определению подлежат моменты разбиения промежутка времени функционирования системы на непересекающиеся подынтервалы и действующий в пределах каждого подынтервала определенный с точностью до набора параметров локальный вариант закона управления , доставляющие минимум функции . Особенно эффективен этот подход в условиях неединственности экстремума целевой функции . Однако, поскольку в ГА требуется производить анализ большого числа альтернативных вариантов решения, время расчетов будет велико, что является существенным недостатком этого метода и может служить препятствием для его использования при синтезе алгоритмов работы регуляторов киберфизических систем в режиме реального времени. Рис. 1. Процедура вычисления управляющих воздействий методом ГА Для преодоления этого недостатка предложено совместить процедуру вычисления управляющих воздействий (рис. 1, 2) с процессом управления. В таком варианте применения ГА следует, не дожидаясь окончания вычислений, раз в несколько эпох выбирать решение, обеспечивающее наибольшее по сравнению с другими имеющимися вариантами управления продвижение объекта управления к цели и использовать его на некотором временном интервале в качестве управляющего воздействия (рис. 3). В искусственном интеллекте этот подход соответствует оперативному режиму работы интеллектуального агента, тогда как предыдущий вариант однократного вычисления управляющих воздействий до начала процесса управления - это автономный режим. Термин «работающий в оперативном режиме» используется по отношению к алгоритмам, которые должны обрабатывать входные данные по мере их получения, а не ожидать, пока станет доступным все множество входных данных. Такой интеллектуальный агент функционирует по методу чередования вычислений и действий: вначале предпринимает действие, затем обозревает среду и вычисляет следующее действие. В теории алгоритмов этот вариант решения задач известен как алгоритм с отсечением по времени (anytime algorithm) - итерационный вычислительный алгоритм, который способен в любое время выдать наилучшее на данный момент решение. При совместном применении алгоритма с отсечением по времени и эволюционного метода следует, не дожидаясь окончания вычислений, раз в несколько эпох выбирать наилучшее решение. Это решение используется некоторое время как текущее управляющее воздействие. Рис. 2. Процедура вычислений управляющих воздействий методом ГА при наличии всей информации В качестве примера применения такого подхода рассмотрим задачу синтеза посредством эволюционных вычислений реального времени закона управления мобильной киберфизической системой. В частности, решен ряд нетривиальных задач оптимального синтеза системы продукций регулятора мобильной киберфизической системы. Мобильность обеспечивается колесным роботом. Кинематическая модель колесного робота - система нелинейных обыкновенных дифференциальных уравнений вида , (1) где переменные состояния - это две координаты и положения объекта на плоскости и угол направления вектора скорости. Модуль вектора скорости равен . Скалярное управление ограничено по модулю и определяет мгновенную скорость поворота вектора скорости. Примем для определенности . Систему (1) при называют Dubins Car (машина Дубинса) по фамилии ученого, изучавшего задачу наискорейшего ее перевода в заданную точку фазового пространства. Решим задачу максимально быстрого перевода машины Дубинса из точки в малую окрестность точки с координатами , . Т. к. третья координата (угол ) в конечной точке не задана, это - задача с подвижным концом траектории. При этом будем учитывать не только время, необходимое объекту управления на перемещение из начальной точки в конечную, но и время, в течение которого осуществляется вычисление закона управления. Поскольку известное точное аналитическое решение задачи быстродействия предполагает закрепление конца траектории и не учитывает время вычисления управления, будем решать задачу численно. В качестве метода вычисления закона управления используем ГА. Программный продукт - Global Optimization Toolbox, процессор Intel® CoreTM 2 Duo 2.2 GHz. Рис. 3. Процедура эволюционных вычислений управляющих воздействий, совмещенная с процессом управления Время вычисления управляющего воздействия ограничим некоторой наперед заданной величиной. В первом случае вначале полностью определим систему продукций программного регулятора, а затем используем ее для управления. Будем считать, что восьми секунд достаточно для гарантированного попадания машины Дубинса в требуемую точку при правильно выбранной стратегии управления и что допустимая частота изменения управляющего воздействия равна 1 с-1. Тогда система продукций регулятора приобретет вид: «если то », . Первая серия из 15 вычислительных экспериментов проводилась при ограничении времени вычисления управляющего воздействия на уровне 8 с, что соответствовало 5 эпохам работы ГА в указанной вычислительной среде. Через 8 с начиналось движение объекта под управлением наилучшей из найденных программ работы регулятора. Общее время от момента получения задачи до окончания движения составляло, таким образом, 16 с. Как следует из рис. 4, ни в одном из 15 экспериментов окрестности точки с координатами , за 16 с достигнуты не были вследствие низкого качества полученных решений. Вторая серия экспериментов проводилась при ограничении времени вычисления управляющего воздействия на уровне 40 с (27 эпох работы ГА). В этом случае (рис. 5) треть траекторий заканчивалась в окрестностях заданной точки, но общее время решения задачи составляло уже 48 с. Рис. 4. Траектории движения машины Дубинса (время вычисления управляющего воздействия 8 с) Рис. 5. Траектории движения машины Дубинса (время вычисления управляющего воздействия 40 с) Изменим тактику. Вначале при лимите времени вычислений в 1 с определим с помощью ГА параметр таким образом, что правило «если то » обеспечит объекту (2.1) минимальное по сравнению со всеми альтернативными вариантами результирующее отклонение от заданного условиями , требуемого конечного положения. Затем, используя это правило для управления в течение первой секунды, будем одновременно искать из таких же соображений параметр . Повторяем эти действия на протяжении первых 7 с движения. Общее время от момента получения задачи до окончания движения составит всего 9 с. Как следует из рис. 6, во всех 15 экспериментах удалось достичь малой окрестности точки , . Рис. 6. Траектории движения машины Дубинса (anytime algorithm управления, полное время 9 с), засечки ставятся через 1 с Полученный эффект повышения качества решения с одновременным существенным сокращением общего времени решения объясняется не только совмещением во времени процессов определения закона управления и движения под действием этого управления, но и уменьшением вычислительной сложности задачи. Действительно, на каждом -том шаге определению подлежит лишь один параметр вместо восьми. Таким образом, может быть преодолен главный недостаток эволюционных вычислений, заключающийся в чрезмерном времени расчетов из-за необходимости анализа большого числа альтернативных вариантов. Следовательно, задача синтеза может быть успешно решена с использованием эволюционных вычислений, в частности генетического алгоритма, в реальном масштабе времени. Причем в однородной среде несомненно преимущество оперативного режима над автономным. В неоднородном окружении картина меняется. Пусть на пути машины Дубинса имеется область, движение по которой нежелательно в силу каких-либо причин (эта область обозначена на последующих рисунках как светло-серый шестиугольник). Теперь автономная организация вычислений на основе всей полноты знаний об окружении, в котором предстоит двигаться, демонстрирует преимущество, т. к. позволяет машине Дубинса вполне успешно миновать запретную область (рис. 7, 8). Оперативное же управление машиной Дубинса обеспечивает преодоление несложных препятствий, но не позволяет справляться с более трудными (рис. 9, 10). Рис. 7. Траектории движения машины Дубинса в неоднородном окружении (автономный режим, время вычисления управляющего воздействия 16 с, полное время 24 с) Рис. 8. Траектории движения машины Дубинса в неоднородном окружении (автономный режим, время вычисления управляющего воздействия 16 с, полное время 24 с) Рис. 9. Траектории движения машины Дубинса в неоднородном окружении (оперативный режим управления, полное время 9 с) Рис. 10. Траектории движения машины Дубинса в неоднородном окружении (оперативный режим управления, полное время 9 с) Этому факту есть рациональное объяснение. Действительно, в автономном режиме система правил работы регулятора полностью определяется до начала движения. При этом используется вся полнота информация как о среде, так и о влиянии на конечный результат всех этапов движения, осуществляется «долгосрочное» планирование. Наоборот, в оперативном режиме расчетов планирование является «краткосрочным», каждый шаг определяется исходя из локальной цели минимизации оставшегося до требуемой точки расстояния. Доступна информация не обо всей окружающей обстановке, а лишь о ближайшей ее части. В этом случае проложить маршрут движения вне запретной области затруднительно. Рассмотренные примеры свидетельствуют о возможности использования эволюционных вычислений в задачах синтеза систем управления реального времени колесными мобильными устройствами, перемещающимися как в однородной, так и в неоднородной среде. Установлена возможность повышения качества решения задачи управления с одновременным существенным сокращением общего времени. Это достигается путем осуществления необходимых для определения закона управления вычислений одновременно с реализацией этого закона. Кроме того, существенно уменьшается вычислительная сложность задачи за счет использования последовательных операций поочередного поиска каждого из параметров системы продукций вместо многомерного поиска. Таким способом может быть преодолен главный недостаток эволюционных вычислений, заключающийся в чрезмерном времени расчетов из-за необходимости анализа большого числа альтернативных вариантов. В условиях отсутствия помех движению можно рекомендовать совмещенный с процессом управления оперативный режим расчетов. Такой режим позволяет существенно сократить время расчетов и повысить качество найденных решений. В неоднородной среде целесообразно использовать автономный режим предварительного вычисления полного решения.

About the authors

Gennady N Rogachev

Samara State Technical University

244, Molodogvardeyskaya str., Samara, 443100, Russian Federation
(Dr. Sci. (Techn.)), Professor

Mihail L Patkin

Samara State Technical University

244, Molodogvardeyskaya str., Samara, 443100, Russian Federation
Postgraduate Student

Nikolay G Rogachev

Samara State Technical University

244, Molodogvardeyskaya str., Samara, 443100, Russian Federation
Graduate Student

References

  1. Чеклецов В.В. Чувство планеты. Интернет вещей и следующая технологическая революция. - М.: Российский исследовательский центр по Интернету вещей, 2013. -130 с.
  2. Cyber-Phisical System. Driving force for innovation in mobility, healthy, energy and production. ACATECH 2011, Springer, 2011. - 48 p.
  3. Living in networked world. Integrate research agenda Cyber-Physical Systems (agenda CPS). ACATECH 2015.
  4. Kranenburg R. van. The Internet of Things. A critique of ambient technology and the all seeing network of RFID. Amsterdam, 2008. - 61 p.
  5. Colombo A., Bangemann T. Industrial Cloud based Cyber physical Systems: The IMC AESOP Approach Cham Springer International Publishing 2014. - 245 p.
  6. Черняк Л. Киберфизические системы на старте // Открытые системы. - 2014. - No 2.
  7. Rogachev G.N. Production method of describing automated controllers in the analysis of continuous-discrete control systems // Automatic control and computer sciences. 2014. - Т. 48. - № 5. - С. 249-256.
  8. Рогачев Г.Н. Гибридно-автоматный метод анализа и синтеза систем автоматического управления // Вестник Самарского государственного технического университета. Сер. Технические науки. - 2006. - Вып. 41. - С. 43-47.
  9. Рогачев Г.Н., Егоров В.А. Численно-аналитическая процедура оптимального синтеза гибридных систем // Вестник Самарского государственного технического университета. Сер. Технические науки. - 2010.- № 7 (28).- С. 32-36.
  10. Рогачев Г.Н. Генетическое программирование в задачах поиска системотехнических решений // Вестник Самарского государственного технического университета. Сер. Технические науки. - 2006. - Вып. 40. - С. 37-42.
  11. Рогачев Г.Н. Использование генетического алгоритма с отсечением по времени в задаче синтеза программного регулятора для машины Дубинса // Вестник Самарского государственного технического университета. Сер. Технические науки. - 2011. - Вып. 3 (31). - С. 27-33.
  12. Рогачев Г.Н., Рогачев Н.Г. Эволюционные вычисления в регуляторе реального времени для машины Дубинса // Аналитическая механика, устойчивость и управление. Труды X Межд. Четаевской конф. Т. 3. Секция 3. Управление. Ч. II. - Казань: Изд-во Казан. гос. техн. ун-та, 2012. - С. 273-281.

Statistics

Views

Abstract - 31

PDF (Russian) - 21

Cited-By


Article Metrics

Metrics Loading ...

PlumX

Dimensions

Refbacks

  • There are currently no refbacks.

Copyright (c) 2016 Samara State Technical University

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies