НЕПАРАМЕТРИЧЕСКИЕ АЛГОРИТМЫ ВОССТАНОВЛЕНИЯ СЛУЧАЙНЫХ ПОЛЕЙ


Цитировать

Полный текст

Аннотация

Многочисленные задачи практики тесно связаны с необходимостью восстановления полей той или иной природы по зашумленным экспериментальным данным. Особенностью этой проблемы является то, что апри- орной информации чаще всего недостаточно для описания этих полей с точностью до набора вектора пара- метров. Это обусловливает тот факт, что по различным каналам многомерных процессов информация может быть разнотипной, следовательно, соответствовать различным уровням априорной информации. На эту проблему обращено специальное внимание. При наличии априорной информации параметрического типа целесообразно использовать соответствующие алгоритмы идентификации, когда структура моделей полей определена с точностью до набора параметров и их последующей оценки по мере поступления текущей информации. В случае, если априорной информации недостаточно, то целесообразно использовать непара- метрические оценки Надарая-Ватсона для восстановления соответствующих полей. При этом существенно определить по всем каналам многомерной системы, являются ли они Н- или Т-процессами, т. е. процессами, для которых входные или выходные компоненты оказываются стохастически зависимыми, а эти зависимости чаще всего неизвестны. В качестве примера использования подобных процессов рассмотрены поля распределения примесей вредных веществ в атмосферном воздухе города. В качестве алгоритма восстановления этих полей применена непара- метрическая оценка функции регрессии.

Полный текст

Введение. При решении задач практики встреча- ется необходимость в восстановлении случайных по- лей по зашумленным данным. Восстанавливаемое поле представляет собой неизвестную стохастиче- скую зависимость между входными и выходными переменными. Общая схема восстанавливаемого слу- чайного поля представлена на рис. 1. Рис. 1. Общая схема восстанавливаемого случайного поля Fig. 1. General scheme of a random field being restored На рис. 1 приняты следующие обозначения: А - неизвестный оператор, влияющий на внешний вид поля; x(t) - выходная переменная; u(t) - входная ин- формация; ξ(t) - случайное воздействие; (t) - непре- рывное время; Hu, Hx - каналы связи, соответствую- щие различным переменным, включающие в себя средства контроля, приборы для измерения наблю- даемых переменных; ut, xt - означают измерение u(t), x(t) в дискретное время; hu(t), hx(t) - случайные поме- хи измерений соответствующих переменных. Восстановление случайного поля относится к задаче идентификации стохастического процесса. Алгоритм восстановления случайного поля существенно зависит от имеющейся априорной информации о процессе. Уровни априорной информации. Рассмотрим процессы с различным уровнем априорной информа- ции [1; 2]: 1. Процессы с параметрической неопределенно- стью. Параметрический уровень априорной информа- ции предполагает наличие параметрической структу- ры модели и некоторых характеристик случайных помех, обычными из которых являются нулевое ма- тематическое ожидание и ограниченная дисперсия. Для оценки параметров используются чаще всего раз- нообразные итеративные вероятностные процедуры. При этих условиях решается задача идентификации в узком смысле (идентификация в узком и широком смыслах рассматривалась авторами ранее в работах [3-6]). 2. Процессы с непараметрической неопределенно- стью. Непараметрический уровень априорной инфор- мации не предполагает наличие модели, но требует наличие некоторых сведений качественного характера о процессе, например, однозначность либо неодно- значность его характеристик, линейность для динами- ческих процессов либо характер его нелинейности. Для решения задач идентификации на этом уровне априорной информации (идентификация в широком смысле) применяются методы непараметрической статистики. 3. Процессы с параметрической и непараметриче- ской неопределенностью. Важными с точки зрения практики являются задачи идентификации много- связных систем в условиях, когда объем исходной информации не соответствует ни одному из выше- описанных типов. Например, для отдельных характе- ристик многосвязного процесса на основании энерге- тических либо физико-химических закономерностей, закона сохранения массы, балансовых соотношений могут быть выведены параметрические закономерно- сти, а для других - нет. Таким образом, мы находимся в ситуации, когда задача идентификации формули- руется в условиях и параметрической, и непарамет- рической априорной информации. Тогда и модели представляют собой взаимосвязанную систему пара- метрических и непараметрических соотношений. Непараметрическая оценка функции регрессии. В качестве непараметрического алгоритма восстанов- ления случайных полей предложен алгоритм непара- метрической оценки функции регрессии [7; 8], осно- ванный на методе ядерного сглаживания [9-12]. Основная идея ядерного сглаживания заключается в следующем: вокруг аппроксимирующей точки стро- ится прямоугольник, каждому элементу выборки на- значается вес (чем больше расстояние между элемен- том выборки и точкой построения прогноза, тем меньше вес), а затем происходит усреднение взве- шенных значений. В случае использования регрессии нулевого порядка взвешенные значения последова- тельности, попавшие в ядро, усредняются. Ядерная оценка плотности использует те же прин- ципы, что и ядерное сглаживание, однако её алгоритм имеет некоторые особенности. Рассмотрим выраже- ние, определяющее процедуру оценки функции в точ- ке u: n å fi Φ((u - ui ) / cs ) h n fˆ (u ) = i=1 , (1) åΦ((u - ui ) / cs ) i=1 где x - последовательность длиной n; cs - коэффици- ент сглаживания; Ф - ядерная функция. Ядерная функция Ф(*)удовлетворяет следующим условиям: влияние оказывают промышленные предприятия, ко- торые находятся непосредственно в селитебных зо- lim 1 +¥ æ t - t ö ò i Φç ÷ dt = 1, cs -¥ è cs ø ( ) i ( ) 1 +¥ æ t - t ö ò j t Φç ÷ dt = j ti . (2) (3) нах, и насыщенный транспортный поток. Высокая концентрация источников энергетическо- го и химического воздействия и скорость накопления загрязнений на сегодняшний день значительно превышают возможности самоочищения атмосферы, что cs ®0 cs -¥ è cs ø ведет ко многим отрицательным последствиям, в том Как следует из выражения (1), плотность в точке u вычисляется как сумма значений ядра для величин, определяемых разностями между значением u и зна- чениями последовательности. При этом точки u, в которых вычисляется плотность, могут не совпадать со значениями элементов выборки. Постановка задачи оценки экологической си- туации в городе Красноярске. В качестве примера восстановления случайного поля с использованием непараметрических алгоритмов был взят процесс восстановления поля распределения загрязняющих веществ в атмосферном воздухе города Красноярска. Оценка качества атмосферного воздуха и прогноз его изменения, организация рациональной системы природопользования, главной задачей которой явля- ется поиск и разработка путей оптимизации взаимо- действия общества с окружающей природной средой, являются приоритетными направлениями в области обеспечения экологической безопасности городской среды [13-15]. Проблема обеспечения чистоты воз- душного бассейна является особо важной, так как представляет угрозу здоровью человека и всей окру- жающей среде в целом. В городской среде источники загрязнения атмосферы многообразны, а состав вы- бросов отличается многокомпонентностью. На эко- логическое состояние города Красноярска основное числе к высоким уровням заболеваемости населения, снижению качества жизни и т. п., поэтому изучение процессов, происходящих в атмосфере, контроль и выявление источников, принятие мер к снижению загрязнения или его полному устранению можно счи- тать жизненно важной задачей. Моделирование пространственного распростране- ния загрязняющих веществ в воздухе городской сре- ды является необходимым этапом при разработке управленческих решений в области управления качест- вом экологических систем. В работах [3-6] авторами выполнены сценарные расчеты содержания оксида азота, формальдегида и оксида углерода в атмосферном воздухе города Красноярска. В качестве входных данных использо- вались время, широта, долгота, направление и ско- рость ветра, в качестве обучающей выборки были взяты данные со стационарных постов наблюдения за загрязнением атмосферы Среднесибирского УГМС. Распределение их на территории города рассматрива- лось в работах [3; 4] и представлено на рис. 2. Циф- рами указаны порядковые номера постов наблюдения согласно плану города. Для моделирования содержа- ния примесей в атмосферном воздухе города был использован непараметрический метод ядерной ап- проксимации. Рис. 2. Расположение основных постов наблюдения за загрязнением атмосферы в городе Красноярске Fig. 2. Arrangement of the main posts of observation in Krasnoyarsk Рис. 3. Расположение дополнительных постов наблюдения за загрязнением атмосферы в городе Красноярске Fig. 3. Arrangement of additional posts of observation in Krasnoyarsk Предложенный метод моделирования экологи- ческой обстановки. В основу предложенной в работе модели положен метод непараметрической оценки функции регрессии. Предложенная модель дополни- тельно учитывает плотность застройки города, для определения которой использовались спутниковые Φ1 (u ) = exp (-u / 2); 1 2 Φ2 (u ) = ìï1- u , если u £ 1, í î ï0, если u >1. (5) (6) снимки и алгоритм выделения граней, и включает в себя две составляющие: модель, построенную на осно- вании данных основных стационарных постов наблю- дения за загрязнением атмосферы [3-6], и модель, построенную на основании данных с семи дополни- тельных автоматизированных постов региональной наблюдательной сети подсистемы мониторинга за- грязнения атмосферного воздуха КГБУ «Центр реали- зации мероприятий по природопользованию и охране окружающей среды Красноярского края», распреде- ление которых по территории города представлено на рис. 3. После разработки этих составляющих они были объедены в единую модель распространения примесей в атмосферном воздухе. Чтобы при построении прогноза в любой точке использовались данные со всех постов наблюдения (так как число наблюдений в единицу времени неве- лико), в качестве ядерной функции для широты и дол- готы измерения была использована гауссова ядерная функция, так как данная функция не обращается в 0. Также были учтены направление и скорость ветра. Изменяя коэффициенты размытости ядер cs1 и cs2, можно менять форму «колокола», под который будут попадать точки для построения модели [1-6; 9]. Модель, основанная на данных дополнительных постов наблюдения, имеет следующий вид: xdin = d( p , b ) ´ Модель, основанная на данных основных стационарных постов наблюдения [3-6], имеет следующий m din s+1 1,s+1 2,s+1 æ p1,s+1 - p1,i ö æ b2,s+1 - b2,i ö æ ts+1 - ti ö вид: å xi Φ1 ç c ÷Φ1 ç c ÷Φ2 ç c ÷ (7) xst = d(u , u ) ´ ´ i=1 è s1 ø è s 2 ø è s3 ø , s+1 1,s+1 2,s+1 m æ p - p ö æ b - b ö æ t - t ö s åΦ ç 1,s+1 1,i ÷Φ ç 2,s+1 2,i ÷Φ ç s+1 i ÷ st æ u1,s+1 - u1,i ö æ u2,s+1 - u2,i ö æ ts+1 - ti ö 1 c 1 c 2 c å xi Φ1 ç c ÷Φ1 ç c ÷Φ2 ç c ÷, (4) i=1 è s1 ø è s 2 ø è s3 ø ´ i=1 è s1 ø è s 2 ø è s3 ø где p - долгота точки измерения; b - широта точки s Φ æ u1,s+1 - u1,i öΦ æ u2,s+1 - u2,i öΦ æ ts+1 - ti ö 1,i 2,i å 1 ç c ÷ 1 ç c ÷ 2 ç c ÷ измерения; ti - время измерения; i= 1,s - номер i=1 è s1 ø è s 2 ø è s3 ø измерения; m - величина выборки; δ(p1,s+1, b2,s+1) - где u1,i - долгота точки измерения; u2,i - широта точки плотность застройки в прогнозируемой точке (безизмерения; ti - время измерения; i= 1,s - номер изразмерный параметр, задаваемый исследователем, мерения; s - величина выборки; δ(u1,s+1, u2,s+1) - плот- ность застройки в прогнозируемой точке (безразмер- ный параметр, задаваемый исследователем, начинает- ся с 1); Ф1 - гауссова ядерная функция; Ф2 - треуголь- ная ядерная функция: начинается с 1). В обучающую выборку вышерассмотренных мо- делей входят только те данные с постов наблюдения за загрязнением атмосферы, которые были получены в том же месяце, в котором необходимо сделать прогноз, чтобы отследить разницу между временами года. Объединяя модели, основанные на данных основ- ных стационарных (4) и дополнительных (7) постов наблюдений, была получена итоговая модель для оценки экологической ситуации в городе Красноярске: å x sv + x dvå s m st din i i i i ны результаты моделирования по диоксиду азота, пы- ли и формальдегиду. Распределение концентраций NО2 в Красноярске по результатам математического моделирования представлено на рис. 4. Согласно выполненным расчетам наибольшие уровни загрязнения наблюда- ются в Центральном и Советском районах города, что объясняется наибольшей плотностью автотрансxst = d(u , u ) i=1 i=1 , (8) портных потоков. Тёмным цветом отображена обs+1 1,s+1 2,s+1 s m ласть с наибольшей концентрацией диоксида азота å svi + å dvi С > 0,053мг/м3, серым цветом - область с конценi=1 i=1 NO2 3 где æ p - p ö æ b - b ö æ - ö трацией СNO2 > 0,046 мг/м , предельно допустимая среднесуточная концентрация по диоксиду азота 1 i 1 dv = Φ ç 1,s+1 1,i ÷Φ ç 2,s+1 2,i ÷Φ ç ts+1 ti ÷, (9) составляет Спдксс= 0,04 мг/м3. 2 è c s1 ø è cs 2 ø è cs3 ø i 1 ç c ÷ 1 ç c ÷ 2 ç c ÷. sv = Φ æ u1,s+1 - u1,i öΦ æ u2,s+1 - u2,i öΦ æ ts+1 - ti ö è s1 ø è s 2 ø è s3 ø (10) Распределение концентраций пыли в городе Крас- ноярске по результатам математического моделиро- вания представлено на рис. 5. Превышение установ- ленного норматива объясняется возникающим над городом куполом тепла, который способствует улав- Результаты моделирования. С помощью предложенной модели были выполнены сценарные расче- ты содержания различных примесей в атмосферном воздухе города Красноярска. На рис. 4-6 представлеливанию различных загрязнителей, особенно неболь- ших твердых частиц, наибольшие значения концен- траций наблюдаются в Железнодорожном и Цен- тральном районах. Рис. 4. Пространственное распределение NО2 в городе Красноярске 18.03.2014 г. (расчетные данные) Fig. 4. Distribution of NО2 in Krasnoyarsk, 18.03.2014 (mathematical model) Рис. 5. Пространственное распределение пыли в городе Красноярске 15.02.2014 г. (расчетные данные) Fig. 5. Distribution of dust in Krasnoyarsk, 15.02.2014 (mathematical model) Рис. 6. Пространственное распределение формальдегида в городе Красноярске 19.06.2014 г. (расчетные данные) Fig. 6. Distribution of formaldehyde in Krasnoyarsk, 19.06.2014 (mathematical model) Тёмным цветом отображена область с наибольшей концентрацией пыли Спыли > 0,38 мг/м3, серым цветом отображена область со средней концентрацией 0,38мг/м3 > Спыли > 0,28 мг/м3, предельно допустимая среднесуточная концентрация по взвешенным веще- ствам составляет Спдксс = 0,15мг/м3. Распределение концентраций формальдегида в го- роде Красноярске по результатам математического моделирования представлено на рис. 6. Формирование высоких концентраций формальде- гида в атмосфере происходит в основном вследствие протекания окислительно-восстановительных реакций с участием метана, продуктов природного топлива, оксидов азота. При этом, чем выше температура воз- духа, тем интенсивнее протекают реакции и выше концентрация формальдегида. На рис. 6 темным цве- том отображена область с концентрацией формальде- гида Сформ > 0,062 мг/м3, серым цветом - область с концентрацией Сформ > 0,052 мг/м3, предельно допустимая среднесуточная концентрация по фор- мальдегиду составляет Спдксс = 0,01 мг/м3, т. е. наблю- дается значительное превышение установленного норматива практически во всех районах города. Наи- более высокие концентрации вещества наблюдаются в часы пик или в условиях фотохимического смога. Для оценки точности модели использовался метод скользящего экзамена, при котором последовательно каждая i-я точка исходной обучающей выборки при- нимается в качестве контрольной ситуации с после- дующим исключением её из процесса обучения, и по оставшейся части строится дерево, с помощью кото- рого и осуществляется прогнозирование. Результаты расчетов согласуются с данными натурных наблюде- ний, т. е. разработанная модель в общей мере отража- ет экологическую ситуацию в городе. По результатам проверки вышеописанным методом использование параметра плотности застройки улучшило качество построенной модели на 10-15 %. Для оценки эффективности алгоритма моделиро- вания использовалось значение ошибки модели, кото- рое рассчитывалась по следующему алгоритму: - построенная модель экологической обстановки с использованием данных всех постов наблюдения (как основных, так и дополнительных) принимается за истину; - поочередно исключается из модели по одному стационарному основному посту и рассчитывается, насколько модель стала грубее; - усредняются полученные результаты снижения точности модели. Усовершенствование модели с помощью учёта данных с семи дополнительных автоматизированных постов региональной наблюдательной сети монито- ринга загрязнения атмосферного воздуха КГБУ «Центр реализации мероприятий по природопользованию и охране окружающей среды Красноярского края» по- зволило улучшить качество прогноза на 20-23 %. Заключение. Настоящее исследование открывает перспективу формулировки и решения различных задач, имеющих непосредственное отношение к эко- логии города. Очевидна необходимость дальнейшего развития данного направления. Несмотря на очевид- ные преимущества передвижных постов наблюдения перед стационарными, на данный момент не сущест- вует единого способа построения их маршрутов. Да- лее авторами планируется разработка маршрутов движения передвижных постов наблюдения, что бу- дет способствовать сокращению времени на принятие управленческих решений в области обеспечения каче- ства экологических систем и, как следствие, сокраще- нию уровня загрязнения атмосферного воздуха в го- роде.
×

Об авторах

Е. Н. Бельская

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева

Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

А. В. Медведев

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева

Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

Е. Д. Михов

Сибирский федеральный университет

Email: edmihov@mail.ru
Российская Федерация, 660041, г. Красноярск, просп. Свободный, 79

О. В. Тасейко

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева

Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

Список литературы

  1. Медведев А. В. Основы теории непараметриче- ских систем. Идентификация, управление, принятие решений : монография / СибГУ им. М. Ф. Решетнева. Красноярск, 2018. 732 с.
  2. Медведев А. В. Основы теории адаптивных сис- тем : монография / Сиб. гос. аэрокосмич. ун-т. Крас- ноярск, 2015. 526 с.
  3. Оценка экологической ситуации с применением методов непараметрического моделирования / Е. Н. Бель- ская [и др.] // Экология и промышленность России. 2017. Т. 8. С. 54-58.
  4. Применение методов непараметрического моде- лирования в решении задач экологического монито- ринга / Е. Н. Бельская [и др.] // Вестник СибГАУ. 2016. Т. 17, № 1. С. 10-18.
  5. Восстановление полей загрязняющих веществ в городской среде / Е. Н. Бельская [и др.] // Решетнев- ские чтения : материалы XX Междунар. науч.-практ. конф. (09-12 нояб. 2016, г. Красноярск). В 2 ч. Ч. 2 / под общ. ред. Ю. Ю. Логинова ; Сиб. гос. аэрокосмич. ун-т. Красноярск, 2016. С. 286-288.
  6. Оценка экологического состояния городской среды на основе ядерной аппроксимации / Е. Н. Бель- ская [и др.] // Безопасность в техносфере. 2017. Т. 6, № 4. С. 13-20.
  7. Надарая Э. А. Непараметрическое оценивание плотности вероятностей и кривой регрессии. Тбилиси : Изд-во Тбилис. ун-та, 1983. 194 c.
  8. Надарая Э. А. Непараметрические оценки кри- вой регрессии // Некоторые вопросы теории вероят- ностных процессов. 1965. Вып. 5. С. 56-68.
  9. Кошкин Г. М., Пивен И. Г. Непараметрическая идентификация стохастических объектов PDF : моно- графия. Хабаровск : Изд-во РАН. Дальневосточное отд-ние, 2009. 336 с.
  10. Хардле В. Прикладная непараметрическая рег- рессия. М. : Мир, 1993. 349 c.
  11. Цыпкин Я. З. Основы теории обучающихся систем. М. : Наука, 1970. 252 c.
  12. Васильев В. А., Добровидов А. В., Кошкин Г. М. Непараметрическое оценивание функционалов от распределений стационарных последовательностей. М. : Наука, 2004. 508 с.
  13. Экологический мониторинг окружающей сре- ды / Ю. А. Комиссаров [и др.]. М. : Химия, 2005. 365 с.
  14. Антропов К. М., Казмер Ю. И., Вараксин А. Н. Описание пространственного распределения загряз- нения атмосферного воздуха промышленного центра методом LandUseRegression (обзор) // Экологические системы и приборы. 2010. № 1. С. 28-41.
  15. Информационная система для моделирования распространения загрязнения атмосферного воздуха с использованием ArcGIS [Электронный ресурс] // Мо- лодой ученый. URL: http://www.moluch.ru/conf/ tech/archive/4/895 (дата обращения: 14.07.2018).

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Бельская Е.Н., Медведев А.В., Михов Е.Д., Тасейко О.В., 2018

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах