A NONPARAMETRIC MODEL IN THE TASK OF PREDICTIVE MODELING OF WIND POWER PLANTS


Cite item

Full Text

Abstract

The work is devoted to solution of the problem of predictive modeling of relative capacity of wind power plants in relation to season and weather factors. It contains step-by-step description of the following steps of modeling: factor selection, raw data pretreatment, model evaluation and optimization. Both heuristic and formal methods were combined to construct the model. The basic modeling approach here is the k-nearest neighbors method. The model has been verified with the use of test sample. The developed model allows to optimize the wind power plant operation in relation to weather factors and network load.

Full Text

Энергоэффективность и энергосбережение входят в пятерку приоритетных направлений технологического развития в России. Развивающиеся технологии использования альтернативных источников энергии способствуют рациональному использованию ресурсов и сокращению выбросов парниковых газов [1]. Одним из активно развивающихся направлений в энергетике в настоящее время являются ветряные электрические установки (ВЭУ). Россия обладает колоссальными возможностями для развития ветроэнергетики. В настоящее время на территории России экономически оправдано строительство ветряных электростанций суммарной мощностью до 250 млрд кВт/ч в год. Наиболее перспективными районами являются Дальневосточный регион, Сибирь, Крайний Север, а также территории Алтая, Нижней и Средней Волги, Каспийское побережье и Республика Карелия [2]. Эффективная эксплуатация ветряных электрических установок требует решения проблем, связанных с необходимостью оптимизации режимов их работы в рамках единой энергетической системы. В частности, возникает необходимость прогнозировать мощность, генерируемую ветряной электрической установкой. Постановка задачи и исходные данные взяты из открытого конкурса Global Energy Forecasting Competition 2012 [3]. Для прогноза выходной мощности семи ветряных электростанций используется следующий набор факторов: метеорологический прогноз, содержащий меридиональную и зональную компоненты скорости ветра (проекции скорости на меридиан и параллель, проходящие через ВЭУ), направление ветра, скорость ветра, и соответствующая прогнозу дата. Исходные данные представляют собой выборку, состоящую из 26 197 наблюдений за четырехлетний период. Прогнозы ветра поступают два раза в сутки, каждый прогноз представляет собой данные о ветре на ближайшие двое суток. По этой причине обучающая выборка содержит многократные прогнозы различной точности. Функционирование ВЭУ сопровождается длительными промежутками отключения или работы на пониженной мощности, связанными как с регламентными работами на станциях, так и с особыми метеорологическими условиями (например, обледенением). Причины каждого конкретного отклонения режима функционирования ВЭУ от нормального неизвестны, поэтому работа с выборкой крайне затруднительна. Мощность воздушного потока зависит не только от скорости, но и от плотности воздуха [4]. Мы не располагаем данными о параметрах, связанных с плотностью (температура, влажность и т. д.). Однако косвенно они могут быть связаны с порядковым номером дня в году (временем года) и временем суток [5]. Применим деревья регрессии [6] для принятия решения о включении факторов в модель. Построение бинарного дерева представляет собой пошаговую процедуру разбиения подмножеств обучающей выборки на две части гиперплоскостью, перпендикулярной оси выбранного фактора и проходящей через точку разбиения так, чтобы сумма дисперсий выходных значений в получаемых подмножествах была минимальна. Дерево регрессии позволяет последовательно разбивать имеющийся набор данных на подмножества с различными выборочными средними. Таким образом, разбиение по какому-либо фактору свидетельствует об изменении выборочной средней, а следовательно, о наличии некоторой зависимости выходной величины от этого фактора. По этой причине факторы, по которым проводились разбиения, будем считать значимыми. Рис. 1. Дерево регрессии для первой из семи ВЭУ: верхняя альтернатива - соблюдение неравенств, нижняя - нарушение; ws - скорость ветра; h - час; dy - порядковый номер дня в году; v - зональная компонента скорости ветра При построении дерева регрессии определяем следующее правило остановки: любое из полученных в результате разбиения подмножеств должно содержать не менее 500 выборочных значений. Данное правило предотвращает выбор факторов, существенных лишь для небольших подмножеств данных (менее 5 % обучающей выборки). Дерево регрессии для ветряной станции 1 изображено на рис. 1. В узлах дерева находятся условия, в соответствии с которыми осуществляется бинарное разделение выборки. В конечных узлах дерева указаны значения средних мощностей - выходных величин, соответствующих областей кусочно-постоянных аппроксимаций, которые представляют собой дерево. Первое разбиение было произведено по скорости ветра: для всех первого подмножества скорость ветра меньше 4,9 м/с (верхняя альтернатива), для всех точек второго - больше 4,9 м/с. Каждое из полученных подмножеств было в свою очередь разбито на два подмножества. Процесс продолжается, пока не нарушается требование к размеру минимального листа дерева. Для каждого подмножества итогового разбиения была вычислена средняя выходная мощность. Например, при условиях «скорость ветра меньше 2.1 м/с» и «порядковый номер часа в сутках меньше 12» средняя относительная мощность составляет 0,03, а при условиях «скорость ветра меньше 2,1 м/с» и «порядковый номер часа в сутках больше или равен 12» - 0,1. Значимость факторов Фактор ВЭУ 1 2 3 4 5 6 7 Зональная компонента скорости ветра - + + + - + + Меридиональная компонента скорости ветра + + + + + + + Направление ветра - + - - + - + Скорость ветра + + + + + + + Год - - - - + - - Месяц - - - - - - - День месяца - - - - - - - Час + + + + + + + День в году + + - - + + + В табл. знаком «+» отмечены факторы, по которым производились разбиения при построении деревьев для соответствующих ветряных установок (значимые факторы). Факторы, значимость которых была установлена в процессе построения деревьев регрессий для пяти и более ветряных установок, были включены в модель: х1 - зональная компонента скорости ветра; х2 -меридиональная компонента скорости ветра; X - скорость ветра; х4 - порядковый номер часа в сутках; х5 -порядковый номер дня в году. К этому набору факторов последовательно добавлялись скорости ветра в районах соседних установок: сначала фактор х6 должен в наибольшей степени улучшать качество модели, затем фактор х7 выбирается с тем же условием. I хр , Xq ) \хр Xq\ j = 1, 2, 3, 6, 7, ' = 1, 2, После выбора значимых факторов необходимо провести предварительную обработку данных. Электрические генераторы характеризуются монотонно возрастающей зависимостью выходной мощности от скорости ветра. Отдельные фрагменты в обучающей выборке противоречат этому теоретическому результату. Следовательно, предполагается наличие аномалий в измерениях соответствующих величин. Другое предположение заключается в том, что данные в этих областях получены во время нештатного функционирования ВЭУ. Были замечены два типичных случая аномальных данных: d4 {К ’ х4 ) = (24 - xp - х4 - высокая мощность при слабом ветре; - низкая мощность при сильном ветре. Первый случай может быть связан с ошибками в прогнозе погоды; второй - как с ошибками в прогнозах, так и с аномальным функционированием ветряной электростанции. Измерения, соответствующие перечисленным случаям, были исключены. К - 4 365 - Ixp - x5| '((■ x5 )=• Прогнозируемую величину (выходную мощность ВЭУ) обозначим у, объем выборки - n. Для предсказания выходной мощности использован непараметрический алгоритм k ближайших соседей [7; 8]. Выбор алгоритма обусловлен следующими причинами: - интерпретируемостью модели. Алгоритм к ближайших соседей позволяет осуществлять прогноз, основываясь на наиболее похожих ситуациях (ближайших соседях) в прошлом в соответствии с выбранным расстоянием. Прогнозирование выполняется простым или взвешенным усреднением выходных значений к ближайших соседей; - циклическим характером некоторых факторов. Среди факторов, включенных в модель, есть циклические (час и порядковый номер дня в году). Алгоритм к ближайших соседей может работать с ними (в отличии, например, от деревьев регрессии); - алгоритм не требует повторного обучения при поступлении новых данных. Поиск ближайших соседей будем осуществлять в соответствии со следующими метриками: 1. Метрика в пространстве одного фактора: ^ (хР , Xq ): р = 1, 2, где j - порядковые номера признаков, для которых метрика применима; р и q - порядковые номера наблюдений, упорядоченных по времени их поступления. 2. Метрика в пространстве одного циклического фактора: - порядковый номер часа в сутках: 4 4 xp - Xq Xp - Xq4 > 24 - X4p - Xq4 p = 1,2,..., n, q = 1,2,..., n; - порядковый номер дня в году: k - x5q\ > 365 - Xp - Xg\ p = 1,2,...,n, q = 1,2,..., n. прогнозирования (1.. .2 ч), однако она будет иметь большие ошибки при долгосрочных прогнозах (до A = 48 ч). При настройке параметров w и k исключаем A ближайших по времени к проверочному множеству наблюдений из обучающей выборки. Для оптимизации параметров модели (1) был использован следующий критерий: 3. Метрика в пространстве всех факторов взвешенную сумму метрик в пространстве одного фактора: 7 D (p , Xq , w) = S (Xp , Xq ) j=1 p = 1,2,...,n, q = 1,2,..., n, где w j - соответствующие различным признакам веса, подлежащие оптимизации в соответствии с критерием качества, который будет рассмотрен ниже. Модель k ближайших соседей имеет вид [7]: n ХФ(Х, Xq , w)yq у (х, w) = ^- Хф(х, Xq , w) q=l где ф(Х, Xq , w) = D (х, k, w) - D (х, Xq, w), D (x, Xq, w) < X(x,k), 0, D (x, xq, w) >X (x, k), здесь k - количество соседей, , k) - расстояние между х и k-м ближайшим соседом, yq - выходная мощность ВЭУ для выборочного элемента с индексом q. Анализ выборочных данных показал, что встречаются ситуации, когда метеорологические прогнозы слабо отличаются друг от друга в течение некоторого промежутка времени. Ближайшие по времени наблюдения, таким образом, будут являться заведомо «хорошими» соседями. Данный эффект приводит к занижению количества ближайших соседей и переобучению при оптимизации модели с использованием критерия Q-кратной кросс-проверки. Идея Q-кратной кросспроверки состоит в выделении в обучающей выборки (V) на Q непересекающихся подмножеств случайным Q Q образом (V, 1 = 1,2,..., Q, 0 V = V, ^VI = 0), поt=1 1=1 строении модели Q раз, при этом каждый раз одно из подмножеств не участвует в построении модели, а используется как тестовая выборка, ошибки Q моделей суммируются [9]: Q 2 £Z(y.-- -X( , w,V \ V) ^ min, (2) 1=1 геГ, w,k где n X Ф( , Xq , w)Xq у (х, w, V \ V, )= -. X ф(х , Xq , w) q=1 Xq «Vt Модель, оптимизированная по критерию (2), будет демонстрировать высокое качество краткосрочного XXX Уг- у (X, ^ Tt ))2 ^ mk1, 1 ieV, w,k V,=((х), Ул(1)), X Хл(, )+1, Ул(1 )+1),..., X Хл(,)+b-1 , yMi)+в-1)), 1 = 1, 2,..., S - проверочные множества, S - количест-(1) во проверочных множеств, Х(1 ) = n - S (A + B) + + XA + B)(1 -1), k ближайших соседей отыскиваются из тестовых множеств: Tt =((xq,yq):v(Xp,yp)e e V1 |q- p| > a) , q = 1, 2,..., n , p = 1, 2,..., n . Были использованы следующие параметры алгоритма кросс-проверки: B = 36; S = 155. Для любого w количество соседей k выбиралось методом полного перебора в диапазоне от 1 до 250. Оптимизация по параметрам w выполнялось с помощью модифицированного покоординатного спуска. С целью улучшения качества модели применялось сглаживание результатов прогнозирования по времени с использованием скользящего среднего: С Xу (х+г,w) y (xp ) = -. (3) v p! 2c+1 Ширина окна сглаживания c = 2 была выбрана из условия минимума критерия: XX(y- у Ххг ))2 ^ min. 1 ieV, c Если известны значения мощности ветряной установки в моменты времени p - 2 и p - 1 (yp-2 и yp-1), тогда будем использовать их вместо у (p-2) и у (Xp-1) в выражение (2). Процедура скользящего среднего приводит к уменьшению ошибок в модели, связанных с временными сдвигами прогноза погоды. Модель (3) была проверена на тестовой выборке [2]. Среднеквадратическая ошибка приняла значение 0,147 2. Так как прогнозируемая величина является нормированной, в процентном отношении ошибка составляет 14,72 %. Фрагмент сравнения выборочных значений мощности и выхода модели (3) представлен на рис. 2. При построении модели были последовательно использованы две процедуры усреднения: вначале -в пространстве факторов, затем - по времени, что привело к сглаживанию прогноза. Тем не менее модель позволяет определить положение практически всех экстремумов функции мощности от времени, а по значению среднеквадратической ошибки предложенная модель на конкурсе [3] заняла второе место. Проверочное множество Рис. 2. Сравнение выборки (пунктирная линия) и выхода модели (сплошная линия) для последних двадцати проверочных множеств Таким образом, построена непараметрическая модель k ближайших соседей. С использованием построенной модели решена задача прогнозирования мощности ветряных электрических установок. С использованием полученной модели могут быть решены задачи прогнозирования выходной мощности для индивидуальных ВЭУ. Качественный прогноз производства электроэнергии ветряными станциями совместно с прогнозом суточного потребления позволяет минимизировать расходы, связанные с использованием резервных мощностей: снизить сжигание органического топлива, уменьшить общее число вынужденных дорогостоящих запусков и остановок резервных тепловых электростанций. Резервным электростанциям требуется значительное время от запуска до начала генерации энергии. Прогнозирование выходной мощности ВЭУ позволит выводить резервные электростанции на требуемые мощности в случае необходимости заранее.
×

About the authors

E. D. Agafonov

Siberian State Aerospace University named after academician M. F. Reshetnev

Email: agafonov@gmx.de

E. S. Mangalova

Siberian State Aerospace University named after academician M. F. Reshetnev

Email: e.s.mangalova@hotmail.com

O. V. Shesterneva

Siberian State Aerospace University named after academician M. F. Reshetnev

Email: kuznetcova_o@mail.ru

References

  1. Энергоэффективные технологии «Сименс» в России [Электронный ресурс]. URL: http://w3.siemens.ru/ energy-efficiency/energy-efficiency.html (дата обращения: 08.02.2013).
  2. РБК Исследования рынков. Совокупная мощность ветряных электростанций России составила 15,4 МВт. [Электронный ресурс]. URL: http://marketing.rbc.ru/ news_research/24/10/2012/562949984996362.shtml (дата обращения: 08.02.2013).
  3. Global Energy Forecasting Competition 2012, wind forecasting [Electronic resource]. URL: http://www.kaggle.com/c/GEF2012-wind-forecasting (date of visit: 08.02.2013).
  4. Crogg K. Harvesting the Wind: The Physics of Wind Turbines [Electronic resource]. URL: https://dspace. lasrworks.org/bitstream/handle/10349/145/fulltext.pdf. Retrieved 2013-01-11 (date of visit: 08.02.2013).
  5. Global Energy Forecasting Competition 2012, Load Forecasting. Data files [Electronic resource]. URL: http://www.kaggle.com/c/global-energy-forecasting-competition-2012-load-forecasting/data (date of visit: 08.02.2013).
  6. Classification and Regression Trees / L. Breiman, J. H. Friedman, R. A. Olshen, C. J. Stone. Wadsworth Inc., 1984.
  7. Хардле В. Прикладная непараметрическая регрессия. М. : Мир, 1993.
  8. Зайцева Е. А., Бурулев Е. В., Медведев A. B. Непараметрические модели и алгоритмы принятия решений // Вестник СибГАУ. 2005. Вып. 6. С. 17-22.
  9. Воронцов К. В. Комбинаторный подход к оценке качества обучаемых алгоритмов // Математические вопросы кибернетики / под ред. О. Б. Лупанова. М. : Физматлит, 2004. T. 13. С. 5-36.

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2013 Agafonov E.D., Mangalova E.S., Shesterneva O.V.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies