НЕПАРАМЕТРИЧЕСКАЯ МОДЕЛЬ В ЗАДАЧЕ ПРОГНОЗИРОВАНИЯ МОЩНОСТИ ВЕТРЯНЫХ ЭЛЕКТРИЧЕСКИХ УСТАНОВОК


Цитировать

Полный текст

Аннотация

Статья посвящена решению практической задачи прогнозирования относительной мощности ветряных электрических установок в зависимости от сезонных и погодных факторов. Описаны следующие этапы решения задачи прогнозирования: выбор значимых факторов, предварительная обработка данных, построение непараметрической модели k ближайших соседей, ее проверка и интерпретация результатов. Качество построенной модели подтверждено результатами открытого международного конкурса, на котором по критерию среднеквадратической ошибки модель показала второй по точности результат. Построенная модель позволит оптимизировать работу ветряных электрических установок в зависимости от погодных условий и нагрузки в энергетической системе.

Полный текст

Энергоэффективность и энергосбережение входят в пятерку приоритетных направлений технологического развития в России. Развивающиеся технологии использования альтернативных источников энергии способствуют рациональному использованию ресурсов и сокращению выбросов парниковых газов [1]. Одним из активно развивающихся направлений в энергетике в настоящее время являются ветряные электрические установки (ВЭУ). Россия обладает колоссальными возможностями для развития ветроэнергетики. В настоящее время на территории России экономически оправдано строительство ветряных электростанций суммарной мощностью до 250 млрд кВт/ч в год. Наиболее перспективными районами являются Дальневосточный регион, Сибирь, Крайний Север, а также территории Алтая, Нижней и Средней Волги, Каспийское побережье и Республика Карелия [2]. Эффективная эксплуатация ветряных электрических установок требует решения проблем, связанных с необходимостью оптимизации режимов их работы в рамках единой энергетической системы. В частности, возникает необходимость прогнозировать мощность, генерируемую ветряной электрической установкой. Постановка задачи и исходные данные взяты из открытого конкурса Global Energy Forecasting Competition 2012 [3]. Для прогноза выходной мощности семи ветряных электростанций используется следующий набор факторов: метеорологический прогноз, содержащий меридиональную и зональную компоненты скорости ветра (проекции скорости на меридиан и параллель, проходящие через ВЭУ), направление ветра, скорость ветра, и соответствующая прогнозу дата. Исходные данные представляют собой выборку, состоящую из 26 197 наблюдений за четырехлетний период. Прогнозы ветра поступают два раза в сутки, каждый прогноз представляет собой данные о ветре на ближайшие двое суток. По этой причине обучающая выборка содержит многократные прогнозы различной точности. Функционирование ВЭУ сопровождается длительными промежутками отключения или работы на пониженной мощности, связанными как с регламентными работами на станциях, так и с особыми метеорологическими условиями (например, обледенением). Причины каждого конкретного отклонения режима функционирования ВЭУ от нормального неизвестны, поэтому работа с выборкой крайне затруднительна. Мощность воздушного потока зависит не только от скорости, но и от плотности воздуха [4]. Мы не располагаем данными о параметрах, связанных с плотностью (температура, влажность и т. д.). Однако косвенно они могут быть связаны с порядковым номером дня в году (временем года) и временем суток [5]. Применим деревья регрессии [6] для принятия решения о включении факторов в модель. Построение бинарного дерева представляет собой пошаговую процедуру разбиения подмножеств обучающей выборки на две части гиперплоскостью, перпендикулярной оси выбранного фактора и проходящей через точку разбиения так, чтобы сумма дисперсий выходных значений в получаемых подмножествах была минимальна. Дерево регрессии позволяет последовательно разбивать имеющийся набор данных на подмножества с различными выборочными средними. Таким образом, разбиение по какому-либо фактору свидетельствует об изменении выборочной средней, а следовательно, о наличии некоторой зависимости выходной величины от этого фактора. По этой причине факторы, по которым проводились разбиения, будем считать значимыми. Рис. 1. Дерево регрессии для первой из семи ВЭУ: верхняя альтернатива - соблюдение неравенств, нижняя - нарушение; ws - скорость ветра; h - час; dy - порядковый номер дня в году; v - зональная компонента скорости ветра При построении дерева регрессии определяем следующее правило остановки: любое из полученных в результате разбиения подмножеств должно содержать не менее 500 выборочных значений. Данное правило предотвращает выбор факторов, существенных лишь для небольших подмножеств данных (менее 5 % обучающей выборки). Дерево регрессии для ветряной станции 1 изображено на рис. 1. В узлах дерева находятся условия, в соответствии с которыми осуществляется бинарное разделение выборки. В конечных узлах дерева указаны значения средних мощностей - выходных величин, соответствующих областей кусочно-постоянных аппроксимаций, которые представляют собой дерево. Первое разбиение было произведено по скорости ветра: для всех первого подмножества скорость ветра меньше 4,9 м/с (верхняя альтернатива), для всех точек второго - больше 4,9 м/с. Каждое из полученных подмножеств было в свою очередь разбито на два подмножества. Процесс продолжается, пока не нарушается требование к размеру минимального листа дерева. Для каждого подмножества итогового разбиения была вычислена средняя выходная мощность. Например, при условиях «скорость ветра меньше 2.1 м/с» и «порядковый номер часа в сутках меньше 12» средняя относительная мощность составляет 0,03, а при условиях «скорость ветра меньше 2,1 м/с» и «порядковый номер часа в сутках больше или равен 12» - 0,1. Значимость факторов Фактор ВЭУ 1 2 3 4 5 6 7 Зональная компонента скорости ветра - + + + - + + Меридиональная компонента скорости ветра + + + + + + + Направление ветра - + - - + - + Скорость ветра + + + + + + + Год - - - - + - - Месяц - - - - - - - День месяца - - - - - - - Час + + + + + + + День в году + + - - + + + В табл. знаком «+» отмечены факторы, по которым производились разбиения при построении деревьев для соответствующих ветряных установок (значимые факторы). Факторы, значимость которых была установлена в процессе построения деревьев регрессий для пяти и более ветряных установок, были включены в модель: х1 - зональная компонента скорости ветра; х2 -меридиональная компонента скорости ветра; X - скорость ветра; х4 - порядковый номер часа в сутках; х5 -порядковый номер дня в году. К этому набору факторов последовательно добавлялись скорости ветра в районах соседних установок: сначала фактор х6 должен в наибольшей степени улучшать качество модели, затем фактор х7 выбирается с тем же условием. I хр , Xq ) \хр Xq\ j = 1, 2, 3, 6, 7, ' = 1, 2, После выбора значимых факторов необходимо провести предварительную обработку данных. Электрические генераторы характеризуются монотонно возрастающей зависимостью выходной мощности от скорости ветра. Отдельные фрагменты в обучающей выборке противоречат этому теоретическому результату. Следовательно, предполагается наличие аномалий в измерениях соответствующих величин. Другое предположение заключается в том, что данные в этих областях получены во время нештатного функционирования ВЭУ. Были замечены два типичных случая аномальных данных: d4 {К ’ х4 ) = (24 - xp - х4 - высокая мощность при слабом ветре; - низкая мощность при сильном ветре. Первый случай может быть связан с ошибками в прогнозе погоды; второй - как с ошибками в прогнозах, так и с аномальным функционированием ветряной электростанции. Измерения, соответствующие перечисленным случаям, были исключены. К - 4 365 - Ixp - x5| '((■ x5 )=• Прогнозируемую величину (выходную мощность ВЭУ) обозначим у, объем выборки - n. Для предсказания выходной мощности использован непараметрический алгоритм k ближайших соседей [7; 8]. Выбор алгоритма обусловлен следующими причинами: - интерпретируемостью модели. Алгоритм к ближайших соседей позволяет осуществлять прогноз, основываясь на наиболее похожих ситуациях (ближайших соседях) в прошлом в соответствии с выбранным расстоянием. Прогнозирование выполняется простым или взвешенным усреднением выходных значений к ближайших соседей; - циклическим характером некоторых факторов. Среди факторов, включенных в модель, есть циклические (час и порядковый номер дня в году). Алгоритм к ближайших соседей может работать с ними (в отличии, например, от деревьев регрессии); - алгоритм не требует повторного обучения при поступлении новых данных. Поиск ближайших соседей будем осуществлять в соответствии со следующими метриками: 1. Метрика в пространстве одного фактора: ^ (хР , Xq ): р = 1, 2, где j - порядковые номера признаков, для которых метрика применима; р и q - порядковые номера наблюдений, упорядоченных по времени их поступления. 2. Метрика в пространстве одного циклического фактора: - порядковый номер часа в сутках: 4 4 xp - Xq Xp - Xq4 > 24 - X4p - Xq4 p = 1,2,..., n, q = 1,2,..., n; - порядковый номер дня в году: k - x5q\ > 365 - Xp - Xg\ p = 1,2,...,n, q = 1,2,..., n. прогнозирования (1.. .2 ч), однако она будет иметь большие ошибки при долгосрочных прогнозах (до A = 48 ч). При настройке параметров w и k исключаем A ближайших по времени к проверочному множеству наблюдений из обучающей выборки. Для оптимизации параметров модели (1) был использован следующий критерий: 3. Метрика в пространстве всех факторов взвешенную сумму метрик в пространстве одного фактора: 7 D (p , Xq , w) = S (Xp , Xq ) j=1 p = 1,2,...,n, q = 1,2,..., n, где w j - соответствующие различным признакам веса, подлежащие оптимизации в соответствии с критерием качества, который будет рассмотрен ниже. Модель k ближайших соседей имеет вид [7]: n ХФ(Х, Xq , w)yq у (х, w) = ^- Хф(х, Xq , w) q=l где ф(Х, Xq , w) = D (х, k, w) - D (х, Xq, w), D (x, Xq, w) < X(x,k), 0, D (x, xq, w) >X (x, k), здесь k - количество соседей, , k) - расстояние между х и k-м ближайшим соседом, yq - выходная мощность ВЭУ для выборочного элемента с индексом q. Анализ выборочных данных показал, что встречаются ситуации, когда метеорологические прогнозы слабо отличаются друг от друга в течение некоторого промежутка времени. Ближайшие по времени наблюдения, таким образом, будут являться заведомо «хорошими» соседями. Данный эффект приводит к занижению количества ближайших соседей и переобучению при оптимизации модели с использованием критерия Q-кратной кросс-проверки. Идея Q-кратной кросспроверки состоит в выделении в обучающей выборки (V) на Q непересекающихся подмножеств случайным Q Q образом (V, 1 = 1,2,..., Q, 0 V = V, ^VI = 0), поt=1 1=1 строении модели Q раз, при этом каждый раз одно из подмножеств не участвует в построении модели, а используется как тестовая выборка, ошибки Q моделей суммируются [9]: Q 2 £Z(y.-- -X( , w,V \ V) ^ min, (2) 1=1 геГ, w,k где n X Ф( , Xq , w)Xq у (х, w, V \ V, )= -. X ф(х , Xq , w) q=1 Xq «Vt Модель, оптимизированная по критерию (2), будет демонстрировать высокое качество краткосрочного XXX Уг- у (X, ^ Tt ))2 ^ mk1, 1 ieV, w,k V,=((х), Ул(1)), X Хл(, )+1, Ул(1 )+1),..., X Хл(,)+b-1 , yMi)+в-1)), 1 = 1, 2,..., S - проверочные множества, S - количест-(1) во проверочных множеств, Х(1 ) = n - S (A + B) + + XA + B)(1 -1), k ближайших соседей отыскиваются из тестовых множеств: Tt =((xq,yq):v(Xp,yp)e e V1 |q- p| > a) , q = 1, 2,..., n , p = 1, 2,..., n . Были использованы следующие параметры алгоритма кросс-проверки: B = 36; S = 155. Для любого w количество соседей k выбиралось методом полного перебора в диапазоне от 1 до 250. Оптимизация по параметрам w выполнялось с помощью модифицированного покоординатного спуска. С целью улучшения качества модели применялось сглаживание результатов прогнозирования по времени с использованием скользящего среднего: С Xу (х+г,w) y (xp ) = -. (3) v p! 2c+1 Ширина окна сглаживания c = 2 была выбрана из условия минимума критерия: XX(y- у Ххг ))2 ^ min. 1 ieV, c Если известны значения мощности ветряной установки в моменты времени p - 2 и p - 1 (yp-2 и yp-1), тогда будем использовать их вместо у (p-2) и у (Xp-1) в выражение (2). Процедура скользящего среднего приводит к уменьшению ошибок в модели, связанных с временными сдвигами прогноза погоды. Модель (3) была проверена на тестовой выборке [2]. Среднеквадратическая ошибка приняла значение 0,147 2. Так как прогнозируемая величина является нормированной, в процентном отношении ошибка составляет 14,72 %. Фрагмент сравнения выборочных значений мощности и выхода модели (3) представлен на рис. 2. При построении модели были последовательно использованы две процедуры усреднения: вначале -в пространстве факторов, затем - по времени, что привело к сглаживанию прогноза. Тем не менее модель позволяет определить положение практически всех экстремумов функции мощности от времени, а по значению среднеквадратической ошибки предложенная модель на конкурсе [3] заняла второе место. Проверочное множество Рис. 2. Сравнение выборки (пунктирная линия) и выхода модели (сплошная линия) для последних двадцати проверочных множеств Таким образом, построена непараметрическая модель k ближайших соседей. С использованием построенной модели решена задача прогнозирования мощности ветряных электрических установок. С использованием полученной модели могут быть решены задачи прогнозирования выходной мощности для индивидуальных ВЭУ. Качественный прогноз производства электроэнергии ветряными станциями совместно с прогнозом суточного потребления позволяет минимизировать расходы, связанные с использованием резервных мощностей: снизить сжигание органического топлива, уменьшить общее число вынужденных дорогостоящих запусков и остановок резервных тепловых электростанций. Резервным электростанциям требуется значительное время от запуска до начала генерации энергии. Прогнозирование выходной мощности ВЭУ позволит выводить резервные электростанции на требуемые мощности в случае необходимости заранее.
×

Об авторах

Е. Д. Агафонов

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева

Email: agafonov@gmx.de

Е. С. Мангалова

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева

Email: e.s.mangalova@hotmail.com

О. В. Шестернева

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева

Email: kuznetcova_o@mail.ru

Список литературы

  1. Энергоэффективные технологии «Сименс» в России [Электронный ресурс]. URL: http://w3.siemens.ru/ energy-efficiency/energy-efficiency.html (дата обращения: 08.02.2013).
  2. РБК Исследования рынков. Совокупная мощность ветряных электростанций России составила 15,4 МВт. [Электронный ресурс]. URL: http://marketing.rbc.ru/ news_research/24/10/2012/562949984996362.shtml (дата обращения: 08.02.2013).
  3. Global Energy Forecasting Competition 2012, wind forecasting [Electronic resource]. URL: http://www.kaggle.com/c/GEF2012-wind-forecasting (date of visit: 08.02.2013).
  4. Crogg K. Harvesting the Wind: The Physics of Wind Turbines [Electronic resource]. URL: https://dspace. lasrworks.org/bitstream/handle/10349/145/fulltext.pdf. Retrieved 2013-01-11 (date of visit: 08.02.2013).
  5. Global Energy Forecasting Competition 2012, Load Forecasting. Data files [Electronic resource]. URL: http://www.kaggle.com/c/global-energy-forecasting-competition-2012-load-forecasting/data (date of visit: 08.02.2013).
  6. Classification and Regression Trees / L. Breiman, J. H. Friedman, R. A. Olshen, C. J. Stone. Wadsworth Inc., 1984.
  7. Хардле В. Прикладная непараметрическая регрессия. М. : Мир, 1993.
  8. Зайцева Е. А., Бурулев Е. В., Медведев A. B. Непараметрические модели и алгоритмы принятия решений // Вестник СибГАУ. 2005. Вып. 6. С. 17-22.
  9. Воронцов К. В. Комбинаторный подход к оценке качества обучаемых алгоритмов // Математические вопросы кибернетики / под ред. О. Б. Лупанова. М. : Физматлит, 2004. T. 13. С. 5-36.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Агафонов Е.Д., Мангалова Е.С., Шестернева О.В., 2013

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах