Construction of a piece-linear autoregression model of an arbitrary order

Cover Page

Cite item

Full Text

Abstract

The relevance of the study is due to the need to expand the arsenal of forms of communication between variables in regression models.

Object: piecewise linear autoregressive model of arbitrary order.

Subject: computing apparatus for solving problems of linear-Boolean programming.

Purpose: development of an algorithm for estimating the parameters of piecewise linear regression.

Methods: regression analysis, mathematical programming.

Results: the paper formulated the problem of constructing a piecewise linear autoregressive model of an arbitrary order based on the method of least modules. An algorithm for solving it is proposed, which reduces to a linear Boolean programming problem of acceptable dimension for real applied problems. A piecewise linear autoregressive model of housing provision based on the statistical information of the Irkutsk region has been developed, which has a high adequacy. The model can be successfully used in solving various predictive problems. Keywords: regression model, autoregression, least modules method, linear Boolean programming problem, housing supply.

Full Text

Введение

Весьма часто при построении математических моделей динамических процессов самой различной природы успешно применяются авторегрессионные соотношения, в правые части которых включаются значения зависимых переменных в прошлые по отношению к текущему моменты времени (или за прошлые периоды времени). Так, в работе [1] с помощью авторегрессионной нейронной сети изучается влияние 66 климатических факторов на спрос на электроэнергию. В [2] с использованием векторной авторегрессионной модели, а также реальной и номинальной кривых Нельсона – Зигеля изучается доходность активов. Получены важные результаты, показывающие, что отсроченные аннуитеты с защитой от инфляции важны при наличии риска реального трудового дохода, однако так называемые номинальные отсроченные аннуитеты покупаются как более дешевая альтернатива, если реальная доходность низка или отрицательна. В статье [3] на основе модели авторегрессионного интегрированного скользящего среднего исследуются будущие цены на интеллектуальные системы, позволяя предлагать более доступные товары и услуги. Работа [4] посвящена созданию авторегрессионной модели первого порядка для нерегулярных дискретных временных рядов при изучении разных типов сверхновых, обнаружении и характеристике внесолнечных планет и классифицировании звезд. Весьма интересным представляется исследование [5], в котором изучается вопрос снижения зависимости Саудовской Аравии от нефти и диверсификации ее экономики. Рассматриваются данные о ценах на нефть и инвестициях в акции исламских государств, оценивается их взаимодействие и взаимовлияние с помощью векторного авторегрессионного моделирования и оценки функции импульсного отклика.

Результаты и обсуждение

Пусть поведение некоторого динамического процесса описывается зависимой переменной yt,t=1,n¯ . Тогда линейная авторегрессионная модель порядка p представима в виде:

yt=i=1pαiyti+εt,  t=p+1,n¯, (1)

где αi, i=1,p¯ – подлежащие оцениванию параметры,εt , i=p+1,n¯ – ошибки аппроксимации, не имеющие вероятностной природы. Таким образом, на значения переменной у в момент времени t (или за период времени t) влияют ее прошлые значения до момента t-p включительно. Отметим, что проблемам построения авторегрессионных моделей посвящена обширная литература (см., например, [6–8]).

В настоящей работе мы займемся решением проблемы построения кусочно-линейной авторегрессии произвольного порядка p, имеющей вид

yt=minα1yt1,α2yt2,...,αpytp+εt,t=p+1,n¯. (2)

При этом потребуем выполнения условия n-p > p (длина выборки данных должна быть больше числа оцениваемых параметров).

Введем следующие обозначения:

zt=minα1yt1,α2yt2,...,αpytp,t=p+1,n¯. (3)

Тогда модель (2) представима в виде:

yt=zt+εt.

Неизвестные параметры αi, i=1,p¯ будем оценивать посредством реализации метода наименьших модулей (МНМ), минимизируя функцию J α:

Jα=t=p+1n|ytzt|​ min. (4)

Следует указать, что построению кусочно-линейной регрессии методом наименьших квадратов с произвольными независимыми переменными посвящены, в частности, работы [9, 10].

Для решения задачи (4) воспользуемся подходом, развитым в работах [11– 14] при использовании МНМ для построения кусочно-линейных многофакторных регрессий.

Введем в рассмотрение переменные  и  следующим образом:

ut=ytzt,  yt>zt0,  впротивномслучае,

vt=ztyt,  zt>yt0,  впротивномслучае.

Тогда будут справедливы тождества

zt+utvt=yt,t=p+1,n¯. (5)

Из соотношения (3) следует справедливость неравенств

ztαiyti,t=p+1,n¯,i=1,p¯, (6)

причем для каждого t по крайней мере одно из них должно обращаться в строгое равенство.

Для достижения последнего условия введем в рассмотрение (np)p булевых переменных σti, t=p+1,n¯, i=1,p¯ и сформируем ограничения:

αiytizt1σtiM,t=p+1,n¯,i=1,p¯, (7)

i=1pσti=1,  t=p+1,n¯, (8)

σti{0,1},  t=p+1,n¯,  i=1,p¯, (9)

где M – заранее выбранное большое положительное число.

Из определения переменных ut и vt следуют следующие равенства

εt=ut+vt,  utvt=0,

что позволяет представить задачу (4) в виде

Jα=t=p+1nut+vtmin. (10)

Таким образом, задача (4) поиска значений неизвестных параметров αi, i=1,p¯ кусочно-линейной авторегрессии (2) с помощью МНМ свелась к задаче линейно-булевого программирования (5) – (10) с (np)p+3(np)+p переменными (из которых (np)p – булевы) и 2((np)p+np) ограничениями.

Важнейшим социальным индикатором эффективности функционирования любого региона является общая площадь жилых помещений, приходящаяся в среднем на одного жителя, выраженная в квадратных метрах. Построим кусочно-линейную авторегрессионную модель (2) динамики этого показателя на основе статистической информации по Иркутской области [15] за 1995–2020 годы (рисунок).

 

Рисунок – Динамика переменной у за 1995–2020 годы

 

Решение задачи (5) – (10) с этими исходными данными позволяет представить модель (2) в виде кусочно-линейной авторегрессии третьего порядка:

yt=min1.016yt1,1.054yt2,1.083yt3,  t=4,26¯, (11)

Е=0.77, КСП=18.                                    

Здесь в качестве критериев оценки адекватности модели использованы средняя относительная ошибка аппроксимации Е и критерий согласованности поведения расчетных и фактических значений зависимой переменной КСП (см., например, [16]):

E=100%npt=p+1n|ytzt|yt,                                  

КСП=t=p+2nsign[(ytyt1)(ztzt1)],                         

где

sign(a)=1,  a00,  впротивномслучае.                                                                    

Как следует из значений Е и КСП, модель (11) обладает весьма высокими аппроксимационными характеристиками. Ее анализ позволяет сделать вывод об увеличении значения параметра с ростом порядка авторегрессионной составляющей, что вполне согласуется с динамикой переменной у, представленной на рис. 1.

Кусочно-линейная авторегрессионная модель (11) обеспеченности жильем в Иркутской области может быть успешно использована при решении различных проблем прогнозного характера.

Заключение и выводы

В работе описан способ построения кусочно-линейной авторегрессионной модели произвольного порядка методом наименьших модулей. Показано, что оценивание ее параметров может быть сведено к задаче линейно-булевого программирования. Построена кусочно-линейная авторегрессионная модель обеспеченности жильем на статистическом материале Иркутской области, обладающая высокими аппроксимационными характеристиками. Модель может быть успешно использована при решении различных прогнозных проблем.

×

About the authors

Sergey I. Noskov

Irkutsk State Railway University

Author for correspondence.
Email: sergey.noskov.57@mail.ru

Doctor of Technical Sciences Professor of the Department
of Information Systems and Information Security

Russian Federation, Irkutsk

References

  1. Chreng, K. Electricity demand prediction for sustainable development in Cambodia using recurrent neural networks with ERA5 reanalysis climate variables / K. Chreng, H. S. Lee, S. Tuy // Energy Reports. – 2022. – № 8. – Р. 76–81.
  2. Owadally, I. Optimal investment for a retirement plan with deferred annuities allowing for inflation and labour income risk / I. Owadally, C. Jang, A. Clare // European Journal of Operational Research. – 2021. – № 3 (295). – Р. 1132–1146.
  3. Forecasting E-commerce products prices by combining an autoregressive integrated moving average (ARIMA) model and Google Trends data / S. Carta, A. Medda, A. Pili, [et al.] // Future Internet. – 2018. – № 1 (11). – Р. 5–11.
  4. Eyheramendy, S. An irregular discrete time series model to identify residuals with autocorrelation in astronomical light curves / S. Eyheramendy, F. Elorrieta, W. Palma // Monthly Notices of the Royal Astronomical Society. – 2018. – № 4 (481). – Р. 4311–4322.
  5. Jawadi, F. Toward a new deal for Saudi Arabia: oil or Islamic stock market investment? / F. Jawadi, N. Jawadi, A. I. Cheffou // Applied Economics. – 2018. – № 50 (59). – Р. 6355–6363.
  6. Драница, Ю. П. Быстрый алгоритм построения нестационарной векторной линейной авторегрессии / Ю. П. Драница, А. Ю. Драница, О. В. Алексеевская. – Текст : непосредственный // Дифференциальные уравнения и процессы управления. – 2011. – № 4. – С. 138–177.
  7. Тырсин, А. Н. Построение моделей авторегрессии временных рядов при наличии помех / А. Н. Тырсин. – Текст : непосредственный // Математическое моделирование. – 2005. – Т. 17, № 5. – С. 10–16.
  8. Гельру, Я. Д. Векторная модель авторегрессии показателей производственной деятельности строительного предприятия / Я. Д. Гельруд, Е. А. Угрюмов, В. Л. Рыбак. – Текст : непосредственный // Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика. – 2018. – Т. 7, № 3. – С. 19–30.
  9. Базилевский, М. П. Исследование возможности построения кусочно-линейных регрессий с нелинейными границами переключения / М. П. Базилевский. – Текст : непосредственный // System Analysis and Mathematical Modeling. – 2021. – Т. 3, № 2. – С. 99–112.
  10. Базилевский, М. П. МНК-оценивание параметров специфицированных на основе функций Леонтьева двухфакторных моделей регрессии / М. П. Базилевский. – Текст : непосредственный // Южно-Сибирский научный вестник. – 2019. – № 2 (26). – С. 66–70.
  11. Носков, С. И. Оценивание параметров аппроксимирующей функции с постоянными пропорциями / С. И. Носков. – Текст : непосредственный // Современные технологии. Системный анализ. Моделирование. – 2013. – № 2 (38). – С. 135–136.
  12. Иванова, Н. К. Идентификация параметров некоторых негладких регрессий / Н. К. Иванова, С. А. Лебедева, С. И. Носков. – Текст : непосредственный // Информационные технологии и проблемы математического моделирования сложных систем. – 2016. – № 17. – С. 107–110.
  13. Носков, С. И. Идентификация параметров кусочно-линейной регрессии / С. И. Носков, Р. В. Лоншаков. – Текст : непосредственный // Информационные технологии и проблемы математического моделирования сложных систем. – 2008. – № 6. – С. 63–64.
  14. Базилевский, М. П. Алгоритм построения линейно-мультипликативной регрессии / М. П. Базилевский, С. И. Носков. – Текст : непосредственный // Современные технологии. Системный анализ. Моделирование. – 2011. – № 1 (29). – С. 88–92.
  15. Федеральная служба государственной статистики. – URL: https://rosstat.gov.ru/folder/210/document/13205 (дата обращения: 09.06.2022). – Текст : электронный.
  16. Носков, С. И. Обобщенный критерий согласованности поведения в регрессионном анализе / С. И. Носков. – Текст : непосредственный // Информационные технологии и математическое моделирование в управлении сложными системами. – 2018. – № 1 (1).– С. 14–20.

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Figure – Dynamics of the variable y for 1995-2020

Download (35KB)

Copyright (c) 2022 Yugra State University

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies