MATHEMATICAL MODELLING OF MIGRATION IN KRASNOYARSK REGION


Cite item

Full Text

Abstract

Statistical analysis of human migration data in Krasnoyarsk region, from January 1998 till August 2010, is carried out. Equations on the basis of regressive, autoregressive analysis and modeling of periodic fluctuations, are constructed.

Full Text

Прогнозирование изменения численности населения является важнейшей задачей демографии, так как численность населения влияет на экономическое развитие как региона, так и страны в целом. Росстат при расчете прогнозов численности населения, миграционного прироста, продолжительности жизни и других показателей применяет компонентный метод (возрастных передвижек) [1, с. 495-496]. Данный метод использует показатели только текущего расчетного периода, что не обеспечивает точность прогноза, а только определяет тенденцию, исходя из ситуации, сложившейся в текущем периоде. Но для того чтобы проводить краткосрочные и долгосрочные экономические расчеты, осуществлять планирование инвестиций, развивать те или иные экономические и социальные сферы регионов страны, необходимо прогноз численности населения осуществлять как можно точнее. Миграция населения является одним из основных факторов динамики численности и структуры населения России и отдельных ее регионов. Правительство РФ выделяет в Концепции демографического развития РФ на период до 2015 г. [2] следующие основные задачи в области миграции и расселения: - регулирование миграционных потоков в целях создания действенных механизмов замещения естественной убыли населения Российской Федерации; - повышение эффективности использования миграционных потоков путем достижения соответствия их объемов, направлений и состава интересам социально-экономического развития Российской Федерации; - обеспечение интеграции мигрантов в российское общество и формирование толерантного к ним отношения. В интервью директора Института демографии Высшей школы экономики Анатолий Григорьевич Вишневским сказал: «Миграция сегодня - одна из самых острых проблем. Для многих природа роста миграции непонятна, и наша задача сделать видимыми те глубокие процессы, которые лежат в ее основе и которые уже нельзя изменить. И, соответственно, необходимо решать совершенно иные задачи - размышлять не о том, как остановить процесс, а о том, как его направить в «правильное» русло и контролировать» [3]. Анализ данных по иммиграции. Объектом статистического анализа являются абсолютные показатели иммиграции населения по Красноярскому краю. Временной ряд состоит из 152 значений внешней для региона иммиграции [4]. Данные представлены помесячно и охватывают период с января 1998 г. по август 2010 г. Наиболее часто встречающееся значение прибывших мигрантов равно 1 885. Среднее значение прибывших человек составляет 2 010. Значение 1 924 человек приходится на середину временного ряда прибывших мигрантов и делит его на две равные по числу единиц части. Всего на территорию Красноярского края с января 1998 г. по август 2010 г. прибыло 305 516 человек. При разбивке данных по годам (рис. 1) прослеживаются следующие тенденции: во второй половине года, по сравнению с первой, наблюдается подъем иммиграции, пик иммиграции приходится на сентябрь-октябрь, минимальное количество прибывших в основном приходится на январь и май. Это указывает на то, что иммиграционная активность населения совпадает с экономической и социальной активностью общества в осенний период. 79 Математика, механика, информатика Рис. 1. Число прибывших в Красноярский край человек: внешняя (для региона) миграция, линейная линия тренда Основными причинами приезда в Красноярский край в этот период являются смена работы и в связи с учебой. В остальное время иммиграция вызвана причинами личного характера - 47 %, сменой места работы - 21 %, возвращением к прежнему месту жительства - 15 % и в связи с учебой - 13 % (в среднем за период с 1998 по 2010 гг.) [4]. Проведем прогнозирование следующими способами: - выявим линейный тренд и построим скользящее среднее для остатков; - построим уравнение авторегрессии для исходных данных; - выделим сезонность и циклы в исходных данных. 1. Построим линейный тренд для данного ряда, отражающий тенденцию изменения количества иммигрантов в Красноярском крае. По методу наименьших квадратов [5, с. 24] уравнение регрессии для исходных данных yt имеет вид: yt =-3,49t + 2276,87, при R2 = 0,087, где t - номер месяца от 1 до 152. Коэффициенты уравнения регрессии статистически значимы, следовательно, данный ряд имеет тренд. Проанализируем остатки et = yt - yt на наличие гете- роскедастичности. Тест Голфелда-Квандта [5, с. 78-79] показал, что, применительно к остаткам, гипотеза об отсутствии гетероскедастичности принимается. Поскольку среди остатков наблюдается автокорреляция, то построим уравнение авторегрессии скользящего среднего для остатков: et = 0,50et-1 + 0,73et-12 - 0,33et-Ш при R2 = 0,803. По тесту Дикки-Фуллера [5, с. 261-271] временной ряд et является стационарным. Тогда мы получим уравнение, описывающее исходные данные yt: yt = -3,49t + 0,50et , + t 1 (1) + 0,73et-12 -0,33et-13 + 2276,87. 2. Построим уравнение авторегрессии для исходных данных yt: yt = 0,46yt-j + 0,73yt-12 - 0,30et-13 +196, при R2 = 0,807. (2) Так как по тесту Дикки-Фуллера временной ряд yt стационарный, то данный вывод противоречит тому, что ряд yt имеет тренд. В рассмотренном случае наклон линии регрессии к оси абсцисс минимален, что объясняет возникшее противоречие. По виду полученных уравнений можно увидеть сезонность, равную 12 месяцам. Одним из методов моделирования временного ряда с периодическими колебаниями является ряд Фурье [5, с. 159]: = 2л p ’ где p - период. По ряду с тенденцией сначала строится прогноз, исходя из тенденции развития уровней ряда, и далее к нему прибавляется прогноз по ряду Фурье отклонений от тренда. В результате применения данного метода мы выделили сезонность: at = 99,8cos(wjt) - 432,1sin(wjt), где w1 = 0,523 при периоде = 12 месяцев, при R2 = 0,395. Тогда уравнение примет вид yt =-3,49t + 2276,87 + 99,8cos(wjt)-432,1sin(wjt) . По графику остатков можно вычислить 11-летний цикл. Для этого воспользуемся предыдущим методом. Произведем расчеты для периодов, равных 9, 10 и 11 лет. В результате при периоде, равном 10-ти годам, R2 имеет наибольшее значение, равное 0,519. Тогда сезонность будет составлять: bt = 327 cos(w2t ) + 205,9 sin(w2t ) - 68,9, где w2 = 0,052 при периоде = 120 месяцев, или 10 лет, при R2 = 0,519. 80 Вестник Сибирского государственного аэрокосмического университета имени академика М. Ф. Решетнева Произведем расчет для периода равного, 13-ти месяцам: ct = -68,95 cos(w3t ) - 89,12 sin(w3t), где w3 = 0,483 при периоде = 13 месяцев, при R2 = 0,089. В результате уравнение примет вид: yt = -3,49t + 2276,87 + 99,8 cos(wy) - 432,1 sin(wjt) + + 327 cos(w2t ) + 205,9 sin(w2t ) - 68,9 - 68,95 cos( w3t) - - 89,12 sin(w3t ) = -3,49t + 99,8 cos(wjt ) - 432,1 sin(wjt ) + + 327 cos(w2t ) + 205,9 sin(w2t ) - 68,95 cos(w3t ) - - 89,12sin(w3t ) + 2207,97. (3) Таким образом, мы получили три уравнения, описывающие исходные данные. Сделаем прогноз на последующие четыре месяца (рис. 2). Графики уравнений (1) и (2) практически идентичны. График уравнения (3) имеет очень усредненный и сглаженный вид по отношению к исходному. Оценить эти прогнозы визуально очень сложно, поэтому для сравнения различных альтернативных прогнозов необходим критерий оценки качества прогноза. В качестве меры оценки точности прогноза воспользуемся традиционным показателем MAPE (Mean Absolute Percentage Error - среднеабсолютная процентная ошибка), а для оценки относительной степени смещения (постоянного занижения или завышения) прогноза - показателем MPE (Mean Percentage Error - средняя процентная ошибка) [6, с. 190]. Показатель MAPE характеризует относительную точность прогноза, MAPE > 0. При условии, что потери при прогнозировании, связанные с завышением фактического будущего значения, уравновешиваются занижением, идеальный прогноз должен быть несмещенным, и MPE должна стремиться к нулю. Для рассматриваемых периодов получены значения ошибок MAPE и MPE (табл. 1). В результате анализа качества прогнозирования иммиграции с использованием различных методов было установлено, что ни один из методов нельзя назвать предпочтительным. Все три прогноза хорошо совпадают. В среднем методы (1) и (2) показали результат лучше, чем метод (3). В качестве результата можно использовать среднее значение прогнозов. Анализ исходных данных по иммиграции за 12-летний период показывает наличие годичных периодов, а также наблюдается 10-летний период. По известным данным невозможно установить, повторится ли 10-летний период изменения иммиграции в будущем. Линия тренда указывает на постепенное снижение количества прибывающего населения на территорию Красноярского края. На данном этапе иммиграция идет постепенно на спад после пика в 2007 г., когда число прибывших мигрантов составило 26 034 человек за год, что объясняется экономическими потрясениями 2008-2009 гг. (рис. 3). Опираясь на полученные результаты прогнозирования можно сделать утверждение о том, что тенденция к сокращению сохранится. Анализ данных по эмиграции. Объектом статистического анализа являются абсолютные показатели эмиграции населения по Красноярскому краю. Временной ряд состоит из 152 значений внешней для региона эмиграции [4]. Данные представлены помесячно и охватывают период с января 1998 г. по август 2010 г. Наиболее часто встречающееся значение выбывших мигрантов равно 1 635. Среднее значение выбывших человек составляет 2 270. _^ ^ _ сентябрь октябрь ноябрь декабрь Да иствительные з наче ния Прогноз! — — — Прогноз 2 ‘прогноз 3 Рис. 2. Результаты прогнозирования иммиграции в Красноярском крае на сентябрь, октябрь, ноябрь, декабрь 2010 г. Таблица 1 Результаты прогнозирования и значения ошибок эксперимента Прогноз/период сентябрь октябрь ноябрь декабрь MAPE, % MPE, % Действительные значения 2893 3076 2356 1743 Прогноз 1 2356 2593 2122 1740 11,09 11,09 Прогноз 2 2376 2633 2188 1830 11,11 8,60 Прогноз 3 2351 2298 2119 1855 15,13 11,93 81 Математика, механика, информатика Рис. 3. Число прибывших человек за год в Красноярский край с 1998 по 2010 гг. Рис. 4. Число выбывших из Красноярского края человек: внешняя (для региона) миграция, линейная линия тренда Значение 2 172 приходится на середину временного ряда выбывших мигрантов и делит его на две равные по числу единиц части. Всего из Красноярского края с января 1998 г. по август 2010 г. выбыло 345 084 человек. При разбивке данных по годам (рис. 4) прослеживаются следующие тенденции: во второй половине года, по сравнению с первой, наблюдается подъем эмиграции, пик эмиграции приходится на август и сентябрь, минимальное количество выбывших в основном приходится на январь, февраль и май. Это указывает на то, что эмиграционная активность населения также совпадает с экономической и социальной активностью общества в осенний период. Основными причинами выезда из Красноярского края в этот период является смена работы и в связи с учебой. В остальное время эмиграция вызвана: причинами личного характера - 57 %, сменой места работы - 11 %, возвращением к прежнему месту жительства - 18 % и в связи с учебой - 8 % (в среднем за период с 1998 по 2010 гг.) [4]. Проведем прогнозирование следующими способами (аналогичными анализу данных по иммиграции): - выявим линейный тренд и построим скользящее среднее для остатков; - построим уравнение авторегрессии для исходных данных; - выделим сезонность и циклы в исходных данных. 1. Построим линейный тренд для данного ряда, отражающий тенденцию изменения количества эмигрантов в Красноярском крае. По методу наименьших квадратов [5, с. 24] уравнение регрессии для исходных данных yt имеет вид yt =-8,48t + 2918,68, при R2 = 0,370, где t - номер месяца от 1 до 152. Коэффициенты уравнения регрессии статистически значимы, следовательно, данный ряд имеет тренд. Проанализируем остатки et = yt - yt на наличие гетероскедастичности. Тест Голфелда-Квандта показал, что применительно к остаткам гипотеза об отсутствии гетероскедастичности принимается. Поскольку среди остатков наблюдается автокорреляция, то построим уравнение авторегрессии скользящего среднего для остатков: et = 0,73et-1 + 0,75et-12 - 0,54et-Ш при R2 = 0,868. 82 Вестник Сибирского государственного аэрокосмического университета имени академика М. Ф. Решетнева По тесту Дикки-Фуллера временной ряд et является стационарным. Тогда мы получим следующее уравнение, описывающее исходные данные yt: yt = -8,48t + 0,73et-1 + 0,75et-12 - - 0,54et-13 + 2918,68. (4) 2. Построим уравнение авторегрессии для исходных данных yt: yt = 0,75yt-1 + 0,19yt-11 + 0,53yt-12 -0,48Уt-lз, (5) при R2 = 0,913. Так как по тесту Дикки-Фуллера временной ряд yt стационарный, то данный вывод противоречит тому, что ряд yt имеет тренд. В рассмотренном случае наклон линии регрессии к оси абсцисс минимален, что объясняет возникшее противоречие. По виду полученных уравнений можно увидеть сезонность, равную 12 месяцам. Одним из методов моделирования временного ряда с периодическими колебаниями является ряд Фурье [5, с. 159]: 2л где p - период. По ряду с тенденцией сначала строится прогноз, исходя из тенденции развития уровней ряда, и далее к нему прибавляется прогноз по ряду Фурье отклонений от тренда. В результате применения данного метода мы выделили сезонность: at = -94,76cos(w1t) - 546,47sin(w1t), где w1 = 0,655 при периоде = 12 месяцев, при R = 0,654. Тогда уравнение примет вид: yt = -8,48t + 2918,68 - 94,76cos(w1t) - 546,47sin(w1t). По графику остатков можно отлечить период, равный 7 годам. Для вычисления этого периода воспользуемся предыдущим методом. Произведем расчеты для периодов 6, 7 и 8 лет. В результате при периоде, равном 7-ми годам, R2 имеет наибольшее значение, равное 0,157, тогда сезонность составит: bt = 147,52sin(w2t ), где w2 = 0,076 при периоде = 83 месяца, или 7-ми годам, при R2 = 0,157. В результате уравнение примет вид: yt = -8,48t + 2918,68 - 94,76 cos(w1t) - 546,47 sin(w1t) + +147,52 sin(w2t ) = -8,48t - 94,76 cos(w1t ) - - 546,47 sin(w1t) +147,52 sin(w2t) + 2918,68. (6) Таким образом, мы получили три уравнения, описывающие исходные данные. Сделаем прогноз на последующие четыре месяца (рис. 5). Графики уравнений (4) и (5) практически идентичны. В качестве меры оценки точности прогноза воспользуемся указанными выше показателями MAPE и MPE. Для рассматриваемых периодов получены значения ошибок MAPE и MPE (табл. 2). В результате анализа качества прогнозирования эмиграции с использованием различных методов было установлено, что прогнозы (1) и (2) показали лучший результат. Прогноз (3) показал самый худший результат. В качестве результата можно использовать среднее значение прогнозов (1) и (2). Рис. 5. Результаты прогнозирования эмиграции в Красноярском крае на сентябрь, октябрь, ноябрь, декабрь 2010 г. Результаты прогнозирования и значения ошибок эксперимента Таблица 2 w Прогноз/период сентябрь октябрь ноябрь декабрь MAPE, % MPE, % Действительные значения 2247 2068 2000 1751 Прогноз 1 2305 2087 1746 1587 6,39 4,64 Прогноз 2 2300 2079 1785 1603 5,52 4,08 Прогноз 3 1582 1230 990 962 41,42 41,42 83 Математика, механика, информатика Рис. 6. Число выбывших человек за год из Красноярского края с 1998 по 2010 гг. Анализ исходных данных по эмиграции за 12-летний период показывает наличие годичных периодов, а также прослеживается 7-летний период. По известным данным невозможно установить повторится ли 7-летний период изменения эмиграции в будущем. Линия тренда указывает на снижение количества уезжающего населения из Красноярского края, но по сравнению со снижением иммиграции эмиграция снижается в два раза быстрее. В 2010 г. в эмиграции наблюдается небольшой подъем после минимума в 2009 г., когда число выбывших людей составило 20 654 человек за год, что также объясняется экономическими потрясениями 2008-2009 гг. (рис. 6). Опираясь на полученные результаты прогнозирования можно сделать утверждение о том, что общая тенденция к сокращению миграции сохранится. Следует отметить, что существует также нелегальная миграция, которая не учитывается в официальных статистических данных Росстата. В данном исследовании нет возможности учесть эту миграцию в связи с тем, что официальных оценок ее масштаба на территории Красноярского края не дается. Таким образом, для эффективного прогнозирования миграционных процессов в Красноярском крае в дополнение к анализу статистических данных необходимо выявление и точная оценка факторов, влияющих на изменение числа прибывающих и выбывающих людей. В дальнейшем планируется выявлять факторы, взаимосвязанные с миграцией, с целью построения модели прогноза миграции населения в Красноярском крае.
×

About the authors

E. Yu. Fedorova

Email: f.katya@mail.ru

References

  1. Демографический ежегодник России : стат. сб., 2010. M. : Росстат, 2010.
  2. Концепция демографического развития РФ на период до 2015 года [Электронный ресурс] // Демоскоп: сайт. URL: http://demoscope.ru/weekly/ knigi/koncepciya/koncepciya.html (дата обращения: 01.08.2011).
  3. Миграция сегодня - одна из самых острых проблем [Электронный ресурс] // Высшая школа экономики: сайт. URL: http://www.hse.ru/news/avant/ 36305898.html (дата обращения: 15.10.2011).
  4. Центральная база статистических данных Федеральной службы государственной статистики РФ [Электронный ресурс] // Федеральная служба государственной статистики РФ: сайт. URL: http://www.gks.ru/dbscripts/Cbsd/DBInet.cgi (дата обращения: 20.01.2011).
  5. Елисеева И. И. Эконометрика : учебник. М. : Проспект, 2011.
  6. Ежов А. А., Шумский С. А. Нейрокомпьютинг и его применение в экономике и бизнесе : учебник. М. : МИФИ, 1998.

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2012 Fedorova E.Y.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies