Моделирование товарооборота кофеен на основе пространственных данных

Обложка
  • Авторы: Иванов И.Д.1, Аблязина Н.Х.2, Гринева Н.В.3
  • Учреждения:
    1. ООО «БСТ Диджитал»
    2. Российская академия народного хозяйства и государственной службы при Президенте Российской Федерации
    3. Финансовый университет при Правительстве Российской Федерации
  • Выпуск: Том 19, № 3 (2023)
  • Страницы: 167-178
  • Раздел: Математические, статистические и инструментальные методы в экономике
  • URL: https://journals.eco-vector.com/2541-8025/article/view/568347
  • EDN: https://elibrary.ru/MFRRXN
  • ID: 568347

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Доступ платный или только для подписчиков

Аннотация

Актуальность статьи заключается в важности задачи размещения для экономических показателей организаций и росте в последние годы интереса к применению пространственных данных в системах поддержки принятия решений. Целью работы является моделирование оценки влияния значимых пространственных факторов для прогнозирования товарооборота кофеен. В рамках статьи проанализированы некоторые подходы, где сочетаются пространственные данные с машинным обучением для решения задачи размещения. Осуществлен корреляционный анализ пространственных данных. Произведен многоступенчатый отбор факторов для двух наборов, релевантных для разных типов моделей. Произведен подбор гиперпараметров для выбранных методов моделирования (линейная регрессия, решающее дерево, случайный лес, градиентный бустинг) и проведено построение моделей. Главными инструментами стали язык программирования Python и его библиотеки pandas, sklearn, XGBoost, hyperopt, shap, boostaroota. Проведен анализ полученных результатов и выделена модель на основе градиентного бустинга как оптимальная с точки зрения точности и интерпретации. Результатом работы является созданный подход к моделированию экономических показателей компании при помощи машинного обучения на основе пространственных данных.

Полный текст

Доступ закрыт

Об авторах

Иван Дмитриевич Иванов

ООО «БСТ Диджитал»

Email: ivanzivanov@yandex.ru
ORCID iD: 0009-0007-7496-3212

руководитель

Россия, Москва

Наиля Хамитовна Аблязина

Российская академия народного хозяйства и государственной службы при Президенте Российской Федерации

Email: nellykluchkovskaya@gmail.com
ORCID iD: 0009-0007-2208-3782
SPIN-код: 1145-0772

Институт ЭМИТ

Россия, Москва

Наталья Владимировна Гринева

Финансовый университет при Правительстве Российской Федерации

Автор, ответственный за переписку.
Email: ngrineva@fa.ru
ORCID iD: 0000-0001-7647-5967
SPIN-код: 1140-9636

кандидат экономических наук, доцент, доцент Департамента анализа данных и машинного обучения

Россия, Москва

Список литературы

  1. Ананьев А. Ю., Гаевой С. В., Островский А. А. Применение геоэкономического имитационного моделирования для решения задач малого и среднего бизнеса // Известия Волгоградского государственного технического университета. —2011. —№. 11. —С. 73–76.
  2. Булычев Д. М. Прогнозирование результатов экспертного оценивания точек продаж с помощью нейронной сети // Вестник Российского нового университета. Серия: Сложные системы: модели, анализ и управление. —2019. —№. 4. —С. 65–74.
  3. Калинкина Г. Е., Маратканов С. В., Габдуллин В. М. Количественная оценка спроса в целях поиска максимально эффективных мест расположения предприятий торговли с помощью геомаркетинга // Вестник Ижевского государственного технического университета. —2012. —№. 4. —С. 57–60.
  4. Наумов А. С., Рубанов И. Н., Аблязина Н. Х. Новые подходы к типологии сельских территорий России //Вестник Московского университета. Серия 5. География. —2021. —№. 4. —С. 12–24.
  5. Тахтаров И. А., Сергеев А. В. Разработка и исследование технологии геомаркетинга на основе транспортных факторов и нелинейной регрессионной модели // Сборник трудов III международной конференции и молодежной школы «Информационные технологии и нанотехнологии» (ИТНТ-2017). —Самара: Новая техника. —2017. —С. 702–706.
  6. ЦИАН. URL: https://www.cian.ru/ (дата обращения: 20.09.2022).
  7. Яндекс.Карты. URL: https://yandex.ru/maps/ (дата обращения: 25.05.2022).
  8. Burges C. et al. Learning to rank using gradient descent // Proceedings of the 22nd international conference on Machine learning. —2005. —С. 89–96.
  9. Karamshuk D. et al. Geo-spotting: mining online location-based services for optimal retail store placement // Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. —2013. —С. 793–801.
  10. Kursa M. B., Rudnicki W. R. Feature selection with the Boruta package // Journal of statistical software. —2010. —Т. 36. —С. 1–13.
  11. Liu Y. et al. DeepStore: An interaction-aware wide&deep model for store site recommendation with attentional spatial embeddings // IEEE Internet of Things Journal. —2019. —Т. 6. —№. 4. —С. 7319–7333.
  12. Yin H. et al. LCARS: a location-content-aware recommender system // Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. —2013. —С. 221–229.
  13. Revealing the ‘Where’ of Business Intelligence using Location Analytics / Esri. 2012. URL: https://www.esri.com/content/dam/esrisites/sitecore-archive/Files/Pdfs/library/whitepapers/pdfs/business-intelligence-location-analytics.pdf (дата обращения: 21.05.2022).

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Значения корреляций целевой переменной с различными факторами, со значением корреляции по модулю больше 0,4

Скачать (63KB)
3. Рис. 2. Взаимосвязь фактора «Суммарный мобильный трафик по средней доходной группе в радиусе 700 м» с целевой переменной

Скачать (37KB)
4. Рис. 3. Взаимосвязь фактора «Пешеходный трафик в радиусе 140 м» с целевой переменной

Скачать (33KB)
5. Рис. 4. Взаимосвязь фактора «Средняя цена квадратного метра в радиусе 300 м» с целевой переменной

Скачать (32KB)
6. Рис. 5. Взаимосвязь фактора «Рейтинг покупательской активности объектов в категории «Косметика» в радиусе 500 м» с целевой переменной

Скачать (40KB)
7. Рис. 6. Взаимосвязь фактора «Суммарное количество объектов в категории «ВУЗы» в радиусе 500 м» с целевой переменной

Скачать (44KB)
8. Рис. 7. Взаимосвязь фактора «Среднее количество объектов в категории «Пункты выдачи» в радиусе 5 м» с целевой переменной

Скачать (37KB)
9. Рис. 8. Взаимосвязь фактора «Утренний автомобильный трафик работающих в радиусе 300 м» с целевой переменной

Скачать (46KB)
10. Рис. 9. Алгоритм предсказания моделью решающего дерева

Скачать (30KB)
11. Рис. 10. Интерпретация модели случайного леса

Скачать (65KB)
12. Рис. 11. Интерпретация модели градиентного бустинга

Скачать (76KB)


Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах