Group Gamma-Distribution and Neural Network in of the Latest Telecommunication Traffic Modeling

Boris Ya. Likhttsinder; Лихтциндер Борис Яковлевич; Alexander Yu. Privalov; Привалов Александр Юрьевич; Tatiana D. Maksimova; Максимова Татьяна Дмитриевна

doi:10.18469/ikt.2023.21.4.04

Group Gamma-Distribution and Neural Network in of the Latest Telecommunication Traffic Modeling

Authors: Likhttsinder B.Y.¹, Privalov A.Y.², Maksimova T.D.¹
Affiliations:
1. Povolzhskiy State University of Telecommunications and Informatics
2. Samara National Research University
Issue: Vol 21, No 4 (2023)
Pages: 23-29
Section: Telecommunication Systems and Devices
URL: https://journals.eco-vector.com/2073-3909/article/view/635112
DOI: https://doi.org/10.18469/ikt.2023.21.4.04
ID: 635112

Cite item

Full Text

Abstract
Full Text
About the authors
References
Supplementary files
Statistics

Abstract

This article considers queue formation in the M/D/1 system with statistical characteristics of the first two orders that areclose to real, as the purpose of telecommunication traffic modeling. The input stream to the system is considered to be a group stream with constant parameters of the package and distance between arrivals, influenced by gamma distribution. These parameters are determined by a neural network trained to determine parameters of such input streams according to statistical characteristics of the queue at various loads of device. The results obtained demonstrate a good ap-proximation with the use of gamma-ray fluxes. Parameters are evaluated with the use of the neural network. The practical usefulness of the considered approach and the prospects of using neural net-works for practical tasks in solving which queue theory is used are provided.

Keywords

queuing system, not ordinary entrance stream, queue moments, neural network, gamma distribution

Full Text

Введение

При моделировании сетей телекоммуникаций часто необходимо имитировать поведение очереди, создаваемой реальным трафиком в узлах сети. При этом, совпадение статистических характеристик самого модельного трафика с реальным прототипом может быть не так важно, как совпадение статистических характеристик, создаваемых этими двумя трафиками очередей.

Примером такой ситуации может служить моделирование прохождения некоторого потока, называемого меченым, через телекоммуникационный узел, моделируемый системой массового обслуживания. Кроме меченного, через этот узел проходят и другие потоки, называемые фоновыми. Они интересуют нас лишь постольку, поскольку создают очередь, в которой участвует и меченый поток. Поэтому относительно фоновых потоков (в отличие от меченого) нам важны именно характеристики создаваемой ими очереди, а не характеристики трафика, как такового.

В [1] показано, как групповой пуассоновский поток может использоваться в такого рода задачах. Его использование удобно, так как параметры потока, приближающие очередь, им создаваемую, к реальной очереди, могут быть найдены аналитическим путем. Однако, приближение может быть не слишком хорошим.

В данной работе мы предлагаем новый подход к решению такой задачи. В качестве модельного трафика предлагается использовать групповой поток, в котором интервал между прибытиями пачек заявок подчиняется принципу гамма-распределения. Экспоненциальное распределение интервала между прибытиями, при котором такой поток становится пуассоновским, является частным случаем гамма-распределения. Таким образом, модель группового гамма-потока оказывается шире по своим возможностям, чем групповой пуассоновский поток.

Однако, для гамма-потока отсутствуют аналитические формулы в отношении статистических характеристик очереди в системе массового обслуживания, а вычисление параметров потока, приближающих реальную очередь, сопряжено с большими сложностями, так как на каждом шаге минимизации различий между статистическими характеристиками очередей приходится производить имитационное моделирование очереди гамма-потока с очередным подборомпробных значений параметров.

В данной работе мы предлагаем следующий подход к этой проблеме – обучить нейронную сеть оценивать параметры гамма-потока, создающего очередь, подавая ей на вход данные о зависимости средней очереди и дисперсии очереди от загрузки прибора (канала). После обучения на вход такой нейросети мы подадим данные об очереди, создаваемой реальным трафиком, и она оценит параметры гамма-потока, наиболее близкого к реальному.

Понятно, что обучение нейросети – процесс, подразумевающий высокую сложность вычислений. Но зато после обучения, оценка параметров для подаваемых на вход данных происходит практически мгновенно.

Заметим, что применение нейросетей в задачах, относимых к теории очередей, пока не очень распространено. В [2] приведен обзор современного состояния при применении машинного обучения (в том числе нейросетей) для задач теории очередей, из которого видно, что до сего времени нейронные сети использовались только для оценки параметров самих систем массового обслуживания с известной структурой, когда им на вход подавался известный трафик. В данной же работе предлагается использование нейросетей для оценки параметров входного трафика в систему массового обслуживания, и такой вид использования представляется новым. В данной работе приведены результаты, демонстрирующие возможность применения такого подхода.

Модель группового гамма-потока. Постановка задачи

Рассматривается поток заявок, в котором заявки всегда приходят пачками по B штук, где B = const – параметр модели. Интервалы времени между прибытиями пачек заявок являются независимыми одинаково распределенными случайными величинами, подчиняющимися принципу гамма-распределения с плотностью:

$f x (x) = \{\begin{matrix} \frac{x {}^{k - 1} e^{- x / θ}}{θ^{κ} Γ (k)}, & x \geq 0; \\ 0, & x < 0. \end{matrix}$

где k и θ – параметры распределения. В такой параметризации θ – это параметр масштаба, и в нашем случае его можно приравнять к 1. Таким образом, поток заявок задается двумя параметрами – k и B.

Этот поток является входным для системы массового обслуживания (СМО) G/D/1. Постоянное время обслуживания заявки τ задается таким образом, чтобы коэффициент загрузки прибора ρ был бы равен заданному: $τ = ρ Μ (X) = ρ k$ (так как M(X) = θ).

Обозначим через $Q_{t} (ρ), t \geq 0$ очередь в данной СМО с коэффициентом загрузки прибора ρ в момент времени t, а через $\bar{Q (ρ)}$ и $D Q (ρ)$ – эмпирические математическое ожидание и дисперсию очереди, полученные по достаточно продолжительной реализации $Q_{t} (ρ)$ .

Для каждого значения ${\{ρ_{n}\}}_{n = 1, \dots, N}$ из некоторого набора, рассмотрим соответствующие множества ${\{\bar{Q (ρ_{n})}\}}_{n = 1 \dots, N}$ .

Задача состоит в том, чтобы оценить параметры k и B, при которых оба этих множества значений были бы близки к значениям ${\{\bar{Q * (ρ_{n})}\}}_{n = 1 \dots, N}$ и ${\{D Q * (ρ_{n})\}}_{n = 1 \dots, N}$ для очереди в данной СМО, полученной при подаче на вход достаточно длинной трассы реального трафика.

Аналитических выражений для этих величин в СМО с таким входным потоком не существует, поэтому для оценки параметров будем использовать нейросеть.

Описание используемой нейросети

Для демонстрации возможности такого подхода обучим достаточно простую нейросеть (рисунок 1), где приведено стандартное графическое представление нейросети, генерируемое библиотекой Keras языка Python, использовавшейся в данной работе. Для эксперимента возьмем 9 значений ρ, минимальное - 0,1, максимальное - 0,9, и, учитывая, что, таким образом, входных значений у нейронной сети получится 18 (9 математических ожиданий и 9 дисперсий), обозначим их как ${\{x_{n}\}}_{n = 0, \dots 17}$ согласно принятой в области нейросетей традиции нумерации с нуля. При этом

$\{\begin{matrix} x_{n} = \frac{\bar{Q (ρ_{n + 1})} - C_{n + 1}}{S_{n + 1}}, n = 0, \dots,8; \\ x_{n} = \frac{D Q (ρ_{n - 8}) - C_{n + 1}}{S_{n + 1}}, n = 9, \dots,17. \end{matrix}$ ,

где ${\{ρ_{n}\}}_{n = 1, \dots,9}$ , а ${\{С_{n}\}}_{n = 1, \dots,18}$ и ${\{S_{n}\}}_{n = 1, \dots,18}$ – центрирующие и нормирующие по соответствующему входу величины, вычисляемые по множеству обучающих примеров объемом M по следующим формулам:

$\{\begin{matrix} С_{n} = \frac{1}{M} \sum_{i = o}^{M - 1} x_{n - 1, i}, n = 1, \dots 18; \\ x_{n} = \sqrt{\frac{1}{M} \sum_{i = o}^{M - 1} x_{n - 1, i}^{2} - C_{n}^{2}}, n = 1, \dots 18. \end{matrix}$ ,

где $x_{n, i}$ – значение на входе n обучающего примера i. Такая нормировка производится для того, чтобы на всех входах данные лежали примерно в одинаковом диапазоне, что повышает качество работы нейросети.

После входа идут два полносвязанных слоя нейросети, в каждом из которых по 16 нейронов, у каждого на выходе функция активации ReLu, а далее – два выходных нейрона – один оценивает параметр k гамма-потока, а второй - размер пачки B. У выходных нейронов функция активации отсутствует. Это одна из типичных архитектур нейросети для решения задачи регрессии параметров входных данных.

В качестве функции потерь, минимизируемой при обучении нейросети, использовалось среднеквадратическое отклонение.

Для повышения точности важным является вопрос выбора значений ${\{ρ_{n}\}}_{n = 1 \dots,9}$ . Равномерный шаг по ρ от 0,1 до 0,9 не является оптимальным решением, так как входные данные приближаются с одинаковой относительной погрешностью, что при больших ρ, приводит к большой абсолютной погрешности приближения $\{\bar{Q (ρ_{n})}\}$ и $\{D Q (ρ_{n})\}, n = 1, \dots N .$

Рисунок 1. Архитектура нейронной сети

Заметно большую точность дает разделение интервала [0, 1; 0, 9] на 8 интервалов так, чтобы для самой быстрорастущей зависимости $\bar{Q (ρ_{n})}$ из рассматриваемого семейства, для каждого интервала $[ρ_{n}, ρ_{n + 1})$ выполнялось условие:

$(ρ_{n + 1} - ρ_{n}) (\bar{Q (ρ_{n + 1})} - \bar{Q (ρ_{n})}) = c o n s t \forall_{n} = 1, \dots,8$ .

Определить нужные величины ρ_n можно численно, приняв ρ₁=0,1, ρ₉=0,9, и подобрав сначала такое значение ρ₅, что $(ρ_{5} - ρ_{1}) (\bar{Q (ρ_{5})} - \bar{Q (ρ_{1})}) = (ρ_{9} - ρ_{5}) (\bar{Q (ρ_{9}}) - \bar{Q (ρ_{5})})$ , а потом аналогичным образом найти ρ₃, используя известные ρ₁ и ρ₅, ρ₇ и известные ρ₅ и ρ₉ и т. д.

Для обучающей и контрольной выборки методом имитационного моделирования было сгенерировано 3000 трасс гамма-потоков со случайными параметрами, длина каждой трассы 200000. 2500 трасс составляли обучающую выборку, 500 трасс ‒ контрольную. Для каждой трассы были посчитаны величины ${\{\bar{Q (ρ_{n})}\}}_{n = 1, \dots, N} и {\{D Q (ρ_{n})\}}_{n = 1, \dots, N}$ , подаваемые на вход нейросети. Соответствующие каждой трассе параметры использовались для обучения с учителем и для тестового контроля.

Рисунок 2. Результаты для приближения гамма-потоков с использованием нейросети: а) Средняя очередь пакетов в потоке; б) Дисперсия очереди пакетов в потоке

Именно генерация методом имитационного моделирования всех примеров занимает более 99% времени проведения такого эксперимента.

Оценка с применением аналитических выражений для сравнения

Для того, чтобы сравнить качество полученных результатов, попробуем приблизить статистические характеристики очереди реального трафика с помощью групповых пуассоновских потоков, для которых мы можем использовать обобщение формул Поллачека-Хинчина, полученных в [3] для СМО G/D/1 интервальным методом. Приведем их здесь в упрощенном виде для постоянного размера пачки B.

$\bar{Q} (ρ) = \frac{ρ B}{2 (1 - ρ)} - \frac{ρ}{2}$ . (1)

Рисунок 3. Результаты для приближения пуассоновским потоком: а) Средняя очередь пакетов в потоке; б) Дисперсия очереди пакетов в потоке

$\begin{array}{l} D Q (ρ) = \frac{ρ B - ρ (1 - ρ)}{4 {(1 - ρ)}^{2}} (ρ B + ρ^{2} - 3 ρ + 2) + \\ \frac{ρ^{3} + ρ B^{2} + 3 ρ^{2} B - 3 ρ B - 3 ρ^{2} + 2 ρ}{3 (1 - ρ)} \end{array}$ , (2)

где $ρ = λ τ B, λ$ – интенсивность потока, τ – постоянное время обслуживания одной заявки.

Имея значения ${\{\bar{Q * (ρ_{n})}\}}_{n = 1 \dots, N}$ и ${\{D Q * (ρ_{n})\}}_{n = 1 \dots, N}$ статистических характеристик очереди реального трафика и , мы можем методом наименьших квадратов минимизировать по параметру B отклонение аналитических кривых (1), (2) от реальных значений при соответствующих нагрузках, и это даст нам приближение реального трафика групповым пуассоновским потоком в смысле порождаемой очереди. Заметим, что в описанных ниже экспериментах мы использовали метод наименьших взвешенных квадратов с весами, обратно пропорциональными значениям соответствующих ${\{\bar{Q * (ρ_{n})}\}}_{n = 1 \dots, N}$ и ${\{D Q * (ρ_{n})\}}_{n = 1 \dots, N}$ , так как они сильно различаются по величине. То есть, по параметру B минимизировалась следующая величина:

$J = \sum_{n = 1}^{N} (\frac{(\bar{Q * (ρ_{n})} - \bar{Q (ρ_{n}))^{2}}}{\bar{Q * (ρ_{n})}}) + \frac{{(D Q * (ρ_{n}) - D Q (ρ_{n}))}^{2}}{D Q * (ρ_{n})}$ ,

где $\bar{Q * (ρ_{n})}$ и $D Q * (ρ_{n})$ – константы, найденные в результате имитационного моделирования очереди реального трафика, а $\bar{Q (ρ_{n})}$ и $D Q (ρ_{n})$ вычисляются по формулам (1, 2).

Заключение

Эксперименты проводились на трассах видеотрафика стандарта H264 с различными значениями параметра кодирования (размером видеобуфера). Результаты, представленные на рисунках 2 и 3, с очевидностью демонстрируют большее приближение при использовании гамма-потоков, параметры которых оцениваются с помощью нейросети.

Это иллюстрирует практическую полезность данного подхода, и перспективы использования нейросетей для решения практических задач, где применяется теория очередей. Кроме собственно имитационного моделирования, в качестве примера возможного применения такого подхода можно предложить, например, обучать нейросеть оценивать в реальном времени вероятность переполнения буфера в телекоммуникационном узле при большой нагрузке. Если использовать при обучении реальный трафик, то его нужно очень много, так как переполнение буфера в реальном оборудовании связи при штатной работе - это довольно редкое событие. Если же использовать искусственно генерируемый трафик, параметры которого, которые также определены с помощью нейросети, позволяют получать близкие к реальным очереди, то его легко можно произвести в необходимом для т.н. предобучения нейросети количестве, а дообучить ее, в случае необходимости, на реальном трафике.

About the authors

Boris Ya. Likhttsinder

Povolzhskiy State University of Telecommunications and Informatics

Author for correspondence.
Email: lixt@psuti.ru

Professor of Networks and Communication Systems Department, Doctor of Technical Science, Professor

Russian Federation, Samara

Alexander Yu. Privalov

Samara National Research University

Email: privalov.ayu@ssau.ru

Head of Applied Mathematics and Physics Department, Doctor of Technical Science, Professor

Russian Federation, Samara

Tatiana D. Maksimova

Povolzhskiy State University of Telecommunications and Informatics

Email: td.pavlova@psuti.ru

Assistant to the vice-rector for administrative and economic work

Russian Federation, Samara

References

Lichtzinder B.Ya., Moiseev V.I., Privalov A.Yu. On the possibility of using group Poisson flows in simulation modeling. Informacionnye tekhnologii i nanotekhnologii (ITNT-2024): materialy X Mezhdunarodnoj konferencii. Samara: Samarskij universitet, 2024, pp. 8–11. (In Russ.)
Vishnevsky V., Gorbunova A.V. Application of machine learning methods to solving problems of queuing theory. Information Technologies and Mathematical Modelling. Queueing Theory and Applications, 2022, vol. 1605, pp. 304–316. DOI: https://doi.org/10.1007/978-3-031-09331- 9_24
Likhttsinder B.J., Privalov A.Y., Moiseev V.I. Batch poissonian arrival models of multiservice network traffic. Problems of Information Transmission, 2023, vol. 59, no. 1, pp. 63–70. doi: 10.1134/S0032946023010064
Lichtzinder B.Ya., Moiseev V.I. Group Poisson and Hyperpoisson models of packet traffic. I-methods, 2022, vol. 14, no. 3. URL: https://www.elibrary.ru/download/elibrary_49871213_30704781.pdf (accessed: 26.04.2024). (In Russ.)
Likhttsinder B.Ya., Bakai Yu.O. Models of group poisson flows in telecommunication traffic control. Vestnik Samarskogo gosudarstvennogo tekhnicheskogo universiteta. Seriya: Tekhnicheskie nauki, 2020, vol. 28, № 3 (67), pp. 75–89.
Likhttsinder B.Ya. Interval characteristics of group poisson models of telecommunication systems traffic. Infokommunikacionnye tehnologii, 2020, vol. 18, no. 3, pp. 302–311. (In Russ.)
Likhttsinder B.Ya. Traffic of multiservice access networks (interval analysis and design). Moscow: Goryachaya liniya - Telekom, 2018, 290 p. (In Russ.)
Blatov I.A., Likhttsinder B.Ya. Авоut limit values queue lengths in queuing systems with burst flows. Infokommunikacionnye tehnologii, 2018, vol. 16, no. 2, pp. 181–187. (In Russ.)
Privalov A.Y., Likhttsinder B.Ya. Interval traffic analysis of multichannel queuing systems. Vestnik Samarskogo gosudarstvennogo tekhnicheskogo universiteta. Seriya: Tekhnicheskie nauki, 2023, vol. 31, no. 2, pp. 56–69. (In Russ.)
Likhttsinder B.Ya. Features of multi-channel processing of batch traffic. T-Comm: Telekommunikacii i transport, 2017, vol. 11, no. 11, pp. 30–33. (In Russ.)

Supplementary files

Supplementary Files

Action

1. JATS XML

Download

2. Figure 1. Neural network architecture

Download (95KB)

Indexing metadata

3. Figure 2. Results for gamma flow approximation using neural network: a) Average queue of packets in the flow; b) Dispersion of packet queue in the flow

Download (215KB)

Indexing metadata

4. Figure 3. Results for the Poisson flow approximation: a) Average packet queue in the flow; b) Dispersion of packet queue in the flow

Download (233KB)

Indexing metadata

Username
Password
Remember me

Forgot password?	Register

Username
Password
Remember me

Forgot password?	Register

Group Gamma-Distribution and Neural Network in of the Latest Telecommunication Traffic Modeling

Full Text

Abstract

Keywords

Full Text

Введение

Модель группового гамма-потока. Постановка задачи

Описание используемой нейросети

Оценка с применением аналитических выражений для сравнения

Заключение

About the authors

Boris Ya. Likhttsinder

Alexander Yu. Privalov

Tatiana D. Maksimova

References

Supplementary files

This website uses cookies