Групповые гамма-потоки и нейросети в моделировании современного телекоммуникационного трафика
- Авторы: Лихтциндер Б.Я.1, Привалов А.Ю.2, Максимова Т.Д.1
-
Учреждения:
- Поволжский государственный университет телекоммуникаций и информатики
- Самарский национальный исследовательский университет имени С.П. Королева
- Выпуск: Том 21, № 4 (2023)
- Страницы: 23-29
- Раздел: Системы и устройства телекоммуникаций
- URL: https://journals.eco-vector.com/2073-3909/article/view/635112
- DOI: https://doi.org/10.18469/ikt.2023.21.4.04
- ID: 635112
Цитировать
Полный текст
Аннотация
В данной работе в качестве цели моделирования телекоммуникационного трафика рассматривается образование очередей в системе М/D/1 с близкими к реальным статистическим характеристикам первых двух порядков. В качестве входного в систему рассматривается групповой поток с постоянным размером пачки и расстоянием между прибытиями, подчиняющимся принципу гамма-распределения. Эти параметры определяются с помощью нейронной сети, которая обучена определять параметры таких входных потоков по статистическим характеристикам очереди при различных загрузках прибора. Получены и представлены результаты, демонстрирующие хорошее приближение при аппроксимации с использованием гамма-потоков, параметры которых оцениваются с помощью нейросети. Показана практическая полезность рассматриваемого подхода и перспективы использования нейросетей для решения практических задач с применением теории очередей.
Полный текст
Введение
При моделировании сетей телекоммуникаций часто необходимо имитировать поведение очереди, создаваемой реальным трафиком в узлах сети. При этом, совпадение статистических характеристик самого модельного трафика с реальным прототипом может быть не так важно, как совпадение статистических характеристик, создаваемых этими двумя трафиками очередей.
Примером такой ситуации может служить моделирование прохождения некоторого потока, называемого меченым, через телекоммуникационный узел, моделируемый системой массового обслуживания. Кроме меченного, через этот узел проходят и другие потоки, называемые фоновыми. Они интересуют нас лишь постольку, поскольку создают очередь, в которой участвует и меченый поток. Поэтому относительно фоновых потоков (в отличие от меченого) нам важны именно характеристики создаваемой ими очереди, а не характеристики трафика, как такового.
В [1] показано, как групповой пуассоновский поток может использоваться в такого рода задачах. Его использование удобно, так как параметры потока, приближающие очередь, им создаваемую, к реальной очереди, могут быть найдены аналитическим путем. Однако, приближение может быть не слишком хорошим.
В данной работе мы предлагаем новый подход к решению такой задачи. В качестве модельного трафика предлагается использовать групповой поток, в котором интервал между прибытиями пачек заявок подчиняется принципу гамма-распределения. Экспоненциальное распределение интервала между прибытиями, при котором такой поток становится пуассоновским, является частным случаем гамма-распределения. Таким образом, модель группового гамма-потока оказывается шире по своим возможностям, чем групповой пуассоновский поток.
Однако, для гамма-потока отсутствуют аналитические формулы в отношении статистических характеристик очереди в системе массового обслуживания, а вычисление параметров потока, приближающих реальную очередь, сопряжено с большими сложностями, так как на каждом шаге минимизации различий между статистическими характеристиками очередей приходится производить имитационное моделирование очереди гамма-потока с очередным подборомпробных значений параметров.
В данной работе мы предлагаем следующий подход к этой проблеме – обучить нейронную сеть оценивать параметры гамма-потока, создающего очередь, подавая ей на вход данные о зависимости средней очереди и дисперсии очереди от загрузки прибора (канала). После обучения на вход такой нейросети мы подадим данные об очереди, создаваемой реальным трафиком, и она оценит параметры гамма-потока, наиболее близкого к реальному.
Понятно, что обучение нейросети – процесс, подразумевающий высокую сложность вычислений. Но зато после обучения, оценка параметров для подаваемых на вход данных происходит практически мгновенно.
Заметим, что применение нейросетей в задачах, относимых к теории очередей, пока не очень распространено. В [2] приведен обзор современного состояния при применении машинного обучения (в том числе нейросетей) для задач теории очередей, из которого видно, что до сего времени нейронные сети использовались только для оценки параметров самих систем массового обслуживания с известной структурой, когда им на вход подавался известный трафик. В данной же работе предлагается использование нейросетей для оценки параметров входного трафика в систему массового обслуживания, и такой вид использования представляется новым. В данной работе приведены результаты, демонстрирующие возможность применения такого подхода.
Модель группового гамма-потока. Постановка задачи
Рассматривается поток заявок, в котором заявки всегда приходят пачками по B штук, где B = const – параметр модели. Интервалы времени между прибытиями пачек заявок являются независимыми одинаково распределенными случайными величинами, подчиняющимися принципу гамма-распределения с плотностью:
где k и θ – параметры распределения. В такой параметризации θ – это параметр масштаба, и в нашем случае его можно приравнять к 1. Таким образом, поток заявок задается двумя параметрами – k и B.
Этот поток является входным для системы массового обслуживания (СМО) G/D/1. Постоянное время обслуживания заявки τ задается таким образом, чтобы коэффициент загрузки прибора ρ был бы равен заданному: (так как M(X) = θ).
Обозначим через очередь в данной СМО с коэффициентом загрузки прибора ρ в момент времени t, а через и – эмпирические математическое ожидание и дисперсию очереди, полученные по достаточно продолжительной реализации .
Для каждого значения из некоторого набора, рассмотрим соответствующие множества .
Задача состоит в том, чтобы оценить параметры k и B, при которых оба этих множества значений были бы близки к значениям и для очереди в данной СМО, полученной при подаче на вход достаточно длинной трассы реального трафика.
Аналитических выражений для этих величин в СМО с таким входным потоком не существует, поэтому для оценки параметров будем использовать нейросеть.
Описание используемой нейросети
Для демонстрации возможности такого подхода обучим достаточно простую нейросеть (рисунок 1), где приведено стандартное графическое представление нейросети, генерируемое библиотекой Keras языка Python, использовавшейся в данной работе. Для эксперимента возьмем 9 значений ρ, минимальное - 0,1, максимальное - 0,9, и, учитывая, что, таким образом, входных значений у нейронной сети получится 18 (9 математических ожиданий и 9 дисперсий), обозначим их как согласно принятой в области нейросетей традиции нумерации с нуля. При этом
,
где , а и – центрирующие и нормирующие по соответствующему входу величины, вычисляемые по множеству обучающих примеров объемом M по следующим формулам:
,
где – значение на входе n обучающего примера i. Такая нормировка производится для того, чтобы на всех входах данные лежали примерно в одинаковом диапазоне, что повышает качество работы нейросети.
После входа идут два полносвязанных слоя нейросети, в каждом из которых по 16 нейронов, у каждого на выходе функция активации ReLu, а далее – два выходных нейрона – один оценивает параметр k гамма-потока, а второй - размер пачки B. У выходных нейронов функция активации отсутствует. Это одна из типичных архитектур нейросети для решения задачи регрессии параметров входных данных.
В качестве функции потерь, минимизируемой при обучении нейросети, использовалось среднеквадратическое отклонение.
Для повышения точности важным является вопрос выбора значений . Равномерный шаг по ρ от 0,1 до 0,9 не является оптимальным решением, так как входные данные приближаются с одинаковой относительной погрешностью, что при больших ρ, приводит к большой абсолютной погрешности приближения и
Рисунок 1. Архитектура нейронной сети
Заметно большую точность дает разделение интервала [0, 1; 0, 9] на 8 интервалов так, чтобы для самой быстрорастущей зависимости из рассматриваемого семейства, для каждого интервала выполнялось условие:
.
Определить нужные величины ρn можно численно, приняв ρ1=0,1, ρ9=0,9, и подобрав сначала такое значение ρ5, что , а потом аналогичным образом найти ρ3, используя известные ρ1 и ρ5, ρ7 и известные ρ5 и ρ9 и т. д.
Для обучающей и контрольной выборки методом имитационного моделирования было сгенерировано 3000 трасс гамма-потоков со случайными параметрами, длина каждой трассы 200000. 2500 трасс составляли обучающую выборку, 500 трасс ‒ контрольную. Для каждой трассы были посчитаны величины , подаваемые на вход нейросети. Соответствующие каждой трассе параметры использовались для обучения с учителем и для тестового контроля.
Рисунок 2. Результаты для приближения гамма-потоков с использованием нейросети: а) Средняя очередь пакетов в потоке; б) Дисперсия очереди пакетов в потоке
Именно генерация методом имитационного моделирования всех примеров занимает более 99% времени проведения такого эксперимента.
Оценка с применением аналитических выражений для сравнения
Для того, чтобы сравнить качество полученных результатов, попробуем приблизить статистические характеристики очереди реального трафика с помощью групповых пуассоновских потоков, для которых мы можем использовать обобщение формул Поллачека-Хинчина, полученных в [3] для СМО G/D/1 интервальным методом. Приведем их здесь в упрощенном виде для постоянного размера пачки B.
. (1)
Рисунок 3. Результаты для приближения пуассоновским потоком: а) Средняя очередь пакетов в потоке; б) Дисперсия очереди пакетов в потоке
, (2)
где – интенсивность потока, τ – постоянное время обслуживания одной заявки.
Имея значения и статистических характеристик очереди реального трафика и , мы можем методом наименьших квадратов минимизировать по параметру B отклонение аналитических кривых (1), (2) от реальных значений при соответствующих нагрузках, и это даст нам приближение реального трафика групповым пуассоновским потоком в смысле порождаемой очереди. Заметим, что в описанных ниже экспериментах мы использовали метод наименьших взвешенных квадратов с весами, обратно пропорциональными значениям соответствующих и , так как они сильно различаются по величине. То есть, по параметру B минимизировалась следующая величина:
,
где и – константы, найденные в результате имитационного моделирования очереди реального трафика, а и вычисляются по формулам (1, 2).
Заключение
Эксперименты проводились на трассах видеотрафика стандарта H264 с различными значениями параметра кодирования (размером видеобуфера). Результаты, представленные на рисунках 2 и 3, с очевидностью демонстрируют большее приближение при использовании гамма-потоков, параметры которых оцениваются с помощью нейросети.
Это иллюстрирует практическую полезность данного подхода, и перспективы использования нейросетей для решения практических задач, где применяется теория очередей. Кроме собственно имитационного моделирования, в качестве примера возможного применения такого подхода можно предложить, например, обучать нейросеть оценивать в реальном времени вероятность переполнения буфера в телекоммуникационном узле при большой нагрузке. Если использовать при обучении реальный трафик, то его нужно очень много, так как переполнение буфера в реальном оборудовании связи при штатной работе - это довольно редкое событие. Если же использовать искусственно генерируемый трафик, параметры которого, которые также определены с помощью нейросети, позволяют получать близкие к реальным очереди, то его легко можно произвести в необходимом для т.н. предобучения нейросети количестве, а дообучить ее, в случае необходимости, на реальном трафике.
Об авторах
Борис Яковлевич Лихтциндер
Поволжский государственный университет телекоммуникаций и информатики
Автор, ответственный за переписку.
Email: lixt@psuti.ru
д.т.н., профессор, профессор кафедры сетей и систем связи
Россия, СамараАлександр Юрьевич Привалов
Самарский национальный исследовательский университет имени С.П. Королева
Email: privalov.ayu@ssau.ru
д.т.н., заведующий кафедры прикладной математики и физики
Россия, СамараТатьяна Дмитриевна Максимова
Поволжский государственный университет телекоммуникаций и информатики
Email: td.pavlova@psuti.ru
помощник проректора по административно-хозяйственной работе
Россия, СамараСписок литературы
- Лихтциндер Б.Я., Моисеев В.И., Привалов А.Ю. О возможности использования групповых пуассоновских потоков в имитационном моделировании // Информационные технологии и нанотехнологии (ИТНТ-2024): материалы X Международной конференции. Самара: Самарский университет, 2024. С. 8–11.
- Vishnevsky V., Gorbunova A.V. Application of machine learning methods to solving problems of queuing theory // Information Technologies and Mathematical Modelling. Queueing Theory and Applications. 2022. Vol. 1605. P. 304–316. DOI: https://doi.org/10.1007/978-3-031-09331- 9_24
- Likhttsinder B.J., Privalov A.Y., Moiseev V.I. Batch poissonian arrival models of multiservice network traffic // Problems of Information Transmission. 2023. Vol. 59, no. 1. P. 63–70. doi: 10.1134/S0032946023010064
- Лихтциндер Б.Я., Моисеев В.И. Групповые пуассоновские и гиперпуассоновские модели пакетного трафика // I-methods. 2022. Т. 14, № 3. URL: https://www.elibrary.ru/download/elibrary_49871213_30704781.pdf (дата обращения: 26.04.2024).
- Likhttsinder B.Ya., BakaiYu.O. Models of group poisson flows in telecommunication traffic control // Вестник Самарского государственного технического университета. Серия: Технические науки. 2020. Т. 28, № 3 (67). С. 75–89.
- Лихтциндер Б.Я. Интервальные характеристики групповых пуассоновских моделей трафика телекоммуникационных систем // Инфокоммуникационные технологии. 2020. Т. 18, № 3. С. 302–311.
- Лихтциндер Б.Я. Трафик мультисервисных сетей доступа (интервальный анализ и проектирование). М.: Горячая линия - Телеком, 2018. 290 с.
- Блатов И.А., Лихтциндер Б.Я. О предельных значениях длин очередей в СМО с пачечными потоками // Инфокоммуникационные технологии. 2018. Т. 16, № 2. С. 181–187.
- Привалов А.Ю., Лихтциндер Б.Я. Интервальный анализ трафика многоканальных систем массового обслуживания // Вестник Самарского государственного технического университета. Серия: Технические науки. 2023. Т. 31, № 2. С. 56–69.
- Лихтциндер Б.Я. Особенности многоканальной обработки пачечного трафика // T-Comm: Телекоммуникации и транспорт. 2017. Т. 11, № 11. С. 30–33.
Дополнительные файлы
