TELECOMMUNICATION TRAFFIC ANALYSIS BY USING COPULAS

Abstract

This work is concerned with utilization of copulas for analysis of high-correlated self-similarity traffic in multiservice networks and for simulation two-dimensional probability densities of correlated random varieties. Proposed approach provides overcoming the main limitations associated with classic queuing theory, which are based on presupposition of independences of arrival and service processes. Copula means to consider relationship between sampling random varieties outside the one-dimensional distribution context. Here definitions of copula functions and Kendall’s and Spearman’s rank correlation coefficients are presented. These coefficients provide more precisely researching of traffic amount. This work presents developed Gumbel’s and Clayton’s copulas and one of Farlie-Gumbel-Morgenstern copulas for two-dimensional lognormal distribution. Criterions for copula selection are based on analysis of existing implementations of random variety sequences. This work sets a relation between rank correlation coefficients and Pearson’s correlation coefficient.

Full Text

Введение Как известно [1], современный трафик мультисервисных сетей обладает самоподобными свойствами. Свойство самоподобия означает, во-первых, что отсчеты трафика обладают сильными корреляционными связями, во-вторых, что одномерные плотности вероятностей отсчетов трафика имеют так называемые «тяжелые» хвосты распределений. При этом самоподобными свойствами могут обладать реализации интенсивности трафика, реализации последовательности интервалов времени между пакетами на входе устройства обработки этих пакетов, а также последовательности длительностей пакетов. Современные методы анализа трафика и устройств обработки такового трафика, основанные на методах классической теории массового обслуживания, требуют более глубоких сведений о статистических свойствах трафика. Наибольший интерес здесь представляет синтез многомерных распределений, учитывающих зависимость отсчетов трафика, которая может описываться не только коэффициентом корреляции Пирсона , но и другими параметрами, например, коэффициентом ранговой корреляции Кендалла и коэффициентом Спирмена , учитывающими более тонкую структуру зависимости между отсчетами трафика. Особый интерес представляет задача синтеза двумерных распределений коррелированных случайных величин, которая может, например, встретиться при решении интегрального уравнения Линдли [2] для анализа систем массового обслуживания общего вида (типа GI/G/1), при анализе статистических свойств вейвлет-преобразованного трафика [1] для декорреляции его отсчетов и др. В [3-4] представлены многочисленные результаты синтеза не только двумерных, но и многомерных распределений, включая случаи, когда одномерные распределениями имеют тяжелые хвосты. Построить двумерную функцию распределения можно, прибегая к понятию копулы [3-6] Понятие копулы Функция называется копулой двух переменных и , определенных на множестве , если она удовлетворяет следующим условиям: 1. . 2. . 3. где , и . 4. . 5. Для любой копулы справедливо: . 6. Для любых , справедливо . Согласно теореме Склара [4] функция совместного (интегрального) распределения случайных величин и определяется копулой от одномерных распределений и . Копулы позволяют рассматривать зависимость между случайными величинами по выборке вне контекста одномерных распределений. Суть состоит в том, что, даже не зная одномерных функций распределения случайных величин, можно рассматривать различные зависимости между ними, которые могут быть охарактеризованы, как было указано выше, либо коэффициентом корреляции , либо коэффициентами ранговой корреляции и . Если функциям и соответствуют плотности и , то, как показано в [3], , (1) где - производная копулы (плотность) и . Многочисленные исследования по теории копул (см. библиографию [3]) показывают, что разным типам распределений соответствуют разные копулы, которые различным образом могут учитывать статистическую зависимость случайных величин. Как правило, построение копулы основано на совместном исследовании конкретных реализаций зависимых случайных величин и . Это исследование заключается в вычислении коэффициентов ранговой корреляции и . Коэффициент ранговой корреляции Коэффициент ранговой корреляции определяется в виде [3; 6] , и, как следует из приведенного выражения, определяет зависимость случайных последовательностей X и Y через показатели согласованности - и рассогласованности - последовательностей. Коэффициент ранговой корреляции имеет свойства: - коэффициент симметричен относительно аргументов; - значения находятся в интервале [-1, 1]; - при независимых X и Y . Использование коэффициента оказалось предпочтительным по сравнению с коэффициентом корреляции , (2) так как при анализе распределений с тяжелыми хвостами, у которых возможно выражение (2) теряет смысл. Коэффициент ранговой корреляции Спирмена определяется как . С учетом того, что случайные величины распределены равномерно на интервале [0, 1], можно говорить, исходя из свойств копулы, что их совместное распределение определяется именно функцией копулы, а вычисляется по формуле (2) для переменных u и v. Основные свойства коэффициента: - симметричен относительно своих аргументов; - , если , и - строго возрастающая функция, то , если - строго убывающая функция, то ; - , если и - строго возрастающие функции; - если и независимы, то . Если наблюдения конечны, то есть , то несмещенная оценка может быть получена в виде [6]: . Копула Гумбеля для двумерного логнормального распределения Рассмотрим модельную задачу, когда по известной одномерной плотности вероятностей отсчетов трафика и известной корреляционной функции требуется построить двумерную плотность вероятностей без анализа реализации трафиковой последовательности. Для примера возьмем частный случай использования логнормального распределения, одномерная плотность которого имеет вид , (3) где и - среднее значение и дисперсия нормального распределения случайной величины . Для распределения (3) справедливо , . При построении двумерного логнормального распределения зависимых случайных величин целесообразно использовать так называемые архимедовы копулы, которые не ограничены обязательным наличием радиальной симметрии, что свойственно эллиптическим копулам [6]. Даже при наличии реализаций случайных величин выбор конкретного вида копулы далеко не однозначен. Из нескольких моделей копула-функций следует выбрать ту, которая наилучшим образом описывает рассматриваемые данные. Критерии, которые можно использовать при выборе копулы, достаточно подробно описаны в [7], и все они основаны на анализе имеющихся реализаций последовательностей случайных величин. В нашем случае единственным критерием правильности выбора копулы является совпадение двумерного распределения, полученного на основе применения конкретной копулы, с двумерным распределением, построенным по точному аналитическому выражению. Для двумерной логнормальной плотности такое выражение имеет вид [9]: , (4) где и - среднее значение и среднеквадратическое отклонение соответствующей нормальной случайной величины , - коэффициент корреляции случайных величин и . Теперь выбор копулы можно произвести методом перебора, основываясь на многочисленных примерах использования копул для построения двумерных распределений [3]. Для построения двумерного логнормального распределения выберем сначала из известных архимедовых копул [3] - копулу Гумбеля с генератором : (5) где , и имеющую плотность . В данной копуле параметр характеризует зависимость случайных величин и , определяет которую коэффициент ранговой корреляции Кендалла . Известно [8], что связь коэффициента и параметра для архимедовых копул устанавливается через генератор в виде , что для копулы Гумбеля дает . В рассматриваемой модельной ситуации, в которой одномерное распределение выборки и её корреляционные свойства предполагаются заданными, и определению подлежит двумерная плотность вероятности гипотетической реализации трафика, крайне затруднительно установить аналитически связь коэффициентов и , поэтому предлагается отождествить и , основываясь на том, что оба параметра характеризуют зависимость отсчетов трафика и могут принимать значения из интервала [-1, 1]. Рассчитаем двумерную плотность логнормального распределения по формуле (1) при использовании копулы (5) с параметром (при замене ) в виде , и с учетом того, что одномерное распределение для логнормального распределения записывается как , где . На рис. 1-4 приведены результаты вычислений при следующих параметрах: ; ; . Рис. 1 Двумерная плотность согласно (1) Рис. 2. График линий уровня для (1) Рис. 3. Двумерная плотность согласно (4) Рис. 4. График линий уровня для (4) Сравнение рис. 1 и рис. 2 показывает лишь принципиальное совпадение формы двумерной плотности. С точки зрения критериев согласия для оценки многомерных распределений можно предложить использование условно вероятностного интегрального преобразования Розенблатта [7], которое переводит набор зависимых случайных величин с заданным двумерным распределением в набор независимых равномерно распределенных на интервале [0; 1] случайных величин. Копула Клейтона для двумерного логнормального распределения Представляет интерес исследовать в данной ситуации (при использовании логнормального распределения) и других копул для синтеза двумерного распределения коррелированных случайных величин, в частности, копулы Клейтона (с генератором ) , (6) для которой . Рис. 5. Двумерная плотность по копуле (6) при Рис. 6. График линий уровня выражения (6) при Полагая, как и в предыдущем случае , получим . Для тех же значений параметров двумерная плотность, полученная из копулы (6) при , представлена на рис. 5 и рис. 6. Здесь также можно констатировать только совпадение формы полученного двумерного распределения с формой, рассчитанной по точной формуле. Попытка перебора значений параметра привела к результату, представленному на рис. 7 и рис. 8 при выборе . Сравнение результатов рис. 7 и рис. 8 с истинной двумерной плотностью показывает их удовлетворительное совпадение. Рис. 7. График линий уровня для (6) при Рис. 7 Двумерная плотность по копуле (6) при Копулы семейства F-G-M Заслуживает внимания использование копулы семейства Фарли-Гумбеля-Моргенштерна с полиномиальным расширением [3] (для этого семейства не существует функций-генераторов ) в виде . (7) Параметр данной копулы удовлетворяет условиям , где р - целое число (). При этом коэффициент корреляции связан с параметром соотношением Легко установить, что при максимальное значение , которое может быть использовано для данной копулы, определяется значением ; а параметр находится в пределах . Плотность вероятности с копулой (7) при будет иметь вид , (8) где u и v определяются как . Установление связи между и При использовании копулы (8) возможен обоснованный подход к выбору параметра . С учетом того, что двумерное распределение определяется копулой вида , существует возможность установления соотношения между коэффициентом корреляции , вычисляемым согласно (2), и параметром копулы, определяющим зависимость случайных величин и . Эта возможность следует из соотношения , подставив которое в (2), можно найти зависимость от , а не от . Основная сложность при этом состоит в выборе копулы, так как производная копулы по должна позволить выделить параметр через относительно простую функцию, полскольку, например, копула (5) сделать этого сделать не позволяет. Для копулы (8) (9) где . Для расчета при использовании одномерных логнормальных распределений (3) с одинаковыми параметрами была использована аппроксимация функции в виде [10] , (10) при ; а также интегральное представление [11]: , (11) и стандартные интегралы из [12]. Рис. 9. Двумерная плотность логнормальных случайных величин, построенная по копуле (7) при Подстановка (9) в (2) с учетом (10)-(11) дает , (12) где ; ; . Результат представлен на рис. 9-10. Определенное согласно (12) значение было использовано в выражении (8) для построения двумерного логнормального распределения с вышеуказанными параметрами . Рис. 10. График линий уровня для (7) при Заключение Таким образом, применение копул для моделирования двумерных плотностей вероятности коррелированных случайных величин при анализе телекоммуникационного трафика может помочь в преодолении главного ограничения классической теории массового обслуживания, заключающегося в постулировании независимости процессов поступления заявок на обслуживание и процессов их обслуживания.
×

About the authors

Igor Viacheslavovich Kartashevskiy

Povolzhskiy State University of Telecommunications and Informatics

Email: ivk@psuti.ru

References

  1. Шелухин О.И., Осин А.В., Смольский С.М. Самоподобие и фракталы. Телеком-муникационные приложения. М.: Физматлит, 2008. - 368 с.
  2. Клейнрок Л. Теория массового обслуживания. М.: Машиностроение, 1979. - 432 с.
  3. Balakrishnan N., Chin-Diew Lai. Continuous Bivariate Distributions. Springer Dordrecht Heidelberg London New York, 2009. - 684p.
  4. Nelsen R.B. An introduction to copulas. Lecture Notes in Statistics. 2-nd Edition, New York, Springer, 2006. - 269 p.
  5. Фантаццини Д. Моделирование многомерных распределений с использованием копула-функций. I // Прикладная эконометрика, №2 (22), 2011. - С. 98-134.
  6. Фантаццини Д. Моделирование многомерных распределений с использованием копула-функций. II // Прикладная эконометрика. №3 (23), 2011. - С. 98-132.
  7. Фантаццини Д. Моделирование многомерных распределений с использованием копула-функций. III // Прикладная эконометрика, №4 (24), 2011. - С. 100-130.
  8. Genest C., MacKay R.J. Copules archim´ediennes et familles de lois bidimensionnelles dont les marges sont donn´ees. Canad. J. Statist. 14, 1986. - Р. 145-159.
  9. Yerel S., Konuk A. Bivariate lognormal distribution model of cutoff grade impurities: A case study of magnesite ore deposit. Scientific Research and Essay. Vol. 4 (12), 2009. - Р. 1500-1504.
  10. Тамм Ю.А., Гомозова Т.М. К аппроксимации интеграла вероятности // Электросвязь, №9, 1970. - С. 77-78.
  11. Бейтмен Г., Эрдейи А. Высшие трансцендентные функции. Т.2. М.: СМБ, 1974 - 296 с.
  12. Градштейн И.С., Рыжик И.Н. Таблицы интегралов, сумм, рядов и произведений. М.: Физматгиз, 1971. - 1108 с.

Statistics

Views

Abstract: 61

PDF (Russian): 31

Dimensions

Article Metrics

Metrics Loading ...

PlumX


Copyright (c) 2016 Kartashevskiy I.V.

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies