SOME GENERALIZATIONS OF METHOD OF MOMENTS IN PROBABILITY DENSITY ESTIMATION BY ORTHOGONAL SERIES


Дәйексөз келтіру

Толық мәтін

Аннотация

A problem of probability density function estimation for continuous random variable is considered in the paper. Actuality of this problem for science and technology including aerospace branch is discussed. Building of the probability density functions estimation by orthonormal series is considered. Applying of the method of moments to statistical estimating series coefficients is investigated, and some generalizations are suggested. Within the scope of method of moments the author uses consecutive ordinary moments of random variable. In this case the calculation of series coefficients estimations is reduced to solving system of linear equations. The paper has the proof of the theorem that in specified conditions of orthonormal system choice, suggested generalization of the method of moments includes the ordinary method of moments and also more widespread estimating coefficients method by sample means of orthonormal functions as particular cases. The paper shows that in the case of using Legendre’s orthonormal system the considered methods are identical. The properties of built estimations are researched, mathematical expectations and covariance matrix are founded. The paper shows that in particular cases the estimations of series coefficients are biased. The estimations of series coefficients, which are calculated by suggested method, were used for building estimation of probability density function. The paper has results of numerical calculations of quality functional values for built estimations of probability density function. The calculations are carried out for uniformly distributed random value. The author compares the suggested method with the widespread estimating method with using Chebyshev’s and trigonometric orthonormal systems. Research shows that generalized method of moments gives substantially better result on small samples.

Толық мәтін

Введение. Задача оценивания неизвестной функции плотности вероятности уже долгое время является важной научно-технической задачей [1]. От качества получаемых оценок плотности вероятности зависит качество основанных на ней алгоритмов классификации, распознавания образов, восстановления зависимостей и др. Кроме того, различные подходы к оцениванию плотности вероятности применяются при решении задач диагностики, часто встречающихся в аэрокосмической технике. Классический подход к оцениванию состоит в том, что подбирается модельный закон, который наилучшим образом описывает данную выборочную совокупность [2]. Однако в этом случае качество оценок существенно ухудшается при сложной структуре закона распределения случайной величины, например, если функция плотности многоэкстремальна, разрывна и т. п. При отсутствии априорной информации о виде закона распределения используются непараметрические оценки функции плотности вероятности. Наиболее распространены ядерные оценки, основанные на работах Розенблатта [3] и Парзена [4], а также оценки в виде ряда ортонормированных функций, называемые проекционными оценками [5]. В последнем случае предполагается, что истинная плотность f(x) принадлежит функциональному гильбертову пространству L2 [6]. Предположим сверх этого, что значения исследуемой случайной величины ξ с вероятностью 1 заключены в некотором отрезке. Не умаляя общности, будем считать, что . Проекционная оценка плотности вероятности имеет вид (1) где - полная система ортонормированных функций пространства L2; aj - коэффициенты, оцениваемые по выборке случайной величины ξ; N - параметр, характеризующий длину ряда ортонормированных функций, также подлежащий настройке. Как показывают численные расчёты, как коэффициенты aj, так и параметр N существенно влияют на качество оценки (1). Так как оптимальными коэффициентами для оценки (1) являются коэффициенты Фурье , , (2) то часто оценки aj коэффициентов строятся в виде выборочных средних значений функций φj(x): , , (3) где x1, …, xn - независимая выборка случайной величины ξ [7]. В [8] показано, что при использовании оценок (3) существует конечное оптимальное значение параметра N. Кроме рассмотренного подхода к построению оценок aj возможно применение метода моментов [9]. В настоящей работе используются начальные моменты случайной величины ξ. Так, приравняем оценки начальных моментов, рассчитанные по выборке, к их теоретическим значениям, рассчитанным с использованием оценки в качестве функции плотности вероятности: Подставляя вместо оценки её выражение (1), получим систему из (N + 1) линейных уравнений с (N + 1) неизвестными: (4) где - скалярное произведение в пространстве L2. Введя матричные обозначения , , , систему (4) можно переписать в виде . (4а) Эта система имеет единственное решение, если матрица B не вырождена [10]. В работе теоретически показано, что если используется система многочленов Лежандра, ортонормированная на отрезке [-1; 1], то матрица B не вырождена при любых конечных N ≥ 0. Численно проверено, что для системы Чебышёва [11] и тригонометрической системы [12] матрица B не вырождена по крайней мере при N ≤ 40. Тогда решение системы (4а) может быть записано в виде . (5) Данное решение, полученное методом моментов, может быть использовано для построения оценки функции плотности вероятности в виде выражения (1). Обобщение метода моментов. Данный подход допускает следующее обобщение. Возьмём произвольное целое и рассчитаем матрицу размерности . Обратную к ней матрицу обозначим через . Выделив в ней подматрицу , содержащую первые (N + 1) её строк, и умножив её на вектор из (N′ + 1) первых начальных выборочных моментов , получим вектор , (6) значения которого наряду со значениями (3) и (5) могут использоваться в качестве оценок коэффициентов для (1). Более того, справедлива следующая теорема. Теорема. Пусть система удовлетворяет следующему условию: при , (7) где - матричная норма, индуцированная векторной l∞-нормой [13]. Тогда при неограниченном увеличении и фиксированном N оценка (6) сходится по вероятности к оценке (3): , где . (8) Доказательство. Докажем более сильное утверждение: , (9) где . Для этого заметим, что . В свою очередь, ; . Тогда . (10) Возьмём теперь произвольное ε > 0. В силу условия (7) с возрастанием выражение может быть сделано меньшим ε, лишь только все . Однако для любой непрерывной случайной величины, распределённой на отрезке , включение всех выполнено с вероятностью 1. Таким образом, или Теперь, переходя к пределу в неравенстве (10), получим формулу (9). Неравенство означает, что каждая компонента вектора больше ε. Отсюда следует, в частности, выполнение этого неравенства для первых компонент. Таким образом, Теорема доказана. Из доказанного следует, что при условии (7) рассматриваемое обобщение метода моментов включает метод (3) как частный случай при . Поэтому для оценок (3) вводится обозначение . С другой стороны, очевидно, что при метод совпадает с обычным методом моментов. Для оценок функции плотности вероятности с коэффициентами (6) и (3) вводятся, соответственно, обозначения и . Можно показать, что для систем Лежандра, Чебышёва и тригонометрической системы выполняется условие (7). Причём для системы Лежандра выражение под пределом в (7) равно 0 при любом N ≥ 0. Действительно, для системы Лежандра имеем при , ; Поэтому при использовании системы Лежандра оценки, полученные по обобщённому методу моментов при любом , совпадают с оценками (3). Далее в статье предполагается, что система ортонормированных функций выбрана таким образом, что условие (7) выполнено. Свойства оценок. Найдём математические ожидания оценок (6): . Так как , то получаем окончательно . При получаем, что оценка является несмещённой: При конечных N′ оценка (6), в общем случае, смещена. Рассчитаем ковариационную матрицу оценок: где - ковариационная матрица степеней случайной величины ξ: . Переходя к пределу при N′ → ∞, получим ковариационную матрицу оценок (6): где - ковариационная матрица функций от случайной величины ξ: . Отсюда видно, что при неограниченном увеличении объёма выборки n дисперсии оценок стремятся к 0. Тогда из теоремы Чебышёва [9] оценки являются состоятельными. Применение оценок. Несмотря на отсутствие при конечных N′ для оценок таких свойств, как несмещённость и состоятельность, в некоторых случаях, особенно на малых выборках, оценка плотности вероятности всё же оказывается лучше, чем оценка . Близость оценки к истинной плотности характеризуется усреднённым квадратичным критерием [14]: . После преобразований получаем следующее выражение [8]: (11) где - оценка плотности вероятности с оптимальными коэффициентами: . (12) Выражение (11) позволяет значительно ускорить процесс вычисления значения критерия Q для данной ортонормированной системы {φi} и данной плотности вероятности f(x). Обобщённый метод моментов был применён при восстановлении различных законов распределения вероятностей. Графики зависимости разности между значением критерия (11) для оценки и оценки при оптимальном N′ представлены на рис. 1 и 2. Рассматривалась задача восстановления равномерного закона распределения на отрезке [0; 0, 5]. Результаты получены при малом объёме выборки n = 20. Из графиков видно, что на малых объёмах выборки обобщённый метод моментов при оптимально настроенных конечных N′ в широком диапазоне значений N даёт существенное улучшение качества оценки функции плотности вероятности. Рис 1. Сравнение качества аппроксимации при восстановлении плотности вероятности методами (3) и (6) с использованием ортонормированной системы Чебышёва Рис 2. Сравнение качества аппроксимации при восстановлении плотности вероятности методами (3) и (6) с использованием ортонормированной тригонометрической системы Заключение. В ходе исследования было разработано обобщение метода моментов для оценивания коэффициентов проекционной оценки (1) функции плотности вероятности, для которого методы оценивания (3) и (5) являются частными случаями. В некоторых случаях, особенно при малых объёмах выборки исследуемой случайной величины, удалось добиться улучшения оценки плотности вероятности по сравнению с наиболее часто используемым методом (3), несмотря на отсутствие у оценок коэффициентов таких свойств, как несмещённость и состоятельность. Здесь уместно замечание известного советского математика В. Н. Вапника: «Ниоткуда не следует, что в классе несмещённых оценок плотности имеются достаточно хорошие оценки. Ведь, как уже отмечалось, само свойство несмещенности оценки не имеет никакой самостоятельной ценности и вводится исключительно в целях ограничения класса оценок» [15].
×

Авторлар туралы

V. Branishti

Reshetnev Siberian State Aerospace University

Email: branishti-v-v@yandex.ru
31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation

Әдебиет тізімі

  1. Акимов С. С. Методы решения задачи восстановления плотности вероятности по выборке из генеральной совокупности // Естественные и математические науки в современном мире. 2014. № 1 (13). С. 29-35.
  2. Кобзарь А. И. Прикладная математическая статистика: для инженеров и научных работников. М. : Физматлит, 2006. 816 с.
  3. Rosenblatt M. Remarks on some nonparametric estimates of a density function // The Annals of Mathematical Statistics. 1956. Vol. 27, № 3. P. 832-837.
  4. Parzen E. On estimation of a probability density function and mode // The Annals of Mathematical Statistics. 1962. Vol. 35, № 3. Pp. 1065-1076.
  5. Ченцов Н. Н. Статистические решающие правила и оптимальные выводы. М. : Физматлит, 1972. 520 с.
  6. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа. 6-е изд., испр. М. : Наука, 1989. 624 с.
  7. Ченцов Н. Н. Оценка неизвестной плотности распределения по наблюдениям // ДАН СССР. 1962. Т. 147, № 1. С. 45-48.
  8. Новосёлов А. А. Об оптимальном выборе структуры функции плотности вероятности и регрессии : препринт. Красноярск : ВЦ СО АН СССР, 1979. 31 с.
  9. Крамер Г. Математические методы статистики : пер. с англ. 2-е изд., стер. М. : Мир, 1975. 648 с.
  10. Мальцев А. И. Основы линейной алгебры. 3-е изд. М. : Наука, 1970. 400 с.
  11. Никифоров А. Ф., Уваров В. Б. Специальные функции математической физики. 2-е изд., перераб. и доп. М. : Наука, 1984. 344 с.
  12. Фихтенгольц Г. М. Курс дифференциального и интегрального исчисления. 8-е изд. М. : Физматлит, 2003. Т. 3. 728 с.
  13. Хорн Р., Джонсон Ч. Матричный анализ : пер. с англ. М. : Мир, 1989. 655 с.
  14. Епанечников В. А. Непараметрическая оценка многомерной плотности вероятности // Теория вероятностей и её применения. 1969. Т. 14, № 1. С. 156-162.
  15. Вапник В. Н. Восстановление зависимостей по эмпирическим данным. М. : Наука, 1979. 448 с.
  16. Akimov S. S. [Methods of probability density function recovering with sample of the entire assembly]. Estestvennye i matematicheskie nauki v sovremennom mire. 2014, Vol. 1 (13), P. 29-35 (In Russ.).
  17. Kobzar A. I. Prikladnaya matematicheskaya statistika: dlya inzhenerov i nauchnykh rabotnikov [Applied mathematical statistics: for engineers and scientists]. Moscow, Fizmatlit Publ., 2006, 816 p.
  18. Rosenblatt M. [Remarks on some nonparametric estimates of a density function]. The Annals of Mathematical Statistics, 1956, Vol. 27, 3, P. 832-837.
  19. Parzen E. On estimation of a probability density function and mode. The Annals of Mathematical Statistics, 1962, Vol. 35, No. 3, P. 1065-1076.
  20. Chentsov N. N. Statisticheskie reshayushchie pravila i optimal’nye vyvody [Statistical decision rules and optimal conclusions]. Moscow, Fizmatlit Publ., 1972, 520 p.
  21. Kolmogorov A. N., Fomin S. V. Elementy teorii funktsiy i funktsional'nogo analiza [Elements of function theory and function analysis]. 6th edition. Moscow, Nauka Publ., 1989, 624 p.
  22. Chentsov N. N. [Estimation of unknown probability density function on observations]. Doklady Akademii nauk SSSR, 1962, Vol. 147, No. 1, P. 45-48 (In Russ.).
  23. Novoselov A. A. Ob optimal’nom vybore struktury funktsii plotnosti veroyatnosti i regressii: preprint [On optimal choice of probability density function and regression structure: preprint]. Krasnoyarsk, Computational Centre of Siberian Department Academy of Science USSR Publ., 1979, 31 p.
  24. Cramér H. Mathematical methods of statistics. Princeton University Press, 1946, 575 p.
  25. Maltsev A. I. Osnovy lineynoy algebry [Basics of linear algebra], 3rd ed. Moscow, Nauka Publ., 1970, 400 p.
  26. Nikiforov A. F., Uvarov V. B. Spetsial’nye funktsii matematicheskoy fiziki [Special functions of mathematical physics], 2nd ed. Moscow, Nauka Publ., 1984, 344 p.
  27. Fikhtengol’ts G. M. Kurs differentsial’nogo i integral'nogo ischisleniya [Course of differential and integral calculus]. 8th ed. Moscow, Fizmatlit Bubl., 2003, Vol. 3, 728 p.
  28. Horn R., Johnson C. Matrix analysis. Cambridge University Press, 1990, 561p.
  29. Epanechnikov V. A. [Nonparametric estimation of a multidimensional probability density]. Teoriya veroyatnostey i ee prilozheniya, 1969, Vol. 14, No. 1,
  30. P. 156-162 (In Russ.).
  31. Vapnik V. N. Vosstanovleniye zavisimostey po empiricheskim dannym [Dependences recovery from empirical data]. Moscow, Nauka Publ., 1979, 448 p.

Қосымша файлдар

Қосымша файлдар
Әрекет
1. JATS XML

© Branishti V.V., 2015

Creative Commons License
Бұл мақала лицензия бойынша қолжетімді Creative Commons Attribution 4.0 International License.

Осы сайт cookie-файлдарды пайдаланады

Біздің сайтты пайдалануды жалғастыра отырып, сіз сайттың дұрыс жұмыс істеуін қамтамасыз ететін cookie файлдарын өңдеуге келісім бересіз.< / br>< / br>cookie файлдары туралы< / a>