Sub-band Representation Image Analysis in the Field of Spatial Frequencies

Abstract

Currently, two-dimensional visual representations of various information arrays are widespread, since images are the most natural form of information exchange for humans. Therefore, various information technologies for the implementation of computer image processing have been created. A signifcant place among existing information technologies is occupied by computer image analysis, the basis of which is the procedure for determining certain properties that characterize them from certain positions. In particular, an important area of image analysis is the automatic classifcation of their constituent objects (pattern recognition). The main attention is paid to the choice of the so-called feature space, which from the standpoint of the problem being solved most adequately refects the properties of the analyzed images. The article considers the possibility of using a sub-band method for image analysis, the application of which, as shown by the research results, allows to obtain characteristics that can be used as features for their comparison.

Full Text

Одним из характерных свойств изображений является наличие квазипериодичности в ориентации линий и контуров объектов. Это позволяет говорить об адекватности анализа изображений на основе частотных представлений, основным инструментом которых служат трансформанты Фурье следующего вида: 12 12 11 , exp( ( 1) ( 1)), = = Φ ωω = = - ω - +ω - ∑∑ F NM ik ik f ik () j( (1) где , ik f 1,.., ; = iN 1,.., = kM - пиксели изобра- жения { }; = ik Ff 11 2; ω= πv 22 2 ω= πv - круговые нормированные пространственные частоты в том смысле, что выполняются неравенства (следствие дискретизации) 12 , 0,5. -≤ < vv 0,5 (2) Ввиду ортогональности используемого в (1) двумерного базиса в области (2) имеет место равенство Парсеваля [1], которое показывает 22 11 22 12 1 2 || | ( , )| /4 . || NM ik ik F Ff dd = = ππ -π -π = = = Φ ωω ω ω π ∑∑ ∫∫ (3) Важность этого равенства определяется тем,что оно описывает распределение евклидовой нормы (энергии) изображения в области определения трансформанты Фурье (пространственных частот). Это распределение можно представить в следующем виде: 12 2 11 || ( ), || RR sr sr F EF = = = ∑∑ (4) где () sr EF - часть энергии (квадрата нормы) 22 (, ) ( ) | ( , )| /4 , ω∈ =Φπ ∫∫ sr F sr uvV E F u v dudv (5) связанная с одной из подобластей пространственных частот ( ) 2 1 21 2 1 21 { [ , [ , )) ( [ , ) [ , ))}, = ∈- - ∪ ∩ ∩ ∈- - ∪ sr s s s s r r rr V u u u uu v v v vv (6) которые не пересекаются и полностью покрывают всю область вида (2). Условия покрытия всей области (2) имеют вид: 12 11 11 2 1 21 0; ; ;. = = > >==π ss r r sR rR uv uu vvu v (7) Очевидно, что характеристики (5) могут использоваться для описания свойств изображений, предназначенных для реализации компьютерной обработки [2; 3], например, в качестве признаков [4; 5] при идентификации их в том или ином классе. Кроме того, ниже будут получены и другие характеристики изображений. Анализ свойств изображений на основе субполосных представлений. Анализ свойств изображений с позиций разбиения области определения их трансформант Фурье (2) на подобласти вида (6), (7) будем именовать субполосным [6]. Важно, что эти характеристики могут быть вычислены непосредственно в области оригиналов (без перехода в частотную область). Нетрудно получить соответствующее представление, если в определение (5) подставить представление (1) подынтегральной функции. В результате имеем: 11 2 2 , 1, 1 1 ( ,) ( , ) 12 2 11 2 2 () exp( (( 1) ( 1) ( 1) ( 1) ) . = = ∈∈ = × × --+ +- -- - -- ∑∑ ∫∫ ∫∫ sr sr NM sr ik nm in km uv V uv V E F ff ji u k vnu m v du dv du dv После интегрирования и проведения несложных преобразований получаем искомое представление: () ( ) = T sr s r E F sp A FB F , (8) где символ sp означает след матрицы; { }, , 1,.., ; { }, , 1,.., = = = = s s ik r r nm A a ik N B b nm M - матрицы с элементами 2sin ( )/2)/( ( )) cos( ( )), / ; = ∆ - π- × × Ω- =∆ π s ik s s s ii s a (uik ik ik a u (9) 2sin ( )/2)/( ( )) cos( ( )), / ; = ∆ - π- × × Ω- =∆π r nm r r r mm r b (vnm nm nm b v (10) 21 21 ; ( ) / 2; ∆ = - Ω= + ss s s s s uu u u u (11) 21 21 ; ( ) / 2. ∆ = - Ω= + rr r r r r vv v v v (12) Здесь и в дальнейшем верхний индекс T означает символ транспонирования матриц и векторов. Представляется естественным матрицы с элементами вида (9) и (10) называть субполосными. Они обладают рядом примечательных свойств, которые полезны для осуществления субполосного анализа изображений. Для более детального анализа этих свойств целесообразно привести общее интегральное представление элементов субполосной матрицы { }, = u u ik Cc , 1,.., = ik N соотносимых с некоторой частотной полосой (субполосой) 2 1 12 1 2 [ , ) ( , ], 0 ; . = - - ∪ < ≤π U u u uu u u (13) Это представление имеет вид exp( ( )) / 2 . ∈ = -- π ∫ u ik uU c ju i k du (14) На основе этого представления легко показать, что субполосные матрицы будут неотрицательно определенными. В самом деле, пусть вектор 1 ( ,.., ) =  T N xxx состоит из вещественных компонент. Тогда при подстановке (14) в определение субполосной квадратичной формы ,1 () = = = ∑  N Tu u u i k ik ik G x x Cx xxc (15) нетрудно получить соотношение 2 ( ) | ( )| /2 , ∈ = π ∫  u uU G x X u du (16) где () Xu - трансформанта (спектр) Фурье рассматриваемого вектора 1 ( ) exp( ( 1)). = = -- ∑ N i i X u x ju i (17) Так как соотношение (17) определяет целую функцию частоты, то она ни в каком частотном интервале конечных размеров не может быть тождественно равна нулю. Поэтому интеграл в правой части (16), а следовательно, и квадратичная форма (15) на всем векторном пространстве будет положительной, то есть выполняется неравенство ,1 = = > ∑  N Tu u i k ik ik x Cx xxc 0. (18) Ясно также, что представление (14) определяет симметричную матрицу. Поэтому она является матрицей простой структуры [7], то есть обладает набором собственных векторов, образующих ортонормальный базис в пространстве векторов соответствующей размерности. Таким образом, справедливо представление , T u uu u C QLQ = (19) где 1 ( ... ) =  uu uN Q qq - ортогональная матрица собственных векторов (1,...,1), = = TT uu u u QQ QQ diag (20) , = u u uu CQ QL (21) 1 ( ,.., ) = λλ uu u L N diag - диагональная матрица собственных чисел. Ввиду (18) собственные числа субполосной матрицы тоже положительны [7], и в дальнейшем полагаем, что они упорядочены по убыванию: 12 ... 0. λ ≥λ ≥ ≥λ > uu u N (22) На основе (21) и (14) нетрудно получить следующее соотношение для компонент собственных векторов ( )exp( ( 1)) / 2 , ∈ λ= - π ∫ r mr r zU q H z jz m dz (23) где 1 ( ) exp( ( 1)). = = -- ∑ N uu r mr m H z q jm (24) Таким образом, собственные векторы субполосных матриц полностью определяются отрезками их трансформант Фурье в рассматриваемом частотном интервале. Умножив (23) слева и справа на u mn q и суммирования по общему нижнему индексу, с учетом свойства ортонормальности собственных векторов (20) получаем важные соотношения (звездочка вверху означает комплексное сопряжение): * * () () /2 () () 0, ∈ π -π π= = = ∫ ∫ uu rn zU uu rn H z H z dz H z H z dz (25) 2 | ( )| /2 ∈ λ = π≤ ∫ uu rr zU H z dz 1. (26) Соотношение (25) определяет так называемое [1] свойство двойной ортогональности спектров собственных векторов. В свою очередь соотношение (26) наряду с равенством Парсеваля показывает, что собственное число равно попадающей в исходный частотный интервал части квадрата евклидовой нормы (энергии) соответствующего собственного вектора. Отметим, что близость собственного числа к единице означает, что область определения спектра соответствующего собственного числа имеет малые размеры (финитна). Соотношение (19) вместе с (20) определяют ортогонально подобные матрицы, следы которых поэтому равны [7], то есть для среднего собственного числа, согласно (25), должно выполняться равенство 21 11 / ( )/ , = = λ= =- π ∑∑ NN uu i ii i N cN uu i / (27) которое следует из (13) и (14). Таким образом, все собственные числа равны единице тогда и только тогда, когда ширина субполосы совпадает со всей областью определения трансформанты Фурье. Очевидно, что в этом случае субполосная матрица с элементами (14) будет единичной. По аналогии с (9) для элементов (14) можно использовать представление 0 2 cos( ( )), = Ω- u ik ik u c c ik (28) где 0 0 sin( ( ) / 2) / ( ( )), /2 . = ∆ - π- =∆π ik ii c uik ik cu (29) Остальные переменные определены соотношениями (11)-(12). В свою очередь, полагая 00 { }, , 1,.., , = = u ik C c ik N (30) 2 (1,cos ,..,cos( ( 1))), 2 (0,sin ,..,sin( ( 1))), = Ω Ω- = Ω Ω- u uu u uu CS N SS N diag diag (31) субполосную матрицу (14) можно представить в аддитивном виде: 00 . = + u uu u uu u C CS C CS SS C SS (32) Субполосную матрицу вида (30) будем называть нулевой для выбранной частотной подполосы. Соотношение (31) определяет процедуру переноса ее в пределы этой субполосы, что может быть удобным для многократного использования субполос одной и той же ширины. Поэтому применение субполосного анализа представляется целесообразным использовать разбиения частотной полосы на 1 + R субполос, границы которых определяются следующим образом: 10 20 11 20 21 0 2/ ; ; 4 / , 1,.., . ==π= = +π = rr u u Nu u u u Nr R ; (33) При этом в соответствии с требованием (13) совпадения с границей области определения должно выполняться равенство ( 2) / 4. = - RN (34) Так как количество частотных интервалов должно быть целым, то выбор размерности обрабатываемых векторов (строк или столбцов изображений) должен это обеспечивать. Пусть теперь наряду с изображением F рассматривается изображение такой же размерности { }, = ik Dd 1,.., ; = iN 1,.., . = kM Тогда квадрат евклидовой нормы их разности = - CFD (35) можно в соответствии с (4) представить в субполосной форме: 2 1 || ( ). = = -= - ∑∑ sr r FD EFD 12 RR s1 || (36) Очевидно, что каждое из слагаемых в последнем соотношении можно считать локальной субполосной мерой близости, которая в соответствии с (5) отражает близость двумерных отрезков трансформант Фурье сравниваемых изображений в заданных подобластях пространственных частот. При этом в вычислительном соотношении (8) необходимо F заменить на . C Для слагаемых в правой части (36) нетрудно показать справедливость следующего соотношения: ( ) ( ) ( ) 2 ( , ), -= + - sr sr sr sr EFD EF ED WFD (37) где последнее слагаемое естественно именовать субполосной корреляцией двух изображений: *2 (, ) (, ) (,) (,) /4 . ω∈ = = ΦΦ π ∫∫ sr sr FD uvV W FD u v u v dudv (38) Сопоставление правой части (38) с определением (5) дает равенства ( , ) ( ); ( , ) ( ). = = sr sr sr sr WFF EF WDD ED (39) После подстановки в (38) определений трансформант Фурье вида (1) и очевидных преобразований можно получить соотношения для вычислений непосредственно в области оригиналов: ( , ) ( ). = T sr s r W F D sp A FB D (40) Таким образом, субполосная корреляция является вещественным числом. Можно также определить нормированный субполосный коэффициент корреляции: 1/2 (, ) (, )/( () ()), ρ= sr sr sr sr FD W FD E FE D (41) который вследствие (39) удовлетворяет неравенству | ( , )| 1 ρ≤ sr FD (42) и может использоваться в качестве меры сходства двумерных отрезков трансформант Фурье сравниваемых изображений в заданной подобласти пространственных частот. Важным направлением анализа изображений служит разделение их на аддитивные компоненты одинаковой размерности [5]: 12 , = + FF F (43) где 11 { }; = ik Ff 22 , { }, = ik Ff 1,.., ; = iN 1,.., . = kM Такие процедуры принято именовать фильтрацией. Часто для получения компонент используются частотные представления. Достаточно широко применяются следующие идеальные требования 1 (,) (,), (,) , Φ ≡Φ ∈ FF sr uv uv uv V (44) 1 (,) 0, (,) . Φ≡ ∉ F sr uv uv V (45) В настоящее время для фильтрации чаще всего используются либо фильтры с конечной импульсной характеристикой (КИХ-фильтры), либо прием обнуления некоторых коэффициентов дискретного преобразования Фурье (ДПФ) и последующего обратного ДПФ [8-11]. В любом случае в точности выполнить требования (44), (45) невозможно. Поэтому целесообразно ввести некоторую меру погрешности их достижения. Естественной мерой представляется функционал следующего вида: 1 1 12 1 ( , ) ( ) || || ( ). sr sr sr PFF EFF F EF = -+ - (46) Заметим, что здесь в правой части первое слагаемое определяет точность выполнения тождеств (44), тогда как остальные два - меру отклонения от тождества (45) (согласно равенству Парсеваля). С учетом равенства (37) и представлений (8) и (40) правую часть (46) можно преобразовать: 1 1 11 (, ) ( 2 ). = + +- + T sr s r TT sr P F F spA FB F sp A FB F F F (47) Очевидно, что искомая компонента изображения должна минимизировать этот функционал. Ясно, что при этом должен минимизироваться след матрицы (часть выражения (47) в скобках). Это соответствует минимизации ее евклидовой нормы. Таким образом, минимум функционала погрешностей выполнения (44), (45) достигается на матрице (изображении): 1 , = sr F A FB (48) подстановка которой в (47) с учетом симметрии субполосных матриц дает соотношение для вычисления достигаемого значения: 1 1 min ( , ) ( ), . × = - -∈ T sr s r T NM s rr s P F F sp A FB F AFBBF A F R (49) Отсюда нетрудно получить и иное представление: 1 1 min ( , ) ( ( )), . × = - -∈ T sr s r T NM rs P F F sp A FB F BF A F R (50) Легко увидеть, что второй сомножитель здесь равен второму слагаемому в (43), который получается в результате минимизации функционала (46). Заключение Субполосный подход к анализу изображений позволяет получить характеристики, которые можно использовать в качестве признаков для их сравнения. Получены соотношения, определяющие важнейшие понятия субполосного анализа, и, в частности, разработана процедура оптимальной фильтрации. Работа выполнена при финансовой поддержке гранта РФФИ № 20-07-00241.
×

About the authors

A. N Zalivin

Belgorod University of Cooperation of Economics and Law

Email: belov@bsu.edu.ru
Belgorod, Russian Federation

A. A Chernomorets

Belgorod State National Research University

Email: belov@bsu.edu.ru
Belgorod, Russian Federation

E. G Zhilyakov

Belgorod State National Research University

Email: belov@bsu.edu.ru
Belgorod, Russian Federation

S. P Belov

Belgorod University of Cooperation of Economics and Law

Email: belov@bsu.edu.ru
Belgorod, Russian Federation

References

  1. Хургин Я.И., Яковлев В.П. Финитные функции в физике и технике. М.: Наука, 1971. 408 с.
  2. Дворкович В.П., Дворкович А.В. Цифровые видеоинформационные системы. М.: Техносфера, 2012. 1009 с.
  3. Обработка и анализ цифровых изображений с примерами на LabVIEW и IMAQ Vision / Ю.В. Визильтер [и др.]. М.: ДМК пресс, 2007. 464 с.
  4. Горелик А.Л., Скрипкин В.А. Методы распознавания. М.: Высшая школа, 2004. 264 с.
  5. Ветров Д.П., Рязанов В.В. О минимизации признакового пространства в задачах распознавания // Математические методы распознавания образов (ММРО-10): доклады Всероссийской конференции. М.: Изд-во ВЦ РАН, 2001. С. 22-25.
  6. Жиляков Е.Г. Оптимальные субполосные методы анализа и синтеза сигналов конечной длительности // Автоматика и телемеханика. 2015. № 4. С. 51-66.
  7. Гантмахер Ф.Р. Теория матриц. М.: Физматлит, 2004. 560 с.
  8. Лайонс Р. Цифровая обработка сигналов / пер. с англ. М.: ООО «Бином-Пресс», 2007. 656 с.
  9. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2012. 1105 с.
  10. Арлазаров В.Л., Емельянов Н.Е. Обработка изображений и анализ данных. М.: ИСА РАН,2008. Т. 38. 368 с.
  11. Оберхеттингер Ф. Преобразование Фурье распределений и их обращения / пер. с англ. М.С. Никулина. М.: Наука, 1979. 248 с.

Statistics

Views

Abstract: 119

PDF (Russian): 17

Dimensions

Article Metrics

Metrics Loading ...

PlumX


Copyright (c) 2020 Zalivin A.N., Chernomorets A.A., Zhilyakov E.G., Belov S.P.

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies