Анализ изображений на основе субполосных представлений в области пространственных частот


Цитировать

Полный текст

Аннотация

В настоящее время двумерные визуальные отображения различных информационных массивов широко распространены, так как изображения являются наиболее естественной для человека формой информационного обмена. Поэтому созданы различные информационные технологии, предназначенные для реализации компьютерной обработки изображений. Существенное место среди информационных технологий занимает компьютерный анализ изображений, основу которого составляют процедуры определения тех или иных свойств, характеризующих их с определенных позиций. В частности, важным направлением анализа изображений служат процедуры автоматической классификации составляющих их объектов(распознавания образов). При этом главное внимание уделяется выбору так называемого пространства признаков, которые с позиций решаемой задачи наиболее адекватно отражают свойства анализируемых изображений. В статье рассматривается возможность использования для анализа изображений субполосного метода, применение которого, как показали результаты исследований, позволяет получить характеристики, которые можно использовать в качестве признаков для их сравнения.

Полный текст

Одним из характерных свойств изображений является наличие квазипериодичности в ориентации линий и контуров объектов. Это позволяет говорить об адекватности анализа изображений на основе частотных представлений, основным инструментом которых служат трансформанты Фурье следующего вида: 12 12 11 , exp( ( 1) ( 1)), = = Φ ωω = = - ω - +ω - ∑∑ F NM ik ik f ik () j( (1) где , ik f 1,.., ; = iN 1,.., = kM - пиксели изобра- жения { }; = ik Ff 11 2; ω= πv 22 2 ω= πv - круговые нормированные пространственные частоты в том смысле, что выполняются неравенства (следствие дискретизации) 12 , 0,5. -≤ < vv 0,5 (2) Ввиду ортогональности используемого в (1) двумерного базиса в области (2) имеет место равенство Парсеваля [1], которое показывает 22 11 22 12 1 2 || | ( , )| /4 . || NM ik ik F Ff dd = = ππ -π -π = = = Φ ωω ω ω π ∑∑ ∫∫ (3) Важность этого равенства определяется тем,что оно описывает распределение евклидовой нормы (энергии) изображения в области определения трансформанты Фурье (пространственных частот). Это распределение можно представить в следующем виде: 12 2 11 || ( ), || RR sr sr F EF = = = ∑∑ (4) где () sr EF - часть энергии (квадрата нормы) 22 (, ) ( ) | ( , )| /4 , ω∈ =Φπ ∫∫ sr F sr uvV E F u v dudv (5) связанная с одной из подобластей пространственных частот ( ) 2 1 21 2 1 21 { [ , [ , )) ( [ , ) [ , ))}, = ∈- - ∪ ∩ ∩ ∈- - ∪ sr s s s s r r rr V u u u uu v v v vv (6) которые не пересекаются и полностью покрывают всю область вида (2). Условия покрытия всей области (2) имеют вид: 12 11 11 2 1 21 0; ; ;. = = > >==π ss r r sR rR uv uu vvu v (7) Очевидно, что характеристики (5) могут использоваться для описания свойств изображений, предназначенных для реализации компьютерной обработки [2; 3], например, в качестве признаков [4; 5] при идентификации их в том или ином классе. Кроме того, ниже будут получены и другие характеристики изображений. Анализ свойств изображений на основе субполосных представлений. Анализ свойств изображений с позиций разбиения области определения их трансформант Фурье (2) на подобласти вида (6), (7) будем именовать субполосным [6]. Важно, что эти характеристики могут быть вычислены непосредственно в области оригиналов (без перехода в частотную область). Нетрудно получить соответствующее представление, если в определение (5) подставить представление (1) подынтегральной функции. В результате имеем: 11 2 2 , 1, 1 1 ( ,) ( , ) 12 2 11 2 2 () exp( (( 1) ( 1) ( 1) ( 1) ) . = = ∈∈ = × × --+ +- -- - -- ∑∑ ∫∫ ∫∫ sr sr NM sr ik nm in km uv V uv V E F ff ji u k vnu m v du dv du dv После интегрирования и проведения несложных преобразований получаем искомое представление: () ( ) = T sr s r E F sp A FB F , (8) где символ sp означает след матрицы; { }, , 1,.., ; { }, , 1,.., = = = = s s ik r r nm A a ik N B b nm M - матрицы с элементами 2sin ( )/2)/( ( )) cos( ( )), / ; = ∆ - π- × × Ω- =∆ π s ik s s s ii s a (uik ik ik a u (9) 2sin ( )/2)/( ( )) cos( ( )), / ; = ∆ - π- × × Ω- =∆π r nm r r r mm r b (vnm nm nm b v (10) 21 21 ; ( ) / 2; ∆ = - Ω= + ss s s s s uu u u u (11) 21 21 ; ( ) / 2. ∆ = - Ω= + rr r r r r vv v v v (12) Здесь и в дальнейшем верхний индекс T означает символ транспонирования матриц и векторов. Представляется естественным матрицы с элементами вида (9) и (10) называть субполосными. Они обладают рядом примечательных свойств, которые полезны для осуществления субполосного анализа изображений. Для более детального анализа этих свойств целесообразно привести общее интегральное представление элементов субполосной матрицы { }, = u u ik Cc , 1,.., = ik N соотносимых с некоторой частотной полосой (субполосой) 2 1 12 1 2 [ , ) ( , ], 0 ; . = - - ∪ < ≤π U u u uu u u (13) Это представление имеет вид exp( ( )) / 2 . ∈ = -- π ∫ u ik uU c ju i k du (14) На основе этого представления легко показать, что субполосные матрицы будут неотрицательно определенными. В самом деле, пусть вектор 1 ( ,.., ) =  T N xxx состоит из вещественных компонент. Тогда при подстановке (14) в определение субполосной квадратичной формы ,1 () = = = ∑  N Tu u u i k ik ik G x x Cx xxc (15) нетрудно получить соотношение 2 ( ) | ( )| /2 , ∈ = π ∫  u uU G x X u du (16) где () Xu - трансформанта (спектр) Фурье рассматриваемого вектора 1 ( ) exp( ( 1)). = = -- ∑ N i i X u x ju i (17) Так как соотношение (17) определяет целую функцию частоты, то она ни в каком частотном интервале конечных размеров не может быть тождественно равна нулю. Поэтому интеграл в правой части (16), а следовательно, и квадратичная форма (15) на всем векторном пространстве будет положительной, то есть выполняется неравенство ,1 = = > ∑  N Tu u i k ik ik x Cx xxc 0. (18) Ясно также, что представление (14) определяет симметричную матрицу. Поэтому она является матрицей простой структуры [7], то есть обладает набором собственных векторов, образующих ортонормальный базис в пространстве векторов соответствующей размерности. Таким образом, справедливо представление , T u uu u C QLQ = (19) где 1 ( ... ) =  uu uN Q qq - ортогональная матрица собственных векторов (1,...,1), = = TT uu u u QQ QQ diag (20) , = u u uu CQ QL (21) 1 ( ,.., ) = λλ uu u L N diag - диагональная матрица собственных чисел. Ввиду (18) собственные числа субполосной матрицы тоже положительны [7], и в дальнейшем полагаем, что они упорядочены по убыванию: 12 ... 0. λ ≥λ ≥ ≥λ > uu u N (22) На основе (21) и (14) нетрудно получить следующее соотношение для компонент собственных векторов ( )exp( ( 1)) / 2 , ∈ λ= - π ∫ r mr r zU q H z jz m dz (23) где 1 ( ) exp( ( 1)). = = -- ∑ N uu r mr m H z q jm (24) Таким образом, собственные векторы субполосных матриц полностью определяются отрезками их трансформант Фурье в рассматриваемом частотном интервале. Умножив (23) слева и справа на u mn q и суммирования по общему нижнему индексу, с учетом свойства ортонормальности собственных векторов (20) получаем важные соотношения (звездочка вверху означает комплексное сопряжение): * * () () /2 () () 0, ∈ π -π π= = = ∫ ∫ uu rn zU uu rn H z H z dz H z H z dz (25) 2 | ( )| /2 ∈ λ = π≤ ∫ uu rr zU H z dz 1. (26) Соотношение (25) определяет так называемое [1] свойство двойной ортогональности спектров собственных векторов. В свою очередь соотношение (26) наряду с равенством Парсеваля показывает, что собственное число равно попадающей в исходный частотный интервал части квадрата евклидовой нормы (энергии) соответствующего собственного вектора. Отметим, что близость собственного числа к единице означает, что область определения спектра соответствующего собственного числа имеет малые размеры (финитна). Соотношение (19) вместе с (20) определяют ортогонально подобные матрицы, следы которых поэтому равны [7], то есть для среднего собственного числа, согласно (25), должно выполняться равенство 21 11 / ( )/ , = = λ= =- π ∑∑ NN uu i ii i N cN uu i / (27) которое следует из (13) и (14). Таким образом, все собственные числа равны единице тогда и только тогда, когда ширина субполосы совпадает со всей областью определения трансформанты Фурье. Очевидно, что в этом случае субполосная матрица с элементами (14) будет единичной. По аналогии с (9) для элементов (14) можно использовать представление 0 2 cos( ( )), = Ω- u ik ik u c c ik (28) где 0 0 sin( ( ) / 2) / ( ( )), /2 . = ∆ - π- =∆π ik ii c uik ik cu (29) Остальные переменные определены соотношениями (11)-(12). В свою очередь, полагая 00 { }, , 1,.., , = = u ik C c ik N (30) 2 (1,cos ,..,cos( ( 1))), 2 (0,sin ,..,sin( ( 1))), = Ω Ω- = Ω Ω- u uu u uu CS N SS N diag diag (31) субполосную матрицу (14) можно представить в аддитивном виде: 00 . = + u uu u uu u C CS C CS SS C SS (32) Субполосную матрицу вида (30) будем называть нулевой для выбранной частотной подполосы. Соотношение (31) определяет процедуру переноса ее в пределы этой субполосы, что может быть удобным для многократного использования субполос одной и той же ширины. Поэтому применение субполосного анализа представляется целесообразным использовать разбиения частотной полосы на 1 + R субполос, границы которых определяются следующим образом: 10 20 11 20 21 0 2/ ; ; 4 / , 1,.., . ==π= = +π = rr u u Nu u u u Nr R ; (33) При этом в соответствии с требованием (13) совпадения с границей области определения должно выполняться равенство ( 2) / 4. = - RN (34) Так как количество частотных интервалов должно быть целым, то выбор размерности обрабатываемых векторов (строк или столбцов изображений) должен это обеспечивать. Пусть теперь наряду с изображением F рассматривается изображение такой же размерности { }, = ik Dd 1,.., ; = iN 1,.., . = kM Тогда квадрат евклидовой нормы их разности = - CFD (35) можно в соответствии с (4) представить в субполосной форме: 2 1 || ( ). = = -= - ∑∑ sr r FD EFD 12 RR s1 || (36) Очевидно, что каждое из слагаемых в последнем соотношении можно считать локальной субполосной мерой близости, которая в соответствии с (5) отражает близость двумерных отрезков трансформант Фурье сравниваемых изображений в заданных подобластях пространственных частот. При этом в вычислительном соотношении (8) необходимо F заменить на . C Для слагаемых в правой части (36) нетрудно показать справедливость следующего соотношения: ( ) ( ) ( ) 2 ( , ), -= + - sr sr sr sr EFD EF ED WFD (37) где последнее слагаемое естественно именовать субполосной корреляцией двух изображений: *2 (, ) (, ) (,) (,) /4 . ω∈ = = ΦΦ π ∫∫ sr sr FD uvV W FD u v u v dudv (38) Сопоставление правой части (38) с определением (5) дает равенства ( , ) ( ); ( , ) ( ). = = sr sr sr sr WFF EF WDD ED (39) После подстановки в (38) определений трансформант Фурье вида (1) и очевидных преобразований можно получить соотношения для вычислений непосредственно в области оригиналов: ( , ) ( ). = T sr s r W F D sp A FB D (40) Таким образом, субполосная корреляция является вещественным числом. Можно также определить нормированный субполосный коэффициент корреляции: 1/2 (, ) (, )/( () ()), ρ= sr sr sr sr FD W FD E FE D (41) который вследствие (39) удовлетворяет неравенству | ( , )| 1 ρ≤ sr FD (42) и может использоваться в качестве меры сходства двумерных отрезков трансформант Фурье сравниваемых изображений в заданной подобласти пространственных частот. Важным направлением анализа изображений служит разделение их на аддитивные компоненты одинаковой размерности [5]: 12 , = + FF F (43) где 11 { }; = ik Ff 22 , { }, = ik Ff 1,.., ; = iN 1,.., . = kM Такие процедуры принято именовать фильтрацией. Часто для получения компонент используются частотные представления. Достаточно широко применяются следующие идеальные требования 1 (,) (,), (,) , Φ ≡Φ ∈ FF sr uv uv uv V (44) 1 (,) 0, (,) . Φ≡ ∉ F sr uv uv V (45) В настоящее время для фильтрации чаще всего используются либо фильтры с конечной импульсной характеристикой (КИХ-фильтры), либо прием обнуления некоторых коэффициентов дискретного преобразования Фурье (ДПФ) и последующего обратного ДПФ [8-11]. В любом случае в точности выполнить требования (44), (45) невозможно. Поэтому целесообразно ввести некоторую меру погрешности их достижения. Естественной мерой представляется функционал следующего вида: 1 1 12 1 ( , ) ( ) || || ( ). sr sr sr PFF EFF F EF = -+ - (46) Заметим, что здесь в правой части первое слагаемое определяет точность выполнения тождеств (44), тогда как остальные два - меру отклонения от тождества (45) (согласно равенству Парсеваля). С учетом равенства (37) и представлений (8) и (40) правую часть (46) можно преобразовать: 1 1 11 (, ) ( 2 ). = + +- + T sr s r TT sr P F F spA FB F sp A FB F F F (47) Очевидно, что искомая компонента изображения должна минимизировать этот функционал. Ясно, что при этом должен минимизироваться след матрицы (часть выражения (47) в скобках). Это соответствует минимизации ее евклидовой нормы. Таким образом, минимум функционала погрешностей выполнения (44), (45) достигается на матрице (изображении): 1 , = sr F A FB (48) подстановка которой в (47) с учетом симметрии субполосных матриц дает соотношение для вычисления достигаемого значения: 1 1 min ( , ) ( ), . × = - -∈ T sr s r T NM s rr s P F F sp A FB F AFBBF A F R (49) Отсюда нетрудно получить и иное представление: 1 1 min ( , ) ( ( )), . × = - -∈ T sr s r T NM rs P F F sp A FB F BF A F R (50) Легко увидеть, что второй сомножитель здесь равен второму слагаемому в (43), который получается в результате минимизации функционала (46). Заключение Субполосный подход к анализу изображений позволяет получить характеристики, которые можно использовать в качестве признаков для их сравнения. Получены соотношения, определяющие важнейшие понятия субполосного анализа, и, в частности, разработана процедура оптимальной фильтрации. Работа выполнена при финансовой поддержке гранта РФФИ № 20-07-00241.
×

Об авторах

А. Н Заливин

Белгородский университет кооперации экономики и права

Email: belov@bsu.edu.ru
Белгород, РФ

А. А Черноморец

Белгородский государственный национальный исследовательский университет

Email: belov@bsu.edu.ru
Белгород, РФ

Е. Г Жиляков

Белгородский государственный национальный исследовательский университет

Email: belov@bsu.edu.ru
Белгород, РФ

С. П Белов

Белгородский университет кооперации экономики и права

Email: belov@bsu.edu.ru
Белгород, РФ

Список литературы

  1. Хургин Я.И., Яковлев В.П. Финитные функции в физике и технике. М.: Наука, 1971. 408 с.
  2. Дворкович В.П., Дворкович А.В. Цифровые видеоинформационные системы. М.: Техносфера, 2012. 1009 с.
  3. Обработка и анализ цифровых изображений с примерами на LabVIEW и IMAQ Vision / Ю.В. Визильтер [и др.]. М.: ДМК пресс, 2007. 464 с.
  4. Горелик А.Л., Скрипкин В.А. Методы распознавания. М.: Высшая школа, 2004. 264 с.
  5. Ветров Д.П., Рязанов В.В. О минимизации признакового пространства в задачах распознавания // Математические методы распознавания образов (ММРО-10): доклады Всероссийской конференции. М.: Изд-во ВЦ РАН, 2001. С. 22-25.
  6. Жиляков Е.Г. Оптимальные субполосные методы анализа и синтеза сигналов конечной длительности // Автоматика и телемеханика. 2015. № 4. С. 51-66.
  7. Гантмахер Ф.Р. Теория матриц. М.: Физматлит, 2004. 560 с.
  8. Лайонс Р. Цифровая обработка сигналов / пер. с англ. М.: ООО «Бином-Пресс», 2007. 656 с.
  9. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2012. 1105 с.
  10. Арлазаров В.Л., Емельянов Н.Е. Обработка изображений и анализ данных. М.: ИСА РАН,2008. Т. 38. 368 с.
  11. Оберхеттингер Ф. Преобразование Фурье распределений и их обращения / пер. с англ. М.С. Никулина. М.: Наука, 1979. 248 с.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Заливин А.Н., Черноморец А.А., Жиляков Е.Г., Белов С.П., 2020

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах