Determination of invariant characteristics for digital image and their calculation in the MatLab system

Cover Page

Cite item

Full Text

Abstract

Subject of research: single-channel digital image, second-order invariants to movements and stretching.

Purpose of research: to determine a new group of invariants of a single-channel digital image with respect to shifts, rotations and stretching.

Methods and objects of research: the object of research is single-channel images. The developed computational algorithms are based on the complex use of analytical and geometric research methods, the theory of invariants and wavelets.

Main results of research: a computational scheme for determining the group of invariant characteristics with respect to such digital image transformations as shifts, rotations and stretching has been developed.

Full Text

Введение

Инвариантные характеристики изображения являются точным математическим инструментом, позволяющим решать широкий класс задач обработки и анализа одноканальных и многоканальных изображений, таких так распознавание образов, поиск объектов по образцу и другие. Инварианты способны передавать характерные особенности изображения и выступать в роли существенных признаков при преобразованиях первичного изображения, таких как сдвиг, поворот, масштабирование, изменения контрастности и яркости. Также инвариантные характеристики характеризуются способностью к обобщению, что в свою очередь является необходимым качеством для моделей и методов искусственного интеллекта, нейронных сетей.

В настоящее время исследования, направленные на поиск и исследование инвариантных характеристик цифрового изображения, являются достаточно актуальными. Они получают развитие в областях распознавания текста, анализа 3D-изображений [1–3]. Однако на практике реальные цифровые содержат помехи, неточности и шумы. Кроме того, цифровые изображения не являются непрерывными, они определятся значениями пикселей в дискретных координатах. Таким образом перед исследователями встает задача определения методов и моделей обработки цифрового дискретного изображения и определения для данного изображения ряда устойчивых инвариантных характеристик [4].

В данной работе представлены инварианты второго порядка (числовые функции, содержащие производные первого и второго порядков) относительно группы аффинных преобразований, а также яркости, контрастности изображения. Использование в методах обработки и анализа цифровых изображений инвариантов второго порядка позволяет найти достаточно устойчивую относительно помех и шума изображения числовую характеристику и существенно снизить сложность метода, что является ощутимым преимуществом при практической реализации алгоритма.

Результаты и обсуждение

Представим цифровое полутоновое изображение в виде непрерывной функции f(x,y). Будем считать, что данная функция цифрового изображения дважды непрерывно дифференцируема. Тогда справедливо разложение Тейлора второго порядка с произвольной точкой рассматриваемой области в виде центра. При помощи простых преобразований любую точку области можно перевести в начало координат. Тогда функция цифрового полутонового изображения будет иметь вид:

f(x,y)=a+p1x+p2y+12b(2,0)x2+2b(1,1)xy+b(0,2)y2+ox2+y2

В данной записи коэффициенты разложения представляют собой значения функции, дифференциалов первого и второго порядка в начале координат:

​​​​​​​           a=f(0,0),p1=fx(0,0),p2=fy(0,0),b(2,0)=2fx2(0,0),b(1,1)=2fxy(0,0),b(0,2)=2fy2(0,0).

Представим, что цифровое изображение претерпело некоторые преобразования (такие как сдвиг, масштабирование, поворот). Обозначим эту группу преобразований как G. В таком случае можем записать

Gλ,ρ,ϕ:f(x,y)eλfeρxcos(ϕ)ysin(ϕ),eρxsin(ϕ)+ycos(ϕ).

В этой записи коэффициент eρ соответствует преобразованию плоскости цифрового изображения, угол ϕ – повороту, а множитель eλ – можно описать как коэффициент соответствующий частотному диапазону данного изображения, а также как фактор поглощения среды, действующий в окрестности рассматриваемой точки.

Определение. Числовая функция I нетождественно равная константе является инвариантом цифрового изображения порядка k, если она сохраняет свое значение под действием преобразований группы G.

Замечание. Размерность пространства инвариантов определяется по формуле:

dimI=dimJ3kdimG.

Заметим, что группа преобразований Gλ,ρ,ϕ действует в пространстве параметров t=a,p1,p2,b11,b22,b12 и образует трехмерную коммутативную группу Ли

Gλ1,ρ1,ϕ1Gλ2,ρ2,ϕ2=Gλ1+λ2,ρ1+ρ2,ϕ1+ϕ2

Для произвольной функции Φ параметров Φa,p1,p2,b11,b22,b12 детерминированы инфинитезимальные дифференциальные операторы XλΦ, XρΦXϕΦ

Теорема 1. Дифференциальные операторы XλΦ, XρΦ, XϕΦ представимы в следующем виде

XλΦ=Φaa+Φp1p1+Φp2p2+Φb11b11+Φb22b22+Φb12b12,

XρΦ=Φp1p1+Φp2p2+Φb112b11+Φb222b22+Φb122b12,

XϕΦ=Φp1p2Φp2p1+Φb112b12Φb222b12+Fb12b11+b22.

Доказательство:

Параметр t преобразуется по формуле tΩ(t), т.е.

aaeλ, p1eλ+ρp1cos(ϕ)+eλ+ρp2sin(ϕ),

p2p1eλ+ρsin(ϕ)+p2eλ+ρcos(ϕ),

b11e2ρ+λb11cos2ϕ+e2ρ+λb12sinϕcosϕe2ρ+λb22cos2ϕ+e2ρ+λb22,

b12e2ρ+λ2b12cos2ϕ+e2ρ+λb22cosϕsinϕe2ρ+λb11sinϕcosϕe2ρ+λb12,

b22e2ρ+λb11e2ρ+λb11cos2ϕ2e2ρ+λb12sinϕcosϕ+e2ρ+λb22cos2ϕ.

Воспользовавшись данным преобразованием, найдем значения следующих дифференциальных операторов:

ddλΦΩtλ=0,ρ=0,ϕ=0=XλΦ,

ddρΦΩtλ=0,ρ=0,ϕ=0=XρΦ,

ddϕΦΩtλ=0,ρ=0,ϕ=0=XϕΦ.

Выполнив вычисления с учетом указанных выше начальных условий, получим:

XλΦ=Φaa+Φp1p1+Φp2p2+Φb11b11+Φb22b22+Φb12b12,

XρΦ=Φp1p1+Φp2p2+Φb112b11+Φb222b22+Φb122b12,

XϕΦ=Φp1p2Φp2p1+Φb112b12Φb222b12+Fb12b11+b22.

Теорема доказана.

Теорема 2. Данные функции являются инвариантами цифрового изображения второго порядка относительно группы преобразований, включающих в себя движения, растяжения и калибровку цифрового полутонового изображения:

Inv1=b11+b22b11p12+2b12p1p2+b22p22p12+p22b112+2b122+b222,Inv2=b11+b22b11p222b12p1p2+b22p12p12+p22b112+2b122+b222,

Доказательство.

Проверяется непосредственно.

Замечание. Для представленных инвариантов справедлива следующая оценка:

122Inv1,Inv21+22

Для выполнения расчетов данных инвариантов в системе Matlab необходимо дополнительно рассмотреть дискретную модель цифрового полутонового изображения.

В силу технических ограничений память компьютера способна хранить и обрабатывать только дискретные числа. Поэтому при оцифровке непрерывная функция изображения f(x,y) превращается в дискретную – возникает прямоугольная решетка точек изображения. И таким образом при любых операциях с использованием цифровых технических средств, таких как хранение, обработка и анализ, полутоновое изображение представляет собой матрицу определенного размера со значениями пикселей в узлах сетки (рис. 1).

 

Рисунок 1 – Дискретная сетка цифрового изображения

 

Система Matlab обладает широкими возможностями обработки и анализа цифровых изображений. При помощи встроенных функций системы была проведена загрузка группы тестовых изображений. Данные группы содержат изображения одной и той же области, но содержащие определенные отличия, такие как уровень яркости, сдвиг по вертикали и горизонтали, угол поворота (рис. 2).

 

Рисунок 2 – Пример группы изображений

 

Для каждого из изображений группы были проведены вычисления инвариантных характеристик Inv1,Inv2. Для оценки результативности характеристик рассматривались значения функции распределения разностей между инвариантными характеристиками вычисленных для значения дискретной функции во всех узлах сетки. Проведенные исследования позволяют сделать вывод: для предполагаемого наличия общих областей на изображениях размером n×m достаточно, чтобы у 0.12×n×m значений сумма попарных разностей по рассмотренным инвариантным характеристикам не превышала величину ε=200.

Заключение и выводы

Проведенные теоретические исследования и вычислительные эксперименты позволяют сделать вывод о том, что представленные в данной работе инвариантные характеристики цифрового одноканального изображения относительно группы аффинных преобразований, а также яркости, контрастности изображения можно эффективно использовать при решении различных задач анализа и обработки цифрового изображений, таких как сортировка изображений, поиск снимков по образцу, распознавание изображений и другие.

×

About the authors

Olga V. Samarina

Yugra State University

Author for correspondence.
Email: O_Samarina@ugrasu.ru

Candidate of Physical and Mathematical Sciences, Associate Professor, Head of Engineering school of Digital Technologies

Russian Federation, Khanty-Mansiysk

Valery A. Samarin

Yugra State University

Email: V_Samarin@ugrasu.ru

Candidate of Technical Sciences, Associate Professor, Associate Professor school of Digital Engineering

Russian Federation, Khanty-Mansiysk

References

  1. Абрамов, Н. С. Обзор методов распознавания образов на основе инвариантов к яркостным и геометрическим преобразованиям / Абрамов Н. С., Фраленко В. П., Хачумов М. В. – Текст : непосредственный // Современные наукоемкие технологии. – 2020. – № 6-1. – С. 110–117.
  2. Нгуен, З. Т. Инварианты в задачах распознавания графических образов / Нгуен З. Т. – Текст : непосредственный // Вестник РУДН. Серия Математика. Информатика. Физика. – 2016. – № 1. – С. 76–85.
  3. Самарина, О. В. Применение интегральных топографических характеристик в решении задач обработки данных дистанционного зондирования / Самарина О. В., Славский В. В., Семенов С. П. – Текст : непосредственный // Математические заметки СВФУ. – Январь-март 2020. – Т. 27, № 1. – С. 41–50.
  4. Сергиенко, А. Б. Цифровая обработка сигналов / А. Б. Сергиенко. – СПб. : Питер, 2003. – 608 с. – Текст : непосредственный.

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Figure 1 - Discrete grid of a digital image

Download (54KB)
3. Figure 2 - An example of a group of images

Download (491KB)

Copyright (c) 2023 Yugra State University

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies