Метод итерационного совмещения телевизионных сигналов на базе линеаризации для систем технического зрения

Обложка

Цитировать

Полный текст

Аннотация

Представлен метод совмещения телевизионных сигналов для систем технического зрения на безе линеаризации. Актуальность разработанного метода заключается в уменьшении погрешности при совмещении сигналов на фоне помех, возникающих из-за изменения условий освещенности, а также в обеспечении высокой скорости обработки. Показано, что идея совмещения заключается в замене в математической модели совмещаемых сигналов тригонометрических функций на приближенные значения, и в добавлении в модель двух переменных – аддитивной и мультипликативной составляющей. Оценка всех параметров совмещения проводится в результате решения системы линейных уравнений, которая определяется в результате разложения совмещаемого сигнала в ряд Тейлора. Проведен эксперимент, показывающий корректное совмещение телевизионных сигналов с помощью предложенного метода, а также сделано сравнение с методом полного перебора по показателям погрешности измерения и скорости обработки. Отмечено, что работа будет полезна для разработчиков измерительных систем технического зрения, в которых обработка ведется в режиме реального времени.

Полный текст

Введение

Обработка сигналов систем видеонаблюдения, и, в том числе, технического зрения, является перспективным направлением в науке и промышленной технике.

Телевизионный сигнал обладает высокой информативностью по сравнению с сигналами от датчиков (акселерометров, гироскопов, одометров и т.д.). Эта особенность позволяет использовать телевизионные сигналы для построения интеллектуальных систем технического зрения. Одной из важных задач при обработке является совмещение сигналов. Эта задача возникает при распознавании объектов, слежении за движущимися объектами, определении их положения, формировании панорамных изображений, сжатии видеосигналов и т.д.

Развитие современной вычислительной техники позволяет решать многие задачи обработки в режиме реального времени. По этой причине разработчики методов и алгоритмов совмещения телевизионных сигналов сосредотачивают свои усилия не только на уменьшении погрешности, но и на оптимизации скорости обработки, чтобы выполнить это требование.

Релевантные работы

Анализ работ по обработке сигналов позволил выделить несколько направлений исследований в области совмещения.

Первое направление связано с классической теорией оценивания параметров с помощью проверки всех гипотез (перебранные методы). Неизвестные параметры оцениваются путем сравнения телевизионных сигналов по минимуму среднеквадратичного отклонения [1–4]. Другой почти аналогичный критерий основан на определении максимального значения коэффициента корреляции [2; 3; 5]. Если среди неизвестных параметров есть угол разворота, то для использования переборных алгоритмов, необходимо генерировать множество шаблонов [2], каждый из которых будет соответствовать некоторому углу поворота [6; 7]. Переборные методы характеризуются низкой погрешностью измерений. Однако их существенным недостатком является наличие высоких требований к вычислительной мощности.

Одним из способов повышения скорости обработки является Фурье-преобразование, которое позволяет уменьшить время расчета среднеквадратичного отклонения и корреляции [8–14].

Для оценки смещений достаточно использования одномерного преобразования Фурье над проекциями изображения на координатные оси [12]. Так как при сдвиге изображения модуль преобразования Фурье меняться не будет, а будет меняться только фазовая составляющая, то этот метод получил название фазовой корреляции изображений [11]. В работе [13] предлагается модификация метода фазовой корреляции, который позволяет проводить совмещение с учетом смещения и угла поворота.

В ряде работ [10; 14; 15] для совмещения изображений по смещению и углу поворота также используется преобразование Фурье. Для упрощения процедуры оценки поворота производится переход к логарифмически-полярной системе координат. Однако эти подходы ограничиваются совмещением с точностью, сравнимой с размером пикселя.

Другое направление совмещения основано на предположении, что на изображении можно выделить особые точки, которым в соответствии ставятся особые точки на эталонном изображении [16–18]. Параметры совмещения определяются путем решения системы уравнений. Недостатком этого подхода является высокая чувствительность к шуму, что не позволяет работать с реальными изображениями, которые подвержены не только аддитивным шумам и линейным искажениям, но и различного рода нелинейным искажениями (засветкам) [16; 18].

В основе исследований, связанных с линеаризацией, лежит идея разложения обрабатываемого сигнала в ряд Тейлора по аргументам, соответствующим параметрам совмещения. Для формирования линейной зависимости производится отбрасывание всех элементов ряда выше первого порядка. В результате формируется система линейных уравнений, решение которой определяет неизвестные параметры совмещения.

Основоположниками этого метода для совмещения телевизионных сигналов являются ученые Lucas и Kanade [19; 20]. Математическая модель для описания обрабатываемых сигналов с одной стороны является простой, а с другой стороны – удовлетворительно описывающей реальные геометрические трансформации для совмещения. Это определило ее повсеместное использование в различных научных и практических исследованиях. В научной литературе метод Lucas-Kanade часто называется методом оценки оптического потока (optical flow).

Существуют различные модификации метода:

 – более точное вычисление частных производных за счет использования полиномов [22];

– удаление импульсных помех за счет анализа данных в смежных фрагментах изображения;

– оценка угла поворота [23–25] за счет использования приближенных значений тригонометрических функций.

В этой статье рассматривается задача, которая не рассматривалась в других исследованиях: одновременная оценка трех параметров (двух смещений вдоль координатных осей и угла поворота) на фоне помех, возникающих из-за изменения условий освещенности (аддитивная и мультипликативная составляющая). Для решения этой задачи был разработан метод на базе линеаризации, который является обобщением работ [19; 20; 23–25].

Метод совмещения телевизионных сигналов при влиянии аддитивной и мультипликативной помех

Допустим f(x, y) и g(x, y) – это обрабатываемые сигналы. Для цифровых телевизионных сигналов (изображений) аргументы (x, y) принимаются дискретные значения (xi, yi).

Сигналы f(x, y) и g(x, y) получены в результате регистрации некоторого исходного сигнала s(x, y) в различные моменты времени. Параметры геометрической трансформации, определяются тремя параметрами: двумя смещениями вдоль осей, углом поворота, а яркостные характеристики из-за изменения освещенности описываются: аддитивной и мультипликативной составляющей.

Таким образом, можно записать:

fxi,yi=sxi,yi+kxi,yi, (1)

gxi,yi=λsx'i,y'i+γ+mxi,yi, (2)

где x'i=xicosαyisinα+h,

y'i=xisinα+yicosα+p,

h, p – смещения, которые необходимо оценить,

α – угол поворота, который необходимо оценить,

λ – мультипликативная составляющая,

γ – аддитивная составляющая,

kxi,yi, mxi,yi – реализации шума.

В формулу (1) подставим значения x'i, y'i вместо xi, yi и выразим функцию s(x, y):

sx'i,y'i=fx'i,y'ikx'i,y'i, (3)

Подставим выражение (3) в формулу (2), получим:

gxi,yi=λfx'i,y'ikx'i,y'i+γ+mxi,yi. (4)

После подстановки выражений для x'i, y'i и введения обозначения:

nxi,yi=λkx'i,y'i+mxi,yi, можно записать:

gxi,yi=λfxicosαyisinα+h,xisinα+yicosα+p+γ+nxi,yi. (5)

Если положить, что угол α мал, то можно сделать следующую замену:

cosα1, sinαα, тогда можно записать:

λfxicosαyisinα+h,xisinα+yicosα+p+γλfxiyiα+h,xiα+yi+p+γ==λfxi+hyiα,yi+p+xiα+γ.

Раскладывая функцию f в окрестности точки (xi, yi), получим:

fxi+hyiα,yi+p+xiαfxi,yi+fxi,yixhyiα++fxi,yiyp+xiα.

Вводя обозначения:

qxi,yi=fxi,yixfxi+1,yifxi,yixi+1xi, rxi,yi=fxi,yiyfxi,yi+1fxi,yiyi+1yi,

получаем результирующее выражение:

gxi,yi=λfxicosαyisinα+h,xisinα+yicosα+p+γλfxi,yi+λqxi,yihyiα++λrxi,yip+xiα+γ. (6)

Для оценки параметров h, p, α, λ и γ воспользуемся методом наименьших квадратов (МНК):

F=i=1Ngxi,yiλfxi,yiλqxi,yi××hyiαλrxi,yip+xiαγ2min.

Решение определяется путем приравнивания частных производных к нулю. В результате определяется система линейных уравнений:

\( \left\{ \begin{array}{l}
\lambda \sum\limits_{i = 1}^N {f\left( {{x_i},{y_i}} \right) \cdot f\left( {{x_i},{y_i}} \right)} + \mu \sum\limits_{i = 1}^N {q\left( {{x_i},{y_i}} \right) \cdot f} \left( {{x_i},{y_i}} \right) + \varepsilon \sum\limits_{i = 1}^N {r\left( {{x_i},{y_i}} \right) \cdot f\left( {{x_i},{y_i}} \right)} + \phi \sum\limits_{i = 1}^N {u\left( {{x_i},{y_i}} \right) \cdot f\left( {{x_i},{y_i}} \right)} - \gamma \sum\limits_{i = 1}^N {f\left( {{x_i},{y_i}} \right)} = \sum\limits_{i = 1}^N {\left( {g\left( {{x_i},{y_i}} \right) \cdot f\left( {{x_i},{y_i}} \right)} \right)} \\
\lambda \sum\limits_{i = 1}^N {f\left( {{x_i},{y_i}} \right) \cdot q\left( {{x_i},{y_i}} \right)} + \mu \sum\limits_{i = 1}^N {q\left( {{x_i},{y_i}} \right) \cdot q} \left( {{x_i},{y_i}} \right) + \varepsilon \sum\limits_{i = 1}^N {r\left( {{x_i},{y_i}} \right) \cdot q\left( {{x_i},{y_i}} \right)} + \phi \sum\limits_{i = 1}^N {u\left( {{x_i},{y_i}} \right) \cdot q\left( {{x_i},{y_i}} \right)} - \gamma \sum\limits_{i = 1}^N {q\left( {{x_i},{y_i}} \right)} = \sum\limits_{i = 1}^N {\left( {g\left( {{x_i},{y_i}} \right) \cdot q\left( {{x_i},{y_i}} \right)} \right)} \\
\lambda \sum\limits_{i = 1}^N {f\left( {{x_i},{y_i}} \right) \cdot r\left( {{x_i},{y_i}} \right)} + \mu \sum\limits_{i = 1}^N {q\left( {{x_i},{y_i}} \right) \cdot r} \left( {{x_i},{y_i}} \right) + \varepsilon \sum\limits_{i = 1}^N {r\left( {{x_i},{y_i}} \right) \cdot r\left( {{x_i},{y_i}} \right)} + \phi \sum\limits_{i = 1}^N {u\left( {{x_i},{y_i}} \right) \cdot r\left( {{x_i},{y_i}} \right)} - \gamma \sum\limits_{i = 1}^N {r\left( {{x_i},{y_i}} \right)} = \sum\limits_{i = 1}^N {\left( {g\left( {{x_i},{y_i}} \right) \cdot r\left( {{x_i},{y_i}} \right)} \right)} \\
\lambda \sum\limits_{i = 1}^N {f\left( {{x_i},{y_i}} \right) \cdot u\left( {{x_i},{y_i}} \right)} + \mu \sum\limits_{i = 1}^N {q\left( {{x_i},{y_i}} \right) \cdot u} \left( {{x_i},{y_i}} \right) + \varepsilon \sum\limits_{i = 1}^N {r\left( {{x_i},{y_i}} \right) \cdot u\left( {{x_i},{y_i}} \right)} + \phi \sum\limits_{i = 1}^N {u\left( {{x_i},{y_i}} \right) \cdot u\left( {{x_i},{y_i}} \right)} - \gamma \sum\limits_{i = 1}^N {u\left( {{x_i},{y_i}} \right)} = \sum\limits_{i = 1}^N {\left( {g\left( {{x_i},{y_i}} \right) \cdot u\left( {{x_i},{y_i}} \right)} \right)} \\
\lambda \sum\limits_{i = 1}^N {f\left( {{x_i},{y_i}} \right)} + \mu \sum\limits_{i = 1}^N {q\left( {{x_i},{y_i}} \right)} + \varepsilon \sum\limits_{i = 1}^N {r\left( {{x_i},{y_i}} \right)} + \phi \sum\limits_{i = 1}^N {u\left( {{x_i},{y_i}} \right)} - \gamma \cdot N = \sum\limits_{i = 1}^N {g\left( {{x_i},{y_i}} \right)}
\end{array} \right. \)

где uxi,yi=qxi,yiyi+rxi,yixiμ=hλ, ε=pλ, ϕ=αλ.

Система линейных уравнений решается относительно h, p, μ, ε, φ.

Итерационная обработка

Так как для оценки параметров совмещения использовалось разложение в ряд Тейлора, то полученное решение будет содержать методическую погрешность. Она возникает из-за отбрасывания элементов ряда выше первого порядка.

Чтобы уменьшить методическую погрешность, исходный метод был модифицирован: была добавлена итерационная обработка. Суть итерационной обработки заключается в пересчете сигнала g(x,y) в соответствии с вычисленными параметрами h, p и α:

xni=xicosαyisinα+h,

yni=xisinα+yicosα+p.

Новый сигнал gn(x, y) = g(xn, yn) и исходный сигнал f(x, y) обрабатывается повторно. В результате, погрешность оценки параметров резко уменьшается. В ходе экспериментов было установлено, что пяти итераций достаточно и дальнейшее увеличение не приводит к существенному уменьшению погрешности.

 Эксперимент

Для проверки разработанного метода был проведен эксперимент с использованием телевизионных сигналов, полученных в системе технического зрения для измерения скорости движения протяженных объектов (см. рисунок 1).

 

Рисунок 1. Совмещение изображений: исходные изображения (а), результат совмещения (б)

 

На рисунке 1a показаны два изображения: на верхнем изображении квадратом выделен фрагмент изображения – это первый сигнал для обработки, а нижнее изображение – это второй сигнал.

Также на рисунке 1а отмечены реперные точки (точки, соответствующие друг другу) и центры фрагментов. У первого сигнала центр и реперная точка не совпадают в отличие от второго сигнала.

Разница между координатами центра и реперной точкой, фактически, определяет смещение, которое необходимо оценить.

Также из рисунка 1а видно, что телевизионные сигналы отличатся поворотом и яркостными характеристиками.

На рисунке 1б показан результат совмещения.

Как можно видеть, разработанный метод позволяет совместить изображения с высокой точностью.

Погрешность совмещения телевизионных сигналов

Для оценки погрешности совмещения при аддитивном шуме было проведено численное моделирование. Оно заключалось в добавлении помехи к каждому элементу телевизионного сигнала. Помеха имела нормальное распределение с задаваемым среднеквадратичным отклонением (СКО) σn. Полученные зашумленные телевизионные сигналы совмещались, а оцениваемые параметры совмещения сравнивались с действительными значениями (получены при нулевом СКО).

Погрешностью параметров будет являться значение среднеквадратичной величины (СКВ):

СКВ=i=1Lh^h2/L,

где h^ – оценка параметра, h – действительное значение, L – количество моделирований.

Графики измерений для нескольких сочетаний аддитивной и мультипликативной составляющей представлены на рисунках 2,3.

 

Рисунок 2. Погрешность оценки угла

 

Рисунок 3. Погрешность оценки смещения

 

Точность оценки совпала с точностью оценки по методу полного перебора. Для получения прецизионной точности с помощью переборного метода, шаг дискретизации выбирался в пять раз меньше, чем размер пикселя, а для восстановления субпиксельных значений была использована линейная интерполяция. Для повышения скорости обработки переборного метода использовалось преобразования Фурье.

Преимущество разработанного метода по сравнению с переборным заключается в уменьшении времени обработки. Для примера, приведенного в статье, время обработки с помощью разработанного метода было приблизительно в 15 раз меньше, чем с помощью переборного.

Исходя из проведенных исследований зависимости погрешности параметров от мощности шума, можно сделать вывод, что погрешность оценки параметров уменьшается с ростом мультипликативной помехи. Это объясняется тем, что эквивалентное отношение сигнал/шум возрастает с ростом мультипликативной помехи, а аддитивная помеха не оказывает существенного влияния на оценку параметров.

При мощности шума σn = 1 у.е. яркости (при градациях от 0 до 255 у.е.) по параметрам h (p) СКВ составляет 0,2 пикселя, по углу поворота α составляет 0,3°.

Заключение

Разработанный метод оценки параметров для совмещения телевизионных сигналов является обобщением метода Lucas-Kanade.

С точки зрения погрешности оценки параметров разработанный метод совпадает с методом перебора, однако скорость обработки приблизительно в 15 раз выше.

Разработанный метод направлен на решение задачи прецизионного совмещения по осям координат и углу разворота при влиянии аддитивных и мультипликативных помех.

Разработанный метод может быть использован для задач прецизионной оценки параметров в системах технического зрения, для которых предъявляются требования обработки данных в режиме реального времени.

×

Об авторах

Ринат Радмирович Диязитдинов

Поволжский государственный университет телекоммуникаций и информатики

Автор, ответственный за переписку.
Email: r.diyazitdinov@psuti.ru

к.т.н., доцент, доцент кафедры сетей и систем связи 

Россия, Самара

Список литературы

  1. Совмещение изображений в условиях неопределенности / В.А. Андросов [и др.] // Зарубежная радиоэлектроника. 1985. № 4. С. 32−41.
  2. Методы оценивания взаимного смещения фрагментов изображений / А.В. Губанов [и др.] // Автометрия. 1988. № 3. С. 70−73.
  3. Панкова Т.Л., Резник А.Л. Эффективность алгоритмов прецизионного совмещения цифровых изображений // Автометрия. 1991. № 5. С. 39−43.
  4. Liu M., Delbruck T. Block-matching optical flow for dynamic vision sensors: Algorithm and FPGA implementation // IEEE International Symposium on Circuits and Systems (ISCAS). 2017. P. 1−4.
  5. Васин Н.Н., Куринский В.Ю. Обработка видеосигналов для измерения скорости движения железнодорожных вагонов на сортировочной горке // Компьютерная оптика. 2005. № 27. С. 185−188.
  6. Артюшенко В.М., Воловач В.И. Оценка ин-формационных параметров сигнала на фоне аддитивно-мультипликативных помех с произвольным распределением // Физика волновых процессов и радиотехнические системы. 2018. T. 21, № 4. С. 58–62.
  7. Диязитдинов Р.Р. Методы различения и оценки параметров оптических сигналов: монография. Самара: ПГУТИ, 2019. 139 с.
  8. Brown L.G. A survey of image registration techniques // ACM Computing Surveys. 1992. no.24(4). P. 325–376.
  9. Barnea D.I., Silverman H.F. A class of algorithms for fast digital registration // IEEE Transactions on Computers. 1972. Vol. С-21. P.179–186.
  10. Wolberg G., Zokai S. Robust image registration using logpolar transform // Proceedings of IEEE International Conference on Image Processing. 2000. Vol. 1. P. 493–196.
  11. Kuglin C.D., Hines D.C. The phase correlation image aligment method // Proceedings International Conference on Cybernetics and Society. 1975. Р. 163–165.
  12. Alliney S., Morandi C. Digital image registration using Projections // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1986. Vol. PAMI-8, no.2. P.222–233.
  13. De Castro E., Morandi C. Registration of translated and rotated images using finite fourier transforms // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1987. Vol. PAMI-9, no. 3. P. 700–703.
  14. Reddy B.S., Chatterji B.N. An FFT-based technique for translation, rotation, and scale-invariant image registration // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1996. Vol 5, no. 8. P.1266–1270.
  15. An IDL/ENVI implementation of the FFT-based algorithm for automatic image registration / H. Xie [et al.] // Computer & Geosciences. 2003. no.29. P. 1045–1055.
  16. Форсайт Д., Понс Ж. Компьютерное зрение. Современный подход. М.: Вильямс, 2004. 928 с.
  17. Прэтт У. Цифровая обработка изображений / пер. с англ. М.: Мир, 1982. С. 312.
  18. Гонсалес Р., Вудс Р. Цифровая обработка изображений / пер. с англ. М.: Техносфера, 2005. 1070 с.
  19. Lucas B.D., Kanade T. An iterative image registration technique with an application to stereo vision // Proceedings Seventh Internatiпnal Joint Conference on Artificial Intelligence. 1981. P. 674−679.
  20. Lucas B.D. Generalized Image Matching by the Method of Differences. Pittsburgh: Carnegie-Melion University publisher, 1984. P. 144.
  21. Horn B.K., Schunck B.G. Determining optical flow // Artificial Intelligence. 1981. Vol. 17. P. 185−204.
  22. High Accuracy Optical Flow Estimation Based on a Theory for Wrapping / T. Brox [et al.] // Lecture Notes in Computer Science. 2004. Vol. 3024. P. 25−36.
  23. Мачнев А.М., Жук С.Я. Беспоисковый алгоритм определения угла поворота изображений // Вісник Національного технічного університету України. Серія: Радіотехніка. Радіоапаратобудування. 2008. № 37.
  24. С. 33–37.
  25. Мачнев А.М. Определение угла поворота при наложении изображений с использованием смешанной системы координат // Вісник Національного технічного університету України. Серія: Радіотехніка. Радіоапаратобудування. 2010. № 42. С. 40–45.
  26. Ташлинский А.Г. Оценивание параметров пространственных деформаций последовательностей изображений. Ульяновск: Ульяновский государственный технический университет, 2000. 132 с.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рисунок 1. Совмещение изображений: исходные изображения (а), результат совмещения (б)

Скачать (200KB)
3. Рисунок 2. Погрешность оценки угла

Скачать (174KB)
4. Рисунок 3. Погрешность оценки смещения

Скачать (179KB)

© Диязитдинов Р.Р., 2023

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах