Method of iterative combination of tv signals based on linearization for machine vision systems

Cover Page

Cite item

Full Text

Abstract

The article describes a method for combining television signals for machine vision systems based on linearization. The relevance of the developed method involves reducing the error when combining signals in the presence of interference arising from changes in illumination, as well as ensuring high processing speed. It is shown that the idea of combination replaces the processing signals of trigonometric functions in the model with a Taylor series, and in adding two variables to the model – additive and multiplicative components. All matching parameters are evaluated by solving a system of linear equations, which is determined by decomposing the matched signal into a Taylor series. An experiment demonstrated the correct combination of television signals using the proposed method, and a comparison was made with the exhaustive search method in terms of measurement error and processing speed. It is noted that the work will be useful for developers of machine vision measurement systems with real time processing.

Full Text

Введение

Обработка сигналов систем видеонаблюдения, и, в том числе, технического зрения, является перспективным направлением в науке и промышленной технике.

Телевизионный сигнал обладает высокой информативностью по сравнению с сигналами от датчиков (акселерометров, гироскопов, одометров и т.д.). Эта особенность позволяет использовать телевизионные сигналы для построения интеллектуальных систем технического зрения. Одной из важных задач при обработке является совмещение сигналов. Эта задача возникает при распознавании объектов, слежении за движущимися объектами, определении их положения, формировании панорамных изображений, сжатии видеосигналов и т.д.

Развитие современной вычислительной техники позволяет решать многие задачи обработки в режиме реального времени. По этой причине разработчики методов и алгоритмов совмещения телевизионных сигналов сосредотачивают свои усилия не только на уменьшении погрешности, но и на оптимизации скорости обработки, чтобы выполнить это требование.

Релевантные работы

Анализ работ по обработке сигналов позволил выделить несколько направлений исследований в области совмещения.

Первое направление связано с классической теорией оценивания параметров с помощью проверки всех гипотез (перебранные методы). Неизвестные параметры оцениваются путем сравнения телевизионных сигналов по минимуму среднеквадратичного отклонения [1–4]. Другой почти аналогичный критерий основан на определении максимального значения коэффициента корреляции [2; 3; 5]. Если среди неизвестных параметров есть угол разворота, то для использования переборных алгоритмов, необходимо генерировать множество шаблонов [2], каждый из которых будет соответствовать некоторому углу поворота [6; 7]. Переборные методы характеризуются низкой погрешностью измерений. Однако их существенным недостатком является наличие высоких требований к вычислительной мощности.

Одним из способов повышения скорости обработки является Фурье-преобразование, которое позволяет уменьшить время расчета среднеквадратичного отклонения и корреляции [8–14].

Для оценки смещений достаточно использования одномерного преобразования Фурье над проекциями изображения на координатные оси [12]. Так как при сдвиге изображения модуль преобразования Фурье меняться не будет, а будет меняться только фазовая составляющая, то этот метод получил название фазовой корреляции изображений [11]. В работе [13] предлагается модификация метода фазовой корреляции, который позволяет проводить совмещение с учетом смещения и угла поворота.

В ряде работ [10; 14; 15] для совмещения изображений по смещению и углу поворота также используется преобразование Фурье. Для упрощения процедуры оценки поворота производится переход к логарифмически-полярной системе координат. Однако эти подходы ограничиваются совмещением с точностью, сравнимой с размером пикселя.

Другое направление совмещения основано на предположении, что на изображении можно выделить особые точки, которым в соответствии ставятся особые точки на эталонном изображении [16–18]. Параметры совмещения определяются путем решения системы уравнений. Недостатком этого подхода является высокая чувствительность к шуму, что не позволяет работать с реальными изображениями, которые подвержены не только аддитивным шумам и линейным искажениям, но и различного рода нелинейным искажениями (засветкам) [16; 18].

В основе исследований, связанных с линеаризацией, лежит идея разложения обрабатываемого сигнала в ряд Тейлора по аргументам, соответствующим параметрам совмещения. Для формирования линейной зависимости производится отбрасывание всех элементов ряда выше первого порядка. В результате формируется система линейных уравнений, решение которой определяет неизвестные параметры совмещения.

Основоположниками этого метода для совмещения телевизионных сигналов являются ученые Lucas и Kanade [19; 20]. Математическая модель для описания обрабатываемых сигналов с одной стороны является простой, а с другой стороны – удовлетворительно описывающей реальные геометрические трансформации для совмещения. Это определило ее повсеместное использование в различных научных и практических исследованиях. В научной литературе метод Lucas-Kanade часто называется методом оценки оптического потока (optical flow).

Существуют различные модификации метода:

 – более точное вычисление частных производных за счет использования полиномов [22];

– удаление импульсных помех за счет анализа данных в смежных фрагментах изображения;

– оценка угла поворота [23–25] за счет использования приближенных значений тригонометрических функций.

В этой статье рассматривается задача, которая не рассматривалась в других исследованиях: одновременная оценка трех параметров (двух смещений вдоль координатных осей и угла поворота) на фоне помех, возникающих из-за изменения условий освещенности (аддитивная и мультипликативная составляющая). Для решения этой задачи был разработан метод на базе линеаризации, который является обобщением работ [19; 20; 23–25].

Метод совмещения телевизионных сигналов при влиянии аддитивной и мультипликативной помех

Допустим f(x, y) и g(x, y) – это обрабатываемые сигналы. Для цифровых телевизионных сигналов (изображений) аргументы (x, y) принимаются дискретные значения (xi, yi).

Сигналы f(x, y) и g(x, y) получены в результате регистрации некоторого исходного сигнала s(x, y) в различные моменты времени. Параметры геометрической трансформации, определяются тремя параметрами: двумя смещениями вдоль осей, углом поворота, а яркостные характеристики из-за изменения освещенности описываются: аддитивной и мультипликативной составляющей.

Таким образом, можно записать:

fxi,yi=sxi,yi+kxi,yi, (1)

gxi,yi=λsx'i,y'i+γ+mxi,yi, (2)

где x'i=xicosαyisinα+h,

y'i=xisinα+yicosα+p,

h, p – смещения, которые необходимо оценить,

α – угол поворота, который необходимо оценить,

λ – мультипликативная составляющая,

γ – аддитивная составляющая,

kxi,yi, mxi,yi – реализации шума.

В формулу (1) подставим значения x'i, y'i вместо xi, yi и выразим функцию s(x, y):

sx'i,y'i=fx'i,y'ikx'i,y'i, (3)

Подставим выражение (3) в формулу (2), получим:

gxi,yi=λfx'i,y'ikx'i,y'i+γ+mxi,yi. (4)

После подстановки выражений для x'i, y'i и введения обозначения:

nxi,yi=λkx'i,y'i+mxi,yi, можно записать:

gxi,yi=λfxicosαyisinα+h,xisinα+yicosα+p+γ+nxi,yi. (5)

Если положить, что угол α мал, то можно сделать следующую замену:

cosα1, sinαα, тогда можно записать:

λfxicosαyisinα+h,xisinα+yicosα+p+γλfxiyiα+h,xiα+yi+p+γ==λfxi+hyiα,yi+p+xiα+γ.

Раскладывая функцию f в окрестности точки (xi, yi), получим:

fxi+hyiα,yi+p+xiαfxi,yi+fxi,yixhyiα++fxi,yiyp+xiα.

Вводя обозначения:

qxi,yi=fxi,yixfxi+1,yifxi,yixi+1xi, rxi,yi=fxi,yiyfxi,yi+1fxi,yiyi+1yi,

получаем результирующее выражение:

gxi,yi=λfxicosαyisinα+h,xisinα+yicosα+p+γλfxi,yi+λqxi,yihyiα++λrxi,yip+xiα+γ. (6)

Для оценки параметров h, p, α, λ и γ воспользуемся методом наименьших квадратов (МНК):

F=i=1Ngxi,yiλfxi,yiλqxi,yi××hyiαλrxi,yip+xiαγ2min.

Решение определяется путем приравнивания частных производных к нулю. В результате определяется система линейных уравнений:

\( \left\{ \begin{array}{l}
\lambda \sum\limits_{i = 1}^N {f\left( {{x_i},{y_i}} \right) \cdot f\left( {{x_i},{y_i}} \right)} + \mu \sum\limits_{i = 1}^N {q\left( {{x_i},{y_i}} \right) \cdot f} \left( {{x_i},{y_i}} \right) + \varepsilon \sum\limits_{i = 1}^N {r\left( {{x_i},{y_i}} \right) \cdot f\left( {{x_i},{y_i}} \right)} + \phi \sum\limits_{i = 1}^N {u\left( {{x_i},{y_i}} \right) \cdot f\left( {{x_i},{y_i}} \right)} - \gamma \sum\limits_{i = 1}^N {f\left( {{x_i},{y_i}} \right)} = \sum\limits_{i = 1}^N {\left( {g\left( {{x_i},{y_i}} \right) \cdot f\left( {{x_i},{y_i}} \right)} \right)} \\
\lambda \sum\limits_{i = 1}^N {f\left( {{x_i},{y_i}} \right) \cdot q\left( {{x_i},{y_i}} \right)} + \mu \sum\limits_{i = 1}^N {q\left( {{x_i},{y_i}} \right) \cdot q} \left( {{x_i},{y_i}} \right) + \varepsilon \sum\limits_{i = 1}^N {r\left( {{x_i},{y_i}} \right) \cdot q\left( {{x_i},{y_i}} \right)} + \phi \sum\limits_{i = 1}^N {u\left( {{x_i},{y_i}} \right) \cdot q\left( {{x_i},{y_i}} \right)} - \gamma \sum\limits_{i = 1}^N {q\left( {{x_i},{y_i}} \right)} = \sum\limits_{i = 1}^N {\left( {g\left( {{x_i},{y_i}} \right) \cdot q\left( {{x_i},{y_i}} \right)} \right)} \\
\lambda \sum\limits_{i = 1}^N {f\left( {{x_i},{y_i}} \right) \cdot r\left( {{x_i},{y_i}} \right)} + \mu \sum\limits_{i = 1}^N {q\left( {{x_i},{y_i}} \right) \cdot r} \left( {{x_i},{y_i}} \right) + \varepsilon \sum\limits_{i = 1}^N {r\left( {{x_i},{y_i}} \right) \cdot r\left( {{x_i},{y_i}} \right)} + \phi \sum\limits_{i = 1}^N {u\left( {{x_i},{y_i}} \right) \cdot r\left( {{x_i},{y_i}} \right)} - \gamma \sum\limits_{i = 1}^N {r\left( {{x_i},{y_i}} \right)} = \sum\limits_{i = 1}^N {\left( {g\left( {{x_i},{y_i}} \right) \cdot r\left( {{x_i},{y_i}} \right)} \right)} \\
\lambda \sum\limits_{i = 1}^N {f\left( {{x_i},{y_i}} \right) \cdot u\left( {{x_i},{y_i}} \right)} + \mu \sum\limits_{i = 1}^N {q\left( {{x_i},{y_i}} \right) \cdot u} \left( {{x_i},{y_i}} \right) + \varepsilon \sum\limits_{i = 1}^N {r\left( {{x_i},{y_i}} \right) \cdot u\left( {{x_i},{y_i}} \right)} + \phi \sum\limits_{i = 1}^N {u\left( {{x_i},{y_i}} \right) \cdot u\left( {{x_i},{y_i}} \right)} - \gamma \sum\limits_{i = 1}^N {u\left( {{x_i},{y_i}} \right)} = \sum\limits_{i = 1}^N {\left( {g\left( {{x_i},{y_i}} \right) \cdot u\left( {{x_i},{y_i}} \right)} \right)} \\
\lambda \sum\limits_{i = 1}^N {f\left( {{x_i},{y_i}} \right)} + \mu \sum\limits_{i = 1}^N {q\left( {{x_i},{y_i}} \right)} + \varepsilon \sum\limits_{i = 1}^N {r\left( {{x_i},{y_i}} \right)} + \phi \sum\limits_{i = 1}^N {u\left( {{x_i},{y_i}} \right)} - \gamma \cdot N = \sum\limits_{i = 1}^N {g\left( {{x_i},{y_i}} \right)}
\end{array} \right. \)

где uxi,yi=qxi,yiyi+rxi,yixiμ=hλ, ε=pλ, ϕ=αλ.

Система линейных уравнений решается относительно h, p, μ, ε, φ.

Итерационная обработка

Так как для оценки параметров совмещения использовалось разложение в ряд Тейлора, то полученное решение будет содержать методическую погрешность. Она возникает из-за отбрасывания элементов ряда выше первого порядка.

Чтобы уменьшить методическую погрешность, исходный метод был модифицирован: была добавлена итерационная обработка. Суть итерационной обработки заключается в пересчете сигнала g(x,y) в соответствии с вычисленными параметрами h, p и α:

xni=xicosαyisinα+h,

yni=xisinα+yicosα+p.

Новый сигнал gn(x, y) = g(xn, yn) и исходный сигнал f(x, y) обрабатывается повторно. В результате, погрешность оценки параметров резко уменьшается. В ходе экспериментов было установлено, что пяти итераций достаточно и дальнейшее увеличение не приводит к существенному уменьшению погрешности.

 Эксперимент

Для проверки разработанного метода был проведен эксперимент с использованием телевизионных сигналов, полученных в системе технического зрения для измерения скорости движения протяженных объектов (см. рисунок 1).

 

Рисунок 1. Совмещение изображений: исходные изображения (а), результат совмещения (б)

 

На рисунке 1a показаны два изображения: на верхнем изображении квадратом выделен фрагмент изображения – это первый сигнал для обработки, а нижнее изображение – это второй сигнал.

Также на рисунке 1а отмечены реперные точки (точки, соответствующие друг другу) и центры фрагментов. У первого сигнала центр и реперная точка не совпадают в отличие от второго сигнала.

Разница между координатами центра и реперной точкой, фактически, определяет смещение, которое необходимо оценить.

Также из рисунка 1а видно, что телевизионные сигналы отличатся поворотом и яркостными характеристиками.

На рисунке 1б показан результат совмещения.

Как можно видеть, разработанный метод позволяет совместить изображения с высокой точностью.

Погрешность совмещения телевизионных сигналов

Для оценки погрешности совмещения при аддитивном шуме было проведено численное моделирование. Оно заключалось в добавлении помехи к каждому элементу телевизионного сигнала. Помеха имела нормальное распределение с задаваемым среднеквадратичным отклонением (СКО) σn. Полученные зашумленные телевизионные сигналы совмещались, а оцениваемые параметры совмещения сравнивались с действительными значениями (получены при нулевом СКО).

Погрешностью параметров будет являться значение среднеквадратичной величины (СКВ):

СКВ=i=1Lh^h2/L,

где h^ – оценка параметра, h – действительное значение, L – количество моделирований.

Графики измерений для нескольких сочетаний аддитивной и мультипликативной составляющей представлены на рисунках 2,3.

 

Рисунок 2. Погрешность оценки угла

 

Рисунок 3. Погрешность оценки смещения

 

Точность оценки совпала с точностью оценки по методу полного перебора. Для получения прецизионной точности с помощью переборного метода, шаг дискретизации выбирался в пять раз меньше, чем размер пикселя, а для восстановления субпиксельных значений была использована линейная интерполяция. Для повышения скорости обработки переборного метода использовалось преобразования Фурье.

Преимущество разработанного метода по сравнению с переборным заключается в уменьшении времени обработки. Для примера, приведенного в статье, время обработки с помощью разработанного метода было приблизительно в 15 раз меньше, чем с помощью переборного.

Исходя из проведенных исследований зависимости погрешности параметров от мощности шума, можно сделать вывод, что погрешность оценки параметров уменьшается с ростом мультипликативной помехи. Это объясняется тем, что эквивалентное отношение сигнал/шум возрастает с ростом мультипликативной помехи, а аддитивная помеха не оказывает существенного влияния на оценку параметров.

При мощности шума σn = 1 у.е. яркости (при градациях от 0 до 255 у.е.) по параметрам h (p) СКВ составляет 0,2 пикселя, по углу поворота α составляет 0,3°.

Заключение

Разработанный метод оценки параметров для совмещения телевизионных сигналов является обобщением метода Lucas-Kanade.

С точки зрения погрешности оценки параметров разработанный метод совпадает с методом перебора, однако скорость обработки приблизительно в 15 раз выше.

Разработанный метод направлен на решение задачи прецизионного совмещения по осям координат и углу разворота при влиянии аддитивных и мультипликативных помех.

Разработанный метод может быть использован для задач прецизионной оценки параметров в системах технического зрения, для которых предъявляются требования обработки данных в режиме реального времени.

×

About the authors

Rinat R. Diyazitdinov

Povolzhskiy State University of Telecommunications and Informatics

Author for correspondence.
Email: r.diyazitdinov@psuti.ru

Associate Professor of Network and Telecommunication System Department, PhD in Technical Sciences, Associate Professor

Russian Federation, Samara

References

  1. Androsov V.A. et al. Image superposition in uncertainty conditions. Zarubegnaya radioelektronika, 1985, no. 4, pp. 32−41. (in Russ.)
  2. Gubanov A.V. et al. Methods of offset estimation by images fragments. Avtometriya, 1988, no. 3, pp. 70−73. (in Russ.)
  3. Pankova T.L., Reznik, A.L. Error of accurate superposition of digital images. Avtometriya, 1991, no. 5, pp. 39−43. (in Russ.)
  4. Liu M., Delbruck T. Block-matching optical flow for dynamic vision sensors: Algorithm and FPGA implementation. IEEE International Symposium on Circuits and Systems (ISCAS), 2017, pp. 1−4.
  5. Vasin N.N., Kurinskiy V.Yu. Video signal processing for measuring the speed of railway cars on the marshalling hill. Komp'yuternaya optika, 2005, no. 27, pp. 185−188. (in Russ.)
  6. Artyushenko V.M., Volovach V.I. Estimation of information parameters of the signal on back-ground of additive and multiplicative noise with arbitrary distribution. Physics of Wave Processes and Radio Systems, 2018, vol. 21, no.4, pp. 58–62. (in Russ.)
  7. Diyazitdinov R.R. Methods for distinguishing and estimating parameters of optical signals: Mono-graph. Samara: PGUTI, 2019, 139 p. (in Russ.)
  8. Brown L.G. A survey of image registration techniques. ACM Computing Surveys, 1992, no. 24(4), pp. 325–376.
  9. Barnea D.I., Silverman H.F. A class of algorithms for fast digital registration. IEEE Transactions on Computers, 1972, vol. C-21, pp.179–186.
  10. Wolberg G., Zokai S. Robust image registration using logpolar transform. Proceedings of IEEE In-ternational Conference on Image Processing, 2000, vol. 1, pp. 493–196.
  11. Kuglin C.D., Hines D.C. The phase correlation image aligment method. Proceedings International Conference on Cybernetics and Society, 1975, pp. 163–165.
  12. Alliney S., Morandi C. Digital image registration using Projections. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1986, vol. PAMI-8, no.2, pp.222–233.
  13. De Castro E., Morandi C. Registration of translated and rotated images using finite fourier transforms. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1987, vol. PAMI-9, no. 3. pp. 700–703.
  14. Reddy B.S., Chatterji B.N. An FFT-based technique for translation, rotation, and scale-invariant image registration. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1996, vol 5, no. 8, pp.1266–1270.
  15. Xie H. et al. An IDL/ENVI implementation of the FFT-based algorithm for automatic image registration. Computer & Geosciences, 2003, no.29, pp. 1045–1055.
  16. Forsyth D. Ponce, J. Computer Vision: A Modern Approach. Moscow: Vil'yams, 2004, 928 p.
  17. (In Russ.)
  18. Pratt W. Digital image processing. Transl. From English. Moscow: Mir, 1982, 312 p.
  19. (In Russ.)
  20. Gonzalez R., Woods R. Digital image processing. Transl. From English. Moscow: Tehnosfera, 2005, 1070 p. (In Russ.)
  21. Lucas B.D., Kanade T. An iterative image registration technique with an application to stereo vision. Proceedings Seventh Internatiпnal Joint Conference on Artificial Intelligence, 1981, pp. 674−679.
  22. Lucas B.D. Generalized Image Matching by the Method of Differences. Pittsburgh: Carnegie-Melion University publisher, 1984, 144 p.
  23. Horn B. K., Schunck B. G. Determining optical flow. Artificial Intelligence, 1981, vol. 17, pp. 185−204.
  24. Brox T. et al. High Accuracy Optical Flow Estimation Based on a Theory for Wrapping. Lecture Notes in Computer Science, 2004, vol. 3024, pp. 25−36.
  25. Machnev A.M., Guk S.Ya. Non-search algorithm of image angle estimation. Vestnik Natcional'nogo tehgnicheskogo universiteta Ukraini. Seriya: Radiotehnika. Radioapparatostroenie, 2008, no. 37, pp. 33–37. (In Russ.)
  26. Machnev A.M. Estimation of rotation angle on image superposition by using mixed coordinate system. Vestnik Natcional'nogo tehgnicheskogo universiteta Ukraini. Seriya: Radiotehnika. Radioappa-ratostroenie, 2010, no. 42, pp. 42–45. (In Russ.)
  27. Tashlinskiy A.G. The image sequence space deformation parameters estimation. Ul'yanovsk: Ul'yanovskij gosudarstvennyj tekhnicheskij universitet, 2000, 132 p. (In Russ.)

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Рисунок 1. Совмещение изображений: исходные изображения (а), результат совмещения (б)

Download (200KB)
3. Рисунок 2. Погрешность оценки угла

Download (174KB)
4. Рисунок 3. Погрешность оценки смещения

Download (179KB)

Copyright (c) 2023 Diyazitdinov R.R.

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies