Выделение объектов интереса на сложном фоне

Cover Page
  • Authors: 1, 1
  • Affiliations:
    1. Поволжский государственный университет телекоммуникаций и информатики
  • Issue: Vol 1 (2022)
  • Pages: 430-432
  • Section: Электроника и радиоэлектроника
  • URL: https://journals.eco-vector.com/osnk-sr/article/view/107543
  • ID: 107543

Cite item

Full Text

Abstract

Обоснование. Задача обнаружения объектов изображения на сложном фоне очень часто встречается при телевизионном наблюдении за быстро перемещающимися объектами на статичном фоне или за неподвижными объектами на изменяющемся фоне или за объектами, которые находятся на разных дистанциях от телевизионной камеры. При этом изображения объектов интереса резко сфокусированы, в отличие от размытого изображения фона. Эта задача относится к задачам сегментации изображений, т. е. разделения изображения на отдельные области по некоторым признакам [1].

Цель — исследование и разработка методов обнаружения и выделения резко сфокусированных объектов на изображениях с размытым фоном.

Методы. В качестве принципа обнаружения указанных выше объектов интереса можно использовать то обстоятельство, что детали резко сфокусированных объектов и в особенности их границы характеризуются быстрыми изменениями яркости. В то же время размытое изображение фона имеет значительно меньшую скорость изменения яркости. Для анализа скорости изменения яркости можно использовать первую и вторую производную по яркости для изображения.

Результаты. Экспериментальные исследования с реальными изображениями, выполненные средствами MATLAB, показали, что использование производных по яркости позволяет решить поставленную задачу. Это иллюстрируется рис. 1, на котором показаны зависимость модуля 1-й и 2-й производной для одной строки f(x) сложного изображения.

1-я производная дискретной одномерной функции профиля строки f(x) вычислялась как разность значений соседних элементов:

dfdx=f(x+1)-f(x),

 

Рис. 1. а — исходное изображение; б — профиль выделенной строки; в — модуль 1-й производной по яркости; г — модуль 2-й производной по яркости

 

а 2-я производная как разность соседних значений первой производной:

d2fdx2=f(x+1)+f(x-1)-2f(x).

Анализ полученных результатов показывает, что модули производных как первого, так и второго порядка (рис. 1, в и г) имеют существенно большую величину на участках строки, принадлежащих резко сфокусированным объектам. Если теперь отбросить все значения модулей, которые не превышают некоторый порог по интенсивности, и сохранить полученный результат, то получим пикселы строки, принадлежащие сфокусированным объектам интереса. Очевидно, что данный вывод можно распространить и на двумерное изображение.

Известно, что производные первого порядка формируются с помощью градиентов

f=GxGy=dfdxdfdy,

а второго порядка — с помощью Лапласианов

2f=d2f(x,y)dx2+d2f(x,y)dy2.

На рис. 2 показан результат обработки тестового изображения Лапласианом и бинаризация модуля полученного отклика по экспериментально подобранному порогу. Видно, что полученное бинарное изображение вполне адекватно соответствует резко сфокусированному объекту.

 

Рис. 2. Исходное и бинарное изображения объекта, полученное с помощью Лапласиана

 

Еще несколько экспериментов было выполнено с помощью стандартных пространственных фильтров для выделения контуров на изображениях: Собела, Робертса, Превитт, Лапласиан-Гауссиана и Кэнни. Их алгоритмы также используют вычисления первой или второй производных по яркости. При этом наилучшие результаты были получены при использовании фильтра Кэнни, что иллюстрирует рис. 3.

 

Рис. 3. Исходное и бинарное изображения объекта, полученное фильтром Кэнни

 

Имеющиеся незначительные разрывы во внешнем контуре объекта интереса легко устраняются дальнейшей морфологической обработкой бинарного изображения.

Выводы. 1. Для обнаружения резко сфокусированных объектов на изображениях можно использовать модули производных по яркости 1-го и 2-го порядка в сочетании с пороговым разделением.

  1. Использование второй производной предполагает выявление точек пересечения нулевых уровней (середина границы), что соответствует более точной локализации объекта. Для этого можно использовать фильтры Лаплассин-Гауссина или Кэнни.
  2. Вычислить первую производную цифрового полутонового изображения можно используя фильтры Собела, Робертса.
  3. Важным моментом, влияющим на точность выделения считается выбор порога бинаризации абсолютного значения отклика фильтров. Его следует подбирать в интерактивном режиме.
  4. Фильтр Кэнни с подобранным значением порога имеет самую высокую эффективность.

Full Text

Обоснование. Задача обнаружения объектов изображения на сложном фоне очень часто встречается при телевизионном наблюдении за быстро перемещающимися объектами на статичном фоне или за неподвижными объектами на изменяющемся фоне или за объектами, которые находятся на разных дистанциях от телевизионной камеры. При этом изображения объектов интереса резко сфокусированы, в отличие от размытого изображения фона. Эта задача относится к задачам сегментации изображений, т. е. разделения изображения на отдельные области по некоторым признакам [1].

Цель — исследование и разработка методов обнаружения и выделения резко сфокусированных объектов на изображениях с размытым фоном.

Методы. В качестве принципа обнаружения указанных выше объектов интереса можно использовать то обстоятельство, что детали резко сфокусированных объектов и в особенности их границы характеризуются быстрыми изменениями яркости. В то же время размытое изображение фона имеет значительно меньшую скорость изменения яркости. Для анализа скорости изменения яркости можно использовать первую и вторую производную по яркости для изображения.

Результаты. Экспериментальные исследования с реальными изображениями, выполненные средствами MATLAB, показали, что использование производных по яркости позволяет решить поставленную задачу. Это иллюстрируется рис. 1, на котором показаны зависимость модуля 1-й и 2-й производной для одной строки f(x) сложного изображения.

1-я производная дискретной одномерной функции профиля строки f(x) вычислялась как разность значений соседних элементов:

dfdx=f(x+1)-f(x),

 

Рис. 1. а — исходное изображение; б — профиль выделенной строки; в — модуль 1-й производной по яркости; г — модуль 2-й производной по яркости

 

а 2-я производная как разность соседних значений первой производной:

d2fdx2=f(x+1)+f(x-1)-2f(x).

Анализ полученных результатов показывает, что модули производных как первого, так и второго порядка (рис. 1, в и г) имеют существенно большую величину на участках строки, принадлежащих резко сфокусированным объектам. Если теперь отбросить все значения модулей, которые не превышают некоторый порог по интенсивности, и сохранить полученный результат, то получим пикселы строки, принадлежащие сфокусированным объектам интереса. Очевидно, что данный вывод можно распространить и на двумерное изображение.

Известно, что производные первого порядка формируются с помощью градиентов

f=GxGy=dfdxdfdy,

а второго порядка — с помощью Лапласианов

2f=d2f(x,y)dx2+d2f(x,y)dy2.

На рис. 2 показан результат обработки тестового изображения Лапласианом и бинаризация модуля полученного отклика по экспериментально подобранному порогу. Видно, что полученное бинарное изображение вполне адекватно соответствует резко сфокусированному объекту.

 

Рис. 2. Исходное и бинарное изображения объекта, полученное с помощью Лапласиана

 

Еще несколько экспериментов было выполнено с помощью стандартных пространственных фильтров для выделения контуров на изображениях: Собела, Робертса, Превитт, Лапласиан-Гауссиана и Кэнни. Их алгоритмы также используют вычисления первой или второй производных по яркости. При этом наилучшие результаты были получены при использовании фильтра Кэнни, что иллюстрирует рис. 3.

 

Рис. 3. Исходное и бинарное изображения объекта, полученное фильтром Кэнни

 

Имеющиеся незначительные разрывы во внешнем контуре объекта интереса легко устраняются дальнейшей морфологической обработкой бинарного изображения.

Выводы. 1. Для обнаружения резко сфокусированных объектов на изображениях можно использовать модули производных по яркости 1-го и 2-го порядка в сочетании с пороговым разделением.

  1. Использование второй производной предполагает выявление точек пересечения нулевых уровней (середина границы), что соответствует более точной локализации объекта. Для этого можно использовать фильтры Лаплассин-Гауссина или Кэнни.
  2. Вычислить первую производную цифрового полутонового изображения можно используя фильтры Собела, Робертса.
  3. Важным моментом, влияющим на точность выделения считается выбор порога бинаризации абсолютного значения отклика фильтров. Его следует подбирать в интерактивном режиме.
  4. Фильтр Кэнни с подобранным значением порога имеет самую высокую эффективность.
×

About the authors

Поволжский государственный университет телекоммуникаций и информатики

Email: nnizom07@gmail.com

магистрант, группа ИСТм-01, факультет информационных систем и технологий

Russian Federation, Самара

Поволжский государственный университет телекоммуникаций и информатики

Author for correspondence.
Email: oleg.l.kulyas@gmail.com

кандидат технических наук, старший научный сотрудник, доцент кафедры информационных систем и технологий

Russian Federation, Самара

References

  1. Гонсалес Р., Вудс Р. Цифровая обработка изображений. Москва: Техносфера, 2012. 1072 с.

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Рис. 1. а — исходное изображение; б — профиль выделенной строки; в — модуль 1-й производной по яркости; г — модуль 2-й производной по яркости

Download (150KB)
3. Рис. 2. Исходное и бинарное изображения объекта, полученное с помощью Лапласиана

Download (58KB)
4. Рис. 3. Исходное и бинарное изображения объекта, полученное фильтром Кэнни

Download (56KB)

Copyright (c) 2022 Нурматов Н.Р., Куляс О.Л.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies