Выделение объектов интереса на сложном фоне

封面
  • 作者: 1, 1
  • 隶属关系:
    1. Поволжский государственный университет телекоммуникаций и информатики
  • 期: 卷 1 (2022)
  • 页面: 430-432
  • 栏目: Электроника и радиоэлектроника
  • URL: https://journals.eco-vector.com/osnk-sr/article/view/107543
  • ID: 107543

如何引用文章

全文:

详细

Обоснование. Задача обнаружения объектов изображения на сложном фоне очень часто встречается при телевизионном наблюдении за быстро перемещающимися объектами на статичном фоне или за неподвижными объектами на изменяющемся фоне или за объектами, которые находятся на разных дистанциях от телевизионной камеры. При этом изображения объектов интереса резко сфокусированы, в отличие от размытого изображения фона. Эта задача относится к задачам сегментации изображений, т. е. разделения изображения на отдельные области по некоторым признакам [1].

Цель — исследование и разработка методов обнаружения и выделения резко сфокусированных объектов на изображениях с размытым фоном.

Методы. В качестве принципа обнаружения указанных выше объектов интереса можно использовать то обстоятельство, что детали резко сфокусированных объектов и в особенности их границы характеризуются быстрыми изменениями яркости. В то же время размытое изображение фона имеет значительно меньшую скорость изменения яркости. Для анализа скорости изменения яркости можно использовать первую и вторую производную по яркости для изображения.

Результаты. Экспериментальные исследования с реальными изображениями, выполненные средствами MATLAB, показали, что использование производных по яркости позволяет решить поставленную задачу. Это иллюстрируется рис. 1, на котором показаны зависимость модуля 1-й и 2-й производной для одной строки f(x) сложного изображения.

1-я производная дискретной одномерной функции профиля строки f(x) вычислялась как разность значений соседних элементов:

dfdx=f(x+1)-f(x),

 

Рис. 1. а — исходное изображение; б — профиль выделенной строки; в — модуль 1-й производной по яркости; г — модуль 2-й производной по яркости

 

а 2-я производная как разность соседних значений первой производной:

d2fdx2=f(x+1)+f(x-1)-2f(x).

Анализ полученных результатов показывает, что модули производных как первого, так и второго порядка (рис. 1, в и г) имеют существенно большую величину на участках строки, принадлежащих резко сфокусированным объектам. Если теперь отбросить все значения модулей, которые не превышают некоторый порог по интенсивности, и сохранить полученный результат, то получим пикселы строки, принадлежащие сфокусированным объектам интереса. Очевидно, что данный вывод можно распространить и на двумерное изображение.

Известно, что производные первого порядка формируются с помощью градиентов

f=GxGy=dfdxdfdy,

а второго порядка — с помощью Лапласианов

2f=d2f(x,y)dx2+d2f(x,y)dy2.

На рис. 2 показан результат обработки тестового изображения Лапласианом и бинаризация модуля полученного отклика по экспериментально подобранному порогу. Видно, что полученное бинарное изображение вполне адекватно соответствует резко сфокусированному объекту.

 

Рис. 2. Исходное и бинарное изображения объекта, полученное с помощью Лапласиана

 

Еще несколько экспериментов было выполнено с помощью стандартных пространственных фильтров для выделения контуров на изображениях: Собела, Робертса, Превитт, Лапласиан-Гауссиана и Кэнни. Их алгоритмы также используют вычисления первой или второй производных по яркости. При этом наилучшие результаты были получены при использовании фильтра Кэнни, что иллюстрирует рис. 3.

 

Рис. 3. Исходное и бинарное изображения объекта, полученное фильтром Кэнни

 

Имеющиеся незначительные разрывы во внешнем контуре объекта интереса легко устраняются дальнейшей морфологической обработкой бинарного изображения.

Выводы. 1. Для обнаружения резко сфокусированных объектов на изображениях можно использовать модули производных по яркости 1-го и 2-го порядка в сочетании с пороговым разделением.

  1. Использование второй производной предполагает выявление точек пересечения нулевых уровней (середина границы), что соответствует более точной локализации объекта. Для этого можно использовать фильтры Лаплассин-Гауссина или Кэнни.
  2. Вычислить первую производную цифрового полутонового изображения можно используя фильтры Собела, Робертса.
  3. Важным моментом, влияющим на точность выделения считается выбор порога бинаризации абсолютного значения отклика фильтров. Его следует подбирать в интерактивном режиме.
  4. Фильтр Кэнни с подобранным значением порога имеет самую высокую эффективность.

全文:

Обоснование. Задача обнаружения объектов изображения на сложном фоне очень часто встречается при телевизионном наблюдении за быстро перемещающимися объектами на статичном фоне или за неподвижными объектами на изменяющемся фоне или за объектами, которые находятся на разных дистанциях от телевизионной камеры. При этом изображения объектов интереса резко сфокусированы, в отличие от размытого изображения фона. Эта задача относится к задачам сегментации изображений, т. е. разделения изображения на отдельные области по некоторым признакам [1].

Цель — исследование и разработка методов обнаружения и выделения резко сфокусированных объектов на изображениях с размытым фоном.

Методы. В качестве принципа обнаружения указанных выше объектов интереса можно использовать то обстоятельство, что детали резко сфокусированных объектов и в особенности их границы характеризуются быстрыми изменениями яркости. В то же время размытое изображение фона имеет значительно меньшую скорость изменения яркости. Для анализа скорости изменения яркости можно использовать первую и вторую производную по яркости для изображения.

Результаты. Экспериментальные исследования с реальными изображениями, выполненные средствами MATLAB, показали, что использование производных по яркости позволяет решить поставленную задачу. Это иллюстрируется рис. 1, на котором показаны зависимость модуля 1-й и 2-й производной для одной строки f(x) сложного изображения.

1-я производная дискретной одномерной функции профиля строки f(x) вычислялась как разность значений соседних элементов:

dfdx=f(x+1)-f(x),

 

Рис. 1. а — исходное изображение; б — профиль выделенной строки; в — модуль 1-й производной по яркости; г — модуль 2-й производной по яркости

 

а 2-я производная как разность соседних значений первой производной:

d2fdx2=f(x+1)+f(x-1)-2f(x).

Анализ полученных результатов показывает, что модули производных как первого, так и второго порядка (рис. 1, в и г) имеют существенно большую величину на участках строки, принадлежащих резко сфокусированным объектам. Если теперь отбросить все значения модулей, которые не превышают некоторый порог по интенсивности, и сохранить полученный результат, то получим пикселы строки, принадлежащие сфокусированным объектам интереса. Очевидно, что данный вывод можно распространить и на двумерное изображение.

Известно, что производные первого порядка формируются с помощью градиентов

f=GxGy=dfdxdfdy,

а второго порядка — с помощью Лапласианов

2f=d2f(x,y)dx2+d2f(x,y)dy2.

На рис. 2 показан результат обработки тестового изображения Лапласианом и бинаризация модуля полученного отклика по экспериментально подобранному порогу. Видно, что полученное бинарное изображение вполне адекватно соответствует резко сфокусированному объекту.

 

Рис. 2. Исходное и бинарное изображения объекта, полученное с помощью Лапласиана

 

Еще несколько экспериментов было выполнено с помощью стандартных пространственных фильтров для выделения контуров на изображениях: Собела, Робертса, Превитт, Лапласиан-Гауссиана и Кэнни. Их алгоритмы также используют вычисления первой или второй производных по яркости. При этом наилучшие результаты были получены при использовании фильтра Кэнни, что иллюстрирует рис. 3.

 

Рис. 3. Исходное и бинарное изображения объекта, полученное фильтром Кэнни

 

Имеющиеся незначительные разрывы во внешнем контуре объекта интереса легко устраняются дальнейшей морфологической обработкой бинарного изображения.

Выводы. 1. Для обнаружения резко сфокусированных объектов на изображениях можно использовать модули производных по яркости 1-го и 2-го порядка в сочетании с пороговым разделением.

  1. Использование второй производной предполагает выявление точек пересечения нулевых уровней (середина границы), что соответствует более точной локализации объекта. Для этого можно использовать фильтры Лаплассин-Гауссина или Кэнни.
  2. Вычислить первую производную цифрового полутонового изображения можно используя фильтры Собела, Робертса.
  3. Важным моментом, влияющим на точность выделения считается выбор порога бинаризации абсолютного значения отклика фильтров. Его следует подбирать в интерактивном режиме.
  4. Фильтр Кэнни с подобранным значением порога имеет самую высокую эффективность.
×

作者简介

Поволжский государственный университет телекоммуникаций и информатики

Email: nnizom07@gmail.com

магистрант, группа ИСТм-01, факультет информационных систем и технологий

俄罗斯联邦, Самара

Поволжский государственный университет телекоммуникаций и информатики

编辑信件的主要联系方式.
Email: oleg.l.kulyas@gmail.com

кандидат технических наук, старший научный сотрудник, доцент кафедры информационных систем и технологий

俄罗斯联邦, Самара

参考

  1. Гонсалес Р., Вудс Р. Цифровая обработка изображений. Москва: Техносфера, 2012. 1072 с.

补充文件

附件文件
动作
1. JATS XML
2. Рис. 1. а — исходное изображение; б — профиль выделенной строки; в — модуль 1-й производной по яркости; г — модуль 2-й производной по яркости

下载 (150KB)
3. Рис. 2. Исходное и бинарное изображения объекта, полученное с помощью Лапласиана

下载 (58KB)
4. Рис. 3. Исходное и бинарное изображения объекта, полученное фильтром Кэнни

下载 (56KB)

版权所有 © Нурматов Н.Р., Куляс О.Л., 2022

Creative Commons License
此作品已接受知识共享署名 4.0国际许可协议的许可
##common.cookie##