Выделение объектов интереса на сложном фоне

Нурматов Низом Рустамович; Куляс Олег Леонидович

Выделение объектов интереса на сложном фоне

Авторы: Нурматов Н.Р.¹, Куляс О.Л.¹
Учреждения:
1. Поволжский государственный университет телекоммуникаций и информатики
Выпуск: Том 1 (2022)
Страницы: 430-432
Раздел: Электроника и радиоэлектроника
URL: https://journals.eco-vector.com/osnk-sr/article/view/107543
ID: 107543

Цитировать

Полный текст

Аннотация
Полный текст
Об авторах
Список литературы
Дополнительные файлы
Статистика

Аннотация

Обоснование. Задача обнаружения объектов изображения на сложном фоне очень часто встречается при телевизионном наблюдении за быстро перемещающимися объектами на статичном фоне или за неподвижными объектами на изменяющемся фоне или за объектами, которые находятся на разных дистанциях от телевизионной камеры. При этом изображения объектов интереса резко сфокусированы, в отличие от размытого изображения фона. Эта задача относится к задачам сегментации изображений, т. е. разделения изображения на отдельные области по некоторым признакам [1].

Цель — исследование и разработка методов обнаружения и выделения резко сфокусированных объектов на изображениях с размытым фоном.

Методы. В качестве принципа обнаружения указанных выше объектов интереса можно использовать то обстоятельство, что детали резко сфокусированных объектов и в особенности их границы характеризуются быстрыми изменениями яркости. В то же время размытое изображение фона имеет значительно меньшую скорость изменения яркости. Для анализа скорости изменения яркости можно использовать первую и вторую производную по яркости для изображения.

Результаты. Экспериментальные исследования с реальными изображениями, выполненные средствами MATLAB, показали, что использование производных по яркости позволяет решить поставленную задачу. Это иллюстрируется рис. 1, на котором показаны зависимость модуля 1-й и 2-й производной для одной строки f(x) сложного изображения.

1-я производная дискретной одномерной функции профиля строки f(x) вычислялась как разность значений соседних элементов:

$\frac{d f}{d x} = f (x + 1) - f (x)$ ,

Рис. 1. а — исходное изображение; б — профиль выделенной строки; в — модуль 1-й производной по яркости; г — модуль 2-й производной по яркости

а 2-я производная как разность соседних значений первой производной:

$\frac{d^{2} f}{d x^{2}} = f (x + 1) + f (x - 1) - 2 f (x)$ .

Анализ полученных результатов показывает, что модули производных как первого, так и второго порядка (рис. 1, в и г) имеют существенно большую величину на участках строки, принадлежащих резко сфокусированным объектам. Если теперь отбросить все значения модулей, которые не превышают некоторый порог по интенсивности, и сохранить полученный результат, то получим пикселы строки, принадлежащие сфокусированным объектам интереса. Очевидно, что данный вывод можно распространить и на двумерное изображение.

Известно, что производные первого порядка формируются с помощью градиентов

$\nabla f = [\begin{array}{l} G_{x} \\ G_{y} \end{array}] = [\begin{array}{l} \frac{d f}{d x} \\ \frac{d f}{d y} \end{array}]$ ,

а второго порядка — с помощью Лапласианов

$\nabla^{2} f = \frac{d^{2} f (x, y)}{d x^{2}} + \frac{d^{2} f (x, y)}{d y^{2}}$ .

На рис. 2 показан результат обработки тестового изображения Лапласианом и бинаризация модуля полученного отклика по экспериментально подобранному порогу. Видно, что полученное бинарное изображение вполне адекватно соответствует резко сфокусированному объекту.

Рис. 2. Исходное и бинарное изображения объекта, полученное с помощью Лапласиана

Еще несколько экспериментов было выполнено с помощью стандартных пространственных фильтров для выделения контуров на изображениях: Собела, Робертса, Превитт, Лапласиан-Гауссиана и Кэнни. Их алгоритмы также используют вычисления первой или второй производных по яркости. При этом наилучшие результаты были получены при использовании фильтра Кэнни, что иллюстрирует рис. 3.

Рис. 3. Исходное и бинарное изображения объекта, полученное фильтром Кэнни

Имеющиеся незначительные разрывы во внешнем контуре объекта интереса легко устраняются дальнейшей морфологической обработкой бинарного изображения.

Выводы. 1. Для обнаружения резко сфокусированных объектов на изображениях можно использовать модули производных по яркости 1-го и 2-го порядка в сочетании с пороговым разделением.

Использование второй производной предполагает выявление точек пересечения нулевых уровней (середина границы), что соответствует более точной локализации объекта. Для этого можно использовать фильтры Лаплассин-Гауссина или Кэнни.
Вычислить первую производную цифрового полутонового изображения можно используя фильтры Собела, Робертса.
Важным моментом, влияющим на точность выделения считается выбор порога бинаризации абсолютного значения отклика фильтров. Его следует подбирать в интерактивном режиме.
Фильтр Кэнни с подобранным значением порога имеет самую высокую эффективность.

Ключевые слова

выделение объектов, MATLAB, производная, перепад яркости, бинарное изображение

Полный текст

$\frac{d f}{d x} = f (x + 1) - f (x)$ ,

а 2-я производная как разность соседних значений первой производной:

$\frac{d^{2} f}{d x^{2}} = f (x + 1) + f (x - 1) - 2 f (x)$ .

Известно, что производные первого порядка формируются с помощью градиентов

$\nabla f = [\begin{array}{l} G_{x} \\ G_{y} \end{array}] = [\begin{array}{l} \frac{d f}{d x} \\ \frac{d f}{d y} \end{array}]$ ,

а второго порядка — с помощью Лапласианов

$\nabla^{2} f = \frac{d^{2} f (x, y)}{d x^{2}} + \frac{d^{2} f (x, y)}{d y^{2}}$ .

Рис. 2. Исходное и бинарное изображения объекта, полученное с помощью Лапласиана

Рис. 3. Исходное и бинарное изображения объекта, полученное фильтром Кэнни

Использование второй производной предполагает выявление точек пересечения нулевых уровней (середина границы), что соответствует более точной локализации объекта. Для этого можно использовать фильтры Лаплассин-Гауссина или Кэнни.
Вычислить первую производную цифрового полутонового изображения можно используя фильтры Собела, Робертса.
Важным моментом, влияющим на точность выделения считается выбор порога бинаризации абсолютного значения отклика фильтров. Его следует подбирать в интерактивном режиме.
Фильтр Кэнни с подобранным значением порога имеет самую высокую эффективность.

Об авторах

Низом Рустамович Нурматов

Поволжский государственный университет телекоммуникаций и информатики

Email: nnizom07@gmail.com

магистрант, группа ИСТм-01, факультет информационных систем и технологий

Россия, Самара

Олег Леонидович Куляс

Поволжский государственный университет телекоммуникаций и информатики

Автор, ответственный за переписку.
Email: oleg.l.kulyas@gmail.com

кандидат технических наук, старший научный сотрудник, доцент кафедры информационных систем и технологий

Россия, Самара

Список литературы

Гонсалес Р., Вудс Р. Цифровая обработка изображений. Москва: Техносфера, 2012. 1072 с.

Дополнительные файлы

Доп. файлы

Действие

1. JATS XML

Скачать

2. Рис. 1. а — исходное изображение; б — профиль выделенной строки; в — модуль 1-й производной по яркости; г — модуль 2-й производной по яркости

Скачать (150KB)

Метаданные

3. Рис. 2. Исходное и бинарное изображения объекта, полученное с помощью Лапласиана

Скачать (58KB)

Метаданные

4. Рис. 3. Исходное и бинарное изображения объекта, полученное фильтром Кэнни

Скачать (56KB)

Метаданные

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация