Выделение объектов интереса на сложном фоне

Мұқаба
  • Авторлар: 1, 1
  • Мекемелер:
    1. Поволжский государственный университет телекоммуникаций и информатики
  • Шығарылым: Том 1 (2022)
  • Беттер: 430-432
  • Бөлім: Электроника и радиоэлектроника
  • URL: https://journals.eco-vector.com/osnk-sr/article/view/107543
  • ID: 107543

Дәйексөз келтіру

Толық мәтін

Аннотация

Обоснование. Задача обнаружения объектов изображения на сложном фоне очень часто встречается при телевизионном наблюдении за быстро перемещающимися объектами на статичном фоне или за неподвижными объектами на изменяющемся фоне или за объектами, которые находятся на разных дистанциях от телевизионной камеры. При этом изображения объектов интереса резко сфокусированы, в отличие от размытого изображения фона. Эта задача относится к задачам сегментации изображений, т. е. разделения изображения на отдельные области по некоторым признакам [1].

Цель — исследование и разработка методов обнаружения и выделения резко сфокусированных объектов на изображениях с размытым фоном.

Методы. В качестве принципа обнаружения указанных выше объектов интереса можно использовать то обстоятельство, что детали резко сфокусированных объектов и в особенности их границы характеризуются быстрыми изменениями яркости. В то же время размытое изображение фона имеет значительно меньшую скорость изменения яркости. Для анализа скорости изменения яркости можно использовать первую и вторую производную по яркости для изображения.

Результаты. Экспериментальные исследования с реальными изображениями, выполненные средствами MATLAB, показали, что использование производных по яркости позволяет решить поставленную задачу. Это иллюстрируется рис. 1, на котором показаны зависимость модуля 1-й и 2-й производной для одной строки f(x) сложного изображения.

1-я производная дискретной одномерной функции профиля строки f(x) вычислялась как разность значений соседних элементов:

dfdx=f(x+1)-f(x),

 

Рис. 1. а — исходное изображение; б — профиль выделенной строки; в — модуль 1-й производной по яркости; г — модуль 2-й производной по яркости

 

а 2-я производная как разность соседних значений первой производной:

d2fdx2=f(x+1)+f(x-1)-2f(x).

Анализ полученных результатов показывает, что модули производных как первого, так и второго порядка (рис. 1, в и г) имеют существенно большую величину на участках строки, принадлежащих резко сфокусированным объектам. Если теперь отбросить все значения модулей, которые не превышают некоторый порог по интенсивности, и сохранить полученный результат, то получим пикселы строки, принадлежащие сфокусированным объектам интереса. Очевидно, что данный вывод можно распространить и на двумерное изображение.

Известно, что производные первого порядка формируются с помощью градиентов

f=GxGy=dfdxdfdy,

а второго порядка — с помощью Лапласианов

2f=d2f(x,y)dx2+d2f(x,y)dy2.

На рис. 2 показан результат обработки тестового изображения Лапласианом и бинаризация модуля полученного отклика по экспериментально подобранному порогу. Видно, что полученное бинарное изображение вполне адекватно соответствует резко сфокусированному объекту.

 

Рис. 2. Исходное и бинарное изображения объекта, полученное с помощью Лапласиана

 

Еще несколько экспериментов было выполнено с помощью стандартных пространственных фильтров для выделения контуров на изображениях: Собела, Робертса, Превитт, Лапласиан-Гауссиана и Кэнни. Их алгоритмы также используют вычисления первой или второй производных по яркости. При этом наилучшие результаты были получены при использовании фильтра Кэнни, что иллюстрирует рис. 3.

 

Рис. 3. Исходное и бинарное изображения объекта, полученное фильтром Кэнни

 

Имеющиеся незначительные разрывы во внешнем контуре объекта интереса легко устраняются дальнейшей морфологической обработкой бинарного изображения.

Выводы. 1. Для обнаружения резко сфокусированных объектов на изображениях можно использовать модули производных по яркости 1-го и 2-го порядка в сочетании с пороговым разделением.

  1. Использование второй производной предполагает выявление точек пересечения нулевых уровней (середина границы), что соответствует более точной локализации объекта. Для этого можно использовать фильтры Лаплассин-Гауссина или Кэнни.
  2. Вычислить первую производную цифрового полутонового изображения можно используя фильтры Собела, Робертса.
  3. Важным моментом, влияющим на точность выделения считается выбор порога бинаризации абсолютного значения отклика фильтров. Его следует подбирать в интерактивном режиме.
  4. Фильтр Кэнни с подобранным значением порога имеет самую высокую эффективность.

Толық мәтін

Обоснование. Задача обнаружения объектов изображения на сложном фоне очень часто встречается при телевизионном наблюдении за быстро перемещающимися объектами на статичном фоне или за неподвижными объектами на изменяющемся фоне или за объектами, которые находятся на разных дистанциях от телевизионной камеры. При этом изображения объектов интереса резко сфокусированы, в отличие от размытого изображения фона. Эта задача относится к задачам сегментации изображений, т. е. разделения изображения на отдельные области по некоторым признакам [1].

Цель — исследование и разработка методов обнаружения и выделения резко сфокусированных объектов на изображениях с размытым фоном.

Методы. В качестве принципа обнаружения указанных выше объектов интереса можно использовать то обстоятельство, что детали резко сфокусированных объектов и в особенности их границы характеризуются быстрыми изменениями яркости. В то же время размытое изображение фона имеет значительно меньшую скорость изменения яркости. Для анализа скорости изменения яркости можно использовать первую и вторую производную по яркости для изображения.

Результаты. Экспериментальные исследования с реальными изображениями, выполненные средствами MATLAB, показали, что использование производных по яркости позволяет решить поставленную задачу. Это иллюстрируется рис. 1, на котором показаны зависимость модуля 1-й и 2-й производной для одной строки f(x) сложного изображения.

1-я производная дискретной одномерной функции профиля строки f(x) вычислялась как разность значений соседних элементов:

dfdx=f(x+1)-f(x),

 

Рис. 1. а — исходное изображение; б — профиль выделенной строки; в — модуль 1-й производной по яркости; г — модуль 2-й производной по яркости

 

а 2-я производная как разность соседних значений первой производной:

d2fdx2=f(x+1)+f(x-1)-2f(x).

Анализ полученных результатов показывает, что модули производных как первого, так и второго порядка (рис. 1, в и г) имеют существенно большую величину на участках строки, принадлежащих резко сфокусированным объектам. Если теперь отбросить все значения модулей, которые не превышают некоторый порог по интенсивности, и сохранить полученный результат, то получим пикселы строки, принадлежащие сфокусированным объектам интереса. Очевидно, что данный вывод можно распространить и на двумерное изображение.

Известно, что производные первого порядка формируются с помощью градиентов

f=GxGy=dfdxdfdy,

а второго порядка — с помощью Лапласианов

2f=d2f(x,y)dx2+d2f(x,y)dy2.

На рис. 2 показан результат обработки тестового изображения Лапласианом и бинаризация модуля полученного отклика по экспериментально подобранному порогу. Видно, что полученное бинарное изображение вполне адекватно соответствует резко сфокусированному объекту.

 

Рис. 2. Исходное и бинарное изображения объекта, полученное с помощью Лапласиана

 

Еще несколько экспериментов было выполнено с помощью стандартных пространственных фильтров для выделения контуров на изображениях: Собела, Робертса, Превитт, Лапласиан-Гауссиана и Кэнни. Их алгоритмы также используют вычисления первой или второй производных по яркости. При этом наилучшие результаты были получены при использовании фильтра Кэнни, что иллюстрирует рис. 3.

 

Рис. 3. Исходное и бинарное изображения объекта, полученное фильтром Кэнни

 

Имеющиеся незначительные разрывы во внешнем контуре объекта интереса легко устраняются дальнейшей морфологической обработкой бинарного изображения.

Выводы. 1. Для обнаружения резко сфокусированных объектов на изображениях можно использовать модули производных по яркости 1-го и 2-го порядка в сочетании с пороговым разделением.

  1. Использование второй производной предполагает выявление точек пересечения нулевых уровней (середина границы), что соответствует более точной локализации объекта. Для этого можно использовать фильтры Лаплассин-Гауссина или Кэнни.
  2. Вычислить первую производную цифрового полутонового изображения можно используя фильтры Собела, Робертса.
  3. Важным моментом, влияющим на точность выделения считается выбор порога бинаризации абсолютного значения отклика фильтров. Его следует подбирать в интерактивном режиме.
  4. Фильтр Кэнни с подобранным значением порога имеет самую высокую эффективность.
×

Авторлар туралы

Поволжский государственный университет телекоммуникаций и информатики

Email: nnizom07@gmail.com

магистрант, группа ИСТм-01, факультет информационных систем и технологий

Ресей, Самара

Поволжский государственный университет телекоммуникаций и информатики

Хат алмасуға жауапты Автор.
Email: oleg.l.kulyas@gmail.com

кандидат технических наук, старший научный сотрудник, доцент кафедры информационных систем и технологий

Ресей, Самара

Әдебиет тізімі

  1. Гонсалес Р., Вудс Р. Цифровая обработка изображений. Москва: Техносфера, 2012. 1072 с.

Қосымша файлдар

Қосымша файлдар
Әрекет
1. JATS XML

© Нурматов Н.Р., Куляс О.Л., 2022

Creative Commons License
Бұл мақала лицензия бойынша қолжетімді Creative Commons Attribution 4.0 International License.

Осы сайт cookie-файлдарды пайдаланады

Біздің сайтты пайдалануды жалғастыра отырып, сіз сайттың дұрыс жұмыс істеуін қамтамасыз ететін cookie файлдарын өңдеуге келісім бересіз.< / br>< / br>cookie файлдары туралы< / a>