IMAGE SEGMENTATION USING CLUSTERIZATION

Alexey Sergeevich Loshkarev; Лошкарев Алексей Сергеевич

doi:10.18469/ikt.2017.15.4.11

IMAGE SEGMENTATION USING CLUSTERIZATION

Authors: Loshkarev A.S.¹
Affiliations:
1. Povolzhskiy State University of Telecommunications and Informatics
Issue: Vol 15, No 4 (2017)
Pages: 388-393
Section: Articles
URL: https://journals.eco-vector.com/2073-3909/article/view/56290
DOI: https://doi.org/10.18469/ikt.2017.15.4.11
ID: 56290

Cite item

Full Text

Abstract
Full Text
About the authors
References
Supplementary files
Statistics

Abstract

Threshold based methods are the most frequently used methods of image segmentation due to their intuitive nature and ease of implementation. In this article, we consider methods of automatic threshold selection, as well as methods for threshold adjustment in accordance with local image properties. The studies were conducted using Matlab software. Global threshold processing cannot produce the desired result if the image background is highly heterogeneous in brightness. In such cases, it is necessary to apply pre-processing to compensate for variations in background brightness, after which a global threshold transformation can be performed. One way to choose a threshold is to visually examine the image histogram. If the histogram has two distinct modes, then it is easy to choose the threshold separating them. Another approach to threshold selection is based on the trial and error method, when different thresholds are selected and checked until the result of the threshold processing satisfies the requirements.

Keywords

Otsu, Adaptive threshold, ISODATA, Otsu, Adaptive threshold, Iterative Self-Organizing Data Analysis Technique, segmentation, binarization, television registration, technical vision system, object detection

Full Text

Введение В настоящее время большое внимание уделяется внедрению информационных технологий во все отрасли деятельности современного человека. Помимо ставших привычными баз данных, позволяющих хранить и обрабатывать большие потоки информации различных типов, на многих предприятиях внедряются системы телевизионной регистрации движущихся объектов. Они достаточно эффективно позволяют отслеживать наличие людей в кадре, автомобилей, деталей на конвейере и другие. Такие системы позволяют осуществлять мониторинг охраняемых зон, предупреждать оператора станка в случае обнаружения дефекта детали. Несмотря на кажущуюся простоту подобные системы работают по сложным алгоритмам, состоящим из нескольких этапов. Если говорить о наиболее сложных из них, то следует обратить внимание на алгоритмы сегментации входной информации. Их основной задачей является выделение на входящем изображении участки, которые представляют ценность для исследования, либо проведения операций над ними. Принимая во внимание популярность подобных систем следует отметить, что исследование, оптимизация и улучшений работы алгоритмов, решающих подобные задачи, является достаточно актуальным вопросом в настоящее время. Рассматривая существующие методы сегментации изображений можно обратить внимание на то, что некоторые из них являются более популярными, а другие нет. В настоящее время наиболее часто используется сегментация методами Otsu, Adaptive Treshold, ISODATA [1]. Данные методы получили широкое распространение на счет своей универсальности, а также простоты своей реализации на ЭВМ. Наиболее простым из исследуемых является метод кластеризации Otsu. Метод Otsu Данный метод использует автоматический выбор порога бинаризации, основанного на гистограммах, что позволяет алгоритму адаптироваться под конкретное изображение. В целом работа алгоритма состоит из двух шагов. Шаг 1. Автоматический расчёт порога кластеризации с использованием нормированной гистограммы яркостей изображения производится по формуле [2]: , (1) где - общее число пикселей на изображении; - число пикселей с уровнем яркости Шаг 2. Процедура кластеризации изображения с использованием рассчитанного порога. Диапазон яркостей пикселей исходного изображения делятся на два класса t (целое значение от 0 до L, где - максимальное значение яркости). Также учитывается, что каждому классу соответствует [3]: ω0 ω0(t) = ; ω1(t) = 1 - ω0(t); (2) μ0(t) = ; μ1(t) = , где ω0(t) и ω1(t) - относительные частоты появления значений каждого из классов 0 и 1, разделенных порогом i; μ0(t) и μ1(t) - средние уровни для каждого из указанных двух классов, разделенных порогом. Использование данного метода оправдано в случаях, когда изображение состоит из объекта и фона. При таких условиях порог определяется максимально точно, что позволяет выделить объект с минимальной погрешностью (см. рис. 1). а) б) Рис. 1. Результат сегментации методом Otsu: а) до обработки; б) после обработки изображения Несмотря на достоинства и простоту сегментации методом Otsu, его слабой стороной является кластеризация участков на изображениях, имеющих сложную структуру. Например, неконтрастный фон, наличие затемненных участков. Этих недостатков можно было бы избежать, если рассчитывать порог для методаOtsu не один раз для всего изображения, а для определенного участка: кластера, либо пикселя [4]. Метод Adaptive Threshold Одним из алгоритмов, которые используют такой подход является AdaptiveТhreshold. Чтобы был понятен принцип работы алгоритма, требуется описать его математически. Известно, что является исходным изображением, которое требуется кластеризовать; представляет собой расчетную величину градиента для исходного изображения рассчитываемая по формуле . (3) Этот метод отличается от предыдущего тем, что использует расчет адаптивного порога для каждого пикселя изображения. Это позволяет представить кластеризацию в следующем виде: (4) В данном случае и представляют собой поверхности в двумерном пространстве 2D, которые имеют пересечение в точке . Исходя из данного выражения следует полагать, что пересечение плоскостей будет происходить в тех точках, где находится целевая область на изображении. Это можно трактовать следующим образом: если является правильной пороговой поверхностью, то значение (где является хаусдорфовой мерой для c, а - число граничных точек объекта), будет максимальным. Это позволяет преобразовать функцию T к функциональному пространству по й формуле (5) где - первая производная от и . Полученная функция является достаточно сложной, ее можно значительно упростить. В этом случае изначальная функция примет вид [5]: (6) где - параметр регуляризации. Дальнейшая минимизация выражения (5) сводится к решению уравнения Пуассона: (7) где α = 1/2λ. Поскольку касается c; то может быть записан как F(x(T),y(T)) по правилу цепи: (8) - измененная функция Т [2]. Таким образом, согласно [6] (9) Это выражение позволяет определить пороговое значение кластеризации для каждого пиксела изображения, что делает его универсальным и позволяет применять его в достаточно широком спектре задач. Рис. 2. Исходное изображение с большим числом мелких деталей Чтобы произвести оценку работы алгоритма были выбраны два тестовых изображения. На первом изображении расположено большое количество небольших областей, которые являются целевыми (см. рис. 2). Универсальность метода AdaptiveТhreshold позволяет получить приемлемые результаты даже в случае большого числа небольших областей (см. рис. 3). Рис. 3. Результаты кластеризации первого тестового изображения После обработки на первом изображении видны границы даже мелких деталей, но присутствует и множество ненужных артефактов, которые образовались из-за наличия шероховатости поверхностей. Эти погрешности имеют незамкнутые контуры, что позволяет впоследствии убрать их с изображения [7]. Во втором тестовом изображении имеется контрастный фон, но при этом имеется большое количество тонких и коротких граней, что заметно усложняет процесс обнаружения (рис. 4). Рис. 4. Исходное изображение для кластеризации областей с гранями объекта После обработки этого изображения были получены следующие результаты (см. рис. 5). Результирующие области были выделены корректно. Исключение составляют лишь небольшие области за границами детали, которые появились в результате зашумления контуров исходного объекта. Рис. 5. Результат кластеризации второго тестового изображения Последнее изображение наиболее подходит для выделения контуров. Деталь контрастна на фоне, что делает контур наиболее четким (см. рис. 6). Рис. 6. Изображение для кластеризации с минимальным наличием шума и дефектов объекта В результате обработки этого изображения были выделены грани деталей, а также небольшие дефекты на ее поверхности (см. рис. 7). Такие результаты были достигнуты за счет отсутствия дефектов исходного изображения. Рис. 7. Результат кластеризации изображения, содержащего минимум дефектов и шумов Из полученных результатов можно сделать вывод о том, что данный алгоритм является чувствительным к наличию шума на исходном изображении, поэтому предварительно нужно выполнять корректирующие действия, например, медианную фильтрацию, что существенно снизит число нежелательных артефактов. Еще одной негативной стороной по сравнению с методом Otsu является большой объем вычислений порогов яркостей, благодаря чему достигается неплохой результат сегментации, но увеличивается вычислительная сложность. Метод ISODATA Оба рассмотренных алгоритма были разработаны сравнительно давно. В настоящее время широко распространен алгоритм ISODATA, который позволяет наиболее точно кластеризовать интересующую область на изображении. Данный алгоритм позволяет автоматически настраивать число кластеров во время итеративного процесса путем слияния схожих по заданной мере кластеров и расщепления кластеров с большим внутренним среднеквадратичным отклонением. Алгоритм ISODATA настраивается следующими параметрами: - желаемое число кластеров; - максимально допустимое число итераций; - максимальное число пар объединяемых кластеров; - пороговое значение для минимального числа элементов в кластере (используется для удаления малых кластеров); - пороговое значение для среднеквадратичного отклонения (используется для операции расщепления); - пороговое значение для межклассового расстояния (используется для операции слияния). Алгоритм состоит из следующих шагов [8]. Шаг 1. Произвольный выбор (необязательно K) начальных центров кластеров из исходной выборки , i = 1; 2 ... N. Шаг 2. Определение каждого из N элементов выборки в ближайший кластер , если [9] Шаг 3. Удаление кластеров с числом элементов меньше : если для некоторого выполнено , то кластер удаляется, уменьшается на единицу. Шаг 4. Обновляются центры кластеров: (10) Шаг 5. Рассчитываются средние расстояния от каждого элемента кластера до соответствующего центра кластера: (11) Шаг 6. Вычисляется общее среднее расстояние от элементов до центра соответствующего кластера: (12) Шаг 7. Если (кластеров мало), то переходим к шагу 8. Если (кластеров много), то переходим к шагу 11, иначе - к шагу 12. Шаг 8. Первый шаг расщепления. Находится вектор стандартного отклонения [10]: (13) Шаг 9. Находится максимальное из . Шаг 10. Расщепление кластера. Шаг 11. Слияние кластеров по принципу Min расстояния между их центрами. Шаг 12. Остановка в случае превышения Max числа итераций. Рассматривая данный алгоритм можно обратить внимание, что сложность его наиболее высокая по сравнению с предыдущими. Несмотря на это он позволяет добиться наилучших результатов (см. рис. 8). Рис. 8. Результат кластеризации с использованием алгоритма ISODATA В данном тесте алгоритмом были сегментированы интересующие области в виде темных областей с точными границами, что делает их пригодными для последующей обработки. Заключение Подводя итог, можно сделать вывод о том, что при выборе одного из рассмотренных алгоритмов следует обратить внимание на вычислительную сложность и скорость его работы. Если в работе телевизионной системы требуется лишь определить наличие интересующей области на кадрах видеоряда, то исходное изображение следует кластеризовывать методом Otsu. В случае же необходимости более детального выделения каждой области, например, для распознавания образов, требуется применение двух других алгоритмов, которые позволяют получить более точные границы каждого из объектов.

About the authors

Alexey Sergeevich Loshkarev

Povolzhskiy State University of Telecommunications and Informatics

Email: lozhkarev-as@mail.ru

References

Image Processing Toolbox // Usеr's Guide, Version 5.0.1. The Math Works, Inc., 2004. - 2 p.
Fuzzy Logic Toolbox // Usеr's Guide, Version 2.2. The Math Works, Inc., 2004. - 5 p.
Hyperspectral Image Analysis Toolbox 1.0 // Laboratory for Applied Remote Sensing and Image Processing, 2004. - P.4.
Bewley A. Real-Time Volume Estimation of a Dragline Payload // IEEE International Conference on Robotics and Automation, 2011. - P.1571-1576. doi: 10.1109/ICRA.2011. 5979898.
Basak S.C., Magnuson V.R., Niemi C.J. et al. Determining Structural Similarity of Chemicals Using Graph Theoretic Indices // Discrete Applied Mathematics. Vol. 19, 1988. - P. 17-44.
Huth R. et al. Classifications of Atmospheric Circulation Patterns: Recent Advances and Applications // Annals of the New York Academy of Sciences. 2008. - P.105-152. doi: 10.1196/annals.1446.019
Achtert E., Böhm C., Kriegel H-P. et al. Finding Hierarchies of Subspace Clusters // Knowledge Discovery in Databases: PKDD 2006, 2006. - P. 446-453.
Fowlkes E.B., Mallows C.L. A Method for Comparing Two Hierarchical Clusterings // Journal of the American Statistical Association, Vol. 78, No. 383, 1983. - P. 553-569. doi: 10.1080/01621459.1983.10478008.
Tian Zhang, Raghu Ramakrishnan, Miron Livny. An Efficient Data Clustering Method for Very Large Databases // Proceedings of the 1996 ACM SIGMOD International Conference on Management of Data. Vol. 25, No. 2, 1996. - P. 103-114.
Achtert E., Böhm C., Kröger P. et al. Mining Hierarchies of Correlation Clusters // Proceedings of the 18th International Conference on Scientific and Statistical Database Management (SSDBM), 2008. - P. 119-128.

Supplementary files

Supplementary Files

Action

1. JATS XML

Download

Username
Password
Remember me

Forgot password?	Register

Username
Password
Remember me

Forgot password?	Register