Метод семантической сегментации изображений на основе нейронной сети с использованием фильтров Габора
- Авторы: Мурин Е.А.1, Сорокин Д.В.1, Крылов А.С.1
-
Учреждения:
- Факультет вычислительной математики и кибернетики Московский государственный университет имени М. В. Ломоносова
- Выпуск: № 3 (2025)
- Страницы: 54–62
- Раздел: КОМПЬЮТЕРНАЯ ГРАФИКА И ВИЗУАЛИЗАЦИЯ
- URL: https://journals.eco-vector.com/0132-3474/article/view/688121
- DOI: https://doi.org/10.31857/S0132347425030052
- EDN: https://elibrary.ru/GRGMFQ
- ID: 688121
Цитировать
Полный текст



Аннотация
Статья посвящена использованию фильтров Габора для повышения эффективности сверточных нейронных сетей (CNN) в задачах анализа изображений, в частности сегментации. Рассматривается применение фильтров Габора как адаптивного компонента на начальных слоях CNN, что позволяет улучшить выделение текстурных и структурных признаков. Для достижения оптимального баланса между числом обучаемых параметров и точностью предложены адаптивные фильтры Габора, которые увеличивают количество каналов на входе без значительного усложнения модели. Проведен сравнительный анализ архитектур с использованием PSPNet для сегментации изображений, модифицированной адаптивными фильтрами Габора. Рассмотрены ограничения на размер фильтров, обеспечивающие устойчивость к вычислительным затратам. Подтверждена актуальность подхода на наборе данных для сегментации изображений, демонстрирующего улучшение точности при минимальном увеличении числа параметров.
Полный текст

Об авторах
Е. А. Мурин
Факультет вычислительной математики и кибернетики Московский государственный университет имени М. В. Ломоносова
Email: kryl@cs.msu.ru
лаборатория математических методов обработки изображений
Россия, 119991 Москва, Ленинские горы, д. 1, стр. 52Д. В. Сорокин
Факультет вычислительной математики и кибернетики Московский государственный университет имени М. В. Ломоносова
Email: dsorokin@cs.msu.ru
лаборатория математических методов обработки изображений
Россия, 119991 Москва, Ленинские горы, д. 1, стр. 52А. С. Крылов
Факультет вычислительной математики и кибернетики Московский государственный университет имени М. В. Ломоносова
Автор, ответственный за переписку.
Email: kryl@cs.msu.ru
лаборатория математических методов обработки изображений
Россия, 119991 Москва, Ленинские горы, д. 1, стр. 52Список литературы
- Fogel Itzhak, Sagi Dov. Gabor filters as texture discriminator // Biological cybernetics. 1989. Vol. 61. No. 2. P. 103–113.
- Coding facial expressions with Gabor wavelets / Michael Lyons, Shigeru Akamatsu, Miyuki Kamachi, Jiro Gyoba // Proceedings Third IEEE international conference on automatic face and gesture recognition // IEEE. 1998. P. 200–205.
- Kwolek Bogdan. Face detection using convolutional neural networks and Gabor filters // Artificial Neural Networks: Biological Inspirations – ICANN 2005: 15th International Conference, Warsaw, Poland, September 11–15, 2005. Proceedings, Part I 15 / Springer. – 2005. P. 551–556.
- Calderon Andres, Roa Sergio, Victorino Jorge. Handwritten digit recognition using convolutional neural networks and Gabor filters // Proc. Int. Congr. Comput. Intell. 2003. P. 1–9.
- Chang Shuo-Yiin, Morgan Nelson. Robust CNN-based speech recognition with Gabor filter kernels // Fifteenth annual conference of the international speech communication association. 2014. P. 905–909.
- Sarwar Syed Shakib, Panda Priyadarshini, Roy Kaushik. Gabor filter assisted energy efficient fast learning convolutional neural net-works // 2017 IEEE/ACM International Symposium on Low Power Electronics and Design (ISLPED) / IEEE. 2017. P. 1–6.
- Gabor convolutional networks / Shangzhen Lu-an, Chen Chen, Baochang Zhang et al. // IEEE Transactions on Image Processing. 2018. Vol. 27. No. 9. P. 4357–4366.
- Adaptive Gabor convolutional networks / Ye Yuan, Li-Na Wang, Guoqiang Zhong et al. // Pattern Recognition. 2022. Vol. 124. P. 108495.
- Learnable Gabor Convolutional Networks / Guoqiang Zhong, Wei Gao, Wencong Jiao et al. // International Conference on Neural Information Processing / Springer. 2019. P. 305–313.
- Residual Gabor convolutional network and FV-Mix exponential level data augmentation strategy for finger vein recognition / Yifan Wang, Huimin Lu, Xiwen Qin, Jianwei Guo // Expert Systems with Applications. 2023. Vol. 223. P. 119874.
- Learning Gabor texture features for fine-grained recognition / Lanyun Zhu, Tianrun Chen, Jianxiong Yin et al. // Proceedings of the IEEE/CVF International Conference on Computer Vision. 2023. P. 1621–1631.
- Osa Priscilla Indira, Zerubia Josiane, Kato Zoltan. AYANet: A Gabor Wavelet-Based and CNN-Based Double Encoder for Building Change Detection in Remote Sensing // Pattern Recognition / Ed. by Apostolos Antonacopoulos, Subhasis Chaudhuri, Rama Chellappa et al. Cham: Springer Nature Switzerland, 2025. P. 131–146.
- Gabor D. Theory of communication: Journal of the Institute of Electrical Engineers // London. 1946. Vol. 93. P. 429–457.
- Krizhevsky Alex, Sutskever Ilya, Hinton Geof-frey E. Imagenet classification with deep convolutional neural networks // Communications of the ACM. 2017. Vol. 60. No. 6. P. 84–90.
- Fast and efficient facial expression recognition using a Gabor convolutional network / Ping Jiang, Bo Wan, Quan Wang, Jiang Wu // IEEE Signal Processing Letters. 2020. Vol. 27. P. 1954–1958.
- Мурин Е.А., Сорокин Д.В., Крылов А.С. Методы классификации гистологических изображений на основе сверточных нейронных сетей с фильтром Габора // GRAPHICON 2024. Материалы 34-й Международной конференции по компьютерной графике и машинному зрению. Омск: Омский государственный технический университет, 2024. С. 656–668.
- Deep residual learning for image recognition / Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun // Proceedings of the IEEE conference on computer vision and pattern recognition. 2016. P. 770–778.
- Pyramid scene parsing network / Heng-shuang Zhao, Jianping Shi, Xiaojuan Qi et al. // Proceedings of the IEEE conference on computer vision and pattern recognition. 2017. P. 2881–2890.
- Gradient-based learning applied to document recognition / Yann LeCun, L´eon Bottou, Yoshua Bengio, Patrick Haffner // Proceedings of the IEEE. 1998. Vol. 86. No. 11. P. 2278–2324.
- The cityscapes dataset for semantic urban scene understanding / Marius Cordts, Mohamed Omran, Sebastian Ramos et al. // Proceedings of the IEEE conference on computer vision and pattern recognition. 2016. P. 3213–3223.
Дополнительные файлы
