Влияние архитектуры CNN, размера и качества изображений на модель, созданную для обнаружения объектов на гистологических препаратах
- Авторы: Федосова Н.В.1, Берченко Г.Н.1, Шугаева О.Б.1, Машошин Д.В.1, Кочан М.Г.1
-
Учреждения:
- Национальный медицинский исследовательский центр травматологии и ортопедии им. Н.Н. Приорова
- Выпуск: Том 31, № 4 (2024)
- Страницы: 751-758
- Раздел: Научные обзоры
- Статья получена: 15.10.2024
- Статья одобрена: 25.10.2024
- Статья опубликована: 25.12.2024
- URL: https://journals.eco-vector.com/0869-8678/article/view/637087
- DOI: https://doi.org/10.17816/vto637087
- ID: 637087
Цитировать
Полный текст



Аннотация
Проблема повышения качества свёрточной нейронной сети (англ. convolutional neural network, CNN) в случае поиска объектов на гистологических сканах возникла достаточно давно и сводится прежде всего к выбору оптимальной архитектуры CNN и подготовке датасета надлежащего качества. На работу алгоритмов обнаружения объектов влияют многие факторы, включая качество изображения, размер изображения и самого объекта поиска. Основной целью проведённой работы являлся поиск существующих исследований, демонстрирующих влияние различных характеристик изображений в обучающей выборке и выбора архитектуры CNN на качество создаваемой модели. В качестве исходных материалов для работы была проанализирована литература за последние 5 лет, посвящённая вопросам предварительной обработки данных, методологиям, требованиям к изображениям, включаемым в датасеты, подготовке изображений для создания моделей CNN и вопросам выбора архитектуры. На момент проведения исследования не сформулировано требований к размерам изображений и отсутствуют данные о соотношении размеров объектов и размеров изображения для оптимизации работы модели. Кроме того, задача выбора архитектуры нейронной сети не является прозрачной и алгоритмизированной. В большинстве случаев исследователи рекомендуют те архитектуры, которые сами разрабатывали или использовали, не объясняя ни причины, ни критерии выбора, не сравнивая с альтернативными вариантами. Всё это существенно затрудняет процесс разработки модели CNN для обработки медицинских изображений. В данном обзорном исследовании приводится краткий обзор исследований, посвящённых подготовке изображений для датасета и возможного подхода к выбору архитектуры CNN.
Ключевые слова
Полный текст

Об авторах
Нина Вениаминовна Федосова
Национальный медицинский исследовательский центр травматологии и ортопедии им. Н.Н. Приорова
Email: hard_sign@mail.ru
ORCID iD: 0000-0002-0829-9188
SPIN-код: 5380-3194
MS
Россия, 127299, Москва, ул. Приорова, 10Геннадий Николаевич Берченко
Национальный медицинский исследовательский центр травматологии и ортопедии им. Н.Н. Приорова
Автор, ответственный за переписку.
Email: berchenko@cito-bone.ru
ORCID iD: 0000-0002-7920-0552
SPIN-код: 3367-2493
д-р мед. наук, профессор
Россия, 127299, Москва, ул. Приорова, 10Ольга Борисовна Шугаева
Национальный медицинский исследовательский центр травматологии и ортопедии им. Н.Н. Приорова
Email: Olga.schugaeva2013@yandex.ru
ORCID iD: 0000-0002-0778-5109
Россия, 127299, Москва, ул. Приорова, 10
Дмитрий Викторович Машошин
Национальный медицинский исследовательский центр травматологии и ортопедии им. Н.Н. Приорова
Email: dima_mash@mail.ru
ORCID iD: 0009-0003-5442-5055
SPIN-код: 5981-4084
Россия, 127299, Москва, ул. Приорова, 10
Михаил Геннадьевич Кочан
Национальный медицинский исследовательский центр травматологии и ортопедии им. Н.Н. Приорова
Email: mk_system@mail.ru
ORCID iD: 0009-0002-0699-1370
Россия, 127299, Москва, ул. Приорова, 10
Список литературы
- Hort M., Chen Z., Zhang J.M., Harman M., Sarro F. Bias Mitigation for Machine Learning Classifiers: A Comprehensive Survey // ACM Journal on Responsible Computing. 2024. Vol. 1, № 2. Р. 1–52. doi: 10.1145/3631326
- Kamiran F., Toon C. Data preprocessing techniques for classification without discrimination // Knowledge and Information Systems. 2012. Vol. 33, № 1. Р. 1–33. doi: 10.1007/s10115-011-0463-8
- Li T., Chen K.-S., Jin M. Analysis and simulation on imaging performance of backward and forward bistatic synthetic aperture radar // Remote Sensing. 2018. Vol. 10, № 11. P. 1676. doi: 10.3390/rs10111676
- Rius A., Cardellach E., Fabra F., et al. Feasibility of GNSS-R ice sheet altimetry in greenland using TDS-1 // Remote Sensing. 2017. Vol. 9, № 7. P. 742. doi: 10.3390/rs9070742
- Yan J., Liu X., Wang X. Object detection in videos with tubelet proposal networks. В кн.: Proceedings of the IEEE conference on computer vision and pattern recognition. 2017. Р. 727–735. doi: 10.1109/cvpr.2017.101
- Kendall A., Gal Y., Cipolla R. Multi-task learning using uncertainty to weigh losses for scene geometry and semantics. В кн.: Proceedings of the IEEE conference on computer vision and pattern recognition. 2018. Р. 7482–7491. doi: 10.1109/cvpr.2018.00781
- Chen W., Daneau S., Mannan F., Heide F. Steady-state nonline- of-sight imaging. В кн.: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2019. Р. 6790–6799. doi: 10.1109/cvpr.2019.00695
- Kaneyasu H., Etter S.B., Sakai T., Sigrist M. Evolution of the filamentary 3-Kelvin phase in Pb-Ru-Sr2RuO4 Josephson junctions // Physical Review B. 2015. Vol. 92, № 13. P. 134515. doi: 10.1103/physrevb.92.134515
- Ren S., He K., Girshick R., Sun J. Faster R-CNN: Towards real-time object detection with region proposal networks // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2015. Vol. 28. doi: 10.1109/tpami.2016.2577031
- Liu W., Anguelov D., Erhan D., et al. SSD: Single shot multibox detector. В кн.: Computer Vision–ECCV. Part I. Springer, 2016. Р. 21–37. doi: 10.1007/978-3-319-46448-0_2
- Redmon J., Farhadi A. YOLOv3: An incremental improvement. В кн.: IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2017. doi: 10.1109/cvpr.2017.690
- Zhang S., Zhu X., Lei Z., et al. S3FD: Single shot scale-invariant face detector. В кн.: IEEE international conference on computer vision. 2017. Р. 192–201. doi: 10.1109/iccv.2017.30
- Kumar A., Mital U., Gajera A., Varanasi S., Patra D. Empirical Study of the Impact of Image Quality, Object size, and Occlusion to Object Detection [Internet]. EasyChair Preprint 9786. 2023. Режим доступа: https://easychair.org/publications/preprint/Wf1V
- Buyukkinaci M. Fruit images for object detection [Internet]. Режим доступа: https://www.kaggle.com/datasets/mbkinaci/fruit-images-for-objectdetection
- Hao Y., Pei H., Lyu Y., et al. Understanding the Impact of Image Quality and Distance of Objects to Object Detection Performance // NYU Multimedia and Visual Computing Lab. 2022. doi: 10.48550/arXiv.2209.08237
- Seker E., Talburt J.R., Greer M.L. Preprocessing to Address Bias in Healthcare Data // Studies in Health Technology and Informatics. 2022. Vol. 294. Р. 327–331. doi: 10.3233/shti220468
- Celis L.E., Keswani V., Vishnoi N. Data preprocessing to mitigate bias: A maximum entropy-based approach. В кн.: International Conference on Machine Learning, PMLR. 2020. Р. 1349–1359. doi: 10.1201/9781003055129-6
Дополнительные файлы
