Влияние архитектуры CNN, размера и качества изображений на модель, созданную для обнаружения объектов на гистологических препаратах

Обложка


Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Доступ платный или только для подписчиков

Аннотация

Проблема повышения качества свёрточной нейронной сети (англ. convolutional neural network, CNN) в случае поиска объектов на гистологических сканах возникла достаточно давно и сводится прежде всего к выбору оптимальной архитектуры CNN и подготовке датасета надлежащего качества. На работу алгоритмов обнаружения объектов влияют многие факторы, включая качество изображения, размер изображения и самого объекта поиска. Основной целью проведённой работы являлся поиск существующих исследований, демонстрирующих влияние различных характеристик изображений в обучающей выборке и выбора архитектуры CNN на качество создаваемой модели. В качестве исходных материалов для работы была проанализирована литература за последние 5 лет, посвящённая вопросам предварительной обработки данных, методологиям, требованиям к изображениям, включаемым в датасеты, подготовке изображений для создания моделей CNN и вопросам выбора архитектуры. На момент проведения исследования не сформулировано требований к размерам изображений и отсутствуют данные о соотношении размеров объектов и размеров изображения для оптимизации работы модели. Кроме того, задача выбора архитектуры нейронной сети не является прозрачной и алгоритмизированной. В большинстве случаев исследователи рекомендуют те архитектуры, которые сами разрабатывали или использовали, не объясняя ни причины, ни критерии выбора, не сравнивая с альтернативными вариантами. Всё это существенно затрудняет процесс разработки модели CNN для обработки медицинских изображений. В данном обзорном исследовании приводится краткий обзор исследований, посвящённых подготовке изображений для датасета и возможного подхода к выбору архитектуры CNN.

Полный текст

Доступ закрыт

Об авторах

Нина Вениаминовна Федосова

Национальный медицинский исследовательский центр травматологии и ортопедии им. Н.Н. Приорова

Email: hard_sign@mail.ru
ORCID iD: 0000-0002-0829-9188
SPIN-код: 5380-3194

MS

Россия, 127299, Москва, ул. Приорова, 10

Геннадий Николаевич Берченко

Национальный медицинский исследовательский центр травматологии и ортопедии им. Н.Н. Приорова

Автор, ответственный за переписку.
Email: berchenko@cito-bone.ru
ORCID iD: 0000-0002-7920-0552
SPIN-код: 3367-2493

д-р мед. наук, профессор

Россия, 127299, Москва, ул. Приорова, 10

Ольга Борисовна Шугаева

Национальный медицинский исследовательский центр травматологии и ортопедии им. Н.Н. Приорова

Email: Olga.schugaeva2013@yandex.ru
ORCID iD: 0000-0002-0778-5109
Россия, 127299, Москва, ул. Приорова, 10

Дмитрий Викторович Машошин

Национальный медицинский исследовательский центр травматологии и ортопедии им. Н.Н. Приорова

Email: dima_mash@mail.ru
ORCID iD: 0009-0003-5442-5055
SPIN-код: 5981-4084
Россия, 127299, Москва, ул. Приорова, 10

Михаил Геннадьевич Кочан

Национальный медицинский исследовательский центр травматологии и ортопедии им. Н.Н. Приорова

Email: mk_system@mail.ru
ORCID iD: 0009-0002-0699-1370
Россия, 127299, Москва, ул. Приорова, 10

Список литературы

  1. Hort M., Chen Z., Zhang J.M., Harman M., Sarro F. Bias Mitigation for Machine Learning Classifiers: A Comprehensive Survey // ACM Journal on Responsible Computing. 2024. Vol. 1, № 2. Р. 1–52. doi: 10.1145/3631326
  2. Kamiran F., Toon C. Data preprocessing techniques for classification without discrimination // Knowledge and Information Systems. 2012. Vol. 33, № 1. Р. 1–33. doi: 10.1007/s10115-011-0463-8
  3. Li T., Chen K.-S., Jin M. Analysis and simulation on imaging performance of backward and forward bistatic synthetic aperture radar // Remote Sensing. 2018. Vol. 10, № 11. P. 1676. doi: 10.3390/rs10111676
  4. Rius A., Cardellach E., Fabra F., et al. Feasibility of GNSS-R ice sheet altimetry in greenland using TDS-1 // Remote Sensing. 2017. Vol. 9, № 7. P. 742. doi: 10.3390/rs9070742
  5. Yan J., Liu X., Wang X. Object detection in videos with tubelet proposal networks. В кн.: Proceedings of the IEEE conference on computer vision and pattern recognition. 2017. Р. 727–735. doi: 10.1109/cvpr.2017.101
  6. Kendall A., Gal Y., Cipolla R. Multi-task learning using uncertainty to weigh losses for scene geometry and semantics. В кн.: Proceedings of the IEEE conference on computer vision and pattern recognition. 2018. Р. 7482–7491. doi: 10.1109/cvpr.2018.00781
  7. Chen W., Daneau S., Mannan F., Heide F. Steady-state nonline- of-sight imaging. В кн.: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2019. Р. 6790–6799. doi: 10.1109/cvpr.2019.00695
  8. Kaneyasu H., Etter S.B., Sakai T., Sigrist M. Evolution of the filamentary 3-Kelvin phase in Pb-Ru-Sr2RuO4 Josephson junctions // Physical Review B. 2015. Vol. 92, № 13. P. 134515. doi: 10.1103/physrevb.92.134515
  9. Ren S., He K., Girshick R., Sun J. Faster R-CNN: Towards real-time object detection with region proposal networks // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2015. Vol. 28. doi: 10.1109/tpami.2016.2577031
  10. Liu W., Anguelov D., Erhan D., et al. SSD: Single shot multibox detector. В кн.: Computer Vision–ECCV. Part I. Springer, 2016. Р. 21–37. doi: 10.1007/978-3-319-46448-0_2
  11. Redmon J., Farhadi A. YOLOv3: An incremental improvement. В кн.: IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2017. doi: 10.1109/cvpr.2017.690
  12. Zhang S., Zhu X., Lei Z., et al. S3FD: Single shot scale-invariant face detector. В кн.: IEEE international conference on computer vision. 2017. Р. 192–201. doi: 10.1109/iccv.2017.30
  13. Kumar A., Mital U., Gajera A., Varanasi S., Patra D. Empirical Study of the Impact of Image Quality, Object size, and Occlusion to Object Detection [Internet]. EasyChair Preprint 9786. 2023. Режим доступа: https://easychair.org/publications/preprint/Wf1V
  14. Buyukkinaci M. Fruit images for object detection [Internet]. Режим доступа: https://www.kaggle.com/datasets/mbkinaci/fruit-images-for-objectdetection
  15. Hao Y., Pei H., Lyu Y., et al. Understanding the Impact of Image Quality and Distance of Objects to Object Detection Performance // NYU Multimedia and Visual Computing Lab. 2022. doi: 10.48550/arXiv.2209.08237
  16. Seker E., Talburt J.R., Greer M.L. Preprocessing to Address Bias in Healthcare Data // Studies in Health Technology and Informatics. 2022. Vol. 294. Р. 327–331. doi: 10.3233/shti220468
  17. Celis L.E., Keswani V., Vishnoi N. Data preprocessing to mitigate bias: A maximum entropy-based approach. В кн.: International Conference on Machine Learning, PMLR. 2020. Р. 1349–1359. doi: 10.1201/9781003055129-6

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Эко-Вектор, 2024

Ссылка на описание лицензии: https://eco-vector.com/for_authors.php#07

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ПИ № ФС 77-76249 от 19.07.2019.