Интерпретируемая модель машинного обучения для прогнозирования урожайности яровой пшеницы

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Доступ платный или только для подписчиков

Аннотация

Исследования проводили с целью создания интерпретируемой модели машинного обучения (объяснимый искусственный интеллект) для прогнозирования урожайности яровой пшеницы. Использовали данные длительного полевого опыта (2001–2024 гг.), проведенного в лесостепи Алтайского Приобья. Схема эксперимента предусматривала изучение роли предшественников, приемов основной обработки выщелоченного чернозема, а также уровней применения минеральных удобрений и химических средств защиты растений в формировании урожайности яровой мягкой пшеницы. Для создания модели использовали экстремальный градиентный бустинг (XGBoost), а для ее интерпретации – аддитивные объяснения Шепли (SHAP), что позволило оценить вклад каждого признака. Построенная модель XGBoost продемонстрировала высокую точность прогнозирования (R² = 0,95, MAE = 0,13 т/га, RMSE = 0,17 т/га), а интеграция с SHAP-анализом выявила наиболее значимые признаки (5…6 из 18), определяющие урожайность в лесостепи Алтайского Приобья. Наибольший в эксперименте вклад в высокую прогнозную урожайность вносили достаточное увлажнение за сельскохозяйственный год (596,5 мм; 1,19 т/га), использование пара в качестве предшественника (0,58 т/га) и применение азотно-фосфорных удобрений (0,21 т/га). Низкая прогнозная урожайность обусловлена недостатком увлажнения в течение сельскохозяйственного года (317 мм; –0,77 т/га) и с мая по октябрь (246 мм; –0,24 т/га), а также высокими значениями суммы положительных температур (2527,5 °C; –0,13 т/га), низким количеством осадков в период вегетации пшеницы (175 мм; –0,10 т/га) и отсутствием применения средств защиты растений (–0,10 т/га). Разработанная модель расширяет возможности машинного обучения, позволяя получать более надежные и информативные результаты.

Полный текст

Доступ закрыт

Об авторах

В. К. Каличкин

Сибирский федеральный научный центр агробиотехнологий Российской академии наук

Автор, ответственный за переписку.
Email: vk.kalichkin@gmail.com

доктор сельскохозяйственных наук

Россия, 630501, Новосибирская область, Новосибирский р-он, пос. Краснообск

В. И. Усенко

Федеральный Алтайский научный центр агробиотехнологий

Email: usenko.001@mail.ru

доктор сельскохозяйственных наук

Россия, 656910, Алтайский край, Барнаул, пос. Научный городок, 35

А. А. Гаркуша

Федеральный Алтайский научный центр агробиотехнологий

Email: usenko.001@mail.ru

кандидат сельскохозяйственных наук

Россия, 656910, Алтайский край, Барнаул, пос. Научный городок, 35

Д. С. Федоров

Сибирский федеральный научный центр агробиотехнологий Российской академии наук

Email: vk.kalichkin@gmail.com
Россия, 630501, Новосибирская область, Новосибирский р-он, пос. Краснообск

К. Ю. Максимович

Сибирский федеральный научный центр агробиотехнологий Российской академии наук

Email: vk.kalichkin@gmail.com

кандидат биологических наук

Россия, 630501, Новосибирская область, Новосибирский р-он, пос. Краснообск

Список литературы

  1. Влияние длительного применения органических и минеральных удобрений на урожайность и качество яровой пшеницы / И. В. Понкратенкова, А. Ю. Гаврилова, Г. Е. Мерзлая и др. // Аграрный вестник Урала. 2019. № 7(186). С. 39–44.
  2. Эффективность использования азота в длительных и краткосрочных опытах агрохимслужбы и Геосети Российской Федерации / В. А. Романенков, М. В. Беличенко, О. В. Рухович и др. // Агрохимия. 2020. № 12. С. 28–37. doi: 10.31857/S0002188120120091.
  3. Зерновая продуктивность свекловичных севооборотов в зависимости от степени биологизации в условиях Центрального Черноземья / А. С. Акименко, В. И. Свиридов, Т. А. Дудкина и др. // Земледелие. 2022. № 3. С. 12–18.
  4. Сычев В. Г., Беличенко М. В., Романенков В. А. Результаты мониторинга урожайности сельскохозяйственных культур, продуктивности севооборотов и изменения свойств почв в длительных опытах Географической сети // Плодородие. 2017. № 6(99). С. 2–5.
  5. Рублюк М. В., Иванов Д. А. Изменение свойств дерново-подзолистой почвы в зависимости от условий осушаемого агроландшафта при возделывании овса в фитоценозе с травами // Земледелие. 2023. № 3. С. 8–12.
  6. Подлесных И. В., Тарасов С. А., Рубаник Ю. О. Динамика органического углерода почвы в пахотном слое и продуктивность культур почвозащитного агропесопандшафтного комплекса в ЦЧР // Земледелие. 2023. № 5. С. 37–41.
  7. Bali N., Singla A. Emerging Trends in Machine Learning to Predict Crop Yield and Study Its Influential Factors: A Survey // Archives of Computational Methods in Engineering. 2022. Vol. 29. Р. 95–112. doi: 10.1007/s11831-021-09569-8.
  8. Иванов Д. А., Рублюк М. В., Анциферова О. Н. Прогнозирование размещения посевов льна на основе данных мониторинга и ГИС-технологий // Земледелие. 2023. № 7. С. 3–6.
  9. Страшная А. И., Береза О. В., Кланг П. С. Прогнозирование урожайности зерновых культур на основе комплексирования наземных и спутниковых данных в субъектах Южного федерального округа // Гидрометеорологические исследования и прогнозы. 2021. № 2. С. 111–137. doi: 10.37162/2618-9631-2021-2-111-137.
  10. Математические модели и программный комплекс по прогнозированию урожайности сельскохозяйственных культур / Д. А. Благов, С. В. Митрофанов, В. С. Никитин и др. // Агротехника и энергообеспечение. 2019. № 3(24). С. 182–188.
  11. Прогнозирование урожайности яровой пшеницы по агрохимическим свойствам в условиях Тетюшского района Республики Татарстан / А. А. Лукманов, Ю. П. Переведенцев, А. Б. Мустафина и др. // Вестник Казанского государственного аграрного университета. 2023. Т. 18. № 3(71). С. 39–45.
  12. Panigrahi B., Kathala K. C. R., Sujatha M. A machine learning-based comparative approach to predict the crop yield using supervised learning with regression models // Procedia Computer Science. 2023. Vol. 218. P. 2684–2693. doi: 10.1016/j.procs.2023.01.241.
  13. Boppudi S. Deep ensemble model with hybrid intelligence technique for crop yield prediction // Multimedia Tools and Applications. 2024. Vol. 83. No. 31. Р. 75709–75729. doi: 10.1007/s11042-024-18354-1.
  14. Applied Deep Learning-Based Crop Yield Prediction: A Systematic Analysis of Current Developments and Potential Challenges / K. Meghraoui, I. Sebari, J. Pilz, et al. // Technologies. 2024. Vol. 12. No. 4. P. 43. URL: https://www.mdpi.com/2227-7080/12/4/43 (дата обращения: 03.03.2025). doi: 10.3390/technologies12040043.
  15. Shingade S. D., Mudhalwadkar R. P. Analysis of crop prediction models using data analytics and ML techniques: a review // Multimedia Tools and Applications. 2024. Vol. 83. No. 13. P. 37813–37838. doi: 10.1007/s11042-023-17038-6.
  16. Ramesh V., Kumaresan P. Stacked Ensemble Model for Accurate Crop Yield Prediction Using Machine Learning Techniques // Environmental Research Communications. 2025. Vol. 7. No. 3. URL: https://iopscience.iop.org/article/10.1088/2515-7620/adb9c0/pdf. (дата обращения: 03.03.2025). doi: 10.1088/2515-7620/adb9c0.
  17. Ryo M. Explainable artificial intelligence and interpretable machine learning for agricultural data analysis // Artificial Intelligence in Agriculture. 2022. Vol. 6. Р. 257–265. doi: 10.1016/j.aiia.2022.11.003.
  18. Cartolano A., Cuzzocrea A., Pilato G. Analyzing and assessing explainable AI models for smart agriculture environments // Multimedia Tools and Applications. 2024. Vol. 83. Р. 37225–37246. doi: 10.1007/s11042-023-17978-z.
  19. Bifarin O. O. Interpretable machine learning with tree-based shapley additive explanations: Application to metabolomics datasets for binary classification // Plos one. 2023. Vol. 18. No. 5. Р. e0284315. URL: https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0284315 (дата обращения: 03.03.2025). doi: 10.1371/journal.pone.0284315.
  20. Interpretable Machine Learning Techniques for an Advanced Crop Recommendation Model / M. Bouni, B. Hssina, K. Douzi, et al. // Journal of Electrical and Computer Engineering. 2024. Vol. 2024. No. 1. Р. 7405217. URL: https://onlinelibrary.wiley.com/doi/full/10.1155/2024/7405217 (дата обращения: 03.03.2025). doi: 10.1155/2024/7405217.
  21. Степанова А. И., Хальясмаа А. И., Матренин П. В. Краткосрочное прогнозирование нагрузки предприятия нефтегазовой промышленности с использованием технологических факторов и аддитивного объяснения Шепли // Известия высших учебных заведений. Проблемы энергетики. 2024. Т. 26. № 4. С. 75–88. doi: 10.30724/1998-9903-2024-26-4-75-88.
  22. Горшенин А. Ю., Грицай А. С., Денисова Л. А. Применение машинного обучения деревьев решений для краткосрочного прогнозирования электропотребления // Известия Тульского государственного университета. Технические науки. 2023. № 11. С. 226–231. doi: 10.24412/2071-6168-2023-11-226-227.
  23. Бадыкова И. Р., Биктимирова К. Р. Выявление факторов воздействия на сектор связи и телекоммуникаций с применением ансамблевых методов машинного обучения // π-Economy. 2024. Т. 17. № 6. С. 61–78. doi: 10.18721/JE.17604.
  24. Интерпретируемые модели машинного обучения как инструмент объяснения прогнозных оценок в кардиологии / К. И. Шахгельдян, В. Ю. Рублев, Н. С. Куксин и др. // Вестник современной клинической медицины. 2025. Т. 18. № 1. С. 98–106. doi: 10.20969/VSKM.2025.18(1).98-106.
  25. Friedman J. H. Greedy function approximation: a gradient boosting machine // Annals of statistics. 2001. Vol. 29. No. 5. P. 1189–1232. URL: https://www.jstor.org/stable/2699986 (дата обращения: 03.03.2025).
  26. From Local Explanations to Global Understanding With Explainable AI for Trees / S. M. Lundberg, G. Erion, H. Chen, et al. // Nature Machine Intelligence. 2020. Vol. 2. No. 1. Р. 56–67. doi: 10.1038/s42256-019-0138-9.
  27. Программа анализа и прогнозирования урожайности сельскохозяйственных культур (CYAF – Crop Yield Analysis & Forecast) / Д. С. Федоров, О. К. Альсова, В. К. Каличкин и др. // Свидетельство о государственной регистрации программы для ЭВМ № 2021777894, 08.11.2021.
  28. Разработка программы анализа и прогнозирования урожайности сельскохозяйственных культур / В. К. Каличкин, Д. С. Федоров, О. К. Альсова и др. // Достижения науки и техники АПК. 2022. Т. 36. № 1. С. 51–56. doi: 10.53859/02352451_2022_36_1_51.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Диаграммы размахов данных по урожайности яровой пшеницы.

Скачать (90KB)
3. Рис. 2. Сравнение фактических и предсказанных значений урожайности яровой пшеницы.

Скачать (105KB)
4. Рис. 3. Вклад различных признаков в прогнозирование урожайности пшеницы.

Скачать (142KB)
5. Рис. 4. Каскадная диаграмма значений SHAP для прогнозной модели высокой урожайности пшеницы.

Скачать (86KB)
6. Рис. 5. Каскадная диаграмма значений SHAP для прогнозной модели низкой урожайности пшеницы.

Скачать (82KB)

© Российская академия наук, 2025