Программное обеспечение для обработки спектральных данных методами хемометрики и машинного обучения

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Доступ платный или только для подписчиков

Аннотация

В статье описан программный пакет, поддерживающий основные методы хемометрики и машинного обучения, используемые для обработки спектральных данных. Он может использоваться как в составе программного обеспечения аналитических спектральных приборов, так и автономно. Пакет содержит как распространенные методы (линейный и квадратичный дискриминантный анализ, регрессия на главные компоненты, метод частичных наименьших квадратов), так и менее известные, но доказавшие свою эффективность при обработке спектров, в том числе метод случайного леса и экстремальный градиентный бустинг. Приводятся данные об апробации программного обеспечения на примере его использования для решения задач классификации частиц черного углерода по исходным объектам горения.

Полный текст

Доступ закрыт

Об авторах

Арам Ваганович Саакян

ФГАОУ ВО «Московский физико-технический институт (национальный исследовательский университет)»

Автор, ответственный за переписку.
Email: saakian.av@phystech.edu
ORCID iD: 0000-0002-4012-4935

аспирант

Россия, Долгопрудный

Александр Давидович Левин

ФГБУ «Всероссийский научно-исследовательский институт оптико-физических измерений»

Email: levin-ad@vniiofi.ru
ORCID iD: 0000-0001-9087-952X

д. т. н., ведущий научный сотрудник

Россия, Москва

Список литературы

  1. Houhou R., Bocklitz T. Trends in artificial intelligence, machine learning and chemometrics applied to chemical data. Anal Sci Adv. 2021; 2: 128–141. https://doi.org/10.1002/ansa.202000162
  2. Joshi P. B. Navigating with chemometrics and machine learning in chemistry. Artif Intell Rev. 2023; 56: 9089–9114. https://doi.org/10.1007/s10462-023-10391-w
  3. PLS_Toolbox. Eigenvector Research, Inc. Available from: https://eigenvector.com/software/pls-toolbox/ [Accessed 4th November 2022]
  4. ChemProject. INRAE Available from: https://www.chemproject.org/ [Accessed 18th July 2023]
  5. Solo. Eigenvector Research, Inc. Available from: https://eigenvector.com/software/solo/ [Accessed 4th November 2022]
  6. Хемометрическое программное обеспечение BWIQ. ООО «Промэнерголаб» Доступно по адресу: https://www.czl.ru/catalog/spektr/bwtek/bwiq.html [Доступ 16 сентября 2020] Chemometric software BWIQ. LLC PromEnergoLab. Available from: https://www.czl.ru/catalog/spektr/bwtek/bwiq.html [Accessed 16th September 2020]
  7. Scikit-learn developers (BSD License). Available from: https://scikit-learn.org/stable/ [Accessed 6th February 2024]
  8. Xgboost developers. Revision 82d846bb. Available from: https://xgboost.readthedocs.io/en/stable/python/python_intro.html [Accessed 6th February 2024]
  9. NumPy team. All rights reserved. Available from: https://numpy.org/ [Accessed 16th September 2023]
  10. pandas via NumFOCUS, Inc. Hosted by OVHcloud. Available from: https://pandas.pydata.org/ [Accessed 8th December 2023]
  11. Python Software Foundation. Available from: https://docs.python.org/3/library/tkinter.html [Accessed 6th February 2024]
  12. Tom Schimansky. Available from: https://github.com/TomSchimansky/CustomTkinter [Accessed 18th January 2024]
  13. GitHub, Inc. Available from: https://github.com/Akascape/CTkMessagebox [Accessed 11th December 2023]
  14. GitHub, Inc. Available from: https://github.com/Akascape/CTkXYFrame [Accessed 11th December 2023]
  15. The SciPy community. Available from: https://docs.scipy.org/doc/scipy/reference/signal.html [Accessed 6th February 2024]
  16. Python Software Foundation. Available from: https://docs.python.org/3/library/sys.html [Accessed 6th February 2024]
  17. The Matplotlib development team. Available from: https://matplotlib.org/ [Accessed 15th September 2023]
  18. GitHub, Inc. Available from: https://github.com/StatguyUser/BaselineRemoval [Accessed 21th September 2023]
  19. Fredrik Lundh and contributors, Jeffrey A. Clark (Alex) and contributors. Logo by Alastair Houghton. Psychedelic art by Jeremy Kun. Available from: https://python-pillow.org/ [Accessed 6th February 2024]
  20. Python Software Foundation. Available from: https://docs.python.org/3/library/os.html [Accessed 6th February 2024]
  21. Python Software Foundation. Available from: https://docs.python.org/3/library/pickle.html [Accessed 6th February 2024]
  22. Clark Consulting & Research. Available from: https://www.python-excel.org/ [Accessed 6th February 2024]
  23. Neptune Labs. All rights reserved. Available from: https://neptune.ai/blog/xgboost-everything-you-need-to-know#:~: text=Gradient%20Boosting%20comes%20with%20an, its%20predictions%20easy%20to%20handle.&text=XGBoost%20performs%20very%20well%20on, with%20not%20too%20many%20features [Accessed 11th August 2023]
  24. Саакян А. В., Юшина А. А., Левин А. Д. Классификация бренди и коньячной продукции по географическому происхождению и сроку выдержки с использованием спектроскопии комбинационного рассеяния и машинного обучения. Измерительная техника. 2023; (3):33–38. https://doi.org/10.32446/0368-1025it.2023-3-33-38 Sahakyan A. V., Yushina A. A., Levin A. D. Classifcation of brandy products by geographical origin and ageing based on raman spectra and discriminant analysis methods. Izmeritel’naya Tekhnika = Measurement Techniques. 2023; (3):33–38. (In Russ.) https://doi.org/10.32446/0368-1025it.2023-3-33-38
  25. Саакян А. B., Аленичев М. К., Левин А. Д. Характеризация коньяков и виноградных бренди по спектрам флуоресценции, обработанным с помощью методов машинного обучения. Заводская лаборатория. Диагностика материалов. 2023; 89(10):25–33. https://doi.org/10.26896/1028-6861-2023-89-10-25-33 Sahakyan A. V., Alenichev M. K., Levin A. D. Characterization of cognacs and grape brandies by fluorescence spectra processed using machine learning methods. Zavodskaja Laboratorija. Diagnostika Materialov = Industrial laboratory. Diagnostics of materials. 2023; 89(10): 25–33. (In Russ.) https://doi.org/10.26896/1028-6861-2023-89-10-25-33

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Спектр без фильтрации

Скачать (224KB)
3. Рис. 2. Спектр с фильтрацией

Скачать (191KB)
4. Рис. 3. Спектры образцов в интервале 300–3 000 см−1

Скачать (326KB)
5. Рис. 4. Проекции КР-спектров в плоскости главных компонент

Скачать (139KB)

© Саакян А.В., Левин А.Д., 2024

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах