Мониторинг отказоустойчивости в распределенных системах
- Авторы: Сухоплюев Д.И.1, Назаров А.Н.2
-
Учреждения:
- МИРЭА – Российский технологический университет
- Федеральный исследовательский центр «Информатика и управление» Российской академии наук
- Выпуск: Том 11, № 4 (2024)
- Страницы: 94-106
- Раздел: МАТЕМАТИЧЕСКОЕ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ, КОМПЛЕКСОВ И КОМПЬЮТЕРНЫХ СЕТЕЙ
- URL: https://journals.eco-vector.com/2313-223X/article/view/659213
- DOI: https://doi.org/10.33693/2313-223X-2024-11-4-94-106
- EDN: https://elibrary.ru/GHFEEC
- ID: 659213
Цитировать
Полный текст



Аннотация
Целью данной работы является разработка и верификация модели мониторинга отказоустойчивости и доступности распределенных систем, построенной на основе вероятностных характеристик компонентов и учета зависимых отказов. Современные распределенные системы требуют точных методов прогнозирования отказов, способных учитывать сложные зависимости между узлами и обеспечивать надежную работу при высоких нагрузках. Традиционные подходы, основанные на анализе эмпирических данных, часто оказываются недостаточными для предсказания состояния системы в условиях изменяющейся нагрузки, что ограничивает их применимость. В ходе исследования разработанная вероятностная модель прошла верификацию с использованием численного моделирования и оценки точности через расхождение Кульбака–Лейблера и среднеквадратичную ошибку (MSE), что подтвердило ее точность и практическую ценность. Экспериментально была доказана универсальность модели: она демонстрирует способность адаптироваться к различным типам распределенных систем, обеспечивая точное прогнозирование доступности и отказоустойчивости в реальном времени. Численные эксперименты показали, что предложенная модель может служить надежным инструментом для управления отказоустойчивостью и балансировкой нагрузки. Таким образом, разработанная модель является эффективным решением для повышения надежности распределенных систем и обладает высокой степенью универсальности, что делает ее ценной для широкого спектра применений.
Ключевые слова
Полный текст

Об авторах
Данил Игоревич Сухоплюев
МИРЭА – Российский технологический университет
Автор, ответственный за переписку.
Email: sukhoplyuev.d.i@edu.mirea.ru
SPIN-код: 3931-0217
аспирант
Россия, МоскваАлексей Николаевич Назаров
Федеральный исследовательский центр «Информатика и управление» Российской академии наук
Email: a.nazarov06@bk.ru
ORCID iD: 0000-0002-0497-0296
SPIN-код: 6032-5302
доктор технических наук, профессор
Россия, МоскваСписок литературы
- Ермагамбетов Р.Т., Киселев Е.С. Современные системы хранения и обработки больших данных: Hadoop и Apache Spark // Форум молодых ученых. 2018. № 8 (24). С. 229–239. EDN: VLYZSA.
- Дзидзава Э.Т., Ахмедов К.М. Большие данные и HADOOP: обзорный доклад // Вестник магистратуры. 2021. № 1-1 (112). С. 30–32. EDN: SCTUXC.
- Некратюк А.А., Сафарьян О.А. Использование метода MAPREDUCE в BIG DATA // Молодой исследователь Дона. 2020. № 3 (24). С. 174–179. EDN: WJCAAM.
- Татарникова Т.М., Архипцев Е.Д., Кармановский Н.С. Определение размера кластера и числа реплик высоконагруженных информационных систем // Известия высших учебных заведений. Приборостроение. 2023. Т. 66. № 8. С. 646–651. doi: 10.17586/0021-3454-2023-66-8-646-651. EDN: GHKBJE.
- Copik M., Calotoiu A., Pengyu Zhou et al. FaaSKeeper: Learning from building serverless services with zookeeper as an example // HPDC’24: Proceedings of the 33rd International Symposium on High-Performance Parallel and Distributed Computing. NY.: Association for Computing Machinery, 2024. Pp. 94–108. doi: 10.1145/3625549.3658661.
- Григорян Т.Г. Отказоустойчивые системы и методы их достижения Fault-tolerant systems // Научный аспект. 2024. Т. 26. № 7. С. 3264–3268. EDN: EBZTNN.
- Лубков Н.В., Степанянц А.С., Викторова В.С. Надежностные модели и анализ систем с защитой // Автоматика и телемеханика. 2018. № 7. С. 117–137. doi: 10.31857/S000523100000271-2. EDN: YALAPB.
- Фокин А.Б. Метод расчета вероятностей связности (коэффициентов готовности) телекоммуникационной сети, поддерживающей механизмы обеспечения отказоустойчивости // Информационные системы и технологии. 2023. № 4 (138). С. 83–91. EDN: CWQJBV.
- Aglianò P., Ugolini S. Structural and universal completeness in algebra and logic. doi: 10.48550/arXiv.2309.14151. URL: https://arxiv.org/abs/2309.14151
- Лемешко Б.Ю., Лемешко С.Б. Проблемы применения непараметрических критериев согласия в задачах обработки результатов измерений // Системы анализа и обработки данных. 2021. № 2 (82). С. 47–66. doi: 10.17212/2782-2001-2021-2-47-66. EDN: WJARCI.
- Хацкевич В.Л. О некоторых экстремальных свойствах средних значений и математических ожиданий случайных величин // Вестник Воронежского государственного технического университета. 2013. Т. 9. № 3-1. С. 39–44. EDN: QCQYVZ.
- Гафарова Л.М., Завьялова И.Г., Мустафин Н.Н. Об особенностях применения критерия согласия Пирсона χ2 // Экономические и социально-гуманитарные исследования. 2015. № 4 (8). С. 63–67. EDN: VEIMQN.
- Головкина А.Г., Козынченко В.А., Клименко И.С. Метод последовательных приближений для построения модели динамической полиномиальной регрессии // Вестник Санкт-Петербургского университета. Прикладная математика. Информатика. Процессы управления. 2022. Т. 18. № 4. С. 487–500. doi: 10.21638/11701/spbu10.2022.404. EDN: QXVJIL.
- Sukhoplyuev D.I., Nazarov A.N. Analysis of application-level load balancing algorithms // Systems of signals generating and processing in the field of on-board communications. Moscow, 2023. Pp. 1–4. doi: 10.1109/IEEECONF56737.2023.10092019.
- Альфара A.Ю.А., Королев Д.В., Зайцев К.С., Дунаев М.Е. Разработка системы мониторинга для серверного приложения // International Journal of Open Information Technologies. 2023. Т. 11. № 8. С. 24–31. EDN: OCTBSB.
Дополнительные файлы
