О задаче применимости синтетических данных при тестировании интеллектуальных транспортных систем
- Авторы: Городничев М.Г.1
-
Учреждения:
- Московский технический университет связи и информатики
- Выпуск: Том 12, № 1 (2025)
- Страницы: 105-115
- Раздел: ИНФОРМАТИКА И ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ
- URL: https://journals.eco-vector.com/2313-223X/article/view/679151
- DOI: https://doi.org/10.33693/2313-223X-2025-12-1-105-115
- EDN: https://elibrary.ru/MLHIWR
- ID: 679151
Цитировать
Полный текст



Аннотация
В настоящее время для обеспечения оптимальности и безопасности дорожного движения внедряют интеллектуальные транспортные системы (ИТС). Все чаще в данных системах для получения характеристик о транспортных потоках применяют искусственный интеллект. Количество сенсоров и датчиков сильно возрастает, что приводит к повышению нагрузок на ИТС. В связи с этим необходимо разрабатывать распределенные системы мониторинга с учетом масштабирования и отказоустойчивости. Однако перед внедрением в эксплуатацию необходимо проводить обширное тестирование. В полной мере провести такое тестирования на реальных данных невозможно ввиду различных факторов. В связи с этим в данной работе предлагается инструмент генерации синтетических данных о транспортных потоках с учетом особенностей предметной области. Система генерации разработана с учетом интеграции в различные системы, что позволит различным производителям ИТС ее использовать. Данный сервис удовлетворяет требованиям масштабирования, и приближены к реальным данным. В исследовании предлагается масштабируемая архитектура интеллектуальной транспортной подсистемы, отвечающей требованиям масштабирования и отказоустойчивости. В рамках данной работы собран стенд и проведено тестирование предлагаемой архитектуры посредством разработанного сервиса генерации синтетических данных о состоянии транспортного потока.
Полный текст

Об авторах
Михаил Геннадьевич Городничев
Московский технический университет связи и информатики
Автор, ответственный за переписку.
Email: m.g.gorodnichev@mtuci.ru
ORCID iD: 0000-0003-1739-9831
Scopus Author ID: 55836031600
ResearcherId: D-3256-2019
кандидат технических наук, доцент, декан факультета «Информационные технологии»
Россия, МоскваСписок литературы
- Rabchevsky A.N. Review of methods and systems for generating synthetic training data. Applied Mathematics and Control Sciences. 2023. No. 4. Pp. 6–45. (In Rus.). doi: 10.15593/2499-9873/2023.4.01.
- Lundin E., Kvarnström H., Jonsson E.A. Synthetic fraud data generation methodology. In: Information and Communications Security. Deng Robertand Bao, Fengand Zhou Jianyingand, Qing Sihan (eds.). Berlin; Heidelberg: Springer Berlin Heidelberg, 2002. Рp. 265–277. doi: 10.1007/3-540-36159-6_23.
- McKenna R., Miklau G., Sheldon D. Winning the NIST Contest: A scalable and general approach to differentially private synthetic data. CoRR. 2021. Art. abs/2108.04978.
- Awan J., Cai Z. One step to efficient synthetic data. arXiv. 2020. Art. bs/2006.02397. doi: 10.48550/ARXIV.2006.02397.
- Mukherjee M., Khushi M. SMOTE-ENC: A novel SMOTE-based method to generate synthetic data for nominal and continuous features. Applied System Innovation. 2021. Vol. 4. Issue 1. Art. 18. doi: 10.3390/asi4010018.
- Bernstein D. Containers and cloud: From LXC to docker to Kubernetes. IEEE Cloud Computing. 2014. No. 3. Pp. 81– 84.
- Barletta M., Cinque M., Simone L.D., Corte R.D. Introducing k4.0s: A model for mixed-criticality container orchestration in Industry 4.0. In: IEEE Intl. Conf. on Dependable, Autonomic and Secure Computing, 2022.
- Polyantseva K., Gorodnichev M., Moseva M. Ensuring the reliability of a highly loaded vehicle monitoring and traffic control platform. In: Systems of signals generating and processing in the field of on board communications. Moscow, 2023. Pp. 1–8. doi: 10.1109/IEEECONF56737.2023.10092031
- Slamnik-Krijestorac N., Yilma G.M., Zarrar Y.F. et al. Multi-domain mech orchestration platform for enhanced back situation awareness. In: IEEE Conference on Computer Communications Workshops, 2021.
- Mason K., Vejdan S., Grijalva S. An “On the Fly” framework for efficiently generating synthetic big data sets. CoRR. 2019. Art. abs/1903.06798.
- Gesmundo A., Tomeh N. HadoopPerceptron: A toolkit for distributed perceptron training and prediction with MapReduce. In: Conference of the European Chapter of the Association for Computational Linguistics. 2012.
Дополнительные файлы
