<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE root>
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:ali="http://www.niso.org/schemas/ali/1.0/" article-type="research-article" dtd-version="1.2" xml:lang="en"><front><journal-meta><journal-id journal-id-type="publisher-id">Informacionnye Tehnologii</journal-id><journal-title-group><journal-title xml:lang="en">Informacionnye Tehnologii</journal-title><trans-title-group xml:lang="ru"><trans-title>Информационные технологии</trans-title></trans-title-group></journal-title-group><issn publication-format="print">1684-6400</issn><publisher><publisher-name xml:lang="en">New Technologies Publishing House</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="publisher-id">702281</article-id><article-id pub-id-type="doi">10.17587/it.31.356-363</article-id><article-categories><subj-group subj-group-type="toc-heading" xml:lang="en"><subject>Modeling and optimization</subject></subj-group><subj-group subj-group-type="toc-heading" xml:lang="ru"><subject>Моделирование и оптимизация</subject></subj-group><subj-group subj-group-type="article-type"><subject>Research Article</subject></subj-group></article-categories><title-group><article-title xml:lang="en">Predictive models for a system collection streaming big data system from distributed electroinduction sensors</article-title><trans-title-group xml:lang="ru"><trans-title>Модели прогнозирования для системы сбора больших потоковых данных с распределенных электроиндукционных датчиков</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author"><name-alternatives><name xml:lang="en"><surname>Kolmogorova</surname><given-names>S. S.</given-names></name><name xml:lang="ru"><surname>Колмогорова</surname><given-names>С. С.</given-names></name></name-alternatives><address><country country="RU">Russian Federation</country></address><bio xml:lang="en"><p>Cand. of Tech. Sc., Associate Professor</p></bio><bio xml:lang="ru"><p>канд. техн. наук, доц.</p></bio><email>ss.kolmogorova@mail.ru</email><xref ref-type="aff" rid="aff1"/><xref ref-type="aff" rid="aff2"/></contrib><contrib contrib-type="author"><name><surname>Иванов</surname><given-names>С. А.</given-names></name><address><country country="RU">Russian Federation</country></address><bio xml:lang="en"><p>Cand. of Tech. Sc., Associate Professor</p></bio><bio xml:lang="ru"><p>канд. техн. наук, доц.</p></bio><email>kemsit@mail.ru</email><xref ref-type="aff" rid="aff2"/></contrib><contrib contrib-type="author"><name-alternatives><name xml:lang="en"><surname>Pavlov</surname><given-names>V. S.</given-names></name><name xml:lang="ru"><surname>Павлов</surname><given-names>В. С.</given-names></name></name-alternatives><address><country country="RU">Russian Federation</country></address><bio xml:lang="en"><p>Cand. of Agricult. Sc., Associate Professor</p></bio><bio xml:lang="ru"><p>канд. сельскохоз. наук, доц.</p></bio><email>pav-vadim@yandex.ru</email><xref ref-type="aff" rid="aff2"/></contrib></contrib-group><aff-alternatives id="aff1"><aff><institution xml:lang="en">Saint Petersburg Electrotechnical University "LETI"</institution></aff><aff><institution xml:lang="ru">Санкт-Петербургский государственный электротехнический университет "ЛЭТИ" им. В. И. Ульянова (Ленина)</institution></aff></aff-alternatives><aff-alternatives id="aff2"><aff><institution xml:lang="en">Saint Petersburg State Forest Technical University"</institution></aff><aff><institution xml:lang="ru">Санкт-Петербургский государственный лесотехнический университет им. С. М. Кирова</institution></aff></aff-alternatives><pub-date date-type="pub" iso-8601-date="2025-07-15" publication-format="electronic"><day>15</day><month>07</month><year>2025</year></pub-date><volume>31</volume><issue>7</issue><issue-title xml:lang="en"/><issue-title xml:lang="ru"/><fpage>356</fpage><lpage>363</lpage><history><date date-type="received" iso-8601-date="2026-02-06"><day>06</day><month>02</month><year>2026</year></date><date date-type="accepted" iso-8601-date="2026-02-06"><day>06</day><month>02</month><year>2026</year></date></history><permissions><copyright-statement xml:lang="en">Copyright ©; 2025, Informacionnye Tehnologii</copyright-statement><copyright-statement xml:lang="ru">Copyright ©; 2025, Информационные технологии</copyright-statement><copyright-year>2025</copyright-year><copyright-holder xml:lang="en">Informacionnye Tehnologii</copyright-holder><copyright-holder xml:lang="ru">Информационные технологии</copyright-holder></permissions><self-uri xlink:href="https://journals.eco-vector.com/1684-6400/article/view/702281">https://journals.eco-vector.com/1684-6400/article/view/702281</self-uri><abstract xml:lang="en"><p>The article discusses various approaches to predicting parameters, in particular the characteristics of the electromagnetic field based on data from a distributed environment. Several classification models were investigated on a simulated sensor data set, covering three different groups of categorization methods: Bayesian methods based on Bayes’ theorem (Naive Bayes and Multinomial Naive Bayes); decision tree methods, which are multi-option methods and the basic elements of the Decision Stump, Hoeffding Tree (Very Fast Decision Trees), Hoeffding Option Tree and Hoeffding Adaptive Tree algorithms; meta/ ensemble methods, which are the combination of a set of classification models that perform the same task, and solutions of individual models that are combined to determine the output. Experimental analysis has shown that the use of models can significantly improve forecasting efficiency. The methods proposed in the article are aimed at efficient classification. The article presented by the authors obtained results related to distributed machine learning. The first is the performance of classifiers with and without regularization in terms of the accuracy metric, the second is the relationship between the size of the dataset and this metric. In this work, in order to avoid overfitting and subsequent reduction in model accuracy, 1 regularization or Lasso regression is used. Regularization or Lasso regression is used. Thus, the results obtained are effectively implemented in a real-time system that measures streaming information about the parameters of the electromagnetic field.</p></abstract><trans-abstract xml:lang="ru"><p>Рассмотрены различные подходы к прогнозированию параметров, в частности характеристики электро­магнитного поля, на основе данных распределенной среды. На моделируемом наборе данных сенсорных элементов были исследованы несколько моделей классификации, охватывающих три различные группы методов: байесов­ские методы, основанные на теореме Байеса (Naive Bayes и Multinomial Naive Bayes); методы деревьев решений с основными элементами алгоритмов Decision Stump, Hoeffding Tree (Very Fast Decision Trees), Hoeffding Option Tree и Hoeffding Adaptive Tree; метаансамблевые методы, которые представляют собой наборы классификационных моделей. Экспериментальный анализ показал, что использование метаансамблевых методов позволяет суще­ственно повысить эффективность прогнозирования. Методы, исследуемые и анализируемые в данной статье, направлены на эффективную классификацию. В представленном авторами исследовании получены результаты, связанные с распределенным машинным обучением: оценка производительности классификаторов с регуляриза­цией и без нее в терминах метрики точности, а также связь размера набора данных с этой метрикой. Для того чтобы избежать чрезмерной подгонки и последующего снижения точности модели, используется регуляризация L1 или регрессия Лассо. Результатом стал эксперимент, показывающий эффективность использования методов прогнозирования в системе реального времени, измеряющей потоковую информацию о параметрах электромаг­нитного поля. Для проверки предложенного подхода были применены 12 алгоритмов классификации, охватыва­ющих три указанных метода категоризации. Каждый алгоритм оценивался для трех различных экземпляров обучающих наборов (50 000, 100 000 и 500 000), а также оценивалась степень точности каждого алгоритма.</p></trans-abstract><kwd-group xml:lang="en"><kwd>forecasting</kwd><kwd>categorization</kwd><kwd>electrometry</kwd><kwd>distributed data collection system</kwd><kwd>streaming big data</kwd><kwd>distributed system</kwd><kwd>classification models</kwd></kwd-group><kwd-group xml:lang="ru"><kwd>прогнозирование</kwd><kwd>категоризация</kwd><kwd>электрометрия</kwd><kwd>распределенная система сбора данных</kwd><kwd>потоковые большие данные</kwd><kwd>распределенная система</kwd><kwd>модели классификации</kwd></kwd-group><funding-group/></article-meta></front><body></body><back><ref-list><ref id="B1"><label>1.</label><citation-alternatives><mixed-citation xml:lang="en">Kolmogorova S. S., Kolmogorov А. S., Baranov D. S., Mokryak А. V. Electromagnetic Field Monitoring Platform for Ensuring Occupational and Industrial Facilities Safety, Occupational Safety in Industry, 2022, no. 2, doi: 10.24000/0409-2961-2022-2-58-63 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Колмогорова С. С., Колмогоров А. С., Баранов Д. С., Мокряк А. В. Платформа контроля электромагнитного поля для обеспечения безопасности труда и промышленных объектов // Безопасность труда в промышленности. 2022. № 2. С. 58—63. DOI: 10.24000/0409-2961-2022-2-58-63.</mixed-citation></citation-alternatives></ref><ref id="B2"><label>2.</label><citation-alternatives><mixed-citation xml:lang="en">Sterenczak K., Laurin G. V., Chirici G., Coomes D. A., Dalponte M., Latifi H., Puletti N. Global Airborne Laser Scanning Data Providers Database (GlobALS) — A New Tool for Monitoring Ecosystems and Biodiversity, Remote Sens., 2020, no. 12, p. 1877.</mixed-citation><mixed-citation xml:lang="ru">Sterenczak K., Laurin G. V., Chirici G., Coomes D. A., Dalponte M., Latifi H., Puletti N. Global Airborne Laser Scanning Data Providers Database (GlobALS) — A New Tool for Monitoring Ecosystems and Biodiversity // Remote Sens. 2020. N. 12. P. 1877.</mixed-citation></citation-alternatives></ref><ref id="B3"><label>3.</label><citation-alternatives><mixed-citation xml:lang="en">Kutuzov M. E., Kolmogorova S. S. Use of recurrent neural network and prediction in data processing from temperature sensors for the forest industry, Information technologies and automation of management: Proceedings of the XIII All-Russian Scientific and Practical Conference of students, graduate students, educators and industry, May 27-28, 2022, Omsk, Omsk State Technical University, 2022, pp. 154—164 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Кутузов М. Е., Колмогорова С. С. Использование рекуррентной нейронной сети и прогнозирование в обработке данных с температурных сенсоров для лесной отрасли // Информационные технологии и автоматизация управления: Матер. XIII Всеросс. науч.-практ. конф. студентов, аспирантов, работников образования и промышленности, Омск, 27—28 мая 2022 г. Омск: Изд. Омского государственного технического университета, 2022. С. 154—164.</mixed-citation></citation-alternatives></ref><ref id="B4"><label>4.</label><citation-alternatives><mixed-citation xml:lang="en">Certificate of state registration of computer program No. 2022666360 Russian Federation. Processing of measurement data by artificial intelligence algorithms: No. 2022665739: applied. 24.08.2022: published on 31.08.2022 / S. S. Kolmogorova, M. E. Kutuzov; applicant Federal State Budgetary Educational Institution of Higher Education "S. M. Kirov St. Petersburg State Forest Engineering University" (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Свидетельство о государственной регистрации программы для ЭВМ № 2022666360 Российская Федерация. Обработка измерительных данных алгоритмами искусственного интеллекта: № 2022665739: заявл. 24.08.2022: опубл. 31.08.2022 / С. С. Колмогорова, М. Е. Кутузов; заявитель Федеральное государственное бюджетное образовательное учреждение высшего образования "Санкт-Петербургский государственный лесотехнический университет имени С. М. Кирова".</mixed-citation></citation-alternatives></ref><ref id="B5"><label>5.</label><citation-alternatives><mixed-citation xml:lang="en">Certificate of state registration of computer program No. 2023663221 Russian Federation. Distributed system of stream data preparation: № 2023661886: applied. 06.06.2023: published on 20.06.2023 / S. S. Kolmogorova; applicant Federal State Budge¬tary Educational Institution of Higher Education "S. M. Kirov St. Petersburg State Forest Engineering University" (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Свидетельство о государственной регистрации программы для ЭВМ № 2023663221 Российская Федерация. Распределенная система подготовки потоковых данных: № 2023661886: заявл. 06.06.2023: опубл. 20.06.2023 / С. С. Колмогорова; заявитель Федеральное государственное бюджетное образовательное учреждение высшего образования "Санкт-Петербургский государственный лесотехнический университет имени С. М. Кирова".</mixed-citation></citation-alternatives></ref><ref id="B6"><label>6.</label><citation-alternatives><mixed-citation xml:lang="en">Yan M., Liu P., Zhao R., Liu L., Chen W., Yu X., Zhang J. Microclimate Monitoring System based on Wireless Sensor Network, J. Intell. Fuzzy Syst., 2018, vol. 35, pp. 1325—1337.</mixed-citation><mixed-citation xml:lang="ru">Yan M., Liu P., Zhao R., Liu L., Chen W., Yu X., Zhang J. Field Microclimate Monitoring System based on Wireless Sensor Network // J. Intell. Fuzzy Syst. 2018. Vol. 35. P. 1325—1337.</mixed-citation></citation-alternatives></ref><ref id="B7"><label>7.</label><citation-alternatives><mixed-citation xml:lang="en">Kolmogorova S. S., Golubyatnikova N. O. On the application of big data structure regularization for the distributed system of collecting and forecasting parameters of observational objects, Vestnik of Voronezh State Technical University, 2022, vol. 18, no. 5, pp. 91—99, doi: 10.36622/VSTU.2022.18.5.012 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Колмогорова С. С., Голубятникова Н. О. О применении регуляризации структуры больших данных для распределенной системы сбора и прогнозирования параметров объектов наблюдений // Вестник Воронежского государственного технического университета. 2022. Т. 18, № 5. С. 91—99. DOI: 10.36622/VSTU.2022.18.5.012.</mixed-citation></citation-alternatives></ref><ref id="B8"><label>8.</label><citation-alternatives><mixed-citation xml:lang="en">Zhang A., Yao F. Analysis of Effective E-Commerce Coordination Big Data Processing Strategies under Infinite Deep Neural Network Topology, Proceedings — 2021 Asia-Pacific Conference on Communications Technology and Computer Science, ACCTCS 2021, Shenyang, 2021, pp. 306—309.</mixed-citation><mixed-citation xml:lang="ru">Zhang A., Yao F. Analysis of Effective E-Commerce Coordination Big Data Processing Strategies under Infinite Deep Neural Network Topology // Proceedings — 2021 Asia-Pacific Conference on Communications Technology and Computer Science, ACCTCS 2021, Shenyang, 2021. P. 306—309.</mixed-citation></citation-alternatives></ref><ref id="B9"><label>9.</label><citation-alternatives><mixed-citation xml:lang="en">Kupriyanov M. S., Kholod I. I. Parallelization of the Naive Bayes algorithm for processing distributed data, Soft measurements and calculations, 2019, no. 8 (21)., pp. 25—32.</mixed-citation><mixed-citation xml:lang="ru">Куприянов М. С., Холод И. И. Распараллеливания алгоритма Naive Bayes для обработки распределенных данных // Мягкие измерения и вычисления. 2019. № 8 (21). С. 25—32.</mixed-citation></citation-alternatives></ref><ref id="B10"><label>10.</label><citation-alternatives><mixed-citation xml:lang="en">Sankaralingam S. K., Nagarajan N. S., Narmadha A. S. Energy aware decision stump linear programming boosting node classification based data aggregation in WSN, Computer Commu-nications, 2020, vol. 155, pp. 133—142.</mixed-citation><mixed-citation xml:lang="ru">Sankaralingam S. K., Nagarajan N. S., Narmadha A. S. Energy aware decision stump linear programming boosting node classification based data aggregation in WSN // Computer Communications. 2020. Vol. 155. P. 133—142.</mixed-citation></citation-alternatives></ref><ref id="B11"><label>11.</label><citation-alternatives><mixed-citation xml:lang="en">Elbasi E., Zreikat A. I. Heart Disease Classification for Early Diagnosis based on Adaptive Hoeffding Tree Algorithm in IoMT Data, International Arab Journal of Information Technology, 2022, vol. 20, no. 1.</mixed-citation><mixed-citation xml:lang="ru">Elbasi E., Zreikat A. I. Heart Disease Classification for Early Diagnosis based on Adaptive Hoeffding Tree Algorithm in IoMT Data // International Arab Journal of Information Techno¬logy. 2022. Vol. 20, N. 1.</mixed-citation></citation-alternatives></ref><ref id="B12"><label>12.</label><citation-alternatives><mixed-citation xml:lang="en">Van Rijn Ja. N., Holmes G., Pfahringer B., Vanschoren J. The online performance estimation framework: heterogeneous ensemble learning for data streams, Machine Learning, 2018, vol. 107, no. 1, pp. 149—176.</mixed-citation><mixed-citation xml:lang="ru">Van Rijn Ja. N., Holmes G., Pfahringer B., Vanschoren J. The online performance estimation framework: heterogeneous ensemble learning for data streams // Machine Learning. 2018. Vol. 107, N. 1. P. 149—176.</mixed-citation></citation-alternatives></ref><ref id="B13"><label>13.</label><citation-alternatives><mixed-citation xml:lang="en">Almeida R. De, Goh Ye. M., Monfared R. et al. An ensemble based on neural networks with random weights for online data stream regression, Soft Computing — A Fusion of Foundations, Methodologies and Applications, 2020, vol. 24, no. 13, pp. 9835—9855.</mixed-citation><mixed-citation xml:lang="ru">Almeida R. De, Goh Ye. M., Monfared R. et al. An ensemble based on neural networks with random weights for online data stream regression // Soft Computing — A Fusion of Foundations, Methodologies and Applications. 2020. Vol. 24, N. 13. P. 9835—9855.</mixed-citation></citation-alternatives></ref><ref id="B14"><label>14.</label><citation-alternatives><mixed-citation xml:lang="en">Sun Y., Pfahringer B., Gomes H. M., Bifet A. SOKNL: A novel way of integrating K-nearest neighbours with adaptive random forest regression for data streams, Data Mining and Knowledge Discovery, 2022, vol. 36, no. 5, pp. 2006—2032.</mixed-citation><mixed-citation xml:lang="ru">Sun Y., Pfahringer B., Gomes H. M., Bifet A. SOKNL: A novel way of integrating K-nearest neighbours with adaptive random forest regression for data streams // Data Mining and Knowledge Discovery. 2022. Vol. 36, N. 5. P. 2006—2032.</mixed-citation></citation-alternatives></ref><ref id="B15"><label>15.</label><citation-alternatives><mixed-citation xml:lang="en">Minkin M. A., Morozov K. Yu. Algorithm for reducing the peak factor of DRM standard radio broadcasting signals using the window weighting method with feedback and adaptive change in window length, Infocommunication technologies, 2021, vol. 19, no. 1, pp. 64—73.</mixed-citation><mixed-citation xml:lang="ru">Минкин М. А., Морозов К. Ю. Алгоритм снижения пик-фактора сигналов радиовещания стандарта DRM методом оконного взвешивания с обратной связью и адаптивным изменением длины окна // Инфокоммуникационные технологии. 2021. Т. 19, № 1. С. 64—73.</mixed-citation></citation-alternatives></ref><ref id="B16"><label>16.</label><citation-alternatives><mixed-citation xml:lang="en">Sheluhin O. I., Barkov V. V., Sekretarev S. A. The online classification of the mobile applications traffic using data mining, T-Comm., 2019, vol. 13, no. 10. pp. 60—67.</mixed-citation><mixed-citation xml:lang="ru">Sheluhin O. I., Barkov V. V., Sekretarev S. A. The online classification of the mobile applications traffic using data mining techniques // T-Comm. 2019. Vol. 13, N. 10. P. 60—67.</mixed-citation></citation-alternatives></ref><ref id="B17"><label>17.</label><citation-alternatives><mixed-citation xml:lang="en">Shibzukhov Z. M. Correct extensions of correct ΣΠ-algorithms, Mathematical methods of pattern recognition, 2011, vol. 15, no. 1, pp. 116—119.</mixed-citation><mixed-citation xml:lang="ru">Шибзухов З. М. Корректные расширения корректных ΣΠ-алгоритмов // Математические методы распознавания образов. 2011. Т. 15, № 1. С. 116—119.</mixed-citation></citation-alternatives></ref><ref id="B18"><label>18.</label><citation-alternatives><mixed-citation xml:lang="en">Ghomeshi H., Gaber M. M., Kovalchuk Ye. EACD: evolutionary adaptation to concept drifts in data streams, Data Mining and Knowledge Discovery, 2019, vol. 33, no. 3, pp. 663—694.</mixed-citation><mixed-citation xml:lang="ru">Ghomeshi H., Gaber M. M., Kovalchuk Ye. EACD: evolutionary adaptation to concept drifts in data streams // Data Mining and Knowledge Discovery. 2019. Vol. 33, N. 3. P. 663—694.</mixed-citation></citation-alternatives></ref><ref id="B19"><label>19.</label><citation-alternatives><mixed-citation xml:lang="en">Kolmogorova S. S., Biryukov S. V. Design of electric induction sensors and electric field measuring instruments (Mono¬graph), St. Petersburg, Renome, 2022. 180 p., doi: 10.25990/7bky-3e46 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Колмогорова С. С., Бирюков С. В. Проектирование электроиндукционных датчиков и средств измерений электрических. Санкт-Петербург: Общество с ограниченной ответственностью "Реноме", 2022. 180 с. DOI: 10.25990/7bky-3e46.</mixed-citation></citation-alternatives></ref><ref id="B20"><label>20.</label><citation-alternatives><mixed-citation xml:lang="en">Cross E. S., Williams L. R., Lewis D. K., Magoon G. R., Onasch T. B., Kaminsky M. L., Worsnop D. R., Jayne J. T. Use of Electrochemical Sensors for Measurement of Air Pollution: Correcting Interference Response and Validating Measurements., Atmos. Meas. Tech., 2017, vol. 10, p. 3575.</mixed-citation><mixed-citation xml:lang="ru">Cross E. S., Williams L. R., Lewis D. K., Magoon G. R., Onasch T. B., Kaminsky M. L., Worsnop D. R., Jayne J. T. Use of Electrochemical Sensors for Measurement of Air Pollution: Correcting Interference Response and Validating Measurements // Atmos. Meas. Tech. 2017. Vol. 10. P. 3575.</mixed-citation></citation-alternatives></ref><ref id="B21"><label>21.</label><citation-alternatives><mixed-citation xml:lang="en">Novikov V. A., Akhmedova S., Orlov A. I. Calibration of inertial sensors using neural networks, Gagarin Readings — 2019: Collection of abstracts of reports of the XLV International Youth Scientific Conference, Moscow, Barnaul, Akhtubinsk, April 16-19, 2019, pp. 548—549.</mixed-citation><mixed-citation xml:lang="ru">Новиков В. А., Ахмедова С., Орлов А. И. Калибровка инерциальных датчиков с помощью нейронных сетей // Гагаринские чтения — 2019: Сб. тезисов докладов XLV Междунар. молодеж. научн. конф., Москва, Барнаул, Ахтубинск, 16—19 апреля 2019 г. 2019. С. 548—549.</mixed-citation></citation-alternatives></ref></ref-list></back></article>
