<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE root>
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:ali="http://www.niso.org/schemas/ali/1.0/" article-type="review-article" dtd-version="1.2" xml:lang="en"><front><journal-meta><journal-id journal-id-type="publisher-id">Informacionnye Tehnologii</journal-id><journal-title-group><journal-title xml:lang="en">Informacionnye Tehnologii</journal-title><trans-title-group xml:lang="ru"><trans-title>Информационные технологии</trans-title></trans-title-group></journal-title-group><issn publication-format="print">1684-6400</issn><publisher><publisher-name xml:lang="en">New Technologies Publishing House</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="publisher-id">702207</article-id><article-id pub-id-type="doi">10.17587/it.31.485-495</article-id><article-categories><subj-group subj-group-type="toc-heading" xml:lang="en"><subject>Intelligent systems and technologies</subject></subj-group><subj-group subj-group-type="toc-heading" xml:lang="ru"><subject>Интеллектуальные системы и технологии</subject></subj-group><subj-group subj-group-type="article-type"><subject>Review Article</subject></subj-group></article-categories><title-group><article-title xml:lang="en">Development of intellectual information system for solving typical tasks of text data analysis, processing and synthesis</article-title><trans-title-group xml:lang="ru"><trans-title>Разработка интеллектуальной информационной системы для решения типовых задач анализа, обработки и синтеза текстовых данных</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author"><name-alternatives><name xml:lang="en"><surname>Zakharova</surname><given-names>О. I.</given-names></name><name xml:lang="ru"><surname>Захарова</surname><given-names>О. И.</given-names></name></name-alternatives><address><country country="RU">Russian Federation</country></address><bio xml:lang="en"><p>Ph.D., Associate Professor, Deputy Head of Research Laboratory, Research Laboratory of Artificial Intelligence</p></bio><bio xml:lang="ru"><p>канд. техн. наук, доц., зам. зав. науч.-исслед. лаб.</p></bio><email>o.zaharova@psuti.ru</email><xref ref-type="aff" rid="aff1"/></contrib></contrib-group><aff-alternatives id="aff1"><aff><institution xml:lang="en">Volga Region State University of Telecommunications and Informatics</institution></aff><aff><institution xml:lang="ru">ФГБОУ ВО Поволжский государственный университет телекоммуникаций и информатики</institution></aff></aff-alternatives><pub-date date-type="pub" iso-8601-date="2025-09-15" publication-format="electronic"><day>15</day><month>09</month><year>2025</year></pub-date><volume>31</volume><issue>9</issue><issue-title xml:lang="en">Informacionnye Tehnologii</issue-title><issue-title xml:lang="ru">Информационные технологии</issue-title><fpage>485</fpage><lpage>495</lpage><history><date date-type="received" iso-8601-date="2026-02-05"><day>05</day><month>02</month><year>2026</year></date><date date-type="accepted" iso-8601-date="2026-02-05"><day>05</day><month>02</month><year>2026</year></date></history><permissions><copyright-statement xml:lang="en">Copyright ©; 2025, Informacionnye Tehnologii</copyright-statement><copyright-statement xml:lang="ru">Copyright ©; 2025, Информационные технологии</copyright-statement><copyright-year>2025</copyright-year><copyright-holder xml:lang="en">Informacionnye Tehnologii</copyright-holder><copyright-holder xml:lang="ru">Информационные технологии</copyright-holder></permissions><self-uri xlink:href="https://journals.eco-vector.com/1684-6400/article/view/702207">https://journals.eco-vector.com/1684-6400/article/view/702207</self-uri><abstract xml:lang="en"><p>We consider the architecture of an intelligent information system (hereinafter — IIS), which contains the necessary components for solving typical tasks of analysis, processing and synthesis of text data, as well as means for configuring such components and monitoring their operation. In this case, the main task was to create a modular structure of the system, allowing horizontal scaling by flexible customization of the components and the sequence of their work as part of a single automated data processing pipeline. To describe the system structure we used the "C4" model of three levels: Context, Containers, Components. The 4th level "Code" is not used in this article, as it represents, designing a solution for module level abstractions. As an example for the design we have chosen an information system for collecting data on literary works, processing unstructured texts of such documents, loading the information into the analytical storage and analytical constructions based on the available data. To test the design solutions, a service catalog for data extraction, transformation and loading pipelines, a catalog of interaction contracts between services and a project structure for a containerization and multi-container management tool — Docker Compose — were developed. Apache Airflow and its REST API for integration with the IIS configuration component was used as an orchestration solution. To configure and optimize the system settings, a diagram of components of the module of own development in Python using the Django framework is given, as well as a description of the logic of its components. In conclusion, the advantage of the used approach over the implementation of ready-made software products with a set of necessary functions is described.</p></abstract><trans-abstract xml:lang="ru"><p>Рассматривается архитектура интеллектуальной информационной системы, которая содержит в своем составе необходимые компоненты для решения типовых задач анализа, обработки и синтеза текстовых данных, а также средства конфигурирования таких компонентов и мониторинга их функционирования. При этом основной задачей было создание модульной структуры системы, позволяющей осуществлять горизонтальное масштабирование путем гибкой настройки состава компонентов и последовательности их работы в составе единого автоматизированного конвейера обработки данных. Для описания структуры системы использована модель "C4" трех уровней: Context, Containers, Components. 4-й уровень "Code" в данной работе не используется, так как предназначен для проектирования решения для абстракций уровня модуля. В качестве примера для проектирования выбрана информационная система по сбору данных о литературных произведениях, обработке не структурированных текстов таких документов, загрузке информации в аналитическое хранилище и аналитических построений на основании имеющихся данных. Для проведения апробации проектных решений разработан каталог сервисов для конвейеров извлечения, трансформации и загрузки данных, каталог контрактов взаимодействия между сервисами и структура проекта для средства контейнеризации и управления несколькими контейнерами — Docker Compose. В качестве оркестровки использовалось решение Apache Airflow и ее REST API для интеграции с компонентом конфигурирования ИИС. Для конфигурации и оптимизации настроек системы приведена диаграмма компонентов модуля собственной разработки на языке Python c использованием фреймворка Django, а также приведено описание логики работы его компонентов. Описано преимущество представленного подхода по сравнению с внедрением готовых программных продуктов, обладающих набором необходимых функций.</p></trans-abstract><kwd-group xml:lang="en"><kwd>information systems</kwd><kwd>information systems architecture</kwd><kwd>text data processing</kwd><kwd>modular system architecture</kwd><kwd>configuration selection</kwd></kwd-group><kwd-group xml:lang="ru"><kwd>информационные системы</kwd><kwd>архитектура информационных систем</kwd><kwd>обработка текстовых данных</kwd><kwd>модульная архитектура системы</kwd><kwd>подбор конфигурации</kwd></kwd-group><funding-group/></article-meta></front><body></body><back><ref-list><ref id="B1"><label>1.</label><citation-alternatives><mixed-citation xml:lang="en">Ivanov V. K., Palyukh B. V., Sotnikov A. N. Architecture of intellectual system of information support of innovations in science and education, Programmnye produkty i sistemy, 2013, no. 4, pp. 197—202 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Иванов В. К., Палюх Б. В., Сотников А. Н. Архитектура интеллектуальной системы информационной поддержки инноваций в науке и образовании // Программные продукты и системы. 2013. № 4. C. 197—202.</mixed-citation></citation-alternatives></ref><ref id="B2"><label>2.</label><citation-alternatives><mixed-citation xml:lang="en">Martin R. Pure Architecture. The Art of Software Development, SPb, Piter, 2020, pp. 26—33 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Мартин Р. Чистая архитектура. Искусство разработки программного обеспечения. СПб.: Питер, 2020. 352 с. С. 26—33.</mixed-citation></citation-alternatives></ref><ref id="B3"><label>3.</label><citation-alternatives><mixed-citation xml:lang="en">Barseghyan A. A. Data and Process Analysis: textbook, SPb., BHV-Peterburg, 2018, pp. 36—41 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Барсегян А. А. Анализ данных и процессов: Учеб. пособ. СПб.: БХВ-Петербург, 2018. 512 с. С. 36—41.</mixed-citation></citation-alternatives></ref><ref id="B4"><label>4.</label><citation-alternatives><mixed-citation xml:lang="en">Berson A., Dubov L. Master data management, M., Publishing House "Noosphere", 2017, pp. 103—105 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Берсон А., Дубов Л. Управление мастер-данными. М.: Издательский дом "Ноосфера", 2017. 384 с. С. 103—105.</mixed-citation></citation-alternatives></ref><ref id="B5"><label>5.</label><citation-alternatives><mixed-citation xml:lang="en">Harenslak B., de Ruyter J. Apache Airflow and data processing pipelines, Moscow, DMK Press, 2021, pp. 346—347 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Харенслак Б., де Руйтер Дж. Apache Airflow и конвейеры обработки данных / Пер. с англ. Д. А. Беликова. М.: ДМК Пресс, 2021. 502 с. С. 346—347.</mixed-citation></citation-alternatives></ref><ref id="B6"><label>6.</label><citation-alternatives><mixed-citation xml:lang="en">Schoenig G.-J. PostgreSQL 11. Mastery of development, Moscow, DMK Press, 2019, pp. 25—26 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Шениг Г.-Ю. PostgreSQL 11. Мастерство разработки / Пер. с анг. А. А. Слинкина. М.: ДМК Пресс, 2019. 352 с. C. 25—26.</mixed-citation></citation-alternatives></ref><ref id="B7"><label>7.</label><citation-alternatives><mixed-citation xml:lang="en">Osipov D. L. Technologies of database design, Moscow, DMK Press, 2019, pp. 467—468 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Осипов Д. Л. Технологии проектирования баз данных. М.: ДМК Пресс, 2019. 498 с. C. 467—468.</mixed-citation></citation-alternatives></ref><ref id="B8"><label>8.</label><citation-alternatives><mixed-citation xml:lang="en">Anderson K. Analytical Culture. From data collection to business results, Moscow, Mann, Ivanov &amp; Ferber, 2017, pp. 81 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Андерсон К. Аналитическая культура. От сбора данных до бизнес-результатов / Пер. с англ. Ю. Константиновой. М.: Манн, Иванов и Фербер, 2017. 336 с. C. 81.</mixed-citation></citation-alternatives></ref><ref id="B9"><label>9.</label><citation-alternatives><mixed-citation xml:lang="en">Forcier J., Bissex P., Chan W. Django. Development of Web Applications in Python, SPb., Symbol Plus, 2009, pp. 170—172 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Форсье Дж., Биссекс П., Чан У. Django. Разработка веб приложений на Python / Пер. с англ. СПб.: Символ Плюс, 2009. 456 с. C. 170—172.</mixed-citation></citation-alternatives></ref><ref id="B10"><label>10.</label><citation-alternatives><mixed-citation xml:lang="en">Arsky Y. M., Finn W. K. Principles of the intelligent systems design, ITiVS, 2008, no. 4, pp. 4—37 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Арский Ю. М., Финн В. К. Принципы конструирования интеллектуальных систем // ИТиВС, 2008. № 4. С. 4—37</mixed-citation></citation-alternatives></ref><ref id="B11"><label>11.</label><citation-alternatives><mixed-citation xml:lang="en">Evteeva E. V. Features and signs of information systems intelligence, Vestnik VUiT, 2010, no. 15, available at: https://cyberleninka.ru/article/n/osobennosti-i-priznaki-intellektualnostiinformatsionnyh-sistem (date of reference: 01.11.2024) (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Евтеева Е. В. Особенности и признаки интеллектуальности информационных систем // Вестник ВУиТ. 2010. № 15. URL: https://cyberleninka.ru/article/n/osobennostii-priznaki-intellektualnosti-informatsionnyh-sistem (дата обращения: 01.11.2024).</mixed-citation></citation-alternatives></ref><ref id="B12"><label>12.</label><citation-alternatives><mixed-citation xml:lang="en">Vorobyeva I. A., Lazareva M. V. System and activity approaches in the design of intellectual learning system, Gumanitarnye issledovaniya Central’noj Rossii, 2024, no. 2 (31), available at: https://cyberleninka.ru/article/n/sistemnyy-i-deyatelnostnyy-podhody-pri-proektirovanii-intellektualnoy-obuchayuschey-sistemy (date of reference: 01.11.2024) (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Воробьева И. А., Лазарева М. В. Системный и деятельностный подходы при проектировании интеллектуальной обучающей системы // Гуманитарные исследования Центральной России. 2024. № 2 (31). URL: https:// cyberleninka.ru/article/n/sistemnyy-i-deyatelnostnyy-podhodypri-proektirovanii-intellektualnoy-obuchayuschey-sistemy (дата обращения: 01.11.2024).</mixed-citation></citation-alternatives></ref><ref id="B13"><label>13.</label><citation-alternatives><mixed-citation xml:lang="en">Densmore J. Data Conveyors. Pocket guide, Astana, ALIST, 2024, pp. 27—30 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Денсмор Дж. Конвейеры данных. Карманный справочник. Астана: АЛИСТ, 2024. 256 с. С. 27—30.</mixed-citation></citation-alternatives></ref><ref id="B14"><label>14.</label><citation-alternatives><mixed-citation xml:lang="en">Grant S. Ingersoll, Thomas S. Morton, Andrew L. Farris Unstructured Text Processing. Retrieval, organization, and manipulation, Moscow, DMK Press, 2015, pp. 178—179 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Грант С. Ингерсолл, Томас С. Мортон, Эндрю Л. Фэррис. Обработка неструктурированных текстов. Поиск, организация и манипулирование. / Пер. с англ. Слинкин А. А. М.: ДМК Пресс, 2015. 414 с. С. 178—179.</mixed-citation></citation-alternatives></ref><ref id="B15"><label>15.</label><citation-alternatives><mixed-citation xml:lang="en">Bolshakova E. I., Vorontsov K. V., Efremova N. E., Klyshinsky E. S., Lukashevich N. V., Sapin A. S. Automatic natural language text processing and data analysis, Moscow, Publishing house of NIU HSE, 2017, pp. 147—148 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Большакова Е. И., Воронцов К. В., Ефремова Н. Э., Клышинский Э. С., Лукашевич Н. В., Сапин А. С. Автоматическая обработка текстов на естественном языке и анализ данных: Учеб. пособие. М.: Изд-во НИУ ВШЭ, 2017. 269 с. С. 147—148</mixed-citation></citation-alternatives></ref><ref id="B16"><label>16.</label><citation-alternatives><mixed-citation xml:lang="en">Pivotto J., Brasil B. Launch Prometheus, Moscow, Books.kz, 2023, pp. 56—57 (in Russian).</mixed-citation><mixed-citation xml:lang="ru">Пивотто Ж., Бразил Б. Запускаем Prometheus / Пер. с англ. А. Н. Киселева. М.: Books.kz, 2023. 392 с. C. 56—57.</mixed-citation></citation-alternatives></ref></ref-list></back></article>
