Prospects for the generative artificial intelligence application in surgery, traumatology and orthopedics
- 作者: Nazarenko A.G.1, Kleimenova E.B.1, Kakabadze N.M.1, Molodchenkov A.I.2,3, Yashina L.P.1
-
隶属关系:
- Priorov National Medical Research Center for Traumatology and Orthopedics
- Federal Research Center «Computer Science and Control» of the Russian Academy of Sciences
- Peoples’ Friendship University of Russia
- 期: 卷 32, 编号 1 (2025)
- 页面: 221-239
- 栏目: Reviews
- ##submission.dateSubmitted##: 06.12.2024
- ##submission.dateAccepted##: 09.12.2024
- ##submission.datePublished##: 08.04.2025
- URL: https://journals.eco-vector.com/0869-8678/article/view/642647
- DOI: https://doi.org/10.17816/vto642647
- ID: 642647
如何引用文章
详细
The review considers the use of generative artificial intelligence technologies in surgery, traumatology and orthopedics. Definitions of key generative artificial intelligence technologies are given, as well as the difference between discriminative and generative models of artificial intelligence. An analysis of publication activity on the use of generative artificial intelligence in surgery, traumatology and orthopedics in world macroregions is conducted. The potential role of various generative artificial intelligence models at the preoperative, intraoperative and postoperative stages of healthcare is analyzed. Data on the results of clinical application of generative artificial intelligence and the most common problems associated with the practical use of various generative artificial intelligence applications are provided including issues of quality and safety of surgical care. The review proposes potential solutions and research directions to address these problems.
全文:
ВВЕДЕНИЕ
В последние 10–15 лет благодаря увеличению скорости работы компьютеров, объёма вычислений и доступной информации технологии искусственного интеллекта (ИИ) развиваются невиданными темпами. Новый виток популярности технологий в последние годы связан с генеративным ИИ, появление которого дало возможность решать задачи принципиально нового класса — писать длинные связные тексты и получать развёрнутые ответы на вопросы, суммировать и сравнивать тексты, создавать изображения, анализировать видео и т.д.
Развитие этой технологии обеспечило доступ к ИИ широкому кругу пользователей и повысило практическую значимость ИИ в различных областях народного хозяйства, включая банковскую и транспортную отрасли, страхование и телекоммуникации, добывающие и производственные предприятия, образование и здравоохранение.
Повышение внимания к технологиям ИИ отражается в росте инвестиций в отрасль: за последние 10 лет только частные мировые инвестиции в ИИ выросли в 30 раз, примерно до 90 млрд долл. США в 2022 г., а к 2025 г. эта цифра может достигнуть около 160 млрд долл. США [1]. По прогнозам компании Gartner, к 2026 г. свыше 80% предприятий будут использовать модели генеративного ИИ или приложения с поддержкой генеративного ИИ в производственных средах по сравнению с менее чем 5% в 2023 году [2].
В России, по оценке компании «Яков и Партнёры», полный экономический потенциал ИИ составляет 22–36 трлн руб. в номинальных ценах, а к 2028 г. реализованный эффект на рост выручки и сокращение затрат компаний может достичь 4,2–6,9 трлн руб., что эквивалентно росту валового внутреннего продукта на 4% [3]. Вклад генеративного ИИ составит 0,8–1,3 трлн руб. (около 20% от этого значения).
Генеративный ИИ (Г-ИИ) — это категория методов ИИ, в которых алгоритмы обучаются на наборах данных для генерации нового контента — текста, изображения или видео. Генеративный ИИ основан на больших (по количеству параметров — слоёв в нейронной сети) моделях, предварительно обученных на больших объёмах данных, — такие модели обычно называют базовыми (Foundation Models). Самая известная на рынке базовая модель — GPT-4 от американской компании OpenAI; уже в первой версии GPT (GPT-1) было около 120 млн параметров, а в GPT-4 количество параметров достигает 1,76 трлн по оценкам экспертов (точное количество параметров OpenAI не раскрывает) [4]. Помимо США, оригинальные базовые модели генеративного ИИ разрабатывает десяток стран, включая Россию, где собственные модели успешно развивают две крупные компании — Сбер (GigaChat, Kandinsky 2.2) и Яндекс (YandexGPT, YandexART) [3]. Очевидным преимуществом отечественных моделей генеративного ИИ для русскоязычной аудитории является более качественная генерация текстов на русском языке.
Здравоохранение отстаёт от других отраслей народного хозяйства в темпах внедрения технологий ИИ, хотя интерес к ним среди медицинских специалистов неуклонно растёт. В связи с этим Всемирная организация здравоохранения (ВОЗ) выпустила ряд документов, регламентирующих различные аспекты применения ИИ в здравоохранении.
В руководстве ВОЗ по внедрению цифровых технологий в здравоохранение [5] говорится, что зачастую это внедрение осуществляется без тщательного изучения доказательной базы их преимуществ и недостатков, способствует распространению ненадёжных технологий и огромному разнообразию цифровых инструментов с ограниченным пониманием их воздействия на процессы оказания медицинской помощи и благополучие людей. Признавая новаторскую роль цифровых технологий, необходимо всесторонне оценивать их эффективность, чтобы инвестиции в них не отвлекали ресурсы от альтернативных нецифровых технологий.
В 2021 году ВОЗ опубликовала руководство по этике и управлению ИИ в здравоохранении [6]. В нём 20 ведущих экспертов в области ИИ определили потенциальные преимущества и риски использования ИИ в здравоохранении, сформулировав принципы, которые должны направлять разработку и внедрение ИИ в медицинских учреждениях: защита автономии; содействие благополучию и безопасности людей; обеспечение прозрачности и объяснимости принимаемых решений; ответственность и подотчётность; адаптивность и устойчивость технологий ИИ.
В 2024 году вышло руководство ВОЗ по использованию больших мультимодальных моделей для технологий генеративного ИИ медицинского назначения, которые способны принимать несколько типов входных данных и генерировать различные типы выходных данных, отличных от тех, что поступили в алгоритм [7]. В нём перечислены риски и способы их минимизации в процессах разработки и внедрения технологий генеративного ИИ для медицины и здравоохранения.
В российской Национальной стратегии развития искусственного интеллекта на период до 2030 года[1] говорится, что ИИ является одной из самых важных технологий, доступных человеку: благодаря ИИ происходит рост мировой экономики, ускорение инноваций во всех областях науки, повышение качества жизни населения, доступности и качества медицинской помощи, качества образования, производительности труда и качества отдыха. В документе перечислены основные принципы развития и использования технологий ИИ, обязательные при его реализации:
- защита прав и свобод человека;
- безопасность, недопустимость использования ИИ в целях умышленного причинения вреда гражданам и организациям;
- прозрачность: объяснимость работы ИИ и процесса достижения им результатов;
- технологический суверенитет;
- целостность инновационного цикла;
- наиболее эффективное использование технологий ИИ;
- поддержка конкуренции;
- открытость и доступность;
- преемственность;
- защищённость: безопасность и правовая охрана технологий ИИ;
- достоверность исходных данных.
Целью данного обзора является анализ возможных сфер применения генеративного ИИ и мультимодальных моделей ИИ в хирургии в целом, а также его перспектив для травматологии и ортопедии.
МЕТОДОЛОГИЯ ПОИСКА ИСТОЧНИКОВ
Анализ применения Г-ИИ в хирургии, травматологии и ортопедии проведён на основании публикаций, отобранных за период с 2019 г. по октябрь 2024 г. из базы данных PubMed и русскоязычной базы данных eLibrary.
В eLibrary из 1766 публикаций, выданных за указанный период по ключевым словам «генеративный искусственный интеллект» или «большие языковые модели», в периодической печати найдено 23 публикации обзорного характера с ключевыми словами «здравоохранение» или «медицина» и обнаружена 1 публикация с ключевыми словами «хирургия», «ортопедия» или «травматология».
В базе данных PubMed по поисковому запросу «((“Generative” AND “artificial” AND “intelligence”) OR (“large” AND “language” AND “models”)) AND (surgery OR orthopedics OR traumatology OR spine)» найдено 872 публикации, включая 37 систематических обзоров и метаанализов, 115 литературных обзоров и 4 клинических исследования, касающихся составления медицинской документации.
ОБСУЖДЕНИЕ
Определение ключевых технологий генеративного искусственного интеллекта
Прежде чем рассматривать направления и перспективы использования генеративного ИИ, необходимо дать определения его ключевым технологиям.
Среди разнообразных определений ИИ остановимся на том, которое приведено в серии ГОСТов по системам искусственного интеллекта [8]: искусственный интеллект — это комплекс технологических решений, позволяющий имитировать когнитивные функции человека (включая самообучение, поиск решений без заранее заданного алгоритма и достижение инсайта) и получать при выполнении конкретных практически значимых задач обработки данных результаты, сопоставимые как минимум с результатами интеллектуальной деятельности человека. Комплекс технологических решений включает информационно-коммуникационную инфраструктуру, программное обеспечение (в том числе то, в котором используются методы машинного обучения), процессы и сервисы по обработке данных, анализу и синтезу решений. Это же определение ИИ дано в Национальной стратегии развития искусственного интеллекта на период до 2030 года.
В том же ГОСТе [8] перечислено 12 категорий, на основании которых можно классифицировать системы ИИ, однако для описания общих принципов работы технологий ИИ чаще используют деление на дискриминативный (Д-ИИ) и генеративный искусственный интеллект.
Д-ИИ сосредоточен на анализе различий между наборами данных и их классификации по заранее определённым категориям [9]. Некоторые из наиболее типичных вариантов использования моделей Д-ИИ включают распознавание изображений и речи, обработку естественного языка и предиктивную аналитику, включая логистическую регрессию, метод опорных векторов (SVM), нейронные сети. Модели Г-ИИ, как говорилось выше, самостоятельно генерируют новые данные и информацию для пользователя в результате изучения шаблонов и структур существующих данных и информации. Типичными примерами применения Г-ИИ являются чат-боты, конструирование молекулярных структур и изображений сверхвысокого разрешения. Эти технологии опираются на специальный класс систем машинного обучения — большие языковые (LLM) или мультимодальные модели (LMM) (рис. 1).
Рис. 1. Наиболее распространённые в медицине модели и алгоритмы генеративного искусственного интеллекта (адаптировано по [17]).
Примечание. ИИ — искусственный интеллект, МО — машинное обучение, Д-ИИ — дискриминативный искусственный интеллект, Г-ИИ — генеративный искусственный интеллект, БЯМ — большие языковые модели, СНС — свёрточная нейронная сеть, РНС — рекуррентная нейронная сеть, СДКП — сеть долговременной краткосрочной памяти, ГСС — генеративно-состязательные сети, САК — состязательный автокодировщик, РАК — разреженный автокодировщик, ВАК — вариационный автокодировщик.
Fig. 1. The most common models and algorithms of generative artificial intelligence in medicine (adapted from [17]).
Note. ИИ — artificial intelligence, МО — machine learning, Д-ИИ — discriminative artificial intelligence, Г-ИИ — generative artificial intelligence, БЯМ — large language models, СНС — convolutional neural network, РНС — recurrent neural network, СДКП — long short-term memory network, ГСС — generative adversarial networks, САК — adversarial autoencoder, РАК — sparse autoencoder, ВАК — variational autoencoder.
В последние годы растёт интерес к гибридным моделям, сочетающим достоинства генеративного и дискриминативного подходов, например для обучения с подкреплением или частично контролируемого обучения [10].
Нейронная сеть (искусственная нейронная сеть) — это математическая модель, построенная по принципу организации и функционирования биологических нейронных сетей, а также её программное или аппаратное воплощение [11]. Она представляет собой систему взаимодействующих между собой простых процессоров (искусственных нейронов), каждый из которых периодически получает и передаёт сигналы другим процессорам. С точки зрения машинного обучения нейронная сеть представляет собой частный случай методов распознавания образов, дискриминантного анализа. Возможность обучения — одно из главных преимуществ нейронных сетей перед традиционными алгоритмами. Технически обучение заключается в нахождении коэффициентов связей между нейронами. В процессе обучения нейронная сеть способна выявлять сложные зависимости между входными и выходными данными, а также выполнять обобщение.
Глубокое обучение (Deep learning) — совокупность методов машинного обучения, основанных на обучении представлениям, а не на специализированных алгоритмах, предназначенных для решения конкретных задач. К методам глубокого обучения относятся, например, системы обучения без учителя, рекуррентные и рекурсивные нейронные сети. Системы глубокого обучения нашли применение в таких областях, как компьютерное зрение, распознавание речи, аудиораспознавание, обработка естественного языка, биоинформатика2.
Обработка естественного языка (Natural Language Processing, NLP) — это направление в машинном обучении, посвящённое распознаванию, генерации и обработке устной и письменной человеческой речи. Оно находится на стыке дисциплин искусственного интеллекта и лингвистики[3].
Языковая модель (ЯМ) (Language Model, LM) — это алгоритм, который анализирует текст, понимает его контекст, обрабатывает и генерирует новые тексты. В его основе лежат нелинейные и вероятностные функции, с помощью которых модель предсказывает, какое слово в тексте может быть следующим, рассчитывая вероятность для каждого из возможных слов. Главная задача ЯМ — «понимать» текст по закономерностям в данных и генерировать осмысленный ответ. ЯМ используются для обнаружения спама, анализа тональности текстов (например, отзывов клиентов), сортировки новостей, выделения в тексте имён, адресов, названия товаров и т.п.[4]. В середине 2024 г. в медицинской литературе упоминались BERT, Bloomz, Claude 2 (Anthropic PBC), DALL-E, GeneGPT, Google Bard (Gemini), GPT, Flan-T5, Large Language Model Meta AI (LLaMA), Microsoft Bing AI, Pathways Language Model (PaLM), Perplexity, Stable Diffusion, Vicuna-13B [12, 13].
Большая языковая модель (БЯМ) — это языковая модель, состоящая из нейронной сети со множеством параметров, обученной на большом объёме неразмеченного текста с использованием обучения без учителя. Хотя этот термин не имеет формального определения, он обычно относится к моделям глубокого обучения, имеющим миллиард и более параметров [14].
Большая генеративная модель (БГМ) — это модель ИИ, способная интерпретировать (предоставлять информацию на основании запросов, например об объектах на изображении или о проанализированном тексте) и создавать мультимодальные данные (тексты, изображения, видеоматериалы и тому подобное) на уровне, сопоставимом с результатами интеллектуальной деятельности человека или превосходящем их5.
GPT (Generative pre-trained transformer, в переводе на русский — «генеративный предобученный трансформер») — это тип нейронных языковых моделей, которые обучаются на больших наборах текстовых данных, чтобы генерировать текст, соответствующий естественному языку и контексту. Предобучение является начальным этапом, на котором модель учится предсказывать следующее слово в тексте, не имея больших объёмов данных6. «Трансформер» означает, что GPT использует механизм самосвязываемости для обработки длинных последовательностей данных без потери информации. Последовательность сначала делится на несколько частей, каждая из которых обрабатывается отдельно и параллельно с другими, а полученные результаты сливаются в общий ответ. Это позволяет трансформерам обрабатывать большие объёмы данных без потери производительности, а также дообучаться впоследствии для различных задач обработки естественного языка. Первую версию GPT компания OpenAI представила в 2018 г. [14]. До этого нейронные ЯМ использовали в основном обучение с учителем на больших объёмах вручную размеченных данных. Это ограничивало их применение и делало обучение моделей очень дорогим и трудозатратным.
В 2024 г. количество активных пользователей ChatGPT — чат-бота на основе GPT — превысило 200 млн, а сайт компании еженедельно посещают около 1 млн человек[7]. ChatGPT поддерживает 26 языков, и, согласно литературному обзору от 2024 года [13], на него приходилось 74% публикаций по использованию моделей Г-ИИ в здравоохранении.
Чат-бот, виртуальный собеседник (chatbot), — программа, предназначенная для автоматического общения с пользователем с помощью текста или голоса. Генеративные боты могут самостоятельно создавать ответы, которые не всегда соответствуют одному из предопределённых вариантов, поскольку анализируют каждое слово в запросе, на основании чего генерируют ответ[8].
Анализ публикационной активности по применению генеративного искусственного интеллекта в хирургии, травматологии и ортопедии
Из 872 найденных статей авторы из США и Китая участвовали в наибольшем числе публикаций (324 и 105 соответственно). Среди макрорегионов мира по числу публикаций лидировала Европа (386 публикаций), а из европейских стран — Германия (74 работы). Авторы из развивающихся стран участвовали в основном в международных исследованиях (рис. 2). Российские учёные были авторами в 6 публикациях, из которых 4 являлись международными проектами.
Рис. 2. Публикационная активность авторов из макрорегионов мира по теме генеративного искусственного интеллекта в хирургии, травматологии и ортопедии.
Fig. 2. Publication activity of authors from macro-regions of the world on the topic of generative artificial intelligence in surgery, traumatology and orthopedics.
Использование технологий генеративного искусственного интеллекта в хирургии
Анализ литературы показывает, что Г-ИИ располагает широким спектром приложений, применимых на различных этапах хирургического лечения (рис. 3).
Рис. 3. Применение технологий генеративного искусственного интеллекта в хирургии (адаптировано по [17]).
Примечание. ЭМК — электронная медицинская карта.
Fig. 3. Application of generative artificial intelligence technologies in surgery (adapted from [17]).
Note. ЭМК — electronic health record.
Предоперационный этап
Одним из многообещающих направлений использования технологий Г-ИИ в клинической медицине признаётся поддержка диагностического процесса [13, 15]. Мультимодальные модели Г-ИИ способны анализировать различные клинические данные — симптомы, результаты лабораторных и инструментальных исследований, записи историй болезни, аудио- и видеофайлы, что позволяет им быстро генерировать потенциальные диагнозы, ускоряя диагностический процесс и делая диагноз более точным [16–18]. Их можно интегрировать с системами стадирования (например, онкологических болезней по TNM) [19, 20], анатомическими классификаторами (например, переломов костей) или оценочными шкалами (например, для расчёта тяжести состояния пациента) [21].
БЯМ могут предоставлять специализированную информацию врачам, не имеющим достаточных знаний по определённой патологии, или выступать в качестве напоминания о необходимости назначения определённых диагностических и лечебных мероприятий в процессе предоперационной подготовки [22]. Например, модели Г-ИИ помогают выявить «красные флажки» в состоянии пациента, требующие немедленного медицинского вмешательства [23].
Кроме того, БЯМ полезны в качестве ресурса, объясняющего пациентам результаты исследований [24], в том числе с учётом различного уровня медицинской грамотности [25], при составлении предоперационных [26] и послеоперационных [19] инструкций для пациентов, при получении информированного согласия пациента [27, 28]. Например, при использовании ChatGPT для информирования гипотетических пациентов с раком кожи информационные материалы ChatGPT получили в среднем 7 баллов из 10 за правильность и читаемость [28].
Интраоперационный этап
Во время операции визуализация в высоком разрешении и моделирование становятся всё более важными элементами хирургической техники. Модели Г-ИИ способны в режиме реального времени обрабатывать изображения области вмешательства, полученные от различных источников. В первую очередь это касается технологий интраоперационной навигации при минимально инвазивных вмешательствах. Текущие исследования в этой области можно разделить на четыре основных направления: построение объёмных моделей органов и имплантируемых медицинских изделий, эндоскопическая навигация, дифференциация тканей и дополненная реальность [29].
Интраоперационную 3D-реконструкцию можно создать на основании данных магнитно-резонансной (МРТ), компьютерной томографии (КТ) или ультразвука, но с помощью обычных технологий рендеринга этот процесс может быть трудоёмким или давать изображения с низким разрешением. Использование моделей Г-ИИ позволяет значительно уменьшить количество снимков, необходимых для 3D-реконструкции, ускорить процесс моделирования до режима реального времени и увеличить разрешение [29, 30].
При эндоскопических вмешательствах для оценки глубины изображения и трёхмерного картирования применяются методы глубокого обучения. Однако получение большого объёма высококачественных данных, содержащих парные видеоизображения, практически затруднено из-за аппаратных ограничений и трудоёмкой маркировки [31, 32]. В настоящее время активно изучаются возможности различных нейронных сетей для визуальной одометрии при работе эндоскопов и капсульных роботов [33–36].
Определение разных типов тканей и анатомических структур является фундаментальным навыком, которым должен обладать хирург для безопасного и успешного проведения операции. К примеру, в спинальной хирургии сочетание плохой видимости, сложной анатомии и близости жизненно важных структур (спинной мозг, периферические нервы, аорта) серьёзно затрудняет манипуляции [37]. Дифференциация тканей особенно сложна в минимально инвазивной хирургии из-за отсутствия прямого обзора и тактильной обратной связи. Растущее число исследований посвящено использованию интраоперационных сенсорных технологий (оптическая когерентная томография, гиперспектральная визуализация, импедансное и виброакустическое зондирование, тензодатчики с шестью степенями свободы, флуоресценция в ближнем инфракрасном диапазоне, зондовая конфокальная лазерная эндомикроскопия) для классификации и дифференциации тканей с целью повышения эффективности хирургической навигации и автономности хирургической робототехники [38]. Применение различных моделей глубокого обучения обеспечивает более надёжную, быструю и точную интерпретацию данных по сравнению с традиционными методами обработки сигналов [39].
Технология дополненной реальности — создание среды, в которой в реальном времени объединены физические и виртуальные объекты, — улучшает интраоперационное зрение хирургов, предоставляя полупрозрачное наложение пред- или интраоперационного изображения на интересующую область. Описано применение этой технологии в челюстно-лицевой [40], пластической [41], сосудистой [42], спинальной [43, 44] хирургии. Одной из самых сложных задач в этой области является проецирование виртуальных изображений на деформируемые органы в отсутствие маркеров. Для её решения предложены различные алгоритмы ИИ, которые были апробированы при лапароскопических операциях [45, 46]. Разрабатываются модели Г-ИИ для воссоздания дополненной реальности при наличии несовершенных или ограниченных изображений [29].
Одним из очевидных и перспективных направлений применения технологий Г-ИИ во время вмешательства является автоматическое составление протоколов операций. Точное и подробное описание хирургического вмешательства важно не только для обеспечения преемственности медицинской помощи, но и в юридических целях. Однако ручное составление протоколов, в том числе по электронным формам, связано с дополнительными затратами времени, а полнота и правильность заполнения этих документов часто остаётся неудовлетворительной. По данным аудита, проведённого в Королевской больнице Хобарта (Австралия), 45% хирургических протоколов имели существенные пробелы, делавшие их уязвимыми с юридической точки зрения, и ни один из протоколов не соответствовал всем требованиям к заполнению [47].
Использование ChatGPT для составления протокола операции описано при проведении пластических [28, 48], офтальмологических [49, 50] и нейрохирургических [51, 52] вмешательств, при лапароскопической аппендэктомии [53], хотя эти работы пока носят экспериментальный характер. Авторы отмечают, что использование чат-бота значительно сокращает время составления протокола при минимальной потребности в финальных правках [48, 52], увеличивает полноту регистрируемой информации за счёт подсказок из шаблона протокола [53].
Любопытна публикация пластического хирурга Физзаха Арифа из Пакистана, который спросил у самого ChatGPT, какова его роль в составлении хирургических протоколов [54]. ChatGPT ответил, что он может играть решающую роль в стандартизации протоколов операций, предоставляя возможность документирования хирургических процедур по стандартной терминологии и формату. «С помощью ChatGPT хирурги могут гарантировать, что вся релевантная информация задокументирована правильно, без возможного двоякого или неправильного толкования. Оказывая помощь хирургу в режиме реального времени во время операций, ChatGPT позволяет быстро документировать ключевую информацию. Это особенно полезно в ситуациях высокого прессинга, когда хирургу необходимо сосредоточиться на операции, но при этом он стремится точно описать ход операции», конец цитаты. По словам автора, ChatGPT «понял» свои ключевые достоинства при составлении хирургических протоколов: стандартизация, точность, помощь в режиме реального времени. Однако пока эту технологию нельзя считать полностью отработанной, и протоколы должны обязательно проверяться и дополняться хирургами [54]. Другие специалисты также отмечают, что на современном этапе использование ChatGPT или других БЯМ может быть затруднено для случаев более редких, специализированных или новейших процедур, на которых модель не обучалась. Кроме того, есть риск чрезмерной зависимости от автоматизации процесса при отсутствии адекватной проверки созданного документа [53].
Ещё одним важным направлением применения технологий Г-ИИ на интраоперационном этапе является обнаружение в реальном времени неблагоприятных событий (НС), настораживающих событий и отклонений от хирургического процесса. Как правило, данные о НС фиксируются ретроспективно, и существенная доля этих происшествий остаётся незарегистрированной, особенно еcли они не привели к тяжёлым последствиям [55]. Это затрудняет анализ состояния безопасности хирургической помощи на оперативном этапе и организацию мер по её совершенствованию. Регистрация интраоперационных НС в реальном времени является более чувствительным и точным методом, но сталкивается с рядом логистических, технологических и стоимостных ограничений. Алгоритмы глубокого обучения и компьютерного зрения показали многообещающий потенциал при решении этой задачи.
В систематическом обзоре [56] проанализировано 13 публикаций по использованию алгоритмов ИИ для выявления интраоперационных осложнений. Большинство работ было опубликовано после 2020 г., что подчёркивает новизну этого направления по сравнению с другими приложениями ИИ в хирургии. В работах использованы различные алгоритмы глубокого нейронного обучения, чаще всего свёрточные нейронные сети, а источником данных служили видеозаписи, реже — данные нейрофизиологического мониторинга или цифровой ангиографии. Обнаружение кровотечения было наиболее распространённым регистрируемым осложнением; несколько работ продемонстрировали успешное выявление дефицита перфузии, термического повреждения и отклонений электромиографии. Хирургическими дисциплинами были урология, офтальмология, общая хирургия и нейрохирургия, что говорит об обобщаемости большинства описанных методов. Групповая чувствительность десяти алгоритмов составила 0,78 (0,64–0,88), специфичность — 0,81 (0,69–0,88).
Чтобы ИИ успешно идентифицировал НС в ходе операции, алгоритм должен сначала уметь распознавать ожидаемый и рутинный порядок манипуляций. Есть примеры успешного определения этапов операции и их результатов с помощью различных моделей нейронных сетей, например положение лапароскопических инструментов в хирургическом поле [57, 58]. Способность моделей ИИ определять хирургические этапы и использование хирургических инструментов закладывает основу для идентификации отклонений от стандартной процедуры, а также для оценки технических навыков хирурга [55, 59, 60].
Комплексным решением в области контроля безопасности хирургических вмешательств с помощью ИИ является относительно новая технология «чёрного ящика операционной» (Operating Room Black Box, ORBB), обеспечивающая комплексную оценку технических и нетехнических навыков операционной бригады. Система создана по образцу чёрного ящика в авиации, помогающего определить причину крушения самолёта. Она позволяет осуществлять наблюдение в реальном времени и непрерывную запись интраоперационных событий, проводить анализ эффективности, безопасности и возникновения НС [61]. ORBB использует несколько моделей компьютерного зрения, выдаёт серию коротких видеоклипов и панель статистики, идентифицирует и разбивает ключевые сегменты процедуры (диссекция, резекция и закрытие), позволяя не смотреть трёх- или четырёхчасовую запись, а сразу перейти к той части операции, где, например, было сильное кровотечение или хирургический степлер дал осечку.
Первый прототип ORBB был создан под руководством Теодора Гранчарова и установлен в больнице Св. Михаила в Торонто. В 2020 г. были опубликованы результаты наблюдения за 132 лапароскопическими операциями с использованием ORBB [62]. Анализ данных выявил 3435 ошибок, или 20 ошибок на 1 операцию. Слуховое отвлечение происходило в среднем 138 раз за один случай, включая сигналы от оборудования, пейджеров, телефонов и хирургических инструментов. Дверь операционной открывалась в среднем 42 раза за случай, или примерно каждые 2 минуты. Авторы утверждают, что хирурги, которые сталкиваются со слуховыми отвлекающими факторами, демонстрируют более низкие качество, скорость и точность манипуляций в смоделированной среде.
В настоящее время система ORBB установлена не менее чем в 40 клиниках США, Канады и нескольких европейских стран. Она используется в том числе для автоматического контроля соблюдения операционной бригадой чек-листа ВОЗ по хирургической безопасности [63].
Например, в клинике Юго-Западного Техасского университета в Далласе система ORBB была установлена в 2020 г. Анализ двухлетнего использования системы включил 4581 операцию, для которых были рассчитаны ключевые показатели выполнения хирургического чек-листа, включая полноту, качество и вовлечённость бригады на трёх этапах проверки. Было подсчитано, что для пациентов с общим баллом качества соблюдения чек-листа, равным нулю, прогнозируемая смертность составляла 4,29%, а у пациентов с баллом 100 — всего 0,11% (p <0,0001). У пациентов с общим баллом качества 100 прогнозируемая продолжительность пребывания в стационаре сократилась на 1,57 дня. По мнению авторов, ORBB предоставляет беспрецедентную возможность оценки не только полноты соблюдения чек-листов ВОЗ, но и вовлечённости бригады и качества выполнения требований безопасности. Его использование позволяет оценивать соблюдение этих требований практически в режиме реального времени и устранять угрозы безопасности, которые могут возникнуть в результате отклонений [63].
Интраоперационные осложнения важно не только регистрировать, но и предсказывать, желательно в режиме реального времени при изменениях состояния пациента. В настоящее время прогнозирование риска осуществляется преимущественно в предоперационном периоде. Во время операции хирургические бригады полагаются почти исключительно на клиническое суждение, однако рискованные ситуации могут быть непредвиденными, и в результате их купирование осуществляется реактивно, а не превентивно [61]. Методы Г-ИИ могут обеспечить поддержку принятия решений в режиме реального времени, автоматически оценивая риск на основе физиологических параметров и неструктурированных данных, таких как текст, аудио и видео, предоставляя более точные прогнозы, чем традиционные статистические методы [64].
В 2018 году Лундберг и соавт. [65] разработали систему предупреждения на основе так называемого объяснимого ИИ (Explainable Artificial Intelligence) под названием Prescience, которая прогнозирует гипоксемию во время хирургических процедур за 5 минут до её развития. Система отслеживает показатели жизнедеятельности и предоставляет врачу оценку риска, которая обновляется в режиме реального времени, а также указывает на причины своего прогноза, перечисляя значимые факторы риска. Это может работать как дополнительный показатель жизнедеятельности и предупреждать анестезиолога о текущем изменении риска.
Несколько слов об объяснимом ИИ будет сказано ниже. Здесь же отметим, что прогностические интраоперационные модели на основе объяснимого ИИ представлены также для кардиохирургии у детей [66], для прогнозирования гипоксемии у детей в общей хирургии [67].
Послеоперационный этап
Важным направлением применения технологий Г-ИИ на послеоперационном этапе является поддержка принятия решений по послеоперационному ведению пациентов, включая оценку риска послеоперационных осложнений, рецидива заболевания, прогноз времени восстановления и отдалённых результатов [68].
В отличие от традиционных систем поддержки принятия решений, БЯМ могут непрерывно обучаться по мере накопления и обработки новой информации, что позволяет сохранять актуальность и релевантность их базы знаний. Например, в Медицинском центре Университета Вандербильта (Нэшвилл, США) провели сравнение 36 рекомендаций, сгенерированных ChatGPT, и 29 рекомендаций от 5 экспертов по поводу предупреждений, автоматически генерируемых в медицинской информационной системе центра (по поводу применения варфарина без контроля МНО, вакцин у иммунокомпрометированных пациентов, нестероидных препаратов при беременности и т.п.). Сравнение показало, что 9 из 20 лучших рекомендаций были сгенерированы ChatGPT; они были понятными, релевантными, умеренно полезными, с низкой предвзятостью и избыточностью [69]. Однако при этом эксперты обнаружили в одной рекомендации от ChatGPT галлюцинацию (ошибку нейросети, которая не подтверждается данными её обучения, или вымышленный ответ, не соответствующий действительности), и одна рекомендация была частично правильной. В связи с этим авторы предлагают активнее развивать технологии объяснимого ИИ, позволяющие пользователям понимать поведение модели [70].
Детальное обсуждение моделей объяснимого ИИ выходит за рамки данного обзора; достаточно упомянуть, что толчок к развитию этого направления был дан программой Управления перспективных исследовательских проектов Министерства обороны США (DARPA), которая в настоящее время инвестирует более 2 млрд долл. в создание систем ИИ третьего поколения, способных работать автономно или в команде с людьми и уметь объяснить людям свои решения [71].
Тема объяснимого ИИ особенно актуальна в медицине, где врач несёт всю полноту ответственности за принятые клинические решения независимо от того, кто (или что) эти решения ему подсказал(о). Отсутствие прозрачности моделей ИИ подрывает доверие к их диагностическим, терапевтическим и прогностическим решениям, о чём многократно писалось в литературе. Например, согласно опросу врачей-реаниматологов отделений интенсивной терапии (ОИТ) [72], 71% респондентов не согласны с тем, что ИИ можно надёжно использовать при принятии клинических решений в ОИТ, или не уверены в этом.
Это мнение нельзя считать абсолютно безосновательным. Например, Якоб Дизи и соавт. [73] предложили модель ИИ для прогноза внутрибольничной летальности пациентов ОИТ на основании данных информационной системы по интенсивной терапии MIMIC-III без предварительного отбора переменных. Детальное изучение модели показало, что одним из наиболее значимых предикторов неминуемой смерти был приход священника к пациенту. Если этот фактор убрать, то прогноз меняется.
В базе данных MEDLINE с 2018 по октябрь 2024 г. нашлось 1148 документов с ключевыми словами “explainable artificial intelligence”, из них 109 касались хирургической тематики. Были разработаны как алгоритмо-специфические, так и универсальные методы для понимания того, как различные типы моделей ИИ вычисляют прогноз. Например, каждый фактор риска можно последовательно удалить, чтобы увидеть, как его отсутствие влияет на прогноз. По сути, это даёт весовой коэффициент каждого фактора риска. Представляя оценку риска в реальном времени и её обоснование, объяснимый ИИ позволит хирургам пользоваться преимуществами комплексного прогнозирования, не теряя при этом интерпретируемости логистической регрессии [74].
Мнение о том, что между точностью и объяснимостью в моделях ИИ существует компромисс или обратная зависимость, в настоящее время пересматривается по мере расширения области исследований объяснимого ИИ [75]. В медицине, где модели ИИ обычно основаны на подробных, структурированных, патофизиологически объяснимых данных, разница в производительности между интерпретируемыми и более сложными моделями часто оказывается минимальной [74].
Выписные эпикризы, как и протоколы операций, являются очевидным направлением применения Г-ИИ в хирургии благодаря возможности соблюдения стандартной формы предоставления исчерпывающей информации в сжатой форме за минимальное время [76]. По данным различных исследований, качество выписных эпикризов можно признать хорошим не более чем в 20–40% случаев [77], а некорректно сформулированные рекомендации по лекарственной терапии для амбулаторного этапа присутствуют в 40% случаев [78]. Составление качественных выписных эпикризов в ручном режиме может занимать много времени, но оно абсолютно необходимо для обеспечения преемственности медицинской помощи. Доказано, что повышение качества этих документов способствует снижению частоты повторных госпитализаций после стационарного лечения обострений сердечной недостаточности [79], улучшению частоты назначения деносумаба после перелома шейки бедра [80], повышению удовлетворённости пациентов [81].
Главными достоинствами ChatGPT и других БЯМ при составлении выписных эпикризов называют последовательный, структурированный и стандартизированный формат, ясный и лаконичный язык, синтез сложной информации, персонализированные рекомендации [82]. Например, анализ выписных эпикризов, сгенерированных ChatGPT после нейрохирургических вмешательств, показал корректность представленной информации в 81–85% документов [83]. В другом исследовании все 25 выписных эпикризов, написанных с помощью ChatGPT, были признаны экспертами качественными по сравнению с 92% эпикризов, написанных врачами-стажёрами [84]. Среднее соответствие минимальному набору данных составило 97%. Примечательно, что эксперты только в 60% случаев угадали, что документ написан чат-ботом.
Вместе с тем многие авторы высказывают опасения по поводу риска возникновения галлюцинаций в автоматически сгенерированных документах, конфиденциальности в отношении доступа компании OpenAI (ChatGPT) к данным пользователей, используемым для составления текста, а также трудностей распознавания текстов, связанных со сложными и необычными случаями [85, 86]. Кроме того, анализ источников информации, содержащейся в составленных врачом выписных эпикризах, показал, что только 61% данных взяты из текущей истории болезни, а 39% поступает из других источников (направлений, предшествующих историй болезни и других медицинских документов) либо является предположениями или рекомендациями, которые не содержатся в документах, а написаны врачом, что называется, «из головы» (11%) [85]. Это вызывает опасения относительно возможности Г-ИИ создавать качественные выписные эпикризы и подчёркивает необходимость человеческого контроля над ним для минимизации рисков и предоставления более персонализированной информации [76, 85].
Учебные и административные задачи
В образовательном процессе технологии Г-ИИ могут использоваться в следующих целях: построение индивидуальных учебных траекторий, автоматизированная проверка домашних заданий, составление профилей обучающихся с индивидуальным планом развития, учебная аналитика на основе больших данных, автоматизированные рекомендации по редизайну учебных программ [86].
Возможности Г-ИИ в хирургическом образовании были продемонстрированы на примере сдачи экзамена для ординаторов-хирургов, включающего 280 вопросов из всех областей общей хирургии, в котором последняя модель GPT-4 правильно ответила на 76% вопросов [87].
Модели Г-ИИ могут служить учебной платформой для совершенствования хирургических навыков. При освоении новых технологий и теоретических курсов способность ИИ анализировать тенденции в результатах прохождения учебных программ может обеспечить персонализированную обратную связь для оптимизации кривой обучения [88]. Интеграция чат-ботов с виртуальной реальностью позволяет задавать вопросы в интерактивном режиме и получать обратную связь для закрепления хирургических навыков во время обучения [18].
Например, в рандомизированном исследовании, проведённом в Медицинской школе Дэвида Геффена Калифорнийского университета Лос-Анджелеса, для обучения студентов, не имевших опыта выполнения интрамедуллярного остеосинтеза большеберцовой кости, была использована хирургическая виртуальная платформа Osso VR [88]. Учебный модуль содержал письменные инструкции и подсказки для каждого шага процедуры. После обучения участники выполнили имитацию процедуры с использованием учебной модели SawBones. В группе, обучавшейся на виртуальной платформе, процедуры были выполнены в среднем на 20% быстрее, чем в контрольной группе, прошедшей стандартное обучение. Оценки обучавшихся на Osso VR по всем категориям были значимо выше (средняя оценка 17,5 против 7,5 в контрольной группе, p <0,001), как и процент шагов, выполненных правильно (63% против 25%, p <0,002).
Одним из наиболее заметных достижений в этом направлении является использование алгоритмов машинного обучения для определения уровня квалификации хирурга (новичок или опытный) [89, 90]. Г-ИИ собирает данные на протяжении всей виртуальной операции и обрабатывает их в режиме реального времени. Было показано, что алгоритмы ИИ определяют квалификацию хирурга при виртуальных операциях с точностью 90% [91].
Как свидетельствует систематический обзор 93 исследований, посвящённых роли ИИ в хирургическом образовании [92], для оценки степени освоения хирургических навыков чаще используют комбинацию показателей, начиная с формализованных шкал, например Объективной структурированной оценки технических навыков (Objective Structured Assessment of Technical Skills) или Глобальной оценки роботических навыков (Global Evaluative Assessment of Robotic Skills), и заканчивая регистрацией объективных кинематических и физиологических параметров: движение глаз (направление и частота фиксации взгляда, частота моргания, ширина зрачка, вергенция), положение и наклон инструментов, количество движений рук, сила, приложенная к определённым структурам, объём удалённой ткани и другие показатели, которые невозможно оценить визуально [92]. Авторы обзора отмечают, что большинство работ касаются симуляционного тренинга для лапароскопических и роботизированных операций, которые выполняются с использованием видеокамер, напрямую показывающих область вмешательства, с возможностью сохранения видеоизображения. В клинических условиях при открытых операциях обзор операционного поля для видеокамеры может частично или полностью перекрываться головой или телом хирурга, освещение и положение камеры часто меняются. Поэтому в клинических условиях применение технологий ИИ для контроля хирургических манипуляций может столкнуться с некоторыми сложностями.
В области управления хирургическими процессами модели машинного обучения используются в первую очередь для предсказания продолжительности операций и составления более точного графика работы операционных. Обычно оценка длительности предстоящей операции опирается на усреднённые исторические данные и мнение хирурга, однако эти методы не отличаются высокой надёжностью, что приводит к сдвигам в расписании, отменам и переносам процедур. В ряде исследований показано, что использование нейросетей и других моделей машинного обучения на основе административных и периоперационных данных позволяет повысить точность прогноза длительности операции на 24–35% [93–95], повысить точность соблюдения расписания до 90% [95], оптимизировать распределение кадров и материальных ресурсов [96]. Описано также использование различных моделей ИИ для прогноза пребывания пациента в палате пробуждения (точность прогноза — 66–82%) и риска отмены операции (точность прогноза — 68–72%) [97].
БЯМ могут облегчить составление документов для страховых компаний и другой рутинной административной документации [98], кодирование болезней, планирование и подготовку врачебных консультаций [99], помогают в составлении планов медсестринского ухода за пациентами [100], выступают в качестве напоминаний о запланированных мероприятиях, снижая дополнительную нагрузку на медицинский персонал и высвобождая время для клинической работы [101].
Основные направления использования генеративного искусственного интеллекта в травматологии и ортопедии
Успешному внедрению технологий Г-ИИ в травматологию и ортопедию способствуют некоторые особенности этой дисциплины: наличие хорошо разработанных алгоритмов диагностики и лечения большинства ортопедических заболеваний, воспроизводимость и высокая эффективность ортопедических вмешательств, накопление национальных и международных баз данных по конкретным процедурам с большим объёмом информации, которые могут служить основой для создания приложений в области ИИ [102].
В целом все описанные выше технологии Г-ИИ и мультимодальные модели применимы и для травматолого-ортопедических вмешательств. В данном разделе остановимся на конкретных примерах использования Г-ИИ в травматологии и ортопедии.
Лучевая визуализация играет центральную роль в диагностике травм и болезней костно-мышечной системы, поэтому данное направление использования ИИ в травматологии и ортопедии развивается достаточно давно, начиная с применения алгоритмов ИИ для выявления опухолей костей, оценки минеральной плотности костной ткани и распознавания трабекулярных структур в длинных костях и заканчивая недавними примерами использования нейросетей для обнаружения переломов костей на рентгенограммах и КТ, повреждений мениска, разрывов связок и отёка костного мозга по данным МРТ [103]. Дискриминативные модели ИИ демонстрируют точность диагностики и классификации переломов длинных костей, позвонков, рёбер, внутрисуставных и перипротезных переломов, нестабильности эндопротезов в 72–100% [104, 105].
Генеративные и смешанные нейросети используются для создания псевдо-КТ-изображений по данным МРТ или улучшения низкодозовых КТ-сканов за счёт шумоподавления, что способствует снижению дозы облучения, ускорению и повышению точности диагностики [106]. Описаны также обратные преобразования КТ-снимков в МРТ-изображения для диагностики спинальной патологии при противопоказаниях к проведению МРТ или для снижения расходов на диагностику [107]. Различные модели ИИ также классифицируют по топологии туловища тип и тяжесть сколиоза с точностью до 86%, чтобы избежать рентгеновского облучения [108].
Второе перспективное направление использования технологий Г-ИИ, в частности нейросетей глубокого обучения, связано с планированием ортопедических вмешательств. Программное обеспечение для создания и использования ортопедических шаблонов на основе нейросети может быстро определять морфологию суставных структур и подбирать оптимальный размер эндопротеза, достигая 90% точности. Исследования показали, что планирование с помощью технологий Г-ИИ сокращает ручные корректировки хирургического плана в среднем на 40% [109]. В области спинальной хирургии различные модели ИИ используются для выбора траектории транспедикулярных винтов и интраоперационного контроля по данным КТ и МРТ. В современной практике траектория винта планируется вручную, что чревато ошибками и требует много времени, тогда как нейросеть справляется с задачей за несколько секунд или даже доли секунды [110]. Во время операции подключение технологий Г-ИИ к системе навигации позволяет снизить дозу облучения на 50% по сравнению с классической флюороскопией [111].
Автоматические и полуавтоматические хирургические роботизированные системы, снабжённые ИИ, во время операции обеспечивают хирургу обратную связь в режиме реального времени и контролируют соответствие процедуры предоперационному плану. Например, использование роботизированной системы MAKO позволяет повысить точность установки эндопротеза коленного сустава на 32% по сравнению с традиционными методами и улучшить выравнивание конечностей [112].
Другим направлением использования Г-ИИ во время операции на костно-мышечной системе являются технологии дополненной реальности. В спинальной хирургии они могут повысить точность хирургической навигации и размещения имплантатов (транспедикулярных винтов), сократить время операции, а также снизить количество процедурных ошибок, особенно у начинающих хирургов, с 7 до 2% [113].
Технологии Г-ИИ демонстрируют многообещающий потенциал в реабилитации травматолого-ортопедических пациентов. Соблюдение пациентами протоколов реабилитации обычно не превышает 50% [114]. Виртуальные помощники на базе ИИ могут предоставлять пациентам персонализированные планы упражнений, отслеживать прогресс, предлагать обратную связь в реальном времени и адаптировать программу реабилитации под индивидуальные потребности и скорость функционального восстановления [115]. Например, приложение Exer Health американской компании Exer Labs (https://www.exer.ai/) использует ИИ для отслеживания двигательной активности пациентов и выполнения ими упражнений в домашних условиях. Exer Health устанавливается на смартфоне или планшете и с помощью компьютерного зрения измеряет диапазон и траекторию движений во время упражнений. Эти данные отправляются ортопеду в виде отчёта о ходе лечения, а пациенты получают ежедневные напоминания о необходимости выполнения упражнений.
Риски применения технологий генеративного искусственного интеллекта в медицине
В руководстве ВОЗ по этике и управлению большими мультимодальными моделями ИИ говорится, что скорость распространения технологий на основе БЯМ превышает принятие любых других потребительских компьютерных программ в истории [7]. Однако этот процесс сопряжён с определёнными рисками.
Одним из распространённых рисков для применения технологий Г-ИИ в медицине специалисты называют галлюцинации — генерирование моделью неверной или бессмысленной информации, которая кажется правдоподобной, но не основана на реальности или данных обучения. Для снижения этого риска рекомендуется внедрение механизмов автоматической перекрёстной проверки со стандартными медицинскими рекомендациями, а также всех текстов, генерируемых моделью [25]. Во всех публикациях подчёркивается, что нейросеть не может заменить хирургов в принятии решений, а является лишь вспомогательным инструментом.
Другой проблемой развития технологий Г-ИИ в медицине является доступность больших аннотированных наборов данных, необходимых для обучения моделей. Большинство доступных наборов данных предназначены для наиболее распространённых состояний и созданы в рамках одного или ограниченного числа учреждений. Обучение модели на данных, которые не репрезентативны для популяции, разнообразия диагнозов, методов визуализации или условий оказания медицинской помощи, может поставить под угрозу её производительность и надёжность. Например, при анализе 480 тысяч рентгенограмм таза эксперты с помощью модели Г-ИИ выделили 6 отличий в строении костей у представителей европеоидной и негроидной расы, включая межвертлужное расстояние, степень остеоартрита, форму запирательного отверстия, угол шейки-диафиза бедренной кости, форму тазового кольца и толщину кортикального слоя бедренной кости [116]. Подобные отличия могут приводить к искажениям при анализе изображений в целях диагностики и прогнозирования.
Для решения проблемы систематических искажений необходимы сотрудничество медицинских организаций с целью обмена данными и совместное создание общедоступных наборов данных, оценка репрезентативности выборок, на которых обучалась модель, и использование алгоритмов коррекции возможных искажений результатов. Технологическим подходом к решению этой проблемы являются так называемые генеративно-состязательные сети (Generative Adversarial Networks, GAN), объединяющие два типа нейросетей, один из которых (сеть G) генерирует образцы, а другой (сеть D) старается отличить правильные («подлинные») образцы от неправильных. Поскольку сети G и D имеют противоположные цели — создать образцы и отбраковать образцы, между ними возникает антагонистическая игра, повышающая точность выходных данных. В травматологии и ортопедии GAN используются для диагностики переломов, остеоартрита и решения ряда других задач, демонстрируя многообещающие результаты [117].
Однако доступность клинических данных порождает этическую проблему защиты конфиденциальности информации. Особенно часто эти опасения звучат в отношении общедоступных больших языковых моделей, в частности ChatGPT. Если модели будут использовать данные пациентов (например, истории болезни), то эта информация будет сохраняться автоматически с последующим риском несанкционированного доступа, реидентификации или утечки. Например, как показал анализ данных, собранных в ходе Национального обследования здоровья и питания (NHANES) в США, повторная идентификация личности была возможна для 85,6% взрослых и 69,8% детей, несмотря на заявленное удаление идентификаторов [118]. Отсутствие надёжных методов обеспечения анонимности данных о пациентах может задерживать или вовсе останавливать проекты из-за трудоёмкого и потенциально ненадёжного процесса деперсонализации данных. В этой области необходимо, с одной стороны, упрощение процессов анонимизации, а с другой — комплексный подход к обеспечению сохранности и защите персональных данных с помощью надёжных алгоритмов деперсонализации.
Серьёзными проблемами, которые препятствуют применению технологий Г-ИИ в практическом здравоохранении, являются обеспечение их бесшовной интеграции с существующими медицинскими инфраструктурами, а также высокие затраты на разработку и внедрение этих технологий в медицинскую практику. В отношении экономической эффективности внедрения ИИ в здравоохранение можно привести результаты анализа Национального бюро экономических исследований США, проведённого в 2022 г. [119]. Согласно выводам экспертов, более широкое внедрение ИИ может способствовать экономии 5–10% расходов на здравоохранение в США ― примерно 200–360 млрд долларов в год (в долларах 2019 года). Данные оценки основаны на конкретных сценариях использования ИИ, где применяются современные технологии, которые могут быть реализованы в течение следующих пяти лет и не приведут к снижению качества медицинских услуг или доступа к ним. Эти возможности также могут привести к нефинансовым выгодам, таким как повышение качества медицинского обслуживания, расширение доступа к услугам, улучшение опыта пациентов и повышение удовлетворённости врачей.
В данном обзоре мы не затронули вопросы использования технологий Г-ИИ в научных исследованиях и приложениях, предназначенных для пациентов, хотя эти направления также имеют большие перспективы развития в ближайшие годы.
ЗАКЛЮЧЕНИЕ
Искусственный интеллект всё чаще позиционируется как революционная технология, способная вывести клиническую практику на принципиально новый уровень. В травматологии и ортопедии, как и в хирургической практике в целом, технологии Г-ИИ могут применяться на всех этапах оказания медицинской помощи — от постановки диагноза до контроля процессов реабилитации пациента на дому.
Однако большинство публикаций, посвящённых применению Г-ИИ в хирургии, травматологии и ортопедии, носит характер пробных внедрений или лабораторных экспериментов. При этом практически отсутствуют данные о внедрении этих технологий в повседневную клиническую практику, свидетельства их устойчивого использования, анализ приемлемости, эффективности и экономического эффекта. Вместе с тем результаты экономических исследований говорят о том, что затраты на начальную разработку и внедрение технологий ИИ в клиническую практику могут окупиться в течение пяти лет без снижения качества медицинской помощи и повлечь за собой значимые нефинансовые преимущества.
Как говорится в Национальной стратегии развития ИИ, Российская Федерация обладает существенным потенциалом для того, чтобы стать одним из международных лидеров в развитии и использовании технологий ИИ. Этому способствуют высокий уровень базового физико-математического образования, сильная естественно-научная школа, наличие компетенций в области моделирования и программирования.
Безусловно, сегодня применение технологий Г-ИИ требует сбалансированных подходов и совместных усилий всех заинтересованных сторон по преобразованию теоретических концепций в практическую клиническую реализацию. Необходимы дополнительные исследования на основе принципов доказательной медицины, чтобы обеспечить технологиям Г-ИИ успешную и безопасную трансляцию в практическое здравоохранение.
ДОПОЛНИТЕЛЬНО
Вклад авторов. А.Г. Назаренко — постановка задачи, редактирование текста статьи; Е.Б. Клеймёнова — формулировка требований к структуре обзора, редактирование текста статьи; А.И. Молодченков — поиск и отбор источников литературы, редактирование текста статьи; Н.М. Какабадзе — обзор литературы, оформление статьи; Л.П. Яшина — сбор и анализ литературных источников, написание текста статьи. Все авторы одобрили рукопись (версию для публикации), а также согласились нести ответственность за все аспекты работы, гарантируя надлежащее рассмотрение и решение вопросов, связанных с точностью и добросовестностью любой её части.
Источник финансирования. Исследование и публикация осуществлены при поддержке Российского научного фонда (грант РНФ № 24-14-00310).
Раскрытие интересов. Авторы заявляют об отсутствии отношений, деятельности и интересов за последние три года, связанных с третьими лицами (коммерческими и некоммерческими), интересы которых могут быть затронуты содержанием статьи.
Рассмотрение и рецензирование. Настоящая работа подана в журнал в инициативном порядке и рассмотрена по обычной процедуре. В рецензировании участвовали два внешних рецензента, член редакционной коллегии и научный редактор издания.
ADDITIONAL INFO
Author contribution. A.G. Nazarenko — development of system requirements, editing of the article; E.B. Kleymenova — requirements for review structure, editing of the article; A.I. Molodchenkov — search and selection of literature sources, editing of the article; N.M. Kakabadze — literature review, paper preparation; L.P. Yashina — search and analysis of literature, writing the article. Thereby, all authors provided approval of the version to be published and agree to be accountable for all aspects of the work in ensuring that questions related to the accuracy or integrity of any part of the work are appropriately investigated and resolved.
Funding source. This work was supported by the Russian Science Foundation (RSF project No. 24-14-00310).
Disclosure of interests. The authors declare the absence of relationships, activities and interests (personal, professional or financial) related to third parties (commercial, non-profit, private), whose interests may be affected by the content of the article, as well as other relationships, activities and interests over the past three years, which must be reported.
Provenance and peer-review. This paper was submitted to the journal on an initiative basis and reviewed according to the usual procedure. Two external reviewers, a member of the editorial board and the scientific editor of the publication participated in the review.
1 Утверждена Указом Президента Российской Федерации № 490 от 10.10.2019 г. (в редакции Указа Президента Российской Федерации № 124 от 15.02.2024 г.).
2 https://ru.ruwiki.ru/wiki/Generative_pre-trained_transformer#mw-header
3 https://blog.skillfactory.ru/glossary/nlp/
4 https://habr.com/ru/companies/skillfactory/articles/837366/
5 Национальная стратегия развития искусственного интеллекта на период до 2030 года. Утверждена Указом Президента Российской Федерации № 490 от 10.10.2019 г. (в редакции Указа Президента Российской Федерации № 124 от 15.02.2024 г.).
6 https://ru.ruwiki.ru/wiki/Generative_pre-trained_transformer#cite_ref-gpt1paper_1-0
7 https://explodingtopics.com/blog/chatgpt-users
8 https://руни.рф/Виртуальный_собеседник
作者简介
Anton Nazarenko
Priorov National Medical Research Center for Traumatology and Orthopedics
Email: NazarenkoAG@cito.priorov.ru
ORCID iD: 0000-0003-1314-2887
SPIN 代码: 1402-5186
MD, Dr. Sci. (Medicine), рrofessor RAS
俄罗斯联邦, 9 Novospassky per., 115172 MoscowElena Kleimenova
Priorov National Medical Research Center for Traumatology and Orthopedics
Email: KleymenovaEB@cito-priorov.ru
ORCID iD: 0000-0002-8745-6195
SPIN 代码: 2037-7164
MD, Dr. Sci. (Medicine), рrofessor
俄罗斯联邦, 9 Novospassky per., 115172 MoscowNodari Kakabadze
Priorov National Medical Research Center for Traumatology and Orthopedics
Email: KakabadzeNM@cito-priorov.ru
ORCID iD: 0000-0002-2380-2394
SPIN 代码: 6321-6733
俄罗斯联邦, 9 Novospassky per., 115172 Moscow
Alexey Molodchenkov
Federal Research Center «Computer Science and Control» of the Russian Academy of Sciences; Peoples’ Friendship University of Russia
Email: aim@isa.ru
ORCID iD: 0000-0003-0039-943X
SPIN 代码: 3378-7234
Cand. Sci. (Engineering)
俄罗斯联邦, Moscow; MoscowLiubov Yashina
Priorov National Medical Research Center for Traumatology and Orthopedics
编辑信件的主要联系方式.
Email: YashinaLP@cito-priorov.ru
ORCID iD: 0000-0003-1357-0056
SPIN 代码: 1910-0484
Cand. Sci. (Biology)
俄罗斯联邦, 9 Novospassky per., 115172 Moscow参考
- Goldman S. AI investment forecast to approach $200 billion globally by 2025. [2023 Aug 1]. Available from: https://www.goldmansachs.com/insights/articles/ai-investment-forecast-to-approach-200-billion-globally-by-2025 Accessed: 14.10.2024.
- Gartner says more than 80% of enterprises will have used generative AI APIs or deployed generative AI-enabled applications by 2026. [2023 Oct 11]. Available from: https://www.gartner.com/en/newsroom/press-releases/2023-10-11-gartner-says-more-than-80-percent-of-enterprises-will-have-used-generative-ai-apis-or-deployed-generative-ai-enabled-applications-by-2026 Accessed: 15.10.2024.
- Masyuk D, Sergienko Ya. Artificial Intelligence in Russia — 2023: Trends and Prospects. Moscow: Yakov and Partners; 2023. 80 p. Available from: https://yakovpartners.ru/upload/iblock/c5e/c8t1wrkdne5y9a4nqlicderalwny7xh4/20231218_AI_future.pdf (in Russ.)
- Bastian M. GPT-4 has more than a trillion parameters. [2023 Mar 25]. Available from: https://the-decoder.com/gpt-4-has-a-trillion-parameters/#summary
- WHO Guideline: Recommendations on digital interventions for health system strengthening. Geneva: WHO; 2019. 124 p. Available from: https://www.who.int/reproductivehealth/publications/digital-interventions-health-system-strengthening/en.
- WHO guidance. Ethics and governance of artificial intelligence for health. Geneva: World Health Organization; 2021. 165 р. Available from: https://www.who.int/publications/i/item/9789240029200
- WHO guidance. Ethics and governance of artificial intelligence for health. Guidance on large multi-modal models. Geneva: World Health Organization; 2024. 98 р. Available from: https: //www.who.int/publications/i/item /9789240084759
- GOST R 59277-2020. Artificial intelligence systems. Classification of artificial intelligence systems (appr. 23.12.2020). Moscow: Standartinform; 2021 (in Russ.)
- Muhammad A, Vissa S. Using the capabilities of hybrid generative-discriminative models. [2024 Apr 17]. Available from: https://skine.ru/articles/737238.
- Generative AI vs. discriminative AI: understanding the key differences. [2024 Jul 24]. Available from: https://www.geeksforgeeks.org/difference-between-generative-ai-and-discriminative-ai
- Osipov YuS, editor. Neural network. The Great Russian Encyclopedia: [in 35 volumes]. Moscow: The Great Russian Encyclopedia; 2004–2017. (in Russ.)
- Zsidai B, Kaarre J, Narup E, et al.; ESSKA Artificial Intelligence Working Group. A practical guide to the implementation of artificial intelligence in orthopaedic research-Part 2: A technical introduction. J Exp Orthop. 2024;11(3):e12025. doi: 10.1186/s40634-023-00662-4
- Moulaei K, Yadegari A, Baharestani M, et al. Generative artificial intelligence in healthcare: A scoping review on benefits, challenges and applications. Int J Med Inform. 2024;188:105474. doi: 10.1016/j.ijmedinf.2024.105474
- Manning CD. Human language understanding and reasoning. Daedalus. 2022;151(2):127–138. doi: 10.1162/DAED_a_01905
- Rodler S, Ganjavi C, Backerd PD. Generative artificial intelligence in surgery. Surgery. 2024;175(6):1496–1502. doi: 10.1016/j.surg.2024.02.019
- Bugaj M, Kliestik T, Lăzăroiu G. Generative artificial intelligence-based diagnostic algorithms in disease risk detection, in personalized and targeted healthcare procedures, and in patient care safety and quality. Contemp Read Law Soc. Justice. 2023;15:9–26.
- Tanveer SA, Fatima B, Ghafoor R. Diagnostic accuracy of artificial intelligence versus manual detection in marginal bone loss around fixed prosthesis. a systematic review. J Pak Med Assoc. 2024;74(4 Suppl):S37–S42. doi: 10.47391/JPMA.AKU-9S-06
- Michelutti L, Tel A, Zeppieri M, et al. Generative adversarial networks (GANs) in the field of head and neck surgery: current evidence and prospects for the future-a systematic review. J Clin Med. 2024;13(12):3556. doi: 10.3390/jcm13123556
- Schukow C, Smith SC, Landgrebe E, et al. Application of ChatGPT in routine diagnostic pathology: promises, pitfalls, and potential future directions. Adv Anat Pathol. 2023;31(1):15–21. doi: 10.1097/PAP.0000000000000406
- Haemmerli J, Sveikata L, Nouri A, et al. ChatGPT in glioma adjuvant therapy decision making: Ready to assume the role of a doctor in the tumor board? BMJ Health Care Inform. 2023;30(1):e100775. doi: 10.1136/bmjhci-2023-100775
- Chen TC, Kaminski E, Koduri L, et al. Chat GPT as a Neuro-score Calculator: Analysis of a large language model’s performance on various neurological exam grading scales. World Neurosurg. 2023;179:e342–e347. doi: 10.1016/j.wneu.2023.08.088
- Rizwan A, Sadiq T. The use of AI in diagnosing diseases and providing management plans: a consultation on cardiovascular disorders with ChatGPT. Cureus. 2023;15(8):e43106. doi: 10.7759/cureus.43106
- Gala D, Makaryus AN. The utility of language models in cardiology: a narrative review of the benefits and concerns ofChatGPT-4. Int J Environ Res Public Health. 2023;20(15):6438. doi: 10.3390/ijerph20156438
- Buga M, Kliestik T, Lăzăroiu G. Generative artificial intelligence-based diagnostic algorithms in disease risk detection, in personalized and targeted healthcare procedures, and in patient care safety and quality. Contemp Read Law Soc Justice. 2023;15:9–26.
- Eppler MB, Ganjavi C, Knudsen JE, et al. Bridging the gap between urological research and patient understanding: the role of large language models in automated generation of layperson’s summaries. Urol Pract. 2023;10(5):436e443. doi: 10.1097/UPJ.0000000000000428
- Javaid M, Haleem A, Singh RP. ChatGPT for healthcare services: An emerging stage for an innovative perspective. BenchCouncil Trans. Benchmarks Stand Eval. 2023;3:100105. doi: 10.1016/j.tbench.2023.100105
- Sharma SC, Ramchandani JP, Thakker A, Lahiri A. ChatGPT in plastic and reconstructive surgery. Indian J Plast Surg. 2023;56(4):320–325. doi: 10.1055/s-0043-1771514
- Aljindan FK, Shawosh MH, Altamimi L, et al. Utilization of ChatGPT-4 in plastic and reconstructive surgery: a narrative review. Plast Reconstr Surg Glob Open. 2023;11(10):e5305. doi: 10.1097/GOX.0000000000005305
- Zhou XY, Guo Y, Shen M, Yang GZ. Application of artificial intelligence in surgery. Front Med. 2020;14(4):417–430. doi: 10.1007/s11684-020-0770-0
- Zhou XY, Yang GZ, Lee SL. A real-time and registration-free framework for dynamic shape instantiation. Med Image Anal. 2018;44:86–97. doi: 10.1016/j.media.2017.11.009
- van der Stap N, van der Heijden F, Broeders IA. Towards automated visual flexible endoscope navigation. Surg Endosc. 2013;27(10):3539–3547. doi: 10.1007/s00464-013-3003-7
- Shen M, Gu Y, Liu N, Yang GZ. Context-aware depth and pose estimation for bronchoscopic navigation. IEEE Robot Autom Lett. 2019;4(2):732–739. doi: 10.1109/LRA.2019.2893419
- Ozyoruk KB, Gokceler GI, Bobrow TL, et al. EndoSLAM dataset and an unsupervised monocular visual odometry and depth estimation approach for endoscopic videos. Med Image Anal. 2021;71:102058. doi: 10.1016/j.media.2021.102058
- Yang Z, Lin S, Simon R, Linte CA. Endoscope Localization and Dense Surgical Scene Reconstruction for Stereo Endoscopy by Unsupervised Optical Flow and Kanade-Lucas-Tomasi Tracking. Annu Int Conf IEEE Eng Med Biol Soc. 2022;2022:4839–4842. doi: 10.1109/EMBC48229.2022.9871588
- Song J, Wang J, Zhao L, et al. MIS-SLAM: real-time large-scale dense deformable SLAM system in minimal invasive surgery based on heterogeneous computing. IEEE Robot Autom Lett. 2018;3(4):4068–4075. doi: 10.1109/lra.2018.2856519
- Turan M, Almalioglu Y, Araujo H, et al. Deep endovo: a recurrent convolutional neural network (RCNN) based visual odometry approach for endoscopic capsule robots. Neurocomputing. 2018;275:1861–1870.
- Kalfas IH. Machine vision navigation in spine surgery. Front Surg. 2021;8:1–7. doi: 10.3389/fsurg.2021.640554
- Massalimova A, Timmermans M, Esfandiari H, et al. Intraoperative tissue classification methods in orthopedic and neurological surgeries: A systematic review. Front Surg. 2022;9:952539. doi: 10.3389/fsurg.2022.952539
- Timmermans M, Massalimova A, Li R, et al. State-of-the-art of non-radiative, non-visual spine sensing with a focus on sensing forces, vibrations and bioelectrical properties: a systematic review. Sensors (Basel). 2023;23(19):8094. doi: 10.3390/s23198094
- Wang J, Suenaga H, Hoshi K, et al. Augmented reality navigation with automatic marker-free image registration using 3-D image overlay for dental surgery. IEEE Trans Biomed Eng. 2014;61(4):1295–1304. doi: 10.1109/TBME.2014.2301191
- Gouveia PF, Costa J, Morgado P, et al. Breast cancer surgery with augmented reality. Breast. 2021;56:14–17. doi: 10.1016/j.breast.2021.01.004
- Carl B, Bopp M, Benescu A, Saß B, Nimsky C. Indocyanine green angiography visualized by augmented reality in aneurysm surgery. World Neurosurg. 2020;142:e307–e315. doi: 10.1016/j.wneu.2020.06.219
- Carl B, Bopp M, Saß B, Nimsky C. Microscope-based augmented reality in degenerative spine surgery: initial experience. World Neurosurg. 2019;128:e541–e551. doi: 10.1016/j.wneu.2019.04.192
- Edström E, Burström G, Omar A, et al. Augmented reality surgical navigation in spine surgery to minimize staff radiation exposure. Spine. 2020;45(1):E45–E53. doi: 10.1097/BRS.0000000000003197
- Zhang X, Wang J, Wang T, et al. A markerless automatic deformable registration framework for augmented reality navigation of laparoscopy partial nephrectomy. Int J CARS. 2019;14(8):1285–1294. doi: 10.1007/s11548-019-01974-6
- Luo H, Yin D, Zhang S., et al. Augmented reality navigation for liver resection with a stereoscopic laparoscope. Comput Methods Programs Biomed. 2020;187:105099. doi: 10.1016/j.cmpb.2019.105099
- Lefter LP, Walker SR, Dewhurst F, Turner RW. An audit of operative notes: facts and ways to improve. ANZ J Surg. 2008;78:800–2. doi: 10.1111/j.1445-2197.2008.04654.x
- Abdelhady AM, Davis CR. Plastic surgery and artificial intelligence: how ChatGPT improved operation note accuracy, time, and education. Mayo Clinic Proceedings: Digital Health. 2023;1:299e308. doi: 10.1016/j.mcpdig.2023.06.002
- Singh S, Djalilian A, Al MJ. ChatGPT and ophthalmology: exploring its potential with discharge summaries and operative notes. Semin Ophthalmol. 2023;38(5):503–507. doi: 10.1080/08820538.2023.2209166
- Waisberg E, Ong J, Masalkhi M, et al. GPT-4 and ophthalmology operative notes. Ann Biomed Eng. 2023;51(11):2353–2355. doi: 10.1007/s10439-023-03263-5.
- Ali A, Kumar RP, Polavarapu H, et al. Bridging the gap: can large language models match human expertise in writing neurosurgical operative notes? World Neurosurg. 2024:192:e34–e41. doi: 10.1016/j.wneu.2024.08.062
- Dubinski D, Won SY, Trnovec S, et al. Leveraging artificial intelligence in neurosurgery-unveiling ChatGPT for neurosurgical discharge summaries and operative reports. Acta Neurochir (Wien). 2024;166(1):38. doi: 10.1007/s00701-024-05908-3
- Robinson A, Aggarwal SJr. When precision meets penmanship: ChatGPT and surgery documentation. Cureus. 2023;15(6):e40546. doi: 10.7759/cureus.40546
- Arif F. ChatGPT for the standardized operative notes in plastic surgery. J Liaquat Nat. Hosp. 2023;1(2):111–113.
- Jung JJ, Elfassy J, Jüni P, Grantcharov T. Adverse events in the operating room: Definitions, prevalence, and characteristics. A systematic review. World J Surg. 2019;43(10):2379–2392. doi: 10.1007/s00268-019-05048-1
- Eppler MB, Sayegh AS, Maas M, et al. Automated capture of intraoperative adverse events using artificial intelligence: a systematic review and meta-analysis. J Clin Med. 2023;12(4):1687. doi: 10.3390/jcm12041687
- Yamazaki Y, Kanaji S, Matsuda T, et al. Automated surgical instrument detection from laparoscopic gastrectomy video images using an open source convolutional neural network platform. J Am Col. Surg. 2020;230(5):725–732.e1. doi: 10.1016/j.jamcollsurg.2020.01.037
- Hegde SR, Namazi B, Iyengar N, et al. Automated segmentation of phases, steps, and tasks in laparoscopic cholecystectomy using deep learning. Surg Endosc. 2024;38(1):158–170. doi: 10.1007/s00464-023-10482-3
- Lee D, Yu HW, Kwon H, et al. Evaluation of surgical skills during robotic surgery by deep learning-based multiple surgical instrument tracking in training and actual operations. J Clin Med. 2020;9:1964. doi: 10.3390/jcm9061964
- Cacciamani GE, Anvar A, Chen A, et al. How the use of the artificial intelligence could improve surgical skills in urology: State of the art and future perspectives. Curr Opin Urol. 2021;31(4):378–384. doi: 10.1097/MOU.0000000000000890
- Peregrin T. Black box technology shines light on improving OR safety, efficiency. ACS Bulletin. 2023;108(7):17–23.
- Jung JJ, Jüni P, Lebovic G, Grantcharov T. First-year analysis of the operating room black box study. Ann Surg. 2020;271(1):122–127. doi: 10.1097/SLA.0000000000002863
- Al Abbas AI, Meier J, Daniel W, et al. Impact of team performance on the surgical safety checklist on patient outcomes: an operating room black box analysis. Surg Endosc. 2024;38:5613–5622 doi: 10.1007/s00464-024-11064-7
- Gordon L, Grantcharov T, Rudzicz F. Explainable artificial intelligence for safe intraoperative decision support. JAMA Surg. 2019;154(11):1064–1065. doi: 10.1001/jamasurg.2019.2821
- Lundberg SM, Nair B, Vavilala MS, et al. Explainable machine-learning predictions for the prevention of hypoxaemia during surgery. Nat Biomed Eng. 2018;2(10):749–760. doi: 10.1038/s41551-018-0304-0
- Zeng X, Hu Y, Shu L. et al. Explainable machine-learning predictions for complications after pediatric congenital heart surgery. Sci Rep. 2021;11:17244. doi: 10.1038/s41598-021-96721-w
- Park J-B, Lee H-J, Yang H-L, et al. Machine learning-based prediction of intraoperative hypoxemia for pediatric patients. PLoS ONE. 2023;18(3):e0282303. doi: 10.1371/journal.pone.0282303
- Bektaş M, Pereira JK, Daams F, et al. ChatGPT in surgery: a revolutionary innovation? Surg. Today. 2024;54:964–971. doi: 10.1007/s00595-024-02800-6
- Liu S, Wright AP, Patterson BL, et al. Using AI-generated suggestions from ChatGPT to optimize clinical decision support. J Am Med Inform Assoc. 2023;30(7):1237–1245. doi: 10.1093/jamia/ocad072
- Liu S, McCoy AB, Peterson JF, et al. Leveraging explainable artificial intelligence to optimize clinical decision support. J Am Med Inform Assoc. 2024;31(4):968–974. doi: 10.1093/jamia/ocae019
- Averkin AN. Explainable artificial intelligence as part of the third generation artificial intelligence. Speech technologies. 2023;(1):4–10. (In Russ.) EDN: ONAIEY
- Van De Sande D, Van Genderen ME, Braaf H, et al. Moving towards clinical use of artificial intelligence in intensive care medicine: business as usual? Intensive Care Med. 2022;48(12):1815–7. doi: 10.1007/s00134-022-06910-y
- Deasy J, Liò P, Ercole A. Dynamic survival prediction in intensive care units from heterogeneous time series without the need for variable selection or curation. Sci Rep. 2020;10(1):22129. doi: 10.1038/s41598-020-79142-z
- Abgrall G, Holder AL, Chelly Dagdia Z, et al. Should AI models be explainable to clinicians? Crit Care. 2024;28:301. doi: 10.1186/s13054-024-05005-y
- Savage N. Breaking into the black box of artificial intelligence. Nature. 2022. doi: 10.1038/d41586-022-00858-1
- Patel SB, Lam K. ChatGPT: the future of discharge summaries? Lancet Digit Health. 2023;5(3):e107–e108. doi: 10.1016/S2589-7500(23)00021-3
- Earnshaw CH, Pedersen A, Evans J. Improving the quality of discharge summaries through a direct feedback system. Future Healthc J. 2020;7(2):149–154. doi: 10.7861/fhj.2019-0046
- Unnewehr M, Schaaf B, Marev R, et al. Optimizing the quality of hospital discharge summaries — a systematic review and practical tools. Postgraduate Med. 2015;127(6):630–639. doi: 10.1080/00325481.2015.1054256
- Salim Al-Damluji M, Dzara K, Hodshon B, et al. Association of discharge summary quality with readmission risk for patients hospitalized with heart failure exacerbation. Circ Cardiovasc Qual Outcomes. 2015;8:109–111. doi: 10.1161/CIRCOUTCOMES.114.001476
- Wood H, Lewis H, Ward R, et al. Improving community prescribing of post-fracture denosumab after discharge. Br J Hosp Med. 2017;78(1):20–22. doi: 10.12968/hmed.2017.78.1.20
- Carter A, Warner E, Roberton A, et al. Tonsillectomy discharge information-An improvement in both patient safety and satisfaction. BMJ Open Quality. 2014;2(2):u203433-u2w1546. doi: 10.1136/bmjquality.u203433.w1546
- Lee P, Bubeck S, Petro J. Benefits, limits, and risks of GPT-4 as an AI chatbot for medicine. N Engl J Med. 2023;388(13):1233–1239. doi: 10.1056/NEJMsr2214184
- Dubinski D, Won SY, Trnovec S, et al. Leveraging artificial intelligence in neurosurgery — unveiling ChatGPT for neurosurgical discharge summaries and operative reports. Acta Neurochir. 2024;166:38. doi: 10.1007/s00701-024-05908-3
- Clough RAJ, Sparkes WA, Clough OT, et al. Transforming healthcare documentation: harnessing the potential of AI to generate discharge summaries. BJGP Open. 2024;8(1):BJGPO.2023.0116. doi: 10.3399/BJGPO.2023.0116
- Ando K, Okumura T, Komachi M, et al. Is artificial intelligence capable of generating hospital discharge summaries from inpatient records? PLOS Digit Health. 2022;1(12):e0000158. doi: 10.1371/journal.pdig.0000158
- Konstantinova LV, Vorozhikhin VV, Petrov AM, Titova ES. Generative Artificial Intelligence: Challenges for Traditional Education: Results of Monitoring Information on Trends in the Development of Higher Education in the World and in Russia. Moscow: Plekhanov Russian University of Economics; 2023. 85 р. (In Russ.)
- Oh N, Choi GS, Lee WY. ChatGPT goes to the operating room: evaluating GPT-4 performance and its potential in surgical education and training in the era of large language models. Ann Surg Treat Res. 2023;104(5):269–273. doi: 10.4174/astr.2023.104.5.269
- Blumstein G, Zukotynski B, Cevallos N, et al. Randomized trial of a virtual reality tool to teach surgical technique for tibial shaft fracture intramedullary nailing. J Surg Educ. 2020;77:969–977. doi: 10.1016/j.jsurg.2020.01.002
- Mirchi N, Bissonnette V, Ledwos N, et al. Artificial neural networks to assess virtual reality anterior cervical discectomy performance. Oper Neurosurg (Hagerstown). 2019;19:65–75. doi: 10.1093/ons/opz359
- Guerrero DT, Asaad M, Rajesh A, et al. Advancing surgical education: the use of artificial intelligence in surgical training. Am Surg. 2023;89(1):49–54. doi: 10.1177/00031348221101503
- Winkler-Schwartz A, Yilmaz R, Mirchi N, et al. Machine learning identification of surgical and operative factors associated with surgical expertise in virtual reality simulation. JAMA Netw Open. 2019;2:e198363. doi: 10.1001/jamanetworkopen.2019.8363
- Bilgic E, Gorgy A, Yang A, et al. Exploring the roles of artificial intelligence in surgical education: A scoping review. Am J Surg. 2022;224(1 Pt A):205–216. doi: 10.1016/j.amjsurg.2021.11.023
- Caserta M, Romero AG. A novel approach to forecast surgery durations using machine learning techniques. Health Care Manag Sci. 2024;27:313–327. doi: 10.1007/s10729-024-09681-8
- ShahabiKargar Z, Khanna S., Good N, et al. Predicting procedure duration to improve scheduling of elective surgery. Lecture Notes in Computer Science. 2014; 8862:998–1009. doi: 10.1007/978-3-319-13560-1_86
- Hassanzadeh H, Boyle J, Khanna S, Biki B, Syed F. Daily surgery caseload prediction: towards improving operating theatre efficiency. BMC Med Inform Decis Mak. 2022;22(1):151. doi: 10.1186/s12911-022-01893-8
- Riahi V, Hassanzadeh H, Khanna S, et al. Improving preoperative prediction of surgery duration. BMC Health Serv Res. 2023;23:1343. doi: 10.1186/s12913-023-10264-6
- Bellini V, Russo M, Domenichetti T, et al. Artificial intelligence in operating room management. J Med Syst. 2024;48:19. doi: 10.1007/s10916-024-02038-2
- Javaid M, Haleem A, Singh RP. ChatGPT for healthcare services: An emerging stage for an innovative perspective. BenchCouncil Trans. Benchmarks Stand Eval. 2023;3(1):100105. doi: 10.1016/j.tbench.2023.100105
- Letourneau-Guillon L, Camirand D, Guilbert F, Forghani R. Artificial intelligence applications for workflow, process optimization and predictive analytics. Neuroimaging Clin N Am. 2020;30(4):e1–e15. doi: 10.1016/j.nic.2020.08.008
- Dos Santos FC, Johnson LG, Madandola OO, et al. An example of leveraging AI for documentation: ChatGPT-generated nursing care plan for an older adult with lung cancer. J Am Med Inform Assoc. 2024;31(9):2089–2096. doi: 10.1093/jamia/ocae116
- Pressman SM, Borna S, Gomez-Cabello CA, et al. Clinical and surgical applications of large language models: a systematic review. J Clin Med. 2024;13(11):3041. doi: 10.3390/jcm13113041
- Mehdian R, Howard M. Artificial intelligence in trauma and orthopedics. In: Artificial intelligence in medicine. Lidströmer N, Ashrafian H, editors. Springer Nature Switzerland; 2022. Р. 873–886. doi: 10.1007/978-3-030-64573-1_256
- Pankhania M. Artificial intelligence in musculoskeletal radiology: past, present, and future. Indian J Musculoskelet Radiol. 2020;2(2):89–96. doi: 10.25259/IJMSR_62_2020
- Ajmera P, Kharat A, Botchu R, et al. Real-world analysis of artificial intelligence in musculoskeletal trauma. J Clin Orthop Trauma. 2021;22:101573. doi: 10.1016/j.jcot.2021.101573
- Kurmis AP, Ianunzio JR. Artificial intelligence in orthopedic surgery: evolution, current state and future directions. Arthroplasty. 2022;4(1):9. doi: 10.1186/s42836-022-00112-z
- Merali ZA, Colak E, Wilson JR. Applications of machine learning to imaging of spinal disorders: current status and future directions. Global Spine J. 2021;11(1_suppl):23S–29S. doi: 10.1177/2192568220961353
- Dai G, Su J, Zhang M, et al. A novel structure preserving generative adversarial network for CT to MR modality translation of spine. Neural Comput Applic. 2024;36:4101–4114. doi: 10.1007/s00521-023-09254-w
- Komeili A, Westover L, Parent EC, et al. Monitoring for idiopathic scoliosis curve progression using surface topography asymmetry analysis of the torso in adolescents. Spine J. 2015;15(4):743–751. doi: 10.1016/j.spinee.2015.01.018
- Anwar A, Zhang Y, Zhang Z, Li J. Artificial intelligence technology improves the accuracy of preoperative planning in primary total hip arthroplasty. Asian J Surg. 2024;47(7):2999–3006. doi: 10.1016/j.asjsur.2024.01.133
- Abel F, Lebl DR, Gorgy G, et al. Deep-learning reconstructed lumbar spine 3D MRI for surgical planning: pedicle screw placement and geometric measurements compared to CT. Eur Spine J. 2024;33(11):4144–4154. doi: 10.1007/s00586-023-08123-3
- Racadio JM, Nachabe R, Homan R, et al. Augmented reality on a C-arm system: a preclinical assessment for percutaneous needle localization. Radiology. 2016;281(1):249–255. doi: 10.1148/radiol.2016151040
- Nam CH, Lee SC, Kim JH, et al. Robot-assisted total knee arthroplasty improves mechanical alignment and accuracy of component positioning compared to the conventional technique. J Exp Orthop. 2022;9(1):108. doi: 10.1186/s40634-022-00546-z
- Dennler C, Jaberg L, Spirig J, et al. Augmented reality-based navigation increases precision of pedicle screw insertion. J Orthop Surg Res. 2020;15(1):174. doi: 10.1186/s13018-020-01690-x
- Holden MA, Haywood KL, Potia TA, et al. Recommendations for exercise adherence measures in musculoskeletal settings: a systematic review and consensus meeting. Syst Rev. 2014;3(1):10. doi: 10.1186/2046-4053-3-10
- McDermott ER, DeFoor MT, Dekker TJ, DePhillipo NN. Artificial intelligence in rehabilitation. In: Artificial intelligence in orthopaedic surgery made easy. Familiari F, Galasso O, Gasparini G, editors. Springer; 2024. Р. 197–204. doi: 10.1007/978-3-031-70310-2_15
- Khosravi B, Rouzrokh P, Erickson BJ, et al. Analyzing racial differences in imaging joint replacement registries using generative artificial intelligence: advancing orthopaedic data equity. Arthroplast Today. 2024;29:101503. doi: 10.1016/j.artd.2024.101503
- Ahn G, Choi BS, Ko S, et al. High-resolution knee plain radiography image synthesis using style generative adversarial network adaptive discriminator augmentation. J Orthop Res. 2023;41(1):84–93. doi: 10.1002/jor.25325
- Na L, Yang C, Lo CC, et al. Feasibility of reidentifying individuals in large National Physical Activity data sets from which protected health information has been removed with use of machine learning. JAMA Netw Open. 2018;1(8):e186040. doi: 10.1001/jamanetworkopen.2018.6040
- Sahni N, Stein G, Zemmel R, Cutler DM. The potential impact of artificial intelligence on healthcare spending. NBER Working Paper No. 30857, 2023. Available from: https://www.nber.org/system/files/working_papers/w30857/w30857.pdf Accessed: 22.11.2024
补充文件
