http://doi.org/10.26347/1607-2502202511-12031-045
Клинические исследования стали ключевым инструментом контроля безопасности, эффективности и качества медицинских изделий, включая программное обеспечение как медицинское изделие. Сбор клинических данных является обязательной частью процедуры регистрации программных медицинских изделий во многих странах. Особое внимание уделяется программного обеспечения как медицинского изделия с применением технологий искусственного интеллекта (ПМИ с ИИ), предназначенным для анализа медицинских изображений, поскольку они относятся к наивысшему классу риска и требуют проведения масштабных клинических исследований для подтверждения его безопасности и эффективности. Несмотря на нормативные требования, реальная практика КИ для ПМИ с ИИ остается ограниченной по виду дизайнов испытаний, в отличие от испытаний для лекарственных средств. Цель данного обзора - изучить современные подходы к планированию и проведению КИ ПМИ с ИИ, особенно в области лучевой диагностики, с акцентом на сбор доказательных клинических данных для регуляторных решений. В ходе подготовки данного обзора было выявлено, что при рассмотрении дизайнов клинических испытаний ПМИ с ИИ важным аспектом является анализ функции интерпретации ПМИ с ИИ. Для ПМИ с ИИ в лучевой диагностике чаще всего используются ретроспективные когортные и попарные дизайны, позволяющие сравнивать работу ПМИ с ИИ относительно эталонных значений при проведении КИ в одно- и многоцентровом виде. В качестве метрик применяются стандартные показатели, основанные на четырехпольной таблице, ROC-анализ, коэффициенты точности сегментации (Дайса, Хаусдорфа) и Bland-Altman-корреляция. Качественное формирование набора данных, в том числе обоснование эталона, обеспечивают достоверность результатов исследований и минимизируют погрешности, возникающие при интерпретации изображений.
Ключевые слова: программное обеспечение, искусственный интеллект, клинические испытания, оценка качества, обзор.
Clinical trials have become a key tool for monitoring the safety, efficacy, and quality of medical devices, including software as a medical device (SaMD). Clinical data collection is a mandatory part of the registration procedure for software-based medical devices in many countries. Particular attention is paid to AI-enabled SaMDs (SAMDs) designed for medical image analysis, as they are classified as the highest risk and require large-scale clinical trials to confirm their safety and efficacy. Despite regulatory requirements, the actual practice of clinical trials for AI-enabled SaMDs remains limited in terms of trial designs, unlike trials for medicinal products. The aim of this review is to examine current approaches to planning and conducting AI-enabled SaMD trials, particularly in the field of radiology, with a focus on collecting evidence-based clinical data for regulatory decisions. During the preparation of this review, it was found that when considering the designs of clinical trials for AI-enabled SaMDs, an important aspect is the analysis of the interpretation function of the AI-enabled SaMDs. Retrospective cohort and paired designs are most commonly used for PMI with AI in radiodiagnosis. These designs allow for comparison of PMI with AI performance against reference values during clinical trials at both single- and multicenter sites. Standard metrics based on a four-field table, ROC analysis, segmentation accuracy coefficients (Dice, Hausdorff), and the Bland-Altman correlation are used. High-quality dataset formation, including reference validation, ensures the reliability of study results and minimizes errors arising during image interpretation.
Keywords: software, artificial intelligence, clinical trial protocols as topic, software validation, review.