http://doi.org/10.26347/1607-2502202401-02028-037
Введение. В статье описана методика и программный комплекс, предназначенные для дифференциальной диагностики аллергического и локального аллергического ринитов по информационно-значимым симптомам, имеющим диагностическое значение в категориях «Жалобы», «Анамнез» и «Объективный статус» с использованием метода машинного обучения Random Forest.Цель. Разработка методики и компьютерной программы для повышения эффективности дифференциальной диагностики аллергического ринита и локального аллергического ринита.Материалы и методы. Для выполнения исследования было обследовано 260 пациентов- женщин в возрасте от 18 до 71 года, из них 214 пациентов с заболеванием аллергический хронический ринит и 46 пациентов с заболеванием локальный хронический ринит. Разработана модель бинарного классификатора, алгоритмическую основу, которого составляет ансамблевый метод машинного обучения Random Forest.Результаты и заключение. Разработан алгоритм и программа для проведения дифференциальной диагностики аллергического ринита и локального аллергического ринита. С помощью матрицы ошибок и ROC-кривой получены значения основных метрик оценки качества бинарной классификации по каждой из категорий симптомов. Показатели качества (общая точность) превышает 0,98, что говорит о возможности использования разработанного классификатора для решения практических задач. Выявлены информационно значимые симптомы в каждой категории. Описанный алгоритм и программный продукт могут быть использованы врачами в качестве инструмента для диагностики в сомнительных случаях без применения лабораторных методов исследования.
Ключевые слова: ансамблевый метод, бэггинг, бустреп, машинное обучение, случайный лес, аллергический ринит, локальный аллергический ринит, roc-анализ, распределение Парето
Background. The article describes a methodology and a software package designed for differential diagnosis of allergic and local allergic rhinitis by information — significant symptoms having diagnostic significance in the categories of «Complaints», «Anamnesis» and «Objective status» using the Random Forest machine learning method.Objective. Development of a methodology and a computer program to improve the effectiveness of differential diagnosis of allergic rhinitis and local allergic rhinitis.Methods. To perform the study, 260 female patients aged 18 to 71 years were examined, including 214 patients with allergic chronic rhinitis and 46 patients with local chronic rhinitis. A model of a binary classifier has been developed, the algorithmic basis of which is the ensemble method of machine learning Random Forest.Results and interpretation. An algorithm and a program for differential diagnosis of allergic rhinitis and local allergic rhinitis have been developed. Using the error matrix and the ROC curve, the values of the main metrics for assessing the quality of binary classification for each of the categories of symptoms were obtained. The quality indicators (overall accuracy) exceed 0.98, which indicates the possibility of using the developed classifier to solve practical problems. Information-relevant symptoms were identified in each category. The described algorithm and software product can be used by doctors as a diagnostic tool in doubtful cases without the use of laboratory research methods.
Keywords: ensemble method, bagging, boost, machine learning, random forest, allergic rhinitis, local allergic rhinitis, ROC-analysis, Pareto distribution