http://doi.org/10.26347/1607-2502202309-10017-024

ОБЗОР ЛИТЕРАТУРЫ: СОВРЕМЕННЫЕ ПОДХОДЫ К СОСТАВЛЕНИЮ ЭЛЕКТРОННЫХ МЕДИЦИНСКИХ КАРТ (ЭМК) С ОНТОЛОГИЯМИ ФЕНОТИПА ЧЕЛОВЕКА (HPO) С ИСПОЛЬЗОВАНИЕМ ПЕРЕДОВЫХ ЯЗЫКОВЫХ МОДЕЛЕЙ

К.Д. Балбек1, А.В. Мелерзанов2

Финансирование. Исследование не имело спонсорской поддержки

Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов

Балбек Кирилл Дмитриевич — научный сотрудник лаборатории медицинского искусственного интеллекта департамента компьютерных наук и технологий университета Цинхуа. 30 Shuangqing Rd, Haidian District, Beijing, 100084, P.R. China. E-mail: kbalbek@gmail.com, Телефон: +79856407641. ORCID: http://orcid.org/0000-0001-9885-1812

Мелерзанов Александр Викторович5* —, кандидат медицинских наук, исполнительный директор научно-технологического комплекса «Прикладная генетика», ФГАОУ ВО «Московский физико-технический институт (национальный исследовательский университет)». 141700, РФ, МО, г. Долгопрудный, Институтский переулок д. 7б, МФТИ. Тел.: +7(495)576-0714. Е-mail: melerzanov.av@mipt.ru. ORCID: https://orcid.org/0000-0002-2624-5255

For citation: Balbek KD, Melerzanov A.V. Literature review: modern approaches of mapping electronic health records (EHR) to human phenotype ontology (HPO) using advanced language models. Health Care Standardization Problems. 2023; 9-10: 17-24. https//doi.org/10.26347/1607-2502202309-10017-024

1Университет Цинхуа; 2ФГАОУ ВО «Московский физико-технический институт (национальный исследовательский университет)»

This text provides an overview of the importance of mapping Electronic Health Records (EHR) to the Human Phenotype Ontology (HPO) using advanced language models. It discusses the challenges posed by the complex and diverse language used in EHRs, which hinders information sharing and extraction. The paper explores the role of numerical and text data within EHRs and their significance in providing valuable insights into patient health. Current approaches using advanced language models like the Transformer, BERT (Bidirectional Encoder Representations from Transformer), BioBERT, ClinicalBERT, and BioALBERT are highlighted, showcasing their ability to capture complex dependencies and context in EHR data. The applications of these models in tasks such as named entity recognition, relation extraction, clinical concept normalization, question answering, and document classification are explored. The paper concludes by emphasizing the potential of advanced language models to improve clinical decision-making, research, and patient care by enabling accurate mapping of EHR data to standardized ontologies like HPO.

LITERATURE REVIEW: MODERN APPROACHES OF MAPPING ELECTRONIC HEALTH RECORDS (EHR) TO HUMAN PHENOTYPE ONTOLOGY (HPO) USING ADVANCED LANGUAGE MODELS

K.D. Balbek1, A.V. Melerzanov2

Funding. The study has no funding

Conflicts of interest. The authors declare no competing interests

Authors

Kirill Balbek — researcher, Laboratory of Medical AI, Computer Sciences and Technology Department, Tsinghua University, Beijing, China email: kbalbek@gmail.com, phone: +79856407641, address: 30 Shuangqing Rd, Haidian District, Beijing, 100084, P.R. China ORCID: http://orcid.org/0000-0001-9885-1812

Alexander Melerzanov6* — MD, PhD, chief of Biomedical and Digital Technologies Research Center «Artificial Intelligence», email: melerzanov.av@mipt.ru, Moscow Institute of Physics and Technology (State Research University), 9 Institustky Ln, Dolgoprudn, MR, Russia 141701. ORCID: https://orcid.org/0000-0002-2624-5255

1Tsinghua University; 2Moscow Institute of Physics and Technology (State Research University)