EA037137B1 - System and method for screening the probability of presence of lung cancer - Google Patents

System and method for screening the probability of presence of lung cancer Download PDF

Info

Publication number
EA037137B1
EA037137B1 EA201900375A EA201900375A EA037137B1 EA 037137 B1 EA037137 B1 EA 037137B1 EA 201900375 A EA201900375 A EA 201900375A EA 201900375 A EA201900375 A EA 201900375A EA 037137 B1 EA037137 B1 EA 037137B1
Authority
EA
Eurasian Patent Office
Prior art keywords
lung cancer
classification model
biomarkers
likelihood
records
Prior art date
Application number
EA201900375A
Other languages
Russian (ru)
Other versions
EA201900375A1 (en
Inventor
Петр Витальевич Глыбочко
Андрей Алексеевич Свистунов
Виктор Викторович Фомин
Филипп Юрьевич Копылов
Марина Игоревна Секачева
Владимир Дмитриевич Паршин
Евгений Павлович Гитель
Алигейдар Алекперович Рагимов
Елена Владимировна Поддубская
Original Assignee
федеральное государственное автономное образовательное учреждение высшего образования Первый Московский государственный медицинский университет имени И.М. Сеченова Министерства здравоохранения Российской Федерации (Сеченовский университет) (ФГАОУ ВО Первый МГМУ им. И.М. Сеченова Минздрава России (Се
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by федеральное государственное автономное образовательное учреждение высшего образования Первый Московский государственный медицинский университет имени И.М. Сеченова Министерства здравоохранения Российской Федерации (Сеченовский университет) (ФГАОУ ВО Первый МГМУ им. И.М. Сеченова Минздрава России (Се filed Critical федеральное государственное автономное образовательное учреждение высшего образования Первый Московский государственный медицинский университет имени И.М. Сеченова Министерства здравоохранения Российской Федерации (Сеченовский университет) (ФГАОУ ВО Первый МГМУ им. И.М. Сеченова Минздрава России (Се
Publication of EA201900375A1 publication Critical patent/EA201900375A1/en
Publication of EA037137B1 publication Critical patent/EA037137B1/en

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Abstract

The invention relates to the field of medicine, namely oncology, and can be used for screening of the probability of presence of lung cancer or detection of the given oncological disease at an early stage. Screening of the probability of presence of lung cancer is based on measuring the level of biomarkers in a biological fluid sample obtained from a subject: HE4, ApoA2, CYFRA.21.1, Ddimer, ApoA1, TTR, B2M, CA125, hsCRP, CEA, sVCAM.1, CA15.3, and determining a patient's sex with subsequent treatment of a set of derived values using at least one classification model trained to determine the probability of presence of lung cancer.

Description

(54) СПОСОБ И СИСТЕМА ДЛЯ СКРИНИНГОВОГО ОПРЕДЕЛЕНИЯ ВЕРОЯТНОСТИ НАЛИЧИЯ РАКА ЛЕГКОГО(54) METHOD AND SYSTEM FOR SCREENING DETERMINATION OF PROBABILITY OF LUNG CANCER

(31) (31) 2018140406 2018140406 РОССИИ (СЕЧЕНОВСКИЙ RUSSIA (SECHENOVSKY (32) (32) 2018.11.15 2018.11.15 УНИВЕРСИТЕТ)) (RU) UNIVERSITY)) (RU) (33) (43) (33) (43) RU 2020.05.31 RU 2020.05.31 (72) (72) Изобретатель: Глыбочко Петр Витальевич, Inventor: Glybochko Petr Vitalievich, (/1)(/3) Заявитель и патентовладелец: ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ (/ 1) (/ 3) Applicant and patent owner: FEDERAL STATE AUTONOMOUS Свистунов Андрей Алексеевич, Фомин Виктор Викторович, Копылов Филипп Юрьевич, Секачева Марина Svistunov Andrey Alekseevich, Fomin Viktor Viktorovich, Kopylov Philip Yurievich, Sekacheva Marina ОБРАЗОВАТЕЛЬНОЕ EDUCATIONAL Игоревна, Паршин Владимир Igorevna, Parshin Vladimir УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ ПЕРВЫЙ INSTITUTION OF HIGHER EDUCATION FIRST Дмитриевич, Гитель Евгений Павлович, Рагимов Алигейдар Dmitrievich, Gitel Evgeny Pavlovich, Ragimov Aligeydar МОСКОВСКИЙ MOSCOW Алекперович, Поддубская Елена Alekperovich, Poddubskaya Elena ГОСУДАРСТВЕННЫЙ STATE Владимировна (RU) ι Vladimirovna (RU) ι МЕДИЦИНСКИЙ УНИВЕРСИТЕТ MEDICAL UNIVERSITY (74) (74) Представитель: | Representative: | ИМЕНИ И.М. СЕЧЕНОВА NAMED AFTER I.M. Sechenova Куприянова О.И. (RU) Kupriyanova O.I. (RU) МИНИСТЕРСТВА MINISTRIES (56) (56) RU-C1-2351936 RU-C1-2351936 ЗДРАВООХРАНЕНИЯ HEALTH CARE RU-C2-23 97704 RU-C2-23 97704 РОССИЙСКОЙ ФЕДЕРАЦИИ RUSSIAN FEDERATION WO-A2-2013048292 WO-A2-2013048292 (СЕЧЕНОВСКИЙ УНИВЕРСИТЕТ) (SECHENOVSK UNIVERSITY) С. BRAMBILLA et al. Early detection of C. BRAMBILLA et al. Early detection of (ФГАОУ ВО ПЕРВЫЙ МГМУ ИМ. (FGAOU V FIRST MGMU IM. lung cancer: role ot biomarkers, European Respiratory Journal, 2003, 21: Suppl. 39, p. 36s-44s, <DOI: lung cancer: role ot biomarkers, European Respiratory Journal, 2003, 21: Suppl. 39, p. 36s-44s, <DOI: И.М. СЕЧЕНОВА МИНЗДРАВА THEM. SECHENOVA MINISTRY OF HEALTH 10.1183/09031936.02.00062002> 10.1183 / 09031936.02.00062002>

037137 В1037137 B1

037137 Bl (57) Изобретение относится к области медицины, а именно онкологии, и может быть использовано для скринингового определения вероятности наличия рака легкого или выявления данного онкологического заболевания на ранней стадии. Скрининговое определение вероятности наличия рака легкого основано на измерении уровня биомаркеров в образце биологической жидкости, полученном у субъекта: НЕ4, АроА2, CYFRA.21.1, Ddimer, ApoAl, TTR, В2М, СА125, hsCRP, CEA, sVCAM.l, CA15.3, и информации о поле пациента, с последующей обработкой совокупности полученных данных с использованием по меньшей мере одной классификационной модели, обученной для определения вероятности наличия рака легкого.037137 Bl (57) The invention relates to medicine, namely oncology, and can be used for screening to determine the likelihood of lung cancer or to detect this cancer at an early stage. The screening determination of the likelihood of having lung cancer is based on measuring the level of biomarkers in a sample of biological fluid obtained from a subject: HE4, ApoA2, CYFRA.21.1, Ddimer, ApoAl, TTR, B2M, CA125, hsCRP, CEA, sVCAM.l, CA15.3, and information about the patient's gender, followed by processing the data set using at least one classification model trained to determine the likelihood of having lung cancer.

Область техники, к которой относится изобретениеThe technical field to which the invention relates

Изобретение относится к области медицины, а именно онкологии, и может быть использовано для скринингового определения вероятности наличия рака легкого, в том числе немелкоклеточного, или выявления данного онкологического заболевания на ранней стадии.The invention relates to medicine, namely oncology, and can be used for screening to determine the likelihood of lung cancer, including non-small cell lung cancer, or to detect this cancer at an early stage.

Уровень техникиState of the art

Злокачественные опухоли представляют собой одну из самых значимых проблем здравоохранения не только в России, но и во всем мире.Malignant tumors represent one of the most significant health problems not only in Russia, but throughout the world.

Онкологические заболевания являются второй по частоте причиной смерти в России. Средний показатель заболеваемости злокачественными новообразованиями в 2016г. составил 408,6 чел. на 100000 населения. Средний показатель смертности - 201,6 чел. на 100 000 населения. Абсолютное число умерших - 295 729 чел. Онкологическая заболеваемость растет во всем мире. За последние 10 лет она увеличилась более чем на 20%.Cancer is the second most common cause of death in Russia. Average incidence of malignant neoplasms in 2016 amounted to 408.6 people. per 100,000 population. The average mortality rate is 201.6 people. per 100,000 population. The absolute number of deaths is 295,729 people. Cancer incidence is growing all over the world. Over the past 10 years, it has increased by more than 20%.

Немелкоклеточный рак легкого стоит на первом месте по распространенности среди мужского населения индустриальных стран (Claudia Allemani, Hannah K Weir, Helena Carreira et al. Global surveillance of cancer survival 1995-2009: analysis of individual data for 25 676 887 patients from 279 population-based registries in 67 countries (CONCORD-2). Lancet 2014;(November 26). doi:http://dx.doi.org/ 10.1016/S0140- 6736(14)62038-9). Статистика развитых стран мира свидетельствует о неуклонном росте впервые выявленных случаев рака легкого по сравнению со злокачественными опухолями любой другой локализации.Non-small cell lung cancer ranks first in terms of prevalence among the male population of industrialized countries (Claudia Allemani, Hannah K Weir, Helena Carreira et al. Global surveillance of cancer survival 1995-2009: analysis of individual data for 25 676 887 patients from 279 population-based registries in 67 countries (CONCORD-2). Lancet 2014; (November 26). doi: http://dx.doi.org/ 10.1016 / S0140-6736 (14) 62038-9). The statistics of developed countries of the world indicate a steady increase in newly diagnosed cases of lung cancer in comparison with malignant tumors of any other localization.

Рак легкого в России также занимает лидирующие позиции в структуре онкологической заболеваемости и смертности. Ежегодно в России заболевают раком легкого свыше 63000 человек, в том числе свыше 53000 мужчин. Более 20000 пациентов, или 34,2%, на момент постановки диагноза имеют распространенные стадии опухолевого процесса, при которых результаты лечения остаются неудовлетворительными. Анализ неудач хирургического лечения показал, что наиболее частой причиной смерти оперированных больных являются гематогенные метастазы (60-70%) и локо-регионарные рецидивы (3040%).Lung cancer in Russia also occupies a leading position in the structure of cancer morbidity and mortality. Over 63,000 people in Russia get lung cancer annually, including over 53,000 men. More than 20,000 patients, or 34.2%, at the time of diagnosis, have advanced stages of the tumor process, in which the results of treatment remain unsatisfactory. Analysis of surgical treatment failures showed that the most common cause of death in operated patients is hematogenous metastases (60-70%) and loco-regional recurrence (3040%).

Таким образом, разработка новых доступных скрининговых способов ранней диагностики рака легкого является очень актуальной задачей.Thus, the development of new available screening methods for the early diagnosis of lung cancer is a very urgent task.

Обычной стратегией скрининга является ежегодная рентгенография грудной клетки, особенно у курильщиков. Однако, в крупном клиническом исследовании PLCO (Prostate, Lung, Colorectal and Ovarian Cancer screening) показано, что проведение такого скрининга не влияет на смертность от рака легких в популяции обследуемых (Oken et al., Screening by chest radiograph and lung cancer mortality: the Prostate, Lung, Colorectal, and Ovarian (PLCO) randomized trial. JAMA. 2011 Nov 2;306(17): 1865-73). Это утверждение безусловно относится и к используемому в России методу рентгеновской диагностики флюорографии. Исследование выполняется в одной проекции и, несомненно, еще менее информативно по сравнению с рентгенографией грудной клетки.A common screening strategy is an annual chest x-ray, especially in smokers. However, in a large clinical trial PLCO (Prostate, Lung, Colorectal and Ovarian Cancer screening) it has been shown that such screening does not affect mortality from lung cancer in the population examined (Oken et al., Screening by chest radiograph and lung cancer mortality: the Prostate, Lung, Colorectal, and Ovarian (PLCO) randomized trial. JAMA. 2011 Nov 2; 306 (17): 1865-73). This statement undoubtedly applies to the method of X-ray diagnostics of fluorography used in Russia. The study is performed in one projection and, undoubtedly, is even less informative than a chest x-ray.

В настоящее время наиболее эффективным методом скрининговой диагностики в мире является низкодозная спиральная компьютерная томография (НДСКТ). При проведении крупного клинического исследования NLST (National Lung Screening Trial) было установлено, что ежегодная НДСКТ приводит к снижению на 20% смертности от рака легкого по сравнению с ежегодной рентгенографией грудной клетки (National Lung Screening Trial Research Team et al., Reduced lung-cancer mortality with low-dose computed tomographic screening. N Engl J Med. 2011 Aug 4;365(5):395-409). Методика рекомендована для скрининга рака легких в США. Американская ассоциация торакальной хирургии рекомендует ежегодный скрининг в возрастной группе от 50 до 79 лет у пациентов со стажем курения 20 лет и дополнительными сопутствующими заболеваниями, которые повышают общий риск развития рака на 5% в течение ближайших 5 лет.Currently, the most effective method of screening diagnostics in the world is low-dose spiral computed tomography (SSCT). In a large clinical study, the National Lung Screening Trial (NLST), it was found that annual STCT leads to a 20% reduction in lung cancer mortality compared to annual chest x-ray (National Lung Screening Trial Research Team et al., Reduced lung-cancer mortality with low-dose computed tomographic screening. N Engl J Med. 2011 Aug 4; 365 (5): 395-409). The technique is recommended for lung cancer screening in the United States. The American Thoracic Surgery Association recommends annual screening in the 50 to 79 age group for patients with 20 years of smoking history and additional comorbidities that increase their overall cancer risk by 5% over the next 5 years.

Однако качественный скрининг методом КТ возможен только при наличии высококвалифицированных специалистов и современных аппаратов, которые есть только в крупных медицинских учреждениях. Негативным фактом является и то, что проведение повторных исследований связано с риском дополнительного облучения.However, high-quality CT screening is possible only if highly qualified specialists and modern devices are available, which are available only in large medical institutions. It is also a negative fact that repeated studies are associated with the risk of additional radiation exposure.

В качестве альтернативы вышеизложенным инструментальным методам визуализации могут выступать методы диагностики, основанные на определении биохимических маркеров в биологических тканях и жидкостях пациента, например цельной крови, сыворотке или плазме. В качестве таких маркеров, например, могут быть использованы различные антигены, протеины и метаболиты, секретируемые злокачественными клетками или образующиеся в процессе их гибели. Так, в настоящее время для диагностики рака легкого наиболее широко используется определение CYFRA 21-1 (фрагмент цитокератина 19) и СЕА (раковый эмбриональный антиген) в плазме крови, известны и другие биомаркеры (Zamay et al., Current and Prospective Protein Biomarkers of Lung Cancer. Cancers 2017, 9, 155). Стоит отметить, что диагностика онкологических заболеваний на основе измерений единичных биомаркеров не является достаточно достоверной ввиду их невысокой чувствительности. Так, например, чувствительность и специфичность CYFRA 21-1 в диагностике рака легкого составляет 43% и 89%, СЕА - 69% и 68% соответственно (Zamay et al., Current and Prospective Protein Biomarkers of Lung Cancer. Cancers 2017, 9, 155). Ис- 1 037137 пользование мультиплексных диагностических методов, подразумевающих оценку риска наличия заболевания на основе измерений нескольких биомаркеров, позволяет преодолеть данную проблему и достичь более достоверных результатов.As an alternative to the above instrumental imaging methods, diagnostic methods based on the determination of biochemical markers in biological tissues and patient fluids, for example, whole blood, serum or plasma, can be used. As such markers, for example, various antigens, proteins and metabolites secreted by malignant cells or formed during their death can be used. Thus, at present, for the diagnosis of lung cancer, the most widely used definitions are CYFRA 21-1 (fragment of cytokeratin 19) and CEA (cancer embryonic antigen) in blood plasma; other biomarkers are also known (Zamay et al., Current and Prospective Protein Biomarkers of Lung Cancer. Cancers 2017, 9, 155). It should be noted that the diagnosis of oncological diseases based on measurements of single biomarkers is not sufficiently reliable due to their low sensitivity. For example, the sensitivity and specificity of CYFRA 21-1 in the diagnosis of lung cancer is 43% and 89%, CEA - 69% and 68%, respectively (Zamay et al., Current and Prospective Protein Biomarkers of Lung Cancer. Cancers 2017, 9, 155). The use of multiplex diagnostic methods, implying an assessment of the risk of the presence of a disease based on measurements of several biomarkers, allows one to overcome this problem and achieve more reliable results.

Так, например, из KR-10-2016-0113444 (прототип) известно определение наличия рака легкого по измеренным в сыворотке крови маркерам следующих белков: НЕ4, RANTES, sVCAM-1, LRG1, СЕА, CYFRA 21-1, АроА2, ApoA1, TTR, B2M, СА125, СА19-9, hsCRP. При этом риск наличия заболевания оценивается по методу логит-регресии на основании совокупности измерений вышеизложенных биомаркеров.So, for example, from KR-10-2016-0113444 (prototype) it is known to determine the presence of lung cancer by the markers of the following proteins measured in blood serum: HE4, RANTES, sVCAM-1, LRG1, CEA, CYFRA 21-1, ApoA2, ApoA1, TTR, B2M, CA125, CA19-9, hsCRP. In this case, the risk of having a disease is assessed using the logit regression method based on a set of measurements of the above biomarkers.

Несмотря на возможность использования в методике комплекса маркеров, повышающих ее диагностическую ценность при оценке риска развития рака легкого, существует необходимость в адаптации методики для различных групп обследуемых. В литературе отмечены межрассовые различия в молекулярных механизмах рака легкого, что ставит под сомнение целесообразность использования единого набора биомаркеров для разных рас. Так, было показано, что частота встречаемости мутаций рецептора эпидермального фактора роста выше в азиатской популяции по сравнению с европеоидной, в то время как частота встречаемости KRAS мутаций - ниже (М.В. Schabath, D. Chress, T. Munoz-Antonia. Racial and Ethnic Differences in the Epidemiology and Genomics of Lung Cancer. Cancer Control. 2016 Oct;23(4):338346). Подобные межрасовые различия могут быть вызваны как факторами окружающей среды (уровень загрязнения воздуха), поведенческими особенностями (специфика питания, распространенность курения), так и генетической предрасположенностью (W. Zhou and D. С. Christiani. East meets West: ethnic differences in epidemiology and clinical behaviors of lung cancer between East Asians and Caucasians. Chin J Cancer. 2011 May; 30(5): 287-292).Despite the possibility of using a complex of markers in the technique that increase its diagnostic value in assessing the risk of developing lung cancer, there is a need to adapt the technique for different groups of subjects. In the literature, interracial differences in the molecular mechanisms of lung cancer have been noted, which casts doubt on the feasibility of using a single set of biomarkers for different races. Thus, it was shown that the incidence of mutations in the epidermal growth factor receptor is higher in the Asian population than in the Caucasian population, while the incidence of KRAS mutations is lower (MV Schabath, D. Chress, T. Munoz-Antonia. Racial and Ethnic Differences in the Epidemiology and Genomics of Lung Cancer. Cancer Control. 2016 Oct; 23 (4): 338346). Such interracial differences can be caused by both environmental factors (air pollution level), behavioral characteristics (dietary habits, smoking prevalence), and genetic predisposition (W. Zhou and D. C. Christiani. East meets West: ethnic differences in epidemiology and clinical behaviors of lung cancer between East Asians and Caucasians. Chin J Cancer. 2011 May; 30 (5): 287-292).

Заявляемое изобретение основано на исследовании нового комплекса маркеров, позволяющего повысить точность и достоверность определения наличия заболевания при скрининге рака легкого у конкретного пациента европеоидной популяции, формирование на этой основе той или иной группы риска и выявление тех пациентов, которые нуждаются в углубленном дорогостоящем обследовании для обнаружения ранней стадии рака легкого.The claimed invention is based on the study of a new complex of markers, which makes it possible to increase the accuracy and reliability of determining the presence of the disease when screening lung cancer in a particular patient of the Caucasian population, the formation on this basis of a particular risk group and the identification of those patients who need an in-depth expensive examination to detect early stages of lung cancer.

Раскрытие изобретенияDisclosure of invention

Технической проблемой, решаемой настоящим изобретением, является создание более точного способа определения вероятности наличия рака легкого в европеоидной популяции.The technical problem solved by the present invention is to provide a more accurate method for determining the likelihood of having lung cancer in a Caucasian population.

Достигаемым техническим результатом является повышение точности скринингового выявления наличия рака у конкретного пациента европеоидной популяции, причем уже на ранних стадиях его развития посредством выявления и учета оригинальной совокупности биомаркеров по итогам анализа фракции сыворотки или плазмы крови при ускорении диагностируемых состояний.The achieved technical result is an increase in the accuracy of screening detection of the presence of cancer in a particular patient of the Caucasian population, and already at the early stages of its development by identifying and taking into account the original set of biomarkers based on the results of the analysis of the serum or blood plasma fraction while accelerating the diagnosed conditions.

Технический результат достигается посредством реализации способа скринингового определения вероятности наличия рака легкого, включающего измерение уровня биомаркеров в образце биологической жидкости, полученном у субъекта: НЕ4, АроА2, CYFRA.21.1, Ddimer, ApoA1, TTR, B2M, СА125, hsCRP, CEA, sVCAM.1, CA15.3, а также определение пола пациента, с последующей обработкой совокупности полученных значений биомаркеров с использованием по меньшей мере одной классификационной модели, обученной для определения высокой или низкой вероятности наличия рака легкого.The technical result is achieved by implementing a method for screening determination of the likelihood of lung cancer, including measuring the level of biomarkers in a sample of biological fluid obtained from a subject: HE4, ApoA2, CYFRA.21.1, Ddimer, ApoA1, TTR, B2M, CA125, hsCRP, CEA, sVCAM. 1, CA15.3, as well as determining the sex of the patient, with subsequent processing of the set of obtained biomarker values using at least one classification model trained to determine a high or low probability of having lung cancer.

В качестве классификационных моделей используют метод случайного леса (random forest), и/или линейный дискриминантный анализ, и/или метод опорных векторов.As classification models, the random forest method and / or linear discriminant analysis and / or support vector machine are used.

Обученную классификационную модель получают посредством реализации следующих шагов:A trained classification model is obtained through the following steps:

формируют обучающую и тестовую выборки записей субъектов с измеренными значениями биомаркеров НЕ4, АроА2, CYFRA.21.1, Ddimer, ApoA1, TTR, B2M, СА125, hsCRP, CEA, sVCAM.1, CA15.3), включающие записи о пациентах разного пола и возраста;form training and test samples of records of subjects with measured values of biomarkers HE4, ApoA2, CYFRA.21.1, Ddimer, ApoA1, TTR, B2M, CA125, hsCRP, CEA, sVCAM.1, CA15.3), including records of patients of different sex and age ;

обучают классификационную модель выявлению заданной патологии, используя записи обучающей и тестовой выборки;teaching the classification model to identify a given pathology using the records of the training and test sample;

сохраняют связи и веса обученной классификационной модели для последующего определения вероятности наличия рака легкого по итогам обработки измеренных данных биомаркеров субъекта.save the connections and weights of the trained classification model for subsequent determination of the likelihood of having lung cancer based on the processing of the measured data of the biomarkers of the subject.

При формировании обучающей и тестовой выборок включают записи субъектов с выявленной патологией - наличие рака и отсутствие рака легкого.When forming the training and test samples, they include records of subjects with identified pathology - the presence of cancer and the absence of lung cancer.

Технический результат достигается посредством реализации системы скринингового определения вероятности наличия рака легкого, включающей модуль ввода измеренных значений биомаркеров субъекта;The technical result is achieved through the implementation of a screening system for determining the likelihood of lung cancer, including a module for inputting measured values of biomarkers of a subject;

модуль хранения данных, выполненный с возможностью хранения обучающей и тестовой выборок классификационной модели, связей и весов обученной классификационной модели, записей субъектов с измеренными значениями биомаркеров НЕ4, АроА2, CYFRA.21.1, Ddimer, ApoA1, TTR, B2M, СА125, hsCRP, CEA, sVCAM.1, CA15.3, включающих записи о пациентах разного пола и возраста;data storage module configured to store training and test samples of the classification model, connections and weights of the trained classification model, records of subjects with measured values of biomarkers HE4, ApoA2, CYFRA.21.1, Ddimer, ApoA1, TTR, B2M, CA125, hsCRP, CEA, sVCAM.1, CA15.3, including records of patients of different sex and age;

модуль обученной классификационной модели, выполненный с возможностью построения и обучения по меньшей мере одной классификационной модели для определения наличия заданной патологии по упомянутым маркерам, взятым из модуля хранения данных;a trained classification model module, configured to build and train at least one classification model to determine the presence of a given pathology by said markers taken from the data storage module;

модуль диагностики, выполненный с возможностью обработки введенных значений биомаркеровdiagnostic module adapted to process the entered biomarker values

- 2 037137 субъекта с использованием по меньшей мере одной обученной классификационной модели;- 2,037137 subjects using at least one trained classification model;

модуль вывода данных, выполненный с возможностью получения данных о высокой или низкой вероятности наличия рака легкого.a data output module configured to obtain data on a high or low likelihood of having lung cancer.

Точность заявляемого мультиплексного метода диагностики рака легкого обеспечивается за счет использования комплекса из 12 биомаркеров и информации о поле пациента, а также за счет использования нескольких классификационных моделей с последующим усреднением модельных результатов.The accuracy of the proposed multiplex method for diagnosing lung cancer is ensured through the use of a complex of 12 biomarkers and information about the patient's field, as well as through the use of several classification models with subsequent averaging of model results.

Краткое описание чертежейBrief Description of Drawings

Изобретение поясняется чертежами, где:The invention is illustrated by drawings, where:

на фиг. 1А представлена диаграмма рассеяния возраст пациента - концентрация биомаркеров. Точки - индивидуальные измерения, линии - предсказания линейной регрессионной модели. На графиках приведены значения корреляционных коэффициентов, рассчитанных по методу Пирсона и Р-значения, рассчитанные по тесту Стьюдента; на фиг. 1Б представлена диаграмма размаха для оценки значимости тендерных различий в концентрациях биомаркеров. На графиках приведены Р-значения, полученные при помощи критерия Стьюдента. Серым цветом показаны данные для женщин, черным - для мужчин;in fig. 1A is a scatter plot of patient age versus biomarker concentration. Points are individual measurements, lines are linear regression model predictions. The graphs show the values of the correlation coefficients calculated by the Pearson method and the P-values calculated by the Student's test; in fig. 1B shows a range diagram for assessing the significance of gender differences in biomarker concentrations. The graphs show the P-values obtained using the Student's t test. Data for women are shown in gray, data for men are shown in black;

на фиг. 2 - ROC-кривые для оценки предсказательной способности отдельных биомаркеров (тип линий соответствует биомаркеру);in fig. 2 - ROC curves for assessing the predictive ability of individual biomarkers (the line type corresponds to the biomarker);

на фиг. 3. - примеры деревьев решений, полученных в результате обучения многофакторного классификационного алгоритма random forest на экспериментальных данных по 12 биомаркерам;in fig. 3. - examples of decision trees obtained as a result of training the multifactorial classification algorithm random forest on experimental data for 12 biomarkers;

на фиг. 4 - визуализация результатов разделения пациентов на 2 класса (здоровые доноры и пациенты с раком легкого) при помощи линейного дискриминантного анализа по 12 биомаркерам;in fig. 4 - visualization of the results of dividing patients into 2 classes (healthy donors and patients with lung cancer) using linear discriminant analysis for 12 biomarkers;

на фиг. 5 - примеры трехмерных проекций разделения объединенной популяции пациентов на 2 класса (здоровые доноры и пациенты с раком легкого) при помощи метода опорных векторов по 12 биомаркерам;in fig. 5 - examples of three-dimensional projections of dividing the pooled patient population into 2 classes (healthy donors and patients with lung cancer) using the support vector machine for 12 biomarkers;

на фиг. 6 - доля классификаторов стратифицированная по AUROC в зависимости от количества включенных в них биомаркеров. Обучение проводилось при помощи: А. Метода опорных векторов; Б. Линейного дискриминантного анализа;in fig. 6 - the proportion of classifiers stratified by AUROC depending on the number of biomarkers included in them. The training was carried out using: A. Support vector method; B. Linear Discriminant Analysis;

на фиг. 7 - ROC-кривые для оценки предсказательной способности различных классификационных алгоритмов: А. Весь набор данных был использован как для обучения модели, так и для ее валидации; Б. 80% данных было использовано для обучения модели, 20% - для валидации;in fig. 7 - ROC curves for assessing the predictive ability of various classification algorithms: A. The entire data set was used both for training the model and for its validation; B. 80% of the data was used for training the model, 20% for validation;

на фиг. 8 - блок-схема системы, предназначенной для оценки вероятности наличия рака легкого на основе данных пациента;in fig. 8 is a block diagram of a system for assessing the likelihood of having lung cancer based on patient data;

на фиг. 9 - алгоритм оценки вероятности наличия рака легкого на основе данных пациента.in fig. 9 illustrates an algorithm for evaluating the likelihood of having lung cancer based on patient data.

Осуществление изобретенияImplementation of the invention

Исходная группа биомаркеров, используемая в диагностическом тесте на определение вероятности наличия рака легкого (РЛ), была получена с использованием многофакторной классификационной модели. Подобные методы позволяют находить комбинации биомаркеров, обладающих наибольшим диагностическим потенциалом. Математическая модель проходит обучение на экспериментальных измерениях заданного набора биомаркеров, полученных на смешанной выборке из здоровых добровольцев и пациентов с РЛ. Обученная модель может быть использована для оценки риска наличия заболевания у пациента на основе показателей его биомаркеров.The initial group of biomarkers used in the diagnostic test to determine the likelihood of having lung cancer (LC) was obtained using a multivariate classification model. Such methods make it possible to find combinations of biomarkers with the greatest diagnostic potential. The mathematical model is trained on experimental measurements of a given set of biomarkers obtained from a mixed sample of healthy volunteers and patients with PD. The trained model can be used to assess the risk of having a disease in a patient based on the indicators of his biomarkers.

В рамках проведенной работы на этапе разработки диагностически значимого комплекса показателей были использованы данные измерений 16 биомаркеров (AFP, CEA, СА 19-9, СА 125, НЕ4, tPSA, CA 15-3, В2М, hsCRP, Ddimer, CYFRA 21-1, ApoA1, ApoA2, Apo B, TTR, sVCAM-1), полученные на выборке здоровых добровольцев европеоидной популяции (n=203, 104 женщины и 99 мужчин 36-80 лет, средний возраст 53 года) и пациентов с раком легкого (n=77, 25 женщин и 52 мужчины 36-80 лет, средний возраст 62 года).As part of the work carried out at the stage of developing a diagnostically significant set of indicators, the measurement data of 16 biomarkers were used (AFP, CEA, CA 19-9, CA 125, HE4, tPSA, CA 15-3, B2M, hsCRP, Ddimer, CYFRA 21-1, ApoA1, ApoA2, Apo B, TTR, sVCAM-1) obtained on a sample of healthy volunteers of the Caucasian population (n = 203, 104 women and 99 men 36-80 years old, mean age 53 years) and patients with lung cancer (n = 77 , 25 women and 52 men 36-80 years old, average age 62 years).

Статистическая обработка экспериментальных данных и разработка классификационных моделей проводилась в среде R {RDevelopmentCoreTeam (2007). R: А language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0}.Statistical processing of experimental data and the development of classification models were carried out in the R {RDevelopmentCoreTeam environment (2007). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0}.

Первым этапом являлся статистический анализ и визуализация данных. Для здоровых добровольцев было оценено влияние пола и возраста на показатели биомаркеров (фиг. 1).The first step was statistical analysis and data visualization. For healthy volunteers, the effect of gender and age on biomarker indices was assessed (Fig. 1).

По итогам проведения исследования на данном этапе был сделан вывод об отсутствии значимой корреляции между возрастом пациентов и показателями большинства биомаркеров, в то же время наблюдались значимые тендерные различия в показателях СЕА, СА 19-9, СА 125, НЕ4, Ddimer, ApoA1 и TTR.Based on the results of the study, at this stage, it was concluded that there was no significant correlation between the age of patients and the indicators of most biomarkers, at the same time, there were significant gender differences in the indicators of CEA, CA 19-9, CA 125, HE4, Ddimer, ApoA1 and TTR.

На следующем этапе проводилась оценка значимости различий в уровнях отдельных биомаркеров между здоровыми добровольцами и пациентами с раком легкого при помощи критерия Стьюдента после нормализации экспериментальных данных путем log-трансофрмации (табл. 1).At the next stage, the significance of differences in the levels of individual biomarkers between healthy volunteers and patients with lung cancer was assessed using the Student's test after normalization of the experimental data by log-transformation (Table 1).

- 3 037137- 3 037137

Таблица 1. Сравнение показателей биомаркеров в плазме крови здоровых доноров и пациентов с раком легкогоTable 1. Comparison of biomarker indices in blood plasma of healthy donors and patients with lung cancer

Биомаркер Biomarker Здоровые доноры Healthy donors Пациенты с раком легкого Lung cancer patients Р-значения1 P-values 1 Р-значения1 (прототип)P-values 1 (prototype) AFP, МЕ/мл AFP, IU / ml 2.84003 2.84003 2.857935 2.857935 0.3 0.3 - - ApoAl, г/л ApoAl, g / l 1.59803 1.59803 1.718442 1.718442 4е-04 *** 4e-04 *** <2.2е -16 *** <2.2e -16 *** АроА2, г/л AroA2, g / l 0.2953 0.2953 0.218312 0.218312 1е-13 *** 1e-13 *** <2.2е-16 *** <2.2e-16 *** АроВ, г/л ApoB, g / l 1.026404 1.026404 0.94039 0.94039 0.008** 0.008 ** - - В2М, нг/мл B2M, ng / ml 1477.291 1477.291 1887.649 1887.649 Зе-09 *** Ze-09 *** <2.2е-16*** <2.2e-16 *** СА125, МЕ/мл CA125, IU / ml 10.68987 10.68987 44.81299 44.81299 4е-06 *** 4e-06 *** 2.2е -14 *** 2.2e -14 *** СА15.3, МЕ/мл CA15.3, IU / ml 15.12623 15.12623 26.86701 26.86701 0.004 ** 0.004 ** - - СА19.9, МЕ/мл CA19.9, IU / ml 6.597143 6.597143 13.31935 13.31935 0.08 0.08 0.2829 0.2829 СЕА, нг/мл CEA, ng / ml 1.856232 1.856232 18.98655 18.98655 2е-05 *** 2e-05 *** <2.2е-16 *** <2.2e-16 *** CYFRA.21.1, нг/мл CYFRA.21.1, ng / ml 1.374517 1.374517 5.257714 5.257714 2е-11 *** 2e-11 *** <2.2е-16 *** <2.2e-16 *** Ddimer, нг/мл Ddimer, ng / ml 119.7537 119.7537 462.6623 462.6623 3е-13 *** 3e-13 *** - - НЕ4, пмоль/л HE4, pmol / l 51.42532 51.42532 104.9732 104.9732 8е-21 *** 8e-21 *** <2.2е-16 *** <2.2e-16 *** hsCRP, мг/л hsCRP, mg / l 1.770049 1.770049 11.55325 11.55325 5е-08 *** 5е-08 *** <2.2е-16 *** <2.2e-16 *** sVCAM.1, нг/мл sVCAM.1, ng / ml 658.3713 658.3713 815.4416 815.4416 2е-04 *** 2e-04 *** 0.01928* 0.01928 * t.PSA, нг/мл t.PSA, ng / ml 1.129717 1.129717 1.735423 1.735423 0.3 0.3 - - TTR, мг/дл TTR, mg / dl 25.64039 25.64039 18.96104 18.96104 2е-09 *** 2e-09 *** <2.2е-16 *** <2.2e-16 ***

1- сравнение по тесту Стьюдента после нормализации экспериментальных данных; 1 - comparison according to Student's test after normalization of experimental data;

* - Р-значения<0.05, * * - Р-значения<0.01, * ** - Р-значения<0.001.* - P-values <0.05, * * - P-values <0.01, * ** - P-values <0.001.

На основании проведенного анализа был сделан вывод об отсутствии значимых различий в концентрациях AFP, CA19.9, t.PSA между здоровыми добровольцами и пациентами с раком легкого. Так же в рамках данного исследования отмечено значимое различие в концентрациях Ddimer, ApoB и СА15.3, не включенных в прототип, а также отмечено более значимое различие в sVCAM.1 по сравнению с исследованием-прототипом.Based on the analysis, it was concluded that there were no significant differences in the concentrations of AFP, CA19.9, t.PSA between healthy volunteers and patients with lung cancer. Also, within the framework of this study, a significant difference was noted in the concentrations of Ddimer, ApoB and CA15.3 not included in the prototype, as well as a more significant difference in sVCAM.1 compared to the prototype study.

Для оценки диагностической ценности отдельных биомаркеров использовался метод логистических регрессий. В данных статистических моделях рассматривалась взаимосвязь между концентрацией биомаркера и вероятностью наличия заболевания (уравнение 1):The logistic regression method was used to assess the diagnostic value of individual biomarkers. In these statistical models, the relationship between the concentration of a biomarker and the likelihood of having a disease was considered (equation 1):

где P(Y) - вероятность наличия заболевания, b0 и b1 - коэффициенты, определяемые по экспериментальным данным, X - предиктор (концентрация биомаркера).where P (Y) is the probability of having a disease, b 0 and b 1 are coefficients determined from experimental data, X is a predictor (biomarker concentration).

Предсказательная способность логистических моделей оценивалась при помощи ROC-анализа, предполагающего определение чувствительности, специфичности и точности метода относительно тестового или общего набора данных. Для этого значение пороговой вероятности, определяющей наличие заболевания, варьировалось в пределах от 0 до 1 с заданным шагом, для каждого шага рассчитывалась доля верно диагностированных случаев заболевания (чувствительность) (Se), правильно определенных случаев отсутствия заболевания (специфичность) (Sp), а также общая доля правильно диагностированных случаев, как наличия, так и отсутствия заболевания (точность) (Acc), (уравнения 2-4):The predictive power of logistic models was assessed using ROC analysis, which involves determining the sensitivity, specificity and accuracy of a method relative to a test or general dataset. For this, the value of the threshold probability that determines the presence of the disease varied from 0 to 1 with a given step, for each step, the proportion of correctly diagnosed cases of the disease (sensitivity) (Se), correctly identified cases of absence of the disease (specificity) (Sp) was calculated, and also the total proportion of correctly diagnosed cases, both the presence and absence of disease (accuracy) (Acc), (equations 2-4):

Se = fn) 100% (2)S e = fn) 100% (2)

Sp = + pp) · 100% (3)Sp = + pp) 100% (3)

Acc=(TN+TP)/(TN+FP+TP+FN)· 100% (4) где ТР - верно классифицированный положительный результат (верно диагностированное заболевание), FP - ложноположительный результат (ошибочно диагностированное заболевание), TN - верно классифицированный отрицательный результат (верно диагностированное отсутствие заболевания), FN - ложноотрицательный результат (ошибочно диагностированное отсутствие заболевания).Acc = (TN + TP) / (TN + FP + TP + FN) 100% (4) where TR - correctly classified positive result (correctly diagnosed disease), FP - false positive result (misdiagnosed disease), TN - correctly classified negative result (correctly diagnosed absence of disease), FN - false negative result (misdiagnosed absence of disease).

Полученный набор значений чувствительности и специфичности использовался для построения ROC-кривой. В качестве интегрального показателя качества моделей использовалась площадь под ROCкривой (AUROC): предикторы с максимальной предиктивной способностью показывают наибольшие значения AUROC. Результаты ROC-анализа приведены на фиг. 2 и в табл. 2.The resulting set of sensitivity and specificity values was used to construct the ROC curve. The area under the ROC curve (AUROC) was used as an integral indicator of the quality of the models: the predictors with the maximum predictive ability show the highest AUROC values. The results of the ROC analysis are shown in FIG. 2 and in table. 2.

- 4 037137- 4 037137

Таблица 2. Диагностическая ценность отдельных биомаркеровTable 2. Diagnostic value of selected biomarkers

I Биомаркер 1 I Biomarker 1 Специфичность, % I Specificity,% I Чувствительность, % Sensitivity,% 1 Точность, % 1 Accuracy,% AUROC AUROC НЕ4 HE4 90 90 82 82 ί . 88 .. . ί. 88 ... ,0.^' ’ л , 0. ^ '’L ' АроА2 'AroA2 97 97 74 74 90 90 0.88 0.88 CYFRA.21.1 CYFRA.21.1 91 91 61 61 ί . 82__.ί. 82 __. 0.83 0.83 . Ddimer ... Ddimer 67 67 84 84 71 71 0.82 0.82 M . MM ^M ... . · H “ MM· M M. MM ^ M .... · H “MM · M МММ “ “ MMM "" Μ ^ммамм Μ. Μ Μ Μ ^ mmmm Μ. Μ Μ ApoAl ApoAl 81 81 70 70 f 78 f 78 0.81 0.81 TTR TTR 85 85 60 60 ' 78 '78 0.8 0.8 В2М B2M 58 1 ;58 1 ; 83 83 ! 65 ! 65 0.76 0.76 СА125 CA125 82 82 56 56 75 75 0.73 0.73 Мн· * МММММММ. «Μ м м. Mn * MMMMMMM. "Μ m m. ^M ^MMMM· · — . — a^MM ^ M ^ MMMM · · -. - a ^ MM ММ^М · ·ΜΜ· Μ· MM ^ M · ΜΜ Μ —..... ..Μ ·Μ Μ - . Μ —..... ..Μ · Μ Μ -. • · Μ · Μ· · · Μ • · Μ · Μ · · · hsCRP hsCRP 85 85 56 56 ; 77 ; 77 0.72 4 0.72 4 CEA CEA 83 83 52 52 75 75 0.68 0.68 sVCAM.1 sVCAM.1 88 88 45 45 ί 76 ί 76 θ θ CA15.3 CA15.3 69 69 49 49 64 64 0.6 0.6 M l> «ΜΜΜΜ MMHM—- MM M M l> «ΜΜΜΜ MMHM—- MM M • - ·· Μ · • - ·· Μ · Μ Μ· Μ Μ Μ · Μ Μ^Μ Μ Μ Μ Μ Μ Μ Μ ^ Μ i ApoB . i ApoB. 53 53 66 66 J __5θ __ J __5θ __ 0.6 0.6 CA19.9 CA19.9 71 71 47 47 64 64 0.59 0.59 AFP AFP 48 48 69 69 1 54- 1 54- 0.56 0.56 t.PSA | t.PSA | 86 | 86 | 40 40 1 70 1 70 0.56 0.56

На основе результатов статистического анализа данных и оценки предсказательной способности однофакторных логистических моделей были отобраны биомаркеры, которые впоследствии были включены в многофакторные классификационные модели. Критерием включения биомаркеров являлись pval<0.005 (табл. 1) и AUROC>0.6 (табл. 2). Таким образом, для построения классификационных моделей были отобраны экспериментальные измерения 12 биомаркеров (НЕ4, АроА2, CYFRA.21.1, Ddimer, ApoA1, TTR, B2M, СА125, hsCRP, CEA, sVCAM.1, CA15.3), также использовалась информация о поле пациента.Based on the results of statistical data analysis and assessment of the predictive ability of univariate logistic models, biomarkers were selected, which were subsequently included in multivariate classification models. The criteria for the inclusion of biomarkers were pval <0.005 (Table 1) and AUROC> 0.6 (Table 2). Thus, to construct classification models, experimental measurements of 12 biomarkers (HE4, ApoA2, CYFRA.21.1, Ddimer, ApoA1, TTR, B2M, CA125, hsCRP, CEA, sVCAM.1, CA15.3) were selected, and information on the field the patient.

Разработка многофакторных классификационных моделей являлась завершающим этапом исследования. Различные способы машинного обучения (random forest, линейный дискриминантный анализ, метод опорных векторов) были использованы в рамках текущей задачи. Оценка параметров моделей (обучение) производилась на объединённых данных, полученных на здоровых добровольцах и пациентах с раком легкого, и была направлена на минимизацию предсказательных ошибок алгоритма. Детальное описание использованных методов изложено в книге (Bishop CM, Pattern recognition and machine learning. Springer. 2006).The development of multivariate classification models was the final stage of the study. Various machine learning methods (random forest, linear discriminant analysis, support vector machine) were used in the current task. The estimation of the parameters of the models (training) was carried out on the combined data obtained on healthy volunteers and patients with lung cancer, and was aimed at minimizing the predictive errors of the algorithm. A detailed description of the methods used is presented in the book (Bishop CM, Pattern recognition and machine learning. Springer. 2006).

Метод random forest (RF) подразумевает создание совокупности кросс-валидированных решающих деревьев. Каждое из таких деревьев проходит обучение на подвыборке данных, включающей информацию лишь по части биомаркеров и наблюдений, и валидируется на подвыборке, не использованной для его построения (бэггинг). На основании предсказаний каждого из построенных деревьев решений пациент причисляется к одной из групп (здоровые доноры или пациенты с раком легкого), финальное предсказание классификатора определяется большинством голосов построенных деревьев (см. фиг. 3 А, Б).The random forest (RF) method involves creating a collection of cross-validated decision trees. Each of these trees is trained on a subsample of data, which includes information only on a part of biomarkers and observations, and is validated on a subsample that was not used for its construction (bagging). Based on the predictions of each of the constructed decision trees, the patient is assigned to one of the groups (healthy donors or patients with lung cancer), the final prediction of the classifier is determined by the majority of votes of the constructed trees (see Fig. 3 A, B).

Использование линейного дискриминантного анализа (LDA) предполагает поиск линейной комбинации биомаркеров - дискриминанты, обеспечивающей наилучшее разделение всей популяции обследуемых на здоровых добровольцев и пациентов с раком легкого. Линейная дискриминанта может быть рассчитана: z(x) = β^ +...+ enxn, где xi - это концентрации i-го биомаркера, βί - коэффициенты модели. Данная задача решается за счет нахождения оси, проекция на которую обеспечивает максимальное отношение общей дисперсии линейной комбинации биомаркеров выборки к сумме дисперсий линейной комбинации биомаркеров внутри классов (см. фиг. 4).The use of linear discriminant analysis (LDA) involves the search for a linear combination of biomarkers - discriminants that provide the best division of the entire population of subjects into healthy volunteers and patients with lung cancer. The linear discriminant can be calculated: z (x) = β ^ + ... + enxn, where xi are the concentrations of the i-th biomarker, βί are the model coefficients. This problem is solved by finding the axis, the projection on which provides the maximum ratio of the total variance of the linear combination of biomarkers in the sample to the sum of the variances of the linear combination of biomarkers within the classes (see Fig. 4).

Таблица 3. Значения линейных коэффициентов при дискриминанте (LDAcomponent 1)Table 3. Values of linear coefficients for discriminant (LDAcomponent 1)

Фактор Factor Коэффициент Coefficient SEX(M) SEX (M) 1.78E-01 1.78E-01 CEA CEA -3.53E-03 -3.53E-03 CA125 CA125 7.98E-03 7.98E-03 ΗΕ4 ΗΕ4 2.48E-02 2.48E-02 CA15.3 CA15.3 -9.30E-03 -9.30E-03 Β2Μ Β2Μ 3.23E-04 3.23E-04 hsCRP hsCRP -1.58E-03 -1.58E-03 Ddimer Ddimer -3.00E-05 -3.00E-05 CYFRA.21.1 CYFRA.21.1 -5.24E-02 -5.24E-02 ApoAl ApoAl 1.94E-02 1.94E-02 ApoA2 ApoA2 -8.02E+00 -8.02E + 00 TTR TTR -6.34E-02 -6.34E-02 sVCAM.1 sVCAM.1 9.86E-05 9.86E-05

- 5 037137- 5 037137

Использование метода опорных векторов (SVM) предполагает нахождение (п-1)-мерной гиперплоскости, разделяющей n-мерное пространство значений биомаркеров на два класса. Пусть имеется обучающая выборка (x1,y1), ... (xn,yn),xi € Rn, yi e {-1,1}, где xi - это вектор значений биомаркеров, а yi определяет принадлежность пациента к классу. Классифицирующая функция может быть определена как F(x) = sign((w,x) + b), где w - нормальный вектор к разделяющей гиперплоскости, b - вспомогательный параметр, а фунуция может принимать значения 1 или -1 в зависимости от класса объекта. Обучение алгоритма подразумевает поиск такой гиперплоскости, которая обеспечивает наименьшую эмпирическую ошибку классификации и максимизирует расстояние между значениями биомаркеров пациентов, относящихся к разным классам (см. фиг. 5).The use of the support vector machine (SVM) assumes finding an (n-1) -dimensional hyperplane dividing the n-dimensional space of biomarker values into two classes. Let there be a training set (x 1 , y 1 ), ... (x n , y n ), xi € R n , yi e {-1,1}, where xi is a vector of biomarker values, and yi determines the patient's identity to the class. The classifying function can be defined as F (x) = sign ((w, x) + b), where w is the normal vector to the dividing hyperplane, b is an auxiliary parameter, and the function can take values 1 or -1 depending on the class of the object ... Algorithm training implies the search for such a hyperplane that provides the smallest empirical classification error and maximizes the distance between the biomarker values of patients belonging to different classes (see Fig. 5).

На первом этапе построения многофакторных моделей проводилось изучение диагностической ценности различных комбинаций биомаркеров из приведенной выше группы. Для этого все возможные комбинации, включающие от 2 до 12 биомаркеров, были использованы для построения классификационных моделей (4803 варианта). Для обучения использовались объединённые данные, полученные на здоровых добровольцах и пациентах с раком легкого, и методы линейного дискриминантного анализа и опорных векторов. Разработанные модели были ранжированы в соответствии с их предсказательным потенциалом, оцененным по показателю AUROC (фиг. 7, табл. 4).At the first stage of constructing multivariate models, the diagnostic value of various combinations of biomarkers from the above group was studied. For this, all possible combinations, including from 2 to 12 biomarkers, were used to build classification models (4803 variants). Pooled data obtained from healthy volunteers and patients with lung cancer and methods of linear discriminant analysis and support vectors were used for training. The developed models were ranked in accordance with their predictive potential, assessed by the AUROC indicator (Fig. 7, Table 4).

Как видно из фиг. 6, набольшей предсказательной способностью обладают комплексные тесты, включающие 11-12 биомаркеров, в то время как для относительно небольшой доли классификаторов, включающих комбинации из 2-3 биомаркеров, показатель AUROC составляет более 80%.As seen in FIG. 6, complex tests including 11-12 biomarkers have the highest predictive power, while for a relatively small proportion of classifiers that include combinations of 2-3 biomarkers, the AUROC indicator is more than 80%.

Финальной фазой построения классификаторов являлась их валидация.The final phase of constructing classifiers was their validation.

Объединённые данные, полученные на здоровых добровольцах и пациентах с раком легкого, были случайным образом разделены на обучающую и тестовую выборки. Оценка параметров моделей (обучение) производилась на обучающей выборке и была направлена на минимизацию предсказательных ошибок алгоритма. Валидация обученных моделей заключалась в оценке их предсказательной способности на тестовой выборке. Предсказательная способность многофакторных классификационных моделей оценивалась при помощи ROC-анализа, как это было сделано ранее для отдельных биомаркеров (фиг. 7, табл. 4).The pooled data obtained from healthy volunteers and patients with lung cancer were randomly divided into training and test samples. The estimation of the parameters of the models (training) was carried out on a training set and was aimed at minimizing the predictive errors of the algorithm. Validation of trained models consisted in assessing their predictive ability on a test sample. The predictive power of multivariate classification models was assessed using ROC analysis, as was done previously for individual biomarkers (Fig. 7, Table 4).

Таблица 4. Диагностическая ценность обученных многофакторных классификационных моделейTable 4. Diagnostic value of trained multivariate classification models

Метод Method Чувствительность, % Sensitivity,% Специфичность, % Specificity,% Точность, % Accuracy,% Пороговая вероятность, % Threshold probability,% AUROC AUROC Весь набор данных был использован как для обучения модели, так и для ее валидации The entire dataset was used to both train the model and validate it. RF RF 100 100 100 100 100 100 50 fifty 1 one LDA LDA 69 69 97 97 89 89 50 fifty 0.93 0.93 SVM SVM 79 79 98 98 92 92 50 fifty 0.99 0.99 80% данных было использовано для обучения модели, 20% - для валидации 80% of the data was used for training the model, 20% for validation RF RF 79 79 100 100 93 93 50 fifty 0.99 0.99 LDA LDA 58 58 95 95 83 83 50 fifty 0.94 0.94 SVM SVM 74 74 95 95 88 88 50 fifty 0.98 0.98

Финальные классификационные модели представляют собой обученные алгоритмы, позволяющие предсказать вероятность наличия рака легкого на основании экспериментальных измерений биомаркеров пациентов с учетом тендерных различий.The final classification models are trained algorithms that predict the likelihood of having lung cancer based on experimental measurements of patient biomarkers, taking into account gender differences.

Финальное решение - определение вероятности наличия рака легкого - рассчитывается как медиана значений вероятностей рака легкого, рассчитанных в 3 классификационных моделях (RF, LDA SVM), обученных на всей выборке пациентов (см., например, Kittler J, Hatef M, Duin RPW et al, On Combining Classifiers. IEEE Transactions on Pattern Analysis and Machine Intelligence, VOL. 20, NO. 3, MARCH 1998 226-39.)The final decision - determining the likelihood of having lung cancer - is calculated as the median of the lung cancer probabilities calculated in 3 classification models (RF, LDA SVM) trained on the entire sample of patients (see, for example, Kittler J, Hatef M, Duin RPW et al , On Combining Classifiers. IEEE Transactions on Pattern Analysis and Machine Intelligence, VOL. 20, NO. 3, MARCH 1998 226-39.)

Для реализации заявляемого способа было разработано программное обеспечение (ПО), позволяющее на основе данных конкретного пациента (пол и результаты измерения биомаркеров) рассчитывать вероятность наличия у него рака легкого. Блок-схема реализации изобретения представлена на фиг. 8.To implement the proposed method, software was developed that allows, based on the data of a particular patient (gender and the results of biomarker measurements), to calculate the likelihood of having lung cancer. A block diagram of an embodiment of the invention is shown in FIG. 8.

Компьютерно-реализуемая система состоит из (1) интерфейса, включающего устройство ввода данных пациента (пол и результаты измерений биомаркеров) и вывода результатов расчета (вероятность наличия рака легкого); (2) блока памяти, содержащего обученные классификаторные модели и программные продукты, необходимые для работы с ними (R portable, Google Chrome Portable), и (3) проThe computer-implemented system consists of (1) an interface that includes a device for inputting patient data (gender and results of biomarker measurements) and outputting calculation results (the likelihood of lung cancer); (2) a memory block containing trained classifier models and software products necessary to work with them (R portable, Google Chrome Portable), and (3) about

- 6 037137 граммного модуля, с помощью которого реализуется программный код, необходимый для обмена данных между интерфейсом и блоком памяти. Для создания графического интерфейса был использован пакет shiny (Winston Chang, Joe Cheng, JJ Allaire, Yihui Xie and Jonathan McPherson (2017). shiny: Web Application Framework for R. R package version 1.0.5. https://CRAN.R-proiect.org/package-shiny) созданный на базе среды R {RDevelopmentCoreTeam (2007). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0}. Для работы с данным пакетом необходимо наличие программных продуктов R portable и Google Chrome portable, хранящихся в блоке памяти. Для работы с предложенными моделями необходимы следующие пакеты: (1) RandomForest (A. Liaw and M. Wiener (2002). Classification and Regression by randomForest. R News 2(3), 18-22); (2) MASS (Venables, W. N. & Ripley, B. D. (2002) Modern Applied Statistics with S. Fourth Edition. Springer, New York. ISBN 0-387-95457-0); (3) e1071 (David Meyer, Evgenia Dimitriadou, Kurt Hornik, Andreas Weingessel and Friedrich Leisch (2017). e1071: Misc Functions of the Department of Statistics, Probability Theory Group (Formerly: E1071), TU Wien. R package version 1.6-8. https://CRAN.Rproject.org/package=e 1071).- 6 037137 gram module, with the help of which the program code necessary for the exchange of data between the interface and the memory unit is implemented. The shiny package was used to create the GUI (Winston Chang, Joe Cheng, JJ Allaire, Yihui Xie and Jonathan McPherson (2017). Shiny: Web Application Framework for R. R package version 1.0.5.https: //CRAN.R- proiect.org/package-shiny) based on the R {RDevelopmentCoreTeam (2007) environment. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0}. To work with this package, you need the R portable and Google Chrome portable software stored in the memory block. To work with the proposed models, the following packages are required: (1) RandomForest (A. Liaw and M. Wiener (2002). Classification and Regression by randomForest. R News 2 (3), 18-22); (2) MASS (Venables, W. N. & Ripley, B. D. (2002) Modern Applied Statistics with S. Fourth Edition. Springer, New York. ISBN 0-387-95457-0); (3) e1071 (David Meyer, Evgenia Dimitriadou, Kurt Hornik, Andreas Weingessel and Friedrich Leisch (2017). E1071: Misc Functions of the Department of Statistics, Probability Theory Group (Formerly: E1071), TU Wien. R package version 1.6- 8.https: //CRAN.Rproject.org/package=e 1071).

Алгоритм оценки вероятности наличия рака легкого на основе данных пациента представлен на фиг. 9.An algorithm for assessing the likelihood of having lung cancer based on patient data is shown in FIG. nine.

Данные пациента вводятся через интерфейс и подаются в качестве входных переменных в разработанные модели, в каждой из которых производится расчет вероятности наличия рака легкого. Далее по результатам модельных предсказанной рассчитывается среднее значение, которое выводится в окно вывода.Patient data are entered through the interface and fed as input variables to the developed models, in each of which the probability of having lung cancer is calculated. Further, based on the results of the model predicted, the average value is calculated, which is displayed in the output window.

Диагностическая мультиплексная панель для оценки риска рака легкого включает биомаркеры, показавшие максимальный предсказательный потенциал в рамках проводимого исследования (рис. 2, табл. 2): НЕ4, АроА2, CYFRA.21.1, Ddimer, ApoA1, TTR. Кроме того, в заявляемый комплекс включены дополнительные биомаркеры, обладающие меньшим предсказательным потенциалом, однако, значимо различные между здоровыми добровольцами и пациентами с раком легкого (табл. 1): В2М, СА125, hsCRP, CEA, sVCAM.1 и СА15.3 в исследуемой популяции.The diagnostic multiplex panel for assessing the risk of lung cancer includes biomarkers that showed the maximum predictive potential in the study (Fig. 2, Table 2): HE4, ApoA2, CYFRA.21.1, Ddimer, ApoA1, TTR. In addition, the claimed complex includes additional biomarkers with a lower predictive potential, however, significantly different between healthy volunteers and patients with lung cancer (Table 1): B2M, CA125, hsCRP, CEA, sVCAM.1 and CA15.3 in the studied population.

Ниже представлено описание одного из клинических примеров применения способа, подтверждающего возможность реализации изобретения с достижением технического результата.Below is a description of one of the clinical examples of the application of the method, which confirms the possibility of implementing the invention with the achievement of a technical result.

Пример 1. Больной К., 54 лет. Курит 35 лет.Example 1. Patient K., 54 years old. Smokes 35 years.

В январе 2018 года в связи с жалобами на слабость и быструю утомляемость обратился в поликлинику по месту жительства.In January 2018, in connection with complaints of weakness and rapid fatigability, he turned to the polyclinic at his place of residence.

Был осмотрен терапевтом. Рекомендован прием витаминов, общий анализ крови, в котором клинически значимых отклонений не было выявлено.Was examined by a therapist. The recommended intake of vitamins, complete blood count, in which clinically significant abnormalities were not identified.

Пациенту было предложено принять участие в программе Онкопоиска.The patient was asked to take part in the Oncopoisk program.

Пациент обследован в рамках программы. Получены следующие результаты исследования сыворотки крови: AFP 2,4 МЕ/мл, СЕА 2,1 нг/мл, СА 19-9 3,6 МЕ/мл, СА 125 9,7 МЕ/мл, НЕ4 110,2 пмоль/л, tPSA 0,65 нг/мл, СА 15-3 19,2 МЕ/мл, В2М 2154 нг/мл, hsCRP <0,08 нг/мл, D-dimer 51,0 ,CYFRA 21-1 1,28 нг/мл, Аро A-1 1,38 г/л, Аро А2 0,289 г/л, Аро В 1,15 г/л, TTR (prealb) 25,0 мг/дл, sVCAM-1 812 нг/мл, Rantes 40784 пг/мл, VEGFR1 135 пг/мл.The patient was examined as part of the program. The following blood serum test results were obtained: AFP 2.4 IU / ml, CEA 2.1 ng / ml, CA 19-9 3.6 IU / ml, CA 125 9.7 IU / ml, HE4 110.2 pmol / l , tPSA 0.65 ng / ml, CA 15-3 19.2 IU / ml, B2M 2154 ng / ml, hsCRP <0.08 ng / ml, D-dimer 51.0, CYFRA 21-1 1.28 ng / ml, Apo A-1 1.38 g / l, Apo A2 0.289 g / l, Apo B 1.15 g / l, TTR (prealb) 25.0 mg / dl, sVCAM-1 812 ng / ml, Rantes 40784 pg / ml, VEGFR1 135 pg / ml.

При обработке полученных результатов заявляемым способом выявлена высокая вероятность рака легкого.When processing the results obtained by the claimed method, a high probability of lung cancer was revealed.

Выполнена РКТ с контрастированием. Выявлено образование в нижней доли правого легкого 13x12 мм, с неровными тяжистыми контурами, неоднородно накапливающее контрастный препарат. Лимфоузлы средостении не увеличены. Пациент госпитализирован для хирургического лечения. Выполнена видеоассистированная торакоскопия, резекция нижней доли правого лекгого, медиастинальная лимфодиссекция. Гистол.№ высокодифференцированная аденокарцинома легкого. В 5 удаленных л/узлах - без признаков метастатического роста.Contrast-enhanced X-ray CT was performed. Revealed a formation in the lower lobe of the right lung 13x12 mm, with uneven heavy contours, non-uniformly accumulating contrast agent. Mediastinal lymph nodes are not enlarged. The patient is hospitalized for surgical treatment. Performed video-assisted thoracoscopy, resection of the lower lobe of the right lung, mediastinal lymph node dissection. Gistol.№ highly differentiated adenocarcinoma of the lung. In 5 remote l / nodes - no signs of metastatic growth.

Claims (5)

1. Способ скринингового определения вероятности наличия рака легкого, включающий измерение уровня биомаркеров в образце биологической жидкости, полученном у субъекта: НЕ4, АроА2, CYFRA.21.1, Ddimer, ApoA1, TTR, B2M, СА125, hsCRP, CEA, sVCAM.1, CA15.3, а также определение пола пациента, с последующей обработкой совокупности полученных значений биомаркеров с использованием по меньшей мере одной классификационной модели, обученной для определения высокой или низкой вероятности наличия рака легкого.1. A method of screening for determining the likelihood of lung cancer, including measuring the level of biomarkers in a sample of biological fluid obtained from a subject: HE4, ApoA2, CYFRA.21.1, Ddimer, ApoA1, TTR, B2M, CA125, hsCRP, CEA, sVCAM.1, CA15 .3, as well as determining the sex of the patient, followed by processing the set of obtained biomarker values using at least one classification model trained to determine a high or low likelihood of lung cancer. 2. Способ по п.1, характеризующийся тем, что в качестве классификационных моделей используют метод случайного леса (random forest), и/или линейный дискриминантный анализ, и/или метод опорных векторов.2. The method according to claim 1, characterized in that the classification models are random forest and / or linear discriminant analysis and / or support vector machines. 3. Способ по п.1, характеризующийся тем, что обученную классификационную модель получают посредством реализации следующих шагов:3. The method according to claim 1, characterized in that the trained classification model is obtained by implementing the following steps: формируют обучающую и тестовую выборки записей субъектов с измеренными значениями био- 7 037137 маркеров НЕ4, АроА2, CYFRA.21.1, Ddimer, ApoA1, TTR, B2M, СА125, hsCRP, CEA, sVCAM.1, CA15.3, включающие записи о пациентах разного пола и возраста;form training and test samples of records of subjects with measured values of bio- 7 037137 markers HE4, ApoA2, CYFRA.21.1, Ddimer, ApoA1, TTR, B2M, CA125, hsCRP, CEA, sVCAM.1, CA15.3, including records about patients of various gender and age; обучают классификационную модель выявлению заданной патологии, используя записи обучающей и тестовой выборки;teaching the classification model to identify a given pathology using the records of the training and test sample; сохраняют связи и веса обученной классификационной модели для последующего определения вероятности наличия рака легкого по итогам обработки измеренных данных биомаркеров субъекта.save the connections and weights of the trained classification model for subsequent determination of the likelihood of having lung cancer based on the processing of the measured data of the biomarkers of the subject. 4. Способ по п.3, характеризующийся тем, что при формировании обучающей и тестовой выборок включают записи субъектов с выявленной патологией - наличие рака и отсутствие рака легкого.4. The method according to claim 3, characterized in that during the formation of the training and test samples, records of subjects with identified pathology are included - the presence of cancer and the absence of lung cancer. 5. Система скринингового определения вероятности наличия рака легкого, включающая модуль ввода измеренных значений биомаркеров субъекта НЕ4, АроА2, CYFRA.21.1, Ddimer, ApoA1, TTR, B2M, CA125, hsCRP, CEA, sVCAM.1, CA15.3;5. A screening system for determining the likelihood of lung cancer, including a module for entering the measured values of the subject's biomarkers HE4, ApoA2, CYFRA.21.1, Ddimer, ApoA1, TTR, B2M, CA125, hsCRP, CEA, sVCAM.1, CA15.3; модуль хранения данных, выполненный с возможностью хранения обучающей и тестовой выборок классификационной модели, связей и весов обученной классификационной модели, записей субъектов с измеренными значениями биомаркеров, включающих записи о пациентах разного пола и возраста;a data storage module configured to store training and test samples of the classification model, connections and weights of the trained classification model, records of subjects with measured biomarker values, including records of patients of different sex and age; модуль обученной классификационной модели, выполненный с возможностью построения и обучения по меньшей мере одной классификационной модели для определения наличия заданной патологии по упомянутым маркерам, взятым из модуля хранения данных;a trained classification model module, configured to build and train at least one classification model to determine the presence of a given pathology by said markers taken from the data storage module; модуль диагностики, выполненный с возможностью обработки введенных значений биомаркеров субъекта с использованием по меньшей мере одной обученной классификационной модели;a diagnostic module configured to process the inputted biomarker values of the subject using at least one trained classification model; модуль вывода данных, выполненный с возможностью получения данных о высокой или низкой вероятности наличия рака легкого.a data output module configured to obtain data on a high or low likelihood of having lung cancer.
EA201900375A 2018-11-15 2019-08-16 System and method for screening the probability of presence of lung cancer EA037137B1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2018140406A RU2697971C1 (en) 2018-11-15 2018-11-15 Method for early diagnosis of lung cancer

Publications (2)

Publication Number Publication Date
EA201900375A1 EA201900375A1 (en) 2020-05-29
EA037137B1 true EA037137B1 (en) 2021-02-10

Family

ID=67733719

Family Applications (1)

Application Number Title Priority Date Filing Date
EA201900375A EA037137B1 (en) 2018-11-15 2019-08-16 System and method for screening the probability of presence of lung cancer

Country Status (2)

Country Link
EA (1) EA037137B1 (en)
RU (1) RU2697971C1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116559453A (en) * 2022-11-22 2023-08-08 杭州广科安德生物科技有限公司 Biomarker for lung cancer detection
CN117051111B (en) * 2023-10-12 2024-01-26 上海爱谱蒂康生物科技有限公司 Application of biomarker combination in preparation of kit for predicting lung cancer

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2351936C1 (en) * 2007-11-19 2009-04-10 Институт Молекулярной Генетики Российской Академии Наук (Имг Ран) Method of diagnosing non-small cell lung cancer and set for realising it
RU2397704C2 (en) * 2008-09-01 2010-08-27 Государственное учреждение научно-исследовательский институт онкологии Томского Научного центра Сибирского отделения Российской академии медицинских наук (ГУ НИИ онкологии ТНЦ СО РАМН) Method of radionuclide diagnosis of lung cancer
WO2013048292A2 (en) * 2011-08-26 2013-04-04 Kutushov Mihail Vladimirovich Method for diagnosing oncological and somatic diseases

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2351936C1 (en) * 2007-11-19 2009-04-10 Институт Молекулярной Генетики Российской Академии Наук (Имг Ран) Method of diagnosing non-small cell lung cancer and set for realising it
RU2397704C2 (en) * 2008-09-01 2010-08-27 Государственное учреждение научно-исследовательский институт онкологии Томского Научного центра Сибирского отделения Российской академии медицинских наук (ГУ НИИ онкологии ТНЦ СО РАМН) Method of radionuclide diagnosis of lung cancer
WO2013048292A2 (en) * 2011-08-26 2013-04-04 Kutushov Mihail Vladimirovich Method for diagnosing oncological and somatic diseases

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
C. BRAMBILLA et al. Early detection of lung cancer: role of biomarkers, European Respiratory Journal, 2003, 21: Suppl. 39, p. 36s-44s, <DOI: 10.1183/09031936.02.00062002> *

Also Published As

Publication number Publication date
EA201900375A1 (en) 2020-05-29
RU2697971C1 (en) 2019-08-21

Similar Documents

Publication Publication Date Title
Ley et al. Idiopathic pulmonary fibrosis: CT and risk of death
Hou et al. Radiomic analysis in contrast-enhanced CT: predict treatment response to chemoradiotherapy in esophageal carcinoma
Qiu et al. Early prediction of clinical benefit of treating ovarian cancer using quantitative CT image feature analysis
US20210217524A1 (en) Performing a prognostic evaluation
Zhou et al. Predicting peritoneal metastasis of gastric cancer patients based on machine learning
EA037137B1 (en) System and method for screening the probability of presence of lung cancer
Röhrich et al. Radiomics score predicts acute respiratory distress syndrome based on the initial CT scan after trauma
Choudhury et al. Using predictive analytics for cancer identification
Araújo et al. Machine learning for the prediction of toxicities from head and neck cancer treatment: A systematic review with meta-analysis
Payares‐Garcia et al. Spatially informed Bayesian neural network for neurodegenerative diseases classification
Li et al. Deep learning nomogram for predicting lymph node metastasis using computed tomography image in cervical cancer
Chang et al. Machine-learning based investigation of prognostic indicators for oncological outcome of pancreatic ductal adenocarcinoma
Hu et al. Automatic placenta abnormality detection using convolutional neural networks on ultrasound texture
US20230252633A1 (en) Method for biomarker estimation
Zeng et al. Development and validation of survival prediction model for gastric adenocarcinoma patients using deep learning: A SEER-based study
Zhu et al. Conditional cancer-specific survival for inflammatory breast cancer: analysis of SEER, 2010 to 2016
RU2698854C1 (en) System and method for screening the probability of having colorectal cancer
RU2718272C1 (en) Method for screening probability of breast cancer presence
RU2718284C1 (en) Method for screening probability of bladder cancer
Lin et al. MRI-based radiomics model for preoperative prediction of extramural venous invasion of rectal adenocarcinoma
Alvandi et al. Identifying survival predictive factors in patients with breast cancer: a 16-year cohort study using cox maximum penalized likelihood method
US20220130542A1 (en) Using machine learning to assess medical information based on a spatial cell organization analysis
EA041241B1 (en) METHOD FOR SCREENING DETERMINATION OF PROBABILITY OF PRESENCE OF URINARY CANCER
RU2816798C1 (en) Method for screening probability of kidney cancer
Philonenko et al. Combining Survival Analysis and Machine Learning for Mass Cancer Risk Prediction using EHR data

Legal Events

Date Code Title Description
MM4A Lapse of a eurasian patent due to non-payment of renewal fees within the time limit in the following designated state(s)

Designated state(s): TM RU