WO2023249252A1 - 폐암 진단용 바이오마커 및 폐암 진단에 대한 인공지능 기반 정보 제공 방법 - Google Patents

폐암 진단용 바이오마커 및 폐암 진단에 대한 인공지능 기반 정보 제공 방법 Download PDF

Info

Publication number
WO2023249252A1
WO2023249252A1 PCT/KR2023/006352 KR2023006352W WO2023249252A1 WO 2023249252 A1 WO2023249252 A1 WO 2023249252A1 KR 2023006352 W KR2023006352 W KR 2023006352W WO 2023249252 A1 WO2023249252 A1 WO 2023249252A1
Authority
WO
WIPO (PCT)
Prior art keywords
carnitine
lung cancer
algorithm
biomarker
cancer diagnosis
Prior art date
Application number
PCT/KR2023/006352
Other languages
English (en)
French (fr)
Inventor
김승구
김기태
Original Assignee
(주)이노베이션바이오
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)이노베이션바이오 filed Critical (주)이노베이션바이오
Publication of WO2023249252A1 publication Critical patent/WO2023249252A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Definitions

  • the present invention relates to a biomarker for lung cancer diagnosis and an artificial intelligence-based information provision method for lung cancer diagnosis, and more specifically, to kynurenine (KN), lysophosphatidylcholine 16:0 (LPC16), and lysophosphatidylcholine.
  • KN kynurenine
  • LPC16 lysophosphatidylcholine 16:0
  • lysophosphatidylcholine lysophosphatidylcholine.
  • lysophosphatidylcholine 18:0, LPC18 glutamic acid (Glu), hexanoyl-L-carnitine (HC), octanoyl-L-carnitine (OC) ), decanoyl-L-carnitine (DC), dodecanoyl-L-carnitine (DDC), myristoyl-L-carnitine (MC) ) and palmitoyl-L-carnitine (PC) and a biomarker composition for lung cancer diagnosis, and an artificial intelligence-based information providing method for lung cancer diagnosis using the biomarker.
  • Glu glutamic acid
  • HC hexanoyl-L-carnitine
  • OC octanoyl-L-carnitine
  • DC decanoyl-L-carnitine
  • DDC dodecanoyl-L-carnitine
  • MC myristoyl-L-carnitine
  • PC palmitoyl-L-carnitine
  • Cancer is a disease in which cells multiply infinitely and interfere with normal cell function. Representative examples include liver cancer, lung cancer, stomach cancer, breast cancer, colon cancer, and ovarian cancer, but can occur in virtually any tissue.
  • cancer diagnosis was based on external changes in biological tissue due to the growth of cancer cells, but in recent years, detection of trace amounts of biomolecules present in biological tissues or cells, such as blood, glyco chains, and DNA, has been used to diagnose cancer. Diagnosis is being attempted. However, the most commonly used cancer diagnosis method is diagnosis using tissue samples obtained through biopsy or imaging.
  • biopsy has the disadvantage of causing great pain to the patient, being expensive, and taking a long time to make a diagnosis.
  • the patient actually has cancer there is a risk that the cancer may metastasize during the biopsy process, and in areas where tissue samples cannot be obtained through biopsy, the suspected tissue may be removed through surgical operation.
  • the disadvantage is that it is impossible to diagnose the disease until it is extracted.
  • lung cancer is one of the cancers with a high mortality rate worldwide, and currently, lung cancer is highly dependent on imaging methods (X-ray, CT, MRI, etc.).
  • imaging methods X-ray, CT, MRI, etc.
  • more than half of lung cancer patients are already inoperable at the time of discovery, and even if surgery is deemed possible and surgery is performed, complete resection is not possible in many of them. Therefore, early diagnosis and treatment of lung cancer are most important in order to increase the cure rate of lung cancer, but lung cancer has limited markers useful for diagnosis, making such diagnosis difficult. Therefore, there is a need to find cancer-specific markers present in biological samples and develop a method to diagnose cancer with high accuracy and precision using these markers.
  • kynurenine KN
  • lysophosphatidylcholine 16:0 LPC16
  • lysophosphatidylcholine 18:0 lysophosphatidylcholine 18:0, LPC18
  • glutamic acid Glu
  • HC hexanoyl-L-carnitine
  • OC octanoyl-L-carnitine
  • decanoyl -L-carnitine decanoyl-L-carnitine
  • DC dodecanoyl-L-carnitine
  • DDC dodecanoyl-L-carnitine
  • MC myristoyl-L-carnitine
  • MC myristoyl-L-carnitine
  • palmitoyl Biomarkers consisting of -L-carnitine (palmitoyl-L-carnitine, PC) were selected, and it was confirmed that the expression levels of these biomarkers showed different patterns in the patient group and the normal control group.
  • the purpose of the present invention is to provide a biomarker composition for diagnosing lung cancer.
  • Another object of the present invention is to provide a composition for diagnosing lung cancer containing a substance for measuring the expression level of the biomarker and a diagnostic kit for lung cancer using the same.
  • Another object of the present invention is to provide a method of providing artificial intelligence-based information for lung cancer diagnosis using the biomarker.
  • the present invention relates to kynurenine (KN), lysophosphatidylcholine 16:0 (LPC16), lysophosphatidylcholine 18:0 (LPC18), glutamic acid (Glu), hexanoyl- L-carnitine (hexanoyl-L-carnitine, HC), octanoyl-L-carnitine (OC), decanoyl-L-carnitine (DC), dodecanoyl-L -A biomarker for lung cancer diagnosis consisting of dodecanoyl-L-carnitine (DDC), myristoyl-L-carnitine (MC), and palmitoyl-L-carnitine (PC) A composition is provided.
  • the biomarker can be extracted from blood.
  • the blood may be whole blood, plasma, or serum.
  • the present invention provides a composition for diagnosing lung cancer, including an agent for measuring blood levels of the biomarker composition for diagnosing lung cancer.
  • the agent for measuring the level of the biomarker composition may be a mass spectrometry agent.
  • the present invention provides a kit for diagnosing lung cancer, including an agent for measuring blood levels of the biomarker composition for diagnosing lung cancer.
  • the present invention provides (a) kynurenine (KN), lysophosphatidylcholine 16:0 (LPC16), lysophosphatidylcholine 18:0 (LPC18), and glutamic acid from the blood of a test subject.
  • KN kynurenine
  • LPC16 lysophosphatidylcholine 16:0
  • LPC18 lysophosphatidylcholine 18:0
  • glutamic acid from the blood of a test subject.
  • the blood in step (a) may be whole blood, plasma, or serum.
  • the concentration of the biomarker in step (a) can be obtained by mass spectrometry of whole blood, plasma, or serum samples by mass peak area, and specifically, liquid chromatography-mass spectrometry (LC-MS), but the mass spectrometer may be any of Triple TOF, Triple Quadrupole, and MALDI TOF capable of quantitative measurement.
  • LC-MS liquid chromatography-mass spectrometry
  • the level of the biomarker in the test subject's blood can be input into the algorithm model and the occurrence of lung cancer can be output as an output value.
  • step (b) is,
  • the level of the biomarker can be learned through a machine learning algorithm to create a lung cancer incidence prediction model.
  • the artificial intelligence may be machine learning or deep learning, and more specifically, the algorithm of step (b) is k-nearest neighbor. algorithm; Logistic regression algorithm; Discriminant analysis algorithm; Partial least squares-discriminant analysis algorithm; Support vector machine algorithm; decision tree algorithm; decision tree ensemble algorithm; and a linear or non-linear classification algorithm including a neural network algorithm.
  • the algorithm when the algorithm is a support vector machine algorithm, it can be expressed as a kernel function of Equation 1 below.
  • the present invention includes a measuring unit that measures the level of a biomarker for lung cancer diagnosis in the blood of a test subject; and a cancer diagnosis unit that determines whether lung cancer has developed by inputting the biomarker level into a learned artificial intelligence algorithm. It provides an artificial intelligence-based lung cancer diagnosis and prediction device.
  • the present invention 10 types of biomarkers that can more accurately diagnose lung cancer were selected and an artificial intelligence-based algorithm for lung cancer diagnosis was established using these.
  • the early lung cancer screening ability using the algorithm developed in the present invention has a sensitivity of 90.21% and a specificity of 93.03%, and it has been confirmed that it has a very high accuracy compared to existing lung cancer screening methods. Therefore, the present invention is suitable for lung cancer diagnosis. Information can be effectively provided.
  • Figure 1 shows kynurenine (KN), lysophosphatidylcholine 16:0 (LPC16), and lysophosphatidylcholine 18:0 in blood obtained from normal control group (Con) and lung cancer patient group (LC).
  • KN kynurenine
  • LPC16 lysophosphatidylcholine 16:0
  • LC lung cancer patient group
  • Figure 2 shows data confirming different expression patterns according to the type of biomarker in the blood of lung cancer patients.
  • kynurenine (KN), lysophosphatidylcholine 16:0 (LPC16), lysophosphatidylcholine 18:0 (LPC18), glutamic acid (Glu) , hexanoyl-L-carnitine (HC), octanoyl-L-carnitine (OC), decanoyl-L-carnitine (DC), dode Composed of dodecanoyl-L-carnitine (DDC), myristoyl-L-carnitine (MC), and palmitoyl-L-carnitine (PC). It relates to a biomarker composition for lung cancer diagnosis.
  • the biomarker is extracted from blood, and the blood may be whole blood, plasma, or serum.
  • diagnosis means confirming the presence or characteristics of a pathological condition. For the purposes of the present invention, diagnosis is to determine whether lung cancer has developed.
  • the term "diagnostic biomarker” refers to polypeptides, nucleic acids (e.g. mRNA, etc.), lipids, glycolipids, glycoproteins, sugars (monosaccharides, refers to organic biomolecules such as disaccharides, oligosaccharides, etc.), and is preferably the biomarker composition for diagnosing lung cancer.
  • blood from normal control (Con) and lung cancer (LC) patient groups was obtained, respectively, and KN, LPC16, LPC18, Glu, HC, OC, DC, DDC, MC and PC concentration was measured. It was confirmed that the blood concentration of the biomarker of the present invention was significantly different between the quantitative value of the lung cancer patient group and the normal control group. KN, LPC16, LPC18, and Glu metabolites were found in the blood of the lung cancer patient group compared to the normal control group. It was confirmed that the concentrations of HC, OC, DC, DDC, MC, and PC metabolites decreased ( Figures 1 and 2).
  • composition for lung cancer diagnosis is provided.
  • the present invention relates to a composition for diagnosing lung cancer comprising an agent for measuring the blood level of the biomarker composition for diagnosing lung cancer of the present invention.
  • composition for diagnosing lung cancer according to the present invention applies mutatis mutandis to the ⁇ Biomarker composition for diagnosing lung cancer> described above.
  • the biomarker of the present invention is a metabolite, and the agent that measures the level of the biomarker composition may be a mass spectrometry agent.
  • the mass spectrometry preparation refers to a preparation capable of analyzing the mass of a marker in whole blood, plasma, or serum, and specifically refers to a preparation capable of performing liquid chromatography-mass spectrometry (LC-MS).
  • LC-MS liquid chromatography-mass spectrometry
  • the present invention relates to a kit for diagnosing lung cancer, which includes an agent for measuring the blood level of the biomarker composition for diagnosing lung cancer of the present invention.
  • composition for diagnosing lung cancer according to the present invention applies mutatis mutandis to the ⁇ Biomarker composition for diagnosing lung cancer> described above.
  • the kit can be manufactured by conventional manufacturing methods known in the art.
  • the kit may include, for example, a lyophilized antibody, a buffer solution, a stabilizer, an inactive protein, etc.
  • the present invention provides (a) kynurenine (KN), lysophosphatidylcholine 16:0 (LPC16), and lysophosphatidylcholine 18:0 from the blood of a test subject.
  • KN kynurenine
  • LPC16 lysophosphatidylcholine 16:0
  • lysophosphatidylcholine 18:0 from the blood of a test subject.
  • LPC18 glutamic acid (Glu), hexanoyl-L-carnitine (HC), octanoyl-L-carnitine (OC), decanoyl-L-carnitine ( decanoyl-L-carnitine (DC), dodecanoyl-L-carnitine (DDC), myristoyl-L-carnitine (MC) and palmitoyl-L-carnitine ( Measuring the level of a biomarker for lung cancer diagnosis consisting of palmitoyl-L-carnitine (PC); and
  • the blood in step (a) may be whole blood, plasma, or serum.
  • the concentration of the biomarker in step (a) can be obtained by mass spectrometry of whole blood, plasma, or serum samples by mass peak area, specifically using liquid chromatography-mass spectrometry (LC-MS).
  • the mass spectrometer may be any one of Triple TOF, Triple Quadrupole, and MALDI TOF capable of quantitative measurement.
  • the level of the biomarker in the test subject's blood can be input into the algorithm model and the occurrence of lung cancer can be output as an output value.
  • step (b) the algorithm model of step (b) is,
  • the level of the biomarker can be learned through a machine learning algorithm to create a lung cancer incidence prediction model.
  • the artificial intelligence may be machine learning or deep learning
  • the algorithm of step (b) includes a k-nearest neighbor algorithm; Logistic regression algorithm; Discriminant analysis algorithm; Partial least squares-discriminant analysis algorithm; Support vector machine algorithm; decision tree algorithm; decision tree ensemble algorithm; and a linear or non-linear classification algorithm including a neural network algorithm.
  • the algorithm when the algorithm is a support vector machine algorithm, it can be expressed as a kernel function of Equation 1 below.
  • a prediction model was developed using quantitative values for 10 biomarkers of the present invention measured in the blood of lung cancer patients and normal controls, and the algorithm uses a radial basis function A support vector machine using as the kernel was used. As a result of confirming the ability to diagnose early lung cancer using the developed prediction model, it was found to have an accuracy of 90.21% sensitivity and 93.03% specificity.
  • the artificial intelligence-based lung cancer diagnosis method using 10 types of biomarkers of the present invention has a very high accuracy compared to other existing diagnostic methods.
  • the present invention is another consistent point, kynurenine (KN), lysophosphatidylcholine 16:0 (lysophosphatidylcholine 16:0, LPC16), lysophosphatidylcholine 18:0 (LPC18) in the blood of the test subject ), glutamic acid (Glu), hexanoyl-L-carnitine (HC), octanoyl-L-carnitine (OC), decanoyl-L-carnitine (decanoyl) -L-carnitine (DC), dodecanoyl-L-carnitine (DDC), myristoyl-L-carnitine (MC) and palmitoyl-L-carnitine (palmitoyl) -A measuring unit that measures the level of a biomarker for lung cancer diagnosis consisting of (L-carnitine, PC); and
  • an artificial intelligence-based lung cancer diagnosis and prediction device including a cancer diagnosis unit that inputs the biomarker level into a learned artificial intelligence algorithm to determine whether lung cancer has occurred.
  • Example 1 Measurement of biomarker concentration in blood of lung cancer patient group and normal control group
  • a total of 864 people were selected. Specifically, 445 normal control patients and 419 lung cancer (LC) patients were selected through Seoul National University Bundang Hospital and Ajou University Hospital. And blood was collected.
  • LC lung cancer
  • Plasma was separated from the blood sample, and kynurenine (KN), lysophosphatidylcholine 16:0 (LPC16), lysophosphatidylcholine 18:0 (LPC18), glutamic acid, Glu), hexanoyl-L-carnitine (HC), octanoyl-L-carnitine (OC), decanoyl-L-carnitine (DC) , dodecanoyl-L-carnitine (DDC), myristoyl-L-carnitine (MC) and palmitoyl-L-carnitine (PC) Standard materials at each concentration required for each biomarker standard curve were produced.
  • KN kynurenine
  • LPC16 lysophosphatidylcholine 16:0
  • LPC18 lysophosphatidylcholine 18:0
  • glutamic acid glutamic acid
  • Glu hexanoyl-L-carnitine
  • OC
  • lipid extraction buffer (Abnova, Taiwan) was added to 20 ⁇ l of plasma and standard materials, vortexed, and centrifuged (10,000 g, 5 minutes, 4°C). After centrifugation, the supernatant was transferred to a new tube and dried for 12 to 16 hours using a concentrator. Add 50 ⁇ l of 100% methanol containing 0.1% formic acid (FA) to the dried metabolite extract, dissolve well using a vortex, and then perform LC-MS/MS (liquid chromatography - mass spectrometry/mass spectrometry). The analysis was conducted using
  • the LC used was the Shimadzu LC 40 system, and the MS was the AB Sciex Triple Quad 5500+ system.
  • the MS was equipped with a turbo spray ion source.
  • Analytical samples were separated within the BEH C18 column (1.7um, 2.1*50mm; Waters) of the Shimadzu LC 40 system.
  • the solvent is a two-step linear gradient (solvent A, 0.1% FA in water; solvent B, 0.1% FA in 100% acetonitrile; 5 ⁇ 55% solvent B 2.5 min, 55% solvent B 5.5 min, 55 ⁇ 95% solvent B 7.5 min, 95% solvent B 11 min, 95 ⁇ 5% solvent B 11.1 min, and 5% solvent B 14.5 min) were used.
  • Mass spectrometry was performed using multiple reaction monitoring (MRM) mode. The area of the mass peak with the same mass value was calculated among the mass spectra of the same time period when the metabolite corresponding to each biomarker passes through liquid chromatography. A standard curve was created using the mass peaks of each biomarker standard material, and the mass peaks of each sample were substituted into the standard curve to measure the concentration of each biomarker.
  • MRM multiple reaction monitoring
  • the blood concentrations of 10 types of biomarkers were confirmed to be significantly different between the quantitative values of the lung cancer patient group and the normal control group.
  • the lung cancer patient group It was confirmed that the concentrations of KN, LPC16, LPC18, and Glu metabolites increased, and those of HC, OC, DC, DDC, MC, and PC decreased in the blood.
  • Example 2 Development of an artificial intelligence-based algorithm model for lung cancer diagnosis
  • a prediction model that can diagnose lung cancer was developed by applying a support vector machine algorithm that uses a radial basis function as the kernel to the quantitative values of 10 types of biomarkers.
  • a lung cancer incidence prediction model was learned by using the kernel function expressed in Equation 1 below and tuning algorithm parameters.
  • Equation 1 determines the range of influence of one training sample, and another parameter, C, determines the extent to which training samples are allowed to be misclassified. Since the learning model is either underfitting or overfitting depending on the values of both parameters, the optimal parameters were selected through repeated cross-validation.
  • sensitivity was 90.21%
  • specificity was 93.03%
  • positive predictive value (PPV) was 92.42%
  • negative predictive value was 92.42%.
  • NPV was found to have an accuracy of 90.99%. In other words, it was confirmed that the artificial intelligence-based lung cancer diagnosis method using 10 types of biomarkers of the present invention has a very high accuracy compared to other existing diagnostic methods.
  • the present invention 10 types of biomarkers that can more accurately diagnose lung cancer are selected, and the early lung cancer screening ability using the algorithm developed using these has a sensitivity of 90.21% and a specificity of 93.03%, compared to the existing Since it has been confirmed that it has a very high accuracy compared to lung cancer screening methods, the present invention can be effectively applied to lung cancer diagnosis.

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Theoretical Computer Science (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

본 발명은 폐암 진단용 바이오마커 및 폐암 진단에 대한 인공지능 기반 정보 제공 방법에 관한 것으로, 보다 상세하게는 키뉴레닌(kynurenine, KN), 리소포스파티딜콜린 16:0(lysophosphatidylcholine 16:0, LPC16), 리소포스파티딜콜린 18:0(lysophosphatidylcholine 18:0, LPC18), 글루탐산(glutamic acid, Glu), 헥사노일-L-카르니틴(hexanoyl-L-carnitine, HC), 옥타노일-L-카르니틴(octanoyl-L-carnitine, OC), 데카노일-L-카르니틴(decanoyl-L-carnitine, DC), 도데카노일-L-카르니틴(dodecanoyl-L-carnitine, DDC), 미리스토일-L-카르니틴(myristoyl-L-carnitine, MC) 및 팔미토일-L-카르니틴(palmitoyl-L-carnitine, PC)으로 구성된 폐암 진단용 바이오마커 조성물 및 상기 바이오마커를 이용한 인공지능 기반 폐암 진단에 대한 정보 제공 방법에 관한 것이다. 본 발명에서 선별한 폐암 진단용 바이오마커를 이용하여 폐암 진단을 위한 인공지능 기반 알고리즘 모델을 확립한 결과, 조기 폐암 선별능은 민감도(sensitivity) 90.21%, 특이도(Specificity) 93.03%로, 기존 폐암 선별방법에 비해 매우 높은 정확도를 가지고 있음을 확인하였으므로, 본 발명은 폐암 진단에 대한 정보를 효과적으로 제공할 수 있다.

Description

폐암 진단용 바이오마커 및 폐암 진단에 대한 인공지능 기반 정보 제공 방법
본 발명은 폐암 진단용 바이오마커 및 폐암 진단에 대한 인공지능 기반 정보 제공 방법에 관한 것으로, 보다 상세하게는 키뉴레닌(kynurenine, KN), 리소포스파티딜콜린 16:0(lysophosphatidylcholine 16:0, LPC16), 리소포스파티딜콜린 18:0(lysophosphatidylcholine 18:0, LPC18), 글루탐산(glutamic acid, Glu), 헥사노일-L-카르니틴(hexanoyl-L-carnitine, HC), 옥타노일-L-카르니틴(octanoyl-L-carnitine, OC), 데카노일-L-카르니틴(decanoyl-L-carnitine, DC), 도데카노일-L-카르니틴(dodecanoyl-L-carnitine, DDC), 미리스토일-L-카르니틴(myristoyl-L-carnitine, MC) 및 팔미토일-L-카르니틴(palmitoyl-L-carnitine, PC)으로 구성된 폐암 진단용 바이오마커 조성물 및 상기 바이오마커를 이용한 폐암 진단에 대한 인공지능 기반 정보 제공 방법에 관한 것이다.
암은 세포가 무한히 증식해 정상적인 세포의 기능을 방해하는 질병으로, 간암, 폐암, 위암, 유방암, 대장암 및 난소암 등이 대표적이나, 실질적으로는 어느 조직(tissue)에서나 발생할 수 있다.
초창기 암 진단은 암 세포의 성장에 따른 생체 조직의 외적 변화에 근거하였으나, 근래에 들어 혈액, 당쇄(glyco chain), 디엔에이(DNA) 등 생물의 조직 또는 세포에 존재하는 미량의 생체 분자 검출을 이용한 진단이 시도되고 있다. 그러나 가장 보편적으로 사용되는 암 진단 방법은 생체 조직 검사를 통해 얻어진 조직 샘플을 이용하거나, 영상을 이용한 진단이다.
그 중 생체 조직 검사는 환자에게 큰 고통을 야기하며, 고비용이 들 뿐 만 아니라, 진단까지 긴 시간이 소요되는 단점이 있다. 또한, 환자가 실제 암에 걸린 경우, 생체 조직 검사 과정 중 암의 전이가 유발될 수 있는 위험이 있으며, 생체 조직 검사를 통해 조직 샘플을 얻을 수 없는 부위의 경우, 외과적인 수술을 통해 의심되는 조직의 적출이 이루어지기 전에는 질병의 진단이 불가능한 단점이 있다.
특히, 폐암은 전세계적으로 높은 치사율을 보이는 암 중 하나로, 현재 폐암의 경우 이미징 방법(X-ray, CT, MRI 등)에 의존도가 높은 편이다. 하지만, 폐암 환자의 절반 이상은 발견 당시 이미 수술이 불가능하며 수술이 가능하다고 판단되어 수술을 시행하여도 그중 많은 수에서는 완전절제가 불가능한 상태이다. 그러므로 폐암의 완치율을 높이기 위해서는 폐암의 조기 진단 및 치료가 가장 중요하나, 폐암은 진단에 유용한 표지(marker)가 제한적이기 때문에 이러한 진단이 어려운 문제점이 있다. 따라서, 생물학적 시료에 존재하는 암 특이적인 마커를 찾고 이들 마커를 이용하여 높은 정확도와 정밀도로 암을 진단할 수 있는 방법을 개발할 필요가 있다.
최근에는, 보다 정확한 암 진단을 위해, 인공지능을 이용한 방법이 연구되고 있다. 인공지능을 이용한 분석에는 머신러닝(machine learning) 또는 딥러닝(deep learning)을 주로 사용하고 있으며, 이러한 인공지능을 바이오 분야에 활용하는 다양한 연구가 이루어지고 있는 추세이다 (대한민국 공개특허 제10-2014-0002149호, 대한민국 등록특허 제10-2268963호).
이에, 본 발명자들은 폐암을 보다 정확하게 진단할 수 있는 마커를 선별하기 위해 예의 노력한 결과, 키뉴레닌(kynurenine, KN), 리소포스파티딜콜린 16:0(lysophosphatidylcholine 16:0, LPC16), 리소포스파티딜콜린 18:0(lysophosphatidylcholine 18:0, LPC18), 글루탐산(glutamic acid, Glu), 헥사노일-L-카르니틴(hexanoyl-L-carnitine, HC), 옥타노일-L-카르니틴(octanoyl-L-carnitine, OC), 데카노일-L-카르니틴(decanoyl-L-carnitine, DC), 도데카노일-L-카르니틴(dodecanoyl-L-carnitine, DDC), 미리스토일-L-카르니틴(myristoyl-L-carnitine, MC) 및 팔미토일-L-카르니틴(palmitoyl-L-carnitine, PC)으로 구성된 바이오마커를 선별하고, 이들 바이오마커의 발현 수준이 환자군과 정상 대조군에서 다른 패턴을 보이는 것을 확인하였다. 또한, 이들 바이오마커 10종에 대한 정량값을 인공지능 기반 알고리즘을 사용하여 분석한 결과, 폐암 진단능이 향상되는 것을 확인하고, 본 발명을 완성하였다.
따라서, 본 발명의 목적은 폐암 진단용 바이오마커 조성물을 제공하는 데 있다.
본 발명의 다른 목적은 상기 바이오마커의 발현 수준을 측정하는 물질을 포함하는 폐암 진단용 조성물 및 이를 이용한 폐암 진단 키트를 제공하는 데 있다.
본 발명의 또 다른 목적은 상기 바이오마커를 이용하여 폐암 진단을 위한 인공지능 기반 정보를 제공하는 방법을 제공하는 데 있다.
상기 목적을 달성하기 위해,
본 발명은 키뉴레닌(kynurenine, KN), 리소포스파티딜콜린 16:0(lysophosphatidylcholine 16:0, LPC16), 리소포스파티딜콜린 18:0(lysophosphatidylcholine 18:0, LPC18), 글루탐산(glutamic acid, Glu), 헥사노일-L-카르니틴(hexanoyl-L-carnitine, HC), 옥타노일-L-카르니틴(octanoyl-L-carnitine, OC), 데카노일-L-카르니틴(decanoyl-L-carnitine, DC), 도데카노일-L-카르니틴(dodecanoyl-L-carnitine, DDC), 미리스토일-L-카르니틴(myristoyl-L-carnitine, MC) 및 팔미토일-L-카르니틴(palmitoyl-L-carnitine, PC)으로 구성된 폐암 진단용 바이오마커 조성물을 제공한다.
본 발명의 바람직한 일실시예에 있어서, 바이오마커는 혈액에서 추출할 수 있다.
본 발명의 바람직한 다른 일실시예에 있어서, 상기 혈액은 전혈, 혈장 또는 혈청일 수 있다.
다른 목적을 달성하기 위해,
본 발명은 상기 폐암 진단용 바이오마커 조성물의 혈액 내 수준을 측정하는 제제를 포함하는 폐암 진단용 조성물을 제공한다.
본 발명의 바람직한 일실시예에 있어서, 상기 바이오마커 조성물의 수준을 측정하는 제제는 질량 분석용 제제일 수 있다.
또한, 본 발명은 상기 폐암 진단용 바이오마커 조성물의 혈액 내 수준을 측정하는 제제를 포함하는 폐암 진단용 키트를 제공한다.
또 다른 목적을 달성하기 위해,
본 발명은 (a) 검사 대상자의 혈액으로부터 키뉴레닌(kynurenine, KN), 리소포스파티딜콜린 16:0(lysophosphatidylcholine 16:0, LPC16), 리소포스파티딜콜린 18:0(lysophosphatidylcholine 18:0, LPC18), 글루탐산(glutamic acid, Glu), 헥사노일-L-카르니틴(hexanoyl-L-carnitine, HC), 옥타노일-L-카르니틴(octanoyl-L-carnitine, OC), 데카노일-L-카르니틴(decanoyl-L-carnitine, DC), 도데카노일-L-카르니틴(dodecanoyl-L-carnitine, DDC), 미리스토일-L-카르니틴(myristoyl-L-carnitine, MC) 및 팔미토일-L-카르니틴(palmitoyl-L-carnitine, PC)으로 구성된 폐암 진단용 바이오마커의 수준을 측정하는 단계; 및
(b) 상기 바이오마커의 발현 수준을 머신러닝 알고리즘 모델에 적용시키는 단계를 포함하는, 인공지능을 이용한 폐암 진단을 위한 정보 제공 방법을 제공한다.
본 발명의 바람직한 일실시예에 있어서, 상기 (a) 단계의 혈액은 전혈, 혈장 또는 혈청일 수 있다.
본 발명의 바람직한 다른 일실시예에 있어서, 상기 (a) 단계에서 바이오마커의 농도는 질량피크 면적으로 전혈, 혈장 또는 혈청 시료를 질량분석하여 얻을 수 있으며, 구체적으로는 액체크로마토그래피-질량분석기(LC-MS)를 통해 얻었으나, 상기 질량분석기는 Triple TOF, Triple Quadrupole 및 정량성 측정이 가능한 MALDI TOF 중 어느 하나인 것일 수 있다.
본 발명의 바람직한 또 다른 일실시예에 있어서, 상기 (b) 알고리즘 모델에 적용시키는 단계에서는 검사 대상자의 혈액 내 바이오마커 수준을 상기 알고리즘 모델에 입력하여 출력값으로 폐암의 발병 여부를 출력할 수 있다.
본 발명의 바람직한 또 다른 일실시예에 있어서, 상기 (b) 단계의 알고리즘 모델은,
(ⅰ) 폐암 환자군 및 정상 대조군의 혈액으로부터 키뉴레닌(kynurenine, KN), 리소포스파티딜콜린 16:0(lysophosphatidylcholine 16:0, LPC16), 리소포스파티딜콜린 18:0(lysophosphatidylcholine 18:0, LPC18), 글루탐산(glutamic acid, Glu), 헥사노일-L-카르니틴(hexanoyl-L-carnitine, HC), 옥타노일-L-카르니틴(octanoyl-L-carnitine, OC), 데카노일-L-카르니틴(decanoyl-L-carnitine, DC), 도데카노일-L-카르니틴(dodecanoyl-L-carnitine, DDC), 미리스토일-L-카르니틴(myristoyl-L-carnitine, MC) 및 팔미토일-L-카르니틴(palmitoyl-L-carnitine, PC)으로 구성된 폐암 진단용 바이오마커의 수준을 측정하는 단계;
(ⅱ) 상기 바이오마커의 수준을 머신러닝 알고리즘으로 학습시켜 폐암 발병 예측 모델을 생성하는 단계를 통해 도출할 수 있다.
본 발명의 바람직한 또 다른 일실시예에 있어서, 상기 인공지능은 머신러닝(machine Learning) 또는 딥러닝(deep Learning)일 수 있으며, 보다 구체적으로 상기 (b) 단계의 알고리즘은, k-최근접 이웃 알고리즘; 로지스틱 회귀 알고리즘; 판별분석 알고리즘; 부분최소자승-판별분석 알고리즘; 서포트 벡터 머신 알고리즘; 결정트리 알고리즘; 결정트리 앙상블 알고리즘; 및 신경망 알고리즘을 포함하는 선형 또는 비선형 분류(classification) 알고리즘으로부터 선택되는 어느 하나일 수 있다.
본 발명의 바람직한 또 다른 일실시예에 있어서, 상기 알고리즘이 서포트 벡터 머신 알고리즘인 경우, 하기 수학식 1의 커널 함수로 표시될 수 있다.
[수학식 1]
Figure PCTKR2023006352-appb-img-000001
x : 폐암 진단용 바이오마커 조성물의 혈액 내 수준 측정값
σ: 결정 경계의 유연성(곡률)에 대한 매개변수
또한, 본 발명은 검사 대상자의 혈액 내 폐암 진단용 바이오마커 수준을 측정하는 측정부; 및 상기 바이오마커 수준을 학습된 인공지능 알고리즘에 입력하여 폐암 발병 유부를 판정하는 암 진단부를 포함하는 인공지능 기반 폐암 진단 예측 장치를 제공한다.
본 발명에서는 폐암을 보다 정확하게 진단할 수 있는 10종의 바이오마커를 선별하고, 이를 이용하여 폐암 진단을 위한 인공지능 기반 알고리즘을 확립하였다. 본 발명에서 개발된 알고리즘을 이용한 조기 폐암 선별능은 민감도(sensitivity) 90.21%, 특이도(specificity) 93.03%로, 기존 폐암 선별방법에 비해 매우 높은 정확도를 가지고 있음을 확인하였으므로, 본 발명은 폐암 진단에 대한 정보를 효과적으로 제공할 수 있다.
도 1은 정상 대조군(Con)과 폐암 환자군(LC)으로부터 수득한 혈액 내 키뉴레닌(kynurenine, KN), 리소포스파티딜콜린 16:0(lysophosphatidylcholine 16:0, LPC16), 리소포스파티딜콜린 18:0(lysophosphatidylcholine 18:0, LPC18), 글루탐산(glutamic acid, Glu), 헥사노일-L-카르니틴(hexanoyl-L-carnitine, HC), 옥타노일-L-카르니틴(octanoyl-L-carnitine, OC), 데카노일-L-카르니틴(decanoyl-L-carnitine, DC), 도데카노일-L-카르니틴(dodecanoyl-L-carnitine, DDC), 미리스토일-L-카르니틴(myristoyl-L-carnitine, MC) 및 팔미토일-L-카르니틴(palmitoyl-L-carnitine, PC) 농도를 확인한 데이터이다.
도 2는 폐암 환자의 혈액에서 바이오마커 종류에 따른 상이한 발현 패턴을 확인한 데이터이다.
이하, 본 발명을 상세하게 설명한다.
폐암 진단용 바이오마커 조성물
본 발명은 일관점에서, 키뉴레닌(kynurenine, KN), 리소포스파티딜콜린 16:0(lysophosphatidylcholine 16:0, LPC16), 리소포스파티딜콜린 18:0(lysophosphatidylcholine 18:0, LPC18), 글루탐산(glutamic acid, Glu), 헥사노일-L-카르니틴(hexanoyl-L-carnitine, HC), 옥타노일-L-카르니틴(octanoyl-L-carnitine, OC), 데카노일-L-카르니틴(decanoyl-L-carnitine, DC), 도데카노일-L-카르니틴(dodecanoyl-L-carnitine, DDC), 미리스토일-L-카르니틴(myristoyl-L-carnitine, MC) 및 팔미토일-L-카르니틴(palmitoyl-L-carnitine, PC)으로 구성된 폐암 진단용 바이오마커 조성물에 관한 것이다.
본 발명에 있어서, 바이오마커는 혈액에서 추출한 것이며, 상기 혈액은 전혈, 혈장 또는 혈청일 수 있다.
본 발명에서 사용된 용어 "진단"은 병리 상태의 존재 또는 특징을 확인하는 것을 의미한다. 본 발명의 목적상, 진단은 폐암 발병 여부를 확인하는 것이다.
본 발명에서 사용된 용어 "진단용 바이오마커"란 정상 대조군에 비해 폐암 환자군에서 유의적 증가 또는 유의적 감소를 보이는 폴리펩타이드, 핵산(예: mRNA 등), 지질, 당지질, 당단백질, 당(단당류, 이당류, 올리고당류 등) 등과 같은 유기 생체 분자를 의미하며, 바람직하게는 상기 폐암 진단용 바이오마커 조성물이다.
본 발명의 구체적인 일구현예에서는, 정상 대조군(Con), 폐암(lung cancer, LC) 환자군의 혈액을 각각 수득하여, 혈액 내 KN, LPC16, LPC18, Glu, HC, OC, DC, DDC, MC 및 PC 농도를 측정하였다. 본 발명의 바이오마커의 혈액 내 농도는 폐암 환자군의 정량값과 정상 대조군의 정량값이 유의하게 차이가 나는 것을 확인하였으며, 정상 대조군에 비해 폐암 환자군의 혈액 내에서 KN, LPC16, LPC18 및 Glu 대사체 농도는 증가하고, HC, OC, DC, DDC, MC 및 PC 대사체 농도는 감소하는 것으로 확인되었다 (도 1 및 도 2).
폐암 진단용 조성물
본 발명은 다른 관점에서, 본 발명의 폐암 진단용 바이오마커 조성물의 혈액 내 수준을 측정하는 제제를 포함하는 폐암 진단용 조성물에 관한 것이다.
본 발명에 따른 폐암 진단용 조성물은 상술한 <폐암 진단용 바이오마커 조성물>을 준용한다.
본 발명의 바이오마커는 대사체로, 상기 바이오마커 조성물의 수준을 측정하는 제제는 질량 분석용 제제일 수 있다.
상기 질량 분석용 제제는 전혈, 혈장 또는 혈청 내 마커의 질량을 분석할 수 있는 제제로, 구체적으로 액체크로마토그래피-질량분석(LC-MS)을 수행할 수 있는 제제를 의미한다.
폐암 진단용 키트
본 발명은 또 다른 일관점에서, 본 발명의 폐암 진단용 바이오마커 조성물의 혈액 내 수준을 측정하는 제제를 포함하는 폐암 진단용 키트에 관한 것이다.
본 발명에 따른 폐암 진단용 조성물은 상술한 <폐암 진단용 바이오마커 조성물>을 준용한다.
상기 키트는 당업계에 알려져 있는 통상의 제조방법에 의해 제조될 수 있다. 상기 키트는 예를 들면, 동결 건조 형태의 항체와 완충액, 안정화제, 불활성 단백질 등을 포함할 수 있다.
인공지능 기반 알고리즘을 이용한 폐암 진단에 대한 정보 제공 방법
본 발명은 또 다른 일관점에서, (a) 검사 대상자의 혈액으로부터 키뉴레닌(kynurenine, KN), 리소포스파티딜콜린 16:0(lysophosphatidylcholine 16:0, LPC16), 리소포스파티딜콜린 18:0(lysophosphatidylcholine 18:0, LPC18), 글루탐산(glutamic acid, Glu), 헥사노일-L-카르니틴(hexanoyl-L-carnitine, HC), 옥타노일-L-카르니틴(octanoyl-L-carnitine, OC), 데카노일-L-카르니틴(decanoyl-L-carnitine, DC), 도데카노일-L-카르니틴(dodecanoyl-L-carnitine, DDC), 미리스토일-L-카르니틴(myristoyl-L-carnitine, MC) 및 팔미토일-L-카르니틴(palmitoyl-L-carnitine, PC)으로 구성된 폐암 진단용 바이오마커의 수준을 측정하는 단계; 및
(b) 상기 바이오마커의 발현 수준을 머신러닝 알고리즘 모델에 적용시키는 단계를 포함하는, 인공지능을 이용한 폐암 진단을 위한 정보 제공 방법을 제공한다.
본 발명에 있어서, 상기 (a) 단계의 혈액은 전혈, 혈장 또는 혈청일 수 있다.
본 발명에 있어서, 상기 (a) 단계에서 바이오마커의 농도는, 질량피크 면적으로 전혈, 혈장 또는 혈청 시료를 질량분석하여 얻을 수 있으며, 구체적으로는 액체크로마토그래피-질량분석기(LC-MS)를 통해 얻었으나, 상기 질량분석기는 Triple TOF, Triple Quadrupole 및 정량성 측정이 가능한 MALDI TOF 중 어느 하나인 것일 수 있다.
본 발명에 있어서, 상기 (b) 알고리즘 모델에 적용시키는 단계는 검사 대상자의 혈액 내 바이오마커의 수준을 상기 알고리즘 모델에 입력하여 출력값으로 폐암의 발병 여부를 출력할 수 있다.
본 발명에 있어서, 상기 (b) 단계의 알고리즘 모델은,
(ⅰ) 폐암 환자군 및 정상 대조군의 혈액으로부터 키뉴레닌(kynurenine, KN), 리소포스파티딜콜린 16:0(lysophosphatidylcholine 16:0, LPC16), 리소포스파티딜콜린 18:0(lysophosphatidylcholine 18:0, LPC18), 글루탐산(glutamic acid, Glu), 헥사노일-L-카르니틴(hexanoyl-L-carnitine, HC), 옥타노일-L-카르니틴(octanoyl-L-carnitine, OC), 데카노일-L-카르니틴(decanoyl-L-carnitine, DC), 도데카노일-L-카르니틴(dodecanoyl-L-carnitine, DDC), 미리스토일-L-카르니틴(myristoyl-L-carnitine, MC) 및 팔미토일-L-카르니틴(palmitoyl-L-carnitine, PC)으로 구성된 폐암 진단용 바이오마커의 수준을 측정하는 단계;
(ⅱ) 상기 바이오마커의 수준을 머신러닝 알고리즘으로 학습시켜 폐암 발병 예측 모델을 생성하는 단계를 통해 도출할 수 있다.
본 발명에 있어서, 상기 인공지능은 머신러닝(machine learning) 또는 딥러닝(deep learning)일 수 있으며, 보다 구체적으로 상기 (b) 단계의 알고리즘은, k-최근접 이웃 알고리즘; 로지스틱 회귀 알고리즘; 판별분석 알고리즘; 부분최소자승-판별분석 알고리즘; 서포트 벡터 머신 알고리즘; 결정트리 알고리즘; 결정트리 앙상블 알고리즘; 및 신경망 알고리즘을 포함하는 선형 또는 비선형 분류(classification) 알고리즘으로부터 선택되는 어느 하나일 수 있다.
본 발명에 있어서, 상기 알고리즘이 서포트 벡터 머신 알고리즘인 경우, 하기 수학식 1의 커널 함수로 표시될 수 있다.
[수학식 1]
Figure PCTKR2023006352-appb-img-000002
x : 폐암 진단용 바이오마커 조성물의 혈액 내 수준 측정값
σ: 결정 경계의 유연성(곡률)에 대한 매개변수
본 발명의 구체적인 일구현예에서, 폐암 환자군과 정상 대조군의 혈액 내에서 측정된 본 발명의 바이오마커 10종에 대한 정량값을 이용하여 예측 모델을 개발하였으며, 알고리즘은 방사 기저 함수(radial basis function)를 커널로 쓰는 서포트 벡터 머신(support vector machine)을 이용하였다. 개발된 예측 모델을 이용하여 조기 폐암 진단능을 확인한 결과, 민감도(sensitivity) 90.21%, 특이도(specificity) 93.03%의 정확도를 보이는 것으로 나타났다.
즉, 본 발명의 10종의 바이오마커를 이용한 인공지능 기반 폐암 진단 방법은 기존의 다른 진단 방법에 비해 매우 높은 정확도를 가지고 있음을 확인하였다.
또한, 본 발명은 또 다른 일관점에서, 검사 대상자의 혈액 내 키뉴레닌(kynurenine, KN), 리소포스파티딜콜린 16:0(lysophosphatidylcholine 16:0, LPC16), 리소포스파티딜콜린 18:0(lysophosphatidylcholine 18:0, LPC18), 글루탐산(glutamic acid, Glu), 헥사노일-L-카르니틴(hexanoyl-L-carnitine, HC), 옥타노일-L-카르니틴(octanoyl-L-carnitine, OC), 데카노일-L-카르니틴(decanoyl-L-carnitine, DC), 도데카노일-L-카르니틴(dodecanoyl-L-carnitine, DDC), 미리스토일-L-카르니틴(myristoyl-L-carnitine, MC) 및 팔미토일-L-카르니틴(palmitoyl-L-carnitine, PC)으로 구성된 폐암 진단용 바이오마커 수준을 측정하는 측정부; 및
상기 바이오마커 수준을 학습된 인공지능 알고리즘에 입력하여 폐암 발병 유부를 판정하는 암 진단부;를 포함하는 인공지능 기반 폐암 진단 예측 장치를 제공한다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다.
이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예 1 : 폐암 환자군과 정상 대조군 혈액 내 바이오마커 농도 측정
1-1 : 시료 준비
본 발명의 바이오마커가 폐암을 진단할 수 있는지 확인하기 위해, 총 864명을 선별하였으며, 구체적으로 정상 대조군 445명 및 폐암(lung cancer, LC) 환자군 419명을 분당서울대병원 및 아주대병원을 통해 선별하여 혈액을 채취하였다.
1-2 : 혈액 내 바이오마커 농도 측정
상기 혈액 샘플에서 혈장을 분리하고, 키뉴레닌(kynurenine, KN), 리소포스파티딜콜린 16:0(lysophosphatidylcholine 16:0, LPC16), 리소포스파티딜콜린 18:0(lysophosphatidylcholine 18:0, LPC18), 글루탐산(glutamic acid, Glu), 헥사노일-L-카르니틴(hexanoyl-L-carnitine, HC), 옥타노일-L-카르니틴(octanoyl-L-carnitine, OC), 데카노일-L-카르니틴(decanoyl-L-carnitine, DC), 도데카노일-L-카르니틴(dodecanoyl-L-carnitine, DDC), 미리스토일-L-카르니틴(myristoyl-L-carnitine, MC) 및 팔미토일-L-카르니틴(palmitoyl-L-carnitine, PC) 각각의 바이오마커 표준곡선에 필요한 농도별 표준물질들을 제작하였다.
20 ㎕의 혈장 및 표준물질들에 400 ㎕의 지질 추출 버퍼(lipid extraction buffer; Abnova, 대만)를 넣고 볼텍싱(vortexing) 후, 원심 분리를(10,000g, 5 분, 4℃)하였다. 원심 분리 후 상층액을 새로운 튜브에 모두 옮기고 농축기(concentrator)를 이용해 12 ~ 16 시간 동안 건조시켜 주었다. 건조된 대사체 추출물에 50 ㎕의 0.1% 포름산(FA)이 포함된 100% 메탄올을 넣고 볼텍서(vortex)를 이용해 잘 녹인 후, LC-MS/MS(liquid chromatography - mass spectrometry/mass spectrometry)을 이용하여 분석을 진행하였다.
사용된 LC는 Shimadzu LC 40 system이며, MS는 AB Sciex Triple Quad 5500+ system였다. MS에는 turbo spray ion source를 장착하였다. 분석 시료는 Shimadzu LC 40 system의 BEH C18 column(1.7um, 2.1*50mm; Waters) 내에서 분리되었다. 용매는 two-step linear gradient(solvent A, 0.1% FA in water; solvent B, 0.1% FA in 100% acetonitrile; 5 ~ 55% solvent B 2.5 min, 55% solvent B 5.5 min, 55 ~ 95% solvent B 7.5 min, 95% solvent B 11 min, 95 ~ 5% solvent B 11.1 min 및 5% solvent B 14.5 min)를 사용하였다.
MRM(multiple reaction monitoring) 모드를 이용하여 질량분석(mass spectrometry, MS/MS)을 수행하였다. 각 바이오마커에 해당하는 대사체가 액체크로마토그래피를 통과해서 나오는 시간대와 동일한 시간대의 질량스펙트럼 중, 동일한 질량값을 갖는 질량피크의 면적을 계산하였다. 각 바이오마커 표준물질들의 질량피크를 이용해 표준곡선을 제작하고 각 시료들의 질량피크를 표준곡선에 대입하여 각 바이오마커의 농도를 측정하였다.
그 결과, 도 1 및 도 2에 나타난 바와 같이, 10종의 바이오마커의 혈액 내 농도는 폐암 환자군의 정량값과 정상 대조군의 정량값이 유의하게 차이가 나는 것을 확인하였으며, 정상 대조군에 비해 폐암 환자군의 혈액 내에서 KN, LPC16, LPC18 및 Glu 대사체 농도는 증가하고, HC, OC, DC, DDC, MC 및 PC 대사체 농도는 감소하는 것으로 확인되었다.
실시예 2 : 폐암 진단을 위한 인공지능 기반 알고리즘 모델 개발
본 발명에서는 바이오마커 10종에 대한 정량값에 방사 기저 함수(radial basis function)를 커널로 쓰는 서포트 벡터 머신(support vector machine) 알고리즘을 적용하여 폐암 발명 여부를 진단할 수 있는 예측 모델을 개발하였다.
하기 수학식 1로 표시되는 커널 함수를 이용하고 알고리즘 매개변수 조정(tuning)을 통해 폐암 발병 예측 모델을 학습시켰다.
[수학식 1]
Figure PCTKR2023006352-appb-img-000003
x : 폐암 진단용 바이오마커 조성물의 혈액 내 수준 측정값
σ: 결정 경계의 유연성(곡률)에 대한 매개변수
수학식 1의 매개변수 σ는 하나의 훈련 샘플이 미치는 영향의 범위를 결정하고, 또 다른 매개변수인 C는 훈련 샘플들이 잘못 분류되는 것을 어느 정도 허용할지 결정한다. 두 매개변수 모두 그 값에 따라 학습 모델이 과소 적합(underfitting)되거나 과대 적합(overfitting)되므로 반복 교차검증을 통해 최적의 매개변수를 선정하였다.
알고리즘을 이용한 폐암 진단능 확인
TRUE
Lung cancer Control
predicted Lung cancer 378 31 92.42% PPV
Control 41 414 90.99% NPV
90.21% Sensitivity 93.03% Specificity
개발된 예측 모델을 이용하여 조기 폐암 진단능을 확인한 결과, 상기 표 1에 나타난 바와 같이, 민감도(sensitivity) 90.21%, 특이도(specificity) 93.03%, 양성예측도(PPV) 92.42%, 음성예측도(NPV) 90.99%의 정확도를 보이는 것으로 나타났다. 즉, 본 발명의 10종의 바이오마커를 이용한 인공지능 기반 폐암 진단 방법은 기존의 다른 진단 방법에 비해 매우 높은 정확도를 가지고 있음을 확인하였다.
본 발명에서는 폐암을 보다 정확하게 진단할 수 있는 10종의 바이오마커를 선별하고, 이를 이용하여 개발된 알고리즘을 이용한 조기 폐암 선별능은 민감도(sensitivity) 90.21%, 특이도(specificity) 93.03%로, 기존 폐암 선별방법에 비해 매우 높은 정확도를 가지고 있음을 확인하였으므로, 본 발명은 폐암 진단에 효과적으로 적용할 수 있다.

Claims (14)

  1. 키뉴레닌(kynurenine, KN), 리소포스파티딜콜린 16:0(lysophosphatidylcholine 16:0, LPC16), 리소포스파티딜콜린 18:0(lysophosphatidylcholine 18:0, LPC18), 글루탐산(glutamic acid, Glu), 헥사노일-L-카르니틴(hexanoyl-L-carnitine, HC), 옥타노일-L-카르니틴(octanoyl-L-carnitine, OC), 데카노일-L-카르니틴(decanoyl-L-carnitine, DC), 도데카노일-L-카르니틴(dodecanoyl-L-carnitine, DDC), 미리스토일-L-카르니틴(myristoyl-L-carnitine, MC) 및 팔미토일-L-카르니틴(palmitoyl-L-carnitine, PC)으로 구성된, 폐암 진단용 바이오마커 조성물.
  2. 제1항에 있어서,
    상기 바이오마커는 혈액에서 추출하는 것을 특징으로 하는, 폐암 진단용 바이오마커 조성물.
  3. 제1항에 있어서,
    상기 혈액은 전혈, 혈장 또는 혈청인 것을 특징으로 하는, 폐암 진단용 바이오마커 조성물.
  4. 제1항 내지 제3항 중 어느 한 항의 폐암 진단용 바이오마커 조성물의 혈액 내 수준을 측정하는 제제를 포함하는, 폐암 진단용 조성물.
  5. 제4항에 있어서,
    상기 바이오마커 조성물의 수준을 측정하는 제제는 질량 분석용 제제인 것을 특징으로 하는, 폐암 진단용 조성물.
  6. 제1항 내지 제3항 중 어느 한 항의 폐암 진단용 바이오마커 조성물의 혈액 내 수준을 측정하는 제제를 포함하는, 폐암 진단용 키트.
  7. (a) 검사 대상자의 혈액으로부터 키뉴레닌(kynurenine, KN), 리소포스파티딜콜린 16:0(lysophosphatidylcholine 16:0, LPC16), 리소포스파티딜콜린 18:0(lysophosphatidylcholine 18:0, LPC18), 글루탐산(glutamic acid, Glu), 헥사노일-L-카르니틴(hexanoyl-L-carnitine, HC), 옥타노일-L-카르니틴(octanoyl-L-carnitine, OC), 데카노일-L-카르니틴(decanoyl-L-carnitine, DC), 도데카노일-L-카르니틴(dodecanoyl-L-carnitine, DDC), 미리스토일-L-카르니틴(myristoyl-L-carnitine, MC) 및 팔미토일-L-카르니틴(palmitoyl-L-carnitine, PC)으로 구성된 폐암 진단용 바이오마커의 수준을 측정하는 단계; 및
    (b) 상기 바이오마커의 발현 수준을 머신러닝 알고리즘 모델에 적용시키는 단계를 포함하는, 인공지능을 이용한 폐암 진단을 위한 정보 제공 방법.
  8. 제7항에 있어서,
    상기 (a) 단계의 혈액은 전혈, 혈장 또는 혈청인 것을 특징으로 하는, 인공지능을 이용한 폐암 진단을 위한 정보 제공 방법.
  9. 제7항에 있어서,
    상기 (a) 단계에서 바이오마커의 수준 측정은, 액체크로마토그래피-질량분석기(LC-MS)를 통해 수득하는 것을 특징으로 하는, 인공지능을 이용한 폐암 진단을 위한 정보 제공 방법.
  10. 제7항에 있어서,
    상기 (b) 알고리즘 모델에 적용시키는 단계는 검사 대상자의 혈액 내 바이오마커의 수준을 상기 알고리즘 모델에 입력하여 출력값으로 폐암의 발병 여부를 출력하는 것을 특징으로 하는, 인공지능을 이용한 폐암 진단을 위한 정보 제공 방법.
  11. 제7항에 있어서,
    상기 (b) 단계의 알고리즘 모델은,
    (ⅰ) 폐암 환자군 및 정상 대조군의 혈액으로부터 키뉴레닌(Kynurenine, KN), 리소포스파티딜콜린 16:0(lysophosphatidylcholine 16:0, LPC16), 리소포스파티딜콜린 18:0(lysophosphatidylcholine 18:0, LPC18), 글루탐산(glutamic acid, Glu), 헥사노일-L-카르니틴(hexanoyl-L-carnitine, HC), 옥타노일-L-카르니틴(octanoyl-L-carnitine, OC), 데카노일-L-카르니틴(decanoyl-L-carnitine, DC), 도데카노일-L-카르니틴(dodecanoyl-L-carnitine, DDC), 미리스토일-L-카르니틴(myristoyl-L-carnitine, MC) 및 팔미토일-L-카르니틴(palmitoyl-L-carnitine, PC)으로 구성된 폐암 진단용 바이오마커의 수준을 측정하는 단계;
    (ⅱ) 상기 바이오마커의 수준을 머신러닝 알고리즘으로 학습시켜 폐암 발병 예측 모델을 생성하는 단계를 통해 도출하는 것을 특징으로 하는, 인공지능을 이용한 폐암 진단을 위한 정보 제공 방법.
  12. 제7항에 있어서,
    상기 (b) 단계의 알고리즘은 k-최근접 이웃 알고리즘; 로지스틱 회귀 알고리즘; 판별분석 알고리즘; 부분최소자승-판별분석 알고리즘; 서포트 벡터 머신 알고리즘; 결정트리 알고리즘; 결정트리 앙상블 알고리즘; 및 신경망 알고리즘을 포함하는 선형 또는 비선형 분류(classification) 알고리즘으로부터 선택되는 어느 하나인 것을 특징으로 하는, 인공지능을 이용한 폐암 진단을 위한 정보 제공 방법.
  13. 제7항에 있어서,
    상기 (b) 단계의 알고리즘이 서포트 벡터 머신 알고리즘인 경우, 하기 수학식 1의 커널 함수로 표시되는 것을 특징으로 하는, 인공지능을 이용한 폐암 진단을 위한 정보 제공 방법:
    [수학식 1]
    Figure PCTKR2023006352-appb-img-000004
    상기에서, x 는 폐암 진단용 바이오마커 조성물의 혈액 내 수준 측정값, σ는 결정 경계의 유연성(곡률)에 대한 매개변수이다.
  14. 검사 대상자의 혈액 내 키뉴레닌(kynurenine, KN), 리소포스파티딜콜린 16:0(lysophosphatidylcholine 16:0, LPC16), 리소포스파티딜콜린 18:0(lysophosphatidylcholine 18:0, LPC18), 글루탐산(glutamic acid, Glu), 헥사노일-L-카르니틴(hexanoyl-L-carnitine, HC), 옥타노일-L-카르니틴(octanoyl-L-carnitine, OC), 데카노일-L-카르니틴(decanoyl-L-carnitine, DC), 도데카노일-L-카르니틴(dodecanoyl-L-carnitine, DDC), 미리스토일-L-카르니틴(myristoyl-L-carnitine, MC) 및 팔미토일-L-카르니틴(palmitoyl-L-carnitine, PC)으로 구성된 폐암 진단용 바이오마커 수준을 측정하는 측정부; 및
    상기 바이오마커 수준을 학습된 인공지능 알고리즘에 입력하여 폐암 발병 유부를 판정하는 암 진단부를 포함하는 인공지능 기반 폐암 진단 예측 장치.
PCT/KR2023/006352 2022-06-20 2023-05-10 폐암 진단용 바이오마커 및 폐암 진단에 대한 인공지능 기반 정보 제공 방법 WO2023249252A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020220074949A KR102569168B1 (ko) 2022-06-20 2022-06-20 폐암 진단용 바이오마커 및 폐암 진단에 대한 인공지능 기반 정보 제공 방법
KR10-2022-0074949 2022-06-20

Publications (1)

Publication Number Publication Date
WO2023249252A1 true WO2023249252A1 (ko) 2023-12-28

Family

ID=87841313

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/006352 WO2023249252A1 (ko) 2022-06-20 2023-05-10 폐암 진단용 바이오마커 및 폐암 진단에 대한 인공지능 기반 정보 제공 방법

Country Status (2)

Country Link
KR (1) KR102569168B1 (ko)
WO (1) WO2023249252A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240043455A (ko) * 2022-09-27 2024-04-03 (주)이노베이션바이오 폐암 진단용 바이오마커 및 검사 대상자 임상정보를 이용한 폐암 진단을 위한 인공지능 기반 정보 제공 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200116410A (ko) * 2019-04-01 2020-10-12 국립암센터 고형암 진단 장치와 고형암 진단 정보 제공 방법
US20220118269A1 (en) * 2020-10-16 2022-04-21 University Of Iowa Research Foundation Monitoring efficacy of magnetic and electric fields using biomarkers

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200116410A (ko) * 2019-04-01 2020-10-12 국립암센터 고형암 진단 장치와 고형암 진단 정보 제공 방법
US20220118269A1 (en) * 2020-10-16 2022-04-21 University Of Iowa Research Foundation Monitoring efficacy of magnetic and electric fields using biomarkers

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JUNJUN NI; LI XU; WEI LI; LIJUN WU: "Simultaneous determination of thirteen kinds of amino acid and eight kinds of acylcarnitine in human serum by LC–MS/MS and its application to measure the serum concentration of lung cancer patients", BIOMEDICAL CHROMATOGRAPHY, JOHN WILEY & SONS LTD., GB, vol. 30, no. 11, 8 June 2016 (2016-06-08), GB , pages 1796 - 1806, XP071549850, ISSN: 0269-3879, DOI: 10.1002/bmc.3755 *
MORENO PAULA, JIMÉNEZ‐JIMÉNEZ CARLA, GARRIDO‐RODRÍGUEZ MARTÍN, CALDERÓN‐SANTIAGO MÓNICA, MOLINA SUSANA, LARA‐CHICA MARIBEL, PRIEGO: "Metabolomic profiling of human lung tumor tissues – nucleotide metabolism as a candidate for therapeutic interventions and biomarkers", MOLECULAR ONCOLOGY, ELSEVIER, vol. 12, no. 10, 1 October 2018 (2018-10-01), pages 1778 - 1796, XP093119669, ISSN: 1574-7891, DOI: 10.1002/1878-0261.12369 *
XIE YING, MENG WEI-YU, LI RUN-ZE, WANG YU-WEI, QIAN XIN, CHAN CHANG, YU ZHI-FANG, FAN XING-XING, PAN HU-DAN, XIE CHUN, WU QI-BIAO,: "Early lung cancer diagnostic biomarker discovery by machine learning methods", TRANSLATIONAL ONCOLOGY, NEOPLASIA PRESS, UNITED STATES, vol. 14, no. 1, 1 January 2021 (2021-01-01), United States , pages 100907, XP093067261, ISSN: 1936-5233, DOI: 10.1016/j.tranon.2020.100907 *

Also Published As

Publication number Publication date
KR102569168B1 (ko) 2023-08-24

Similar Documents

Publication Publication Date Title
WO2023249252A1 (ko) 폐암 진단용 바이오마커 및 폐암 진단에 대한 인공지능 기반 정보 제공 방법
WO2018062704A1 (ko) 대장암 진단 장치와 대장암 진단 정보 제공 방법
WO2020180003A1 (ko) 엑소좀에 의한 인공지능 기반의 액체생검을 이용한 암 진단 정보 제공 방법 및 시스템
Weimann et al. Measurement of 8-oxo-2′-deoxyguanosine and 8-oxo-2′-deoxyadenosine in DNA and human urine by high performance liquid chromatography-electrospray tandem mass spectrometry
WO2012157867A2 (ko) 초고속 멀티 모드 질량 분석을 위한 비행시간 기반 질량 현미경 시스템
WO2021150011A1 (ko) 당뇨 조기진단 또는 당뇨병성 합병증 진단을 위한 바이오마커 및 이의 용도
CN110455954A (zh) 一种血浆中儿茶酚胺代谢物高效液相色谱串联质谱检测方法
WO2017217669A1 (ko) 담도암 진단 정보 제공 방법과 담도암 진단 장치
KR20200116410A (ko) 고형암 진단 장치와 고형암 진단 정보 제공 방법
CN109613144B (zh) 一种儿茶酚胺类激素的检测方法
EP2623983B1 (en) Method for crystallizing low mass ions for diagnosing colorectal cancer and method for diagnosing colorectal cancer using same
WO2024071740A1 (ko) 폐암 진단용 바이오마커 및 검사 대상자 임상정보를 이용한 폐암 진단을 위한 인공지능 기반 정보 제공 방법
WO2020256351A1 (ko) 대사체 분석을 이용한 류마티스 관절염 중증도 예측 또는 구분용 바이오마커
WO2014163421A1 (ko) 인간 혈청 당쇄 지도 및 이를 이용하여 혈청 시료를 검증하는 방법
WO2022255774A1 (ko) 아실카르니틴 대사체를 포함하는 구강암 진단용 바이오마커 조성물
WO2020204373A2 (ko) 고형암 진단 장치와 고형암 진단 정보 제공 방법
WO2019098643A1 (ko) 말디토프 질량 분석에 의한 항생제 내성 판별 장치 및 방법
WO2015026171A1 (ko) 리소포스파티딜콜린 및 호모시스테인산을 포함하는 난소암 진단용 조성물 및 이를 사용하여 난소암을 진단하는 방법
CN116027041A (zh) 口腔癌辅助诊断标志物、试剂盒及其应用
WO2019083220A1 (ko) 소변 대사체 분석을 이용한 베체트병의 진단방법
CN113917034A (zh) 用于评估阿尔茨海默症的生物标记组合及其应用和试剂盒
WO2021154015A1 (ko) 반려동물 골관절염 진단용 당사슬 바이오마커를 이용한 반려동물 골관절염 진단방법
WO2022145976A1 (ko) 다중 주파수를 이용한 바이오 센서 장치의 항원 검출 방법
WO2024005592A1 (ko) 알츠하이머성 치매 관련 단백질 유래 인산화 펩타이드를 이용한 알츠하이머병 조기 진단, 단계 구분 및 뇌의 아밀로이드 베타 축적 판별 방법
WO2024038927A1 (ko) 엑소좀 sers 신호를 이용한 인공지능 기반의 다중암 동시 진단 시스템 및 그 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23827372

Country of ref document: EP

Kind code of ref document: A1