WO2022265392A1 - 난소암 진단용 다중 바이오 마커 및 이의 용도 - Google Patents
난소암 진단용 다중 바이오 마커 및 이의 용도 Download PDFInfo
- Publication number
- WO2022265392A1 WO2022265392A1 PCT/KR2022/008478 KR2022008478W WO2022265392A1 WO 2022265392 A1 WO2022265392 A1 WO 2022265392A1 KR 2022008478 W KR2022008478 W KR 2022008478W WO 2022265392 A1 WO2022265392 A1 WO 2022265392A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- ovarian cancer
- protein
- level
- gene encoding
- present
- Prior art date
Links
- 206010033128 Ovarian cancer Diseases 0.000 title claims abstract description 242
- 206010061535 Ovarian neoplasm Diseases 0.000 title claims abstract description 242
- 239000000090 biomarker Substances 0.000 title abstract description 64
- 238000000034 method Methods 0.000 claims abstract description 77
- 238000003745 diagnosis Methods 0.000 claims abstract description 45
- 210000004369 blood Anatomy 0.000 claims abstract description 13
- 239000008280 blood Substances 0.000 claims abstract description 13
- 238000012216 screening Methods 0.000 claims abstract description 7
- 229940079593 drug Drugs 0.000 claims abstract description 6
- 239000003814 drug Substances 0.000 claims abstract description 6
- 108090000623 proteins and genes Proteins 0.000 claims description 234
- 102000004169 proteins and genes Human genes 0.000 claims description 144
- 230000014509 gene expression Effects 0.000 claims description 82
- 102100026553 Mannose-binding protein C Human genes 0.000 claims description 65
- 102100024078 Plasma serine protease inhibitor Human genes 0.000 claims description 65
- 101001056128 Homo sapiens Mannose-binding protein C Proteins 0.000 claims description 64
- 101001053641 Homo sapiens Plasma serine protease inhibitor Proteins 0.000 claims description 63
- 108010052469 Apolipoprotein L1 Proteins 0.000 claims description 57
- 102000018757 Apolipoprotein L1 Human genes 0.000 claims description 57
- 102100031786 Adiponectin Human genes 0.000 claims description 44
- 101000775469 Homo sapiens Adiponectin Proteins 0.000 claims description 43
- 102100028709 Thyroxine-binding globulin Human genes 0.000 claims description 43
- 101000837639 Homo sapiens Thyroxine-binding globulin Proteins 0.000 claims description 42
- 239000000523 sample Substances 0.000 claims description 41
- 102100031758 Extracellular matrix protein 1 Human genes 0.000 claims description 40
- 239000003795 chemical substances by application Substances 0.000 claims description 36
- 210000002381 plasma Anatomy 0.000 claims description 32
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 30
- 206010028980 Neoplasm Diseases 0.000 claims description 26
- 239000000203 mixture Substances 0.000 claims description 23
- 201000011510 cancer Diseases 0.000 claims description 21
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 20
- 238000004949 mass spectrometry Methods 0.000 claims description 19
- 230000008859 change Effects 0.000 claims description 11
- 101000866526 Homo sapiens Extracellular matrix protein 1 Proteins 0.000 claims description 9
- 108091093037 Peptide nucleic acid Proteins 0.000 claims description 9
- 230000003247 decreasing effect Effects 0.000 claims description 9
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 8
- 108091023037 Aptamer Proteins 0.000 claims description 7
- 238000009007 Diagnostic Kit Methods 0.000 claims description 7
- 238000010171 animal model Methods 0.000 claims description 6
- 108010059886 Apolipoprotein A-I Proteins 0.000 claims description 5
- 102000005666 Apolipoprotein A-I Human genes 0.000 claims description 5
- 108010071690 Prealbumin Proteins 0.000 claims description 5
- 102000004338 Transferrin Human genes 0.000 claims description 5
- 108090000901 Transferrin Proteins 0.000 claims description 5
- 102000009190 Transthyretin Human genes 0.000 claims description 5
- 230000000692 anti-sense effect Effects 0.000 claims description 5
- 210000002966 serum Anatomy 0.000 claims description 5
- 239000012581 transferrin Substances 0.000 claims description 5
- 108010088751 Albumins Proteins 0.000 claims description 4
- 102000009027 Albumins Human genes 0.000 claims description 4
- 102100033312 Alpha-2-macroglobulin Human genes 0.000 claims description 4
- 108010087614 Apolipoprotein A-II Proteins 0.000 claims description 4
- 102000009081 Apolipoprotein A-II Human genes 0.000 claims description 4
- 102000016918 Complement C3 Human genes 0.000 claims description 4
- 108010028780 Complement C3 Proteins 0.000 claims description 4
- 102000008946 Fibrinogen Human genes 0.000 claims description 4
- 108010049003 Fibrinogen Proteins 0.000 claims description 4
- 102000014702 Haptoglobin Human genes 0.000 claims description 4
- 108050005077 Haptoglobin Proteins 0.000 claims description 4
- -1 IgM Proteins 0.000 claims description 4
- 102000012404 Orosomucoid Human genes 0.000 claims description 4
- 108010061952 Orosomucoid Proteins 0.000 claims description 4
- 108010015078 Pregnancy-Associated alpha 2-Macroglobulins Proteins 0.000 claims description 4
- 229940012952 fibrinogen Drugs 0.000 claims description 4
- 239000003446 ligand Substances 0.000 claims description 4
- 108010038807 Oligopeptides Proteins 0.000 claims description 3
- 102000015636 Oligopeptides Human genes 0.000 claims description 3
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 claims description 3
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 claims description 3
- 229940024142 alpha 1-antitrypsin Drugs 0.000 claims description 3
- 239000002773 nucleotide Substances 0.000 claims description 3
- 125000003729 nucleotide group Chemical group 0.000 claims description 3
- 102100024329 Cytochrome P450 11B2, mitochondrial Human genes 0.000 claims 8
- 101000909153 Homo sapiens Carboxypeptidase N subunit 2 Proteins 0.000 claims 8
- 101000941777 Homo sapiens Copine-2 Proteins 0.000 claims 8
- 101000761956 Homo sapiens Cytochrome P450 11B2, mitochondrial Proteins 0.000 claims 8
- 102100030762 Apolipoprotein L1 Human genes 0.000 claims 7
- 101100323521 Homo sapiens APOL1 gene Proteins 0.000 claims 7
- 238000007781 pre-processing Methods 0.000 claims 1
- 230000035945 sensitivity Effects 0.000 abstract description 28
- 102000004506 Blood Proteins Human genes 0.000 abstract description 17
- 108010017384 Blood Proteins Proteins 0.000 abstract description 17
- 238000013399 early diagnosis Methods 0.000 abstract description 11
- 238000002405 diagnostic procedure Methods 0.000 abstract description 7
- 238000011282 treatment Methods 0.000 abstract description 7
- 239000000107 tumor biomarker Substances 0.000 abstract description 6
- 238000001514 detection method Methods 0.000 abstract description 5
- 238000001574 biopsy Methods 0.000 abstract description 4
- 230000008569 process Effects 0.000 abstract description 4
- 230000000694 effects Effects 0.000 abstract description 3
- 238000001647 drug administration Methods 0.000 abstract description 2
- 102100024921 Carboxypeptidase N subunit 2 Human genes 0.000 description 33
- 101710137813 Carboxypeptidase N subunit 2 Proteins 0.000 description 33
- 101710127949 Extracellular matrix protein 1 Proteins 0.000 description 32
- 238000004458 analytical method Methods 0.000 description 27
- 201000010099 disease Diseases 0.000 description 19
- 238000012549 training Methods 0.000 description 17
- 238000007637 random forest analysis Methods 0.000 description 13
- 238000012795 verification Methods 0.000 description 13
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 12
- 238000012706 support-vector machine Methods 0.000 description 11
- 238000004393 prognosis Methods 0.000 description 10
- 102100023123 Mucin-16 Human genes 0.000 description 9
- 238000010200 validation analysis Methods 0.000 description 9
- 239000003550 marker Substances 0.000 description 8
- 238000000575 proteomic method Methods 0.000 description 8
- 238000011002 quantification Methods 0.000 description 7
- 238000002553 single reaction monitoring Methods 0.000 description 7
- 238000003556 assay Methods 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000013145 classification model Methods 0.000 description 6
- 238000004817 gas chromatography Methods 0.000 description 6
- 210000001672 ovary Anatomy 0.000 description 6
- 230000004083 survival effect Effects 0.000 description 6
- 238000002604 ultrasonography Methods 0.000 description 6
- 201000009030 Carcinoma Diseases 0.000 description 5
- 108020004414 DNA Proteins 0.000 description 5
- 238000002965 ELISA Methods 0.000 description 5
- 238000009534 blood test Methods 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 238000004128 high performance liquid chromatography Methods 0.000 description 5
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 230000027455 binding Effects 0.000 description 4
- 238000000688 desorption electrospray ionisation Methods 0.000 description 4
- 229940088598 enzyme Drugs 0.000 description 4
- 239000012530 fluid Substances 0.000 description 4
- 238000004811 liquid chromatography Methods 0.000 description 4
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 4
- 238000002552 multiple reaction monitoring Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 3
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 3
- 206010006187 Breast cancer Diseases 0.000 description 3
- 208000026310 Breast neoplasm Diseases 0.000 description 3
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 3
- 239000000091 biomarker candidate Substances 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 239000000104 diagnostic biomarker Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 230000036210 malignancy Effects 0.000 description 3
- 238000001819 mass spectrum Methods 0.000 description 3
- 230000009245 menopause Effects 0.000 description 3
- 150000007523 nucleic acids Chemical group 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 238000002559 palpation Methods 0.000 description 3
- 206010034260 pelvic mass Diseases 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000004445 quantitative analysis Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000001269 time-of-flight mass spectrometry Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- 108010076365 Adiponectin Proteins 0.000 description 2
- 206010008342 Cervix carcinoma Diseases 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 238000000018 DNA microarray Methods 0.000 description 2
- 239000003298 DNA probe Substances 0.000 description 2
- 206010061818 Disease progression Diseases 0.000 description 2
- 208000035699 Distal ileal obstruction syndrome Diseases 0.000 description 2
- 101710110798 Mannose-binding protein C Proteins 0.000 description 2
- 101100328463 Mus musculus Cmya5 gene Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 108010001953 Protein C Inhibitor Proteins 0.000 description 2
- 229940122929 Protein C inhibitor Drugs 0.000 description 2
- 108010026552 Proteome Proteins 0.000 description 2
- 208000005718 Stomach Neoplasms Diseases 0.000 description 2
- 208000024770 Thyroid neoplasm Diseases 0.000 description 2
- 108010000259 Thyroxine-Binding Globulin Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 239000012472 biological sample Substances 0.000 description 2
- 201000010881 cervical cancer Diseases 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000003795 desorption Methods 0.000 description 2
- 238000000375 direct analysis in real time Methods 0.000 description 2
- 230000005750 disease progression Effects 0.000 description 2
- 238000012063 dual-affinity re-targeting Methods 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 235000019253 formic acid Nutrition 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 206010017758 gastric cancer Diseases 0.000 description 2
- 238000000760 immunoelectrophoresis Methods 0.000 description 2
- 238000001114 immunoprecipitation Methods 0.000 description 2
- 238000012744 immunostaining Methods 0.000 description 2
- 238000009616 inductively coupled plasma Methods 0.000 description 2
- 238000005040 ion trap Methods 0.000 description 2
- 238000000752 ionisation method Methods 0.000 description 2
- 238000000091 laser ablation electrospray ionisation Methods 0.000 description 2
- 230000003211 malignant effect Effects 0.000 description 2
- 238000000816 matrix-assisted laser desorption--ionisation Methods 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 230000001394 metastastic effect Effects 0.000 description 2
- 206010061289 metastatic neoplasm Diseases 0.000 description 2
- 230000002611 ovarian Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000012207 quantitative assay Methods 0.000 description 2
- 238000003127 radioimmunoassay Methods 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 238000004683 secondary electrospray ionisation mass spectroscopy Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 201000011549 stomach cancer Diseases 0.000 description 2
- 238000000672 surface-enhanced laser desorption--ionisation Methods 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 238000004885 tandem mass spectrometry Methods 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 238000000176 thermal ionisation mass spectrometry Methods 0.000 description 2
- 201000002510 thyroid cancer Diseases 0.000 description 2
- XUIIKFGFIJCVMT-UHFFFAOYSA-N thyroxine-binding globulin Natural products IC1=CC(CC([NH3+])C([O-])=O)=CC(I)=C1OC1=CC(I)=C(O)C(I)=C1 XUIIKFGFIJCVMT-UHFFFAOYSA-N 0.000 description 2
- 238000013055 trapped ion mobility spectrometry Methods 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 230000004614 tumor growth Effects 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 1
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical group NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 1
- 208000005641 Adenomyosis Diseases 0.000 description 1
- 208000000230 African Trypanosomiasis Diseases 0.000 description 1
- 102000007592 Apolipoproteins Human genes 0.000 description 1
- 108010071619 Apolipoproteins Proteins 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 208000007690 Brenner tumor Diseases 0.000 description 1
- 108010029697 CD40 Ligand Proteins 0.000 description 1
- 102100032937 CD40 ligand Human genes 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 102000004003 Chemokine CCL11 Human genes 0.000 description 1
- 108010082548 Chemokine CCL11 Proteins 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 101100120663 Drosophila melanogaster fs(1)h gene Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 201000009273 Endometriosis Diseases 0.000 description 1
- 208000021309 Germ cell tumor Diseases 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 101000793429 Homo sapiens Apolipoprotein L1 Proteins 0.000 description 1
- 101100497186 Homo sapiens CPN2 gene Proteins 0.000 description 1
- 101001081567 Homo sapiens Insulin-like growth factor-binding protein 1 Proteins 0.000 description 1
- 101001133056 Homo sapiens Mucin-1 Proteins 0.000 description 1
- 101000955067 Homo sapiens WAP four-disulfide core domain protein 2 Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 102100027636 Insulin-like growth factor-binding protein 1 Human genes 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 102000003814 Interleukin-10 Human genes 0.000 description 1
- 108090000174 Interleukin-10 Proteins 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 102000004889 Interleukin-6 Human genes 0.000 description 1
- 108010002586 Interleukin-7 Proteins 0.000 description 1
- 102000000704 Interleukin-7 Human genes 0.000 description 1
- 244000278243 Limnocharis flava Species 0.000 description 1
- 235000003403 Limnocharis flava Nutrition 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 102100030417 Matrilysin Human genes 0.000 description 1
- 108090000855 Matrilysin Proteins 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 102100034256 Mucin-1 Human genes 0.000 description 1
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 1
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 1
- 208000034176 Neoplasms, Germ Cell and Embryonal Diseases 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 101710183733 Plasma serine protease inhibitor Proteins 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 102000003946 Prolactin Human genes 0.000 description 1
- 108010057464 Prolactin Proteins 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 102000017975 Protein C Human genes 0.000 description 1
- 108020004518 RNA Probes Proteins 0.000 description 1
- 239000003391 RNA probe Substances 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 102100030852 Run domain Beclin-1-interacting and cysteine-rich domain-containing protein Human genes 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 208000002669 Sex Cord-Gonadal Stromal Tumors Diseases 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical class IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 1
- 102100033732 Tumor necrosis factor receptor superfamily member 1A Human genes 0.000 description 1
- 101710187743 Tumor necrosis factor receptor superfamily member 1A Proteins 0.000 description 1
- 101710187830 Tumor necrosis factor receptor superfamily member 1B Proteins 0.000 description 1
- 102100033733 Tumor necrosis factor receptor superfamily member 1B Human genes 0.000 description 1
- 206010046798 Uterine leiomyoma Diseases 0.000 description 1
- 108010000134 Vascular Cell Adhesion Molecule-1 Proteins 0.000 description 1
- 102100023543 Vascular cell adhesion protein 1 Human genes 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 230000029936 alkylation Effects 0.000 description 1
- 238000005804 alkylation reaction Methods 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 230000033115 angiogenesis Effects 0.000 description 1
- 108010036226 antigen CYFRA21.1 Proteins 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000004900 autophagic degradation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 102000015736 beta 2-Microglobulin Human genes 0.000 description 1
- 108010081355 beta 2-Microglobulin Proteins 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 208000009060 clear cell adenocarcinoma Diseases 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000024203 complement activation Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002559 cytogenic effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003544 deproteinization Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 230000002357 endometrial effect Effects 0.000 description 1
- 201000009274 endometriosis of uterus Diseases 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 201000005206 focal segmental glomerulosclerosis Diseases 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000000762 glandular Effects 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 1
- 238000010562 histological examination Methods 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 102000057799 human ADIPOQ Human genes 0.000 description 1
- 102000057641 human APOL1 Human genes 0.000 description 1
- 208000029080 human African trypanosomiasis Diseases 0.000 description 1
- 102000054414 human ECM1 Human genes 0.000 description 1
- 102000043411 human MBL2 Human genes 0.000 description 1
- 102000049532 human SERPINA5 Human genes 0.000 description 1
- 102000048799 human SERPINA7 Human genes 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000000951 immunodiffusion Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 108040006849 interleukin-2 receptor activity proteins Proteins 0.000 description 1
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 208000017169 kidney disease Diseases 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000004880 lymph fluid Anatomy 0.000 description 1
- 230000002132 lysosomal effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 208000030427 mucinous ovarian cancer Diseases 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 229950006780 n-acetylglucosamine Drugs 0.000 description 1
- 238000010844 nanoflow liquid chromatography Methods 0.000 description 1
- 210000002445 nipple Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 201000004228 ovarian endometrial cancer Diseases 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 229940097325 prolactin Drugs 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 230000009103 reabsorption Effects 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 208000028467 sex cord-stromal tumor Diseases 0.000 description 1
- 201000002612 sleeping sickness Diseases 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- HWCKGOZZJDHMNC-UHFFFAOYSA-M tetraethylammonium bromide Chemical compound [Br-].CC[N+](CC)(CC)CC HWCKGOZZJDHMNC-UHFFFAOYSA-M 0.000 description 1
- 239000005495 thyroid hormone Substances 0.000 description 1
- 229940036555 thyroid hormone Drugs 0.000 description 1
- 239000002753 trypsin inhibitor Substances 0.000 description 1
- 230000005748 tumor development Effects 0.000 description 1
- 208000010576 undifferentiated carcinoma Diseases 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/574—Immunoassay; Biospecific binding assay; Materials therefor for cancer
Definitions
- the present invention relates to multiple biomarkers for ovarian cancer diagnosis and uses thereof, and relates to a biomarker combination for ovarian cancer diagnosis comprising two or more proteins selected from the group consisting of MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 and ADIPOQ, the biomarker combination It relates to a composition or kit for diagnosing ovarian cancer comprising a marker protein or an agent capable of measuring the level of a gene encoding the same, and a method for diagnosing ovarian cancer or a drug screening method for preventing or treating ovarian cancer using the biomarker combination .
- Ovarian cancer is a malignant tumor that occurs in the ovary and appears to occur frequently in postmenopausal women in their 50s or older, and is the most common gynecological cancer in women along with cervical cancer. According to data from the Health Insurance Review and Assessment Service in 2019, 47% of female patients who died of cancer died from ovarian cancer, which has a significantly higher mortality rate than other female cancers such as cervical cancer, breast cancer, and thyroid cancer. According to the NIH report (NIH, Cancer Stat Facts: Ovarian Cancer), more than 1.2% of women suffer from ovarian cancer, and the 5-year survival rate of ovarian cancer patients is only 49.1%.
- ovarian cancer is often in the metastatic stage when symptoms appear, and according to actual reports, about 70% or more of patients are diagnosed in the advanced stage (Holschneider and Berek, 2000), and about 60% is reported to be diagnosed distant (Siegel et al., 2017; and NIH, SEER program). On the other hand, when diagnosed in the early stage (localized), the 5-year survival rate increases to a very high level of 92.6%.
- the most effective strategy to increase the survival rate and treatment potential of ovarian cancer is early diagnosis of ovarian cancer, but the diagnosis of ovarian cancer currently used clinically is after confirming the tumor through physical examination methods such as ultrasound or palpation, A test or blood test (CA-125, etc.) determines whether it is malignant, and is currently the earliest way to detect ovarian cancer. Methods through ultrasound and palpation can be confirmed only after the tumor has grown to a certain extent, and since a biopsy is essential for accurate diagnosis of a malignant tumor, it is very invasive to the human body and causes pain and burden to the patient. .
- biomarkers such as CA125, HE4, and CEA have been reported through extensive investment and research to discover blood biomarkers for diagnosing ovarian cancer. Because of their low sensitivity and specificity, the biomarkers are used only for reference in clinical judgment, and it is difficult to replace existing methods for the diagnosis of ovarian cancer.
- CA125 The most common biomarker for early diagnosis of ovarian cancer is CA125.
- CA125 has been detected in ovarian adenomyosis, uterine myoma, endometrial pathology, and endometriosis in addition to ovarian cancer, so there is a limit to its use as a single biomarker ( Kim et al., 2019).
- HE4 IL-2R, prolactin, CA 15-3, CA 19-9, CA 72-4, Cyfra 21-1, TNFR1, TNFR2, IL-6, IL-7, IL-10 , TNF- ⁇ , TSH, IGFBP1, MMP-7, VCAM-1, eotaxin-1, FSH, LH, ErbB2, ApoA1, TTR, adiponectin, and CD40L have been reported, but the above biomarkers other than CA125 are sensitive and The specificity is very low ((Baron et al., 2003; Perkins et al., 2003).
- a single biomarker can have increased expression in various diseases except ovarian cancer, and ovaries that do not express the biomarker Since it is impossible to diagnose cancer patients, diagnosis of ovarian cancer using a single biomarker has very low specificity and sensitivity, making it difficult to use for accurate diagnosis.
- RMI Random Index
- Ova1 is an FDA-approved multivariate index assay, consisting of a panel of five plasma protein markers (CA125-II, transferrin, beta-2 microglobulin, apolipoprotein A-1, and transthyretin).
- Ova1 has a low specificity of 35% and a sensitivity of 96% (Ueland et al., 2011; Miller et al., 2011).
- Another multivariate index analysis method for predicting epithelial cancer in women with pelvic masses is the Moore group's Risk of Ovarian Malignancy Algorithm (ROMA).
- ROMA Ovarian Malignancy Algorithm
- the 2011 FDA-approved ROMA score has a specificity of about 75% for the combination of HE4, CA125, and menopause.
- Another biomarker-based index called the Copenhagen Index (CPH-I), which uses a combination of HE4, CA125 and age, was developed by Karlsen et al, and is similar to ROMA and RMI, but does not consider ultrasound and menopausal status.
- CPH-I Copenhagen Index
- the multi-biomarker-based analysis method currently used in clinical practice as described above has low specificity and sensitivity, and in addition to plasma markers, confirmation of pelvic mass through ultrasound, menopausal status, age, etc. are included as markers, targeting all women. It cannot be used as a diagnostic method for ovarian cancer, and therefore, the above-described methods are used as primary classification of patients and reference test methods, not ideal diagnostic methods. Therefore, in order to confirm the diagnosis of ovarian cancer, since the existing biopsy should be accompanied, pain and burden imposed on the patient are still accompanied.
- biomarkers capable of diagnosing ovarian cancer with high specificity and sensitivity are currently almost non-existent despite the high need.
- the combination of biomarkers does not always involve improvement in sensitivity and specificity, and even if one of the sensitivity and specificity is improved, the other is frequently decreased. Therefore, it is required to develop a diagnostic method through the discovery of biomarkers capable of early diagnosis of ovarian cancer with high sensitivity and specificity and their optimal combination (Heliyon 5 (2019) e02826).
- An object of the present invention is to provide biomarkers and combinations thereof capable of diagnosing ovarian cancer with high specificity and sensitivity.
- Another object of the present invention is to provide diagnostic uses of the biomarkers and combinations thereof for ovarian cancer.
- Another object of the present invention is to provide a composition for diagnosing ovarian cancer capable of diagnosing ovarian cancer with high specificity and sensitivity.
- Another object of the present invention is to provide a diagnostic kit for ovarian cancer capable of diagnosing ovarian cancer with high specificity and sensitivity.
- Another object of the present invention is to provide a method for diagnosing ovarian cancer capable of diagnosing ovarian cancer with high specificity and sensitivity or a method for providing information for diagnosis.
- the present invention provides a diagnostic biomarker for ovarian cancer comprising two or more proteins selected from the group consisting of MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 and ADIPOQ, or a combination thereof:
- the present invention also provides a composition for diagnosing ovarian cancer comprising an agent capable of measuring the level of two or more proteins selected from the group consisting of MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 and ADIPOQ or genes encoding them. .
- the present invention also provides a diagnostic kit for ovarian cancer comprising an agent capable of measuring the level of two or more proteins selected from the group consisting of MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 and ADIPOQ or genes encoding them. .
- the present invention also provides a method for diagnosing ovarian cancer or a method for providing information for diagnosis, comprising the following steps:
- the present invention also provides a method for screening for a drug for preventing or treating ovarian cancer comprising the following steps:
- 1 is a result of analyzing the amount of plasma protein and the peak area normalized based on the median value (Median centering normalization).
- Figure 2 shows the number of differentially expressed proteins analyzed in the total plasma proteome of three groups (normal, stage 1-2, stage 3-4).
- green indicates normal and stage 1-2 ovarian cancer patients
- blue indicates normal and stage 3-4 ovarian cancer patients
- pink indicates differentially expressed proteins between stage 1-2 and stage 3-4 ovarian cancer patients.
- FIG. 3 shows the results of a feature selection process performed to select optimal marker protein candidates for diagnosis of early ovarian cancer patients (stage 1-2, 3a) or total ovarian cancer patients (3b). Markers with a probability of less than 0.50 were excluded from the combination.
- Figure 4 is a box plot comparing the levels of seven plasma proteins in normal controls and stage 1-2 ovarian cancer patients.
- 5 is a box plot comparing the levels of seven plasma proteins in normal controls and total ovarian cancer patients.
- FIG. 6 schematically shows training information of a random forest model for diagnostic verification of ovarian cancer patient groups (stage 1-2) for three protein markers.
- FIG. 7 schematically shows training information of a support vector machine model for diagnostic verification of ovarian cancer patient groups (stage 1-2) for three protein markers.
- FIG. 8 shows ROC analysis results in a training set and a validation set of a normal group and ovarian cancer patients (stages 1 and 2) using a random forest analysis model including three protein panels of an early ovarian cancer prediction model.
- ROC analysis in training and validation sets of normal groups and ovarian cancer patients (stages 1 and 2) using a suppository vector machine (SVM) analysis model including three protein panels of an early ovarian cancer prediction model. This is the result.
- SVM suppository vector machine
- FIG. 10 shows ROC analysis results when ovarian cancer is diagnosed using each of the three proteins (a: APOL1, b: SERPINA5, C: MBL2) of the early ovarian cancer prediction model independently.
- FIG. 11 schematically shows training information of a random forest model for diagnostic verification of ovarian cancer patient groups (all stages) for seven protein markers.
- FIG. 12 schematically shows training information of a support vector machine model for diagnostic verification of ovarian cancer patient groups (all stages) for three protein markers.
- FIG. 13 is a ROC analysis analysis result in a training set and a validation set of a normal group and ovarian cancer patients (stages 1, 2, 3, and 4) using a random forest analysis model including seven protein panels of an ovarian cancer prediction model. to be.
- FIG. 14 is a result of ROC analysis in a training set and a validation set of a normal group and ovarian cancer patients (stages 1, 2, 3, and 4) using a support vector machine analysis model including 7 protein panels of an ovarian cancer prediction model. to be.
- ovarian cancer In contrast to the fact that ovarian cancer occurs in about 1-2% of women, 47% of female patients who die of cancer are ovarian cancer, which has a significantly higher mortality rate than other female cancers. The 5-year survival rate is also very low, less than 50%. The reason for the low mortality rate is that ovarian cancer is often in the metastatic stage at the time of symptom onset and is already quite advanced at the time of diagnosis.
- the most effective strategy to increase the survival rate and treatment potential of ovarian cancer is early diagnosis of ovarian cancer, but the diagnosis of ovarian cancer currently used clinically is after confirming the tumor through physical examination methods such as ultrasound or palpation, A test or blood test (CA-125, etc.) determines whether it is malignant, and is currently the earliest way to detect ovarian cancer. Diagnosis of ovarian cancer through a blood test is non-invasive and reduces the patient's burden compared to a biopsy, etc.
- currently approved blood test methods such as the RMI method (RMI I, II, III), ROMA, CPH-1, and Ova1 are mostly for screening for malignancy from patients with a mass, not independent diagnostic methods. , its sensitivity and specificity are low, and it can be applied only to patients with specific conditions, including factors other than blood biomarkers such as age or menopause.
- QTOF LC-MS-based quantitative plasma proteomic analysis technique SWATH Sequential Window Acquisition of all Theoretical Mass Spectra
- SWATH Sequential Window Acquisition of all Theoretical Mass Spectra
- biomarkers quantified by various predictive statistical models such as a random forest model and a support vector machine are evaluated using a combination of the derived biomarker candidate groups
- biomarkers quantified by various predictive statistical models such as a random forest model and a support vector machine
- the present invention relates to a biomarker combination for diagnosis of ovarian cancer comprising two or more proteins of MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 and ADIPOQ.
- the present invention may be characterized by including two or more proteins of MBL2, APOL1 and SERPINA5, and more preferably, it may be characterized by including MBL2, APOL1 and SERPINA5 proteins.
- the present invention may be characterized by further comprising any one or more proteins of SERPINA7, ECM1, CPN2 and ADIPOQ together with MBL2, APOL1 and SERPINA5 proteins.
- the present invention in addition to two or more proteins of MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 and ADIPOQ described above, it may be characterized in that it is composed in combination with various plasma biomarkers known as conventional ovarian cancer markers.
- the ovarian cancer may be characterized as stage 1 and stage 2 ovarian cancer, but is not limited thereto.
- the present invention relates to the use of a combination of two or more proteins selected from among MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 and ADIPOQ for diagnosis of ovarian cancer.
- the present invention relates to the treatment of ovarian cancer, including an agent capable of measuring the level of two or more proteins selected from the group consisting of MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 and ADIPOQ or the expression level of a gene encoding them. It relates to a diagnostic composition.
- the composition for diagnosing ovarian cancer may be characterized in that it includes an agent capable of measuring the protein levels of MBL2, APOL1 and SERPINA5 or the expression levels of genes encoding them.
- the composition for diagnosing ovarian cancer preferably measures the protein levels of MBL2 and APOL1, MBL2 and SERPINA5, or APOL1 and SERPINA5, most preferably MBL2, APOL1 and SERPINA5, or the expression level of a gene encoding them.
- the diagnosis of ovarian cancer may be a diagnosis of stage 1 and/or stage 2 ovarian cancer.
- the composition for diagnosing ovarian cancer includes an agent capable of measuring the protein levels of MBL2, APOL1 and SERPINA5 or the expression level of a gene encoding them, and the protein level of any one or more of SERPINA7, ECM1, CPN2 and ADIPOQ Or it may be characterized in that it comprises an agent capable of measuring the expression level of the gene encoding it.
- the composition for diagnosing ovarian cancer may be characterized by comprising an agent capable of measuring the levels of MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 and ADIPOQ proteins or the expression levels of genes encoding them. there is.
- the composition for diagnosing ovarian cancer can measure the level of various plasma biomarker proteins known as conventional ovarian cancer markers or the expression level of genes encoding them, in addition to the biomarker protein for diagnosing ovarian cancer of the present invention described above. It may be characterized in that it further comprises an agent with.
- MBL2 mannose binding lectin 2
- MBP-C mannose binding protein C
- the representative human MBL2 sequence is the same as SEQ ID NO: 1 (UniProtKB-P11226), but is not limited thereto, and a protein comprising a peptide sequence determined to be substantially homologous to SEQ ID NO: 1 or a mutant thereof includes For example, about 80% or more homology with SEQ ID NO: 1, preferably 85% or more homology, more preferably 90% or more homology, even more preferably 95% or more homology, still more preferably 97% It may include sequences having more than homology, most preferably more than 99% homology, but is not limited thereto.
- APOL1 (Apolipoprotein L1) is an apolipoprotein component generally included in HDL that circulates through the blood and is involved in inflammatory reactions. In particular, it is reported that APOL1 induces lysosomal swelling and dissolution to induce autophagy. APOL1 is known to be associated with diseases such as sleeping sickness, kidney disease, and FSGS.
- sequence of representative human APOL1 is the same as SEQ ID NO: 2 (UniProtKB - O14791), but is not limited thereto, and a protein comprising a peptide sequence determined to be substantially homologous to SEQ ID NO: 2 or a mutant thereof includes For example, about 80% or more homology with SEQ ID NO: 1, preferably 85% or more homology, more preferably 90% or more homology, even more preferably 95% or more homology, still more preferably 97% It may include sequences having more than homology, most preferably more than 99% homology, but is not limited thereto.
- SERPINA 5 (Serpin Family A Member 5) is also referred to as plasma serine protease inhibitor or protein C inhibitor (PCI).
- SERPINA5 inhibits the activity of protein C, and is a protein known as a plasma biomarker of prostate cancer, a male tumor in particular.
- a representative sequence of human SERPINA5 is SEQ ID NO: 3 (UniProtKB: P05154), but is not limited thereto, and includes a protein comprising a peptide sequence determined to be substantially homologous to SEQ ID NO: 3 or a mutant thereof.
- homology with SEQ ID NO: 3 preferably 85% or more homology, more preferably 90% or more homology, even more preferably 95% or more homology, still more preferably 97% It may include sequences having more than homology, most preferably more than 99% homology, but is not limited thereto.
- SERPINA7 (Serpin Family A Member 7) is also referred to as thyroxine binding globulin (TBG).
- SERPINA7 is reported as a plasma transport protein capable of binding to thyroid hormone.
- a representative sequence of human SERPINA7 is SEQ ID NO: 4 (UniProtKB: P05543), but is not limited thereto, and includes a protein comprising a peptide sequence determined to be substantially homologous to SEQ ID NO: 4 or a mutant thereof.
- homology to SEQ ID NO: 4 preferably 85% or more homology, more preferably 90% or more homology, even more preferably 95% or more homology, still more preferably 97% It may include sequences having more than homology, most preferably more than 99% homology, but is not limited thereto.
- ECM1 Extracellular matrix protein 1
- ECM1 Extracellular matrix protein 1
- SEQ ID NO: 5 UniProtKB: Q16610
- homology to SEQ ID NO: 5 preferably 85% or more homology, more preferably 90% or more homology, even more preferably 95% or more homology, still more preferably 97% It may include sequences having more than homology, most preferably more than 99% homology, but is not limited thereto.
- Carboxypeptidase N Subunit 2 is a human plasma protein known to bind to and stabilize the catalytic subunit. CPN2 is also reported to be upregulated in liver cancer tissue (The Human protein atlas). A representative sequence of human CPN2 is shown in SEQ ID NO: 6 (UniProtKB: P22792), but is not limited thereto, and includes a protein comprising a peptide sequence determined to be substantially homologous to SEQ ID NO: 6 or a mutant thereof.
- homology to SEQ ID NO: 6 preferably 85% or more homology, more preferably 90% or more homology, even more preferably 95% or more homology, still more preferably 97% It may include sequences having more than homology, most preferably more than 99% homology, but is not limited thereto.
- ADIPOQ adiponectin
- GBP-28 GBP-28
- apM1 adiponectin
- Acrp30 adiponectin
- ADIPOQ is a protein hormone that regulates metabolic processes such as glucose control and fatty acid oxidation, and is present in high abundance in plasma. Mutations in ADIPOQ are reported to be associated with breast cancer (Cancers 2021, 13(10), 2261).
- the sequence of representative human ADIPOQ is the same as SEQ ID NO: 7 (UniProtKB: Q15848), but is not limited thereto, and includes a protein comprising a peptide sequence determined to be substantially homologous to SEQ ID NO: 7 or a mutant thereof.
- homology with SEQ ID NO: 7 preferably 85% or more homology, more preferably 90% or more homology, even more preferably 95% or more homology, still more preferably 97% It may include sequences having more than homology, most preferably more than 99% homology, but is not limited thereto.
- the "diagnosis" means accurately identifying the condition of a subject for a specific disease or disorder.
- a subject's condition for a particular disease or condition may include susceptibility to a particular disease or condition, determination of a condition currently suffering from the subject, as well as prognosis of the subject, identification of a cancer state, cancer
- the basis for appropriate treatment according to the patient's disease and condition such as determining the stage or predicting the susceptibility and responsiveness of cancer to treatment, ascertaining the characteristics of the disease, and confirming the condition of the target to determine the therapeutic effect of a specific drug It is used in a broad sense that includes obtaining, further predicting and confirming whether or not recurrence in a subject who has been cured from a specific disease or disease.
- the diagnosis is to determine whether or not a disease has occurred or is likely to develop.
- prognosis means the prediction of medical outcome (eg, long-term viability, disease-free survival rate, etc.), and includes a positive prognosis (positive prognosis) or negative prognosis (negative prognosis), and the negative prognosis Prognosis includes disease progression or mortality, such as recurrence, tumor growth, metastasis, and drug resistance, and positive prognosis includes disease remission, such as no disease, improvement or stabilization of disease, such as tumor regression ( stabilization).
- prognosis includes disease progression or mortality, such as recurrence, tumor growth, metastasis, and drug resistance
- positive prognosis includes disease remission, such as no disease, improvement or stabilization of disease, such as tumor regression ( stabilization).
- the term "prediction" means to guess in advance about medical consequences, and for the purpose of the present invention, the course of a patient diagnosed with ovarian cancer (disease progression, improvement, recurrence of gastric cancer, tumor growth) , weak resistance) means to guess in advance.
- the disease or disease subject to diagnosis may be ovarian cancer.
- the ovarian cancer refers to a malignant tumor, that is, cancer, that occurs in the ovary or in a peripheral organ of the ovary.
- the ovarian cancer includes epithelial cell carcinoma, germ cell tumor, and sex cord stromal tumor in the ovary, and more specific examples include serous ovarian cancer, mucinous ovarian cancer, and endometrial cancer. Examples include, but are not limited to, endometroid carcinoma, clear cell carcinoma, Malignant brenner tumor, undifferentiated carcinoma, and unclassified ovarian cancer.
- the ovarian cancer can be classified according to the stage, specifically, it can be divided into stages 1 to 4, with stage 1 and 2 as early stages, stage 3 and 4 as early stages.
- the stage is classified as an advanced stage (FIGO classification criteria).
- the stage of ovarian cancer can be classified according to the following criteria (TNM and FIGO classification criteria, 2019, Genitourinary Imaging Diagnostic Gynecological Imaging, Society of Genitourinary Imaging):
- composition for diagnosing ovarian cancer of the present invention may be characterized in that it is used for diagnosing all stage 1 to 4 ovarian cancer, and preferably used for diagnosing early stages 1 to 2 ovarian cancer, but is limited thereto. it is not going to be
- the agent capable of measuring the protein level is, for example, an antibody, an oligopeptide, a ligand, a peptide nucleic acid (PNA), and an app that specifically binds to each ovarian cancer diagnostic biomarker protein of the present invention. It may be any one or more of aptamers, but is not limited thereto.
- the antibody includes all "antibodies” such as polyclonal antibodies, monoclonal antibodies and recombinant antibodies, and an antibody refers to a specific protein molecule directed against an antigenic site.
- Polyclonal antibodies can be produced by a method well known in the art, in which the diagnostic biomarker protein for ovaries of the present invention is injected into an animal as an antigen and blood is collected from the animal to obtain serum containing the antibody.
- Such polyclonal antibodies can be prepared from any animal species host, such as goat, rabbit, sheep, monkey, horse, pig, mouse, rat, cow, and dog.
- Monoclonal antibodies can be prepared by the hybridoma method well known in the art (see Kohler and Milstein (1976) European Journal of Immunology 6:511-519), or from a phage antibody library (Clackson et al, Nature, 352:624-628, 1991 (Marks et al, J. Mol. Biol., 222:58, 1-597, 1991) technique.
- Antibodies prepared by the above method may be separated and purified using methods such as gel electrophoresis, dialysis, salt precipitation, ion exchange chromatography, and affinity chromatography.
- Antibodies of the present invention also include functional fragments of antibody molecules as well as complete forms having two full-length light chains and two full-length heavy chains.
- a functional fragment of an antibody molecule means a fragment having at least an antigen-binding function, and includes Fab, F(ab'), F(ab') 2 and Fv.
- antibodies are generally quantitatively analyzed by color reaction using secondary antibodies conjugated with enzymes such as alkaline phosphatase (AP) or horseradish peroxidase (HRP) and their substrates, Quantitative analysis can also be performed directly using those in which AP or HRP enzymes are conjugated to the protein monoclonal antibody.
- enzymes such as alkaline phosphatase (AP) or horseradish peroxidase (HRP) and their substrates
- the "PNA (Peptide Nucleic Acid)” is a polymer similar to artificially synthesized DNA or RNA, and has an N-(2-aminoethyl)-glycine backbone connected by a peptide bond. PNA has improved binding ability and stability to DNA or RNA, and is used for diagnostic analysis.
- the “aptamer” is an oligonucleic acid or peptide molecule, and may be characterized in that it specifically binds to a target.
- the aptamer may be characterized in that it specifically binds to any one or more of the biomarker proteins for diagnosis of ovarian cancer of the present invention.
- the agent capable of measuring the expression level of the gene may be characterized in that it is selected from the group consisting of primers, probes, and antisense nucleotides that specifically bind to genes encoding each protein, but are limited thereto it is not going to be
- the term "primer” is a nucleic acid sequence having a short free 3' hydroxyl group, capable of forming a base pair with a complementary template, and a starting point for copying the template. By means a short functional nucleic acid sequence.
- PCR amplification is performed using the sense and antisense primers of the marker polynucleotide of the present invention, and the prognosis of gastric cancer can be predicted through whether a desired product is produced. PCR conditions and lengths of sense and antisense primers can be modified based on those known in the art.
- the "probe” of the present invention refers to a nucleic acid fragment such as RNA or DNA corresponding to a few bases to several hundred bases in length that can form a specific binding with mRNA, and is labeled so that the presence or absence of a specific mRNA can be confirmed. there is.
- the probe may be manufactured in the form of an oligonucleotide probe, a single stranded DNA probe, a double stranded DNA probe, an RNA probe, or the like.
- the measurement of the protein level is a protein selected from the group consisting of MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 and ADIPOQ, which are ovarian cancer diagnostic markers of the present invention, in biological samples to diagnose the disease of the present invention. means to confirm the presence and expression level of
- protein level measurement or comparative analysis methods include western blotting, ELISA (enzyme linked immunosorbent assay), radioimmunoassay, radioimmunodiffusion, and Ouchterlony Immune diffusion, Rocket immunoelectrophoresis, tissue immunostaining, immunoprecipitation assay, complete fixation assay, FACS, protein chip, and mass spectrometry.
- ELISA enzyme linked immunosorbent assay
- radioimmunoassay radioimmunodiffusion
- Ouchterlony Immune diffusion Rocket immunoelectrophoresis, tissue immunostaining, immunoprecipitation assay, complete fixation assay, FACS, protein chip, and mass spectrometry.
- Rocket immunoelectrophoresis tissue immunostaining
- immunoprecipitation assay complete fixation assay
- FACS protein chip
- mass spectrometry mass spectrometry
- the mass spectrometry is performed according to the ionization method, for example, FAB, CI, APCI, ESI, DESI, MALDI, SELDI, ICP, DESI, SESI, LAESI, FD, FAB, DIOS, DART , SIMS, TIMS, etc., depending on the mass selection method, qaudrupole mass filter, ion trap, electron multiplier, etc., depending on the combination with separation technology, gas chromatography It can be classified into gas chromatography (GS), liquid chromatography (liquid chromatography, LC), etc., and data derived from mass spectrometry can be displayed in methods such as SIM, TIC, and SRM, and each classification is combined is named For example, MALDI-TOF (Matrix Assisted Laser Desorption/Ionization Time of Flight Mass Spectrometry) analysis, SELDITOF (Sulface Enhanced Laser Desorption/Ionization Time of Flight Mass Spectrometry) analysis, liquid
- the present invention relates to ovarian cancer comprising an agent capable of measuring the level of two or more proteins selected from the group consisting of MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 and ADIPOQ or the expression level of a gene encoding them. It relates to a diagnostic kit for
- the kit for diagnosing ovarian cancer may be characterized in that it includes a preparation capable of measuring the protein levels of MBL2, APOL1 and SERPINA5 or the expression levels of genes encoding them.
- the kit for diagnosing ovarian cancer preferably measures the protein levels of MBL2 and APOL1, MBL2 and SERPINA5, or APOL1 and SERPINA5, most preferably MBL2, APOL1 and SERPINA5, or the expression level of a gene encoding them.
- the diagnosis of ovarian cancer may be a diagnosis of stage 1 and/or stage 2 ovarian cancer.
- the kit for diagnosing ovarian cancer includes an agent capable of measuring the protein levels of MBL2, APOL1 and SERPINA5 or the expression level of genes encoding them, and the protein level of any one or more of SERPINA7, ECM1, CPN2 and ADIPOQ. Or it may be characterized in that it comprises an agent capable of measuring the expression level of the gene encoding it.
- the kit for diagnosing ovarian cancer may be characterized in that it includes an agent capable of measuring the levels of MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 and ADIPOQ proteins or the expression levels of genes encoding them. .
- the kit for diagnosing ovarian cancer can measure the level of various plasma biomarker proteins known as conventional ovarian cancer markers or the expression level of genes encoding them, in addition to the biomarker protein for diagnosing ovarian cancer of the present invention described above. It may be characterized in that it further comprises an agent with.
- the kit for diagnosing ovarian cancer may include the composition for diagnosing ovarian cancer of the present invention.
- the kit for diagnosing ovarian cancer may include one or more other component compositions, solutions, or devices suitable for the analysis method.
- it may be an RT-PCR kit, a DNA chip kit, a protein chip kit, a rapid kit, or a selected reaction monitoring (SRM)/multiple reaction monitoring (MRM) kit.
- SRM selected reaction monitoring
- MRM multiple reaction monitoring
- the RT-PCR kit contains, in addition to each primer pair specific for a marker gene, a test tube or other suitable container, a reaction buffer, deoxynucleotides (dNTPs), enzymes such as Taq-polymerase and reverse transcriptase, DNase and RNase inhibitors. , DEPC-water, sterile water, and the like.
- dNTPs deoxynucleotides
- a primer pair specific to a gene used as a quantitative control may be included.
- the DNA chip kit includes a substrate to which a cDNA corresponding to a gene or a fragment thereof is attached as a probe, and the substrate may include a cDNA corresponding to a quantitative structural gene or a fragment thereof.
- kits according to the present invention may be a diagnostic kit including an agent for measuring the protein level, and in this case, the agent for measuring the protein level may preferably be an antibody specific to the protein. Therefore, a diagnostic kit including an agent for measuring the protein level may be, for example, a kit for detecting a diagnostic marker including essential elements necessary for performing ELISA, and such a kit forms an "antigen-antibody complex". It may also include reagents capable of detecting the antibody, such as labeled secondary antibodies, chromophores, enzymes (eg, conjugated to antibodies) and their substrates, and the like. In addition, antibodies specific to the quantification control protein may be included.
- the amount of formation of the antigen-antibody complex can be quantitatively measured through the size of a signal of a detection label.
- detection labels may be selected from the group consisting of enzymes, fluorescent substances, ligands, luminescent substances, microparticles, redox molecules, and radioactive isotopes, but are not necessarily limited thereto.
- the selected reaction monitoring also referred to as multiple reaction monitoring (MRM) is a method used in tandem mass spectrometry and is used for target quantitative proteomic analysis.
- MRM multiple reaction monitoring
- the SRM used for targeted quantitative proteomic analysis is Nature Methods. 9 (6): 555-566.
- the present invention provides (a) the expression level of two or more proteins selected from the group consisting of MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 and ADIPOQ from a sample isolated from the subject or the expression level of the gene encoding them measuring;
- the subject may be an animal including a human, preferably a mammal, and more preferably a human.
- the sample may be a solid or non-solid sample isolated from a subject to be diagnosed with ovarian cancer, for example, organs, tissues, cells isolated from the subject, or whole blood obtained from the subject. , leukocytes, peripheral blood mononuclear cells, buffy coat, plasma, serum, sputum, tears, mucus, sebi Nasal washes, nasal aspirates, breath, urine, semen, saliva, peritoneal washings, ascites, cystic fluid, meningeal fluid, amniotic fluid, glandular fluid, pancreatic fluid, lymph fluid, pleural fluid, nipple aspirate, bronchial aspiration It may be bronchial aspirate, synovial fluid, joint aspirate, organ secretions, cells, cell extract, or cerebrospinal fluid, but is limited thereto It is not.
- the sample is most preferably obtained from a subject. It may be whole blood, plasma or serum.
- biomarker of the present invention is a protein present in plasma at a very low concentration, samples obtained from patients were pretreated to increase sensitivity and accuracy.
- it may be characterized in that it further comprises the step of pre-treating the sample separated from the target before the step (a).
- the step of pre-treating the sample separated from the subject may include removing proteins abundantly present in the sample.
- the protein abundantly present in the sample is the protein abundantly present in the sample.
- proteins abundant in the sample include, for example, albumin, IgA, IgG, IgM, and ⁇ 1.
- -Antitrypsin ⁇ 1-acid glycoprotein, apolipoprotein A1, apolipoprotein A2, complement C3, transferrin, ⁇ 2-macroglobulin, transthyretin, haptoglobin, and fibrinogen, but not limited thereto.
- the pretreatment step consists of albumin, IgA, IgG, IgM, ⁇ 1-antitrypsin, ⁇ 1-acid glycoprotein, apolipoprotein A1, apolipoprotein A2, complement C3, transferrin, ⁇ 2-macroglobulin, transthyretin, haptoglobin and fibrinogen from the sample. It may be characterized by including the step of removing any one or more selected from the group.
- a high-concentration plasma protein removal column MARS14 connected to high-performance liquid chromatography was used to remove the protein, but is not limited thereto.
- the step of pre-treating the sample separated from the subject may include the step of cleaving the protein contained in the sample into short peptides.
- the step of cutting the protein included in the sample into short peptides can be performed through various methods known in the art.
- a sample isolated from a subject was pretreated by the suspension trap method using a trypsin/rice seed mixture and cleaved into short peptides, but is not limited thereto.
- the step (a) may be characterized by measuring the protein level.
- the measurement of the protein level is a protein selected from the group consisting of MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 and ADIPOQ, which are ovarian cancer diagnostic markers of the present invention, in biological samples to diagnose the disease of the present invention. It may be to confirm the presence and expression level of
- the method for measuring the protein level in step (a) is Western blotting, ELISA (enzyme linked immunosorbent assay), radioimmunoassay, radioimmunodiffusion, oxycrerony ( Ouchterlony) immunodiffusion method, Rocket immunoelectrophoresis, tissue immunostaining, immunoprecipitation assay, complete fixation assay, FACS, protein chip, and mass spectrometry and the like, but are not limited thereto, and any known method capable of measuring protein levels, preferably plasma protein levels, may be used.
- the protein level or gene expression level in step (a) may be characterized in that it is performed by an absolute quantification method or a relative quantification method known in the art.
- step (a) may be characterized in that it is preferably performed by mass spectrometry.
- the mass spectrometry is performed according to the ionization method, for example, FAB, CI, APCI, ESI, DESI, MALDI, SELDI, ICP, DESI, SESI, LAESI, FD, FAB, DIOS, DART , SIMS, TIMS, etc., depending on the mass selection method, qaudrupole mass filter, ion trap, electron multiplier, etc., depending on the combination with separation technology, gas chromatography It can be classified into gas chromatography (GS), liquid chromatography (liquid chromatography, LC), etc., and data derived from mass spectrometry can be displayed in methods such as SIM, TIC, and SRM, and each classification is combined can be named
- the mass spectrometry may include matrix assisted laser desorption/ionization time of flight mass spectrometry (MALDI-TOF) analysis, surface enhanced laser desorption/ionization time of flight mass spectrometry (SELDITOF) analysis, liquid
- the level when the protein level is measured by the mass spectrometry, the level can be measured without developing an antibody or aptamer that specifically binds to the biomarker or purchasing an expensive antibody/aptamer. .
- ovarian cancer when using the biomarker for ovarian cancer diagnosis of the present invention, even if the protein level is measured based on mass spectrometry, ovarian cancer, preferably early ovarian cancer, is highly sensitive and accurate. It is characterized by being able to diagnose.
- a quantitative assay using a label or a non-labeled quantitative assay can be used without limitation.
- the quantitative analysis method using the label may be characterized in that it is performed using a substance (eg, a fluorescent substance or a radioisotope) that exhibits a detection signal on a protein.
- a substance eg, a fluorescent substance or a radioisotope
- the label-free quantitative analysis method is, for example, SWATH MS analysis performed in the Examples of the present invention, but is not limited thereto.
- the step (a) is preferably sequential. It can be characterized as being performed through Window Acquisition of all Theoretical (SWATH) mass spectrometry.
- the step (a) may be characterized by measuring the levels of MBL2, APOL1 and SERPINA5 proteins or the expression levels of genes encoding them.
- step (a) preferably measures the protein level of MBL2 and APOL1, MBL2 and SERPINA5, or APOL1 and SERPINA5, most preferably MBL2, APOL1 and SERPINA5 or the expression level of the gene encoding them.
- the diagnosis of ovarian cancer may be a diagnosis of stage 1 and/or stage 2 ovarian cancer.
- the step (a) may be characterized by further measuring the protein level of any one or more of SERPINA7, ECM1, CPN2 and ADIPOQ together with MBL2, APOL1 and SERPINA5 or the expression level of the gene encoding them. there is.
- step (a) may be characterized by measuring the levels of MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 and ADIPOQ proteins or the expression levels of genes encoding them.
- the composition for diagnosing ovarian cancer measures the level of various plasma biomarker proteins known as conventional ovarian cancer markers or the expression level of genes encoding them, in addition to the biomarker protein for diagnosing ovarian cancer of the present invention described above. can be characterized.
- the step (a) may be characterized by measuring the protein level or the expression level of the gene encoding it by an absolute quantification method.
- the step (a) may be characterized in that the protein level or the expression level of the gene encoding it is measured by a relative quantification method in comparison with a control group.
- control group in step (b) is the level of MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 and ADIPOQ proteins in samples isolated from subjects not suffering from ovarian cancer, or the expression levels of genes encoding them. can be done with
- control group in step (b) may be provided by direct measurement, or may be characterized in that it is a reference value that has been previously measured and provided.
- step (b) when the protein level in step (a) or the expression level of the gene encoding it is measured by a relative quantification method, the step (b) is automatically performed by the relative quantification result. can do.
- a total of 31 differentially expressed proteins (DEPs) showing significant differences were identified.
- Alpolipoprotein L1 was the common DEP for the 3 groups, and 10 proteins appeared as common DEPs for the control group and ovarian cancer stage 1-2 group, and the control group and ovarian cancer stage 3-4 group.
- 7 proteins appeared as common DEPs between the control group and ovarian cancer stage 1-2 group, ovarian cancer stage 1-2 group and ovarian cancer stage 3-4 group.
- APOL1, SERPINA5, SERPINA7, ECM1, CPN2, and ADIPOQ among the biomarkers for diagnosing ovarian cancer of the present invention decreased in all ovarian cancer patients, and MBL2 increased.
- APOL1 and SERPINA5 were significantly decreased, and MBL2 was significantly increased when compared to normal controls as well as stage 3-4 ovarian cancer patients.
- (C) further comprising the step of confirming that the subject is likely to suffer from ovarian cancer when a change in the level of any one or more of the following proteins or the expression level of a gene encoding the same is detected can be characterized.
- the increase in MBL2 protein level and/or the expression level of the gene encoding the same is, for example, about 1.1 times or more, preferably about 1.2 times or more, more preferably about 1.3 times or more compared to the control group. , more preferably about 1.4 times or more, more preferably about 1.5 times or more, and most preferably about 1.53 times or more.
- the decrease in the ii) APOL1 protein level and/or the expression level of the gene encoding the same is, for example, about 0.01-fold to about 0.9-fold, more preferably about 0.1-fold to about 0.85-fold compared to the control group. It can be characterized in that it is preferably reduced by about 0.4 times to about 0.8 times, and most preferably by about 0.7 to about 0.8 times.
- the reduction in the iii) SERPINA5 protein level and/or the expression level of the gene encoding the same is, for example, about 0.01-fold to about 0.9-fold, more preferably about 0.1-fold to about 0.85-fold, compared to the control group. It can be characterized in that it is preferably reduced by about 0.4 times to about 0.8 times, and most preferably by about 0.7 to about 0.8 times.
- the decrease in the iv) SERPINA7 protein level and/or the expression level of the gene encoding the same is, for example, about 0.01-fold to about 0.95-fold, more preferably about 0.1-fold to about 0.9-fold, compared to the control group. It may be characterized in that it is preferably reduced by about 0.5 times to about 0.9 times, and most preferably by about 0.8 times to about 0.9 times.
- v) the reduction of the ECM1 protein level and/or the expression level of the gene encoding the same is, for example, about 0.01-fold to about 0.95-fold, more preferably about 0.1-fold to about 0.9-fold, more preferably compared to the control group.
- it may be characterized in that it is reduced by about 0.5 times to about 0.9 times, and most preferably by about 0.7 times to about 0.9 times.
- the decrease in CPN2 protein level and/or the expression level of the gene encoding the same is, for example, about 0.01-fold to about 0.95-fold, more preferably about 0.1-fold to about 0.9-fold, more preferably compared to the control group. It may be characterized in that it is reduced by about 0.5 times to about 0.9 times, and most preferably by about 0.8 times to about 0.9 times.
- the ADIPOQ protein level and/or the expression level of the gene encoding it is reduced, for example, by about 0.01-fold to about 0.95-fold, more preferably by about 0.1-fold to about 0.9-fold, more preferably compared to the control group. It may be characterized in that it is reduced by about 0.5 times to about 0.9 times, and most preferably by about 0.8 times to about 0.9 times.
- (C) further comprising the step of confirming that the subject is likely to suffer from stage 1 or stage 2 ovarian cancer when a change in the level of the following proteins or genes encoding them is detected can be characterized.
- the increase in the MBL2 protein level and/or the expression level of the gene encoding the same is, for example, about 1.1 times or more, preferably about 1.2 times or more, more preferably about 1.4 times or more compared to the control group. , more preferably about 1.5 times or more, more preferably about 1.6 times or more, and most preferably about 1.7 times or more.
- the decrease in the ii) APOL1 protein level and/or the expression level of the gene encoding the same is, for example, about 0.01-fold to about 0.9-fold, more preferably about 0.1-fold to about 0.85-fold compared to the control group. It may be characterized in that it is preferably reduced by about 0.4 to about 0.8 times, and most preferably by about 0.6 to about 0.7 times.
- the reduction in the iii) SERPINA5 protein level and/or the expression level of the gene encoding the same is, for example, about 0.01-fold to about 0.9-fold, more preferably about 0.1-fold to about 0.85-fold, compared to the control group. It may be characterized in that it is preferably reduced by about 0.4 to about 0.8 times, and most preferably by about 0.6 to about 0.7 times.
- examples of the increase or decrease in the expression level of each protein level and / or the gene encoding the above are derived based on the values confirmed and verified in 113 human subjects in the examples of the present invention, It will be readily understood by those skilled in the art that the level of reduction or increase may be different for each individual subject.
- a step of interpreting the change (increase or decrease) of the protein level and/or the expression level of the gene encoding the same may be further included.
- the step of interpreting the change (increase or decrease) in the expression level of the protein level and / or the gene encoding it may be characterized by interpreting by a scoring algorithm based on the importance of each biomarker. .
- the step of analyzing the change in the protein level and/or the expression level of the gene encoding it may be characterized in that it is interpreted by a prediction or classification model.
- the prediction or classification model may be characterized in that it is learned by a known data analysis method.
- the prediction or classification model is linear regression, logistic regression, ridge regression, lasso regression, jackknife regression, decision tree Tree), Random Forest, K-means Clustering, Cross-Validation, Artificial Neural Network, Ensemble Learning, Naive Bayes Classification Bayesian Classifier), collaborative filtering, Principal Component Analysis (PCA), and Support Vector Machine (SVM), etc., preferably learning with a random forest or support vector machine It may be, but is not limited thereto.
- the prediction or classification model may be learned by a supervised or unsupervised algorithm newly designed by a person skilled in the art for diagnosis of ovarian cancer based on an embodiment of the present invention, in addition to known models.
- a prediction or classification model based on a random forest or support vector machine method was used to change the level of the biomarker of the present invention, and both predictive or classification models trained with the two methods showed significantly high sensitivity and specificity. It has been proven that patients with total ovarian cancer and stage 1-2 ovarian cancer can be diagnosed.
- the biomarker protein for diagnosing ovarian cancer of the present invention can be used to diagnose whether a subject is suffering from ovarian cancer, and based on this, can be used to improve or treat ovarian cancer in patients who have already been diagnosed with ovarian cancer. It is self-explanatory to the skilled person.
- the present invention provides a method comprising: (a) treating a sample isolated from a subject or a cancer disease animal model with a candidate agent; and
- the method of screening for a drug for preventing or treating ovarian cancer of the present invention may be characterized by having the same characteristics as those described in the method for diagnosing and/or providing information for diagnosis of ovarian cancer.
- SWATH Simential Window Acquisition of all Theoretical Mass Spectra
- DPHL A pan-human protein mass spectrometry library (Reference thesis: https://pubmed.ncbi.nlm.nih.gov/32795611/) (spectral library). Samples were pretreated with cleaved peptides, and plasma proteins were quantified through LC/MS SWATH analysis.
- High-concentration plasma deproteinization column MARS14 column (100 x 4.6 mm; Agilent Technology, Palo Alto) coupled to high-performance liquid chromatography (HPLC) for reproducible analysis of 113 plasma samples prior to subjecting them to SWATH analysis. . After peptide preparation, 113 different samples were analyzed by SWATH-MS in the same amount based on the values quantified by NanoDrop.
- 40 ⁇ L of plasma was injected onto a MARS14 column and the top 14 abundant proteins (albumin, IgA, IgG, IgM, ⁇ 1-antitrypsin, ⁇ 1-acid glycoprotein, apolipoprotein A1, apolipoprotein A2, complement C3, transferrin, ⁇ 2- macroglobulin, transthyretin, haptoglobin and fibrinogen) were removed.
- the mixture was diluted 4-fold with Agilent's buffer A (part number: 5185-5987) and loaded onto the MARS14 column of the Shimadzu HPLC LC20AT system.
- a fraction of unbound plasma proteins at low concentrations was lyophilized and then reabsorbed to prepare peptides by the suspension trap method. Specifically, 1,4-dithiothreitol was added to 10 mM by reabsorption with 5% SDS (50 mM TEAB) buffer and reacted at 95 ° C for 10 minutes to reduce disulfide bonds made it Thereafter, for alkylation, iodoacetamide was added to a concentration of 20 mM, reacted for 30 minutes at room temperature under dark conditions, and digested with 6 ⁇ g of a trypsin/rice seed mixture at 37° C. for 18 hours.
- Peptides were lyophilized, lyophilized with a cold trap (CentriVap Cold Traps, LABCONCO), and stored at -80°C until use.
- LC-MS/MS liquid chromatography-tandem mass spectrometry
- the iRT standard provided by the iRT-Kit (Biognosys AG, Schlieren, Switzerland) was then added to the sample in 1/10 volume to follow the supplier instructions (Reference: https://pubmed.ncbi.nlm.nih.gov/22577012 Retention time was corrected according to /).
- the total amount of each sample was 40 ⁇ g and was dissolved in 40 ⁇ L.
- a 4 ⁇ L sample injected was analyzed using a SCIEX TripleTOF 5600+ system mass spectrometer with the following LC-MS/MS settings.
- a nanoLC 425 (Eksigent, Dublin, CA, USA) was used as an analytical column with an Eksigent Micro Trap C18 column (ChromXP C18CL, 5 ⁇ m, 120 ⁇ ) and an Eksigent column (C18-CL, 0.3 x 150 mm, particle size 3). ⁇ m, pore size 120 ⁇ ) together the column temperature was maintained at 40 °C. Samples were loaded onto the trap column using buffer A at a flow rate of 10 ⁇ L/min. After 10 minutes, the peptide mixture was separated through a concentration gradient using buffer A and buffer B (0.1% formic acid in HPLC acetonitrile) at a flow rate of 5 ⁇ L/min by 57 minutes.
- SWATH All Theoretical Mass Spectrum
- MS parameters were set as follows: ion source gas 1 (GS1) 15 psi; ion source gas 2 (GS2) 20 psi; Curtain Gas (CUR) 30 psi; temperature (TEM) 250 °C; Floating Ion Spray Voltage (ISVF) 5500V.
- SWATH LC-MS analysis was performed sequentially over 5 days by randomly mixing to minimize batch-specific bias between analyses.
- SWATH LC-MS analysis was performed on 113 samples to obtain 113 spectral results.
- Qualitative proteomic analysis was performed on the resulting spectra using DIA-NN software and Pan-human proteome library, and a total of 831 proteins from 113 samples could be qualitatively/quantitatively analyzed.
- FIG. 1 it was confirmed that reproducibility was shown as a result of analyzing the information on the amount of normalized proteins based on the median value for each of a total of 113 samples from the normal group and the ovarian cancer patient group in a log scale.
- statistical analysis was performed using the quantitative information of a total of 133 proteins that were not related to MARS-14 high abundant protein depletion and detected more than 80% in 113 plasma samples of two groups.
- APOL1, SERPINA5, SERPINA7, ECM1, CPN2, and ADIPOQ among the biomarkers for diagnosing ovarian cancer of the present invention decreased in all ovarian cancer patients, and MBL2 increased.
- APOL1 and SERPINA5 were significantly decreased, and MBL2 was confirmed to be significantly increased when compared to normal controls as well as stage 3-4 ovarian cancer patients (FIG. 2 ).
- stage 1-2 Based on the total plasma proteomics detected in the ovarian cancer patients (group 1: stage 1-2, group 2: stage 3-4) and the normal control group, a feature selection process was performed, and each stage Optimal marker protein candidates for deriving ovarian cancer patients were selected.
- stage 1-2 group 4 proteins (Fig. 3a) and in the case of the entire stage, 10 proteins were derived as candidates (Fig. 3b), but to improve the sensitivity and accuracy of detection, biomarker candidates with a probability of less than 0.5 were excluded.
- 3 biomarkers for diagnosis of stage 1-2 ovarian cancer patients and 7 plasma biomarkers including the above 3 biomarkers for diagnosis of all ovarian cancer patients were selected.
- Table 2 and FIGS. 4 and 5 show changes in the expression levels of the seven biomarkers for diagnosing ovarian cancer of the present invention, compared to the normal group, which will be described below. As shown in Table 2 and FIGS. 4-5, the selected 7 biomarkers show significant differences in stage 1-2 ovarian cancer patients or all ovarian cancer patients compared to normal controls.
- a model capable of predicting early ovarian cancer disease and ovarian cancer disease was constructed using the quantitative information of plasma proteomics of the normal group and ovarian cancer patients collected in Example 2.
- disease prediction models were created for 39 patients with stage 1-2 among 83 patients with ovarian cancer, including 30 normal patients, for early ovarian cancer disease prediction.
- 30 normal patients and 83 total patients with ovarian cancer were included in the ovarian cancer disease model prediction.
- the model in the step of selecting characteristic variables with protein quantitative information as a variable using the same decision tree structure for both sets
- the embedded method which includes variable selection itself, was applied.
- the clinical cut value was set to 0.5284, which is the Youden index, based on the validation set, the specificity was 83.33% and the sensitivity was 90.90% (FIG. 8).
- the area under the curved surface of the receiving motion characteristic is 0.857 (training set) and 0.939 (verification set)
- the clinical cut value is set to 0.6852, which is the Youden index, based on the verification set.
- the specificity was 100% and the sensitivity was 90.90% (FIG. 9). This is significantly better than the area under curvature (AUC) value in the case of diagnosing early ovarian cancer using each biomarker independently, which means that the early stage ovarian cancer diagnosis method of the present invention shows significantly better diagnostic accuracy (FIG. 10). ).
- FIGS. 11 and 12 Training of each model for diagnostic verification of the ovarian cancer patient group (all stages) using 7 protein markers is shown in FIGS. 11 and 12, respectively.
- Ovarian cancer diagnosis prediction is based on whether the normal group and all ovarian cancer patient groups (stages 1-4) can be distinguished using a model composed of the above 7 protein panels (MBL2, APOL1, SERPINA7, ECM1, SERPINA5, CPN2, ADIPOQ). verified.
- the clinical cut value was set to 0.6289, which is the Youden index, based on the validation set, the specificity was 90.0% and the sensitivity was 77.77% (FIG. 13).
- the area under the surface of the receiving motion characteristic is 0.858 (training set) and 0.800 (verification set), and the clinical cut value is set to 0.666, which is the Youden index, based on the verification set.
- the specificity was 80.0% and the sensitivity was 74.07% (FIG. 14).
- Seven biomarkers for the diagnosis of all ovarian cancer are also significantly superior to the area under curvature (AUC) value when diagnosing early ovarian cancer using each biomarker independently, so the early stage ovarian cancer diagnosis method of the present invention is remarkably It was confirmed that it exhibited excellent diagnostic accuracy (FIG. 15a to 15g).
- the biomarkers and combinations thereof of the present invention can diagnose ovarian cancer with significantly better sensitivity and specificity than previously reported ovarian cancer biomarkers, and in particular, can detect stage 1 and/or stage 2 ovarian cancer, thereby preventing ovarian cancer. Early diagnosis is possible. Furthermore, the biomarker of the present invention can be diagnosed based on plasma protein levels, and has excellent sensitivity and specificity even in a very small amount of blood, so the procedure is simple compared to other ovarian cancer diagnosis methods involving histological examination, and the patient's Pain and strain can be significantly reduced.
- the ovarian cancer biomarker of the present invention is different from previously reported ovarian cancer biomarkers and has the advantage that it can be used together with or in place of existing biomarkers, and can also be used as a marker for therapeutic effects after drug administration, It can also be used very usefully in screening for clinical treatments for ovarian cancer.
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Immunology (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Urology & Nephrology (AREA)
- Oncology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Hospice & Palliative Care (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Hematology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Cell Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
본 발명은 난소암 진단용 다중 바이오 마커 및 이의 용도에 관한 것으로, 본 발명의 바이오마커 및 이의 조합은 종래 보고된 난소암 바이오마커 보다 현저히 뛰어난 민감도와 특이도로 난소암을 진단할 수 있으며, 특히, 1기 및/또는 2기 난소암의 검출이 가능하여 난소암의 조기 진단이 가능하다. 나아가, 본 발명의 바이오마커는 혈장 단백질 수준을 기반으로 진단이 가능하며, 극소량의 혈액에서도 민감도와 특이도가 뛰어나, 조직 검사를 수반하는 다른 난소암 진단방법에 비해 그 절차가 간단하며, 환자의 고통과 부담을 현저하게 줄일 수 있다. 본 발명의 난소암 바이오마커는 종래 보고된 난소암 바이오마커와 상이하여 기존의 바이오마커와 함께 또는 이를 대체하여 사용할 수 있다는 장점이 있으며, 약물 투여 후 치료효과에 대한 마커로도 사용할 수 있어, 환자에 대한 난소암의 임상적 치료제 스크리닝에 있어서도 매우 유용하게 사용될 수 있다.
Description
본 발명은 난소암 진단용 다중 바이오 마커 및 이의 용도에 관한 것으로, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질을 포함하는 난소암 진단용 바이오마커 조합, 상기 바이오마커 단백질 또는 이를 코딩하는 유전자 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 조성물 또는 키트, 및 상기 바이오마커 조합을 사용한 난소암의 진단 방법 또는 난소암 예방 또는 치료용 약물 스크리닝 방법에 관한 것이다.
난소암은 난소에 발생하는 악성 종양으로 주로 50대 이상의 폐경기 여성에서 자주 발생하는 것으로 나타나며, 자궁경부암과 함께 여성에게 가장 흔한 부인과 암이다. 2019년 건강보험심사평가원의 자료에 의하면, 암으로 사망하는 여성환자의 47%가 난소암으로 사망했으며, 자궁경부암, 유방암, 갑상선 암과 같은 다른 여성암보다 현저하게 높은 치사율을 나타낸다. NIH의 보고에 따르면(NIH, Cancer Stat Facts: Ovarian Cancer), 여성의 1.2% 이상이 난소암을 겪고 있으며, 난소암 환자의 5년 생존률은 단지 49.1%에 불과하다.
특히, 난소암은 증상의 발현 시, 전이 단계에 있는 경우가 많으며, 실제 보고에 의하면, 약 70%의 이상의 환자가 말기 단계(advanced stage)에서 진단되며(Holschneider and Berek, 2000), 약 60%가 전이 이후(distant)에 진단되는 것으로 보고된다 (Siegel et al., 2017; 및 NIH, SEER program). 반면 초기 단계(early stage, localized)에서 진단시 5년 생존률은 92.6%로 매우 높은 수준으로 증가한다. 따라서, 난소암의 생존률 및 치료 가능성을 높이는 가장 유효한 전략은 난소암의 조기진단에 있으나, 현재 임상적으로 사용되는 난소암의 진단은 초음파 또는 촉지를 통한 물리적 검사방법을 통해 종양을 확인한 뒤, 조직검사 또는 혈액검사(CA-125 등)를 통해 악성 여부를 판단하며, 현재로서는 가장 일찍 난소암을 발견할 수 있는 방법이다. 초음파, 촉지 검사를 통한 방법은 종양이 어느 정도 성장된 뒤에야 확인이 가능하며, 악성종양의 정확한 확진을 위해서는 조직검사가 필수적으로 수반되어야 하기 때문에, 매우 인체 침습적이며, 환자에게 고통과 부담을 야기한다. 따라서, 이러한 방법을 대체하기 위한 진단 방법으로 혈액 검사가 고안되었으며, 난소암을 진단하기 위한 혈액 바이오마커의 발굴을 위한 많은 투자와 연구를 통해 CA125, HE4, CEA등의 바이오마커가 보고되었으나, 각각의 바이오마커는 낮은 민감도 및 특이성으로 인해 임상에서 판단의 참고를 위해서만 사용되며, 난소암 확진을 위해 기존의 방법을 대체하기는 어렵다.
난소암의 조기 진단을 위한 가장 일반적인 바이오마커는 CA125이다. 그러나, CA125는 난소암외에도 난소의 자궁선근증(adenomyosis), 자궁근종(uterine myoma), 자궁내막 병리 (endometrial pathology), 자궁내막증(endometriosis)에서도 검출되어, 단일 바이오마커로의 사용에 한계가 있다(Kim et al., 2019). 또한, 조기 진단 마커로서, HE4, IL-2R, prolactin, CA 15-3, CA 19-9, CA 72-4, Cyfra 21-1, TNFR1, TNFR2, IL-6, IL-7, IL-10, TNF-α, TSH, IGFBP1, MMP-7, VCAM-1, eotaxin-1, FSH, LH, ErbB2, ApoA1,TTR, adiponectin, 및 CD40L 등이 보고된 바 있으나, CA125외의 상기 바이오마커들은 민감도 및 특이성이 매우 낮다((Baron et al., 2003; Perkins et al., 2003). 이와 같이, 단일 바이오마커는 난소암을 제외한 다양한 질병에서도 발현이 증가할 수 있으며, 해당 바이오마커를 발현하지 않는 난소암 환자의 진단이 불가능하다. 따라서, 단일 바이오마커를 사용한 난소암의 진단은 매우 낮은 특이도와 민감도를 가져, 정확한 진단에 사용하기 어렵다.
상기 단일 바이오마커의 한계를 극복하기 위한 분석 방법으로 다중 바이오마커의 조합을 사용한 다변량 지수 분석(Multivariate index assay)이 개발되었다. Jacobs 및 그룹은 CA125를 초음파 및 폐경기와 결합하여, “Risk of Malignancy Index” (RMI) 알고리즘을 제안한 바 있다(Jacobs et al., 1990). RMI는 골반 종괴가 있는 여성으로부터 난소암 환자를 구별하기 위한 방법이다. 또한, Ova1은 FDA 승인된 다변량 지수 분석으로, 5개의 혈장 단백질 마커 패널로 구성된다(CA125-II, transferrin, beta-2 microglobulin, apolipoprotein A-1, 및 transthyretin). Ova1 은 35%의 낮은 특이도 및 96%의 민감도를 갖는다(Ueland et al., 2011; Miller et al., 2011). 또 다른 다변량 지수 분석 방법으로 골반 종괴를 갖는 여성의 상피암을 예측하기 위한 방법으로 Moore 그룹의 ROMA(Risk of Ovarian Malignancy Algorithm)이 있다. 2011년 FDA 승인된 ROMA score는 HE4, CA125및 폐경기의 조합으로 약 75%의 특이도를 가진다. HE4, CA125 및 연령의 조합을 사용하는 코펜하겐 지수 (CPH-I)라는 또 다른 바이오 마커 기반 지수는 Karlsen 등이 개발하였으며, ROMA 및 RMI와 유사하지만 초음파 및 폐경기 상태를 고려하지 않는다. 상기한 현재 임상에서 사용되는 다중 바이오마커 기반의 분석법은 낮은 특이도와 민감도를 가지며, 혈장 마커이외에도, 초음파를 통한 골반종괴의 확인, 폐경기 여부, 나이 등이 마커로 포함되어, 전체적인 여성을 대상으로 하는 난소암의 진단법으로 사용될 수 없고, 따라서, 상기한 방법들은 이상적인 진단 방법이 아닌 환자의 1차 분류 및 참고용 시험법으로 사용되는 실정이다. 따라서, 난소암의 확진을 위해서는 기존의 조직 검사등이 함께 수반되어야 하므로, 환자에게 부담되는 고통 및 부담이 여전히 수반된다.
결과적으로, 현재 높은 특이성과 민감도로 난소암의 진단, 특히 I기 및 II기에서의 조기 진단이 가능한 바이오마커는 높은 필요성에도 불구하고, 거의 전무한 상황이다. 또한, 바이오마커의 조합은 항상 민감도와 특이도의 향상을 수반하지 않으며, 민감도 및 특이도 중 어느 하나가 향상되더라도, 다른 하나를 감소시키는 경우가 빈번하다. 따라서, 높은 민감도와 특이도로 난소암의 조기진단이 가능한 바이오마커의 발굴 및 이들의 최적의 조합을 통한 진단방법의 개발이 요구된다(Heliyon 5 (2019) e02826).
이러한 배경기술 하에서 본 발명자들은 높은 특이도와 민감도로 난소암의 진단, 특히 조기진단이 가능한 바이오마커를 발굴하고자 예의 노력한 결과, MBL2, APOL1 및 SERPINA5를 포함하는 새로운 난소암 조기진단용 단백질 바이오마커를 도출하였으며, 이들을 조합하는 경우에 수 내지 수십 μL의 극소량의 시료에서도 기존에 보고된 바이오마커 또는 이의 조합을 사용한 난소암의 진단방법보다 현저히 높은 특이도와 민감도로 난소암을 진단할 수 있으며, 특히 1기 및 2기의 난소암의 조기진단이 가능함을 확인하고 본 발명을 완성하였다.
본 배경기술 부분에 기재된 상기 정보는 오직 본 발명의 배경에 대한 이해를 향상시키기 위한 것이며, 이에 본 발명이 속하는 기술분야에서 통상의 지식을 가지는 자에게 있어 이미 알려진 선행기술을 형성하는 정보를 포함하지 않을 수 있다.
[발명의 내용]
[해결하고자 하는 과제]
본 발명의 목적은 높은 특이도와 민감도로 난소암의 진단이 가능한 바이오마커 및 이의 조합을 제공하는 데 있다.
본 발명의 또 다른 목적은 상기 바이오마커 및 이의 조합의 난소암의 진단 용도를 제공하는 데 있다.
본 발명의 다른 목적은 높은 특이도와 민감도로 난소암의 진단이 가능한 난소암의 진단용 조성물을 제공하는 데 있다.
본 발명의 또 다른 목적은 높은 특이도와 민감도로 난소암의 진단이 가능한 난소암의 진단용 키트를 제공하는 데 있다.
본 발명의 또 다른 목적은 높은 특이도와 민감도로 난소암의 진단이 가능한 난소암의 진단방법 또는 진단을 위한 정보제공방법을 제공하는 데 있다.
[과제의 해결수단]
상기 목적을 달성하기 위하여, 본 발명은 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질을 포함하는 난소암의 진단용 바이오마커 또는 이의 조합을 제공한다:
본 발명은 또한, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 또는 이를 코딩하는 유전자 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 조성물을 제공한다.
본 발명은 또한, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 또는 이를 코딩하는 유전자 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 키트를 제공한다.
본 발명은 또한, 다음 단계를 포함하는 난소암의 진단방법 또는 진단을 위한 정보제공방법을 제공한다:
(a) 대상으로부터 분리된 시료로부터, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 단계;
(b) 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 대조군과 비교하는 단계.
본 발명은 또한, 다음 단계를 포함하는 난소암의 예방 또는 치료용 약물을 스크리닝하는 방법을 제공한다:
(a) 대상으로부터 분리한 시료 또는 암 질환 동물 모델에 후보 약제를 처리하는 단계; 및
(b) 상기 후보 약제가 처리된 시료 또는 암 질환 동물 모델에서 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 단계.
도 1은 중간값 기반으로 정규화(Median centering normalization)된 혈장 단백질의 양과 피크 범위(peak area)를 분석한 결과이다.
도 2는 3개의 그룹(정상, 1-2기, 3-4기)의 전체 혈장 단백질체에서 분석된 차등 발현 단백질(Differential expressed proteins)의 수를 나타낸 것이다. 밴다이어그램에서, 초록색은 정상 및 1-2기 난소암 환자, 파란색은 정상 및 3-4기 난소암 환자, 분홍색은 1-2기 및 3-4기 난소암 환자간의 차등 발현 단백질을 나타낸 것이다.
도 3은 초기 난소암환자(1-2기, 3a) 또는 전체 난소암 환자(3b)의 진단을 위한 최적의 마커 단백질 후보 선별을 위해 수행한 기능 선택 프로세스(Feature selection process) 결과를 나타낸 것이다. Probavility가 0.50 미만의 마커는 조합에서 제외하였다.
도 4는 정상 대조군과 1-2기 난소암 환자에서 7개 혈장 단백질 수준을 비교한 박스 플롯이다.
도 5는 정상 대조군과 전체 난소암 환자에서 7개 혈장 단백질 수준을 비교한 박스 플롯이다.
도 6은 3개의 단백질 마커에 대해 난소암 환자군 (병기 1-2기)의 진단 검증을 위한 랜덤 포레스트 모델의 훈련 정보를 개략적으로 나타낸 것이다.
도 7은 3개의 단백질 마커에 대해 난소암 환자군 (병기 1-2기)의 진단 검증을 위한 서포트 벡터 머신 모델의 훈련 정보를 개략적으로 나타낸 것이다.
도 8은 초기 난소암 예측 모델의 3개의 단백질 패널을 포함하는 랜덤 포레스트 분석 모델을 이용하여 정상군과 난소암 환자(1, 2기)의 훈련세트와 검증세트에서의 ROC 분석 결과이다.
도 9는 초기 난소암 예측 모델의 3개의 단백질 패널을 포함하는 서프트 벡터 머신(SVM) 분석 모델을 이용하여 정상군과 난소암 환자(1, 2기)의 훈련세트와 검증세트에서의 ROC 분석 결과이다.
도 10은 초기 난소암 예측 모델의 3개의 단백질(a: APOL1, b: SERPINA5, C: MBL2)을 각각 독립적으로 사용하여 난소암을 진단하는 경우의 ROC 분석 결과이다.
도 11은 7개의 단백질 마커에 대해 난소암 환자군(전체 병기)의 진단 검증을 위한 랜덤 포레스트 모델의 훈련 정보를 개략적으로 나타낸 것이다.
도 12는 3개의 단백질 마커에 대해 난소암 환자군(전체 병기)의 진단 검증을 위한 서포트 벡터 머신 모델의 훈련 정보를 개략적으로 나타낸 것이다.
도 13은 난소암 예측 모델의 7개의 단백질 패널을 포함하는 랜덤 포레스트 분석 모델을 이용하여 정상군과 난소암 환자(1, 2, 3, 4기)의 훈련세트와 검증세트에서의 ROC analysis 분석 결과이다.
도 14는 난소암 예측 모델의 7개의 단백질 패널을 포함하는 서포트 벡터 머신 분석 모델을 이용하여 정상군과 난소암 환자(1, 2, 3, 4기)의 훈련세트와 검증세트에서의 ROC 분석 결과이다.
도 15는 난소암 예측 모델의 7개의 단백질(a: APOL1, b: SERPINA5, c: MBL2, d: ECM1, e: SERPINA7, f: CPN2, g: ADIPOQ)을 각각 독립적으로 사용하여 난소암을 진단하는 경우의 ROC 분석 결과이다.
[발명을 실시하기 위한 구체적인 내용]
다른 식으로 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술분야에서 숙련된 전문가에 의해서 통상적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로 본 명세서에서 사용된 명명법은 본 기술분야에서 잘 알려져 있고 통상적으로 사용되는 것이다.
본 명세서에 기재된 농도 범위에 있어서, “내지”는 양 임계 범위를 포함(이상 및 이하)하는 의미로 사용되었으며, 양 임계 범위를 포함하지 않는 경우 “초과” 및 “미만”으로 농도 범위를 기재하였다. 본 명세서에서 수치에 사용된 “약”은 통상의 기술자에 의해 기재된 수치와 실질적으로 동등한 효과를 나타낼 수 있을 것으로 기대되는 범위를 포함하는 의미로 사용되며, 예를 들어, 기재된 수치 값의 ±20%, ±10%, ±5% 등일 수 있으나, 이에 제한되는 것은 아니다.
난소암은 약 1~2%의 여성에게 발병하는 것과 대비하여, 암으로 사망하는 여성환자의 47%가 난소암으로 다른 여성암보다 현저하게 높은 치사율을 나타내고, 난소암으로 확진된 난소암 환자의 5년 생존률 또한 50% 미만으로 매우 낮다. 낮은 치사율의 원인은 난소암의 경우 증상의 발현시 대부분 전이단계에 있는 경우가 많으며, 진단되는 시기 이미 상당히 진행되어 있기 때문이다.
따라서, 난소암의 생존률 및 치료 가능성을 높이는 가장 유효한 전략은 난소암의 조기진단에 있으나, 현재 임상적으로 사용되는 난소암의 진단은 초음파 또는 촉지를 통한 물리적 검사방법을 통해 종양을 확인한 뒤, 조직검사 또는 혈액검사(CA-125 등)를 통해 악성 여부를 판단하며, 현재로서는 가장 일찍 난소암을 발견할 수 있는 방법이다. 혈액 검사를 통한 난소암의 진단은 조직검사 등에 비해 비침습적이고 환자의 부담을 줄이는 특성이 있다. 그러나, RMI법(RMI I, II, III), ROMA, CPH-1, Ova1 등의 현재 승인된 혈액 검사법은 독립적인 진단방법이 아닌 종괴가 발견된 환자로부터, 악성여부를 선별하기 위한 것이 대부분이며, 그 민감도 및 특이도가 낮고, 나이 또는 폐경기와 같은 혈액 바이오마커 외의 다른 요소를 포함하여, 특정 조건의 환자에게만 적용이 가능하다는 단점이 있다.
본 발명의 일 실시예에서는, 혈장 샘플을 대상으로 QTOF LC-MS 기반의 정량적 혈장 단백질체 분석기법인 SWATH(Sequential Window Acquisition of all Theoretical Mass Spectra)을 사용하여, 정상대조군과 난소암 환자의 혈장 단백질을 정량적으로 분석하였다. 정상대조군과 난소암 환자에서 유의미한 수준 차이를 확인 하였으며, 약 133개의 후보 단백질 중 난소암 환자의 진단을 위한 바이오마커 후보군(MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ)을 도출하였다.
본 발명의 다른 실시예에서는, 도출된 바이오마커 후보군의 조합을 사용하여 랜덤 포레스트 모델 및 서포트 벡터 머신 등의 다양한 예측 통계 모델로 정량된 바이오마커를 평가하는 경우에, 기존에 보고된 난소암 환자의 진단방법과 비교하여 현저히 높은 민감도와 특이도로 난소암 환자를 진단할 수 있음을 확인 하였으며, 특히, MBL2, APOL1, 및 SERPINA5 중 둘 이상의 조합이 1기 및 2기의 초기 난소암 환자를 매우 높은 민감도와 특이도로 진단할 수 있음을 확인하였다.
따라서, 본 발명은 일 관점에서, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ 중 둘 이상의 단백질을 포함하는 난소암의 진단용 바이오마커 조합에 관한 것이다.
본 발명에 있어서, 바람직하게는 MBL2, APOL1 및 SERPINA5 중 둘 이상의 단백질을 포함하는 것을 특징으로 할 수 있으며, 더욱 바람직하게는 MBL2, APOL1 및 SERPINA5 단백질을 포함하는 것을 특징으로 할 수 있다.
본 발명에 있어서, MBL2, APOL1 및 SERPINA5 단백질과 함께, SERPINA7, ECM1, CPN2 및 ADIPOQ 중 어느 하나 이상의 단백질을 추가로 포함하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 개시된 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ 중 둘 이상의 단백질외에도 종래 난소암 마커로 공지된 다양한 혈장 바이오마커와 조합하여 구성되는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 난소암은 1기 및 2기의 난소암인 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.
본 발명은 다른 관점에서, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ 중 둘 이상의 단백질의 조합의 난소암의 진단용도에 관한 것이다.
본 발명은 다른 관점에서, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 조성물에 관한 것이다.
본 발명에 있어서, 상기 난소암의 진단용 조성물은 MBL2, APOL1 및 SERPINA5의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 난소암의 진단용 조성물은 바람직하게는 MBL2 및 APOL1, MBL2 및 SERPINA5, 또는 APOL1 및 SERPINA5, 가장 바람직하게는 MBL2, APOL1 및 SERPINA5의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함할 수 있으며, 이 때, 상기 난소암의 진단은 1기 및/또는 2기 난소암의 진단인 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 난소암의 진단용 조성물은 MBL2, APOL1 및 SERPINA5의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제와 함께, SERPINA7, ECM1, CPN2 및 ADIPOQ 중 어느 하나 이상의 단백질수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 난소암의 진단용 조성물은, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 난소암의 진단용 조성물은 상기 개시된 본 발명의 난소암 진단용 바이오마커 단백질 외에도, 종래 난소암 마커로 공지된 다양한 혈장 바이오마커 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 추가로 포함하는 것을 특징으로 할 수 있다.
본 발명의 용어. “MBL2(mannose binding lectin 2)”는 Mannose binding protein C(MBP-C)등 으로도 명칭된다. MBL2는 혈장에 존재할 수 있으며, 박테리아, 효모, 바이러스를 포함하는 만흔 미생물에서 만노스 및 N-아세틸 글루코사민을 인식하고 결합하여 보체 경로를 활성화한다. 본 발명에 있어서, 대표적인 인간 MBL2의 서열은 서열번호 1(UniProtKB - P11226)과 같으나, 이에 제한되는 것은 아니며, 서열번호 1과 실질적으로 상동성이 있는 것으로 판단되는 펩티드 서열을 포함하는 단백질 또는 이의 돌연변이를 포함한다. 예를 들어, 서열번호 1과 약 80% 이상의 상동성, 바람직하게는 85% 이상의 상동성, 더욱 바람직하게는 90% 이상의 상동성, 더욱 바람직하게는 95% 이상의 상동성, 더욱 바람직하게는 97% 이상의 상동성, 가장 바람직하게는 99% 이상의 상동성을 갖는 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.
본 발명의 용어. “APOL1(Apolipoprotein L1)”은 일반적으로 HDL에 포함된 아포지단백 성분으로 혈액을 통해 순환하며 염증반응에 관여하고, 특히, APOL1은 리소좀 팽윤 및 용해를 유도하여 autophagy를 유도하는 것으로 보고된다. APOL1은 수면병, 신장 질환, FSGS와 같은 질환과 연관된 것으로 알려져 있다. 본 발명에 있어서, 대표적인 인간 APOL1의 서열은 서열번호 2(UniProtKB - O14791)과 같으나, 이에 제한되는 것은 아니며, 서열번호 2와 실질적으로 상동성이 있는 것으로 판단되는 펩티드 서열을 포함하는 단백질 또는 이의 돌연변이를 포함한다. 예를 들어, 서열번호 1과 약 80% 이상의 상동성, 바람직하게는 85% 이상의 상동성, 더욱 바람직하게는 90% 이상의 상동성, 더욱 바람직하게는 95% 이상의 상동성, 더욱 바람직하게는 97% 이상의 상동성, 가장 바람직하게는 99% 이상의 상동성을 갖는 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.
본 발명의 용어, “SERPINA 5(Serpin Family A Member 5)”는 혈장 세린 프로테아제 억제제(plasma serine protease inhibitor) 또는 단백질 C 억제제(Protein C inhibitor, PCI)으로도 명칭된다. SERPINA5는 단백질 C의 활성을 억제하며, 특히 남성 종양인 전립선 암의 혈장 바이오마커로 알려진 단백질이다. 대표적인 인간 SERPINA5의 서열은 서열번호 3(UniProtKB: P05154)과 같으나, 이에 제한되는 것은 아니며, 서열번호 3과 실질적으로 상동성이 있는 것으로 판단되는 펩티드 서열을 포함하는 단백질 또는 이의 돌연변이를 포함한다. 예를 들어, 서열번호 3과 약 80% 이상의 상동성, 바람직하게는 85% 이상의 상동성, 더욱 바람직하게는 90% 이상의 상동성, 더욱 바람직하게는 95% 이상의 상동성, 더욱 바람직하게는 97% 이상의 상동성, 가장 바람직하게는 99% 이상의 상동성을 갖는 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.
본 발명의 용어, “SERPINA7(Serpin Family A Member 7)”는 티록신 결합 글로불린(Thyroxine binding globulin, TBG)으로도 명칭된다. SERPINA7는 갑상선 호르몬과 결합가능한 혈장 수송 단백질로 보고된다. 대표적인 인간 SERPINA7의 서열은 서열번호 4(UniProtKB: P05543)과 같으나, 이에 제한되는 것은 아니며, 서열번호 4와 실질적으로 상동성이 있는 것으로 판단되는 펩티드 서열을 포함하는 단백질 또는 이의 돌연변이를 포함한다. 예를 들어, 서열번호 4와 약 80% 이상의 상동성, 바람직하게는 85% 이상의 상동성, 더욱 바람직하게는 90% 이상의 상동성, 더욱 바람직하게는 95% 이상의 상동성, 더욱 바람직하게는 97% 이상의 상동성, 가장 바람직하게는 99% 이상의 상동성을 갖는 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.
본 발명의 용어, “ECM1(Extracellular matrix protein 1)”은 세포 증식, 혈관 신생 및 분화 기능을 갖는 것으로 알려진 분비성 당단백질이며, 유방암, 갑상선암, 간세포암 등의 암종에서 종양의 발달 촉진과 관련이 있는 것으로 알려져 있다(Atlas of Genetics and Cytogenetics in Oncology and Haematology). 대표적인 인간 ECM1의 서열은 서열번호 5(UniProtKB: Q16610)와 같으나, 이에 제한되는 것은 아니며, 서열번호 5와 실질적으로 상동성이 있는 것으로 판단되는 펩티드 서열을 포함하는 단백질 또는 이의 돌연변이를 포함한다. 예를 들어, 서열번호 5와 약 80% 이상의 상동성, 바람직하게는 85% 이상의 상동성, 더욱 바람직하게는 90% 이상의 상동성, 더욱 바람직하게는 95% 이상의 상동성, 더욱 바람직하게는 97% 이상의 상동성, 가장 바람직하게는 99% 이상의 상동성을 갖는 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.
본 발명의 용어, “CPN2(Carboxypeptidase N Subunit 2)”는 인간 혈장 단백질로 촉매 서브유닛에 결합 및 안정화하는 것으로 알려져 있다. CPN2는 또한, 간암 조직에서 발현이 향상되는 것으로 보고된다(The Human protein atlas). 대표적인 인간 CPN2의 서열은 서열번호 6(UniProtKB: P22792)과 같으나, 이에 제한되는 것은 아니며, 서열번호 6과 실질적으로 상동성이 있는 것으로 판단되는 펩티드 서열을 포함하는 단백질 또는 이의 돌연변이를 포함한다. 예를 들어, 서열번호 6과 약 80% 이상의 상동성, 바람직하게는 85% 이상의 상동성, 더욱 바람직하게는 90% 이상의 상동성, 더욱 바람직하게는 95% 이상의 상동성, 더욱 바람직하게는 97% 이상의 상동성, 가장 바람직하게는 99% 이상의 상동성을 갖는 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.
본 발명의 용어, “ADIPOQ(adiponectin)”는 GBP-28, apM1, 및 Acrp30 등으로도 명칭된다. ADIPOQ는 포도당 조절 및 지방산 산화 등의 대사과정을 조절하는 단백질 호르몬으로, 혈장에 매우 풍부하게 존재한다. ADIPOQ의 변이는 유방암과 연관되는 것으로 보고된다(Cancers 2021, 13(10), 2261). 대표적인 인간 ADIPOQ의 서열은 서열번호 7(UniProtKB: Q15848)과 같으나, 이에 제한되는 것은 아니며, 서열번호 7과 실질적으로 상동성이 있는 것으로 판단되는 펩티드 서열을 포함하는 단백질 또는 이의 돌연변이를 포함한다. 예를 들어, 서열번호 7과 약 80% 이상의 상동성, 바람직하게는 85% 이상의 상동성, 더욱 바람직하게는 90% 이상의 상동성, 더욱 바람직하게는 95% 이상의 상동성, 더욱 바람직하게는 97% 이상의 상동성, 가장 바람직하게는 99% 이상의 상동성을 갖는 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 “진단”은 특정 질병 또는 질환에 대한 대상(subject)의 상태를 정확하게 파악하는 것을 의미한다. 예를 들어, 특정 질병 또는 질환에 대한 대상의 상태는 특정 질병 또는 질환에 대한 감수성(susceptibility), 현재 대상이 앓고 있는 질환의 판정뿐만 아니라, 대상의 예후(prognosis), 암 상태의 동정, 암의 단계 결정 또는 치료에 대한 암의 감수성 및 반응성에 대한 예측과 같은 질환의 특성에 대한 확인, 특정 약물의 치료 효을 확인하기 위해 대상의 상태를 확인하는 것과 같이 환자의 질병 및 상태에 따른 적절한 처치의 근거를 얻는 것, 나아가 특정 질병 또는 질환으로부터 완치된 대상에서의 재발여부의 예측 및 확인을 포함하는 광의의 의미로 사용된다. 본 발명에 있어서, 바람직하게는, 상기 진단은 질환의 발병 여부 또는 발병 가능성을 확인하는 것이다.
본 발명에 있어서, 용어 "예후"는 의학적 귀추(예컨대, 장기 생존 가능성, 무병생존율 등)에 대한 예상을 의미하며, 양성적 예후(긍정적 예후) 또는 음성적 예후(부정적 예후)를 포함하며, 상기 음성적 예후는 재발, 종양 성장, 전이, 약 저항성 등의 병의 진행 또는 치명성(mortality)을 포함하고, 양성적 예후는 질병이 없는 상태 등의 질병의 차도, 종양 퇴행 등의 질병의 개선 또는 안정화(stabilization)를 포함한다.
본 발명에 있어서, 용어 "예측"은 의학적 귀추에 대하여 미리 헤아려 짐작하는 것을 의미하며, 본 발명의 목적상 난소암으로 진단받은 환자의 병의 경과(병의 진행, 개선, 위암의 재발, 종양 성장, 약 저항성)를 미리 짐작하는 것을 의미한다.
본 발명에 있어서, 상기 진단의 대상 질병 또는 질환은 난소암인 것을 특징으로 할 수 있다. 상기 난소암은 난소 또는 난소의 주변기관에서 발생하는 악성종양, 즉 암을 의미한다. 구체적인 예로, 상기 난소암은 난소에서의 상피세포암, 배세포종양, 및 성삭 기질 종양을 포함하며, 더욱 구체적인 예로, 장액성 난소암(Serous carcinoma), 점액성 난소암(Mucinous carcinoma), 자궁내막양 난소암(Endometroid carcinoma), 투명세포암(Clear cell carcinoma), 브레너 종양(Malignant brenner tumor), 미분화세포암(Undifferentiated carcinoma), 미분류 난소암(Unclassified Carcinoma)을 포함하나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 난소암은 병기에 따라 구분될 수 있으며, 구체적으로는 1기 내지 4기의 난소암으로 구분될 수 있으며, 1기 및 2기를 초기(early stage)로, 3기 및 4기를 진행된 병기(advanced stage)로 분류한다(FIGO 분류 기준).
본 발명의 용어, 난소암의 병기는 아래의 기준에 따라 분류될 수 있다(TNM 및 FIGO 분류 기준, 2019, 비뇨생식기영상진단 부인과영상, 비뇨생식기영상의학회):
본 발명의 난소암 진단용 조성물은 1기 내지 4기의 전체 난소암을 진단하는데 사용되는 것을 특징으로 할 수 있으며, 바람직하게는 1기 내지 2기의 초기 난소암을 진단하는데 사용될 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 단백질 수준을 측정할 수 있는 제제는 예를 들어, 본 발명의 각 난소암 진단용 바이오마커 단백질에 특이적으로 결합하는 항체, 올리고펩타이드, 리간드, PNA(peptide nucleic acid) 및 앱타머(aptamer) 중 어느 하나 이상일 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 항체는 다클론 항체, 단클론 항체 및 재조합 항체 등의 "항체"를 모두 포함하며 항체란 항원성 부위에 대해서 지시되는 특이적인 단백질 분자를 의미한다. 다클론 항체는 본 발명의 난소용 진단용 바이오마커 단백질을 항원으로 동물에 주사하고 동물로부터 채혈하여 항체를 포함하는 혈청을 수득하는 당업계에 널리 공지된 방법에 의해 생산할 수 있다. 이러한 다클론 항체는 염소, 토끼, 양, 원숭이, 말, 돼지, 쥐, 랫트(rat), 소, 개 등의 임의의 동물 종 숙주로부터 제조 가능하다. 단클론 항체는 당업계에 널리 공지된 하이브리도마 방법(Kohler 및 Milstein (1976) European Jounral of Immunology 6:511-519 참조), 또는 파지 항체 라이브러리(Clackson et al, Nature, 352:624-628, 1991; Marks et al, J. Mol. Biol., 222:58, 1-597, 1991) 기술을 이용하여 제조될 수 있다. 상기 방법으로 제조된 항체는 겔 전기영동, 투석, 염 침전, 이온교환 크로마토그래피, 친화성 크로마토그래피 등의 방법을 이용하여 분리, 정제할 수 있다. 또한 본 발명의 항체는 2개의 전체 길이의 경쇄 및 2개의 전체 길이의 중쇄를 가지는 완전한 형태뿐만 아니라, 항체 분자의 기능적인 단편을 포함한다. 항체 분자의 기능적인 단편이란 적어도 항원 결합 기능을 보유하고 있는 단편을 뜻하며, Fab, F(ab'), F(ab') 2 및 Fv 등이 있다.
이러한 항체에는 일반적으로 알칼라인 포스파타제(alkaline phosphatase, AP) 또는 홀스래디쉬 퍼록시다제 (horseradish peroxidase, HRP) 등의 효소가 컨쥬게이션된 2차 항체 및 이들의 기질을 사용하여 발색반응시킴으로써 정량분석하거나, 직접 상기 단백질 모노클로날 항체에 AP 또는 HRP 효소 등이 컨쥬게이션된 것을 사용하여 정량분석할 수도 있다.
본 발명에 있어서, 상기 “PNA(Peptide Nucleic Acid)”는 인공 합성된 DNA 또는 RNA와 유사한 중합체로, 펩타이드 결합에 의해 연결된 N-(2-aminoethyl)-glycine 골격을 갖는다. PNA는 DNA 또는 RNA에 대한 결합력과 안정성이 향상되어, 진단 분석에 사용된다.
본 발명에 있어서, 상기 “앱타머(aptamer)”는 올리고 핵산 또는 펩타이드 분자로, 표적에 특이적으로 결합하는 것을 특징으로 할 수 있다. 본 발명에 있어서, 상기 압타머는 본 발명의 난소암 진단용 바이오마커 단백질 중 어느 하나 이상에 특이적으로 결합하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 유전자의 발현 수준을 측정할 수 있는 제제는 각 단백질을 코딩하는 유전자에 특이적으로 결합하는 프라이머, 프로브 및 안티센스 뉴클레오티드로 구성된 군에서 선택되는 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.
본 발명에서 용어, "프라이머"는 짧은 자유 3 말단 수산화기(free 3` hydroxyl group)을 가지는 핵산 서열로 상보적인 주형(template)와 염기쌍(base pair)을 형성할 수 있고 주형의 복사를 위한 시작지점으로는 기능을 하는 짧은 핵산 서열을 의미한다. 본 발명에서는 본 발명 마커 폴리뉴클레오티드의 센스 및 안티센스 프라이머를 이용하여 PCR 증폭을 실시하여 원하는 생성물의 생성 여부를 통해 위암의 예후를 예측할 수 있다. PCR 조건, 센스 및 안티센스 프라이머의 길이는 당업계에 공지된 것을 기초로 변형할 수 있다.
본 발명의 "프로브"란 mRNA와 특이적 결합을 이룰 수 있는 짧게는 수 염기 내지 길게는 수백 염기에 해당하는 RNA 또는 DNA 등의 핵산 단편을 의미하며, 라벨링되어 있어서 특정 mRNA의 존재 유무를 확인할 수 있다. 프로브는 올리고뉴클레오티드 프로브, 단쇄 DNA(single straned DNA) 프로브, 이중쇄 DNA (double stranded DNA) 프로브, RNA 프로브 등의 형태로 제작될 수 있다.
본 발명에 있어서, 상기 단백질 수준의 측정은 본 발명의 질환을 진단하기 위하여 생물학적 시료에서 본 발명의 난소암 진단용 마커인 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 단백질의 존재 여부와 발현 정도를 확인하는 것을 의미한다.
본 발명에 있어서, 단백질의 수준 측정 또는 비교 분석 방법으로는 웨스턴 블랏(western blotting), ELISA(enzyme linked immunosorbent assay), 방사선면역분석법(Radioimmunoassay), 방사면역확산법(Radioimmunodiffusion), 오우크레로니 (Ouchterlony) 면역 확산법, 로케트(Rocket) 면역전기영동, 조직면역 염색, 면역침전분석법(immunoprecipitation assay), 보체 고정 분석법(complete fixation assay), FACS, 단백질 칩(protein chip), 및 질량 분석법(mass spectrometry) 등이 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 질량 분석법(Mass spectrometry)은 이온화 방법에 따라, 예를 들어 FAB, CI, APCI, ESI, DESI, MALDI, SELDI, ICP, DESI, SESI, LAESI, FD, FAB, DIOS, DART, SIMS, TIMS 등으로, 질량 선택방법에 따라, 4극 질량 필터(qaudrupole mass filter), 이온 포집(ion trap), 전자증배관(electron multiplier) 등으로, 분리 기술과의 조합에 따라, 기체 크로마토그래피(Gas chromatography, GS), 액체 크로마토그래피(liquid chromatography, LC) 등으로 구분될 수 있으며, 질량 분석법으로 도출된 데이터는 SIM, TIC, SRM 과 같은 방법으로 표시될 수 있고, 각 분류는 조합되어 명명된다. 구체적인 예를 들어, MALDI-TOF(Matrix Assisted Laser Desorption/Ionization Time of Flight Mass Spectrometry) 분석, SELDITOF(Sulface Enhanced Laser Desorption/Ionization Time of Flight Mass Spectrometry) 분석, 액상 크로마토그래피-질량분석(liquid chromatography-Mass Spectrometry, LC-MS), LCMS/MS(liquid chromatography-Mass Spectrometry/ Mass Spectrometry) 등이 있으나, 이에 제한되는 것은 아니다.
본 발명은 또 다른 관점에서, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 키트에 관한 것이다.
본 발명에 있어서, 상기 난소암의 진단용 키트는 MBL2, APOL1 및 SERPINA5의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 난소암의 진단용 키트는 바람직하게는 MBL2 및 APOL1, MBL2 및 SERPINA5, 또는 APOL1 및 SERPINA5, 가장 바람직하게는 MBL2, APOL1 및 SERPINA5의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함할 수 있으며, 이 때, 상기 난소암의 진단은 1기 및/또는 2기 난소암의 진단인 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 난소암의 진단용 키트는 MBL2, APOL1 및 SERPINA5의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제와 함께, SERPINA7, ECM1, CPN2 및 ADIPOQ 중 어느 하나 이상의 단백질수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 난소암의 진단용 키트는 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 난소암의 진단용 키트는 상기 개시된 본 발명의 난소암 진단용 바이오마커 단백질 외에도, 종래 난소암 마커로 공지된 다양한 혈장 바이오마커 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 추가로 포함하는 것을 특징으로 할 수 있다.
본 발명의 관점에서, 설명되지 않은 용어의 정의 및 구현예들은 별도로 기재되지 않는 한 상기 난소암의 진단용 조성물의 관점에 기재된 것과 동일한 특징을 공유할 수 있다.
본 발명에 있어서, 상기 난소암 진단용 키트는 본 발명의 난소암 진단용 조성물을 포함하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 난소암 진단용 키트는 분석 방법에 적합한 한 종류 또는 그 이상의 다른 구성 성분 조성물, 용액 또는 장치를 포함할 수 있다. 예를 들어, RT-PCR 키트, DNA 칩 키트, 단백질 칩 키트, 래피드(rapid) 키트, 또는 SRM(selected reaction monitoring)/MRM(Multiple reaction monitoring) 키트일 수 있다.
상기 RT-PCR 키트는 마커 유전자에 대한 특이적인 각각의 프라이머 쌍 외에도 테스트 튜브 또는 다른 적절한 컨테이너, 반응 완충액, 데옥시뉴클레오타이드(dNTPs), Taq-폴리머라아제 및 역전사 효소와 같은 효소, DNase, RNase 억제제, DEPC-수, 멸균수 등을 포함할 수 있다. 또한, 정량 대조구로 사용되는 유전자에 특이적인 프라이머 쌍을 포함할 수 있다. DNA 칩 키트는 유전자 또는 그의 단편에 해당하는 cDNA가 프로브로 부착되어 있는 기판을 포함하고, 기판은 정량구조 유전자 또는 그의 단편에 해당하는 cDNA를 포함할 수 있다.
또한, 본 발명에 따른 키트는 상기 단백질 수준을 측정하는 제재를 포함하는 진단 키트일 수 있으며, 이때 상기 단백질 수준을 측정하는 제제는 바람직하게는 상기 단백질에 특이적인 항체일 수 있다. 따라서, 상기 단백질 수준을 측정하는 제제를 포함하는 진단 키트는, 예컨대, ELISA를 수행하기 위해 필요한 필수요소를 포함하는 진단 마커 검출용 키트일 수 있으며, 이러한 키트는 "항원-항체 복합체"를 형성한 항체를 검출할 수 있는 시약, 예컨대, 표지된 2차 항체, 발색단 (chromophores), 효소(예: 항체와 접합) 및 그의 기질 등을 포함할 수도 있다. 또한, 정량 대조군 단백질에 특이적인 항체를 포함할 수 있다.
아울러, 상기 항원-항체 복합체의 형성량은 검출 라벨(detection label)의 시그널의 크기를 통해서 정량적으로 측정할 수 있다. 이러한 검출 라벨은 효소, 형광물, 리간드, 발광물, 미소입자(microparticle), 레독스 분자 및 방사선 동위원소로 이루어진 그룹 중에서 선택할 수 있으며, 반드시 이로 제한되는 것은 아니다.
상기 SRM(selected reaction monitoring)은 MRM(Multiple reaction monitoring)으로도 명명되며, 탠덤 질량 분광법(Tandem mass spectrometry)에 사용되는 방법으로, 표적 정량 단백질체 분석에 사용된다. 표적 정량 단백질체 분석에 사용되는 SRM은 Nature Methods. 9 (6): 555-566에 상세히 기재되어 있다.
본 발명은 또 다른 관점에서, (a) 대상으로부터 분리된 시료로부터, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 단계;
(b) 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 대조군과 비교하는 단계를 포함하는 난소암의 진단방법 및/또는 진단을 위한 정보제공 방법에 관한 것이다.
본 발명에 있어서, 상기 대상은 인간을 포함하는 동물인 것을 특징으로 할 수 있으며, 바람직하게는 포유동물, 더욱 바람직하게는 인간인 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 시료는 난소암을 진단하고자 하는 대상으로부터 분리된 고형 또는 비고형 시료일 수 있으며, 예를 들어, 대상으로부터 분리된 기관, 조직, 세포 또는 대상으로부터 수득한 전혈(whole blood), 백혈구(leukocytes), 말초혈액 단핵 세포(peripheral blood mononuclear cells), 백혈구 연층(buffy coat), 혈장(plasma), 혈청(serum), 객담(sputum), 눈물 (tears), 점액(mucus), 세비액(nasal washes), 비강 흡인물(nasal aspirate), 호흡(breath), 소변(urine), 정액(semen), 침(saliva), 복강 세척액(peritoneal washings), 복수(ascites), 낭종액(cystic fluid), 뇌척수막액(meningeal fluid), 양수(amniotic fluid), 선액(glandular fluid), 췌장액(pancreatic fluid), 림프액 (lymph fluid), 흉수(pleural fluid), 유두 흡인물(nipple aspirate), 기관지 흡인물(bronchial aspirate), 활액(synovial fluid), 관절 흡인물(joint aspirate), 기관 분비물(organ secretions), 세포(cell), 세포 추출물(cell extract) 또는 뇌척수액(cerebrospinal fluid)일 수 있으나 이에 제한되는 것은 아니다.
본 발명의 일 실시예에서는, 혈장 단백질 수준을 기반으로 높은 민감도와 특이도를 갖는 난소암 진단용 바이오마커 및 이의 조합을 개발하였으며, 따라서 본 발명에 있어서, 상기 시료는 가장 바람직하게는 대상으로부터 수득한 전혈, 혈장 또는 혈청일 수 있다.
본 발명의 바이오마커는 혈장에 매우 낮은 농도로 존재하는 단백질이기 때문에, 민감도와 정확도를 높이기 위해 환자로부터 수득한 시료를 전처리하였다.
따라서, 본 발명에 있어서, 상기 (a) 단계 전에 대상으로부터 분리된 시료를 전처리하는 단계를 추가로 포함하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 대상으로부터 분리된 시료를 전처리하는 단계는 시료에 풍부하게 존재하는 단백질을 제거하는 단계를 포함하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 시료에 풍부하게 존재하는 단백질은 시료에
본 발명에 있어서, 상기 대상으로부터 분리된 시료가, 전혈, 혈장, 또는 혈청과 같은 혈액 기반의 시료인 경우, 상기 시료에 풍부하게 존재하는 단백질은 예를 들어, albumin, IgA, IgG, IgM, α1-antitrypsin, α1-acid glycoprotein, apolipoprotein A1, apolipoprotein A2, complement C3, transferrin, α2-macroglobulin, transthyretin, haptoglobin 및 fibrinogen 등이 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 전처리 단계는 시료로부터 albumin, IgA, IgG, IgM, α1-antitrypsin, α1-acid glycoprotein, apolipoprotein A1, apolipoprotein A2, complement C3, transferrin, α2-macroglobulin, transthyretin, haptoglobin 및 fibrinogen으로 구성된 군에서 선택되는 어느 하나 이상을 제거하는 단계를 포함하는 것을 특징으로 할 수 있다.
바람직한 예로서, 본 발명의 일 실시예에서는 상기 단백질을 제거하기 위해 고성능 액체 크로마토 그래피에 연결된 고농도 혈장 단백질 제거 컬럼 MARS14을 사용하였으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 대상으로부터 분리된 시료를 전처리하는 단계는 시료에 포함된 단백질을 짧은 펩타이드로 절단하는 단계를 포함하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 시료에 포함된 단백질을 짧은 펩타이드로 절단하는 단계는 당업계에 공지된 다양한 방법을 통해 수행될 수 있다. 본 발명의 일 실시예에서는 트립신/라이스씨 혼합물 사용한 suspension trap 방법으로 대상으로부터 분리된 시료를 전처리하여 짧은 펩타이드로 절단하였으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 (a) 단계는 단백질 수준을 측정하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 단백질 수준의 측정은 본 발명의 질환을 진단하기 위하여 생물학적 시료에서 본 발명의 난소암 진단용 마커인 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 단백질의 존재 여부와 발현 정도를 확인하는 것일 수 있다.
본 발명에 있어서, 상기 (a) 단계의 단백질의 수준 측정방법은 웨스턴 블랏(western blotting), ELISA(enzyme linked immunosorbent assay), 방사선면역분석법(Radioimmunoassay), 방사면역확산법(Radioimmunodiffusion), 오우크레로니 (Ouchterlony) 면역 확산법, 로케트(Rocket) 면역전기영동, 조직면역 염색, 면역침전분석법(immunoprecipitation assay), 보체 고정 분석법(complete fixation assay), FACS, 단백질 칩(protein chip), 및 질량 분석법(mass spectrometry) 등이 있으나, 이에 제한되는 것은 아니며, 단백질의 수준, 바람직하게는 혈장 단백질 수준을 측정할 수 있는 공지된 방법이라면 모두 사용될 수 있다.
본 발명에 있어서, 상기 (a) 단계의 단백질 수준 또는 유전자의 발현 수준은 당업계에 공지된 절대적 정량 방법 또는 상대적 정량 방법에 의해 수행되는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 (a) 단계는 바람직하게는 질량 분석법에 의해 수행되는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 질량 분석법(Mass spectrometry)은 이온화 방법에 따라, 예를 들어 FAB, CI, APCI, ESI, DESI, MALDI, SELDI, ICP, DESI, SESI, LAESI, FD, FAB, DIOS, DART, SIMS, TIMS 등으로, 질량 선택방법에 따라, 4극 질량 필터(qaudrupole mass filter), 이온 포집(ion trap), 전자증배관(electron multiplier) 등으로, 분리 기술과의 조합에 따라, 기체 크로마토그래피(Gas chromatography, GS), 액체 크로마토그래피(liquid chromatography, LC) 등으로 구분될 수 있으며, 질량 분석법으로 도출된 데이터는 SIM, TIC, SRM 과 같은 방법으로 표시될 수 있고, 각 분류는 조합되어 명명될 수 있다. 구체적인 예를 들어, 상기 질량 분석법은 MALDI-TOF(Matrix Assisted Laser Desorption/Ionization Time of Flight Mass Spectrometry) 분석, SELDITOF(Sulface Enhanced Laser Desorption/Ionization Time of Flight Mass Spectrometry) 분석, 액상 크로마토그래피-질량분석(liquid chromatography-Mass Spectrometry, LC-MS), 또는 LCMS/MS(liquid chromatography-Mass Spectrometry/ Mass Spectrometry) 등 일 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, 상기 질량 분석법에 의해 단백질 수준을 측정하는 경우, 바이오마커에 특이적으로 결합하는 항체, 압타머 등을 개발하거나, 고가의 항체/압타머를 구매하지 않아도 수준의 측정이 가능하다.
특히, 본 발명의 일 실시예에서와 같이, 본 발명의 난소암 진단을 위한 바이오마커를 사용하는 경우 질량 분석법에 기반하여 단백질 수준을 측정하더라도 높은 민감도와 정확도로 난소암, 바람직하게는 초기 난소암을 진단할 수 있는 것을 특징으로 한다.
본 발명에 있어서, 질량 분석법을 기반으로 단백질 수준을 측정하는 방법의 예로서, 표지를 사용한 정량 분석법 또는 비표지 정량 분석법을 제한 없이 사용할 수 있다.
본 발명에 있어서, 상기 표지를 사용한 정량 분석법은 단백질에 검출 신호를 나타내는 물질(예, 형광체 또는 방사선동위원소)등을 사용하여 수행되는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 비표지 정량 분석법은 예를 들어, 본 발명의 실시예에서 수행된 SWATH MS 분석이 있으나, 이에 제한되는 것은 아니다.본 발명에 있어서, 상기 (a) 단계는 바람직하게는 Sequential Window Acquisition of all Theoretical (SWATH) 질량 분석을 통해 수행되는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 (a) 단계는 MBL2, APOL1 및 SERPINA5 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 (a) 단계는 바람직하게는 MBL2 및 APOL1, MBL2 및 SERPINA5, 또는 APOL1 및 SERPINA5, 가장 바람직하게는 MBL2, APOL1 및 SERPINA5의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 것을 특징으로 할 수 있으며, 이 때, 상기 난소암의 진단은 1기 및/또는 2기 난소암의 진단인 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 (a) 단계는 MBL2, APOL1 및 SERPINA5와 함께, SERPINA7, ECM1, CPN2 및 ADIPOQ 중 어느 하나 이상의 단백질수준 또는 이를 코딩하는 유전자의 발현 수준을 추가로 측정하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 (a) 단계는 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 난소암의 진단용 조성물은 상기 개시된 본 발명의 난소암 진단용 바이오마커 단백질 외에도, 종래 난소암 마커로 공지된 다양한 혈장 바이오마커 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 (a) 단계는 단백질수준 또는 이를 코딩하는 유전자의 발현수준을 절대적 정량법에 의해 측정하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 (a) 단계는 단백질수준 또는 이를 코딩하는 유전자의 발현수준을 대조군과 대비하여, 상대적 정량법에 의해 측정하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 (b) 단계의 대조군은 난소암을 앓지 않는 대상으로부터 분리된 시료의 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준인 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 (b) 단계의 대조군은 직접적인 측정에 의해 제공될 수 있으며, 또는 기존에 측정되어 제공된 기준값인 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 (a) 단계의 단백질수준 또는 이를 코딩하는 유전자의 발현수준의 측정이 상대적 정량법에 의해 수행되는 경우, 상기 (b) 단계가 상대적 정량 결과에 의해 자동적으로 수행되는 것을 특징으로 할 수 있다.
본 발명의 일 실시예에서, 각 단계(stage)의 2 그룹의 난소암 환자(group 1: 1-2기, group 2: 3-4기) 및 정상 비교군을 각각 비교한 정량적 혈장 단백질체 분석에서, 유의미한 수준의 차이를 나타내는 총 31개의 DEP(differential expressed protein)를 확인하였다. 3 그룹 공통적인 DEP는 Alpolipoprotein L1이었으며 10개의 단백질은 대조군과 난소암 1-2기군, 대조군과 난소암 3-4기군의 공통된 DEP로 타났다. 또한 7개의 단백질들은 대조군과 난소암 1-2기군, 난소암 1-2기군과 난소암 3-4기군간의 공통된 DEP로 나타났다. 특히, 본 발명의 난소암 진단용 바이오마커 중 APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ는 전체 난소암 환자에서 감소하고, MBL2는 증가하는 것으로 나타났다. 특히 1-2기 난소암 환자의 경우, 정상 대조군은 물론, 3-4기 난소암 환자와 비교하는 경우에도 APOL1 및 SERPINA5는 현저한 감소가 나타났으며, MBL2는 현저히 증가하는 것으로 확인되었다.
따라서, 본 발명에 있어서, (C) 다음 중 어느 하나 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준 변화가 검출되는 경우, 대상이 난소암을 앓을 가능성이 있는 것으로 확인하는 단계를 추가로 포함하는 것을 특징으로 할 수 있다.
i) MBL2 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 증가;
ii) APOL1 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소;
iii) SERPINA5 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소;
iv) SERPINA7 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소;
v) ECM1 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소;
vi) CPN2 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소; 및
vii) ADIPOQ 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소.
본 발명에 있어서, 상기 i) MBL2 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 증가는 예를 들어, 대조군 대비 약 1.1배 이상, 바람직하게는 약 1.2배 이상, 더욱 바람직하게는 약 1.3배 이상, 더욱 바람직하게는 약 1.4배 이상, 더욱 바람직하게는 약 1.5배 이상, 가장 바람직하게는 약 1.53배 이상 증가되는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 ii) APOL1 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소는 예를 들어, 대조군 대비 약 0.01배 내지 약 0.9배, 더욱 바람직하게는 약 0.1배 내지 약 0.85배, 더욱 바람직하게는 약 0.4배 내지 약 0.8배, 가장 바람직하게는 약 0.7 내지 약 0.8배 감소되는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 iii) SERPINA5 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소는 예를 들어, 대조군 대비 약 0.01배 내지 약 0.9배, 더욱 바람직하게는 약 0.1배 내지 약 0.85배, 더욱 바람직하게는 약 0.4배 내지 약 0.8배, 가장 바람직하게는 약 0.7 내지 약 0.8배 감소되는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 iv) SERPINA7 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소는 예를 들어, 대조군 대비 약 0.01배 내지 약 0.95배, 더욱 바람직하게는 약 0.1배 내지 약 0.9배, 더욱 바람직하게는 약 0.5배 내지 약 0.9배, 가장 바람직하게는 0.8배 내지 0.9배 감소되는 것을 특징으로 할 수 있다.
본 발명에 있어서, v) ECM1 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소는 예를 들어, 대조군 대비 약 0.01배 내지 약 0.95배, 더욱 바람직하게는 약 0.1배 내지 약 0.9배, 더욱 바람직하게는 약 0.5배 내지 약 0.9배, 가장 바람직하게는 0.7배 내지 0.9배 감소되는 것을 특징으로 할 수 있다.
본 발명에 있어서, vi) CPN2 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소는 예를 들어, 대조군 대비 약 0.01배 내지 약 0.95배, 더욱 바람직하게는 약 0.1배 내지 약 0.9배, 더욱 바람직하게는 약 0.5배 내지 약 0.9배, 가장 바람직하게는 0.8배 내지 0.9배 감소되는 것을 특징으로 할 수 있다.
본 발명에 있어서, vii) ADIPOQ 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소는 예를 들어, 대조군 대비 약 0.01배 내지 약 0.95배, 더욱 바람직하게는 약 0.1배 내지 약 0.9배, 더욱 바람직하게는 약 0.5배 내지 약 0.9배, 가장 바람직하게는 0.8배 내지 0.9배 감소되는 것을 특징으로 할 수 있다.
본 발명에 있어서, (C) 다음의 단백질 또는 이를 코딩하는 유전자의 수준 변화가 검출되는 경우, 대상이 제1기 또는 제2기 난소암을 앓을 가능성이 있는 것으로 확인하는 단계를 추가로 포함하는 것을 특징으로 할 수 있다.
i) MBL2 단백질 또는 이를 코딩하는 유전자의 수준 증가;
ii) APOL1 단백질 또는 이를 코딩하는 유전자의 수준 감소; 및
iii) SERPINA5 단백질 또는 이를 코딩하는 유전자의 수준 감소.
본 발명에 있어서, 상기 i) MBL2 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 증가는 예를 들어, 대조군 대비 약 1.1배 이상, 바람직하게는 약 1.2배 이상, 더욱 바람직하게는 약 1.4배 이상, 더욱 바람직하게는 약 1.5배 이상, 더욱 바람직하게는 약 1.6배 이상, 가장 바람직하게는 약 1.7배 이상 증가되는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 ii) APOL1 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소는 예를 들어, 대조군 대비 약 0.01배 내지 약 0.9배, 더욱 바람직하게는 약 0.1배 내지 약 0.85배, 더욱 바람직하게는 약 0.4배 내지 약 0.8배, 가장 바람직하게는 약 0.6 내지 약 0.7배 감소되는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 iii) SERPINA5 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소는 예를 들어, 대조군 대비 약 0.01배 내지 약 0.9배, 더욱 바람직하게는 약 0.1배 내지 약 0.85배, 더욱 바람직하게는 약 0.4배 내지 약 0.8배, 가장 바람직하게는 약 0.6 내지 약 0.7배 감소되는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기한 각 단백질 수준 및/또는 이를 코딩하는 유전자의 발현수준의 증가 또는 감소의 예는 본 발명의 실시예에서 113명의 인간 대상에서 확인하고 검증된 값을 기반으로 도출된 것이며, 개별 대상마다 수준의 감소 또는 증가는 상이할 수 있음은 통상의 기술자에게 자명하게 이해될 수 있다.
따라서, 본 발명에 있어서 난소암의 정확한 진단 또는 진단을 위한 정보의 제공을 위해, 상기 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준의 변화(증가 또는 감소)를 해석하는 단계를 추가로 포함할 수 있다.
본 발명에 있어서, 상기 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준의 변화(증가 또는 감소)를 해석하는 단계는 각 바이오마커의 중요도 등에 기초하여 스코어링 알고리즘에 의해 해석하는 것을 특징으로 할 수 있다.
본 발명에 있어서, 상기 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준의 변화를 해석하는 단계는 예측 또는 분류 모형에 의해 해석되는 것을 특징으로 할 수 있다. 본 발명에 있어서, 상기 예측 또는 분류 모형은 공지된 데이터 분석방법으로 학습된 것을 특징으로 할 수 있다. 예를 들어, 상기 예측 또는 분류 모형은 선형 회귀(Linear Regression), 로지스틱 회귀(Logistic Regression), 능선 회귀(Ridge Regression), 라쏘 회귀(Lasso Regression), 잭나이프 회귀(Jackknife Regression), 의사결정 트리(Decision Tree), 랜덤 포레스트(Random Forest), K-평균 클러스터링(K-means Clustering), 교차검증(Cross-Validation), 인공신경망(Artificial neural network), 앙상블 러닝(Ensemble Learning), 나이브 베이즈 분류(Naive Bayesian Classifier), 협업 필터링(Collaborative filtering), 주성분 분석(Principal Component Analysis; PCA) 및 서포트 벡터 머신(Support Vector Machine; SVM) 등의 방법으로 학습된 것, 바람직하게는 랜덤 포레스트 또는 서포트 벡터 머신으로 학습된 것일 수 있으나, 이에 제한되는 것은 아니다. 본 발명에 있어서, 상기 예측 또는 분류 모형은 공지된 모형 이외에도 통상의 기술자가 본 발명의 실시예를 기반으로 난소암의 진단을 위해 새롭게 설계한 지도 또는 비지도 알고리즘에 의해 학습된 것일 수 있다.
본 발명의 일 실시예에서는, 본 발명의 바이오마커의 수준 변화를 랜덤 포레스트 또는 서포트 벡터 머신 방법 기반의 예측 또는 분류 모델을 사용하였으며, 두 방법으로 훈련된 예측 또는 분류 모델 모두에서 현저히 높은 민감도와 특이도로 전체 난소암 및 1-2기 난소암 환자를 진단할 수 있음을 입증하였다.
본 발명의 난소암 진단용 바이오마커 단백질은 대상이 난소암을 앓고 있는지 여부를 진단하는 데 사용될 수 있으며, 이를 기반으로, 이미 난소암으로 확진된 환자에게서 난소암의 개선 또는 치료 여부에도 사용할 수 있음은 통상의 기술자에게 자명하다.
따라서, 본 발명은 또 다른 관점에서, (a) 대상으로부터 분리한 시료 또는 암 질환 동물 모델에 후보 약제를 처리하는 단계; 및
(b) 상기 후보 약제가 처리된 시료 또는 암 질환 동물 모델에서 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 단계를 포함하는, 난소암의 예방 또는 치료용 약물을 스크리닝하는 방법에 관한 것이다.
본 발명의 난소암의 예방 또는 치료용 약물을 스크리닝하는 방법은 상기한 난소암의 진단 및/또는 진단을 위한 정보제공방법에서 기재된 것과 동일한 특징을 갖는 것을 특징으로 할 수 있다.
실시예
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지 않는 것은 당업계에서 통상의 지식을 가진 자에 있어서 자명할 것이다.
실시예 1: 혈액시료의 준비
난소암 진단마커 바이오마커의 개발을 위해, 정상군 및 난소암 환자를 모집하여 혈장 시료를 채집하였다. 실험에 참여한 대상자는 총 113명으로 각 그룹별 대상군의 수, 평균 나이 및 병기는 하기 표 1과 같다. 정상군 및 난소암 환자의 혈장 샘플은 연세대학교 강남세브란스병원에서 제공받았다.
실시예 2: 정략적 혈장 단백질체 분석
혈장 샘플로부터 난소암 및 초기 진단 마커를 선별하기 위해, 혈장 단백질을 정량적으로 분석하였다. 총 113명의 혈장 샘플로부터 혈장 단백질을 정량적으로 분석하기 위해서 사중극자 비행시간 (Quadrupole Time of Flight) 질량분석기 (Mass spectrometry) 기반의 정량적 혈장 단백체 분석기법인 SWATH (Sequential Window Acquisition of all Theoretical Mass Spectra)를 이용하였다. 혼합된 시료를 이용하여 DPHL: A pan-human protein mass spectrometry library (참조 논문: https://pubmed.ncbi.nlm.nih.gov/32795611/)(스펙트럼 라이브러리)이용하여, 40μL의 적은 양의 혈액 시료를 절단된 펩티드로 전처리하여 LC/MS SWATH 분석을 통해 혈장 단백질을 정량분석 하였다.
113개의 혈장 샘플들을 SWATH 분석에 적용하기 전에 재현성있는 분석을 위해 고성능 액체 크로마토그래피 (High-performance liquid chromatography, HPLC)에 연결한 고농도 혈장 단백질 제거 컬럼 MARS14 컬럼 (100 x 4.6 mm; Agilent Technology, Palo Alto, CA, USA)을 이용하여 저농도 단백질을 분리하고 이를 자동화된 액체 분주 시스템 (Bravo Automated Liquid Handling Platform - Agilent사)를 이용하여 펩티드를 제조하는 전처리 과정을 수행하였다. 펩티드 제조 후 NanoDrop으로 정량 한 값을 기반으로 서로 다른 113개의 시료를 동일양으로 SWATH-MS 분석하였다.
보다 구체적으로, 40 μL의 혈장을 MARS14 컬럼에 주입하여 상위 14 개의 풍부한 단백질 (albumin, IgA, IgG, IgM, α1-antitrypsin, α1-acid glycoprotein, apolipoprotein A1, apolipoprotein A2, complement C3, transferrin, α2-macroglobulin, transthyretin, haptoglobin and fibrinogen)을 제거하였다. 이를 위해 혼합물을 Agilent사의 buffer A (부품번호: 5185-5987)로 4 배 희석하고 Shimadzu HPLC LC20AT 시스템의 MARS14 컬럼에 로드하였다. 결합되지 않은 저농도 혈장 단백질의 분획을 동결건조한 후에 재흡수하여 Suspension trap 방법으로 펩티드로 제조하였다. 자세히 설명하면, 5%SDS (50mM TEAB) 버퍼로 재흡수하여10 mM이 되도록 1,4-디티오트레이톨 (1,4-Dithiothreitol)을 첨가하고 95℃에서 10분 동안 반응시켜 이황화결합을 환원시켰다. 그 후, 알킬화를 위해 20 mM이 되도록 아이오도아세트아미드 (iodoacetamide)를 첨가하여 암조건하에 실온에서 30분 동안 반응시키고, 6μg의 트립신/라이스씨 혼합물로 37도에서 18시간동안 분해시켰다. 펩티드를 융출하여 콜드 트랩 (CentriVap Cold Traps, LABCONCO)으로 동결 건조하고 사용할 때까지 영하 80도에서 보관하였다. 액체 크로마토 그래피-탠덤 질량 분석법 (LC-MS/MS) 분석 전에 건조된 펩티드 샘플을 버퍼 A (0.1 % formic acid in HPLC water)으로 녹이고 총 펩티드 농도를 UV/Vis 분광 광도계 (NanoDrop One, Thermo Fisher Scientific)로 흡광도를 측정하였다. 파장 280 nm, 샘플 유형 옵션이 "1 Abs = 1 mg/mL"로 설정되었다. 그런 다음 iRT-Kit (Biognosys AG, Schlieren, Switzerland)에서 제공하는 iRT 표준을 1/10 부피로 샘플에 추가하여 공급 업체 지침 (참고논문: https://pubmed.ncbi.nlm.nih.gov/22577012/)에 따라 머무름 시간을 보정하였다. 각 샘플의 총량은 40μg이며 40μL에 용해하였다. 주입된 4 μL의 샘플은 다음 LC-MS/MS 설정과 함께 SCIEX TripleTOF 5600+ 시스템 질량 분석기를 사용하여 분석되하였다. LC 분리를 위해 nanoLC 425 (Eksigent, Dublin, CA, USA)를 Eksigent 마이크로 트랩 C18컬럼 (ChromXP C18CL, 5 μm, 120 Å)과 분석 컬럼으로서 Eksigent 컬럼 (C18-CL, 0.3 x 150 mm, 입자 크기 3 μm, 기공 크기 120 Å)을 함께 컬럼 온도가 40℃로 유지되도록 하였다. 샘플을 버퍼 A를 사용하여 10μL/min의 유속으로 트랩 컬럼에 로드하였다. 10분 후, 펩티드 혼합물은 버퍼 A와 버퍼 B (0.1 % formic acid in HPLC acetonitrile)을 사용하여 57 분에 의해 5μL/분으로 유속으로 농도구배를 통한 분리를 수행하였다. 버퍼 B를 38분 동안 3-25% 변경하고, 5분 동안 25-32% 변경하고, 2분 동안 32-80% 변경하고, 3분 동안, 80%로 유지하고, 3분 동안 80-3% 변경하고, 8분 동안 3%로 유지하였다. 개별 샘플의 경우 모든 질량 분석 실행은 SCIEX 기술 노트에 따라 100개의 가변 창을 사용하여 모든 이론적 질량 스펙트럼 (SWATH) 모드의 순차 창 수집에서 작동되었다. SWATH 매개 변수는 다음과 같이 설정되었다: Lower m/z limit 400; m/z 상한선 1250; 윈도우 오버랩 (Da) 1.0; CES는 작은 창에 대해 5, 큰 창에 대해 8, 가장 큰 창에 대해 10. MS2 스펙트럼은 고감도 모드에서 2.5ms 동안 100-1500m/z 범위에서 수집되었으며 총 사이클 시간은 2.8초였다. 다른 MS 파라미터는 다음과 같이 설정되었다: 이온 소스 가스 1 (GS1) 15 psi; 이온 소스 가스 2 (GS2) 20 psi; 커튼 가스 (CUR) 30 psi; 온도 (TEM) 250 ℃; 이온 스프레이 전압 부동 (ISVF) 5500V.
펩티드로 제조된 혈장 단백질 시료 113개를 LC-MS로 분석함에 있어서 분석 간 Batch별 bias를 최소화하기 위해 무작위로 혼합하여 순차적으로 SWATH LC-MS 분석을 5일간에 걸쳐 수행하였다. 113개의 시료에 대해 SWATH LC-MS 분석을 수행하여 113개의 스펙트럼(spectrum) 결과를 획득하였다. 해당 결과 스펙트럼(spectrum)들을 DIA-NN software와 Pan-human proteome library를 이용하여 정성적으로 단백체 분석을 수행하였으며 113개 시료로부터 총 831개의 단백질들을 정성/정량 분석할 수 있었다. 도 1에 나타난 바와 같이, 정상군과 난소암 환자군에서의 총 113개의 시료별로 중간값 기반의 정규화된 단백질들의 양 정보를 로그 스케일(Log scale)로 분석한 결과 재현성을 보이는 것을 확인하였다. 또한, 2개 그룹의 113개의 혈장 시료 들에서 80% 이상 검출되면서 MARS-14 high abundant protein depletion에 관련되지 않은 단백질 총 133개 단백질들의 정량 정보를 이용하여 통계분석을 수행하였다.
각 병기(stage)의 2 그룹의 난소암 환자(group 1: 1-2기, group 2: 3-4기) 및 정상 비교군을 각각 비교한 정량적 혈장 단백질체 분석결과, 유의미한 수준의 차이를 나타내는 총 31개의 DEP(differential expressed protein)를 확인하였다. 3 그룹 공통적인 DEP는 Alpolipoprotein L1이었으며 10개의 단백질은 대조군과 난소암 1-2기군, 대조군과 난소암 3-4기군의 공통된 DEP로 타났다. 또한 7개의 단백질들은 대조군과 난소암 1-2기군, 난소암 1-2기군과 난소암 3-4기군간의 공통된 DEP로 나타났다. 특히, 본 발명의 난소암 진단용 바이오마커 중 APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ는 전체 난소암 환자에서 감소하고, MBL2는 증가하는 것으로 나타났다. 특히 1-2기 난소암 환자의 경우, 정상 대조군은 물론, 3-4기 난소암 환자와 비교하는 경우에도 APOL1 및 SERPINA5는 현저한 감소가 나타났으며, MBL2는 현저히 증가하는 것으로 확인되었다(도 2).
그룹의 난소암 환자(group 1: 1-2기, group 2: 3-4기) 및 정상 비교군에서 검출된 전체 혈장 단백질체를 기반으로 기능 선택 프로세스(Feature selection process)를 수행하여, 각 병기의 난소암환자를 도출하기 위한 최적의 마커 단백질 후보를 선별하였다. 1-2기 그룹의 경우 4개의 단백질(도 3a), 전체 병기의 경우 10개의 단백질이 후보로 도출되었으나(도 3b), 검출의 민감도와 정확도를 향상시키기 위해 Probability가 0.5 미만인 바이오마커 후보를 제외하여 1-2기 난소암 환자의 진단을 위한 3종 바이오마커 및 전체 난소암 환자의 진단을 위한 상기 3종 바이오마커를 포함하는 7종의 혈장 바이오마커를 선별하였다.
이하 설명될 본 발명의 난소암 진단용 바이오마커 7종의 정상군 대비 발현 수준의 변화는 아래 표 2 및 도 4, 도 5와 같다. 표 2 및 도 4-5에서 도시된 것과 같이 선별된 7종의 바이오마커는 정상 대조군과 대비하여, 1-2기 난소암 환자 또는 전체 난소암 환자에서 현저한 수준의 차이를 나타낸다.
실시예 3: 혈장 단백질 데이터를 이용한 모델 구축 및 검증
실시예 2에서 수집된 정상군 및 난소암 환자의 혈장 단백체의 정량 정보를 이용하여 초기 난소암 질병 예측 및 난소암 질병 예측을 할 수 있는 모델을 구축하였다. 첫째 세트로 초기 난소암 질병 예측에는 30명의 정상군 포함 난소암 83명의 환자 중에 병기가 1-2기인 환자 39명을 대상으로 질병예측 모델을 생성하였다. 두번째 세트로 난소암 질병 모델 예측에는 30명의 정상군과 83명의 난소암 전체 환자를 대상으로 포함하였다. 133개의 단백질 중에 바이오마커로 사용될 변수선택 (Feature selection)을 위해서 두 개의 세트에 동일하게 의사 결정 나무 구조 (Determination tree structure)를 이용하여 단백질 정량정보를 변수로 하고 특징적인 변수를 선택하는 단계에서 모델 자체에 변수 선택이 포함된 임베디드 방법 (Embedded method)을 적용하였다. 무작위 숲 알고리즘 (Random forest algorythme, RF)을 이용하여 10,000개의 의사결정 나무 형성하여 각 나무의 AUC결과 값을 기준으로 예측력이 높은 변수를 1차로 선정하였다. 이를 10-fold 교차검증을 3번 반복하여 선정된 변수의 확률 값이 50%이상인 변수를 최종 선정하였다 (표 3). 위의 과정을 통해서 초기 난소암 예측 세트에서의 결과 선정된 3개의 단백질 패널을 이용하여 전체 시료를 그룹별로 3 등분을 하고 이중 2/3의 정보를 이용하여 모델을 구성하는 훈련 세트 (training set)로 사용하고 나머지 1/3의 정보는 모델의 완성도를 검증하는 검증 세트 (test set)로 구성하였다 (표 4). 예측 통계 모델은 무작위 숲 알고리즘과 서포트 벡터 머신(Support vector machine, SVM)을 2가지를 사용하였다. 난소암 예측 세트에는 7개의 단백질 패널을 (표 5) 이용하여 위의 3배 교차검증으로 시료를 구성하여 SVM, RF모델을 생성 및 검증하였다 (표 6).
초기 난소암 진단 예측은 상기 3개의 단백질 (APOL1, SERPINA5, MBL2) 패널로 구성된 모델을 이용하여 정상군과 난소암 환자군 (병기 1-2기)을 구분할 수 있는지를 검증하였다. 검증은 랜덤 포레스트 모델(Random Forest model, RF model) 및 서포트 벡터 머신 모델(Support Vector Machine model, SVM model)을 이용하였다. 3개의 단백질 마커를 사용한 난소암 환자군 (병기 1-2기)의 진단 검증을 위한 각 모델의 훈련은 각각 도 6 및 도 7과 같다.
랜덤 포레스트 모델을 응용한 훈련세트와 검증세트의 임상적 유용성을 나타내는 수신동작특성(ROC, receiver operating characteristics)의 곡면하면적 (Area under curve, AUC)은 1.0 (훈련 세트), 0.886 (검증 세트)로 매우 우수하게 나타났다. 검증 세트를 기준으로 임상절단 값을 유덴지수 (Youden index)인 0.5284로 설정하면, 특이도는 83.33%이고 민감도가 90.90%인 것으로 나타났다(도 8). 한편, 서포트 벡터 머신 모델을 응용한 결과는 수신동작특성의 곡면하면적은 0.857 (훈련 세트), 0.939 (검증 세트)이며, 검증 세트를 기준으로 임상절단 값을 유덴지수 (Youden index)인 0.6852로 설정하면, 특이도는 100%이고 민감도가 90.90%인 것으로 나타났다 (도 9). 이는 각각의 바이오마커를 독립적으로 이용하여 초기 난소암을 진단하는 경우의 곡면하면적(AUC) 값보다 현저히 뛰어나, 본 발명의 초기 난소암 진단 방법이 현저히 우수한 진단 정확도를 나타냄을 의미한다(도 10).
7개의 단백질 마커를 사용한 난소암 환자군(전체 병기)의 진단 검증을 위한 각 모델의 훈련은 각각 도 11 및 도 12와 같다.
난소암 진단 예측은 상기 7개의 단백질 (MBL2, APOL1, SERPINA7, ECM1, SERPINA5, CPN2, ADIPOQ) 패널로 구성된 모델을 이용하여 정상군과 전체 난소암 환자군 (병기 1-4기)을 구분할 수 있는지를 검증하였다. 랜덤 포레스트 모델을 응용한 훈련세트와 검증세트의 임상적 유용성을 나타내는 수신동작특성(ROC, receiver operating characteristics)의 곡면하면적 (Area under curve, AUC)은 1.0 (훈련 세트), 0.881 (검증 세트)로 매우 우수하게 나타났다. 검증 세트를 기준으로 임상절단 값을 유덴지수 (Youden index)인 0.6289로 설정하면, 특이도는 90.0%이고 민감도가 77.77%인 것으로 나타났다 (도 13). 한편, 서포트 벡터 머신 모델을 응용한 결과는 수신동작특성의 곡면하면적은 0.858 (훈련 세트), 0.800 (검증 세트)이며, 검증 세트를 기준으로 임상절단 값을 유덴지수 (Youden index)인 0.666로 설정하면, 특이도는 80.0%이고 민감도가 74.07%인 것으로 나타났다 (도 14). 전체 난소암의 진단을 위한 7종 바이오마커 또한 각각의 바이오마커를 독립적으로 이용하여 초기 난소암을 진단하는 경우의 곡면하면적(AUC) 값보다 현저히 뛰어나, 본 발명의 초기 난소암 진단 방법이 현저히 우수한 진단 정확도를 나타냄을 확인하였다(도 15a 내지 15g).
본 발명의 바이오마커 및 이의 조합은 종래 보고된 난소암 바이오마커 보다 현저히 뛰어난 민감도와 특이도로 난소암을 진단할 수 있으며, 특히, 1기 및/또는 2기 난소암의 검출이 가능하여 난소암의 조기 진단이 가능하다. 나아가, 본 발명의 바이오마커는 혈장 단백질 수준을 기반으로 진단이 가능하며, 극소량의 혈액에서도 민감도와 특이도가 뛰어나, 조직 검사를 수반하는 다른 난소암 진단방법에 비해 그 절차가 간단하며, 환자의 고통과 부담을 현저하게 줄일 수 있다. 본 발명의 난소암 바이오마커는 종래 보고된 난소암 바이오마커와 상이하여 기존의 바이오마커와 함께 또는 이를 대체하여 사용할 수 있다는 장점이 있으며, 약물 투여 후 치료효과에 대한 마커로도 사용할 수 있어, 환자에 대한 난소암의 임상적 치료제 스크리닝에 있어서도 매우 유용하게 사용될 수 있다.
이상으로 본 발명 내용의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적 기술은 단지 바람직한 실시 양태일 뿐이며, 이에 의해 본 발명의 범위가 제한되는 것이 아닌 점은 명백할 것이다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항들과 그것들의 등가물에 의하여 정의된다고 할 것이다.
Claims (21)
- MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 조성물.
- 제1항에 있어서, MBL2, APOL1 및 SERPINA5 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 조성물.
- 제2항에 있어서, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 어느 하나 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 추가로 포함하는 난소암의 진단용 조성물.
- 제1항에 있어서, 상기 단백질 수준을 측정할 수 있는 제제는 각 단백질에 특이적으로 결합하는 항체, 올리고펩타이드, 리간드, PNA(peptide nucleic acid) 및 앱타머(aptamer)로 구성된 군에서 선택되는 것을 특징으로 하는 난소암의 진단용 조성물.
- 제1항에 있어서, 상기 유전자의 발현 수준을 측정할 수 있는 제제는 각 단백질을 코딩하는 유전자에 특이적으로 결합하는 프라이머, 프로브 및 안티센스 뉴클레오티드로 구성된 군에서 선택되는 것을 특징으로 하는 난소암의 진단용 조성물.
- MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 키트.
- 제6항에 있어서, MBL2, APOL1 및 SERPINA5 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 키트.
- 제7항에 있어서, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 어느 하나 이상의 단백질 수준 또는 이를 코딩하는 유전자 발현 수준을 측정할 수 있는 제제를 추가로 포함하는 난소암의 진단용 키트.
- 제6항에 있어서, 상기 단백질 수준을 측정할 수 있는 제제는 각 단백질에 특이적으로 결합하는 항체, 올리고펩타이드, 리간드, PNA(peptide nucleic acid) 및 앱타머(aptamer)로 구성된 군에서 선택되는 것을 특징으로 하는 난소암의 진단용 키트.
- 제6항에 있어서, 상기 유전자의 발현 수준을 측정할 수 있는 제제는 각 단백질을 코딩하는 유전자에 특이적으로 결합하는 프라이머, 프로브 및 안티센스 뉴클레오티드로 구성된 군에서 선택되는 것을 특징으로 하는 난소암의 진단용 키트.
- (a) 대상으로부터 분리된 시료로부터, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 단계;(b) 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 대조군과 비교하는 단계를 포함하는 난소암의 진단방법.
- 제11항에 있어서, 상기 (a) 단계 이전에, 다음의 단계를 통해 대상으로 분리된 시료를 전처리하는 단계를 추가로 포함하는 것을 특징으로 하는 난소암의 진단 방법:i) 시료로부터 albumin, IgA, IgG, IgM, α1-antitrypsin, α1-acid glycoprotein, apolipoprotein A1, apolipoprotein A2, complement C3, transferrin, α2-macroglobulin, transthyretin, haptoglobin 및 fibrinogen으로 구성된 군에서 선택되는 어느 하나 이상을 제거하는 단계; 및ii) 시료에 포함된 단백질을 짧은 펩타이드로 절단하는 단계.
- 제11항에 있어서, 상기 (a) 단계의 시료는 혈액, 혈청 또는 혈장인 것을 특징으로 하는 난소암의 진단방법.
- 제11항에 있어서, 상기 (a) 단계는 질량 분석법(mass spectrometry)을 통해 단백질 수준을 측정하는 것을 특징으로 하는 난소암의 진단방법.
- 제14항에 있어서, 상기 질량 분석법(mass spectrometry)은 Sequential Window Acquisition of all Theoretical (SWATH) 질량 분석인 것을 특징으로 하는 난소암의 진단방법.
- 제11항에 있어서, 상기 (a) 단계는 MBL2, APOL1 및 SERPINA5 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 것을 특징으로 하는 난소암의 진단 방법.
- 제11항에 있어서, 상기 (a) 단계는 SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 어느 하나 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 추가로 측정하는 것을 특징으로 하는 난소암의 진단방법.
- 제11항에 있어서, 상기 난소암은 1기 또는 2기 난소암인 것을 특징으로 하는 난소암의 진단방법.
- 제11항에 있어서,(C) 다음 중 어느 하나 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준 변화가 검출되는 경우, 난소암의 발병 가능성이 있는 것으로 확인하는 단계를 추가로 포함하는 난소암의 진단방법:i) MBL2 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 증가;ii) APOL1 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소;iii) SERPINA5 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소;iv) SERPINA7 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소;v) ECM1 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소;vi) CPN2 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소; 및vii) ADIPOQ 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소.
- 제11항에 있어서,(C) 다음의 단백질 또는 이를 코딩하는 유전자의 수준 변화가 검출되는 경우, 제1기 또는 제2기 난소암의 발병 가능성이 있는 것으로 확인하는 단계를 포함하는 난소암의 진단방법:i) MBL2 단백질 또는 이를 코딩하는 유전자의 수준 증가;ii) APOL1 단백질 또는 이를 코딩하는 유전자의 수준 감소; 및iii) SERPINA5 단백질 또는 이를 코딩하는 유전자의 수준 감소.
- (a) 대상으로부터 분리한 시료 또는 암 질환 동물 모델에 후보 약제를 처리하는 단계; 및(b) 상기 후보 약제가 처리된 시료 또는 암 질환 동물 모델에서 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 단계를 포함하는, 난소암의 예방 또는 치료용 약물을 스크리닝하는 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210079315A KR102402428B1 (ko) | 2021-06-18 | 2021-06-18 | 난소암 진단용 다중 바이오 마커 및 이의 용도 |
KR10-2021-0079315 | 2021-06-18 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2022265392A1 true WO2022265392A1 (ko) | 2022-12-22 |
Family
ID=81787225
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2022/008478 WO2022265392A1 (ko) | 2021-06-18 | 2022-06-15 | 난소암 진단용 다중 바이오 마커 및 이의 용도 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR102402428B1 (ko) |
WO (1) | WO2022265392A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102402428B1 (ko) * | 2021-06-18 | 2022-05-31 | 주식회사 레지온 | 난소암 진단용 다중 바이오 마커 및 이의 용도 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8221984B2 (en) * | 2007-03-27 | 2012-07-17 | Vermillion, Inc. | Biomarkers for ovarian cancer |
KR20150050776A (ko) * | 2013-10-31 | 2015-05-11 | 안국약품 주식회사 | 난소암 진단용 바이오마커 조합 |
WO2019209888A1 (en) * | 2018-04-23 | 2019-10-31 | Seer, Inc. | Systems and methods for complex biomolecule sampling and biomarker discovery |
KR20200057652A (ko) * | 2018-11-16 | 2020-05-26 | 가톨릭대학교 산학협력단 | 유전성 난소암 발병 예측용 바이오마커 및 이의 용도 |
KR102402428B1 (ko) * | 2021-06-18 | 2022-05-31 | 주식회사 레지온 | 난소암 진단용 다중 바이오 마커 및 이의 용도 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE602004022632D1 (de) * | 2003-01-09 | 2009-10-01 | Beth Israel Hospital | Verwendung von adiponectin zur diagnose von krebs |
KR101628035B1 (ko) * | 2013-09-13 | 2016-06-09 | 인제대학교 산학협력단 | Vsig4를 이용한 난소암 치료제 스크리닝 방법 |
-
2021
- 2021-06-18 KR KR1020210079315A patent/KR102402428B1/ko active IP Right Grant
-
2022
- 2022-06-15 WO PCT/KR2022/008478 patent/WO2022265392A1/ko active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8221984B2 (en) * | 2007-03-27 | 2012-07-17 | Vermillion, Inc. | Biomarkers for ovarian cancer |
KR20150050776A (ko) * | 2013-10-31 | 2015-05-11 | 안국약품 주식회사 | 난소암 진단용 바이오마커 조합 |
WO2019209888A1 (en) * | 2018-04-23 | 2019-10-31 | Seer, Inc. | Systems and methods for complex biomolecule sampling and biomarker discovery |
KR20200057652A (ko) * | 2018-11-16 | 2020-05-26 | 가톨릭대학교 산학협력단 | 유전성 난소암 발병 예측용 바이오마커 및 이의 용도 |
KR102402428B1 (ko) * | 2021-06-18 | 2022-05-31 | 주식회사 레지온 | 난소암 진단용 다중 바이오 마커 및 이의 용도 |
Non-Patent Citations (1)
Title |
---|
CHENG YUSHAN, LIU CHONGDONG, ZHANG NAWEI, WANG SHENGDIAN, ZHANG ZHENYU: "Proteomics Analysis for Finding Serum Markers of Ovarian Cancer", BIOMED RESEARCH INTERNATIONAL, HINDAWI PUBLISHING CORPORATION, vol. 2014, 1 January 2014 (2014-01-01), pages 1 - 9, XP093015363, ISSN: 2314-6133, DOI: 10.1155/2014/179040 * |
Also Published As
Publication number | Publication date |
---|---|
KR102402428B1 (ko) | 2022-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8911951B2 (en) | Plasma kallikrein fragments as diagnostic biomarkers for lung cancers | |
US10345309B2 (en) | Biomarkers for gastric cancer and uses thereof | |
US8741587B2 (en) | ARMET as a marker for cancer | |
US8273539B2 (en) | Extracellular and membrane-associated prostate cancer markers | |
US20070053896A1 (en) | Diagnostic marker for ovarian cancer | |
US20190170769A1 (en) | Methods and compositions for detecting endometrial or ovarian cancer | |
WO2014148780A1 (ko) | 간암 진단용 바이오 마커 | |
WO2021006649A1 (ko) | 췌장암 진단용 바이오마커 패널 및 그 용도 | |
EP4045912A1 (en) | Apparatuses and methods for detection of pancreatic cancer | |
WO2022265392A1 (ko) | 난소암 진단용 다중 바이오 마커 및 이의 용도 | |
WO2016093567A1 (ko) | 간암 진단용 바이오마커 및 그 용도 | |
CN113652488B (zh) | Ctsf在非小细胞肺癌脑转移疗效评价中的应用 | |
KR102000387B1 (ko) | 췌관내유두상점액종양의 악성도를 감별할 수 있는 단백질 바이오마커 및 그 용도 | |
KR102091747B1 (ko) | 유방암 진단용 바이오마커 및 이의 용도 | |
WO2023191543A1 (ko) | 암의 진단용 조성물 | |
WO2021145479A1 (ko) | 암의 진단용 조성물 | |
WO2021172923A1 (ko) | 암의 진단용 조성물 | |
WO2021137553A1 (ko) | 임신중독증 진단용 바이오마커 조성물 및 이의 용도 | |
WO2021172926A1 (ko) | 암의 진단용 조성물 | |
KR20110129508A (ko) | 폐암 바이오마커 | |
KR20240054700A (ko) | 간암 진단용 바이오마커 및 간암 진단에 대한 인공지능 기반 정보 제공 방법 | |
US20060046276A1 (en) | Acetyl-LDL receptor as a biomarker for breast cancer | |
US20150044703A1 (en) | Methods and compositions for detecting endometrial or ovarian cancer | |
CN111879940A (zh) | 肺结核、肺腺癌标志物及应用 | |
AU2004270759A1 (en) | Diagnostic marker for ovarian cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 22825315 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 22825315 Country of ref document: EP Kind code of ref document: A1 |