KR20240061639A - 폐암 진단용 dna 메틸화 마커 및 이의 용도 - Google Patents
폐암 진단용 dna 메틸화 마커 및 이의 용도 Download PDFInfo
- Publication number
- KR20240061639A KR20240061639A KR1020230148520A KR20230148520A KR20240061639A KR 20240061639 A KR20240061639 A KR 20240061639A KR 1020230148520 A KR1020230148520 A KR 1020230148520A KR 20230148520 A KR20230148520 A KR 20230148520A KR 20240061639 A KR20240061639 A KR 20240061639A
- Authority
- KR
- South Korea
- Prior art keywords
- lung cancer
- loss
- dna
- methylation
- gain
- Prior art date
Links
- 208000020816 lung neoplasm Diseases 0.000 title claims abstract description 126
- 206010058467 Lung neoplasm malignant Diseases 0.000 title claims abstract description 125
- 201000005202 lung cancer Diseases 0.000 title claims abstract description 125
- 230000007067 DNA methylation Effects 0.000 title claims abstract description 75
- 239000003550 marker Substances 0.000 title claims abstract description 61
- 238000003745 diagnosis Methods 0.000 claims abstract description 23
- 230000011987 methylation Effects 0.000 claims description 82
- 238000007069 methylation reaction Methods 0.000 claims description 82
- 238000000034 method Methods 0.000 claims description 38
- 239000000523 sample Substances 0.000 claims description 21
- 239000000203 mixture Substances 0.000 claims description 15
- 238000007481 next generation sequencing Methods 0.000 claims description 10
- 238000009396 hybridization Methods 0.000 claims description 9
- 238000007855 methylation-specific PCR Methods 0.000 claims description 8
- 108091033319 polynucleotide Proteins 0.000 claims description 8
- 102000040430 polynucleotide Human genes 0.000 claims description 8
- 239000002157 polynucleotide Substances 0.000 claims description 8
- 230000000295 complement effect Effects 0.000 claims description 6
- 239000012472 biological sample Substances 0.000 claims description 5
- 238000001369 bisulfite sequencing Methods 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 5
- 238000000018 DNA microarray Methods 0.000 claims description 4
- 238000012175 pyrosequencing Methods 0.000 claims description 3
- 230000009870 specific binding Effects 0.000 claims description 3
- 108091008324 binding proteins Proteins 0.000 claims description 2
- 238000011880 melting curve analysis Methods 0.000 claims description 2
- 238000003753 real-time PCR Methods 0.000 claims description 2
- 102000014914 Carrier Proteins Human genes 0.000 claims 1
- 210000004369 blood Anatomy 0.000 abstract description 20
- 239000008280 blood Substances 0.000 abstract description 20
- 238000013399 early diagnosis Methods 0.000 abstract description 4
- 101100495925 Schizosaccharomyces pombe (strain 972 / ATCC 24843) chr3 gene Proteins 0.000 description 47
- 108020004414 DNA Proteins 0.000 description 43
- 210000001519 tissue Anatomy 0.000 description 41
- 206010028980 Neoplasm Diseases 0.000 description 35
- 150000007523 nucleic acids Chemical class 0.000 description 28
- 201000011510 cancer Diseases 0.000 description 26
- 238000012163 sequencing technique Methods 0.000 description 20
- 102000039446 nucleic acids Human genes 0.000 description 17
- 108020004707 nucleic acids Proteins 0.000 description 17
- 108090000623 proteins and genes Proteins 0.000 description 16
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical group NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 13
- CTMZLDSMFCVUNX-VMIOUTBZSA-N cytidylyl-(3'->5')-guanosine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=C(C(N=C(N)N3)=O)N=C2)O)[C@@H](CO)O1 CTMZLDSMFCVUNX-VMIOUTBZSA-N 0.000 description 12
- 238000012360 testing method Methods 0.000 description 11
- 210000004027 cell Anatomy 0.000 description 9
- 108091029523 CpG island Proteins 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 210000004072 lung Anatomy 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 102100036792 Adhesion G protein-coupled receptor L4 Human genes 0.000 description 7
- 101000928172 Homo sapiens Adhesion G protein-coupled receptor L4 Proteins 0.000 description 7
- 101000738765 Homo sapiens Receptor-type tyrosine-protein phosphatase N2 Proteins 0.000 description 7
- 102100037404 Receptor-type tyrosine-protein phosphatase N2 Human genes 0.000 description 7
- 210000000349 chromosome Anatomy 0.000 description 7
- 208000000649 small cell carcinoma Diseases 0.000 description 7
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 239000008186 active pharmaceutical agent Substances 0.000 description 6
- 238000003149 assay kit Methods 0.000 description 6
- 239000012530 fluid Substances 0.000 description 6
- 239000002096 quantum dot Substances 0.000 description 6
- 238000009966 trimming Methods 0.000 description 6
- 101000658571 Homo sapiens Transmembrane 4 L6 family member 19 Proteins 0.000 description 5
- 101000915599 Homo sapiens Zinc finger protein 776 Proteins 0.000 description 5
- 101000976642 Homo sapiens Zinc finger protein ZIC 4 Proteins 0.000 description 5
- 102100034906 Transmembrane 4 L6 family member 19 Human genes 0.000 description 5
- 102100028581 Zinc finger protein 776 Human genes 0.000 description 5
- 102100023493 Zinc finger protein ZIC 4 Human genes 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 102000014835 CACNA1H Human genes 0.000 description 4
- 102100024594 Histone-lysine N-methyltransferase PRDM16 Human genes 0.000 description 4
- 102100040228 Homeobox protein Hox-D3 Human genes 0.000 description 4
- 101000686942 Homo sapiens Histone-lysine N-methyltransferase PRDM16 Proteins 0.000 description 4
- 101001037158 Homo sapiens Homeobox protein Hox-D3 Proteins 0.000 description 4
- 101001091564 Homo sapiens Kinase non-catalytic C-lobe domain-containing protein 1 Proteins 0.000 description 4
- 101000922695 Homo sapiens Polypeptide N-acetylgalactosaminyltransferase 9 Proteins 0.000 description 4
- 101000653634 Homo sapiens T-box transcription factor TBX15 Proteins 0.000 description 4
- 101000932804 Homo sapiens Voltage-dependent T-type calcium channel subunit alpha-1H Proteins 0.000 description 4
- 102100035795 Kinase non-catalytic C-lobe domain-containing protein 1 Human genes 0.000 description 4
- 102100031433 Polypeptide N-acetylgalactosaminyltransferase 9 Human genes 0.000 description 4
- 102100029853 T-box transcription factor TBX15 Human genes 0.000 description 4
- 229940104302 cytosine Drugs 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000001114 immunoprecipitation Methods 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 208000010507 Adenocarcinoma of Lung Diseases 0.000 description 3
- 102100024437 Adhesion G protein-coupled receptor A1 Human genes 0.000 description 3
- 102100029758 Cadherin-4 Human genes 0.000 description 3
- 102100036372 Carbonic anhydrase 5A, mitochondrial Human genes 0.000 description 3
- 238000009007 Diagnostic Kit Methods 0.000 description 3
- 102000016680 Dioxygenases Human genes 0.000 description 3
- 108010028143 Dioxygenases Proteins 0.000 description 3
- 102100036966 Dipeptidyl aminopeptidase-like protein 6 Human genes 0.000 description 3
- 101000833343 Homo sapiens Adhesion G protein-coupled receptor A1 Proteins 0.000 description 3
- 101000794580 Homo sapiens Cadherin-4 Proteins 0.000 description 3
- 101000714503 Homo sapiens Carbonic anhydrase 5A, mitochondrial Proteins 0.000 description 3
- 101000804935 Homo sapiens Dipeptidyl aminopeptidase-like protein 6 Proteins 0.000 description 3
- 101000703741 Homo sapiens Short stature homeobox protein 2 Proteins 0.000 description 3
- 108091008058 MIR10B Proteins 0.000 description 3
- 102100031976 Short stature homeobox protein 2 Human genes 0.000 description 3
- 208000009956 adenocarcinoma Diseases 0.000 description 3
- 239000002246 antineoplastic agent Substances 0.000 description 3
- 229940041181 antineoplastic drug Drugs 0.000 description 3
- 231100000504 carcinogenesis Toxicity 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 210000000265 leukocyte Anatomy 0.000 description 3
- 201000005249 lung adenocarcinoma Diseases 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 3
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 238000004393 prognosis Methods 0.000 description 3
- 210000003296 saliva Anatomy 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 206010041823 squamous cell carcinoma Diseases 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 238000001356 surgical procedure Methods 0.000 description 3
- 230000005945 translocation Effects 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 210000002700 urine Anatomy 0.000 description 3
- 102100022912 ADP-ribosylation factor-like protein 16 Human genes 0.000 description 2
- 102100033792 ALX homeobox protein 1 Human genes 0.000 description 2
- 102100032605 Adhesion G protein-coupled receptor B1 Human genes 0.000 description 2
- 208000005623 Carcinogenesis Diseases 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 102100024816 E3 ubiquitin-protein ligase TRAF7 Human genes 0.000 description 2
- 101150026630 FOXG1 gene Proteins 0.000 description 2
- 102100020871 Forkhead box protein G1 Human genes 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 102100021090 Homeobox protein Hox-A9 Human genes 0.000 description 2
- 101000974510 Homo sapiens ADP-ribosylation factor-like protein 16 Proteins 0.000 description 2
- 101000779615 Homo sapiens ALX homeobox protein 1 Proteins 0.000 description 2
- 101000796780 Homo sapiens Adhesion G protein-coupled receptor B1 Proteins 0.000 description 2
- 101000830899 Homo sapiens E3 ubiquitin-protein ligase TRAF7 Proteins 0.000 description 2
- 101001007703 Homo sapiens Neurexophilin-1 Proteins 0.000 description 2
- 101000595669 Homo sapiens Pituitary homeobox 2 Proteins 0.000 description 2
- 101001132819 Homo sapiens Protein CBFA2T3 Proteins 0.000 description 2
- 101001038337 Homo sapiens Serine/threonine-protein kinase LMTK1 Proteins 0.000 description 2
- 101000703681 Homo sapiens Single-minded homolog 1 Proteins 0.000 description 2
- 101000633708 Homo sapiens Src kinase-associated phosphoprotein 2 Proteins 0.000 description 2
- 101000659774 Homo sapiens Taste receptor type 1 member 3 Proteins 0.000 description 2
- 101000982057 Homo sapiens Unconventional myosin-XVI Proteins 0.000 description 2
- 101000782311 Homo sapiens Zinc finger protein 835 Proteins 0.000 description 2
- 101000976653 Homo sapiens Zinc finger protein ZIC 1 Proteins 0.000 description 2
- 102100027527 Neurexophilin-1 Human genes 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 102100036090 Pituitary homeobox 2 Human genes 0.000 description 2
- 206010036790 Productive cough Diseases 0.000 description 2
- 102100033812 Protein CBFA2T3 Human genes 0.000 description 2
- 102000005026 SLC6A18 Human genes 0.000 description 2
- 108060007757 SLC6A18 Proteins 0.000 description 2
- 102000005025 SLC6A19 Human genes 0.000 description 2
- 108060007758 SLC6A19 Proteins 0.000 description 2
- 108091036332 SOX2OT Proteins 0.000 description 2
- 102100040293 Serine/threonine-protein kinase LMTK1 Human genes 0.000 description 2
- 102100031980 Single-minded homolog 1 Human genes 0.000 description 2
- 206010041067 Small cell lung cancer Diseases 0.000 description 2
- 102100029213 Src kinase-associated phosphoprotein 2 Human genes 0.000 description 2
- 102100035942 Taste receptor type 1 member 3 Human genes 0.000 description 2
- 102100026677 Unconventional myosin-XVI Human genes 0.000 description 2
- 108010053100 Vascular Endothelial Growth Factor Receptor-3 Proteins 0.000 description 2
- 102100033179 Vascular endothelial growth factor receptor 3 Human genes 0.000 description 2
- 102100035788 Zinc finger protein 835 Human genes 0.000 description 2
- 102100023497 Zinc finger protein ZIC 1 Human genes 0.000 description 2
- 230000027455 binding Effects 0.000 description 2
- 230000036952 cancer formation Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 108010027263 homeobox protein HOXA9 Proteins 0.000 description 2
- 201000005243 lung squamous cell carcinoma Diseases 0.000 description 2
- 210000001165 lymph node Anatomy 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 2
- 238000010837 poor prognosis Methods 0.000 description 2
- 239000002244 precipitate Substances 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 210000000582 semen Anatomy 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 210000003802 sputum Anatomy 0.000 description 2
- 208000024794 sputum Diseases 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 102100037426 17-beta-hydroxysteroid dehydrogenase type 1 Human genes 0.000 description 1
- MFSSHRCJKRDIOL-UHFFFAOYSA-N 2-(2-fluorophenoxy)-4-(2-methylpyrazol-3-yl)benzamide Chemical compound CN1C(=CC=N1)C2=CC(=C(C=C2)C(=O)N)OC3=CC=CC=C3F MFSSHRCJKRDIOL-UHFFFAOYSA-N 0.000 description 1
- WZFUQSJFWNHZHM-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)CC(=O)N1CC2=C(CC1)NN=N2 WZFUQSJFWNHZHM-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- 102100029824 ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 2 Human genes 0.000 description 1
- 102100022974 AP-2 complex subunit alpha-2 Human genes 0.000 description 1
- 102100022452 Actin-related protein T2 Human genes 0.000 description 1
- 108050006870 Actin-related protein T2 Proteins 0.000 description 1
- 102100026441 Adhesion G-protein coupled receptor D1 Human genes 0.000 description 1
- 102100036601 Aggrecan core protein Human genes 0.000 description 1
- 102100021836 Alpha-2,8-sialyltransferase 8E Human genes 0.000 description 1
- 102100022983 B-cell lymphoma/leukemia 11B Human genes 0.000 description 1
- 102100028266 Brain-specific angiogenesis inhibitor 1-associated protein 2-like protein 2 Human genes 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 102100031184 C-Maf-inducing protein Human genes 0.000 description 1
- 102000014817 CACNA1A Human genes 0.000 description 1
- 102000014814 CACNA1C Human genes 0.000 description 1
- 102000014837 CACNA1G Human genes 0.000 description 1
- 102100040531 CKLF-like MARVEL transmembrane domain-containing protein 2 Human genes 0.000 description 1
- 102100040750 CUB and sushi domain-containing protein 1 Human genes 0.000 description 1
- 102100024153 Cadherin-15 Human genes 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 102100025942 Chemokine-like protein TAFA-5 Human genes 0.000 description 1
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 1
- 208000031404 Chromosome Aberrations Diseases 0.000 description 1
- 102100025658 Cilia- and flagella-associated protein 46 Human genes 0.000 description 1
- 102100031457 Collagen alpha-1(V) chain Human genes 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 102100030150 Complement C1q tumor necrosis factor-related protein 8 Human genes 0.000 description 1
- 102100024332 Cytochrome P450 11B1, mitochondrial Human genes 0.000 description 1
- 102100038017 DIS3-like exonuclease 2 Human genes 0.000 description 1
- 102100031230 DNA topoisomerase I, mitochondrial Human genes 0.000 description 1
- 102100039883 DNA-directed RNA polymerase III subunit RPC5 Human genes 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102100020743 Dipeptidase 1 Human genes 0.000 description 1
- 102100035424 DnaJ homolog subfamily B member 8 Human genes 0.000 description 1
- 102100036515 Ectonucleoside triphosphate diphosphohydrolase 8 Human genes 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102100021601 Ephrin type-A receptor 8 Human genes 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 102100035433 FOXL2 neighbor protein Human genes 0.000 description 1
- 102100037060 Forkhead box protein D3 Human genes 0.000 description 1
- 102100020856 Forkhead box protein F1 Human genes 0.000 description 1
- 102100041001 Forkhead box protein I1 Human genes 0.000 description 1
- 102100039826 G protein-regulated inducer of neurite outgrowth 1 Human genes 0.000 description 1
- 101710150822 G protein-regulated inducer of neurite outgrowth 1 Proteins 0.000 description 1
- 102100031411 GAS2-like protein 1 Human genes 0.000 description 1
- 102100032845 Gamma-2-syntrophin Human genes 0.000 description 1
- 102100039416 Gap junction beta-4 protein Human genes 0.000 description 1
- 102100037390 Genetic suppressor element 1 Human genes 0.000 description 1
- 102100035902 Glutamate decarboxylase 1 Human genes 0.000 description 1
- 229940121710 HMGCoA reductase inhibitor Drugs 0.000 description 1
- 102100030968 Homeobox even-skipped homolog protein 2 Human genes 0.000 description 1
- 102100030087 Homeobox protein DLX-1 Human genes 0.000 description 1
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 1
- 102100030308 Homeobox protein Hox-A11 Human genes 0.000 description 1
- 102100020761 Homeobox protein Hox-C13 Human genes 0.000 description 1
- 102100039544 Homeobox protein Hox-D10 Human genes 0.000 description 1
- 102100034858 Homeobox protein Hox-D8 Human genes 0.000 description 1
- 102100034864 Homeobox protein Hox-D9 Human genes 0.000 description 1
- 102100030636 Homeobox protein OTX1 Human genes 0.000 description 1
- 102100033791 Homeobox protein aristaless-like 3 Human genes 0.000 description 1
- 101000806242 Homo sapiens 17-beta-hydroxysteroid dehydrogenase type 1 Proteins 0.000 description 1
- 101000794082 Homo sapiens ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 2 Proteins 0.000 description 1
- 101000757394 Homo sapiens AP-2 complex subunit alpha-2 Proteins 0.000 description 1
- 101000718219 Homo sapiens Adhesion G-protein coupled receptor D1 Proteins 0.000 description 1
- 101000999998 Homo sapiens Aggrecan core protein Proteins 0.000 description 1
- 101000616703 Homo sapiens Alpha-2,8-sialyltransferase 8E Proteins 0.000 description 1
- 101000903697 Homo sapiens B-cell lymphoma/leukemia 11B Proteins 0.000 description 1
- 101000935881 Homo sapiens Brain-specific angiogenesis inhibitor 1-associated protein 2-like protein 2 Proteins 0.000 description 1
- 101000993081 Homo sapiens C-Maf-inducing protein Proteins 0.000 description 1
- 101000749427 Homo sapiens CKLF-like MARVEL transmembrane domain-containing protein 2 Proteins 0.000 description 1
- 101000892017 Homo sapiens CUB and sushi domain-containing protein 1 Proteins 0.000 description 1
- 101000762242 Homo sapiens Cadherin-15 Proteins 0.000 description 1
- 101000788164 Homo sapiens Chemokine-like protein TAFA-5 Proteins 0.000 description 1
- 101000914166 Homo sapiens Cilia- and flagella-associated protein 46 Proteins 0.000 description 1
- 101000941708 Homo sapiens Collagen alpha-1(V) chain Proteins 0.000 description 1
- 101000794270 Homo sapiens Complement C1q tumor necrosis factor-related protein 8 Proteins 0.000 description 1
- 101000951062 Homo sapiens DIS3-like exonuclease 2 Proteins 0.000 description 1
- 101000669240 Homo sapiens DNA-directed RNA polymerase III subunit RPC5 Proteins 0.000 description 1
- 101000932213 Homo sapiens Dipeptidase 1 Proteins 0.000 description 1
- 101000804109 Homo sapiens DnaJ homolog subfamily B member 8 Proteins 0.000 description 1
- 101000852000 Homo sapiens Ectonucleoside triphosphate diphosphohydrolase 8 Proteins 0.000 description 1
- 101000898676 Homo sapiens Ephrin type-A receptor 8 Proteins 0.000 description 1
- 101000877721 Homo sapiens FOXL2 neighbor protein Proteins 0.000 description 1
- 101001029308 Homo sapiens Forkhead box protein D3 Proteins 0.000 description 1
- 101000931494 Homo sapiens Forkhead box protein F1 Proteins 0.000 description 1
- 101000892875 Homo sapiens Forkhead box protein I1 Proteins 0.000 description 1
- 101000922847 Homo sapiens GAS2-like protein 1 Proteins 0.000 description 1
- 101001099051 Homo sapiens GPI inositol-deacylase Proteins 0.000 description 1
- 101000868450 Homo sapiens Gamma-2-syntrophin Proteins 0.000 description 1
- 101001026271 Homo sapiens Genetic suppressor element 1 Proteins 0.000 description 1
- 101000873546 Homo sapiens Glutamate decarboxylase 1 Proteins 0.000 description 1
- 101000938533 Homo sapiens Homeobox even-skipped homolog protein 2 Proteins 0.000 description 1
- 101000864690 Homo sapiens Homeobox protein DLX-1 Proteins 0.000 description 1
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 1
- 101001083158 Homo sapiens Homeobox protein Hox-A11 Proteins 0.000 description 1
- 101001002988 Homo sapiens Homeobox protein Hox-C13 Proteins 0.000 description 1
- 101000962573 Homo sapiens Homeobox protein Hox-D10 Proteins 0.000 description 1
- 101001019776 Homo sapiens Homeobox protein Hox-D8 Proteins 0.000 description 1
- 101001019766 Homo sapiens Homeobox protein Hox-D9 Proteins 0.000 description 1
- 101000584392 Homo sapiens Homeobox protein OTX1 Proteins 0.000 description 1
- 101000779611 Homo sapiens Homeobox protein aristaless-like 3 Proteins 0.000 description 1
- 101000614618 Homo sapiens Junctophilin-3 Proteins 0.000 description 1
- 101000994453 Homo sapiens Keratin, type I cytoskeletal 24 Proteins 0.000 description 1
- 101001046537 Homo sapiens Kinesin-like protein KIFC2 Proteins 0.000 description 1
- 101000619912 Homo sapiens LIM/homeobox protein Lhx8 Proteins 0.000 description 1
- 101001004836 Homo sapiens Leucine-rich repeat and transmembrane domain-containing protein 2 Proteins 0.000 description 1
- 101001039113 Homo sapiens Leucine-rich repeat-containing protein 15 Proteins 0.000 description 1
- 101000965732 Homo sapiens Leucine-rich repeat-containing protein 74A Proteins 0.000 description 1
- 101000801619 Homo sapiens Long-chain-fatty-acid-CoA ligase ACSBG1 Proteins 0.000 description 1
- 101000969828 Homo sapiens Maestro heat-like repeat family member 5 Proteins 0.000 description 1
- 101000578869 Homo sapiens Meiosis 1 arrest protein Proteins 0.000 description 1
- 101000969786 Homo sapiens Metallophosphoesterase domain-containing protein 1 Proteins 0.000 description 1
- 101000976899 Homo sapiens Mitogen-activated protein kinase 15 Proteins 0.000 description 1
- 101000972276 Homo sapiens Mucin-5B Proteins 0.000 description 1
- 101000980673 Homo sapiens Multicilin Proteins 0.000 description 1
- 101000955263 Homo sapiens Multiple epidermal growth factor-like domains protein 6 Proteins 0.000 description 1
- 101000982032 Homo sapiens Myosin-binding protein C, cardiac-type Proteins 0.000 description 1
- 101000633314 Homo sapiens Nicotinamide riboside kinase 2 Proteins 0.000 description 1
- 101001121386 Homo sapiens Ovochymase-1 Proteins 0.000 description 1
- 101001123300 Homo sapiens PR domain zinc finger protein 13 Proteins 0.000 description 1
- 101001069727 Homo sapiens Paired mesoderm homeobox protein 1 Proteins 0.000 description 1
- 101000759168 Homo sapiens Palmitoyltransferase ZDHHC7 Proteins 0.000 description 1
- 101001126498 Homo sapiens Peroxisome biogenesis factor 10 Proteins 0.000 description 1
- 101000583183 Homo sapiens Plakophilin-3 Proteins 0.000 description 1
- 101000888119 Homo sapiens Polypeptide N-acetylgalactosaminyltransferase 17 Proteins 0.000 description 1
- 101001067511 Homo sapiens Polypeptide N-acetylgalactosaminyltransferase-like 6 Proteins 0.000 description 1
- 101001077449 Homo sapiens Potassium voltage-gated channel subfamily S member 1 Proteins 0.000 description 1
- 101000753535 Homo sapiens Potassium-transporting ATPase subunit beta Proteins 0.000 description 1
- 101000854595 Homo sapiens Protein FAM166C Proteins 0.000 description 1
- 101000742083 Homo sapiens Protein phosphatase 1 regulatory subunit 29 Proteins 0.000 description 1
- 101000652820 Homo sapiens Protein shisa-like-1 Proteins 0.000 description 1
- 101000957503 Homo sapiens Putative uncharacterized protein encoded by LINC00305 Proteins 0.000 description 1
- 101000782312 Homo sapiens Putative zinc finger protein 833 Proteins 0.000 description 1
- 101001092197 Homo sapiens RNA binding protein fox-1 homolog 3 Proteins 0.000 description 1
- 101000708215 Homo sapiens Ras and Rab interactor 1 Proteins 0.000 description 1
- 101001110312 Homo sapiens Ras-associating and dilute domain-containing protein Proteins 0.000 description 1
- 101001061942 Homo sapiens Ras-related protein Rab-40C Proteins 0.000 description 1
- 101000703425 Homo sapiens Rho GTPase-activating protein 39 Proteins 0.000 description 1
- 101000654676 Homo sapiens Semaphorin-6B Proteins 0.000 description 1
- 101000794043 Homo sapiens Serine/threonine-protein kinase BRSK2 Proteins 0.000 description 1
- 101000974731 Homo sapiens Small conductance calcium-activated potassium channel protein 1 Proteins 0.000 description 1
- 101000839323 Homo sapiens Synaptotagmin-7 Proteins 0.000 description 1
- 101000728490 Homo sapiens Tether containing UBX domain for GLUT4 Proteins 0.000 description 1
- 101000637031 Homo sapiens Trafficking protein particle complex subunit 9 Proteins 0.000 description 1
- 101000800546 Homo sapiens Transcription factor 21 Proteins 0.000 description 1
- 101000634975 Homo sapiens Tripartite motif-containing protein 29 Proteins 0.000 description 1
- 101000796738 Homo sapiens Tryptase gamma Proteins 0.000 description 1
- 101000962366 Homo sapiens Type II inositol 1,4,5-trisphosphate 5-phosphatase Proteins 0.000 description 1
- 101000900760 Homo sapiens Uncharacterized protein encoded by LINC01551 Proteins 0.000 description 1
- 101000750380 Homo sapiens Ventral anterior homeobox 1 Proteins 0.000 description 1
- 101000867811 Homo sapiens Voltage-dependent L-type calcium channel subunit alpha-1C Proteins 0.000 description 1
- 101000935117 Homo sapiens Voltage-dependent P/Q-type calcium channel subunit alpha-1A Proteins 0.000 description 1
- 101000867850 Homo sapiens Voltage-dependent T-type calcium channel subunit alpha-1G Proteins 0.000 description 1
- 101000740765 Homo sapiens Voltage-dependent calcium channel subunit alpha-2/delta-4 Proteins 0.000 description 1
- 101000915477 Homo sapiens Zinc finger MIZ domain-containing protein 1 Proteins 0.000 description 1
- 101000964754 Homo sapiens Zinc finger protein 709 Proteins 0.000 description 1
- 101000851815 Homo sapiens p53-regulated apoptosis-inducing protein 1 Proteins 0.000 description 1
- 101000847068 Homo sapiens t-SNARE domain-containing protein 1 Proteins 0.000 description 1
- 102100040488 Junctophilin-3 Human genes 0.000 description 1
- 108010006746 KCNQ2 Potassium Channel Proteins 0.000 description 1
- 102100032704 Keratin, type I cytoskeletal 24 Human genes 0.000 description 1
- 102100022251 Kinesin-like protein KIFC2 Human genes 0.000 description 1
- 102100022136 LIM/homeobox protein Lhx8 Human genes 0.000 description 1
- 102100025969 Leucine-rich repeat and transmembrane domain-containing protein 2 Human genes 0.000 description 1
- 102100040645 Leucine-rich repeat-containing protein 15 Human genes 0.000 description 1
- 102100040978 Leucine-rich repeat-containing protein 74A Human genes 0.000 description 1
- 102100033564 Long-chain-fatty-acid-CoA ligase ACSBG1 Human genes 0.000 description 1
- 206010050017 Lung cancer metastatic Diseases 0.000 description 1
- 101150029107 MEIS1 gene Proteins 0.000 description 1
- 102100021322 Maestro heat-like repeat family member 5 Human genes 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 102100028343 Meiosis 1 arrest protein Human genes 0.000 description 1
- 102100021275 Metallophosphoesterase domain-containing protein 1 Human genes 0.000 description 1
- 102100023483 Mitogen-activated protein kinase 15 Human genes 0.000 description 1
- 102100022494 Mucin-5B Human genes 0.000 description 1
- 102100024179 Multicilin Human genes 0.000 description 1
- 102100039005 Multiple epidermal growth factor-like domains protein 6 Human genes 0.000 description 1
- 102100031623 Myelin transcription factor 1-like protein Human genes 0.000 description 1
- 108700041619 Myeloid Ecotropic Viral Integration Site 1 Proteins 0.000 description 1
- 102000047831 Myeloid Ecotropic Viral Integration Site 1 Human genes 0.000 description 1
- 102100026771 Myosin-binding protein C, cardiac-type Human genes 0.000 description 1
- 101150059596 Myt1l gene Proteins 0.000 description 1
- 101150079937 NEUROD1 gene Proteins 0.000 description 1
- 108700020297 NeuroD Proteins 0.000 description 1
- 102100032063 Neurogenic differentiation factor 1 Human genes 0.000 description 1
- 102100029560 Nicotinamide riboside kinase 2 Human genes 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 102100026305 Ovochymase-1 Human genes 0.000 description 1
- 108010032788 PAX6 Transcription Factor Proteins 0.000 description 1
- 102100028973 PR domain zinc finger protein 13 Human genes 0.000 description 1
- 102100037506 Paired box protein Pax-6 Human genes 0.000 description 1
- 102100033786 Paired mesoderm homeobox protein 1 Human genes 0.000 description 1
- 102100023402 Palmitoyltransferase ZDHHC7 Human genes 0.000 description 1
- 102100030554 Peroxisome biogenesis factor 10 Human genes 0.000 description 1
- 102100030347 Plakophilin-3 Human genes 0.000 description 1
- 102100034550 Polypeptide N-acetylgalactosaminyltransferase-like 6 Human genes 0.000 description 1
- 102100034354 Potassium voltage-gated channel subfamily KQT member 2 Human genes 0.000 description 1
- 102100025066 Potassium voltage-gated channel subfamily S member 1 Human genes 0.000 description 1
- 102100021944 Potassium-transporting ATPase subunit beta Human genes 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 102100020939 Protein FAM166C Human genes 0.000 description 1
- 102100038668 Protein phosphatase 1 regulatory subunit 29 Human genes 0.000 description 1
- 102100030927 Protein shisa-like-1 Human genes 0.000 description 1
- 102100038653 Putative uncharacterized protein encoded by LINC00305 Human genes 0.000 description 1
- 102100035789 Putative zinc finger protein 833 Human genes 0.000 description 1
- 102100035530 RNA binding protein fox-1 homolog 3 Human genes 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 102100031485 Ras and Rab interactor 1 Human genes 0.000 description 1
- 102100022126 Ras-associating and dilute domain-containing protein Human genes 0.000 description 1
- 102100029539 Ras-related protein Rab-40C Human genes 0.000 description 1
- 102100030748 Rho GTPase-activating protein 39 Human genes 0.000 description 1
- 102100030680 SH3 and multiple ankyrin repeat domains protein 2 Human genes 0.000 description 1
- 101710067890 SHANK2 Proteins 0.000 description 1
- 102100032796 Semaphorin-6B Human genes 0.000 description 1
- 102100029891 Serine/threonine-protein kinase BRSK2 Human genes 0.000 description 1
- 102100022747 Small conductance calcium-activated potassium channel protein 1 Human genes 0.000 description 1
- 108010049356 Steroid 11-beta-Hydroxylase Proteins 0.000 description 1
- 102100028197 Synaptotagmin-7 Human genes 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 102100029773 Tether containing UBX domain for GLUT4 Human genes 0.000 description 1
- 101150106297 Top1mt gene Proteins 0.000 description 1
- 102100031926 Trafficking protein particle complex subunit 9 Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102100033121 Transcription factor 21 Human genes 0.000 description 1
- 108090001039 Transcription factor AP-2 Proteins 0.000 description 1
- 102000004893 Transcription factor AP-2 Human genes 0.000 description 1
- 102100029519 Tripartite motif-containing protein 29 Human genes 0.000 description 1
- 102100032761 Tryptase gamma Human genes 0.000 description 1
- 108010091356 Tumor Protein p73 Proteins 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 102100030018 Tumor protein p73 Human genes 0.000 description 1
- 102100039257 Type II inositol 1,4,5-trisphosphate 5-phosphatase Human genes 0.000 description 1
- 102100022066 Uncharacterized protein encoded by LINC01551 Human genes 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 102100021166 Ventral anterior homeobox 1 Human genes 0.000 description 1
- 102100037053 Voltage-dependent calcium channel subunit alpha-2/delta-4 Human genes 0.000 description 1
- 102100028535 Zinc finger MIZ domain-containing protein 1 Human genes 0.000 description 1
- 102100040662 Zinc finger protein 709 Human genes 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 201000008395 adenosquamous carcinoma Diseases 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000011319 anticancer therapy Methods 0.000 description 1
- 102000023732 binding proteins Human genes 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 210000001754 blood buffy coat Anatomy 0.000 description 1
- 210000000621 bronchi Anatomy 0.000 description 1
- 210000003123 bronchiole Anatomy 0.000 description 1
- 230000005773 cancer-related death Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 108010005226 connexin 30.3 Proteins 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 238000002224 dissection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 101150100366 end gene Proteins 0.000 description 1
- 238000001839 endoscopy Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 230000000762 glandular Effects 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 238000007031 hydroxymethylation reaction Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 208000003849 large cell carcinoma Diseases 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 210000004880 lymph fluid Anatomy 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012164 methylation sequencing Methods 0.000 description 1
- 108091053306 miR-493 stem-loop Proteins 0.000 description 1
- 108091027261 miR-5700 stem-loop Proteins 0.000 description 1
- 108091071822 miR-572 stem-loop Proteins 0.000 description 1
- HOEFWOBLOGZQIQ-UHFFFAOYSA-N morpholin-4-yl morpholine-4-carbodithioate Chemical compound C1COCCN1C(=S)SN1CCOCC1 HOEFWOBLOGZQIQ-UHFFFAOYSA-N 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 210000002445 nipple Anatomy 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 102100036520 p53-regulated apoptosis-inducing protein 1 Human genes 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000003169 placental effect Effects 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 239000013615 primer Substances 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 239000013049 sediment Substances 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 210000003765 sex chromosome Anatomy 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 208000000587 small cell lung carcinoma Diseases 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 102100032828 t-SNARE domain-containing protein 1 Human genes 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Hospice & Palliative Care (AREA)
- Biophysics (AREA)
- Oncology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 폐암 진단용 DNA 메틸화 마커 및 이의 용도에 관한 것으로, 보다 구체적으로는 폐암 여부를 결정할 수 있는 DNA 메틸화 마커 조합 및 이의 용도에 관한 것이다. 본 발명에 따른 폐암 진단용 DNA 메틸화 마커는 폐암 조직 샘플을 사용하지 않고, 혈액 샘플의 DNA 메틸화 정보만을 이용하여 높은 정확도로 폐암을 진단할 수 있어, 폐암의 조기 진단에 유용하게 활용할 수 있다.
Description
본 발명은 폐암 진단용 DNA 메틸화 마커 및 이의 용도에 관한 것으로, 보다 구체적으로는 폐암 여부를 결정할 수 있는 DNA 메틸화 마커 조합 및 이의 용도에 관한 것이다.
폐암은 전 세계 암 관련 사망 원인 중 가장 흔한 것이다. 과거 20년간 폐암의 발견과 치료에 상당한 발전들이 있었음에도 불구하고, 병을 가진 환자들에 대한 예후는 모든 기의 폐암에 대한 5년 생존율을 합해도 10%에서 15% 사이로 여전히 좋지 못하다. 폐암환자들에 대한 좋지 못한 예후는 일부 재발의 결과인데, 이는 적절한 림프 결절 절단과 함께 치료적인 외과적 절제를 받은 환자들의 대략 20-50%에서 나타난다. 1기 폐암을 가진 환자들조차도 암을 미처 발견하기도 전에, 암이 림프결절 근처 또는 다른 곳으로 퍼져서 5년 생존율이 50%보다 낮다.
폐암은 소세포암(small cell lung cancer, 이하 SCLC라고도 함)과 비소세포암(non-small cell lung cancer, 이하 NSCLC라고도 함)의 두 가지로 분류되며, 비소세포암은 다시 편평상피암, 선암, 대세포암, 선편평상피암 등의 조직형으로 분류 된다. 소세포암은 비소세포암에 비해 수술 후 예후가 좋지 않아 대개 항암제가 주 치료제로 사용되고 있으며 비소세포암은 일반적으로 1-2기 에서는 수술, 그리고 진행된 경우는 항암제가 주 치료제로 사용된다. 상기의 폐암 중 80% 정도를 차지하는 비소세포 암은 암 덩어리의 크기, 주변조직 침투여부, 림프선의 침범 정도, 및 멀리 떨어진 장기로의 전이 여부에 따라 병기를 정하고 치료방법을 결정하는데, 수술을 제외하고는 치료효과가 적어서 치유하기 힘든 암 중의 하나이다. 이렇게 나쁜 예후와 높은 치사율을 보이는 것은 폐암을 효과적으로 진단할 수 있는 제제 또는 방법이 부족하기 때문이다. 따라서, 난치병인 폐암에서는 조기 진단 및 치료가 매우 중요한 실정이다.
암을 정확히 진단하려면 변이유전자를 파악하는 것뿐만 아니라, 그 유전자의 변이가 나타나는 기전을 파악하는 것이 중요하다. 이전에는 유전자의 코딩서열의 돌연변이, 즉 점 돌연변이나 결실, 삽입 등의 미세변화나 거시적인 염색체 이상에 초점을 맞추어 연구해 왔다. 그러나 최근에는 이들만큼 유전자외 변화가 중요한 것으로 보고되고 있고, 대표적인 것이 프로모터 CpG 섬의 메틸화이다.
포유류 세포의 게놈 DNA에는 A, C, G, T 외에 5번째 염기가 존재하며, 이는 시토신 환의 5번째 탄소에 메틸기가 붙은 5-메틸시토신(5-mC)이다. 5-mC는 항상 CG 다이뉴클레오타이드의 C에만 오며(5'-mCG-3'), 이러한 CG를 흔히 CpG라고 표시한다. CpG의 C는 대부분이 메틸기가 붙어서 메틸화되어 있다. 이러한 CpG의 메틸화는 알루(alu)나 전이인자(transposon)와 같이 게놈 내에 반복되는 염기서열(repetitive sequence)이 발현되지 못하도록 억제하며, 포유류 세포에서 유전자외 변화가 가장 흔히 나타나는 부위이다. 이러한 CpG의 5-mC는 자연히 탈아미노화(deamination)되어 T로 바뀌며, 이에 따라 포유류 게놈 내 CpG는 정상적으로 나타나야 할 빈도(1/4 x 1/4=6.25%)보다 훨씬 낮은 1%의 빈도만을 나타낸다.
CpG 중에 예외적으로 밀집되어 나타나는 것들이 있으며, 이를 CpG 섬이라고 한다. CpG 섬은 길이가 0.2~3kb이고, C 및 G염기의 분포백분율이 50%를 넘으며, CpG의 분포백분율이 3.75%이상으로 높게 집중되어 나타나는 부위를 가리킨다. CpG 섬은 전체 인체 유전체에 약 45,000개가 나타나며, 특히 유전자의 발현을 조절하는 프로모터 부위에 집중되어 나타난다. 실제로 인체 유전자중 약 절반을 차지하는 중요 유전자(housekeeping genes)의 프로모터에는 CpG 섬이 나타난다 (Cross, S. et al., Curr. Opin. Gene Develop., 5:309, 1995). 이에 실제 혈액이나 객담, 침, 대변, 소변 등에서 종양관련 유전자의 프로모터 메틸화를 조사하여 각종 암 진료에 사용하려는 시도가 최근 활발하게 이루어지고 있다.
현재 임상에서 암의 진단은 문진(history taking)과 신체검사, 임상병리검사를 거쳐 일단 의심이 되면 방사선 검사 및 내시경 검사로 진행되며, 최종적으로는 조직 검사로 확인된다. 그러나 현존 임상 검사법으로는 암의 세포수가 10억 개, 암의 직경이 1 cm 이상이 되어야 진단이 가능하다. 이런 경우 이미 암세포는 전이 능력을 갖고 있으며, 실제 절반이상에서 암이 이미 전이되어 있다. 한편, 암이 직간접으로 생산하는 물질을 혈액 내에서 찾는 종양마커(tumor markers)가 암 선별검사(cancer screening)에 이용되는데, 이는 정확도에 한계가 있어서 암이 있을 때도 약 절반까지 정상으로 나타나며, 암이 없을 때도 종종 양성으로 나타나서 혼란을 야기한다. 또한, 암의 치료에 주로 사용되는 항암제의 경우, 암의 용적이 적은 경우에만 그 효과를 나타내는 문제점이 있다.
이에, 최근에는 DNA 메틸화 측정을 통하여 암을 진단하는 방법들이 제시되고 있다. DNA 메틸화는 주로 특정 유전자의 프로모터 부위의 CpG 섬(CpG island)의 사이토신(cytosine)에서 일어나고, 그로 인하여 전사인자의 결합이 방해를 받게 되어 특정 유전자의 발현이 차단(gene silencing)되는 것으로, 이는 생체 내에서 유전자의 단백질 지정 코딩서열(coding sequence)에 돌연변이(mutation)가 없이도 그 유전자의 기능이 소실되는 주요 기전이며, 인체 암에서 다수의 종양 억제 유전자(tumor suppressor genes)의 기능이 소실되는 원인으로 해석되고 있다. 프로모터 CpG 섬의 메틸화가 발암을 직접 유발하는지, 또는 발암에 2차적인 변화인지에 대한 논란이 있으나, 전립선암, 결장암, 자궁암, 유방암 등 다양한 암 세포에서 CpG 섬에서의 이러한 비정상적인 메틸화/탈메틸화가 보고되었다. 따라서, 이는 암의 조기진단, 발암 위험의 예측, 암의 예후 예측, 치료 후 추적 조사, 항암요법에 대한 반응 예측 등 다방면으로 이용될 수 있다. 이를 메틸화 특이 PCR(이하 MSP라고 함), 자동염기분석 또는 bisulfite pyrosequencing 등의 방법으로 검사하여 암의 진단과 스크리닝 등에 이용하려는 시도가 최근 활발하게 이루어지고 있으나, 다수는 소수의 특정 유전자 또는 프로모터 부위의 메틸화를 검출하여 이를 분석하는 방법에 그치고 있으며 (예를 들어, 대한민국 특허 제1557183호, 대한민국 특허 제1191947호). 진단의 효율 및 정확도에는 한계가 있다.
이에, 본 발명자들은 상기 문제점들을 해결하고, 높은 민감도와 정확도의 폐암 진단용 DNA 메틸화 마커를 개발하기 위해 예의 노력한 결과, 폐암 조직 샘플의 TCGA 메틸화 데이터와 폐암 환자의 조직 및 cfDNA에서 메틸화된 DNA 영역을 선별하고, 해당 데이터 세트에서 공통된 영역의 폐암 특이적 DNA 메틸화 마커를 선별하여, 상기 DNA 메틸화 마커를 분석할 경우, 높은 정확도로 폐암 여부를 조기에 진단할 수 있다는 것을 확인하고, 본 발명을 완성하였다.
본 발명의 목적은 폐암 진단용 DNA 메틸화 마커 조합을 제공하는 것이다.
본 발명의 다른 목적은 상기 DNA 메틸화 마커 조합을 이용한 폐암 진단을 위한 정보의 제공방법을 제공하는 것이다.
본 발명의 또 다른 목적은 상기 DNA 메틸화 마커 조합을 검출할 수 있는 프로브 조성물, 프라미어 조성물 및 상기 조성물을 포함하는 폐암 진단용 키트를 제공하는 것이다.
상기 목적을 달성하기 위하여, 본 발명은 표 1로 표시되는 DNA 메틸화 마커를 포함하는 폐암 진단용 DNA 메틸화 마커 조합을 제공한다.
본 발명은 또한, (a) 생체 시료에서 DNA를 분리하는 단계; (b) 상기 DNA 메틸화 마커 조합의 메틸화 수준을 검출하는 단계; 및 (c) 상기 검출된 DNA 메틸화 마커 수준이 기준값(cut-off value)을 초과할 경우, 폐암으로 판정하는 단계; 를 포함하는 폐암 진단을 위한 정보의 제공방법을 제공한다.
본 발명은 또한, 상기 DNA 메틸화 마커 조합의 DNA 메틸화 마커를 각각 증폭할 수 있는 프라이머 조합을 포함하는 폐암 진단용 조성물을 제공한다.
본 발명은 또한, 상기 DNA 메틸화 마커 조합의 DNA 메티로하 마커의 메틸화된 염기를 함유하는 10개 이상의 연속 염기를 포함하는 폴리뉴클레오타이드 또는 그의 상보적인 폴리뉴클레오타이드와 특이적으로 각각 혼성화할 수 있는 프로브 조합을 포함하는 폐암 진단용 조성물을 제공한다.
본 발명은 또한, 상기 조성물을 포함하는 폐암 진단용 키트를 제공한다.
본 발명에 따른 폐암 진단용 DNA 메틸화 마커는 폐암 조직 샘플을 사용하지 않고, 혈액 샘플의 DNA 메틸화 정보만을 이용하여 높은 정확도로 폐암을 진단할 수 있어, 폐암의 조기 진단에 유용하게 활용할 수 있다.
도 1은 본 발명의 폐암 진단용 DNA 메틸화 마커를 선별하는 과정을 나타낸 흐름도이다.
도 2는 본 발명의 일 실시예에 따라 선별한 366개의 폐암 특이적 DNA 메틸화 마커의 폐암 진단 성능을 확인한 ROC 곡선 결과이다.
도 3은 본 발명의 일 실시예에 따라 선별한 366개의 폐암 특이적 DNA 메틸화 마커의 성능을 확인한 그래프이다.
도 4는 본 발명의 폐암 진단용 DNA 메틸화 마커 최소 조합을 선별하는 과정을 나타낸 흐름도이다.
도 5는 본 발명의 일 실시예에 따라 선별한 폐암 특이적 DNA 메틸화 마커와 다른 마커 세트 후보군의 AUC 값 차이를 나타내는 그래프로서, (A)는 10개 세트의 과메틸화 마커 조합, (B)는 10개 세트의 저메틸화 마커 조합, (C)는 7개 세트의 과메틸화 마커 조합 및 (D)는 7개 세트의 저메틸화 마커 조합의 결과이다.
도 6은 본 발명의 일 실시예에 따라 선별한 폐암 특이적 DNA 메틸화 마커 최소 조합을 이용하여 폐암 여부를 판단한 결과를 나타내는 ROC_AUC 그래프이다.
도 7은 본 발명의 일 실시예에 따라 선별한 페암 특이적 DNA 메틸화 마커 각각의 폐암과 정상 조직간 메틸화 수준 차이를 측정한 결과이다.
도 8은 본 발명의 일 실시예에 따라 선별한 폐암 특이적 DNA 메틸화 마커 366개 조합을 이용하여 임상 샘플에서 폐암 여부를 판단한 결과를 나타내는 ROC_AUC 그래프이다.
도 9는 본 발명의 일 실시예에 따라 선별한 페암 특이적 DNA 메틸화 마커 366개의 폐암 특이적 DNA 메틸화 마커의 성능을 임상샘플에서 확인한 그래프이다.
도 10은 본 발명의 일 실시예에 따라 선별한 폐암 특이적 DNA 메틸화 마커 20개 조합을 이용하여 임상 샘플에서 폐암 여부를 판단한 결과를 나타내는 ROC_AUC 그래프이다.
도 11은 본 발명의 일 실시예에 따라 선별한 페암 특이적 DNA 메틸화 마커 20개의 폐암 특이적 DNA 메틸화 마커의 성능을 임상샘플에서 확인한 그래프이다.
도 12는 본 발명의 일 실시예에 따라 선별한 폐암 특이적 DNA 메틸화 마커 14개 조합을 이용하여 임상 샘플에서 폐암 여부를 판단한 결과를 나타내는 ROC_AUC 그래프이다.
도 13은 본 발명의 일 실시예에 따라 선별한 페암 특이적 DNA 메틸화 마커 14개의 폐암 특이적 DNA 메틸화 마커의 성능을 임상샘플에서 확인한 그래프이다.
도 2는 본 발명의 일 실시예에 따라 선별한 366개의 폐암 특이적 DNA 메틸화 마커의 폐암 진단 성능을 확인한 ROC 곡선 결과이다.
도 3은 본 발명의 일 실시예에 따라 선별한 366개의 폐암 특이적 DNA 메틸화 마커의 성능을 확인한 그래프이다.
도 4는 본 발명의 폐암 진단용 DNA 메틸화 마커 최소 조합을 선별하는 과정을 나타낸 흐름도이다.
도 5는 본 발명의 일 실시예에 따라 선별한 폐암 특이적 DNA 메틸화 마커와 다른 마커 세트 후보군의 AUC 값 차이를 나타내는 그래프로서, (A)는 10개 세트의 과메틸화 마커 조합, (B)는 10개 세트의 저메틸화 마커 조합, (C)는 7개 세트의 과메틸화 마커 조합 및 (D)는 7개 세트의 저메틸화 마커 조합의 결과이다.
도 6은 본 발명의 일 실시예에 따라 선별한 폐암 특이적 DNA 메틸화 마커 최소 조합을 이용하여 폐암 여부를 판단한 결과를 나타내는 ROC_AUC 그래프이다.
도 7은 본 발명의 일 실시예에 따라 선별한 페암 특이적 DNA 메틸화 마커 각각의 폐암과 정상 조직간 메틸화 수준 차이를 측정한 결과이다.
도 8은 본 발명의 일 실시예에 따라 선별한 폐암 특이적 DNA 메틸화 마커 366개 조합을 이용하여 임상 샘플에서 폐암 여부를 판단한 결과를 나타내는 ROC_AUC 그래프이다.
도 9는 본 발명의 일 실시예에 따라 선별한 페암 특이적 DNA 메틸화 마커 366개의 폐암 특이적 DNA 메틸화 마커의 성능을 임상샘플에서 확인한 그래프이다.
도 10은 본 발명의 일 실시예에 따라 선별한 폐암 특이적 DNA 메틸화 마커 20개 조합을 이용하여 임상 샘플에서 폐암 여부를 판단한 결과를 나타내는 ROC_AUC 그래프이다.
도 11은 본 발명의 일 실시예에 따라 선별한 페암 특이적 DNA 메틸화 마커 20개의 폐암 특이적 DNA 메틸화 마커의 성능을 임상샘플에서 확인한 그래프이다.
도 12는 본 발명의 일 실시예에 따라 선별한 폐암 특이적 DNA 메틸화 마커 14개 조합을 이용하여 임상 샘플에서 폐암 여부를 판단한 결과를 나타내는 ROC_AUC 그래프이다.
도 13은 본 발명의 일 실시예에 따라 선별한 페암 특이적 DNA 메틸화 마커 14개의 폐암 특이적 DNA 메틸화 마커의 성능을 임상샘플에서 확인한 그래프이다.
다른 식으로 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술 분야에서 숙련된 전문가에 의해서 통상적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로 본 명세서에서 사용된 명명법 및 이하에 기술하는 실험 방법은 본 기술 분야에서 잘 알려져 있고 통상적으로 사용되는 것이다.
본 발명에서는, 혈중 무세포 핵산의 메틸화 정보를 이용하여 폐암 여부를 진단할 수 있는 모델을 개발하고 그 정확도를 확인하고자 하였다.
본 발명에서는 TCGA 데이터베이스에 기재된 폐암 조직 샘플의 메틸화 데이터, 폐암 환자의 조직 및 혈액 샘플에서 추출한 무세포 핵산의 메틸화 데이터를 조합하여, 폐암 여부를 판별할 수 있는 DNA 메틸화 마커를 선별하였다.
즉, 본 발명의 일 실시예에서는, TCGA 데이터베이스에 기재된 폐암 조직 샘플과 정상 샘플의 메틸화 데이터를 기반으로 폐암 특이적 메틸화 영역을 선별하고, 폐암 환자와 정상인의 조직 및 혈액에서 추출한 메틸화된 DNA를 두 가지 방법으로 시퀀싱(cfMeDIP-seq, EM-seq) 한 뒤, 이를 비교하여 폐암 조직 특이적 메틸화 영역을 선별하였으며, TCGA 데이터베이스에서 선별한 메틸화 영역과 폐암 환자 조직과 정상인 조직에서 선별한 메틸화 영역에서 겹치는 영역을 선별하고, TCGA 데이터베이스에서 선별한 메틸화 영역과 폐암 환자 혈액과 정상인 혈액에서 선별한 메틸화 영역에서 겹치는 영역을 선별하고, 모든 데이터 세트에서 겹치는 영역을 1차로 선별한 다음, 이를 필터링하여 최종 마커를 선별하고, 해당 마커를 이용하여, 폐암 여부를 판단할 경우, 높은 정확도로 폐암 여부를 결정할 수 있다는 것을 확인하였다(도 2).
따라서, 본 발명은 일관점에서,
하기 표 1로 표시되는 DNA 메틸화 마커로 구성된 군에서 선택되는 2 이상의 DNA 메틸화 마커를 포함하는 폐암 진단용 DNA 메틸화 마커 조합에 관한 것이다.
염색체 | 시작위치 | 종료위치 |
chr1 | 79472407 | 79472408 |
chr1 | 79472360 | 79472361 |
chr1 | 156357838 | 156357839 |
chr3 | 147128156 | 147128157 |
chr3 | 147130535 | 147130536 |
chr7 | 27225542 | 27225543 |
chr14 | 57265874 | 57265875 |
chr16 | 87958492 | 87958493 |
chr1 | 9896308 | 9896309 |
chr2 | 10666712 | 10666713 |
chr7 | 157544911 | 157544912 |
chr8 | 978225 | 978226 |
chr11 | 2033842 | 2033843 |
chr19 | 57175042 | 57175043 |
본 발명에 있어서, 상기 폐암 진단용 DNA 메틸화 마커 조합은 하기 표 2로 표시되는 DNA 마커를 추가로 포함하는 것을 특징으로 할 수 있으나, 이에 한정되는 것은 아니다.
염색체 | 시작위치 | 종료위치 |
chr1 | 157164795 | 157164796 |
chr3 | 181442675 | 181442676 |
chr5 | 92909428 | 92909429 |
chr7 | 1303350 | 1303351 |
chr12 | 1943888 | 1943889 |
chr17 | 79652243 | 79652244 |
본 발명에 있어서, 상기 폐암 진단용 DNA 메틸화 마커 조합은 하기 표 3으로 표시되는 DNA 마커로 구성된 군에서 선택되는 2 이상의 DNA 메틸화 마커를 추가로 포함하는 것을 특징으로 할 수 있으나, 이에 한정되는 것은 아니다.
염색체 | 시작위치 | 종료위치 | 염색체 | 시작위치 | 종료위치 |
chr1 | 38412711 | 38412712 | chr12 | 132847907 | 132847908 |
chr1 | 63790044 | 63790045 | chr12 | 132892613 | 132892614 |
chr1 | 75595970 | 75595971 | chr12 | 133028690 | 133028691 |
chr1 | 79472282 | 79472283 | chr13 | 109741117 | 109741118 |
chr1 | 79472452 | 79472453 | chr13 | 109741176 | 109741177 |
chr1 | 110611218 | 110611219 | chr13 | 112200864 | 112200865 |
chr1 | 119526060 | 119526061 | chr13 | 112607846 | 112607847 |
chr1 | 119529219 | 119529220 | chr13 | 114056351 | 114056352 |
chr1 | 119532093 | 119532094 | chr13 | 114065008 | 114065009 |
chr1 | 119535928 | 119535929 | chr13 | 114065669 | 114065670 |
chr1 | 119548825 | 119548826 | chr13 | 114311898 | 114311899 |
chr1 | 170630070 | 170630071 | chr14 | 77328166 | 77328167 |
chr1 | 214153294 | 214153295 | chr14 | 100658902 | 100658903 |
chr1 | 214153460 | 214153461 | chr14 | 101334582 | 101334583 |
chr1 | 214153472 | 214153473 | chr14 | 104648347 | 104648348 |
chr10 | 81003175 | 81003176 | chr14 | 104837541 | 104837542 |
chr10 | 103043991 | 103043992 | chr14 | 104837550 | 104837551 |
chr10 | 118892211 | 118892212 | chr14 | 105031243 | 105031244 |
chr11 | 31819444 | 31819445 | chr14 | 106174668 | 106174669 |
chr12 | 54339653 | 54339654 | chr14 | 106239286 | 106239287 |
chr12 | 85667616 | 85667617 | chr14 | 106320669 | 106320670 |
chr12 | 85671811 | 85671812 | chr15 | 26235162 | 26235163 |
chr12 | 85673221 | 85673222 | chr15 | 78505051 | 78505052 |
chr13 | 79169872 | 79169873 | chr15 | 89386800 | 89386801 |
chr13 | 112726118 | 112726119 | chr16 | 605214 | 605215 |
chr13 | 112759719 | 112759720 | chr16 | 605347 | 605348 |
chr14 | 29235193 | 29235194 | chr16 | 644081 | 644082 |
chr14 | 29235196 | 29235197 | chr16 | 1052939 | 1052940 |
chr14 | 29254942 | 29254943 | chr16 | 1061053 | 1061054 |
chr14 | 57278188 | 57278189 | chr16 | 1093823 | 1093824 |
chr14 | 99729088 | 99729089 | chr16 | 1147829 | 1147830 |
chr14 | 101923256 | 101923257 | chr16 | 1233872 | 1233873 |
chr16 | 66613266 | 66613267 | chr16 | 1256295 | 1256296 |
chr16 | 86547530 | 86547531 | chr16 | 1257884 | 1257885 |
chr19 | 11785188 | 11785189 | chr16 | 1271741 | 1271742 |
chr19 | 12624466 | 12624467 | chr16 | 1271998 | 1271999 |
chr19 | 22806184 | 22806185 | chr16 | 1316081 | 1316082 |
chr19 | 58220494 | 58220495 | chr16 | 2213440 | 2213441 |
chr19 | 58220516 | 58220517 | chr16 | 2213749 | 2213750 |
chr19 | 58220657 | 58220658 | chr16 | 11770950 | 11770951 |
chr19 | 58220662 | 58220663 | chr16 | 22326535 | 22326536 |
chr19 | 58220773 | 58220774 | chr16 | 81564192 | 81564193 |
chr2 | 45159894 | 45159895 | chr16 | 85019773 | 85019774 |
chr2 | 63281844 | 63281845 | chr16 | 85678884 | 85678885 |
chr2 | 66666684 | 66666685 | chr16 | 86465884 | 86465885 |
chr2 | 73148229 | 73148230 | chr16 | 87682572 | 87682573 |
chr2 | 74875227 | 74875228 | chr16 | 87958407 | 87958408 |
chr2 | 119599459 | 119599460 | chr16 | 88442086 | 88442087 |
chr2 | 119607379 | 119607380 | chr16 | 88460610 | 88460611 |
chr2 | 119607573 | 119607574 | chr16 | 89016957 | 89016958 |
chr2 | 171676809 | 171676810 | chr16 | 89029055 | 89029056 |
chr2 | 172952948 | 172952949 | chr16 | 89110004 | 89110005 |
chr2 | 176948728 | 176948729 | chr16 | 89118838 | 89118839 |
chr2 | 176981336 | 176981337 | chr16 | 89245231 | 89245232 |
chr2 | 176986460 | 176986461 | chr16 | 89704682 | 89704683 |
chr2 | 176993017 | 176993018 | chr17 | 38860042 | 38860043 |
chr2 | 177012191 | 177012192 | chr17 | 40705588 | 40705589 |
chr2 | 177014996 | 177014997 | chr17 | 48680554 | 48680555 |
chr2 | 177015044 | 177015045 | chr17 | 49027095 | 49027096 |
chr2 | 177027043 | 177027044 | chr17 | 77174120 | 77174121 |
chr2 | 177029073 | 177029074 | chr17 | 79096529 | 79096530 |
chr2 | 177029459 | 177029460 | chr17 | 79099882 | 79099883 |
chr2 | 177029608 | 177029609 | chr17 | 79961522 | 79961523 |
chr2 | 182543233 | 182543234 | chr17 | 80342459 | 80342460 |
chr20 | 43726765 | 43726766 | chr18 | 44259973 | 44259974 |
chr3 | 138662315 | 138662316 | chr18 | 61817320 | 61817321 |
chr3 | 147111660 | 147111661 | chr18 | 76485587 | 76485588 |
chr3 | 147113918 | 147113919 | chr19 | 3936724 | 3936725 |
chr3 | 147114406 | 147114407 | chr19 | 4552496 | 4552497 |
chr3 | 147142182 | 147142183 | chr19 | 13394116 | 13394117 |
chr3 | 157812226 | 157812227 | chr19 | 18085190 | 18085191 |
chr3 | 157813327 | 157813328 | chr2 | 1133947 | 1133948 |
chr3 | 157820591 | 157820592 | chr2 | 1880012 | 1880013 |
chr3 | 157821262 | 157821263 | chr2 | 4931004 | 4931005 |
chr3 | 157821994 | 157821995 | chr2 | 4931074 | 4931075 |
chr4 | 11370466 | 11370467 | chr2 | 10638113 | 10638114 |
chr4 | 15704680 | 15704681 | chr2 | 26800399 | 26800400 |
chr4 | 41875470 | 41875471 | chr2 | 233198590 | 233198591 |
chr4 | 85402870 | 85402871 | chr2 | 239544973 | 239544974 |
chr4 | 111543401 | 111543402 | chr2 | 241083864 | 241083865 |
chr4 | 111552040 | 111552041 | chr20 | 5451900 | 5451901 |
chr4 | 174452835 | 174452836 | chr20 | 60120472 | 60120473 |
chr5 | 42952113 | 42952114 | chr20 | 60456498 | 60456499 |
chr5 | 54519023 | 54519024 | chr20 | 60456503 | 60456504 |
chr5 | 76932016 | 76932017 | chr20 | 61625364 | 61625365 |
chr5 | 76934327 | 76934328 | chr20 | 61695598 | 61695599 |
chr5 | 140536238 | 140536239 | chr20 | 61755045 | 61755046 |
chr5 | 172671754 | 172671755 | chr20 | 61792443 | 61792444 |
chr5 | 172672766 | 172672767 | chr20 | 62079911 | 62079912 |
chr6 | 10425648 | 10425649 | chr21 | 46420451 | 46420452 |
chr6 | 27648004 | 27648005 | chr21 | 46677879 | 46677880 |
chr6 | 50804147 | 50804148 | chr22 | 29704483 | 29704484 |
chr6 | 100050791 | 100050792 | chr22 | 37769171 | 37769172 |
chr6 | 100066698 | 100066699 | chr22 | 38506737 | 38506738 |
chr6 | 100903817 | 100903818 | chr22 | 43835600 | 43835601 |
chr6 | 100917397 | 100917398 | chr22 | 44708861 | 44708862 |
chr6 | 105388731 | 105388732 | chr22 | 49137906 | 49137907 |
chr6 | 134210946 | 134210947 | chr22 | 49376886 | 49376887 |
chr7 | 8482235 | 8482236 | chr22 | 49487343 | 49487344 |
chr7 | 8482325 | 8482326 | chr22 | 50470101 | 50470102 |
chr7 | 25898688 | 25898689 | chr3 | 14615134 | 14615135 |
chr7 | 26897202 | 26897203 | chr3 | 128182392 | 128182393 |
chr7 | 26897253 | 26897254 | chr3 | 134146405 | 134146406 |
chr7 | 27192056 | 27192057 | chr3 | 194078147 | 194078148 |
chr7 | 27205217 | 27205218 | chr3 | 196065306 | 196065307 |
chr7 | 27206073 | 27206074 | chr3 | 196065318 | 196065319 |
chr7 | 27225772 | 27225773 | chr3 | 196065320 | 196065321 |
chr7 | 39649443 | 39649444 | chr3 | 196065328 | 196065329 |
chr7 | 96631680 | 96631681 | chr3 | 196065569 | 196065570 |
chr7 | 96636616 | 96636617 | chr4 | 1538525 | 1538526 |
chr7 | 96642794 | 96642795 | chr5 | 476497 | 476498 |
chr7 | 129423053 | 129423054 | chr5 | 476646 | 476647 |
chr7 | 153584582 | 153584583 | chr5 | 555251 | 555252 |
chr7 | 153584597 | 153584598 | chr5 | 1003897 | 1003898 |
chr8 | 4849522 | 4849523 | chr5 | 1119025 | 1119026 |
chr8 | 65498812 | 65498813 | chr5 | 1140096 | 1140097 |
chr9 | 79638117 | 79638118 | chr5 | 1202449 | 1202450 |
chr1 | 942161 | 942162 | chr5 | 1219972 | 1219973 |
chr1 | 1267193 | 1267194 | chr5 | 1232590 | 1232591 |
chr1 | 1267201 | 1267202 | chr5 | 1244729 | 1244730 |
chr1 | 2345333 | 2345334 | chr5 | 1257084 | 1257085 |
chr1 | 2750406 | 2750407 | chr5 | 1767994 | 1767995 |
chr1 | 2764669 | 2764670 | chr5 | 2103257 | 2103258 |
chr1 | 2847632 | 2847633 | chr5 | 2132336 | 2132337 |
chr1 | 2850512 | 2850513 | chr5 | 17654594 | 17654595 |
chr1 | 2904595 | 2904596 | chr5 | 169531595 | 169531596 |
chr1 | 2936277 | 2936278 | chr5 | 180046901 | 180046902 |
chr1 | 2949633 | 2949634 | chr5 | 180047184 | 180047185 |
chr1 | 3058151 | 3058152 | chr6 | 466893 | 466894 |
chr1 | 3083061 | 3083062 | chr6 | 25218752 | 25218753 |
chr1 | 3150935 | 3150936 | chr6 | 169740781 | 169740782 |
chr1 | 3210325 | 3210326 | chr7 | 1403804 | 1403805 |
chr1 | 3495611 | 3495612 | chr7 | 4841835 | 4841836 |
chr1 | 3606892 | 3606893 | chr7 | 71177239 | 71177240 |
chr1 | 22925489 | 22925490 | chr7 | 154542060 | 154542061 |
chr1 | 35220814 | 35220815 | chr7 | 155191845 | 155191846 |
chr1 | 56880606 | 56880607 | chr7 | 157085979 | 157085980 |
chr10 | 44197967 | 44197968 | chr7 | 157502455 | 157502456 |
chr10 | 134652276 | 134652277 | chr7 | 157776887 | 157776888 |
chr10 | 134833372 | 134833373 | chr7 | 157968578 | 157968579 |
chr10 | 134833874 | 134833875 | chr7 | 158030726 | 158030727 |
chr10 | 134838656 | 134838657 | chr7 | 158331217 | 158331218 |
chr10 | 134842688 | 134842689 | chr7 | 158799715 | 158799716 |
chr10 | 134912012 | 134912013 | chr7 | 158820591 | 158820592 |
chr10 | 134928457 | 134928458 | chr8 | 1140682 | 1140683 |
chr10 | 134929181 | 134929182 | chr8 | 10753237 | 10753238 |
chr10 | 135015300 | 135015301 | chr8 | 141107113 | 141107114 |
chr10 | 135016451 | 135016452 | chr8 | 142517494 | 142517495 |
chr10 | 135018765 | 135018766 | chr8 | 142841913 | 142841914 |
chr10 | 135018844 | 135018845 | chr8 | 142841965 | 142841966 |
chr11 | 393606 | 393607 | chr8 | 143201145 | 143201146 |
chr11 | 1006121 | 1006122 | chr8 | 143208101 | 143208102 |
chr11 | 1050848 | 1050849 | chr8 | 143262200 | 143262201 |
chr11 | 1257516 | 1257517 | chr8 | 143333654 | 143333655 |
chr11 | 1464300 | 1464301 | chr8 | 143509263 | 143509264 |
chr11 | 2182540 | 2182541 | chr8 | 143535735 | 143535736 |
chr11 | 47359115 | 47359116 | chr8 | 143605535 | 143605536 |
chr11 | 61302186 | 61302187 | chr8 | 143625791 | 143625792 |
chr11 | 66104485 | 66104486 | chr8 | 143915919 | 143915920 |
chr11 | 68964113 | 68964114 | chr8 | 143915954 | 143915955 |
chr11 | 69192623 | 69192624 | chr8 | 143961145 | 143961146 |
chr11 | 69192697 | 69192698 | chr8 | 144203483 | 144203484 |
chr11 | 70781118 | 70781119 | chr8 | 144366016 | 144366017 |
chr11 | 120008998 | 120008999 | chr8 | 144416327 | 144416328 |
chr11 | 128812875 | 128812876 | chr8 | 144801223 | 144801224 |
chr12 | 2613914 | 2613915 | chr8 | 145697495 | 145697496 |
chr12 | 29650795 | 29650796 | chr8 | 145758486 | 145758487 |
chr12 | 94954828 | 94954829 | chr9 | 137718814 | 137718815 |
chr12 | 124693173 | 124693174 | chr9 | 138018566 | 138018567 |
chr12 | 131580615 | 131580616 | chr9 | 140041732 | 140041733 |
chr12 | 132680972 | 132680973 | chr9 | 140333139 | 140333140 |
chr12 | 132839436 | 132839437 |
본 발명에 용어, "DNA 메틸화(DNA methylation)"는 게놈 DNA에서 시토신 염기의 C5-위치에 메틸기가 공유결합한 것을 의미한다. 메틸화 수준은 예를 들면 모든 게놈 영역 및 일부 비-게놈 영역 내의 DNA 염기서열에 존재하는 메틸화의 양을 의미하며, 본 발명에서는 상기 DNA 메틸화 마커의 메틸화 정도를 의미한다. 상기 DNA 메틸화 마커에서 메틸화는 서열 전체 또는 일부에 걸쳐 일어날 수 있다.
본 발명에서, 상기 폐암은 폐에 발생한 악성 종양을 의미하며, 보다 구체적으로는 폐를 구성하는 조직(기관지, 세기관지, 폐포 등)에서 기원한 원발성 폐암과 다른 장기에서 생겨나 폐로 전이된 전이성 폐암을 의미한다. 원발성 폐암은 비소세포폐암(Non-small cell carcinoma) 및 소세포암(small cell carcinoma)로 이루어질 수 있으며, 비소세포폐암은 다시 편평상피세포암(squamous cell carcinoma), 선암(adenocarcinoma) 및 대세포암(large-cell carcinoma)로 이루어질 수 있다.
본 발명은 다른 관점에서,
(a) 생체 시료에서 DNA를 분리하는 단계;
(b) 상기 DNA 메틸화 마커 조합의 메틸화 수준을 검출하는 단계; 및
(c) 상기 검출된 DNA 메틸화 마커 수준이 기준값(cut-off value)을 초과할 경우, 폐암으로 판정하는 단계;
를 포함하는 폐암 진단을 위한 정보의 제공방법에 관한 것이다.
본 발명에서, 상기 DNA는 생체시료에서 추출한 DNA이면 제한없이 이용할 수 있으나, 바람직하게는 세포 유리 핵산 또는 세포 내 핵산의 조각일 수 있으나, 이에 한정되는 것은 아니다.
본 발명에서, 상기 생체시료는 개체로부터 얻어지거나 개체로부터 유래된 임의의 물질, 생물학적 체액, 조직 또는 세포를 의미하는 것으로, 예를 들면, 전혈(whole blood), 백혈구(leukocytes), 말초혈액 단핵 세포(peripheral blood mononuclear cells), 백혈구 연층(buffy coat), (혈장(plasma) 및 혈청(serum)을 포함하는) 혈액, 객담(sputum), 눈물(tears), 점액(mucus), 세비액(nasal washes), 비강 흡인물(nasal aspirate), 호흡(breath), 소변(urine), 정액(semen), 침(saliva), 복강 세척액(peritoneal washings), 골반 내 유체액(pelvic fluids), 낭종액(cystic fluid), 뇌척수막 액(meningeal fluid), 양수(amniotic fluid), 선액(glandular fluid), 췌장액(pancreatic fluid), 림프액(lymph fluid), 흉수(pleural fluid), 유두 흡인물(nipple aspirate), 기관지 흡인물(bronchial aspirate), 활액(synovial fluid), 관절 흡인물(joint aspirate), 기관 분비물(organ secretions), 세포(cell), 세포 추출물(cell extract), 정액, 모발, 타액, 소변, 구강세포, 태반세포, 뇌척수액(cerebrospinal fluid) 및 이의 혼합물을 포함할 수 있으나, 이에 한정되는 것은 아니다.
본 발명에서, 상기 (b) 단계의 메틸화 수준의 검출은 공지의 다양한 방법으로 검출할 수 있으며, 바람직하게는 바이설파이트 전환법(bisulfite conversion) 또는 메틸화 DNA 면역침강법(Methylated DNA Immunoprecipitation, MeDIP)으로 수득한 것을 특징으로 할 수 있으나, 이에 한정되는 것은 아니다
본 발명에서, DNA 메틸화를 검출할 수 있는 방법은 제한효소 기반 검출 방법이 추가로 있는데, 이는 methylation restriction enzyme(MRE)를 이용하여 메틸화 되지 않은 핵산을 절단하거나, 메틸화 여부에 상관없이 특정 서열(recognition site)를 절단하여 hybridization 방법 또는 PCR과 결합해 분석하는 방법이다.
본 발명에서 바이설파이트 치환에 기반한 방법은 Whole-Genome Bisulfite Sequencing(WGBS), Reduced-Representation Bisulfite Sequencing (RRBS), Methylated CpG Tandems Amplification and Sequencing (MCTA-seq), Targeted Bisulfite Sequencing, Methylation Array 및 Methylation-specific PCR (MSP) 등이 있다.
본 발명에서, 메틸화 DNA를 풍부화(enrichment)하여 분석하는 방법은 Methylated DNA Immunoprecipitation Sequencing (MeDIP-seq), Methyl-CpG Binding Domain Protein Capture Sequencing (MBD-seq) 등이 있다.
본 발명에서 메틸화 DNA를 분석할 수 있는 또 다른 방법은 5-hydroxymethylation profiling이 있으며, 그 예시로는 5hmC-Seal (hMe-Seal), hmC-CATCH, Hydroxymethylated DNA Immunoprecipitation Sequencing (hMeDIP-seq), Oxidative Bisulfite Conversion 등이 있다.
본 발명에 있어서, 상기 (b) 단계의 메틸화 수준의 검출은, PCR, 메틸화 특이 PCR(methylation specific PCR), 실시간 메틸화 특이 PCR(real time methylation specific PCR), 메틸화 DNA 특이적 결합 단백질을 이용한 PCR, 정량 PCR, 메틸화 특이적인 PNA를 이용하는 PCR, melting curve analysis, DNA 칩, 파이로시퀀싱, 바이설파이트 시퀀싱 및 메틸화 차세대 염기서열 시퀀싱으로 구성된 군으로부터 선택된 어느 하나의 방법을 이용하는 것을 특징으로 할 수 있으나, 이에 한정되는 것은 아니다.
본 발명에서, 차세대 유전자서열검사기(next-generation sequencer)는 당업계에 공지된 임의의 시퀀싱 방법으로 사용될 수 있다. 선택 방법에 의해 분리된 핵산의 시퀀싱은 전형적으로는 차세대 시퀀싱(NGS)을 사용하여 수행된다. 차세대 시퀀싱은 개개의 핵산 분자 또는 고도로 유사한 방식으로 개개의 핵산 분자에 대해 클론으로 확장된 프록시 중 하나의 뉴클레오타이드 서열을 결정하는 임의의 시퀀싱 방법을 포함한다(예를 들어, 105개 이상의 분자가 동시에 시퀀싱된다). 일 실시형태에서, 라이브러리 내 핵산 종의 상대적 존재비는 시퀀싱 실험에 의해 만들어진 데이터에서 그것의 동족 서열의 상대적 발생 수를 계측함으로써 추정될 수 있다. 차세대 시퀀싱 방법은 당업계에 공지되어 있고, 예를 들어 본 명세서에 참조로서 포함된 문헌(Metzker, M. (2010) Nature Biotechnology Reviews 11:31-46)에 기재된다.
일 실시형태에서, 차세대 시퀀싱은 개개의 핵산 분자의 뉴클레오타이드 서열을 결정하기 위해 한다(예를 들어, 헬리코스 바이오사이언스(Helicos BioSciences)의 헬리스코프 유전자 시퀀싱 시스템(HeliScope Gene Sequencing system) 및 퍼시픽바이오사이언스의 팩바이오 알에스 시스템(PacBio RS system)). 다른 실시형태에서, 시퀀싱, 예를 들어, 더 적지만 더 긴 리드를 만들어내는 다른 시퀀싱 방법보다 시퀀싱 단위 당 서열의 더 많은 염기를 만들어내는 대량병렬의 짧은-리드 시퀀싱(예를 들어, 캘리포니아주 샌디에고에 소재한 일루미나 인코포레이티드(Illumina Inc.) 솔렉사 시퀀서(Solexa sequencer)) 방법은 개개의 핵산 분자에 대해 클론으로 확장된 프록시의 뉴클레오타이드 서열을 결정한다(예를 들어, 캘리포니아주 샌디에고에 소재한 일루미나 인코포레이티드(Illumina Inc.) 솔렉사 시퀀서(Solexa sequencer); 454 라이프 사이언스(Life Sciences)(코네티컷주 브랜포드에 소재) 및 아이온 토렌트(Ion Torrent)). 차세대 시퀀싱을 위한 다른 방법 또는 기계는, 이하에 제한되는 것은 아니지만, 454 라이프 사이언스(Life Sciences)(코네티컷주 브랜포드에 소재), 어플라이드 바이오시스템스(캘리포니아주 포스터 시티에 소재; SOLiD 시퀀서), 헬리코스 바이오사이언스 코포레이션(매사추세츠주 캠브릿지에 소재) 및 에멀젼 및 마이크로 유동 시퀀싱 기법 나노 점적(예를 들어, 지누바이오(GnuBio) 점적)에 의해 제공된다.
차세대 시퀀싱을 위한 플랫폼은, 이하에 제한되는 것은 아니지만, 로슈(Roche)/454의 게놈 시퀀서(Genome Sequencer: GS) FLX 시스템, 일루미나(Illumina)/솔렉사(Solexa) 게놈 분석기(Genome Analyzer: GA), 라이프(Life)/APG의 서포트 올리고(Support Oligonucleotide Ligation Detection: SOLiD) 시스템, 폴로네이터(Polonator)의 G.007 시스템, 헬리코스 바이오사이언스의 헬리스코프 유전자 시퀀싱 시스템(Helicos BioSciences' HeliScope Gene Sequencing system), 옥스포드 나노포어 테크놀로지스(Oxford Nanopore Technologies)의 PromethION, GriION, MinION 시스템 및 퍼시픽 바이오사이언스(Pacific Biosciences)의 팩바이오알에스(PacBio RS) 시스템을 포함한다.
본 발명에 있어서, 상기 (b) 단계의 메틸화 수준은 베타값(beta value)으로 표시되는 것을 특징으로 할 수 있으나, 이에 한정되는 것은 아니다.
본 발명에 있어서, 상기 (c) 단계는 상기 (c) 단계는 다음의 단계를 포함하는 방법으로 수행되는 것을 특징으로 할 수 있다:
(c-i) 정상 그룹 샘플에서 수득한 베타값의 표준편차와 평균값을 계산하는 단계;
(c-ii) 하기 수식 1로 z 점수(z-score)를 계산하는 단계;
수식 1:
(c-ii) 계산된 z 점수의 합, 평균 또는 표준 편차를 계산하는 단계; 및
(c-iii) 계산된 z 점수의 합, 평균 또는 표준 편차가 기준값을 초과할 경우, 폐암인 것으로 판정하는 단계.
본 발명에 있어서, 상기 (c) 단계는 검출된 DNA 메틸화 마커 조합의 메틸화 수준의 정보를 정상 샘플의 값과 비교하여 기준값 이상 차이가 날 경우, 폐암 유무를 판정하는 단계로 수행되는 것을 특징으로 할 수 있으나, 이에 한정되는 것은 아니다.
본 발명에서, 상기 (c) 단계의 기준값은 폐암 여부를 판정할 수 있는 값이면 제한없이 사용할 수 있으며, 바람직하게는 정상 샘플의 메틸화 수준의 99% 내지 75% 일 수 있고, 더욱 바람직하게는 97% 내지 80%일 수 있으며, 가장 바람직하게는 95%일 수 있으나, 이에 한정되는 것은 아니다.
본 발명에 있어서, 상기 (c) 단계는 검출된 DNA 메틸화 마커 조합의 메틸화 수준의 정보는 각 마커의 베타 값의 합, 차, 곱, 평균, 곱의 로그, 합의 로그, 중앙값, 분위수, 최소값, 최대값, 분산, 표준편차, 절대 편차, 변동 계수, 이들의 역수값 및 조합으로 구성된 군에서 선택되는 하나 이상의 값일 수 있으나, 이에 한정되는 것은 아니다.
본 발명에서, 상기 메틸화 수준의 정보를 베타값으로 계산할 때, 과메틸화된 메틸화 마커의 베타값은 그대로 사용하고, 저메틸화된 메틸화 마커의 베타값은 100 또는 1 등의 일정 기준값에서 차감하는 방법으로 계산하거나, -1을 곱하여 계산하는 것은 통상의 기술자에게 잘 알려져 있다.
본 발명에서, 상기 (c) 단계의 기준값은 폐암 여부를 판정할 수 있는 값이면 제한없이 사용할 수 있으며, 바람직하게는 z 점수의 평균의 기준값은 0.2 내지 0.9, 더욱 바람직하게는 0.3 내지 0.8, 가장 바람직하게는 0.5 내지 0.6 사이의 값일 수 있고, z 점수 합의 기준값은 100 내지 300, 더욱 바람직하게는 150 내지 200, 가장 바람직하게는 180 내지 200 사이의 값일 수 있으며, z 점수 표준 편차의 기준값은 0.5 내지 2, 더욱 바람직하게는 0.8 내지 1.5, 가장 바람직하게는 0.9 내지 1.2 사이의 값일 수 있으나, 이에 한정되는 것은 아니다.
본 발명은 또 다른 관점에서,
상기 DNA 메틸화 마커 조합의 DNA 메틸화 마커를 각각 증폭할 수 있는 프라이머 조합을 포함하는 폐암 진단용 조성물에 관한 것이다.
본 발명에서, 상기 프라이머의 적절한 길이는 사용 목적에 따라 달라질 수 있으나, 일반적으로 15 내지 30개의 염기로 구성될 수 있다. 프라이머 서열은 주형과 완전하게 상보적일 필요는 없으나, 주형과 혼성화할 정도로 충분히 상보적이어야 한다. 상기 프라이머는 메틸화 마커를 포함하는 DNA 서열에 혼성화하여 메틸화 마커를 포함하는 DNA 단편을 증폭시킬 수 있다. 본 발명의 프라이머는 DNA 메틸화 수준을 검출하여 폐암 여부를 확인하기 위한 진단 키트나 예측 방법 등에 사용될 수 있다.
본 발명에서, 상기 DNA 메틸화 마커를 증폭할 수 있는 프라이머는 상기 마커 영역을 직접적으로 포함하지 않는 동일한 염색체의 염기서열이면 제한없이 이용가능하나, 구체적으로는 마커 영역의 5' 업스트림으로 1 내지 1000bp, 3' 다운스트림으로 1 내지 1000bp 일 수 있고, 보다 구체적으로는 마커 영역의 5' 업스트림으로 1 내지 200bp, 3' 다운스트림으로 1 내지 200bp 일 수 있으나 이에 한정되는 것은 아니다.
본 발명은 또 다른 관점에서,
상기 DNA 메틸화 마커 조합의 DNA 메티로하 마커의 메틸화된 염기를 함유하는 10개 이상의 연속 염기를 포함하는 폴리뉴클레오타이드 또는 그의 상보적인 폴리뉴클레오타이드와 특이적으로 각각 혼성화할 수 있는 프로브 조합을 포함하는 폐암 진단용 조성물에 관한 것이다.
본 발명에서, 상기 프로브는 메틸화 특이적일 수 있으며, 이는 메틸화 마커 영역의 메틸화된 핵산에만 특이적으로 혼성화하는 것을 의미한다. 여기에서, 혼성화란 보통 엄격한 조건, 예를 들어 1M 이하의 염 농도 및 25℃이상의 온도 하에서 보통 수행된다. 예를 들어, 5XSSPE (750mM NaCl, 50mM Na Phosphate, 5mM EDTA, pH 7.4) 및 25 ~ 30℃의 조건이 메틸화 특이적 프로브 혼성화에 적합할 수 있다.
본 발명에 있어서, 상기 프로브는 혼성화 프로브를 의미하는 것으로, 핵산의 상보성 가닥에 서열 특이적으로 결합할 수 있는 올리고뉴클레오티드를 의미한다. 본 발명의 메틸화 특이적 프로브는 같은 종의 두 개체로부터 유래한 핵산 단편 중에서 메틸화가 존재하여, 한 개체로부터 유래한 DNA 단편에는 혼성화 하나, 다른 개체로부터 유래한 단편에는 혼성화하지 않을 수 있다. 이 경우 혼성화 조건은 혼성화 강도에 있어서 유의한 차이를 보여 메틸화 여부에 따라 혼성화되도록 충분히 엄격해야 한다. 이러한 본 발명의 프로브는 중앙 부위가 메틸화 마커의 영역에 정렬하는 것이 바람직하다. 본 발명의 프로브는 DNA 메틸화 수준을 검출하여 폐암 여부를 확인하기 위한 진단 키트나 예측 방법 등에 사용될 수 있다.
본 발명은 또 다른 관점에서,
상기 조성물 중 어느 하나를 포함하는 조성물을 폐암 진단용 키트에 관한 것이다.
본 발명에서 상기 키트는 본 발명의 폴리뉴클레오티드 뿐만 아니라 분석 방법에 적합한 한 종류 또는 그 이상의 다른 구성 성분 조성물, 용액 또는 장치가 포함될 수 있다. 일 양태로서, 본 발명의 키트는 PCR을 수행하기 위해 필요한 필수 요소를 포함하는 키트일 수 있으며, 테스트 튜브 또는 다른 적절한 컨테이너, 반응 완충액 (pH 및 마그네슘 농도는 다양), 데옥시뉴클레오타이드 (dNTPs), Taq-폴리머라아제 및 역전사 효소와 같은 효소, DNase, RNAse 억제제, DEPC-수 (DEPC-water) 및 멸균수 등을 추가로 포함할 수 있다. 다른 일 양태로서, 본 발명의 키트는 DNA 칩을 수행하기 위해 필요한 필수 요소를 포함하는 혈중 스타틴 농도 예측용 키트일 수 있으며, DNA 칩 키트는 상기 메틸화에 대한 특이적인 폴리뉴클레오티드, 프라이머 또는 프로브가 부착되어 있는 기판을 포함하고 기판은 정량 대조구 유전자 또는 그의 단편에 해당하는 핵산을 포함할 수 있다.
실시예
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지는 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예 1. TCGA methylation 450K array 데이터에서 폐암 특이적 메틸화 영역 선별
The Cancer Genome Atlas (TCGA)에서 Infinium Human Methylation 450K BeadChip array 데이터(UCSC Xena, http://xena.ucsc.edu)를 사용하여 메틸화 정도를 확인하였다. 조직으로부터 추출된 DNA는 바이설파이트 처리를 통해 변환되며, DNA 메틸화 여부는 사이토신 염기의 변형을 통해 확인할 수 있다. 각 영역마다 메틸화 정도를 확인할 수 있으며, 메틸화 정도를 나타내는 값인 베타 값(beta value)을 사용하여 폐암 조직과 주변 정상 조직간의 차별적으로 메틸화된 영역을 선별하였다.
TCGA methylation 450k array 데이터를 표 4 및 표 5와 같이 폐의 선암과폐의 편평상피세포암으로 구분하고, Train, Test 그룹으로 나누어 진행하였고, Train 그룹을 이용하여 마커 선정을 수행 하였다.
LUAD (선암) |
Primary Solid Tumor | Solid Tissue Normal | Normal whole blood | Total |
Train | 320 | 32 | 459 | 811 |
Test | 138 | - | 197 | 335 |
Total | 458 | 32 | 656 | 1,146 |
LUSC (편평상피세포암) |
Primary Solid Tumor | Solid Tissue Normal | Normal whole blood | Total |
Train | 259 | 42 | 459 | 760 |
Test | 111 | - | 197 | 308 |
Total | 370 | 42 | 656 | 1,068 |
먼저, 약 48만개(480K)의 영역에서 결측값(missing value)을 제외한 다음,
폐의 선암 특이적 메틸화 영역 선별을 위해서는 Limma(Linear Models for Microarray Data) software를 사용하여 FDR값이 0.01미만이면서 absolute delta beta가 0.25 초과인 영역을 선정하여, 폐의 선암 특이적인 617개의 저메틸화 CpG와 3,114개의 과메틸화 CpG를 선별하였다.
폐의 편평상피세포암 특이적 메틸화 영역 선별을 위해서는 Limma(Linear Models for Microarray Data) software를 사용하여 FDR값이 0.01미만이면서 absolute delta beta가 0.25 초과인 영역을 선정하여, 폐의 편평상피세포암 특이적인 8,105개의 저메틸화 CpG와 5,486개의 과메틸화 CpG를 선별하였다.
실시예 2. 혈액에서 메틸화된 cfDNA를 추출하여, 차세대 염기서열 분석 수행(cfMeDIP-Seq)
폐암 환자 25명 및 정상인 190명의 혈액을 채취 후 3000 rpm, 25℃10분의 조건으로 혈장 부분만 1차 원심 분리한 다음, 1차 원심 분리된 혈장을 16000g, 25℃10분의 조건으로 2차 원심분리하여 침전물을 제외한 혈장 상층액을 분리하였다. 분리된 혈장에 대해 chemagen DNA kit 사용하여 cell-free DNA를 추출하고, Truseq Nano DNA HT library prep kit (Illumina)를 사용해 adaptor ligation 과정까지 수행한 다음, cfMeDIP kit (diagnode)의 antibody를 이용해 10 rpm, 4℃17시간 반응하여 5mC immunoprecipitation을 진행하였다. 이 후 purification을 진행하고, 다시 Truseq Nano DNA HT library prep kit (Illumina)를 사용해 PCR enrichment를 진행하여, 최종적인 library를 제작하였다. 제작한 library는 Novaseq 6000 (Illumina) 를 150 paired-end 모드로 sequencing을 진행하였고 샘플 당 약 100 million 개의 reads를 생산하였다.
실시예 3. cfMeDIP-Seq 데이터 분석을 통한 폐암 특이적 메틸화 영역 선별
실시예 2에서 메틸화 된 세포 유리 핵산을 sequencing하였기 때문에, 확보되는 핵산 단편 데이터는 메틸화가 되어있고, 이를 휴먼 참조 유전체에 정렬을 하여 전체 휴먼 유전체 영역에서 메틸화가 된 영역들을 확인 할 수 있다. MeDIP-Seq 데이터는 메틸화된 영역을 나타내며, 300bp bin당 정규화된 값(normalized value)을 사용하여 폐암 그룹과 정상 그룹간의 차별적으로 메틸화 된 영역을 선별하였다.
cfMeDIP-Seq 데이터는 하기 표 6과 같이 Train, Test 그룹으로 나누어 진행하였다. Train 그룹을 이용하여 마커 선정을 수행하였으며, test 그룹으로 마커의 성능을 확인하였다.
Lung cancer | Normal | Total | |
Train | 19 | 152 | 171 |
Test | 6 | 38 | 44 |
Total | 25 | 190 | 215 |
먼저,
Trim Galore(version 0.6.6)를 이용하여 fastq 파일에서 adapter trimming과 quality trimming을 수행한 다음, bwa(version 0.7.17-r1188) alignment tool을 이용하여 핵산 단편 데이터를 참조 유전체(hg19)에 정렬하고, samtools rmdup (version 1.11) tool을 이용하여 PCR duplicate 핵산 단편을 제거한 후, samtools view (version 1.11) tool을 이용하여 mapping quality가 10미만인 핵산 단편을 제거한 뒤, chr1~22, X, Y만을 남기고 제거하고, 성염색체를 제외하고 겹치지 않게 300bp bin으로 binning한 후, 300bp bin당 read count 값을 생성하였다.Blacklist region(Low_mappability_island, centromeric_repeat …과 bin당 전체 샘플에서 read count 총합이 10이하인 bin을 제외하였다.
edgeR(Empirical Analysis of Digital Gene Expression Data in R) software를 사용하여 300bp bin당 정규화된 값을(TMM normalized value) 생성하였다.
마지막으로, edgeR software를 사용하여 FDR값이 0.05미만이고 log2 fold change의 절대값이 2초과인 폐암 특이적인 120,176개의 과메틸화 영역과 185,638개의 저메틸화 영역을 선별한 다음, 선별된 bin에 포함되어 있는 CpG를 추출하였다.
그 다음, TCGA array data & cfMeDIP-seq data에서 동일하게 발견된 138개의 과메틸화 CpG와 1309개의 저메틸화 CpG를 포함하는 bin으로 폐암과 정상 그룹간의 구분하는 모델을 제작하였고 test 그룹에서 accuracy 0.98, AUC 1.00의 성능을 확인하였다
실시예 4. EM-seq(Enzymatic Methylation sequencing) 수행
4-1. Whole genome EM-seq
폐암 환자 7명 및 정상인 10명의 혈액을 채취한 다음, 3000 rpm, 25℃10분의 조건으로 혈장 부분만 1차 원심분리하고, 1차 원심분리된 혈장을 16000g, 25℃10분의 조건으로 2차 원심분리하여 Plasma 분리 후, Buffy coat 400 ul를 분리하여 QIAmp DNA mini Kit(Qiagen, Germany)를 사용하여 genomic DNA를 추출하였다.
또한 상기 폐암 환자 7명의 폐암 조직 및 주변 정상 조직의 Fresh Frozen tissue 10-30ng을 FastPrep-24를 사용하여 조직을 파쇄 시킨 후 QIAmp DNA mini Kit(Qiagen, Germany)를 사용하여 genomic DNA를 추출하였다.
상기 조직과 혈액에서 추출한 genomic DNA 농도 측정은 Qubit DS DNA HS assay Kit(Thermo Fisher Scientific, USA)으로 진행하고, Nanodrop으로 순도를 한 다음, 200ng의 DNA 50ul을 Covaris를 사용해 240-290bp에 맞춰 DNA shearing을 진행하였으며, Tapestation 4200 (Agilent, USA)으로 D1000 screen tape & reagent (Agilent, USA)를 사용해 DNA size를 확인하였다.
200ng sheared DNA를 ten-eleven translocation dioxygenase 2(TET2)와 APOBEC을 사용해 un-methylated cytosine을 Uracil로 치환하는 과정을 거쳐 methylation conversion을 한 뒤 enzymatic methyl-seq (NEB Kit)를 사용하여 library 제작한 다음, 제작한 DNA library의 농도와 size를 각각 Qubit DS DNA HS assay Kit(Thermo Fisher Scientific, USA)과 Tapestation 4200(Agilent, USA)을 사용해 측정한 후, Novaseq 6000 (Illumina) 를 150 paired-end 모드로 Final 농도를 2nM에 맞추어 sequencing을 진행하여, 샘플 당 약 650 milion 개의 reads를 생산 하였다.
4-2. cfDNA Targeted methylome panel 기반 EM-Seq
Methylome panel은 Twist Human Methylome Panel(Twist Bioscience, USA)을 사용하였다.
실시예 4-1의 폐암 환자 7명을 포함하는 폐암 환자 12명 및 정상인 7명의 혈액을 채취한 다음, 3000 rpm, 25℃10분의 조건으로 혈장 부분만 1차 원심분리한 다음, 1차 원심 분리된 혈장을 16000g, 25℃10분의 조건으로 2차 원심분리하여 침전물을 제외한 혈장 상층액을 분리하고, 분리한 혈장에 대해 Mag-bind cfDNA kit 사용하여 cell-free DNA를 추출하고 농도는 Qubit DS DNA HS assay Kit(Thermo Fisher Scientific, USA)를 사용하여 측정하였다. 추출한 cfDNA의 최대량을 사용하여 ten-eleven translocation dioxygenase 2(TET2)와 APOBEC을 사용해 un-methylated cytosine을 Uracil로 치환하는 과정을 거쳐 methylation conversion을 한 뒤 enzymatic methyl-seq (NEB Kit)를 사용하여 library 제작하였다.
제작한 DNA library의 농도와 size를 각각 Qubit DS DNA HS assay Kit(Thermo Fisher Scientific, USA)과 Tapestation 4200(Agilent, USA)을 사용해 측정하였다. 200ng의 Library를 8검체씩 pooling하여, Hybridization 진행한 다음, capture된 샘플을 Tapestation 4200(Agilent, USA)으로 High sensitivity D1000 screen tape & Reagent(Agilent, USA)를 사용하여 농도를 측정하였다. Novaseq 6000 (Illumina) 를 150 paired-end 모드로 Final 농도를 2nM에 맞추어 sequencing을 진행하여, 샘플 당 약 150milion 개의 reads를 생산 하였다.
실시예 5. EM-seq 데이터 분석을 통한 폐암 특이적 메틸화 영역 선별
메틸화 된 세포 유리 핵산을 sequencing하였기 때문에, 확보되는 핵산 단편 데이터는 메틸화가 되어있고, 이를 휴먼 참조 유전체에 정렬을 하여 전체 휴먼 유전체 영역에서 메틸화가 된 영역들을 확인할 수 있다. EM-Seq 데이터는 메틸화된 Cytosine은 그대로 Cytosine으로 남아있고, 메틸화되지 않은 Cytosine들은 Thymine으로 변환되어 메틸화된 CpG와 메틸화된 정도를 확인할 수 있다. 폐암 그룹과 정상인 그룹간의 차별적으로 메틸화 된 CpG를 선별하였다.
EM-seq 데이터는 하기 표 7 및 8과 같이 Discovery, External 그룹으로 나누어 진행하였고, whole genome EM-seq data을 이용하여 마커 선정을 하고 Twist methylome panel의 External 그룹을 이용하여 feature filtering을 진행하였고, 전체 Twist methylome panel data 사용하여 cancer 여부를 분류하였다.
WGEM-seq | Lung cancer tissue | Normal tissue | WBC | Total |
Total | 7 | 7 | 10 | 24 |
Panel | Lung cancer | Normal | Total |
Discovery | 7 | - | 7 |
External | 5 | 7 | 12 |
Total | 12 | 7 | 19 |
먼저, Trim Galore(version 0.6.6)를 이용하여 fastq 파일에서 adapter trimming과 quality trimming을 수행한 다음, Bismark(version 0.23.0) alignment tool을 이용하여 핵산 단편 데이터를 참조 유전체(hg19)에 정렬하고, Samtools view (version 1.11) tool을 이용하여 mapping quality가 10이상이고 chr1~22,X,Y의 핵산 단편만 선별한 뒤, Bismark(version 0.23.0)의 bismark_methylation_extractor를 활용하여 methylation calling을 진행하였다.methylKit (version 1.12.0) R package를 이용하여 Tumor, Normal sample들의 beta value(methylation percentage)값을 하나의 파일로 merge한 다음, methylKit(version 1.12.0) R package를 이용하여 Difference의 절대값이 25 초과이고 qvalue가 0.01미만인 CpG들을 선별하였다.
상기 방법으로 폐의 조직과 주변 정상 조직간의 차별적으로 메틸화 된 CpG를 선별한 결과, 폐암 특이적으로 과메틸화된 72,113개의 CpG와 저메틸화된 260,606개의 CpG를 선별하였고, 폐의 정상조직과 정상 전혈(WBC)간의 차별적으로 메틸화 된 CpG를 선별한 결과, 폐 조직 특이적으로 과메틸화된 108,548개의 CpG와 저메틸화된 387,282개의 CpG를 선별하였다.
상기 선별한 CpG들 중에 중복되는 CpG들을 선별하여 과메틸 CpG 13,196개와 저메틸화된 CpG 54,239개를 선별하였다.
실시예 6. 최종 마커 선별
실시예 1 및 3에서 동일하게 발견되는 138개의 과메틸화 CpG와 1,309개의 저메틸화 CpG를 선별하였으며, 실시예 1 및 5에서 동일하게 발견되는 362개의 과메틸화 CpG와 101개의 저메틸화 CpG를 각각 선별한 다음, 중복없이 통합하여 1차 종합영역으로 489개의 과메틸화 CpG 및 1,401개의 저메틸화 CpG들을 선별하였다.
선별한 1차 종합 CpG들 중 폐암 특이적으로 더 유의미한 CpG들을 골라내기 위해 상기 표 6의 cfDNA Targeted methylome panel을 이용한 EM-Seq 데이터 중 External set에 기반한 filtering 과정을 수행하였다.
우선, 1차 종합 CpG들의 beta value으로 폐암 그룹과 정상 그룹을 구분하는 AUC를 계산하여 AUC가 6.5이상인 유의미한 CpG들을 선별하였다.
아울러, 폐암 그룹과 정상 그룹과의 Difference의 절대값이 3이상, qvalue의 절대값이 0.05미만이고, 정상 그룹의 standard deviation(SD)의 절대값이 0.05보다 작은 CpG들을 선별하였다.
상기 두 필터링에서 선별한 CpG들을 중복없이 합하여, 130개의 과메틸화 CpG 및 236개의 저메틸화 CpG를 최종적으로 선별하였다.
선별한 366개의 메틸화 마커 리스트는 하기 표 9와 같다.
염색체 | 시작위치 | 종료위치 | 유전자 | illumina ProbID | gain/loss |
chr1 | 38412711 | 38412712 | INPP5B | cg17949727,cg10784030 | gain |
chr1 | 63790044 | 63790045 | FOXD3 | . | gain |
chr1 | 75595970 | 75595971 | LHX8 | . | gain |
chr1 | 79472282 | 79472283 | ADGRL4 | cg14319235 | gain |
chr1 | 79472343 | 79472344 | ADGRL4 | cg21113740,cg04360793 | gain |
chr1 | 79472361 | 79472362 | ADGRL4 | cg04360793,cg15084543 | gain |
chr1 | 79472408 | 79472409 | ADGRL4 | cg15084543 | gain |
chr1 | 79472452 | 79472453 | ADGRL4 | . | gain |
chr1 | 110611218 | 110611219 | ALX3 | cg11071207 | gain |
chr1 | 119526060 | 119526061 | TBX15 | . | gain |
chr1 | 119529219 | 119529220 | TBX15 | cg05363616 | gain |
chr1 | 119532093 | 119532094 | TBX15 | cg24884142 | gain |
chr1 | 119535928 | 119535929 | TBX15 | . | gain |
chr1 | 119548825 | 119548826 | . | cg01959730 | gain |
chr1 | 156357839 | 156357840 | . | cg22353551,cg17966560 | gain |
chr1 | 157164796 | 157164797 | . | cg09504320 | gain |
chr1 | 170630070 | 170630071 | PRRX1 | . | gain |
chr1 | 214153294 | 214153295 | . | . | gain |
chr1 | 214153460 | 214153461 | . | . | gain |
chr1 | 214153472 | 214153473 | . | cg25742246 | gain |
chr10 | 81003175 | 81003176 | ZMIZ1 | cg14371731 | gain |
chr10 | 103043991 | 103043992 | . | cg01812599,cg19507206 | gain |
chr10 | 118892211 | 118892212 | VAX1 | . | gain |
chr11 | 31819444 | 31819445 | PAX6 | cg21016855,cg06666008 | gain |
chr12 | 54339653 | 54339654 | HOXC13 | cg03239552 | gain |
chr12 | 85667616 | 85667617 | . | cg16733705 | gain |
chr12 | 85671811 | 85671812 | ALX1 | . | gain |
chr12 | 85673221 | 85673222 | ALX1 | . | gain |
chr13 | 79169872 | 79169873 | OBI1-AS1 | . | gain |
chr13 | 112726118 | 112726119 | . | cg14582400 | gain |
chr13 | 112759719 | 112759720 | . | cg13692446 | gain |
chr14 | 29235193 | 29235194 | FOXG1 | . | gain |
chr14 | 29235196 | 29235197 | FOXG1 | cg25078444 | gain |
chr14 | 29254942 | 29254943 | LINC01551 | cg11226913 | gain |
chr14 | 57265875 | 57265876 | . | cg18280830,cg27175093 | gain |
chr14 | 57278188 | 57278189 | OTX2-AS1 | cg18451814 | gain |
chr14 | 99729088 | 99729089 | BCL11B | . | gain |
chr14 | 101923256 | 101923257 | . | . | gain |
chr16 | 66613266 | 66613267 | CMTM2 | cg16626067,cg09854734, cg06666025 |
gain |
chr16 | 86547530 | 86547531 | FOXF1 | cg00551679,cg02783918 | gain |
chr19 | 11785188 | 11785189 | ZNF833P | . | gain |
chr19 | 12624466 | 12624467 | ZNF709 | . | gain |
chr19 | 22806184 | 22806185 | . | . | gain |
chr19 | 58220494 | 58220495 | ZNF776 | . | gain |
chr19 | 58220516 | 58220517 | ZNF776 | cg21790626 | gain |
chr19 | 58220657 | 58220658 | ZNF776 | . | gain |
chr19 | 58220662 | 58220663 | ZNF776 | cg03234186 | gain |
chr19 | 58220773 | 58220774 | ZNF776 | . | gain |
chr2 | 45159894 | 45159895 | . | . | gain |
chr2 | 63281844 | 63281845 | OTX1 | cg00445405 | gain |
chr2 | 66666684 | 66666685 | MEIS1 | . | gain |
chr2 | 73148229 | 73148230 | EMX1 | . | gain |
chr2 | 74875227 | 74875228 | M1AP | cg20945085 | gain |
chr2 | 119599459 | 119599460 | . | cg20175390 | gain |
chr2 | 119607379 | 119607380 | EN1 | cg03726556,cg14228146 | gain |
chr2 | 119607573 | 119607574 | EN1 | cg17030233,cg18093372 | gain |
chr2 | 171676809 | 171676810 | GAD1 | . | gain |
chr2 | 172952948 | 172952949 | DLX1 | . | gain |
chr2 | 176948728 | 176948729 | EVX2 | cg01749491,cg11359133, cg07411620 |
gain |
chr2 | 176981336 | 176981337 | HOXD10 | cg05979020 | gain |
chr2 | 176986460 | 176986461 | HOXD9 | cg08363794 | gain |
chr2 | 176993017 | 176993018 | HOXD8 | . | gain |
chr2 | 177012191 | 177012192 | MIR10B | cg04194947 | gain |
chr2 | 177014996 | 177014997 | MIR10B | . | gain |
chr2 | 177015044 | 177015045 | MIR10B | cg25942990 | gain |
chr2 | 177027043 | 177027044 | HOXD3 | cg06316886 | gain |
chr2 | 177029073 | 177029074 | HOXD3 | . | gain |
chr2 | 177029459 | 177029460 | HOXD3 | cg24541426 | gain |
chr2 | 177029608 | 177029609 | HOXD3 | . | gain |
chr2 | 182543233 | 182543234 | NEUROD1 | cg16640855 | gain |
chr20 | 43726765 | 43726766 | KCNS1 | cg07160746 | gain |
chr3 | 138662315 | 138662316 | FOXL2NB | cg15931949 | gain |
chr3 | 147111660 | 147111661 | ZIC4 | . | gain |
chr3 | 147113918 | 147113919 | ZIC4 | cg12892506 | gain |
chr3 | 147114406 | 147114407 | ZIC4 | cg00028935 | gain |
chr3 | 147128157 | 147128158 | ZIC4 | cg12595013 | gain |
chr3 | 147130536 | 147130537 | ZIC1 | cg19029181 | gain |
chr3 | 147142182 | 147142183 | . | cg01150433 | gain |
chr3 | 157812226 | 157812227 | . | . | gain |
chr3 | 157813327 | 157813328 | . | . | gain |
chr3 | 157820591 | 157820592 | SHOX2 | cg18194945 | gain |
chr3 | 157821262 | 157821263 | SHOX2 | cg04521004 | gain |
chr3 | 157821994 | 157821995 | SHOX2 | cg04913979 | gain |
chr3 | 181442676 | 181442677 | SOX2-OT | cg01783662,cg11362010 | gain |
chr4 | 11370466 | 11370467 | MIR572 | cg11636702 | gain |
chr4 | 15704680 | 15704681 | BST1 | cg00731785 | gain |
chr4 | 41875470 | 41875471 | . | cg05036656 | gain |
chr4 | 85402870 | 85402871 | . | . | gain |
chr4 | 111543401 | 111543402 | PITX2 | cg05835105 | gain |
chr4 | 111552040 | 111552041 | PITX2 | cg26708319 | gain |
chr4 | 174452835 | 174452836 | HAND2-AS1 | . | gain |
chr5 | 42952113 | 42952114 | . | . | gain |
chr5 | 54519023 | 54519024 | MCIDAS | cg04286194 | gain |
chr5 | 76932016 | 76932017 | OTP | . | gain |
chr5 | 76934327 | 76934328 | OTP | . | gain |
chr5 | 92909429 | 92909430 | NR2F1-AS1 | cg15143788 | gain |
chr5 | 140536238 | 140536239 | PCDHB17P | . | gain |
chr5 | 172671754 | 172671755 | . | . | gain |
chr5 | 172672766 | 172672767 | . | . | gain |
chr6 | 10425648 | 10425649 | . | cg22367191 | gain |
chr6 | 27648004 | 27648005 | . | . | gain |
chr6 | 50804147 | 50804148 | TFAP2B | cg24641186 | gain |
chr6 | 100050791 | 100050792 | PRDM13 | cg27112666,cg04670802 | gain |
chr6 | 100066698 | 100066699 | . | cg00792513 | gain |
chr6 | 100903817 | 100903818 | SIM1 | . | gain |
chr6 | 100917397 | 100917398 | SIM1 | . | gain |
chr6 | 105388731 | 105388732 | LIN28B-AS1 | cg03738025 | gain |
chr6 | 134210946 | 134210947 | TCF21 | . | gain |
chr7 | 8482235 | 8482236 | NXPH1 | cg12597389 | gain |
chr7 | 8482325 | 8482326 | NXPH1 | . | gain |
chr7 | 25898688 | 25898689 | . | cg03190219 | gain |
chr7 | 26897202 | 26897203 | SKAP2 | cg09426383 | gain |
chr7 | 26897253 | 26897254 | SKAP2 | cg20747577 | gain |
chr7 | 27192056 | 27192057 | HOXA-AS3 | cg10739556,cg24398479 | gain |
chr7 | 27205217 | 27205218 | HOXA9 | cg05065989 | gain |
chr7 | 27206073 | 27206074 | HOXA9 | cg15506609 | gain |
chr7 | 27225523 | 27225524 | HOXA11-AS | cg10657141 | gain |
chr7 | 27225528 | 27225529 | HOXA11-AS | cg10657141,cg05311410 | gain |
chr7 | 27225543 | 27225544 | HOXA11-AS | cg10657141,cg05311410, cg17466857 |
gain |
chr7 | 27225772 | 27225773 | HOXA11-AS | cg07116997 | gain |
chr7 | 39649443 | 39649444 | LOC646999 | . | gain |
chr7 | 96631680 | 96631681 | DLX6-AS1 | . | gain |
chr7 | 96636616 | 96636617 | DLX6-AS1 | cg03774463 | gain |
chr7 | 96642794 | 96642795 | DLX6-AS1 | cg10205928 | gain |
chr7 | 129423053 | 129423054 | . | . | gain |
chr7 | 153584582 | 153584583 | DPP6 | cg06495961,cg14523847, cg27032232 |
gain |
chr7 | 153584597 | 153584598 | DPP6 | cg14523847,cg27032232 | gain |
chr8 | 4849522 | 4849523 | CSMD1 | . | gain |
chr8 | 65498812 | 65498813 | LOC401463 | . | gain |
chr9 | 79638117 | 79638118 | . | cg00959431 | gain |
chr1 | 942161 | 942162 | . | cg13219080,cg09364122 | loss |
chr1 | 1267193 | 1267194 | TAS1R3 | cg13246026 | loss |
chr1 | 1267201 | 1267202 | TAS1R3 | . | loss |
chr1 | 2345333 | 2345334 | PEX10 | . | loss |
chr1 | 2750406 | 2750407 | . | cg06711333 | loss |
chr1 | 2764669 | 2764670 | . | . | loss |
chr1 | 2847632 | 2847633 | . | cg14165772 | loss |
chr1 | 2850512 | 2850513 | . | . | loss |
chr1 | 2904595 | 2904596 | . | . | loss |
chr1 | 2936277 | 2936278 | ACTRT2 | cg17025560,cg14093144 | loss |
chr1 | 2949633 | 2949634 | . | cg06201717,cg19825898, cg24150662 |
loss |
chr1 | 3058151 | 3058152 | PRDM16 | cg05343184 | loss |
chr1 | 3083061 | 3083062 | PRDM16 | cg03391389 | loss |
chr1 | 3150935 | 3150936 | PRDM16 | . | loss |
chr1 | 3210325 | 3210326 | PRDM16 | cg10328768 | loss |
chr1 | 3495611 | 3495612 | MEGF6 | . | loss |
chr1 | 3606892 | 3606893 | TP73 | cg23163013 | loss |
chr1 | 9896309 | 9896310 | . | cg20488341 | loss |
chr1 | 22925489 | 22925490 | EPHA8 | cg22493620,cg09940915 | loss |
chr1 | 35220814 | 35220815 | GJB4 | cg01333788,cg27632959 | loss |
chr1 | 56880606 | 56880607 | . | cg18090390 | loss |
chr10 | 44197967 | 44197968 | . | cg02112154 | loss |
chr10 | 134652276 | 134652277 | CFAP46 | . | loss |
chr10 | 134833372 | 134833373 | . | cg18720533,cg02401524 | loss |
chr10 | 134833874 | 134833875 | . | cg03030984 | loss |
chr10 | 134838656 | 134838657 | . | . | loss |
chr10 | 134842688 | 134842689 | . | . | loss |
chr10 | 134912012 | 134912013 | ADGRA1 | . | loss |
chr10 | 134928457 | 134928458 | ADGRA1 | . | loss |
chr10 | 134929181 | 134929182 | ADGRA1 | . | loss |
chr10 | 135015300 | 135015301 | KNDC1 | . | loss |
chr10 | 135016451 | 135016452 | KNDC1 | . | loss |
chr10 | 135018765 | 135018766 | KNDC1 | . | loss |
chr10 | 135018844 | 135018845 | KNDC1 | . | loss |
chr11 | 393606 | 393607 | PKP3 | cg03547062,cg18308516 | loss |
chr11 | 1006121 | 1006122 | AP2A2 | cg24716664 | loss |
chr11 | 1050848 | 1050849 | . | . | loss |
chr11 | 1257516 | 1257517 | MUC5B | . | loss |
chr11 | 1464300 | 1464301 | BRSK2 | . | loss |
chr11 | 2033843 | 2033844 | . | cg25068071 | loss |
chr11 | 2182540 | 2182541 | INS | . | loss |
chr11 | 47359115 | 47359116 | MYBPC3 | cg05649391 | loss |
chr11 | 61302186 | 61302187 | SYT7 | . | loss |
chr11 | 66104485 | 66104486 | RIN1 | cg14042308,cg23220439 | loss |
chr11 | 68964113 | 68964114 | . | . | loss |
chr11 | 69192623 | 69192624 | . | . | loss |
chr11 | 69192697 | 69192698 | . | cg03888946 | loss |
chr11 | 70781118 | 70781119 | SHANK2 | . | loss |
chr11 | 120008998 | 120008999 | TRIM29 | cg24593464,cg02280132 | loss |
chr11 | 128812875 | 128812876 | TP53AIP1 | cg04817300,cg22837015, cg19275133 |
loss |
chr12 | 1943889 | 1943890 | CACNA2D4 | cg02505216 | loss |
chr12 | 2613914 | 2613915 | CACNA1C | cg02140020,cg12205822 | loss |
chr12 | 29650795 | 29650796 | OVCH1 | cg07854132,cg22535349 | loss |
chr12 | 94954828 | 94954829 | MIR5700 | . | loss |
chr12 | 124693173 | 124693174 | ZNF664-RFLNA | cg05619449 | loss |
chr12 | 131580615 | 131580616 | ADGRD1 | cg24098252 | loss |
chr12 | 132680972 | 132680973 | GALNT9 | cg03225476 | loss |
chr12 | 132839436 | 132839437 | GALNT9 | . | loss |
chr12 | 132847907 | 132847908 | GALNT9 | . | loss |
chr12 | 132892613 | 132892614 | GALNT9 | cg08899593 | loss |
chr12 | 133028690 | 133028691 | . | . | loss |
chr13 | 109741117 | 109741118 | MYO16 | . | loss |
chr13 | 109741176 | 109741177 | MYO16 | . | loss |
chr13 | 112200864 | 112200865 | . | . | loss |
chr13 | 112607846 | 112607847 | . | cg08644897 | loss |
chr13 | 114056351 | 114056352 | . | . | loss |
chr13 | 114065008 | 114065009 | . | . | loss |
chr13 | 114065669 | 114065670 | . | . | loss |
chr13 | 114311898 | 114311899 | ATP4B | cg17363387 | loss |
chr14 | 77328166 | 77328167 | LRRC74A | cg18269382 | loss |
chr14 | 100658902 | 100658903 | . | cg23112821,cg01538305 | loss |
chr14 | 101334582 | 101334583 | MIR493 | . | loss |
chr14 | 104648347 | 104648348 | . | . | loss |
chr14 | 104837541 | 104837542 | . | cg08037115 | loss |
chr14 | 104837550 | 104837551 | . | . | loss |
chr14 | 105031243 | 105031244 | . | cg10426658 | loss |
chr14 | 106174668 | 106174669 | . | cg16279237 | loss |
chr14 | 106239286 | 106239287 | . | . | loss |
chr14 | 106320669 | 106320670 | . | cg23684139 | loss |
chr15 | 26235162 | 26235163 | LINC02346 | . | loss |
chr15 | 78505051 | 78505052 | ACSBG1 | . | loss |
chr15 | 89386800 | 89386801 | ACAN | . | loss |
chr16 | 605214 | 605215 | . | cg10396171 | loss |
chr16 | 605347 | 605348 | . | . | loss |
chr16 | 644081 | 644082 | RAB40C | . | loss |
chr16 | 1052939 | 1052940 | . | cg08438529 | loss |
chr16 | 1061053 | 1061054 | . | cg05970874 | loss |
chr16 | 1093823 | 1093824 | . | cg10129154 | loss |
chr16 | 1147829 | 1147830 | C1QTNF8 | cg27136719 | loss |
chr16 | 1233872 | 1233873 | CACNA1H | cg06008356 | loss |
chr16 | 1256295 | 1256296 | CACNA1H | cg09842735 | loss |
chr16 | 1257884 | 1257885 | CACNA1H | cg16453617 | loss |
chr16 | 1271741 | 1271742 | CACNA1H | . | loss |
chr16 | 1271998 | 1271999 | TPSG1 | cg05042366 | loss |
chr16 | 1316081 | 1316082 | . | cg08197072 | loss |
chr16 | 2213440 | 2213441 | TRAF7 | cg04987122 | loss |
chr16 | 2213749 | 2213750 | TRAF7 | cg02925248 | loss |
chr16 | 11770950 | 11770951 | SNN | . | loss |
chr16 | 22326535 | 22326536 | POLR3E | cg10508883 | loss |
chr16 | 81564192 | 81564193 | CMIP | cg01033642 | loss |
chr16 | 85019773 | 85019774 | ZDHHC7 | . | loss |
chr16 | 85678884 | 85678885 | GSE1 | cg01767053 | loss |
chr16 | 86465884 | 86465885 | . | cg01882058 | loss |
chr16 | 87682572 | 87682573 | JPH3 | cg05443795 | loss |
chr16 | 87958407 | 87958408 | CA5A | cg04352288 | loss |
chr16 | 87958493 | 87958494 | CA5A | cg06948222 | loss |
chr16 | 88442086 | 88442087 | . | . | loss |
chr16 | 88460610 | 88460611 | . | . | loss |
chr16 | 89016957 | 89016958 | CBFA2T3 | . | loss |
chr16 | 89029055 | 89029056 | CBFA2T3 | cg06982885 | loss |
chr16 | 89110004 | 89110005 | . | . | loss |
chr16 | 89118838 | 89118839 | . | . | loss |
chr16 | 89245231 | 89245232 | CDH15 | . | loss |
chr16 | 89704682 | 89704683 | DPEP1 | . | loss |
chr17 | 38860042 | 38860043 | KRT24 | cg04219544 | loss |
chr17 | 40705588 | 40705589 | HSD17B1 | cg01612247 | loss |
chr17 | 48680554 | 48680555 | CACNA1G | cg26639906 | loss |
chr17 | 49027095 | 49027096 | . | cg00029979 | loss |
chr17 | 77174120 | 77174121 | RBFOX3 | . | loss |
chr17 | 79096529 | 79096530 | AATK | . | loss |
chr17 | 79099882 | 79099883 | AATK | . | loss |
chr17 | 79652244 | 79652245 | ARL16 | cg22209573 | loss |
chr17 | 79961522 | 79961523 | ASPSCR1 | cg00598204 | loss |
chr17 | 80342459 | 80342460 | . | cg05995260 | loss |
chr18 | 44259973 | 44259974 | ST8SIA5 | . | loss |
chr18 | 61817320 | 61817321 | LINC00305 | cg18827787 | loss |
chr18 | 76485587 | 76485588 | . | cg22110922 | loss |
chr19 | 3936724 | 3936725 | NMRK2 | . | loss |
chr19 | 4552496 | 4552497 | SEMA6B | . | loss |
chr19 | 13394116 | 13394117 | CACNA1A | cg16707895 | loss |
chr19 | 18085190 | 18085191 | KCNN1 | cg27648056 | loss |
chr19 | 57175043 | 57175044 | ZNF835 | cg08431567,cg06230408 | loss |
chr2 | 1133947 | 1133948 | SNTG2 | cg10325383 | loss |
chr2 | 1880012 | 1880013 | MYT1L | cg22946562 | loss |
chr2 | 4931004 | 4931005 | . | . | loss |
chr2 | 4931074 | 4931075 | . | cg02883150 | loss |
chr2 | 10638113 | 10638114 | . | cg22157027 | loss |
chr2 | 10666713 | 10666714 | . | cg08846959 | loss |
chr2 | 26800399 | 26800400 | FAM166C | . | loss |
chr2 | 233198590 | 233198591 | DIS3L2 | . | loss |
chr2 | 239544973 | 239544974 | . | . | loss |
chr2 | 241083864 | 241083865 | OTOS | . | loss |
chr20 | 5451900 | 5451901 | LOC643406 | cg04281261 | loss |
chr20 | 60120472 | 60120473 | CDH4 | cg12762862 | loss |
chr20 | 60456498 | 60456499 | CDH4 | cg24688309,cg01185502 | loss |
chr20 | 60456503 | 60456504 | CDH4 | cg01185502 | loss |
chr20 | 61625364 | 61625365 | . | cg10233904 | loss |
chr20 | 61695598 | 61695599 | LINC01749 | cg01042841 | loss |
chr20 | 61755045 | 61755046 | . | cg16473797 | loss |
chr20 | 61792443 | 61792444 | . | . | loss |
chr20 | 62079911 | 62079912 | KCNQ2 | . | loss |
chr21 | 46420451 | 46420452 | PICSAR | . | loss |
chr21 | 46677879 | 46677880 | . | cg10272901 | loss |
chr22 | 29704483 | 29704484 | GAS2L1 | cg04929173 | loss |
chr22 | 37769171 | 37769172 | ELFN2 | cg21515305 | loss |
chr22 | 38506737 | 38506738 | BAIAP2L2 | cg08196512,cg11744966, cg09247692 |
loss |
chr22 | 43835600 | 43835601 | MPPED1 | . | loss |
chr22 | 44708861 | 44708862 | SHISAL1 | . | loss |
chr22 | 49137906 | 49137907 | TAFA5 | cg12986453 | loss |
chr22 | 49376886 | 49376887 | . | . | loss |
chr22 | 49487343 | 49487344 | . | . | loss |
chr22 | 50470101 | 50470102 | . | . | loss |
chr3 | 14615134 | 14615135 | . | cg11100465 | loss |
chr3 | 128182392 | 128182393 | DNAJB8 | cg20268341 | loss |
chr3 | 134146405 | 134146406 | . | . | loss |
chr3 | 194078147 | 194078148 | LRRC15 | cg19531604 | loss |
chr3 | 196065306 | 196065307 | TM4SF19 | cg21845080 | loss |
chr3 | 196065318 | 196065319 | TM4SF19 | . | loss |
chr3 | 196065320 | 196065321 | TM4SF19 | cg22496559 | loss |
chr3 | 196065328 | 196065329 | TM4SF19 | cg22496559,cg11363229 | loss |
chr3 | 196065569 | 196065570 | TM4SF19 | . | loss |
chr4 | 1538525 | 1538526 | . | . | loss |
chr5 | 476497 | 476498 | PP7080 | cg06852942 | loss |
chr5 | 476646 | 476647 | PP7080 | . | loss |
chr5 | 555251 | 555252 | . | . | loss |
chr5 | 1003897 | 1003898 | . | cg18801579 | loss |
chr5 | 1119025 | 1119026 | . | . | loss |
chr5 | 1140096 | 1140097 | . | cg01056615,cg23499632 | loss |
chr5 | 1202449 | 1202450 | SLC6A19 | cg24041118 | loss |
chr5 | 1219972 | 1219973 | SLC6A19 | cg24114651 | loss |
chr5 | 1232590 | 1232591 | SLC6A18 | cg11231434 | loss |
chr5 | 1244729 | 1244730 | SLC6A18 | cg06708198 | loss |
chr5 | 1257084 | 1257085 | TERT | cg17249224 | loss |
chr5 | 1767994 | 1767995 | . | cg10452667 | loss |
chr5 | 2103257 | 2103258 | . | cg19021412 | loss |
chr5 | 2132336 | 2132337 | . | . | loss |
chr5 | 17654594 | 17654595 | . | cg19090585 | loss |
chr5 | 169531595 | 169531596 | FOXI1 | . | loss |
chr5 | 180046901 | 180046902 | FLT4 | cg23297812 | loss |
chr5 | 180047184 | 180047185 | FLT4 | cg07072463 | loss |
chr6 | 466893 | 466894 | . | . | loss |
chr6 | 25218752 | 25218753 | . | . | loss |
chr6 | 169740781 | 169740782 | . | cg11583041 | loss |
chr7 | 1303351 | 1303352 | . | cg23167506 | loss |
chr7 | 1403804 | 1403805 | . | . | loss |
chr7 | 4841835 | 4841836 | RADIL | . | loss |
chr7 | 71177239 | 71177240 | GALNT17 | cg08766170 | loss |
chr7 | 154542060 | 154542061 | DPP6 | cg08910550 | loss |
chr7 | 155191845 | 155191846 | . | . | loss |
chr7 | 157085979 | 157085980 | . | . | loss |
chr7 | 157502455 | 157502456 | PTPRN2 | cg13401196 | loss |
chr7 | 157544912 | 157544913 | PTPRN2 | cg22377978 | loss |
chr7 | 157776887 | 157776888 | PTPRN2 | cg23684218 | loss |
chr7 | 157968578 | 157968579 | PTPRN2 | . | loss |
chr7 | 158030726 | 158030727 | PTPRN2 | . | loss |
chr7 | 158331217 | 158331218 | PTPRN2 | cg12364136 | loss |
chr7 | 158799715 | 158799716 | LINC00689 | cg11772799,cg10874111 | loss |
chr7 | 158820591 | 158820592 | LINC00689 | . | loss |
chr8 | 978226 | 978227 | . | cg04544946 | loss |
chr8 | 1140682 | 1140683 | . | cg20860124 | loss |
chr8 | 10753237 | 10753238 | . | . | loss |
chr8 | 141107113 | 141107114 | TRAPPC9 | . | loss |
chr8 | 142517494 | 142517495 | MROH5 | cg26654519 | loss |
chr8 | 142841913 | 142841914 | . | cg07969668 | loss |
chr8 | 142841965 | 142841966 | . | . | loss |
chr8 | 143201145 | 143201146 | . | . | loss |
chr8 | 143208101 | 143208102 | . | cg00584485 | loss |
chr8 | 143262200 | 143262201 | . | cg03957095 | loss |
chr8 | 143333654 | 143333655 | TSNARE1 | cg08957001 | loss |
chr8 | 143509263 | 143509264 | . | . | loss |
chr8 | 143535735 | 143535736 | . | . | loss |
chr8 | 143605535 | 143605536 | ADGRB1 | . | loss |
chr8 | 143625791 | 143625792 | ADGRB1 | cg27039312 | loss |
chr8 | 143915919 | 143915920 | GML | cg07711097 | loss |
chr8 | 143915954 | 143915955 | GML | cg07711097,cg22396979 | loss |
chr8 | 143961145 | 143961146 | CYP11B1 | . | loss |
chr8 | 144203483 | 144203484 | . | . | loss |
chr8 | 144366016 | 144366017 | . | . | loss |
chr8 | 144416327 | 144416328 | TOP1MT | . | loss |
chr8 | 144801223 | 144801224 | MAPK15 | cg06344474 | loss |
chr8 | 145697495 | 145697496 | KIFC2 | cg06666727 | loss |
chr8 | 145758486 | 145758487 | ARHGAP39 | cg25667997 | loss |
chr9 | 137718814 | 137718815 | COL5A1 | . | loss |
chr9 | 138018566 | 138018567 | . | cg13982366 | loss |
chr9 | 140041732 | 140041733 | GRIN1 | . | loss |
chr9 | 140333139 | 140333140 | ENTPD8 | . | loss |
실시예 7. 마커 성능 확인
실시예 6에서 선별한 366개의 마커에 대하여 전체 EM-Seq 데이터에서 수득한 beta value를 사용하여 성능을 확인하였다. 먼저, 정상 그룹 샘플의 표준편차와 평균값을 계산한 뒤, 아래 수식 1로 마커별 z-score를 계산하였다.
수식 1:
계산된 z-score를 사용하여 z-score의 평균, z-score의 합, z-score의 SD값을 계산하고, 계산된 z-score의 평균, z-score의 합, z-score의 SD를 이용하여 표 8에 기재된 기준값을 초과할 경우, 폐암으로 판정하였다.
표 10의 기준값은 정상 샘플들의 95 percentile 값으로 결정하였다.
Score | Cut-off |
Mean of Z-score | 0.53 |
Sum of Z-score | 195.04 |
SD of Z-score | 1.06 |
그 결과, 표 11, 도 2 및 도 3에 기재된 바와 같이, ROC 분석 결과인 AUC 값은 AUC 값은 mean of Z-score, sum of Z-score, SD of Z-score에서 각각 1.00, 1.00, 1.00인 것을 확인하였다
Score | AUC |
Mean of Z-score | 1.00 |
Sum of Z-score | 1.00 |
SD of Z-score | 1.00 |
실시예 8. TCGA methylation 450K array 데이터에서 폐암 특이적 메틸화 영역 선별
아울러, 폐암 진단을 위한 최소 마커 조합을 도출하기 위하여, The Cancer Genome Atlas (TCGA)에서 Infinium Human Methylation 450K BeadChip array 데이터(UCSC Xena, http://xena.ucsc.edu)를 사용하여 메틸화 정도를 확인하였다. 조직으로부터 추출된 DNA는 바이설파이트 처리를 통해 변환되며, DNA 메틸화 여부는 사이토신 염기의 변형을 통해 확인할 수 있다. 각 영역마다 메틸화 정도를 확인할 수 있으며, 메틸화 정도를 나타내는 값인 베타 값(beta value)을 사용하여 폐암 조직과 주변 정상 조직간의 차별적으로 메틸화된 영역을 선별하였다.
TCGA methylation 450k array 데이터는 표 12와 같다.
Primary Solid Tumor | Solid Tissue Normal | Total | |
LUAD | 458 | 32 | 490 |
LUSC | 370 | 42 | 412 |
Total | 828 | 74 | 902 |
먼저, 약 48만개(480K)의 영역에서 결측값(missing value)을 제외한 다음, 유의미한 과메틸화 영역를 선별하기 위해 메틸화 점수를 사용계산하였다. 과메틸화된 영역의 메틸화 점수는 베타값을 그대로 더해주고, 저메틸화 영역은 베타값에 -1을 곱한 후 합을 계산하였다.
무작위로 10개의 CpG 영역을 1000번 복원 추출하여 CpG 영역 세트를 구성한 다음, 각각의 CpG 영역 세트를 활용하여 902개의 폐암 조직과 주변 정상 조직의 메틸화 점수를 계산하여, 계산한 메틸화 점수를 활용하여 폐암 조직과 주변 정상 조직을 분류하는 AUC를 계산하고 가장 높은 AUC의 CpG 영역을 선별하한 결과, AUC가 0.996인 10개의 과메틸화 영역과 AUC가 0.990인 저메틸화 영역 세트 10개를 선별하였다(도 5, A, B).
또한, 무작위로 7개의 영역을 1000번 복원 추출하여 CpG 영역 세트를 구성한 다음, 동일한 방법으로 AUC가 0.996인 7개의 과메틸화 영역과 AUC가 0.976인 저메틸화 영역 세트 7개를 선별하였다(도 5, C, D, 표 13).
아울러, 상기 20개 세트 및 14개 세트가 폐암과 주변 조직을 높은 정확도로 구별할 수 있는 것을 확인하였다(도 6 및 도 7).
하기 표에서, nCPG=14 컬럼의 O는 14개 세트를 의미하고, X는 14개 세트에서는 선별되지 않았으나, 20개 세트에서 추가로 선별된 마커를 의미한다.
Chromosome | start | end | gene | illumina ProbID | nCPG=14 | gain/loss |
chr1 | 79472407 | 79472408 | ADGRL4 | cg15084543 | O | gain |
chr1 | 79472360 | 79472361 | ADGRL4 | cg04360793 | O | gain |
chr1 | 156357838 | 156357839 | - | cg22353551 | O | gain |
chr3 | 147128156 | 147128157 | ZIC4 | cg12595013 | O | gain |
chr3 | 147130535 | 147130536 | ZIC1 | cg19029181 | O | gain |
chr7 | 27225542 | 27225543 | HOXA11 | cg10657141 | O | gain |
chr14 | 57265874 | 57265875 | - | cg18280830 | O | gain |
chr1 | 157164795 | 157164796 | - | cg09504320 | X | gain |
chr3 | 181442675 | 181442676 | SOX2-OT | cg01783662 | X | gain |
chr5 | 92909428 | 92909429 | NR2F1-AS1 | cg15143788 | X | gain |
chr16 | 87958492 | 87958493 | CA5A | cg06948222 | O | loss |
chr1 | 9896308 | 9896309 | - | cg20488341 | O | loss |
chr2 | 10666712 | 10666713 | - | cg08846959 | O | loss |
chr7 | 157544911 | 157544912 | PTPRN2 | cg22377978 | O | loss |
chr8 | 978225 | 978226 | - | cg04544946 | O | loss |
chr11 | 2033842 | 2033843 | - | cg25068071 | O | loss |
chr19 | 57175042 | 57175043 | ZNF835 | cg08431567 | O | loss |
chr7 | 1303350 | 1303351 | - | cg23167506 | X | loss |
chr12 | 1943888 | 1943889 | LRTM2 | cg02505216 | X | loss |
chr17 | 79652243 | 79652244 | ARL16 | cg22209573 | X | loss |
실시예 9. 임상 샘플에서의 마커 패널 성능 확인
표 14의 폐암 환자 129명 및 정상인 184명의 샘플에서 Targeted EM-Seq을 수행하여 상기 마커 세트(표 9 및 표 13)의 성능을 각각 확인하였다.
Lung Panel | Lung cancer | Normal | Total |
Total | 129 | 55 | 184 |
9-1. Targeted EM-Seq 수행
상기 환자들의 혈액을 채취한 다음, 3000 rpm, 25℃10분의 조건으로 혈장 부분만 1차 원심분리한 다음, 1차 원심 분리된 혈장을 16000g, 25℃10분의 조건으로 2차 원심분리하여 침전물을 제외한 혈장 상층액을 분리하고, 분리한 혈장에 대해 Mag-bind cfDNA kit 사용하여 cell-free DNA를 추출하고 농도는 Qubit DS DNA HS assay Kit(Thermo Fisher Scientific, USA)를 사용하여 측정하였다. 추출한 cfDNA의 최대량을 사용하여 ten-eleven translocation dioxygenase 2(TET2)와 APOBEC을 사용해 un-methylated cytosine을 Uracil로 치환하는 과정을 거쳐 methylation conversion을 한 뒤 enzymatic methyl-seq (NEB Kit)를 사용하여 library 제작하였다.
제작한 DNA library의 농도와 size를 각각 Qubit DS DNA HS assay Kit(Thermo Fisher Scientific, USA)과 Tapestation 4200(Agilent, USA)을 사용해 측정하였다. 200ng의 Library를 8검체씩 pooling하여, Hybridization 진행한 다음, capture된 샘플을 Tapestation 4200(Agilent, USA)으로 High sensitivity D1000 screen tape & Reagent(Agilent, USA)를 사용하여 농도를 측정하였다. Miseq Dx (Illumina)장비를 사용하여 150 paired-end 모드로 Final 농도를 11pM에 맞추어 sequencing을 진행하여, 샘플 당 700X depth를 생산하였다.
9-2. 성능 확인
메틸화 된 세포 유리 핵산을 sequencing하였기 때문에, 확보되는 핵산 단편 데이터는 메틸화가 되어있고, 이를 휴먼 참조 유전체에 정렬을 하여 전체 휴먼 유전체 영역에서 메틸화가 된 영역들을 확인할 수 있다. EM-Seq 데이터는 메틸화된 Cytosine영역은 그대로 Cytosine으로 남아있고, 메틸화되지 않은 Cytosine들은 Thymine으로 변환되어 메틸화된 영역과 메틸화된 정도를 확인할 수 있다.
먼저, Trim Galore(version 0.6.6)를 이용하여 fastq 파일에서 adapter trimming과 quality trimming을 수행한 다음, Bismark(version 0.23.0) alignment tool을 이용하여 핵산 단편 데이터를 참조 유전체(hg19)에 정렬하고, Samtools view (version 1.11) tool을 이용하여 mapping quality가 10이상이고 chr1~22,X,Y의 핵산 단편만 선별한 뒤, Bismark(version 0.23.0)의 bismark_methylation_extractor를 활용하여 methylation calling을 진행하였다.
methylKit (version 1.12.0) R package를 이용하여 Tumor, Normal sample들의 beta value(methylation percentage)값을 하나의 파일로 merge한 다음, 베타값을 이용하여 실시예 7에서 도출한 정상 그룹 샘플의 표준 편차를 기반으로 수식 1을 이용해 z-score를 계산하였다.
계산된 z-score를 사용하여 z-score의 평균, z-score의 합, z-score의 SD값을 계산하고, 계산된 z-score의 평균, z-score의 합, z-score의 SD를 이용하여 표 8에 기재된 기준값을 초과할 경우, 폐암으로 판정하였다. 기준값은 실시예 7과 동일한 기준을 사용하였다.
그 결과, 366개 마커 조합을 모두 사용한 경우, 표 15, 도 8 및 9에 기재된 바와 같이, ROC 분석 결과인 AUC 값은 mean of Z-score, sum of Z-score, SD of Z-score에서 각각 0.75, 0.75, 0.80인 것을 확인하였고,
Score | AUC |
Mean of Z-score | 0.75 |
Sum of Z-score | 0.75 |
SD of Z-score | 0.80 |
20개의 마커 조합을 사용한 경우에는 표 16, 도 10 및 11에 기재된 바와 같이, ROC 분석 결과인 AUC 값은 mean of Z-score, sum of Z-score, SD of Z-score에서 각각 0.78, 0.78, 0.77인 것을 확인하였으며,
Score | AUC |
Mean of Z-score | 0.78 |
Sum of Z-score | 0.78 |
SD of Z-score | 0.77 |
14개의 마커 조합을 사용한 경우에는 표 17, 도 12 및 13에 기재된 바와 같이, ROC 분석 결과인 AUC 값은 mean of Z-score, sum of Z-score, SD of Z-score에서 각각 0.78, 0.78, 0.77인 것을 확인하였다.
Score | AUC |
Mean of Z-score | 0.78 |
Sum of Z-score | 0.78 |
SD of Z-score | 0.77 |
이상으로 본 발명 내용의 특정한 부분을 상세히 기술하였는 바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적 기술은 단지 바람직한 실시 양태일 뿐이며, 이에 의해 본 발명의 범위가 제한되는 것이 아닌 점은 명백할 것이다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항들과 그것들의 등가물에 의하여 정의된다고 할 것이다.
Claims (10)
- 하기 표 1로 표시되는 DNA 메틸화 마커를 포함하는 폐암 진단용 DNA 메틸화 마커 조합.
- 제1항에 있어서, 상기 폐암 진단용 DNA 메틸화 마커 조합은 하기 표 2로 표시되는 DNA 마커를 추가로 포함하는 것을 특징으로 하는 폐암 진단용 DNA 메틸화 마커 조합.
- 제2항에 있어서, 상기 폐암 진단용 DNA 메틸화 마커 조합은 하기 표 3으로 표시되는 DNA 마커로 구성된 군에서 선택되는 2 이상의 DNA 메틸화 마커를 추가로 포함하는 것을 특징으로 하는 폐암 진단용 DNA 메틸화 마커 조합.
- (a) 생체 시료에서 DNA를 분리하는 단계;
(b) 제1항의 DNA 메틸화 마커 조합의 메틸화 수준을 검출하는 단계; 및
(c) 상기 검출된 DNA 메틸화 마커 수준이 기준값(cut-off value)을 초과할 경우, 폐암으로 판정하는 단계;
를 포함하는 폐암 진단을 위한 정보의 제공방법.
- 제4항에 있어서, 상기 (b) 단계의 메틸화 수준의 검출은, PCR, 메틸화 특이 PCR(methylation specific PCR), 실시간 메틸화 특이 PCR(real time methylation specific PCR), 메틸화 DNA 특이적 결합 단백질을 이용한 PCR, 정량 PCR, 메틸화 특이적인 PNA를 이용하는 PCR, melting curve analysis, DNA 칩, 파이로시퀀싱, 바이설파이트 시퀀싱 및 메틸화 차세대 염기서열 시퀀싱으로 구성된 군으로부터 선택된 어느 하나의 방법을 이용하는 것을 특징으로 하는 방법.
- 제4항에 있어서, 상기 (b) 단계의 메틸화 수준은 베타값(beta value)으로 표시되는 것을 특징으로 하는 방법.
- 제4항에 있어서, 상기 (c) 단계는 다음의 단계를 포함하는 방법으로 수행되는 것을 특징으로 하는 방법:
(c-i) 정상 그룹 샘플에서 수득한 베타값의 표준편차와 평균값을 계산하는 단계;
(c-ii) 하기 수식 1로 z 점수(z-score)를 계산하는 단계; 및
수식 1:
(c-ii) 계산된 z 점수의 합, 평균 또는 표준 편차를 계산하는 단계; 및
(c-iii) 계산된 z 점수의 합, 평균 또는 표준 편차가 기준값을 초과할 경우, 폐암인 것으로 판정하는 단계.
- 제1항 내지 제3항 중 어느 한 항의 DNA 메틸화 마커 조합의 DNA 메틸화 마커를 각각 증폭할 수 있는 프라이머 조합을 포함하는 폐암 진단용 조성물.
- 제1항 내지 제3항 중 어느 한 항의 DNA 메틸화 마커 조합의 DNA 메티로하 마커의 메틸화된 염기를 함유하는 10개 이상의 연속 염기를 포함하는 폴리뉴클레오타이드 또는 그의 상보적인 폴리뉴클레오타이드와 특이적으로 각각 혼성화할 수 있는 프로브 조합을 포함하는 폐암 진단용 조성물.
- 제8항 또는 제9항의 조성물을 포함하는 폐암 진단용 키트.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20220142051 | 2022-10-31 | ||
KR1020220142051 | 2022-10-31 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20240061639A true KR20240061639A (ko) | 2024-05-08 |
KR102701683B1 KR102701683B1 (ko) | 2024-09-02 |
Family
ID=90931050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230148520A KR102701683B1 (ko) | 2022-10-31 | 2023-10-31 | 폐암 진단용 dna 메틸화 마커 및 이의 용도 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR102701683B1 (ko) |
WO (1) | WO2024096536A1 (ko) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013507987A (ja) * | 2009-10-26 | 2013-03-07 | アボット・ラボラトリーズ | 非小細胞肺癌の予後を決定するための診断方法 |
SG11201605259QA (en) * | 2013-12-30 | 2016-07-28 | Agency Science Tech & Res | Methods for measuring biomarkers in gastrointestinal cancer |
US10385406B2 (en) * | 2016-05-05 | 2019-08-20 | Exact Sciences Development Company, Llc | Detection of lung neoplasia by analysis of methylated DNA |
EP3945135A1 (en) * | 2020-07-27 | 2022-02-02 | Les Laboratoires Servier | Biomarkers for diagnosing and monitoring lung cancer |
WO2022204358A1 (en) * | 2021-03-26 | 2022-09-29 | Freenome Holdings, Inc. | Methods and systems for detecting cancer via nucleic acid methylation analysis |
-
2023
- 2023-10-31 KR KR1020230148520A patent/KR102701683B1/ko active IP Right Grant
- 2023-10-31 WO PCT/KR2023/017173 patent/WO2024096536A1/ko unknown
Non-Patent Citations (2)
Title |
---|
Cancers (Basel), 14(4): 961 (2022.02.15.) * |
Epigenetics, 15(4): 419-430 (2019.11.27.) * |
Also Published As
Publication number | Publication date |
---|---|
WO2024096536A1 (ko) | 2024-05-10 |
KR102701683B1 (ko) | 2024-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230348992A1 (en) | Methylation markers for diagnosing hepatocellular carcinoma and lung cancer | |
CN107847515B (zh) | 实体瘤甲基化标志物及其用途 | |
US11396678B2 (en) | Breast and ovarian cancer methylation markers and uses thereof | |
CN113661249A (zh) | 用于分离无细胞dna的组合物和方法 | |
US20190345560A1 (en) | Lung cancer methylation markers and uses thereof | |
US20210115518A1 (en) | Leukemia methylation markers and uses thereof | |
US10370726B2 (en) | Detecting colorectal neoplasia | |
EP2707506B1 (en) | Method of detecting cancer through generalized loss of stability of epigenetic domains, and compositions thereof | |
US20190300964A1 (en) | Colon cancer methylation markers and uses thereof | |
US20190300965A1 (en) | Liver cancer methylation markers and uses thereof | |
US20240209453A1 (en) | Liver cancer methylation and protein markers and their uses | |
EP3077537B1 (en) | Novel rna-biomarkers for diagnosis of prostate cancer | |
CN112639983B (zh) | 微卫星不稳定性检测 | |
WO2016168174A1 (en) | Predicting the occurrence of metastatic cancer using epigenomic biomarkers and non-invasive methodologies | |
EP3227460B1 (en) | Novel rna-biomarker signature for diagnosis of prostate cancer | |
WO2022262831A1 (zh) | 用于评估肿瘤的物质及其方法 | |
KR102701683B1 (ko) | 폐암 진단용 dna 메틸화 마커 및 이의 용도 | |
KR102701682B1 (ko) | 간암 진단용 dna 메틸화 마커 및 이의 용도 | |
CN115772566B (zh) | 用于辅助检测肺癌体细胞erbb2基因突变的甲基化生物标记物及其应用 | |
US20240352537A1 (en) | Composition for diagnosing prostate cancer by using cpg methylation changes in specific genes, and use thereof | |
KR20240059529A (ko) | 폐암 진단용 메틸화 마커 및 이의 조합 | |
WO2023086950A1 (en) | Methylation signatures in cell-free dna for tumor classification and early detection | |
Lo | Molecular Analyses of Malignant Pleural Mesothelioma | |
Kwan | Epigenetic Study of Plasma Circulating DNA in Prostate Cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |