JP2024525190A - 腫瘍評価のための物質及び方法 - Google Patents
腫瘍評価のための物質及び方法 Download PDFInfo
- Publication number
- JP2024525190A JP2024525190A JP2023578089A JP2023578089A JP2024525190A JP 2024525190 A JP2024525190 A JP 2024525190A JP 2023578089 A JP2023578089 A JP 2023578089A JP 2023578089 A JP2023578089 A JP 2023578089A JP 2024525190 A JP2024525190 A JP 2024525190A
- Authority
- JP
- Japan
- Prior art keywords
- seq
- region
- human
- fragment
- methylation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 348
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 28
- 239000000463 material Substances 0.000 title claims abstract description 11
- 230000011987 methylation Effects 0.000 claims abstract description 363
- 238000007069 methylation reaction Methods 0.000 claims abstract description 363
- 108020004414 DNA Proteins 0.000 claims description 311
- 239000012634 fragment Substances 0.000 claims description 301
- 150000007523 nucleic acids Chemical class 0.000 claims description 233
- 206010061902 Pancreatic neoplasm Diseases 0.000 claims description 224
- 201000002528 pancreatic cancer Diseases 0.000 claims description 224
- 102000039446 nucleic acids Human genes 0.000 claims description 223
- 108020004707 nucleic acids Proteins 0.000 claims description 223
- 230000004048 modification Effects 0.000 claims description 175
- 238000012986 modification Methods 0.000 claims description 175
- 201000010099 disease Diseases 0.000 claims description 123
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 123
- 230000000295 complement effect Effects 0.000 claims description 108
- 239000003153 chemical reaction reagent Substances 0.000 claims description 101
- 238000006243 chemical reaction Methods 0.000 claims description 98
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 86
- 101000909641 Homo sapiens Transcription factor COE2 Proteins 0.000 claims description 47
- 238000001514 detection method Methods 0.000 claims description 45
- 239000000126 substance Substances 0.000 claims description 42
- 238000002360 preparation method Methods 0.000 claims description 39
- 229940104302 cytosine Drugs 0.000 claims description 38
- 238000003860 storage Methods 0.000 claims description 28
- 108091008146 restriction endonucleases Proteins 0.000 claims description 27
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 claims description 22
- 230000003321 amplification Effects 0.000 claims description 20
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 20
- 230000009615 deamination Effects 0.000 claims description 17
- 238000006481 deamination reaction Methods 0.000 claims description 17
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 16
- 210000001124 body fluid Anatomy 0.000 claims description 16
- 239000010839 body fluid Substances 0.000 claims description 16
- 238000012408 PCR amplification Methods 0.000 claims description 12
- 229940035893 uracil Drugs 0.000 claims description 8
- 102000040430 polynucleotide Human genes 0.000 abstract description 9
- 108091033319 polynucleotide Proteins 0.000 abstract description 9
- 239000002157 polynucleotide Substances 0.000 abstract description 9
- 206010061309 Neoplasm progression Diseases 0.000 abstract description 4
- 230000005751 tumor progression Effects 0.000 abstract description 4
- 230000005740 tumor formation Effects 0.000 abstract description 3
- 230000005748 tumor development Effects 0.000 abstract 1
- 239000000523 sample Substances 0.000 description 212
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 151
- 208000008443 pancreatic carcinoma Diseases 0.000 description 151
- 108090000623 proteins and genes Proteins 0.000 description 146
- 108091028043 Nucleic acid sequence Proteins 0.000 description 135
- 239000002585 base Substances 0.000 description 86
- 102100029712 E3 ubiquitin-protein ligase TRIM58 Human genes 0.000 description 73
- 101000795365 Homo sapiens E3 ubiquitin-protein ligase TRIM58 Proteins 0.000 description 73
- 101000655118 Homo sapiens T-cell leukemia homeobox protein 2 Proteins 0.000 description 68
- 108010083162 Twist-Related Protein 1 Proteins 0.000 description 63
- 102100030398 Twist-related protein 1 Human genes 0.000 description 63
- 101001120819 Homo sapiens Oligodendrocyte transcription factor 3 Proteins 0.000 description 59
- 102100026056 Oligodendrocyte transcription factor 3 Human genes 0.000 description 59
- 238000012163 sequencing technique Methods 0.000 description 54
- 102100032528 C-type lectin domain family 11 member A Human genes 0.000 description 51
- 101000942297 Homo sapiens C-type lectin domain family 11 member A Proteins 0.000 description 51
- 102100037060 Forkhead box protein D3 Human genes 0.000 description 49
- 102100039544 Homeobox protein Hox-D10 Human genes 0.000 description 49
- 101001029308 Homo sapiens Forkhead box protein D3 Proteins 0.000 description 49
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 49
- 101000962573 Homo sapiens Homeobox protein Hox-D10 Proteins 0.000 description 49
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 48
- 102000054766 genetic haplotypes Human genes 0.000 description 46
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 45
- 101001026192 Homo sapiens Potassium voltage-gated channel subfamily A member 6 Proteins 0.000 description 44
- 102100037448 Potassium voltage-gated channel subfamily A member 6 Human genes 0.000 description 43
- 102100025176 Cyclin-A1 Human genes 0.000 description 41
- 102100027695 Homeobox protein engrailed-2 Human genes 0.000 description 41
- 101000934314 Homo sapiens Cyclin-A1 Proteins 0.000 description 41
- 101001081122 Homo sapiens Homeobox protein engrailed-2 Proteins 0.000 description 41
- 238000012706 support-vector machine Methods 0.000 description 41
- 230000007067 DNA methylation Effects 0.000 description 40
- 102100032567 T-cell leukemia homeobox protein 2 Human genes 0.000 description 40
- 239000011159 matrix material Substances 0.000 description 39
- 102100024204 Transcription factor COE2 Human genes 0.000 description 38
- 239000002609 medium Substances 0.000 description 38
- 102100027345 Homeobox protein SIX3 Human genes 0.000 description 35
- 101000651928 Homo sapiens Homeobox protein SIX3 Proteins 0.000 description 35
- 238000012549 training Methods 0.000 description 33
- 206010033645 Pancreatitis Diseases 0.000 description 31
- 210000004027 cell Anatomy 0.000 description 31
- CTMZLDSMFCVUNX-VMIOUTBZSA-N cytidylyl-(3'->5')-guanosine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=C(C(N=C(N)N3)=O)N=C2)O)[C@@H](CO)O1 CTMZLDSMFCVUNX-VMIOUTBZSA-N 0.000 description 31
- 210000000349 chromosome Anatomy 0.000 description 29
- 230000000875 corresponding effect Effects 0.000 description 29
- 210000001519 tissue Anatomy 0.000 description 27
- 238000003752 polymerase chain reaction Methods 0.000 description 26
- 238000013178 mathematical model Methods 0.000 description 25
- 102100026619 Cartilage intermediate layer protein 2 Human genes 0.000 description 23
- 101000913768 Homo sapiens Cartilage intermediate layer protein 2 Proteins 0.000 description 23
- 238000011144 upstream manufacturing Methods 0.000 description 23
- 125000003729 nucleotide group Chemical group 0.000 description 22
- 239000002773 nucleotide Substances 0.000 description 21
- 210000002381 plasma Anatomy 0.000 description 20
- 238000012360 testing method Methods 0.000 description 19
- 239000003550 marker Substances 0.000 description 18
- 102100021086 Homeobox protein Hox-D4 Human genes 0.000 description 15
- 101001041136 Homo sapiens Homeobox protein Hox-D4 Proteins 0.000 description 15
- 238000007477 logistic regression Methods 0.000 description 15
- 230000004069 differentiation Effects 0.000 description 14
- 102100032556 C-type lectin domain family 14 member A Human genes 0.000 description 13
- 101000942280 Homo sapiens C-type lectin domain family 14 member A Proteins 0.000 description 13
- 210000004369 blood Anatomy 0.000 description 13
- 239000008280 blood Substances 0.000 description 13
- 101000626383 Homo sapiens Synaptotagmin-10 Proteins 0.000 description 12
- 102100024618 Synaptotagmin-10 Human genes 0.000 description 12
- 238000009826 distribution Methods 0.000 description 12
- 102100041029 60S ribosomal protein L9 Human genes 0.000 description 11
- 102100030968 Homeobox even-skipped homolog protein 2 Human genes 0.000 description 11
- 101000672886 Homo sapiens 60S ribosomal protein L9 Proteins 0.000 description 11
- 101000938533 Homo sapiens Homeobox even-skipped homolog protein 2 Proteins 0.000 description 11
- 101000572989 Homo sapiens POU domain, class 3, transcription factor 3 Proteins 0.000 description 11
- 101000864786 Homo sapiens Secreted frizzled-related protein 2 Proteins 0.000 description 11
- 102100026456 POU domain, class 3, transcription factor 3 Human genes 0.000 description 11
- 102100030054 Secreted frizzled-related protein 2 Human genes 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 11
- 101000977765 Homo sapiens Iroquois-class homeodomain protein IRX-4 Proteins 0.000 description 10
- 101000662678 Homo sapiens Protein TOPAZ1 Proteins 0.000 description 10
- 101000713606 Homo sapiens T-box transcription factor TBX20 Proteins 0.000 description 10
- 101000946163 Homo sapiens Transcription factor LBX2 Proteins 0.000 description 10
- 101000750399 Homo sapiens Ventral anterior homeobox 2 Proteins 0.000 description 10
- 101000802329 Homo sapiens Zinc finger protein 750 Proteins 0.000 description 10
- 101000976643 Homo sapiens Zinc finger protein ZIC 2 Proteins 0.000 description 10
- 102100023531 Iroquois-class homeodomain protein IRX-4 Human genes 0.000 description 10
- 102100037459 Protein TOPAZ1 Human genes 0.000 description 10
- 102100036833 T-box transcription factor TBX20 Human genes 0.000 description 10
- 102100034737 Transcription factor LBX2 Human genes 0.000 description 10
- 102100034644 Zinc finger protein 750 Human genes 0.000 description 10
- 102100023492 Zinc finger protein ZIC 2 Human genes 0.000 description 10
- 238000012164 methylation sequencing Methods 0.000 description 10
- 239000000047 product Substances 0.000 description 10
- -1 9-Sep Proteins 0.000 description 9
- 208000000668 Chronic Pancreatitis Diseases 0.000 description 9
- 102100035316 Doublesex- and mab-3-related transcription factor A2 Human genes 0.000 description 9
- 102100034858 Homeobox protein Hox-D8 Human genes 0.000 description 9
- 101000928215 Homo sapiens Arf-GAP with GTPase, ANK repeat and PH domain-containing protein 2 Proteins 0.000 description 9
- 101000949728 Homo sapiens Doublesex- and mab-3-related transcription factor A2 Proteins 0.000 description 9
- 101001019776 Homo sapiens Homeobox protein Hox-D8 Proteins 0.000 description 9
- 101001076680 Homo sapiens Insulin-induced gene 1 protein Proteins 0.000 description 9
- 101000595526 Homo sapiens T-box brain protein 1 Proteins 0.000 description 9
- 101000653634 Homo sapiens T-box transcription factor TBX15 Proteins 0.000 description 9
- 101000653635 Homo sapiens T-box transcription factor TBX18 Proteins 0.000 description 9
- 101000666775 Homo sapiens T-box transcription factor TBX3 Proteins 0.000 description 9
- 102100025887 Insulin-induced gene 1 protein Human genes 0.000 description 9
- 206010033649 Pancreatitis chronic Diseases 0.000 description 9
- 102100036083 T-box brain protein 1 Human genes 0.000 description 9
- 102100029853 T-box transcription factor TBX15 Human genes 0.000 description 9
- 102100029848 T-box transcription factor TBX18 Human genes 0.000 description 9
- 102100038409 T-box transcription factor TBX3 Human genes 0.000 description 9
- 102100021167 Ventral anterior homeobox 2 Human genes 0.000 description 9
- 238000002790 cross-validation Methods 0.000 description 9
- 238000003745 diagnosis Methods 0.000 description 9
- 238000012216 screening Methods 0.000 description 9
- 238000006467 substitution reaction Methods 0.000 description 9
- 101710082567 3-methylorcinaldehyde synthase Proteins 0.000 description 8
- 101710099902 Acid-sensing ion channel 2 Proteins 0.000 description 8
- 102100032381 Alpha-hemoglobin-stabilizing protein Human genes 0.000 description 8
- 102100036781 Arf-GAP with GTPase, ANK repeat and PH domain-containing protein 2 Human genes 0.000 description 8
- 102100032312 Brevican core protein Human genes 0.000 description 8
- 108091029430 CpG site Proteins 0.000 description 8
- 102100029813 D(1B) dopamine receptor Human genes 0.000 description 8
- 102100037799 DNA-binding protein Ikaros Human genes 0.000 description 8
- 102100030307 Homeobox protein Hox-A13 Human genes 0.000 description 8
- 102100040205 Homeobox protein Hox-D12 Human genes 0.000 description 8
- 102100030634 Homeobox protein OTX2 Human genes 0.000 description 8
- 102100028798 Homeodomain-only protein Human genes 0.000 description 8
- 101000797984 Homo sapiens Alpha-hemoglobin-stabilizing protein Proteins 0.000 description 8
- 101000731086 Homo sapiens Brevican core protein Proteins 0.000 description 8
- 101000865210 Homo sapiens D(1B) dopamine receptor Proteins 0.000 description 8
- 101000599038 Homo sapiens DNA-binding protein Ikaros Proteins 0.000 description 8
- 101001037169 Homo sapiens Homeobox protein Hox-D12 Proteins 0.000 description 8
- 101000584400 Homo sapiens Homeobox protein OTX2 Proteins 0.000 description 8
- 101000839095 Homo sapiens Homeodomain-only protein Proteins 0.000 description 8
- 101001020548 Homo sapiens LIM/homeobox protein Lhx1 Proteins 0.000 description 8
- 101000645296 Homo sapiens Metalloproteinase inhibitor 2 Proteins 0.000 description 8
- 101000685818 Homo sapiens Protein SIX6OS1 Proteins 0.000 description 8
- 101000703741 Homo sapiens Short stature homeobox protein 2 Proteins 0.000 description 8
- 101000607306 Homo sapiens UL16-binding protein 1 Proteins 0.000 description 8
- 101000744900 Homo sapiens Zinc finger homeobox protein 3 Proteins 0.000 description 8
- 102100036133 LIM/homeobox protein Lhx1 Human genes 0.000 description 8
- 102100026262 Metalloproteinase inhibitor 2 Human genes 0.000 description 8
- 101710132461 Molybdenum cofactor sulfurase Proteins 0.000 description 8
- 102100040101 Proto-oncogene serine/threonine-protein kinase mos Human genes 0.000 description 8
- 102100040012 UL16-binding protein 1 Human genes 0.000 description 8
- 102100039966 Zinc finger homeobox protein 3 Human genes 0.000 description 8
- 102100027904 Zinc finger protein basonuclin-1 Human genes 0.000 description 8
- 238000003556 assay Methods 0.000 description 8
- 230000002759 chromosomal effect Effects 0.000 description 8
- 108010021685 homeobox protein HOXA13 Proteins 0.000 description 8
- 102100030332 Homeobox protein Mohawk Human genes 0.000 description 7
- 101000990997 Homo sapiens Homeobox protein Mohawk Proteins 0.000 description 7
- 101000616761 Homo sapiens Single-minded homolog 2 Proteins 0.000 description 7
- 101000642523 Homo sapiens Transcription factor SOX-7 Proteins 0.000 description 7
- 102100023134 Protein SIX6OS1 Human genes 0.000 description 7
- 102100031976 Short stature homeobox protein 2 Human genes 0.000 description 7
- 102100021825 Single-minded homolog 2 Human genes 0.000 description 7
- 238000004590 computer program Methods 0.000 description 7
- 239000013068 control sample Substances 0.000 description 7
- 201000008129 pancreatic ductal adenocarcinoma Diseases 0.000 description 7
- 238000007781 pre-processing Methods 0.000 description 7
- 238000001712 DNA sequencing Methods 0.000 description 6
- 102100036730 Transcription factor SOX-7 Human genes 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 201000011510 cancer Diseases 0.000 description 6
- 238000011161 development Methods 0.000 description 6
- 210000004923 pancreatic tissue Anatomy 0.000 description 6
- 238000007637 random forest analysis Methods 0.000 description 6
- 230000035945 sensitivity Effects 0.000 description 6
- 241000124008 Mammalia Species 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000004949 mass spectrometry Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 101000976075 Homo sapiens Insulin Proteins 0.000 description 4
- 102100023915 Insulin Human genes 0.000 description 4
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical class OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 4
- 238000001574 biopsy Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000006911 enzymatic reaction Methods 0.000 description 4
- 239000007850 fluorescent dye Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000001963 growth medium Substances 0.000 description 4
- 238000002844 melting Methods 0.000 description 4
- 230000008018 melting Effects 0.000 description 4
- 239000013074 reference sample Substances 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 102100038776 ADP-ribosylation factor-related protein 1 Human genes 0.000 description 3
- 102100032091 ALK and LTK ligand 2 Human genes 0.000 description 3
- 102100029160 ATP-dependent (S)-NAD(P)H-hydrate dehydratase Human genes 0.000 description 3
- 102100022144 Achaete-scute homolog 2 Human genes 0.000 description 3
- 102100034134 Activin receptor type-1B Human genes 0.000 description 3
- 102100033568 Acyl-CoA-binding domain-containing protein 6 Human genes 0.000 description 3
- 102100029229 Alpha-N-acetylgalactosaminide alpha-2,6-sialyltransferase 5 Human genes 0.000 description 3
- 102100024075 Alpha-internexin Human genes 0.000 description 3
- 102100038343 Ammonium transporter Rh type C Human genes 0.000 description 3
- 102100040539 BTB/POZ domain-containing protein KCTD1 Human genes 0.000 description 3
- 102100027321 Beta-1,4-galactosyltransferase 7 Human genes 0.000 description 3
- 102100025074 C-C chemokine receptor-like 2 Human genes 0.000 description 3
- 102000017925 CHRM3 Human genes 0.000 description 3
- 102100028226 COUP transcription factor 2 Human genes 0.000 description 3
- 102100024951 Cactin Human genes 0.000 description 3
- 102100031185 Calmodulin-lysine N-methyltransferase Human genes 0.000 description 3
- 102100021953 Carboxypeptidase Z Human genes 0.000 description 3
- 102100037988 Cartilage acidic protein 1 Human genes 0.000 description 3
- 102100028061 Cation channel sperm-associated protein 3 Human genes 0.000 description 3
- 102100033781 Collagen alpha-2(IV) chain Human genes 0.000 description 3
- 102100032644 Copine-2 Human genes 0.000 description 3
- 102100032165 Corticotropin-releasing factor-binding protein Human genes 0.000 description 3
- 102100021430 Cyclic pyranopterin monophosphate synthase Human genes 0.000 description 3
- 102100032757 Cysteine-rich protein 2 Human genes 0.000 description 3
- 102100026139 DNA damage-inducible transcript 4 protein Human genes 0.000 description 3
- 102100022730 Diacylglycerol kinase gamma Human genes 0.000 description 3
- 102100037888 DnaJ homolog subfamily B member 12 Human genes 0.000 description 3
- 102100032248 Dysferlin Human genes 0.000 description 3
- 102100035989 E3 SUMO-protein ligase PIAS1 Human genes 0.000 description 3
- 102100039577 ETS translocation variant 5 Human genes 0.000 description 3
- 102100037074 Ellis-van Creveld syndrome protein Human genes 0.000 description 3
- 102100032051 Elongation of very long chain fatty acids protein 3 Human genes 0.000 description 3
- 102100039608 Epidermal growth factor receptor kinase substrate 8-like protein 1 Human genes 0.000 description 3
- 102100030778 Epidermal growth factor receptor substrate 15-like 1 Human genes 0.000 description 3
- 102100037316 F-box/LRR-repeat protein 4 Human genes 0.000 description 3
- 102100028417 Fibroblast growth factor 12 Human genes 0.000 description 3
- 102100026149 Fibroblast growth factor receptor-like 1 Human genes 0.000 description 3
- 102100021084 Forkhead box protein C1 Human genes 0.000 description 3
- 102100020848 Forkhead box protein F2 Human genes 0.000 description 3
- 102100027570 Forkhead box protein Q1 Human genes 0.000 description 3
- 102100028924 Formin-2 Human genes 0.000 description 3
- 108010062427 GDP-mannose 4,6-dehydratase Proteins 0.000 description 3
- 102000002312 GDPmannose 4,6-dehydratase Human genes 0.000 description 3
- 102100031465 Hepatocyte growth factor activator Human genes 0.000 description 3
- 102100024594 Histone-lysine N-methyltransferase PRDM16 Human genes 0.000 description 3
- 102100029019 Homeobox protein HMX1 Human genes 0.000 description 3
- 102100029013 Homeobox protein HMX3 Human genes 0.000 description 3
- 102100029433 Homeobox protein Hox-B9 Human genes 0.000 description 3
- 102100040229 Homeobox protein Hox-D1 Human genes 0.000 description 3
- 102100027886 Homeobox protein Nkx-2.2 Human genes 0.000 description 3
- 102100027885 Homeobox protein Nkx-2.4 Human genes 0.000 description 3
- 102100027875 Homeobox protein Nkx-2.5 Human genes 0.000 description 3
- 102100027876 Homeobox protein Nkx-2.6 Human genes 0.000 description 3
- 102100030636 Homeobox protein OTX1 Human genes 0.000 description 3
- 102100029279 Homeobox protein SIX1 Human genes 0.000 description 3
- 102100025448 Homeobox protein SIX6 Human genes 0.000 description 3
- 102100031159 Homeobox protein prophet of Pit-1 Human genes 0.000 description 3
- 101000809413 Homo sapiens ADP-ribosylation factor-related protein 1 Proteins 0.000 description 3
- 101000776351 Homo sapiens ALK and LTK ligand 2 Proteins 0.000 description 3
- 101001124829 Homo sapiens ATP-dependent (S)-NAD(P)H-hydrate dehydratase Proteins 0.000 description 3
- 101000901109 Homo sapiens Achaete-scute homolog 2 Proteins 0.000 description 3
- 101000799189 Homo sapiens Activin receptor type-1B Proteins 0.000 description 3
- 101000801610 Homo sapiens Acyl-CoA-binding domain-containing protein 6 Proteins 0.000 description 3
- 101000833549 Homo sapiens Alpha-internexin Proteins 0.000 description 3
- 101000666627 Homo sapiens Ammonium transporter Rh type C Proteins 0.000 description 3
- 101000613885 Homo sapiens BTB/POZ domain-containing protein KCTD1 Proteins 0.000 description 3
- 101000937508 Homo sapiens Beta-1,4-galactosyltransferase 7 Proteins 0.000 description 3
- 101000716068 Homo sapiens C-C chemokine receptor type 6 Proteins 0.000 description 3
- 101100222250 Homo sapiens CATSPER3 gene Proteins 0.000 description 3
- 101000860860 Homo sapiens COUP transcription factor 2 Proteins 0.000 description 3
- 101000993070 Homo sapiens Calmodulin-lysine N-methyltransferase Proteins 0.000 description 3
- 101000878940 Homo sapiens Cartilage acidic protein 1 Proteins 0.000 description 3
- 101000710876 Homo sapiens Collagen alpha-2(IV) chain Proteins 0.000 description 3
- 101000941777 Homo sapiens Copine-2 Proteins 0.000 description 3
- 101000921095 Homo sapiens Corticotropin-releasing factor-binding protein Proteins 0.000 description 3
- 101000969676 Homo sapiens Cyclic pyranopterin monophosphate synthase Proteins 0.000 description 3
- 101000942088 Homo sapiens Cysteine-rich protein 2 Proteins 0.000 description 3
- 101000912753 Homo sapiens DNA damage-inducible transcript 4 protein Proteins 0.000 description 3
- 101000804964 Homo sapiens DNA polymerase subunit gamma-1 Proteins 0.000 description 3
- 101001044807 Homo sapiens Diacylglycerol kinase gamma Proteins 0.000 description 3
- 101000805849 Homo sapiens DnaJ homolog subfamily B member 12 Proteins 0.000 description 3
- 101001016184 Homo sapiens Dysferlin Proteins 0.000 description 3
- 101000813745 Homo sapiens ETS translocation variant 5 Proteins 0.000 description 3
- 101000881890 Homo sapiens Ellis-van Creveld syndrome protein Proteins 0.000 description 3
- 101000921367 Homo sapiens Elongation of very long chain fatty acids protein 3 Proteins 0.000 description 3
- 101000813988 Homo sapiens Epidermal growth factor receptor kinase substrate 8-like protein 1 Proteins 0.000 description 3
- 101001064156 Homo sapiens Epidermal growth factor receptor substrate 15-like 1 Proteins 0.000 description 3
- 101001026867 Homo sapiens F-box/LRR-repeat protein 4 Proteins 0.000 description 3
- 101000917234 Homo sapiens Fibroblast growth factor 12 Proteins 0.000 description 3
- 101000912518 Homo sapiens Fibroblast growth factor receptor-like 1 Proteins 0.000 description 3
- 101000818310 Homo sapiens Forkhead box protein C1 Proteins 0.000 description 3
- 101000931482 Homo sapiens Forkhead box protein F2 Proteins 0.000 description 3
- 101000861406 Homo sapiens Forkhead box protein Q1 Proteins 0.000 description 3
- 101001059398 Homo sapiens Formin-2 Proteins 0.000 description 3
- 101001066338 Homo sapiens Hepatocyte growth factor activator Proteins 0.000 description 3
- 101000686942 Homo sapiens Histone-lysine N-methyltransferase PRDM16 Proteins 0.000 description 3
- 101000986308 Homo sapiens Homeobox protein HMX1 Proteins 0.000 description 3
- 101000986301 Homo sapiens Homeobox protein HMX3 Proteins 0.000 description 3
- 101000989000 Homo sapiens Homeobox protein Hox-B9 Proteins 0.000 description 3
- 101001037162 Homo sapiens Homeobox protein Hox-D1 Proteins 0.000 description 3
- 101000632186 Homo sapiens Homeobox protein Nkx-2.2 Proteins 0.000 description 3
- 101000632189 Homo sapiens Homeobox protein Nkx-2.4 Proteins 0.000 description 3
- 101000632197 Homo sapiens Homeobox protein Nkx-2.5 Proteins 0.000 description 3
- 101000632193 Homo sapiens Homeobox protein Nkx-2.6 Proteins 0.000 description 3
- 101000584392 Homo sapiens Homeobox protein OTX1 Proteins 0.000 description 3
- 101000634171 Homo sapiens Homeobox protein SIX1 Proteins 0.000 description 3
- 101000835956 Homo sapiens Homeobox protein SIX6 Proteins 0.000 description 3
- 101000706471 Homo sapiens Homeobox protein prophet of Pit-1 Proteins 0.000 description 3
- 101001035135 Homo sapiens Homocysteine-responsive endoplasmic reticulum-resident ubiquitin-like domain member 2 protein Proteins 0.000 description 3
- 101000993380 Homo sapiens Hypermethylated in cancer 1 protein Proteins 0.000 description 3
- 101001082574 Homo sapiens Hypoxia-inducible factor 1-alpha inhibitor Proteins 0.000 description 3
- 101001053270 Homo sapiens Insulin gene enhancer protein ISL-2 Proteins 0.000 description 3
- 101001033704 Homo sapiens Insulin, isoform 2 Proteins 0.000 description 3
- 101001011441 Homo sapiens Interferon regulatory factor 4 Proteins 0.000 description 3
- 101001012154 Homo sapiens Inverted formin-2 Proteins 0.000 description 3
- 101001053444 Homo sapiens Iroquois-class homeodomain protein IRX-1 Proteins 0.000 description 3
- 101001139146 Homo sapiens Krueppel-like factor 2 Proteins 0.000 description 3
- 101001020544 Homo sapiens LIM/homeobox protein Lhx2 Proteins 0.000 description 3
- 101000620503 Homo sapiens LIM/homeobox protein Lhx4 Proteins 0.000 description 3
- 101000619914 Homo sapiens LIM/homeobox protein Lhx5 Proteins 0.000 description 3
- 101001038440 Homo sapiens Leucine zipper putative tumor suppressor 1 Proteins 0.000 description 3
- 101001039236 Homo sapiens Leucine-rich repeat and fibronectin type-III domain-containing protein 2 Proteins 0.000 description 3
- 101001027925 Homo sapiens Metastasis-associated protein MTA1 Proteins 0.000 description 3
- 101000928919 Homo sapiens Muscarinic acetylcholine receptor M3 Proteins 0.000 description 3
- 101001030232 Homo sapiens Myosin-9 Proteins 0.000 description 3
- 101000644718 Homo sapiens NEDD8-conjugating enzyme UBE2F Proteins 0.000 description 3
- 101000969977 Homo sapiens Neuritin-like protein Proteins 0.000 description 3
- 101000603763 Homo sapiens Neurogenin-1 Proteins 0.000 description 3
- 101001111328 Homo sapiens Nuclear factor 1 A-type Proteins 0.000 description 3
- 101001109719 Homo sapiens Nucleophosmin Proteins 0.000 description 3
- 101000987689 Homo sapiens PEX5-related protein Proteins 0.000 description 3
- 101000595929 Homo sapiens POLG alternative reading frame Proteins 0.000 description 3
- 101000572986 Homo sapiens POU domain, class 3, transcription factor 2 Proteins 0.000 description 3
- 101001123298 Homo sapiens PR domain zinc finger protein 14 Proteins 0.000 description 3
- 101000613577 Homo sapiens Paired box protein Pax-2 Proteins 0.000 description 3
- 101001069727 Homo sapiens Paired mesoderm homeobox protein 1 Proteins 0.000 description 3
- 101000595515 Homo sapiens Phosphatidylinositol 4-phosphate 5-kinase type-1 gamma Proteins 0.000 description 3
- 101001093731 Homo sapiens Phosphatidylinositol N-acetylglucosaminyltransferase subunit Q Proteins 0.000 description 3
- 101000689399 Homo sapiens Phospholipid scramblase family member 5 Proteins 0.000 description 3
- 101000583156 Homo sapiens Pituitary homeobox 1 Proteins 0.000 description 3
- 101000883798 Homo sapiens Probable ATP-dependent RNA helicase DDX53 Proteins 0.000 description 3
- 101000650314 Homo sapiens Probable E3 SUMO-protein ligase RNF212 Proteins 0.000 description 3
- 101000630121 Homo sapiens Probable cysteine-tRNA ligase, mitochondrial Proteins 0.000 description 3
- 101001099423 Homo sapiens Proenkephalin-A Proteins 0.000 description 3
- 101000945496 Homo sapiens Proliferation marker protein Ki-67 Proteins 0.000 description 3
- 101000845685 Homo sapiens Protein Dok-7 Proteins 0.000 description 3
- 101000854603 Homo sapiens Protein FAM168A Proteins 0.000 description 3
- 101000979565 Homo sapiens Protein NLRC5 Proteins 0.000 description 3
- 101001121506 Homo sapiens Protein odd-skipped-related 2 Proteins 0.000 description 3
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 3
- 101000725943 Homo sapiens RNA polymerase II subunit A C-terminal domain phosphatase Proteins 0.000 description 3
- 101001061942 Homo sapiens Ras-related protein Rab-40C Proteins 0.000 description 3
- 101000584583 Homo sapiens Receptor activity-modifying protein 1 Proteins 0.000 description 3
- 101000731726 Homo sapiens Rho guanine nucleotide exchange factor 16 Proteins 0.000 description 3
- 101001104307 Homo sapiens Ribonuclease 7 Proteins 0.000 description 3
- 101000693903 Homo sapiens S phase cyclin A-associated protein in the endoplasmic reticulum Proteins 0.000 description 3
- 101000664381 Homo sapiens SKI family transcriptional corepressor 1 Proteins 0.000 description 3
- 101000740180 Homo sapiens Sal-like protein 3 Proteins 0.000 description 3
- 101000874221 Homo sapiens Serine dehydratase-like Proteins 0.000 description 3
- 101000643378 Homo sapiens Serine racemase Proteins 0.000 description 3
- 101000697610 Homo sapiens Serine/threonine-protein kinase 32C Proteins 0.000 description 3
- 101000799194 Homo sapiens Serine/threonine-protein kinase receptor R3 Proteins 0.000 description 3
- 101000687679 Homo sapiens Small integral membrane protein 5 Proteins 0.000 description 3
- 101001090074 Homo sapiens Small nuclear protein PRAC1 Proteins 0.000 description 3
- 101000701869 Homo sapiens Sperm acrosome-associated protein 7 Proteins 0.000 description 3
- 101000864810 Homo sapiens Surfactant-associated protein 3 Proteins 0.000 description 3
- 101000655119 Homo sapiens T-cell leukemia homeobox protein 3 Proteins 0.000 description 3
- 101000596739 Homo sapiens Testis-expressed protein 29 Proteins 0.000 description 3
- 101000638722 Homo sapiens Thimet oligopeptidase Proteins 0.000 description 3
- 101000801891 Homo sapiens Thioredoxin, mitochondrial Proteins 0.000 description 3
- 101000732336 Homo sapiens Transcription factor AP-2 gamma Proteins 0.000 description 3
- 101000652332 Homo sapiens Transcription factor SOX-1 Proteins 0.000 description 3
- 101000626594 Homo sapiens Transmembrane protein 179 Proteins 0.000 description 3
- 101000597758 Homo sapiens Transmembrane protein 18 Proteins 0.000 description 3
- 101000611197 Homo sapiens Trinucleotide repeat-containing gene 6C protein Proteins 0.000 description 3
- 101000652500 Homo sapiens Tubulin-specific chaperone D Proteins 0.000 description 3
- 101000597785 Homo sapiens Tumor necrosis factor receptor superfamily member 6B Proteins 0.000 description 3
- 101001030254 Homo sapiens Unconventional myosin-XVB Proteins 0.000 description 3
- 101000667110 Homo sapiens Vacuolar protein sorting-associated protein 13B Proteins 0.000 description 3
- 101000873111 Homo sapiens Vesicle transport protein SEC20 Proteins 0.000 description 3
- 101000802319 Homo sapiens Zinc finger protein 554 Proteins 0.000 description 3
- 101000976642 Homo sapiens Zinc finger protein ZIC 4 Proteins 0.000 description 3
- 101000620751 Homo sapiens mRNA export factor RAE1 Proteins 0.000 description 3
- 102100039926 Homocysteine-responsive endoplasmic reticulum-resident ubiquitin-like domain member 2 protein Human genes 0.000 description 3
- 102100031612 Hypermethylated in cancer 1 protein Human genes 0.000 description 3
- 102100030481 Hypoxia-inducible factor 1-alpha inhibitor Human genes 0.000 description 3
- 102100024390 Insulin gene enhancer protein ISL-2 Human genes 0.000 description 3
- 102100039090 Insulin, isoform 2 Human genes 0.000 description 3
- 102100030126 Interferon regulatory factor 4 Human genes 0.000 description 3
- 102100030075 Inverted formin-2 Human genes 0.000 description 3
- 102100024435 Iroquois-class homeodomain protein IRX-1 Human genes 0.000 description 3
- 102100020675 Krueppel-like factor 2 Human genes 0.000 description 3
- 102100036132 LIM/homeobox protein Lhx2 Human genes 0.000 description 3
- 102100022257 LIM/homeobox protein Lhx4 Human genes 0.000 description 3
- 102100022139 LIM/homeobox protein Lhx5 Human genes 0.000 description 3
- 102100040275 Leucine zipper putative tumor suppressor 1 Human genes 0.000 description 3
- 102100040698 Leucine-rich repeat and fibronectin type-III domain-containing protein 2 Human genes 0.000 description 3
- 102100035135 Limbin Human genes 0.000 description 3
- 108050003065 Limbin Proteins 0.000 description 3
- 102100037517 Metastasis-associated protein MTA1 Human genes 0.000 description 3
- 102100038938 Myosin-9 Human genes 0.000 description 3
- 102100020694 NEDD8-conjugating enzyme UBE2F Human genes 0.000 description 3
- 108010018525 NFATC Transcription Factors Proteins 0.000 description 3
- 102000002673 NFATC Transcription Factors Human genes 0.000 description 3
- 102100021346 Neuritin-like protein Human genes 0.000 description 3
- 102100038550 Neurogenin-1 Human genes 0.000 description 3
- 102100024006 Nuclear factor 1 A-type Human genes 0.000 description 3
- 102100022678 Nucleophosmin Human genes 0.000 description 3
- 102100026742 Opioid-binding protein/cell adhesion molecule Human genes 0.000 description 3
- 101710096745 Opioid-binding protein/cell adhesion molecule Proteins 0.000 description 3
- 108010032788 PAX6 Transcription Factor Proteins 0.000 description 3
- 102100029578 PEX5-related protein Human genes 0.000 description 3
- 102100035196 POLG alternative reading frame Human genes 0.000 description 3
- 102100026459 POU domain, class 3, transcription factor 2 Human genes 0.000 description 3
- 102100028974 PR domain zinc finger protein 14 Human genes 0.000 description 3
- 102100040852 Paired box protein Pax-2 Human genes 0.000 description 3
- 102100037506 Paired box protein Pax-6 Human genes 0.000 description 3
- 102100033786 Paired mesoderm homeobox protein 1 Human genes 0.000 description 3
- 108010068633 Perilipin-3 Proteins 0.000 description 3
- 102000001486 Perilipin-3 Human genes 0.000 description 3
- 102100036082 Phosphatidylinositol 4-phosphate 5-kinase type-1 gamma Human genes 0.000 description 3
- 102100035193 Phosphatidylinositol N-acetylglucosaminyltransferase subunit Q Human genes 0.000 description 3
- 102100024536 Phospholipid scramblase family member 5 Human genes 0.000 description 3
- 102100030345 Pituitary homeobox 1 Human genes 0.000 description 3
- 102100038236 Probable ATP-dependent RNA helicase DDX53 Human genes 0.000 description 3
- 102100027568 Probable E3 SUMO-protein ligase RNF212 Human genes 0.000 description 3
- 102100026179 Probable cysteine-tRNA ligase, mitochondrial Human genes 0.000 description 3
- 102100038931 Proenkephalin-A Human genes 0.000 description 3
- 102100034836 Proliferation marker protein Ki-67 Human genes 0.000 description 3
- 102100031135 Protein Dok-7 Human genes 0.000 description 3
- 102100020938 Protein FAM168A Human genes 0.000 description 3
- 108010038241 Protein Inhibitors of Activated STAT Proteins 0.000 description 3
- 102100023432 Protein NLRC5 Human genes 0.000 description 3
- 102100025660 Protein odd-skipped-related 2 Human genes 0.000 description 3
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 3
- 102000018795 RELT Human genes 0.000 description 3
- 108010052562 RELT Proteins 0.000 description 3
- 102100027669 RNA polymerase II subunit A C-terminal domain phosphatase Human genes 0.000 description 3
- 102000020171 Rab20 Human genes 0.000 description 3
- 108050007545 Rab20 Proteins 0.000 description 3
- 102100029539 Ras-related protein Rab-40C Human genes 0.000 description 3
- 102100030697 Receptor activity-modifying protein 1 Human genes 0.000 description 3
- 108010022037 Retinoic Acid 4-Hydroxylase Proteins 0.000 description 3
- 102000012211 Retinoic Acid 4-Hydroxylase Human genes 0.000 description 3
- 102100032436 Rho guanine nucleotide exchange factor 16 Human genes 0.000 description 3
- 102100027219 S phase cyclin A-associated protein in the endoplasmic reticulum Human genes 0.000 description 3
- 102100038524 SKI family transcriptional corepressor 1 Human genes 0.000 description 3
- 108010069296 ST6GalNAc V brain-specific GD1alpha synthase Proteins 0.000 description 3
- 102100037191 Sal-like protein 3 Human genes 0.000 description 3
- 101100495925 Schizosaccharomyces pombe (strain 972 / ATCC 24843) chr3 gene Proteins 0.000 description 3
- 102100035737 Serine dehydratase-like Human genes 0.000 description 3
- 102100035717 Serine racemase Human genes 0.000 description 3
- 102100027903 Serine/threonine-protein kinase 32C Human genes 0.000 description 3
- 102100034136 Serine/threonine-protein kinase receptor R3 Human genes 0.000 description 3
- 102100024788 Small integral membrane protein 5 Human genes 0.000 description 3
- 102100034766 Small nuclear protein PRAC1 Human genes 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 102100030414 Sperm acrosome-associated protein 7 Human genes 0.000 description 3
- 102100030067 Surfactant-associated protein 3 Human genes 0.000 description 3
- 102100032568 T-cell leukemia homeobox protein 3 Human genes 0.000 description 3
- 102100035103 Testis-expressed protein 29 Human genes 0.000 description 3
- 102100031293 Thimet oligopeptidase Human genes 0.000 description 3
- 102100034795 Thioredoxin, mitochondrial Human genes 0.000 description 3
- 102100033345 Transcription factor AP-2 gamma Human genes 0.000 description 3
- 102100030248 Transcription factor SOX-1 Human genes 0.000 description 3
- 102100024878 Transmembrane protein 179 Human genes 0.000 description 3
- 102100035318 Transmembrane protein 18 Human genes 0.000 description 3
- 102100040242 Trinucleotide repeat-containing gene 6C protein Human genes 0.000 description 3
- 102100030290 Tubulin-specific chaperone D Human genes 0.000 description 3
- 102100035284 Tumor necrosis factor receptor superfamily member 6B Human genes 0.000 description 3
- 102100038933 Unconventional myosin-XVB Human genes 0.000 description 3
- 102100039113 Vacuolar protein sorting-associated protein 13B Human genes 0.000 description 3
- 102100038286 Vasoactive intestinal polypeptide receptor 2 Human genes 0.000 description 3
- 101710137651 Vasoactive intestinal polypeptide receptor 2 Proteins 0.000 description 3
- 102100035030 Vesicle transport protein SEC20 Human genes 0.000 description 3
- 108010020277 WD repeat containing planar cell polarity effector Proteins 0.000 description 3
- 102100020877 WD repeat-containing and planar cell polarity effector protein fritz homolog Human genes 0.000 description 3
- 102100034645 Zinc finger protein 554 Human genes 0.000 description 3
- 102100023493 Zinc finger protein ZIC 4 Human genes 0.000 description 3
- 230000004931 aggregating effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 101150113057 cactin gene Proteins 0.000 description 3
- 108010053786 carboxypeptidase Z Proteins 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 102100022885 mRNA export factor RAE1 Human genes 0.000 description 3
- 230000003211 malignant effect Effects 0.000 description 3
- 238000007855 methylation-specific PCR Methods 0.000 description 3
- 239000002213 purine nucleotide Substances 0.000 description 3
- 239000002719 pyrimidine nucleotide Substances 0.000 description 3
- 150000003230 pyrimidines Chemical class 0.000 description 3
- 238000003753 real-time PCR Methods 0.000 description 3
- 102100036933 12-(S)-hydroxy-5,8,10,14-eicosatetraenoic acid receptor Human genes 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 102100039338 Aminomethyltransferase, mitochondrial Human genes 0.000 description 2
- 102100026683 Angiogenic factor with G patch and FHA domains 1 Human genes 0.000 description 2
- 238000009007 Diagnostic Kit Methods 0.000 description 2
- 102100024443 Dihydropyrimidinase-related protein 4 Human genes 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 108091010837 Glial cell line-derived neurotrophic factor Proteins 0.000 description 2
- 102000034615 Glial cell line-derived neurotrophic factor Human genes 0.000 description 2
- 102100029020 Homeobox protein HMX2 Human genes 0.000 description 2
- 101001071349 Homo sapiens 12-(S)-hydroxy-5,8,10,14-eicosatetraenoic acid receptor Proteins 0.000 description 2
- 101000887804 Homo sapiens Aminomethyltransferase, mitochondrial Proteins 0.000 description 2
- 101000690725 Homo sapiens Angiogenic factor with G patch and FHA domains 1 Proteins 0.000 description 2
- 101001053490 Homo sapiens Dihydropyrimidinase-related protein 4 Proteins 0.000 description 2
- 101000986307 Homo sapiens Homeobox protein HMX2 Proteins 0.000 description 2
- 101000613629 Homo sapiens Lysine-specific demethylase 4B Proteins 0.000 description 2
- 101001006996 Homo sapiens Serine/threonine-protein kinase H1 Proteins 0.000 description 2
- 101000588540 Homo sapiens Serine/threonine-protein kinase Nek6 Proteins 0.000 description 2
- 101100313974 Homo sapiens TLX2 gene Proteins 0.000 description 2
- 101000954157 Homo sapiens Vasopressin V1a receptor Proteins 0.000 description 2
- 102100040860 Lysine-specific demethylase 4B Human genes 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 206010027476 Metastases Diseases 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 101150064081 SIX3 gene Proteins 0.000 description 2
- 102100028474 Serine/threonine-protein kinase H1 Human genes 0.000 description 2
- 102100031401 Serine/threonine-protein kinase Nek6 Human genes 0.000 description 2
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 2
- 101150115782 TLX2 gene Proteins 0.000 description 2
- 102100037187 Vasopressin V1a receptor Human genes 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 210000003917 human chromosome Anatomy 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000009401 metastasis Effects 0.000 description 2
- RXNXLAHQOVLMIE-UHFFFAOYSA-N phenyl 10-methylacridin-10-ium-9-carboxylate Chemical compound C12=CC=CC=C2[N+](C)=C2C=CC=CC2=C1C(=O)OC1=CC=CC=C1 RXNXLAHQOVLMIE-UHFFFAOYSA-N 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- DJEHXEMURTVAOE-UHFFFAOYSA-M potassium bisulfite Chemical compound [K+].OS([O-])=O DJEHXEMURTVAOE-UHFFFAOYSA-M 0.000 description 2
- 229940099427 potassium bisulfite Drugs 0.000 description 2
- 235000010259 potassium hydrogen sulphite Nutrition 0.000 description 2
- 238000012372 quality testing Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- AOSFMYBATFLTAQ-UHFFFAOYSA-N 1-amino-3-(benzimidazol-1-yl)propan-2-ol Chemical compound C1=CC=C2N(CC(O)CN)C=NC2=C1 AOSFMYBATFLTAQ-UHFFFAOYSA-N 0.000 description 1
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- JTNCEQNHURODLX-UHFFFAOYSA-N 2-phenylethanimidamide Chemical compound NC(=N)CC1=CC=CC=C1 JTNCEQNHURODLX-UHFFFAOYSA-N 0.000 description 1
- 101150078398 Ahsp gene Proteins 0.000 description 1
- 101150101605 BNC1 gene Proteins 0.000 description 1
- 101150008122 Bcan gene Proteins 0.000 description 1
- 101150038349 CCNA1 gene Proteins 0.000 description 1
- 101150090468 CILP2 gene Proteins 0.000 description 1
- 101150033941 CLEC14A gene Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 101150091394 Drd5 gene Proteins 0.000 description 1
- 101150008523 EBF2 gene Proteins 0.000 description 1
- 101150020290 EVX2 gene Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102100033047 G-protein coupled receptor 3 Human genes 0.000 description 1
- 101150029115 HOPX gene Proteins 0.000 description 1
- 101150016059 HOXA13 gene Proteins 0.000 description 1
- 101150017486 HOXD12 gene Proteins 0.000 description 1
- 102100030309 Homeobox protein Hox-A1 Human genes 0.000 description 1
- 101100272646 Homo sapiens BNC1 gene Proteins 0.000 description 1
- 101100496005 Homo sapiens CILP2 gene Proteins 0.000 description 1
- 101000871088 Homo sapiens G-protein coupled receptor 3 Proteins 0.000 description 1
- 101001083156 Homo sapiens Homeobox protein Hox-A1 Proteins 0.000 description 1
- 101100020640 Homo sapiens LBX2 gene Proteins 0.000 description 1
- 101100242101 Homo sapiens OLIG3 gene Proteins 0.000 description 1
- 101100203275 Homo sapiens SIM2 gene Proteins 0.000 description 1
- 101100096510 Homo sapiens SPRN gene Proteins 0.000 description 1
- 101000838578 Homo sapiens Serine/threonine-protein kinase TAO2 Proteins 0.000 description 1
- 101100098951 Homo sapiens TBR1 gene Proteins 0.000 description 1
- 101100313162 Homo sapiens TBX15 gene Proteins 0.000 description 1
- 101100313165 Homo sapiens TBX18 gene Proteins 0.000 description 1
- 101100426073 Homo sapiens TRIM58 gene Proteins 0.000 description 1
- 101100214311 Homo sapiens ZFHX3 gene Proteins 0.000 description 1
- 101100545259 Homo sapiens ZIC2 gene Proteins 0.000 description 1
- 101150050410 Hoxd8 gene Proteins 0.000 description 1
- 101150016712 IKZF1 gene Proteins 0.000 description 1
- 101150071462 INSIG1 gene Proteins 0.000 description 1
- 101150016847 IRX4 gene Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 102220516431 Kidney-associated antigen 1_R1A_mutation Human genes 0.000 description 1
- 101150029259 LBX2 gene Proteins 0.000 description 1
- 101150097504 LHX1 gene Proteins 0.000 description 1
- 101150041858 MKX gene Proteins 0.000 description 1
- 101100178955 Mus musculus Hoxd4 gene Proteins 0.000 description 1
- 101150092239 OTX2 gene Proteins 0.000 description 1
- 101150077449 POU3F3 gene Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 101150082310 Rpl9 gene Proteins 0.000 description 1
- 101150106827 SFRP2 gene Proteins 0.000 description 1
- 102100023161 Seizure 6-like protein 2 Human genes 0.000 description 1
- 102100031579 Shadow of prion protein Human genes 0.000 description 1
- 101100193542 Solanum demissum R1A gene Proteins 0.000 description 1
- 101150034175 Syt10 gene Proteins 0.000 description 1
- 108010029625 T-Box Domain Protein 2 Proteins 0.000 description 1
- 102100038721 T-box transcription factor TBX2 Human genes 0.000 description 1
- 101150067263 TBR1 gene Proteins 0.000 description 1
- 101150058980 TBX15 gene Proteins 0.000 description 1
- 101150003741 TBX18 gene Proteins 0.000 description 1
- 101150052804 TOPAZ1 gene Proteins 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 101150111019 Tbx3 gene Proteins 0.000 description 1
- 101150021063 Timp2 gene Proteins 0.000 description 1
- 101150041044 ULBP1 gene Proteins 0.000 description 1
- 101150036297 ZFHX3 gene Proteins 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- BIGPRXCJEDHCLP-UHFFFAOYSA-N ammonium bisulfate Chemical compound [NH4+].OS([O-])(=O)=O BIGPRXCJEDHCLP-UHFFFAOYSA-N 0.000 description 1
- 238000013103 analytical ultracentrifugation Methods 0.000 description 1
- 230000001640 apoptogenic effect Effects 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 238000001369 bisulfite sequencing Methods 0.000 description 1
- LVGQIQHJMRUCRM-UHFFFAOYSA-L calcium bisulfite Chemical compound [Ca+2].OS([O-])=O.OS([O-])=O LVGQIQHJMRUCRM-UHFFFAOYSA-L 0.000 description 1
- 235000010260 calcium hydrogen sulphite Nutrition 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 210000002808 connective tissue Anatomy 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000030944 contact inhibition Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- VGONTNSXDCQUGY-UHFFFAOYSA-N desoxyinosine Natural products C1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 VGONTNSXDCQUGY-UHFFFAOYSA-N 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- WBZKQQHYRPRKNJ-UHFFFAOYSA-L disulfite Chemical compound [O-]S(=O)S([O-])(=O)=O WBZKQQHYRPRKNJ-UHFFFAOYSA-L 0.000 description 1
- 101150096609 dmrta2 gene Proteins 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 210000003722 extracellular fluid Anatomy 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 101150075618 foxd3 gene Proteins 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000008105 immune reaction Effects 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 230000036046 immunoreaction Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009830 intercalation Methods 0.000 description 1
- 238000002350 laparotomy Methods 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 101150069859 mos gene Proteins 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 230000001338 necrotic effect Effects 0.000 description 1
- 210000000944 nerve tissue Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000007800 oxidant agent Substances 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000010827 pathological analysis Methods 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 229910000343 potassium bisulfate Inorganic materials 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- WBHQBSYUUJJSRZ-UHFFFAOYSA-M sodium bisulfate Chemical compound [Na+].OS([O-])(=O)=O WBHQBSYUUJJSRZ-UHFFFAOYSA-M 0.000 description 1
- 229910000342 sodium bisulfate Inorganic materials 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 101150008195 tbx20 gene Proteins 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 239000000439 tumor marker Substances 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 101150116983 znf750 gene Proteins 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/40—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2527/00—Reactions demanding special reaction conditions
- C12Q2527/146—Concentration of target or template
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2531/00—Reactions of nucleic acids characterised by
- C12Q2531/10—Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
- C12Q2531/113—PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/107—Nucleic acid detection characterized by the use of physical, structural and functional properties fluorescence
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/112—Disease subtyping, staging or classification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/50—Determining the risk of developing a disease
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Medical Informatics (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Public Health (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Databases & Information Systems (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本出願は、腫瘍を評価するための、物質及び方法に関する。特に、本出願は、対象における腫瘍発症のリスク及び/又は腫瘍進行を評価するための、物質、キット、デバイス、システム及び方法を提供する。例えば、本出願は、対象から選択された標的ポリヌクレオチド配列のメチル化状態に基づいて、対象における腫瘍形成リスク及び/又は腫瘍進行を評価する方法を提供する。
Description
本出願は、生物医学の分野に関し、具体的には、腫瘍を評価するための、物質及び方法に関する。
背景技術
膵管腺癌(PDAC)等の膵癌は、世界で最も致死的な疾患の1つである。その5年相対生存率は9%であり、遠隔転移を有する患者については、この率はわずか3%にさらに低下する。高い死亡率の主な理由は、PDACの早期検出のための方法が依然として限定されており、PDAC患者にとって外科的切除を受けることが重要であることである。超音波内視鏡下穿刺吸引法(EUS-FNA)は、開腹手術を行わずに病理診断を得るための別の一般的な方法であるが、侵襲的であり、PDACが既に進行していることを通常意味する明確な画像所見を必要とする。腫瘍の発生及び発症中に、悪性細胞におけるDNAメチル化パターン及びゲノムDNAのレベルに大きな変化が生じる。いくつかの腫瘍特異的DNAメチル化は、腫瘍形成の初期に起こることが示されており、腫瘍形成の「促進因子」であり得る。循環腫瘍DNA(ctDNA)分子は、アポトーシス又は壊死腫瘍細胞に由来し、初期悪性腫瘍からの腫瘍特異的DNAメチル化マーカを有する。近年、様々な癌に対する非侵襲的早期スクリーニングツールの開発のための新たな有望な標的として研究されている。しかしながら、これらの研究のほとんどは、有効な結果をもたらさなかった。
したがって、血漿DNAから膵癌腫瘍特異的マーカを同定することができる物質及び方法が当技術分野において緊急に必要とされている。
本出願は、試料中の標的遺伝子及び/又は標的配列のメチル化レベルを検出し、その検出結果の差次的な遺伝子メチル化レベルを用いて、膵癌を特定することにより、より高精度、低コストで、膵癌を非侵襲的かつ正確に診断することを目的とする。
一態様では、本出願は、DNAメチル化を検出するための試薬を提供し、試薬は、検出対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを検出するための試薬を含み、DNA配列は、以下の遺伝子配列:DMRTA2、FOXD3、TBX15、BCAN、TRIM58、SIX3、VAX2、EMX1、LBX2、TLX2、POU3F3、TBR1、EVX2、HOXD12、HOXD8、HOXD4、TOPAZ1、SHOX2、DRD5、RPL9、HOPX、SFRP2、IRX4、TBX18、OLIG3、ULBP1、HOXA13、TBX20、IKZF1、INSIG1、SOX7、EBF2、MOS、MKX、KCNA6、SYT10、AGAP2、TBX3、CCNA1、ZIC2、CLEC14A、OTX2、C14orf39、BNC1、AHSP、ZFHX3、LHX1、TIMP2、ZNF750、SIM2又はその20kb上流若しくは下流内の配列のうちの1つ又は複数又は全てから選択される。本出願は、配列番号1~56に示される配列を包含する、上述の遺伝子から選択される標的配列を膵癌関連遺伝子として有するメチル化マーカをさらに提供する。本出願はさらに、上記の標的遺伝子及び/又は標的配列DNA配列又はその断片及び/又はそのメチル化情報を担持する培地及びデバイスを提供する。また、本出願は、上記の標的遺伝子及び/又は標的配列DNA配列又はその断片、及び/又はそのメチル化情報の、対象の膵癌の診断用キットの調製における、使用を提供する。本出願は、上記のキットをさらに提供する。
別の態様では、本出願は、DNAメチル化を検出するための試薬を提供し、試薬は、検出される対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを検出するための試薬を含み、DNA配列は、以下の遺伝子配列、又はその20kb上流若しくは下流の配列:SIX3、TLX2、及びCILP2のうちの1つ若しくは複数(少なくとも7つ等)又は全てから選択される。本出願は、配列番号57~59に示される配列を包含する、上述の遺伝子から選択される標的配列を膵癌関連遺伝子として有するメチル化マーカをさらに提供する。本出願はさらに、上記の標的遺伝子及び/又は標的配列DNA配列又はその断片及び/又はそのメチル化情報を担持する培地及びデバイスを提供する。また、本出願は、上記の標的遺伝子及び/又は標的配列DNA配列又はその断片、及び/又はそのメチル化情報の、対象の膵癌の診断用キットの調製における、使用を提供する。本出願は、上記のキットをさらに提供する。
背景技術
膵管腺癌(PDAC)等の膵癌は、世界で最も致死的な疾患の1つである。その5年相対生存率は9%であり、遠隔転移を有する患者については、この率はわずか3%にさらに低下する。高い死亡率の主な理由は、PDACの早期検出のための方法が依然として限定されており、PDAC患者にとって外科的切除を受けることが重要であることである。超音波内視鏡下穿刺吸引法(EUS-FNA)は、開腹手術を行わずに病理診断を得るための別の一般的な方法であるが、侵襲的であり、PDACが既に進行していることを通常意味する明確な画像所見を必要とする。腫瘍の発生及び発症中に、悪性細胞におけるDNAメチル化パターン及びゲノムDNAのレベルに大きな変化が生じる。いくつかの腫瘍特異的DNAメチル化は、腫瘍形成の初期に起こることが示されており、腫瘍形成の「促進因子」であり得る。循環腫瘍DNA(ctDNA)分子は、アポトーシス又は壊死腫瘍細胞に由来し、初期悪性腫瘍からの腫瘍特異的DNAメチル化マーカを有する。近年、様々な癌に対する非侵襲的早期スクリーニングツールの開発のための新たな有望な標的として研究されている。しかしながら、これらの研究のほとんどは、有効な結果をもたらさなかった。
したがって、血漿DNAから膵癌腫瘍特異的マーカを同定することができる物質及び方法が当技術分野において緊急に必要とされている。
本出願は、試料中の標的遺伝子及び/又は標的配列のメチル化レベルを検出し、その検出結果の差次的な遺伝子メチル化レベルを用いて、膵癌を特定することにより、より高精度、低コストで、膵癌を非侵襲的かつ正確に診断することを目的とする。
一態様では、本出願は、DNAメチル化を検出するための試薬を提供し、試薬は、検出対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを検出するための試薬を含み、DNA配列は、以下の遺伝子配列:DMRTA2、FOXD3、TBX15、BCAN、TRIM58、SIX3、VAX2、EMX1、LBX2、TLX2、POU3F3、TBR1、EVX2、HOXD12、HOXD8、HOXD4、TOPAZ1、SHOX2、DRD5、RPL9、HOPX、SFRP2、IRX4、TBX18、OLIG3、ULBP1、HOXA13、TBX20、IKZF1、INSIG1、SOX7、EBF2、MOS、MKX、KCNA6、SYT10、AGAP2、TBX3、CCNA1、ZIC2、CLEC14A、OTX2、C14orf39、BNC1、AHSP、ZFHX3、LHX1、TIMP2、ZNF750、SIM2又はその20kb上流若しくは下流内の配列のうちの1つ又は複数又は全てから選択される。本出願は、配列番号1~56に示される配列を包含する、上述の遺伝子から選択される標的配列を膵癌関連遺伝子として有するメチル化マーカをさらに提供する。本出願はさらに、上記の標的遺伝子及び/又は標的配列DNA配列又はその断片及び/又はそのメチル化情報を担持する培地及びデバイスを提供する。また、本出願は、上記の標的遺伝子及び/又は標的配列DNA配列又はその断片、及び/又はそのメチル化情報の、対象の膵癌の診断用キットの調製における、使用を提供する。本出願は、上記のキットをさらに提供する。
別の態様では、本出願は、DNAメチル化を検出するための試薬を提供し、試薬は、検出される対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを検出するための試薬を含み、DNA配列は、以下の遺伝子配列、又はその20kb上流若しくは下流の配列:SIX3、TLX2、及びCILP2のうちの1つ若しくは複数(少なくとも7つ等)又は全てから選択される。本出願は、配列番号57~59に示される配列を包含する、上述の遺伝子から選択される標的配列を膵癌関連遺伝子として有するメチル化マーカをさらに提供する。本出願はさらに、上記の標的遺伝子及び/又は標的配列DNA配列又はその断片及び/又はそのメチル化情報を担持する培地及びデバイスを提供する。また、本出願は、上記の標的遺伝子及び/又は標的配列DNA配列又はその断片、及び/又はそのメチル化情報の、対象の膵癌の診断用キットの調製における、使用を提供する。本出願は、上記のキットをさらに提供する。
別の態様では、本出願は、DNAメチル化を検出するための試薬を提供し、試薬は、検出対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを検出するための試薬を含み、DNA配列は、以下の遺伝子配列:ARHGEF16、PRDM16、NFIA、ST6GALNAC5、PRRX1、LHX4、ACBD6、FMN2、CHRM3、FAM150B、TMEM18、SIX3、CAMKMT、OTX1、WDPCP、CYP26B1、DYSF、HOXD1、HOXD4、UBE2F、RAMP1、AMT、PLSCR5、ZIC4、PEX5L、ETV5、DGKG、FGF12、FGFRL1、RNF212、DOK7、HGFAC、EVC、EVC2、HMX1、CPZ、IRX1、GDNF、AGGF1、CRHBP、PITX1、CATSPER3、NEUROG1、NPM1、TLX3、NKX2-5、BNIP1、PROP1、B4GALT7、IRF4、FOXF2、FOXQ1、FOXC1、GMDS、MOCS1、LRFN2、POU3F2、FBXL4、CCR6、GPR31、TBX20、HERPUD2、VIPR2、LZTS1、NKX2-6、PENK、PRDM14、VPS13B、OSR2、NEK6、LHX2、DDIT4、DNAJB12、CRTAC1、PAX2、HIF1AN、ELOVL3、INA、HMX2、HMX3、MKI67、DPYSL4、STK32C、INS、INS-IGF2、ASCL2、PAX6、RELT、FAM168A、OPCML、ACVR1B、ACVRL1、AVPR1A、LHX5、SDSL、RAB20、COL4A2、CARKD、CARS2、SOX1、TEX29、SPACA7、SFTA3、SIX6、SIX1、INF2、TMEM179、CRIP2、MTA1、PIAS1、SKOR1、ISL2、SCAPER、POLG、RHCG、NR2F2、RAB40C、PIGQ、CPNE2、NLRC5、PSKH1、NRN1L、SRR、HIC1、HOXB9、PRAC1、SMIM5、MYO15B、TNRC6C、9-Sep、TBCD、ZNF750、KCTD1、SALL3、CTDP1、NFATC1、ZNF554、THOP1、CACTIN、PIP5K1C、KDM4B、PLIN3、EPS15L1、KLF2、EPS8L1、PPP1R12C、NKX2-4、NKX2-2、TFAP2C、RAE1、TNFRSF6B、ARFRP1、MYH9及びTXN2又はその20kb上流若しくは下流内の配列のうちの1つ又は複数(少なくとも7等)又は全てから選択される。本出願は、配列番号60~160に示される配列を包含する、上述の遺伝子から選択される標的配列を膵癌関連遺伝子として有するメチル化マーカをさらに提供する。本出願はさらに、上記の標的遺伝子及び/又は標的配列DNA配列又はその断片及び/又はそのメチル化情報を担持する培地及びデバイスを提供する。また、本出願は、上記の標的遺伝子及び/又は標的配列DNA配列又はその断片、及び/又はそのメチル化情報の、対象の膵癌の診断用キットの調製における、使用を提供する。本出願は、上記のキットをさらに提供する。
別の態様では、本出願は、患者の血漿試料中のDNAメチル化を検出し、標的メチル化マーカのメチル化度データとCA19-9検出結果とに基づいて、膵癌をより高精度かつ低コストで非侵襲的かつ正確に診断する目的を達成するために、膵癌を診断するための機械学習モデルを構築することを提供する。また、本出願は、(1)対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ又は複数のCpGジヌクレオチドのメチル化状態若しくはレベルと、対象のCA19-9レベルとを取得すること、(2)メチル化状態若しくはレベルを用いて演算し、メチル化スコアを得る数理モデルを用いること、(3)メチル化スコアとCA19-9レベルとをデータマトリックスに合成すること、(4)データマトリックスに基づいて膵癌診断モデルを構築すること、及び任意に(5)膵癌スコアを得、膵癌スコアに基づいて膵癌を診断することを含む、膵癌の診断又は膵癌診断モデルの構築方法を提供する。1つ又は複数の実施形態では、DNA配列は、以下の遺伝子配列:SIX3、TLX2、CILP2又はその20kb上流若しくは下流内の配列のうちの1つ又は複数(例えば、少なくとも2つ)又は全てから選択される。好ましくは、DNA配列は、以下の組合せのいずれかから選択される遺伝子配列を包含する:(1)SIX3、TLX2;(2)SIX3、CILP2;(3)TLX2、CILP2;(4)SIX3、TLX2、CILP2。また、本出願は、(1)対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ又は複数のCpGジヌクレオチドのメチル化状態若しくはレベルと、対象のCA19-9レベルとを取得すること、(2)メチル化状態又はレベルを用いて数理モデルを用いて算出し、メチル化スコアを取得すること、(3)以下に示すモデルであって、
式中、Mは工程(2)で計算された試料のメチル化スコアであり、Cは試料のCA19-9レベルであるモデルに基づいて膵癌スコアを取得し、膵癌スコアに基づいて膵癌を診断することを含む、膵癌の診断方法を提供する。1つ又は複数の実施形態では、DNA配列は、以下の遺伝子配列:SIX3、TLX2、CILP2又はその20kb上流若しくは下流内の配列のうちの1つ又は複数(例えば、少なくとも2つ)又は全てから選択される。好ましくは、DNA配列は、以下の組合せのいずれかから選択される遺伝子配列を包含する:(1)SIX3、TLX2;(2)SIX3、CILP2;(3)TLX2、CILP2;(4)SIX3、TLX2、CILP2。また、本出願は、(1)対象におけるゲノムDNAセグメントのメチル化ハプロタイプ分率及び配列決定デプスを取得し、任意に、(2)メチル化ハプロタイプ分率及び配列決定デプスデータを前処理し、(3)特徴メチル化セグメントを取得するためにクロスバリデーション増分特徴選択を行い、(4)特徴メチル化セグメントのメチル化検出結果についての数学モデルを構築し、メチル化スコアを取得し、(5)メチル化スコア及び対応するCA19-9レベルに基づいて、膵癌診断モデルを構築する、膵癌診断モデルの構築方法を提供する。1つ又は複数の実施形態において、工程(1)は、1.1)配列決定リードデータを得るために、対象の試料のDNAメチル化を検出すること、1.2)場合により、アダプタ及び/又はスプライシングを除去する等、配列決定データを前処理すること、1.3)メチル化セグメントの位置及び配列決定デプス情報を得るために、配列決定データを参照ゲノムにアラインメントすること、1.4)以下の式であって、
式中、iは標的メチル化領域を表し、hは標的メチル化ハプロタイプを表し、Niは標的メチル化領域に位置するリードの数を表し、Ni、hは標的メチル化ハプロタイプを含むリードの数を表す、
式に従ってセグメントのメチル化ハプロタイプ分率(MHF)を計算することを含む。本出願は、DNAメチル化を検出するための試薬若しくはデバイス、及びCA19-9レベルを検出するための試薬若しくはデバイスの、膵癌診断用キットの調製における、使用であって、DNAメチル化を検出するための試薬若しくはデバイスが、対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを決定するために使用される、使用をさらに提供する。本出願は、上記のキットをさらに提供する。また、本出願は、メモリと、プロセッサと、メモリに格納され、プロセッサで実行可能なコンピュータプログラムと、を包含し、プロセッサがプログラムを実行することにより、工程が実現される、膵癌の診断又は膵癌診断モデルの構築デバイスを提供する。
別の態様では、本出願は、患者の血漿試料中のDNAメチル化を検出し、標的メチル化マーカのメチル化度データとCA19-9検出結果とに基づいて、膵癌をより高精度かつ低コストで非侵襲的かつ正確に診断する目的を達成するために、膵癌を診断するための機械学習モデルを構築することを提供する。また、本出願は、(1)対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ又は複数のCpGジヌクレオチドのメチル化状態若しくはレベルと、対象のCA19-9レベルとを取得すること、(2)メチル化状態若しくはレベルを用いて演算し、メチル化スコアを得る数理モデルを用いること、(3)メチル化スコアとCA19-9レベルとをデータマトリックスに合成すること、(4)データマトリックスに基づいて膵癌診断モデルを構築すること、及び任意に(5)膵癌スコアを得、膵癌スコアに基づいて膵癌を診断することを含む、膵癌の診断又は膵癌診断モデルの構築方法を提供する。1つ又は複数の実施形態では、DNA配列は、以下の遺伝子配列:SIX3、TLX2、CILP2又はその20kb上流若しくは下流内の配列のうちの1つ又は複数(例えば、少なくとも2つ)又は全てから選択される。好ましくは、DNA配列は、以下の組合せのいずれかから選択される遺伝子配列を包含する:(1)SIX3、TLX2;(2)SIX3、CILP2;(3)TLX2、CILP2;(4)SIX3、TLX2、CILP2。また、本出願は、(1)対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ又は複数のCpGジヌクレオチドのメチル化状態若しくはレベルと、対象のCA19-9レベルとを取得すること、(2)メチル化状態又はレベルを用いて数理モデルを用いて算出し、メチル化スコアを取得すること、(3)以下に示すモデルであって、
式中、Mは工程(2)で計算された試料のメチル化スコアであり、Cは試料のCA19-9レベルであるモデルに基づいて膵癌スコアを取得し、膵癌スコアに基づいて膵癌を診断することを含む、膵癌の診断方法を提供する。1つ又は複数の実施形態では、DNA配列は、以下の遺伝子配列:SIX3、TLX2、CILP2又はその20kb上流若しくは下流内の配列のうちの1つ又は複数(例えば、少なくとも2つ)又は全てから選択される。好ましくは、DNA配列は、以下の組合せのいずれかから選択される遺伝子配列を包含する:(1)SIX3、TLX2;(2)SIX3、CILP2;(3)TLX2、CILP2;(4)SIX3、TLX2、CILP2。また、本出願は、(1)対象におけるゲノムDNAセグメントのメチル化ハプロタイプ分率及び配列決定デプスを取得し、任意に、(2)メチル化ハプロタイプ分率及び配列決定デプスデータを前処理し、(3)特徴メチル化セグメントを取得するためにクロスバリデーション増分特徴選択を行い、(4)特徴メチル化セグメントのメチル化検出結果についての数学モデルを構築し、メチル化スコアを取得し、(5)メチル化スコア及び対応するCA19-9レベルに基づいて、膵癌診断モデルを構築する、膵癌診断モデルの構築方法を提供する。1つ又は複数の実施形態において、工程(1)は、1.1)配列決定リードデータを得るために、対象の試料のDNAメチル化を検出すること、1.2)場合により、アダプタ及び/又はスプライシングを除去する等、配列決定データを前処理すること、1.3)メチル化セグメントの位置及び配列決定デプス情報を得るために、配列決定データを参照ゲノムにアラインメントすること、1.4)以下の式であって、
式中、iは標的メチル化領域を表し、hは標的メチル化ハプロタイプを表し、Niは標的メチル化領域に位置するリードの数を表し、Ni、hは標的メチル化ハプロタイプを含むリードの数を表す、
式に従ってセグメントのメチル化ハプロタイプ分率(MHF)を計算することを含む。本出願は、DNAメチル化を検出するための試薬若しくはデバイス、及びCA19-9レベルを検出するための試薬若しくはデバイスの、膵癌診断用キットの調製における、使用であって、DNAメチル化を検出するための試薬若しくはデバイスが、対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを決定するために使用される、使用をさらに提供する。本出願は、上記のキットをさらに提供する。また、本出願は、メモリと、プロセッサと、メモリに格納され、プロセッサで実行可能なコンピュータプログラムと、を包含し、プロセッサがプログラムを実行することにより、工程が実現される、膵癌の診断又は膵癌診断モデルの構築デバイスを提供する。
別の態様では、本出願は、試験される試料中の遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、及び/又はTWIST1又はそれらの断片を有するDNA領域の修飾状態の存在及び/又は含有量を決定することを含む、膵腫瘍の存在を決定する、膵腫瘍の発症を評価する、及び/又は膵腫瘍の進行を評価する方法を提供する。さらに、本出願は、試験される試料中の、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、DNA領域又はその相補的領域、又はその断片からなる群から選択されるDNA領域の修飾状態の存在及び/又は含有量を決定することを含む、疾患の存在を決定する、疾患の発症若しくは発症のリスクを評価する、及び/又は疾患の進行を評価する方法を提供する。さらに、本出願は、上記断片の修飾状態を同定するためのプローブ及び/又はプライマーの組合せを提供する。また、本出願は、上記物質を含むキットを提供する。別の態様において、本出願は、疾患検出製品の調製における本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットの使用を提供する。別の態様では、本出願は、疾患の存在を決定し、疾患の発症若しくは発症のリスクを評価し、及び/又は疾患の進行を評価するための、物質の調製における本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットの使用を提供する。別の態様では、本出願は、本出願の方法を実行することができるプログラムを記録した記憶媒体を提供する。別の態様では、本出願は、本出願の記憶媒体を含むデバイスを提供する。
別の態様では、本出願は、試験される試料中の遺伝子EBF2及びCCNA1、又はKCNA6、TLX2及びEMX1、又はTRIM58、TWIST1、FOXD3及びEN2、又はTRIM58、TWIST1、CLEC11A、HOXD10及びOLIG3、又はそれらの断片を有するDNA領域の修飾状態の存在及び/又は含有量を決定することを含む、膵腫瘍の存在を決定する、膵腫瘍の発症を評価する、及び/又は膵腫瘍の進行を評価する方法を提供する。さらに、本出願は、試験される試料中の、ヒトchr8:25907849-25907950に由来する、及びヒトchr13:37005635-37005754に由来する、又はヒトchr12:4919142-4919289に由来する、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:73147525-73147644に由来する、又はヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr1:63788812-63788952に由来する、及びヒトchr7:155167513-155167628に由来する、又はヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr19:51228168-51228782に由来する、ヒトchr2:176945511-176945630に由来する、及びヒトchr6:137814700-137814853に由来する、DNA領域又はその相補的領域、又はその断片からなる群から選択されるDNA領域の修飾状態の存在及び/又は含有量を決定することを含む、疾患の存在を決定する、疾患の発症若しくは発症のリスクを評価する、及び/又は疾患の進行を評価する方法を提供する。さらに、本出願は、上記断片の修飾状態を同定するためのプローブ及び/又はプライマーの組合せを提供する。また、本出願は、上記の物質組合せを含むキットを提供する。別の態様において、本出願は、疾患検出製品の調製における本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットの使用を提供する。別の態様では、本出願は、疾患の存在を決定し、疾患の発症若しくは発症のリスクを評価し、及び/又は疾患の進行を評価するための、物質の調製における本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットの使用を提供する。別の態様では、本出願は、本出願の方法を実行することができるプログラムを記録した記憶媒体を提供する。別の態様では、本出願は、本出願の記憶媒体を含むデバイスを提供する。
別の態様では、本出願は、試験される試料中の遺伝子EBF2及びCCNA1、又はKCNA6、TLX2及びEMX1、又はTRIM58、TWIST1、FOXD3及びEN2、又はTRIM58、TWIST1、CLEC11A、HOXD10及びOLIG3、又はそれらの断片を有するDNA領域の修飾状態の存在及び/又は含有量を決定することを含む、膵腫瘍の存在を決定する、膵腫瘍の発症を評価する、及び/又は膵腫瘍の進行を評価する方法を提供する。さらに、本出願は、試験される試料中の、ヒトchr8:25907849-25907950に由来する、及びヒトchr13:37005635-37005754に由来する、又はヒトchr12:4919142-4919289に由来する、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:73147525-73147644に由来する、又はヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr1:63788812-63788952に由来する、及びヒトchr7:155167513-155167628に由来する、又はヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr19:51228168-51228782に由来する、ヒトchr2:176945511-176945630に由来する、及びヒトchr6:137814700-137814853に由来する、DNA領域又はその相補的領域、又はその断片からなる群から選択されるDNA領域の修飾状態の存在及び/又は含有量を決定することを含む、疾患の存在を決定する、疾患の発症若しくは発症のリスクを評価する、及び/又は疾患の進行を評価する方法を提供する。さらに、本出願は、上記断片の修飾状態を同定するためのプローブ及び/又はプライマーの組合せを提供する。また、本出願は、上記の物質組合せを含むキットを提供する。別の態様において、本出願は、疾患検出製品の調製における本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットの使用を提供する。別の態様では、本出願は、疾患の存在を決定し、疾患の発症若しくは発症のリスクを評価し、及び/又は疾患の進行を評価するための、物質の調製における本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットの使用を提供する。別の態様では、本出願は、本出願の方法を実行することができるプログラムを記録した記憶媒体を提供する。別の態様では、本出願は、本出願の記憶媒体を含むデバイスを提供する。
当業者は、以下の詳細な説明から本出願の他の態様及び利点を容易に理解するであろう。以下の詳細な説明では、本出願の例示的な実施形態のみを示し、説明する。当業者が理解するように、本出願の内容は、当業者が本出願によって網羅される本発明の精神及び範囲から逸脱することなく、開示された特定の実施形態に変更を加えることを可能にする。したがって、本出願の明細書における図面及び説明は例示的なものにすぎず、限定的なものではない。
本出願が関連する本発明の特定の特徴は、添付の特許請求の範囲に記載されている。本出願が関連する本発明の特徴及び利点は、以下に詳細に説明する例示的な実施形態及び図面を参照することによってよりよく理解することができる。図面の簡単な説明は以下の通りである。
本出願が関連する本発明の特定の特徴は、添付の特許請求の範囲に記載されている。本出願が関連する本発明の特徴及び利点は、以下に詳細に説明する例示的な実施形態及び図面を参照することによってよりよく理解することができる。図面の簡単な説明は以下の通りである。
発明の詳細な説明
以下、具体例を挙げて本出願発明の実施形態を説明する。当業者は、本明細書の開示から本出願発明の他の利点及び効果を容易に理解することができる。
用語の定義
本出願において、「試験される試料」という用語は、通常、試験される必要がある試料を指す。例えば、試験される試料上の1つ又は複数の遺伝子領域が修飾されているかどうかを検出することができる。
本出願において、「無細胞核酸」又は「cfDNA」という用語は、一般に、収集されたときに細胞内に含まれない試料中のDNAを指す。例えば、無細胞核酸は、細胞又は組織のインビトロ破壊によって非細胞内にされたDNAを示さない場合がある。例えば、cfDNAは、正常細胞及び癌細胞の両方に由来するDNAを包含し得る。例えば、cfDNAは、血液又は血漿(「循環系」)から得ることができる。例えば、cfDNAは、壊死又はアポトーシス等の分泌又は細胞死方法を介して循環系に放出され得る。
本出願において、「相補的核酸」という用語は、一般に、参照ヌクレオチド配列に相補的なヌクレオチド配列を指す。例えば、相補的核酸は、場合により反対の向きを有する核酸分子であり得る。例えば、相補性は、以下の相補的会合:グアニン及びシトシン;アデニン及びチミン;アデニン及びウラシルを有することを指し得る。
本出願において、「DNA領域」という用語は、一般に、2つ以上の共有結合した天然に存在する又は修飾されたデオキシリボヌクレオチドの配列を指す。例えば、遺伝子のDNA領域は、遺伝子が位置する特定のデオキシリボヌクレオチド配列の位置を指すことができ、例えば、デオキシリボヌクレオチド配列は遺伝子をコードする。例えば、本出願のDNA領域は、DNA領域の全長、その相補的領域、又はその断片を包含する。例えば、本出願で提供される検出領域の上流及び下流の少なくとも約20kbの配列を検出部位として使用することができる。例えば、本出願で提供される検出領域の上流及び下流の少なくとも約20kb、少なくとも約15kb、少なくとも約10kb、少なくとも約5kb、少なくとも約3kb、少なくとも約2kb、少なくとも約1kb、又は少なくとも約0.5kbの配列を検出部位として使用することができる。例えば、適切なプライマー及びプローブは、試料のメチル化を検出するためにマイクロコンピュータを使用して上記のものに従って設計することができる。
本出願において、「修飾状態」という用語は、一般に、本出願における遺伝子断片、ヌクレオチド又はそれらの塩基の修飾状態を指す。例えば、本出願における修飾状態は、シトシンの修飾状態を指し得る。例えば、本出願における修飾状態を有する遺伝子断片は、変化した遺伝子発現活性を有し得る。例えば、本出願における修飾状態は、塩基のメチル化修飾を指し得る。例えば、本出願における修飾状態は、例えば5-メチルシトシン(5mC)になり得るゲノムDNAのCpG領域中のシトシンの5’炭素位置におけるメチル基の共有結合を指し得る。例えば、修飾状態は、DNA配列内の5-メチルシトシン(「5-mCyt」)の存在又は非存在を指し得る。
本出願において、「メチル化」とは、本出願における遺伝子断片、ヌクレオチド又はそれらの塩基のメチル化状態を総称する。例えば、本出願において遺伝子が位置するDNAセグメントは、1つ又は複数の鎖にメチル化を有し得る。例えば、本出願において遺伝子が位置するDNAセグメントは、1つ又は複数の部位にメチル化を有していてもよい。
本出願において、「変換」という用語は、一般に、1つ又は複数の構造の別の構造への変換を指す。例えば、本出願における変換は具体的であり得る。例えば、メチル化修飾を伴わないシトシンは、変換後に他の構造(例えば、ウラシル)に変化し得、メチル化修飾を伴うシトシンは、変換後に基本的に変化しないままであり得る。例えば、メチル化修飾を伴わないシトシンは、変換後に切断され得、メチル化修飾を伴うシトシンは、変換後に基本的に変化しないままであり得る。
本出願において、「脱アミノ化試薬」という用語は、一般に、アミノ基を除去する能力を有する物質を指す。例えば、脱アミノ化試薬は、未修飾シトシンを脱アミノ化することができる。
本出願において、「バイサルファイト」という用語は、一般に、修飾状態を有するDNA領域を修飾状態を有さないものと区別することができる試薬を指す。例えば、バイサルファイトは、バイサルファイト、又はその類似体、又はそれらの組合せを包含し得る。例えば、バイサルファイトは、修飾されていないシトシンのアミノ基を脱アミノ化して、修飾されたシトシンと区別することができる。本出願において、「類似体」という用語は、一般に、同様の構造及び/又は機能を有する物質を指す。例えば、バイサルファイトの類似体は、バイサルファイトと同様の構造を有し得る。例えば、バイサルファイト類似体は、修飾状態を有するDNA領域と修飾状態を有さないDNA領域とを区別することもできる試薬を指し得る。
以下、具体例を挙げて本出願発明の実施形態を説明する。当業者は、本明細書の開示から本出願発明の他の利点及び効果を容易に理解することができる。
用語の定義
本出願において、「試験される試料」という用語は、通常、試験される必要がある試料を指す。例えば、試験される試料上の1つ又は複数の遺伝子領域が修飾されているかどうかを検出することができる。
本出願において、「無細胞核酸」又は「cfDNA」という用語は、一般に、収集されたときに細胞内に含まれない試料中のDNAを指す。例えば、無細胞核酸は、細胞又は組織のインビトロ破壊によって非細胞内にされたDNAを示さない場合がある。例えば、cfDNAは、正常細胞及び癌細胞の両方に由来するDNAを包含し得る。例えば、cfDNAは、血液又は血漿(「循環系」)から得ることができる。例えば、cfDNAは、壊死又はアポトーシス等の分泌又は細胞死方法を介して循環系に放出され得る。
本出願において、「相補的核酸」という用語は、一般に、参照ヌクレオチド配列に相補的なヌクレオチド配列を指す。例えば、相補的核酸は、場合により反対の向きを有する核酸分子であり得る。例えば、相補性は、以下の相補的会合:グアニン及びシトシン;アデニン及びチミン;アデニン及びウラシルを有することを指し得る。
本出願において、「DNA領域」という用語は、一般に、2つ以上の共有結合した天然に存在する又は修飾されたデオキシリボヌクレオチドの配列を指す。例えば、遺伝子のDNA領域は、遺伝子が位置する特定のデオキシリボヌクレオチド配列の位置を指すことができ、例えば、デオキシリボヌクレオチド配列は遺伝子をコードする。例えば、本出願のDNA領域は、DNA領域の全長、その相補的領域、又はその断片を包含する。例えば、本出願で提供される検出領域の上流及び下流の少なくとも約20kbの配列を検出部位として使用することができる。例えば、本出願で提供される検出領域の上流及び下流の少なくとも約20kb、少なくとも約15kb、少なくとも約10kb、少なくとも約5kb、少なくとも約3kb、少なくとも約2kb、少なくとも約1kb、又は少なくとも約0.5kbの配列を検出部位として使用することができる。例えば、適切なプライマー及びプローブは、試料のメチル化を検出するためにマイクロコンピュータを使用して上記のものに従って設計することができる。
本出願において、「修飾状態」という用語は、一般に、本出願における遺伝子断片、ヌクレオチド又はそれらの塩基の修飾状態を指す。例えば、本出願における修飾状態は、シトシンの修飾状態を指し得る。例えば、本出願における修飾状態を有する遺伝子断片は、変化した遺伝子発現活性を有し得る。例えば、本出願における修飾状態は、塩基のメチル化修飾を指し得る。例えば、本出願における修飾状態は、例えば5-メチルシトシン(5mC)になり得るゲノムDNAのCpG領域中のシトシンの5’炭素位置におけるメチル基の共有結合を指し得る。例えば、修飾状態は、DNA配列内の5-メチルシトシン(「5-mCyt」)の存在又は非存在を指し得る。
本出願において、「メチル化」とは、本出願における遺伝子断片、ヌクレオチド又はそれらの塩基のメチル化状態を総称する。例えば、本出願において遺伝子が位置するDNAセグメントは、1つ又は複数の鎖にメチル化を有し得る。例えば、本出願において遺伝子が位置するDNAセグメントは、1つ又は複数の部位にメチル化を有していてもよい。
本出願において、「変換」という用語は、一般に、1つ又は複数の構造の別の構造への変換を指す。例えば、本出願における変換は具体的であり得る。例えば、メチル化修飾を伴わないシトシンは、変換後に他の構造(例えば、ウラシル)に変化し得、メチル化修飾を伴うシトシンは、変換後に基本的に変化しないままであり得る。例えば、メチル化修飾を伴わないシトシンは、変換後に切断され得、メチル化修飾を伴うシトシンは、変換後に基本的に変化しないままであり得る。
本出願において、「脱アミノ化試薬」という用語は、一般に、アミノ基を除去する能力を有する物質を指す。例えば、脱アミノ化試薬は、未修飾シトシンを脱アミノ化することができる。
本出願において、「バイサルファイト」という用語は、一般に、修飾状態を有するDNA領域を修飾状態を有さないものと区別することができる試薬を指す。例えば、バイサルファイトは、バイサルファイト、又はその類似体、又はそれらの組合せを包含し得る。例えば、バイサルファイトは、修飾されていないシトシンのアミノ基を脱アミノ化して、修飾されたシトシンと区別することができる。本出願において、「類似体」という用語は、一般に、同様の構造及び/又は機能を有する物質を指す。例えば、バイサルファイトの類似体は、バイサルファイトと同様の構造を有し得る。例えば、バイサルファイト類似体は、修飾状態を有するDNA領域と修飾状態を有さないDNA領域とを区別することもできる試薬を指し得る。
本出願において、「メチル化感受性制限酵素」とは、一般に、その認識部位のメチル化状態に応じて核酸を選択的に消化する酵素をいう。例えば、認識部位がメチル化されていない場合に特異的に切断する制限酵素の場合、認識部位がメチル化されている場合には、切断が起こらないか、又は切断が著しく効率が低下して起こり得る。認識部位がメチル化されているときに特異的に切断する制限酵素については、認識部位がメチル化されていないときには、切断が起こらないか、又は著しく効率が低下して起こり得る。例えば、メチル化特異的制限酵素は、CGジヌクレオチド(例えば、cgcg又はcccggg)を含む配列を認識することができる。
本出願において、「腫瘍」という用語は、一般に、正常な成長及び/又は発達中に制御の少なくとも部分的な喪失を示す細胞及び/又は組織を指す。例えば、一般的な腫瘍又は癌細胞は、接触阻害を失っていることが多く、浸潤性及び/又は転移する能力を有し得る。例えば、本出願の腫瘍は良性又は悪性であり得る。
本出願において、「進行」という用語は、一般に、疾患のそれほど重症でない状態からより重症な状態への変化を指す。例えば、腫瘍の進行は、腫瘍の数又は重症度、癌細胞転移の程度、癌が成長又は拡大する速度の増加を包含し得る。例えば、腫瘍進行は、ステージIからステージII、ステージIIからステージIII等の、それほど重症でない状態からより重症な状態への癌の進行を包含し得る。
本出願において、「発症」という用語は、一般に、個体における病変の発生を指す。例えば、腫瘍を発症した場合、個体は腫瘍患者と診断され得る。
本出願において、「蛍光PCR」という用語は、一般に、定量的又は半定量的PCR技術を指す。例えば、PCR技術は、リアルタイム定量ポリメラーゼ連鎖反応、定量ポリメラーゼ連鎖反応又は動的ポリメラーゼ連鎖反応であり得る。例えば、標的核酸の初期量は、インターカレーティング蛍光色素又は配列特異的プローブの助けを借りてPCR増幅を使用することによって定量的に検出することができ、配列特異的プローブは、それが標的核酸にハイブリダイズする場合にのみ検出可能な蛍光レポーターを含むことができる。
本出願において、「PCR増幅」という用語は、一般にポリメラーゼ連鎖反応を指す。例えば、本出願におけるPCR増幅は、DNA増幅に使用するために現在知られている任意のポリメラーゼ連鎖増幅反応を含み得る。
本出願において、「蛍光Ct値」という用語は、一般に、標的核酸の定量的又は半定量的評価のための測定値を指す。例えば、蛍光シグナルが設定された閾値に達するときに経験される増幅反応サイクルの数を指すことができる。
本出願において、「腫瘍」という用語は、一般に、正常な成長及び/又は発達中に制御の少なくとも部分的な喪失を示す細胞及び/又は組織を指す。例えば、一般的な腫瘍又は癌細胞は、接触阻害を失っていることが多く、浸潤性及び/又は転移する能力を有し得る。例えば、本出願の腫瘍は良性又は悪性であり得る。
本出願において、「進行」という用語は、一般に、疾患のそれほど重症でない状態からより重症な状態への変化を指す。例えば、腫瘍の進行は、腫瘍の数又は重症度、癌細胞転移の程度、癌が成長又は拡大する速度の増加を包含し得る。例えば、腫瘍進行は、ステージIからステージII、ステージIIからステージIII等の、それほど重症でない状態からより重症な状態への癌の進行を包含し得る。
本出願において、「発症」という用語は、一般に、個体における病変の発生を指す。例えば、腫瘍を発症した場合、個体は腫瘍患者と診断され得る。
本出願において、「蛍光PCR」という用語は、一般に、定量的又は半定量的PCR技術を指す。例えば、PCR技術は、リアルタイム定量ポリメラーゼ連鎖反応、定量ポリメラーゼ連鎖反応又は動的ポリメラーゼ連鎖反応であり得る。例えば、標的核酸の初期量は、インターカレーティング蛍光色素又は配列特異的プローブの助けを借りてPCR増幅を使用することによって定量的に検出することができ、配列特異的プローブは、それが標的核酸にハイブリダイズする場合にのみ検出可能な蛍光レポーターを含むことができる。
本出願において、「PCR増幅」という用語は、一般にポリメラーゼ連鎖反応を指す。例えば、本出願におけるPCR増幅は、DNA増幅に使用するために現在知られている任意のポリメラーゼ連鎖増幅反応を含み得る。
本出願において、「蛍光Ct値」という用語は、一般に、標的核酸の定量的又は半定量的評価のための測定値を指す。例えば、蛍光シグナルが設定された閾値に達するときに経験される増幅反応サイクルの数を指すことができる。
発明の詳細な説明
本出願のメチル化核酸断片マーカに基づいて、膵癌を効果的に同定することができ、本出願は、血漿cfDNAハイスループットメチル化シーケンシングに基づく、cfDNAメチル化マーカと膵癌との間の関係の診断モデルを提供する。このモデルは、非侵襲的で安全かつ便利な検出、高スループット及び高検出特異性という利点を有する。本出願で得られた最適なシーケンシングに基づいて、良好な検出効果を達成しながら検出コストを効果的に制御することができる。本発明のDNAメチル化マーカに基づいて、膵癌患者と慢性膵炎患者とを効果的に鑑別することができる。本発明は、血漿cfDNAハイスループットメチル化シーケンシングに基づく、cfDNAメチル化マーカのメチル化レベルと膵癌との関係の診断モデルを提供する。このモデルは、非侵襲的で安全かつ便利な検出、高スループット及び高検出特異性という利点を有する。本発明で得られた最適なシーケンシングに基づいて、良好な検出効果を達成しながら検出コストを効果的に制御することができる。
本出願のメチル化核酸断片マーカに基づいて、膵癌を効果的に同定することができ、本出願は、血漿cfDNAハイスループットメチル化シーケンシングに基づく、cfDNAメチル化マーカと膵癌との間の関係の診断モデルを提供する。このモデルは、非侵襲的で安全かつ便利な検出、高スループット及び高検出特異性という利点を有する。本出願で得られた最適なシーケンシングに基づいて、良好な検出効果を達成しながら検出コストを効果的に制御することができる。本発明のDNAメチル化マーカに基づいて、膵癌患者と慢性膵炎患者とを効果的に鑑別することができる。本発明は、血漿cfDNAハイスループットメチル化シーケンシングに基づく、cfDNAメチル化マーカのメチル化レベルと膵癌との関係の診断モデルを提供する。このモデルは、非侵襲的で安全かつ便利な検出、高スループット及び高検出特異性という利点を有する。本発明で得られた最適なシーケンシングに基づいて、良好な検出効果を達成しながら検出コストを効果的に制御することができる。
本出願は、膵癌の特性が、以下の遺伝子:DMRTA2、FOXD3、TBX15、BCAN、TRIM58、SIX3、VAX2、EMX1、LBX2、TLX2、POU3F3、TBR1、EVX2、HOXD12、HOXD8、HOXD4、TOPAZ1、SHOX2、DRD5、RPL9、HOPX、SFRP2、IRX4、TBX18、OLIG3、ULBP1、HOXA13、TBX20、IKZF1、INSIG1、SOX7、EBF2、MOS、MKX、KCNA6、SYT10、AGAP2、TBX3、CCNA1、ZIC2、CLEC14A、OTX2、C14orf39、BNC1、AHSP、ZFHX3、LHX1、TIMP2、ZNF750、SIM2又はその20kb上流若しくは下流の配列から選択される1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50の遺伝子のメチル化レベルに関連することを見出した。1つ又は複数の実施形態では、膵癌の特性は、以下の組合せ:(1)LBX2、TBR1、EVX2、SFRP2、SYT10、CCNA1、ZFHX3;(2)TRIM58、HOXD4、INSIG1、SYT10、CCNA1、ZIC2、CLEC14A;(3)EMX1、POU3F3、TOPAZ1、ZIC2、OTX2、AHSP、TIMP2;(4)EMX1、EVX2、RPL9、SFRP2、HOXA13、SYT10、CLEC14A;(5)TBX15、EMX1、LBX2、OLIG3、SYT10、AGAP2、TBX3;(6)TRIM58、VAX2、EMX1、HOXD4、ZIC2、CLEC14A、LHX1;(7)POU3F3、HOXD8、RPL9、TBX18、SYT10、TBX3、CLEC14A;(8)TRIM58、EMX1、TLX2、EVX2、HOXD4、HOXD4、IRX4;(9)SIX3、POU3F3、TOPAZ1、RPL9、SFRP2、CLEC14A、BNC1;(10)DMRTA2、HOXD4、IRX4、INSIG1、MOS、CLEC14A、CLEC14Aのいずれかから選択される遺伝子の配列のメチル化レベルに関連する。本発明は、上記の遺伝子又はその断片の1つ又は複数のCpGを含む核酸分子を提供する。本出願は、膵癌と膵炎(慢性膵炎等)との間の分化が、遺伝子:SIX3、TLX2、CILP2又はその20kb上流又は下流内の以下の配列から選択される1、2、3個の遺伝子のメチル化レベルに関連することを見出した。
本発明において、「遺伝子」という用語は、ゲノム上の目的の遺伝子のコード配列と非コード配列の両方を包含する。非コード配列は、イントロン、プロモータ、調節エレメント又は配列等を包含する。
さらに、膵癌の特性は、DMRTA2遺伝子領域中の配列番号1、FOXD3遺伝子領域中の配列番号2、TBX15遺伝子領域中の配列番号3、BCAN遺伝子領域中の配列番号4、TRIM58遺伝子領域中の配列番号5、SIX3遺伝子領域中の配列番号6、VAX2遺伝子領域中の配列番号7、EMX1遺伝子領域中の配列番号8、LBX2遺伝子領域中の配列番号9、TLX2遺伝子領域中の配列番号10、POU3F3遺伝子領域中の配列番号11及び配列番号12、TBR1遺伝子領域中の配列番号13、EVX2遺伝子領域の配列番号14及び配列番号15、HOXD12遺伝子領域の配列番号16、HOXD8遺伝子領域の配列番号17、HOXD4遺伝子領域の配列番号18及び配列番号19、TOPAZ1遺伝子領域の配列番号20、SHOX2遺伝子領域の配列番号21、DRD5遺伝子領域の配列番号22、RPL9遺伝子領域の配列番号23及び配列番号24、HOPX遺伝子領域の配列番号25、SFRP2遺伝子領域の配列番号26、IRX4遺伝子領域の配列番号27、TBX18遺伝子領域の配列番号28、OLIG3遺伝子領域の配列番号29、ULBP1遺伝子領域の配列番号30、HOXA13遺伝子領域の配列番号31、TBX20遺伝子領域の配列番号32、IKZF1遺伝子領域の配列番号33、INSIG1遺伝子領域の配列番号34、SOX7遺伝子領域の配列番号35、EBF2遺伝子領域の配列番号36、MOS遺伝子領域の配列番号37、MKX遺伝子領域の配列番号38、KCNA6遺伝子領域の配列番号39、SYT10遺伝子領域の配列番号40、AGAP2遺伝子領域の配列番号41、TBX3遺伝子領域の配列番号42、CCNA1遺伝子領域における配列番号43、ZIC2遺伝子領域における配列番号44及び配列番号45、CLEC14A遺伝子領域における配列番号46及び配列番号47、OTX2遺伝子領域における配列番号48、C14orf39遺伝子領域における配列番号49、BNC1遺伝子領域における配列番号50、AHSP遺伝子領域における配列番号51、ZFHX3遺伝子領域における配列番号52、LHX1遺伝子領域における配列番号53、TIMP2遺伝子領域における配列番号54、ZNF750遺伝子領域における配列番号55及びSIM2遺伝子領域における配列番号56から選択される任意の1つ又はランダムな2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55個のセグメント又は56個全てのセグメントのメチル化レベルに関連する。
本発明において、「遺伝子」という用語は、ゲノム上の目的の遺伝子のコード配列と非コード配列の両方を包含する。非コード配列は、イントロン、プロモータ、調節エレメント又は配列等を包含する。
さらに、膵癌の特性は、DMRTA2遺伝子領域中の配列番号1、FOXD3遺伝子領域中の配列番号2、TBX15遺伝子領域中の配列番号3、BCAN遺伝子領域中の配列番号4、TRIM58遺伝子領域中の配列番号5、SIX3遺伝子領域中の配列番号6、VAX2遺伝子領域中の配列番号7、EMX1遺伝子領域中の配列番号8、LBX2遺伝子領域中の配列番号9、TLX2遺伝子領域中の配列番号10、POU3F3遺伝子領域中の配列番号11及び配列番号12、TBR1遺伝子領域中の配列番号13、EVX2遺伝子領域の配列番号14及び配列番号15、HOXD12遺伝子領域の配列番号16、HOXD8遺伝子領域の配列番号17、HOXD4遺伝子領域の配列番号18及び配列番号19、TOPAZ1遺伝子領域の配列番号20、SHOX2遺伝子領域の配列番号21、DRD5遺伝子領域の配列番号22、RPL9遺伝子領域の配列番号23及び配列番号24、HOPX遺伝子領域の配列番号25、SFRP2遺伝子領域の配列番号26、IRX4遺伝子領域の配列番号27、TBX18遺伝子領域の配列番号28、OLIG3遺伝子領域の配列番号29、ULBP1遺伝子領域の配列番号30、HOXA13遺伝子領域の配列番号31、TBX20遺伝子領域の配列番号32、IKZF1遺伝子領域の配列番号33、INSIG1遺伝子領域の配列番号34、SOX7遺伝子領域の配列番号35、EBF2遺伝子領域の配列番号36、MOS遺伝子領域の配列番号37、MKX遺伝子領域の配列番号38、KCNA6遺伝子領域の配列番号39、SYT10遺伝子領域の配列番号40、AGAP2遺伝子領域の配列番号41、TBX3遺伝子領域の配列番号42、CCNA1遺伝子領域における配列番号43、ZIC2遺伝子領域における配列番号44及び配列番号45、CLEC14A遺伝子領域における配列番号46及び配列番号47、OTX2遺伝子領域における配列番号48、C14orf39遺伝子領域における配列番号49、BNC1遺伝子領域における配列番号50、AHSP遺伝子領域における配列番号51、ZFHX3遺伝子領域における配列番号52、LHX1遺伝子領域における配列番号53、TIMP2遺伝子領域における配列番号54、ZNF750遺伝子領域における配列番号55及びSIM2遺伝子領域における配列番号56から選択される任意の1つ又はランダムな2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55個のセグメント又は56個全てのセグメントのメチル化レベルに関連する。
いくつかの実施形態では、膵癌の特性は、以下の組合せ:(1)配列番号9、配列番号13、配列番号14、配列番号26、配列番号40、配列番号43、配列番号52、(2)配列番号5、配列番号18、配列番号34、配列番号40、配列番号43、配列番号45、配列番号46、(3)配列番号8、配列番号11、配列番号20、配列番号44、配列番号48、配列番号51、配列番号54、(4)配列番号8、配列番号14、配列番号24、配列番号26、配列番号31、配列番号40、配列番号46、(5)配列番号3、配列番号8、配列番号9、配列番号29、配列番号40、配列番号41、配列番号42、(6)配列番号5、配列番号7、配列番号8、配列番号19、配列番号44、配列番号47、配列番号53、(7)配列番号12、配列番号17、配列番号24、配列番号28、配列番号40、配列番号42、配列番号47、(8)配列番号5、配列番号8、配列番号10、配列番号14、配列番号18、配列番号19、配列番号27、(9)配列番号6、配列番号12、配列番号20、配列番号24、配列番号26、配列番号47、配列番号50、(10)配列番号1、配列番号19、配列番号27、配列番号34、配列番号37、配列番号46、配列番号47又はその相補配列のいずれかから選択される配列のメチル化レベルに関連する。
本明細書に記載される「膵癌関連配列」は、上記の50個の遺伝子、その20kb上流又は下流内の配列、上記の56個の配列(配列番号1~56)又はその相補的配列、サブ領域、及び/又は処理された配列を包含する。
本明細書に記載される「膵癌関連配列」は、上記の50個の遺伝子、その20kb上流又は下流内の配列、上記の56個の配列(配列番号1~56)又はその相補的配列、サブ領域、及び/又は処理された配列を包含する。
ヒト染色体における上記の56個の配列の位置は以下の通りである:配列番号1:chr1の50884507-50885207bps、配列番号2:chr1の63788611-63789152bps、配列番号3:chr1の119522143-119522719bps、配列番号4:chr1の156611710-156612211bps、配列番号5:chr1の248020391-248020979bps、配列番号6:chr2の45028796-45029378bps、配列番号7:chr2の71115731-71116272bps、配列番号8:chr2の73147334-73147835bps、配列番号9:chr2の74726401-74726922bps、配列番号10:chr2の74742861-74743362bps、配列番号11:chr2の105480130-105480830bps、配列番号12:chr2の105480157-105480659bps、配列番号13:chr2の162280233-162280736bps、配列番号14:chr2の176945095-176945601bps、配列番号15:chr2の176945320-176945821bps、配列番号16:chr2の176964629-176965209bps、配列番号17:chr2の176994514-176995015bps、配列番号18:chr2の177016987-177017501bps、配列番号19:chr2の177024355-177024866bps、配列番号20:chr3の44063336-44063893bps、配列番号21:chr3の157812057-157812604bps、配列番号22:chr4の9783025-9783527bps、配列番号23:chr4の39448278-39448779bps、配列番号24:chr4の39448327-39448879bps、配列番号25:chr4の57521127-57521736bps、配列番号26:chr4の154709362-154709867bps、配列番号27:chr5の1876136-1876645bps、配列番号28:chr6の85476916-85477417bps、配列番号29:chr6の137814499-137815053bps、配列番号30:chr6の150285594-150286095bps、配列番号31:chr7の27244522-27245037bps、配列番号32:chr7の35293435-35293950bps、配列番号33:chr7の50343543-50344243bps、配列番号34:chr7の155167312-155167828bps、配列番号35:chr8の10588692-10589253bps、配列番号36:chr8の25907648-25908150bps、配列番号37:chr8の57069450-57070150bps、配列番号38:chr10の28034404-28034908bps、配列番号39:chr12の4918941-4919489bps、配列番号40:chr12の33592612-33593117bps、配列番号41:chr12の58131095-58131654bps、配列番号42:chr12の115124763-115125348bps、配列番号43:chr13の37005444-37005945bps、配列番号44:chr13の100649468-100649995bps、配列番号45:chr13の100649513-100650027bps、配列番号46:chr14の38724419-38724935bps、配列番号47:chr14の38724602-38725108bps、配列番号48:chr14の57275646-57276162bps、配列番号49:chr14の60952384-60952933bps、配列番号50:chr15の83952059-83952595bps、配列番号51:chr16の31579970-31580561bps、配列番号52:chr16の73096773-73097473bps、配列番号53:chr17の35299694-35300224bps、配列番号54:chr17の76929623-76930176bps、配列番号55:chr17の80846617-80847210bps、配列番号56:chr21の38081247-38081752bpsここで、配列の塩基及びメチル化部位には、参照ゲノムHG19に対応する番号が付されている。
1つ又は複数の実施形態では、本明細書に記載の核酸分子は、DMRTA2、FOXD3、TBX15、BCAN、TRIM58、SIX3、VAX2、EMX1、LBX2、TLX2、POU3F3、TBR1、EVX2、HOXD12、HOXD8、HOXD4、TOPAZ1、SHOX2、DRD5、RPL9、HOPX、SFRP2、IRX4、TBX18、OLIG3、ULBP1、HOXA13、TBX20、IKZF1、INSIG1、SOX7、EBF2、MOS、MKX、KCNA6、SYT10、AGAP2、TBX3、CCNA1、ZIC2、CLEC14A、OTX2、C14orf39、BNC1、AHSP、ZFHX3、LHX1、TIMP2、ZNF750、SIM2から選択される1つ又は複数の遺伝子の断片であり、断片の長さは1bp-1kb、好ましくは1bp-700bpであり、断片は、染色体領域中の対応する遺伝子の1つ又は複数のメチル化部位を含む。
本明細書に記載される遺伝子又はその断片におけるメチル化部位には、それだけに限らないが、chr1染色体50884514、50884531、50884533、50884541、50884544、50884547、50884550、50884552、50884566、50884582、50884586、50884589、50884591、50884598、50884606、50884610、50884612、50884615、50884621、50884633、50884646、50884649、50884658、50884662、50884673、50884682、50884691、50884699、50884702、50884724、50884732、50884735、50884742、50884751、50884754、50884774、50884777、50884780、50884783、50884786、50884789、50884792、50884795、50884798、50884801、50884804、50884807、50884809、50884820、50884822、50884825、50884849、50884852、50884868、50884871、50884885、50884889、50884902、50884924、50884939、50884942、50884945、50884948、50884975、50884980、50884983、50884999、50885001、63788628、63788660、63788672、63788685、63788689、63788703、63788706、63788709、63788721、63788741、63788744、63788747、63788753、63788759、63788768、63788776、63788785、63788789、63788795、63788804、63788816、63788822、63788825、63788828、63788849、63788852、63788861、63788870、63788872、63788878、63788881、63788889、63788897、63788902、63788906、63788917、63788920、63788933、63788947、63788983、63788987、63788993、63788999、63789004、63789011、63789014、63789020、63789022、63789025、63789031、63789035、63789047、63789056、63789059、63789068、63789071、63789073、63789077、63789080、63789083、63789092、63789094、63789101、63789106、63789109、63789124、
119522172、119522188、119522190、119522233、119522239、119522313、119522368、119522386、119522393、119522409、119522425、119522427、119522436、119522440、119522444、119522446、119522449、119522451、119522456、119522459、119522464、119522469、119522474、119522486、119522488、119522500、119522502、119522516、119522529、119522537、119522548、119522550、119522559、119522563、119522566、119522571、119522577、119522579、119522582、119522594、119522599、119522607、119522615、119522621、119522629、119522631、119522637、119522665、119522673、
156611713、156611720、156611733、156611737、156611749、156611752、156611761、156611767、156611784、156611791、156611797、156611802、156611811、156611813、156611819、156611830、156611836、156611842、156611851、156611862、156611890、156611893、156611902、156611905、156611915、156611926、156611945、156611949、156611951、156611960、156611963、156611994、156612002、156612015、156612024、156612034、156612042、156612044、156612079、156612087、156612090、156612094、156612097、156612105、156612140、156612147、156612166、156612188、156612191、156612204、156612209、
248020399、248020410、248020436、248020447、248020450、248020453、248020470、248020495、248020497、248020507、248020512、248020516、248020520、248020526、248020536、248020543、248020559、248020562、248020566、248020573、248020579、248020581、248020589、248020591、248020598、248020625、248020632、248020641、248020671、248020680、248020688、248020692、248020695、248020697、248020704、248020707、248020713、248020721、248020729、248020741、248020748、248020756、248020765、248020775、248020791、248020795、248020798、248020812、248020814、248020821、248020826、248020828、248020831、248020836、248020838、248020840、248020845、248020848、248020861、248020869、248020878、248020883、248020886、248020902、248020905、248020908、248020914、248020925、248020930、248020934、248020937、248020940、248020953、248020956、248020975;
119522172、119522188、119522190、119522233、119522239、119522313、119522368、119522386、119522393、119522409、119522425、119522427、119522436、119522440、119522444、119522446、119522449、119522451、119522456、119522459、119522464、119522469、119522474、119522486、119522488、119522500、119522502、119522516、119522529、119522537、119522548、119522550、119522559、119522563、119522566、119522571、119522577、119522579、119522582、119522594、119522599、119522607、119522615、119522621、119522629、119522631、119522637、119522665、119522673、
156611713、156611720、156611733、156611737、156611749、156611752、156611761、156611767、156611784、156611791、156611797、156611802、156611811、156611813、156611819、156611830、156611836、156611842、156611851、156611862、156611890、156611893、156611902、156611905、156611915、156611926、156611945、156611949、156611951、156611960、156611963、156611994、156612002、156612015、156612024、156612034、156612042、156612044、156612079、156612087、156612090、156612094、156612097、156612105、156612140、156612147、156612166、156612188、156612191、156612204、156612209、
248020399、248020410、248020436、248020447、248020450、248020453、248020470、248020495、248020497、248020507、248020512、248020516、248020520、248020526、248020536、248020543、248020559、248020562、248020566、248020573、248020579、248020581、248020589、248020591、248020598、248020625、248020632、248020641、248020671、248020680、248020688、248020692、248020695、248020697、248020704、248020707、248020713、248020721、248020729、248020741、248020748、248020756、248020765、248020775、248020791、248020795、248020798、248020812、248020814、248020821、248020826、248020828、248020831、248020836、248020838、248020840、248020845、248020848、248020861、248020869、248020878、248020883、248020886、248020902、248020905、248020908、248020914、248020925、248020930、248020934、248020937、248020940、248020953、248020956、248020975;
chr2染色体45028802、45028816、45028832、45028839、45028956、45028961、45028965、45028973、45029004、45029017、45029035、45029046、45029057、45029060、45029063、45029065、45029071、45029106、45029112、45029117、45029128、45029146、45029176、45029179、45029184、45029189、45029192、45029195、45029218、45029226、45029228、45029231、45029235、45029263、45029273、45029285、45029288、45029295、45029307、45029317、45029353、45029357、71115760、71115787、71115789、71115837、71115928、71115936、71115948、71115962、71115968、71115978、71115981、71115983、71115985、71115987、71115994、71116000、71116022、71116024、71116030、71116036、71116047、71116054、71116067、71116096、71116101、71116103、71116107、71116117、71116119、71116130、71116137、71116141、71116152、71116154、71116158、71116174、71116188、71116190、71116194、71116203、71116215、71116226、71116233、71116242、71116257、71116259、71116261、71116268、71116271、
73147340、73147350、73147364、73147369、73147382、73147405、73147408、73147432、73147438、73147444、73147481、73147491、73147493、73147523、73147529、73147537、73147559、73147571、73147582、73147584、73147592、73147595、73147598、73147607、73147613、73147620、73147623、73147631、73147644、73147668、73147673、73147678、73147687、73147690、73147693、73147695、73147710、73147720、73147738、73147755、73147767、73147771、73147789、73147798、73147803、73147811、73147814、73147816、73147822、73147825、73147827、73147829、
74726438、74726440、74726449、74726478、74726480、74726482、74726484、74726493、74726495、74726524、74726526、74726533、74726536、74726539、74726548、74726554、74726569、74726572、74726585、74726597、74726599、74726616、74726633、74726642、74726649、74726651、74726656、74726668、74726672、74726682、74726687、74726695、74726700、74726710、74726716、74726734、74726746、74726760、74726766、74726772、74726784、74726791、74726809、74726828、74726833、74726835、74726861、74726892、74726894、74726908、74742879、74742882、74742891、74742913、74742922、74742925、74742942、74742950、74742953、74742967、74742981、74742984、74742996、74743004、74743006、74743009、74743011、74743015、74743021、74743035、74743056、74743059、74743061、74743064、74743068、74743073、74743082、74743084、74743101、74743108、74743111、74743119、74743121、74743127、74743131、74743137、74743139、74743141、74743146、74743172、74743174、74743182、74743186、74743191、74743195、74743198、74743207、74743231、74743234、74743241、74743243、74743268、74743295、74743301、74743306、74743318、74743321、74743325、74743329、74743333、74743336、74743343、74743346、74743352、74743357、
105480130、105480161、105480179、105480198、105480207、105480210、105480212、105480226、105480254、105480258、105480272、105480291、105480337、105480360、105480377、105480383、105480387、105480390、105480407、105480409、105480412、105480424、105480426、105480429、105480433、105480438、105480461、105480464、105480475、105480481、105480488、105480490、105480503、105480546、105480556、105480571、105480577、105480581、105480604、105480621、105480623、105480630、105480634、105480637、
162280237、162280239、162280242、162280245、162280249、162280257、162280263、162280289、162280293、162280297、162280306、162280309、162280314、162280317、162280327、162280331、162280341、162280351、162280362、162280368、162280393、162280396、162280398、162280402、162280405、162280407、162280409、162280417、162280420、162280438、162280447、162280459、162280462、162280466、162280470、162280473、162280479、162280483、162280486、162280489、162280492、162280498、162280519、162280534、162280539、162280548、162280561、162280570、162280575、162280585、162280598、162280604、162280611、162280614、162280618、162280623、162280627、162280633、162280641、162280647、162280657、162280673、162280681、162280693、162280708、162280728、
176945102、176945119、176945122、176945132、176945134、176945137、176945141、176945144、176945147、176945150、176945159、176945165、176945170、176945177、176945179、176945186、176945188、176945198、176945200、176945213、176945215、176945218、176945222、176945224、176945250、176945270、176945274、176945288、176945296、176945298、176945316、176945329、176945336、176945339、176945345、176945347、176945351、176945354、176945356、176945372、176945374、176945378、176945381、176945384、176945387、176945392、176945398、176945402、176945417、176945422、176945426、176945452、176945458、176945462、176945464、176945468、176945497、176945507、176945526、176945532、176945547、176945550、176945570、176945580、176945582、176945585、176945604、176945609、176945647、176945679、176945695、176945732、176945747、176945750、176945761、176945770、176945789、176945791、176945795、176964640、176964642、176964663、176964665、176964667、176964670、176964672、176964685、176964690、176964694、176964703、176964709、176964711、176964720、176964724、176964736、176964739、176964747、176964769、176964778、176964805、176964811、176964834、176964838、176964843、176964847、176964863、176964865、176964869、176964875、176964879、176964886、176964892、176964930、176964946、176964959、176964966、176964969、176964978、176965003、176965021、176965035、176965062、176965065、176965069、176965085、176965099、176965102、176965109、176965125、176965130、176965140、176965186、176965196、176994516、176994525、176994528、176994531、176994537、176994546、176994557、176994559、176994568、176994570、176994583、176994586、176994623、176994637、176994654、176994661、176994665、176994682、176994688、176994728、176994738、176994747、176994750、176994753、176994764、176994768、176994773、176994778、176994780、176994783、176994793、176994801、176994804、176994807、176994809、176994811、176994822、176994830、176994832、176994837、176994839、176994848、176994851、176994853、176994859、176994864、176994867、176994871、176994880、176994890、176994905、176994909、176994911、176994931、176994934、176994936、176994938、176994942、176994944、176994948、176994952、176994961、176994964、176994971、176994974、176994980、176994983、176994986、176994996、176995011、176995013、
177017050、177017079、177017124、177017173、177017179、177017182、177017193、177017211、177017223、177017225、177017227、177017237、177017239、177017246、177017251、177017253、177017267、177017270、177017276、177017296、177017300、177017331、177017352、177017368、177017374、177017378、177017389、177017446、177017449、177017452、177017463、177017483、177017488、177024359、177024367、177024415、177024502、177024514、177024528、177024531、177024540、177024548、177024550、177024558、177024582、177024605、177024616、177024619、177024634、177024642、177024655、177024698、177024709、177024714、177024723、177024725、177024748、177024756、177024769、177024771、177024776、177024783、177024800、177024836、177024838、177024856、177024861;
73147340、73147350、73147364、73147369、73147382、73147405、73147408、73147432、73147438、73147444、73147481、73147491、73147493、73147523、73147529、73147537、73147559、73147571、73147582、73147584、73147592、73147595、73147598、73147607、73147613、73147620、73147623、73147631、73147644、73147668、73147673、73147678、73147687、73147690、73147693、73147695、73147710、73147720、73147738、73147755、73147767、73147771、73147789、73147798、73147803、73147811、73147814、73147816、73147822、73147825、73147827、73147829、
74726438、74726440、74726449、74726478、74726480、74726482、74726484、74726493、74726495、74726524、74726526、74726533、74726536、74726539、74726548、74726554、74726569、74726572、74726585、74726597、74726599、74726616、74726633、74726642、74726649、74726651、74726656、74726668、74726672、74726682、74726687、74726695、74726700、74726710、74726716、74726734、74726746、74726760、74726766、74726772、74726784、74726791、74726809、74726828、74726833、74726835、74726861、74726892、74726894、74726908、74742879、74742882、74742891、74742913、74742922、74742925、74742942、74742950、74742953、74742967、74742981、74742984、74742996、74743004、74743006、74743009、74743011、74743015、74743021、74743035、74743056、74743059、74743061、74743064、74743068、74743073、74743082、74743084、74743101、74743108、74743111、74743119、74743121、74743127、74743131、74743137、74743139、74743141、74743146、74743172、74743174、74743182、74743186、74743191、74743195、74743198、74743207、74743231、74743234、74743241、74743243、74743268、74743295、74743301、74743306、74743318、74743321、74743325、74743329、74743333、74743336、74743343、74743346、74743352、74743357、
105480130、105480161、105480179、105480198、105480207、105480210、105480212、105480226、105480254、105480258、105480272、105480291、105480337、105480360、105480377、105480383、105480387、105480390、105480407、105480409、105480412、105480424、105480426、105480429、105480433、105480438、105480461、105480464、105480475、105480481、105480488、105480490、105480503、105480546、105480556、105480571、105480577、105480581、105480604、105480621、105480623、105480630、105480634、105480637、
162280237、162280239、162280242、162280245、162280249、162280257、162280263、162280289、162280293、162280297、162280306、162280309、162280314、162280317、162280327、162280331、162280341、162280351、162280362、162280368、162280393、162280396、162280398、162280402、162280405、162280407、162280409、162280417、162280420、162280438、162280447、162280459、162280462、162280466、162280470、162280473、162280479、162280483、162280486、162280489、162280492、162280498、162280519、162280534、162280539、162280548、162280561、162280570、162280575、162280585、162280598、162280604、162280611、162280614、162280618、162280623、162280627、162280633、162280641、162280647、162280657、162280673、162280681、162280693、162280708、162280728、
176945102、176945119、176945122、176945132、176945134、176945137、176945141、176945144、176945147、176945150、176945159、176945165、176945170、176945177、176945179、176945186、176945188、176945198、176945200、176945213、176945215、176945218、176945222、176945224、176945250、176945270、176945274、176945288、176945296、176945298、176945316、176945329、176945336、176945339、176945345、176945347、176945351、176945354、176945356、176945372、176945374、176945378、176945381、176945384、176945387、176945392、176945398、176945402、176945417、176945422、176945426、176945452、176945458、176945462、176945464、176945468、176945497、176945507、176945526、176945532、176945547、176945550、176945570、176945580、176945582、176945585、176945604、176945609、176945647、176945679、176945695、176945732、176945747、176945750、176945761、176945770、176945789、176945791、176945795、176964640、176964642、176964663、176964665、176964667、176964670、176964672、176964685、176964690、176964694、176964703、176964709、176964711、176964720、176964724、176964736、176964739、176964747、176964769、176964778、176964805、176964811、176964834、176964838、176964843、176964847、176964863、176964865、176964869、176964875、176964879、176964886、176964892、176964930、176964946、176964959、176964966、176964969、176964978、176965003、176965021、176965035、176965062、176965065、176965069、176965085、176965099、176965102、176965109、176965125、176965130、176965140、176965186、176965196、176994516、176994525、176994528、176994531、176994537、176994546、176994557、176994559、176994568、176994570、176994583、176994586、176994623、176994637、176994654、176994661、176994665、176994682、176994688、176994728、176994738、176994747、176994750、176994753、176994764、176994768、176994773、176994778、176994780、176994783、176994793、176994801、176994804、176994807、176994809、176994811、176994822、176994830、176994832、176994837、176994839、176994848、176994851、176994853、176994859、176994864、176994867、176994871、176994880、176994890、176994905、176994909、176994911、176994931、176994934、176994936、176994938、176994942、176994944、176994948、176994952、176994961、176994964、176994971、176994974、176994980、176994983、176994986、176994996、176995011、176995013、
177017050、177017079、177017124、177017173、177017179、177017182、177017193、177017211、177017223、177017225、177017227、177017237、177017239、177017246、177017251、177017253、177017267、177017270、177017276、177017296、177017300、177017331、177017352、177017368、177017374、177017378、177017389、177017446、177017449、177017452、177017463、177017483、177017488、177024359、177024367、177024415、177024502、177024514、177024528、177024531、177024540、177024548、177024550、177024558、177024582、177024605、177024616、177024619、177024634、177024642、177024655、177024698、177024709、177024714、177024723、177024725、177024748、177024756、177024769、177024771、177024776、177024783、177024800、177024836、177024838、177024856、177024861;
chr3染色体44063356、44063391、44063404、44063411、44063417、44063423、44063450、44063516、44063541、44063544、44063559、44063565、44063567、44063574、44063586、44063593、44063602、44063606、44063620、44063633、44063638、44063643、44063649、44063657、44063660、44063662、44063682、44063686、44063719、44063745、44063756、44063768、44063779、44063807、44063821、44063832、44063836、44063858、44063877、
157812071、157812085、157812092、157812117、157812131、157812152、157812170、157812173、157812175、157812184、157812206、157812212、157812226、157812256、157812259、157812275、157812277、157812287、157812294、157812296、157812302、157812305、157812307、157812312、157812319、157812321、157812329、157812331、157812334、157812354、157812358、157812369、157812380、157812383、157812385、157812404、157812411、157812414、157812420、157812437、157812442、157812457、157812468、157812470、157812475、157812498、157812542、157812548;
157812071、157812085、157812092、157812117、157812131、157812152、157812170、157812173、157812175、157812184、157812206、157812212、157812226、157812256、157812259、157812275、157812277、157812287、157812294、157812296、157812302、157812305、157812307、157812312、157812319、157812321、157812329、157812331、157812334、157812354、157812358、157812369、157812380、157812383、157812385、157812404、157812411、157812414、157812420、157812437、157812442、157812457、157812468、157812470、157812475、157812498、157812542、157812548;
chr4染色体9783036、9783050、9783059、9783075、9783080、9783097、9783105、9783112、9783120、9783126、9783142、9783144、9783153、9783160、9783166、9783185、9783192、9783196、9783198、9783206、9783213、9783218、9783220、9783233、9783244、9783246、9783252、9783271、9783275、9783277、9783304、9783322、9783327、9783342、9783348、9783354、9783358、9783361、9783363、9783376、9783398、9783409、9783425、9783427、9783442、9783449、9783467、9783492、9783494、9783496、9783501、9783508、9783511、
39448284、39448302、39448320、39448323、39448340、39448343、39448347、39448365、39448422、39448432、39448453、39448464、39448473、39448478、39448481、39448503、39448516、39448524、39448528、39448549、39448551、39448557、39448562、39448568、39448575、39448577、39448586、39448593、39448613、39448625、39448629、39448633、39448647、39448653、39448662、39448665、39448670、39448683、39448695、39448697、39448729、39448732、39448748、39448757、39448759、39448767、39448773、39448796、39448800、39448809、39448811、39448836、39448845、39448857、39448864、39448869、39448874、
57521138、57521209、57521237、57521297、57521304、57521310、57521336、57521348、57521377、57521397、57521411、57521419、57521426、57521442、57521449、57521486、57521506、57521518、57521537、57521545、57521581、57521603、57521622、57521631、57521652、57521657、57521665、57521680、57521687、57521701、57521716、57521725、57521733、
154709378、154709414、154709425、154709441、154709492、154709513、154709522、154709540、154709557、154709561、154709576、154709591、154709597、154709607、154709612、154709617、154709633、154709640、154709663、154709675、154709684、154709690、154709697、154709721、154709745、154709756、154709759、154709789、154709812、154709828、154709834;
39448284、39448302、39448320、39448323、39448340、39448343、39448347、39448365、39448422、39448432、39448453、39448464、39448473、39448478、39448481、39448503、39448516、39448524、39448528、39448549、39448551、39448557、39448562、39448568、39448575、39448577、39448586、39448593、39448613、39448625、39448629、39448633、39448647、39448653、39448662、39448665、39448670、39448683、39448695、39448697、39448729、39448732、39448748、39448757、39448759、39448767、39448773、39448796、39448800、39448809、39448811、39448836、39448845、39448857、39448864、39448869、39448874、
57521138、57521209、57521237、57521297、57521304、57521310、57521336、57521348、57521377、57521397、57521411、57521419、57521426、57521442、57521449、57521486、57521506、57521518、57521537、57521545、57521581、57521603、57521622、57521631、57521652、57521657、57521665、57521680、57521687、57521701、57521716、57521725、57521733、
154709378、154709414、154709425、154709441、154709492、154709513、154709522、154709540、154709557、154709561、154709576、154709591、154709597、154709607、154709612、154709617、154709633、154709640、154709663、154709675、154709684、154709690、154709697、154709721、154709745、154709756、154709759、154709789、154709812、154709828、154709834;
chr5染色体1876139、1876168、1876200、1876208、1876213、1876215、1876286、1876290、1876298、1876308、1876311、1876337、1876339、1876347、1876354、1876368、1876372、1876374、1876386、1876395、1876397、1876399、1876403、1876420、1876424、1876432、1876436、1876449、1876456、1876459、1876463、1876483、1876498、1876525、1876527、1876557、1876563、1876570、1876576、1876605、1876630、1876634、1876638;
chr6染色体85476921、85476930、85476974、85477014、85477032、85477035、85477070、85477083、85477106、85477124、85477151、85477153、85477166、85477175、85477186、85477217、85477228、85477230、85477236、85477245、85477249、85477251、85477253、85477261、85477283、
137814512、137814516、137814523、137814548、137814558、137814561、137814564、137814567、137814620、137814636、137814638、137814642、137814645、137814654、137814666、137814679、137814689、137814695、137814707、137814710、137814717、137814723、137814728、137814744、137814746、137814749、137814768、137814776、137814786、137814788、137814792、137814794、137814803、137814807、137814818、137814824、137814837、137814860、137814920、137814935、137814952、137814957、137814960、137814969、137814971、137814986、137814988、137814995、137815016、137815024、137815030、137815034、137815036、137815040、
150285620、150285634、150285641、150285652、150285659、150285661、150285670、150285677、150285688、150285695、150285697、150285706、150285713、150285715、150285724、150285731、150285733、150285742、150285760、150285767、150285769、150285775、150285778、150285788、150285813、150285815、150285826、150285829、150285844、150285860、150285887、150285890、150285892、150285901、150285908、150285910、150285926、150285928、150285937、150285944、150285956、150285963、150285966、150285974、150285981、150285983、150285992、150285999、150286001、150286010、150286017、150286019、150286028、150286035、150286038、150286046、150286055、150286063、150286073、150286082、150286089、150286091;
137814512、137814516、137814523、137814548、137814558、137814561、137814564、137814567、137814620、137814636、137814638、137814642、137814645、137814654、137814666、137814679、137814689、137814695、137814707、137814710、137814717、137814723、137814728、137814744、137814746、137814749、137814768、137814776、137814786、137814788、137814792、137814794、137814803、137814807、137814818、137814824、137814837、137814860、137814920、137814935、137814952、137814957、137814960、137814969、137814971、137814986、137814988、137814995、137815016、137815024、137815030、137815034、137815036、137815040、
150285620、150285634、150285641、150285652、150285659、150285661、150285670、150285677、150285688、150285695、150285697、150285706、150285713、150285715、150285724、150285731、150285733、150285742、150285760、150285767、150285769、150285775、150285778、150285788、150285813、150285815、150285826、150285829、150285844、150285860、150285887、150285890、150285892、150285901、150285908、150285910、150285926、150285928、150285937、150285944、150285956、150285963、150285966、150285974、150285981、150285983、150285992、150285999、150286001、150286010、150286017、150286019、150286028、150286035、150286038、150286046、150286055、150286063、150286073、150286082、150286089、150286091;
chr7染色体27244531、27244533、27244537、27244555、27244564、27244578、27244603、27244609、27244612、27244619、27244621、27244627、27244631、27244657、27244673、27244702、27244704、27244714、27244723、27244755、27244772、27244780、27244787、27244789、27244798、27244800、27244810、27244833、27244856、27244869、27244874、27244881、27244885、27244887、27244892、27244897、27244907、27244911、27244917、27244920、27244931、27244948、27244951、27244980、27244982、27244986、27245014、27245018、35293441、35293451、35293470、35293479、35293482、35293488、35293492、35293497、35293502、35293506、35293514、35293531、35293537、35293543、35293588、35293590、35293621、35293652、35293656、35293658、35293670、35293676、35293685、35293687、35293690、35293692、35293700、35293717、35293721、35293731、35293747、35293750、35293753、35293759、35293767、35293780、35293783、35293790、35293796、35293809、35293812、35293815、35293821、35293827、35293829、35293834、35293838、35293840、35293847、35293849、35293860、35293863、35293867、35293869、35293879、35293884、35293892、35293940、50343545、50343548、50343552、50343555、50343562、50343566、50343572、50343574、50343577、50343579、50343587、50343603、50343605、50343608、50343611、50343624、50343628、50343630、50343635、50343637、50343639、50343648、50343651、50343654、50343656、50343659、50343663、50343669、50343672、50343674、50343678、50343682、50343693、50343696、50343699、50343702、50343714、50343719、50343725、50343728、50343731、50343736、50343739、50343758、50343765、50343768、50343770、50343785、50343789、50343791、50343805、50343813、50343822、50343824、50343826、50343829、50343831、50343833、50343838、50343847、50343850、50343853、50343858、50343864、50343869、50343872、50343883、50343890、50343897、50343907、50343909、50343914、50343926、50343934、50343939、50343946、50343950、50343959、50343961、50343963、50343969、50343974、50343980、50343990、50344001、50344007、50344011、50344028、50344041、155167320、155167333、155167340、155167343、155167345、155167347、155167350、155167357、155167379、155167382、155167394、155167401、155167423、155167430、155167467、155167478、155167480、155167486、155167499、155167505、155167507、155167511、155167513、155167516、155167518、155167528、155167543、155167552、155167555、155167560、155167562、155167568、155167570、155167578、155167602、155167608、155167611、155167617、155167662、155167702、155167707、155167716、155167718、155167739、155167750、155167753、155167757、155167759、155167771、155167773、155167791、155167801、155167803、155167805、155167813、155167819、155167821、155167827;
chr8染色体10588729、10588742、10588820、10588833、10588841、10588851、10588857、10588865、10588867、10588883、10588888、10588895、10588938、10588942、10588946、10588948、10588951、10588959、10588992、10589003、10589007、10589009、10589016、10589034、10589060、10589062、10589076、10589079、10589093、10589152、10589193、10589206、10589241、25907660、25907702、25907709、25907724、25907747、25907752、25907754、25907757、25907769、25907796、25907800、25907814、25907818、25907821、25907824、25907838、25907848、25907866、25907874、25907880、25907884、25907893、25907898、25907900、25907902、25907906、25907918、25907947、25907976、25908055、25908057、25908064、25908071、25908098、25908101、57069480、57069544、57069569、57069606、57069631、57069648、57069688、57069698、57069709、57069712、57069722、57069735、57069739、57069755、57069764、57069773、57069775、57069784、57069786、57069791、57069793、57069800、57069812、57069816、57069823、57069825、57069827、57069839、57069842、57069847、57069851、57069853、57069884、57069889、57069894、57069907、57069914、57069919、57069931、57069940、57069948、57069958、57069968、57069973、57069978、57070013、57070035、57070038、57070042、57070046、57070066、57070079、57070087、57070091、57070126、57070143;
chr10染色体28034412、28034415、28034418、28034442、28034444、28034467、28034469、28034494、28034501、28034505、28034545、28034556、28034559、28034568、28034582、28034591、28034596、28034599、28034605、28034616、28034619、28034622、28034624、28034645、28034651、28034654、28034658、28034669、28034682、28034687、28034697、28034711、28034714、28034727、28034729、28034739、28034741、28034751、28034757、28034760、28034763、28034768、28034787、28034790、28034792、28034794、28034797、28034801、28034816、28034843、28034853、28034856、28034867、28034871、28034873、28034882、28034888、28034892、28034907;
chr12染色体4918962、4918966、4918968、4918975、4918982、4919001、4919056、4919065、4919079、4919081、4919086、4919095、4919097、4919118、4919124、4919138、4919145、4919147、4919164、4919170、4919173、4919184、4919191、4919199、4919215、4919230、4919236、4919239、4919242、4919253、4919260、4919281、4919293、4919300、4919303、4919309、4919327、4919331、4919351、4919358、4919376、4919386、4919395、4919401、4919408、4919421、4919424、4919430、4919438、4919453、4919465、4919469、4919475、4919486、33592615、33592629、33592635、33592642、33592659、33592661、33592663、33592674、33592681、33592683、33592692、33592704、33592707、33592709、33592711、33592715、33592720、33592725、33592727、33592744、33592774、33592798、33592803、33592811、33592831、33592848、33592859、33592862、33592865、33592867、33592875、33592882、33592885、33592887、33592891、33592905、33592908、33592913、33592915、33592923、33592931、33592933、33592953、33592955、33592977、33592981、33592986、33592989、33592998、33593004、33593017、33593035、33593049、33593090、33593093、58131100、58131102、58131111、58131133、58131154、58131168、58131175、58131181、58131224、58131242、58131261、58131277、58131300、58131303、58131306、58131309、58131312、58131318、58131321、58131331、58131345、58131348、58131384、58131390、58131404、58131412、58131414、58131426、58131429、58131445、58131453、58131475、58131478、58131487、58131503、58131510、58131523、58131546、58131549、58131553、58131557、58131564、58131571、58131576、58131586、58131605、58131608、58131624、58131642、115124768、115124773、115124782、115124811、115124838、115124853、115124871、115124874、115124894、115124904、115124924、115124930、115124933、115124935、115124946、115124970、115124973、115124981、115124999、115125013、115125034、115125053、115125060、115125098、115125107、115125114、115125121、115125131、115125141、115125151、115125177、115125192、115125225、115125305、115125335;
chr13染色体37005452、37005489、37005501、37005520、37005551、37005553、37005557、37005562、37005566、37005570、37005582、37005596、37005608、37005629、37005633、37005635、37005673、37005678、37005686、37005694、37005704、37005706、37005721、37005732、37005738、37005741、37005745、37005773、37005778、37005794、37005801、37005805、37005814、37005816、37005821、37005833、37005835、37005844、37005855、37005857、37005878、37005881、37005883、37005892、37005899、37005909、37005924、37005929、37005934、37005939、37005941、100649486、100649489、100649519、100649538、100649567、100649569、100649577、100649584、100649601、100649603、100649605、100649623、100649625、100649628、100649648、100649671、100649673、100649686、100649689、100649691、100649701、100649705、100649715、100649718、100649721、100649725、100649731、100649734、100649738、100649740、100649745、100649763、100649769、100649777、100649785、100649792、100649800、100649847、100649886、100649912、100649915、100649917、100649941、100649945、100649949、100649965、100649975、100649982、100650005;
chr14染色体38724435、38724459、38724473、38724486、38724507、38724511、38724527、38724531、38724534、38724540、38724544、38724546、38724565、38724578、38724586、38724597、38724624、38724627、38724646、38724648、38724650、38724669、38724675、38724680、38724682、38724685、38724726、38724732、38724734、38724746、38724765、38724771、38724780、38724796、38724798、38724806、38724808、38724810、38724821、38724847、38724852、38724858、38724864、38724867、38724873、38724896、38724906、38724929、38724935、38724945、38724978、38724995、38725003、38725005、38725014、38725016、38725023、38725026、38725030、38725034、38725038、38725048、38725058、38725077、38725081、38725088、38725101、57275669、57275674、57275677、57275681、57275683、57275687、57275690、57275706、57275725、57275749、57275752、57275761、57275768、57275772、57275778、57275785、57275821、57275823、57275827、57275829、57275831、57275835、57275852、57275874、57275876、57275885、57275896、57275908、57275912、57275914、57275924、57275956、57275967、57275969、57275971、57275981、57275988、57275993、57275995、57276000、57276031、57276035、57276039、57276057、57276066、57276073、57276090、60952394、60952398、60952405、60952418、60952421、60952425、60952464、60952468、60952482、60952500、60952503、60952505、60952517、60952522、60952544、60952550、60952554、60952593、60952599、60952615、60952618、60952634、60952658、60952683、60952687、60952730、60952738、60952755、60952762、60952781、60952791、60952799、60952827、60952829、60952836、60952839、60952841、60952848、60952855、60952857、60952870、60952876、60952878、60952887、60952896、60952898、60952908、60952919、60952921、60952931;
chr15染色体83952068、83952081、83952084、83952087、83952095、83952105、83952108、83952114、83952125、83952135、83952140、83952156、83952160、83952162、83952175、83952178、83952181、83952184、83952188、83952200、83952206、83952209、83952214、83952220、83952225、83952229、83952236、83952238、83952242、83952266、83952285、83952291、83952298、83952309、83952314、83952317、83952345、83952352、83952358、83952360、83952367、83952406、83952411、83952414、83952418、83952420、83952425、83952430、83952453、83952464、83952472、83952486、83952496、83952498、83952500、83952506、83952508、83952527、83952553、83952559、83952566、83952570、83952582、83952592;
chr16染色体31579976、31580071、31580078、31580081、31580089、31580100、31580110、31580117、31580138、31580150、31580153、31580159、31580165、31580220、31580246、31580254、31580269、31580287、31580296、31580299、31580309、31580311、31580316、31580343、31580424、31580496、31580524、31580560、73096786、73096842、73096889、73096894、73096903、73096914、73096923、73096929、73096934、73096943、73096948、73096966、73096970、73096979、73097000、73097015、73097017、73097019、73097028、73097037、73097045、73097057、73097060、73097066、73097069、73097078、73097080、73097082、73097084、73097108、73097114、73097142、73097156、73097183、73097260、73097267、73097284、73097296、73097301、73097329、73097357、73097364、73097377、73097381、73097387、73097470;
chr17染色体35299698、35299703、35299710、35299719、35299729、35299731、35299741、35299746、35299776、35299813、35299816、35299822、35299837、35299850、35299877、35299885、35299913、35299915、35299926、35299928、35299933、35299935、35299944、35299946、35299963、35299966、35299972、35299974、35299990、35299996、35299999、35300006、35300010、35300020、35300027、35300036、35300039、35300044、35300059、35300068、35300074、35300086、35300097、35300109、35300115、35300146、35300151、35300163、35300167、35300172、35300196、35300202、35300214、35300217、35300221、76929645、76929709、76929713、76929742、76929769、76929829、76929873、76929926、76929982、76930043、76930095、76930148、76930169、80846623、80846652、80846683、80846709、80846717、80846730、80846745、80846763、80846794、80846860、80846867、80846886、80846960、80846965、80847079、80847092、80847115、80847128、80847137、80847153、80847158、80847209;
chr21染色体38081248、38081253、38081300、38081303、38081306、38081321、38081327、38081333、38081341、38081344、38081352、38081354、38081356、38081363、38081394、38081396、38081407、38081421、38081430、38081443、38081454、38081461、38081478、38081480、38081492、38081497、38081499、38081502、38081514、38081517、38081520、38081537、38081557、38081563、38081566、38081577、38081583、38081586、38081606、38081625、38081642、38081665、38081695、38081707、38081719、38081725、38081732が挙げられる。
上記メチル化部位の塩基には、参照ゲノムHG19に対応する番号が付されている。
上記メチル化部位の塩基には、参照ゲノムHG19に対応する番号が付されている。
1つ又は複数の実施形態において、膵癌と膵炎との間の分化は、以下の組合せ:(1)SIX3、TLX2;(2)SIX3、CILP2;(3)TLX2、CILP2;(4)SIX3、TLX2、CILP2のいずれかから選択される遺伝子由来の配列のメチル化レベルと相関する。本発明は、上記の遺伝子又はその断片の1つ又は複数のCpGを含む核酸分子を提供する。
また、膵癌と膵炎との鑑別は、SIX3遺伝子領域の配列番号57、TLX2遺伝子領域の配列番号58、及びCILP2遺伝子領域の配列番号59から選択されるいずれか一つのセグメント又はランダムな二つ若しくは三つ全てのセグメントのメチル化レベルに関連する。
いくつかの実施形態では、膵癌と膵炎との間の分化は、(1)配列番号57、配列番号58、(2)配列番号57、配列番号59、(3)配列番号58、配列番号59、(4)配列番号57、配列番号58、配列番号59、又はそれらの相補配列からなる群のいずれか1つから選択される配列のメチル化レベルと相関する。
本明細書において「膵癌と膵炎との鑑別に関連する配列」とは、上記3遺伝子、その上流又は下流20kb以内の配列、上記3配列(配列番号57~59)又はそれらの相補配列を包含する。
ヒト染色体における上記3つの配列の位置は以下の通りである:配列番号57:chr2の45028785-45029307、配列番号58:chr2の74742834-74743351、配列番号59:chr19の19650745-19651270。ここで、配列の塩基及びメチル化部位には、参照ゲノムHG19に対応する番号が付されている。
1つ又は複数の実施形態において、本明細書中に記載される核酸分子は、SIX3、TLX2、CILP2から選択される1つ又は複数の遺伝子の断片であり、断片の長さは1bp-1kb、好ましくは1bp-700bpであり、断片は、染色体領域中の対応する遺伝子の1つ又は複数のメチル化部位を含む。本明細書に記載される遺伝子又はその断片におけるメチル化部位には、それだけに限らないが、以下が含まれる:chr2の45028802、45028816、45028832、45028839、45028956、45028961、45028965、45028973、45029004、45029017、45029035、45029046、45029057、45029060、45029063、45029065、45029071、45029106、45029112、45029117、45029128、45029146、45029176、45029179、45029184、45029189、45029192、45029195、45029218、45029226、45029228、45029231、45029235、45029263、45029273、45029285、45029288、45029295,74742838、74742840、74742844、74742855、74742879、74742882、74742891、74742913、74742922、74742925、74742942、74742950、74742953、74742967、74742981、74742984、74742996、74743004、74743006、74743009、74743011、74743015、74743021、74743035、74743056、74743059、74743061、74743064、74743068、74743073、74743082、74743084、74743101、74743108、74743111、74743119、74743121、74743127、74743131、74743137、74743139、74743141、74743146、74743172、74743174、74743182、74743186、74743191、74743195、74743198、74743207、74743231、74743234、74743241、74743243、74743268、74743295、74743301、74743306、74743318、74743321、74743325、74743329、74743333、74743336、74743343、74743346;chr19の19650766、19650791、19650796、19650822、19650837、19650839、19650874、19650882、19650887、19650893、19650895、19650899、19650907、19650917、19650955、19650978、19650981、19650995、19650997、19651001、19651008、19651020、19651028、19651041、19651053、19651059、19651062、19651065、19651071、19651090、19651101、19651109、19651111、19651113、19651121、19651123、19651127、19651133、19651142、19651144、19651151、19651166、19651170、19651173、19651176、19651179、19651183、19651185、19651202、19651204、19651206、19651225、19651227、19651235、19651237、19651243、19651246、19651263、19651267。上記メチル化部位の非変異塩基は、参照ゲノムHG19に対応してナンバリングされている。
いくつかの実施形態では、膵癌と膵炎との間の分化は、(1)配列番号57、配列番号58、(2)配列番号57、配列番号59、(3)配列番号58、配列番号59、(4)配列番号57、配列番号58、配列番号59、又はそれらの相補配列からなる群のいずれか1つから選択される配列のメチル化レベルと相関する。
本明細書において「膵癌と膵炎との鑑別に関連する配列」とは、上記3遺伝子、その上流又は下流20kb以内の配列、上記3配列(配列番号57~59)又はそれらの相補配列を包含する。
ヒト染色体における上記3つの配列の位置は以下の通りである:配列番号57:chr2の45028785-45029307、配列番号58:chr2の74742834-74743351、配列番号59:chr19の19650745-19651270。ここで、配列の塩基及びメチル化部位には、参照ゲノムHG19に対応する番号が付されている。
1つ又は複数の実施形態において、本明細書中に記載される核酸分子は、SIX3、TLX2、CILP2から選択される1つ又は複数の遺伝子の断片であり、断片の長さは1bp-1kb、好ましくは1bp-700bpであり、断片は、染色体領域中の対応する遺伝子の1つ又は複数のメチル化部位を含む。本明細書に記載される遺伝子又はその断片におけるメチル化部位には、それだけに限らないが、以下が含まれる:chr2の45028802、45028816、45028832、45028839、45028956、45028961、45028965、45028973、45029004、45029017、45029035、45029046、45029057、45029060、45029063、45029065、45029071、45029106、45029112、45029117、45029128、45029146、45029176、45029179、45029184、45029189、45029192、45029195、45029218、45029226、45029228、45029231、45029235、45029263、45029273、45029285、45029288、45029295,74742838、74742840、74742844、74742855、74742879、74742882、74742891、74742913、74742922、74742925、74742942、74742950、74742953、74742967、74742981、74742984、74742996、74743004、74743006、74743009、74743011、74743015、74743021、74743035、74743056、74743059、74743061、74743064、74743068、74743073、74743082、74743084、74743101、74743108、74743111、74743119、74743121、74743127、74743131、74743137、74743139、74743141、74743146、74743172、74743174、74743182、74743186、74743191、74743195、74743198、74743207、74743231、74743234、74743241、74743243、74743268、74743295、74743301、74743306、74743318、74743321、74743325、74743329、74743333、74743336、74743343、74743346;chr19の19650766、19650791、19650796、19650822、19650837、19650839、19650874、19650882、19650887、19650893、19650895、19650899、19650907、19650917、19650955、19650978、19650981、19650995、19650997、19651001、19651008、19651020、19651028、19651041、19651053、19651059、19651062、19651065、19651071、19651090、19651101、19651109、19651111、19651113、19651121、19651123、19651127、19651133、19651142、19651144、19651151、19651166、19651170、19651173、19651176、19651179、19651183、19651185、19651202、19651204、19651206、19651225、19651227、19651235、19651237、19651243、19651246、19651263、19651267。上記メチル化部位の非変異塩基は、参照ゲノムHG19に対応してナンバリングされている。
1つ又は複数の実施形態において、膵癌と膵炎との間の分化は、ARHGEF16、PRDM16、NFIA、ST6GALNAC5、PRRX1、LHX4、ACBD6、FMN2、CHRM3、FAM150B、TMEM18、SIX3、CAMKMT、OTX1、WDPCP、CYP26B1、DYSF、HOXD1、HOXD4、UBE2F、RAMP1、AMT、PLSCR5、ZIC4、PEX5L、ETV5、DGKG、FGF12、FGFRL1、RNF212、DOK7、HGFAC、EVC、EVC2、HMX1、CPZ、IRX1、GDNF、AGGF1、CRHBP、PITX1、CATSPER3、NEUROG1、NPM1、TLX3、NKX2-5、BNIP1、PROP1、B4GALT7、IRF4、FOXF2、FOXQ1、FOXC1、GMDS、MOCS1、LRFN2、POU3F2、FBXL4、CCR6、GPR31、TBX20、HERPUD2、VIPR2、LZTS1、NKX2-6、PENK、PRDM14、VPS13B、OSR2、NEK6、LHX2、DDIT4、DNAJB12、CRTAC1、PAX2、HIF1AN、ELOVL3、INA、HMX2、HMX3、MKI67、DPYSL4、STK32C、INS、INS-IGF2、ASCL2、PAX6、RELT、FAM168A、OPCML、ACVR1B、ACVRL1、AVPR1A、LHX5、SDSL、RAB20、COL4A2、CARKD、CARS2、SOX1、TEX29、SPACA7、SFTA3、SIX6、SIX1、INF2、TMEM179、CRIP2、MTA1、PIAS1、SKOR1、ISL2、SCAPER、POLG、RHCG、NR2F2、RAB40C、PIGQ、CPNE2、NLRC5、PSKH1、NRN1L、SRR、HIC1、HOXB9、PRAC1、SMIM5、MYO15B、TNRC6C、9-Sep、TBCD、ZNF750、KCTD1、SALL3、CTDP1、NFATC1、ZNF554、THOP1、CACTIN、PIP5K1C、KDM4B、PLIN3、EPS15L1、KLF2、EPS8L1、PPP1R12C、NKX2-4、NKX2-2、TFAP2C、RAE1、TNFRSF6B、ARFRP1、MYH9、及びTXN2のうちのいずれか1つから選択される遺伝子からの配列のメチル化レベルに関する。本発明は、上記の遺伝子又はその断片の1つ又は複数のCpGを含む核酸分子を提供する。
いくつかの実施形態では、膵癌と膵炎との間の分化は、配列番号60~160又はその相補配列からなる群のいずれかから選択される配列のメチル化レベルと相関する。
ここで、「膵癌と膵炎との分化に関連する配列」とは、上記の101遺伝子、その上流又は下流20kb以内の配列、上記の101配列(配列番号60~160)又はそれらの相補配列を包含する。ここで、配列の塩基及びメチル化部位には、参照ゲノムHG19に対応する番号が付されている。
1つ又は複数の実施形態において、核酸分子の長さは、1bp-1000bp、1bp-900bp、1bp-800bp、1bp-700bpである。核酸分子の長さは、上記のいずれかの末端値の間の範囲であり得る。
いくつかの実施形態では、膵癌と膵炎との間の分化は、配列番号60~160又はその相補配列からなる群のいずれかから選択される配列のメチル化レベルと相関する。
ここで、「膵癌と膵炎との分化に関連する配列」とは、上記の101遺伝子、その上流又は下流20kb以内の配列、上記の101配列(配列番号60~160)又はそれらの相補配列を包含する。ここで、配列の塩基及びメチル化部位には、参照ゲノムHG19に対応する番号が付されている。
1つ又は複数の実施形態において、核酸分子の長さは、1bp-1000bp、1bp-900bp、1bp-800bp、1bp-700bpである。核酸分子の長さは、上記のいずれかの末端値の間の範囲であり得る。
本明細書で使用される場合、DNAメチル化を検出する方法は当技術分野で周知であり、例えばバイサルファイト変換ベースのPCR(例えば、メチル化特異的PCR(MSP))、DNA配列決定、全ゲノムメチル化配列決定、単純化メチル化配列決定、メチル化感受性制限酵素アッセイ、蛍光定量、メチル化感受性高解像度融解曲線アッセイ、チップベースのメチル化アトラス、質量分析等である。1つ又は複数の実施形態において、検出は、遺伝子又は部位において任意の鎖を検出することを包含する。
したがって、本発明は、DNAメチル化検出用試薬に関する。DNAメチル化を検出する上記の方法で使用される試薬は、当技術分野で周知である。DNA増幅を伴う検出方法において、DNAメチル化を検出するための試薬は、プライマーを包含する。プライマーの配列はメチル化特異的又は非特異的である。プライマーの配列は、非メチル化特異的ブロッカーを包含し得る。ブロッカーは、メチル化検出の特異性を向上させることができる。DNAメチル化を検出するための試薬はまた、プローブを包含し得る。典型的には、プローブ配列の5’末端を蛍光レポーターで標識し、3’末端をクエンチャーで標識する。プローブの配列は、例示的に、MGB(副溝結合剤)又はLNA(ロックド核酸)を包含する。MGB及びLNAは、Tm値を増加させ、アッセイの特異性を増加させ、プローブ設計の柔軟性を高めるために使用される。本明細書で使用される「プライマー」は、ヌクレオチド重合が開始されるときに合成をガイドする特定のヌクレオチド配列を有する核酸分子を指す。プライマーは、通常、2つの人工的に合成されたオリゴヌクレオチド配列である。一方のプライマーは標的領域の一端のDNA鋳型鎖に相補的であり、他方のプライマーは標的領域の他端の別のDNA鋳型鎖に相補的であり、それらはヌクレオチド重合の開始点として働く。プライマーは、通常、少なくとも9bpである。インビトロで人工的に設計されたプライマーは、ポリメラーゼ連鎖反応(PCR)、qPCR、配列決定及びプローブ合成に広く使用されている。典型的には、プライマーは、増幅産物が1~2000bp、10~1000bp、30~900bp、40~800bp、50~700bp、又は少なくとも150bp、少なくとも140bp、少なくとも130bp、少なくとも120bpの長さを有するように設計される。
本明細書における「変異体」又は「変異体」という用語は、他の核酸とハイブリダイズする能力を保持しながら、参照配列と比較して1つ又は複数のヌクレオチドの挿入、欠失又は置換によって核酸配列が変化するポリヌクレオチドを指す。本明細書の実施形態のいずれかによる変異体は、参照配列の生物学的活性を保持しながら、参照配列に対して少なくとも70%、好ましくは少なくとも80%、好ましくは少なくとも85%、好ましくは少なくとも90%、好ましくは少なくとも95%、好ましくは少なくとも97%の配列同一性を有するヌクレオチド配列を包含する。2つのアラインメントされた配列間の配列同一性は、例えば、NCBIのBLASTnを使用して計算することができる。変異体はまた、参照配列の生物学的活性を依然として保持しながら、参照配列のヌクレオチド配列に1つ又は複数の変異(挿入、欠失又は置換)を有するヌクレオチド配列を包含する。複数の突然変異は、通常、1~8、1~5又は1~3等の1~10の範囲内の突然変異を指す。置換は、プリンヌクレオチドとピリミジンヌクレオチドとの間、又はプリンヌクレオチド間又はピリミジンヌクレオチド間であり得る。置換は、好ましくは保存的置換である。例えば、当技術分野では、類似又は類似の特性を有するヌクレオチドによる保存的置換は、一般に、ポリヌクレオチドの安定性及び機能を変化させない。保存的置換は、プリンヌクレオチド(A及びG)間の交換及びピリミジンヌクレオチド(T又はU及びC)間の交換を包含する。したがって、本発明のポリヌクレオチドにおける1つ又はいくつかの部位の同じ側鎖由来の残基による置換は、その活性に実質的に影響を及ぼさないであろう。さらに、メチル化部位(連続するCG等)は、本発明の変異体では変異していない。すなわち、本発明の方法は、対応する配列中のメチル化可能部位のメチル化状態を検出し、メチル化不可能部位の塩基に変異が生じ得る。典型的には、メチル化部位は連続したCpGジヌクレオチドである。
したがって、本発明は、DNAメチル化検出用試薬に関する。DNAメチル化を検出する上記の方法で使用される試薬は、当技術分野で周知である。DNA増幅を伴う検出方法において、DNAメチル化を検出するための試薬は、プライマーを包含する。プライマーの配列はメチル化特異的又は非特異的である。プライマーの配列は、非メチル化特異的ブロッカーを包含し得る。ブロッカーは、メチル化検出の特異性を向上させることができる。DNAメチル化を検出するための試薬はまた、プローブを包含し得る。典型的には、プローブ配列の5’末端を蛍光レポーターで標識し、3’末端をクエンチャーで標識する。プローブの配列は、例示的に、MGB(副溝結合剤)又はLNA(ロックド核酸)を包含する。MGB及びLNAは、Tm値を増加させ、アッセイの特異性を増加させ、プローブ設計の柔軟性を高めるために使用される。本明細書で使用される「プライマー」は、ヌクレオチド重合が開始されるときに合成をガイドする特定のヌクレオチド配列を有する核酸分子を指す。プライマーは、通常、2つの人工的に合成されたオリゴヌクレオチド配列である。一方のプライマーは標的領域の一端のDNA鋳型鎖に相補的であり、他方のプライマーは標的領域の他端の別のDNA鋳型鎖に相補的であり、それらはヌクレオチド重合の開始点として働く。プライマーは、通常、少なくとも9bpである。インビトロで人工的に設計されたプライマーは、ポリメラーゼ連鎖反応(PCR)、qPCR、配列決定及びプローブ合成に広く使用されている。典型的には、プライマーは、増幅産物が1~2000bp、10~1000bp、30~900bp、40~800bp、50~700bp、又は少なくとも150bp、少なくとも140bp、少なくとも130bp、少なくとも120bpの長さを有するように設計される。
本明細書における「変異体」又は「変異体」という用語は、他の核酸とハイブリダイズする能力を保持しながら、参照配列と比較して1つ又は複数のヌクレオチドの挿入、欠失又は置換によって核酸配列が変化するポリヌクレオチドを指す。本明細書の実施形態のいずれかによる変異体は、参照配列の生物学的活性を保持しながら、参照配列に対して少なくとも70%、好ましくは少なくとも80%、好ましくは少なくとも85%、好ましくは少なくとも90%、好ましくは少なくとも95%、好ましくは少なくとも97%の配列同一性を有するヌクレオチド配列を包含する。2つのアラインメントされた配列間の配列同一性は、例えば、NCBIのBLASTnを使用して計算することができる。変異体はまた、参照配列の生物学的活性を依然として保持しながら、参照配列のヌクレオチド配列に1つ又は複数の変異(挿入、欠失又は置換)を有するヌクレオチド配列を包含する。複数の突然変異は、通常、1~8、1~5又は1~3等の1~10の範囲内の突然変異を指す。置換は、プリンヌクレオチドとピリミジンヌクレオチドとの間、又はプリンヌクレオチド間又はピリミジンヌクレオチド間であり得る。置換は、好ましくは保存的置換である。例えば、当技術分野では、類似又は類似の特性を有するヌクレオチドによる保存的置換は、一般に、ポリヌクレオチドの安定性及び機能を変化させない。保存的置換は、プリンヌクレオチド(A及びG)間の交換及びピリミジンヌクレオチド(T又はU及びC)間の交換を包含する。したがって、本発明のポリヌクレオチドにおける1つ又はいくつかの部位の同じ側鎖由来の残基による置換は、その活性に実質的に影響を及ぼさないであろう。さらに、メチル化部位(連続するCG等)は、本発明の変異体では変異していない。すなわち、本発明の方法は、対応する配列中のメチル化可能部位のメチル化状態を検出し、メチル化不可能部位の塩基に変異が生じ得る。典型的には、メチル化部位は連続したCpGジヌクレオチドである。
本明細書に記載されるように、変換は、DNA又はRNAの塩基間で起こり得る。本明細書に記載の「変換」、「シトシン変換」又は「CT変換」は、非酵素的又は酵素的方法を用いてDNAを処理することによって、未修飾シトシン(C)を、シトシンよりもグアニンに結合する能力が低い塩基(例えば、ウラシル(U))に変換する方法である。シトシンを変換するための非酵素的又は酵素的方法は、当技術分野で周知である。例示的には、非酵素的方法は、重亜硫酸カルシウム、重亜硫酸ナトリウム、重亜硫酸カリウム、重亜硫酸アンモニウム、重硫酸ナトリウム、重硫酸カリウム及び重硫酸アンモニウム等の重亜硫酸塩、酸性亜硫酸塩又はメタ重亜硫酸塩等の変換試薬での処理を包含する。例示的には、酵素的方法は、デアミナーゼ処理を包含する。変換されたDNAは、場合により精製される。本明細書での使用に適したDNA精製方法は、当技術分野で周知である。
本発明はさらに、膵癌を診断するためのメチル化検出キットを提供する。キットは、本明細書に記載のプライマー及び/又はプローブを含み、本発明者らによって発見された膵癌関連配列のメチル化レベルを検出するために使用される。キットはまた、内部標準又は陽性対照として、本明細書に記載される、特に第1の態様に記載される核酸分子を含み得る。本明細書に記載の「ハイブリダイゼーション」という用語は、主にストリンジェントな条件下での核酸配列の対合を指す。例示的なストリンジェントな条件は、0.1×SSPE(又は0.1×SSC)及び0.1%SDSの溶液中、65℃でのハイブリダイゼーション及び膜洗浄である。
プライマー、プローブ及び核酸分子に加えて、キットはまた、DNAメチル化を検出するために必要とされる他の試薬を含む。例示的には、DNAメチル化を検出するための他の試薬は、次のうちの1つ又は複数を包含し得る:バイサルファイト及びその誘導体、PCR緩衝液、ポリメラーゼ、dNTP、プライマー、プローブ、メチル化感受性又は非感受性制限エンドヌクレアーゼ、消化緩衝液、蛍光色素、蛍光消光剤、蛍光レポーター、エキソヌクレアーゼ、アルカリホスファターゼ、内部標準、及び対照。
キットはまた、非メチル化シトシンがグアニンに結合しない塩基に変換される変換陽性標準を含み得る。陽性標準は、完全にメチル化されていてもよい。キットはまた、PCR反応試薬を含み得る。好ましくは、PCR反応試薬は、Taq DNAポリメラーゼ、PCR緩衝液、dNTP及びMg2+を包含する。
本発明はさらに、(1)対象の試料中の本明細書に記載の膵癌関連配列のメチル化レベルを検出することと、(2)対照試料及び/又は参照レベルと比較することによって、又は計算によってスコアを得ることと、(3)スコアに基づいて、対象が膵癌に罹患しているか否かを特定することと、を含む、膵癌のスクリーニング方法を提供する。通常、工程(1)の前に、方法は、試料DNAの抽出及び品質検査、及び/又はDNA上の非メチル化シトシンをグアニンに結合しない塩基に変換することをさらに含む。
具体的な実施形態において、工程(1)は:ゲノムDNA又はcfDNAを変換試薬で処理して、非メチル化シトシンを、シトシンよりもグアニンに対する結合能が低い塩基(例えば、ウラシル)に変換することと、本明細書に記載の膵癌関連配列の変換された配列を増幅するのに適したプライマーを使用してPCR増幅を実施することと、増幅産物の有無によって、又は配列同定(例えば、プローブベースのPCR同定又はDNA配列決定同定)によって、少なくとも1つのCpGのメチル化状態又はレベルを決定することと、を含む。
あるいは、工程(1)は、ゲノムDNA又はcfDNAをメチル化感受性制限エンドヌクレアーゼで処理することと、本明細書に記載の膵癌関連配列の少なくとも1つのCpGの配列を増幅するのに適したプライマーを使用してPCR増幅を行うことと、増幅産物の存在又は非存在によって少なくとも1つのCpGのメチル化状態又はレベルを決定することと、を含む。ここでいう「メチル化状態」とは、目的とする配列中の任意の位置における任意の数のCpGのメチル化状態の関係を包含する。この関係は、メチル化状態パラメータ(例えば、0又は1)の加算若しくは減算又は数学的アルゴリズム(例えば、平均、パーセンテージ、分数、比、程度、又は数学的モデルを使用した計算)の計算結果であり得、これは、メチル化レベル測定値、メチル化ハプロタイプ比率、又はメチル化ハプロタイプ負荷を包含するが、これらに限定されない。用語「メチル化状態」は、典型的にはメチル化又は非メチル化(例えば、メチル化状態パラメータ0又は1)を包含する特定のCpG部位のメチル化を示す。
本発明はさらに、膵癌を診断するためのメチル化検出キットを提供する。キットは、本明細書に記載のプライマー及び/又はプローブを含み、本発明者らによって発見された膵癌関連配列のメチル化レベルを検出するために使用される。キットはまた、内部標準又は陽性対照として、本明細書に記載される、特に第1の態様に記載される核酸分子を含み得る。本明細書に記載の「ハイブリダイゼーション」という用語は、主にストリンジェントな条件下での核酸配列の対合を指す。例示的なストリンジェントな条件は、0.1×SSPE(又は0.1×SSC)及び0.1%SDSの溶液中、65℃でのハイブリダイゼーション及び膜洗浄である。
プライマー、プローブ及び核酸分子に加えて、キットはまた、DNAメチル化を検出するために必要とされる他の試薬を含む。例示的には、DNAメチル化を検出するための他の試薬は、次のうちの1つ又は複数を包含し得る:バイサルファイト及びその誘導体、PCR緩衝液、ポリメラーゼ、dNTP、プライマー、プローブ、メチル化感受性又は非感受性制限エンドヌクレアーゼ、消化緩衝液、蛍光色素、蛍光消光剤、蛍光レポーター、エキソヌクレアーゼ、アルカリホスファターゼ、内部標準、及び対照。
キットはまた、非メチル化シトシンがグアニンに結合しない塩基に変換される変換陽性標準を含み得る。陽性標準は、完全にメチル化されていてもよい。キットはまた、PCR反応試薬を含み得る。好ましくは、PCR反応試薬は、Taq DNAポリメラーゼ、PCR緩衝液、dNTP及びMg2+を包含する。
本発明はさらに、(1)対象の試料中の本明細書に記載の膵癌関連配列のメチル化レベルを検出することと、(2)対照試料及び/又は参照レベルと比較することによって、又は計算によってスコアを得ることと、(3)スコアに基づいて、対象が膵癌に罹患しているか否かを特定することと、を含む、膵癌のスクリーニング方法を提供する。通常、工程(1)の前に、方法は、試料DNAの抽出及び品質検査、及び/又はDNA上の非メチル化シトシンをグアニンに結合しない塩基に変換することをさらに含む。
具体的な実施形態において、工程(1)は:ゲノムDNA又はcfDNAを変換試薬で処理して、非メチル化シトシンを、シトシンよりもグアニンに対する結合能が低い塩基(例えば、ウラシル)に変換することと、本明細書に記載の膵癌関連配列の変換された配列を増幅するのに適したプライマーを使用してPCR増幅を実施することと、増幅産物の有無によって、又は配列同定(例えば、プローブベースのPCR同定又はDNA配列決定同定)によって、少なくとも1つのCpGのメチル化状態又はレベルを決定することと、を含む。
あるいは、工程(1)は、ゲノムDNA又はcfDNAをメチル化感受性制限エンドヌクレアーゼで処理することと、本明細書に記載の膵癌関連配列の少なくとも1つのCpGの配列を増幅するのに適したプライマーを使用してPCR増幅を行うことと、増幅産物の存在又は非存在によって少なくとも1つのCpGのメチル化状態又はレベルを決定することと、を含む。ここでいう「メチル化状態」とは、目的とする配列中の任意の位置における任意の数のCpGのメチル化状態の関係を包含する。この関係は、メチル化状態パラメータ(例えば、0又は1)の加算若しくは減算又は数学的アルゴリズム(例えば、平均、パーセンテージ、分数、比、程度、又は数学的モデルを使用した計算)の計算結果であり得、これは、メチル化レベル測定値、メチル化ハプロタイプ比率、又はメチル化ハプロタイプ負荷を包含するが、これらに限定されない。用語「メチル化状態」は、典型的にはメチル化又は非メチル化(例えば、メチル化状態パラメータ0又は1)を包含する特定のCpG部位のメチル化を示す。
1つ又は複数の実施形態において、対象の試料におけるメチル化レベルは、対照試料及び/又は参照レベルと比較した場合、増加又は減少する。メチル化マーカのレベルがある閾値を満たすとき、膵癌が同定される。あるいは、試験した遺伝子のメチル化レベルを数学的に分析してスコアを得ることができる。試験した試料について、スコアが閾値より大きい場合、決定結果は陽性、すなわち、膵癌が存在し、そうでない場合、それは陰性である、すなわち、膵癌血漿は存在しない。従来の数学的分析方法及び閾値を決定する方法は、当技術分野で公知である。例示的な方法は、数学的モデルである。例えば、差異的メチル化マーカについては、2群の試料に対してサポートベクターマシン(SVM)モデルを構築し、このモデルを用いて検出結果の精度、感度及び特異度、並びに予測値特性曲線下面積(ROC)(AUC)を統計的に解析し、試験セット試料の予測スコアを統計的に解析する。
1つ又は複数の実施形態において、対象の試料におけるメチル化レベルは、対照試料及び/又は参照レベルと比較した場合、増加又は減少する。メチル化マーカのレベルが特定の閾値を満たす場合、膵癌が同定され、そうでなければ慢性膵炎である。あるいは、試験した遺伝子のメチル化レベルを数学的に分析してスコアを得ることができる。試験される試料について、スコアが閾値より大きい場合、鑑別結果が陽性、すなわち、膵癌が存在し、そうでない場合、それは陰性である、すなわち、それは膵炎である。閾値を決定するための従来の数学的解析方法及び方法は当技術分野で公知であり、例示的な方法はサポートベクターマシン(SVM)数学モデルである。例えば、示差的メチル化マーカについては、上記学習群の試料に対してサポートベクターマシン(SVM)を構築し、モデルを用いて検出結果の精度、感度及び特異度、並びに予測値特性曲線下面積(ROC)(AUC)を統計的に解析し、試験セットの試料の予測スコアを統計的に解析する。サポートベクターマシンの一実施形態では、スコア閾値は0.897である。スコアが0.897より大きい場合、対象は膵癌患者であるとみなされ、そうでなければ、対象は慢性膵炎の患者である。
好ましい実施形態では、モデル訓練方法は以下の通りである:最初に、各部位のメチル化レベルに従って差次的にメチル化されたセグメントを得て、差次的にメチル化された領域マトリックスを構築すること、例えば、samtoolsソフトウェア等を介して、HG19ゲノム中の単一のCpGジヌクレオチド位置のメチル化レベルデータからメチル化データマトリックスを構築すること、次いで、SVMモデルを訓練する工程と、を含む。
例示的なSVMモデル訓練方法は以下の通りである。
a)訓練モデルモードが構築される。パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
典型的には、モデル構築中、膵癌を有するカテゴリーは1としてコード化され、膵癌を有さないカテゴリーは0としてコード化され得る。本発明では、python software(v3.6.9)及びsklearn software package(0.23.1)により閾値は0.895に設定される。構築されたモデルは、膵癌の有無で試料を0.895で最終的に区別する。
ここで、試料は哺乳動物、好ましくはヒト由来である。試料は、任意の器官(例えば、膵臓)、組織(例えば、上皮組織、結合組織、筋組織及び神経組織)、細胞(例えば、膵癌生検)又は体液(例えば、血液、血漿、血清、間質液、尿)に由来し得る。一般に、試料は、ゲノムDNA又はcfDNA(無循環DNA又は無細胞DNA)を含んでいればよい。循環フリーDNA又は無細胞DNAと呼ばれるcfDNAは、血漿中に放出された分解DNA断片である。例示的には、試料は、膵癌生検、好ましくは細針吸引生検である。あるいは、試料は血漿又はcfDNAである。
1つ又は複数の実施形態において、対象の試料におけるメチル化レベルは、対照試料及び/又は参照レベルと比較した場合、増加又は減少する。メチル化マーカのレベルが特定の閾値を満たす場合、膵癌が同定され、そうでなければ慢性膵炎である。あるいは、試験した遺伝子のメチル化レベルを数学的に分析してスコアを得ることができる。試験される試料について、スコアが閾値より大きい場合、鑑別結果が陽性、すなわち、膵癌が存在し、そうでない場合、それは陰性である、すなわち、それは膵炎である。閾値を決定するための従来の数学的解析方法及び方法は当技術分野で公知であり、例示的な方法はサポートベクターマシン(SVM)数学モデルである。例えば、示差的メチル化マーカについては、上記学習群の試料に対してサポートベクターマシン(SVM)を構築し、モデルを用いて検出結果の精度、感度及び特異度、並びに予測値特性曲線下面積(ROC)(AUC)を統計的に解析し、試験セットの試料の予測スコアを統計的に解析する。サポートベクターマシンの一実施形態では、スコア閾値は0.897である。スコアが0.897より大きい場合、対象は膵癌患者であるとみなされ、そうでなければ、対象は慢性膵炎の患者である。
好ましい実施形態では、モデル訓練方法は以下の通りである:最初に、各部位のメチル化レベルに従って差次的にメチル化されたセグメントを得て、差次的にメチル化された領域マトリックスを構築すること、例えば、samtoolsソフトウェア等を介して、HG19ゲノム中の単一のCpGジヌクレオチド位置のメチル化レベルデータからメチル化データマトリックスを構築すること、次いで、SVMモデルを訓練する工程と、を含む。
例示的なSVMモデル訓練方法は以下の通りである。
a)訓練モデルモードが構築される。パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
典型的には、モデル構築中、膵癌を有するカテゴリーは1としてコード化され、膵癌を有さないカテゴリーは0としてコード化され得る。本発明では、python software(v3.6.9)及びsklearn software package(0.23.1)により閾値は0.895に設定される。構築されたモデルは、膵癌の有無で試料を0.895で最終的に区別する。
ここで、試料は哺乳動物、好ましくはヒト由来である。試料は、任意の器官(例えば、膵臓)、組織(例えば、上皮組織、結合組織、筋組織及び神経組織)、細胞(例えば、膵癌生検)又は体液(例えば、血液、血漿、血清、間質液、尿)に由来し得る。一般に、試料は、ゲノムDNA又はcfDNA(無循環DNA又は無細胞DNA)を含んでいればよい。循環フリーDNA又は無細胞DNAと呼ばれるcfDNAは、血漿中に放出された分解DNA断片である。例示的には、試料は、膵癌生検、好ましくは細針吸引生検である。あるいは、試料は血漿又はcfDNAである。
本出願はさらに、膵癌に関連するメチル化ハプロタイプ画分を得るための方法に関する。メチル化標的配列決定(MethylTitan)によって得られたメチル化データを例にとると、マーカ部位をスクリーニング及び試験する方法は以下の通りである:元のペアエンドシーケンシングリード-リードを結合して結合されたシングルエンドリードを得ること-アダプタを除去してアダプタフリーリードを得ること-BAMファイルを形成するためにヒトDNAゲノムに合わせるBismark-ハプロタイプファイルを形成するために各リードのCpG部位メチル化レベルをsamtoolsによって抽出すること-メタファイルを形成するためにC部位メチル化ハプロタイプ画分を統計的に分析すること-MHF(メチル化ハプロタイプ画分を計算すること-サイトをフィルタリングするためにカバレッジ200を使用してmeth.matrix matrixファイルを形成すること-0.1を超えるNA値に基づいてフィルタリングして、サイトをフィルタリングすること-試料を訓練セット及び試験セットに事前に分割すること-訓練セット内の各ハプロタイプの表現型のロジスティック回帰モデルを構築すること-各メチル化ハプロタイプ画分の回帰P値を選択すること-各MethylTitan増幅領域を統計的に分析し、領域のメチル化レベルを表すために最も有意なP値を有するメチル化ハプロタイプを選択し、サポートベクターマシンを介してモデル化すること-訓練セット(ROCプロット)の結果を形成し、検証のためのモデルを使用して試験セットを予測すること。具体的には、膵癌に関連するメチル化ハプロタイプを得るための方法は、以下の工程:(1)試験対象の膵癌を有する又は有さない患者から血漿試料を得、cfDNAを抽出し、ライブラリ構築及び配列決定を行うためにMethylTitan法を使用し、及び配列決定リードを得る工程と、(2)シーケンシングデータの前処理する工程(シーケンサーによって生成されたシーケンシングデータのアダプタ除去及びスプライシングを包含する)と、(3)上記の前処理後の配列決定データをヒトゲノムのHG19参照ゲノム配列にアラインして、各断片の位置を決定する工程と、を含む。工程(2)のデータは、Illumina配列決定プラットフォームのペアエンド150bp配列決定から得ることができる。工程(2)におけるアダプタ除去は、2つのペアエンド配列決定データの5’末端及び3’末端の配列決定アダプタをそれぞれ除去すること、並びにアダプタを除去した後に低品質塩基を除去することである。工程(2)におけるスプライシング工程は、ペアエンドシーケンシングデータを結合し、それらを元のライブラリ断片に復元することである。これにより、シーケンシング断片のより良好なアライメント及び正確な位置決めが可能になる。例えば、配列決定ライブラリの長さは約180bpであり、150bpの対の末端はライブラリ断片全体を完全にカバーすることができる。工程(3)は、(a)変換された参照ゲノムの2つのセットを構築し、変換された参照ゲノムのアライメントインデックスをそれぞれ構築するために、それぞれHG19参照ゲノムデータに対してCT及びGA変換を実施する工程と、(b)上の結合された配列決定配列データに対してもCT及びGA変換を行う工程と、(c)上記の変換された参照ゲノム配列をそれぞれアラインメントし、最後にアラインメント結果を要約して、参照ゲノム中の配列決定データの位置を決定する工程と、を含む。
また、膵癌に関するメチル化値の取得方法は、(4)MHFの算出と、(5)メチル化ハプロタイプMHFデータマトリックスの構築と、(6)試料グループ分けによる各メチル化ハプロタイプのロジスティック回帰モデルの構築と、を含む。工程(4)は、工程(3)で得られたアライメント結果に基づいて、HG19参照ゲノムの位置におけるメチル化ハプロタイプ状態及び配列決定デプス情報を得ることを含む。工程(5)は、メチル化ハプロタイプ状態及び配列決定デプス情報データをデータマトリックスに組み合わせることを含む。このうち、深さが200未満の各データ点は欠損値として扱われ、欠損値を埋めるためにK最近傍(KNN)法が使用される。工程(6)は、ロジスティック回帰を用いた上記マトリックス中の各位置の統計的モデリングに基づいて、2つの群間で有意な回帰係数を有するハプロタイプをスクリーニングすることからなる。
また、膵癌に関するメチル化値の取得方法は、(4)MHFの算出と、(5)メチル化ハプロタイプMHFデータマトリックスの構築と、(6)試料グループ分けによる各メチル化ハプロタイプのロジスティック回帰モデルの構築と、を含む。工程(4)は、工程(3)で得られたアライメント結果に基づいて、HG19参照ゲノムの位置におけるメチル化ハプロタイプ状態及び配列決定デプス情報を得ることを含む。工程(5)は、メチル化ハプロタイプ状態及び配列決定デプス情報データをデータマトリックスに組み合わせることを含む。このうち、深さが200未満の各データ点は欠損値として扱われ、欠損値を埋めるためにK最近傍(KNN)法が使用される。工程(6)は、ロジスティック回帰を用いた上記マトリックス中の各位置の統計的モデリングに基づいて、2つの群間で有意な回帰係数を有するハプロタイプをスクリーニングすることからなる。
本発明は、DNAメチル化及びCA19-9レベルと、膵癌及び膵炎との関係を調べる。マーカ群DNAメチル化レベル及びCA19-9レベルを、膵癌と慢性膵炎とを非侵襲的に鑑別するためのマーカとして、膵癌の非侵襲的診断の精度を向上させることを目的とする。
本発明者らは、膵癌マーカのスクリーニング及び診断において、CA19-9のレベルを組み合わせることにより、診断精度を有意に向上させることができることを見出した。
本発明は、最初に、膵癌メチル化マーカをスクリーニングする方法であって、(1)対象のゲノム(cfDNA等)のDNAセグメントのメチル化ハプロタイプ分率及び配列決定デプスを得ることと、場合により(2)メチル化ハプロタイプ分率及び配列決定デプスデータを前処理することと、(3)クロスバリデーション増分特徴選択を行って特徴メチル化セグメントを得ることと、を含む方法を提供する。
工程(1)のデータ取得は、メチル化検出後のデータ解析であってもよいし、ファイルから直接読み出すことであってもよい。メチル化検出が行われる実施形態では、工程(1)は、1.1)配列決定リードデータを得るために、対象の試料のDNAメチル化を検出すること、1.3)メチル化セグメントの位置及び配列決定デプス情報を得るために、配列決定データを参照ゲノムにアラインメントすること、1.4)以下の式であって、
式中、iは標的メチル化領域を表し、hは標的メチル化ハプロタイプを表し、Niは標的メチル化領域に位置するリードの数を表し、Ni、hは標的メチル化ハプロタイプを含むリードの数を表す、
式に従ってセグメントのメチル化ハプロタイプ分率(MHF)を計算することを含む。典型的には、標的領域内の各メチル化ハプロタイプについてメチル化ハプロタイプ画分を計算する必要がある。この工程はまた、1.2)アダプタ除去及び/又はスプライシング等、配列決定データを前処理する工程を含み得る。
工程(2)は、メチル化ハプロタイプ比及び配列決定デプス情報データをデータマトリックスに組み合わせる工程を含む。さらに、結果をより正確にするために、工程(2)はまた、データマトリックスにおいて5~15%(例えば、10%)より高い欠損値割合を有する部位を除去することを含み、300(例えば、200未満)未満の深さを有する各データ点について、それは欠損値として扱われ、欠損値はK最近傍法を使用して帰属される。
1つ又は複数の実施形態において、工程(3)は、数学的モデルを使用して訓練データにおけるクロスバリデーション増分特徴選択を実施することを含み、数学的モデルのAUCを増加させるDNAセグメントは、特徴メチル化セグメントである。このうち、数理モデルは、サポートベクターマシンモデル(SVM)又はランダムフォレストモデルであり得る。好ましくは、工程(3)は、(3.1)高度に関連性のある候補メチル化セグメントを得るために、メチル化ハプロタイプ分率及び配列決定デプスに従ってDNAセグメントの関連性をランク付けする工程、及び(3.2)クロスバリデーション増分特徴選択を行う工程を含み、候補メチル化セグメントは関連性に従って(例えば、降順の回帰係数に従って)ランク付けされ、毎回1つ又は複数の候補メチル化セグメントデータが追加され、試験データが予測され、平均クロスバリデーションAUCが増加する候補メチル化セグメントは特徴メチル化セグメントである。これらのうち、工程(3.1)は、具体的には、メチル化ハプロタイプ画分及び対象の表現型に関するDNAセグメントの配列決定深度に基づいてロジスティック回帰モデルを構築し、大きな回帰係数を有するDNAセグメントをスクリーニングして、候補メチル化セグメントを形成することを含むことができる。工程(3.2)の予測は、モデル(サポートベクターマシンモデル、ランダムフォレストモデル等)を構築することによって行うことができる。
本発明者らは、膵癌マーカのスクリーニング及び診断において、CA19-9のレベルを組み合わせることにより、診断精度を有意に向上させることができることを見出した。
本発明は、最初に、膵癌メチル化マーカをスクリーニングする方法であって、(1)対象のゲノム(cfDNA等)のDNAセグメントのメチル化ハプロタイプ分率及び配列決定デプスを得ることと、場合により(2)メチル化ハプロタイプ分率及び配列決定デプスデータを前処理することと、(3)クロスバリデーション増分特徴選択を行って特徴メチル化セグメントを得ることと、を含む方法を提供する。
工程(1)のデータ取得は、メチル化検出後のデータ解析であってもよいし、ファイルから直接読み出すことであってもよい。メチル化検出が行われる実施形態では、工程(1)は、1.1)配列決定リードデータを得るために、対象の試料のDNAメチル化を検出すること、1.3)メチル化セグメントの位置及び配列決定デプス情報を得るために、配列決定データを参照ゲノムにアラインメントすること、1.4)以下の式であって、
式中、iは標的メチル化領域を表し、hは標的メチル化ハプロタイプを表し、Niは標的メチル化領域に位置するリードの数を表し、Ni、hは標的メチル化ハプロタイプを含むリードの数を表す、
式に従ってセグメントのメチル化ハプロタイプ分率(MHF)を計算することを含む。典型的には、標的領域内の各メチル化ハプロタイプについてメチル化ハプロタイプ画分を計算する必要がある。この工程はまた、1.2)アダプタ除去及び/又はスプライシング等、配列決定データを前処理する工程を含み得る。
工程(2)は、メチル化ハプロタイプ比及び配列決定デプス情報データをデータマトリックスに組み合わせる工程を含む。さらに、結果をより正確にするために、工程(2)はまた、データマトリックスにおいて5~15%(例えば、10%)より高い欠損値割合を有する部位を除去することを含み、300(例えば、200未満)未満の深さを有する各データ点について、それは欠損値として扱われ、欠損値はK最近傍法を使用して帰属される。
1つ又は複数の実施形態において、工程(3)は、数学的モデルを使用して訓練データにおけるクロスバリデーション増分特徴選択を実施することを含み、数学的モデルのAUCを増加させるDNAセグメントは、特徴メチル化セグメントである。このうち、数理モデルは、サポートベクターマシンモデル(SVM)又はランダムフォレストモデルであり得る。好ましくは、工程(3)は、(3.1)高度に関連性のある候補メチル化セグメントを得るために、メチル化ハプロタイプ分率及び配列決定デプスに従ってDNAセグメントの関連性をランク付けする工程、及び(3.2)クロスバリデーション増分特徴選択を行う工程を含み、候補メチル化セグメントは関連性に従って(例えば、降順の回帰係数に従って)ランク付けされ、毎回1つ又は複数の候補メチル化セグメントデータが追加され、試験データが予測され、平均クロスバリデーションAUCが増加する候補メチル化セグメントは特徴メチル化セグメントである。これらのうち、工程(3.1)は、具体的には、メチル化ハプロタイプ画分及び対象の表現型に関するDNAセグメントの配列決定深度に基づいてロジスティック回帰モデルを構築し、大きな回帰係数を有するDNAセグメントをスクリーニングして、候補メチル化セグメントを形成することを含むことができる。工程(3.2)の予測は、モデル(サポートベクターマシンモデル、ランダムフォレストモデル等)を構築することによって行うことができる。
特徴的なメチル化セグメントを得た後、それらをCA19-9レベルと組み合わせて、より正確な膵癌診断モデルを構築することができる。したがって、膵癌診断モデルの構築方法では、上記(1)~(3)の工程に加えて、(4)特徴メチル化セグメントのデータに対する数理モデルを構築してメチル化スコアを求める工程、及び(5)メチル化スコアとCA19-9レベルとをデータマトリックスに結合し、データマトリックスに基づいて膵癌診断モデルを構築する工程も含む。工程(4)における「データ」は、特徴的なメチル化セグメント、好ましくはメチル化ハプロタイプ画分と配列決定デプスとを組み合わせたマトリックスのメチル化検出結果である。
工程(4)の数学的モデルは、サポートベクターマシン(SVM)モデル、ランダムフォレスト、及び回帰モデル等、診断データ分析に一般的に使用される任意の数学的モデルとすることができる。ここで、例示的な数学的モデルは、ベクトルマシン(SVM)モデルである。
工程(5)の膵癌診断モデルは、サポートベクターマシン(SVM)モデル、ランダムフォレスト、回帰モデル等、診断データ解析に用いる任意の数理モデルを用いることができる。ここで、膵癌診断モデルの一例として、以下に示すロジスティック回帰膵癌モデルが挙げられ、
式中、Mは試料のメチル化スコアであり、Cは試料のCA19-9レベルである。一つ又は複数の実施形態では、モデル閾値は0.885であり、この値よりも高い値は膵癌を示すと決定され、この値以下の値は膵癌がないと決定される。
具体的な実施形態において、膵炎及び膵癌を区別するための機械学習に基づく方法は、
(1)試験対象の膵癌又は膵炎の患者の血液を抽出し、患者の年齢、性別、CA19-9検査値等を収集することと、(2)試験対象の膵癌又は膵炎を有する患者から血漿試料を得て、cfDNAを抽出し、MethylTitan法を使用してライブラリを作成し、配列決定を実施して配列決定リードを得ることと、(3)シーケンシングデータを前処理すること(シーケンサーによって生成されたシーケンシングデータに対してアダプタ除去及びスプライシングを行うことを包含する)と、(4)上記の前処理された配列決定データを参照ゲノム配列にアラインメントして、各断片の位置を決定することと、(5)MHF(Methylated Haplotype Fraction)メチル化数値マトリックスの計算:対象のメチル化領域は複数のメチル化ハプロタイプを有していてもよく、対象領域内のメチル化ハプロタイプごとにこの値を計算する必要があり、MHFの計算式は以下のように示され、
(式中、iは標的メチル化領域を表し、hは標的メチル化ハプロタイプを表し、Niは標的メチル化領域に位置するリードの数を表し、Ni、hは標的メチル化ハプロタイプを包含するリードの数を表す)と、6)参照ゲノム内の位置について、その位置でメチル化ハプロタイプ画分及び配列決定デプス情報を取得し、メチル化ハプロタイプ画分及び配列決定デプス情報データをデータマトリックスに組合せ、10%より高い欠損値割合を有する部位を除去し、200未満の深さを有する各データ点を欠損値とみなし、K最近傍(KNN)法を用いて欠損値を帰属させることと、(7)全ての試料を2つの部分に分割することであって、一方は訓練セットであり、他方は試験セットである、ことと、(8)訓練セット試料群に従って特徴メチル化セグメントを発見すること:表現型についての各メチル化セグメントについてのロジスティック回帰モデルを構築し、増幅された各標的領域について、候補メチル化セグメントを形成するために最も有意な回帰係数を有するメチル化セグメントを選択するためのスクリーニングと、を包含する。訓練セットは、十倍クロスバリデーション増分特徴選択のために10個の部分にランダムに分割される。各領域における候補メチル化セグメントを回帰係数の有意性に応じて降順に順位付けし、その都度1つのメチル化セグメントのデータを追加して試験データを予測する(予測用のベクターマシン(SVM)モデルを構築する)。分化指数は、10回のクロスバリデーションAUCの平均値である。訓練データのAUCが増加する場合、候補メチル化セグメントは特徴メチル化セグメントとして保持され、そうでない場合は破棄され、(9)工程(8)でスクリーニングした訓練セット中の特徴的なメチル化領域のデータをサポートベクターマシン(SVM)モデルに組み込み、試験セット中のモデルの性能を検証する工程;(10)工程(9)の訓練セットSVMモデルの予測スコアと訓練セット試料に対応するCA19-9測定値とを組み合わせたデータマトリックスをロジスティック回帰モデルに組み込み、試験セット内のCA19-9と組み合わせたモデルの性能を検証する工程。
工程(4)の数学的モデルは、サポートベクターマシン(SVM)モデル、ランダムフォレスト、及び回帰モデル等、診断データ分析に一般的に使用される任意の数学的モデルとすることができる。ここで、例示的な数学的モデルは、ベクトルマシン(SVM)モデルである。
工程(5)の膵癌診断モデルは、サポートベクターマシン(SVM)モデル、ランダムフォレスト、回帰モデル等、診断データ解析に用いる任意の数理モデルを用いることができる。ここで、膵癌診断モデルの一例として、以下に示すロジスティック回帰膵癌モデルが挙げられ、
式中、Mは試料のメチル化スコアであり、Cは試料のCA19-9レベルである。一つ又は複数の実施形態では、モデル閾値は0.885であり、この値よりも高い値は膵癌を示すと決定され、この値以下の値は膵癌がないと決定される。
具体的な実施形態において、膵炎及び膵癌を区別するための機械学習に基づく方法は、
(1)試験対象の膵癌又は膵炎の患者の血液を抽出し、患者の年齢、性別、CA19-9検査値等を収集することと、(2)試験対象の膵癌又は膵炎を有する患者から血漿試料を得て、cfDNAを抽出し、MethylTitan法を使用してライブラリを作成し、配列決定を実施して配列決定リードを得ることと、(3)シーケンシングデータを前処理すること(シーケンサーによって生成されたシーケンシングデータに対してアダプタ除去及びスプライシングを行うことを包含する)と、(4)上記の前処理された配列決定データを参照ゲノム配列にアラインメントして、各断片の位置を決定することと、(5)MHF(Methylated Haplotype Fraction)メチル化数値マトリックスの計算:対象のメチル化領域は複数のメチル化ハプロタイプを有していてもよく、対象領域内のメチル化ハプロタイプごとにこの値を計算する必要があり、MHFの計算式は以下のように示され、
(式中、iは標的メチル化領域を表し、hは標的メチル化ハプロタイプを表し、Niは標的メチル化領域に位置するリードの数を表し、Ni、hは標的メチル化ハプロタイプを包含するリードの数を表す)と、6)参照ゲノム内の位置について、その位置でメチル化ハプロタイプ画分及び配列決定デプス情報を取得し、メチル化ハプロタイプ画分及び配列決定デプス情報データをデータマトリックスに組合せ、10%より高い欠損値割合を有する部位を除去し、200未満の深さを有する各データ点を欠損値とみなし、K最近傍(KNN)法を用いて欠損値を帰属させることと、(7)全ての試料を2つの部分に分割することであって、一方は訓練セットであり、他方は試験セットである、ことと、(8)訓練セット試料群に従って特徴メチル化セグメントを発見すること:表現型についての各メチル化セグメントについてのロジスティック回帰モデルを構築し、増幅された各標的領域について、候補メチル化セグメントを形成するために最も有意な回帰係数を有するメチル化セグメントを選択するためのスクリーニングと、を包含する。訓練セットは、十倍クロスバリデーション増分特徴選択のために10個の部分にランダムに分割される。各領域における候補メチル化セグメントを回帰係数の有意性に応じて降順に順位付けし、その都度1つのメチル化セグメントのデータを追加して試験データを予測する(予測用のベクターマシン(SVM)モデルを構築する)。分化指数は、10回のクロスバリデーションAUCの平均値である。訓練データのAUCが増加する場合、候補メチル化セグメントは特徴メチル化セグメントとして保持され、そうでない場合は破棄され、(9)工程(8)でスクリーニングした訓練セット中の特徴的なメチル化領域のデータをサポートベクターマシン(SVM)モデルに組み込み、試験セット中のモデルの性能を検証する工程;(10)工程(9)の訓練セットSVMモデルの予測スコアと訓練セット試料に対応するCA19-9測定値とを組み合わせたデータマトリックスをロジスティック回帰モデルに組み込み、試験セット内のCA19-9と組み合わせたモデルの性能を検証する工程。
本発明はさらに、DNAメチル化を検出するための試薬又はデバイスと、CA19-9レベルを検出するための試薬又はデバイスとを包含する、膵癌診断用キットを提供する。
DNAメチル化を検出するための試薬は、対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ又は複数のCpGジヌクレオチドのメチル化状態若しくはレベルを決定するために使用される。DNAメチル化を検出するための例示的な試薬は、本発明者らによって見出された膵癌と膵炎との間の分化に関連する配列のメチル化レベルを検出するための本明細書に記載のプライマー及び/又はプローブを包含する。
本明細書に記載のCA19-9レベルは、主に体液(血液又は血漿等)中のCA19-9レベルを指す。CA19-9レベルを検出するための試薬は、CA19-9検出方法で使用することができる当技術分野で公知の任意の試薬、例えば限定するものではないが、CA19-9に対する抗体、及び任意の緩衝液、洗浄液等を包含する免疫反応に基づく検出試薬であり得る。本発明で使用される例示的な検出方法は、化学発光イムノアッセイによってCA19-9の含有量を検出する。具体的な工程は、まず、CA19-9に対する抗体を化学発光マーカ(アクリジニウムエステル)で標識し、標識抗体とCA19-9抗原とを免疫反応させてCA19-9抗原-アクリジニウムエステル標識抗体複合体を形成した後、酸化剤(H2O2)とNaOHを添加してアルカリ環境を形成する。このとき、アクリジニウムエステルは、触媒なしで分解して発光することができる。単位時間当たりに生成された光子エネルギーは、光コレクタ及び光電子増倍管(化学発光検出器)によって受け取られ、記録される。この光の積分はCA19-9抗原の量に比例し、CA19-9の含有量は標準曲線に従って計算することができる。
本発明はさらに、(1)対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ又は複数のCpGジヌクレオチドのメチル化状態若しくはレベルと、対象のCA19-9レベルとを取得すること、(2)メチル化状態若しくはレベルを用いて演算し、メチル化スコアを得る数理モデル(例えば、サポートベクターマシンモデル又はランダムフォレストモデル)を用いること、(3)メチル化スコアとCA19-9レベルとをデータマトリックスに組み合わせること、(4)データマトリックスに基づいて膵癌診断モデル(例えば、ロジスティック回帰モデル)を構築すること、及び任意に(5)膵癌スコアを得、膵癌スコアが閾値に達したか否かに応じて、膵癌を診断すること、を含む、膵癌の診断方法を包含する。本方法は、工程(1)の前にDNA抽出及び/又は品質検査をさらに包含し得る。本発明は、膵炎を有する患者から膵癌を同定すること、すなわち、膵癌と膵炎とを区別することに特に適している。
対象は、例えば、膵炎と診断された患者、又は膵炎と診断された(以前の診断)患者である。すなわち、1つ又は複数の実施形態において、方法は、以前に診断された患者を包含する、慢性膵炎と診断された患者における膵癌を同定する。もちろん、本発明の方法は、上記の対象に限定されるものではなく、未診断の対象において直接、膵炎や膵癌を診断・同定するために用いることもできる。
DNAメチル化を検出するための試薬は、対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ又は複数のCpGジヌクレオチドのメチル化状態若しくはレベルを決定するために使用される。DNAメチル化を検出するための例示的な試薬は、本発明者らによって見出された膵癌と膵炎との間の分化に関連する配列のメチル化レベルを検出するための本明細書に記載のプライマー及び/又はプローブを包含する。
本明細書に記載のCA19-9レベルは、主に体液(血液又は血漿等)中のCA19-9レベルを指す。CA19-9レベルを検出するための試薬は、CA19-9検出方法で使用することができる当技術分野で公知の任意の試薬、例えば限定するものではないが、CA19-9に対する抗体、及び任意の緩衝液、洗浄液等を包含する免疫反応に基づく検出試薬であり得る。本発明で使用される例示的な検出方法は、化学発光イムノアッセイによってCA19-9の含有量を検出する。具体的な工程は、まず、CA19-9に対する抗体を化学発光マーカ(アクリジニウムエステル)で標識し、標識抗体とCA19-9抗原とを免疫反応させてCA19-9抗原-アクリジニウムエステル標識抗体複合体を形成した後、酸化剤(H2O2)とNaOHを添加してアルカリ環境を形成する。このとき、アクリジニウムエステルは、触媒なしで分解して発光することができる。単位時間当たりに生成された光子エネルギーは、光コレクタ及び光電子増倍管(化学発光検出器)によって受け取られ、記録される。この光の積分はCA19-9抗原の量に比例し、CA19-9の含有量は標準曲線に従って計算することができる。
本発明はさらに、(1)対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ又は複数のCpGジヌクレオチドのメチル化状態若しくはレベルと、対象のCA19-9レベルとを取得すること、(2)メチル化状態若しくはレベルを用いて演算し、メチル化スコアを得る数理モデル(例えば、サポートベクターマシンモデル又はランダムフォレストモデル)を用いること、(3)メチル化スコアとCA19-9レベルとをデータマトリックスに組み合わせること、(4)データマトリックスに基づいて膵癌診断モデル(例えば、ロジスティック回帰モデル)を構築すること、及び任意に(5)膵癌スコアを得、膵癌スコアが閾値に達したか否かに応じて、膵癌を診断すること、を含む、膵癌の診断方法を包含する。本方法は、工程(1)の前にDNA抽出及び/又は品質検査をさらに包含し得る。本発明は、膵炎を有する患者から膵癌を同定すること、すなわち、膵癌と膵炎とを区別することに特に適している。
対象は、例えば、膵炎と診断された患者、又は膵炎と診断された(以前の診断)患者である。すなわち、1つ又は複数の実施形態において、方法は、以前に診断された患者を包含する、慢性膵炎と診断された患者における膵癌を同定する。もちろん、本発明の方法は、上記の対象に限定されるものではなく、未診断の対象において直接、膵炎や膵癌を診断・同定するために用いることもできる。
特定の実施形態では、工程(1)は、対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを検出すること、例えば、本明細書に記載のプライマー分子及び/又はプローブ分子を使用してメチル化状態又はレベルを検出することを含む。
メチル化状態又はレベルを検出し、CA19-9レベルを検出するための方法は、本明細書の他の箇所に記載されている。メチル化状態又はレベルを検出するための具体的な方法は、ゲノムDNA又はcfDNAを変換試薬で処理して、非メチル化シトシンを、シトシンよりもグアニンに対する結合能が低い塩基(ウラシル等)に変換することと、本明細書に記載の膵癌と膵炎との間の分化に関連する配列の変換された配列を増幅するのに適したプライマーを使用してPCR増幅を行うことと、少なくとも1つのCpGのメチル化レベルを、増幅産物の存在若しくは非存在によって、又は配列同定(例えば、プローブベースのPCR同定又はDNA配列決定同定)によって決定することと、を含む。
好ましい実施形態では、モデル訓練方法は以下の通りである:最初に、各部位のメチル化レベルに従って差次的にメチル化されたセグメントを得て、差次的にメチル化された領域マトリックスを構築すること、例えば、samtoolsソフトウェア等を介して、HG19ゲノム中の単一のCpGジヌクレオチド位置のメチル化レベルデータからメチル化データマトリックスを構築すること、次いで、SVMモデルを訓練する工程と、を含む。
例示的なSVMモデル訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(v0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(v0.23.1)は、データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
本発明者らの知見によれば、メチル化スコアとCA19-9レベルとを組み合わせることにより、診断精度を有意に向上させることができる。具体的には、メチル化スコアとCA19-9レベルとをデータマトリックスに合成し、そのデータマトリックスに基づいて膵癌診断モデル(例えば、ロジスティック回帰モデル)を構築し、膵癌スコアを求める。
メチル化スコア及びCA19-9レベルのデータマトリックスは、任意選択的に正規化される。標準化は、当該技術分野における従来の標準化方法を用いて行うことができる。本発明の実施形態では、ロバストスケーラ標準化方法が例として使用され、標準化式は以下の通りであり、
ここで、x及びx’はそれぞれ正規化前後の試料データであり、中央値は試料の中央値であり、IQRは試料の四分位範囲である。
メチル化スコアと同様に、従来の数学的モデリングの方法及びデータ行列を介して閾値を決定する方法は、例えばサポートベクターマシン(SVM)数学モデル、ランダムフォレストモデル又はロジスティック回帰モデルを介して当技術分野で公知である。例示的な手法は、ロジスティック回帰モデルである。例えば、示差的メチル化マーカについては、上記学習群の試料に対してロジスティック回帰モデルを構築し、モデルを用いて検出結果の精度、感度及び特異度、並びに予測値特性曲線下面積(ROC)(AUC)を統計的に解析し、試験セットの試料の予測スコアを統計的に解析する。メチル化レベルとCA19-9レベルとを組み合わせた膵癌スコアが特定の閾値を満たす場合、膵癌が同定され、そうでなければ慢性膵炎が同定される。
メチル化状態又はレベルを検出し、CA19-9レベルを検出するための方法は、本明細書の他の箇所に記載されている。メチル化状態又はレベルを検出するための具体的な方法は、ゲノムDNA又はcfDNAを変換試薬で処理して、非メチル化シトシンを、シトシンよりもグアニンに対する結合能が低い塩基(ウラシル等)に変換することと、本明細書に記載の膵癌と膵炎との間の分化に関連する配列の変換された配列を増幅するのに適したプライマーを使用してPCR増幅を行うことと、少なくとも1つのCpGのメチル化レベルを、増幅産物の存在若しくは非存在によって、又は配列同定(例えば、プローブベースのPCR同定又はDNA配列決定同定)によって決定することと、を含む。
好ましい実施形態では、モデル訓練方法は以下の通りである:最初に、各部位のメチル化レベルに従って差次的にメチル化されたセグメントを得て、差次的にメチル化された領域マトリックスを構築すること、例えば、samtoolsソフトウェア等を介して、HG19ゲノム中の単一のCpGジヌクレオチド位置のメチル化レベルデータからメチル化データマトリックスを構築すること、次いで、SVMモデルを訓練する工程と、を含む。
例示的なSVMモデル訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(v0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(v0.23.1)は、データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
本発明者らの知見によれば、メチル化スコアとCA19-9レベルとを組み合わせることにより、診断精度を有意に向上させることができる。具体的には、メチル化スコアとCA19-9レベルとをデータマトリックスに合成し、そのデータマトリックスに基づいて膵癌診断モデル(例えば、ロジスティック回帰モデル)を構築し、膵癌スコアを求める。
メチル化スコア及びCA19-9レベルのデータマトリックスは、任意選択的に正規化される。標準化は、当該技術分野における従来の標準化方法を用いて行うことができる。本発明の実施形態では、ロバストスケーラ標準化方法が例として使用され、標準化式は以下の通りであり、
ここで、x及びx’はそれぞれ正規化前後の試料データであり、中央値は試料の中央値であり、IQRは試料の四分位範囲である。
メチル化スコアと同様に、従来の数学的モデリングの方法及びデータ行列を介して閾値を決定する方法は、例えばサポートベクターマシン(SVM)数学モデル、ランダムフォレストモデル又はロジスティック回帰モデルを介して当技術分野で公知である。例示的な手法は、ロジスティック回帰モデルである。例えば、示差的メチル化マーカについては、上記学習群の試料に対してロジスティック回帰モデルを構築し、モデルを用いて検出結果の精度、感度及び特異度、並びに予測値特性曲線下面積(ROC)(AUC)を統計的に解析し、試験セットの試料の予測スコアを統計的に解析する。メチル化レベルとCA19-9レベルとを組み合わせた膵癌スコアが特定の閾値を満たす場合、膵癌が同定され、そうでなければ慢性膵炎が同定される。
別の態様では、本出願は、試験される試料中の遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1及び/又はEMX1又はそれらの断片を有するDNA領域の修飾状態の存在及び/又は含有量を決定することを含む、膵腫瘍の存在を決定する、膵腫瘍の発症を評価する、及び/又は膵腫瘍の進行を評価する方法を提供する。例えば、本出願の方法は、試験される試料中の遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1、又はそれらの断片を有するDNA領域の修飾状態の存在及び/又は内容の決定結果に基づいて膵腫瘍が存在するかどうかを決定することを含み得る。例えば、本出願の方法は、試験される試料中の遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1及び/又はEMX1、又はそれらの断片を有するDNA領域の修飾状態の存在及び/又は内容の決定結果に基づいて、膵腫瘍の発症が診断されるかどうかを評価することを含み得る。例えば、本出願の方法は、試験される試料中の遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1及び/又はEMX1、又はそれらの断片を有するDNA領域の修飾状態の存在及び/又は含有量の決定結果に基づいて、膵腫瘍の発症と診断されるリスクがあるかどうか及び/又はリスクのレベルを含み得る。例えば、本出願の方法は、試験される試料中の遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1、又はそれらの断片を有するDNA領域の修飾状態の存在及び/又は内容の決定結果に基づいて膵腫瘍の進行を評価することを含み得る。
別の態様では、本出願は、膵腫瘍関連DNA領域のメチル化状態を評価するための方法を提供し、これは、試験される試料中の遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1、又はそれらの断片でDNA領域の修飾状態の存在及び/又は含有量を決定することを含み得る。例えば、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1及び/又はEMX1、又はそれらの断片を有するDNA領域の修飾状態の存在及び/又は含有量に関する決定結果に基づいて、膵腫瘍関連DNA領域のメチル化状態を評価することを含む。例えば、膵腫瘍関連DNA領域のメチル化状態は、膵腫瘍の発症に関連し得、そのDNA領域における参照レベルと比較したメチル化の確認された存在又は増加した含有量を指し得る。
例えば、本出願のDNA領域は、ヒトchr2:74740686-74744275に由来し、ヒトchr8:25699246-25907950に由来し、ヒトchr12:4918342-4960278に由来し、ヒトchr13:37005635-37017019に由来し、ヒトchr1:63788730-63790797に由来し、ヒトchr1:248020501-248043438に由来し、ヒトchr2:176945511-176984670に由来し、ヒトchr6:137813336-137815531に由来し、ヒトchr7:155167513-155257526に由来し、ヒトchr19:51226605-51228981に由来し、ヒトchr7:19155091-19157295に由来し、及びヒトchr2:73147574-73162020に由来し得る。例えば、本出願の遺伝子は、それらの名称及びそれらの染色体座標によって記載することができる。例えば、染色体座標は、2009年2月に公開されたヒトゲノムデータベースのHg19バージョン(又は「Hg19座標」)と一致し得る。例えば、本出願のDNA領域は、Hg19座標で規定される領域に由来してもよい。
別の態様では、本出願は、膵腫瘍関連DNA領域のメチル化状態を評価するための方法を提供し、これは、試験される試料中の遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1、又はそれらの断片でDNA領域の修飾状態の存在及び/又は含有量を決定することを含み得る。例えば、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1及び/又はEMX1、又はそれらの断片を有するDNA領域の修飾状態の存在及び/又は含有量に関する決定結果に基づいて、膵腫瘍関連DNA領域のメチル化状態を評価することを含む。例えば、膵腫瘍関連DNA領域のメチル化状態は、膵腫瘍の発症に関連し得、そのDNA領域における参照レベルと比較したメチル化の確認された存在又は増加した含有量を指し得る。
例えば、本出願のDNA領域は、ヒトchr2:74740686-74744275に由来し、ヒトchr8:25699246-25907950に由来し、ヒトchr12:4918342-4960278に由来し、ヒトchr13:37005635-37017019に由来し、ヒトchr1:63788730-63790797に由来し、ヒトchr1:248020501-248043438に由来し、ヒトchr2:176945511-176984670に由来し、ヒトchr6:137813336-137815531に由来し、ヒトchr7:155167513-155257526に由来し、ヒトchr19:51226605-51228981に由来し、ヒトchr7:19155091-19157295に由来し、及びヒトchr2:73147574-73162020に由来し得る。例えば、本出願の遺伝子は、それらの名称及びそれらの染色体座標によって記載することができる。例えば、染色体座標は、2009年2月に公開されたヒトゲノムデータベースのHg19バージョン(又は「Hg19座標」)と一致し得る。例えば、本出願のDNA領域は、Hg19座標で規定される領域に由来してもよい。
別の態様では、本出願は、試験される試料中の遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1及び/若しくはEMX1、又はその相補的領域若しくはその断片を有するDNA領域の特定のサブ領域の修飾状態の存在及び/又は含有量を決定することを含む、疾患の存在を決定する、疾患の発症又は発症のリスクを評価する、及び/又は疾患の進行を評価する方法を提供する。
別の態様では、本出願は、試験される試料中の、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、ヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来する、DNA領域又はその相補的領域、又はその断片からなる群から選択されるDNA領域の修飾状態の存在及び/又は含有量を決定することを含み得る、疾患の存在を決定する、疾患の発症若しくは発症のリスクを評価する、及び/又は疾患の進行を評価する方法を提供する。例えば、本出願の方法は、試験される試料中のDNA領域又はその相補的領域又はその断片の修飾状態の存在及び/又は含有量の決定結果に基づいて疾患が存在するかどうかを同定することを含み得る。例えば、本出願の方法は、試験される試料中のDNA領域又はその相補的領域又はその断片の修飾状態の存在及び/又は含有量の決定結果に基づいて、疾患の発症が診断されるか否かを評価することを含み得る。例えば、本出願の方法は、試験される試料中のDNA領域又はその相補的領域又はその断片の修飾状態の存在及び/又は含有量の決定結果に基づいて、疾患と診断されるリスクがあるかどうか及び/又はリスクのレベルを評価することを含み得る。例えば、本出願の方法は、試験される試料中のDNA領域又はその相補的領域又はその断片の修飾状態の存在及び/又は含有量の決定結果に基づいて疾患の進行を評価することを含み得る。
別の態様では、本出願は、試験される試料中の、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、ヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来する、DNA領域又はその相補的領域、又はその断片からなる群から選択されるDNA領域の修飾状態の存在及び/又は含有量を決定することを含み得る、疾患の存在を決定する、疾患の発症若しくは発症のリスクを評価する、及び/又は疾患の進行を評価する方法を提供する。例えば、本出願の方法は、試験される試料中のDNA領域又はその相補的領域又はその断片の修飾状態の存在及び/又は含有量の決定結果に基づいて疾患が存在するかどうかを同定することを含み得る。例えば、本出願の方法は、試験される試料中のDNA領域又はその相補的領域又はその断片の修飾状態の存在及び/又は含有量の決定結果に基づいて、疾患の発症が診断されるか否かを評価することを含み得る。例えば、本出願の方法は、試験される試料中のDNA領域又はその相補的領域又はその断片の修飾状態の存在及び/又は含有量の決定結果に基づいて、疾患と診断されるリスクがあるかどうか及び/又はリスクのレベルを評価することを含み得る。例えば、本出願の方法は、試験される試料中のDNA領域又はその相補的領域又はその断片の修飾状態の存在及び/又は含有量の決定結果に基づいて疾患の進行を評価することを含み得る。
別の態様では、本出願は、試験される試料中の、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来する、DNA領域又はその相補的領域、又はその断片からなる群から選択されるDNA領域の修飾状態の存在及び/又は含有量を決定することを含み得る、DNA領域のメチル化状態を決定する方法を提供する。例えば、そのDNA領域におけるメチル化の参照レベルと比較して確認された存在又は増加した含有量は、疾患の発症に関連し得る。例えば、本出願におけるDNA領域は、ゲノムDNAの特定のセグメントを指し得る。例えば、本出願のDNA領域は、遺伝子名や染色体座標の集合で指定されてもよい。例えば、遺伝子は、その名称を参照することによってその配列及び染色体位置が決定され得るか、又はその染色体座標を参照することによってその配列及び染色体位置が決定され得る。本出願は、これらの特定のDNA領域のメチル化状態を一連の分析指標として使用し、感度及び/又は特異性の有意な改善を提供することができ、スクリーニング方法を単純化することができる。例えば、「感度」は、正確に同定された陽性結果の割合、すなわち議論中の疾患を有すると正確に同定された個体の割合を指すことができ、「特異性」は、正確に同定された陰性結果の割合、すなわち議論中の疾患を有さないと正確に同定された個体の割合を指すことができる。
例えば、変異体は、本明細書に記載のDNA領域に対して少なくとも80%、少なくとも85%、少なくとも90%、95%、98%、又は99%の配列同一性を含み得、変異体は、1つ又は複数の欠失、付加、置換、逆位配列等を含み得る。例えば、本出願における変異体の修飾状態は、同じ評価結果を達成することができる。本出願のDNA領域は、あらゆる形態の任意の他の突然変異、多型変異又は対立遺伝子変異を含み得る。
例えば、本出願の方法は、配列番号164、168、172、176、180、184、188、192、196、200、204、208、212、216、220、224、228及び232からなる群から選択されるDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる核酸を提供することを含み得る。
別の態様では、本出願は、疾患の存在を決定する、疾患の発症又は発症のリスクを評価する、及び/又は疾患の進行を評価する方法を提供し、この方法は、試験される試料中の、ヒトchr2:74743042-74743113に由来する、及びヒトchr2:74743157-74743253に由来する、ヒトchr2:74743042-74743113に由来する、及びヒトchr2:74743157-74743253に由来する、ヒトchr8:25907865-25907930に由来する、及びヒトchr8:25907698-25907814に由来する、ヒトchr12:4919188-4919272に由来する、ヒトchr12:4919036-4919164に由来する、及びヒトchr12:4919341-4919438に由来する、ヒトchr13:37005652-37005721に由来する、ヒトchr13:37005458-37005596に由来する、及びヒトchr13:37005694-37005824に由来する、ヒトchr1:63788850-63788913に由来する、ヒトchr1:248020635-248020731に由来する、ヒトchr2:176945521-176945603に由来する、ヒトchr6:137814750-137814815に由来する、ヒトchr7:155167531-155167610に由来する、ヒトchr19:51228620-51228722に由来する、及びヒトchr7:19156779-19157914に由来する、及びヒトchr2:73147571-73147626に由来する、DNA領域、又はその相補的領域又はその断片からなる群から選択DNA領域の修飾状態の存在及び/又は内容を決定することを含み得る。
例えば、上記の領域の1つ又は複数は、増幅領域及び/又は検出領域として機能することができる。
例えば、本出願の方法は、配列番号165、169、173、177、181、185、189、193、197、201、205、209、213、217、221、225、229、及び233からなる群から選択される核酸、又はその相補的核酸、又はその断片を提供することを含み得る。例えば、核酸は、標的領域を検出するために使用され得る。例えば、核酸をプローブとして用いてもよい。
例えば、本出願の方法は、配列番号164、168、172、176、180、184、188、192、196、200、204、208、212、216、220、224、228及び232からなる群から選択されるDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる核酸を提供することを含み得る。
別の態様では、本出願は、疾患の存在を決定する、疾患の発症又は発症のリスクを評価する、及び/又は疾患の進行を評価する方法を提供し、この方法は、試験される試料中の、ヒトchr2:74743042-74743113に由来する、及びヒトchr2:74743157-74743253に由来する、ヒトchr2:74743042-74743113に由来する、及びヒトchr2:74743157-74743253に由来する、ヒトchr8:25907865-25907930に由来する、及びヒトchr8:25907698-25907814に由来する、ヒトchr12:4919188-4919272に由来する、ヒトchr12:4919036-4919164に由来する、及びヒトchr12:4919341-4919438に由来する、ヒトchr13:37005652-37005721に由来する、ヒトchr13:37005458-37005596に由来する、及びヒトchr13:37005694-37005824に由来する、ヒトchr1:63788850-63788913に由来する、ヒトchr1:248020635-248020731に由来する、ヒトchr2:176945521-176945603に由来する、ヒトchr6:137814750-137814815に由来する、ヒトchr7:155167531-155167610に由来する、ヒトchr19:51228620-51228722に由来する、及びヒトchr7:19156779-19157914に由来する、及びヒトchr2:73147571-73147626に由来する、DNA領域、又はその相補的領域又はその断片からなる群から選択DNA領域の修飾状態の存在及び/又は内容を決定することを含み得る。
例えば、上記の領域の1つ又は複数は、増幅領域及び/又は検出領域として機能することができる。
例えば、本出願の方法は、配列番号165、169、173、177、181、185、189、193、197、201、205、209、213、217、221、225、229、及び233からなる群から選択される核酸、又はその相補的核酸、又はその断片を提供することを含み得る。例えば、核酸は、標的領域を検出するために使用され得る。例えば、核酸をプローブとして用いてもよい。
例えば、本出願の方法は、配列番号166及び167、170及び171、174及び175、178及び179、182及び183、186及び187、190及び191、194及び195、198及び199、202及び203、206及び207、210及び211、214及び215、218及び219、222及び223、226及び227、230及び231、並びに234及び235からなる群から選択される核酸の組合せ、又はそれらの相補的核酸の組合せ、又はそれらの断片を提供することを含む。例えば、核酸の組合せは、標的領域を増幅するために使用され得る。例えば、核酸の組合せは、プライマーの組合せとして機能し得る。
例えば、疾患は腫瘍を包含し得る。例えば、疾患は固形腫瘍を包含し得る。例えば、疾患は、膵腫瘍等の任意の腫瘍を包含し得る。例えば、場合により、本出願の疾患は、膵癌を包含し得る。例えば、場合により、本出願の疾患は、膵管腺癌を包含し得る。例えば、場合により、本出願の膵腫瘍は、膵管腺癌を包含し得る。
例えば、本出願における「相補的」及び「実質的に相補的」は、ヌクレオチド又は核酸間、例えば二本鎖DNA分子の2本の鎖間、又はオリゴヌクレオチドプライマーと一本鎖核酸上のプライマー結合部位との間のハイブリダイゼーション又は塩基対形成又は二本鎖の形成を包含し得る。相補的なヌクレオチドは、典型的には、A及びT(又はA及びU)又はC及びGであり得る。2つの一本鎖RNA又はDNA分子について、一方の鎖のヌクレオチドが、最適に整列され、比較され、適切なヌクレオチド挿入又は欠失を有する場合、他方の鎖のヌクレオチドの少なくとも約80%(通常、少なくとも約90%~約95%、又はさらに約98%~約100%)と対になる場合、それらは実質的に相補的であるとみなすことができる。一態様では、2つの相補的ヌクレオチド配列は、25%未満のミスマッチ、より好ましくは15%未満のミスマッチ、及び5%未満のミスマッチで、又は逆ヌクレオチド間のミスマッチなしでハイブリダイズすることができる。例えば、2つの分子は、高度にストリンジェントな条件下でハイブリダイズすることができる。
例えば、本出願における修飾状態は、DNA領域内の特定のヌクレオチド又は複数のヌクレオチドにおける修飾状態の有無及び/又は含有量を指し得る。例えば、本出願における修飾状態は、特定のDNA配列中の各塩基又は各特定の塩基(例えば、シトシン)の修飾状態を指し得る。例えば、本出願における修飾状態は、特定のDNA配列における塩基対の組合せ及び/又は塩基の組合せの修飾状態を指し得る。例えば、本出願における修飾状態は、特定のDNA配列(遺伝子が位置するDNA領域又はその特定の領域断片を包含する)における領域修飾の密度に関する情報を指すことができるが、配列において修飾がどこで起こるかに関する正確な位置情報を提供しない場合がある。
例えば、本出願の修飾状態は、メチル化状態又はメチル化に類似する状況であり得る。例えば、メチル化されている、又は高度にメチル化されている状態は、特定の領域の転写サイレンシングに関連し得る。例えば、メチル化されている、又は高度にメチル化されている状態は、メチル化特異的変換試薬(例えば、脱アミノ化試薬及び/又はメチル化感受性制限酵素)によって変換され得ることに関連し得る。例えば、変換は、他の物質に変換されること、及び/又は切断若しくは消化されることを指し得る。
例えば、この方法は、試験される試料中の核酸を得ることをさらに含み得る。例えば、核酸は無細胞核酸を包含し得る。例えば、試験される試料は、組織、細胞及び/又は体液を包含し得る。例えば、試験される試料は血漿を包含し得る。例えば、本出願の検出方法は、任意の適切な生物学的試料に対して実施することができる。例えば、試験される試料は、動物に由来し得る等、生物学的材料の任意の試料であり得るが、細胞材料、生物学的流体(血液等)、排出物、組織生検標本、外科標本、又は動物の体内に導入され、その後除去された流体に限定されない。例えば、本出願において試験される試料は、試料が単離された後に任意の形態で処理された試料を包含し得る。
例えば、方法は、DNA領域又はその断片を変換することをさらに含み得る。例えば、本出願の変換工程により、修飾された塩基と修飾されていない塩基は、変換後に異なる物質を形成することができる。例えば、修飾状態を有する塩基は、変換後に実質的に変化せず、修飾状態を有さない塩基は、変換後の塩基とは異なる他の塩基(例えば、他の塩基は、ウラシルを包含し得る。)に変化するか、又は変換後に切断される。例えば、塩基はシトシンを包含し得る。例えば、修飾は、メチル化修飾を包含し得る。例えば、変換は、脱アミノ化試薬及び/又はメチル化感受性制限酵素による変換を含み得る。例えば、脱アミノ化試薬は、バイサルファイト又はその類似体を包含し得る。例えば、重亜硫酸ナトリウム又は重亜硫酸カリウムである。
例えば、疾患は腫瘍を包含し得る。例えば、疾患は固形腫瘍を包含し得る。例えば、疾患は、膵腫瘍等の任意の腫瘍を包含し得る。例えば、場合により、本出願の疾患は、膵癌を包含し得る。例えば、場合により、本出願の疾患は、膵管腺癌を包含し得る。例えば、場合により、本出願の膵腫瘍は、膵管腺癌を包含し得る。
例えば、本出願における「相補的」及び「実質的に相補的」は、ヌクレオチド又は核酸間、例えば二本鎖DNA分子の2本の鎖間、又はオリゴヌクレオチドプライマーと一本鎖核酸上のプライマー結合部位との間のハイブリダイゼーション又は塩基対形成又は二本鎖の形成を包含し得る。相補的なヌクレオチドは、典型的には、A及びT(又はA及びU)又はC及びGであり得る。2つの一本鎖RNA又はDNA分子について、一方の鎖のヌクレオチドが、最適に整列され、比較され、適切なヌクレオチド挿入又は欠失を有する場合、他方の鎖のヌクレオチドの少なくとも約80%(通常、少なくとも約90%~約95%、又はさらに約98%~約100%)と対になる場合、それらは実質的に相補的であるとみなすことができる。一態様では、2つの相補的ヌクレオチド配列は、25%未満のミスマッチ、より好ましくは15%未満のミスマッチ、及び5%未満のミスマッチで、又は逆ヌクレオチド間のミスマッチなしでハイブリダイズすることができる。例えば、2つの分子は、高度にストリンジェントな条件下でハイブリダイズすることができる。
例えば、本出願における修飾状態は、DNA領域内の特定のヌクレオチド又は複数のヌクレオチドにおける修飾状態の有無及び/又は含有量を指し得る。例えば、本出願における修飾状態は、特定のDNA配列中の各塩基又は各特定の塩基(例えば、シトシン)の修飾状態を指し得る。例えば、本出願における修飾状態は、特定のDNA配列における塩基対の組合せ及び/又は塩基の組合せの修飾状態を指し得る。例えば、本出願における修飾状態は、特定のDNA配列(遺伝子が位置するDNA領域又はその特定の領域断片を包含する)における領域修飾の密度に関する情報を指すことができるが、配列において修飾がどこで起こるかに関する正確な位置情報を提供しない場合がある。
例えば、本出願の修飾状態は、メチル化状態又はメチル化に類似する状況であり得る。例えば、メチル化されている、又は高度にメチル化されている状態は、特定の領域の転写サイレンシングに関連し得る。例えば、メチル化されている、又は高度にメチル化されている状態は、メチル化特異的変換試薬(例えば、脱アミノ化試薬及び/又はメチル化感受性制限酵素)によって変換され得ることに関連し得る。例えば、変換は、他の物質に変換されること、及び/又は切断若しくは消化されることを指し得る。
例えば、この方法は、試験される試料中の核酸を得ることをさらに含み得る。例えば、核酸は無細胞核酸を包含し得る。例えば、試験される試料は、組織、細胞及び/又は体液を包含し得る。例えば、試験される試料は血漿を包含し得る。例えば、本出願の検出方法は、任意の適切な生物学的試料に対して実施することができる。例えば、試験される試料は、動物に由来し得る等、生物学的材料の任意の試料であり得るが、細胞材料、生物学的流体(血液等)、排出物、組織生検標本、外科標本、又は動物の体内に導入され、その後除去された流体に限定されない。例えば、本出願において試験される試料は、試料が単離された後に任意の形態で処理された試料を包含し得る。
例えば、方法は、DNA領域又はその断片を変換することをさらに含み得る。例えば、本出願の変換工程により、修飾された塩基と修飾されていない塩基は、変換後に異なる物質を形成することができる。例えば、修飾状態を有する塩基は、変換後に実質的に変化せず、修飾状態を有さない塩基は、変換後の塩基とは異なる他の塩基(例えば、他の塩基は、ウラシルを包含し得る。)に変化するか、又は変換後に切断される。例えば、塩基はシトシンを包含し得る。例えば、修飾は、メチル化修飾を包含し得る。例えば、変換は、脱アミノ化試薬及び/又はメチル化感受性制限酵素による変換を含み得る。例えば、脱アミノ化試薬は、バイサルファイト又はその類似体を包含し得る。例えば、重亜硫酸ナトリウム又は重亜硫酸カリウムである。
例えば、方法は、DNA領域又はその断片の修飾状態の存在及び/又は含有量を決定する前に、試験される試料中のDNA領域又はその断片を増幅することをさらに含み得る。例えば、増幅はPCR増幅を包含し得る。例えば、本出願における増幅は、任意の公知の増幅系を包含し得る。例えば、本出願における増幅工程は任意であり得る。例えば、「増幅」は、所望の配列の複数のコピーを生成する方法を指し得る。「複数のコピー」は、少なくとも2つのコピーを指し得る。「コピー」は、鋳型配列に対する完全な配列相補性又は同一性を意味しない場合がある。例えば、コピーは、デオキシイノシン等のヌクレオチド類似体、意図的な配列変更(ハイブリダイズ可能であるが鋳型に相補的ではない配列を包含するプライマーによって導入されたもの等)、及び/又は増幅配列エラー中に起こり得る。
例えば、修飾状態の存在及び/又は含有量を決定するための方法は、変換後の修飾状態を有する塩基によって形成された物質の存在及び/又は含有量を決定することを含み得る。例えば、修飾状態の存在及び/又は含有量を決定する方法は、修飾状態を有するDNA領域又はその断片の存在及び/又は含有量を決定することを含み得る。例えば、修飾状態を有するDNA領域又はその断片の存在及び/又は含有量を直接検出することができる。例えば、修飾状態を有するDNA領域又はその断片は、反応中に修飾状態を有さないDNA領域又はその断片とは異なる特徴を有し得る(例えば、増幅反応)という様式で検出され得る。例えば、蛍光PCR法では、修飾状態のDNA領域又はその断片を特異的に増幅して蛍光を発することができ、修飾状態を有さないDNA領域又はその断片は、実質的に増幅されず、基本的に蛍光を発しない。例えば、修飾状態を有する塩基の変換時に形成される種の存在及び/又は含有量を決定する代替方法は、本出願の範囲内に包含され得る。
例えば、修飾状態を有するDNA領域又はその断片の存在及び/又は含有量は、蛍光PCR法によって検出される蛍光Ct値によって決定される。例えば、膵腫瘍の存在、又は膵腫瘍の発症若しくは発症のリスクは、DNA領域若しくはその断片の修飾状態の存在及び/又はDNA領域若しくはその断片の修飾状態の含有量が参照レベルに対してより高いことを決定することによって決定される。例えば、試験される試料の蛍光Ct値が参照蛍光Ct値よりも低い場合、DNA領域又はその断片の修飾状態の存在を決定することができ、及び/又はDNA領域又はその断片の修飾状態の含有量が参照試料中の修飾状態の含有量よりも高いと決定することができる。例えば、参照試料を検出することにより、参照蛍光Ct値を求めることができる。例えば、試験される試料の蛍光Ct値が参照蛍光Ct値よりも高いか又は実質的に同等である場合、DNA領域又はその断片の修飾状態の存在は除外され得ず、試験される試料の蛍光Ct値が、参照蛍光Ct値よりも高いか又は実質的に同等である場合、DNA領域又はその断片の修飾状態の含有量が、参照試料中の修飾状態の含有量よりも低いか又は実質的に同等であることを確認することができる。
例えば、本出願は、例えば、試験される試料のメチル化レベル及び参照レベルを包含するサイクル閾値(すなわち、Ct値)を介して、特定のDNA領域又はその断片の修飾状態の存在及び/又は内容を表すことができる。例えば、Ct値は、PCR産物の蛍光がバックグラウンドシグナルを超えて検出され得るサイクル数を指し得る。例えば、Ct値と試料中の標的マーカの出発含有量との間に負の相関、すなわち、Ct値が低いほど、試験される試料中のDNA領域又はその断片の修飾状態の含有量が大きくなり得る。
例えば、試験される試料のCt値がその対応する基準Ct値と同じ又はそれより低い場合、それは、特定の疾患の存在として確認され得るか、特定の疾患の発症若しくは発症のリスクとして診断され得るか、又は特定の疾患の特定の進行として評価され得る。例えば、試験される試料のCt値が、その対応する基準Ct値よりも少なくとも1サイクル、少なくとも2サイクル、少なくとも5サイクル、少なくとも10サイクル、少なくとも20サイクル又は少なくとも50サイクル低い場合、それは、特定の疾患の存在として確認され得るか、特定の疾患の発症若しくは発症のリスクとして診断され得るか、又は特定の疾患の特定の進行として評価され得る。
例えば、修飾状態の存在及び/又は含有量を決定するための方法は、変換後の修飾状態を有する塩基によって形成された物質の存在及び/又は含有量を決定することを含み得る。例えば、修飾状態の存在及び/又は含有量を決定する方法は、修飾状態を有するDNA領域又はその断片の存在及び/又は含有量を決定することを含み得る。例えば、修飾状態を有するDNA領域又はその断片の存在及び/又は含有量を直接検出することができる。例えば、修飾状態を有するDNA領域又はその断片は、反応中に修飾状態を有さないDNA領域又はその断片とは異なる特徴を有し得る(例えば、増幅反応)という様式で検出され得る。例えば、蛍光PCR法では、修飾状態のDNA領域又はその断片を特異的に増幅して蛍光を発することができ、修飾状態を有さないDNA領域又はその断片は、実質的に増幅されず、基本的に蛍光を発しない。例えば、修飾状態を有する塩基の変換時に形成される種の存在及び/又は含有量を決定する代替方法は、本出願の範囲内に包含され得る。
例えば、修飾状態を有するDNA領域又はその断片の存在及び/又は含有量は、蛍光PCR法によって検出される蛍光Ct値によって決定される。例えば、膵腫瘍の存在、又は膵腫瘍の発症若しくは発症のリスクは、DNA領域若しくはその断片の修飾状態の存在及び/又はDNA領域若しくはその断片の修飾状態の含有量が参照レベルに対してより高いことを決定することによって決定される。例えば、試験される試料の蛍光Ct値が参照蛍光Ct値よりも低い場合、DNA領域又はその断片の修飾状態の存在を決定することができ、及び/又はDNA領域又はその断片の修飾状態の含有量が参照試料中の修飾状態の含有量よりも高いと決定することができる。例えば、参照試料を検出することにより、参照蛍光Ct値を求めることができる。例えば、試験される試料の蛍光Ct値が参照蛍光Ct値よりも高いか又は実質的に同等である場合、DNA領域又はその断片の修飾状態の存在は除外され得ず、試験される試料の蛍光Ct値が、参照蛍光Ct値よりも高いか又は実質的に同等である場合、DNA領域又はその断片の修飾状態の含有量が、参照試料中の修飾状態の含有量よりも低いか又は実質的に同等であることを確認することができる。
例えば、本出願は、例えば、試験される試料のメチル化レベル及び参照レベルを包含するサイクル閾値(すなわち、Ct値)を介して、特定のDNA領域又はその断片の修飾状態の存在及び/又は内容を表すことができる。例えば、Ct値は、PCR産物の蛍光がバックグラウンドシグナルを超えて検出され得るサイクル数を指し得る。例えば、Ct値と試料中の標的マーカの出発含有量との間に負の相関、すなわち、Ct値が低いほど、試験される試料中のDNA領域又はその断片の修飾状態の含有量が大きくなり得る。
例えば、試験される試料のCt値がその対応する基準Ct値と同じ又はそれより低い場合、それは、特定の疾患の存在として確認され得るか、特定の疾患の発症若しくは発症のリスクとして診断され得るか、又は特定の疾患の特定の進行として評価され得る。例えば、試験される試料のCt値が、その対応する基準Ct値よりも少なくとも1サイクル、少なくとも2サイクル、少なくとも5サイクル、少なくとも10サイクル、少なくとも20サイクル又は少なくとも50サイクル低い場合、それは、特定の疾患の存在として確認され得るか、特定の疾患の発症若しくは発症のリスクとして診断され得るか、又は特定の疾患の特定の進行として評価され得る。
例えば、対象に由来する細胞試料、組織試料又は試料のCt値が、その対応する参照Ct値と同じ又はそれより高い場合、それは、特定の疾患の非存在として確認され得るか、特定の疾患の発症又は発症のリスクとして診断され得ないか、又は特定の疾患の特定の進行として評価され得ない。例えば、対象に由来する細胞試料、組織試料又は試料のCt値が、その対応する参照Ct値よりも少なくとも1サイクル、少なくとも2サイクル、少なくとも5サイクル、少なくとも10サイクル、少なくとも20サイクル又は少なくとも50サイクル高い場合、それは、特定の疾患の非存在として確認され得るか、特定の疾患の発症又は発症のリスクとして診断され得ないか、又は特定の疾患の特定の進行として評価され得ない。例えば、対象に由来する細胞試料、組織試料又は試料のCt値が、同一又は対応する基準Ct値である場合には、特定の疾患の有無として確認したり、特定の疾患を発症している若しくは発症していないと診断したり、特定の疾患を発症する危険性を有している若しくは有していないと診断したり、特定の疾患が一定程度進行している若しくは有していないと評価したりすることができるとともに、更なる検査の提案を行うことができる。
例えば、本出願における基準レベル又は対照レベルは、正常レベル又は健康レベルを指すことができる。例えば、正常レベルは、疾患を有さない細胞、組織又は個体に由来する試料のDNA領域の修飾レベルであり得る。例えば、腫瘍の評価に使用される場合、正常レベルは、腫瘍を含まない細胞、組織又は個体に由来する試料のDNA領域の修飾レベルであり得る。例えば、膵腫瘍の評価に用いられる場合、正常レベルは、膵腫瘍を有さない細胞、組織又は個体に由来する試料のDNA領域の修飾レベルであり得る。
例えば、本出願における参照レベルは、特定の疾患の有無が対象又は試料において確認される閾値レベルを指し得る。例えば、本出願における基準レベルは、対象が特定の疾患を発症している又は発症するリスクがあると診断される閾値レベルを指し得る。例えば、本出願における基準レベルは、対象が特定の疾患の特定の進行を有すると評価される閾値レベルを指し得る。例えば、細胞試料、組織試料又は対象に由来する試料中のDNA領域の修飾状態が、対応する参照レベル(例えば、ここでの参照レベルは、特定の疾患を有さない患者のDNA領域の修飾状態を指し得る)より高いか又は実質的に等しい場合、それは、特定の疾患の存在として確認され得るか、特定の疾患を発症している若しくは発症するリスクがあると診断され得るか、又は特定の疾患の特定の進行として評価され得る。例えば、本出願においてAとBが「実質的に等しい」とは、AとBとの差が1%以下、0.5%以下、0.1%以下、0.01%以下、0.001%以下、又は0.0001%以下であることを意味し得る。例えば、対象に由来する細胞試料、組織試料又は試料中のDNA領域の修飾状態が、対応する参照レベルよりも少なくとも1%、少なくとも5%、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも1倍、少なくとも2倍、少なくとも5倍、少なくとも10倍又は少なくとも20倍高い場合、それは、特定の疾患の存在として確認され得るか、特定の疾患の発症若しくは発症のリスクとして診断され得るか、又は特定の疾患の特定の進行として評価され得る。例えば、多数回の検出のうちの少なくとも1回、少なくとも2回又は少なくとも3回の検出において、対象に由来する細胞試料、組織試料又は試料中のDNA領域の修飾状態が、対応する参照レベルよりも少なくとも1%、少なくとも5%、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも1回、少なくとも2回、少なくとも5回、少なくとも10回又は少なくとも20回高い場合、それは、特定の疾患の存在として確認され得るか、特定の疾患の発症若しくは発症のリスクとして診断され得るか、又は特定の疾患の特定の進行として評価され得る。
例えば、本出願における基準レベル又は対照レベルは、正常レベル又は健康レベルを指すことができる。例えば、正常レベルは、疾患を有さない細胞、組織又は個体に由来する試料のDNA領域の修飾レベルであり得る。例えば、腫瘍の評価に使用される場合、正常レベルは、腫瘍を含まない細胞、組織又は個体に由来する試料のDNA領域の修飾レベルであり得る。例えば、膵腫瘍の評価に用いられる場合、正常レベルは、膵腫瘍を有さない細胞、組織又は個体に由来する試料のDNA領域の修飾レベルであり得る。
例えば、本出願における参照レベルは、特定の疾患の有無が対象又は試料において確認される閾値レベルを指し得る。例えば、本出願における基準レベルは、対象が特定の疾患を発症している又は発症するリスクがあると診断される閾値レベルを指し得る。例えば、本出願における基準レベルは、対象が特定の疾患の特定の進行を有すると評価される閾値レベルを指し得る。例えば、細胞試料、組織試料又は対象に由来する試料中のDNA領域の修飾状態が、対応する参照レベル(例えば、ここでの参照レベルは、特定の疾患を有さない患者のDNA領域の修飾状態を指し得る)より高いか又は実質的に等しい場合、それは、特定の疾患の存在として確認され得るか、特定の疾患を発症している若しくは発症するリスクがあると診断され得るか、又は特定の疾患の特定の進行として評価され得る。例えば、本出願においてAとBが「実質的に等しい」とは、AとBとの差が1%以下、0.5%以下、0.1%以下、0.01%以下、0.001%以下、又は0.0001%以下であることを意味し得る。例えば、対象に由来する細胞試料、組織試料又は試料中のDNA領域の修飾状態が、対応する参照レベルよりも少なくとも1%、少なくとも5%、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも1倍、少なくとも2倍、少なくとも5倍、少なくとも10倍又は少なくとも20倍高い場合、それは、特定の疾患の存在として確認され得るか、特定の疾患の発症若しくは発症のリスクとして診断され得るか、又は特定の疾患の特定の進行として評価され得る。例えば、多数回の検出のうちの少なくとも1回、少なくとも2回又は少なくとも3回の検出において、対象に由来する細胞試料、組織試料又は試料中のDNA領域の修飾状態が、対応する参照レベルよりも少なくとも1%、少なくとも5%、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも1回、少なくとも2回、少なくとも5回、少なくとも10回又は少なくとも20回高い場合、それは、特定の疾患の存在として確認され得るか、特定の疾患の発症若しくは発症のリスクとして診断され得るか、又は特定の疾患の特定の進行として評価され得る。
例えば、細胞試料、組織試料又は対象に由来する試料中のDNA領域の修飾状態が、対応する参照レベル(例えば、ここでの参照レベルは、特定の疾患を有する患者のDNA領域の修飾状態を指し得る)よりも低いか又は実質的に等しい場合、それは、特定の疾患の非存在として確認され得ないか、特定の疾患を発症している又は発症するリスクがあると診断され得ないか、又は特定の疾患の特定の進行として評価され得ない。例えば、対象に由来する細胞試料、組織試料又は試料中のDNA領域の修飾状態が、対応する参照レベルよりも少なくとも1%、少なくとも5%、少なくとも10%、少なくとも20%、少なくとも50%及び少なくとも100%低い場合、それは、特定の疾患の非存在として確認され得るか、特定の疾患の発症若しくは発症のリスクとして診断され得ないか、又は特定の疾患の特定の進行として評価され得ない。
参照レベルは、所望の感度及び特異性に基づいて当業者によって選択され得る。例えば、本出願における様々な状況における基準レベルは、当業者によって容易に識別可能であり得る。例えば、適切な基準レベル及び/又は基準レベルを取得する適切な手段は、限られた回数の試行に基づいて識別することができる。例えば、参照レベルは、1つ又は複数の参照試料から導出され得、参照レベルは、目的の試料を試験する実験と並行して行われた実験から得られる。あるいは、参照レベルは、1つ又は複数の参照試料又は疾患参照試料からのデータ、標準又はレベルの集合を包含するデータベースで得られてもよい。いくつかの実施形態では、データ、標準又はレベルのセットは、1つ又は複数の試料からのデータと比較することができ、それによって異なる検出条件から生じる誤差を低減するために使用することができるように標準化又は正規化することができる。
例えば、参照レベルは、例えば、1つ又は複数の参照試料及び/又は他の検査室及び臨床データからの標的マーカの修飾レベルを包含する参照データベースであり得るデータベースから導出され得る。例えば、参照データベースは、健康な個体及び/又は対応する疾患に罹患していない個体(すなわち、疾患を有さないことが知られている個体)から得られた参照試料からの参照レベルデータを集約することによって確立することができる。例えば、参照データベースは、治療中の対応する疾患を有する個体から得られた参照試料からの参照レベルデータを集約することによって確立することができる。例えば、参照データベースは、疾患の異なる段階の個体から得られた参照試料からのデータを集約することによって構築することができる。例えば、異なる段階は、本出願の目的のマーカの異なる修飾レベルによって証明され得る。当業者はまた、年齢、性別、病歴、家族歴、症状等の様々な要因に基づいて、個体が対応する疾患に罹患しているか、又は対応する疾患に罹患するリスクがあるかどうかを決定することができる。
例えば、本出願は、サイクル閾値(すなわち、Ct値)を使用して、特定のDNA領域又はその断片における修飾状態の存在及び/又は含有量を表すことができる。決定方法は、遺伝子から選択された各配列のメチル化レベルに基づいてスコアを算出し、スコアが0より大きければ陽性、すなわち試料に対応する結果が悪性小結節であり得る、とすることができ、1つ又は複数の実施形態では、スコアが0未満である場合、結果は陰性であり、すなわち、膵臓試料に対応する結果は良性結節であり得る。例えば、PCR実施形態において、メチル化レベルは、メチル化レベル=2^(-ΔCt試験される試料)/2^(-ΔCt陽性基準)×100%(ただし、ΔCt=Ct標的遺伝子-Ct内部参照遺伝子)として算出することができる。配列決定の実施形態において、メチル化レベルは、以下のように計算することができる:メチル化レベル=メチル化された塩基の数/全塩基の数。
例えば、本出願の方法は、以下の工程:試験される試料中の核酸を得る工程と、DNA領域又はその断片を変換する工程と、変換後の修飾状態を有する塩基によって形成された物質の存在及び/又は含有量を決定する工程と、を含み得る。
例えば、本出願の方法は、以下の工程:試験される試料中の核酸を得る工程と、DNA領域又はその断片を変換する工程と、検出される試料中のDNA領域又はその断片を増幅する工程と、変換後の修飾状態を有する塩基によって形成された物質の存在及び/又は含有量を決定する工程と、を含み得る。
参照レベルは、所望の感度及び特異性に基づいて当業者によって選択され得る。例えば、本出願における様々な状況における基準レベルは、当業者によって容易に識別可能であり得る。例えば、適切な基準レベル及び/又は基準レベルを取得する適切な手段は、限られた回数の試行に基づいて識別することができる。例えば、参照レベルは、1つ又は複数の参照試料から導出され得、参照レベルは、目的の試料を試験する実験と並行して行われた実験から得られる。あるいは、参照レベルは、1つ又は複数の参照試料又は疾患参照試料からのデータ、標準又はレベルの集合を包含するデータベースで得られてもよい。いくつかの実施形態では、データ、標準又はレベルのセットは、1つ又は複数の試料からのデータと比較することができ、それによって異なる検出条件から生じる誤差を低減するために使用することができるように標準化又は正規化することができる。
例えば、参照レベルは、例えば、1つ又は複数の参照試料及び/又は他の検査室及び臨床データからの標的マーカの修飾レベルを包含する参照データベースであり得るデータベースから導出され得る。例えば、参照データベースは、健康な個体及び/又は対応する疾患に罹患していない個体(すなわち、疾患を有さないことが知られている個体)から得られた参照試料からの参照レベルデータを集約することによって確立することができる。例えば、参照データベースは、治療中の対応する疾患を有する個体から得られた参照試料からの参照レベルデータを集約することによって確立することができる。例えば、参照データベースは、疾患の異なる段階の個体から得られた参照試料からのデータを集約することによって構築することができる。例えば、異なる段階は、本出願の目的のマーカの異なる修飾レベルによって証明され得る。当業者はまた、年齢、性別、病歴、家族歴、症状等の様々な要因に基づいて、個体が対応する疾患に罹患しているか、又は対応する疾患に罹患するリスクがあるかどうかを決定することができる。
例えば、本出願は、サイクル閾値(すなわち、Ct値)を使用して、特定のDNA領域又はその断片における修飾状態の存在及び/又は含有量を表すことができる。決定方法は、遺伝子から選択された各配列のメチル化レベルに基づいてスコアを算出し、スコアが0より大きければ陽性、すなわち試料に対応する結果が悪性小結節であり得る、とすることができ、1つ又は複数の実施形態では、スコアが0未満である場合、結果は陰性であり、すなわち、膵臓試料に対応する結果は良性結節であり得る。例えば、PCR実施形態において、メチル化レベルは、メチル化レベル=2^(-ΔCt試験される試料)/2^(-ΔCt陽性基準)×100%(ただし、ΔCt=Ct標的遺伝子-Ct内部参照遺伝子)として算出することができる。配列決定の実施形態において、メチル化レベルは、以下のように計算することができる:メチル化レベル=メチル化された塩基の数/全塩基の数。
例えば、本出願の方法は、以下の工程:試験される試料中の核酸を得る工程と、DNA領域又はその断片を変換する工程と、変換後の修飾状態を有する塩基によって形成された物質の存在及び/又は含有量を決定する工程と、を含み得る。
例えば、本出願の方法は、以下の工程:試験される試料中の核酸を得る工程と、DNA領域又はその断片を変換する工程と、検出される試料中のDNA領域又はその断片を増幅する工程と、変換後の修飾状態を有する塩基によって形成された物質の存在及び/又は含有量を決定する工程と、を含み得る。
例えば、本出願の方法は、以下の工程:試験される試料中の核酸を得る工程と、試験される試料から得られたDNAを、該DNA中の非メチル化部位とメチル化部位とを区別可能な試薬で処理して、処理済みDNAを得る工程と、場合により、試験される試料中のDNA領域又はその断片を増幅する工程と、試験される試料中の処理されたDNAのメチル化状態の存在及び/又は含有量を定量的、半定量的又は定性的に分析する工程と、試験される試料中の処理されたDNAのメチル化レベルを対応する参照レベルと比較する工程と、を含み得る。試験される試料中のDNA領域のメチル化状態が、対応する基準レベル以上である場合、特定疾患の存在を確認すること、特定疾患の発症若しくは発症の危険性と診断すること、又は特定疾患の一定の進行と評価することができる。
別の態様では、本出願は、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域に結合することができる配列、又はその相補的領域、又はその変換領域、又はその断片を含み得る核酸を提供する。例えば、核酸は、本出願の任意のプローブであり得る。別の態様では、本出願は、DNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1でDNA領域に結合することができる核酸、又はその相補的領域、又はその変換領域、又はその断片を設計することを含み得る、核酸を調製する方法を提供する。例えば、核酸を調製する方法は、当技術分野で公知の任意の適切な方法であり得る。
別の態様では、本出願は、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域に結合することができる配列、又はその相補的領域、又はその変換領域、又はその断片を含み得る核酸の組合せを提供する。例えば、核酸の組合せは、本出願の任意のプライマーの組合せであり得る。別の態様では、本出願は、DNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1でDNA領域を増幅することができる核酸の組合せ、又はその相補的領域、又はその変換領域、又はその断片を設計することを含み得る、核酸の組合せを調製する方法を提供する。例えば、核酸の組合せにおいて核酸を調製する方法は、当技術分野で公知の任意の適切な方法であり得る。例えば、標的ポリヌクレオチドのメチル化状態は、標的ポリヌクレオチドとハイブリダイズするように構成された単一のプローブ又はプライマーを使用して評価することができる。例えば、標的ポリヌクレオチドのメチル化状態は、標的ポリヌクレオチドとハイブリダイズするように構成された複数のプローブ又はプライマーを使用して評価することができる。
別の態様では、本出願は、本出願の核酸及び/又は本出願の核酸の組合せを含み得るキットを提供する。例えば、本出願のキットは、場合により、対応する用途のための参照試料を含むか、又は対応する用途のための参照レベルを提供し得る。
別の態様では、本出願のプローブは検出可能な物質も含有し得る。1つ又は複数の実施形態において、検出可能な物質は、5’蛍光レポーター及び3’標識クエンチャーであり得る。1つ又は複数の実施形態において、蛍光レポーター遺伝子は、Cy5、Texas Red、FAM及びVICから選択され得る。
別の態様では、本出願のキットはまた、非メチル化シトシンがグアニンに結合しない塩基に変換される変換陽性標準を含み得る。1つ又は複数の実施形態において、陽性標準は、完全にメチル化され得る。
別の態様では、本出願のキットはまた、PCR緩衝液、ポリメラーゼ、dNTP、制限エンドヌクレアーゼ、酵素消化緩衝液、蛍光色素、蛍光クエンチャー、蛍光レポーター、エキソヌクレアーゼ、アルカリホスファターゼ、内部標準、対照、KCl、MgCl2及び(NH4)2SO4から選択される1つ又は複数の物質を含むことができる。
別の態様では、本出願は、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域に結合することができる配列、又はその相補的領域、又はその変換領域、又はその断片を含み得る核酸を提供する。例えば、核酸は、本出願の任意のプローブであり得る。別の態様では、本出願は、DNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1でDNA領域に結合することができる核酸、又はその相補的領域、又はその変換領域、又はその断片を設計することを含み得る、核酸を調製する方法を提供する。例えば、核酸を調製する方法は、当技術分野で公知の任意の適切な方法であり得る。
別の態様では、本出願は、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域に結合することができる配列、又はその相補的領域、又はその変換領域、又はその断片を含み得る核酸の組合せを提供する。例えば、核酸の組合せは、本出願の任意のプライマーの組合せであり得る。別の態様では、本出願は、DNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1でDNA領域を増幅することができる核酸の組合せ、又はその相補的領域、又はその変換領域、又はその断片を設計することを含み得る、核酸の組合せを調製する方法を提供する。例えば、核酸の組合せにおいて核酸を調製する方法は、当技術分野で公知の任意の適切な方法であり得る。例えば、標的ポリヌクレオチドのメチル化状態は、標的ポリヌクレオチドとハイブリダイズするように構成された単一のプローブ又はプライマーを使用して評価することができる。例えば、標的ポリヌクレオチドのメチル化状態は、標的ポリヌクレオチドとハイブリダイズするように構成された複数のプローブ又はプライマーを使用して評価することができる。
別の態様では、本出願は、本出願の核酸及び/又は本出願の核酸の組合せを含み得るキットを提供する。例えば、本出願のキットは、場合により、対応する用途のための参照試料を含むか、又は対応する用途のための参照レベルを提供し得る。
別の態様では、本出願のプローブは検出可能な物質も含有し得る。1つ又は複数の実施形態において、検出可能な物質は、5’蛍光レポーター及び3’標識クエンチャーであり得る。1つ又は複数の実施形態において、蛍光レポーター遺伝子は、Cy5、Texas Red、FAM及びVICから選択され得る。
別の態様では、本出願のキットはまた、非メチル化シトシンがグアニンに結合しない塩基に変換される変換陽性標準を含み得る。1つ又は複数の実施形態において、陽性標準は、完全にメチル化され得る。
別の態様では、本出願のキットはまた、PCR緩衝液、ポリメラーゼ、dNTP、制限エンドヌクレアーゼ、酵素消化緩衝液、蛍光色素、蛍光クエンチャー、蛍光レポーター、エキソヌクレアーゼ、アルカリホスファターゼ、内部標準、対照、KCl、MgCl2及び(NH4)2SO4から選択される1つ又は複数の物質を含むことができる。
別の態様では、本出願においてDNAメチル化を検出するために使用される試薬は、以下の方法:バイサルファイト変換ベースのPCR(例えば、メチル化特異的PCR)、DNA配列決定(例えば、バイサルファイトシーケンシング、全ゲノムメチル化シーケンシング、単純化メチル化シーケンシング)、メチル化感受性制限エンドヌクレアーゼアッセイ、蛍光定量、メチル化感受性高分解能融解曲線アッセイ、チップベースのメチル化アトラス、及び質量分析(例えば、飛行質量分析)の1つ又は複数で使用される試薬であり得る。例えば、試薬は、バイサルファイト及びその誘導体、蛍光色素、蛍光消光剤、蛍光レポーター、内部標準、及び対照のうちの1つ又は複数から選択され得る。
診断方法、調製用途
別の態様において、本出願は、疾患検出製品の調製における本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットの使用を提供する。
別の態様では、本出願は、本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットを提供することを包含し得る疾患検出方法を提供する。
別の態様では、本出願は、疾患検出に使用するための本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットを提供する。
別の態様では、本出願は、疾患の存在を決定し、疾患の発症若しくは発症のリスクを評価し、及び/又は疾患の進行を評価するための、物質の調製における本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットの使用を提供する。
別の態様では、本出願は、疾患の存在を決定する、疾患の発症若しくは発症のリスクを評価する、及び/又は疾患の進行を評価する方法を提供し、これは、本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットを提供することを含み得る。
別の態様では、本出願は、疾患の存在を決定し、疾患の発症若しくは発症のリスクを評価し、及び/又は疾患の進行を評価するために使用され得る、本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットを提供する。
別の態様では、本出願は、DNA領域又はその断片の修飾状態を決定することができる物質の調製における、本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットの使用を提供する。
別の態様では、本出願は、本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットを提供することを含み得る、DNA領域又はその断片の修飾状態を決定する方法を提供する。
別の態様では、本出願は、DNA領域又はその断片の修飾状態を決定するために使用され得る、本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットを提供する。
別の態様では、本出願は、DNA領域の修飾状態を決定するための核酸、核酸の組合せ及び/又はキットの、膵腫瘍の存在を決定するための、膵腫瘍の発症若しくは発症のリスクを評価するための、及び/又は膵腫瘍の進行を評価するための、物質の調製における、使用であって、決定のためのDNA領域が、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1及び/又はEMX1を有するDNA領域、又はそれらの断片を包含する、使用を提供する。
別の態様では、本出願は、膵腫瘍の存在を決定し、膵腫瘍の発症又は発症のリスクを評価し、及び/又は膵腫瘍の進行を評価する方法であって、核酸、核酸の組合せ及び/又はDNA領域の修飾状態を決定するためのキットを提供することを含み得、決定のためのDNA領域は、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域、又はそれらの断片を包含する。
別の態様では、本出願は、膵腫瘍の存在を決定するための、膵腫瘍の発症又は発症のリスクを評価するための、及び/又は膵腫瘍の進行を評価するために使用され得るDNA領域の修飾状態を決定するための核酸、核酸の組合せ及び/又はキットを提供し、ここで、決定のためのDNA領域は、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1及び/又はEMX1を有するDNA領域、又はそれらの断片を包含する。
診断方法、調製用途
別の態様において、本出願は、疾患検出製品の調製における本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットの使用を提供する。
別の態様では、本出願は、本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットを提供することを包含し得る疾患検出方法を提供する。
別の態様では、本出願は、疾患検出に使用するための本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットを提供する。
別の態様では、本出願は、疾患の存在を決定し、疾患の発症若しくは発症のリスクを評価し、及び/又は疾患の進行を評価するための、物質の調製における本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットの使用を提供する。
別の態様では、本出願は、疾患の存在を決定する、疾患の発症若しくは発症のリスクを評価する、及び/又は疾患の進行を評価する方法を提供し、これは、本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットを提供することを含み得る。
別の態様では、本出願は、疾患の存在を決定し、疾患の発症若しくは発症のリスクを評価し、及び/又は疾患の進行を評価するために使用され得る、本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットを提供する。
別の態様では、本出願は、DNA領域又はその断片の修飾状態を決定することができる物質の調製における、本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットの使用を提供する。
別の態様では、本出願は、本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットを提供することを含み得る、DNA領域又はその断片の修飾状態を決定する方法を提供する。
別の態様では、本出願は、DNA領域又はその断片の修飾状態を決定するために使用され得る、本出願の核酸、本出願の核酸の組合せ及び/又は本出願のキットを提供する。
別の態様では、本出願は、DNA領域の修飾状態を決定するための核酸、核酸の組合せ及び/又はキットの、膵腫瘍の存在を決定するための、膵腫瘍の発症若しくは発症のリスクを評価するための、及び/又は膵腫瘍の進行を評価するための、物質の調製における、使用であって、決定のためのDNA領域が、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1及び/又はEMX1を有するDNA領域、又はそれらの断片を包含する、使用を提供する。
別の態様では、本出願は、膵腫瘍の存在を決定し、膵腫瘍の発症又は発症のリスクを評価し、及び/又は膵腫瘍の進行を評価する方法であって、核酸、核酸の組合せ及び/又はDNA領域の修飾状態を決定するためのキットを提供することを含み得、決定のためのDNA領域は、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域、又はそれらの断片を包含する。
別の態様では、本出願は、膵腫瘍の存在を決定するための、膵腫瘍の発症又は発症のリスクを評価するための、及び/又は膵腫瘍の進行を評価するために使用され得るDNA領域の修飾状態を決定するための核酸、核酸の組合せ及び/又はキットを提供し、ここで、決定のためのDNA領域は、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1及び/又はEMX1を有するDNA領域、又はそれらの断片を包含する。
別の態様では、本出願は、試験される試料中の、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来する、DNA領域又はその相補的領域、又はその断片からなる群から選択されるDNA領域の修飾状態の存在及び/又は含有量を決定することを包含し得る、疾患の存在を決定する、疾患の発症若しくは発症のリスクを評価する、及び/又は疾患の進行を評価する方法を提供する。
別の態様では、本出願は、膵腫瘍の存在を決定し、膵腫瘍の発症又は発症のリスクを評価し、及び/又は膵腫瘍の進行を評価する方法を提供し、これは、核酸、核酸の組合せ及び/又はDNA領域の修飾状態を決定するためのキットを提供することを含み得、DNA領域は、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来するDNA領域又はその相補的領域又はその断片からなる群から選択されるDNA領域を包含し得る。
別の態様において、本出願は、膵腫瘍の存在を決定するための、膵腫瘍の発症又は発症のリスクを評価するための、及び/又は膵腫瘍の進行を評価するために使用され得るDNA領域の修飾状態を決定するための核酸、核酸の組合せ及び/又はキットを提供し、ここで、DNA領域は、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来するDNA領域、又はその相補的領域、又はその断片からなる群から選択されるDNA領域を包含し得る。
別の態様では、本出願は、膵腫瘍の存在を決定し、膵腫瘍の発症又は発症のリスクを評価し、及び/又は膵腫瘍の進行を評価する方法を提供し、これは、核酸、核酸の組合せ及び/又はDNA領域の修飾状態を決定するためのキットを提供することを含み得、DNA領域は、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来するDNA領域又はその相補的領域又はその断片からなる群から選択されるDNA領域を包含し得る。
別の態様において、本出願は、膵腫瘍の存在を決定するための、膵腫瘍の発症又は発症のリスクを評価するための、及び/又は膵腫瘍の進行を評価するために使用され得るDNA領域の修飾状態を決定するための核酸、核酸の組合せ及び/又はキットを提供し、ここで、DNA領域は、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来するDNA領域、又はその相補的領域、又はその断片からなる群から選択されるDNA領域を包含し得る。
別の態様では、本出願は、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域の核酸、又はその変換領域、又はその断片、及び上述の核酸の組合せを提供する。
別の態様では、本出願は、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域の核酸、又はその変換された領域、又はその断片、及び上記の核酸の組合せの、膵腫瘍の存在を決定するための、膵腫瘍の発症若しくは発症のリスクを評価するための、及び/又は膵腫瘍の進行を評価するための、物質の調製における、使用を提供する。
別の態様では、本出願は、膵腫瘍の存在を決定し、膵腫瘍の発症又は発症のリスクを評価し、及び/又は膵腫瘍の進行を評価する方法であって、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1、又はそれらの変換領域、又はそれらの断片、及び上述の核酸の組合せを有するDNA領域の核酸を提供することを含む方法を提供する。
別の態様では、本出願は、膵腫瘍の存在を決定し、膵腫瘍の発症又は発症のリスクを評価し、及び/又は膵腫瘍の進行を評価するために使用され得る、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域、又はその変換領域、又はその断片、及び上記の核酸の組合せの核酸を提供する。
別の態様では、本出願は、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来するDNA領域、又はその相補的領域、又はその変換領域、又はその断片、及び上記の核酸の組合せからなる群から選択されるDNA領域の核酸を提供する。
別の態様において、本出願は、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来するDNA領域、若しくはその相補的領域、若しくはその断片、及び上記の核酸の組合せからなる群から選択されるDNA領域の核酸の、疾患の発症若しくは危険性を決定し、及び/又は疾患の進行を評価するための、物質の調製における、使用を提供する。
別の態様では、本出願は、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域の核酸、又はその変換された領域、又はその断片、及び上記の核酸の組合せの、膵腫瘍の存在を決定するための、膵腫瘍の発症若しくは発症のリスクを評価するための、及び/又は膵腫瘍の進行を評価するための、物質の調製における、使用を提供する。
別の態様では、本出願は、膵腫瘍の存在を決定し、膵腫瘍の発症又は発症のリスクを評価し、及び/又は膵腫瘍の進行を評価する方法であって、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1、又はそれらの変換領域、又はそれらの断片、及び上述の核酸の組合せを有するDNA領域の核酸を提供することを含む方法を提供する。
別の態様では、本出願は、膵腫瘍の存在を決定し、膵腫瘍の発症又は発症のリスクを評価し、及び/又は膵腫瘍の進行を評価するために使用され得る、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域、又はその変換領域、又はその断片、及び上記の核酸の組合せの核酸を提供する。
別の態様では、本出願は、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来するDNA領域、又はその相補的領域、又はその変換領域、又はその断片、及び上記の核酸の組合せからなる群から選択されるDNA領域の核酸を提供する。
別の態様において、本出願は、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来するDNA領域、若しくはその相補的領域、若しくはその断片、及び上記の核酸の組合せからなる群から選択されるDNA領域の核酸の、疾患の発症若しくは危険性を決定し、及び/又は疾患の進行を評価するための、物質の調製における、使用を提供する。
別の態様では、本出願は、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来するDNA領域、その相補的領域、又はその変換領域、又はその断片、並びに上記の核酸の組合せからなる群から選択されるDNA領域の核酸を提供することを含む、疾患の存在を決定する、疾患の発症又は発症のリスクを評価する、及び/又は疾患の進行を評価する方法を提供する。
別の態様では、本出願は、患の存在の決定、疾患の発症又は発症のリスクの評価、及び/又は疾患の進行の評価に使用され得る、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来するDNA領域、又はその相補的領域、又はその変換領域、又はその断片、ならび上記の核酸の組合せからなる群から選択されるDNA領域の核酸を提供する。
別の態様では、本出願は、患の存在の決定、疾患の発症又は発症のリスクの評価、及び/又は疾患の進行の評価に使用され得る、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来するDNA領域、又はその相補的領域、又はその変換領域、又はその断片、ならび上記の核酸の組合せからなる群から選択されるDNA領域の核酸を提供する。
例えば、本出願における決定に使用されるDNA領域は、EBF2及びCCNA1を有するDNA領域又はその断片からなる群から選択される2つの遺伝子を含む。例えば、それは、試験される試料中のヒトchr8:25907849-25907950由来及びヒトchr13:37005635-37005754由来のDNA領域、又はその相補的領域、又はその断片からなる群から選択される2つのDNA領域の修飾状態の存在及び/又は含有量を決定することを含む。
例えば、本出願の方法において、標的遺伝子は、KCNA6、TLX2及びEMX1からなる群から選択される2つの遺伝子を包含し得る。例えば、本出願の方法において、標的遺伝子は、KCNA6及びTLX2を包含し得る。
例えば、本出願の方法において、標的遺伝子は、KCNA6及びEMX1を包含し得る。例えば、本出願の方法において、標的遺伝子は、TLX2及びEMX1を包含し得る。例えば、本出願の方法において、標的遺伝子は、KCNA6、TLX2及びEMX1からなる群から選択される3つの遺伝子を包含し得る。例えば、本出願の方法において、標的遺伝子は、KCNA6、TLX2及びEMX1を包含し得る。例えば、それは、試験される試料中のヒトchr12:4919142-4919289に由来する、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:73147525-73147644に由来するDNA領域、又はその相補的領域、又はそれらの断片からなる群から選択される2つ以上のDNA領域の修飾状態の存在及び/又は含有量を決定することを含む。
例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、FOXD3及びEN2からなる群から選択される2つの遺伝子を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58及びTWIST1を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58及びFOXD3を包含し得る。例えば、本出願の方法において、標的遺伝子は、TRIM58及びEN2を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1及びFOXD3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1及びEN2を包含し得る。例えば、本出願の方法では、標的遺伝子はFOXD3及びEN2を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、FOXD3及びEN2からなる群から選択される3つの遺伝子を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1及びFOXD3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1及びEN2を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、FOXD3及びEN2を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1、FOXD3及びEN2を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、FOXD3及びEN2からなる群から選択される4つの遺伝子を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、FOXD3及びEN2を包含し得る。例えば、それは、試験される試料中のヒトchr1:248020592-248020779に由来するDNA領域、ヒトchr7:19156739-19157277に由来するDNA領域、ヒトchr1:63788812-63788952に由来するDNA領域、及びヒトchr7:155167513-155167628に由来するDNA領域、又はそれらの相補的領域、又はそれらの断片からなる群から選択される2つ以上のDNA領域の修飾状態の存在及び/又は含有量を決定することを含む。
例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される2つの遺伝子を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58及びTWIST1を包含し得る。例えば、本出願の方法において、標的遺伝子は、TRIM58及びCLEC11Aを包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58及びHOXD10を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1及びCLEC11Aを包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1及びHOXD10を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、CLEC11A及びHOXD10を包含し得る。例えば、本出願の方法では、標的遺伝子は、CLEC11A及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、HOXD10及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される3つの遺伝子を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1及びCLEC11Aを包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1及びHOXD10を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、CLEC11A及びHOXD10を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、CLEC11A及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、HOXD10及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1、CLEC11A及びHOXD10を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1、CLEC11A及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1、HOXD10及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、CLEC11A、HOXD10及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される4つの遺伝子を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、CLEC11A及びHOXD10を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、CLEC11A及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、HOXD10及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、CLEC11A、HOXD10及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1、CLEC11A、HOXD10及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される5つの遺伝子を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、CLEC11A、HOXD10及びOLIG3を包含し得る。
例えば、本出願の方法において、標的遺伝子は、KCNA6、TLX2及びEMX1からなる群から選択される2つの遺伝子を包含し得る。例えば、本出願の方法において、標的遺伝子は、KCNA6及びTLX2を包含し得る。
例えば、本出願の方法において、標的遺伝子は、KCNA6及びEMX1を包含し得る。例えば、本出願の方法において、標的遺伝子は、TLX2及びEMX1を包含し得る。例えば、本出願の方法において、標的遺伝子は、KCNA6、TLX2及びEMX1からなる群から選択される3つの遺伝子を包含し得る。例えば、本出願の方法において、標的遺伝子は、KCNA6、TLX2及びEMX1を包含し得る。例えば、それは、試験される試料中のヒトchr12:4919142-4919289に由来する、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:73147525-73147644に由来するDNA領域、又はその相補的領域、又はそれらの断片からなる群から選択される2つ以上のDNA領域の修飾状態の存在及び/又は含有量を決定することを含む。
例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、FOXD3及びEN2からなる群から選択される2つの遺伝子を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58及びTWIST1を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58及びFOXD3を包含し得る。例えば、本出願の方法において、標的遺伝子は、TRIM58及びEN2を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1及びFOXD3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1及びEN2を包含し得る。例えば、本出願の方法では、標的遺伝子はFOXD3及びEN2を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、FOXD3及びEN2からなる群から選択される3つの遺伝子を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1及びFOXD3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1及びEN2を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、FOXD3及びEN2を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1、FOXD3及びEN2を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、FOXD3及びEN2からなる群から選択される4つの遺伝子を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、FOXD3及びEN2を包含し得る。例えば、それは、試験される試料中のヒトchr1:248020592-248020779に由来するDNA領域、ヒトchr7:19156739-19157277に由来するDNA領域、ヒトchr1:63788812-63788952に由来するDNA領域、及びヒトchr7:155167513-155167628に由来するDNA領域、又はそれらの相補的領域、又はそれらの断片からなる群から選択される2つ以上のDNA領域の修飾状態の存在及び/又は含有量を決定することを含む。
例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される2つの遺伝子を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58及びTWIST1を包含し得る。例えば、本出願の方法において、標的遺伝子は、TRIM58及びCLEC11Aを包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58及びHOXD10を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1及びCLEC11Aを包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1及びHOXD10を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、CLEC11A及びHOXD10を包含し得る。例えば、本出願の方法では、標的遺伝子は、CLEC11A及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、HOXD10及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される3つの遺伝子を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1及びCLEC11Aを包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1及びHOXD10を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、CLEC11A及びHOXD10を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、CLEC11A及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、HOXD10及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1、CLEC11A及びHOXD10を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1、CLEC11A及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1、HOXD10及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、CLEC11A、HOXD10及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される4つの遺伝子を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、CLEC11A及びHOXD10を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、CLEC11A及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、HOXD10及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、CLEC11A、HOXD10及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TWIST1、CLEC11A、HOXD10及びOLIG3を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される5つの遺伝子を包含し得る。例えば、本出願の方法では、標的遺伝子は、TRIM58、TWIST1、CLEC11A、HOXD10及びOLIG3を包含し得る。
例えば、それは、試験される試料中のヒトchr1:248020592-248020779に由来するDNA領域、ヒトchr7:19156739-19157277に由来するDNA領域、ヒトchr19:51228168-51228782に由来するDNA領域、ヒトchr2:176945511-176945630に由来するDNA領域、及びヒトchr6:137814700-137814853に由来するDNA領域、又はそれらの相補的領域、又はそれらの断片からなる群から選択される2つ以上のDNA領域の修飾状態の存在及び/又は含有量を決定することを含む。
例えば、本出願の核酸は、単離された核酸を指し得る。例えば、単離されたポリヌクレオチドは、DNA分子、RNA分子、又はそれらの組合せであり得る。例えば、DNA分子は、ゲノムDNA分子又はその断片であり得る。
別の態様では、本出願は、本出願の方法を実行することができるプログラムを記録した記憶媒体を提供する。
別の態様では、本出願は、本出願の記憶媒体を含むことができるデバイスを提供する。別の態様では、本出願は、コンピュータプログラムが格納された不揮発性コンピュータ可読記憶媒体を提供し、プログラムは、本出願の任意の1つ又は複数の方法を実施するためにプロセッサによって実行される。例えば、不揮発性コンピュータ可読記憶媒体は、フロッピーディスク、フレキシブルディスク、ハードディスク、ソリッドステートストレージ(SSS)(ソリッドステートドライブ(SSD)等)、ソリッドステートカード(SSC)、ソリッドステートモジュール(SSM)、エンタープライズフラッシュドライブ、磁気テープ、又は任意の他の非一時的磁気媒体等を包含し得る。不揮発性コンピュータ可読記憶媒体はまた、パンチカード、紙テープ、光学マークカード(又は穴パターン又は他の光学的に識別可能なマーキングを有する任意の他の物理媒体)、コンパクトディスク読み出し専用メモリ(CD-ROM)、コンパクトディスク書き換え可能(CD-RW)、デジタル多用途ディスク(DVD)、ブルーレイディスク(BD)、及び/又は任意の他の非一時的光媒体を包含し得る。
例えば、本出願の核酸は、単離された核酸を指し得る。例えば、単離されたポリヌクレオチドは、DNA分子、RNA分子、又はそれらの組合せであり得る。例えば、DNA分子は、ゲノムDNA分子又はその断片であり得る。
別の態様では、本出願は、本出願の方法を実行することができるプログラムを記録した記憶媒体を提供する。
別の態様では、本出願は、本出願の記憶媒体を含むことができるデバイスを提供する。別の態様では、本出願は、コンピュータプログラムが格納された不揮発性コンピュータ可読記憶媒体を提供し、プログラムは、本出願の任意の1つ又は複数の方法を実施するためにプロセッサによって実行される。例えば、不揮発性コンピュータ可読記憶媒体は、フロッピーディスク、フレキシブルディスク、ハードディスク、ソリッドステートストレージ(SSS)(ソリッドステートドライブ(SSD)等)、ソリッドステートカード(SSC)、ソリッドステートモジュール(SSM)、エンタープライズフラッシュドライブ、磁気テープ、又は任意の他の非一時的磁気媒体等を包含し得る。不揮発性コンピュータ可読記憶媒体はまた、パンチカード、紙テープ、光学マークカード(又は穴パターン又は他の光学的に識別可能なマーキングを有する任意の他の物理媒体)、コンパクトディスク読み出し専用メモリ(CD-ROM)、コンパクトディスク書き換え可能(CD-RW)、デジタル多用途ディスク(DVD)、ブルーレイディスク(BD)、及び/又は任意の他の非一時的光媒体を包含し得る。
例えば、本出願のデバイスは、記憶媒体に結合されたプロセッサをさらに包含することができ、プロセッサは、本出願の方法を実施するために記憶媒体に記憶されたプログラムに基づいて実行するように構成される。例えば、デバイスは、データベースシステム上で実行されたときに本出願の方法が正しい結果を生成することを保証するために様々な機構を実装することができる。本出願では、デバイスは、永久データストレージとして磁気ディスクを使用することができる。本出願では、デバイスは、複数のデータベースクライアントのためのデータベース記憶及び処理サービスを提供することができる。デバイスは、複数の共有記憶デバイスにわたってデータベースデータを記憶することができ、及び/又は複数の実行ノードを有する1つ又は複数の実行プラットフォームを利用することができる。デバイスは、ストレージ及びコンピューティングリソースを効果的に無限に拡張できるように編成することができる。
本明細書に記載の「複数」は、任意の整数を意味する。好ましくは、「1つ又は複数」の「より多く」は、例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60以上を包含する2以上の任意の整数であってもよい。
実施形態1
1.哺乳動物から単離された核酸分子であって、核酸分子が膵癌関連遺伝子のメチル化マーカであり、核酸分子の配列が、(1)以下の配列:配列番号1、配列番号2、配列番号3、配列番号4、配列番号5、配列番号6、配列番号7、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12、配列番号13、配列番号14、配列番号15、配列番号16、配列番号17、配列番号18、配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、配列番号37、配列番号38、配列番号39、配列番号40、配列番号41、配列番号42、配列番号43、配列番号44、配列番号45、配列番号46、配列番号47、配列番号48、配列番号49、配列番号50、配列番号51、配列番号52、配列番号53、配列番号54、配列番号55、配列番号56、又はそれと少なくとも70%の同一性を有する変異体におけるメチル化部位が変異していない、変異体のうちの1つ又は複数又は全部、(2)(1)の相補性配列、(3)非メチル化シトシンをシトシンよりもグアニン結合能が低い塩基に変換するように処理された(1)又は(2)の配列を包含し、
好ましくは、核酸分子は、試料中の対応する配列のDNAメチル化レベルを検出するための内部標準又は対照として使用される、
哺乳動物から単離された核酸分子。
2.DNAメチル化を検出するための試薬であって、検出対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを検出するための試薬を含み、DNA配列が、以下の遺伝子配列:DMRTA2、FOXD3、TBX15、BCAN、TRIM58、SIX3、VAX2、EMX1、LBX2、TLX2、POU3F3、TBR1、EVX2、HOXD12、HOXD8、HOXD4、TOPAZ1、SHOX2、DRD5、RPL9、HOPX、SFRP2、IRX4、TBX18、OLIG3、ULBP1、HOXA13、TBX20、IKZF1、INSIG1、SOX7、EBF2、MOS、MKX、KCNA6、SYT10、AGAP2、TBX3、CCNA1、ZIC2、CLEC14A、OTX2、C14orf39、BNC1、AHSP、ZFHX3、LHX1、TIMP2、ZNF750、SIM2、又はその20kb上流若しくは下流内の配列のうちの1つ又は複数又は全てから選択され、
好ましくは、
DNA配列は、以下の配列:配列番号1、配列番号2、配列番号3、配列番号4、配列番号5、配列番号6、配列番号7、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12、配列番号13、配列番号14、配列番号15、配列番号16、配列番号17、配列番号18、配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、配列番号37、配列番号38、配列番号39、配列番号40、配列番号41、配列番号42、配列番号43、配列番号44、配列番号45、配列番号46、配列番号47、配列番号48、配列番号49、配列番号50、配列番号51、配列番号52、配列番号53、配列番号54、配列番号55、配列番号56、又はその相補的配列又はそれらと少なくとも70%の同一性を有する、変異体のメチル化部位が変異していない変異体のうちの1つ又は複数又は全てから選択され、並びに/あるいは
試薬は、DNA配列又はその断片とハイブリダイズするプライマー分子であり、プライマー分子は、亜硫酸塩処理後にDNA配列又はその断片を増幅することができ、並びに/あるいは
試薬は、DNA配列又はその断片とハイブリダイズするプローブ分子である、DNAメチル化を検出するための試薬。
本明細書に記載の「複数」は、任意の整数を意味する。好ましくは、「1つ又は複数」の「より多く」は、例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60以上を包含する2以上の任意の整数であってもよい。
実施形態1
1.哺乳動物から単離された核酸分子であって、核酸分子が膵癌関連遺伝子のメチル化マーカであり、核酸分子の配列が、(1)以下の配列:配列番号1、配列番号2、配列番号3、配列番号4、配列番号5、配列番号6、配列番号7、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12、配列番号13、配列番号14、配列番号15、配列番号16、配列番号17、配列番号18、配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、配列番号37、配列番号38、配列番号39、配列番号40、配列番号41、配列番号42、配列番号43、配列番号44、配列番号45、配列番号46、配列番号47、配列番号48、配列番号49、配列番号50、配列番号51、配列番号52、配列番号53、配列番号54、配列番号55、配列番号56、又はそれと少なくとも70%の同一性を有する変異体におけるメチル化部位が変異していない、変異体のうちの1つ又は複数又は全部、(2)(1)の相補性配列、(3)非メチル化シトシンをシトシンよりもグアニン結合能が低い塩基に変換するように処理された(1)又は(2)の配列を包含し、
好ましくは、核酸分子は、試料中の対応する配列のDNAメチル化レベルを検出するための内部標準又は対照として使用される、
哺乳動物から単離された核酸分子。
2.DNAメチル化を検出するための試薬であって、検出対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを検出するための試薬を含み、DNA配列が、以下の遺伝子配列:DMRTA2、FOXD3、TBX15、BCAN、TRIM58、SIX3、VAX2、EMX1、LBX2、TLX2、POU3F3、TBR1、EVX2、HOXD12、HOXD8、HOXD4、TOPAZ1、SHOX2、DRD5、RPL9、HOPX、SFRP2、IRX4、TBX18、OLIG3、ULBP1、HOXA13、TBX20、IKZF1、INSIG1、SOX7、EBF2、MOS、MKX、KCNA6、SYT10、AGAP2、TBX3、CCNA1、ZIC2、CLEC14A、OTX2、C14orf39、BNC1、AHSP、ZFHX3、LHX1、TIMP2、ZNF750、SIM2、又はその20kb上流若しくは下流内の配列のうちの1つ又は複数又は全てから選択され、
好ましくは、
DNA配列は、以下の配列:配列番号1、配列番号2、配列番号3、配列番号4、配列番号5、配列番号6、配列番号7、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12、配列番号13、配列番号14、配列番号15、配列番号16、配列番号17、配列番号18、配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、配列番号37、配列番号38、配列番号39、配列番号40、配列番号41、配列番号42、配列番号43、配列番号44、配列番号45、配列番号46、配列番号47、配列番号48、配列番号49、配列番号50、配列番号51、配列番号52、配列番号53、配列番号54、配列番号55、配列番号56、又はその相補的配列又はそれらと少なくとも70%の同一性を有する、変異体のメチル化部位が変異していない変異体のうちの1つ又は複数又は全てから選択され、並びに/あるいは
試薬は、DNA配列又はその断片とハイブリダイズするプライマー分子であり、プライマー分子は、亜硫酸塩処理後にDNA配列又はその断片を増幅することができ、並びに/あるいは
試薬は、DNA配列又はその断片とハイブリダイズするプローブ分子である、DNAメチル化を検出するための試薬。
3.DNA配列又はその断片及び/又はそのメチル化情報を記録する媒体であって、DNA配列が、(i)以下の遺伝子配列:DMRTA2、FOXD3、TBX15、BCAN、TRIM58、SIX3、VAX2、EMX1、LBX2、TLX2、POU3F3、TBR1、EVX2、HOXD12、HOXD8、HOXD4、TOPAZ1、SHOX2、DRD5、RPL9、HOPX、SFRP2、IRX4、TBX18、OLIG3、ULBP1、HOXA13、TBX20、IKZF1、INSIG1、SOX7、EBF2、MOS、MKX、KCNA6、SYT10、AGAP2、TBX3、CCNA1、ZIC2、CLEC14A、OTX2、C14orf39、BNC1、AHSP、ZFHX3、LHX1、TIMP2、ZNF750、SIM2、又はその20kb上流若しくは下流内の配列のうちの1つ又は複数又は全てから選択されるか、あるいは(ii)非メチル化シトシンを、シトシンよりもグアニンに対する結合能が低い塩基に変換するように処理された、(i)の配列であり、
好ましくは、
培地は、配列又はその断片を含む核酸分子の存在、含有量及び/又はメチル化レベルを決定するために、遺伝子メチル化配列決定データとアライメントするために使用され、並びに/あるいは
DNA配列は、DNAのセンス鎖又はアンチセンス鎖を含み、並びに/あるいは
断片の長さが1~1000bpであり、並びに/あるいは
DNA配列は、以下の配列:配列番号1、配列番号2、配列番号3、配列番号4、配列番号5、配列番号6、配列番号7、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12、配列番号13、配列番号14、配列番号15、配列番号16、配列番号17、配列番号18、配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、配列番号37、配列番号38、配列番号39、配列番号40、配列番号41、配列番号42、配列番号43、配列番号44、配列番号45、配列番号46、配列番号47、配列番号48、配列番号49、配列番号50、配列番号51、配列番号52、配列番号53、配列番号54、配列番号55、配列番号56、又はその相補的配列、又はそれらと少なくとも70%の同一性を有する、変異体におけるメチル化部位が変異していない変異体のうちの1つ又は複数又は全てから選択され、
より好ましくは、
培地は、DNA配列若しくはその断片及び/又はそのメチル化情報が印刷された担体であり、並びに/あるいは
媒体は、配列又はその断片及び/又はそのメチル化情報と、コンピュータプログラムとを記憶したコンピュータ読み取り可能な媒体であり、コンピュータプログラムがプロセッサにより実行されると、試料のメチル化シーケンシングデータと配列又はその断片とを比較して、試料中の配列又はその断片を含む核酸分子の存在、含有量及び/又はメチル化レベルを取得する工程であって、存在、含有量及び/又はメチル化レベルが、膵癌の診断に用いられる工程が実施される、DNA配列又はその断片及び/又はそのメチル化情報を記録する媒体。
好ましくは、
培地は、配列又はその断片を含む核酸分子の存在、含有量及び/又はメチル化レベルを決定するために、遺伝子メチル化配列決定データとアライメントするために使用され、並びに/あるいは
DNA配列は、DNAのセンス鎖又はアンチセンス鎖を含み、並びに/あるいは
断片の長さが1~1000bpであり、並びに/あるいは
DNA配列は、以下の配列:配列番号1、配列番号2、配列番号3、配列番号4、配列番号5、配列番号6、配列番号7、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12、配列番号13、配列番号14、配列番号15、配列番号16、配列番号17、配列番号18、配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、配列番号37、配列番号38、配列番号39、配列番号40、配列番号41、配列番号42、配列番号43、配列番号44、配列番号45、配列番号46、配列番号47、配列番号48、配列番号49、配列番号50、配列番号51、配列番号52、配列番号53、配列番号54、配列番号55、配列番号56、又はその相補的配列、又はそれらと少なくとも70%の同一性を有する、変異体におけるメチル化部位が変異していない変異体のうちの1つ又は複数又は全てから選択され、
より好ましくは、
培地は、DNA配列若しくはその断片及び/又はそのメチル化情報が印刷された担体であり、並びに/あるいは
媒体は、配列又はその断片及び/又はそのメチル化情報と、コンピュータプログラムとを記憶したコンピュータ読み取り可能な媒体であり、コンピュータプログラムがプロセッサにより実行されると、試料のメチル化シーケンシングデータと配列又はその断片とを比較して、試料中の配列又はその断片を含む核酸分子の存在、含有量及び/又はメチル化レベルを取得する工程であって、存在、含有量及び/又はメチル化レベルが、膵癌の診断に用いられる工程が実施される、DNA配列又はその断片及び/又はそのメチル化情報を記録する媒体。
4.対象の膵癌を診断するためのキットの調製における以下の項目(a)及び/又は(b)、
(a)対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを決定するための試薬若しくはデバイス、
(b)非メチル化シトシンを、シトシンよりもグアニンに対する結合能が低い塩基に変換するように処理されたDNA配列又はその断片の核酸分子
の使用であって、
ここで、DNA配列は、以下の遺伝子配列:DMRTA2、FOXD3、TBX15、BCAN、TRIM58、SIX3、VAX2、EMX1、LBX2、TLX2、POU3F3、TBR1、EVX2、HOXD12、HOXD8、HOXD4、TOPAZ1、SHOX2、DRD5、RPL9、HOPX、SFRP2、IRX4、TBX18、OLIG3、ULBP1、HOXA13、TBX20、IKZF1、INSIG1、SOX7、EBF2、MOS、MKX、KCNA6、SYT10、AGAP2、TBX3、CCNA1、ZIC2、CLEC14A、OTX2、C14orf39、BNC1、AHSP、ZFHX3、LHX1、TIMP2、ZNF750、SIM2、又はその20kb上流若しくは下流内の配列のうちの1つ又は複数又は全てから選択され、
好ましくは、断片の長さは1~1000bpである、使用。
5.DNA配列が、以下の配列:配列番号1、配列番号2、配列番号3、配列番号4、配列番号5、配列番号6、配列番号7、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12、配列番号13、配列番号14、配列番号15、配列番号16、配列番号17、配列番号18、配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、配列番号37、配列番号38、配列番号39、配列番号40、配列番号41、配列番号42、配列番号43、配列番号44、配列番号45、配列番号46、配列番号47、配列番号48、配列番号49、配列番号50、配列番号51、配列番号52、配列番号53、配列番号54、配列番号55、配列番号56、又はその相補配列又はそれらと少なくとも70%の同一性を有する、変異体のメチル化部位は変異していない変異体のうちの1つ又は複数又は全てから選択される、実施形態4に記載の使用。
(a)対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを決定するための試薬若しくはデバイス、
(b)非メチル化シトシンを、シトシンよりもグアニンに対する結合能が低い塩基に変換するように処理されたDNA配列又はその断片の核酸分子
の使用であって、
ここで、DNA配列は、以下の遺伝子配列:DMRTA2、FOXD3、TBX15、BCAN、TRIM58、SIX3、VAX2、EMX1、LBX2、TLX2、POU3F3、TBR1、EVX2、HOXD12、HOXD8、HOXD4、TOPAZ1、SHOX2、DRD5、RPL9、HOPX、SFRP2、IRX4、TBX18、OLIG3、ULBP1、HOXA13、TBX20、IKZF1、INSIG1、SOX7、EBF2、MOS、MKX、KCNA6、SYT10、AGAP2、TBX3、CCNA1、ZIC2、CLEC14A、OTX2、C14orf39、BNC1、AHSP、ZFHX3、LHX1、TIMP2、ZNF750、SIM2、又はその20kb上流若しくは下流内の配列のうちの1つ又は複数又は全てから選択され、
好ましくは、断片の長さは1~1000bpである、使用。
5.DNA配列が、以下の配列:配列番号1、配列番号2、配列番号3、配列番号4、配列番号5、配列番号6、配列番号7、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12、配列番号13、配列番号14、配列番号15、配列番号16、配列番号17、配列番号18、配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、配列番号37、配列番号38、配列番号39、配列番号40、配列番号41、配列番号42、配列番号43、配列番号44、配列番号45、配列番号46、配列番号47、配列番号48、配列番号49、配列番号50、配列番号51、配列番号52、配列番号53、配列番号54、配列番号55、配列番号56、又はその相補配列又はそれらと少なくとも70%の同一性を有する、変異体のメチル化部位は変異していない変異体のうちの1つ又は複数又は全てから選択される、実施形態4に記載の使用。
6.試薬は、DNA配列若しくはその断片とハイブリダイズするプライマー分子を含み、及び/又は
試薬は、DNA配列若しくはその断片とハイブリダイズするプローブ分子を含み、及び/又は
試薬は実施形態3の培地を含む、
実施形態4又は5の使用。
7.試料は、哺乳動物の組織、細胞又は体液、例えば膵臓組織又は血液に由来し、並びに/あるいは
試料がゲノムDNA又はcfDNAを包含し、並びに/あるいは
DNA配列が、非メチル化シトシンが、シトシンよりもグアニンに対する結合能が低い塩基に変換され、並びに/あるいは
DNA配列がメチル化感受性制限酵素で処理される、
実施形態4又は5の使用。
8.診断が、対照試料及び/又は参照レベルとの比較又は計算によってスコアを得ること、並びにスコアに基づいて膵癌を診断することを含み、好ましくは、計算は、サポートベクターマシンモデルを構築することによって実行される、実施形態4又は5に記載の使用。
9.膵癌を同定するためのキットであって、
(a)対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを決定するための試薬若しくはデバイス、及び
場合により、(b)非メチル化シトシンを、シトシンよりもグアニンに対する結合能が低い塩基に変換するようにプロセシングされたDNA配列又はその断片の核酸分子
を包含し、
ここで、DNA配列は、以下の遺伝子配列:DMRTA2、FOXD3、TBX15、BCAN、TRIM58、SIX3、VAX2、EMX1、LBX2、TLX2、POU3F3、TBR1、EVX2、HOXD12、HOXD8、HOXD4、TOPAZ1、SHOX2、DRD5、RPL9、HOPX、SFRP2、IRX4、TBX18、OLIG3、ULBP1、HOXA13、TBX20、IKZF1、INSIG1、SOX7、EBF2、MOS、MKX、KCNA6、SYT10、AGAP2、TBX3、CCNA1、ZIC2、CLEC14A、OTX2、C14orf39、BNC1、AHSP、ZFHX3、LHX1、TIMP2、ZNF750、SIM2、又はその20kb上流若しくは下流内の配列のうちの1つ又は複数又は全て(例えば、少なくとも7)から選択され、
好ましくは、
DNA配列は、以下の配列:配列番号1、配列番号2、配列番号3、配列番号4、配列番号5、配列番号6、配列番号7、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12、配列番号13、配列番号14、配列番号15、配列番号16、配列番号17、配列番号18、配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、配列番号37、配列番号38、配列番号39、配列番号40、配列番号41、配列番号42、配列番号43、配列番号44、配列番号45、配列番号46、配列番号47、配列番号48、配列番号49、配列番号50、配列番号51、配列番号52、配列番号53、配列番号54、配列番号55、配列番号56又はその相補的配列、又はそれらと少なくとも70%の同一性を有する、変異体のメチル化部位が変異していない変異体のうちの1つ又は複数又は全てから選択され、並びに/あるいは
キットは、実施形態6~8のいずれか1つの使用に適しており、並びに/あるいは
試薬は、DNA配列又はその断片とハイブリダイズするプライマー分子を含み、並びに/あるいは
試薬は、DNA配列又はその断片とハイブリダイズするプローブ分子を含み、並びに/あるいは
試薬は実施形態3の培地を含み、並びに/あるいは
試料は、哺乳動物の組織、細胞又は体液、例えば膵臓組織又は血液に由来し、並びに/あるいは
DNA配列が、非メチル化シトシンが、シトシンよりもグアニンに対する結合能が低い塩基に変換され、並びに/あるいは
DNA配列がメチル化感受性制限酵素で処理される、膵癌を同定するためのキット。
試薬は、DNA配列若しくはその断片とハイブリダイズするプローブ分子を含み、及び/又は
試薬は実施形態3の培地を含む、
実施形態4又は5の使用。
7.試料は、哺乳動物の組織、細胞又は体液、例えば膵臓組織又は血液に由来し、並びに/あるいは
試料がゲノムDNA又はcfDNAを包含し、並びに/あるいは
DNA配列が、非メチル化シトシンが、シトシンよりもグアニンに対する結合能が低い塩基に変換され、並びに/あるいは
DNA配列がメチル化感受性制限酵素で処理される、
実施形態4又は5の使用。
8.診断が、対照試料及び/又は参照レベルとの比較又は計算によってスコアを得ること、並びにスコアに基づいて膵癌を診断することを含み、好ましくは、計算は、サポートベクターマシンモデルを構築することによって実行される、実施形態4又は5に記載の使用。
9.膵癌を同定するためのキットであって、
(a)対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを決定するための試薬若しくはデバイス、及び
場合により、(b)非メチル化シトシンを、シトシンよりもグアニンに対する結合能が低い塩基に変換するようにプロセシングされたDNA配列又はその断片の核酸分子
を包含し、
ここで、DNA配列は、以下の遺伝子配列:DMRTA2、FOXD3、TBX15、BCAN、TRIM58、SIX3、VAX2、EMX1、LBX2、TLX2、POU3F3、TBR1、EVX2、HOXD12、HOXD8、HOXD4、TOPAZ1、SHOX2、DRD5、RPL9、HOPX、SFRP2、IRX4、TBX18、OLIG3、ULBP1、HOXA13、TBX20、IKZF1、INSIG1、SOX7、EBF2、MOS、MKX、KCNA6、SYT10、AGAP2、TBX3、CCNA1、ZIC2、CLEC14A、OTX2、C14orf39、BNC1、AHSP、ZFHX3、LHX1、TIMP2、ZNF750、SIM2、又はその20kb上流若しくは下流内の配列のうちの1つ又は複数又は全て(例えば、少なくとも7)から選択され、
好ましくは、
DNA配列は、以下の配列:配列番号1、配列番号2、配列番号3、配列番号4、配列番号5、配列番号6、配列番号7、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12、配列番号13、配列番号14、配列番号15、配列番号16、配列番号17、配列番号18、配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、配列番号37、配列番号38、配列番号39、配列番号40、配列番号41、配列番号42、配列番号43、配列番号44、配列番号45、配列番号46、配列番号47、配列番号48、配列番号49、配列番号50、配列番号51、配列番号52、配列番号53、配列番号54、配列番号55、配列番号56又はその相補的配列、又はそれらと少なくとも70%の同一性を有する、変異体のメチル化部位が変異していない変異体のうちの1つ又は複数又は全てから選択され、並びに/あるいは
キットは、実施形態6~8のいずれか1つの使用に適しており、並びに/あるいは
試薬は、DNA配列又はその断片とハイブリダイズするプライマー分子を含み、並びに/あるいは
試薬は、DNA配列又はその断片とハイブリダイズするプローブ分子を含み、並びに/あるいは
試薬は実施形態3の培地を含み、並びに/あるいは
試料は、哺乳動物の組織、細胞又は体液、例えば膵臓組織又は血液に由来し、並びに/あるいは
DNA配列が、非メチル化シトシンが、シトシンよりもグアニンに対する結合能が低い塩基に変換され、並びに/あるいは
DNA配列がメチル化感受性制限酵素で処理される、膵癌を同定するためのキット。
10.メモリと、プロセッサと、メモリに記憶され、プロセッサ上で実行可能なコンピュータプログラムとを包含する、膵癌を診断するためのデバイスであって、プロセッサがプログラムを実行すると、以下の工程、すなわち、
(1)検出対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを得る工程であって、DNA配列が以下の遺伝子配列:DMRTA2、FOXD3、TBX15、BCAN、TRIM58、SIX3、VAX2、EMX1、LBX2、TLX2、POU3F3、TBR1、EVX2、HOXD12、HOXD8、HOXD4、TOPAZ1、SHOX2、DRD5、RPL9、HOPX、SFRP2、IRX4、TBX18、OLIG3、ULBP1、HOXA13、TBX20、IKZF1、INSIG1、SOX7、EBF2、MOS、MKX、KCNA6、SYT10、AGAP2、TBX3、CCNA1、ZIC2、CLEC14A、OTX2、C14orf39、BNC1、AHSP、ZFHX3、LHX1、TIMP2、ZNF750、SIM2のうちの1つ又は複数又は全てから選択される、工程と、
(2)対照試料及び/又は基準レベルと比較することによって、又は計算によってスコアを得る工程と、
(3)スコアに基づいて膵癌を診断する工程と、
が実行され、
好ましくは、
DNA配列は、以下の配列:配列番号1、配列番号2、配列番号3、配列番号4、配列番号5、配列番号6、配列番号7、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12、配列番号13、配列番号14、配列番号15、配列番号16、配列番号17、配列番号18、配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、配列番号37、配列番号38、配列番号39、配列番号40、配列番号41、配列番号42、配列番号43、配列番号44、配列番号45、配列番号46、配列番号47、配列番号48、配列番号49、配列番号50、配列番号51、配列番号52、配列番号53、配列番号54、配列番号55、配列番号56、又はその相補的配列又はそれらと少なくとも70%の同一性を有する、変異体のメチル化部位が変異していない変異体のうちの1つ又は複数又は全てから選択され、並びに/あるいは
工程(1)は、実施形態1の核酸分子及び/若しくは実施形態2の試薬及び/若しくは実施形態3の培地によって試料中の配列のメチル化レベルを検出することを含み、並びに/又は
試料がゲノムDNA又はcfDNAを含み、並びに/あるいは
非メチル化シトシンが、シトシンよりもグアニンに対する結合能が低い塩基に変換される場合配列が変換され、並びに/あるいは
DNA配列がメチル化感受性制限酵素で処理され、並びに/あるいは
工程(2)のスコアは、サポートベクターマシンモデルを構築することによって計算される、膵癌を診断するためのデバイス。
(1)検出対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを得る工程であって、DNA配列が以下の遺伝子配列:DMRTA2、FOXD3、TBX15、BCAN、TRIM58、SIX3、VAX2、EMX1、LBX2、TLX2、POU3F3、TBR1、EVX2、HOXD12、HOXD8、HOXD4、TOPAZ1、SHOX2、DRD5、RPL9、HOPX、SFRP2、IRX4、TBX18、OLIG3、ULBP1、HOXA13、TBX20、IKZF1、INSIG1、SOX7、EBF2、MOS、MKX、KCNA6、SYT10、AGAP2、TBX3、CCNA1、ZIC2、CLEC14A、OTX2、C14orf39、BNC1、AHSP、ZFHX3、LHX1、TIMP2、ZNF750、SIM2のうちの1つ又は複数又は全てから選択される、工程と、
(2)対照試料及び/又は基準レベルと比較することによって、又は計算によってスコアを得る工程と、
(3)スコアに基づいて膵癌を診断する工程と、
が実行され、
好ましくは、
DNA配列は、以下の配列:配列番号1、配列番号2、配列番号3、配列番号4、配列番号5、配列番号6、配列番号7、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12、配列番号13、配列番号14、配列番号15、配列番号16、配列番号17、配列番号18、配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号28、配列番号29、配列番号30、配列番号31、配列番号32、配列番号33、配列番号34、配列番号35、配列番号36、配列番号37、配列番号38、配列番号39、配列番号40、配列番号41、配列番号42、配列番号43、配列番号44、配列番号45、配列番号46、配列番号47、配列番号48、配列番号49、配列番号50、配列番号51、配列番号52、配列番号53、配列番号54、配列番号55、配列番号56、又はその相補的配列又はそれらと少なくとも70%の同一性を有する、変異体のメチル化部位が変異していない変異体のうちの1つ又は複数又は全てから選択され、並びに/あるいは
工程(1)は、実施形態1の核酸分子及び/若しくは実施形態2の試薬及び/若しくは実施形態3の培地によって試料中の配列のメチル化レベルを検出することを含み、並びに/又は
試料がゲノムDNA又はcfDNAを含み、並びに/あるいは
非メチル化シトシンが、シトシンよりもグアニンに対する結合能が低い塩基に変換される場合配列が変換され、並びに/あるいは
DNA配列がメチル化感受性制限酵素で処理され、並びに/あるいは
工程(2)のスコアは、サポートベクターマシンモデルを構築することによって計算される、膵癌を診断するためのデバイス。
実施形態2
1.哺乳動物から単離された核酸分子であって、核酸分子が、膵癌と膵炎との間の分化に関連するメチル化マーカであり、核酸分子の配列が、(1)配列番号57、配列番号58、配列番号59、又はそれらと少なくとも70%の同一性を有する変異体中のメチル化部位が変異していない変異体からなる群から選択される配列の1つ又は複数若しくは全部、(2)(1)の相補的配列、(3)非メチル化シトシンをシトシンよりもグアニンに対する結合能が低い塩基に変換するように処理された(1)又は(2)の配列、を包含し、
好ましくは、核酸分子は、試料中の対応する配列のDNAメチル化レベルを検出するための内部標準又は対照として使用される、哺乳動物から単離された核酸分子。
2.DNAメチル化を検出するための試薬であって、検出対象の対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを検出するための試薬を含み、DNA配列が、以下の遺伝子配列:SIX3、TLX2、CILP2又はその20kb上流若しくは下流の配列のうちの1つ又は複数又は全てから選択され、
好ましくは、
DNA配列が、以下の配列若しくはその相補配列:配列番号57、配列番号58、配列番号59、又はそれらと少なくとも70%の同一性を有する変異体のうちの1つ又は複数若しくは全部から選択され、変異体のメチル化部位が変異しておらず、及び/又は
試薬は、DNA配列又はその断片とハイブリダイズするプライマー分子であり、プライマー分子は、亜硫酸塩処理後にDNA配列又はその断片を増幅することができ、及び/又は
試薬は、DNA配列又はその断片とハイブリダイズするプローブ分子である、DNAメチル化を検出するための試薬。
3.DNA配列又はその断片及び/又はそのメチル化情報を記録する媒体であって、DNA配列が、(i)以下の遺伝子配列:SIX3、TLX2、CILP2、又はその20kb上流若しくは下流内の配列のうちの1つ又は複数又は全てから選択されるか、又は(ii)非メチル化シトシンを、シトシンよりもグアニンに対する結合能が低い塩基に変換するように処理された(i)の配列であり、
好ましくは、
培地は、配列又はその断片を含む核酸分子の存在、含有量及び/又はメチル化レベルを決定するために、遺伝子メチル化配列決定データとアライメントするために使用され、及び/又は
DNA配列は、DNAのセンス鎖又はアンチセンス鎖を含み、及び/又は
断片の長さが1~1000bpであり、及び/又は
DNA配列が、以下の配列又はその相補配列:配列番号57、配列番号58、配列番号59、又はそれらと少なくとも70%の同一性を有する、変異体のメチル化部位は変異していない変異体のうちの1つ又は複数又は全部から選択され、
より好ましくは、
培地は、DNA配列若しくはその断片及び/又はそのメチル化情報が印刷された担体であり、及び/又は
媒体は、配列又はその断片及び/又はそのメチル化情報、並びにコンピュータプログラムを記憶したコンピュータ読み取り可能な媒体であり、コンピュータプログラムがプロセッサにより実行されると、以下の工程、試料のメチル化シーケンシングデータと配列又はその断片とを比較して、試料中の配列又はその断片を含む核酸分子の存在、含有量及び/又はメチル化レベルを取得する工程であって、存在、含有量及び/又はメチル化レベルが、膵癌と膵炎との鑑別に用いられる、工程が実行される、DNA配列又はその断片及び/又はそのメチル化情報を記録する媒体。
4.以下の項目(a)及び/又は(b)、
(a)対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを決定するための試薬若しくはデバイス、
(b)非メチル化シトシンを、シトシンよりもグアニンに対する結合能が低い塩基に変換するように処理されたDNA配列又はその断片の核酸分子
の、膵癌と膵炎とを鑑別するためのキットの調製における、使用であって、
ここで、DNA配列は、以下の遺伝子配列、:SIX3、TLX2、CILP2、又はその20kb上流若しくは下流内の配列のうちの1つ又は複数又は全てから選択され、
好ましくは、断片の長さは1~1000bpである、使用。
1.哺乳動物から単離された核酸分子であって、核酸分子が、膵癌と膵炎との間の分化に関連するメチル化マーカであり、核酸分子の配列が、(1)配列番号57、配列番号58、配列番号59、又はそれらと少なくとも70%の同一性を有する変異体中のメチル化部位が変異していない変異体からなる群から選択される配列の1つ又は複数若しくは全部、(2)(1)の相補的配列、(3)非メチル化シトシンをシトシンよりもグアニンに対する結合能が低い塩基に変換するように処理された(1)又は(2)の配列、を包含し、
好ましくは、核酸分子は、試料中の対応する配列のDNAメチル化レベルを検出するための内部標準又は対照として使用される、哺乳動物から単離された核酸分子。
2.DNAメチル化を検出するための試薬であって、検出対象の対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを検出するための試薬を含み、DNA配列が、以下の遺伝子配列:SIX3、TLX2、CILP2又はその20kb上流若しくは下流の配列のうちの1つ又は複数又は全てから選択され、
好ましくは、
DNA配列が、以下の配列若しくはその相補配列:配列番号57、配列番号58、配列番号59、又はそれらと少なくとも70%の同一性を有する変異体のうちの1つ又は複数若しくは全部から選択され、変異体のメチル化部位が変異しておらず、及び/又は
試薬は、DNA配列又はその断片とハイブリダイズするプライマー分子であり、プライマー分子は、亜硫酸塩処理後にDNA配列又はその断片を増幅することができ、及び/又は
試薬は、DNA配列又はその断片とハイブリダイズするプローブ分子である、DNAメチル化を検出するための試薬。
3.DNA配列又はその断片及び/又はそのメチル化情報を記録する媒体であって、DNA配列が、(i)以下の遺伝子配列:SIX3、TLX2、CILP2、又はその20kb上流若しくは下流内の配列のうちの1つ又は複数又は全てから選択されるか、又は(ii)非メチル化シトシンを、シトシンよりもグアニンに対する結合能が低い塩基に変換するように処理された(i)の配列であり、
好ましくは、
培地は、配列又はその断片を含む核酸分子の存在、含有量及び/又はメチル化レベルを決定するために、遺伝子メチル化配列決定データとアライメントするために使用され、及び/又は
DNA配列は、DNAのセンス鎖又はアンチセンス鎖を含み、及び/又は
断片の長さが1~1000bpであり、及び/又は
DNA配列が、以下の配列又はその相補配列:配列番号57、配列番号58、配列番号59、又はそれらと少なくとも70%の同一性を有する、変異体のメチル化部位は変異していない変異体のうちの1つ又は複数又は全部から選択され、
より好ましくは、
培地は、DNA配列若しくはその断片及び/又はそのメチル化情報が印刷された担体であり、及び/又は
媒体は、配列又はその断片及び/又はそのメチル化情報、並びにコンピュータプログラムを記憶したコンピュータ読み取り可能な媒体であり、コンピュータプログラムがプロセッサにより実行されると、以下の工程、試料のメチル化シーケンシングデータと配列又はその断片とを比較して、試料中の配列又はその断片を含む核酸分子の存在、含有量及び/又はメチル化レベルを取得する工程であって、存在、含有量及び/又はメチル化レベルが、膵癌と膵炎との鑑別に用いられる、工程が実行される、DNA配列又はその断片及び/又はそのメチル化情報を記録する媒体。
4.以下の項目(a)及び/又は(b)、
(a)対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを決定するための試薬若しくはデバイス、
(b)非メチル化シトシンを、シトシンよりもグアニンに対する結合能が低い塩基に変換するように処理されたDNA配列又はその断片の核酸分子
の、膵癌と膵炎とを鑑別するためのキットの調製における、使用であって、
ここで、DNA配列は、以下の遺伝子配列、:SIX3、TLX2、CILP2、又はその20kb上流若しくは下流内の配列のうちの1つ又は複数又は全てから選択され、
好ましくは、断片の長さは1~1000bpである、使用。
5.DNA配列が、以下の配列:配列番号57、配列番号58、配列番号59、又はその相補配列又はそれらと少なくとも70%の同一性を有する、変異体のメチル化部位は変異していない変異体のうちの1つ又は複数又は全部から選択される、実施形態4に記載の使用。
6.試薬は、DNA配列若しくはその断片とハイブリダイズするプライマー分子を含み、及び/又は
試薬は、DNA配列若しくはその断片とハイブリダイズするプローブ分子を含み、及び/又は
試薬は実施形態3の培地を含む、
実施形態4又は5の使用。
7.試料は、哺乳動物の組織、細胞又は体液、例えば膵臓組織又は血液に由来し、並びに/あるいは
試料がゲノムDNA又はcfDNAを包含し、並びに/あるいは
DNA配列が、非メチル化シトシンが、シトシンよりもグアニンに対する結合能が低い塩基に変換され、並びに/あるいは
DNA配列がメチル化感受性制限酵素で処理される、
実施形態4又は5の使用。
8.診断が、対照試料及び/又は参照レベルと比較することによって、又は計算によってスコアを得ること、並びにスコアに基づいて膵癌と膵炎とを区別することを含み、好ましくは、計算は、サポートベクターマシンモデルを構築することによって実行される、実施形態4又は5に記載の使用。
9.膵癌と膵炎とを区別するためのキットであって、
(a)対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを決定するための試薬若しくはデバイス、及び
場合により、(b)非メチル化シトシンを、シトシンよりもグアニンに対する結合能が低い塩基に変換するようにプロセシングされたDNA配列又はその断片の核酸分子
を含み、
ここで、DNA配列は、以下の遺伝子配列:SIX3、TLX2、CILP2、又はその20kb上流若しくは下流内の配列のうちの1つ又は複数又は全てから選択され、
好ましくは、
DNA配列が、以下の配列:配列番号57、配列番号58、配列番号59、若しくはその相補配列又はそれらと少なくとも70%の同一性を有する、変異体のメチル化部位が変異していない変異体のうちの1つ又は複数若しくは全部から選択され、並びに/あるいは
キットは、実施形態6~8のいずれか1つの使用に適しており、並びに/あるいは
試薬は、DNA配列又はその断片とハイブリダイズするプライマー分子を含み、並びに/あるいは
試薬は、DNA配列又はその断片とハイブリダイズするプローブ分子を含み、並びに/あるいは
試薬は実施形態3の培地を含み、並びに/あるいは
試料は、哺乳動物の組織、細胞又は体液、例えば膵臓組織又は血液に由来し、並びに/あるいは
DNA配列が、非メチル化シトシンが、シトシンよりもグアニンに対する結合能が低い塩基に変換され、並びに/あるいは
DNA配列がメチル化感受性制限酵素で処理される、膵癌と膵炎とを区別するためのキット。
6.試薬は、DNA配列若しくはその断片とハイブリダイズするプライマー分子を含み、及び/又は
試薬は、DNA配列若しくはその断片とハイブリダイズするプローブ分子を含み、及び/又は
試薬は実施形態3の培地を含む、
実施形態4又は5の使用。
7.試料は、哺乳動物の組織、細胞又は体液、例えば膵臓組織又は血液に由来し、並びに/あるいは
試料がゲノムDNA又はcfDNAを包含し、並びに/あるいは
DNA配列が、非メチル化シトシンが、シトシンよりもグアニンに対する結合能が低い塩基に変換され、並びに/あるいは
DNA配列がメチル化感受性制限酵素で処理される、
実施形態4又は5の使用。
8.診断が、対照試料及び/又は参照レベルと比較することによって、又は計算によってスコアを得ること、並びにスコアに基づいて膵癌と膵炎とを区別することを含み、好ましくは、計算は、サポートベクターマシンモデルを構築することによって実行される、実施形態4又は5に記載の使用。
9.膵癌と膵炎とを区別するためのキットであって、
(a)対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを決定するための試薬若しくはデバイス、及び
場合により、(b)非メチル化シトシンを、シトシンよりもグアニンに対する結合能が低い塩基に変換するようにプロセシングされたDNA配列又はその断片の核酸分子
を含み、
ここで、DNA配列は、以下の遺伝子配列:SIX3、TLX2、CILP2、又はその20kb上流若しくは下流内の配列のうちの1つ又は複数又は全てから選択され、
好ましくは、
DNA配列が、以下の配列:配列番号57、配列番号58、配列番号59、若しくはその相補配列又はそれらと少なくとも70%の同一性を有する、変異体のメチル化部位が変異していない変異体のうちの1つ又は複数若しくは全部から選択され、並びに/あるいは
キットは、実施形態6~8のいずれか1つの使用に適しており、並びに/あるいは
試薬は、DNA配列又はその断片とハイブリダイズするプライマー分子を含み、並びに/あるいは
試薬は、DNA配列又はその断片とハイブリダイズするプローブ分子を含み、並びに/あるいは
試薬は実施形態3の培地を含み、並びに/あるいは
試料は、哺乳動物の組織、細胞又は体液、例えば膵臓組織又は血液に由来し、並びに/あるいは
DNA配列が、非メチル化シトシンが、シトシンよりもグアニンに対する結合能が低い塩基に変換され、並びに/あるいは
DNA配列がメチル化感受性制限酵素で処理される、膵癌と膵炎とを区別するためのキット。
10.メモリと、プロセッサと、メモリに記憶され、プロセッサ上で実行可能なコンピュータプログラムとを包含する、膵癌と膵炎とを鑑別するデバイスであって、プロセッサがプログラムを実行すると、以下の工程、
(1)検出対象の対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを得る工程であって、DNA配列が、以下の遺伝子配列:SIX3、TLX2、CILP2の1つ若しくは複数又は全部から選択される工程と、
(2)対照試料及び/又は基準レベルと比較することによって、又は計算によってスコアを得る工程と、
(3)スコアに基づいて、膵癌と膵炎とを鑑別する工程と、
が実行され、
好ましくは、
DNA配列が、以下の配列:配列番号57、配列番号58、配列番号59、若しくはその相補配列又はそれらと少なくとも70%の同一性を有する、変異体のメチル化部位が変異していない変異体のうちの1つ又は複数若しくは全部から選択され、並びに/あるいは
工程(1)は、実施形態1の核酸分子及び/又は実施形態2の試薬及び/又は実施形態3の培地によって試料中の配列のメチル化レベルを検出することを含み、並びに/あるいは
試料がゲノムDNA又はcfDNAを含み、並びに/あるいは
非メチル化シトシンが、シトシンよりもグアニンに対する結合能が低い塩基に変換される配列、並びに/あるいは
DNA配列をメチル化感受性制限酵素で処理し、並びに/あるいは
工程(2)のスコアは、サポートベクターマシンモデルを構築することによって計算される、膵癌と膵炎とを鑑別するデバイス。
実施形態3
1.膵腫瘍の存在及び/又は進行を評価するための方法であって、以下のDNA領域、又はその相補的領域、又はその断片から選択されるDNA領域の修飾状態の存在及び/又は含有量を試験される試料中で決定することを含む方法。
(1)検出対象の対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを得る工程であって、DNA配列が、以下の遺伝子配列:SIX3、TLX2、CILP2の1つ若しくは複数又は全部から選択される工程と、
(2)対照試料及び/又は基準レベルと比較することによって、又は計算によってスコアを得る工程と、
(3)スコアに基づいて、膵癌と膵炎とを鑑別する工程と、
が実行され、
好ましくは、
DNA配列が、以下の配列:配列番号57、配列番号58、配列番号59、若しくはその相補配列又はそれらと少なくとも70%の同一性を有する、変異体のメチル化部位が変異していない変異体のうちの1つ又は複数若しくは全部から選択され、並びに/あるいは
工程(1)は、実施形態1の核酸分子及び/又は実施形態2の試薬及び/又は実施形態3の培地によって試料中の配列のメチル化レベルを検出することを含み、並びに/あるいは
試料がゲノムDNA又はcfDNAを含み、並びに/あるいは
非メチル化シトシンが、シトシンよりもグアニンに対する結合能が低い塩基に変換される配列、並びに/あるいは
DNA配列をメチル化感受性制限酵素で処理し、並びに/あるいは
工程(2)のスコアは、サポートベクターマシンモデルを構築することによって計算される、膵癌と膵炎とを鑑別するデバイス。
実施形態3
1.膵腫瘍の存在及び/又は進行を評価するための方法であって、以下のDNA領域、又はその相補的領域、又はその断片から選択されるDNA領域の修飾状態の存在及び/又は含有量を試験される試料中で決定することを含む方法。
2.膵腫瘍の存在及び/又は進行を評価する方法であって、試験される試料中の配列番号60~160のいずれか1つから選択されるDNA領域、又はその相補的領域、又はその断片の修飾状態の存在及び/又は含有量を決定することを含む方法。
膵腫瘍の存在及び/又は進行を評価する方法であって、試験される試料中のARHGEF16、PRDM16、NFIA、ST6GALNAC5、PRRX1、LHX4、ACBD6、FMN2、CHRM3、FAM150B、TMEM18、SIX3、CAMKMT、OTX1、WDPCP、CYP26B1、DYSF、HOXD1、HOXD4、UBE2F、RAMP1、AMT、PLSCR5、ZIC4、PEX5L、ETV5、DGKG、FGF12、FGFRL1、RNF212、DOK7、HGFAC、EVC、EVC2、HMX1、CPZ、IRX1、GDNF、AGGF1、CRHBP、PITX1、CATSPER3、NEUROG1、NPM1、TLX3、NKX2-5、BNIP1、PROP1、B4GALT7、IRF4、FOXF2、FOXQ1、FOXC1、GMDS、MOCS1、LRFN2、POU3F2、FBXL4、CCR6、GPR31、TBX20、HERPUD2、VIPR2、LZTS1、NKX2-6、PENK、PRDM14、VPS13B、OSR2、NEK6、LHX2、DDIT4、DNAJB12、CRTAC1、PAX2、HIF1AN、ELOVL3、INA、HMX2、HMX3、MKI67、DPYSL4、STK32C、INS、INS-IGF2、ASCL2、PAX6、RELT、FAM168A、OPCML、ACVR1B、ACVRL1、AVPR1A、LHX5、SDSL、RAB20、COL4A2、CARKD、CARS2、SOX1、TEX29、SPACA7、SFTA3、SIX6、SIX1、INF2、TMEM179、CRIP2、MTA1、PIAS1、SKOR1、ISL2、SCAPER、POLG、RHCG、NR2F2、RAB40C、PIGQ、CPNE2、NLRC5、PSKH1、NRN1L、SRR、HIC1、HOXB9、PRAC1、SMIM5、MYO15B、TNRC6C、9-Sep、TBCD、ZNF750、KCTD1、SALL3、CTDP1、NFATC1、ZNF554、THOP1、CACTIN、PIP5K1C、KDM4B、PLIN3、EPS15L1、KLF2、EPS8L1、PPP1R12C、NKX2-4、NKX2-2、TFAP2C、RAE1、TNFRSF6B、ARFRP1、MYH9、及びTXN2又はその断片からなる群から選択される遺伝子を用いてDNA領域の修飾状態の存在及び/又は内容を決定することを含む、膵腫瘍の存在及び/又は進行を評価する方法。
膵腫瘍の存在及び/又は進行を評価する方法であって、試験される試料中のARHGEF16、PRDM16、NFIA、ST6GALNAC5、PRRX1、LHX4、ACBD6、FMN2、CHRM3、FAM150B、TMEM18、SIX3、CAMKMT、OTX1、WDPCP、CYP26B1、DYSF、HOXD1、HOXD4、UBE2F、RAMP1、AMT、PLSCR5、ZIC4、PEX5L、ETV5、DGKG、FGF12、FGFRL1、RNF212、DOK7、HGFAC、EVC、EVC2、HMX1、CPZ、IRX1、GDNF、AGGF1、CRHBP、PITX1、CATSPER3、NEUROG1、NPM1、TLX3、NKX2-5、BNIP1、PROP1、B4GALT7、IRF4、FOXF2、FOXQ1、FOXC1、GMDS、MOCS1、LRFN2、POU3F2、FBXL4、CCR6、GPR31、TBX20、HERPUD2、VIPR2、LZTS1、NKX2-6、PENK、PRDM14、VPS13B、OSR2、NEK6、LHX2、DDIT4、DNAJB12、CRTAC1、PAX2、HIF1AN、ELOVL3、INA、HMX2、HMX3、MKI67、DPYSL4、STK32C、INS、INS-IGF2、ASCL2、PAX6、RELT、FAM168A、OPCML、ACVR1B、ACVRL1、AVPR1A、LHX5、SDSL、RAB20、COL4A2、CARKD、CARS2、SOX1、TEX29、SPACA7、SFTA3、SIX6、SIX1、INF2、TMEM179、CRIP2、MTA1、PIAS1、SKOR1、ISL2、SCAPER、POLG、RHCG、NR2F2、RAB40C、PIGQ、CPNE2、NLRC5、PSKH1、NRN1L、SRR、HIC1、HOXB9、PRAC1、SMIM5、MYO15B、TNRC6C、9-Sep、TBCD、ZNF750、KCTD1、SALL3、CTDP1、NFATC1、ZNF554、THOP1、CACTIN、PIP5K1C、KDM4B、PLIN3、EPS15L1、KLF2、EPS8L1、PPP1R12C、NKX2-4、NKX2-2、TFAP2C、RAE1、TNFRSF6B、ARFRP1、MYH9、及びTXN2又はその断片からなる群から選択される遺伝子を用いてDNA領域の修飾状態の存在及び/又は内容を決定することを含む、膵腫瘍の存在及び/又は進行を評価する方法。
3.試験される試料中の核酸を得ることをさらに含む、実施形態1~2のいずれか一項に記載の方法。
4.核酸が無細胞核酸を包含する、実施形態3に記載の方法。
5.試験される試料が組織、細胞及び/又は体液を包含する、実施形態1~4のいずれか一項に記載の方法。
6.試験される試料が血漿を包含する、実施形態1~5のいずれか一項に記載の方法。
7.DNA領域又はその断片を変換することをさらに含む、実施形態1~6のいずれか一項に記載の方法。
8.修飾状態を有する塩基及び修飾状態を有さない塩基が、それぞれ変換後に異なる物質を形成する、実施形態7に記載の方法。
9.修飾状態を有する塩基が、変換後に実質的に変化せず、修飾状態を有さない塩基が、変換後の塩基とは異なる他の塩基に変更されるか、又は変換後に切断される、実施形態7~8のいずれか一項に記載の方法。
10.塩基がシトシンを包含する、実施形態8~9のいずれか一項に記載の方法。
11.修飾状態がメチル化修飾を包含する、実施形態1~10のいずれか一項に記載の方法。
12.他の塩基がシトシンを包含する、実施形態9~11のいずれか一項に記載の方法。
13.変換が、脱アミノ化試薬及び/又はメチル化感受性制限酵素による変換を含む、実施形態7~12のいずれか一項に記載の方法。
14.脱アミノ化試薬がバイサルファイト又はその類似体を包含する、実施形態13に記載の方法。
15.修飾状態の存在及び/又は含有量を決定する方法が、修飾状態を有するDNA領域又はその断片の存在及び/又は含有量を決定することを含む、実施形態1~14のいずれか一項に記載の方法。
16.修飾状態を有するDNA領域又はその断片の存在及び/又は含有量が配列決定によって検出される、実施形態1~15のいずれか一項に記載の方法。
4.核酸が無細胞核酸を包含する、実施形態3に記載の方法。
5.試験される試料が組織、細胞及び/又は体液を包含する、実施形態1~4のいずれか一項に記載の方法。
6.試験される試料が血漿を包含する、実施形態1~5のいずれか一項に記載の方法。
7.DNA領域又はその断片を変換することをさらに含む、実施形態1~6のいずれか一項に記載の方法。
8.修飾状態を有する塩基及び修飾状態を有さない塩基が、それぞれ変換後に異なる物質を形成する、実施形態7に記載の方法。
9.修飾状態を有する塩基が、変換後に実質的に変化せず、修飾状態を有さない塩基が、変換後の塩基とは異なる他の塩基に変更されるか、又は変換後に切断される、実施形態7~8のいずれか一項に記載の方法。
10.塩基がシトシンを包含する、実施形態8~9のいずれか一項に記載の方法。
11.修飾状態がメチル化修飾を包含する、実施形態1~10のいずれか一項に記載の方法。
12.他の塩基がシトシンを包含する、実施形態9~11のいずれか一項に記載の方法。
13.変換が、脱アミノ化試薬及び/又はメチル化感受性制限酵素による変換を含む、実施形態7~12のいずれか一項に記載の方法。
14.脱アミノ化試薬がバイサルファイト又はその類似体を包含する、実施形態13に記載の方法。
15.修飾状態の存在及び/又は含有量を決定する方法が、修飾状態を有するDNA領域又はその断片の存在及び/又は含有量を決定することを含む、実施形態1~14のいずれか一項に記載の方法。
16.修飾状態を有するDNA領域又はその断片の存在及び/又は含有量が配列決定によって検出される、実施形態1~15のいずれか一項に記載の方法。
17.膵腫瘍の存在又は進行が、DNA領域若しくはその断片の修飾状態の存在及び/又は参照レベルと比較してより高いDNA領域若しくはその断片の修飾状態の含有量を決定することによって決定される、実施形態1~16に記載の方法。
18.実施形態1のDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる配列を含む核酸。
19.配列番号60~160のいずれかから選択されるDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる配列を含む核酸。
20.実施形態2から選択される遺伝子を有するDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる配列を含む核酸。
21.実施形態18~20のいずれか1つに記載の核酸を含むキット。
22.実施形態18~20のいずれか一項に記載の核酸及び/又は実施形態21に記載のキットの、疾患検出産物の調製における、使用。
23.実施形態18~20のいずれか一項に記載の核酸及び/又は実施形態21に記載のキットの、膵腫瘍の存在及び/又は進行を評価するための、物質の調製における、使用。
24.実施形態18~20のいずれか一項に記載の核酸及び/又は実施形態21に記載のキットの、DNA領域又はその断片の修飾状態を決定するための物質の調製における、使用。
25.核酸を調製する方法であって、実施形態1から選択されるDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる核酸を、DNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて設計することを含む方法。
26.配列番号60~160のいずれか一つから選択されるDNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて、DNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる核酸を設計することを含む、核酸を調製する方法。
27.核酸を調製する方法であって、実施形態2の遺伝子を有するDNA領域、又はその相補的領域、又はその変換領域、又はその断片と結合することができる核酸を、DNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて設計することを含む方法。
28.DNA領域の修飾状態を決定するための核酸、核酸の組合せ及び/又はキットの、膵腫瘍の存在及び/又は進行を評価するための、物質の調製における、使用であって、決定のためのDNA領域が、実施形態1から選択されるDNA領域の配列、又はその相補的領域、又はその変換領域、又はその断片を含む使用。
29.核酸、核酸の組合せ及び/又はキットの、膵腫瘍の存在及び/又は進行を評価するための、物質の調製におけるDNA領域の修飾状態を決定するための、使用であって、決定のためのDNA領域が、配列番号60~160のいずれか一つから選択されるDNA領域の配列、又はその相補的領域、又はその変換領域、又はその断片を含む使用。
30.核酸、核酸の組合せ及び/又はキットの、膵腫瘍の存在及び/又は進行を評価するための、物質の調製におけるDNA領域の修飾状態を決定するための、使用であって、決定のためのDNA領域が、実施形態2から選択される遺伝子を有するDNA領域の配列、又はその相補的領域、又はその変換領域、又はその断片を含む使用。
31.修飾状態がメチル化修飾を包含する、実施形態29~30のいずれか1つの使用。
32.実施形態1~17のいずれか一項に記載の方法を実行することができるプログラムを記録した記憶媒体。
33.実施形態32の記憶媒体を含み、任意選択的に、記憶媒体に結合されたプロセッサをさらに含み、プロセッサは、記憶媒体に記憶されたプログラムに基づいて実行して、実施形態1~17のいずれか一項に記載の方法を実施するように構成される、デバイス。
18.実施形態1のDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる配列を含む核酸。
19.配列番号60~160のいずれかから選択されるDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる配列を含む核酸。
20.実施形態2から選択される遺伝子を有するDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる配列を含む核酸。
21.実施形態18~20のいずれか1つに記載の核酸を含むキット。
22.実施形態18~20のいずれか一項に記載の核酸及び/又は実施形態21に記載のキットの、疾患検出産物の調製における、使用。
23.実施形態18~20のいずれか一項に記載の核酸及び/又は実施形態21に記載のキットの、膵腫瘍の存在及び/又は進行を評価するための、物質の調製における、使用。
24.実施形態18~20のいずれか一項に記載の核酸及び/又は実施形態21に記載のキットの、DNA領域又はその断片の修飾状態を決定するための物質の調製における、使用。
25.核酸を調製する方法であって、実施形態1から選択されるDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる核酸を、DNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて設計することを含む方法。
26.配列番号60~160のいずれか一つから選択されるDNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて、DNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる核酸を設計することを含む、核酸を調製する方法。
27.核酸を調製する方法であって、実施形態2の遺伝子を有するDNA領域、又はその相補的領域、又はその変換領域、又はその断片と結合することができる核酸を、DNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて設計することを含む方法。
28.DNA領域の修飾状態を決定するための核酸、核酸の組合せ及び/又はキットの、膵腫瘍の存在及び/又は進行を評価するための、物質の調製における、使用であって、決定のためのDNA領域が、実施形態1から選択されるDNA領域の配列、又はその相補的領域、又はその変換領域、又はその断片を含む使用。
29.核酸、核酸の組合せ及び/又はキットの、膵腫瘍の存在及び/又は進行を評価するための、物質の調製におけるDNA領域の修飾状態を決定するための、使用であって、決定のためのDNA領域が、配列番号60~160のいずれか一つから選択されるDNA領域の配列、又はその相補的領域、又はその変換領域、又はその断片を含む使用。
30.核酸、核酸の組合せ及び/又はキットの、膵腫瘍の存在及び/又は進行を評価するための、物質の調製におけるDNA領域の修飾状態を決定するための、使用であって、決定のためのDNA領域が、実施形態2から選択される遺伝子を有するDNA領域の配列、又はその相補的領域、又はその変換領域、又はその断片を含む使用。
31.修飾状態がメチル化修飾を包含する、実施形態29~30のいずれか1つの使用。
32.実施形態1~17のいずれか一項に記載の方法を実行することができるプログラムを記録した記憶媒体。
33.実施形態32の記憶媒体を含み、任意選択的に、記憶媒体に結合されたプロセッサをさらに含み、プロセッサは、記憶媒体に記憶されたプログラムに基づいて実行して、実施形態1~17のいずれか一項に記載の方法を実施するように構成される、デバイス。
実施形態4
1.膵癌診断モデルの構築方法であって、
(1)対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベル、及び対象のCA19-9レベルを得ることと、
(2)メチル化状態又はレベルを用いた数理モデルを用いた計算によりメチル化スコアを求める工程と、
(3)メチル化スコアとCA19-9レベルとをデータマトリックスに組み合わせることと、
(4)データマトリックスに基づいて、膵癌診断モデルを構築することと、
を含む、膵癌診断モデルの構築方法。
2.方法が、以下:
DNA配列は、以下の遺伝子配列:SIX3、TLX2、CILP2又はその20kb上流若しくは下流内の配列のうちの1つ又は複数から選択され、
断片は、少なくとも1つのCpGジヌクレオチドを含み、
工程(1)は、対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを検出することを含み、
試料は、哺乳動物の組織、細胞又は体液、例えば膵臓組織又は血液からのものであり、
CA19-9レベルが、血液又は血漿CA19-9レベルであり、
工程(2)の数学的モデルはサポートベクターマシンモデルであり、
工程(4)の膵癌診断モデルは、ロジスティック回帰モデルである、
から選択される1つ又は複数の特徴をさらに包含する、実施形態1に記載の方法。
3.膵癌診断モデルを構築する方法であって、
(1)対象のゲノムDNAセグメントのメチル化ハプロタイプ分率及び配列決定デプスを得ることと、
場合により(2)メチル化ハプロタイプ分画及び配列決定デプスデータを前処理することと、
(3)特徴メチル化セグメントを得るためにクロスバリデーション増分特徴選択を行う工程と、
(4)特徴メチル化セグメントのメチル化検出結果の数理モデルを構築してメチル化スコアを取得することと、
(5)メチル化スコア及び対応するCA19-9レベルに基づいて膵癌診断モデルを構築することと、
を含む、膵癌診断モデルを構築する方法。
4.方法は、以下
工程(1)は、
1.1)対象の試料のDNAメチル化を検出して配列決定リードデータを得る工程、
1.2)アダプタ除去及び/又はスプライシング等のシーケンシングデータの任意の前処理する工程、
1.3)配列決定データを参照ゲノムとアラインメントして、メチル化セグメントの位置及び配列決定デプス情報を得る工程、
1.4)以下の式に従ってセグメントのメチル化ハプロタイプ分率(MHF)を計算する工程であって、
式中、iは標的メチル化領域を表し、hは標的メチル化ハプロタイプを表し、Niは標的メチル化領域に位置するリードの数を表し、Ni、hは標的メチル化ハプロタイプを包含するリードの数を表す、工程
を含み、
工程(2)は、(2.1)メチル化ハプロタイプ分率及び配列決定デプス情報データをデータマトリックスに組み合わせる工程、好ましくは、工程(2)は、2.2)データマトリックスから5~15%(例えば、10%)より高い欠損値割合を有する部位を除去する工程、及び/又は2.3)300(例えば、200未満)未満の深さを有する各データ点を欠損値として取得し、欠損値に衝突させる工程(例えば、K最近傍法を用いて)をさらに含み、
工程(3)は、数学的モデルを使用して、訓練データにおけるクロスバリデーション増分特徴選択を実施することを含み、数学的モデルのAUCを増加させるDNAセグメントは、特徴メチル化セグメントであり、
工程(5)は、メチル化スコアとCA19-9レベルとをデータマトリックスに結合し、データマトリックスに基づいて膵癌診断モデルを構築する工程、から選択される1つ又は複数の特徴をさらに包含する、実施形態3に記載の方法。
1.膵癌診断モデルの構築方法であって、
(1)対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベル、及び対象のCA19-9レベルを得ることと、
(2)メチル化状態又はレベルを用いた数理モデルを用いた計算によりメチル化スコアを求める工程と、
(3)メチル化スコアとCA19-9レベルとをデータマトリックスに組み合わせることと、
(4)データマトリックスに基づいて、膵癌診断モデルを構築することと、
を含む、膵癌診断モデルの構築方法。
2.方法が、以下:
DNA配列は、以下の遺伝子配列:SIX3、TLX2、CILP2又はその20kb上流若しくは下流内の配列のうちの1つ又は複数から選択され、
断片は、少なくとも1つのCpGジヌクレオチドを含み、
工程(1)は、対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを検出することを含み、
試料は、哺乳動物の組織、細胞又は体液、例えば膵臓組織又は血液からのものであり、
CA19-9レベルが、血液又は血漿CA19-9レベルであり、
工程(2)の数学的モデルはサポートベクターマシンモデルであり、
工程(4)の膵癌診断モデルは、ロジスティック回帰モデルである、
から選択される1つ又は複数の特徴をさらに包含する、実施形態1に記載の方法。
3.膵癌診断モデルを構築する方法であって、
(1)対象のゲノムDNAセグメントのメチル化ハプロタイプ分率及び配列決定デプスを得ることと、
場合により(2)メチル化ハプロタイプ分画及び配列決定デプスデータを前処理することと、
(3)特徴メチル化セグメントを得るためにクロスバリデーション増分特徴選択を行う工程と、
(4)特徴メチル化セグメントのメチル化検出結果の数理モデルを構築してメチル化スコアを取得することと、
(5)メチル化スコア及び対応するCA19-9レベルに基づいて膵癌診断モデルを構築することと、
を含む、膵癌診断モデルを構築する方法。
4.方法は、以下
工程(1)は、
1.1)対象の試料のDNAメチル化を検出して配列決定リードデータを得る工程、
1.2)アダプタ除去及び/又はスプライシング等のシーケンシングデータの任意の前処理する工程、
1.3)配列決定データを参照ゲノムとアラインメントして、メチル化セグメントの位置及び配列決定デプス情報を得る工程、
1.4)以下の式に従ってセグメントのメチル化ハプロタイプ分率(MHF)を計算する工程であって、
式中、iは標的メチル化領域を表し、hは標的メチル化ハプロタイプを表し、Niは標的メチル化領域に位置するリードの数を表し、Ni、hは標的メチル化ハプロタイプを包含するリードの数を表す、工程
を含み、
工程(2)は、(2.1)メチル化ハプロタイプ分率及び配列決定デプス情報データをデータマトリックスに組み合わせる工程、好ましくは、工程(2)は、2.2)データマトリックスから5~15%(例えば、10%)より高い欠損値割合を有する部位を除去する工程、及び/又は2.3)300(例えば、200未満)未満の深さを有する各データ点を欠損値として取得し、欠損値に衝突させる工程(例えば、K最近傍法を用いて)をさらに含み、
工程(3)は、数学的モデルを使用して、訓練データにおけるクロスバリデーション増分特徴選択を実施することを含み、数学的モデルのAUCを増加させるDNAセグメントは、特徴メチル化セグメントであり、
工程(5)は、メチル化スコアとCA19-9レベルとをデータマトリックスに結合し、データマトリックスに基づいて膵癌診断モデルを構築する工程、から選択される1つ又は複数の特徴をさらに包含する、実施形態3に記載の方法。
5.方法が、以下:
工程(4)の数学的モデルはベクトルマシン(SVM)モデルであり、
工程(4)におけるメチル化検出結果が、メチル化ハプロタイプ分率と配列決定デプスとの結合マトリックスであり、
工程(5)の膵癌診断モデルは、ロジスティック回帰モデルである、
から選択される1つ又は複数の特徴をさらに包含する、実施形態3又は4に記載の方法。
6.DNAメチル化を検出するための試薬若しくはデバイス、及びCA19-9レベルを検出するための試薬若しくはデバイスの、膵癌診断用キットの調製における、使用であって、DNAメチル化を検出するための試薬若しくはデバイスが、対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを決定するために使用される、使用。
7.使用が、以下:
DNA配列は、以下の遺伝子配列:SIX3、TLX2、CILP2、又はその20kb上流若しくは下流内の配列のうちの1つ又は複数から選択され、
断片は、少なくとも1つのCpGジヌクレオチドを含み、
DNAメチル化検出用試薬は、DNA配列又はその断片とハイブリダイズするプライマー分子を含み、プライマー分子は、亜硫酸塩処理後のDNA配列又はその断片を増幅することができ、
DNAメチル化検出用試薬は、DNA配列又はその断片とハイブリダイズするプローブ分子を含み、
CA19-9レベル検出用試薬は、免疫応答に基づく検出試薬であり、
キットはPCR反応試薬も含み、
キットは、バイサルファイト変換ベースのPCR、DNA配列決定、メチル化感受性制限エンドヌクレアーゼアッセイ、蛍光定量、メチル化感受性高分解能融解曲線アッセイ、チップベースのメチル化アトラス、質量分析から選択される1つ又は複数の方法で使用される試薬である、DNAメチル化を検出するための他の試薬も含み、
診断は、実施形態1~5のいずれか一項に記載の膵癌診断モデルを構築して演算を行い、スコアに基づいて膵癌を診断することを包含する、から選択される1つ又は複数の特徴をさらに包含する、実施形態6に記載の使用。
8.膵癌を診断するためのキットであって、
(a)DNAメチル化を検出するための試薬又はデバイスであって、対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを決定するために使用される、試薬又はデバイスと、
(b)CA19-9レベルを検出するための試薬又はデバイス
を含む、膵癌を診断するためのキット。
工程(4)の数学的モデルはベクトルマシン(SVM)モデルであり、
工程(4)におけるメチル化検出結果が、メチル化ハプロタイプ分率と配列決定デプスとの結合マトリックスであり、
工程(5)の膵癌診断モデルは、ロジスティック回帰モデルである、
から選択される1つ又は複数の特徴をさらに包含する、実施形態3又は4に記載の方法。
6.DNAメチル化を検出するための試薬若しくはデバイス、及びCA19-9レベルを検出するための試薬若しくはデバイスの、膵癌診断用キットの調製における、使用であって、DNAメチル化を検出するための試薬若しくはデバイスが、対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを決定するために使用される、使用。
7.使用が、以下:
DNA配列は、以下の遺伝子配列:SIX3、TLX2、CILP2、又はその20kb上流若しくは下流内の配列のうちの1つ又は複数から選択され、
断片は、少なくとも1つのCpGジヌクレオチドを含み、
DNAメチル化検出用試薬は、DNA配列又はその断片とハイブリダイズするプライマー分子を含み、プライマー分子は、亜硫酸塩処理後のDNA配列又はその断片を増幅することができ、
DNAメチル化検出用試薬は、DNA配列又はその断片とハイブリダイズするプローブ分子を含み、
CA19-9レベル検出用試薬は、免疫応答に基づく検出試薬であり、
キットはPCR反応試薬も含み、
キットは、バイサルファイト変換ベースのPCR、DNA配列決定、メチル化感受性制限エンドヌクレアーゼアッセイ、蛍光定量、メチル化感受性高分解能融解曲線アッセイ、チップベースのメチル化アトラス、質量分析から選択される1つ又は複数の方法で使用される試薬である、DNAメチル化を検出するための他の試薬も含み、
診断は、実施形態1~5のいずれか一項に記載の膵癌診断モデルを構築して演算を行い、スコアに基づいて膵癌を診断することを包含する、から選択される1つ又は複数の特徴をさらに包含する、実施形態6に記載の使用。
8.膵癌を診断するためのキットであって、
(a)DNAメチル化を検出するための試薬又はデバイスであって、対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを決定するために使用される、試薬又はデバイスと、
(b)CA19-9レベルを検出するための試薬又はデバイス
を含む、膵癌を診断するためのキット。
9.キットが、以下:
DNA配列は、以下の遺伝子配列:SIX3、TLX2、CILP2又はその20kb上流若しくは下流内の配列のうちの1つ又は複数から選択され、
断片は、少なくとも1つのCpGジヌクレオチドを含み、
DNAメチル化検出用試薬は、DNA配列又はその断片とハイブリダイズするプライマー分子を含み、プライマー分子は、亜硫酸塩処理後のDNA配列又はその断片を増幅することができ、
DNAメチル化検出用試薬は、DNA配列又はその断片とハイブリダイズするプローブ分子を含み、
CA19-9レベル検出用試薬は、免疫応答に基づく検出試薬であり、
キットはPCR反応試薬も含み、
キットは、DNAメチル化を検出するための他の試薬も含み、これらの試薬は、以下の方法:バイサルファイト変換ベースのPCR、DNA配列決定、メチル化感受性制限エンドヌクレアーゼアッセイ、蛍光定量、メチル化感受性高分解能融解曲線アッセイ、チップベースのメチル化アトラス、質量分析の1つ又は複数で使用される試薬である。から選択される1つ又はそれを超える特徴をさらに包含する、実施形態8に記載のキット。
10.メモリと、プロセッサと、メモリに記憶され、プロセッサ上で実行可能なコンピュータプログラムとを含み、プロセッサがプログラムを実行すると、以下の工程:
(1)対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベル、及び対象のCA19-9レベルを得る工程、
(2)メチル化状態又はレベルを用いた数理モデルを用いた計算によりメチル化スコアを求める工程、
(3)メチル化スコアとCA19-9レベルとをデータマトリックスに組み合わせる工程、
(4)データマトリックスに基づいて膵癌診断モデルを構築する工程、
任意に(5)膵癌スコアを得、膵癌スコアに基づいて、膵癌を診断する工程、
あるいは
(1)対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベル、及び対象のCA19-9レベルを得る工程、
(2)メチル化状態又はレベルを用いた数理モデルを用いた計算によりメチル化スコアを求める工程、
(3)以下に示すモデルに従って膵癌スコアを取得し、該膵癌スコアに基づいて膵癌を診断する工程であって、
式中、Mは工程(2)で計算された試料のメチル化スコアであり、Cは試料のCA19-9レベルである、工程
が実行され、
好ましくは、デバイスは、
DNA配列は、以下の遺伝子配列:SIX3、TLX2、CILP2又はその20kb上流若しくは下流内の配列のうちの1つ又は複数から選択され、
断片は、少なくとも1つのCpGジヌクレオチドを含み、
工程(1)は、対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを検出することを包含し、
試料は、哺乳動物の組織、細胞又は体液、例えば膵臓組織又は血液からのものであり、
CA19-9レベルが、血液又は血漿CA19-9レベルであり、
工程(2)の数学的モデルはサポートベクターマシンモデルであり、
工程(4)の膵癌診断モデルは、ロジスティック回帰モデルである、
から選択される1つ又は複数の特徴をさらに包含する
膵癌を診断するための、又は膵癌診断モデルを構築するための、デバイス。
DNA配列は、以下の遺伝子配列:SIX3、TLX2、CILP2又はその20kb上流若しくは下流内の配列のうちの1つ又は複数から選択され、
断片は、少なくとも1つのCpGジヌクレオチドを含み、
DNAメチル化検出用試薬は、DNA配列又はその断片とハイブリダイズするプライマー分子を含み、プライマー分子は、亜硫酸塩処理後のDNA配列又はその断片を増幅することができ、
DNAメチル化検出用試薬は、DNA配列又はその断片とハイブリダイズするプローブ分子を含み、
CA19-9レベル検出用試薬は、免疫応答に基づく検出試薬であり、
キットはPCR反応試薬も含み、
キットは、DNAメチル化を検出するための他の試薬も含み、これらの試薬は、以下の方法:バイサルファイト変換ベースのPCR、DNA配列決定、メチル化感受性制限エンドヌクレアーゼアッセイ、蛍光定量、メチル化感受性高分解能融解曲線アッセイ、チップベースのメチル化アトラス、質量分析の1つ又は複数で使用される試薬である。から選択される1つ又はそれを超える特徴をさらに包含する、実施形態8に記載のキット。
10.メモリと、プロセッサと、メモリに記憶され、プロセッサ上で実行可能なコンピュータプログラムとを含み、プロセッサがプログラムを実行すると、以下の工程:
(1)対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベル、及び対象のCA19-9レベルを得る工程、
(2)メチル化状態又はレベルを用いた数理モデルを用いた計算によりメチル化スコアを求める工程、
(3)メチル化スコアとCA19-9レベルとをデータマトリックスに組み合わせる工程、
(4)データマトリックスに基づいて膵癌診断モデルを構築する工程、
任意に(5)膵癌スコアを得、膵癌スコアに基づいて、膵癌を診断する工程、
あるいは
(1)対象の試料中のDNA配列若しくはその断片のメチル化レベル、又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベル、及び対象のCA19-9レベルを得る工程、
(2)メチル化状態又はレベルを用いた数理モデルを用いた計算によりメチル化スコアを求める工程、
(3)以下に示すモデルに従って膵癌スコアを取得し、該膵癌スコアに基づいて膵癌を診断する工程であって、
式中、Mは工程(2)で計算された試料のメチル化スコアであり、Cは試料のCA19-9レベルである、工程
が実行され、
好ましくは、デバイスは、
DNA配列は、以下の遺伝子配列:SIX3、TLX2、CILP2又はその20kb上流若しくは下流内の配列のうちの1つ又は複数から選択され、
断片は、少なくとも1つのCpGジヌクレオチドを含み、
工程(1)は、対象の試料中のDNA配列若しくはその断片のメチル化レベル又はDNA配列若しくはその断片中の1つ若しくは複数のCpGジヌクレオチドのメチル化状態若しくはレベルを検出することを包含し、
試料は、哺乳動物の組織、細胞又は体液、例えば膵臓組織又は血液からのものであり、
CA19-9レベルが、血液又は血漿CA19-9レベルであり、
工程(2)の数学的モデルはサポートベクターマシンモデルであり、
工程(4)の膵癌診断モデルは、ロジスティック回帰モデルである、
から選択される1つ又は複数の特徴をさらに包含する
膵癌を診断するための、又は膵癌診断モデルを構築するための、デバイス。
実施形態5
1.膵腫瘍の存在を決定し、膵腫瘍の発症又は発症のリスクを評価し、及び/又は膵腫瘍の進行を評価する方法であって、試験される試料中の遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1及び/又はEMX1又はそれらの断片を用いてDNA領域の修飾状態の存在及び/又は含有量を決定することを含む、方法。
2.膵腫瘍関連DNA領域のメチル化状態を評価する方法であって、試験される試料中の遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1、又はそれらの断片でDNA領域の修飾状態の存在及び/又は含有量を決定することを含む方法。
3.DNA領域が、ヒトchr2:74740686-74744275に由来し、ヒトchr8:25699246-25907950に由来し、ヒトchr12:4918342-4960278に由来し、ヒトchr13:37005635-37017019に由来し、ヒトchr1:63788730-63790797に由来し、ヒトchr1:248020501-248043438に由来し、ヒトchr2:176945511-176984670に由来し、ヒトchr6:137813336-137815531に由来し、ヒトchr7:155167513-155257526に由来し、ヒトchr19:51226605-51228981に由来し、ヒトchr7:19155091-19157295に由来し、及びヒトchr2:73147574-73162020、実施形態1~2のいずれか一項に記載の方法。
4.試験される試料中の核酸を得ることをさらに含む、実施形態1~3のいずれか一項に記載の方法。
5.核酸が無細胞核酸を包含する、実施形態4に記載の方法。
6.試験される試料が組織、細胞及び/又は体液を包含する、実施形態1~5のいずれか一項に記載の方法。
7.試験される試料が血漿を包含する、実施形態1~6のいずれか一項に記載の方法。
8.DNA領域又はその断片を変換することをさらに含む、実施形態1~7のいずれか一項に記載の方法。
9.修飾状態を有する塩基及び修飾状態を有さない塩基が、変換後に異なる物質を形成する、実施形態8に記載の方法。
10.修飾状態を有する塩基が、変換後に実質的に変化せず、修飾状態を有さない塩基が、変換後の塩基とは異なる他の塩基に変更されるか、又は変換後に切断される、実施形態1~9のいずれか一項に記載の方法。
11.塩基がシトシンを包含する、実施形態9~10のいずれか一項に記載の方法。
12.修飾状態がメチル化修飾を包含する、実施形態1~11のいずれか一項に記載の方法。
13.他の塩基がシトシンを包含する、実施形態10~12のいずれか一項に記載の方法。
14.変換が、脱アミノ化試薬及び/又はメチル化感受性制限酵素による変換を含む、実施形態8~13のいずれか一項に記載の方法。
15.脱アミノ化試薬がバイサルファイト又はその類似体を包含する、実施形態14に記載の方法。
1.膵腫瘍の存在を決定し、膵腫瘍の発症又は発症のリスクを評価し、及び/又は膵腫瘍の進行を評価する方法であって、試験される試料中の遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1及び/又はEMX1又はそれらの断片を用いてDNA領域の修飾状態の存在及び/又は含有量を決定することを含む、方法。
2.膵腫瘍関連DNA領域のメチル化状態を評価する方法であって、試験される試料中の遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1、又はそれらの断片でDNA領域の修飾状態の存在及び/又は含有量を決定することを含む方法。
3.DNA領域が、ヒトchr2:74740686-74744275に由来し、ヒトchr8:25699246-25907950に由来し、ヒトchr12:4918342-4960278に由来し、ヒトchr13:37005635-37017019に由来し、ヒトchr1:63788730-63790797に由来し、ヒトchr1:248020501-248043438に由来し、ヒトchr2:176945511-176984670に由来し、ヒトchr6:137813336-137815531に由来し、ヒトchr7:155167513-155257526に由来し、ヒトchr19:51226605-51228981に由来し、ヒトchr7:19155091-19157295に由来し、及びヒトchr2:73147574-73162020、実施形態1~2のいずれか一項に記載の方法。
4.試験される試料中の核酸を得ることをさらに含む、実施形態1~3のいずれか一項に記載の方法。
5.核酸が無細胞核酸を包含する、実施形態4に記載の方法。
6.試験される試料が組織、細胞及び/又は体液を包含する、実施形態1~5のいずれか一項に記載の方法。
7.試験される試料が血漿を包含する、実施形態1~6のいずれか一項に記載の方法。
8.DNA領域又はその断片を変換することをさらに含む、実施形態1~7のいずれか一項に記載の方法。
9.修飾状態を有する塩基及び修飾状態を有さない塩基が、変換後に異なる物質を形成する、実施形態8に記載の方法。
10.修飾状態を有する塩基が、変換後に実質的に変化せず、修飾状態を有さない塩基が、変換後の塩基とは異なる他の塩基に変更されるか、又は変換後に切断される、実施形態1~9のいずれか一項に記載の方法。
11.塩基がシトシンを包含する、実施形態9~10のいずれか一項に記載の方法。
12.修飾状態がメチル化修飾を包含する、実施形態1~11のいずれか一項に記載の方法。
13.他の塩基がシトシンを包含する、実施形態10~12のいずれか一項に記載の方法。
14.変換が、脱アミノ化試薬及び/又はメチル化感受性制限酵素による変換を含む、実施形態8~13のいずれか一項に記載の方法。
15.脱アミノ化試薬がバイサルファイト又はその類似体を包含する、実施形態14に記載の方法。
16.修飾状態の存在及び/又は含有量を決定するための方法が、変換後の修飾状態を有する塩基によって形成される物質の存在及び/又は含有量を決定することを含む、実施形態1~15のいずれか一項に記載の方法。
17.修飾状態の存在及び/又は含有量を決定する方法が、修飾状態を有するDNA領域又はその断片の存在及び/又は含有量を決定することを含む、実施形態1~16のいずれか一項に記載の方法。
18.修飾状態を有するDNA領域又はその断片の存在及び/又は含有量が、蛍光PCR法によって検出される蛍光Ct値によって決定される、実施形態1~17のいずれか一項に記載の方法。
19.膵腫瘍の存在、又は膵腫瘍の発症若しくは発症のリスクが、DNA領域若しくはその断片の修飾状態の存在及び/又はDNA領域若しくはその断片の修飾状態の含有量が参照レベルに対してより高いことを決定することによって決定される、実施形態1~18のいずれか一項に記載の方法。
20.DNA領域又はその断片の修飾状態の存在及び/又は含有量を決定する前に、試験される試料中のDNA領域又はその断片を増幅することをさらに含む、実施形態1~19のいずれか一項に記載の方法。
21.増幅がPCR増幅を含む、実施形態20に記載の方法。
22.試験される試料中の、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来する、DNA領域又はその相補的領域、又はその断片からなる群から選択されるDNA領域の修飾状態の存在及び/又は含有量を決定することを含む、疾患の存在を決定する、疾患の発症若しくは発症のリスクを評価する、及び/又は疾患の進行を評価する方法。
23.試験される試料中の、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来する、DNA領域又はその相補的領域、又はその断片からなる群から選択されるDNA領域の修飾状態の存在及び/又は含有量を決定することを含む、DNA領域のメチル化状態を決定する方法。
17.修飾状態の存在及び/又は含有量を決定する方法が、修飾状態を有するDNA領域又はその断片の存在及び/又は含有量を決定することを含む、実施形態1~16のいずれか一項に記載の方法。
18.修飾状態を有するDNA領域又はその断片の存在及び/又は含有量が、蛍光PCR法によって検出される蛍光Ct値によって決定される、実施形態1~17のいずれか一項に記載の方法。
19.膵腫瘍の存在、又は膵腫瘍の発症若しくは発症のリスクが、DNA領域若しくはその断片の修飾状態の存在及び/又はDNA領域若しくはその断片の修飾状態の含有量が参照レベルに対してより高いことを決定することによって決定される、実施形態1~18のいずれか一項に記載の方法。
20.DNA領域又はその断片の修飾状態の存在及び/又は含有量を決定する前に、試験される試料中のDNA領域又はその断片を増幅することをさらに含む、実施形態1~19のいずれか一項に記載の方法。
21.増幅がPCR増幅を含む、実施形態20に記載の方法。
22.試験される試料中の、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来する、DNA領域又はその相補的領域、又はその断片からなる群から選択されるDNA領域の修飾状態の存在及び/又は含有量を決定することを含む、疾患の存在を決定する、疾患の発症若しくは発症のリスクを評価する、及び/又は疾患の進行を評価する方法。
23.試験される試料中の、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来する、DNA領域又はその相補的領域、又はその断片からなる群から選択されるDNA領域の修飾状態の存在及び/又は含有量を決定することを含む、DNA領域のメチル化状態を決定する方法。
24.配列番号164,168,172,176,180,184,188,192,196,200,204,208,212,216,220,224,228及び232からなる群から選択されるDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる核酸を提供することを含む、実施形態22~23のいずれか一項に記載の方法。
25、ヒトchr2:74743042-74743113に由来する及びヒトchr2:74743157-74743253に由来する、ヒトchr2:74743042-74743113に由来する及びヒトchr2:74743157-74743253に由来する、ヒトchr8:25907865-25907930に由来する及びヒトchr8:25907698-25907814に由来する、ヒトchr12:4919188-4919272に由来する、ヒトchr12:4919036-4919164に由来する及びヒトchr12:4919341-4919438に由来する、ヒトchr13:37005652-37005721に由来する、ヒトchr13:37005458-37005596に由来する及びヒトchr13:37005694-37005824に由来する、ヒトchr1:63788850-63788913に由来する、ヒトchr1:248020635-248020731に由来する、ヒトchr2:176945521-176945603に由来する、ヒトchr6:137814750-137814815に由来する、ヒトchr7:155167531-155167610に由来する、ヒトchr19:51228620-51228722に由来する、及びヒトchr7:19156779-19157914に由来する、及びヒトchr2:73147571-73147626に由来する、DNA領域、又はその相補的領域、又はその変換領域、又はその断片からなる群から選択されるDNA領域に結合することができる核酸を提供することを含む、実施形態22~24のいずれか一項に記載の方法。
26.配列番号165、169、173、177、181、185、189、193、197、201、205、209、213、217、221、225、229、及び233からなる群から選択される核酸、又はその相補的核酸、又はその断片を提供することを含む、実施形態22~25のいずれか一項に記載の方法。
27.配列番号166及び167、170及び171、174及び175、178及び179、182及び183、186及び187、190及び191、194及び195、198及び199、202及び203、206及び207、210及び211、214及び215、218及び219、222及び223、226及び227、230及び231、並びに234及び235からなる群から選択される核酸の組合せ、又はそれらの相補的核酸の組合せ、又はそれらの断片を提供することを含む、実施形態22~26のいずれか一項に記載の方法。
28.疾患が腫瘍を包含する、実施形態22~27のいずれか一項に記載の方法。
29.試験される試料中の核酸を得ることをさらに含む、実施形態22~28のいずれか一項に記載の方法。
30.核酸が無細胞核酸を包含する、実施形態29に記載の方法。
31.試験される試料が組織、細胞及び/又は体液を包含する、実施形態22~30のいずれか一項に記載の方法。
32.試験される試料が血漿を包含する、実施形態22~31のいずれか一項に記載の方法。
33.DNA領域又はその断片を変換することをさらに含む、実施形態22~32のいずれか一項に記載の方法。
34.修飾状態を有する塩基及び修飾状態を有さない塩基が、変換後に異なる物質を形成する、実施形態33に記載の方法。
25、ヒトchr2:74743042-74743113に由来する及びヒトchr2:74743157-74743253に由来する、ヒトchr2:74743042-74743113に由来する及びヒトchr2:74743157-74743253に由来する、ヒトchr8:25907865-25907930に由来する及びヒトchr8:25907698-25907814に由来する、ヒトchr12:4919188-4919272に由来する、ヒトchr12:4919036-4919164に由来する及びヒトchr12:4919341-4919438に由来する、ヒトchr13:37005652-37005721に由来する、ヒトchr13:37005458-37005596に由来する及びヒトchr13:37005694-37005824に由来する、ヒトchr1:63788850-63788913に由来する、ヒトchr1:248020635-248020731に由来する、ヒトchr2:176945521-176945603に由来する、ヒトchr6:137814750-137814815に由来する、ヒトchr7:155167531-155167610に由来する、ヒトchr19:51228620-51228722に由来する、及びヒトchr7:19156779-19157914に由来する、及びヒトchr2:73147571-73147626に由来する、DNA領域、又はその相補的領域、又はその変換領域、又はその断片からなる群から選択されるDNA領域に結合することができる核酸を提供することを含む、実施形態22~24のいずれか一項に記載の方法。
26.配列番号165、169、173、177、181、185、189、193、197、201、205、209、213、217、221、225、229、及び233からなる群から選択される核酸、又はその相補的核酸、又はその断片を提供することを含む、実施形態22~25のいずれか一項に記載の方法。
27.配列番号166及び167、170及び171、174及び175、178及び179、182及び183、186及び187、190及び191、194及び195、198及び199、202及び203、206及び207、210及び211、214及び215、218及び219、222及び223、226及び227、230及び231、並びに234及び235からなる群から選択される核酸の組合せ、又はそれらの相補的核酸の組合せ、又はそれらの断片を提供することを含む、実施形態22~26のいずれか一項に記載の方法。
28.疾患が腫瘍を包含する、実施形態22~27のいずれか一項に記載の方法。
29.試験される試料中の核酸を得ることをさらに含む、実施形態22~28のいずれか一項に記載の方法。
30.核酸が無細胞核酸を包含する、実施形態29に記載の方法。
31.試験される試料が組織、細胞及び/又は体液を包含する、実施形態22~30のいずれか一項に記載の方法。
32.試験される試料が血漿を包含する、実施形態22~31のいずれか一項に記載の方法。
33.DNA領域又はその断片を変換することをさらに含む、実施形態22~32のいずれか一項に記載の方法。
34.修飾状態を有する塩基及び修飾状態を有さない塩基が、変換後に異なる物質を形成する、実施形態33に記載の方法。
35.修飾状態を有する塩基が、変換後に実質的に変化せず、修飾状態を有さない塩基が、変換後の塩基とは異なる他の塩基に変更されるか、又は変換後に切断される、実施形態22~34のいずれか一項に記載の方法。
36.塩基がシトシンを包含する、実施形態34~35のいずれか一項に記載の方法。
37.修飾状態がメチル化修飾を包含する、実施形態22~36のいずれか一項に記載の方法。
38.他の塩基がシトシンを包含する、実施形態35~37のいずれか一項に記載の方法。
39.変換が、脱アミノ化試薬及び/又はメチル化感受性制限酵素による変換を含む、実施形態33~38のいずれか一項に記載の方法。
40.脱アミノ化試薬がバイサルファイト又はその類似体を包含する、実施形態39に記載の方法。
41.修飾状態の存在及び/又は含有量を決定するための方法が、変換後の修飾状態を有する塩基によって形成される物質の存在及び/又は含有量を決定することを含む、実施形態22~40のいずれか一項に記載の方法。
42.修飾状態の存在及び/又は含有量を決定する方法が、修飾状態を有するDNA領域又はその断片の存在及び/又は含有量を決定することを含む、実施形態22~41のいずれか一項に記載の方法。
43.修飾状態を有するDNA領域又はその断片の存在及び/又は含有量が、蛍光PCR法によって検出される蛍光Ct値によって決定される、実施形態22~42のいずれか一項に記載の方法。
44.膵腫瘍の存在、又は膵腫瘍の発症若しくは発症のリスクが、DNA領域若しくはその断片の修飾状態の存在及び/又はDNA領域若しくはその断片の修飾状態の含有量が参照レベルに対してより高いことを決定することによって決定される、実施形態22~43のいずれか一項に記載の方法。
45.DNA領域又はその断片の修飾状態の存在及び/又は含有量を決定する前に、試験される試料中のDNA領域又はその断片を増幅することをさらに含む、実施形態22~44のいずれか一項に記載の方法。
46.増幅がPCR増幅を含む、実施形態45に記載の方法。
47.遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる配列を含む核酸。
48.DNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1でDNA領域に結合することができる核酸、又はその相補的領域、又はその変換領域、又はその断片を設計することを含む、核酸を調製する方法。
49.遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる配列を含む、核酸の組合せ。
50.DNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域を増幅することができる核酸の組合せ、又はその相補的領域、又はその変換領域、又はその断片を設計することを含む、核酸の組合せを調製する方法。
36.塩基がシトシンを包含する、実施形態34~35のいずれか一項に記載の方法。
37.修飾状態がメチル化修飾を包含する、実施形態22~36のいずれか一項に記載の方法。
38.他の塩基がシトシンを包含する、実施形態35~37のいずれか一項に記載の方法。
39.変換が、脱アミノ化試薬及び/又はメチル化感受性制限酵素による変換を含む、実施形態33~38のいずれか一項に記載の方法。
40.脱アミノ化試薬がバイサルファイト又はその類似体を包含する、実施形態39に記載の方法。
41.修飾状態の存在及び/又は含有量を決定するための方法が、変換後の修飾状態を有する塩基によって形成される物質の存在及び/又は含有量を決定することを含む、実施形態22~40のいずれか一項に記載の方法。
42.修飾状態の存在及び/又は含有量を決定する方法が、修飾状態を有するDNA領域又はその断片の存在及び/又は含有量を決定することを含む、実施形態22~41のいずれか一項に記載の方法。
43.修飾状態を有するDNA領域又はその断片の存在及び/又は含有量が、蛍光PCR法によって検出される蛍光Ct値によって決定される、実施形態22~42のいずれか一項に記載の方法。
44.膵腫瘍の存在、又は膵腫瘍の発症若しくは発症のリスクが、DNA領域若しくはその断片の修飾状態の存在及び/又はDNA領域若しくはその断片の修飾状態の含有量が参照レベルに対してより高いことを決定することによって決定される、実施形態22~43のいずれか一項に記載の方法。
45.DNA領域又はその断片の修飾状態の存在及び/又は含有量を決定する前に、試験される試料中のDNA領域又はその断片を増幅することをさらに含む、実施形態22~44のいずれか一項に記載の方法。
46.増幅がPCR増幅を含む、実施形態45に記載の方法。
47.遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる配列を含む核酸。
48.DNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1でDNA領域に結合することができる核酸、又はその相補的領域、又はその変換領域、又はその断片を設計することを含む、核酸を調製する方法。
49.遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる配列を含む、核酸の組合せ。
50.DNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域を増幅することができる核酸の組合せ、又はその相補的領域、又はその変換領域、又はその断片を設計することを含む、核酸の組合せを調製する方法。
51.実施形態47の核酸及び/又は実施形態49の核酸の組合せを含むキット。
52.実施形態47に記載の核酸、実施形態49に記載の核酸の組合せ、及び/又は実施形態51に記載のキットの、疾患検出産物の調製における、使用。
53.実施形態47の核酸、実施形態49の核酸の組合せ及び/又は実施形態51のキットの、疾患の存在を決定するための、疾患の発症若しくは発症のリスクを評価するための、及び/又は疾患の進行を評価するための、物質の調製における、使用。
54.実施形態47の核酸、実施形態49の核酸の組合せ及び/又は実施形態51のキットの、DNA領域又はその断片の修飾状態を決定するための物質の調製における、使用。
55.DNA領域の修飾状態を決定するための核酸、核酸の組合せ及び/又はキットの、膵腫瘍の存在を決定するための、膵腫瘍の発症若しくは発症のリスクを評価するための、及び/又は膵腫瘍の進行を評価するための、物質の調製における、使用であって、決定のためのDNA領域が、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1及び/又はEMX1を有するDNA領域、又はそれらの断片を包含する、使用。
56.DNA領域の修飾状態を決定するための核酸、核酸の組合せ及び/又はキットの、疾患の存在を決定するための、疾患の発症又は発症のリスクを評価するための、及び/又は疾患の進行を評価するための、物質の調製における、使用であって、DNA領域が、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来する、DNA領域、又はその相補的領域、又はその断片からなる群から選択されるDNA領域を包含する、使用。
57.遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域の核酸、又はその変換された領域、又はその断片、及び上記の核酸の組合せの、膵腫瘍の存在を決定するための、膵腫瘍の発症若しくは発症のリスクを評価するための、及び/又は膵腫瘍の進行を評価するための、物質の調製における、使用。
58.ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来するDNA領域、若しくはその相補的領域、又はその変換領域、若しくはその断片、並びに上記の核酸の組合せからなる群から選択されるDNA領域の核酸の、疾患の存在、疾患の発症若しくは発症のリスクを決定し、及び/又は疾患の進行を評価するための、物質の調製における、使用。
52.実施形態47に記載の核酸、実施形態49に記載の核酸の組合せ、及び/又は実施形態51に記載のキットの、疾患検出産物の調製における、使用。
53.実施形態47の核酸、実施形態49の核酸の組合せ及び/又は実施形態51のキットの、疾患の存在を決定するための、疾患の発症若しくは発症のリスクを評価するための、及び/又は疾患の進行を評価するための、物質の調製における、使用。
54.実施形態47の核酸、実施形態49の核酸の組合せ及び/又は実施形態51のキットの、DNA領域又はその断片の修飾状態を決定するための物質の調製における、使用。
55.DNA領域の修飾状態を決定するための核酸、核酸の組合せ及び/又はキットの、膵腫瘍の存在を決定するための、膵腫瘍の発症若しくは発症のリスクを評価するための、及び/又は膵腫瘍の進行を評価するための、物質の調製における、使用であって、決定のためのDNA領域が、遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1及び/又はEMX1を有するDNA領域、又はそれらの断片を包含する、使用。
56.DNA領域の修飾状態を決定するための核酸、核酸の組合せ及び/又はキットの、疾患の存在を決定するための、疾患の発症又は発症のリスクを評価するための、及び/又は疾患の進行を評価するための、物質の調製における、使用であって、DNA領域が、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来する、DNA領域、又はその相補的領域、又はその断片からなる群から選択されるDNA領域を包含する、使用。
57.遺伝子TLX2、EBF2、KCNA6、CCNA1、FOXD3、TRIM58、HOXD10、OLIG3、EN2、CLEC11A、TWIST1、及び/又はEMX1を有するDNA領域の核酸、又はその変換された領域、又はその断片、及び上記の核酸の組合せの、膵腫瘍の存在を決定するための、膵腫瘍の発症若しくは発症のリスクを評価するための、及び/又は膵腫瘍の進行を評価するための、物質の調製における、使用。
58.ヒトchr2:74743035-74743151に由来する、及びヒトchr2:74743080-74743301に由来する、ヒトchr8:25907849-25907950に由来する、及びヒトchr8:25907698-25907894に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr12:4918991-4919187に由来する、及びヒトchr12:4919235-4919439に由来する、ヒトchr13:37005635-37005754に由来する、ヒトchr13:37005458-37005653に由来する、及びヒトchr13:37005680-37005904に由来する、ヒトchr1:63788812-63788952に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr2:176945511-176945630に由来する、ヒトchr6:137814700-137814853に由来する、ヒトchr7:155167513-155167628に由来する、ヒトchr19:51228168-51228782に由来する、及びヒトchr7:19156739-19157277に由来する、及びヒトchr2:73147525-73147644に由来するDNA領域、若しくはその相補的領域、又はその変換領域、若しくはその断片、並びに上記の核酸の組合せからなる群から選択されるDNA領域の核酸の、疾患の存在、疾患の発症若しくは発症のリスクを決定し、及び/又は疾患の進行を評価するための、物質の調製における、使用。
59.実施形態1~46のいずれか一項に記載の方法を実行することができるプログラムを記録した記憶媒体。
60.実施形態59に記載の記憶媒体を含むデバイス。
61.記憶媒体に結合されたプロセッサをさらに含み、プロセッサが、記憶媒体に記憶されたプログラムに基づいて実行して、実施形態1~46のいずれか一項に記載の方法を実施するように構成される、実施形態60に記載のデバイス。
実施形態6
1.膵腫瘍の存在を決定し、膵腫瘍の発症又は発症のリスクを評価し、及び/又は膵腫瘍の進行を評価する方法であって、試験される試料中のEBF2、並びにCCNA1、KCNA6、TLX2、及びEMX1、TRIM58、TWIST1、FOXD3、及びEN2、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3、又はそれらの断片からなる群から選択される2つの遺伝子によるDNA領域の修飾状態の存在及び/又は含有量を決定することを含む方法。
2.膵腫瘍関連DNA領域のメチル化状態を評価する方法であって、試験される試料中の、EBF2、並びにCCNA1、KCNA6、TLX2、及びEMX1、TRIM58、TWIST1、FOXD3、及びEN2、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される2つの遺伝子、又はそれらの断片を有するDNA領域の修飾状態の存在及び/又は含有量を決定することを含む方法。
3.DNA領域が、ヒトchr8:25699246-25907950に由来する、及びヒトchr13:37005635-37017019に由来する、ヒトchr12:4918342-4960278に由来する、ヒトchr2:74740686-74744275に由来する、及びヒトchr2:73147574-73162020に由来する、ヒトchr1:248020501-248043438に由来する、ヒトchr7:19155091-19157295に由来する、ヒトchr1:63788730-63790797に由来する、及びヒトchr7:155167513-155257526に由来する、ヒトchr1:248020501-248043438に由来する、ヒトchr7:19155091-19157295に由来する、ヒトchr19:51226605-51228981に由来する、ヒトchr2:176945511-176984670に由来する、及びヒトchr6:137813336-137815531に由来するDNA領域からなる群のうちの2つから選択される、実施形態1~2のいずれか一項に記載の方法。
4.試験される試料中の核酸を得ることをさらに含む、実施形態1~3のいずれか一項に記載の方法。
5.核酸が無細胞核酸を包含する、実施形態4に記載の方法。
6.試験される試料が組織、細胞及び/又は体液を包含する、実施形態1~5のいずれか一項に記載の方法。
7.試験される試料が血漿を包含する、実施形態1~6のいずれか一項に記載の方法。
8.DNA領域又はその断片を変換することをさらに含む、実施形態1~7のいずれか一項に記載の方法。
60.実施形態59に記載の記憶媒体を含むデバイス。
61.記憶媒体に結合されたプロセッサをさらに含み、プロセッサが、記憶媒体に記憶されたプログラムに基づいて実行して、実施形態1~46のいずれか一項に記載の方法を実施するように構成される、実施形態60に記載のデバイス。
実施形態6
1.膵腫瘍の存在を決定し、膵腫瘍の発症又は発症のリスクを評価し、及び/又は膵腫瘍の進行を評価する方法であって、試験される試料中のEBF2、並びにCCNA1、KCNA6、TLX2、及びEMX1、TRIM58、TWIST1、FOXD3、及びEN2、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3、又はそれらの断片からなる群から選択される2つの遺伝子によるDNA領域の修飾状態の存在及び/又は含有量を決定することを含む方法。
2.膵腫瘍関連DNA領域のメチル化状態を評価する方法であって、試験される試料中の、EBF2、並びにCCNA1、KCNA6、TLX2、及びEMX1、TRIM58、TWIST1、FOXD3、及びEN2、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される2つの遺伝子、又はそれらの断片を有するDNA領域の修飾状態の存在及び/又は含有量を決定することを含む方法。
3.DNA領域が、ヒトchr8:25699246-25907950に由来する、及びヒトchr13:37005635-37017019に由来する、ヒトchr12:4918342-4960278に由来する、ヒトchr2:74740686-74744275に由来する、及びヒトchr2:73147574-73162020に由来する、ヒトchr1:248020501-248043438に由来する、ヒトchr7:19155091-19157295に由来する、ヒトchr1:63788730-63790797に由来する、及びヒトchr7:155167513-155257526に由来する、ヒトchr1:248020501-248043438に由来する、ヒトchr7:19155091-19157295に由来する、ヒトchr19:51226605-51228981に由来する、ヒトchr2:176945511-176984670に由来する、及びヒトchr6:137813336-137815531に由来するDNA領域からなる群のうちの2つから選択される、実施形態1~2のいずれか一項に記載の方法。
4.試験される試料中の核酸を得ることをさらに含む、実施形態1~3のいずれか一項に記載の方法。
5.核酸が無細胞核酸を包含する、実施形態4に記載の方法。
6.試験される試料が組織、細胞及び/又は体液を包含する、実施形態1~5のいずれか一項に記載の方法。
7.試験される試料が血漿を包含する、実施形態1~6のいずれか一項に記載の方法。
8.DNA領域又はその断片を変換することをさらに含む、実施形態1~7のいずれか一項に記載の方法。
9.修飾状態を有する塩基及び修飾状態を有さない塩基が、変換後に異なる物質を形成する、実施形態8に記載の方法。
10.修飾状態を有する塩基が、変換後に実質的に変化せず、修飾状態を有さない塩基が、変換後の塩基とは異なる他の塩基に変更されるか、又は変換後に切断される、実施形態1~9のいずれか一項に記載の方法。
11.塩基がシトシンを包含する、実施形態9~10のいずれか一項に記載の方法。
12.修飾状態がメチル化修飾を包含する、実施形態1~11のいずれか一項に記載の方法。
13.他の塩基がシトシンを包含する、実施形態10~12のいずれか一項に記載の方法。
14.変換が、脱アミノ化試薬及び/又はメチル化感受性制限酵素による変換を含む、実施形態8~13のいずれか一項に記載の方法。
15.脱アミノ化試薬がバイサルファイト又はその類似体を包含する、実施形態14に記載の方法。
16.修飾状態の存在及び/又は含有量を決定するための方法が、変換後の修飾状態を有する塩基によって形成される物質の存在及び/又は含有量を決定することを含む、実施形態1~15のいずれか一項に記載の方法。
17.修飾状態の存在及び/又は含有量を決定する方法が、修飾状態を有するDNA領域又はその断片の存在及び/又は含有量を決定することを含む、実施形態1~16のいずれか一項に記載の方法。
18.修飾状態を有するDNA領域又はその断片の存在及び/又は含有量が、蛍光PCR法によって検出される蛍光Ct値によって決定される、実施形態1~17のいずれか一項に記載の方法。
19.膵腫瘍の存在、又は膵腫瘍の発症若しくは発症のリスクが、DNA領域若しくはその断片の修飾状態の存在及び/又はDNA領域若しくはその断片の修飾状態の含有量が参照レベルに対してより高いことを決定することによって決定される、実施形態1~18のいずれか一項に記載の方法。
20.DNA領域又はその断片の修飾状態の存在及び/又は含有量を決定する前に、試験される試料中のDNA領域又はその断片を増幅することをさらに含む、実施形態1~19のいずれか一項に記載の方法。
21.増幅がPCR増幅を含む、実施形態20に記載の方法。
22.試験される試料中の、ヒトchr8:25907849-25907950に由来する、及びヒトchr13:37005635-37005754に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:73147525-73147644に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr1:63788812-63788952に由来する、及びヒトchr7:155167513-155167628に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr19:51228168-51228782に由来する、ヒトchr2:176945511-176945630に由来する、及びヒトchr6:137814700-137814853に由来する、DNA領域又はその相補的領域、又はその断片からなる群から選択される2つのDNA領域の修飾状態の存在及び/又は含有量を決定することを含む、疾患の存在を決定する、疾患の発症若しくは発症のリスクを評価する、及び/又は疾患の進行を評価する方法。
23.DNA領域のメチル化状態を決定する方法であって、試験される試料中の、ヒトchr8:25907849-25907950に由来する、及びヒトchr13:37005635-37005754に由来する、又はヒトchr12:4919142-4919289に由来する、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:73147525-73147644に由来する、又はヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr1:63788812-63788952に由来する、及びヒトchr7:155167513-155167628に由来する、又はヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr19:51228168-51228782に由来する、ヒトchr2:176945511-176945630に由来する、及びヒトchr6:137814700-137814853に由来する、DNA領域又はその相補的領域、又はその断片からなる群から選択される2つのDNA領域の修飾状態の存在及び/又は含有量を決定することを含む、DNA領域のメチル化状態を決定する方法。
10.修飾状態を有する塩基が、変換後に実質的に変化せず、修飾状態を有さない塩基が、変換後の塩基とは異なる他の塩基に変更されるか、又は変換後に切断される、実施形態1~9のいずれか一項に記載の方法。
11.塩基がシトシンを包含する、実施形態9~10のいずれか一項に記載の方法。
12.修飾状態がメチル化修飾を包含する、実施形態1~11のいずれか一項に記載の方法。
13.他の塩基がシトシンを包含する、実施形態10~12のいずれか一項に記載の方法。
14.変換が、脱アミノ化試薬及び/又はメチル化感受性制限酵素による変換を含む、実施形態8~13のいずれか一項に記載の方法。
15.脱アミノ化試薬がバイサルファイト又はその類似体を包含する、実施形態14に記載の方法。
16.修飾状態の存在及び/又は含有量を決定するための方法が、変換後の修飾状態を有する塩基によって形成される物質の存在及び/又は含有量を決定することを含む、実施形態1~15のいずれか一項に記載の方法。
17.修飾状態の存在及び/又は含有量を決定する方法が、修飾状態を有するDNA領域又はその断片の存在及び/又は含有量を決定することを含む、実施形態1~16のいずれか一項に記載の方法。
18.修飾状態を有するDNA領域又はその断片の存在及び/又は含有量が、蛍光PCR法によって検出される蛍光Ct値によって決定される、実施形態1~17のいずれか一項に記載の方法。
19.膵腫瘍の存在、又は膵腫瘍の発症若しくは発症のリスクが、DNA領域若しくはその断片の修飾状態の存在及び/又はDNA領域若しくはその断片の修飾状態の含有量が参照レベルに対してより高いことを決定することによって決定される、実施形態1~18のいずれか一項に記載の方法。
20.DNA領域又はその断片の修飾状態の存在及び/又は含有量を決定する前に、試験される試料中のDNA領域又はその断片を増幅することをさらに含む、実施形態1~19のいずれか一項に記載の方法。
21.増幅がPCR増幅を含む、実施形態20に記載の方法。
22.試験される試料中の、ヒトchr8:25907849-25907950に由来する、及びヒトchr13:37005635-37005754に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:73147525-73147644に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr1:63788812-63788952に由来する、及びヒトchr7:155167513-155167628に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr19:51228168-51228782に由来する、ヒトchr2:176945511-176945630に由来する、及びヒトchr6:137814700-137814853に由来する、DNA領域又はその相補的領域、又はその断片からなる群から選択される2つのDNA領域の修飾状態の存在及び/又は含有量を決定することを含む、疾患の存在を決定する、疾患の発症若しくは発症のリスクを評価する、及び/又は疾患の進行を評価する方法。
23.DNA領域のメチル化状態を決定する方法であって、試験される試料中の、ヒトchr8:25907849-25907950に由来する、及びヒトchr13:37005635-37005754に由来する、又はヒトchr12:4919142-4919289に由来する、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:73147525-73147644に由来する、又はヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr1:63788812-63788952に由来する、及びヒトchr7:155167513-155167628に由来する、又はヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr19:51228168-51228782に由来する、ヒトchr2:176945511-176945630に由来する、及びヒトchr6:137814700-137814853に由来する、DNA領域又はその相補的領域、又はその断片からなる群から選択される2つのDNA領域の修飾状態の存在及び/又は含有量を決定することを含む、DNA領域のメチル化状態を決定する方法。
24.配列番号1及び5、又はそれらの相補的領域、又はそれらの変換領域、又はそれらの断片からなる群から選択される2つのDNA領域に結合することができる核酸を提供することを含む、実施形態22~23のいずれか一項に記載の方法。
25.ヒトchr8:25907865-25907930に由来する、及びヒトchr13:37005652-37005721に由来する、ヒトchr12:4919188-4919272に由来する、ヒトchr2:74743042-74743113に由来する、及びヒトchr2:73147571-73147626に由来する、ヒトchr1:248020635-248020731に由来する、ヒトchr7:19156779-19157914に由来する、ヒトchr1:63788850-63788913に由来する、及びヒトchr7:155167531-155167610に由来する、ヒトchr1:248020635-248020731に由来する、ヒトchr7:19156779-19157914に由来する、ヒトchr19:51228620-51228722に由来する、ヒトchr2:176945521-176945603に由来する、及びヒトchr6:137814750-137814815に由来する、DNA領域又はその相補的領域、又はその変換領域、又はその断片からなる群から選択される2つのDNA領域に結合することができる核酸を提供することを含む、実施形態22~24のいずれか一項に記載の方法。
26.配列番号173及び193、181、165及び233、209、229、205及び221、209、229、225、213及び217、又はその相補的核酸、又はその断片からなる群から選択される2つの核酸を提供することを含む、実施形態22~25のいずれか一項に記載の方法。
27.配列番号174及び175、及び194及び195、182及び183、166及び167、及び234及び235、210及び211、230及び231、206及び207、及び222及び223、210及び211、230及び231、226及び227、214及び215、及び218及び219、又はそれらの相補的核酸の組合せ、又はそれらの断片からなる群から選択される2つの核酸を提供することを含む、実施形態22~26のいずれか一項に記載の方法。
28.疾患が腫瘍を包含する、実施形態22~27のいずれか一項に記載の方法。
29.試験される試料中の核酸を得ることをさらに含む、実施形態22~28のいずれか一項に記載の方法。
30.核酸が無細胞核酸を包含する、実施形態29に記載の方法。
31.試験される試料が組織、細胞及び/又は体液を包含する、実施形態22~30のいずれか一項に記載の方法。
32.試験される試料が血漿を包含する、実施形態22~31のいずれか一項に記載の方法。
33.DNA領域又はその断片を変換することをさらに含む、実施形態22~32のいずれか一項に記載の方法。
25.ヒトchr8:25907865-25907930に由来する、及びヒトchr13:37005652-37005721に由来する、ヒトchr12:4919188-4919272に由来する、ヒトchr2:74743042-74743113に由来する、及びヒトchr2:73147571-73147626に由来する、ヒトchr1:248020635-248020731に由来する、ヒトchr7:19156779-19157914に由来する、ヒトchr1:63788850-63788913に由来する、及びヒトchr7:155167531-155167610に由来する、ヒトchr1:248020635-248020731に由来する、ヒトchr7:19156779-19157914に由来する、ヒトchr19:51228620-51228722に由来する、ヒトchr2:176945521-176945603に由来する、及びヒトchr6:137814750-137814815に由来する、DNA領域又はその相補的領域、又はその変換領域、又はその断片からなる群から選択される2つのDNA領域に結合することができる核酸を提供することを含む、実施形態22~24のいずれか一項に記載の方法。
26.配列番号173及び193、181、165及び233、209、229、205及び221、209、229、225、213及び217、又はその相補的核酸、又はその断片からなる群から選択される2つの核酸を提供することを含む、実施形態22~25のいずれか一項に記載の方法。
27.配列番号174及び175、及び194及び195、182及び183、166及び167、及び234及び235、210及び211、230及び231、206及び207、及び222及び223、210及び211、230及び231、226及び227、214及び215、及び218及び219、又はそれらの相補的核酸の組合せ、又はそれらの断片からなる群から選択される2つの核酸を提供することを含む、実施形態22~26のいずれか一項に記載の方法。
28.疾患が腫瘍を包含する、実施形態22~27のいずれか一項に記載の方法。
29.試験される試料中の核酸を得ることをさらに含む、実施形態22~28のいずれか一項に記載の方法。
30.核酸が無細胞核酸を包含する、実施形態29に記載の方法。
31.試験される試料が組織、細胞及び/又は体液を包含する、実施形態22~30のいずれか一項に記載の方法。
32.試験される試料が血漿を包含する、実施形態22~31のいずれか一項に記載の方法。
33.DNA領域又はその断片を変換することをさらに含む、実施形態22~32のいずれか一項に記載の方法。
34.修飾状態を有する塩基及び修飾状態を有さない塩基が、変換後に異なる物質を形成する、実施形態33に記載の方法。
35.修飾状態を有する塩基が、変換後に実質的に変化せず、修飾状態を有さない塩基が、変換後の塩基とは異なる他の塩基に変更されるか、又は変換後に切断される、実施形態22~34のいずれか一項に記載の方法。
36.塩基がシトシンを包含する、実施形態34~35のいずれか一項に記載の方法。
37.修飾状態がメチル化修飾を包含する、実施形態22~36のいずれか一項に記載の方法。
38.他の塩基がシトシンを包含する、実施形態35~37のいずれか一項に記載の方法。
39.変換が、脱アミノ化試薬及び/又はメチル化感受性制限酵素による変換を含む、実施形態33~38のいずれか一項に記載の方法。
40.脱アミノ化試薬がバイサルファイト又はその類似体を包含する、実施形態39に記載の方法。
41.修飾状態の存在及び/又は含有量を決定するための方法が、変換後の修飾状態を有する塩基によって形成される物質の存在及び/又は含有量を決定することを含む、実施形態22~40のいずれか一項に記載の方法。
42.修飾状態の存在及び/又は含有量を決定する方法が、修飾状態を有するDNA領域又はその断片の存在及び/又は含有量を決定することを含む、実施形態22~41のいずれか一項に記載の方法。
43.修飾状態を有するDNA領域又はその断片の存在及び/又は含有量が、蛍光PCR法によって検出される蛍光Ct値によって決定される、実施形態22~42のいずれか一項に記載の方法。
44.膵腫瘍の存在、又は膵腫瘍の発症若しくは発症のリスクが、DNA領域若しくはその断片の修飾状態の存在及び/又はDNA領域若しくはその断片の修飾状態の含有量が参照レベルに対してより高いことを決定することによって決定される、実施形態22~43のいずれか一項に記載の方法。
45.DNA領域又はその断片の修飾状態の存在及び/又は含有量を決定する前に、試験される試料中のDNA領域又はその断片を増幅することをさらに含む、実施形態22~44のいずれか一項に記載の方法。
46.増幅がPCR増幅を含む、実施形態45に記載の方法。
47.EBF2、並びにCCNA1、KCNA6、TLX2、及びEMX1、TRIM58、TWIST1、FOXD3、及びEN2、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される2つの遺伝子を有するDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる配列を含む、核酸。
48、DNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて、EBF2、並びにCCNA1、KCNA6、TLX2、及びEMX1、TRIM58、TWIST1、FOXD3、及びEN2、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される2つの遺伝子、又はその相補的領域、又はその変換領域、又はその断片を有するDNA領域に結合可能な核酸を設計することを含む、核酸の調製方法。
49.EBF2、並びにCCNA1、KCNA6、TLX2、及びEMX1、TRIM58、TWIST1、FOXD3、及びEN2、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される2つの遺伝子を有するDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる配列を含む、核酸の組合せ。
50.DNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて、EBF2、並びにCCNA1、KCNA6、TLX2、及びEMX1、TRIM58、TWIST1、FOXD3、及びEN2、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される2つの遺伝子、又はその相補的領域、又はその変換領域、又はその断片を有するDNA領域を増幅可能な核酸の組合せを、設計することを含む、核酸の組合せの調製方法。
35.修飾状態を有する塩基が、変換後に実質的に変化せず、修飾状態を有さない塩基が、変換後の塩基とは異なる他の塩基に変更されるか、又は変換後に切断される、実施形態22~34のいずれか一項に記載の方法。
36.塩基がシトシンを包含する、実施形態34~35のいずれか一項に記載の方法。
37.修飾状態がメチル化修飾を包含する、実施形態22~36のいずれか一項に記載の方法。
38.他の塩基がシトシンを包含する、実施形態35~37のいずれか一項に記載の方法。
39.変換が、脱アミノ化試薬及び/又はメチル化感受性制限酵素による変換を含む、実施形態33~38のいずれか一項に記載の方法。
40.脱アミノ化試薬がバイサルファイト又はその類似体を包含する、実施形態39に記載の方法。
41.修飾状態の存在及び/又は含有量を決定するための方法が、変換後の修飾状態を有する塩基によって形成される物質の存在及び/又は含有量を決定することを含む、実施形態22~40のいずれか一項に記載の方法。
42.修飾状態の存在及び/又は含有量を決定する方法が、修飾状態を有するDNA領域又はその断片の存在及び/又は含有量を決定することを含む、実施形態22~41のいずれか一項に記載の方法。
43.修飾状態を有するDNA領域又はその断片の存在及び/又は含有量が、蛍光PCR法によって検出される蛍光Ct値によって決定される、実施形態22~42のいずれか一項に記載の方法。
44.膵腫瘍の存在、又は膵腫瘍の発症若しくは発症のリスクが、DNA領域若しくはその断片の修飾状態の存在及び/又はDNA領域若しくはその断片の修飾状態の含有量が参照レベルに対してより高いことを決定することによって決定される、実施形態22~43のいずれか一項に記載の方法。
45.DNA領域又はその断片の修飾状態の存在及び/又は含有量を決定する前に、試験される試料中のDNA領域又はその断片を増幅することをさらに含む、実施形態22~44のいずれか一項に記載の方法。
46.増幅がPCR増幅を含む、実施形態45に記載の方法。
47.EBF2、並びにCCNA1、KCNA6、TLX2、及びEMX1、TRIM58、TWIST1、FOXD3、及びEN2、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される2つの遺伝子を有するDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる配列を含む、核酸。
48、DNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて、EBF2、並びにCCNA1、KCNA6、TLX2、及びEMX1、TRIM58、TWIST1、FOXD3、及びEN2、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される2つの遺伝子、又はその相補的領域、又はその変換領域、又はその断片を有するDNA領域に結合可能な核酸を設計することを含む、核酸の調製方法。
49.EBF2、並びにCCNA1、KCNA6、TLX2、及びEMX1、TRIM58、TWIST1、FOXD3、及びEN2、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される2つの遺伝子を有するDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる配列を含む、核酸の組合せ。
50.DNA領域、又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて、EBF2、並びにCCNA1、KCNA6、TLX2、及びEMX1、TRIM58、TWIST1、FOXD3、及びEN2、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される2つの遺伝子、又はその相補的領域、又はその変換領域、又はその断片を有するDNA領域を増幅可能な核酸の組合せを、設計することを含む、核酸の組合せの調製方法。
51.実施形態47の核酸及び/又は実施形態49の核酸の組合せを含むキット。
52.実施形態47に記載の核酸、実施形態49に記載の核酸の組合せ、及び/又は実施形態51に記載のキットの、疾患検出産物の調製における、使用。
53.実施形態47の核酸、実施形態49の核酸の組合せ及び/又は実施形態51のキットの、疾患の存在を決定するための、疾患の発症若しくは発症のリスクを評価するための、及び/又は疾患の進行を評価するための、物質の調製における、使用。
54.実施形態47の核酸、実施形態49の核酸の組合せ及び/又は実施形態51のキットの、DNA領域又はその断片の修飾状態を決定するための物質の調製における、使用。
55.DNA領域の修飾状態を決定するための核酸、核酸の組合せ及び/又はキットの、膵腫瘍の存在を決定するための、膵腫瘍の発症若しくは発症のリスクを評価するための、及び/又は膵腫瘍の進行を評価するための、物質の調製における、使用であって、決定のためのDNA領域が、EBF2、並びにCCNA1、KCNA6、TLX2及びEMX1、TRIM58、TWIST1、FOXD3及びEN2、TRIM58、TWIST1、CLEC11A、HOXD10及びOLIG3からなる群から選択される2つの遺伝子を有するDNA領域、又はそれらの断片を包含する、使用。
56.DNA領域の修飾状態を決定するための核酸、核酸の組合せ及び/又はキットの、疾患の存在を決定するための、疾患の発症若しくは発症のリスクを評価するための、及び/又は疾患の進行を評価するための、物質の調製における、使用であって、DNA領域が、ヒトchr8:25907849-25907950に由来する、及びヒトchr13:37005635-37005754に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:73147525-73147644に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr1:63788812-63788952に由来する、及びヒトchr7:155167513-155167628に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr19:51228168-51228782に由来する、ヒトchr2:176945511-176945630に由来する、及びヒトchr6:137814700-137814853に由来するDNA領域、又はその相補的領域、又はその断片からなる群から選択される2つのDNA領域を含む、使用。
57.EBF2、並びにCCNA1、KCNA6、TLX2、及びEMX1、TRIM58、TWIST1、FOXD3、及びEN2、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される2つの遺伝子を有するDNA領域の核酸、又はその変換領域、又はその断片、並びに上記の核酸の組合せの、膵腫瘍の存在を決定するための、膵腫瘍の発症を評価するための、及び/又は膵腫瘍の進行を評価するための、物質の調製における、使用。
58.ヒトchr8:25907849-25907950に由来する、及びヒトchr13:37005635-37005754に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:73147525-73147644に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr1:63788812-63788952に由来する、及びヒトchr7:155167513-155167628に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr19:51228168-51228782に由来する、ヒトchr2:176945511-176945630に由来する、及びヒトchr6:137814700-137814853に由来するDNA領域若しくはその相補的領域、若しくはその変換領域、若しくはその断片、及び上記の核酸の組合せからなる群から選択される2つのDNA領域の核酸の、疾患の存在を決定する、疾患の発症若しくは発症のリスクを評価する、及び/又は疾患の進行を評価するための、物質の調製における、使用。
52.実施形態47に記載の核酸、実施形態49に記載の核酸の組合せ、及び/又は実施形態51に記載のキットの、疾患検出産物の調製における、使用。
53.実施形態47の核酸、実施形態49の核酸の組合せ及び/又は実施形態51のキットの、疾患の存在を決定するための、疾患の発症若しくは発症のリスクを評価するための、及び/又は疾患の進行を評価するための、物質の調製における、使用。
54.実施形態47の核酸、実施形態49の核酸の組合せ及び/又は実施形態51のキットの、DNA領域又はその断片の修飾状態を決定するための物質の調製における、使用。
55.DNA領域の修飾状態を決定するための核酸、核酸の組合せ及び/又はキットの、膵腫瘍の存在を決定するための、膵腫瘍の発症若しくは発症のリスクを評価するための、及び/又は膵腫瘍の進行を評価するための、物質の調製における、使用であって、決定のためのDNA領域が、EBF2、並びにCCNA1、KCNA6、TLX2及びEMX1、TRIM58、TWIST1、FOXD3及びEN2、TRIM58、TWIST1、CLEC11A、HOXD10及びOLIG3からなる群から選択される2つの遺伝子を有するDNA領域、又はそれらの断片を包含する、使用。
56.DNA領域の修飾状態を決定するための核酸、核酸の組合せ及び/又はキットの、疾患の存在を決定するための、疾患の発症若しくは発症のリスクを評価するための、及び/又は疾患の進行を評価するための、物質の調製における、使用であって、DNA領域が、ヒトchr8:25907849-25907950に由来する、及びヒトchr13:37005635-37005754に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:73147525-73147644に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr1:63788812-63788952に由来する、及びヒトchr7:155167513-155167628に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr19:51228168-51228782に由来する、ヒトchr2:176945511-176945630に由来する、及びヒトchr6:137814700-137814853に由来するDNA領域、又はその相補的領域、又はその断片からなる群から選択される2つのDNA領域を含む、使用。
57.EBF2、並びにCCNA1、KCNA6、TLX2、及びEMX1、TRIM58、TWIST1、FOXD3、及びEN2、TRIM58、TWIST1、CLEC11A、HOXD10、及びOLIG3からなる群から選択される2つの遺伝子を有するDNA領域の核酸、又はその変換領域、又はその断片、並びに上記の核酸の組合せの、膵腫瘍の存在を決定するための、膵腫瘍の発症を評価するための、及び/又は膵腫瘍の進行を評価するための、物質の調製における、使用。
58.ヒトchr8:25907849-25907950に由来する、及びヒトchr13:37005635-37005754に由来する、ヒトchr12:4919142-4919289に由来する、ヒトchr2:74743035-74743151に由来する、及びヒトchr2:73147525-73147644に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr1:63788812-63788952に由来する、及びヒトchr7:155167513-155167628に由来する、ヒトchr1:248020592-248020779に由来する、ヒトchr7:19156739-19157277に由来する、ヒトchr19:51228168-51228782に由来する、ヒトchr2:176945511-176945630に由来する、及びヒトchr6:137814700-137814853に由来するDNA領域若しくはその相補的領域、若しくはその変換領域、若しくはその断片、及び上記の核酸の組合せからなる群から選択される2つのDNA領域の核酸の、疾患の存在を決定する、疾患の発症若しくは発症のリスクを評価する、及び/又は疾患の進行を評価するための、物質の調製における、使用。
59.実施形態1~46のいずれか一項に記載の方法を実行することができるプログラムを記録した記憶媒体。
60.実施形態59に記載の記憶媒体を含むデバイス。
61.記憶媒体に結合されたプロセッサをさらに含み、プロセッサが、記憶媒体に記憶されたプログラムに基づいて実行して、実施形態1~46のいずれか一項に記載の方法を実施するように構成される、実施形態60に記載のデバイス。
いかなる理論によっても限定されることを意図するものではないが、以下の例は、本出願の方法及び使用を例示するためのものにすぎず、本出願の発明の範囲を限定することを意図するものではない。
例
例1
1-1:標的化メチル化配列決定による膵癌の示差的メチル化部位のスクリーニング
本発明者らは、合計94個の膵癌血液試料及び80個の膵癌非含有血液試料を採取し、全ての登録患者はインフォームドコンセント用紙に署名した。試料情報については以下の表を参照されたい。
血漿DNAのメチル化配列決定データを、その中のメチル化分類マーカを同定するためにMethylTitanアッセイによって得た。方法は以下の通りである。
1.血漿cfDNA試料の抽出
Streck採血管を使用して患者から2mlの全血試料を採取し、血漿を適時(3日以内)に遠心分離によって分離し、実験室に輸送し、次いで、指示に従ってQIAGEN QIAamp Circulating Nucleic Acid Kitを使用してcfDNAを抽出した。
60.実施形態59に記載の記憶媒体を含むデバイス。
61.記憶媒体に結合されたプロセッサをさらに含み、プロセッサが、記憶媒体に記憶されたプログラムに基づいて実行して、実施形態1~46のいずれか一項に記載の方法を実施するように構成される、実施形態60に記載のデバイス。
いかなる理論によっても限定されることを意図するものではないが、以下の例は、本出願の方法及び使用を例示するためのものにすぎず、本出願の発明の範囲を限定することを意図するものではない。
例
例1
1-1:標的化メチル化配列決定による膵癌の示差的メチル化部位のスクリーニング
本発明者らは、合計94個の膵癌血液試料及び80個の膵癌非含有血液試料を採取し、全ての登録患者はインフォームドコンセント用紙に署名した。試料情報については以下の表を参照されたい。
血漿DNAのメチル化配列決定データを、その中のメチル化分類マーカを同定するためにMethylTitanアッセイによって得た。方法は以下の通りである。
1.血漿cfDNA試料の抽出
Streck採血管を使用して患者から2mlの全血試料を採取し、血漿を適時(3日以内)に遠心分離によって分離し、実験室に輸送し、次いで、指示に従ってQIAGEN QIAamp Circulating Nucleic Acid Kitを使用してcfDNAを抽出した。
2.配列決定及びデータ前処理
1)ライブラリを、Illumina Nextseq 500シーケンサーを使用してペアエンドシーケンシングした。
2)Pear(v0.6.0)ソフトウェアは、Illumina Hiseq X10/Nextseq 500/Nova seqシーケンサーからの同じペアエンド150bpシーケンシング断片のペアエンド配列決定データを、最短重複長が20bpであり、最短長が組み合わせ後に30bpである一配列に組み合わせた。
3)Trim_galore v 0.6.0及びcutadapt v1.8.1ソフトウェアを使用して、結合された配列決定データに対してアダプタ除去を行った。アダプタ配列「AGATCGGAAGAGCAC」を配列の5’末端から除去し、両端のシーケンシング品質値が20未満の塩基を除去した。
3.シーケンシングデータアライメント
本明細書で使用される参照ゲノムデータは、UCSCデータベース(UCSC:HG19,hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/hg19.fa.gz)からのものであった。
1)まず、Bismark softwareを用いてHG19をシトシンからチミン(CT)及びアデニンからグアニン(GA)に変換し、Bowtie2 softwareを用いて変換後のゲノムのインデックスを構築した。
2)前処理されたデータはまた、CT及びGAの変換に供された。
3)変換された配列を、Bowtie2ソフトウェアを使用して変換されたHG19参照ゲノムにアラインメントした。最小シード配列長は20であり、シード配列においてミスマッチは許容されなかった。
4.MHFの算出
各標的領域HG19のCpG部位について、上記のアライメント結果に基づいて、各部位に対応するメチル化レベルを求めた。本明細書における部位のヌクレオチド番号付けは、HG19のヌクレオチド位置番号付けに対応する。1つの標的メチル化領域は、複数のメチル化ハプロタイプを有し得る。この値は、標的領域内のメチル化ハプロタイプごとに計算する必要がある。MHFの計算式の一例は以下の通りであり、
式中、iは標的メチル化領域を表し、hは標的メチル化ハプロタイプを表し、Niは標的メチル化領域に位置するリードの数を表し、Ni、hは標的メチル化ハプロタイプを含むリードの数を表す。
5.メチル化データマトリックス
1)訓練セット及び試験セット中の各試料のメチル化配列決定データをデータマトリックスに組合せ、200未満の深さの各部位を欠損値とした。
2)10%を超える欠損値割合を有する部位を除去した。
3)データマトリックスの欠損値については、KNNアルゴリズムを使用して欠損データを補間した。
6.学習セット試料群に基づく特徴メチル化セグメントの発見
1)表現型に関して各メチル化セグメントについてロジスティック回帰モデルを構築し、最も有意な回帰係数を有するメチル化セグメントを各増幅標的領域についてスクリーニングして候補メチル化セグメントを形成した。
2)訓練セットを、十倍クロスバリデーション増分特徴選択のために10の部分にランダムに分割した。
3)各領域における候補メチル化セグメントを回帰係数の有意性に従って降順にランク付けし、1つのメチル化セグメントのデータを毎回追加して試験データを予測した。
4)工程3)では、工程2)で生成されたデータの10コピーを使用した。データの各コピーについて、10回の計算を行い、最終AUCは10回の計算の平均であった。訓練データのAUCが増加した場合、候補メチル化セグメントは特徴メチル化セグメントとして保持され、そうでない場合は破棄される。
5)訓練セット中の異なる数の特徴の下での平均AUC中央値に対応する特徴の組合せを、特徴メチル化セグメントの最終的な組合せとした。
1)ライブラリを、Illumina Nextseq 500シーケンサーを使用してペアエンドシーケンシングした。
2)Pear(v0.6.0)ソフトウェアは、Illumina Hiseq X10/Nextseq 500/Nova seqシーケンサーからの同じペアエンド150bpシーケンシング断片のペアエンド配列決定データを、最短重複長が20bpであり、最短長が組み合わせ後に30bpである一配列に組み合わせた。
3)Trim_galore v 0.6.0及びcutadapt v1.8.1ソフトウェアを使用して、結合された配列決定データに対してアダプタ除去を行った。アダプタ配列「AGATCGGAAGAGCAC」を配列の5’末端から除去し、両端のシーケンシング品質値が20未満の塩基を除去した。
3.シーケンシングデータアライメント
本明細書で使用される参照ゲノムデータは、UCSCデータベース(UCSC:HG19,hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/hg19.fa.gz)からのものであった。
1)まず、Bismark softwareを用いてHG19をシトシンからチミン(CT)及びアデニンからグアニン(GA)に変換し、Bowtie2 softwareを用いて変換後のゲノムのインデックスを構築した。
2)前処理されたデータはまた、CT及びGAの変換に供された。
3)変換された配列を、Bowtie2ソフトウェアを使用して変換されたHG19参照ゲノムにアラインメントした。最小シード配列長は20であり、シード配列においてミスマッチは許容されなかった。
4.MHFの算出
各標的領域HG19のCpG部位について、上記のアライメント結果に基づいて、各部位に対応するメチル化レベルを求めた。本明細書における部位のヌクレオチド番号付けは、HG19のヌクレオチド位置番号付けに対応する。1つの標的メチル化領域は、複数のメチル化ハプロタイプを有し得る。この値は、標的領域内のメチル化ハプロタイプごとに計算する必要がある。MHFの計算式の一例は以下の通りであり、
式中、iは標的メチル化領域を表し、hは標的メチル化ハプロタイプを表し、Niは標的メチル化領域に位置するリードの数を表し、Ni、hは標的メチル化ハプロタイプを含むリードの数を表す。
5.メチル化データマトリックス
1)訓練セット及び試験セット中の各試料のメチル化配列決定データをデータマトリックスに組合せ、200未満の深さの各部位を欠損値とした。
2)10%を超える欠損値割合を有する部位を除去した。
3)データマトリックスの欠損値については、KNNアルゴリズムを使用して欠損データを補間した。
6.学習セット試料群に基づく特徴メチル化セグメントの発見
1)表現型に関して各メチル化セグメントについてロジスティック回帰モデルを構築し、最も有意な回帰係数を有するメチル化セグメントを各増幅標的領域についてスクリーニングして候補メチル化セグメントを形成した。
2)訓練セットを、十倍クロスバリデーション増分特徴選択のために10の部分にランダムに分割した。
3)各領域における候補メチル化セグメントを回帰係数の有意性に従って降順にランク付けし、1つのメチル化セグメントのデータを毎回追加して試験データを予測した。
4)工程3)では、工程2)で生成されたデータの10コピーを使用した。データの各コピーについて、10回の計算を行い、最終AUCは10回の計算の平均であった。訓練データのAUCが増加した場合、候補メチル化セグメントは特徴メチル化セグメントとして保持され、そうでない場合は破棄される。
5)訓練セット中の異なる数の特徴の下での平均AUC中央値に対応する特徴の組合せを、特徴メチル化セグメントの最終的な組合せとした。
選択された特徴的なメチル化核酸配列の分布は以下の通りである:DMRTA2遺伝子領域中の配列番号1、FOXD3遺伝子領域中の配列番号2、TBX15遺伝子領域中の配列番号3、BCAN遺伝子領域中の配列番号4、TRIM58遺伝子領域中の配列番号5、SIX3遺伝子領域中の配列番号6、VAX2遺伝子領域中の配列番号7、EMX1遺伝子領域中の配列番号8、LBX2遺伝子領域中の配列番号9、TLX2遺伝子領域中の配列番号10、POU3F3遺伝子領域中の配列番号11及び配列番号12、TBR1遺伝子領域中の配列番号13、EVX2遺伝子領域の配列番号14及び配列番号15、HOXD12遺伝子領域の配列番号16、HOXD8遺伝子領域の配列番号17、HOXD4遺伝子領域の配列番号18及び配列番号19、TOPAZ1遺伝子領域の配列番号20、SHOX2遺伝子領域の配列番号21、DRD5遺伝子領域の配列番号22、RPL9遺伝子領域の配列番号23及び配列番号24、HOPX遺伝子領域の配列番号25、SFRP2遺伝子領域の配列番号26、IRX4遺伝子領域の配列番号27、TBX18遺伝子領域の配列番号28、OLIG3遺伝子領域の配列番号29、ULBP1遺伝子領域の配列番号30、HOXA13遺伝子領域の配列番号31、TBX20遺伝子領域の配列番号32、IKZF1遺伝子領域の配列番号33、INSIG1遺伝子領域の配列番号34、SOX7遺伝子領域の配列番号35、EBF2遺伝子領域の配列番号36、MOS遺伝子領域の配列番号37、MKX遺伝子領域の配列番号38、KCNA6遺伝子領域の配列番号39、SYT10遺伝子領域の配列番号40、AGAP2遺伝子領域の配列番号41、TBX3遺伝子領域の配列番号42、CCNA1遺伝子領域における配列番号43、ZIC2遺伝子領域における配列番号44及び配列番号45、CLEC14A遺伝子領域における配列番号46及び配列番号47、OTX2遺伝子領域における配列番号48、C14orf39遺伝子領域における配列番号49、BNC1遺伝子領域における配列番号50、AHSP遺伝子領域における配列番号51、ZFHX3遺伝子領域における配列番号52、LHX1遺伝子領域における配列番号53、TIMP2遺伝子領域における配列番号54、ZNF750遺伝子領域における配列番号55及びSIM2遺伝子領域における配列番号56。上記のメチル化マーカのレベルは、膵癌患者のcfDNAにおいて増加又は減少した(表1-1、隅付き括弧による表1)。上記の56個のマーカ領域の配列を配列番号1~56に示す。各マーカ領域中の全てのCpG部位のメチル化レベルは、MethylTitanシーケンシングによって得ることができる。各領域における全てのCpG部位の平均メチル化レベル、並びに単一のCpG部位のメチル化レベルは、いずれも膵癌の診断のためのマーカとして使用することができる。
試験セットにおける膵癌罹患者及び膵癌非罹患者のメチル化マーカのメチル化レベルを表1-2(隅付き括弧による表4)に示す。表から分かるように、選択されたメチル化マーカの分布は、膵癌罹患者と膵癌非罹患者とで有意に異なり、良好な分化効果が得られた。
表1-3(隅付き括弧の表5)に、選択した各マーカにおけるランダムな10個のCpG部位又はそれらの組合せのメチル化度とマーカ全体のメチル化度との相関(ピアソン相関係数)及び対応する有意性p値を示す。マーカ内の単一のCpG部位又は複数のCpG部位の組合せのメチル化レベルは、全領域のメチル化レベルと有意な相関を有し(p<0.05)、相関係数はいずれも0.8を超えることが分かる。この強い又は極めて強い相関は、マーカ内の単一のCpG部位又は複数のCpG部位の組合せがマーカ全体と同じ良好な分化効果を有することを示す。
1-2:単一メチル化マーカの予測性能
膵癌患者及び膵癌非罹患患者における単一メチル化マーカの鑑別能を検証するために、単一メチル化マーカのメチル化レベルの値を用いて、単一マーカの予測能を検証した。
まず、56個のメチル化マーカのメチル化レベルの値を訓練用の訓練セット試料に分けて用いて、膵癌の有無を鑑別するための閾値、感度及び特異度を決定し、次いで、その閾値を用いて、試験セット試料の感度及び特異度を統計的に解析した。結果を以下の表1-4(隅付き括弧による表6)に示す。単一のマーカも良好な分化性能を達成することができることが分かる。
膵癌患者及び膵癌非罹患患者における単一メチル化マーカの鑑別能を検証するために、単一メチル化マーカのメチル化レベルの値を用いて、単一マーカの予測能を検証した。
まず、56個のメチル化マーカのメチル化レベルの値を訓練用の訓練セット試料に分けて用いて、膵癌の有無を鑑別するための閾値、感度及び特異度を決定し、次いで、その閾値を用いて、試験セット試料の感度及び特異度を統計的に解析した。結果を以下の表1-4(隅付き括弧による表6)に示す。単一のマーカも良好な分化性能を達成することができることが分かる。
1-3:全マーカの組合せの予測モデル
メチル化核酸断片マーカを用いて膵癌を鑑別する潜在的な能力を検証するために、試験群におけるこのメチル化核酸断片マーカ群の分類予測効果を検証するために、訓練群における56個のメチル化核酸断片マーカに基づいてサポートベクターマシン疾患分類モデルを構築した。訓練群及び試験群は、訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する割合に従って分割した。
発見されたメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1)試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2)SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
モデルを構築する過程で、膵癌試料型を1とコードし、膵癌非含有試料型を0とコードした。sklearnソフトウェアパッケージ(0.23.1)によってモデルを構築する方法では、閾値はデフォルトで0.895に設定されていた。構築されたモデルは、膵癌の有無にかかわらず試料を最終的に0.895区別した。訓練セット試料に対する2つのモデルの予測スコアを表1-5(隅付き括弧による表7)に示す。
メチル化核酸断片マーカを用いて膵癌を鑑別する潜在的な能力を検証するために、試験群におけるこのメチル化核酸断片マーカ群の分類予測効果を検証するために、訓練群における56個のメチル化核酸断片マーカに基づいてサポートベクターマシン疾患分類モデルを構築した。訓練群及び試験群は、訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する割合に従って分割した。
発見されたメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1)試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2)SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
モデルを構築する過程で、膵癌試料型を1とコードし、膵癌非含有試料型を0とコードした。sklearnソフトウェアパッケージ(0.23.1)によってモデルを構築する方法では、閾値はデフォルトで0.895に設定されていた。構築されたモデルは、膵癌の有無にかかわらず試料を最終的に0.895区別した。訓練セット試料に対する2つのモデルの予測スコアを表1-5(隅付き括弧による表7)に示す。
本出願のメチル化核酸断片マーカ群に基づいて、本例ではSVMにより確立されたモデルに従った試験セットで予測した。予測関数を用いて試験セットを予測し、予測結果を出力した(疾患確率:デフォルトスコア閾値は0.895であり、スコアが0.895より大きい場合、対象は悪性とみなされる)。試験群は57個の試料(試料118~174)を包含し、計算方法は以下の通りである。
コマンドライン:
test_pred=model.predict(test_df)
ここで、test_predは、この例で構築されたSVM予測モデルを使用して取得された試験セット内の試料の予測スコアを表し、modelは、この例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
コマンドライン:
test_pred=model.predict(test_df)
ここで、test_predは、この例で構築されたSVM予測モデルを使用して取得された試験セット内の試料の予測スコアを表し、modelは、この例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
試験群の予測スコアを表1-6に示す。ROC曲線を図2に示す。予測スコア分布を図3に示す。試験群の全AUC下の面積は0.911であった。訓練セットにおいて、モデルの感度は、特異度が90.7%であったときに71.4%に達することができ、試験セットにおいて、特異度が88.5%である場合、モデルの感度は83.9%に達することができた。選択された変数によって確立されたSVMモデルの微分効果が良好であることが分かる。
図4及び図5は、それぞれ訓練群及び試験群における56個のメチル化核酸断片マーカの分布を示す。このメチル化マーカ群の膵癌非罹患者の血漿と膵癌患者の血漿との差は比較的安定していることが分かる。
1-4:腫瘍マーカ予測比較
本出願のメチル化マーカ群に基づいて、例1-3においてSVMにより確立されたモデルに従った試験セットにおいて予測した。CA19-9マーカに基づいて膵癌を予測した。試料は130個であった(表1-7)。計算方法は以下の通りである。
コマンドライン:
Combine_scalar=RobustScaler().fit(combine_train_df)
scaled_combine_train_df=combine_scalar.transform(combine_train_df)
scaled_combine_test_df=combine_scalar.transform(combine_test_df)
combine_model=LogisticRegression().fit(scaled_combine_train_df,train_ca19_pheno)
ここで、combine_train_dfは試験セット試料の例1-3で構築されたSVM予測モデルによって得られた予測スコアをCA19-9と結合した訓練セットデータマトリックスを表し、scaled_combine_train_dfは標準化後の訓練セットデータマトリックスを表す。scaled_combine_test_dfは、標準化された試験・セットデータマトリックスを表し、combine_modelは、標準化された訓練・セットデータマトリックスを用いてフィッティングされたロジスティック回帰モデルを表す。
図4及び図5は、それぞれ訓練群及び試験群における56個のメチル化核酸断片マーカの分布を示す。このメチル化マーカ群の膵癌非罹患者の血漿と膵癌患者の血漿との差は比較的安定していることが分かる。
1-4:腫瘍マーカ予測比較
本出願のメチル化マーカ群に基づいて、例1-3においてSVMにより確立されたモデルに従った試験セットにおいて予測した。CA19-9マーカに基づいて膵癌を予測した。試料は130個であった(表1-7)。計算方法は以下の通りである。
コマンドライン:
Combine_scalar=RobustScaler().fit(combine_train_df)
scaled_combine_train_df=combine_scalar.transform(combine_train_df)
scaled_combine_test_df=combine_scalar.transform(combine_test_df)
combine_model=LogisticRegression().fit(scaled_combine_train_df,train_ca19_pheno)
ここで、combine_train_dfは試験セット試料の例1-3で構築されたSVM予測モデルによって得られた予測スコアをCA19-9と結合した訓練セットデータマトリックスを表し、scaled_combine_train_dfは標準化後の訓練セットデータマトリックスを表す。scaled_combine_test_dfは、標準化された試験・セットデータマトリックスを表し、combine_modelは、標準化された訓練・セットデータマトリックスを用いてフィッティングされたロジスティック回帰モデルを表す。
各試料の予測スコアを表1-7に示す。ROC曲線を図6に示す。予測スコア分布を図7に示す。試験群の全AUCは0.935である。この図から、確立されたロジスティック回帰モデルの微分効果が良好であることが分かる。
図7は、CA19-9のみを用いて構築したSVMモデルと、例3のみを用いて構築したSVMモデルと、例3とCA19-9とを組み合わせて構築したモデルとの分類予測スコアの分布を示す。この方法は、膵癌の特定においてより安定していることがわかる。
図7は、CA19-9のみを用いて構築したSVMモデルと、例3のみを用いて構築したSVMモデルと、例3とCA19-9とを組み合わせて構築したモデルとの分類予測スコアの分布を示す。この方法は、膵癌の特定においてより安定していることがわかる。
1-5:従来のマーカの陰性試料における分類予測モデルの性能
本出願のメチル化マーカ群に基づいて、例1-3においてSVMによって確立されたモデルに従って、従来の腫瘍マーカCA19-9(CA19-9測定値<37)について陰性であった試料に対して試験を行った。
関連する試料のCA19-9測定値及びモデル予測値を表1-8に示し、ROC曲線を図8に示す。スコアリング閾値として0.895も使用して、試験セットのAUC値は0.885に達した。CA19-9を用いて区別できない患者については、例3で構築したSVMモデルでも比較的良好な結果が得られることが分かる。
本出願のメチル化マーカ群に基づいて、例1-3においてSVMによって確立されたモデルに従って、従来の腫瘍マーカCA19-9(CA19-9測定値<37)について陰性であった試料に対して試験を行った。
関連する試料のCA19-9測定値及びモデル予測値を表1-8に示し、ROC曲線を図8に示す。スコアリング閾値として0.895も使用して、試験セットのAUC値は0.885に達した。CA19-9を用いて区別できない患者については、例3で構築したSVMモデルでも比較的良好な結果が得られることが分かる。
1-6:配列番号9、配列番号14、配列番号13、配列番号26、配列番号40、配列番号43、配列番号52の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号9、14、13、26、40、43、52をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号9、14、13、26、40、43、52をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図9に示す。構築されたモデルのAUCは0.881であった。試験セットでは、特異度を0.846とした場合、感度は0.774に達し(表1-9)(隅付き括弧による表11)、膵癌患者と健康な人との鑑別効果は良好であった。
1-7:配列番号5、配列番号18、配列番号34、配列番号40、配列番号43、配列番号45、配列番号46の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号5、配列番号18、配列番号34、配列番号40、配列番号43、配列番号45、配列番号46をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図10に示す。構築されたモデルのAUCは0.881であった。試験セットでは、特異度を0.692とした場合、感度は0.839に達し(表1-10、隅付き括弧による表12)、膵癌患者と健康な人との鑑別効果は良好であった。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図9に示す。構築されたモデルのAUCは0.881であった。試験セットでは、特異度を0.846とした場合、感度は0.774に達し(表1-9)(隅付き括弧による表11)、膵癌患者と健康な人との鑑別効果は良好であった。
1-7:配列番号5、配列番号18、配列番号34、配列番号40、配列番号43、配列番号45、配列番号46の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号5、配列番号18、配列番号34、配列番号40、配列番号43、配列番号45、配列番号46をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図10に示す。構築されたモデルのAUCは0.881であった。試験セットでは、特異度を0.692とした場合、感度は0.839に達し(表1-10、隅付き括弧による表12)、膵癌患者と健康な人との鑑別効果は良好であった。
1-8:配列番号8、配列番号11、配列番号20、配列番号44、配列番号48、配列番号51、配列番号54の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号8、配列番号11、配列番号20、配列番号44、配列番号48、配列番号51、配列番号54をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図11に示す。構築されたモデルのAUCは0.880であった。試験セットでは、特異度を0.769とした場合、感度は0.839に達し(表1-11、隅付き括弧による表13)、膵癌患者と健康な人との鑑別効果は良好であった。
1-9:配列番号8、配列番号14、配列番号26、配列番号24、配列番号31、配列番号40、配列番号46の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号8、配列番号14、配列番号26、配列番号24、配列番号31、配列番号40、配列番号46をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号8、配列番号11、配列番号20、配列番号44、配列番号48、配列番号51、配列番号54をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図11に示す。構築されたモデルのAUCは0.880であった。試験セットでは、特異度を0.769とした場合、感度は0.839に達し(表1-11、隅付き括弧による表13)、膵癌患者と健康な人との鑑別効果は良好であった。
1-9:配列番号8、配列番号14、配列番号26、配列番号24、配列番号31、配列番号40、配列番号46の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号8、配列番号14、配列番号26、配列番号24、配列番号31、配列番号40、配列番号46をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図12に示す。構築されたモデルのAUCは0.871であった。試験セットでは、特異度を0.885とした場合、感度は0.710に達し(表1-12、隅付き括弧による表14)、膵癌患者と健康な人との鑑別効果は良好であった。
1-10:配列番号3、9、8、29、42、40、41の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号3、9、8、29、42、40、41をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図12に示す。構築されたモデルのAUCは0.871であった。試験セットでは、特異度を0.885とした場合、感度は0.710に達し(表1-12、隅付き括弧による表14)、膵癌患者と健康な人との鑑別効果は良好であった。
1-10:配列番号3、9、8、29、42、40、41の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号3、9、8、29、42、40、41をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図13に示す。構築されたモデルのAUCは0.866であった。試験セットでは、特異度を0.538とした場合、感度は0.903に達し(表1-13、隅付き括弧による表15)、膵癌患者と健康な人との鑑別効果は良好であった。
1-11:配列番号5、8、19、7、44、47、53の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号5、8、19、7、44、47、53をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図14に示す。構築されたモデルのAUCは0.864であった。試験セットでは、特異度を0.577とした場合、感度は0.774に達し(表1-14、隅付き括弧による表16)、膵癌患者と健康な人との鑑別効果は良好であった。
1-12:配列番号12、17、24、28、40、42、47の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号12、17、24、28、40、42、47をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1-11:配列番号5、8、19、7、44、47、53の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号5、8、19、7、44、47、53をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図14に示す。構築されたモデルのAUCは0.864であった。試験セットでは、特異度を0.577とした場合、感度は0.774に達し(表1-14、隅付き括弧による表16)、膵癌患者と健康な人との鑑別効果は良好であった。
1-12:配列番号12、17、24、28、40、42、47の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号12、17、24、28、40、42、47をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図15に示す。構築されたモデルのAUCは0.862であった。試験セットでは、特異度を0.731とした場合、感度は0.871に達し(表1-15、隅付き括弧による表17)、膵癌患者と健康な人との鑑別効果は良好であった。
1-13:配列番号5、配列番号18、配列番号14、配列番号10、配列番号8、配列番号19、配列番号27の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号5、配列番号18、配列番号14、配列番号10、配列番号8、配列番号19、配列番号27をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図15に示す。構築されたモデルのAUCは0.862であった。試験セットでは、特異度を0.731とした場合、感度は0.871に達し(表1-15、隅付き括弧による表17)、膵癌患者と健康な人との鑑別効果は良好であった。
1-13:配列番号5、配列番号18、配列番号14、配列番号10、配列番号8、配列番号19、配列番号27の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号5、配列番号18、配列番号14、配列番号10、配列番号8、配列番号19、配列番号27をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図16に示す。構築されたモデルのAUCは0.859であった。試験セットでは、特異度を0.615とした場合、感度は0.839に達し(表1-16、隅付き括弧による表18)、膵癌患者と健康な人との鑑別効果は良好であった。
1-14:配列番号6、配列番号12、配列番号20、配列番号26、配列番号24、配列番号47、配列番号50の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号6、配列番号12、配列番号20、配列番号26、配列番号24、配列番号47、配列番号50をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図17に示す。構築されたモデルのAUCは0.857であった。試験セットでは、特異度を0.846とした場合、感度は0.774に達し(表1-17、隅付き括弧による表19)、膵癌患者と健康な人との鑑別効果は良好であった。
1-15:配列番号1、19、27、34、37、46、47の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号1、19、27、34、37、46、47をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
1-14:配列番号6、配列番号12、配列番号20、配列番号26、配列番号24、配列番号47、配列番号50の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号6、配列番号12、配列番号20、配列番号26、配列番号24、配列番号47、配列番号50をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図17に示す。構築されたモデルのAUCは0.857であった。試験セットでは、特異度を0.846とした場合、感度は0.774に達し(表1-17、隅付き括弧による表19)、膵癌患者と健康な人との鑑別効果は良好であった。
1-15:配列番号1、19、27、34、37、46、47の7つのマーカの組合せのモデル構築及び性能評価
異なるマーカの組合せの予測性能を検証するために、本出願における56個のメチル化マーカのクラスターに基づいて、7個のマーカ配列番号1、19、27、34、37、46、47をモデル構築及び性能試験のために選択した。訓練群の117個の試料(試料1~117)及び試験群の57個の試料(試料118~174)を包含する訓練群及び試験群を分割した。
7個のメチル化マーカを使用して、両方の試料群の訓練セットにおけるサポートベクターマシンモデルを構築した。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図18に示す。構築されたモデルのAUCは0.856であった。試験セットでは、特異度を0.808とした場合、感度は0.742に達し(表1-18、隅付き括弧による表20)、膵癌患者と健康な人との鑑別効果は良好であった。
この試験では、血漿cfDNA中の関連遺伝子のメチル化レベルを用いて、膵癌に罹患していない対象の血漿と膵癌に罹患している対象の血漿との差を試験し、有意差のある56個のメチル化核酸断片をスクリーニングした。上記のメチル化核酸断片マーカ群に基づいて、サポートベクターマシン法による膵癌リスク予測モデルが構築され、膵癌を高い感度及び特異度で効果的に同定することができ、膵癌のスクリーニング及び診断に適している。
例2
2-1:標的化メチル化配列決定による膵癌の示差的メチル化部位のスクリーニング
発明者は、合計94名の膵癌患者及び25名の慢性膵炎患者から血液試料を採取し、全ての患者がインフォームドコンセント用紙に署名した。膵癌を有する患者は、膵炎の以前の診断を有していた。試料情報については以下の表を参照されたい。
1.試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2.SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
3.試験セットデータを使用して試験を実行した:上記のモデルを試験用の試験セットに入れた。コマンドライン:test_pred=model.predict(test_df)、ここで、test_predは試験セット試料に対してこの例で構築されたSVM予測モデルによって得られた予測スコアを表し、modelはこの例で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
この7マーカ併用モデルのROC曲線を図18に示す。構築されたモデルのAUCは0.856であった。試験セットでは、特異度を0.808とした場合、感度は0.742に達し(表1-18、隅付き括弧による表20)、膵癌患者と健康な人との鑑別効果は良好であった。
この試験では、血漿cfDNA中の関連遺伝子のメチル化レベルを用いて、膵癌に罹患していない対象の血漿と膵癌に罹患している対象の血漿との差を試験し、有意差のある56個のメチル化核酸断片をスクリーニングした。上記のメチル化核酸断片マーカ群に基づいて、サポートベクターマシン法による膵癌リスク予測モデルが構築され、膵癌を高い感度及び特異度で効果的に同定することができ、膵癌のスクリーニング及び診断に適している。
例2
2-1:標的化メチル化配列決定による膵癌の示差的メチル化部位のスクリーニング
発明者は、合計94名の膵癌患者及び25名の慢性膵炎患者から血液試料を採取し、全ての患者がインフォームドコンセント用紙に署名した。膵癌を有する患者は、膵炎の以前の診断を有していた。試料情報については以下の表を参照されたい。
血漿DNAのメチル化配列決定データを、その中のDNAメチル化分類マーカを同定するためにMethylTitanアッセイによって得た。方法は以下の通りである。
1.血漿cfDNA試料の抽出
Streck採血管を使用して患者から2mlの全血試料を採取し、血漿を適時(3日以内)に遠心分離によって分離し、実験室に輸送し、次いで、指示に従ってQIAGEN QIAamp Circulating Nucleic Acid Kitを使用してcfDNAを抽出した。
2.配列決定及びデータ前処理
1)ライブラリを、Illumina Nextseq 500シーケンサーを使用してペアエンドシーケンシングした。
2)Pear(v0.6.0)ソフトウェアは、Illumina Hiseq X10/Nextseq 500/Nova seqシーケンサーからの同じペアエンド150bpシーケンシング断片のペアエンド配列決定データを、最短重複長が20bpであり、最短長が組み合わせ後に30bpである一配列に組み合わせた。
3)Trim_galore v 0.6.0及びcutadapt v1.8.1ソフトウェアを使用して、結合された配列決定データに対してアダプタ除去を行った。アダプタ配列「AGATCGGAAGAGCAC」を配列の5’末端から除去し、両端のシーケンシング品質値が20未満の塩基を除去した。
3.シーケンシングデータアライメント
本明細書で使用される参照ゲノムデータは、UCSCデータベース(UCSC:HG19,hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/hg19.fa.gz)からのものであった。
1)まず、Bismark softwareを用いてHG19をシトシンからチミン(CT)及びアデニンからグアニン(GA)に変換し、Bowtie2 softwareを用いて変換後のゲノムのインデックスを構築した。
2)前処理されたデータはまた、CT及びGAの変換に供された。
3)変換された配列を、Bowtie2ソフトウェアを使用して変換されたHG19参照ゲノムにアラインメントした。最小シード配列長は20であり、シード配列においてミスマッチは許容されなかった。
4.MHFの算出
各標的領域HG19のCpG部位について、上記のアライメント結果に基づいて、各部位に対応するメチル化状態を求めた。本明細書における部位のヌクレオチド番号付けは、HG19のヌクレオチド位置番号付けに対応する。1つの標的メチル化領域は、複数のメチル化ハプロタイプを有し得る。この値は、標的領域内のメチル化ハプロタイプごとに計算する必要がある。MHFの計算式の一例は以下の通りであり、
式中、iは標的メチル化領域を表し、hは標的メチル化ハプロタイプを表し、Niは標的メチル化領域に位置するリードの数を表し、Ni、hは標的メチル化ハプロタイプを含むリードの数を表す。
1.血漿cfDNA試料の抽出
Streck採血管を使用して患者から2mlの全血試料を採取し、血漿を適時(3日以内)に遠心分離によって分離し、実験室に輸送し、次いで、指示に従ってQIAGEN QIAamp Circulating Nucleic Acid Kitを使用してcfDNAを抽出した。
2.配列決定及びデータ前処理
1)ライブラリを、Illumina Nextseq 500シーケンサーを使用してペアエンドシーケンシングした。
2)Pear(v0.6.0)ソフトウェアは、Illumina Hiseq X10/Nextseq 500/Nova seqシーケンサーからの同じペアエンド150bpシーケンシング断片のペアエンド配列決定データを、最短重複長が20bpであり、最短長が組み合わせ後に30bpである一配列に組み合わせた。
3)Trim_galore v 0.6.0及びcutadapt v1.8.1ソフトウェアを使用して、結合された配列決定データに対してアダプタ除去を行った。アダプタ配列「AGATCGGAAGAGCAC」を配列の5’末端から除去し、両端のシーケンシング品質値が20未満の塩基を除去した。
3.シーケンシングデータアライメント
本明細書で使用される参照ゲノムデータは、UCSCデータベース(UCSC:HG19,hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/hg19.fa.gz)からのものであった。
1)まず、Bismark softwareを用いてHG19をシトシンからチミン(CT)及びアデニンからグアニン(GA)に変換し、Bowtie2 softwareを用いて変換後のゲノムのインデックスを構築した。
2)前処理されたデータはまた、CT及びGAの変換に供された。
3)変換された配列を、Bowtie2ソフトウェアを使用して変換されたHG19参照ゲノムにアラインメントした。最小シード配列長は20であり、シード配列においてミスマッチは許容されなかった。
4.MHFの算出
各標的領域HG19のCpG部位について、上記のアライメント結果に基づいて、各部位に対応するメチル化状態を求めた。本明細書における部位のヌクレオチド番号付けは、HG19のヌクレオチド位置番号付けに対応する。1つの標的メチル化領域は、複数のメチル化ハプロタイプを有し得る。この値は、標的領域内のメチル化ハプロタイプごとに計算する必要がある。MHFの計算式の一例は以下の通りであり、
式中、iは標的メチル化領域を表し、hは標的メチル化ハプロタイプを表し、Niは標的メチル化領域に位置するリードの数を表し、Ni、hは標的メチル化ハプロタイプを含むリードの数を表す。
5.メチル化データマトリックス
1)訓練セット及び試験セット中の各試料のメチル化配列決定データをデータマトリックスに組合せ、200未満の深さの各部位を欠損値とした。
2)10%を超える欠損値割合を有する部位を除去した。
3)データマトリックスの欠損値については、KNNアルゴリズムを使用して欠損データを補間した。
6.学習セット試料群に基づく特徴メチル化セグメントの発見
1)表現型に関して各メチル化セグメントについてロジスティック回帰モデルを構築し、最も有意な回帰係数を有するメチル化セグメントを各増幅標的領域についてスクリーニングして候補メチル化セグメントを形成した。
2)訓練セットを、十倍クロスバリデーション増分特徴選択のために10の部分にランダムに分割した。
3)各領域における候補メチル化セグメントを回帰係数の有意性に従って降順にランク付けし、1つのメチル化セグメントのデータを毎回追加して試験データを予測した。
4)工程3)では、工程2)で生成されたデータの10コピーを使用した。データの各コピーについて、10回の計算を行い、最終AUCは10回の計算の平均であった。訓練データのAUCが増加した場合、候補メチル化セグメントは特徴メチル化セグメントとして保持され、そうでない場合は破棄される。
5)訓練セット中の異なる数の特徴の下での平均AUC中央値に対応する特徴の組合せを、特徴メチル化セグメントの最終的な組合せとした。
HG19における選択された特徴的なメチル化マーカの分布は以下の通りである:SIX3遺伝子領域における配列番号57、TLX2遺伝子領域における配列番号58、及びCILP2遺伝子領域における配列番号59。上記のメチル化マーカのレベルは、膵癌患者のcfDNAにおいて増加又は減少した(表2-1)。上記3つのマーカ領域の配列を配列番号57~59に示す。各マーカ領域中の全てのCpG部位のメチル化レベルは、MethylTitanシーケンシングによって得ることができる。各領域における全てのCpG部位の平均メチル化レベル、並びに単一のCpG部位のメチル化状態は、いずれも膵癌の診断のためのマーカとして使用することができる。
試験セットにおける膵癌患者及び慢性膵炎患者のメチル化マーカのメチル化レベルを表2-2に示す。表から分かるように、メチル化マーカのメチル化レベルの分布は、膵癌患者と慢性膵炎患者とで有意に異なり、良好な鑑別効果が得られた。
表2-3に、選択した各マーカにおけるランダムな10個のCpG部位又はそれらの組合せのメチル化度とマーカ全体のメチル化度との相関(ピアソン相関係数)及び対応する有意性p値を示す。マーカ内の単一のCpG部位又は複数のCpG部位の組合せのメチル化レベルは、全領域のメチル化状態又はレベルと有意な相関を有し(p<0.05)、相関係数はいずれも0.8を超えることが分かる。この強い又は極めて強い相関は、マーカ内の単一のCpG部位又は複数のCpG部位の組合せがマーカ全体と同じ良好な分化効果を有することを示す。
1)訓練セット及び試験セット中の各試料のメチル化配列決定データをデータマトリックスに組合せ、200未満の深さの各部位を欠損値とした。
2)10%を超える欠損値割合を有する部位を除去した。
3)データマトリックスの欠損値については、KNNアルゴリズムを使用して欠損データを補間した。
6.学習セット試料群に基づく特徴メチル化セグメントの発見
1)表現型に関して各メチル化セグメントについてロジスティック回帰モデルを構築し、最も有意な回帰係数を有するメチル化セグメントを各増幅標的領域についてスクリーニングして候補メチル化セグメントを形成した。
2)訓練セットを、十倍クロスバリデーション増分特徴選択のために10の部分にランダムに分割した。
3)各領域における候補メチル化セグメントを回帰係数の有意性に従って降順にランク付けし、1つのメチル化セグメントのデータを毎回追加して試験データを予測した。
4)工程3)では、工程2)で生成されたデータの10コピーを使用した。データの各コピーについて、10回の計算を行い、最終AUCは10回の計算の平均であった。訓練データのAUCが増加した場合、候補メチル化セグメントは特徴メチル化セグメントとして保持され、そうでない場合は破棄される。
5)訓練セット中の異なる数の特徴の下での平均AUC中央値に対応する特徴の組合せを、特徴メチル化セグメントの最終的な組合せとした。
HG19における選択された特徴的なメチル化マーカの分布は以下の通りである:SIX3遺伝子領域における配列番号57、TLX2遺伝子領域における配列番号58、及びCILP2遺伝子領域における配列番号59。上記のメチル化マーカのレベルは、膵癌患者のcfDNAにおいて増加又は減少した(表2-1)。上記3つのマーカ領域の配列を配列番号57~59に示す。各マーカ領域中の全てのCpG部位のメチル化レベルは、MethylTitanシーケンシングによって得ることができる。各領域における全てのCpG部位の平均メチル化レベル、並びに単一のCpG部位のメチル化状態は、いずれも膵癌の診断のためのマーカとして使用することができる。
試験セットにおける膵癌患者及び慢性膵炎患者のメチル化マーカのメチル化レベルを表2-2に示す。表から分かるように、メチル化マーカのメチル化レベルの分布は、膵癌患者と慢性膵炎患者とで有意に異なり、良好な鑑別効果が得られた。
表2-3に、選択した各マーカにおけるランダムな10個のCpG部位又はそれらの組合せのメチル化度とマーカ全体のメチル化度との相関(ピアソン相関係数)及び対応する有意性p値を示す。マーカ内の単一のCpG部位又は複数のCpG部位の組合せのメチル化レベルは、全領域のメチル化状態又はレベルと有意な相関を有し(p<0.05)、相関係数はいずれも0.8を超えることが分かる。この強い又は極めて強い相関は、マーカ内の単一のCpG部位又は複数のCpG部位の組合せがマーカ全体と同じ良好な分化効果を有することを示す。
2-2:単一メチル化マーカの予測性能
単一のメチル化マーカが膵炎と膵癌とを区別する能力を検証するために、単一のメチル化マーカのメチル化レベルの値を使用して、単一のマーカの予測性能を検証した。
まず、3つのメチル化マーカのメチル化レベル値を訓練用の訓練セット試料に分けて使用し、膵癌と膵炎とを鑑別するための閾値、感度及び特異度を決定し、次いで、閾値を使用して試験セット中の試料の感度及び特異度を統計的に分析した。結果を以下の表2-4(隅付き括弧による表25)に示す。単一のマーカも良好な分化性能を達成することができることが分かる。
単一のメチル化マーカが膵炎と膵癌とを区別する能力を検証するために、単一のメチル化マーカのメチル化レベルの値を使用して、単一のマーカの予測性能を検証した。
まず、3つのメチル化マーカのメチル化レベル値を訓練用の訓練セット試料に分けて使用し、膵癌と膵炎とを鑑別するための閾値、感度及び特異度を決定し、次いで、閾値を使用して試験セット中の試料の感度及び特異度を統計的に分析した。結果を以下の表2-4(隅付き括弧による表25)に示す。単一のマーカも良好な分化性能を達成することができることが分かる。
2-3.分類予測モデルの構築
マーカDNAメチル化レベル(メチル化ハプロタイプ分率等)を用いて膵癌患者と慢性膵炎患者とを分類する潜在的な能力を検証するために、訓練群において、3つのDNAメチル化マーカの組合せに基づいてサポートベクターマシン疾患分類モデルを構築して、試験群におけるこのDNAメチル化マーカ群の分類予測効果を検証した。訓練群及び試験群は、訓練群の80個の試料(試料1~80)及び試験群の39個の試料(試料80~119)を包含する割合に従って分割した。
発見されたDNAメチル化マーカを使用して、両方の試料群の訓練セットにおいて、サポートベクターマシンモデルを構築した。
1)試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2)メチル化マーカを使用して膵癌を同定する可能性を利用するために、疾患分類システムが遺伝子マーカに基づいて開発された。SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(v0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(v0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
モデルを構築する過程で、膵癌型は1、慢性膵炎型は0とコードされた。sklearnソフトウェアパッケージ(v0.23.1)によってモデルを構築する方法では、閾値はデフォルトで0.897に設定されていた。最後に、構築されたモデルは、膵癌と膵炎とを区別するためのスコア閾値として0.897を使用した。訓練セット試料に対する2つのモデルの予測スコアを表2-5(隅付き括弧による表26)に示す。
マーカDNAメチル化レベル(メチル化ハプロタイプ分率等)を用いて膵癌患者と慢性膵炎患者とを分類する潜在的な能力を検証するために、訓練群において、3つのDNAメチル化マーカの組合せに基づいてサポートベクターマシン疾患分類モデルを構築して、試験群におけるこのDNAメチル化マーカ群の分類予測効果を検証した。訓練群及び試験群は、訓練群の80個の試料(試料1~80)及び試験群の39個の試料(試料80~119)を包含する割合に従って分割した。
発見されたDNAメチル化マーカを使用して、両方の試料群の訓練セットにおいて、サポートベクターマシンモデルを構築した。
1)試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2)メチル化マーカを使用して膵癌を同定する可能性を利用するために、疾患分類システムが遺伝子マーカに基づいて開発された。SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)パイソンソフトウェア(v3.6.9)のsklearnソフトウェアパッケージ(v0.23.1)を使用して、訓練モデルを構築し、訓練モデルの訓練モードを相互検証する。コマンドライン:model=SVR()。
b)sklearnソフトウェアパッケージ(v0.23.1)は、メチル化値データマトリックスを入力してSVMモデルmodel.fit(x_train,y_train)を構築するために使用され、x_trainは訓練セットデータマトリックスを表し、y_trainは訓練セットの表現型情報を表す。
モデルを構築する過程で、膵癌型は1、慢性膵炎型は0とコードされた。sklearnソフトウェアパッケージ(v0.23.1)によってモデルを構築する方法では、閾値はデフォルトで0.897に設定されていた。最後に、構築されたモデルは、膵癌と膵炎とを区別するためのスコア閾値として0.897を使用した。訓練セット試料に対する2つのモデルの予測スコアを表2-5(隅付き括弧による表26)に示す。
2-4:分類予測モデル試験
上記の膵癌及び膵炎の対象の血液試料を用いてMethylTitanシーケンシングを行い、シーケンシング結果における特徴的なメチル化マーカシグナルに基づいて、PCA及びクラスタリング等の分類解析を行った。
本出願のメチル化マーカ群に基づいて、例2-3においてSVMにより確立されたモデルに従った試験セットにおいて予測した。予測関数を用いて試験セットを予測して、予測結果を出力した(疾患確率:デフォルトスコア閾値は0.897であり、スコアが0.897より大きい場合、対象は膵酸を有する患者とみなされ、そうでない場合、対象は慢性膵炎を有する患者である)。試験群は57個の試料(試料118~174)を有し、計算方法は以下の通りである。
コマンドライン:
test_pred=model.predict(test_df)
ここで、test_predは、例2-3で構築されたSVM予測モデルを使用して取得された試験セット内の試料の予測スコアを表し、modelは、例2-3で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
試験群の予測スコアを表2-6に示す。ROC曲線を図19に示す。予測スコア分布を図20に示す。試験群の全AUC下の面積は0.847であった。訓練セットにおいて、特異度が88.2%であるとき、このモデルの感度は88.9%に達することができ、試験セットにおいて、特異度が87.5%である場合、感度は74.2%に達することができた。選択された変数によって確立されたSVMモデルの微分効果が良好であることが分かる。
上記の膵癌及び膵炎の対象の血液試料を用いてMethylTitanシーケンシングを行い、シーケンシング結果における特徴的なメチル化マーカシグナルに基づいて、PCA及びクラスタリング等の分類解析を行った。
本出願のメチル化マーカ群に基づいて、例2-3においてSVMにより確立されたモデルに従った試験セットにおいて予測した。予測関数を用いて試験セットを予測して、予測結果を出力した(疾患確率:デフォルトスコア閾値は0.897であり、スコアが0.897より大きい場合、対象は膵酸を有する患者とみなされ、そうでない場合、対象は慢性膵炎を有する患者である)。試験群は57個の試料(試料118~174)を有し、計算方法は以下の通りである。
コマンドライン:
test_pred=model.predict(test_df)
ここで、test_predは、例2-3で構築されたSVM予測モデルを使用して取得された試験セット内の試料の予測スコアを表し、modelは、例2-3で構築されたSVM予測モデルを表し、test_dfは試験セットデータを表す。
試験群の予測スコアを表2-6に示す。ROC曲線を図19に示す。予測スコア分布を図20に示す。試験群の全AUC下の面積は0.847であった。訓練セットにおいて、特異度が88.2%であるとき、このモデルの感度は88.9%に達することができ、試験セットにおいて、特異度が87.5%である場合、感度は74.2%に達することができた。選択された変数によって確立されたSVMモデルの微分効果が良好であることが分かる。
図21及び22は、それぞれ訓練群及び試験群における3つのメチル化マーカの分布を示す。このメチル化マーカ群の相違は、膵炎患者の血漿と膵癌患者の血漿とで比較的安定していることが分かる。
2-5:腫瘍マーカ陰性である患者に対する予測効果
本出願のメチル化マーカ群に基づき、例2-3においてSVMにより確立されたモデルに従って、腫瘍マーカCA19-9陰性(<37)の患者を判別した。
試験群の予測スコアを表2-7に、ROC曲線を図23に示す。従来の腫瘍マーカCA19-9によって区別することができない患者については、構築されたSVMモデルも良好な結果を達成することができることが分かる。
2-5:腫瘍マーカ陰性である患者に対する予測効果
本出願のメチル化マーカ群に基づき、例2-3においてSVMにより確立されたモデルに従って、腫瘍マーカCA19-9陰性(<37)の患者を判別した。
試験群の予測スコアを表2-7に、ROC曲線を図23に示す。従来の腫瘍マーカCA19-9によって区別することができない患者については、構築されたSVMモデルも良好な結果を達成することができることが分かる。
この研究では、血漿cfDNA中のメチル化マーカのメチル化レベルを使用して、慢性膵炎を有する対象の血漿と膵癌を有する対象の血漿との間の差を研究し、有意差のある3つのDNAメチル化マーカをスクリーニングした。上記のDNAメチル化マーカ群に基づいて、サポートベクターマシン法により、膵癌患者と慢性膵炎患者とを感度及び特異度高く効果的に鑑別することができ、慢性膵炎患者における膵癌のスクリーニング及び診断に適した悪性膵癌リスク予測モデルを構築した。
例3
3-1:標的化メチル化配列決定による膵癌特異的メチル化部位のスクリーニング
年齢及び性別が一致する膵癌血液試料を合計110個、膵癌を有さない試料を110個採取した。全ての登録患者がインフォームドコンセント用紙に署名した。試料情報を表3-1(隅付き括弧による表29)に示す。
本出願は、DNAメチル化マーカのクラスターを提供する。患者の血漿試料中のDNAメチル化マーカのメチル化レベルを検出することにより、検出されたメチル化レベルデータを用いて、診断モデルに従ってスコアを予測し、膵癌患者と健康な人とを識別して、早期スクリーニングの精度が高く、コストが低い膵癌の早期診断という目的を達成する。
例3
3-1:標的化メチル化配列決定による膵癌特異的メチル化部位のスクリーニング
年齢及び性別が一致する膵癌血液試料を合計110個、膵癌を有さない試料を110個採取した。全ての登録患者がインフォームドコンセント用紙に署名した。試料情報を表3-1(隅付き括弧による表29)に示す。
本出願は、DNAメチル化マーカのクラスターを提供する。患者の血漿試料中のDNAメチル化マーカのメチル化レベルを検出することにより、検出されたメチル化レベルデータを用いて、診断モデルに従ってスコアを予測し、膵癌患者と健康な人とを識別して、早期スクリーニングの精度が高く、コストが低い膵癌の早期診断という目的を達成する。
1.試料cfDNA抽出
全ての血液試料をStreckチューブに採取し、血漿を抽出するために、血液試料を最初に1600gで4℃で10分間遠心分離した。バフィーコート層の損傷を防ぐために、滑らかな制動モードを設定する必要があった。次いで、上清を新しい1.5mlコニカルチューブに移し、4℃で10分間16000gで遠心分離した。上清を新しい1.5mlコニカルチューブに再び移し、-80℃で保存した。
循環無細胞DNA(cfDNA)を抽出するために、血漿アリコートを解凍し、製造業者の指示に従ってQIAamp Circulating Nucleic Acid Extraction Kit(Qiagen 55114)を使用して直ちに処理した。抽出されたcfDNA濃度を、qubit3.0を使用して定量した。
2.バイサルファイト変換及びライブラリの調製
亜硫酸水素ナトリウム変換キット(ThermoFisher、MECOV50)を用いて、シトシン塩基の亜硫酸水素ナトリウム変換を行った。製造者の説明書に従って、20ngのゲノムDNA又はctDNAを下流用途のために変換及び精製した。
試料DNAの抽出、品質検査、及びDNA上の非メチル化シトシンのグアニンに結合しない塩基への変換を行った。1つ又は複数の実施形態において、変換は、酵素的方法、好ましくはデアミナーゼによる処理を用いて行われるか、又は変換は、非酵素的方法、好ましくはバイサルファイト若しくは重硫酸塩による処理、より好ましくは亜硫酸水素カルシウム、亜硫酸水素ナトリウム、亜硫酸水素カリウム、重亜硫酸アンモニウム、重硫酸ナトリウム、重硫酸カリウム及び重硫酸アンモニウムによる処理を用いて行われる。
ライブラリは、MethylTitan(特許番号:CN201910515830)法を用いて構築した。メチルチタン法は以下の通りである。バイサルファイトによって変換されたDNAを脱リン酸化し、次いで、分子タグ(UMI)を有するユニバーサルIllumina配列決定アダプタに連結した。第2鎖の合成及び精製の後、変換されたDNAを、必要な標的領域の標的化増幅のための半標的化PCR反応に供した。再度精製した後、試料特異的バーコード及び全長Illumina配列決定アダプタをPCR反応によって標的DNA分子に加えた。次いで、IlluminaのKAPAライブラリ定量キット(KK4844)を用いて最終ライブラリを定量し、Illuminaシーケンサーで配列決定した。MethylTitanライブラリ構築方法は、必要な標的断片をより少量のDNA、特にcfDNAで効果的に濃縮することができるが、この方法は元のDNAのメチル化状態を十分に保存することができ、最終的に隣接するCpGメチル化シトシン(所与のターゲットは、所与の領域に応じて、数から数十のCpGを有することができる)を分析することによって、その特定の領域の全メチル化パターンは、個々の塩基の状態を比較するのではなく、固有のマーカとして機能することができる。
3.配列決定及びデータ前処理
1)ペアエンド配列決定を、Illumina Hiseq 2500シーケンサーを使用して行った。配列決定体積は、試料当たり25~35Mであった。Illumina Hiseq 2500シーケンサーからのペアエンド150bpシーケンシングデータを、Trim_galore v0.6.0及びcutadapt v2.1ソフトウェアを使用してアダプタ除去に供した。Read1の3’末端のアダプタ配列「AGATCGGAAGAGCACACGTCTGAACTCCAGTC」を除去し、Read2の3’末端のアダプタ配列「AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT」を除去し、シーケンシング品質が20未満であった塩基を両端から除去した。5’末端に3bpアダプタ配列が存在する場合、リード全体が除去される。30塩基より短いリードもアダプタ除去後に除去した。
2)ペアエンド配列を、Pear v0.9.6ソフトウェアを使用してシングルエンド配列に組み合わせた。少なくとも20塩基が重複する両端からのリードを組合せ、組み合わせたリードが30塩基より短い場合は破棄した。
全ての血液試料をStreckチューブに採取し、血漿を抽出するために、血液試料を最初に1600gで4℃で10分間遠心分離した。バフィーコート層の損傷を防ぐために、滑らかな制動モードを設定する必要があった。次いで、上清を新しい1.5mlコニカルチューブに移し、4℃で10分間16000gで遠心分離した。上清を新しい1.5mlコニカルチューブに再び移し、-80℃で保存した。
循環無細胞DNA(cfDNA)を抽出するために、血漿アリコートを解凍し、製造業者の指示に従ってQIAamp Circulating Nucleic Acid Extraction Kit(Qiagen 55114)を使用して直ちに処理した。抽出されたcfDNA濃度を、qubit3.0を使用して定量した。
2.バイサルファイト変換及びライブラリの調製
亜硫酸水素ナトリウム変換キット(ThermoFisher、MECOV50)を用いて、シトシン塩基の亜硫酸水素ナトリウム変換を行った。製造者の説明書に従って、20ngのゲノムDNA又はctDNAを下流用途のために変換及び精製した。
試料DNAの抽出、品質検査、及びDNA上の非メチル化シトシンのグアニンに結合しない塩基への変換を行った。1つ又は複数の実施形態において、変換は、酵素的方法、好ましくはデアミナーゼによる処理を用いて行われるか、又は変換は、非酵素的方法、好ましくはバイサルファイト若しくは重硫酸塩による処理、より好ましくは亜硫酸水素カルシウム、亜硫酸水素ナトリウム、亜硫酸水素カリウム、重亜硫酸アンモニウム、重硫酸ナトリウム、重硫酸カリウム及び重硫酸アンモニウムによる処理を用いて行われる。
ライブラリは、MethylTitan(特許番号:CN201910515830)法を用いて構築した。メチルチタン法は以下の通りである。バイサルファイトによって変換されたDNAを脱リン酸化し、次いで、分子タグ(UMI)を有するユニバーサルIllumina配列決定アダプタに連結した。第2鎖の合成及び精製の後、変換されたDNAを、必要な標的領域の標的化増幅のための半標的化PCR反応に供した。再度精製した後、試料特異的バーコード及び全長Illumina配列決定アダプタをPCR反応によって標的DNA分子に加えた。次いで、IlluminaのKAPAライブラリ定量キット(KK4844)を用いて最終ライブラリを定量し、Illuminaシーケンサーで配列決定した。MethylTitanライブラリ構築方法は、必要な標的断片をより少量のDNA、特にcfDNAで効果的に濃縮することができるが、この方法は元のDNAのメチル化状態を十分に保存することができ、最終的に隣接するCpGメチル化シトシン(所与のターゲットは、所与の領域に応じて、数から数十のCpGを有することができる)を分析することによって、その特定の領域の全メチル化パターンは、個々の塩基の状態を比較するのではなく、固有のマーカとして機能することができる。
3.配列決定及びデータ前処理
1)ペアエンド配列決定を、Illumina Hiseq 2500シーケンサーを使用して行った。配列決定体積は、試料当たり25~35Mであった。Illumina Hiseq 2500シーケンサーからのペアエンド150bpシーケンシングデータを、Trim_galore v0.6.0及びcutadapt v2.1ソフトウェアを使用してアダプタ除去に供した。Read1の3’末端のアダプタ配列「AGATCGGAAGAGCACACGTCTGAACTCCAGTC」を除去し、Read2の3’末端のアダプタ配列「AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT」を除去し、シーケンシング品質が20未満であった塩基を両端から除去した。5’末端に3bpアダプタ配列が存在する場合、リード全体が除去される。30塩基より短いリードもアダプタ除去後に除去した。
2)ペアエンド配列を、Pear v0.9.6ソフトウェアを使用してシングルエンド配列に組み合わせた。少なくとも20塩基が重複する両端からのリードを組合せ、組み合わせたリードが30塩基より短い場合は破棄した。
4.シーケンシングデータの比較
本出願で使用される参照ゲノムデータは、UCSCデータベース(UCSC:hg19,hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/hg19.fa.gz)からのものであった。
1)まず、Bismark softwareを用いてhg19をシトシンからチミン(CT)及びアデニンからグアニン(GA)に変換し、Bowtie2 softwareを用いて変換後のゲノムのインデックスを構築した。
2)前処理されたデータはまた、CT及びGA変換に供された。
3)変換された配列を、Bowtie2ソフトウェアを使用して変換されたHG19参照ゲノムにアラインメントした。最小シード配列長は20であり、シード配列においてミスマッチは許容されなかった。
5.メチル化情報の抽出
各標的領域hg19のCpG部位について、上記のアライメント結果に基づいて、各部位に対応するメチル化レベルを求めた。本発明に関与する部位のヌクレオチド番号付けは、hg19のヌクレオチド位置番号付けに対応する。
1)メチル化ハプロタイプ分率(MHF)を算出するために、各標的領域hg19のCpG部位について、上記の比較結果に基づいて、リードの各部位に対応する塩基配列を得た(Cはこの部位でメチル化が起こることを示し、Tはこの部位の非メチル化状態を示す)。本明細書における部位のヌクレオチド番号付けは、HG19のヌクレオチド位置番号付けに対応する。1つの標的メチル化領域は、複数のメチル化ハプロタイプを有し得る。この値は、標的領域内のメチル化ハプロタイプごとに計算する必要がある。MHFの計算式の一例は以下の通りであり、
MHFi,h=(Ni,h)/Ni
式中、iは標的メチル化領域を表し、hは標的メチル化ハプロタイプを表し、Niは標的メチル化領域に位置するリードの数を表し、Ni、hは標的メチル化ハプロタイプを含むリードの数を表す。
2)平均メチル化度(AMF)の算出は、対象領域毎に、その領域内の平均メチル化度を算出する。式は以下の通りである。
AMF=
式中、mは標的中のCpG部位の総数であり、iは領域中の各CpG部位であり、NC、iは塩基がTであるCpG部位でのリードの数(すなわち、この部位でメチル化されているリードの数)であり、NT、iは塩基がTであるCpG部位でのリードの数(すなわち、この部位でメチル化されていない配列決定リードの数)である。
6.特徴マトリックスの構築
1)訓練セット及び試験セットの試料のメチル化ハプロタイプ分率(MHF)及び平均メチル化分率(AMF)のデータをそれぞれデータマトリックスに組合せ、深度200未満の各部位を欠損値とした。
2)10%を超える欠損値割合を有する部位を除去した。
3)データマトリックスの欠損値については、KNNアルゴリズムを使用して欠損データを補間した。まず、KNNアルゴリズムによる訓練セットを用いて補間器を訓練した後、訓練セットマトリックス及び試験セットマトリックスをそれぞれ補間した。
7.特徴マトリックスによるメチル化マーカのスクリーニング(図1)
1)訓練セットをランダムに3分割し、ロジスティック回帰モデルを構築し、各標的領域の平均AUCを計算し、各標的領域のAUCが最大の特徴を領域の代表的な特徴として選択し、AUCに従って降順にランク付けした。
2)訓練セットを、十倍クロスバリデーション増分特徴選択のために10の部分にランダムに分割した。特定の方法は、訓練セット内のデータの一部を試験データとして破棄し、訓練セット内の残りのデータを訓練データとして破棄することを含んでいた。上記の順序に従って、各領域の代表的な特徴を特徴の組合せに組み込み、9個の訓練データを用いてロジスティック回帰モデルを構築し、試験データを予測した。10回繰り返した後、試験データの平均AUCを算出した。
3)訓練データのAUCが増加すると、メチル化マーカは維持され、そうでなければ除去される。サイクル後、得られた特徴の組合せをメチル化マーカの組合せとし、全ての訓練セットデータを用いて新たなモデルを訓練し、試験セットデータを用いて検証した。
本出願で使用される参照ゲノムデータは、UCSCデータベース(UCSC:hg19,hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/hg19.fa.gz)からのものであった。
1)まず、Bismark softwareを用いてhg19をシトシンからチミン(CT)及びアデニンからグアニン(GA)に変換し、Bowtie2 softwareを用いて変換後のゲノムのインデックスを構築した。
2)前処理されたデータはまた、CT及びGA変換に供された。
3)変換された配列を、Bowtie2ソフトウェアを使用して変換されたHG19参照ゲノムにアラインメントした。最小シード配列長は20であり、シード配列においてミスマッチは許容されなかった。
5.メチル化情報の抽出
各標的領域hg19のCpG部位について、上記のアライメント結果に基づいて、各部位に対応するメチル化レベルを求めた。本発明に関与する部位のヌクレオチド番号付けは、hg19のヌクレオチド位置番号付けに対応する。
1)メチル化ハプロタイプ分率(MHF)を算出するために、各標的領域hg19のCpG部位について、上記の比較結果に基づいて、リードの各部位に対応する塩基配列を得た(Cはこの部位でメチル化が起こることを示し、Tはこの部位の非メチル化状態を示す)。本明細書における部位のヌクレオチド番号付けは、HG19のヌクレオチド位置番号付けに対応する。1つの標的メチル化領域は、複数のメチル化ハプロタイプを有し得る。この値は、標的領域内のメチル化ハプロタイプごとに計算する必要がある。MHFの計算式の一例は以下の通りであり、
MHFi,h=(Ni,h)/Ni
式中、iは標的メチル化領域を表し、hは標的メチル化ハプロタイプを表し、Niは標的メチル化領域に位置するリードの数を表し、Ni、hは標的メチル化ハプロタイプを含むリードの数を表す。
2)平均メチル化度(AMF)の算出は、対象領域毎に、その領域内の平均メチル化度を算出する。式は以下の通りである。
AMF=
式中、mは標的中のCpG部位の総数であり、iは領域中の各CpG部位であり、NC、iは塩基がTであるCpG部位でのリードの数(すなわち、この部位でメチル化されているリードの数)であり、NT、iは塩基がTであるCpG部位でのリードの数(すなわち、この部位でメチル化されていない配列決定リードの数)である。
6.特徴マトリックスの構築
1)訓練セット及び試験セットの試料のメチル化ハプロタイプ分率(MHF)及び平均メチル化分率(AMF)のデータをそれぞれデータマトリックスに組合せ、深度200未満の各部位を欠損値とした。
2)10%を超える欠損値割合を有する部位を除去した。
3)データマトリックスの欠損値については、KNNアルゴリズムを使用して欠損データを補間した。まず、KNNアルゴリズムによる訓練セットを用いて補間器を訓練した後、訓練セットマトリックス及び試験セットマトリックスをそれぞれ補間した。
7.特徴マトリックスによるメチル化マーカのスクリーニング(図1)
1)訓練セットをランダムに3分割し、ロジスティック回帰モデルを構築し、各標的領域の平均AUCを計算し、各標的領域のAUCが最大の特徴を領域の代表的な特徴として選択し、AUCに従って降順にランク付けした。
2)訓練セットを、十倍クロスバリデーション増分特徴選択のために10の部分にランダムに分割した。特定の方法は、訓練セット内のデータの一部を試験データとして破棄し、訓練セット内の残りのデータを訓練データとして破棄することを含んでいた。上記の順序に従って、各領域の代表的な特徴を特徴の組合せに組み込み、9個の訓練データを用いてロジスティック回帰モデルを構築し、試験データを予測した。10回繰り返した後、試験データの平均AUCを算出した。
3)訓練データのAUCが増加すると、メチル化マーカは維持され、そうでなければ除去される。サイクル後、得られた特徴の組合せをメチル化マーカの組合せとし、全ての訓練セットデータを用いて新たなモデルを訓練し、試験セットデータを用いて検証した。
合計101個のメチル化マーカをスクリーニングした。GREATツール(great.stanford.edu/great/public-3.0.0/html/index.php)を遺伝子アノテーションに使用した(表3-2参照)。GREAT分析では、マーカ領域を隣接遺伝子と相関させ、隣接遺伝子を有する領域に注釈を付けた。相関を2つの方法に分けた。まず、各遺伝子の調節ドメインを見つけ、次いで、この領域の調節ドメインをカバーする遺伝子をこの領域と相関させた。
例えば、ARHGEF16(-60,185)及びPRDM16(+325,030)は、ARHGEF16遺伝子の転写開始部位(TSS)から60,185bp上流及びPRDM16遺伝子の転写開始部位(TSS)から325,030bp下流のマーカを表す。
例えば、ARHGEF16(-60,185)及びPRDM16(+325,030)は、ARHGEF16遺伝子の転写開始部位(TSS)から60,185bp上流及びPRDM16遺伝子の転写開始部位(TSS)から325,030bp下流のマーカを表す。
メチル化マーカ領域のメチル化レベルは、膵癌cfDNAにおいて亢進又は低下していた(表3-3参照)。得られた101個のメチル化マーカの配列は、配列番号60~160に示す通りである。各メチル化マーカの全てのCpG部位のメチル化レベルは、MethylTitanメチル化シーケンシングによって取得することができる。各領域における全てのCpG部位の平均メチル化レベル、並びに単一のCpG部位のメチル化レベルは、いずれも膵癌のマーカとして使用することができる。
表3-3(隅付き括弧による表31)から分かるように、メチル化マーカ領域における平均メチル化レベルの分布は、膵癌罹患者と膵癌非罹患者とで有意に異なっており、分化効果が良好で有意差がある(P<0.01)ことから、膵癌に対する良好なメチル化マーカであるといえる。
3-2:単一メチル化マーカの分化能
単一のメチル化マーカが膵癌を膵癌非存在下と鑑別する能力を検証するために、例3-1の訓練セットデータにおいて、単一マーカのメチル化度データを用いてモデルを訓練し、試験セットの試料を用いてモデルの性能を検証した。
Python(V1.0.1)のsklearn(V3.9.7)パッケージのロジスティック回帰モデルを使用した:model=LogisticRegression()。モデルの式は以下の通りであり、ここで、xは試料標的マーカのメチル化レベル値であり、wは異なるマーカの係数であり、bは切片値であり、yはモデル予測スコアである。
訓練は、訓練セット:model.fit(Traindata,TrainPheno)からの試料を使用して行われ、ここで、TrainDataは訓練セット試料中の標的メチル化部位のデータであり、TrainPhenoは訓練セット試料の形質である(膵癌については1、膵癌非存在については0)。モデルの関連閾値は、訓練セットの試料に基づいて決定された。
試験セットの試料を使用して試験を行った:TestPred=model.predict_proba(TestData)[:1]、式中、TestDataは試験セット試料中の標的メチル化部位のデータであり、TestPredはモデル予測スコアである。この閾値に基づく予測スコアを用いて、試料が膵癌であるか否かを決定した。
3-2:単一メチル化マーカの分化能
単一のメチル化マーカが膵癌を膵癌非存在下と鑑別する能力を検証するために、例3-1の訓練セットデータにおいて、単一マーカのメチル化度データを用いてモデルを訓練し、試験セットの試料を用いてモデルの性能を検証した。
Python(V1.0.1)のsklearn(V3.9.7)パッケージのロジスティック回帰モデルを使用した:model=LogisticRegression()。モデルの式は以下の通りであり、ここで、xは試料標的マーカのメチル化レベル値であり、wは異なるマーカの係数であり、bは切片値であり、yはモデル予測スコアである。
訓練は、訓練セット:model.fit(Traindata,TrainPheno)からの試料を使用して行われ、ここで、TrainDataは訓練セット試料中の標的メチル化部位のデータであり、TrainPhenoは訓練セット試料の形質である(膵癌については1、膵癌非存在については0)。モデルの関連閾値は、訓練セットの試料に基づいて決定された。
試験セットの試料を使用して試験を行った:TestPred=model.predict_proba(TestData)[:1]、式中、TestDataは試験セット試料中の標的メチル化部位のデータであり、TestPredはモデル予測スコアである。この閾値に基づく予測スコアを用いて、試料が膵癌であるか否かを決定した。
本例における単一メチル化マーカのロジスティック回帰モデルの効果を表3-4に示す。この表から、全てのメチル化マーカのAUC値は、試験セット及び訓練セットのいずれにおいても0.55を超えており、いずれも膵癌の良好なマーカであることが分かる。
本特許における各単一メチル化マーカは、膵癌マーカとして使用することができる。ロジスティック回帰モデリングは、訓練セットに従って閾値を設定するために使用される。スコアが閾値より大きい場合、膵癌であると予測され、逆もまた同様である場合、膵癌非存在であると予測される。訓練セット及び試験セットは、非常に良好な精度、特異性及び感度を達成することができ、他の機械学習モデルも同様の結果を達成することができる。
本特許における各単一メチル化マーカは、膵癌マーカとして使用することができる。ロジスティック回帰モデリングは、訓練セットに従って閾値を設定するために使用される。スコアが閾値より大きい場合、膵癌であると予測され、逆もまた同様である場合、膵癌非存在であると予測される。訓練セット及び試験セットは、非常に良好な精度、特異性及び感度を達成することができ、他の機械学習モデルも同様の結果を達成することができる。
3-3:全ての対象メチル化マーカに対する機械学習モデル
本例では、101個のメチル化マーカ全てのメチル化レベルを用いて、データ中の膵癌罹患検体と膵癌非罹患検体とを精度よく判別できるロジスティック回帰機械学習モデルMODEL1を構築する。具体的な工程は、101個の標的メチル化マーカ(配列番号60~160)の全ての組合せのデータ入力モデルを用いること以外は、基本的に例3-2と同様である。
訓練セット及び試験セットにおけるモデル予測スコアの分布を図25に示す。ROC曲線を図26に示す。訓練セットでは、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.982に達した。試験セットにおいて、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.975に達した。閾値を0.600に設定し、スコアがこの値より大きい場合は膵癌と予測し、そうでない場合は膵癌非存在と予測した。この閾値の下では、訓練セット精度は0.939であり、訓練セット特異度は0.984であり、訓練セット感度は0.899であり、試験セット精度は0.886であり、試験セット特異度は0.915であり、試験セット感度は0.854であり、モデルは、膵癌を有する試料と膵癌を有さない試料とを区別することができる。
3-4:メチル化マーカの組合せ1の機械学習モデル
当該マーカの組合せの効果を検証するために、本例では、101個のメチル化マーカの全てから、メチル化レベルに基づいて、配列番号113、配列番号124、配列番号67、配列番号77、配列番号80、配列番号96を包含する計6個のメチル化マーカを選択し、ロジスティック回帰機械学習モデルを構築した。
機械学習モデルの構築方法も例3-2と一致するが、関連する試料は、その例では上記6つのマーカのデータのみを使用する。訓練セット及び試験セットにおけるモデルのモデルスコアを図27に示す。モデルのROC曲線を図28に示す。このモデルの訓練セット及び試験セットでは、膵癌を有する試料及び膵癌を有さない試料のスコアが、他の癌種のスコアと有意に異なることが分かる。このモデルの訓練セットでは、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.925に達した。試験セットにおいて、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.953に達した。閾値を0.511に設定し、スコアがこの値より大きい場合は膵癌と予測し、そうでない場合は膵癌非存在と予測した。この閾値の下では、訓練セット精度は0.886であり、訓練セット特異度は0.921であり、訓練セット感度は0.855であり、試験セット精度は0.886であり、試験セット特異度は0.915であり、試験セット感度は0.854であり、この組合せモデルの良好な性能を示している。
本例では、101個のメチル化マーカ全てのメチル化レベルを用いて、データ中の膵癌罹患検体と膵癌非罹患検体とを精度よく判別できるロジスティック回帰機械学習モデルMODEL1を構築する。具体的な工程は、101個の標的メチル化マーカ(配列番号60~160)の全ての組合せのデータ入力モデルを用いること以外は、基本的に例3-2と同様である。
訓練セット及び試験セットにおけるモデル予測スコアの分布を図25に示す。ROC曲線を図26に示す。訓練セットでは、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.982に達した。試験セットにおいて、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.975に達した。閾値を0.600に設定し、スコアがこの値より大きい場合は膵癌と予測し、そうでない場合は膵癌非存在と予測した。この閾値の下では、訓練セット精度は0.939であり、訓練セット特異度は0.984であり、訓練セット感度は0.899であり、試験セット精度は0.886であり、試験セット特異度は0.915であり、試験セット感度は0.854であり、モデルは、膵癌を有する試料と膵癌を有さない試料とを区別することができる。
3-4:メチル化マーカの組合せ1の機械学習モデル
当該マーカの組合せの効果を検証するために、本例では、101個のメチル化マーカの全てから、メチル化レベルに基づいて、配列番号113、配列番号124、配列番号67、配列番号77、配列番号80、配列番号96を包含する計6個のメチル化マーカを選択し、ロジスティック回帰機械学習モデルを構築した。
機械学習モデルの構築方法も例3-2と一致するが、関連する試料は、その例では上記6つのマーカのデータのみを使用する。訓練セット及び試験セットにおけるモデルのモデルスコアを図27に示す。モデルのROC曲線を図28に示す。このモデルの訓練セット及び試験セットでは、膵癌を有する試料及び膵癌を有さない試料のスコアが、他の癌種のスコアと有意に異なることが分かる。このモデルの訓練セットでは、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.925に達した。試験セットにおいて、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.953に達した。閾値を0.511に設定し、スコアがこの値より大きい場合は膵癌と予測し、そうでない場合は膵癌非存在と予測した。この閾値の下では、訓練セット精度は0.886であり、訓練セット特異度は0.921であり、訓練セット感度は0.855であり、試験セット精度は0.886であり、試験セット特異度は0.915であり、試験セット感度は0.854であり、この組合せモデルの良好な性能を示している。
3-5:メチル化マーカの組合せ2の機械学習モデル
当該マーカの組合せの効果を検証するために、本例では、全101個のメチル化マーカの中から、メチル化レベルに基づいて、配列番号108、配列番号126、配列番号136、配列番号141、配列番号153、配列番号159、配列番号82を包含する計7個のメチル化マーカを選択し、ロジスティック回帰機械学習モデルを構築した。
機械学習モデルの構築方法も例3-2と一致するが、関連する試料は、その例では上記7つのマーカのデータのみを使用する。訓練セット及び試験セットにおけるモデルのモデルスコアを図29に示す。モデルのROC曲線を図30に示す。このモデルの訓練セット及び試験セットでは、膵癌を有する試料及び膵癌を有さない試料のスコアが、他の癌種のスコアと有意に異なることが分かる。このモデルの訓練セットでは、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.919に達した。試験セットにおいて、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.938に達した。閾値を0.581に設定し、スコアがこの値より大きい場合は膵癌と予測し、そうでない場合は膵癌非存在と予測した。この閾値の下では、訓練セット精度は0.826であり、訓練セット特異度は0.921であり、訓練セット感度は0.754であり、試験セット精度は0.818であり、試験セット特異度は0.830であり、試験セット感度は0.805であり、この組合せモデルの良好な性能を示している。
3-6:メチル化マーカの組合せ3の機械学習モデル
当該マーカの組合せの効果を検証するために、本例では、全101個のメチル化マーカの中から、メチル化レベルに基づいて、配列番号115、配列番号109、配列番号120、配列番号137、配列番号145、配列番号147、配列番号158、配列番号88、配列番号94、配列番号101を包含する合計10個のメチル化マーカを選択して、ロジスティック回帰機械学習モデルを構築した。
機械学習モデルの構築方法も例3-2と一致するが、関連する試料は、その例では上記10つのマーカのデータのみを使用する。訓練セット及び試験セットにおけるモデルのモデルスコアを図31に示す。モデルのROC曲線を図32に示す。このモデルの訓練セット及び試験セットでは、膵癌を有する試料及び膵癌を有さない試料のスコアが、他の癌種のスコアと有意に異なることが分かる。このモデルの訓練セットでは、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.919に達した。試験セットにおいて、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.950に達した。閾値を0.587に設定し、スコアがこの値より大きい場合は膵癌と予測し、そうでない場合は膵癌非存在と予測した。この閾値の下では、訓練セット精度は0.848であり、訓練セット特異度は0.952であり、訓練セット感度は0.812であり、試験セット精度は0.886であり、試験セット特異度は0.915であり、試験セット感度は0.854であり、この組合せモデルの良好な性能を示している。
3-7:全標的メチル化マーカMODEL1のモデルと他の特許予測モデルとの融合モデルの予測効果
以前の特許(特許番号:CN2021106792818)において、本発明者らは56個のメチル化マーカを提供した。本発明者らは、先の特許における56個のメチル化マーカを用いてロジスティック回帰モデルMODEL2を構築し、例3-3におけるモデルMODEL1及び機械学習モデル用MODEL2の予測値(予測値については表3-5参照)を用いて融合モデルDUALMODELを構築した。
当該マーカの組合せの効果を検証するために、本例では、全101個のメチル化マーカの中から、メチル化レベルに基づいて、配列番号108、配列番号126、配列番号136、配列番号141、配列番号153、配列番号159、配列番号82を包含する計7個のメチル化マーカを選択し、ロジスティック回帰機械学習モデルを構築した。
機械学習モデルの構築方法も例3-2と一致するが、関連する試料は、その例では上記7つのマーカのデータのみを使用する。訓練セット及び試験セットにおけるモデルのモデルスコアを図29に示す。モデルのROC曲線を図30に示す。このモデルの訓練セット及び試験セットでは、膵癌を有する試料及び膵癌を有さない試料のスコアが、他の癌種のスコアと有意に異なることが分かる。このモデルの訓練セットでは、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.919に達した。試験セットにおいて、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.938に達した。閾値を0.581に設定し、スコアがこの値より大きい場合は膵癌と予測し、そうでない場合は膵癌非存在と予測した。この閾値の下では、訓練セット精度は0.826であり、訓練セット特異度は0.921であり、訓練セット感度は0.754であり、試験セット精度は0.818であり、試験セット特異度は0.830であり、試験セット感度は0.805であり、この組合せモデルの良好な性能を示している。
3-6:メチル化マーカの組合せ3の機械学習モデル
当該マーカの組合せの効果を検証するために、本例では、全101個のメチル化マーカの中から、メチル化レベルに基づいて、配列番号115、配列番号109、配列番号120、配列番号137、配列番号145、配列番号147、配列番号158、配列番号88、配列番号94、配列番号101を包含する合計10個のメチル化マーカを選択して、ロジスティック回帰機械学習モデルを構築した。
機械学習モデルの構築方法も例3-2と一致するが、関連する試料は、その例では上記10つのマーカのデータのみを使用する。訓練セット及び試験セットにおけるモデルのモデルスコアを図31に示す。モデルのROC曲線を図32に示す。このモデルの訓練セット及び試験セットでは、膵癌を有する試料及び膵癌を有さない試料のスコアが、他の癌種のスコアと有意に異なることが分かる。このモデルの訓練セットでは、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.919に達した。試験セットにおいて、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.950に達した。閾値を0.587に設定し、スコアがこの値より大きい場合は膵癌と予測し、そうでない場合は膵癌非存在と予測した。この閾値の下では、訓練セット精度は0.848であり、訓練セット特異度は0.952であり、訓練セット感度は0.812であり、試験セット精度は0.886であり、試験セット特異度は0.915であり、試験セット感度は0.854であり、この組合せモデルの良好な性能を示している。
3-7:全標的メチル化マーカMODEL1のモデルと他の特許予測モデルとの融合モデルの予測効果
以前の特許(特許番号:CN2021106792818)において、本発明者らは56個のメチル化マーカを提供した。本発明者らは、先の特許における56個のメチル化マーカを用いてロジスティック回帰モデルMODEL2を構築し、例3-3におけるモデルMODEL1及び機械学習モデル用MODEL2の予測値(予測値については表3-5参照)を用いて融合モデルDUALMODELを構築した。
DUALMODELモデルの構築は、例3-2と同様であるが、当該試料については、MODEL1予測値及びMODEL2予測値が用いられる。訓練セット及び試験セットにおけるDUALMODELのモデルスコアを図33に、モデルのROC曲線を図34に示す。このモデルの訓練セット及び試験セットでは、膵癌を有する試料及び膵癌を有さない試料のスコアが、他の癌種のスコアと有意に異なることが分かる。このモデルの訓練セットでは、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.983に達した。試験セットにおいて、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.971に達した。閾値を0.418に設定し、スコアがこの値より大きい場合は膵癌と予測し、そうでない場合は膵癌非存在と予測した。この閾値の下では、訓練セット精度は0.939であり、訓練セット特異度は0.984であり、訓練セット感度は0.913であり、試験セット精度は0.909であり、試験セット特異度は0.872であり、試験セット感度は0.951であり、これは、本特許及び他の特許されたメチル化マーカの組合せからなる凝集モデルが良好な性能を有することを示している。
3-8:全ての対象メチル化マーカと他の特許メチル化マーカを組み合わせたALLMODEL予測モデルの予測効果
先の特許出願(特許番号:CN2021106792818)では56個のメチル化マーカを用意し、本出願の101個のメチル化マーカと先の特許の56個のメチル化マーカを併せて用いてロジスティック回帰モデルALLMODELを構築した。ALLMODELモデルの構築は、例3-2と同様であるが、当該試料には、本特許の101個のメチル化マーカと、先行特許の56個のメチル化マーカと、を包含する計157個のメチル化マーカが用いられている。訓練セット及び試験セットにおけるALLMODELのモデルスコアを図35に、モデルのROC曲線を図36に示す。このモデルの訓練セット及び試験セットでは、膵癌を有する試料及び膵癌を有さない試料のスコアが、他の癌種のスコアと有意に異なることが分かる。このモデルの訓練セットでは、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.982に達した。試験セットにおいて、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.975に達した。閾値を0.599に設定し、スコアがこの値より大きい場合は膵癌と予測し、そうでない場合は膵癌非存在と予測した。この閾値の下では、訓練セット精度は0.939であり、訓練セット特異度は0.984であり、訓練セット感度は0.899であり、試験セット精度は0.886であり、試験セット特異度は0.915であり、試験セット感度は0.854であり、これは、本特許のメチル化マーカと他の特許マーカとの組合せを使用して構築されたモデルが良好な性能を有することを示している。
例4
4-1:標的化メチル化配列決定による特徴的なメチル化部位のスクリーニング
発明者は、合計94名の膵癌患者及び25名の慢性膵炎患者から血液試料を採取し、全ての患者がインフォームドコンセント用紙に署名した。膵癌を有する患者は、膵炎の以前の診断を有していた。試料情報については以下の表を参照されたい。
先の特許出願(特許番号:CN2021106792818)では56個のメチル化マーカを用意し、本出願の101個のメチル化マーカと先の特許の56個のメチル化マーカを併せて用いてロジスティック回帰モデルALLMODELを構築した。ALLMODELモデルの構築は、例3-2と同様であるが、当該試料には、本特許の101個のメチル化マーカと、先行特許の56個のメチル化マーカと、を包含する計157個のメチル化マーカが用いられている。訓練セット及び試験セットにおけるALLMODELのモデルスコアを図35に、モデルのROC曲線を図36に示す。このモデルの訓練セット及び試験セットでは、膵癌を有する試料及び膵癌を有さない試料のスコアが、他の癌種のスコアと有意に異なることが分かる。このモデルの訓練セットでは、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.982に達した。試験セットにおいて、膵癌試料を有する試料と膵癌試料を有さない試料とを区別するためのAUCは0.975に達した。閾値を0.599に設定し、スコアがこの値より大きい場合は膵癌と予測し、そうでない場合は膵癌非存在と予測した。この閾値の下では、訓練セット精度は0.939であり、訓練セット特異度は0.984であり、訓練セット感度は0.899であり、試験セット精度は0.886であり、試験セット特異度は0.915であり、試験セット感度は0.854であり、これは、本特許のメチル化マーカと他の特許マーカとの組合せを使用して構築されたモデルが良好な性能を有することを示している。
例4
4-1:標的化メチル化配列決定による特徴的なメチル化部位のスクリーニング
発明者は、合計94名の膵癌患者及び25名の慢性膵炎患者から血液試料を採取し、全ての患者がインフォームドコンセント用紙に署名した。膵癌を有する患者は、膵炎の以前の診断を有していた。試料情報については以下の表を参照されたい。
血漿DNAのメチル化配列決定データを、その中のDNAメチル化分類マーカを同定するためにMethylTitanアッセイによって得た。処理については図37を参照されたく、具体的な処理は以下の通りである。
1.血漿cfDNA試料の抽出
Streck採血管を使用して患者から2mlの全血試料を採取し、血漿を適時(3日以内)に遠心分離によって分離し、実験室に輸送し、次いで、指示に従ってQIAGEN QIAamp Circulating Nucleic Acid Kitを使用してcfDNAを抽出した。
2.配列決定及びデータ前処理
1)ライブラリを、Illumina Nextseq 500シーケンサーを使用してペアエンドシーケンシングした。
2)Pear(v0.6.0)ソフトウェアは、Illumina Hiseq X10/Nextseq 500/Nova seqシーケンサーからの同じペアエンド150bpシーケンシング断片のペアエンド配列決定データを、最短重複長が20bpであり、最短長が組み合わせ後に30bpである一配列に組み合わせた。
3)Trim_galore v0.6.0及びcutadapt v1.8.1ソフトウェアを使用して、結合された配列決定データに対してアダプタ除去を行った。アダプタ配列「AGATCGGAAGAGCAC」を配列の5’末端から除去し、両端のシーケンシング品質値が20未満の塩基を除去した。
3.シーケンシングデータアライメント
本明細書で使用される参照ゲノムデータは、UCSCデータベース(UCSC:HG19,hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/hg19.fa.gz)からのものであった。
1)まず、Bismark softwareを用いてHG19をシトシンからチミン(CT)及びアデニンからグアニン(GA)に変換し、Bowtie2 softwareを用いて変換後のゲノムのインデックスを構築した。
2)前処理されたデータはまた、CT及びGAの変換に供された。
3)変換された配列を、Bowtie2ソフトウェアを使用して変換されたHG19参照ゲノムにアラインメントした。最小シード配列長は20であり、シード配列においてミスマッチは許容されなかった。
4.MHFの算出
各標的領域HG19のCpG部位について、上記のアライメント結果に基づいて、各部位に対応するメチル化状態を求めた。本明細書における部位のヌクレオチド番号付けは、HG19のヌクレオチド位置番号付けに対応する。1つの標的メチル化領域は、複数のメチル化ハプロタイプを有し得る。この値は、標的領域内のメチル化ハプロタイプごとに計算する必要がある。MHFの計算式の一例は以下の通りであり、
式中、iは標的メチル化領域を表し、hは標的メチル化ハプロタイプを表し、Niは標的メチル化領域に位置するリードの数を表し、Ni、hは標的メチル化ハプロタイプを含むリードの数を表す。
5.メチル化データマトリックス
1)訓練セット及び試験セット中の各試料のメチル化配列決定データをデータマトリックスに組合せ、200未満の深さの各部位を欠損値とした。
2)10%を超える欠損値割合を有する部位を除去した。
3)データマトリックスの欠損値については、KNNアルゴリズムを使用して欠損データを補間した。
1.血漿cfDNA試料の抽出
Streck採血管を使用して患者から2mlの全血試料を採取し、血漿を適時(3日以内)に遠心分離によって分離し、実験室に輸送し、次いで、指示に従ってQIAGEN QIAamp Circulating Nucleic Acid Kitを使用してcfDNAを抽出した。
2.配列決定及びデータ前処理
1)ライブラリを、Illumina Nextseq 500シーケンサーを使用してペアエンドシーケンシングした。
2)Pear(v0.6.0)ソフトウェアは、Illumina Hiseq X10/Nextseq 500/Nova seqシーケンサーからの同じペアエンド150bpシーケンシング断片のペアエンド配列決定データを、最短重複長が20bpであり、最短長が組み合わせ後に30bpである一配列に組み合わせた。
3)Trim_galore v0.6.0及びcutadapt v1.8.1ソフトウェアを使用して、結合された配列決定データに対してアダプタ除去を行った。アダプタ配列「AGATCGGAAGAGCAC」を配列の5’末端から除去し、両端のシーケンシング品質値が20未満の塩基を除去した。
3.シーケンシングデータアライメント
本明細書で使用される参照ゲノムデータは、UCSCデータベース(UCSC:HG19,hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/hg19.fa.gz)からのものであった。
1)まず、Bismark softwareを用いてHG19をシトシンからチミン(CT)及びアデニンからグアニン(GA)に変換し、Bowtie2 softwareを用いて変換後のゲノムのインデックスを構築した。
2)前処理されたデータはまた、CT及びGAの変換に供された。
3)変換された配列を、Bowtie2ソフトウェアを使用して変換されたHG19参照ゲノムにアラインメントした。最小シード配列長は20であり、シード配列においてミスマッチは許容されなかった。
4.MHFの算出
各標的領域HG19のCpG部位について、上記のアライメント結果に基づいて、各部位に対応するメチル化状態を求めた。本明細書における部位のヌクレオチド番号付けは、HG19のヌクレオチド位置番号付けに対応する。1つの標的メチル化領域は、複数のメチル化ハプロタイプを有し得る。この値は、標的領域内のメチル化ハプロタイプごとに計算する必要がある。MHFの計算式の一例は以下の通りであり、
式中、iは標的メチル化領域を表し、hは標的メチル化ハプロタイプを表し、Niは標的メチル化領域に位置するリードの数を表し、Ni、hは標的メチル化ハプロタイプを含むリードの数を表す。
5.メチル化データマトリックス
1)訓練セット及び試験セット中の各試料のメチル化配列決定データをデータマトリックスに組合せ、200未満の深さの各部位を欠損値とした。
2)10%を超える欠損値割合を有する部位を除去した。
3)データマトリックスの欠損値については、KNNアルゴリズムを使用して欠損データを補間した。
6.学習セット試料群に基づく特徴メチル化セグメントの発見
1)表現型に関して各メチル化セグメントについてロジスティック回帰モデルを構築し、最も有意な回帰係数を有するメチル化セグメントを各増幅標的領域についてスクリーニングして候補メチル化セグメントを形成した。
2)訓練セットを、十倍クロスバリデーション増分特徴選択のために10の部分にランダムに分割した。
3)各領域における候補メチル化セグメントを回帰係数の有意性に応じて降順に順位付けし、その都度1つのメチル化セグメントのデータを追加して試験データ(サポートベクターマシン(SVM)モデル)を予測する。
4)工程3)では、工程2)で生成されたデータの10コピーを使用した。データの各コピーについて、10回の計算を行い、最終AUCは10回の計算の平均であった。訓練データのAUCが増加した場合、候補メチル化セグメントは特徴メチル化セグメントとして保持され、そうでない場合は破棄される。
HG19における選択された特徴的なメチル化マーカの分布は以下の通りである:SIX3遺伝子領域における配列番号57、TLX2遺伝子領域における配列番号58、及びCILP2遺伝子領域における配列番号59。上記のメチル化マーカのレベルは、膵癌患者のcfDNAにおいて増加又は減少した(表4-1)。上記3つのマーカ領域の配列を配列番号57~59に示す。
訓練セット及び試験セットにおける膵癌患者及び慢性膵炎患者のメチル化マーカの平均メチル化レベルをそれぞれ表4-1及び表4-2に示す。膵癌患者及び慢性膵炎患者における訓練セット及び試験セットにおける上記三つのメチル化マーカのメチル化レベルの分布を、それぞれ図38及び図39に示す。図及び表から分かるように、メチル化マーカのメチル化レベルは、膵癌患者と慢性膵炎患者とで有意差があり、良好な鑑別効果を有する。
4-2:機械学習に基づく分類予測モデルの構築
マーカDNAメチル化レベル(メチル化ハプロタイプ分率等)を用いて膵癌患者と慢性膵炎患者とを分類する潜在的な能力を検証するために、訓練群において、3つのDNAメチル化マーカの組合せに基づいてサポートベクターマシン疾患分類モデルpp_modelを構築し、サポートベクターマシンモデル予測スコアとCA19-9測定値との組合せデータマトリックスに基づくロジスティック回帰疾患分類モデルcpp_modelを構築し、試験群において2つのモデルの分類予測効果を検証した。訓練群及び試験群は、訓練群の80個の試料(試料1~80)及び試験群の39個の試料(試料80~119)を包含する割合に従って分割した。
発見されたDNAメチル化マーカを使用して、訓練セットにおいて、サポートベクターマシンモデルを構築した。
1)表現型に関して各メチル化セグメントについてロジスティック回帰モデルを構築し、最も有意な回帰係数を有するメチル化セグメントを各増幅標的領域についてスクリーニングして候補メチル化セグメントを形成した。
2)訓練セットを、十倍クロスバリデーション増分特徴選択のために10の部分にランダムに分割した。
3)各領域における候補メチル化セグメントを回帰係数の有意性に応じて降順に順位付けし、その都度1つのメチル化セグメントのデータを追加して試験データ(サポートベクターマシン(SVM)モデル)を予測する。
4)工程3)では、工程2)で生成されたデータの10コピーを使用した。データの各コピーについて、10回の計算を行い、最終AUCは10回の計算の平均であった。訓練データのAUCが増加した場合、候補メチル化セグメントは特徴メチル化セグメントとして保持され、そうでない場合は破棄される。
HG19における選択された特徴的なメチル化マーカの分布は以下の通りである:SIX3遺伝子領域における配列番号57、TLX2遺伝子領域における配列番号58、及びCILP2遺伝子領域における配列番号59。上記のメチル化マーカのレベルは、膵癌患者のcfDNAにおいて増加又は減少した(表4-1)。上記3つのマーカ領域の配列を配列番号57~59に示す。
訓練セット及び試験セットにおける膵癌患者及び慢性膵炎患者のメチル化マーカの平均メチル化レベルをそれぞれ表4-1及び表4-2に示す。膵癌患者及び慢性膵炎患者における訓練セット及び試験セットにおける上記三つのメチル化マーカのメチル化レベルの分布を、それぞれ図38及び図39に示す。図及び表から分かるように、メチル化マーカのメチル化レベルは、膵癌患者と慢性膵炎患者とで有意差があり、良好な鑑別効果を有する。
4-2:機械学習に基づく分類予測モデルの構築
マーカDNAメチル化レベル(メチル化ハプロタイプ分率等)を用いて膵癌患者と慢性膵炎患者とを分類する潜在的な能力を検証するために、訓練群において、3つのDNAメチル化マーカの組合せに基づいてサポートベクターマシン疾患分類モデルpp_modelを構築し、サポートベクターマシンモデル予測スコアとCA19-9測定値との組合せデータマトリックスに基づくロジスティック回帰疾患分類モデルcpp_modelを構築し、試験群において2つのモデルの分類予測効果を検証した。訓練群及び試験群は、訓練群の80個の試料(試料1~80)及び試験群の39個の試料(試料80~119)を包含する割合に従って分割した。
発見されたDNAメチル化マーカを使用して、訓練セットにおいて、サポートベクターマシンモデルを構築した。
1)試料を2つの部分に事前に分割し、1つの部分をモデルの訓練に使用し、1つの部分をモデル試験に使用した。
2)メチル化マーカを使用して膵癌を同定する可能性を利用するために、疾患分類システムが遺伝子マーカに基づいて開発された。SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)訓練モデルは、Pythonソフトウェア(v0.23.1)のsklearnソフトウェアパッケージ(v3.6.9)、コマンドライン:pp_model=SVR()を使用して構築される。
b)メチル化数値マトリックスは、sklearnソフトウェアパッケージ(v0.23.1)を使用してSVMモデルpp_model.fit(train_df,train_pheno)を構築するために入力され、train_dfは訓練セットのメチル化数値マトリックスを表し、train_phenoは訓練セットの表現型情報を表し、pp_modelは3つのメチル化マーカ数値マトリックスを使用して構築されたSVMモデルを表す。
c)予測スコアを得るために、訓練セット及び試験セットデータがそれぞれpp_modelモデルに取り込まれる:train_pred=pp_model.predict(train_df)
test_pred=pp_model.predict(test_df)
ここで、train_df及びtest_dfは、それぞれ訓練セット及び試験セットのメチル化数値行列であり、train_pred及びtest_predは、それぞれ訓練セット及び試験セットデータのpp_modelモデル予測スコアである。
3)膵癌患者と膵炎患者との鑑別能を向上させるために、CA19-9の検出値がモデルに包含された。具体的な方法は以下の通りである。
d)訓練セット及び対応するCA19-9測定データのSVMモデル予測値は、データマトリックスに結合され、標準化される。
Combine_scalar_train=RobustScaler().fit(combine_train_df)
Combine_scalar_test=RobustScaler().fit(combine_test_df)
scaled_combine_train_df=Combine_scalar_train.transform(combine_train_df)
scaled_combine_test_df=Combine_scalar_test.transform(combine_test_df)
ここで、combine_train_df及びcombine_test_dfは、試験セット試料及び訓練セット試料のこの例で構築されたpp_model予測モデルによって取得された予測スコアがそれぞれCA19-9と組み合わされたデータマトリックスを表す。scaled_combine_train_df及びscaled_combine_test_dfは、それぞれ、標準化後の訓練セット及び試験セットのデータマトリックスを表す。
e)訓練セットpp_modelモデル予測スコアとCA19-9測定値との組合せ標準化データマトリックスを使用してロジスティック回帰モデルが構築され、このモデルは、試験セットpp_modelモデル予測スコアとCA19-9との組合せ標準化データマトリックスを予測するために使用される。
cpp_model=LogisticRegression().fit(scaled_combine_train_df,train_pheno)
combine_test_pred=cpp_model.predict(scaled_combine_test_df)
ここで、cpp_modelは、CA19-9検出値を組み込んだ標準化された訓練セットデータマトリックスを用いてフィッティングされたロジスティック回帰モデルを表し、combine_test_predは、試験セット内のcpp_modelの予測スコアを表す。
2)メチル化マーカを使用して膵癌を同定する可能性を利用するために、疾患分類システムが遺伝子マーカに基づいて開発された。SVMモデルを、訓練セットにおけるメチル化マーカレベルを使用して訓練した。具体的な訓練方法は以下の通りである。
a)訓練モデルは、Pythonソフトウェア(v0.23.1)のsklearnソフトウェアパッケージ(v3.6.9)、コマンドライン:pp_model=SVR()を使用して構築される。
b)メチル化数値マトリックスは、sklearnソフトウェアパッケージ(v0.23.1)を使用してSVMモデルpp_model.fit(train_df,train_pheno)を構築するために入力され、train_dfは訓練セットのメチル化数値マトリックスを表し、train_phenoは訓練セットの表現型情報を表し、pp_modelは3つのメチル化マーカ数値マトリックスを使用して構築されたSVMモデルを表す。
c)予測スコアを得るために、訓練セット及び試験セットデータがそれぞれpp_modelモデルに取り込まれる:train_pred=pp_model.predict(train_df)
test_pred=pp_model.predict(test_df)
ここで、train_df及びtest_dfは、それぞれ訓練セット及び試験セットのメチル化数値行列であり、train_pred及びtest_predは、それぞれ訓練セット及び試験セットデータのpp_modelモデル予測スコアである。
3)膵癌患者と膵炎患者との鑑別能を向上させるために、CA19-9の検出値がモデルに包含された。具体的な方法は以下の通りである。
d)訓練セット及び対応するCA19-9測定データのSVMモデル予測値は、データマトリックスに結合され、標準化される。
Combine_scalar_train=RobustScaler().fit(combine_train_df)
Combine_scalar_test=RobustScaler().fit(combine_test_df)
scaled_combine_train_df=Combine_scalar_train.transform(combine_train_df)
scaled_combine_test_df=Combine_scalar_test.transform(combine_test_df)
ここで、combine_train_df及びcombine_test_dfは、試験セット試料及び訓練セット試料のこの例で構築されたpp_model予測モデルによって取得された予測スコアがそれぞれCA19-9と組み合わされたデータマトリックスを表す。scaled_combine_train_df及びscaled_combine_test_dfは、それぞれ、標準化後の訓練セット及び試験セットのデータマトリックスを表す。
e)訓練セットpp_modelモデル予測スコアとCA19-9測定値との組合せ標準化データマトリックスを使用してロジスティック回帰モデルが構築され、このモデルは、試験セットpp_modelモデル予測スコアとCA19-9との組合せ標準化データマトリックスを予測するために使用される。
cpp_model=LogisticRegression().fit(scaled_combine_train_df,train_pheno)
combine_test_pred=cpp_model.predict(scaled_combine_test_df)
ここで、cpp_modelは、CA19-9検出値を組み込んだ標準化された訓練セットデータマトリックスを用いてフィッティングされたロジスティック回帰モデルを表し、combine_test_predは、試験セット内のcpp_modelの予測スコアを表す。
モデルを構築する過程で、膵癌型は1、慢性膵炎型は0とコードされる。モデル予測スコア分布に従って、pp_model及びcpp_model閾値は、それぞれ0.892及び0.885に設定される。2つのモデルに基づいて、予測スコアが閾値より高い場合、患者は膵癌を有すると分類され、そうでない場合、患者は膵炎を有すると分類される。
訓練セット及び試験セット試料の2つのモデルの予測スコアを、それぞれ表4-3及び表4-4に示す。予測スコアの分布を図40に示す。二つの機械学習モデルとCA19-9測定のみのROC曲線を図41に示すが、CA19-9単独のAUC値は0.84、pp_modelのAUC値は0.88、cpp_modelのAUC値は0.90である。3つのメチル化マーカを用いて構築されたSVMモデル(pp_model)の性能は、CA19-9のそれよりも有意に良好であり、また、CA19-9検出値をpp_modelモデルの予測値に加算して構築されたロジスティック回帰モデルcpp_modelの性能も、pp_modelのそれよりも良好である。
決定された閾値は、試験セット内の統計に使用される(37の認識された閾値がCA19-9に使用される)。感度及び特異度を表4-5に示す。検査セットにおける特異度が100%であると、cpp_modelの膵癌患者に対する感度は87%に達することができ、その性能はpp_modelやCA19-9よりも優れている。
さらに、CA19-9に関して陰性(<37)と同定された試料中の2つのモデルの性能を統計的に分析した。結果を表4-6に示す。試験セットにおいてCA19-9に関して陰性であると同定された膵癌患者について、cpp_modelは依然として63%の感度及び100%の特異度に達することができることが分かる。
訓練セット及び試験セット試料の2つのモデルの予測スコアを、それぞれ表4-3及び表4-4に示す。予測スコアの分布を図40に示す。二つの機械学習モデルとCA19-9測定のみのROC曲線を図41に示すが、CA19-9単独のAUC値は0.84、pp_modelのAUC値は0.88、cpp_modelのAUC値は0.90である。3つのメチル化マーカを用いて構築されたSVMモデル(pp_model)の性能は、CA19-9のそれよりも有意に良好であり、また、CA19-9検出値をpp_modelモデルの予測値に加算して構築されたロジスティック回帰モデルcpp_modelの性能も、pp_modelのそれよりも良好である。
決定された閾値は、試験セット内の統計に使用される(37の認識された閾値がCA19-9に使用される)。感度及び特異度を表4-5に示す。検査セットにおける特異度が100%であると、cpp_modelの膵癌患者に対する感度は87%に達することができ、その性能はpp_modelやCA19-9よりも優れている。
さらに、CA19-9に関して陰性(<37)と同定された試料中の2つのモデルの性能を統計的に分析した。結果を表4-6に示す。試験セットにおいてCA19-9に関して陰性であると同定された膵癌患者について、cpp_modelは依然として63%の感度及び100%の特異度に達することができることが分かる。
この研究では、血漿cfDNA中のメチル化マーカのメチル化レベルを使用して、慢性膵炎を有する対象の血漿と膵癌を有する対象の血漿との間の差を研究し、有意差のある3つのDNAメチル化マーカをスクリーニングした。CA19-9検出値を組み合わせた上記DNAメチル化マーカ群に基づいて、サポートベクターマシン及びロジスティック回帰法により、慢性膵炎と診断された患者における膵癌患者と慢性膵炎患者とを感度及び特異度高く効果的に鑑別することができ、慢性膵炎患者における膵癌のスクリーニング及び診断に適した悪性膵癌リスク予測モデルを構築した。
例5
5-1膵管腺癌、隣接組織及び白血球DNA試料のメチル化存在量の比較
膵管腺癌患者の膵臓、癌組織及び隣接組織に異常がない健康な人の白血球からDNA試料を得た(白血球試料30個、癌組織試料30個を包含する)。形質細胞を含まないDNAのほとんどは、白血球の破裂後に放出されたDNAに由来し、そのバックグラウンドは形質細胞を含まないDNAの検出部位の基本的なバックグラウンドシグナルであり得るので、白血球DNAを参照試料として選択した。説明書に従い、Qiagen QIAamp DNA Mini Kitを用いて白血球DNAを抽出し、Qiagen QIAamp DNA FFPE Tissue Kitを用いて組織DNAを抽出した。Qubit(商標)dsDNA HS Assay Kit(Thermo、カタログ番号:Q32854)を使用して、cfDNAの濃度を検出した。
上記工程で得られたDNA試料20ngをバイサルファイト試薬(MethylCode(商標)Bisulfite conversion Kit、Thermo、カタログ番号:MECOV50)で処理して、変換DNAを得た。
PCR反応系において、各プライマーの終濃度は100nMであり、各検出プローブの終濃度は100nMである。例えば、PCR反応系は、10μL~12.50μLの2×PCR反応混合物、0.12μLのフォワードプライマー及びリバースプライマー、0.04μLのプローブ、6μLの試料DNA(約10ng)、及び約20μLの総体積を構成する水を含むことができる。
プライマー及びプローブ配列を表5-1に示す。例えば、PCR反応条件は以下の通りであり得る:95℃で5分間。95℃で20秒間、及び60℃で45秒間(蛍光収集)、50サイクル。ABI7500 Real-Time PCR Systemを使用して、対応する蛍光チャネル内の異なる蛍光を検出した。白血球、隣接組織及び癌組織から得られた試料のCt値を計算し、比較した。メチル化レベル=2-ΔCt試験対象試料/2-ΔCt陽性標準×100%。ΔCt=Ct標的遺伝子-Ct内部参照遺伝子
例5
5-1膵管腺癌、隣接組織及び白血球DNA試料のメチル化存在量の比較
膵管腺癌患者の膵臓、癌組織及び隣接組織に異常がない健康な人の白血球からDNA試料を得た(白血球試料30個、癌組織試料30個を包含する)。形質細胞を含まないDNAのほとんどは、白血球の破裂後に放出されたDNAに由来し、そのバックグラウンドは形質細胞を含まないDNAの検出部位の基本的なバックグラウンドシグナルであり得るので、白血球DNAを参照試料として選択した。説明書に従い、Qiagen QIAamp DNA Mini Kitを用いて白血球DNAを抽出し、Qiagen QIAamp DNA FFPE Tissue Kitを用いて組織DNAを抽出した。Qubit(商標)dsDNA HS Assay Kit(Thermo、カタログ番号:Q32854)を使用して、cfDNAの濃度を検出した。
上記工程で得られたDNA試料20ngをバイサルファイト試薬(MethylCode(商標)Bisulfite conversion Kit、Thermo、カタログ番号:MECOV50)で処理して、変換DNAを得た。
PCR反応系において、各プライマーの終濃度は100nMであり、各検出プローブの終濃度は100nMである。例えば、PCR反応系は、10μL~12.50μLの2×PCR反応混合物、0.12μLのフォワードプライマー及びリバースプライマー、0.04μLのプローブ、6μLの試料DNA(約10ng)、及び約20μLの総体積を構成する水を含むことができる。
プライマー及びプローブ配列を表5-1に示す。例えば、PCR反応条件は以下の通りであり得る:95℃で5分間。95℃で20秒間、及び60℃で45秒間(蛍光収集)、50サイクル。ABI7500 Real-Time PCR Systemを使用して、対応する蛍光チャネル内の異なる蛍光を検出した。白血球、隣接組織及び癌組織から得られた試料のCt値を計算し、比較した。メチル化レベル=2-ΔCt試験対象試料/2-ΔCt陽性標準×100%。ΔCt=Ct標的遺伝子-Ct内部参照遺伝子
結果は、癌組織におけるメチル化シグナルの陽性率が白血球試料のそれよりもはるかに高くなり得ることを示し、これはまた、癌組織におけるメチル化シグナルを示す。標的メチル化シグナルは、白血球のほとんどの試料で検出できなかった。これらの標的は全て、膵癌の血液検査に使用される可能性を有し得る。これは、腫瘍組織に対する選択された標的マーカの実現可能性及び特異性を実証する。
特異度が90%を超える場合、検出部位の検出感度統計を以下の表に示す。選択された標的マーカは、腫瘍組織に対して高い感度を有することが証明されている。
膵管腺癌患者及び膵臓に異常がない患者の血漿試料におけるメチル化シグナルの比較
膵臓に異常がない100人の健康な対照からの血漿及び膵管腺癌を有する100人の患者からの血漿を試験のために選択した:市販のQIAamp DNA Mini Kit(QIAGEN、カタログ番号:51304)を使用して上記血漿試料から細胞外DNAを抽出した。抽出した細胞外遊離DNAに対して、市販のバイサルファイト変換試薬MethylCode(商標)Bisulfite conversion Kitを用いて亜硫酸塩変換処理を行い、変換DNAを得た。
上記PCR反応系を用いて蛍光PCR検出を行った。表5-1に示すプライマー及びプローブ配列を使用し、参照遺伝子ACTBを対照として同時に試験した。プライマーの最終濃度は500nMであり、プローブの最終濃度は200nMである。PCR反応系は、10μLの増幅前希釈産物、2.5μLの検出部位用のプライマー及びプローブマスターミックスを含む。PCR試薬(Luna(登録商標)Universal Probe qPCR Master Mix(NEB))12.5μL。
特異度が90%を超える場合、検出部位の検出感度統計を以下の表に示す。選択された標的マーカは、腫瘍組織に対して高い感度を有することが証明されている。
膵管腺癌患者及び膵臓に異常がない患者の血漿試料におけるメチル化シグナルの比較
膵臓に異常がない100人の健康な対照からの血漿及び膵管腺癌を有する100人の患者からの血漿を試験のために選択した:市販のQIAamp DNA Mini Kit(QIAGEN、カタログ番号:51304)を使用して上記血漿試料から細胞外DNAを抽出した。抽出した細胞外遊離DNAに対して、市販のバイサルファイト変換試薬MethylCode(商標)Bisulfite conversion Kitを用いて亜硫酸塩変換処理を行い、変換DNAを得た。
上記PCR反応系を用いて蛍光PCR検出を行った。表5-1に示すプライマー及びプローブ配列を使用し、参照遺伝子ACTBを対照として同時に試験した。プライマーの最終濃度は500nMであり、プローブの最終濃度は200nMである。PCR反応系は、10μLの増幅前希釈産物、2.5μLの検出部位用のプライマー及びプローブマスターミックスを含む。PCR試薬(Luna(登録商標)Universal Probe qPCR Master Mix(NEB))12.5μL。
蛍光PCR反応系は例5-1と同様である。PCR反応条件は以下の通りである:95℃で5分間;95℃で15秒間、56℃で40秒間(蛍光収集)、50サイクル。異なる遺伝子プローブ修飾蛍光に従って、対応する検出蛍光チャネルを選択した。メチル化レベル=2^(-ΔCt試験試料)/2^(-ΔCt陽性標準)×100%。ΔCt=Ct標的遺伝子-Ct内部参照遺伝子
結果は、本出願の全ての標的が膵管腺癌の血液検出に使用できることを示す。これは、腫瘍組織に対する選択された標的マーカの実現可能性及び特異性を実証する。
例6
6-1膵癌の予測のためのEBF2とCCNA1の組合せ
本出願は、膵癌患者115名及び健康な人対照85名の血漿cfDNAに対してメチル化特異的PCRを行い、本出願の遺伝子組合せのDNAメチル化レベルを利用して、膵癌血漿と正常者血漿とを識別できることを見出した。
QIAamp DNA Mini Kit(QIAGEN、カタログ番号:51304)を用いて、膵癌患者115名及び健康な対照85名の血漿からcfDNAを抽出し、Qubit(商標)dsDNA HS Assay Kit(Thermo、カタログ番号:Q32854)を使用してDNA濃度を検出し、1%アガロースゲル電気泳動により品質検査を行った。
工程1で得られたDNAを、MethylCode(商標)Bisulfite conversion Kit(Thermo、カタログ番号:MECOV50)を用いてバイサルファイト変換した。非メチル化シトシン(C)をウラシル(U)に変換し、メチル化シトシンは変換後も変化しなかった。
結果は、本出願の全ての標的が膵管腺癌の血液検出に使用できることを示す。これは、腫瘍組織に対する選択された標的マーカの実現可能性及び特異性を実証する。
例6
6-1膵癌の予測のためのEBF2とCCNA1の組合せ
本出願は、膵癌患者115名及び健康な人対照85名の血漿cfDNAに対してメチル化特異的PCRを行い、本出願の遺伝子組合せのDNAメチル化レベルを利用して、膵癌血漿と正常者血漿とを識別できることを見出した。
QIAamp DNA Mini Kit(QIAGEN、カタログ番号:51304)を用いて、膵癌患者115名及び健康な対照85名の血漿からcfDNAを抽出し、Qubit(商標)dsDNA HS Assay Kit(Thermo、カタログ番号:Q32854)を使用してDNA濃度を検出し、1%アガロースゲル電気泳動により品質検査を行った。
工程1で得られたDNAを、MethylCode(商標)Bisulfite conversion Kit(Thermo、カタログ番号:MECOV50)を用いてバイサルファイト変換した。非メチル化シトシン(C)をウラシル(U)に変換し、メチル化シトシンは変換後も変化しなかった。
プライマー及びプローブ配列を表6-1(隅付き括弧による表47)に示す。
多重メチル化特異的PCR法(Multiplex MSP)を用いた。PCR混合物は、PCR反応液、プライマー混合物及びプローブ混合物を包含し、単一の試料を調製した。プライマー混合物は、本出願の遺伝子組合せ及び内部参照遺伝子のそれぞれについて、1対のプライマーを包含する。
PCR反応系は以下の通りである:5.00μLの試料cfDNA/陽性対照/陰性対照、3.40μLのマルチプレックスプライマー混合物(100μM)、4.10μLの水、及び12.5μLの2×PCR反応混合物。
PCRプログラムは、94℃で2分間の前変性、94℃で30秒間の変性、60℃で1分間のアニーリング、45サイクルに設定した。60℃でのアニーリング及び伸長段階中に蛍光シグナルを収集した。
メチル化レベル=Ct内部参照遺伝子--Ct標的遺伝子。
本出願の遺伝子組合せのメチル化レベルについて、バイナリーロジスティック回帰分析を行い、フィッティングを行った。例えば、例示式のスコアが0より大きい場合、鑑別結果は陽性、すなわち悪性小結節である。
例示的なフィッティング式は、Score=3.54632+EBF2メチル化レベル×0.04422+CCNA1メチル化レベル×0.06956であり得る。
ROCによって分析されるように、本出願における遺伝子の組合せは、78%の特異性、62%の感度、及び0.689のAUCを有する。
結果は、対照血漿と膵管腺癌血漿との間の本出願における検出部位の組合せのDNAメチル化シグナルの比較を示す。選択された標的マーカは、腫瘍検出に対して高い感度を有することが証明されている。
6-2膵癌予測のためのKCNA6、TLX2及びEMX1の組合せ
本出願は、膵癌患者115名及び健康な人対照85名の血漿cfDNAに対してメチル化特異的PCRを行い、本出願の遺伝子組合せのDNAメチル化レベルを利用して、膵癌血漿と正常者血漿とを識別できることを見出した。
QIAamp DNA Mini Kit(QIAGEN、カタログ番号:51304)を用いて、膵癌患者115名及び健康な対照85名の血漿からcfDNAを抽出し、Qubit(商標)dsDNA HS Assay Kit(Thermo、カタログ番号:Q32854)を使用してDNA濃度を検出し、1%アガロースゲル電気泳動により品質検査を行った。
工程1で得られたDNAを、MethylCode(商標)Bisulfite conversion Kit(Thermo、カタログ番号:MECOV50)を用いてバイサルファイト変換した。非メチル化シトシン(C)をウラシル(U)に変換し、メチル化シトシンは変換後も変化しなかった。
多重メチル化特異的PCR法(Multiplex MSP)を用いた。PCR混合物は、PCR反応液、プライマー混合物及びプローブ混合物を包含し、単一の試料を調製した。プライマー混合物は、本出願の遺伝子組合せ及び内部参照遺伝子のそれぞれについて、1対のプライマーを包含する。
PCR反応系は以下の通りである:5.00μLの試料cfDNA/陽性対照/陰性対照、3.40μLのマルチプレックスプライマー混合物(100μM)、4.10μLの水、及び12.5μLの2×PCR反応混合物。
PCRプログラムは、94℃で2分間の前変性、94℃で30秒間の変性、60℃で1分間のアニーリング、45サイクルに設定した。60℃でのアニーリング及び伸長段階中に蛍光シグナルを収集した。
メチル化レベル=Ct内部参照遺伝子--Ct標的遺伝子。
本出願の遺伝子組合せのメチル化レベルについて、バイナリーロジスティック回帰分析を行い、フィッティングを行った。例えば、例示式のスコアが0より大きい場合、鑑別結果は陽性、すなわち悪性小結節である。
例示的なフィッティング式は、Score=3.54632+EBF2メチル化レベル×0.04422+CCNA1メチル化レベル×0.06956であり得る。
ROCによって分析されるように、本出願における遺伝子の組合せは、78%の特異性、62%の感度、及び0.689のAUCを有する。
結果は、対照血漿と膵管腺癌血漿との間の本出願における検出部位の組合せのDNAメチル化シグナルの比較を示す。選択された標的マーカは、腫瘍検出に対して高い感度を有することが証明されている。
6-2膵癌予測のためのKCNA6、TLX2及びEMX1の組合せ
本出願は、膵癌患者115名及び健康な人対照85名の血漿cfDNAに対してメチル化特異的PCRを行い、本出願の遺伝子組合せのDNAメチル化レベルを利用して、膵癌血漿と正常者血漿とを識別できることを見出した。
QIAamp DNA Mini Kit(QIAGEN、カタログ番号:51304)を用いて、膵癌患者115名及び健康な対照85名の血漿からcfDNAを抽出し、Qubit(商標)dsDNA HS Assay Kit(Thermo、カタログ番号:Q32854)を使用してDNA濃度を検出し、1%アガロースゲル電気泳動により品質検査を行った。
工程1で得られたDNAを、MethylCode(商標)Bisulfite conversion Kit(Thermo、カタログ番号:MECOV50)を用いてバイサルファイト変換した。非メチル化シトシン(C)をウラシル(U)に変換し、メチル化シトシンは変換後も変化しなかった。
プライマー及びプローブ配列を表6-2(隅付き括弧による表48)に示す。
多重メチル化特異的PCR法(Multiplex MSP)を用いた。PCR混合物は、PCR反応液、プライマー混合物及びプローブ混合物を包含し、単一の試料を調製した。プライマー混合物は、本出願の遺伝子組合せ及び内部参照遺伝子のそれぞれについて、1対のプライマーを包含する。
PCR反応系は以下の通りである:5.00μLの試料cfDNA/陽性対照/陰性対照、3.40μLのマルチプレックスプライマー混合物(100μM)、4.10μLの水、及び12.5μLの2×PCR反応混合物。
PCRプログラムは、94℃で2分間の前変性、94℃で30秒間の変性、60℃で1分間のアニーリング、45サイクルに設定した。60℃でのアニーリング及び伸長段階中に蛍光シグナルを収集した。
メチル化レベル=Ct内部参照遺伝子--Ct標的遺伝子。
本出願の遺伝子組合せのメチル化レベルについて、バイナリーロジスティック回帰分析を行い、フィッティングを行った。例えば、例示式のスコアが0より大きい場合、鑑別結果は陽性、すなわち悪性小結節である。
例示的なフィッティング式は、Score=3.48511+KCNA6メチル化度×0.04870+TLX2メチル化度×0.00464+EMX1メチル化度×0.06555であり得る。
ROCによって分析されるように、本出願における遺伝子の組合せは、81%の特異性、63%の感度、及び0.735のAUCを有する。
結果は、対照血漿と膵管腺癌血漿との間の本出願における検出部位の組合せのDNAメチル化シグナルの比較を示す。選択された標的マーカは、腫瘍検出に対して高い感度を有することが証明されている。
6-3膵癌予測のためのTRIM58、TWIST1、FOXD3及びEN2の組合せ
本出願は、膵癌患者115名及び健康な人対照85名の血漿cfDNAに対してメチル化特異的PCRを行い、本出願の遺伝子組合せのDNAメチル化レベルを利用して、膵癌血漿と正常者血漿とを識別できることを見出した。
QIAamp DNA Mini Kit(QIAGEN、カタログ番号:51304)を用いて、膵癌患者115名及び健康な対照85名の血漿からcfDNAを抽出し、Qubit(商標)dsDNA HS Assay Kit(Thermo、カタログ番号:Q32854)を使用してDNA濃度を検出し、1%アガロースゲル電気泳動により品質検査を行った。
多重メチル化特異的PCR法(Multiplex MSP)を用いた。PCR混合物は、PCR反応液、プライマー混合物及びプローブ混合物を包含し、単一の試料を調製した。プライマー混合物は、本出願の遺伝子組合せ及び内部参照遺伝子のそれぞれについて、1対のプライマーを包含する。
PCR反応系は以下の通りである:5.00μLの試料cfDNA/陽性対照/陰性対照、3.40μLのマルチプレックスプライマー混合物(100μM)、4.10μLの水、及び12.5μLの2×PCR反応混合物。
PCRプログラムは、94℃で2分間の前変性、94℃で30秒間の変性、60℃で1分間のアニーリング、45サイクルに設定した。60℃でのアニーリング及び伸長段階中に蛍光シグナルを収集した。
メチル化レベル=Ct内部参照遺伝子--Ct標的遺伝子。
本出願の遺伝子組合せのメチル化レベルについて、バイナリーロジスティック回帰分析を行い、フィッティングを行った。例えば、例示式のスコアが0より大きい場合、鑑別結果は陽性、すなわち悪性小結節である。
例示的なフィッティング式は、Score=3.48511+KCNA6メチル化度×0.04870+TLX2メチル化度×0.00464+EMX1メチル化度×0.06555であり得る。
ROCによって分析されるように、本出願における遺伝子の組合せは、81%の特異性、63%の感度、及び0.735のAUCを有する。
結果は、対照血漿と膵管腺癌血漿との間の本出願における検出部位の組合せのDNAメチル化シグナルの比較を示す。選択された標的マーカは、腫瘍検出に対して高い感度を有することが証明されている。
6-3膵癌予測のためのTRIM58、TWIST1、FOXD3及びEN2の組合せ
本出願は、膵癌患者115名及び健康な人対照85名の血漿cfDNAに対してメチル化特異的PCRを行い、本出願の遺伝子組合せのDNAメチル化レベルを利用して、膵癌血漿と正常者血漿とを識別できることを見出した。
QIAamp DNA Mini Kit(QIAGEN、カタログ番号:51304)を用いて、膵癌患者115名及び健康な対照85名の血漿からcfDNAを抽出し、Qubit(商標)dsDNA HS Assay Kit(Thermo、カタログ番号:Q32854)を使用してDNA濃度を検出し、1%アガロースゲル電気泳動により品質検査を行った。
工程1で得られたDNAを、MethylCode(商標)Bisulfite conversion Kit(Thermo、カタログ番号:MECOV50)を用いてバイサルファイト変換した。非メチル化シトシン(C)をウラシル(U)に変換し、メチル化シトシンは変換後も変化しなかった。
プライマー及びプローブ配列を表6-3(隅付き括弧による表49)に示す。
多重メチル化特異的PCR法(Multiplex MSP)を用いた。PCR混合物は、PCR反応液、プライマー混合物及びプローブ混合物を包含し、単一の試料を調製した。プライマー混合物は、本出願の遺伝子組合せ及び内部参照遺伝子のそれぞれについて、1対のプライマーを包含する。
PCR反応系は以下の通りである:5.00μLの試料cfDNA/陽性対照/陰性対照、3.40μLのマルチプレックスプライマー混合物(100μM)、4.10μLの水、及び12.5μLの2×PCR反応混合物。
PCRプログラムは、94℃で2分間の前変性、94℃で30秒間の変性、60℃で1分間のアニーリング、45サイクルに設定した。60℃でのアニーリング及び伸長段階中に蛍光シグナルを収集した。
メチル化レベル=Ct内部参照遺伝子--Ct標的遺伝子。
本出願の遺伝子組合せのメチル化レベルについて、バイナリーロジスティック回帰分析を行い、フィッティングを行った。例えば、例示式のスコアが0より大きい場合、鑑別結果は陽性、すなわち悪性小結節である。
例示的なフィッティング式は、Score=1.76599+TRIM58メチル化レベル×0.03214+TWIST1メチル化レベル×0.02187+FOXD3メチル化レベル×0.03075+EN2メチル化レベル×0.04429であり得る。
ROCによって分析されるように、本出願における遺伝子の組合せは、80%の特異性、64%の感度、及び0.735のAUCを有する。
結果は、対照血漿と膵管腺癌血漿との間の本出願における検出部位の組合せのDNAメチル化シグナルの比較を示す。選択された標的マーカは、腫瘍検出に対して高い感度を有することが証明されている。
6-4膵癌予測のためのTRIM58、TWIST1、CLEC11A、HOXD10及びOLIG3の組合せ
本出願は、膵癌患者115名及び健康な人対照85名の血漿cfDNAに対してメチル化特異的PCRを行い、本出願の遺伝子組合せのDNAメチル化レベルを利用して、膵癌血漿と正常者血漿とを識別できることを見出した。
プライマー及びプローブ配列を表6-3(隅付き括弧による表49)に示す。
多重メチル化特異的PCR法(Multiplex MSP)を用いた。PCR混合物は、PCR反応液、プライマー混合物及びプローブ混合物を包含し、単一の試料を調製した。プライマー混合物は、本出願の遺伝子組合せ及び内部参照遺伝子のそれぞれについて、1対のプライマーを包含する。
PCR反応系は以下の通りである:5.00μLの試料cfDNA/陽性対照/陰性対照、3.40μLのマルチプレックスプライマー混合物(100μM)、4.10μLの水、及び12.5μLの2×PCR反応混合物。
PCRプログラムは、94℃で2分間の前変性、94℃で30秒間の変性、60℃で1分間のアニーリング、45サイクルに設定した。60℃でのアニーリング及び伸長段階中に蛍光シグナルを収集した。
メチル化レベル=Ct内部参照遺伝子--Ct標的遺伝子。
本出願の遺伝子組合せのメチル化レベルについて、バイナリーロジスティック回帰分析を行い、フィッティングを行った。例えば、例示式のスコアが0より大きい場合、鑑別結果は陽性、すなわち悪性小結節である。
例示的なフィッティング式は、Score=1.76599+TRIM58メチル化レベル×0.03214+TWIST1メチル化レベル×0.02187+FOXD3メチル化レベル×0.03075+EN2メチル化レベル×0.04429であり得る。
ROCによって分析されるように、本出願における遺伝子の組合せは、80%の特異性、64%の感度、及び0.735のAUCを有する。
結果は、対照血漿と膵管腺癌血漿との間の本出願における検出部位の組合せのDNAメチル化シグナルの比較を示す。選択された標的マーカは、腫瘍検出に対して高い感度を有することが証明されている。
6-4膵癌予測のためのTRIM58、TWIST1、CLEC11A、HOXD10及びOLIG3の組合せ
本出願は、膵癌患者115名及び健康な人対照85名の血漿cfDNAに対してメチル化特異的PCRを行い、本出願の遺伝子組合せのDNAメチル化レベルを利用して、膵癌血漿と正常者血漿とを識別できることを見出した。
QIAamp DNA Mini Kit(QIAGEN、カタログ番号:51304)を用いて、膵癌患者115名及び健康な対照85名の血漿からcfDNAを抽出し、Qubit(商標)dsDNA HS Assay Kit(Thermo、カタログ番号:Q32854)を使用してDNA濃度を検出し、1%アガロースゲル電気泳動により品質検査を行った。
工程1で得られたDNAを、MethylCode(商標)Bisulfite conversion Kit(Thermo、カタログ番号:MECOV50)を用いてバイサルファイト変換した。非メチル化シトシン(C)をウラシル(U)に変換し、メチル化シトシンは変換後も変化しなかった。
プライマー及びプローブ配列を表6-4(隅付き括弧による表50)に示す。
多重メチル化特異的PCR法(Multiplex MSP)を用いた。PCR混合物は、PCR反応液、プライマー混合物及びプローブ混合物を包含し、単一の試料を調製した。プライマー混合物は、本出願の遺伝子組合せ及び内部参照遺伝子のそれぞれについて、1対のプライマーを包含する。
PCR反応系は以下の通りである:5.00μLの試料cfDNA/陽性対照/陰性対照、3.40μLのマルチプレックスプライマー混合物(100μM)、4.10μLの水、及び12.5μLの2×PCR反応混合物。
PCRプログラムは、94℃で2分間の前変性、94℃で30秒間の変性、60℃で1分間のアニーリング、45サイクルに設定した。60℃でのアニーリング及び伸長段階中に蛍光シグナルを収集した。
メチル化レベル=Ct内部参照遺伝子--Ct標的遺伝子。
本出願の遺伝子組合せのメチル化レベルについて、バイナリーロジスティック回帰分析を行い、フィッティングを行った。例えば、例示式のスコアが0より大きい場合、鑑別結果は陽性、すなわち悪性小結節である。
例示的なフィッティング式は、Score=1.65343+TRIM58メチル化レベル×0.03638+TWIST1メチル化レベル×0.02269+CLEC11Aメチル化レベル×0.00536-HOXD10メチル化レベル×0.00435+OLIG3メチル化レベル×0.02293であり得る。
工程1で得られたDNAを、MethylCode(商標)Bisulfite conversion Kit(Thermo、カタログ番号:MECOV50)を用いてバイサルファイト変換した。非メチル化シトシン(C)をウラシル(U)に変換し、メチル化シトシンは変換後も変化しなかった。
プライマー及びプローブ配列を表6-4(隅付き括弧による表50)に示す。
多重メチル化特異的PCR法(Multiplex MSP)を用いた。PCR混合物は、PCR反応液、プライマー混合物及びプローブ混合物を包含し、単一の試料を調製した。プライマー混合物は、本出願の遺伝子組合せ及び内部参照遺伝子のそれぞれについて、1対のプライマーを包含する。
PCR反応系は以下の通りである:5.00μLの試料cfDNA/陽性対照/陰性対照、3.40μLのマルチプレックスプライマー混合物(100μM)、4.10μLの水、及び12.5μLの2×PCR反応混合物。
PCRプログラムは、94℃で2分間の前変性、94℃で30秒間の変性、60℃で1分間のアニーリング、45サイクルに設定した。60℃でのアニーリング及び伸長段階中に蛍光シグナルを収集した。
メチル化レベル=Ct内部参照遺伝子--Ct標的遺伝子。
本出願の遺伝子組合せのメチル化レベルについて、バイナリーロジスティック回帰分析を行い、フィッティングを行った。例えば、例示式のスコアが0より大きい場合、鑑別結果は陽性、すなわち悪性小結節である。
例示的なフィッティング式は、Score=1.65343+TRIM58メチル化レベル×0.03638+TWIST1メチル化レベル×0.02269+CLEC11Aメチル化レベル×0.00536-HOXD10メチル化レベル×0.00435+OLIG3メチル化レベル×0.02293であり得る。
ROCによって分析されるように、本出願における遺伝子の組合せは、90%の特異性、52%の感度、及び0.726のAUCを有する。
結果は、対照血漿と膵管腺癌血漿との間の本出願における検出部位の組合せのDNAメチル化シグナルの比較を示す。選択された標的マーカは、腫瘍検出に対して高い感度を有することが証明されている。
上記の詳細な説明は、説明及び例として提供されており、添付の特許請求の範囲を限定することを意図していない。本明細書に記載された実施形態に対する様々な修正は、当業者には明らかであり、添付の特許請求の範囲及びそれらの均等物の範囲内にとどまる。
結果は、対照血漿と膵管腺癌血漿との間の本出願における検出部位の組合せのDNAメチル化シグナルの比較を示す。選択された標的マーカは、腫瘍検出に対して高い感度を有することが証明されている。
上記の詳細な説明は、説明及び例として提供されており、添付の特許請求の範囲を限定することを意図していない。本明細書に記載された実施形態に対する様々な修正は、当業者には明らかであり、添付の特許請求の範囲及びそれらの均等物の範囲内にとどまる。
配列表161 <223>ACTBプローブ
配列表162 <223>ACTBフォワードプライマー
配列表163 <223>ACTBリバースプライマー
配列表164 <223>TLX2領域1
配列表165 <223>TLX2プローブ1
配列表166 <223>TLX2フォワードプライマー1
配列表167 <223>TLX2リバースプライマー1
配列表168 <223>TLX2領域2
配列表169 <223>TLX2プローブ2
配列表170 <223>TLX2フォワードプライマー2
配列表171 <223>TLX2リバースプライマー2
配列表172 <223>EBF2領域1
配列表173 <223>EBF2プローブ1
配列表174 <223>EBF2フォワードプライマー1
配列表175 <223>EBF2リバースプライマー1
配列表176 <223>EBF2領域2
配列表177 <223>EBF2プローブ2
配列表178 <223>EBF2フォワードプライマー2
配列表179 <223>EBF2リバースプライマー2
配列表180 <223>KCNA6領域1
配列表181 <223>KCNA6プローブ1
配列表182 <223>KCNA6フォワードプライマー1
配列表183 <223>KCNA6リバースプライマー1
配列表184 <223>KCNA6領域2
配列表185 <223>KCNA6プローブ2
配列表186 <223>KCNA6フォワードプライマー2
配列表187 <223>KCNA6リバースプライマー2
配列表188 <223>KCNA6領域3
配列表189 <223>KCNA6プローブ3
配列表190 <223>KCNA6フォワードプライマー3
配列表191 <223>KCNA6リバースプライマー3
配列表192 <223>CCNA1領域1
配列表193 <223>CCNA1プローブ1
配列表194 <223>CCNA1フォワードプライマー1
配列表195 <223>CCNA1リバースプライマー1
配列表196 <223>CCNA1領域2
配列表197 <223>CCNA1プローブ2
配列表198 <223>CCNA1フォワードプライマー2
配列表199 <223>CCNA1リバースプライマー2
配列表200 <223>CCNA1領域3
配列表201 <223>CCNA1プローブ3
配列表202 <223>CCNA1フォワードプライマー3
配列表203 <223>CCNA1リバースプライマー3
配列表204 <223>FOXD3領域1
配列表205 <223>FOXD3プローブ1
配列表206 <223>FOXD3フォワードプライマー1
配列表207 <223>FOXD3リバースプライマー1
配列表208 <223>TRIM58領域1
配列表209 <223>TRIM58プローブ1
配列表210 <223>TRIM58フォワードプライマー1
配列表211 <223>TRIM58リバースプライマー1
配列表212 <223>HOXD10領域1
配列表213 <223>HOXD10プローブ1
配列表214 <223>HOXD10フォワードプライマー1
配列表215 <223>HOXD10リバースプライマー1
配列表216 <223>OLIG3領域1
配列表217 <223>OLIG3プローブ1
配列表218 <223>OLIG3フォワードプライマー1
配列表219 <223>OLIG3リバースプライマー1
配列表220 <223>EN2領域1
配列表221 <223>EN2プローブ1
配列表222 <223>EN2フォワードプライマー1
配列表223 <223>EN2リバースプライマー1
配列表224 <223>CLEC11A領域1
配列表225 <223>CLEC11Aプローブ1
配列表226 <223>CLEC11Aフォワードプライマー1
配列表227 <223>CLEC11Aリバースプライマー1
配列表228 <223>TWIST1領域1
配列表229 <223>TWIST1プローブ1
配列表230 <223>TWIST1フォワードプライマー1
配列表231 <223>TWIST1リバースプライマー1
配列表232 <223>EMX1領域1
配列表233 <223>EMX1プローブ1
配列表234 <223>EMX1フォワードプライマー1
配列表235 <223>EMX1リバースプライマー1
配列表162 <223>ACTBフォワードプライマー
配列表163 <223>ACTBリバースプライマー
配列表164 <223>TLX2領域1
配列表165 <223>TLX2プローブ1
配列表166 <223>TLX2フォワードプライマー1
配列表167 <223>TLX2リバースプライマー1
配列表168 <223>TLX2領域2
配列表169 <223>TLX2プローブ2
配列表170 <223>TLX2フォワードプライマー2
配列表171 <223>TLX2リバースプライマー2
配列表172 <223>EBF2領域1
配列表173 <223>EBF2プローブ1
配列表174 <223>EBF2フォワードプライマー1
配列表175 <223>EBF2リバースプライマー1
配列表176 <223>EBF2領域2
配列表177 <223>EBF2プローブ2
配列表178 <223>EBF2フォワードプライマー2
配列表179 <223>EBF2リバースプライマー2
配列表180 <223>KCNA6領域1
配列表181 <223>KCNA6プローブ1
配列表182 <223>KCNA6フォワードプライマー1
配列表183 <223>KCNA6リバースプライマー1
配列表184 <223>KCNA6領域2
配列表185 <223>KCNA6プローブ2
配列表186 <223>KCNA6フォワードプライマー2
配列表187 <223>KCNA6リバースプライマー2
配列表188 <223>KCNA6領域3
配列表189 <223>KCNA6プローブ3
配列表190 <223>KCNA6フォワードプライマー3
配列表191 <223>KCNA6リバースプライマー3
配列表192 <223>CCNA1領域1
配列表193 <223>CCNA1プローブ1
配列表194 <223>CCNA1フォワードプライマー1
配列表195 <223>CCNA1リバースプライマー1
配列表196 <223>CCNA1領域2
配列表197 <223>CCNA1プローブ2
配列表198 <223>CCNA1フォワードプライマー2
配列表199 <223>CCNA1リバースプライマー2
配列表200 <223>CCNA1領域3
配列表201 <223>CCNA1プローブ3
配列表202 <223>CCNA1フォワードプライマー3
配列表203 <223>CCNA1リバースプライマー3
配列表204 <223>FOXD3領域1
配列表205 <223>FOXD3プローブ1
配列表206 <223>FOXD3フォワードプライマー1
配列表207 <223>FOXD3リバースプライマー1
配列表208 <223>TRIM58領域1
配列表209 <223>TRIM58プローブ1
配列表210 <223>TRIM58フォワードプライマー1
配列表211 <223>TRIM58リバースプライマー1
配列表212 <223>HOXD10領域1
配列表213 <223>HOXD10プローブ1
配列表214 <223>HOXD10フォワードプライマー1
配列表215 <223>HOXD10リバースプライマー1
配列表216 <223>OLIG3領域1
配列表217 <223>OLIG3プローブ1
配列表218 <223>OLIG3フォワードプライマー1
配列表219 <223>OLIG3リバースプライマー1
配列表220 <223>EN2領域1
配列表221 <223>EN2プローブ1
配列表222 <223>EN2フォワードプライマー1
配列表223 <223>EN2リバースプライマー1
配列表224 <223>CLEC11A領域1
配列表225 <223>CLEC11Aプローブ1
配列表226 <223>CLEC11Aフォワードプライマー1
配列表227 <223>CLEC11Aリバースプライマー1
配列表228 <223>TWIST1領域1
配列表229 <223>TWIST1プローブ1
配列表230 <223>TWIST1フォワードプライマー1
配列表231 <223>TWIST1リバースプライマー1
配列表232 <223>EMX1領域1
配列表233 <223>EMX1プローブ1
配列表234 <223>EMX1フォワードプライマー1
配列表235 <223>EMX1リバースプライマー1
Claims (61)
- 膵腫瘍の存在を決定するための、膵腫瘍の発症又は発症のリスクを評価するための、並びに/あるいは膵腫瘍の進行を評価するための、
試験される試料中の遺伝子EBF2を有するDNA領域又はその断片の、修飾状態の存在及び/又は含有量を決定すること、を含む、
方法。 - 膵腫瘍に関連するDNA領域のメチル化状態を評価するための、
試験される試料中の遺伝子EBF2を有するDNA領域又はその断片の、修飾状態の存在及び/又は含有量を決定すること、を含む、
方法。 - DNA領域がヒトchr8:25699246-25907950に由来する、請求項1~2のいずれか一項に記載の方法。
- 試験される試料中の核酸を得ることをさらに含む、請求項1~3のいずれか一項に記載の方法。
- 核酸が無細胞核酸を包含する、請求項4に記載の方法。
- 試験される試料が、組織、細胞及び/又は体液を包含する、請求項1~5のいずれか一項に記載の方法。
- 試験される試料が血漿を包含する、請求項1~6のいずれか一項に記載の方法。
- DNA領域又はその断片を変換することをさらに含む、請求項1~7のいずれか一項に記載の方法。
- 修飾状態を有する塩基及び前記修飾状態を有さない塩基が、変換後に異なる物質を形成する、請求項8に記載の方法。
- 修飾状態を有する塩基が、変換後に実質的に変化せず、前記修飾状態を有さない塩基が、変換後の塩基とは異なる他の塩基に変更されるか、又は変換後に切断される、請求項1~9のいずれか一項に記載の方法。
- 塩基がシトシンを包含する、請求項9~10のいずれか一項に記載の方法。
- 修飾状態がメチル化修飾を包含する、請求項1~11のいずれか一項に記載の方法。
- 他の塩基がウラシルを包含する、請求項10~12のいずれか一項に記載の方法。
- 変換が、脱アミノ化試薬及び/又はメチル化感受性制限酵素による変換を含む、請求項8~13のいずれか一項に記載の方法。
- 脱アミノ化試薬がバイサルファイト又はその類似体を包含する、請求項14に記載の方法。
- 修飾状態の存在及び/又は含有量を決定するための方法が、前記修飾状態による塩基の変換後に形成される物質の存在及び/又は含有量を決定することを含む、請求項1~15のいずれか一項に記載の方法。
- 修飾状態の存在及び/又は含有量を決定する方法が、前記修飾状態を有するDNA領域又はその断片の存在及び/又は含有量を決定することを含む、請求項1~16のいずれか一項に記載の方法。
- 修飾状態を有するDNA領域又はその断片の存在及び/又は含有量が、蛍光PCR法によって検出される蛍光Ct値によって決定される、請求項1~17のいずれか一項に記載の方法。
- 膵腫瘍の存在、又は膵腫瘍の発症若しくは発症のリスクが、DNA領域若しくはその断片の修飾状態の存在及び/又は参照レベルに対して前記DNA領域若しくはその断片の修飾状態のより高い含有量を決定することによって決定される、請求項1~18のいずれか一項に記載の方法。
- DNA領域又はその断片の修飾状態の存在及び/又は含有量を決定する前に、試験される試料中の前記DNA領域又はその断片を増幅することをさらに含む、請求項1~19のいずれか一項に記載の方法。
- 増幅がPCR増幅を含む、請求項20に記載の方法。
- 疾患の存在を決定するための、疾患の発症若しくは発症のリスクを評価するための、及び/又は疾患の進行を評価するための、
修飾状態の存在及び/又は含有量の決定を、試験される試料中の、ヒトchr8:25907849-25907950由来のDNA領域及びヒトchr8:25907698-25907894由来のDNA領域からなる群から選択される前記DNA領域、又はその相補的領域、又はその断片について行うこと、を含む、
方法。 - DNA領域のメチル化状態を決定するための、
修飾状態の存在及び/又は含有量の決定を、試験される試料中のヒトchr8:25907849-25907950由来のDNA領域、及びヒトchr8:25907698-25907894由来のDNA領域からなる群から選択される前記DNA領域、又はその相補的領域、又はそれらの断片について行うこと、を含む、
方法。 - 配列番号172及び配列番号176からなる群から選択されるDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる核酸を提供することを含む、請求項22~23のいずれか一項に記載の方法。
- ヒトchr8:25907865-25907930由来のDNA領域、及びヒトchr8:25907698-25907814由来のDNA領域からなる群から選択されるDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる核酸を提供することを含む、請求項22~24のいずれか一項に記載の方法。
- 配列番号173及び配列番号177からなる群から選択される核酸、又はその相補的核酸、又はその断片を提供することを含む、請求項22~25のいずれか一項に記載の方法。
- 配列番号174及び175、並びに配列番号178及び179からなる群から選択される核酸の組合せ、又はそれらの相補的核酸の組合せ、又はそれらの断片を提供することを含む、請求項22~26のいずれか一項に記載の方法。
- 疾患が腫瘍を包含する、請求項22~27のいずれか一項に記載の方法。
- 試験される試料中の核酸を得ることをさらに含む、請求項22~28のいずれか一項に記載の方法。
- 核酸が無細胞核酸を包含する、請求項29に記載の方法。
- 試験される試料が、組織、細胞及び/又は体液を包含する、請求項22~30のいずれか一項に記載の方法。
- 試験される試料が血漿を包含する、請求項22~31のいずれか一項に記載の方法。
- DNA領域又はその断片を変換することをさらに含む、請求項22~32のいずれか一項に記載の方法。
- 修飾状態を有する塩基及び前記修飾状態を有さない塩基が、変換後に異なる物質を形成する、請求項33に記載の方法。
- 修飾状態を有する塩基が、変換後に実質的に変化せず、前記修飾状態を有さない塩基が、変換後の塩基とは異なる他の塩基に変更されるか、又は変換後に切断される、請求項22~34のいずれか一項に記載の方法。
- 塩基がシトシンを包含する、請求項34~35のいずれか一項に記載の方法。
- 修飾状態がメチル化修飾を包含する、請求項22~36のいずれか一項に記載の方法。
- 他の塩基がウラシルを包含する、請求項35~37のいずれか一項に記載の方法。
- 変換が、脱アミノ化試薬及び/又はメチル化感受性制限酵素による変換を含む、請求項33~38のいずれか一項に記載の方法。
- 脱アミノ化試薬がバイサルファイト又はその類似体を包含する、請求項39に記載の方法。
- 修飾状態の存在及び/又は含有量を決定するための方法が、変換後の前記修飾状態を有する塩基によって形成される物質の存在及び/又は含有量を決定することを含む、請求項22~40のいずれか一項に記載の方法。
- 修飾状態の存在及び/又は含有量を決定するための方法が、前記修飾状態を有するDNA領域又はその断片の存在及び/又は含有量を決定することを含む、請求22~41のいずれか一項に記載の方法。
- 修飾状態を有するDNA領域又はその断片の存在及び/又は含有量が、蛍光PCR法によって検出される蛍光Ct値によって決定される、請求項22~42のいずれか一項に記載の方法。
- 膵腫瘍の存在、又は膵腫瘍の発症若しくは発症のリスクが、DNA領域若しくはその断片の修飾状態の存在及び/又は参照レベルに対して前記DNA領域若しくはその断片の修飾状態のより高い含有量を決定することによって決定される、請求項22~43のいずれか一項に記載の方法。
- DNA領域又はその断片の修飾状態の存在及び/又は含有量を決定する前に、試験される試料中の前記DNA領域又はその断片を増幅することをさらに含む、請求項22~44のいずれか一項に記載の方法。
- 増幅がPCR増幅を含む、請求項45に記載の方法。
- 遺伝子EBF2を有するDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる配列を含む核酸。
- DNA領域又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて、遺伝子EBF2を有するDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合可能な核酸を設計することを含む、核酸を調製するための方法。
- 遺伝子EBF2を有するDNA領域、又はその相補的領域、又はその変換領域、又はその断片に結合することができる配列を含む核酸の組合せ。
- DNA領域又はその相補的領域、又はその変換領域、又はその断片の修飾状態に基づいて、遺伝子EBF2を有するDNA領域、又はその相補的領域、又はその変換領域、又はその断片を増幅することができる核酸の組合せを設計することを含む、核酸の組合せを調製するための方法。
- 請求項47に記載の核酸及び/又は請求項49に記載の核酸の組合せを含むキット。
- 請求項47に記載の核酸、請求項49に記載の核酸の組合せ及び/又は請求項51に記載のキットの、疾患検出製品の調製における、使用。
- 請求項47に記載の核酸、請求項49に記載の核酸の組合せ及び/又は請求項51に記載のキットの、
疾患の存在を決定するための、疾患の発症若しくは発症のリスクを評価するための、及び/又は疾患の進行を評価するための、物質の調製における、
使用。 - 請求項47に記載の核酸、請求項49に記載の核酸の組合せ及び/又は請求項51に記載のキットの、
DNA領域又はその断片の修飾状態を決定するための物質の調製における、
使用。 - 物質の調製におけるDNA領域の修飾状態を決定するための、核酸、核酸の組合せ及び/又はキットの、
膵腫瘍の存在を決定するための、膵腫瘍の発症又は発症のリスクを評価するための、及び/又は膵腫瘍の進行を評価するための、、
使用、ここで、
決定のための前記DNA領域は、遺伝子EBF2を有するDNA領域又はその断片を包含する。 - 物質の調製におけるDNA領域の修飾状態を決定するための、核酸、核酸の組合せ及び/又はキットの、
疾患の存在を決定するための、疾患の発症若しくは発症のリスクを評価するための、及び/又は疾患の進行を評価するための、
使用、ここで、
前記DNA領域は、ヒトchr8:25907849-25907950由来のDNA領域及びヒトchr8:25907698-25907894由来のDNA領域からなる群から選択されるDNA領域、又はその相補的領域、又はその断片を包含する。 - 遺伝子EBF2を有するDNA領域又はその変換領域又はそれらの断片の核酸、及び上記核酸の組合せの、
膵腫瘍の存在を決定するための、膵腫瘍の発症又は発症のリスクを評価するための、及び/又は膵腫瘍の進行を評価するための、物質の調製における、
使用。 - ヒトchr8:25907849-25907950に由来するDNA領域及びヒトchr8:25907698-25907894に由来するDNA領域、又はその相補的領域、又はその変換領域、又はその断片からなる群から選択されるDNA領域の核酸、及び上記の核酸の組合せの、
疾患の存在の決定するための、疾患の発症又は発症のリスクを評価するための、及び/又は疾患の進行を評価するための、物質の調製における、
使用。 - 請求項1~46のいずれか一項に記載の方法を実行可能なプログラムを記録する記憶媒体。
- 請求項59に記載の記憶媒体を含むデバイス。
- 記憶媒体に結合されたプロセッサをさらに含み、前記プロセッサが、前記記憶媒体に記憶されたプログラムに基づいて実行して、請求項1~46のいずれか一項に記載の方法を実施するように構成される、請求項60に記載のデバイス。
Applications Claiming Priority (25)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110680924.0 | 2021-06-18 | ||
CN202110679281.8A CN115491421A (zh) | 2021-06-18 | 2021-06-18 | 胰腺癌诊断相关dna甲基化标志物及其应用 |
CN202110679281.8 | 2021-06-18 | ||
CN202110680924.0A CN115491411A (zh) | 2021-06-18 | 2021-06-18 | 鉴别胰腺炎和胰腺癌的甲基化标志物及其应用 |
CN202111191903.9 | 2021-10-13 | ||
CN202111191903.9A CN115985486A (zh) | 2021-10-13 | 2021-10-13 | 一种基于机器学习的胰腺癌诊断方法 |
CN202111598099 | 2021-12-24 | ||
CN202111608328 | 2021-12-24 | ||
CN202111608328.8 | 2021-12-24 | ||
CN202111608215.8 | 2021-12-24 | ||
CN202111600984 | 2021-12-24 | ||
CN202111598099.6 | 2021-12-24 | ||
CN202111608215 | 2021-12-24 | ||
CN202111600984.3 | 2021-12-24 | ||
CN202210047980 | 2022-01-17 | ||
CN202210047980.5 | 2022-01-17 | ||
CN202210091957.6 | 2022-01-26 | ||
CN202210092055 | 2022-01-26 | ||
CN202210091957 | 2022-01-26 | ||
CN202210092040.8 | 2022-01-26 | ||
CN202210092055.4 | 2022-01-26 | ||
CN202210092038 | 2022-01-26 | ||
CN202210092040 | 2022-01-26 | ||
CN202210092038.0 | 2022-01-26 | ||
PCT/CN2022/099311 WO2022262831A1 (zh) | 2021-06-18 | 2022-06-17 | 用于评估肿瘤的物质及其方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024525190A true JP2024525190A (ja) | 2024-07-10 |
Family
ID=84526888
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023578089A Pending JP2024525190A (ja) | 2021-06-18 | 2022-06-17 | 腫瘍評価のための物質及び方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20240141442A1 (ja) |
EP (1) | EP4372103A1 (ja) |
JP (1) | JP2024525190A (ja) |
KR (1) | KR20240021975A (ja) |
CN (1) | CN117500942A (ja) |
AU (1) | AU2022292704A1 (ja) |
CA (1) | CA3222729A1 (ja) |
WO (1) | WO2022262831A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117936104B (zh) * | 2024-03-25 | 2024-06-04 | 青岛山大齐鲁医院(山东大学齐鲁医院(青岛)) | 一种基于局部阈值分割算法的胃癌免疫评分方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1782315A4 (en) * | 2004-07-30 | 2009-06-24 | Rosetta Inpharmatics Llc | FORECAST FOR BREAST CANCER PATIENTS |
WO2013097868A1 (en) * | 2011-12-27 | 2013-07-04 | Region Syddanmark | Detection of adenomas of the colon or rectum |
US20130274127A1 (en) * | 2012-04-17 | 2013-10-17 | Genomic Health, Inc. | Gene expression markers for prediction of response to phosphoinositide 3-kinase inhibitors |
GB201212334D0 (en) * | 2012-07-11 | 2012-08-22 | Warwick The | Therapeutic targets for alzheimers disease |
US20210154267A1 (en) * | 2016-03-23 | 2021-05-27 | University Of Miami | Treatment of cancer by activating endogenous cryptic amyloidogenic aggregating peptides |
KR102056405B1 (ko) * | 2018-04-05 | 2019-12-16 | (주)메디젠휴먼케어 | Ebf2 유전자 다형성을 이용한 가와사키병 발병 예측 방법 |
-
2022
- 2022-06-17 KR KR1020247001904A patent/KR20240021975A/ko unknown
- 2022-06-17 CN CN202280042761.6A patent/CN117500942A/zh active Pending
- 2022-06-17 WO PCT/CN2022/099311 patent/WO2022262831A1/zh active Application Filing
- 2022-06-17 EP EP22824304.4A patent/EP4372103A1/en active Pending
- 2022-06-17 CA CA3222729A patent/CA3222729A1/en active Pending
- 2022-06-17 US US18/571,373 patent/US20240141442A1/en active Pending
- 2022-06-17 JP JP2023578089A patent/JP2024525190A/ja active Pending
- 2022-06-17 AU AU2022292704A patent/AU2022292704A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2022292704A1 (en) | 2024-01-18 |
CN117500942A (zh) | 2024-02-02 |
EP4372103A1 (en) | 2024-05-22 |
US20240141442A1 (en) | 2024-05-02 |
WO2022262831A1 (zh) | 2022-12-22 |
CA3222729A1 (en) | 2022-12-22 |
KR20240021975A (ko) | 2024-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111742062B (zh) | 用于诊断癌症的甲基化标志物 | |
JP2024009833A (ja) | 血漿による胎児または腫瘍のメチロームの非侵襲的決定 | |
JP2021061861A (ja) | 癌スクリーニング及び胎児分析のための変異検出 | |
JP2020010700A (ja) | エピジェネティックドメインの安定性の全般的な損失を通して癌を検出する方法およびその組成物 | |
CN115341031A (zh) | 一种泛癌甲基化生物标志物的筛选方法、生物标志物及应用 | |
AU2024203201A1 (en) | Multimodal analysis of circulating tumor nucleic acid molecules | |
JP2024525190A (ja) | 腫瘍評価のための物質及び方法 | |
CN115851923A (zh) | 用于检测结直肠癌淋巴结转移的甲基化生物标记物及其应用 | |
TW202330938A (zh) | 用於評估腫瘤的物質及其方法 | |
CN115772566B (zh) | 用于辅助检测肺癌体细胞erbb2基因突变的甲基化生物标记物及其应用 | |
EP4234720A1 (en) | Epigenetic biomarkers for the diagnosis of thyroid cancer | |
US20220290245A1 (en) | Cancer detection and classification | |
US20240309461A1 (en) | Sample barcode in multiplex sample sequencing | |
Michel et al. | Non-invasive multi-cancer diagnosis using DNA hypomethylation of LINE-1 retrotransposons | |
WO2022255944A2 (en) | Method for detection and quantification of methylated dna | |
JP2024126029A (ja) | 循環腫瘍核酸分子のマルチモーダル分析 | |
CN118460724A (zh) | 一种早期胃癌淋巴结转移的甲基化标志物及应用 | |
BR122021021820B1 (pt) | Método para determinar um perfil de metilação de uma amostra biológica de um organismo e meio de armazenamento legível por computador |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240626 |