CN113557308A - 检测子宫内膜癌 - Google Patents
检测子宫内膜癌 Download PDFInfo
- Publication number
- CN113557308A CN113557308A CN202080017116.XA CN202080017116A CN113557308A CN 113557308 A CN113557308 A CN 113557308A CN 202080017116 A CN202080017116 A CN 202080017116A CN 113557308 A CN113557308 A CN 113557308A
- Authority
- CN
- China
- Prior art keywords
- max
- nbpf8
- methylation
- sample
- emx2os
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 206010014733 Endometrial cancer Diseases 0.000 title claims abstract description 237
- 206010014759 Endometrial neoplasm Diseases 0.000 title claims abstract description 237
- 238000001514 detection method Methods 0.000 title description 19
- 238000000034 method Methods 0.000 claims abstract description 267
- 239000000203 mixture Substances 0.000 claims abstract description 28
- 238000012216 screening Methods 0.000 claims abstract description 18
- 230000011987 methylation Effects 0.000 claims description 454
- 238000007069 methylation reaction Methods 0.000 claims description 454
- 239000000523 sample Substances 0.000 claims description 359
- 101001024615 Homo sapiens Putative neuroblastoma breakpoint family member 8 Proteins 0.000 claims description 262
- 102100037017 Putative neuroblastoma breakpoint family member 8 Human genes 0.000 claims description 262
- 150000007523 nucleic acids Chemical class 0.000 claims description 219
- 102000039446 nucleic acids Human genes 0.000 claims description 195
- 108020004707 nucleic acids Proteins 0.000 claims description 195
- -1 DIDO1_ A Proteins 0.000 claims description 176
- 239000003550 marker Substances 0.000 claims description 148
- 108090000623 proteins and genes Proteins 0.000 claims description 148
- 108020004414 DNA Proteins 0.000 claims description 139
- 102100034031 Cytohesin-2 Human genes 0.000 claims description 120
- 101000870120 Homo sapiens Cytohesin-2 Proteins 0.000 claims description 120
- 101000585675 Homo sapiens Obscurin Proteins 0.000 claims description 109
- 102100030127 Obscurin Human genes 0.000 claims description 109
- 125000003729 nucleotide group Chemical group 0.000 claims description 108
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 claims description 94
- 239000002773 nucleotide Substances 0.000 claims description 93
- 101000743782 Homo sapiens Zinc finger protein 90 Proteins 0.000 claims description 91
- 102100039071 Zinc finger protein 90 Human genes 0.000 claims description 91
- 101000965705 Homo sapiens Volume-regulated anion channel subunit LRRC8D Proteins 0.000 claims description 89
- 102100040987 Volume-regulated anion channel subunit LRRC8D Human genes 0.000 claims description 89
- 101000641956 Homo sapiens Villin-like protein Proteins 0.000 claims description 75
- 102100033418 Villin-like protein Human genes 0.000 claims description 75
- 230000002357 endometrial effect Effects 0.000 claims description 69
- 230000007067 DNA methylation Effects 0.000 claims description 64
- 230000002759 chromosomal effect Effects 0.000 claims description 63
- 238000003752 polymerase chain reaction Methods 0.000 claims description 63
- 238000003556 assay Methods 0.000 claims description 62
- 102100035368 Growth/differentiation factor 6 Human genes 0.000 claims description 61
- 101001023964 Homo sapiens Growth/differentiation factor 6 Proteins 0.000 claims description 61
- 101000644537 Homo sapiens Sequestosome-1 Proteins 0.000 claims description 60
- 206010028980 Neoplasm Diseases 0.000 claims description 60
- 102100020814 Sequestosome-1 Human genes 0.000 claims description 60
- 102100029647 Apoptosis-associated speck-like protein containing a CARD Human genes 0.000 claims description 59
- 101000728679 Homo sapiens Apoptosis-associated speck-like protein containing a CARD Proteins 0.000 claims description 59
- 239000003153 chemical reaction reagent Substances 0.000 claims description 54
- 108091008146 restriction endonucleases Proteins 0.000 claims description 52
- 102100026098 Claudin-7 Human genes 0.000 claims description 51
- 101000912652 Homo sapiens Claudin-7 Proteins 0.000 claims description 51
- 101001018553 Homo sapiens MyoD family inhibitor Proteins 0.000 claims description 50
- 102100033694 MyoD family inhibitor Human genes 0.000 claims description 50
- 108091034117 Oligonucleotide Proteins 0.000 claims description 44
- 230000003321 amplification Effects 0.000 claims description 43
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 43
- 108091029430 CpG site Proteins 0.000 claims description 42
- 101000744924 Homo sapiens Zinc finger protein 506 Proteins 0.000 claims description 42
- 102100039960 Zinc finger protein 506 Human genes 0.000 claims description 42
- 210000004369 blood Anatomy 0.000 claims description 42
- 239000008280 blood Substances 0.000 claims description 42
- 101000797990 Homo sapiens Putative activator of 90 kDa heat shock protein ATPase homolog 2 Proteins 0.000 claims description 41
- 102100032319 Putative activator of 90 kDa heat shock protein ATPase homolog 2 Human genes 0.000 claims description 41
- 102100033553 Delta-like protein 4 Human genes 0.000 claims description 40
- 101000872077 Homo sapiens Delta-like protein 4 Proteins 0.000 claims description 40
- 101000973200 Homo sapiens Nuclear factor 1 C-type Proteins 0.000 claims description 39
- 101000864070 Homo sapiens Smoothelin Proteins 0.000 claims description 39
- 102100022162 Nuclear factor 1 C-type Human genes 0.000 claims description 39
- 102100029937 Smoothelin Human genes 0.000 claims description 39
- 201000011510 cancer Diseases 0.000 claims description 39
- 101001046985 Homo sapiens KN motif and ankyrin repeat domain-containing protein 1 Proteins 0.000 claims description 37
- 102100022891 KN motif and ankyrin repeat domain-containing protein 1 Human genes 0.000 claims description 37
- 239000012472 biological sample Substances 0.000 claims description 37
- 238000012163 sequencing technique Methods 0.000 claims description 36
- 238000007855 methylation-specific PCR Methods 0.000 claims description 35
- 102100029108 Elongation factor 1-alpha 2 Human genes 0.000 claims description 34
- 101000841231 Homo sapiens Elongation factor 1-alpha 2 Proteins 0.000 claims description 34
- 102100032251 Pro-thyrotropin-releasing hormone Human genes 0.000 claims description 33
- 101800004623 Thyrotropin-releasing hormone Proteins 0.000 claims description 33
- 102100027516 Cholesterol side-chain cleavage enzyme, mitochondrial Human genes 0.000 claims description 32
- 101000852596 Homo sapiens Inositol-trisphosphate 3-kinase A Proteins 0.000 claims description 30
- 101001117305 Homo sapiens Prostaglandin D2 receptor Proteins 0.000 claims description 30
- 101000640056 Homo sapiens Protein strawberry notch homolog 2 Proteins 0.000 claims description 30
- 101000658628 Homo sapiens Testis-specific Y-encoded-like protein 5 Proteins 0.000 claims description 30
- 102100036405 Inositol-trisphosphate 3-kinase A Human genes 0.000 claims description 30
- 102100024212 Prostaglandin D2 receptor Human genes 0.000 claims description 30
- 102100033980 Protein strawberry notch homolog 2 Human genes 0.000 claims description 30
- 102100034914 Testis-specific Y-encoded-like protein 5 Human genes 0.000 claims description 30
- 238000004458 analytical method Methods 0.000 claims description 30
- 108010084976 Cholesterol Side-Chain Cleavage Enzyme Proteins 0.000 claims description 29
- 201000000274 Carcinosarcoma Diseases 0.000 claims description 28
- 241000282414 Homo sapiens Species 0.000 claims description 25
- 101000579876 Homo sapiens Leucine-rich repeat-containing protein 34 Proteins 0.000 claims description 25
- 102100027500 Leucine-rich repeat-containing protein 34 Human genes 0.000 claims description 25
- 230000001419 dependent effect Effects 0.000 claims description 21
- 102100024387 AF4/FMR2 family member 3 Human genes 0.000 claims description 20
- 102100025942 Chemokine-like protein TAFA-5 Human genes 0.000 claims description 20
- 101000833166 Homo sapiens AF4/FMR2 family member 3 Proteins 0.000 claims description 20
- 101000788164 Homo sapiens Chemokine-like protein TAFA-5 Proteins 0.000 claims description 20
- 101000627851 Homo sapiens Matrix metalloproteinase-23 Proteins 0.000 claims description 20
- 102100024130 Matrix metalloproteinase-23 Human genes 0.000 claims description 20
- 102000011324 NDRG Human genes 0.000 claims description 20
- 108050001500 NDRG Proteins 0.000 claims description 20
- 239000013068 control sample Substances 0.000 claims description 18
- 102100023830 Homeobox protein EMX2 Human genes 0.000 claims description 17
- 101001048970 Homo sapiens Homeobox protein EMX2 Proteins 0.000 claims description 17
- 208000005342 Porcine Reproductive and Respiratory Syndrome Diseases 0.000 claims description 16
- 239000003795 chemical substances by application Substances 0.000 claims description 16
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 15
- 210000002700 urine Anatomy 0.000 claims description 12
- 102100033764 Acyl-coenzyme A oxidase-like protein Human genes 0.000 claims description 11
- 101000801174 Homo sapiens Acyl-coenzyme A oxidase-like protein Proteins 0.000 claims description 11
- 101001017833 Homo sapiens Leucine-rich repeat-containing protein 4 Proteins 0.000 claims description 11
- 101000995300 Homo sapiens Protein NDRG2 Proteins 0.000 claims description 11
- 101000783373 Homo sapiens Serine/threonine-protein phosphatase 2A 56 kDa regulatory subunit gamma isoform Proteins 0.000 claims description 11
- 102100033304 Leucine-rich repeat-containing protein 4 Human genes 0.000 claims description 11
- 102100034436 Protein NDRG2 Human genes 0.000 claims description 11
- 102100036140 Serine/threonine-protein phosphatase 2A 56 kDa regulatory subunit gamma isoform Human genes 0.000 claims description 11
- 238000005259 measurement Methods 0.000 claims description 11
- 238000000926 separation method Methods 0.000 claims description 11
- 102100026947 2-oxoglutarate and iron-dependent oxygenase domain-containing protein 3 Human genes 0.000 claims description 10
- 102100022861 ADP-ribosylation factor-like protein 5A Human genes 0.000 claims description 10
- 102100026596 Bcl-2-like protein 1 Human genes 0.000 claims description 10
- 102100024340 Contactin-4 Human genes 0.000 claims description 10
- 108010044266 Dopamine Plasma Membrane Transport Proteins Proteins 0.000 claims description 10
- 102000011320 FAM189 Human genes 0.000 claims description 10
- 108050001519 FAM189 Proteins 0.000 claims description 10
- 102100037819 Fas apoptotic inhibitory molecule 1 Human genes 0.000 claims description 10
- 102100023849 Glycophorin-C Human genes 0.000 claims description 10
- 102100040139 Glycosyltransferase 1 domain-containing protein 1 Human genes 0.000 claims description 10
- 101000982616 Homo sapiens 2-oxoglutarate and iron-dependent oxygenase domain-containing protein 3 Proteins 0.000 claims description 10
- 101000974441 Homo sapiens ADP-ribosylation factor-like protein 5A Proteins 0.000 claims description 10
- 101000765923 Homo sapiens Bcl-2-like protein 1 Proteins 0.000 claims description 10
- 101000909504 Homo sapiens Contactin-4 Proteins 0.000 claims description 10
- 101000878509 Homo sapiens Fas apoptotic inhibitory molecule 1 Proteins 0.000 claims description 10
- 101000905336 Homo sapiens Glycophorin-C Proteins 0.000 claims description 10
- 101001037042 Homo sapiens Glycosyltransferase 1 domain-containing protein 1 Proteins 0.000 claims description 10
- 101001050321 Homo sapiens Junctional adhesion molecule C Proteins 0.000 claims description 10
- 101001006887 Homo sapiens Kelch-like protein 21 Proteins 0.000 claims description 10
- 101000995332 Homo sapiens Protein NDRG4 Proteins 0.000 claims description 10
- 101000618181 Homo sapiens Speedy protein A Proteins 0.000 claims description 10
- 101000798552 Homo sapiens Transmembrane protein 240 Proteins 0.000 claims description 10
- 101000776450 Homo sapiens Uncharacterized protein C6orf132 Proteins 0.000 claims description 10
- 101000965721 Homo sapiens Volume-regulated anion channel subunit LRRC8A Proteins 0.000 claims description 10
- 102100023429 Junctional adhesion molecule C Human genes 0.000 claims description 10
- 102100027799 Kelch-like protein 21 Human genes 0.000 claims description 10
- 208000010994 Lethal infantile mitochondrial myopathy Diseases 0.000 claims description 10
- 101710163270 Nuclease Proteins 0.000 claims description 10
- 102100034432 Protein NDRG4 Human genes 0.000 claims description 10
- 102000005029 SLC6A3 Human genes 0.000 claims description 10
- 102100021885 Speedy protein A Human genes 0.000 claims description 10
- 102100032492 Transmembrane protein 240 Human genes 0.000 claims description 10
- 102100031217 Uncharacterized protein C6orf132 Human genes 0.000 claims description 10
- 102100040985 Volume-regulated anion channel subunit LRRC8A Human genes 0.000 claims description 10
- 238000004949 mass spectrometry Methods 0.000 claims description 10
- 101100272587 Gallus gallus ITA gene Proteins 0.000 claims description 9
- 101000944327 Homo sapiens Uncharacterized protein C5orf52 Proteins 0.000 claims description 9
- 102100033160 Uncharacterized protein C5orf52 Human genes 0.000 claims description 9
- 101150073847 Mmp23 gene Proteins 0.000 claims description 6
- 230000001105 regulatory effect Effects 0.000 claims description 6
- 239000013074 reference sample Substances 0.000 claims description 4
- 102000004150 Flap endonucleases Human genes 0.000 claims description 3
- 108090000652 Flap endonucleases Proteins 0.000 claims description 3
- 101000861327 Homo sapiens Cholesterol side-chain cleavage enzyme, mitochondrial Proteins 0.000 claims description 3
- 239000002253 acid Substances 0.000 claims description 2
- 108010076804 DNA Restriction Enzymes Proteins 0.000 claims 8
- 238000009585 enzyme analysis Methods 0.000 claims 8
- 238000012175 pyrosequencing Methods 0.000 claims 8
- 102100026802 72 kDa type IV collagenase Human genes 0.000 claims 4
- 101000627872 Homo sapiens 72 kDa type IV collagenase Proteins 0.000 claims 4
- 206010039491 Sarcoma Diseases 0.000 claims 3
- 102100022900 Actin, cytoplasmic 1 Human genes 0.000 claims 1
- 108010085238 Actins Proteins 0.000 claims 1
- 102100023994 Beta-1,3-galactosyltransferase 6 Human genes 0.000 claims 1
- 101000904594 Homo sapiens Beta-1,3-galactosyltransferase 6 Proteins 0.000 claims 1
- 210000001519 tissue Anatomy 0.000 description 78
- 239000013615 primer Substances 0.000 description 54
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 47
- 210000004027 cell Anatomy 0.000 description 43
- 238000005516 engineering process Methods 0.000 description 38
- 108091028043 Nucleic acid sequence Proteins 0.000 description 31
- 238000006243 chemical reaction Methods 0.000 description 25
- 108091029523 CpG island Proteins 0.000 description 24
- 229940104302 cytosine Drugs 0.000 description 21
- 210000002381 plasma Anatomy 0.000 description 20
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 18
- 238000002474 experimental method Methods 0.000 description 18
- 102000004190 Enzymes Human genes 0.000 description 16
- 108090000790 Enzymes Proteins 0.000 description 16
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 16
- 210000000265 leukocyte Anatomy 0.000 description 15
- 210000002966 serum Anatomy 0.000 description 15
- 108091033319 polynucleotide Proteins 0.000 description 14
- 102000040430 polynucleotide Human genes 0.000 description 14
- 239000002157 polynucleotide Substances 0.000 description 14
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 13
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 13
- 108700028369 Alleles Proteins 0.000 description 13
- 238000011160 research Methods 0.000 description 13
- 241001465754 Metazoa Species 0.000 description 12
- 230000000295 complement effect Effects 0.000 description 12
- 239000012634 fragment Substances 0.000 description 12
- 229920001184 polypeptide Polymers 0.000 description 12
- 102000004196 processed proteins & peptides Human genes 0.000 description 12
- 108090000765 processed proteins & peptides Proteins 0.000 description 12
- 239000007853 buffer solution Substances 0.000 description 11
- 238000003776 cleavage reaction Methods 0.000 description 11
- 201000010099 disease Diseases 0.000 description 11
- 238000009396 hybridization Methods 0.000 description 11
- 230000007017 scission Effects 0.000 description 11
- 230000035945 sensitivity Effects 0.000 description 11
- 238000011282 treatment Methods 0.000 description 11
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 102000004169 proteins and genes Human genes 0.000 description 10
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 10
- 208000035269 cancer or benign tumor Diseases 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 9
- 230000001613 neoplastic effect Effects 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 108091026890 Coding region Proteins 0.000 description 8
- 108010006785 Taq Polymerase Proteins 0.000 description 8
- 108020004999 messenger RNA Proteins 0.000 description 8
- 229940035893 uracil Drugs 0.000 description 8
- 108091092195 Intron Proteins 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 6
- 238000001976 enzyme digestion Methods 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 6
- 238000003753 real-time PCR Methods 0.000 description 6
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 241000124008 Mammalia Species 0.000 description 5
- 238000000137 annealing Methods 0.000 description 5
- 230000000903 blocking effect Effects 0.000 description 5
- 208000035475 disorder Diseases 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 229940113082 thymine Drugs 0.000 description 5
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 108091093088 Amplicon Proteins 0.000 description 4
- 208000005623 Carcinogenesis Diseases 0.000 description 4
- 241000282412 Homo Species 0.000 description 4
- 101000635944 Homo sapiens Myelin protein P0 Proteins 0.000 description 4
- 101000974433 Homo sapiens Putative ADP-ribosylation factor-like protein 5C Proteins 0.000 description 4
- 108060004795 Methyltransferase Proteins 0.000 description 4
- 102100030741 Myelin protein P0 Human genes 0.000 description 4
- 102100022868 Putative ADP-ribosylation factor-like protein 5C Human genes 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 239000000090 biomarker Substances 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000036952 cancer formation Effects 0.000 description 4
- 231100000504 carcinogenesis Toxicity 0.000 description 4
- 239000000356 contaminant Substances 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 238000002405 diagnostic procedure Methods 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 208000003200 Adenoma Diseases 0.000 description 3
- 206010001233 Adenoma benign Diseases 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 3
- 102000016397 Methyltransferase Human genes 0.000 description 3
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 3
- 230000027455 binding Effects 0.000 description 3
- 238000009739 binding Methods 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000001351 cycling effect Effects 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 239000013315 hypercross-linked polymer Substances 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 238000007857 nested PCR Methods 0.000 description 3
- 239000002751 oligonucleotide probe Substances 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 125000000714 pyrimidinyl group Chemical group 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 210000004881 tumor cell Anatomy 0.000 description 3
- 230000009946 DNA mutation Effects 0.000 description 2
- 102100031780 Endonuclease Human genes 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 241000282849 Ruminantia Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- 241000282898 Sus scrofa Species 0.000 description 2
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 2
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 2
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 2
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 238000001369 bisulfite sequencing Methods 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 208000029742 colonic neoplasm Diseases 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 230000006326 desulfonation Effects 0.000 description 2
- 238000005869 desulfonation reaction Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 230000002550 fecal effect Effects 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 230000006607 hypermethylation Effects 0.000 description 2
- 206010020718 hyperplasia Diseases 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 201000005202 lung cancer Diseases 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000000155 melt Substances 0.000 description 2
- 230000009826 neoplastic cell growth Effects 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 239000002987 primer (paints) Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 239000000092 prognostic biomarker Substances 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 238000012113 quantitative test Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000000108 ultra-filtration Methods 0.000 description 2
- HWPZZUQOWRWFDB-UHFFFAOYSA-N 1-methylcytosine Chemical compound CN1C=CC(N)=NC1=O HWPZZUQOWRWFDB-UHFFFAOYSA-N 0.000 description 1
- JTBBWRKSUYCPFY-UHFFFAOYSA-N 2,3-dihydro-1h-pyrimidin-4-one Chemical group O=C1NCNC=C1 JTBBWRKSUYCPFY-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- 108020005065 3' Flanking Region Proteins 0.000 description 1
- 108020005029 5' Flanking Region Proteins 0.000 description 1
- 101150104383 ALOX5AP gene Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 241000283726 Bison Species 0.000 description 1
- 102100024504 Bone morphogenetic protein 3 Human genes 0.000 description 1
- 241000283725 Bos Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 101100264044 Caenorhabditis elegans cwn-2 gene Proteins 0.000 description 1
- 241000282832 Camelidae Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241001466804 Carnivora Species 0.000 description 1
- 241000282994 Cervidae Species 0.000 description 1
- 108091006146 Channels Proteins 0.000 description 1
- 241001227713 Chiron Species 0.000 description 1
- 206010073140 Clear cell sarcoma of soft tissue Diseases 0.000 description 1
- 108091033380 Coding strand Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241000777300 Congiopodidae Species 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 108700029231 Developmental Genes Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 241000282818 Giraffidae Species 0.000 description 1
- 101000762375 Homo sapiens Bone morphogenetic protein 3 Proteins 0.000 description 1
- 101000612134 Homo sapiens Procollagen C-endopeptidase enhancer 1 Proteins 0.000 description 1
- 101000712958 Homo sapiens Ras association domain-containing protein 1 Proteins 0.000 description 1
- 101000665140 Homo sapiens Scm-like with four MBT domains protein 2 Proteins 0.000 description 1
- 101000864786 Homo sapiens Secreted frizzled-related protein 2 Proteins 0.000 description 1
- 101800001509 Large capsid protein Proteins 0.000 description 1
- 229920000106 Liquid crystal polymer Polymers 0.000 description 1
- 206010064912 Malignant transformation Diseases 0.000 description 1
- 101100236114 Mus musculus Lrrfip1 gene Proteins 0.000 description 1
- 108020003217 Nuclear RNA Proteins 0.000 description 1
- 102000043141 Nuclear RNA Human genes 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 241000282376 Panthera tigris Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241001135989 Porcine reproductive and respiratory syndrome virus Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 102100041026 Procollagen C-endopeptidase enhancer 1 Human genes 0.000 description 1
- 108010066717 Q beta Replicase Proteins 0.000 description 1
- 102100033243 Ras association domain-containing protein 1 Human genes 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 102100038691 Scm-like with four MBT domains protein 2 Human genes 0.000 description 1
- 102100030054 Secreted frizzled-related protein 2 Human genes 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 101150019524 WNT2 gene Proteins 0.000 description 1
- 102000052556 Wnt-2 Human genes 0.000 description 1
- 108700020986 Wnt-2 Proteins 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 238000007844 allele-specific PCR Methods 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 101150010487 are gene Proteins 0.000 description 1
- 210000003567 ascitic fluid Anatomy 0.000 description 1
- 238000007845 assembly PCR Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000002902 bimodal effect Effects 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000007806 chemical reaction intermediate Substances 0.000 description 1
- 201000000292 clear cell sarcoma Diseases 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000012864 cross contamination Methods 0.000 description 1
- CTMZLDSMFCVUNX-VMIOUTBZSA-N cytidylyl-(3'->5')-guanosine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=C(C(N=C(N)N3)=O)N=C2)O)[C@@H](CO)O1 CTMZLDSMFCVUNX-VMIOUTBZSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 210000004696 endometrium Anatomy 0.000 description 1
- 239000005447 environmental material Substances 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000000762 glandular Effects 0.000 description 1
- 239000008241 heterogeneous mixture Substances 0.000 description 1
- 230000001744 histochemical effect Effects 0.000 description 1
- 238000007849 hot-start PCR Methods 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000007851 intersequence-specific PCR Methods 0.000 description 1
- 238000007852 inverse PCR Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 238000007854 ligation-mediated PCR Methods 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 1
- 230000036212 malign transformation Effects 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000010208 microarray analysis Methods 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 238000007856 miniprimer PCR Methods 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000007838 multiplex ligation-dependent probe amplification Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- SQMWSBKSHWARHU-SDBHATRESA-N n6-cyclopentyladenosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(NC3CCCC3)=C2N=C1 SQMWSBKSHWARHU-SDBHATRESA-N 0.000 description 1
- 230000001338 necrotic effect Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 210000002445 nipple Anatomy 0.000 description 1
- 229940124276 oligodeoxyribonucleotide Drugs 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000001855 preneoplastic effect Effects 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000012207 quantitative assay Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 238000004153 renaturation Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000010517 secondary reaction Methods 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000005382 thermal cycling Methods 0.000 description 1
- 238000007862 touchdown PCR Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
- G16B35/20—Screening of libraries
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/143—Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Genetics & Genomics (AREA)
- Pathology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Library & Information Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Microbiology (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Enzymes And Modification Thereof (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本文提供了筛查子宫内膜癌(EC)的技术,并且特别但不仅仅是检测子宫内膜癌和各种子宫内膜癌亚型的存在的方法、组合物和相关用途。
Description
相关申请的交叉引用
本申请要求2019年1月24日提交的美国临时专利申请No.62/796,384的优先权,其以引用的方式整体并入本文中。
技术领域
本文提供了筛查子宫内膜癌(EC)的技术,并且特别但不仅仅是检测子宫内膜癌和各种子宫内膜癌亚型的存在的方法、组合物和相关用途。
背景技术
尽管子宫内膜癌(EC)是美国和许多其它发达国家最常见的妇科恶性肿瘤,但缺乏早期检测EC的方法(参见Siegel,R.L.等人,Cancer statistics,2016.CA Cancer J Clin,2016.66(1):第7-30页;Parkin,D.等人,Global cancer statistics,2002.CA Cancer JClin.,2005.55(2):第74-108页)。虽然低风险的早期EC预后良好,5年总生存率(OS)>95%,但被诊断为III期或IV期时的5年OS分别变为68%和17%(参见Fridley,B.L.等人,PLoSONE,2010.5(9):第e12693页)。大多数EC都是低级别子宫内膜样组织学,并且之前都有增生前体;然而,更具侵袭性的3级子宫内膜样、浆液性、透明细胞和癌肉瘤组织学占新诊断的EC的10-15%,并且可能是高度致命的(参见Felix,A.S.等人,Cancer Causes Control,2010.21(11):第1851-6页;Moore,K.N.和A.N.Fader,Clin Obstet Gynecol,2011.54(2):第278-91页;Cancer Genome Atlas Research,N.等人,Nature,2013.497(7447):第67-73页;Hussein,Y.R.等人,Int J Gynecol Pathol,2016.35(1):第16-24页)。早期检测可增加治愈的机会(参见Mariani,A.等人,Gynecologic Oncology,2008.109(1):第11-18页)。
需要改进检测EC和各种EC亚型的方法。
本发明满足了这些需要。
发明内容
已经将甲基化DNA作为大多数肿瘤类型组织中潜在的一类生物标志物进行研究。在许多情况下,DNA甲基转移酶在胞嘧啶-磷酸-鸟嘌呤(CpG)岛位点处添加甲基至DNA,作为基因表达的表观遗传控制。在生物学上有吸引力的机制中,认为肿瘤抑制基因启动子区域中的获得性甲基化事件会使表达沉默,从而促进肿瘤发生。DNA甲基化可能是比RNA或蛋白质表达更具有化学和生物学稳定性的诊断工具(Laird(2010)Nat Rev Genet 11:191-203)。此外,在如散发性结肠癌等其它癌症中,甲基化标志物提供了极好的特异性,并且比单独DNA突变具有更广泛的信息和更灵敏(Zou等人(2007)Cancer Epidemiol BiomarkersPrev 16:2686-96)。
当应用于动物模型和人类细胞系时,对CpG岛的分析产生了重要的发现。例如,Zhang和同事发现来自同一CpG岛的不同部分的扩增子可能具有不同的甲基化水平(Zhang等人(2009)PLoS Genet 5:e1000438)。此外,甲基化水平在高度甲基化与未甲基化序列之间呈双峰分布,这进一步证明了DNA甲基转移酶活性的二元开关样模式(Zhang等人(2009)PLoS Genet 5:e1000438)。对鼠体内组织和体外细胞系的分析表明,只有约0.3%的高CpG密度启动子(HCP,定义为在300个碱基对区域内具有>7%CpG序列)被甲基化,而低CpG密度区域(LCP,定义为在300个碱基对区域内具有<5%CpG序列)往往以动态组织特异性模式频繁甲基化(Meissner等人(2008)Nature 454:766-70)。HCP包括普遍存在的看家基因和高度调控的发育基因的启动子。在>50%甲基化的HCP位点中,有几个已建立的标志物,例如Wnt2、NDRG2、SFRP2和BMP3(Meissner等人(2008)Nature 454:766-70)。
已经将DNA甲基转移酶在胞嘧啶-磷酸-鸟嘌呤(CpG)岛位点处对DNA的表观遗传甲基化作为大多数肿瘤类型组织中潜在的一类生物标志物进行研究。在生物学上有吸引力的机制中,认为肿瘤抑制基因启动子区域中的获得性甲基化事件会使表达沉默,从而促进肿瘤发生。DNA甲基化可能是比RNA或蛋白质表达更具有化学和生物学稳定性的诊断工具。此外,在如散发性结肠癌等其它癌症中,异常的甲基化标志物比单独DNA突变具有更广泛的信息和更灵敏,并且提供了极好的特异性。
有几种方法可用于搜索新的甲基化标志物。虽然基于微阵列的CpG甲基化询问是一种合理的高通量方法,但这种策略偏向于已知的感兴趣区域,主要是已确立的肿瘤抑制启动子。在过去十年中,已经开发了用于全基因组DNA甲基化分析的替代方法。有三种基本方法。第一种采用通过识别特定甲基化位点的限制酶消化DNA,然后是几种可能的分析技术,这些技术提供的甲基化数据仅限于酶识别位点或用于在定量步骤中扩增DNA的引物(例如甲基化特异性PCR;MSP)。第二种方法使用针对甲基胞嘧啶或其它甲基化特异性结合结构域的抗体富集基因组DNA的甲基化部分,然后进行微阵列分析或测序以将片段映射至参考基因组。这种方法不提供片段内所有甲基化位点的单核苷酸分辨率。第三种方法首先是对DNA进行亚硫酸氢盐处理,将所有未甲基化的胞嘧啶转化为尿嘧啶,然后是限制酶消化,并在与接头配体偶联后对所有片段进行完整测序。限制酶的选择可以富集CpG密集区域的片段,减少在分析过程中可能映射至多个基因位置的冗余序列的数目。
在中高读取覆盖率下RRBS在单核苷酸分辨率下产生所有CpG岛的80-90%和大多数肿瘤抑制启动子的CpG甲基化状态数据。在癌症病例对照研究中,对这些读数的分析可鉴定差异甲基化区域(DMR)。在之前对胰腺癌样本的RRBS分析中,发现了数百个DMR,其中许多从未与致癌作用相关联,并且许多未注释。对独立组织样品集的进一步验证研究证实了在性能方面具有100%灵敏度和特异性的标志物CpG。
EC自发脱落肿瘤细胞(参见Chin,A.B.等人,American Journal of Obstetricsand Gynecology,2000.182(6):第1278-1282页)并且通过微创方法检测EC生物标志物是一种很有前景的方法(参见Kinde,I.等人,Science Translational Medicine,2013.5(167):第167ra4页;Bakkum-Gamez,J.N.等人,Gynecologic Oncology,2015.137(1):第14-22页;Wentzensen,N.等人,International Journal of Cancer,2014.135(8):第1860-1868页;Fiegl H,G.C.等人,Cancer Epidemiol Biomarkers Prev,2004.13(5):第882-8页);然而,需要优化标志物、标准化收集方法和提高特异性。DNA甲基化是EC致癌作用的早期事件(参见Tao,M.H.和J.L.Freudenheim,Epigenetics,2010.5(6):第491-8页);在与EC相邻的看起来形态正常的子宫内膜中RASSF1甲基化(参见Fiegl H,G.C.等人,Cancer EpidemiolBiomarkers Prev,2004.13(5):第882-8页;Pijnenborg,J.等人,Annals of Oncology,2007.18(3):第491-497页;Suehiro,Y.等人,Clinical Cancer Research,2008.14(11):第3354-3361页;Arafa,M.等人,Histopathology,2008.53(5):第525-532页);MLH1甲基化发生在非典型增生中(参见Suehiro,Y.等人,Clinical Cancer Research,2008.14(11):第3354-3361页;Horowitz,N.等人,Gynecologic Oncology,2002.86(1):第62-68页;Xiong,Y.等人,Gynecologic Oncology,2006.103(1):第321-328页;Banno K,Y.M.等人,OncolRep,2006.16(6):第1189-96页;Zighelboim,I.等人,Clinical Cancer Research,2007.13(10):第2882-2889页;Guida M,S.F.等人,Eur J Gynaecol Oncol.,2009.30(3):第267-70页)。这些和其它基因被确定为在EC中甲基化(参见Fiegl H,G.C.等人,Cancer EpidemiolBiomarkers Prev,2004.13(5):第882-8页;Suehiro,Y.等人,Clinical Cancer Research,2008.14(11):第3354-3361页;Zighelboim,I.等人,Clinical Cancer Research,2007.13(10):第2882-2889页;Wentzensen,N.等人,International Journal of Cancer,2014:页码[电子出版比印刷先进];Tao MH,F.J.,DNA methylation in EC.Epigenetics,2010.5(6):第491-8页;Integrated genomic characterization of endometrialcarcinoma.Nature,2013.497(7447):第67-73页;Huang,Y.-W.等人,GynecologicOncology,2010.117(2):第239-247页;Xiong,Y.等人,Gynecologic Oncology,2005.99(1):第135-141页;Sasaki,M.等人,Cancer Research,2001.61(1):第97-102页;Sasaki,M.等人,Molecular and Cellular Endocrinology,2003.202(1-2):第201-207页),并且从坏死肿瘤细胞释放的游离甲基化DNA是一个有吸引力的目标,并已在各种生物体液中检测到,包括唾液、血浆、腹膜液、粪便、乳头抽吸物、尿液、胰液和阴道液(参见Bakkum-Gamez,J.N.等人,Gynecologic Oncology,2015.137(1):第14-22页;Fiegl H,G.C.等人,CancerEpidemiol Biomarkers Prev,2004.13(5):第882-8页;Duffy MJ,N.R.等人,Eur JCancer,2009.45(3):第335-46页;Ahlquist,D.A.等人,Gastroenterology,2012.142(2):第248-256页;Duffy,M.J.等人,Eur J Cancer,2009.45(3):第335-46页;Kisiel,J.B.等人,Clinical Cancer Research,2015.21(19):第4473-4481页)。
本文提供了筛查EC的技术,并且特别但不仅仅是检测EC和各种EC亚型(例如透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)的存在的方法、组合物和相关用途。
实际上,如实施例I、II和III中所述,在鉴定本发明实施方案的过程中进行的实验鉴定了一组新的差异甲基化区域(DMR),用于区分子宫内膜癌来源的DNA与非肿瘤对照DNA。
这类实验列出并描述了499种新的DNA甲基化标志物,可将EC组织(以及EC组织的各种亚型)与良性子宫内膜组织区分开来(参见表1、8和21,实施例1、2和3)。
从这499种新的DNA甲基化标志物中,进一步的实验鉴定了以下能够区分EC组织与良性子宫内膜组织的标志物和/或标志物组:
·AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90(参见表2,实施例1);
·EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B(参见表3,实施例1);
·SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A(参见表15,实施例1);以及
·EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553(参见表20,实施例1)。
从这499种新的DNA甲基化标志物中,进一步的实验鉴定了以下标志物和/或标志物组,用于检测血液样品(例如,血浆样品、全血样品、白细胞样品、血清样品)中的EC:
·ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A(参见表9,实施例1)。
从这499种新的DNA甲基化标志物中,进一步的实验鉴定了以下能够区分透明细胞EC组织与良性子宫内膜组织的标志物和/或标志物组:
·DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422(参见表4,实施例1);
·ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A(参见表11,实施例1);
·SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A(参见表16,实施例1);以及
·MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B(参见表24,实施例3)。
从这499种新的DNA甲基化标志物中,进一步的实验鉴定了以下标志物和/或标志物组,用于检测血液样品(例如,血浆样品、全血样品、白细胞样品、血清样品)中的透明细胞EC:
·SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC。
从这499种新的DNA甲基化标志物中,进一步的实验鉴定了以下能够区分癌肉瘤EC组织与良性子宫内膜组织的标志物和/或标志物组:
·EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B(参见表5,实施例1);
·EMX2OS和LRRC34(参见表13,实施例1);
·ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL(参见表18,实施例1);以及
·TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B(参见表24,实施例3)。
从这499种新的DNA甲基化标志物中,进一步的实验鉴定了以下标志物和/或标志物组,用于检测血液样品(例如,血浆样品、全血样品、白细胞样品、血清样品)中的癌肉瘤EC:
·SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL(参见表13,实施例1)。
从这499种新的DNA甲基化标志物中,进一步的实验鉴定了以下能够区分浆液性EC组织与良性子宫内膜组织的标志物和/或标志物组:
·EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B(参见表7,实施例1);
·MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C(参见表12,实施例1);
·MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL(参见表17,实施例1);以及
·EMX2OS和LRRC41_D(参见表24,实施例3)。
从这499种新的DNA甲基化标志物中,进一步的实验鉴定了以下标志物和/或标志物组,用于检测血液样品(例如,血浆样品、全血样品、白细胞样品、血清样品)中的浆液性EC:
·SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A(参见表12,实施例1)。
从这499种新的DNA甲基化标志物中,进一步的实验鉴定了以下能够区分子宫内膜样EC组织与良性子宫内膜组织的标志物和/或标志物组:
·MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B(参见表6,实施例1);
·MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL(参见表14,实施例1);以及
·SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A(参见表19,实施例1)。
从这499种新的DNA甲基化标志物中,进一步的实验鉴定了以下标志物和/或标志物组,用于检测血液样品(例如,血浆样品、全血样品、白细胞样品、血清样品)中的子宫内膜样EC:
·SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A(参见表14,实施例1)。
从这499种新的DNA甲基化标志物中,进一步的实验鉴定了以下能够区分子宫内膜样EC 1级组织与良性子宫内膜组织的标志物和/或标志物组:
·TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C(参见表25,实施例3)。
从这499种新的DNA甲基化标志物中,进一步的实验鉴定了以下能够区分子宫内膜样EC 2级组织与良性子宫内膜组织的标志物和/或标志物组:
·TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B(参见表25,实施例3)。
从这499种新的DNA甲基化标志物中,进一步的实验鉴定了以下能够区分子宫内膜样EC 3级组织与良性子宫内膜组织的标志物和/或标志物组:
·TSPYL5、MPZ_B、TRH和PTGDR(参见表25,实施例3)。
如本文所述,这项技术提供了对EC总体和各种类型EC(例如透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)具有高辨别力的许多甲基化DNA标志物和其子集(例如,2种、3种、4种、5种、6种、7种或8种标志物的集合)。实验将选择过滤器应用于候选标志物以鉴定提供高信噪比和低背景水平,从而为EC筛查或诊断提供高特异性的标志物。
在一些实施方案中,这项技术涉及评估生物样品(例如子宫内膜组织样品、血液样品)中本文鉴定的一种或多种标志物的存在和甲基化状态。这些标志物包含如本文所讨论,例如,如表1、8和21中提供的一个或多个差异甲基化区域(DMR)。在这项技术的实施方案中评估甲基化状态。因此,在测量基因甲基化状态的方法中不限制本文提供的技术。例如,在一些实施方案中,通过基因组扫描方法测量甲基化状态。例如,一种方法涉及限制性界标基因组扫描(Kawai等人(1994)Mol.Cell.Biol.14:7421-7427)并且另一实例涉及甲基化敏感性随机引物PCR(Gonzalgo等人(1997)Cancer Res.57:594-599)。在一些实施方案中,特定CpG位点处甲基化模式的变化通过用甲基化敏感性限制酶消化基因组DNA,随后对感兴趣区域进行DNA分析(Southern analysis)(消化-DNA法)来监测。在一些实施方案中,分析甲基化模式的变化涉及基于PCR的方法,所述方法涉及在PCR扩增之前用甲基化敏感性限制酶或甲基化依赖性限制酶消化基因组DNA(Singer-Sam等人(1990)Nucl.Acids Res.18:687)。此外,已报告利用亚硫酸氢盐处理DNA作为甲基化分析的起点的其它技术。这些包括甲基化特异性PCR(MSP)(Herman等人(1992)Proc.Natl.Acad.Sci.USA 93:9821-9826)和从亚硫酸氢盐转化的DNA扩增的PCR产物的限制酶消化(Sadri和Hornsby(1996)Nucl.Acids Res.24:5058-5059;以及Xiong和Laird(1997)Nucl.Acids Res.25:2532-2534)。已开发PCR技术用于检测基因突变(Kuppuswamy等人(1991)Proc.Natl.Acad.Sci.USA 88:1143-1147)和定量等位基因特异性表达(Szabo和Mann(1995)Genes Dev.9:3097-3108;以及Singer-Sam等人(1992)PCR Methods Appl.1:160-163)。这类技术使用内部引物,其与PCR生成的模板退火并紧邻待测定的单个核苷酸的5'端终止。如美国专利No.7,037,650中所述的使用“定量Ms-SNuPE测定”的方法用于一些实施方案中。
在评估甲基化状态时,甲基化状态通常表示为在特定位点(例如,在单个核苷酸、特定区域或基因座、更长的感兴趣序列,例如,高达约100-bp、200-bp、500-bp、1000-bp的DNA子序列或更长序列)处甲基化的单个DNA链相对于包含该特定位点的样品中的DNA总群体的分数或百分比。传统上,未甲基化核酸的量是通过PCR使用校准器来确定。然后,用亚硫酸氢盐处理已知量的DNA,并使用实时PCR或其它指数扩增,例如QuARTS测定(例如,由美国专利No.8,361,720以及美国专利申请公布No.2012/0122088和2012/0122106提供,以引用的方式并入本文中)来确定所得到的甲基化特异性序列。
例如,在一些实施方案中,方法包括通过使用外部标准来生成未甲基化靶标的标准曲线。标准曲线由至少两个点构建,并将未甲基化DNA的实时Ct值与已知的定量标准相关联。然后,由至少两个点和外部标准构建甲基化靶标的第二条标准曲线。这个第二条标准曲线将甲基化DNA的Ct与已知的定量标准相关联。接着,确定甲基化和未甲基化群体的测试样品Ct值,并根据前两个步骤产生的标准曲线计算DNA的基因组当量。感兴趣位点处的甲基化百分比由甲基化DNA的量相对于群体中DNA的总量计算,例如(甲基化DNA的数目)/(甲基化DNA的数目+未甲基化DNA的数目)×100。
本文还提供了用于实施所述方法的组合物和试剂盒。例如,在一些实施方案中,对一种或多种标志物具有特异性的试剂(例如,引物、探针)单独或成组提供(例如,用于扩增多个标志物的引物对组)。还可提供用于进行检测测定的额外试剂(例如,用于进行QuARTS、PCR、测序、亚硫酸氢盐或其它测定的酶、缓冲液、阳性和阴性对照)。在一些实施方案中,试剂盒含有能够以甲基化特异性方式修饰DNA的试剂(例如,甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)。在一些实施方案中,提供了含有一种或多种对于实施方法而言必需的、足够的或有用的试剂的试剂盒。还提供了含有试剂的反应混合物。还提供了含有多种试剂的预混试剂组,这些试剂可以相互添加和/或添加至测试样品中以完善反应混合物。
在一些实施方案中,本文所述的技术与可编程机器相关联,该可编程机器被设计用于执行由本文所述的方法提供的一系列算术或逻辑运算。例如,这项技术的一些实施方案与计算机软件和/或计算机硬件相关联(例如,在其中执行)。在一个方面,这项技术涉及一种计算机,该计算机包括一种形式的存储器、用于执行算术和逻辑运算的元件以及用于执行一系列指令(例如,本文提供的方法)以读取、操作和存储数据的处理元件(例如,微处理器)。在一些实施方案中,微处理器是系统的一部分,用于:确定甲基化状态(例如,一种或多种DMR,例如表1、8和21中提供的DMR 1-499);比较甲基化状态(例如,一种或多种DMR,例如表1、8和21中提供的DMR 1-499);生成标准曲线;确定Ct值;计算甲基化的分数、频率或百分比(例如,一种或多种DMR,例如表1、8和21中提供的DMR 1-499);鉴定CpG岛;确定测定或标志物的特异性和/或灵敏度;计算ROC曲线和相关的AUC;序列分析;皆如本文所述或本领域已知。
在一些实施方案中,微处理器或计算机在算法中使用甲基化状态数据来预测癌症部位。
在一些实施方案中,软件或硬件组件接收多个测定的结果并基于多个测定的结果确定单个值结果以向用户报告,指示癌症风险(例如,确定如表2、18和26中提供的多个DMR的甲基化状态)。相关实施方案基于来自多个测定的结果的数学组合(例如加权组合、线性组合)计算风险因子,例如确定多个标志物(例如,如表1、8和21中提供的多个DMR)的甲基化状态。在一些实施方案中,DMR的甲基化状态定义了一个维度并且可以在多维空间中具有值并且由多个DMR的甲基化状态定义的坐标是例如向用户报告的结果,例如与癌症相关风险。
一些实施方案包含存储媒体和存储器组件。存储器组件(例如,易失性和/或非易失性存储器)可用于存储指令(例如,如本文提供的方法的实施方案)和/或数据(例如工件,例如甲基化测量、序列和与之相关的统计描述)。一些实施方案涉及还包括CPU、图形卡和用户界面(例如,包括例如显示器的输出装置和例如键盘的输入装置)中的一个或多个的系统。
与这项技术相关的可编程机器包括常规的现存技术和正在开发或有待开发的技术(例如,量子计算机、化学计算机、DNA计算机、光学计算机、基于自旋电子学的计算机等)。
在一些实施方案中,这项技术包含用于传输数据的有线(例如,金属电缆、光纤)或无线传输媒体。例如,一些实施方案涉及通过网络(例如,局域网(LAN)、广域网(WAN)、自组织网络、互联网等)进行数据传输。在一些实施方案中,可编程机器作为对等体存在于这样的网络上,并且在一些实施方案中可编程机器具有客户端/服务器关系。
在一些实施方案中,数据存储在例如硬盘、闪存、光学媒体、软盘等计算机可读存储媒体上。
在一些实施方案中,本文提供的技术与协同操作以执行如本文所述的方法的多个可编程装置相关联。例如,在一些实施方案中,多台计算机(例如,通过网络连接)可以并行工作以收集和处理数据,例如,在集群计算或网格计算或一些其它依赖于完整计算机(具有板载CPU、存储器、电源、网络接口等)通过常规网络接口(例如以太网、光纤)或无线网络技术连接到网络(私有、公共或互联网)的分布式计算机架构的执行中。
例如,一些实施方案提供了一种包括计算机可读媒体的计算机。该实施方案包括耦合到处理器的随机存取存储器(RAM)。处理器执行被存储在存储器中的计算机可执行程序指令。这样的处理器可以包括微处理器、ASIC、状态机或其它处理器,并且可以是多种计算机处理器中的任一种,例如来自Santa Clara(California)的Intel公司和Schaumburg(Illinois)的Motorola公司的处理器。这样的处理器包括或可以与媒体,例如计算机可读媒体通信,所述媒体存储指令,在由处理器执行时,这些指令使处理器执行本文所述的步骤。
计算机可读媒体的实施方案包括但不限于能够为处理器提供计算机可读指令的电子、光学、磁性或其它存储或传输装置。合适媒体的其它实例包括但不限于软盘、CD-ROM、DVD、磁盘、存储芯片、ROM、RAM、ASIC、配置的处理器、所有光学媒体、所有磁带或其它磁性媒体,或计算机处理器可以从中读取指令的任何其它媒体。此外,各种其它形式的计算机可读媒体可以向计算机传输或携带指令,包括路由器、私有或公共网络、或其它有线和无线传输装置或信道。指令可以包含来自任何合适的计算机编程语言的代码,包括例如C、C++、C#、Visual Basic、Java、Python、Perl和JavaScript。
在一些实施方案中,计算机连接到网络。计算机还可能包括许多外部或内部装置,例如鼠标、CD-ROM、DVD、键盘、显示器或其它输入或输出装置。计算机的实例是个人计算机、数字助理、个人数字助理、蜂窝电话、移动电话、智能电话、寻呼机、数字平板电脑、膝上型计算机、互联网设备和其它基于处理器的装置。一般来说,与本文提供的技术的各方面相关的计算机可以是在任何操作系统上操作的任何类型的基于处理器的平台,例如MicrosoftWindows、Linux、UNIX、Mac OS X等,能够支持一个或多个包含本文提供的技术的程序。一些实施方案包括执行其它应用程序(例如,应用程序)的个人计算机。应用程序可以含在存储器中并且可以包括例如文字处理应用程序、电子表格应用程序、电子邮件应用程序、即时消息应用程序、演示应用程序、因特网浏览器应用程序、日历/组织器应用程序和任何其它能够由客户端装置执行的应用程序。
本文所述的与这项技术相关联的所有这类组件、计算机和系统可以是逻辑的或虚拟的。
因此,本文提供了与从受试者获得的样品中筛查EC和/或各种形式的EC(例如,透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)的方法相关的技术,所述方法包括测定从受试者获得的样品(例如子宫内膜组织)(例如血液样品)中标志物的甲基化状态,并且当标志物的甲基化状态不同于在未患EC的受试者中测定的标志物的甲基化状态时,将所述受试者鉴定为患有EC和/或特定形式的EC,其中标志物包含差异甲基化区域(DMR)中的碱基,所述DMR选自由表1、8和21中提供的DMR 1-499组成的组。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有EC:AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90(参见表2,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有EC:EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B(参见表3,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有EC:SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A(参见表15,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有EC:EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553(参见表20,实施例1)。
在一些实施方案中,其中从受试者获得的样品是血液样品(例如,血浆样品、全血样品、白细胞样品、血清样品)并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有EC:ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A(参见表9,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有透明细胞EC:DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422(参见表4,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有透明细胞EC:ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A(参见表11,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有透明细胞EC:SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A(参见表16,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有透明细胞EC:MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B(参见表24,实施例3)。
在一些实施方案中,其中从受试者获得的样品是血液样品(例如,血浆样品、全血样品、白细胞样品、血清样品)并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有透明细胞EC:SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有癌肉瘤EC:EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B(参见表5,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有癌肉瘤EC:EMX2OS和LRRC34(参见表13,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有癌肉瘤EC:ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL(参见表18,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有癌肉瘤EC:TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B(参见表24,实施例3)。
在一些实施方案中,其中从受试者获得的样品是血液样品(例如,血浆样品、全血样品、白细胞样品、血清样品)并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有癌肉瘤EC:SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL(参见表13,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有浆液性EC:EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B(参见表7,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有浆液性EC:MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C(参见表12,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有浆液性EC:MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL(参见表17,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有浆液性EC:EMX2OS和LRRC41_D(参见表24,实施例3)。
在一些实施方案中,其中从受试者获得的样品是血液样品(例如,血浆样品、全血样品、白细胞样品、血清样品)并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有浆液性EC:SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A(参见表12,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有子宫内膜样EC:MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B(参见表6,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有子宫内膜样EC:MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL(参见表14,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有子宫内膜样EC:SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A(参见表19,实施例1)。
在一些实施方案中,其中从受试者获得的样品是血液样品(例如,血浆样品、全血样品、白细胞样品、血清样品)并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有子宫内膜样EC:SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A(参见表14,实施例1)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有子宫内膜样1级EC:TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C(参见表25,实施例3)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有子宫内膜样2级EC:TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B(参见表25,实施例3)。
在一些实施方案中,其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有子宫内膜样3级EC:TSPYL5、MPZ_B、TRH和PTGDR(参见表25,实施例3)。
这项技术涉及鉴定和区分EC和/或各种形式的EC(例如,透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)。一些实施方案提供了包括测定多种标志物,例如包括测定2种至11种至100种或120种或499种标志物的方法。
这项技术不限于所评估的甲基化状态。在一些实施方案中,评估样品中标志物的甲基化状态包括确定一种碱基的甲基化状态。在一些实施方案中,测定样品中标志物的甲基化状态包括确定多种碱基的甲基化程度。此外,在一些实施方案中,标志物的甲基化状态包含相对于标志物的正常甲基化状态增加的标志物甲基化。在一些实施方案中,标志物的甲基化状态包含相对于标志物的正常甲基化状态减少的标志物甲基化。在一些实施方案中,标志物的甲基化状态包含相对于标志物的正常甲基化状态不同的标志物甲基化模式。
此外,在一些实施方案中,标志物是100个或更少碱基的区域,标志物是500个或更少碱基的区域,标志物是1000个或更少碱基的区域,标志物是5000个或更少碱基的区域,或在一些实施方案中,标志物是一个碱基。在一些实施方案中,标志物在高CpG密度启动子中。
这项技术不受样品类型的限制。例如,在一些实施方案中,样品是粪便样品、组织样品(例如子宫内膜组织样品)、血液样品(例如血浆、白细胞、血清、全血)、排泄物或尿液样品。
此外,在用于确定甲基化状态的方法中不限制这项技术。在一些实施方案中,分析包括使用甲基化特异性聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。在一些实施方案中,测定包括使用甲基化特异性寡核苷酸。在一些实施方案中,这项技术使用大规模平行测序(例如,下一代测序)来确定甲基化状态,例如,边合成边测序、实时(例如,单分子)测序、珠乳液测序(bead emulsion sequencing)、纳米孔测序等。
这项技术提供了用于检测DMR的试剂,例如,在一些实施方案中提供了一组寡核苷酸,其包含由SEQ ID NO:1-499提供的序列(参见表1、8和21)。在一些实施方案中,提供了包含与在DMR中具有碱基的染色体区域互补的序列的寡核苷酸,例如对DMR的甲基化状态敏感的寡核苷酸。
这项技术提供了用于鉴定EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90(参见表2,实施例1)。
这项技术提供了用于鉴定EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B(参见表3,实施例1)。
这项技术提供了用于鉴定EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A(参见表15,实施例1)。
这项技术提供了用于鉴定EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553(参见表20,实施例1)。
这项技术提供了用于鉴定EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A(参见表9,实施例1)。
这项技术提供了用于鉴定透明细胞EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422(参见表4,实施例1)。
这项技术提供了用于鉴定透明细胞EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A(参见表11,实施例1)。
这项技术提供了用于鉴定透明细胞EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A(参见表16,实施例1)。
这项技术提供了用于鉴定透明细胞EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B(参见表24,实施例3)。
这项技术提供了用于鉴定透明细胞EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC(参见表11,实施例1)。
这项技术提供了用于鉴定癌肉瘤EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B(参见表5,实施例1)。
这项技术提供了用于鉴定癌肉瘤EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:EMX2OS和LRRC34(参见表13,实施例1)。
这项技术提供了用于鉴定癌肉瘤EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL(参见表18,实施例1)。
这项技术提供了用于鉴定癌肉瘤EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B(参见表24,实施例3)。
这项技术提供了用于鉴定癌肉瘤EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL(参见表13,实施例1)。
这项技术提供了用于鉴定浆液性EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B(参见表7,实施例1)。
这项技术提供了用于鉴定浆液性EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C(参见表12,实施例1)。
这项技术提供了用于鉴定浆液性EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL(参见表17,实施例1)。
这项技术提供了用于鉴定浆液性EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:EMX2OS和LRRC41_D(参见表24,实施例3)。
这项技术提供了用于鉴定浆液性EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A(参见表12,实施例1)。
这项技术提供了用于鉴定子宫内膜样EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B(参见表6,实施例1)。
这项技术提供了用于鉴定子宫内膜样EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL(参见表14,实施例1)。
这项技术提供了用于鉴定子宫内膜样EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A(参见表19,实施例1)。
这项技术提供了用于鉴定子宫内膜样EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A(参见表14,实施例1)。
这项技术提供了用于鉴定子宫内膜样1级EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C(参见表25,实施例3)。
这项技术提供了用于鉴定子宫内膜样2级EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B(参见表25,实施例3)。
这项技术提供了用于鉴定子宫内膜样3级EC的各种标志物组,例如,在一些实施方案中,标志物包含具有如下注释的染色体区域:TSPYL5、MPZ_B、TRH和PTGDR(参见表25,实施例3)。
提供了试剂盒实施方案,例如一种试剂盒,所述试剂盒包括能够以甲基化特异性方式修饰DNA的试剂(例如,甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂);以及对照核酸,所述对照核酸包含来自选自由DMR 1-499(来自表1、8和21)组成的组的DMR的序列并且具有与未患EC的受试者相关的甲基化状态。在一些实施方案中,试剂盒包括亚硫酸氢盐试剂和如本文所述的寡核苷酸。在一些实施方案中,试剂盒包括能够以甲基化特异性方式修饰DNA的试剂(例如,甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂);以及对照核酸,所述对照核酸包含来自选自由DMR 1-499(来自表1、8和21)组成的组的DMR的序列并且具有与患有EC的受试者相关的甲基化状态。一些试剂盒实施例包括用于从受试者获得样品(例如,粪便样品;子宫内膜组织样品;血液样品)的样品收集器;能够以甲基化特异性方式修饰DNA的试剂(例如,甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂);以及如本文所述的寡核苷酸。
这项技术涉及组合物(例如,反应混合物)的实施方案。在一些实施方案中,提供了一种组合物,所述组合物包含:包含DMR的核酸,以及能够以甲基化特异性方式修饰DNA的试剂(例如,甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)。一些实施方案提供包含核酸的组合物,所述核酸包含DMR和如本文所述的寡核苷酸。一些实施方案提供包含核酸的组合物,所述核酸包含DMR和甲基化敏感性限制酶。一些实施方案提供包含核酸的组合物,所述核酸包含DMR和聚合酶。
提供了额外的相关方法实施方案,用于筛查从受试者获得的样品(例如,子宫内膜组织样品;血液样品;粪便样品)中的EC和/或各种形式的EC(例如,透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC),例如一种方法,所述方法包括确定样品中的标志物的甲基化状态,所述标志物包含如DMR 1-499(来自表1、8和21)中的一个或多个的DMR中的碱基;将来自受试者样品的标志物的甲基化状态与来自未患EC(例如,EC、透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)的受试者的正常对照样品的标志物的甲基化状态进行比较;以及确定受试样品和正常对照样品的甲基化状态差异的置信区间和/或p值。在一些实施方案中,置信区间为90%、95%、97.5%、98%、99%、99.5%、99.9%或99.99%,并且p值为0.1、0.05、0.025、0.02、0.01、0.005、0.001或0.0001。方法的一些实施方案提供了使包含DMR的核酸与能够以甲基化特异性方式修饰核酸的试剂(例如,甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)反应的步骤,以产生例如以甲基化特异性方式修饰的核酸;对以甲基化特异性方式修饰的核酸进行测序,以提供以甲基化特异性方式修饰的核酸的核苷酸序列;将以甲基化特异性方式修饰的核酸的核苷酸序列与来自未患EC和/或一种形式的EC的受试者的包含DMR的核酸的核苷酸序列进行比较,以鉴定这两个序列的差异;以及当存在差异时,将受试者鉴定为患有EC(例如,EC和/或一种形式的EC:透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)。
这项技术提供了用于筛查从受试者获得的样品中的EC的系统。系统的示例性实施方案包括例如用于筛查从受试者获得的样品(例如子宫内膜组织样品;血浆样品;粪便样品)中的EC和/或和/或EC类型(例如透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)的系统,该系统包括:分析组件,所述分析组件被配置用于确定样品的甲基化状态;软件组件,所述软件组件被配置用于将样品的甲基化状态与数据库中记录的对照样品或参考样品甲基化状态进行比较;以及警报组件,所述警报组件被配置用于向用户发出关于EC相关的甲基化状态的警报。在一些实施方案中,警报由软件组件确定,所述软件组件接收多个测定的结果(例如,确定多种标志物,如例如表1、8和21中提供的DMR的甲基化状态)并基于多个结果计算值或结果以进行报告。一些实施例提供与本文提供的每个DMR相关联的加权参数的数据库,用于计算值或结果和/或警报以向用户(例如,如医师、护士、临床医生等)报告。在一些实施方案中,报告了来自多个测定的所有结果,并且在一些实施方案中,一个或多个结果用于提供评分、值或结果,所述评分、值或结果基于来自多个测定的一个或多个结果的复合物,其指示受试者中的癌症风险。
在系统的一些实施方案中,样品包含含有DMR的核酸。在一些实施方案中,该系统还包括用于分离核酸的组件、用于收集样品的组件,例如用于收集粪便样品的组件。在一些实施方案中,系统包含含有DMR的核酸序列。在一些实施方案中,数据库包含来自未患EC和/或特定类型EC(例如,透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)的受试者的核酸序列。还提供了核酸,例如一组核酸,每个核酸具有包含DMR的序列。在一些实施方案中,该组核酸中每个核酸具有来自未患EC和/或特定类型EC的受试者的序列。相关系统实施方案包括如所述的一组核酸和与该组核酸相关的核酸序列数据库。一些实施方案还包括能够以甲基化特异性方式修饰DNA的试剂(例如,甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)。并且,一些实施方案还包括核酸测序仪。
在某些实施方案中,提供了用于表征来自人类患者的样品(例如,子宫内膜组织样品;血液样品;粪便样品)的方法。例如,在一些实施方案中,这类实施方案包括从人类患者的样品获得DNA;测定DNA甲基化标志物的甲基化状态,所述DNA甲基化标志物包含选自由表1、8和21的DMR 1-499组成的组的差异甲基化区域(DMR)中的碱基;以及将一种或多种DNA甲基化标志物的所测定的甲基化状态与未患EC和/或特定类型EC(例如,透明细胞EC、癌肉瘤EC、子宫内膜样EC,浆液性EC)的人类患者的一种或多种DNA甲基化标志物的甲基化水平参考进行比较。
这类方法不限于来自人类患者的特定类型的样品。在一些实施方案中,样品是子宫内膜组织样品。在一些实施方案中,样品是血浆样品。在一些实施方案中,样品是粪便样品、组织样品、子宫内膜组织样品、血液样品(例如白细胞样品、血浆样品、全血样品、血清样品)或尿液样品。
在一些实施方案中,这类方法包括测定多种DNA甲基化标志物。在一些实施方案中,这类方法包括测定2至11种DNA甲基化标志物。在一些实施方案中,这类方法包括测定12至120种DNA甲基化标志物。在一些实施方案中,这类方法包括测定2至499种DNA甲基化标志物。在一些实施方案中,这类方法包括测定样品中的一种或多种DNA甲基化标志物的甲基化状态,包括确定一种碱基的甲基化状态。在一些实施方案中,这类方法包括测定样品中的一种或多种DNA甲基化标志物的甲基化状态,包括确定多种碱基处的甲基化程度。在一些实施方案中,这类方法包括测定正向链的甲基化状态或测定反向链的甲基化状态。
在一些实施方案中,DNA甲基化标志物是100个或更少碱基的区域。在一些实施方案中,DNA甲基化标志物是500个或更少碱基的区域。在一些实施方案中,DNA甲基化标志物是1000个或更少碱基的区域。在一些实施方案中,DNA甲基化标志物是5000个或更少碱基的区域。在一些实施方案中,DNA甲基化标志物是一个碱基。在一些实施方案中,DNA甲基化标志物在高CpG密度启动子中。
在一些实施方案中,分析包括使用甲基化特异性聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。
在一些实施方案中,测定包括使用甲基化特异性寡核苷酸。在一些实施方案中,甲基化特异性寡核苷酸选自由SEQ ID NO:1-499(表1、8和21)组成的组。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90(参见表2,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B(参见表3,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A(参见表15,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553(参见表20,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A(参见表9,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422(参见表4,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A(参见表11,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A(参见表16,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B(参见表24,实施例3)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC(参见表11,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B(参见表5,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:EMX2OS和LRRC34(参见表13,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL(参见表18,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B(参见表24,实施例3)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL(参见表13,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B(参见表7,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C(参见表12,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL(参见表17,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:EMX2OS和LRRC41_D(参见表24,实施例3)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A(参见表12,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B(参见表6,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL(参见表14,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A(参见表19,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A(参见表14,实施例1)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C(参见表25,实施例3)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B(参见表25,实施例3)。
在一些实施方案中,具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物:TSPYL5、MPZ_B、TRH和PTGDR(参见表25,实施例3)。
在一些实施方案中,这类方法包括确定两种DNA甲基化标志物的甲基化状态。在一些实施方案中,这类方法包括确定在表1、8和/或21的一行中提供的一对DNA甲基化标志物的甲基化状态。
在某些实施方案中,这项技术提供了用于表征从人类患者获得的样品(例如,子宫内膜组织样品;白细胞样品;血浆样品;全血样品;血清样品;粪便样品)的方法。这类方法包括确定样品中的DNA甲基化标志物的甲基化状态,所述DNA甲基化标志物包含选自由表1、8或21的DMR 1-499组成的组的DMR中的碱基;将来自患者样品的DNA甲基化标志物的甲基化状态与来自未患EC和/或特定形式EC(例如,透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)的人类受试者的正常对照样品的DNA甲基化标志物的甲基化状态进行比较;以及确定人类患者和正常对照样品的甲基化状态差异的置信区间和/或p值。在一些实施方案中,置信区间为90%、95%、97.5%、98%、99%、99.5%、99.9%或99.99%,并且p值为0.1、0.05、0.025、0.02、0.01、0.005、0.001或0.0001。
在某些实施方案中,这项技术提供了用于表征从人类受试者获得的样品(例如,子宫内膜组织样品;白细胞样品;血浆样品;全血样品;血清样品;粪便样品)的方法,所述方法包括使包含DMR的核酸与能够以甲基化特异性方式修饰DNA的试剂(例如,甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)反应,以产生以甲基化特异性方式修饰的核酸;对以甲基化特异性方式修饰的核酸进行测序,以提供以甲基化特异性方式修饰的核酸的核苷酸序列;将以甲基化特异性方式修饰的核酸的核苷酸序列与来自未患EC的受试者的包含DMR的核酸的核苷酸序列进行比较,以鉴定这两个序列的差异。
在某些实施方案中,这项技术提供了用于表征从人类受试者获得的样品(例如,子宫内膜组织样品;血浆样品;粪便样品)的系统,所述系统包括:分析组件,所述分析组件被配置用于确定样品的甲基化状态;软件组件,所述软件组件被配置用于将样品的甲基化状态与数据库中记录的对照样品或参考样品甲基化状态进行比较;以及警报组件,所述警报组件被配置用于基于甲基化状态的组合确定单个值并向用户发出关于EC相关的甲基化状态的警报。在一些实施方案中,样品包含含有DMR的核酸。
在一些实施方案中,这类系统还包括用于分离核酸的组件。在一些实施方案中,这类系统还包括用于收集样品的组件。
在一些实施方案中,样品是粪便样品、组织样品、子宫内膜组织样品、血液样品(例如血浆样品、白细胞样品、全血样品、血清样品)或尿液样品。
在一些实施方案中,数据库包含含有DMR的核酸序列。在一些实施方案中,数据库包含来自未患EC的受试者的核酸序列。
基于本文所含的教导内容,额外实施方法对于相关领域的技术人员来说将是显而易见的。
附图说明
图1:交叉验证的3-MDM图源自于rPART模拟(EMX2OS、NBPF8、SFMBT2),其以97%特异性和97%灵敏度以及0.98的AUC区分总体EC与BE。数据以热矩阵格式绘制,允许互补性可视化。
图2:用于61个甲基化标志物的标志物染色体区域(例如区分EC组织与正常子宫内膜组织的甲基化区域)和相关引物和探针信息。
定义
为了便于理解本发明的技术,以下定义了多个术语和短语。在整个详细描述中阐述了另外的定义。
在整个说明书和权利要求书中,除非上下文另外清楚规定,否则以下术语采用与本文明确相关的含义。如本文所用,短语“在一个实施方案中”不一定指相同的实施方案,尽管其可能是这样。此外,如本文所用,短语“在另一个实施方案中”不一定指不同的实施方案,尽管其可能是这样。因此,如下所述,在不脱离本发明的范围或精神下,可以容易地组合本发明的各种实施方案。
另外,除非上下文另外清楚规定,否则如本文所用,术语“或”是包括性的“或”运算符并且等同于术语“和/或”。除非上下文另外清楚规定,术语“基于”不是排他性的,并且允许基于未描述的另外的因素。另外,在整个说明书中,“一(a/an)”和“所述”的含义包括复数个提及物。“在……中”的含义包括“在……中”和“在……上”。
如在本申请中的权利要求书中使用的过渡短语“基本上由……组成”将权利要求的范围限于所说明的材料或步骤,“以及实质上不影响所要求的发明的基本和新颖特征的那些材料或步骤”,如In re Herz,537F.2d 549,551-52,190USPQ 461,463(CCPA 1976)中所论述。举例来说,“基本上由所列举元素组成的”组合物可以含有一定水平的未列举的污染物,使得污染物尽管存在,但与纯组合物,即“由所列举组分组成”的组合物相比,不会改变所列举组合物的功能。
如本文所用,“核酸”或“核酸分子”一般是指任何核糖核酸或脱氧核糖核酸,其可以是未修饰的或修饰的DNA或RNA。“核酸”包括不限于单链和双链核酸。如本文所用,术语“核酸”还包括含有一个或多个修饰碱基的如上所述的DNA。因此,具有出于稳定性或其它原因而进行修饰的主链的DNA是“核酸”。如本文所用,术语“核酸”涵盖这样的化学、酶促或代谢修饰形式的核酸,以及病毒和细胞(包括例如简单和复杂细胞)特征性的DNA化学形式。
术语“寡核苷酸”或“多核苷酸”或“核苷酸”或“核酸”是指具有两个或更多个,优选地超过三个和通常超过十个脱氧核糖核苷酸或核糖核苷酸的分子。确切的大小将取决于许多因素,而这些因素又取决于寡核苷酸的最终功能或用途。寡核苷酸可以通过任何方式产生,包括化学合成、DNA复制、逆转录或它们的组合。DNA的典型脱氧核糖核苷酸是胸腺嘧啶、腺嘌呤、胞嘧啶和鸟嘌呤。RNA的典型核糖核苷酸是尿嘧啶、腺嘌呤、胞嘧啶和鸟嘌呤。
如本文所用,术语核酸的“基因座”或“区域”是指核酸的亚区域,例如染色体上的基因、单个核苷酸、CpG岛等。
术语“互补”和“互补性”是指通过碱基配对规则相关的核苷酸(例如1个核苷酸)或多核苷酸(例如核苷酸序列)。例如,序列5'-A-G-T-3'与序列3'-T-C-A-5'互补。互补性可以是“部分的”,其中仅一些核酸碱基根据碱基配对规则匹配。或者,核酸之间可能存在“完全”或“全部”互补。核酸链之间的互补程度影响核酸链之间杂交的效率和强度。这在依赖于核酸之间的结合的扩增反应和检测方法中特别重要。
术语“基因”是指包含产生RNA或多肽或其前体所必需的编码序列的核酸(例如DNA或RNA)序列。功能性多肽可由全长编码序列或由编码序列的任何部分编码,只要保留多肽的所需活性或功能特性(例如酶活性、配体结合、信号转导等)即可。当在提及基因时使用时术语“部分”是指该基因的片段。片段的大小可以在几个核苷酸至整个基因序列减去一个核苷酸的范围内变化。因此,“包含基因至少一部分的核苷酸”可以包含基因片段或整个基因。
术语“基因”还涵盖结构基因的编码区,并包括在5'和3'末端与编码区相邻,例如在任一个末端相距约1kb的序列,使得基因对应于全长mRNA(例如包含编码、调控、结构和其它序列)的长度。位于编码区5'并且存在于mRNA上的序列称为5'非翻译或未翻译序列。位于编码区3'或下游并且存在于mRNA上的序列称为3'非翻译或3'未翻译序列。术语“基因”涵盖基因的cDNA与基因组形式。在一些生物体(例如真核生物)中,基因的基因组形式或克隆含有被称为“内含子”或“插入区”或“插入序列”的非编码序列中断的编码区。内含子是转录成核RNA(hnRNA)的基因区段;内含子可以含有调控元件,例如增强子。内含子从核转录本或初级转录本中移出或“剪除”;因此,在信使RNA(mRNA)转录本中不存在内含子。mRNA在翻译期间发挥作用,以指定新生多肽中氨基酸的序列或次序。
除含有内含子外,基因的基因组形式还可以包括位于RNA转录本上存在的序列的5'和3'末端的序列。这些序列被称为“侧接”序列或区域(这些侧接序列位于mRNA转录本上存在的非翻译序列的5'或3')。5'侧接区域可以含有调控序列,例如启动子和强化子,其控制或影响基因的转录。3'侧接区域可以含有指导转录终止、转录后裂解和多腺苷酸化的序列。
在提及基因时术语“野生型”是指具有从天然存在的来源分离的基因特征的基因。在提及基因产物时术语“野生型”是指具有从天然存在的来源分离的基因产物特征的基因产物。如应用于物体的术语“天然存在”是指可以在自然界中发现物体的事实。例如,存在于生物体(包括病毒)中的可以从自然界来源分离并且未经实验室人员有意修饰的多肽或多核苷酸序列是天然存在的。野生型基因通常是在群体中最常观察到的基因或等位基因,因此被任意指定为基因的“正常”或“野生型”形式。相比之下,在提及基因或基因产物时术语“修饰的”或“突变的”分别是指与野生型基因或基因产物相比显示序列和/或功能特性修饰(例如特征改变)的基因或基因产物。注意,可以分离天然存在的突变体;这些通过它们与野生型基因或基因产物相比特征改变的事实来鉴定。
术语“等位基因”是指基因的变异;所述变异包括但不限于变体和突变体、多态基因座和单核苷酸多态基因座、移码和剪接突变。等位基因可能在群体中天然存在,或者其可能在群体中任何特定个体的一生中出现。
因此,在提及核苷酸序列时使用时术语“变体”和“突变体”是指与另一个通常相关的核苷酸序列相差一个或多个核苷酸的核酸序列。“变异”是两个不同核苷酸序列之间的差异;典型地,一个序列是参考序列。
“扩增”是涉及模板特异性的核酸复制的特定情况。其与非特异性模板复制(例如依赖用模板但不依赖于特定模板的复制)形成对比。在这里模板特异性不同于复制保真度(例如合成适当多核苷酸序列)和核苷酸(核糖或脱氧核糖)特异性。模板特异性常根据“靶标”特异性来描述。在设法从其它核酸中分选出来的意义上,靶序列是“靶标”。扩增技术主要是为这种分选而设计的。
在核酸背景下术语“扩增(amplifying或amplification)”是指典型地从少量多核苷酸(例如单个多核苷酸分子)开始,产生多拷贝的多核苷酸或多核苷酸的一部分,其中扩增产物或扩增子一般是可检测的。多核苷酸的扩增涵盖多种化学和酶促过程。在聚合酶链式反应(PCR)或连接酶链式反应(LCR;参见例如美国专利No.5,494,810;以引用的方式整体并入本文中)期间从靶标或模板DNA分子的一个或几个拷贝产生多个DNA拷贝是扩增的形式。另外类型的扩增包括(但不限于)等位基因特异性PCR(参见例如美国专利No.5,639,611;以引用的方式整体并入本文中)、装配PCR(参见例如美国专利No.5,965,408;以引用的方式整体并入本文中)、解旋酶依赖性扩增(参见例如美国专利No.7,662,594;以引用的方式整体并入本文中)、热启动PCR(参见例如美国专利No.5,773,258和5,338,671;各以引用的方式整体并入本文中)、序列间特异性PCR、反向PCR(参见例如Triglia等人(1988)Nucleic Acids Res.,16:8186;以引用的方式整体并入本文中)、连接介导的PCR(参见例如Guilfoyle,R.等人,Nucleic Acids Research,25:1854-1858(1997);美国专利No.5,508,169;各以引用的方式整体并入本文中)、甲基化特异性PCR(参见例如Herman等人,(1996)PNAS 93(13)9821-9826;以引用的方式整体并入本文中)、微型引物PCR、多重连接依赖性探针扩增(参见例如Schouten等人,(2002)Nucleic Acids Research 30(12):e57;以引用的方式整体并入本文中)、多重PCR(参见例如Chamberlain等人,(1988)Nucleic AcidsResearch 16(23)11141-11156;Ballabio等人,(1990)Human Genetics 84(6)571-573;Hayden等人,(2008)BMC Genetics 9:80;各以引用的方式整体并入本文中)、巢式PCR、重叠延伸PCR(参见例如Higuchi等人,(1988)Nucleic Acids Research 16(15)7351-7367;以引用的方式整体并入本文中)、实时PCR(参见例如Higuchi等人,(1992)Biotechnology 10:413-417;Higuchi等人,(1993)Biotechnology 11:1026-1030;各以引用的方式整体并入本文中)、逆转录PCR(参见例如Bustin,S.A.(2000)J.Molecular Endocrinology 25:169-193;以引用的方式整体并入本文中)、固相PCR、热不对称交错PCR和降落PCR(参见例如Don等人,Nucleic Acids Research(1991)19(14)4008;Roux,K.(1994)Biotechniques 16(5)812-814;Hecker等人,(1996)Biotechniques 20(3)478-485;各以引用的方式整体并入本文中)。多核苷酸扩增也可以使用数字PCR来完成(参见例如Kalinina等人,Nucleic AcidsResearch.25;1999-2004,(1997);Vogelstein和Kinzler,Proc Natl Acad Sci USA.96;9236-41,(1999);国际专利公布No.WO05023091A2;美国专利申请公布No.20070202525;各以引用的方式整体并入本文中)。
术语“聚合酶链式反应”(“PCR”)是指K.B.Mullis的美国专利No.4,683,195、4,683,202和4,965,188的方法,其描述了一种增加基因组或其它DNA或RNA的混合物中的靶序列区段的浓度的方法,不进行克隆或纯化。这种扩增靶序列的过程由以下组成:将大量过量的两种寡核苷酸引物引入含有所需靶序列的DNA混合物中,接着在DNA聚合酶存在下进行精确的热循环序列。两种引物与它们各自的双链靶序列的链互补。为了实现扩增,使混合物变性,然后使引物与它们在靶分子内的互补序列退火。在退火之后,将引物用聚合酶延伸以便形成一对新的互补链。变性、引物退火和聚合酶延伸的步骤可以重复多次(即,变性、退火和延伸构成一个“循环”;可以存在多个“循环”)以获得高浓度的所需靶序列的扩增区段。所需靶序列的扩增区段的长度由引物彼此之间的相对位置决定,因此,该长度是一个可控参数。由于所述过程的重复方面,所述方法称为“聚合酶链式反应”(“PCR”)。因为靶序列的所需扩增区段变成混合物中的主要序列(根据浓度),所以它们被称为“PCR扩增”并且是“PCR产物”或“扩增子”。本领域的技术人员将理解,术语“PCR”涵盖使用例如实时PCR、巢式PCR、逆转录PCR(RT-PCR)、单引物和随机引物PCR等最初描述的方法的许多变体。
大部分扩增技术是通过选择酶来实现模板特异性的。扩增酶是在使用它们的条件下将仅加工核酸的异质混合物中的特定核酸序列的酶。例如,在Q-β复制酶的情况下,MDV-1RNA是复制酶的特定模板(Kacian等人,Proc.Natl.Acad.Sci.USA,69:3038[1972])。其它核酸不会被这种扩增酶复制。类似地,在T7 RNA聚合酶的情况下,这种扩增酶对其自身的启动子具有严格的特异性(Chamberlin等人,Nature,228:227[1970])。在T4 DNA连接酶的情况下,酶不会连接两种寡核苷酸或多核苷酸,其中寡核苷酸或多核苷酸底物与模板之间在连接点处存在错配(Wu和Wallace(1989)Genomics 4:560)。最终,发现依赖于热稳定模板的DNA聚合酶(例如Taq和Pfu DNA聚合酶)由于它们能够在高温下发挥作用,而对由引物限制并因此由引物界定的序列显示高特异性;高温产生有利于引物与靶序列杂交而不利于与非靶序列杂交的热力学条件(H.A.Erlich(编辑),PCR Technology,Stockton Press[1989])。
如本文所用,术语“核酸检测测定”是指测定感兴趣核酸的核苷酸组成的任何方法。核酸检测测定包括但不限于DNA测序法、探针杂交法、结构特异性裂解测定(例如INVADER测定(Hologic公司),并描述于例如美国专利No.5,846,717、5,985,557、5,994,069、6,001,567、6,090,543和6,872,816;Lyamichev等人,Nat.Biotech.,17:292(1999);Hall等人,PNAS,USA,97:8272(2000)和美国专利No.9,096,893,各以引用的方式整体并入本文中以达成所有目的);酶错配裂解法(例如Variagenics,美国专利No.6,110,684、5,958,692、5,851,770,以引用的方式整体并入本文中);上述聚合酶链式反应(PCR);分支杂交法(例如Chiron,美国专利No.5,849,481、5,710,264、5,124,246和5,624,802,以引用的方式整体并入本文中);滚环复制(例如美国专利No.6,210,884、6,183,960和6,235,502,以引用的方式整体并入本文中);NASBA(例如美国专利No.5,409,818,以引用的方式整体并入本文中);分子信标技术(例如美国专利No.6,150,097,以引用的方式整体并入本文中);电子传感器技术(Motorola,美国专利No.6,248,229、6,221,583、6,013,170和6,063,573,以引用的方式整体并入本文中);循环探针技术(例如美国专利No.5,403,711、5,011,769和5,660,988,以引用的方式整体并入本文中);Dade Behring信号放大法(例如美国专利No.6,121,001、6,110,677、5,914,230、5,882,867和5,792,614,以引用的方式整体并入本文中);连接酶链式反应(例如Baranay Proc.Natl.Acad.Sci USA 88,189-93(1991));和夹心杂交法(例如美国专利No.5,288,609,以引用的方式整体并入本文中)。
术语“可扩增核酸”是指可以通过任何扩增方法扩增的核酸。预期“可扩增核酸”通常包含“样品模板”。
术语“样品模板”是指源自针对“靶标”(定义如下)的存在进行分析的样品的核酸。相反,“背景模板”用于指代样品中可能存在或不存在的除样品模板以外的核酸。背景模板通常是无意的。它可能是交叉污染的结果,或者可能是由于存在试图从样品中净化掉的核酸污染物。例如,来自生物体的除待检测核酸之外的核酸可能作为测试样品中的背景存在。
术语“引物”是指当置于诱导与核酸模板链互补的引物延伸产物合成的条件下(例如在核苷酸和诱导剂如DNA聚合酶存在下以及在合适温度和pH值下)时能够充当合成起始点的寡核苷酸,无论天然存在,如例如来自限制消化液的核酸片段,还是合成产生。引物优选是单链的,以获得最大的扩增效率,但也可以是双链的。如果是双链,那么引物在用于制备延伸产物之前首先进行处理以分离其链。优选地,引物是寡脱氧核糖核苷酸。引物必须足够长以在诱导剂存在下引发延伸产物的合成。引物的确切长度取决于许多因素,包括温度、引物来源和方法的使用。
术语“探针”是指能够与另一感兴趣寡核苷酸杂交的寡核苷酸(例如核苷酸序列),无论天然存在,如纯化的限制消化液中,还是合成、重组或通过PCR扩增产生。探针可以是单链或双链的。探针可用于检测、鉴定和分离特定基因序列(例如,“捕获探针”)。预期本发明中使用的任何探针在一些实施方案中都可以用任何“报告分子”标记,以便在任何检测系统中可检测,包括但不限于酶(例如,ELISA,以及基于酶的组织化学分析)、荧光、放射性和发光系统。并不意图将本发明限于任何特定的检测系统或标记。
如本文所用,术语“靶标”是指设法例如通过探针结合、扩增、分离、捕获等从其它核酸中分选出的核酸。例如,当用于聚合酶链式反应时,“靶标”是指由用于聚合酶链式反应的引物结合的核酸区域,而当用于不扩增靶DNA的测定时,例如在侵入性裂解测定的一些实施方案中,靶标包括探针和侵入性寡核苷酸(例如,INVADER寡核苷酸)结合形成侵入性裂解结构的位点,以便可以检测到靶核酸的存在。“区段”定义为靶序列内的核酸区域。
如本文所用,“甲基化”是指胞嘧啶的C5或N4位置的胞嘧啶甲基化、腺嘌呤的N6位置或其它类型的核酸甲基化。体外扩增的DNA通常未甲基化,因为典型的体外DNA扩增方法不会保留扩增模板的甲基化模式。然而,“未甲基化的DNA”或“甲基化的DNA”也可以分别指原始模板未甲基化或甲基化的扩增DNA。
因此,如本文所用,“甲基化核苷酸”或“甲基化核苷酸碱基”是指核苷酸碱基上存在甲基部分,其中甲基部分不存在于公认的典型核苷酸碱基中。例如,胞嘧啶在其嘧啶环上不含甲基部分,但5-甲基胞嘧啶在其嘧啶环的5位含有甲基部分。因此,胞嘧啶不是甲基化核苷酸,5-甲基胞嘧啶是甲基化核苷酸。在另一个实例中,胸腺嘧啶在其嘧啶环的5位含有甲基部分;然而,就本文而言,当存在于DNA中时,胸腺嘧啶不被视为甲基化核苷酸,因为胸腺嘧啶是DNA的典型核苷酸碱基。
如本文所用,“甲基化核酸分子”是指含有一个或多个甲基化核苷酸的核酸分子。
如本文所用,核酸分子的“甲基化状态”、“甲基化概况”和“甲基化状况”是指核酸分子中一个或多个甲基化核苷酸碱基的存在或不存在。例如,含有甲基化胞嘧啶的核酸分子被认为是甲基化的(例如,核酸分子的甲基化状态是甲基化的)。不含任何甲基化核苷酸的核酸分子被认为是未甲基化的。
特定核酸序列(例如,如本文所述的基因标志物或DNA区域)的甲基化状态可以指示序列中每个碱基的甲基化状态,或者可以指示序列内碱基子集(例如,一个或多个胞嘧啶)的甲基化状态,或者可以指示关于序列内区域甲基化密度的信息,提供或不提供序列内发生甲基化的位置的精确信息。
核酸分子中核苷酸基因座的甲基化状态是指核酸分子中特定基因座处甲基化核苷酸的存在或不存在。例如,当核酸分子中第7个核苷酸处存在的核苷酸为5-甲基胞嘧啶时,核酸分子中第7个核苷酸处胞嘧啶的甲基化状态是甲基化的。类似地,当核酸分子中第7个核苷酸处存在的核苷酸为胞嘧啶(而非5-甲基胞嘧啶)时,核酸分子中第7个核苷酸处胞嘧啶的甲基化状态是未甲基化的。
甲基化状况可以任选地由“甲基化值”(例如,代表甲基化频率、分数、比率、百分比等)表示或指示。例如,可以通过量化在用甲基化依赖性限制酶进行限制性消化后完整核酸的量,或通过比较亚硫酸氢盐反应后的扩增概况,或通过比较经过亚硫酸氢盐处理和未处理的核酸的序列来产生甲基化值。因此,值,例如甲基化值,代表甲基化状况并且因此可以用作跨基因座的多个拷贝的甲基化状况的定量指标。当需要将样品中序列的甲基化状况与阈值或参考值进行比较时,这特别有用。
如本文所用,“甲基化频率”或“甲基化百分比(%)”是指分子或基因座被甲基化的实例数相对于分子或基因座未甲基化的实例数。
因此,甲基化状态描述了核酸(例如,基因组序列)的甲基化状态。此外,甲基化状态是指与甲基化相关的特定基因组基因座处的核酸区段的特征。这类特征包括但不限于,该DNA序列中的任何胞嘧啶(C)残基是否被甲基化、甲基化C残基的位置、甲基化C在核酸任何特定区域中的频率或百分比,以及由于例如等位基因来源的差异而导致的甲基化的等位基因差异。术语“甲基化状态”、“甲基化概况”和“甲基化状况”还指生物样品中核酸的任何特定区域中甲基化C或未甲基化C的相对浓度、绝对浓度或模式。例如,如果核酸序列内的胞嘧啶(C)残基被甲基化,那么可以将其称为“高甲基化”或“甲基化增加”,而如果DNA序列内的胞嘧啶(C)残基未甲基化,那么可以将其称为“低甲基化”或“甲基化降低”。同样,如果与另一核酸序列(例如,来自不同区域或来自不同个体等)相比,核酸序列内的胞嘧啶(C)残基被甲基化,那么认为该序列与其它核酸序列相比是高甲基化的或甲基化增加。可替代地,如果与另一核酸序列(例如,来自不同区域或来自不同个体等)相比,DNA序列内的胞嘧啶(C)残基未被甲基化,那么认为该序列与其它核酸序列相比是低甲基化的或甲基化降低。此外,如本文所用的术语“甲基化模式”是指核酸区域上甲基化和未甲基化核苷酸的集合位点。当整个区域中甲基化和未甲基化核苷酸的数量相同或相似但甲基化和未甲基化核苷酸的位置不同时,两个核酸可能具有相同或相似的甲基化频率或甲基化百分比但具有不同的甲基化模式。当序列的甲基化程度(例如一个的甲基化相对于另一个增加或减少)、频率或模式时有差异时,称其为“差异甲基化”或具有“甲基化差异”或具有“不同甲基化状态”。术语“差异甲基化”是指与癌症阴性样品中的核酸甲基化水平或模式相比,癌症阳性样品中的核酸甲基化水平或模式的差异。它还可能指手术后癌症复发的患者与未复发的患者之间水平或模式的差异。差异甲基化和DNA甲基化的特定水平或模式是预后和预测性生物标志物,例如,一旦确定了正确的截止或预测特征。
甲基化状态频率可以用于描述个体群体或来自单一个体的样品。例如,甲基化状态频率为50%的核苷酸基因座在50%的情况下被甲基化,在50%的情况下未甲基化。例如,这种频率可以用于描述个体群体或一批核酸中核苷酸基因座或核酸区域被甲基化的程度。因此,当核酸分子的第一个群体或库中的甲基化不同于核酸分子的第二个群体或库中的甲基化时,第一个群体或库的甲基化状态频率将不同于第二个群体或库的甲基化状态频率。例如,这种频率还可以用于描述单一个体中核苷酸基因座或核酸区域被甲基化的程度。例如,这种频率可以用于描述来自组织样品的一组细胞在核苷酸基因座或核酸区域被甲基化或未甲基化的程度。
如本文所用,“核苷酸基因座”是指核苷酸在核酸分子中的位置。甲基化核苷酸的核苷酸基因座是指甲基化核苷酸在核酸分子中的位置。
典型地,人类DNA的甲基化发生在包括相邻鸟嘌呤和胞嘧啶的二核苷酸序列上,其中胞嘧啶位于鸟嘌呤的5'(也称为CpG二核苷酸序列)。CpG二核苷酸内的大多数胞嘧啶在人类基因组中被甲基化,但是一些在特定的富含CpG二核苷酸的基因组区域(称为CpG岛)中保持未甲基化(参见例如Antequera等人(1990)Cell 62:503-514)。
如本文所用,“CpG岛”是指基因组DNA的富含G:C的区域,其含有相对于总基因组DNA数量增加的CpG二核苷酸。CpG岛的长度可以是至少100、200或更多个碱基对,其中该区域的G:C含量至少为50%,并且观察CpG频率与预期频率的比率为0.6;在某些情况下,CpG岛的长度可以为至少500个碱基对,其中该区域的G:C含量至少为55%并且观察CpG频率与预期频率的比率为0.65。可以根据Gardiner-Garden等人(1987)J.Mol.Biol.196:261-281中提供的方法计算相比于预期频率的观察CpG频率。例如,相比于预期频率的观察CpG频率可以根据公式R=(A×B)/(C×D)计算,其中R是观察CpG频率与预期频率的比值,A是分析序列中的CpG二核苷酸的数量,B是分析序列中的核苷酸总数,C是分析序列中的C核苷酸总数,D是分析序列中的G核苷酸总数。典型地在CpG岛中,例如在启动子区域确定甲基化状态。应了解尽管人类基因组中的其它序列易于发生DNA甲基化,例如CpA和CpT(参见Ramsahoye(2000)Proc.Natl.Acad.Sci.USA 97:5237-5242;Salmon和Kaye(1970)Biochim.Biophys.Acta.204:340-351;Grafstrom(1985)Nucleic Acids Res.13:2827-2842;Nyce(1986)Nucleic Acids Res.14:4353-4367;Woodcock(1987)Biochem.Biophys.Res.Commun.145:888-894)。
如本文所用,“甲基化特异性试剂”是指根据核酸分子的甲基化状态修饰核酸分子的核苷酸的试剂,或甲基化特异性试剂是指能够以反映核酸分子的甲基化状态的方式改变核酸分子的核苷酸序列的化合物或组合物或其它剂。用这种试剂处理核酸分子的方法可以包括使核酸分子与试剂接触,如果需要,再加上额外的步骤,以实现核苷酸序列的所需改变。这类方法可以以将未甲基化的核苷酸(例如,每个未甲基化的胞嘧啶)修饰成不同核苷酸的方式应用。例如,在一些实施方案中,这种试剂可以使未甲基化的胞嘧啶核苷酸脱氨基,产生脱氧尿嘧啶残基。这种试剂的实例包括但不限于甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂。
甲基化特异性试剂对核酸核苷酸序列的改变也可能产生每个甲基化核苷酸被修饰为不同的核苷酸的核酸分子。
术语“甲基化测定”是指用于确定核酸序列内的一个或多个CpG二核苷酸序列的甲基化状态的任何测定。
术语“MS AP-PCR”(甲基化敏感性随机引物聚合酶链式反应)是指本领域公认的技术,这项技术允许使用富含CG的引物对基因组进行全局扫描,重点关注最有可能含有CpG二核苷酸的区域,并由Gonzalgo等人(1997)Cancer Research 57:594-599描述。
术语“MethyLightTM”是指Eads等人(1999)Cancer Res.59:2302-2306描述的本领域公认的基于荧光的实时PCR技术。
术语“HeavyMethylTM”是指一种测定,其中覆盖扩增引物之间的CpG位置或被扩增引物覆盖的甲基化特异性阻断探针(本文也称为阻断剂)能够实现核酸样品的甲基化特异性选择性扩增。
术语“HeavyMethylTMMethyLightTM”测定是指HeavyMethylTMMethyLightTM测定,它是MethyLightTM测定的变体,其中MethyLightTM测定与覆盖扩增引物之间的CpG位置的甲基化特异性阻断探针组合。
术语“Ms-SNuPE”(甲基化敏感性单核苷酸引物延伸)是指由Gonzalgo和Jones(1997)Nucleic Acids Res.25:2529-2531描述的本领域公认的测定。
术语“MSP”(甲基化特异性PCR)是指由Herman等人(1996)Proc.Natl.Acad.Sci.USA 93:9821-9826和由美国专利No.5,786,146描述的本领域公认的甲基化测定。
术语“COBRA”(联合亚硫酸氢盐限制分析)是指由Xiong和Laird(1997)NucleicAcids Res.25:2532-2534描述的本领域公认的甲基化测定。
术语“MCA”(甲基化CpG岛扩增)是指由Toyota等人(1999)Cancer Res.59:2307-12和WO 00/26401A1中描述的甲基化测定。
如本文所用,“选定核苷酸”是指核酸分子中四种典型存在的核苷酸中的一种核苷酸(DNA为C、G、T和A,RNA为C、G、U和A),并且可以包括典型存在的核苷酸的甲基化衍生物(例如,当C是选定核苷酸时,甲基化和未甲基化的C都包括在选定核苷酸的含义内),而甲基化的选定核苷酸特指甲基化的典型存在的核苷酸并且未甲基化的选定核苷酸特指未甲基化的典型存在的核苷酸。
术语“甲基化特异性限制酶”是指根据核酸识别位点的甲基化状态选择性消化核酸的限制酶。在识别位点未甲基化或半甲基化下特异性切割的限制酶的情况下(甲基化敏感性酶),如果在一条或两条链上识别位点甲基化,那么切割不会发生。在只有识别位点甲基化时才特异性切割的限制酶的情况下(甲基化依赖性酶),如果识别位点未甲基化,那么切割不会发生(或会发生,但效率显著降低)。优选的是甲基化特异性限制酶,其识别序列含有CG二核苷酸(例如识别序列如CGCG或CCCGGG)。对于一些实施方案进一步优选的是如果该二核苷酸中的胞嘧啶在碳原子C5处被甲基化则不会切割的限制酶。
如本文所用,“不同核苷酸”是指化学上与选定核苷酸不同的核苷酸,通常使得不同核苷酸具有不同于选定核苷酸的沃森-克里克碱基配对(Watson-Crick base-pairing)特性,其中与选定核苷酸互补的典型存在的核苷酸不同于与不同核苷酸互补的典型存在的核苷酸。例如,当C是选定核苷酸时,U或T可以是不同核苷酸,例如C与G的互补性和U或T与A的互补性。如本文所用,与选定核苷酸互补或与不同核苷酸互补的核苷酸是指在高严格条件下以比互补核苷酸与四种典型存在的核苷酸中的三种进行碱基配对高的亲和力与选定核苷酸或不同核苷酸进行碱基配对的核苷酸。互补性的一个实例是DNA(例如A-T和C-G)和RNA(例如A-U和C-G)中的沃森-克里克碱基配对。因此,例如,在高严格条件下,G与C碱基配对的亲和力高于G与G、A或T碱基配对,因此,当C是选定核苷酸时,G是与选定核苷酸互补的核苷酸。
如本文所用,给定标志物(或一起使用的标志物组)的“灵敏度”是指报告DNA甲基化值高于区分赘生物与非赘生物样品的阈值的样品的百分比。在一些实施方案中,阳性定义为报告DNA甲基化值高于阈值(例如,与疾病相关的范围)的组织学确认的瘤形成,并且假阴性定义为报告DNA甲基化值低于阈值(例如,与无疾病相关的范围)的组织学确认的瘤形成。因此,灵敏度值反映了从已知患病样品获得的给定标志物的DNA甲基化测量值在疾病相关测量值范围内的概率。如这里所定义,计算出的灵敏度值的临床相关性表示对当将给定标志物应用于患有临床疾患的受试者时将检测到该疾患存在的概率的估计。
如本文所用,给定标志物(或一起使用的标志物组)的“特异性”是指报告DNA甲基化值高于区分赘生物与非赘生物样品的阈值的非赘生物样品的百分比。在一些实施方案中,阴性定义为报告DNA甲基化值低于阈值(例如,与无疾病相关的范围)的组织学确认的非赘生物样品,并且假阳性定义为报告DNA甲基化值高于阈值(例如,与疾病相关的范围)的组织学确认的非赘生物样品。因此,特异性值反映了从已知非赘生物样品获得的给定标志物的DNA甲基化测量值在非疾病相关测量值范围内的概率。如这里所定义,计算出的特异性值的临床相关性表示对当将给定标志物应用于未患临床疾患的受试者时将检测到该疾患不存在的概率的估计。
如本文所用,术语“AUC”是“曲线下面积”的缩写。其尤其是指接受者操作特征(ROC)曲线下面积。ROC曲线是针对诊断测试的不同可能切点的真阳性率与假阳性率的关系图。它显示了取决于所选切点的灵敏度与特异性之间的平衡(灵敏度的任何增加都将伴随着特异性的降低)。ROC曲线下面积(AUC)是衡量诊断测试准确性的量度(面积越大越好;最佳值为1;随机测试的ROC曲线位于对角线上,面积为0.5;参考:J.P.Egan.(1975)SignalDetection Theory and ROC Analysis,Academic Press,New York)。
如本文所用,术语“赘生物”是指组织的任何新的异常生长。因此,赘生物可以是癌前赘生物或恶性赘生物。
如本文所用,术语“赘生物特异性标志物”是指可用于指示赘生物存在的任何生物物质或要素。生物物质的实例包括但不限于核酸、多肽、碳水化合物、脂肪酸、细胞成分(例如细胞膜和线粒体)和全细胞。在一些情况下,标志物是特定核酸区域(例如,基因、基因内区域、特定基因座等)。作为标志物的核酸区域可称为例如“标志基因”、“标志物区域”、“标志序列”、“标志基因座”等。
如本文所用,术语“腺瘤”是指腺来源的良性肿瘤。虽然这些生长是良性的,但随着时间的推移,它们可能会发展为恶性。
术语“癌前”或“赘生物前”和其等同术语是指任何正在发生恶性转化的细胞增殖性疾病。
赘生物、腺瘤、癌症等的“部位”是受试者体内赘生物、腺瘤、癌症等所在的组织、器官、细胞类型、解剖区域、身体部位等。
如本文所用,“诊断”测试应用包括检测或鉴定受试者的疾病状态或疾患,确定受试者感染给定疾病或疾患的可能性,确定患有疾病或疾患的受试者将对疗法作出反应的可能性,确定患有疾病或疾患的受试者的预后(或其可能的进展或消退),以及确定治疗对患有疾病或疾患的受试者的影响。例如,诊断可用于检测受试者感染赘生物的存在或可能性,或这类受试者将对化合物(例如药品,例如药物)或其它治疗产生有利反应的可能性。
术语“分离的”如在“分离的寡核苷酸”中当与核酸相关使用时是指从至少一种在天然来源中通常相关联的污染核酸中鉴定并分离的核酸序列。分离的核酸以不同于在自然界中发现的形式或设置存在。相比之下,未分离的核酸,如DNA和RNA,在它们存在于自然界中的状态下被发现。未分离的核酸的实例包括:在宿主细胞染色体上与邻近基因相邻的给定DNA序列(例如,基因);RNA序列,例如编码特定蛋白质的特定mRNA序列,在细胞中发现其呈与许多其它编码多种蛋白质的mRNA的混合物。然而,编码特定蛋白质的分离的核酸包括例如在通常表达蛋白质的细胞中的这种核酸,其中该核酸在与天然细胞不同的染色体位置中,或者另外由不同于自然界中发现的核酸侧接。分离的核酸或寡核苷酸可以单链或双链形式存在。当分离的核酸或寡核苷酸用于表达蛋白质时,该寡核苷酸将至少包含有义链或编码链(即寡核苷酸可以是单链的),但可以同时含有有义链和反义链(即,寡核苷酸可以是双链的)。分离的核酸在从其天然或典型环境分离后,可以与其它核酸或分子组合。例如,分离的核酸可以存在于宿主细胞中,在该宿主细胞中放置该核酸,例如用于异源表达。
术语“纯化的”是指从其天然环境中移出、分离或分离出的分子,核酸或氨基酸序列。因此,“分离的核酸序列”可以是纯化的核酸序列。“基本上纯化的”分子至少60%不含,优选至少75%不含,更优选至少90%不含与它们天然相关的其它组分。如本文所用,术语“纯化的”或“进行纯化”还指从样品中去除污染物。污染蛋白质的去除引起样品中感兴趣的多肽或核酸的百分比增加。在另一个实例中,重组多肽在植物、细菌、酵母或哺乳动物宿主细胞中表达,并且通过去除宿主细胞蛋白质来纯化多肽;从而增加了样品中重组多肽的百分比。
术语“包含”给定多核苷酸序列或多肽的“组合物”泛指含有给定多核苷酸序列或多肽的任何组合物。该组合物可包含含有盐(例如NaCl)、去污剂(例如SDS)和其它组分(例如登哈特溶液(Denhardt’ssolution)、奶粉、鲑鱼精DNA等)的水溶液。
术语“样品”以其最广泛的含义使用。在某种意义上,它可以指动物细胞或组织。在另一种意义上,它是指从任何来源获得的样本或培养物,以及生物和环境样品。生物样品可以从植物或动物(包括人类)获得,并且涵盖流体、固体、组织和气体。环境样品包括环境材料,例如表面物质、土壤、水和工业样品。这些实例不应被解释为限制适用于本发明的样品类型。
如本文所用,在一些情况下使用的“远程样品”涉及从不是样品的细胞、组织或器官来源的部位间接收集的样品。
如本文所用,术语“患者”或“受试者”是指要经受这项技术提供的各种测试的生物体。术语“受试者”包括动物,优选哺乳动物,包括人。在一个优选的实施方案中,受试者是灵长类动物。在一个更优选的实施方案中,受试者是人。进一步关于诊断方法,优选的受试者是脊椎动物受试者。优选的脊椎动物是温血动物;优选的温血脊椎动物是哺乳动物。优选的哺乳动物最优选是人。如本文所用,术语“受试者”包括人和动物受试者。因此,本文提供了兽医治疗用途。因此,本发明的技术提供了对哺乳动物(例如人类)以及以下动物的诊断:那些因濒危而重要的哺乳动物(例如东北虎);具有经济重要性的动物,例如在农场饲养供人类食用的动物;和/或对人类具有社会重要性的动物,例如作为宠物或在动物园饲养的动物。这种动物的实例包括但不限于:食肉动物,例如猫和狗;猪科动物,包括猪、肉猪和野猪;反刍动物和/或有蹄类动物,如牛、公牛、绵羊、长颈鹿、鹿、山羊、野牛和骆驼;鳍足类动物;和马。因此,还提供了家畜的诊断和治疗,包括但不限于家养猪、反刍动物、有蹄类动物、马(包括赛马)等。当前公开的主题还包括用于诊断受试者的肺癌的系统。例如,该系统可作为市售试剂盒提供,该试剂盒可用于筛查已收集生物样品的受试者患肺癌的风险或诊断其患肺癌。根据本发明的技术提供的示例性系统包括评估本文所述的标志物的甲基化状态。
如本文所用,术语“试剂盒”是指递送材料的任何递送系统。在反应测定的情况下,这类递送系统包括允许存储反应试剂(例如适当容器中的寡核苷酸、酶等)和/或支持材料(例如,缓冲液、关于进行测定的书面说明书等)、将其从一个位置运输或递送至另一个位置的系统。例如,试剂盒包括含有相关反应试剂和/或支持材料的一个或多个外壳(例如,盒)。如本文使用,术语“零散试剂盒”是指包括两个或更多个单独容器的递送系统,每个容器含有全部试剂盒组分的子部分。这些容器可共同或单独递送至预定接受者。例如,第一个容器可含有用于测定中的酶,而第二个容器含有寡核苷酸。术语“零散试剂盒”意图涵盖含有受联邦食品、药品和化妆品法案第520(e)节监管的分析物特定试剂(ASR)的试剂盒,但不限于此。事实上,包含各自含有全部试剂盒组分的子部分的两个或更多个单独容器的任何递送系统均包括在术语“零散试剂盒”中。相比之下,“组合试剂盒”是指在单一容器中(例如,容纳每个所需组分的单一盒中)含有反应测定的所有组分的递送系统。术语“试剂盒”包括零散试剂盒和组合试剂盒。
如本文所用,术语“信息”是指任何事实或数据的集合。在提及使用计算机系统(包括但不限于互联网)存储或处理的信息时,该术语是指以任何格式(例如,模拟、数字、光学等)存储的任何数据。如本文所用,术语“与受试者相关的信息”是指与受试者(例如,人、植物或动物)有关的事实或数据。术语“基因组信息”是指与基因组有关的信息,包括但不限于核酸序列、基因、甲基化百分比、等位基因频率、RNA表达水平、蛋白质表达、与基因型相关的表型等。“等位基因频率信息”是指与等位基因频率有关的事实或数据,包括但不限于等位基因身份、等位基因的存在与受试者(例如人类受试者)的一种特征之间的统计相关性、个体或群体中等位基因的存在或不存在、在具有一种或多种特定特征的个体中存在等位基因的可能性百分比等。
具体实施方式
在各种实施方案的详细描述中,为了解释的目的,阐述了许多具体细节以提供对所公开的实施方案的透彻理解。然而,本领域技术人员将理解,可以在有或没有这些具体细节的情况下实践这些各种实施方案。在其它情况下,结构和装置以框图形式展示。此外,本领域技术人员可以容易地理解,其中呈现和执行方法的特定顺序是例示性的,并且预期这些顺序可以变化并且仍然保持在本文公开的各种实施方案的精神和范围内。
本文提供了筛查EC的技术,并且特别但不仅仅是检测EC和/或EC特定形式(例如透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)的存在的方法、组合物和相关用途。如这项技术在本文中所描述,使用的章节标题仅仅是出于组织的目的,而不应视为以任何方式限制主题。
实际上,如实施例1、2和3中所述,在本发明的实施方案的鉴定过程期间进行的实验鉴定了一组499个新颖的差异甲基化区域(DMR),用于区分源自子宫内膜癌的DNA与非赘生物对照DNA。从这499个新颖的DNA甲基化标志物中,进一步的实验鉴定出能够区分不同EC类型与正常子宫内膜组织的标志物。例如,单独的DMR组被确定能够区分1)EC与正常子宫内膜组织;2)透明细胞EC与正常子宫内膜组织;3)浆液性EC与正常子宫内膜组织;4)癌肉瘤EC与正常子宫内膜组织;以及5)子宫内膜样EC与正常子宫内膜组织。
尽管这里的公开内容涉及某些例示的实施方案,但是应当理解,这些实施方案是作为示例而不是作为限制来呈现的。
在具体方面,本发明的技术提供了用于鉴定、确定和/或分类例如EC的癌症的组合物和方法。所述方法包括确定从受试者分离的生物样品(例如,粪便样品、子宫内膜组织样品、血浆样品)中至少一种甲基化标志物的甲基化状况,其中该标志物的甲基化状态的变化指示EC的存在、类别或部位。具体实施方案涉及包含差异甲基化区域(DMR,例如DMR 1-499,参见表1、8和21)的标志物,所述标志物用于诊断(例如筛查)EC和各种EC类型(例如,透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)。
除了分析包含本文所提供和表1、8和21中所列出的DMR(例如DMR,例如DMR 1-499)的至少一种标志物、标志物区域或标志物的碱基的甲基化分析的实施方案以外,这项技术还提供了包含含有DMR的至少一种标志物、标志物区域或标志物的碱基的标志物组,用于检测癌症、尤其是EC。
这项技术的的一些实施方案是基于对包含DMR的至少一种标志物、标志物区域或标志物的碱基的CpG甲基化状况的分析。
在一些实施方案中,本发明的技术提供了以甲基化特异性方式修饰DNA的试剂(例如甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)的用途,所述试剂与一种或多种甲基化测定组合,用于确定包含DMR(例如DMR 1-499,参见表1、8和21)的至少一种标志物内的CpG二核苷酸序列的甲基化状况。基因组CpG二核苷酸可以是甲基化或未甲基化的(可替代地分别称为高甲基化和低甲基化)。然而,本发明的方法适合于分析非均质性的生物样品,例如在偏远样品(例如血液、器官流出物或粪便)的背景内的低浓度的肿瘤细胞或从中获得的生物材料。因此,当分析这类样品内CpG位置的甲基化状况时,可使用定量测定来确定具体CpG位置的甲基化水平(例如百分比、分数、比率、比例或程度)。
根据本发明的技术,对包含DMR的标志物中CpG二核苷酸序列的甲基化状况的确定可用于诊断和表征例如EC的癌症。
标志物的组合
在一些实施方案中,这项技术涉及评估包含来自表1、8和21的DMR(例如DMR编号1-499)的标志物的组合的甲基化状态。在一些实施方案中,评估超过一种标志物的甲基化状态增加用于鉴定受试者中的赘生物(例如EC)的筛查或诊断法的特异性和/或灵敏度。
利用例如如通过与预测特异性和灵敏度有关的统计技术鉴定的标志物的多种组合预测多种癌症。这项技术提供了鉴定一些癌症的预测组合和验证预测组合的方法。
测定甲基化状态的方法
在某些实施方案中,用于分析核酸中5-甲基胞嘧啶的存在的方法涉及用以甲基化特异性方式修饰DNA的试剂处理DNA。这种试剂的实例包括(但不限于)甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂。
常用于分析核酸中5-甲基胞嘧啶的存在的方法是基于Frommer等人描述的用于检测DNA中的5-甲基胞嘧啶的亚硫酸氢盐方法(Frommer等人(1992)Proc.Natl.Acad.Sci.USA89:1827-31,明确地以引用的方式整体并入本文中以达成所有目的)或其变体。定位5-甲基胞嘧啶的亚硫酸氢盐方法是基于如下观测结果:胞嘧啶与亚硫酸氢盐离子(又名亚硫酸氢盐)反应,而5-甲基胞嘧啶不反应。反应通常根据以下步骤进行:首先,胞嘧啶与亚硫酸氢盐反应,形成磺化胞嘧啶。然后,磺化的反应中间体自发脱氨基,产生磺化尿嘧啶。最终,磺化尿嘧啶在碱性条件下脱磺酸,形成尿嘧啶。检测是可能的原因在于尿嘧啶碱基与腺嘌呤配对(因此,行为如胸腺嘧啶一样),而5-甲基胞嘧啶碱基与鸟嘌呤配对(因此,行为如胞嘧啶一样)。这使得通过例如以下区分甲基化胞嘧啶与非甲基化胞嘧啶成为可能:亚硫酸氢盐基因组测序(Grigg G和Clark S,Bioessays(1994)16:431-36;Grigg G,DNA Seq.(1996)6:189-98)、如例如美国专利No.5,786,146中公开的甲基化特异性PCR(MSP)或使用包含序列特异性探针裂解的测定,例如QuARTS瓣状核酸内切酶测定(参见例如Zou等人(2010)“Sensitive quantification of methylated markers with a novel methylationspecific technology”Clin Chem 56:A199;以及美国专利No.8,361,720;8,715,937;8,916,344;和9,212,392。
一些常规技术涉及如下方法,所述方法包括将待分析的DNA封装在琼脂糖基质中,从而防止DNA的扩散和复性(亚硫酸氢盐仅与单链DNA反应),并用快速透析代替沉淀和纯化步骤(Olek A等人,(1996)“A modified and improved method for bisulfite basedcytosine methylation analysis”Nucleic Acids Res.24:5064-6)。因此可以分析单个细胞的甲基化状况,这说明了该方法的实用性和灵敏度。Rein,T.等人,(1998)Nucleic AcidsRes.26:2255概述了检测5-甲基胞嘧啶的常规方法。
亚硫酸氢盐技术典型地包括在亚硫酸氢盐处理后扩增已知核酸的短的特定片段,然后通过测序(Olek和Walter(1997)Nat.Genet.17:275-6)或引物延伸反应(Gonzalgo和Jones(1997)Nucleic Acids Res.25:2529-31;WO 95/00669;美国专利No.6,251,594)分析产物以分析单个胞嘧啶位置。一些方法使用酶消化(Xiong和Laird(1997)Nucleic AcidsRes.25:2532-4)。本领域也描述了通过杂交进行的检测(Olek等人,WO 99/28498)。此外,已经描述了使用亚硫酸氢盐技术检测单个基因的甲基化(Grigg和Clark(1994)Bioessays16:431-6;Zeschnigk等人(1997)Hum Mol Genet.6:387-95;Feil等人(1994)NucleicAcids Res.22:695;Martin等人(1995)Gene 157:261-4;WO 9746705;WO 9515373)。
根据本发明的技术,各种甲基化测定程序可以与亚硫酸氢盐处理结合使用。这些测定允许确定核酸序列内的一个或多个CpG二核苷酸(例如CpG岛)的甲基化状态。这类测定除其它技术外还涉及经过亚硫酸氢盐处理的核酸的测序、PCR(用于序列特异性扩增)、DNA印迹分析(Southern blot analysis)和甲基化特异性限制酶如甲基化敏感性或甲基化依赖性酶的使用。
例如,通过使用亚硫酸氢盐处理,已简化基因组测序供分析甲基化模式和5-甲基胞嘧啶分布(Frommer等人(1992)Proc.Natl.Acad.Sci.USA 89:1827-1831)。此外,对从经过亚硫酸氢盐转化的DNA扩增的PCR产物的限制酶消化可用于评估甲基化状态,例如,如Sadri和Hornsby(1997)Nucl.Acids Res.24:5058-5059所述或如在称为COBRA(联合亚硫酸氢盐限制分析)的方法中所体现(Xiong和Laird(1997)Nucleic Acids Res.25:2532-2534)。
COBRATM分析是一种定量甲基化测定,可用于确定少量基因组DNA中特定基因座的DNA甲基化水平(Xiong和Laird,Nucleic Acids Res.25:2532-2534,1997)。简单地说,限制酶消化用于揭示经过亚硫酸氢钠处理的DNA的PCR产物的甲基化依赖性序列差异。根据Frommer等人(Proc.Natl.Acad.Sci.USA 89:1827-1831,1992)描述的程序,首先通过标准亚硫酸氢盐处理将甲基化依赖性序列差异引入基因组DNA。然后使用对感兴趣的CpG岛具有特异性的引物对经过亚硫酸氢盐转化的DNA进行PCR扩增,接着进行限制性内切酶消化、凝胶电泳,并使用特定的标记的杂交探针进行检测。原始DNA样品中的甲基化水平由在广泛的DNA甲基化水平范围内呈线性定量方式的消化和未消化的PCR产物的相对量表示。此外,这项技术可以可靠地应用于从显微解剖的石蜡包埋组织样品中获得的DNA。
用于COBRATM分析的典型试剂(例如,可在典型的基于COBRATM的试剂盒中找到)可能包括但不限于:针对特定基因座(例如,特定基因、标志物、DMR、基因区域、标志物区域、经过亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物;限制酶和适当的缓冲液;基因杂交寡核苷酸;对照杂交寡核苷酸;寡核苷酸探针的激酶标记试剂盒;和标记的核苷酸。此外,亚硫酸氢盐转化试剂可能包括:DNA变性缓冲液;磺化缓冲液;DNA回收试剂或试剂盒(如沉淀、超滤、亲和柱);脱磺酸缓冲液;和DNA回收组分。
如“MethyLightTM”(一种基于荧光的实时PCR技术)(Eads等人,Cancer Res.59:2302-2306,1999)、Ms-SNuPETM(甲基化敏感性单核苷酸引物延伸)反应(Gonzalgo和Jones,Nucleic Acids Res.25:2529-2531,1997)、甲基化特异性PCR(“MSP”;Herman等人,Proc.Natl.Acad.Sci.USA 93:9821-9826,1996;美国专利No.5,786,146)和甲基化CpG岛扩增(“MCA”;Toyota等人,Cancer Res.59:2307-12,1999)等测定单独使用或与这些方法中的一种或多种组合使用。
“HeavyMethylTM”测定技术是一种基于经过亚硫酸氢盐处理的DNA的甲基化特异性扩增来评估甲基化差异的定量方法。覆盖扩增引物之间的CpG位置或被扩增引物覆盖的甲基化特异性阻断探针(本文也称为阻断剂)能够实现核酸样品的甲基化特异性选择性扩增。
术语“HeavyMethylTMMethyLightTM”测定是指HeavyMethylTMMethyLightTM测定,它是MethyLightTM测定的变体,其中MethyLightTM测定与覆盖扩增引物之间的CpG位置的甲基化特异性阻断探针组合。HeavyMethylTM测定也可以与甲基化特异性扩增引物结合使用。
用于HeavyMethylTM分析的典型试剂(例如,可在典型的基于MethyLightTM的试剂盒中找到)可以包括但不限于:针对特定基因座(例如,特定基因、标志物、基因区域、标志物区域、经过亚硫酸氢盐处理的DNA序列、CpG岛或经过亚硫酸氢盐处理的DNA序列或CpG岛等)的PCR引物;阻断寡核苷酸;优化的PCR缓冲液和脱氧核苷酸;以及Taq聚合酶。
MSP(甲基化特异性PCR)允许评估CpG岛内几乎任一组CpG位点的甲基化状况,而无需使用甲基化敏感性限制酶(Herman等人Proc.Natl.Acad.Sci.USA 93:9821-9826,1996;美国专利No.5,786,146)。简单地说,亚硫酸氢钠对DNA进行修饰,将未甲基化而非甲基化的胞嘧啶转化为尿嘧啶,随后使用对甲基化与未甲基化DNA具有特异性的引物扩增产物。MSP只需要少量的DNA,对给定CpG岛基因座的0.1%甲基化等位基因敏感,并且可以对从石蜡包埋样品中提取的DNA进行分析。用于MSP分析的典型试剂(例如,可在典型的基于MSP的试剂盒中找到)可以包括但不限于:针对特定基因座(例如,特定基因、标志物、基因区域、标志物区域、经过亚硫酸氢盐处理的DNA序列、CpG岛等)的甲基化和未甲基化PCR引物;优化的PCR缓冲液和脱氧核苷酸;以及特定的探针。
MethyLightTM测定是一种高通量的定量甲基化测定,它利用基于荧光的实时PCR(例如),在PCR步骤后无需进一步操作(Eads等人,Cancer Res.59:2302-2306,1999)。简单地说,MethyLightTM过程从基因组DNA的混合样品开始,该样品在亚硫酸氢钠反应中根据标准程序转化为甲基化依赖性序列差异的混合库(亚硫酸氢盐过程将未甲基化的胞嘧啶残基转化为尿嘧啶)。然后在“偏向”反应中例如使用与已知的CpG二核苷酸重叠的PCR引物进行基于荧光的PCR。序列区分发生在扩增过程的水平和荧光检测过程的水平下。
MethyLightTM测定用作核酸,例如基因组DNA样品中甲基化模式的定量测试,其中序列区分发生在探针杂交水平下。在定量型式中,PCR反应在存在与特定假定甲基化位点重叠的荧光探针的情况下提供甲基化特异性扩增。引物和探针都不覆盖任何CpG二核苷酸的反应提供了对所述量的输入DNA的无偏向控制。可替代地,通过使用不覆盖已知的甲基化位点的对照寡核苷酸(例如,HeavyMethylTM和MSP技术的基于荧光的型式)或使用覆盖潜在甲基化位点的寡核苷酸探测偏向的PCR池,实现基因组甲基化的定性测试。
MethyLightTM过程与任何合适的探针(例如“”探针、探针等)一起使用。例如,在一些应用中,双链基因组DNA用亚硫酸氢钠处理并使用探针,例如使用MSP引物和/或HeavyMethyl阻断剂寡核苷酸和探针进行两组PCR反应中的一组。探针使用荧光“报告基因”和“猝灭剂”分子进行双重标记,并且设计成对相对较高GC含量的区域具有特异性,以便它在PCR循环中比正向或反向引物高约10℃的温度下熔化。这允许探针在PCR退火/延伸步骤期间保持完全杂交。当Taq聚合酶在PCR过程中酶促合成一条新链时,它最终将到达退火的探针。然后,Taq聚合酶5'至3'核酸内切酶活性将置换探针,它是通过消化探针以释放荧光报告分子,从而使用实时荧光检测系统对其现在未淬灭的信号进行定量检测。
用于MethyLightTM分析的典型试剂(例如,可在典型的基于MethyLightTM的试剂盒中找到)可以包括但不限于:针对特定基因座(例如,特定基因、标志物、基因区域、标志物区域、经过亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物;或探针;优化的PCR缓冲液和脱氧核苷酸;以及Taq聚合酶。
QMTM(定量甲基化)测定是基因组DNA样品中甲基化模式的替代定量测试,其中序列区分发生在探针杂交水平下。在这种定量型式中,PCR反应在存在与特定假定甲基化位点重叠的荧光探针的情况下提供无偏向的扩增。引物和探针都不覆盖任何CpG二核苷酸的反应提供了对所述量的输入DNA的无偏向控制。可替代地,通过使用不覆盖已知的甲基化位点的对照寡核苷酸(HeavyMethylTM和MSP技术的基于荧光的型式)或使用覆盖潜在甲基化位点的寡核苷酸探测偏向的PCR池,实现基因组甲基化的定性测试。
在扩增过程中,QMTM过程可以与任何合适的探针,例如“”探针、探针一起使用。例如,双链基因组DNA用亚硫酸氢钠处理,并经受无偏向引物和探针。探针使用荧光“报告基因”和“猝灭剂”分子进行双重标记,并且设计成对相对较高GC含量的区域具有特异性,以便它在PCR循环中比正向或反向引物高约10℃的温度下熔化。这允许探针在PCR退火/延伸步骤期间保持完全杂交。当Taq聚合酶在PCR过程中酶促合成一条新链时,它最终将到达退火的探针。然后,Taq聚合酶5'至3'核酸内切酶活性将置换探针,它是通过消化探针以释放荧光报告分子,从而使用实时荧光检测系统对其现在未淬灭的信号进行定量检测。用于QMTM分析的典型试剂(例如,可在典型的基于QMTM的试剂盒中找到)可以包括但不限于:针对特定基因座(例如,特定基因、标志物、基因区域、标志物区域、经过亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物;或探针;优化的PCR缓冲液和脱氧核苷酸;以及Taq聚合酶。
Ms-SNuPETM技术是一种用于评估特定CpG位点的甲基化差异的定量方法,该方法基于DNA的亚硫酸氢盐处理,然后是单核苷酸引物延伸(Gonzalgo和Jones,Nucleic AcidsRes.25:2529-2531,1997)。简单地说,基因组DNA与亚硫酸氢钠反应,将未甲基化的胞嘧啶转化为尿嘧啶,同时保持5-甲基胞嘧啶不变。然后使用对经过亚硫酸氢盐转化的DNA具有特异性的PCR引物进行所需靶序列的扩增,并且分离所得产物并用作感兴趣CpG位点的甲基化分析的模板。可以分析少量的DNA(例如,显微解剖病理切片),并且避免使用限制酶来确定CpG位点的甲基化状况。
用于Ms-SNuPETM分析的典型试剂(例如,可在典型的基于Ms-SNuPETM的试剂盒中找到)可能包括但不限于:针对特定基因座(例如,特定基因、标志物、基因区域、标志物区域、经过亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物;优化的PCR缓冲液和脱氧核苷酸;凝胶提取试剂盒;阳性对照引物;针对特定基因座的Ms-SNuPETM引物;反应缓冲液(针对Ms-SNuPE反应);和标记的核苷酸。此外,亚硫酸氢盐转化试剂可能包括:DNA变性缓冲液;磺化缓冲液;DNA回收试剂或试剂盒(如沉淀、超滤、亲和柱);脱磺酸缓冲液;和DNA回收组分。
简化代表性亚硫酸氢盐测序(RRBS)从对核酸进行亚硫酸氢盐处理以将所有未甲基化的胞嘧啶转化为尿嘧啶开始,然后进行限制酶消化(例如,通过识别包括CG序列的位点的酶,如MspI)以及在与接头配体偶联后对片段进行完整测序。限制酶的选择可以富集CpG密集区域的片段,减少在分析过程中可能映射至多个基因位置的冗余序列的数目。因此,RRBS通过选择限制性片段的子集(例如,通过使用制备型凝胶电泳的大小选择)用于测序来降低核酸样品的复杂性。与全基因组亚硫酸氢盐测序相反,限制酶消化产生的每个片段都含有至少一个CpG二核苷酸的DNA甲基化信息。因此,RRBS富集样品中在区域内具有高频率的限制酶切割位点的启动子、CpG岛和其它基因组特征,从而提供了一种评估一个或多个基因组基因座的甲基化状态的测定法。
RRBS的典型方案包括使用限制酶(如MspI)消化核酸样品、填充悬垂和A尾、连接接头、亚硫酸氢盐转化和PCR的步骤。参见例如等人(2005)“Genome-scale DNA methylationmapping of clinical samples at single-nucleotide resolution”Nat Methods 7:133-6;Meissner等人(2005)“Reduced representation bisulfite sequencing forcomparative high-resolution DNA methylation analysis”Nucleic Acids Res.33:5868-77。
在一些实施方案中,使用定量等位基因特异性实时靶标和信号放大(QuARTS)测定来评估甲基化状态。在每个QuARTS测定中依次发生三个反应,包括初级反应中的扩增(反应1)和靶探针裂解(反应2);以及次级反应中的FRET裂解和荧光信号生成(反应3)。当使用特定引物扩增目标核酸时,带有瓣序列的特定检测探针与扩增子松散地结合。靶结合位点处特定侵入性寡核苷酸的存在引起5'核酸酶,例如FEN-1核酸内切酶,通过在检测探针和瓣序列之间切割来释放瓣序列。瓣序列与相应FRET盒的非发夹部分互补。因此,瓣序列充当FRET盒上的侵入性寡核苷酸,并在FRET盒荧光团与猝灭剂之间实现裂解,产生荧光信号。裂解反应可以每个靶标切割多个探针,从而每个瓣释放多个荧光团,提供指数信号放大。QuARTS可以通过使用带有不同染料的FRET盒来检测单个反应孔中的多个靶标。参见例如Zou等人(2010)“Sensitive quantification of methylated markers with a novelmethylation specific technology”Clin Chem 56:A199),和美国专利No.8,361,720;8,715,937;8,916,344;以及9,212,392,每一个都通过引用的方式并入本文中,以达成所有目的。
术语“亚硫酸氢盐试剂”是指包含亚硫酸氢盐(bisulfite)、亚硫酸氢盐(disulfite)、亚硫酸氢盐(hydrogen sulfite)或其组合的试剂,如本文所公开,其用于区分甲基化与未甲基化的CpG二核苷酸序列。所述处理方法是本领域已知的(例如PCT/EP2004/011715和WO2013/116375,各自通过引用的方式整体并入)。在一些实施方案中,亚硫酸氢盐处理在变性溶剂例如但不限于正烷二醇或二乙二醇二甲醚(DME)的存在下,或在二噁烷或二噁烷衍生物的存在下进行。在一些实施方案中,变性溶剂以介于1%与35%(v/v)之间的浓度使用。在一些实施方案中,亚硫酸氢盐反应在清除剂存在下进行,所述清除剂例如但不限于色烷衍生物,例如6-羟基-2,5,7,8,-四甲基色烷2-甲酸或三羟基苯甲酸和其衍生物,例如没食子酸(参见:PCT/EP2004/011715,以引用的方式整体并入)。在某些优选的实施方案中,亚硫酸氢盐反应包括用亚硫酸氢铵处理,例如,如WO 2013/116375中所述。
在一些实施方案中,使用根据本发明的引物寡核苷酸组(例如参见表10、19和20)和扩增酶扩增处理过的DNA的片段。几个DNA区段的扩增可以在同一个反应容器中同时进行。通常,使用聚合酶链式反应(PCR)进行扩增。扩增子的长度通常为100至2000个碱基对。
在该方法的另一个实施方案中,可以通过使用甲基化特异性引物寡核苷酸来检测在包含DMR(例如DMR 1-499,表1、8和21)的标志物内或附近的CpG位置的甲基化状况。这种技术(MSP)已在Herman的美国专利No.6,265,171中描述。使用甲基化状况特异性引物扩增经过亚硫酸氢盐处理的DNA可以区分甲基化与未甲基化的核酸。MSP引物对含有至少一种与经过亚硫酸氢盐处理的CpG二核苷酸杂交的引物。因此,所述引物的序列包含至少一个CpG二核苷酸。对未甲基化的DNA具有特异性的MSP引物在CpG的C位置处含有“T”。
通过扩增获得的片段可以带有直接或间接的可检测标记。在一些实施方案中,标记是荧光标记、放射性核素或具有可在质谱仪中检测到的典型质量的可分离分子片段。在所述标记是质量标记的情况下,一些实施方案提供标记的扩增子具有单个正或负净电荷,从而允许在质谱仪中具有更好的可检测性。可以通过例如基质辅助激光解吸/电离质谱法(MALDI)或使用电喷雾质谱法(ESI)来进行检测和可视化。
适用于这些测定技术的分离DNA的方法是本领域已知的。具体地说,一些实施方案包括分离核酸,如通过引用的方式整体并入本文中的美国专利申请序列号13/470,251(“Isolation of Nucleic Acids”)中所述。
在一些实施方案中,本文所述的标志物可用于对粪便样品进行的QUARTS测定。在一些实施方案中,提供了产生DNA样品的方法,特别是产生如下DNA样品的方法,所述DNA样品包含小体积(例如,小于100微升、小于60微升)的高度纯化的低丰度核酸并且基本上和/或实际上不含抑制用于测试DNA样品的测定(例如,PCR、INVADER、QuARTS测定等)的物质。这类DNA样品可在定性检测在取自患者的样品中存在的基因、基因变体(例如等位基因)或基因修饰(例如甲基化)的存在或定量测量其活性、表达或数量的诊断分析中使用。例如,一些癌症与特定突变等位基因或特定甲基化状态的存在相关,因此检测和/或定量这类突变等位基因或甲基化状态在癌症的诊断和治疗中具有预测价值。
许多有价值的遗传标志物以极低的量存在于样品中,并且产生这类标志物的许多事件非常罕见。因此,即使是灵敏的检测方法(例如PCR)也需要大量DNA来提供足够的低丰度靶标,以满足或代替测定的检测阈值。此外,即使是少量抑制物质的存在也会损害这些旨在检测如此少量靶标的测定的准确性和精确度。因此,本文提供了对体积和浓度提供必要管理以产生这类DNA样品的方法。
在一些实施方案中,样品包含血液、血清、白细胞、血浆或唾液。在一些实施方案中,受试者是人。这类样品可以通过本领域已知的,例如熟练技术人员显而易见的多种方法获得。可以通过使样品经受本领域技术人员已知的各种技术,包括但不限于离心和过滤来获得无细胞或基本上无细胞的样品。尽管通常优选不使用侵入性技术来获得样品,但获得样品例如组织匀浆、组织切片和活检标本仍可能是优选的。这项技术不限于用于制备样品和提供用于测试的核酸的方法。例如,在一些实施方案中,使用直接基因捕获,例如,如美国专利No.8,808,990和9,169,511以及WO 2012/155072中所详述,或通过相关方法,从粪便样品或血液或血浆样品中分离DNA。
标志物的分析可以单独或与一个测试样品中的另外的标志物同时进行。例如,可以将几个标志物组合到一个测试中以有效处理多个样品并潜在地提供更高的诊断和/或预后准确性。此外,本领域技术人员会认识到测试来自同一受试者的多个样品(例如,在连续时间点)的价值。这类系列样品测试可以鉴定标志物甲基化状态随时间的变化。甲基化状态的变化以及甲基化状态没有变化可以提供有关疾病状态的有用信息,包括但不限于鉴定事件发生的大致时间、可挽救组织的存在和数量、药物疗法的适当性、各种疗法的有效性以及对受试者结果的鉴定,包括未来事件的风险。
生物标志物的分析可以呈多种物理格式进行。例如,可以使用微量滴定板或自动化来促进大量测试样品的处理。可替代地,可以开发单一样品格式以促进以及时方式进行即刻治疗和诊断,例如在非卧床运输或急诊室环境中。
预期以试剂盒的形式提供这项技术的实施方案。试剂盒包含本文所述的组合物、装置、设备等的实施方案,以及试剂盒的使用说明书。这类说明书描述了用于从样品制备分析物,例如用于收集样品和从样品制备核酸的合适方法。试剂盒的各个组分被包装在合适的容器和包装(例如,小瓶、盒子、泡罩包装、安瓿、广口瓶、瓶子、管等)中并且这些组分被一起包装在合适的容器(例如,一个盒子或多个盒子)中以方便试剂盒的用户存储、运输和/或使用。应当理解,液体组分(例如,缓冲液)可以呈冻干形式提供以供用户复原。试剂盒可以包括用于评估、验证和/或确保试剂盒性能的对照或参考。例如,用于测定样品中存在的核酸量的试剂盒可以包括对照,其包含已知浓度的用于比较的相同或另一种核酸,并且在一些实施方案中,对对照核酸具有特异性的检测试剂(例如引物)。试剂盒适用于临床环境,并且在一些实施方案中,适用于用户家中。在一些实施方案中,试剂盒的组件提供用于从样品制备核酸溶液的系统的功能。在一些实施方案中,系统的某些组件由用户提供。
方法
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90,以及
2)检测EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B,以及
2)检测EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A,以及
2)检测EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553,以及
2)检测EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从血液样品(例如,血浆样品、全血样品、白细胞样品、血清样品)分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A,以及
2)检测EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422,以及
2)检测透明细胞EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A,以及
2)检测透明细胞EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A,以及
2)检测透明细胞EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B,以及
2)检测透明细胞EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从血液样品(例如,血浆样品、全血样品、白细胞样品、血清样品)分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC,以及
2)检测透明细胞EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B,以及
2)检测癌肉瘤EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:EMX2OS和LRRC34,以及
2)检测癌肉瘤EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL,以及
2)检测癌肉瘤EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B,以及
2)检测癌肉瘤EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从血液样品(例如,血浆样品、全血样品、白细胞样品、血清样品)分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL,以及
2)检测癌肉瘤EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B,以及
2)检测浆液性EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C,以及
2)检测浆液性EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL,以及
2)检测浆液性EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:EMX2OS和LRRC41_D,以及
2)检测浆液性EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从血液样品(例如,血浆样品、全血样品、白细胞样品、血清样品)分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A,以及
2)检测浆液性EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B,以及
2)检测子宫内膜样EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL,以及
2)检测子宫内膜样EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A,以及
2)检测子宫内膜样EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从血液样品(例如,血浆样品、全血样品、白细胞样品、血清样品)分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A,以及
2)检测子宫内膜样EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C,以及
2)检测子宫内膜样1级EC(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B,以及
2)检测子宫内膜样EC 2级(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触,所述标志物选自具有选自由以下组成的组的注释的染色体区域:TSPYL5、MPZ_B、TRH和PTGDR,以及
2)检测子宫内膜样EC 3级(例如以大于或等于80%的灵敏度和大于或等于80%的特异性提供)。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)通过用以甲基化特异性方式修饰DNA的试剂(例如其中所述试剂亚硫酸氢盐试剂、甲基化敏感性限制酶或甲基化依赖性限制酶)处理人类个体的生物样品中的基因组DNA,测量所述生物样品中一种或多种基因的甲基化水平,其中所述一种或多种基因选自以下组中的一组:
(i)AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90;
(ii)EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B;
(iii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553;以及
(v)ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A;
2)使用一组针对所选择的一种或多种基因的引物扩增经过处理的基因组DNA;以及
3)通过聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离以及靶标捕获确定所述一种或多种基因的甲基化水平。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)通过用以甲基化特异性方式修饰DNA的试剂(例如其中所述试剂亚硫酸氢盐试剂、甲基化敏感性限制酶或甲基化依赖性限制酶)处理人类个体的生物样品中的基因组DNA,测量所述生物样品中一种或多种基因的甲基化水平,其中所述一种或多种基因选自以下组中的一组:
(i)DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422;
(ii)ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A;
(iii)SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A;
(iv)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B;以及
(v)SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC;
2)使用一组针对所选择的一种或多种基因的引物扩增经过处理的基因组DNA;以及
3)通过聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离以及靶标捕获确定所述一种或多种基因的甲基化水平。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)通过用以甲基化特异性方式修饰DNA的试剂(例如其中所述试剂亚硫酸氢盐试剂、甲基化敏感性限制酶或甲基化依赖性限制酶)处理人类个体的生物样品中的基因组DNA,测量所述生物样品中一种或多种基因的甲基化水平,其中所述一种或多种基因选自以下组中的一组:
(i)EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B;
(ii)EMX2OS和LRRC34;
(iii)ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL;
(iv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B;以及
(v)SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL;
2)使用一组针对所选择的一种或多种基因的引物扩增经过处理的基因组DNA;以及
3)通过聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离以及靶标捕获确定所述一种或多种基因的甲基化水平。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)通过用以甲基化特异性方式修饰DNA的试剂(例如其中所述试剂亚硫酸氢盐试剂、甲基化敏感性限制酶或甲基化依赖性限制酶)处理人类个体的生物样品中的基因组DNA,测量所述生物样品中一种或多种基因的甲基化水平,其中所述一种或多种基因选自以下组中的一组:
(i)EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B;
(ii)MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C;
(iii)MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL;
(iv)EMX2OS和LRRC41_D;以及
(v)SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A;
2)使用一组针对所选择的一种或多种基因的引物扩增经过处理的基因组DNA;以及
3)通过聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离以及靶标捕获确定所述一种或多种基因的甲基化水平。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)通过用以甲基化特异性方式修饰DNA的试剂(例如其中所述试剂亚硫酸氢盐试剂、甲基化敏感性限制酶或甲基化依赖性限制酶)处理人类个体的生物样品中的基因组DNA,测量所述生物样品中一种或多种基因的甲基化水平,其中所述一种或多种基因选自以下组中的一组:
(i)MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B;
(ii)MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL;
(iii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(iv)SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A;
(v)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C;
(vi)TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B;以及
(vii)TSPYL5、MPZ_B、TRH和PTGDR;
2)使用一组针对所选择的一种或多种基因的引物扩增经过处理的基因组DNA;以及
3)通过聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离以及靶标捕获确定所述一种或多种基因的甲基化水平。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)测量来自样品的DNA中至少一种甲基化标志基因的量,其中所述一种或多种基因选自以下组中的一组:
(i)AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90;
(ii)EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B;
(iii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553;以及
(v)ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A;
2)测量DNA中的至少一种参考标志物的量;以及
3)将在DNA中测量的至少一种甲基化标志基因的量的值计算为在DNA中测量的参考标志基因的量的百分比,其中该值指示在样品中测量的至少一种甲基化标志DNA的量。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)测量来自样品的DNA中至少一种甲基化标志基因的量,其中所述一种或多种基因选自以下组中的一组:
(i)DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422;
(ii)ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A;
(iii)SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A;
(iv)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B;以及
(v)SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC;
2)测量DNA中至少一种参考标志物的量;以及
3)将在DNA中测量的至少一种甲基化标志基因的量的值计算为在DNA中测量的参考标志基因的量的百分比,其中该值指示在样品中测量的至少一种甲基化标志DNA的量。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)测量来自样品的DNA中至少一种甲基化标志基因的量,其中所述一种或多种基因选自以下组中的一组:
(i)EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B;
(ii)EMX2OS和LRRC34;
(iii)ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL;
(iv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B;以及
(v)SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL;
2)测量DNA中至少一种参考标志物的量;以及
3)将在DNA中测量的至少一种甲基化标志基因的量的值计算为在DNA中测量的参考标志基因的量的百分比,其中该值指示在样品中测量的至少一种甲基化标志DNA的量。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)测量来自样品的DNA中至少一种甲基化标志基因的量,其中所述一种或多种基因选自以下组中的一组:
(i)EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B;
(ii)MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C;
(iii)MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL;
(iv)EMX2OS和LRRC41_D;以及
(v)SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A;
2)测量DNA中至少一种参考标志物的量;以及
3)将在DNA中测量的至少一种甲基化标志基因的量的值计算为在DNA中测量的参考标志基因的量的百分比,其中该值指示在样品中测量的至少一种甲基化标志DNA的量。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)测量来自样品的DNA中至少一种甲基化标志基因的量,其中所述一种或多种基因选自以下组中的一组:
(i)MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B;
(ii)MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL;
(iii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(iv)SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A;
(v)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C;
(vi)TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B;以及
(vii)TSPYL5、MPZ_B、TRH和PTGDR;
2)测量DNA中至少一种参考标志物的量;以及
3)将在DNA中测量的至少一种甲基化标志基因的量的值计算为在DNA中测量的参考标志基因的量的百分比,其中该值指示在样品中测量的至少一种甲基化标志DNA的量。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)通过用亚硫酸氢盐以甲基化特异性方式修饰DNA的试剂(例如甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)处理人类个体的生物样品中的基因组DNA,测量所述生物样品中一种或多种基因的CpG位点的甲基化水平;
2)使用一组针对所选择的一种或多种基因的引物扩增经过修饰的基因组DNA;以及
3)通过甲基化特异性PCR、定量甲基化特异性PCR、甲基化敏感性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序或亚硫酸氢盐基因组测序PCR确定所述CpG位点的甲基化水平;
其中所述一种或多种基因选自以下组中的一组:
(i)AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90;
(ii)EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B;
(iii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553;以及
(v)ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)通过用亚硫酸氢盐以甲基化特异性方式修饰DNA的试剂(例如甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)处理人类个体的生物样品中的基因组DNA,测量所述生物样品中一种或多种基因的CpG位点的甲基化水平;
2)使用一组针对所选择的一种或多种基因的引物扩增经过修饰的基因组DNA;以及
3)通过甲基化特异性PCR、定量甲基化特异性PCR、甲基化敏感性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序或亚硫酸氢盐基因组测序PCR确定所述CpG位点的甲基化水平;
其中所述一种或多种基因选自以下组中的一组:
(i)DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422;
(ii)ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A;
(iii)SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A;
(iv)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B;以及
(v)SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)通过用亚硫酸氢盐以甲基化特异性方式修饰DNA的试剂(例如甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)处理人类个体的生物样品中的基因组DNA,测量所述生物样品中一种或多种基因的CpG位点的甲基化水平;
2)使用一组针对所选择的一种或多种基因的引物扩增经过修饰的基因组DNA;以及
3)通过甲基化特异性PCR、定量甲基化特异性PCR、甲基化敏感性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序或亚硫酸氢盐基因组测序PCR确定所述CpG位点的甲基化水平;
其中所述一种或多种基因选自以下组中的一组:
(i)EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B;
(ii)EMX2OS和LRRC34;
(iii)ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL;
(iv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B;以及
(v)SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)通过用亚硫酸氢盐以甲基化特异性方式修饰DNA的试剂(例如甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)处理人类个体的生物样品中的基因组DNA,测量所述生物样品中一种或多种基因的CpG位点的甲基化水平;
2)使用一组针对所选择的一种或多种基因的引物扩增经过修饰的基因组DNA;以及
3)通过甲基化特异性PCR、定量甲基化特异性PCR、甲基化敏感性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序或亚硫酸氢盐基因组测序PCR确定所述CpG位点的甲基化水平;
其中所述一种或多种基因选自以下组中的一组:
(i)EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B;
(ii)MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C;
(iii)MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL;
(iv)EMX2OS和LRRC41_D;以及
(v)SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A。
在这项技术的一些实施方案中,提供包括以下步骤的方法:
1)通过用亚硫酸氢盐以甲基化特异性方式修饰DNA的试剂(例如甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)处理人类个体的生物样品中的基因组DNA,测量所述生物样品中一种或多种基因的CpG位点的甲基化水平;
2)使用一组针对所选择的一种或多种基因的引物扩增经过修饰的基因组DNA;以及
3)通过甲基化特异性PCR、定量甲基化特异性PCR、甲基化敏感性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序或亚硫酸氢盐基因组测序PCR确定所述CpG位点的甲基化水平;
其中所述一种或多种基因选自以下组中的一组:
(i)MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B;
(ii)MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL;
(iii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(iv)SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A;
(v)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C;
(vi)TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B;以及
(vii)TSPYL5、MPZ_B、TRH和PTGDR。
优选地,这类方法的灵敏度为约70%至约100%,或约80%至约90%,或约80%至约85%。优选地,特异性为约70%至约100%,或约80%至约90%,或约80%至约85%。
基因组DNA可以通过任何方式分离,包括使用市售试剂盒。简单地说,当感兴趣的DNA被细胞膜包裹时,生物样品必须通过酶促、化学或机械方式进行破坏和溶解。然后可以例如通过用蛋白酶K消化来清除DNA溶液中的蛋白质和其它污染物。然后从溶液中回收基因组DNA。这可以通过多种方法进行,包括盐析、有机萃取或将DNA结合到固相载体上。方法的选择将受到几种因素的影响,包括时间、费用和所需的DNA数量。包含赘生物或肿瘤发生前物质的所有临床样品类型都适用于本发明的方法,例如细胞系、组织切片、活检、石蜡包埋组织、体液、粪便、乳腺组织、子宫内膜组织、白细胞、结肠流出物、尿液、血浆、血清、全血、分离的血细胞、从血液中分离的细胞以及它们的组合。
这项技术不限于用于制备样品和提供用于测试的核酸的方法。例如,在一些实施方案中,使用直接基因捕获,例如,如美国专利申请序列号61/485386中所详述,或通过相关方法,从粪便样品或血液或血浆样品中分离DNA。
然后用至少一种试剂或一系列试剂处理基因组DNA样品,所述试剂区分包含DMR(例如DMR 1-499,如表1、8和21所提供)的至少一种标志物内的甲基化与未甲基化的CpG二核苷酸。
在一些实施方案中,试剂将在5'-位置未甲基化的胞嘧啶碱基转化为尿嘧啶、胸腺嘧啶或在杂交行为方面与胞嘧啶不同的另一碱基。然而,在一些实施方案中,试剂可以是甲基化敏感性限制酶。
在一些实施方案中,基因组DNA样品通过如下方式进行处理,使得将在5'-位置未甲基化的胞嘧啶碱基转化为尿嘧啶、胸腺嘧啶或在杂交行为方面与胞嘧啶不同的另一碱基。在一些实施方案中,这种处理是用亚硫酸氢盐(亚硫酸氢盐、亚硫酸氢盐),然后碱水解进行的。
然后分析处理过的核酸以确定靶基因序列(来自包含DMR,例如至少一种选自DMR1-499(例如,如表1、8和21中提供)的DMR的标志物的至少一种基因、基因组序列或核苷酸)的甲基化状态。分析方法可选自本领域已知的那些,包括本文所列的那些,例如本文所述的QuARTS和MSP。
异常甲基化,更具体地,包含DMR(例如,DMR 1-499,例如,如表1、8和21所提供)的标志物的高甲基化与EC和/或一种EC类型(例如,透明细胞EC,癌肉瘤EC、子宫内膜样EC、浆液性EC)相关。
这项技术涉及与EC相关的任何样品的分析。例如,在一些实施方案中,样品包含从患者获得的组织和/或生物流体。在一些实施方案中,样品包含分泌物。在一些实施方案中,样品包含血液、血清、血浆、胃分泌物、胰液、胃肠活检样品、来自乳房活检的显微解剖细胞和/或从粪便中回收的细胞。在一些实施方案中,样品包含子宫内膜组织。在一些实施方案中,受试者是人。样品可以包括来自子宫内膜、乳房、肝脏、胆管、胰腺、胃、结肠、直肠、食道、小肠、阑尾、十二指肠、息肉、胆囊、肛门和/或腹膜的细胞、分泌物或组织。在一些实施方案中,样品包含细胞液、腹水、尿液、粪便、胰液、在内窥镜检查期间获得的流体、血液、粘液或唾液。在一些实施方案中,样品是粪便样品。在一些实施方案中,样品是子宫内膜组织样品。
这类样品可以通过本领域已知的,例如熟练技术人员显而易见的多种方法获得。例如,尿液和粪便样品很容易获得,而血液、腹水、血清或胰液样品可以通过使用例如针头和注射器以肠胃外方式获得。可以通过使样品经受本领域技术人员已知的各种技术,包括但不限于离心和过滤来获得无细胞或基本上无细胞的样品。尽管通常优选不使用侵入性技术来获得样品,但获得样品例如组织匀浆、组织切片和活检标本仍可能是优选的。
在一些实施方案中,这项技术涉及一种治疗患者(例如,患有EC、早期EC或可能发展为EC的患者)(例如,患有透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC的患者)的方法,该方法包括确定如本文提供的一种或多种DMR的甲基化状态并基于确定甲基化状态的结果对患者进行治疗。治疗可以是施用药物化合物、疫苗、进行手术、对患者进行成像、进行另一测试。优选地,所述使用是在临床筛查方法、预后评估方法、监测疗法结果的方法、鉴定最可能对特定治疗性治疗有反应的患者的方法、对患者或受试者进行成像的方法以及药物筛查和开发的方法中。
在这项技术的一些实施方案中,提供了一种用于诊断受试者中的EC的方法。如本文所用,术语“诊断(diagnosing)”和“诊断(diagnosis)”是指熟练技术人员可以估计甚至确定受试者是否患有给定疾病或疾患或将来是否可能显现给定疾病或疾患的方法。熟练技术人员通常基于一种或多种诊断指标做出诊断,所述诊断指标例如生物标志物(例如,如本文公开的DMR),其甲基化状态指示疾患存在、严重性或不存在。
连同诊断一起,临床癌症预后涉及确定癌症的侵袭性和肿瘤复发的可能性,以规划最有效的疗法。如果可以做出更准确的预后,或者甚至可以评估显现癌症的潜在风险,则可以为患者选择适当的疗法,在某些情况下,可以选择不太严重的疗法。癌症生物标志物的评估(例如,确定甲基化状态)可用于将不需要疗法或需要有限疗法的具有良好预后和/或显现癌症风险低的受试者与更可能显现癌症或遭受癌症复发的受益于更深入的治疗的受试者分开。
因此,如本文所用,“做出诊断”或“诊断”还包括确定显现癌症的风险或确定预后,这可以基于本文公开的诊断生物标志物(例如,DMR)的测量预测临床结果(有或没有医学治疗)、选择适当的治疗(或治疗是否有效)或监测当前治疗并可能改变治疗。此外,在本公开主题的一些实施方案中,可以随时间对生物标志物进行多次测定以促进诊断和/或预后。生物标志物的时间变化可用于预测临床结果、监测EC的进展和/或监测针对癌症的适当疗法的功效。例如,在这样的实施方案中,可能期望在有效疗法过程期间的时间内看到生物样品中的一种或多种本文公开的生物标志物(例如DMR)(以及可能的一种或多种额外生物标志物,如果被监测)的甲基化状态的变化。
在一些实施方案中,本发明公开的主题还提供了一种用于确定是否在受试者中开始或继续癌症的预防或治疗的方法。在一些实施方案中,该方法包括在一段时间内提供来自受试者的一系列生物样品;分析该系列生物样品以确定每个生物样品中至少一种本文公开的生物标志物的甲基化状态;以及比较每个生物样品中一种或多种生物标志物的甲基化状态的任何可测量变化。一段时间内生物标志物甲基化状态的任何变化都可用于预测显现癌症的风险、预测临床结果、确定是否开始或继续癌症的预防或疗法,以及当前疗法是否有效治疗癌症。例如,可以在开始治疗之前选择第一时间点并且可以在开始治疗之后的某个时间选择第二时间点。甲基化状态可以在取自不同时间点的每个样品中测量,并记录定性和/或定量差异。来自不同样品的生物标志物水平的甲基化状态的变化可与受试者中的EC风险、预后、确定治疗功效和/或癌症进展相关。
在优选的实施方案中,本发明的方法和组合物用于在早期阶段,例如在疾病症状出现之前治疗或诊断疾病。在一些实施方案中,本发明的方法和组合物用于在临床阶段治疗或诊断疾病。
如所述,在一些实施方案中,可以对一种或多种诊断或预后生物标志物进行多次测定,并且可以使用标志物的时间变化来确定诊断或预后。例如,可以在初始时间确定诊断标志物,并在第二时间再次确定。在这样的实施方案中,标志物从初始时间到第二时间的增加可以诊断癌症的特定类型或严重程度,或给定的预后。同样,标志物从初始时间到第二时间的减少可以指示癌症的特定类型或严重程度,或给定的预后。此外,一种或多种标志物的变化程度可能与癌症的严重程度和未来的不良事件有关。技术人员将理解,虽然在某些实施方案中可以在多个时间点对相同的生物标志物进行比较测量,但也可以在一个时间点测量给定的生物标志物,并在第二个时间点测量第二种生物标志物,并且比较这些标志物可以提供诊断信息。
如本文所用,短语“确定预后”是指熟练技术人员可以预测受试者的疾患的进程或结果的方法。术语“预后”并不是指能够以100%的准确度预测疾患的进程或结果,甚至不是基于生物标志物(例如DMR)的甲基化状态大概预测给定的进程或结果发生的可能性。相反,熟练技术人员会理解,术语“预后”是指某个过程或结果发生的可能性增加;也就是说,与未表现出给定疾患的那些个体相比,表现出疾患的受试者更可能发生过程或结果。例如,在未表现出疾患(例如,具有一种或多种DMR的正常甲基化状态)的个体中,给定结果(例如,患有EC)的机会可能非常低。
在一些实施方案中,统计分析将预后指标与不利结果的倾向相关联。例如,在一些实施方案中,与从未患癌症的患者获得的正常对照样品中的甲基化状态不同的甲基化状态可以表示受试者比水平更类似于对照样品中的甲基化状态的受试者更可能患上癌症,如由统计显著性水平确定。此外,甲基化状态相对于基线(例如,“正常”)水平的变化可以反映受试者的预后,并且甲基化状态的变化程度可以与不良事件的严重程度相关。通常通过比较两个或更多个群体并确定置信区间和/或p值来确定统计显著性。参见例如Dowdy和Wearden,Statistics for Research,John Wiley&Sons,New York,1983,以引用的方式整体并入本文中。本发明主题的示例性置信区间为90%、95%、97.5%、98%、99%、99.5%、99.9%和99.99%,而示例性p值为0.1、0.05、0.025、0.02、0.01、0.005、0.001和0.0001。
在其它实施方案中,可以建立本文公开的预后或诊断生物标志物(例如,DMR)的甲基化状态变化的阈值程度,并且简单地比较生物样品中生物标志物的甲基化状态变化程度与甲基化状态变化的阈值程度。本文提供的生物标志物的甲基化状态的优选阈值变化为约5%、约10%、约15%、约20%、约25%、约30%、约50%、约75%、约100%和约150%。在其它实施方案中,可以建立“列线图”,通过该“列线图”,预后或诊断指标(生物标志物或生物标志物的组合)的甲基化状态与给定结果的相关倾向直接相关。熟练技术人员熟悉使用这类列线图来关联两个数值,并理解该测量中的不确定度与标志物浓度中的不确定度相同,因为参考的是单个样品测量值,而不是总体平均值。
在一些实施方案中,对照样品与生物样品同时分析,使得从生物样品获得的结果可以与从对照样品获得的结果进行比较。此外,预期可提供标准曲线,生物样品的测定结果可与之进行比较。如果使用荧光标记,则这类标准曲线将生物标志物的甲基化状态呈现为测定单位的函数,例如荧光信号强度。使用取自多个供体的样品,可以提供正常组织中一种或多种生物标志物的对照甲基化状态,以及取自具有化生的供体或具有EC的供体的组织中一种或多种生物标志物的“风险”水平的标准曲线。在该方法的某些实施方案中,在从受试者获得的生物样品中鉴定本文提供的一种或多种DMR的异常甲基化状态后,受试者被鉴定为具有化生。在该方法的其它实施方案中,在从受试者获得的生物样品中检测到一种或多种这类生物标志物的异常甲基化状态引起该受试者被鉴定为具有癌症。
标志物的分析可以单独或与一个测试样品中的另外的标志物同时进行。例如,可以将几个标志物组合到一个测试中以有效处理多个样品并潜在地提供更高的诊断和/或预后准确性。此外,本领域技术人员会认识到测试来自同一受试者的多个样品(例如,在连续时间点)的价值。这类系列样品测试可以鉴定标志物甲基化状态随时间的变化。甲基化状态的变化以及甲基化状态没有变化可以提供有关疾病状态的有用信息,包括但不限于鉴定事件发生的大致时间、可挽救组织的存在和数量、药物疗法的适当性、各种疗法的有效性以及对受试者结果的鉴定,包括未来事件的风险。
生物标志物的分析可以呈多种物理格式进行。例如,可以使用微量滴定板或自动化来促进大量测试样品的处理。可替代地,可以开发单一样品格式以促进以及时方式进行即刻治疗和诊断,例如在非卧床运输或急诊室环境中。
在一些实施方案中,如果与对照甲基化状态相比,样品中至少一种生物标志物的甲基化状态存在可测量的差异,则受试者被诊断为具有EC。相反,当在生物样品中未鉴定出甲基化状态的变化时,可以鉴定受试者为未患EC、没有患癌症的风险或具有低的患癌症的风险。在这点上,患有癌症或其风险的受试者可以与患有低至基本上没有癌症或其风险的受试者相区分。那些有显现EC风险的受试者可以进行更密集和/或定期的筛查计划,包括内窥镜监测。另一方面,那些具有低至基本上没有风险的受试者可以避免接受额外的EC测试(例如,侵入性程序),直到例如未来的筛查,例如根据本发明的技术进行的筛查表明在那些受试者中出现了EC风险的时间。
如上所述,根据本发明的技术方法的实施方案,检测一种或多种生物标志物的甲基化状态的变化可以是定性测定,也可以是定量测定。因此,将受试者诊断为患有EC或有显现EC风险的步骤表明进行了某些阈值测量,例如,生物样品中一种或多种生物标志物的甲基化状态不同于预定的对照甲基化状态。在该方法的一些实施方案中,对照甲基化状态是生物标志物的任何可检测的甲基化状态。在对照样品与生物样品同时测试的方法的其它实施方案中,预定甲基化状态是对照样品中的甲基化状态。在该方法的其它实施方案中,预定甲基化状态基于标准曲线和/或由标准曲线鉴定。在该方法的其它实施方案中,预定甲基化状态是特定状态或状态范围。因此,可以在本领域技术人员显而易见的可接受限度内,部分地基于所实践的方法的实施方案和期望的特异性等来选择预定甲基化状态。
进一步关于诊断方法,优选的受试者是脊椎动物受试者。优选的脊椎动物是温血动物;优选的温血脊椎动物是哺乳动物。优选的哺乳动物最优选是人。如本文所用,术语“受试者”包括人和动物受试者。因此,本文提供了兽医治疗用途。因此,本发明的技术提供了对哺乳动物(例如人类)以及以下动物的诊断:那些因濒危而重要的哺乳动物(例如东北虎);具有经济重要性的动物,例如在农场饲养供人类食用的动物;和/或对人类具有社会重要性的动物,例如作为宠物或在动物园饲养的动物。这种动物的实例包括但不限于:食肉动物,例如猫和狗;猪科动物,包括猪、肉猪和野猪;反刍动物和/或有蹄类动物,如牛、公牛、绵羊、长颈鹿、鹿、山羊、野牛和骆驼;和马。因此,还提供了家畜的诊断和治疗,包括但不限于家养猪、反刍动物、有蹄类动物、马(包括赛马)等。
本发明公开的主题还包括用于诊断受试者中的EC和/或特定EC形式(例如,透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)的系统。例如,该系统可作为市售试剂盒提供,该试剂盒可用于筛查已收集生物样品的受试者患EC的风险或诊断其患EC。根据本发明的技术提供的示例性系统包括评估如表1、8和21中提供的DMR的甲基化状态。
实施例
实施例I.
本实施例描述了通过全甲基化分析选择发现和验证用于检测子宫内膜癌(EC)和EC组织学亚型(例如,浆液性EC、透明细胞EC、癌肉瘤EC和子宫内膜样EC)的新颖DNA甲基化标志物。
使用样品制备、测序、分析管道和过滤器的专有方法来鉴定差异甲基化区域(DMR)并将其缩小到那些可以精确定位EC和各种EC组织学亚型(例如,浆液性EC、透明细胞EC、癌肉瘤EC和子宫内膜样EC)并在临床测试环境中表现出色的DMR。
从组织到组织分析,鉴定了318个高甲基化EC DMR(表1)。表2展示了与表1中列举的标志物的EC对照相比较的曲线下面积和倍数变化。
表1.已鉴定的将子宫内膜癌组织与正常子宫内膜组织区分开来的甲基化区域。
表2.与表1中列举的标志物的EC对照相比较的EC组织的曲线下面积、倍数变化和p值。
这类EC DMR包括EC特定区域、EC亚型特定区域以及针对更通用癌症谱的那些区域。
表3中示出了区分EC与正常子宫内膜组织的最高总DMR。表4中示出了区分透明细胞EC与正常子宫内膜组织的最高总DMR。表5中示出了区分癌肉瘤EC与正常子宫内膜组织的最高总DMR。表6中示出了区分子宫内膜样EC与正常子宫内膜组织的最高总DMR。表7中示出了区分浆液性EC与正常子宫内膜组织的最高总DMR。表4、5、6和7中某些基因上的灰度红色阴影指示与多个亚型重叠的DMR。
表3.区分子宫内膜癌组织与正常子宫内膜组织的最高甲基化区域。
基因名称 | DMR编号 | AUC | FC |
EMX2OS | 81 | 0.9309 | 264 |
CYTH2 | 59 | 0.8856 | 20.37 |
C17orf107_A | 28 | 0.8328 | 64.08 |
DIDO1_A | 63 | 0.8777 | 126.3 |
GDF6 | 102 | 0.8772 | 22.97 |
NBPF8 | 162 | 0.8718 | 42.83 |
MAX.chr14.103021656-103021718 | 174 | 0.8679 | 100.9 |
JSRP1_A | 124 | 0.8642 | 38.78 |
GATA2_B | 100 | 0.8639 | 19.23 |
SFMBT2_B | 262 | 0.8431 | 18.31 |
表4.区分透明细胞EC与正常子宫内膜组织的最高总DMR。
基因名称 | DMR编号 | AUC | FC | p值 |
DIDO1_A | 63 | 0.98 | 238 | 5.6E-12 |
NDRG2 | 226 | 0.98 | 84 | 1.08E-07 |
MAX.chr14.103021656-103021718 | 174 | 0.98 | 127 | 5.89E-07 |
MMP23B | 218 | 0.97 | 88 | 4.16E-10 |
EMX2OS | 81 | 0.97 | 235 | 1.49E-07 |
SEPT9_B | 259 | 0.97 | 101 | 1.34E-06 |
NBPF8 | 162 | 0.97 | 53 | 1.61E-08 |
EEF1A2 | 75 | 0.95 | 68 | 3.22E-06 |
AIM1_A | 11 | 0.94 | 369 | 5.34E-06 |
BMP4_B | 26 | 0.94 | 33 | 1.18E-08 |
MAX.chr8.145103829-145103992 | 207 | 0.94 | 26 | 6.52E-08 |
OBSCN_A | 234 | 0.93 | 436 | 5.79E-08 |
PYCARD | 248 | 0.93 | 336 | 0.000463 |
GDF6 | 102 | 0.93 | 38 | 7.98E-07 |
MDFI_B | 212 | 0.93 | 80 | 3.45E-07 |
MIAT_A | 214 | 0.93 | 68 | 4.28E-07 |
SLC8A3 | 271 | 0.92 | 55 | 1.94E-09 |
ZNF323_A | 312 | 0.92 | 364 | 5.47E-05 |
SQSTM1 | 278 | 0.92 | 146 | 4.73E-10 |
AFF3 | 7 | 0.92 | 32 | 2.95E-09 |
C1orf70 | 34 | 0.91 | 252 | 1.56E-07 |
GDF7_A | 103 | 0.91 | 54 | 2.74E-08 |
JSRP1_A | 124 | 0.91 | 72 | 5.16E-10 |
LRRC8D_A | 152 | 0.90 | 27 | 9.12E-05 |
FEV | 87 | 0.90 | 14 | 1.08E-09 |
MAX.chr8.145104263-145104422 | 208 | 0.90 | 52 | 0.000146 |
表5.区分癌肉瘤EC与正常子宫内膜组织的最高总DMR。
基因名称 | DMR编号 | AUC | FC | p值 |
EMX2OS | 81 | 0.94 | 323 | 4.11E-05 |
DIDO1_A | 63 | 0.94 | 143 | 1.84E-06 |
SBNO2 | 256 | 0.94 | 129 | 0.003217 |
AMIGO3_A | 13 | 0.93 | 40 | 8.39E-05 |
PCOLCE | 238 | 0.91 | 41 | 0.000952 |
CLDN7 | 55 | 0.91 | 62 | 0.005037 |
CYTH2 | 59 | 0.91 | 19 | 4.92E-06 |
OBSCN_A | 234 | 0.90 | 159 | 0.007225 |
AHSA2 | 10 | 0.90 | 59 | 0.001032 |
DLL4 | 67 | 0.90 | 17 | 0.000177 |
EMX2 | 80 | 0.89 | 308 | 0.007177 |
MAX.chr14.74100620-74100870 | 177 | 0.88 | 49 | 0.000555 |
LRRC34 | 146 | 0.88 | 150 | 0.002837 |
PPP2R5C_A | 243 | 0.88 | 169 | 6.79E-05 |
SQSTM1 | 278 | 0.88 | 102 | 0.005911 |
MAX.chr17.73073716-73073814 | 180 | 0.87 | 586 | 0.008309 |
CYP11A1 | 57 | 0.86 | 61 | 0.001696 |
ACOXL_A | 2 | 0.86 | 51 | 0.007356 |
AIM1_B | 12 | 0.86 | 95 | 0.001099 |
表6.区分子宫内膜样EC与正常子宫内膜组织的最高总DMR。
基因名称 | DMR编号 | AUC | FC | p值 |
MAX.chr10.130339363-130339534 | 165 | 0.97 | 29 | 1.53E-06 |
SFMBT2_C | 263 | 0.95 | 33 | 6.01E-08 |
CYTH2 | 59 | 0.94 | 25 | 2.18E-08 |
SLC6A3 | 270 | 0.93 | 24 | 1.07E-07 |
VILL | 302 | 0.93 | 67 | 5.35E-11 |
EMX2OS | 81 | 0.92 | 299 | 9.02E-06 |
MAX.chr10.22624479-22624553 | 167 | 0.92 | 63 | 1.42E-10 |
GDF6 | 102 | 0.92 | 28 | 7.96E-07 |
ZNF90 | 318 | 0.91 | 104 | 3.79E-05 |
ZNF506 | 314 | 0.91 | 71 | 9.38E-10 |
JSRP1_A | 124 | 0.91 | 70 | 1.24E-10 |
C5orf52 | 40 | 0.90 | 166 | 1.66E-07 |
SFMBT2_B | 262 | 0.90 | 36 | 2.01E-09 |
NBPF8 | 162 | 0.90 | 66 | 2.95E-07 |
RHBDL1_A | 252 | 0.90 | 51 | 1.34E-05 |
DIDO1_A | 63 | 0.90 | 90 | 1.81E-08 |
KANK1 | 126 | 0.89 | 135 | 1.05E-06 |
GATA2_B | 100 | 0.89 | 24 | 9.71E-09 |
表7.区分浆液性EC与正常子宫内膜组织的最高总DMR。
基因名称 | DMR编号 | AUC | FC | p值 |
EMX2OS | 81 | 1.00 | 277 | 3.71E-10 |
KANK1 | 126 | 0.94 | 65 | 3.2E-07 |
C1orf70_B | 35 | 0.94 | 49 | 5.25E-06 |
AMIGO3_A | 13 | 0.92 | 23 | 2.81E-05 |
DIDO1_A | 63 | 0.92 | 127 | 3.83E-07 |
LRRC41_C | 149 | 0.91 | 50 | 7.06E-08 |
NFIC | 230 | 0.91 | 46 | 7.52E-05 |
FKBP11_A | 88 | 0.91 | 722 | 0.001236 |
C17orf107_A | 28 | 0.91 | 93 | 6.96E-12 |
SMTN | 273 | 0.90 | 87 | 2.18E-06 |
LRRC41_B | 148 | 0.90 | 93 | 9.19E-06 |
LRRC8D_A | 152 | 0.89 | 59 | 3.13E-06 |
OBSCN_A | 234 | 0.87 | 128 | 2.48E-05 |
MAX.chr7.104624356-104624730 | 204 | 0.86 | 403 | 0.000153 |
MIAT_B | 215 | 0.86 | 47 | 3.77E-05 |
组织对白细胞(血沉棕黄层)分析产生了129个高甲基化子宫内膜组织DMR,其中WBC中的噪音小于1%(表8)。表9示出了与EC血沉棕黄层对照相比较的表8中列举的标志物的曲线下面积、倍数变化和p值。
表8.WBC中噪声小于1%的高甲基化子宫内膜组织DMR
表9.EC与EC血沉棕黄层对照相比较的表8中列举的标志物的曲线下面积、倍数变化和p值。
从这些标志物组中选择了56个候选标志物作为初始试点。开发了甲基化特异性PCR测定并在两轮样品上进行了测试;那些被测序的样品和更大的独立队列。短扩增子引物(<150bp)被设计成靶向DMR中最具辨别力的CpG,并在对照上进行测试以确保完全甲基化的片段以线性方式稳健地扩增,而未甲基化和/或未转化的片段不会扩增。表10列出了56个候选标志物的112个引物序列和退火温度。
表10.
对第一轮验证的结果进行逻辑分析以确定AUC和倍数变化。从以前的工作中认识到,器官内癌症亚型的表观遗传学不同,并且最好的组来自亚型标志物的组合。组织和血沉棕黄层对照的分析是分开进行的。在表11(透明细胞EC与血沉棕黄层)、12(浆液性EC与血沉棕黄层)、13(癌肉瘤EC与血沉棕黄层)和14(子宫内膜样EC与血沉棕黄层)中突出显示结果。某些基因上的灰度红色阴影指示与多个亚型重叠的DMR。灰度红色阴影的程度指示标志物测定的辨别强度。许多测定在EC与血沉棕黄层样品具有100%的辨别率,并且在EC与良性子宫内膜比较中接近100%。
表11.区分1)透明细胞EC与血沉棕黄层和2)透明细胞EC与正常子宫内膜和正常宫颈阴道组织的DMR
表12.区分1)浆液性EC与血沉棕黄层和2)浆液性EC与正常子宫内膜和正常宫颈阴道组织的DMR
表13.区分1)癌肉瘤EC与血沉棕黄层和2)癌肉瘤EC与正常子宫内膜和正常宫颈阴道组织的DMR
表14.区分1)子宫内膜样EC与血沉棕黄层和2)子宫内膜样EC与正常子宫内膜和正常宫颈阴道组织的DMR
这些结果为用于独立样品测试的高性能候选者提供了丰富的来源。在最初的56个MDM中,选择33个。大多数都在0.90-1.00的AUC范围内,但包括具有极高FC数(非常少的背景)的MDM和/或表现出与其它MDM的互补性的那些MDM。所有MDM测定都展示了高分析性能-线性、效率、序列特异性(使用熔化曲线分析评估)和强扩增。
在第2轮验证中,与上一步一样,进行的实验是在一个批次中的整个样品和标志物组上运行。每个标志物运行约10ng FFPE来源的样品DNA-总共350个。表15、16、17、18和19中列出EC总体和亚型对比正常组织(组合)的结果。与BE(良性子宫内膜)相比,多个MDM在所有EC组织学中都显示出显著的甲基化倍数变化(10至>1000)。表20中列出了交叉验证的AUC。
表15.区分EC与正常子宫内膜组织的DMR。
表16.区分透明细胞EC与正常子宫内膜组织的DMR。
表17.区分浆液性EC与正常子宫内膜组织的DMR。
表18.区分癌肉瘤EC与正常子宫内膜组织的DMR。
表19.区分子宫内膜样EC与正常子宫内膜组织的DMR。
表20.
接着,数据以热矩阵格式绘制,允许互补性可视化。交叉验证的3-MDM图源自于rPART模拟(EMX2OS、NBPF8、SFMBT2),其以97%特异性和97%灵敏度以及0.98的AUC区分总体EC与BE(参见图1)。
一些MDM区分透明细胞组织学与BE和所有其它EC组织学(MDFI、GDF7_A、SEPTIN9、EEF1A2)并且C5orf52区分子宫内膜样组织学(G1/2E、G3E)与BE和所有其它EC组织学。
总之,全甲基化组测序、严格的过滤标准和生物学验证得出针对EC的出色候选MDM。一些MDM以相对较高的灵敏度区分所有EC组织学与BE,而另一些则准确地区分组织学。
实施例II.
本实施例描述了实施例I的材料和方法。
样品:
组织和血液从Mayo Clinic生物样本库获得,并接受机构IRB监督。样本的选择严格遵守主题研究授权和纳入/排除标准。癌症亚型包括1)浆液性EC,2)透明细胞EC,3)癌肉瘤EC,和4)子宫内膜样EC。对照包括非赘生物组织和全血来源的白细胞。对组织进行宏观解剖并由专门的GI病理学家审查组织学。样品经过年龄性别匹配,随机化并且是盲样。使用QIAamp DNA Tissue Mini试剂盒(冷冻组织)、QIAamp DNA FFPE Tissue试剂盒(FFPE组织)和QIAamp DNA Blood Mini试剂盒(血沉棕黄层样品)(Qiagen,Valencia CA)纯化来自113个冷冻组织(16个1/2级子宫内膜样(G1/2E)、16个3级子宫内膜样(G3E)、11个浆液性、11个透明细胞EC、15个子宫癌肉瘤、44个良性子宫内膜(BE)组织(14个增生、12个萎缩、18个增生紊乱)、70个福尔马林固定石蜡包埋(FFPE)宫颈癌(CC)(36个鳞状细胞癌、34个腺癌)和18个无癌女性的血沉棕黄层)的DNA。DNA用AMPure XP珠(Beckman-Coulter,Brea CA)重新纯化,并通过PicoGreen(Thermo-Fisher,Waltham MA)定量。使用qPCR评估DNA完整性。
测序:
RRBS测序文库是按照Meissner协议(参见Gu等人Nature Protocols 2011)并经过修改制备的。样品以4重形式合并,并通过Mayo Genomics Facility在Illumina HiSeq2500仪器(Illumina,San Diego CA)上进行测序。读数由Illumina管道模块处理,用于图像分析和碱基判读。使用Mayo开发的生物信息学套件SAAP-RRBS进行二次分析。简单地说,使用Trim-Galore清理读数,并与使用BSMAP构建的GRCh37/hg19参考基因组比对。对于覆盖率≥10X并且碱基质量得分≥20的CpG,甲基化比率通过计算C/(C+T)或对于映射到反向链的读数,相反地,计算G/(G+A)来确定。
生物标志物选择:
单个CpG按高甲基化比率排序,即给定基因座的甲基化胞嘧啶数量占该基因座总胞嘧啶计数的比率。对于病例,要求比率≥0.20(20%);对于组织对照,≤0.05(5%);对于血沉棕黄层对照,≤0.01(1%)。不符合这些标准的CpG被丢弃。随后,候选CpG通过基因组定位被分入DMR(差异甲基化区域),范围在大约60-200bp,每个区域的最小截止值为5个CpG。CpG密度过高(>30%)的DMR被排除在外,以避免在验证阶段出现GC相关的扩增问题。对于每个候选区域,创建了一个2D矩阵,将样品中的单个CpG与病例和对照的样品方式进行比较。分析总体EC与所有良性子宫内膜和/或无癌血沉棕黄层,以及亚型比较。然后将这些CpG矩阵与参考序列进行比较,以评估在初始过滤过程中是否丢弃了基因组连续的甲基化位点。从这个区域子集中,最终选择要求在每个样品水平上跨DMR序列的单个CpG协调和连续的高甲基化(在病例下)。相反,对照样品的甲基化程度必须至少比病例低10倍,并且CpG模式必须更加随机且不那么协调。要求亚型队列中至少10%的癌症样品对DMR内的每个CpG位点具有至少50%的高甲基化比率。
在单独的分析中,利用专有的DMR鉴定管道和回归包,根据CpG的平均甲基化值推导出DMR。比较EC病例、组织对照和血沉棕黄层对照之间平均甲基化百分比的差异;每个映射的CpG的100个碱基对内的平铺阅读框用于鉴定对照甲基化<5%的DMR;仅当覆盖的总深度为每个受试者平均10个读数并且亚组间的差异>0时才分析DMR。假设比值比的生物学相关增加>3x并且覆盖深度为10个读数,在双侧检验中,在5%的显著性水平和假设二项式方差膨胀因子为1下,每组需要≥18个样品才能达到80%的功效。
回归后,DMR按p值、接受者操作特征曲线下面积(AUC)和病例与所有对照之间的倍数变化差异排序。由于事先计划了独立验证,因此在此阶段没有对错误发现进行调整。
生物标志物验证:
选择DMR的一个子集进行进一步开发。标准主要是逻辑推导的ROC曲线下面积度量,它提供了对该区域辨别潜力的性能评估。选择0.85的AUC作为截止值。此外,计算甲基化倍数变化比(平均癌症高甲基化比率/平均对照高甲基化比率),组织与组织比较采用下限10,并且组织与血沉棕黄层比较采用下限20。要求p值小于0.01。DMR必须在平均和单个CpG选择过程中列出。使用MethPrimer(Li LC和Dahiya R.MethPrimer:designing primersfor methylation PCRs.Bioinformatics 2002年11月;18(11):1427-31PMID:12424112)为候选区域设计定量甲基化特异性PCR(qMSP)引物,并且对20ng(6250当量)的阳性和阴性基因组甲基化对照进行QC检查。测试多个退火温度以获得最佳辨别。在qMSP的两个阶段中进行验证。第一个阶段由重新测试已测序的DNA样品组成。这样做是为了验证DMR是真正具有辨别力的,而不是过度拟合极大的下一代数据集的结果。第二个阶段使用了更大的独立样品集:
组 | N |
子宫内膜癌-癌肉瘤 | 36 |
子宫内膜癌-透明细胞 | 22 |
子宫内膜癌-子宫内膜样1/2级 | 36 |
子宫内膜癌-子宫内膜样3级 | 36 |
子宫内膜癌-浆液性 | 32 |
良性子宫内膜-分泌 | 5 |
良性子宫内膜-增生 | 32 |
良性子宫内膜-萎缩 | 28 |
良性子宫内膜-增生紊乱 | 19 |
宫颈癌-鳞癌 | 36 |
宫颈癌-腺癌 | 36 |
这些组织像以前一样通过专家临床和病理审查进行鉴定。如前所述进行DNA纯化。EZ-96DNA甲基化试剂盒(Zymo Research,Irvine CA)用于亚硫酸氢盐转化步骤。在Roche480LightCyclers(Roche,Basel Switzerland)上使用SYBR Green检测扩增10ng转化的DNA(每个标志物)。连续稀释的通用甲基化基因组DNA(Zymo Research)用作定量标准。CpG不可知的ACTB(β-肌动蛋白)测定用作输入参考和标准化对照。结果表示为甲基化拷贝(特定标志物)/ACTB拷贝。
统计学:
对单个MDM(甲基化DNA标志物)性能的结果进行逻辑分析。对于标志物的组合,使用两种技术。首先,将rPart技术应用于整个MDM集并仅限于3个MDM的组合,在此基础上计算出rPart预测的癌症概率。第二种方法使用随机森林回归(rForest),它生成500个单独的rPart模型,这些模型与原始数据的boot strap样品拟合(大约2/3数据用于训练)并用于估计整个MDM组的交叉验证误差(1/3数据用于测试),并重复500次,以避免低估或高估真实交叉验证度量的虚假分开。然后将结果在500次迭代中取平均值。
实施例III.
本实施例描述了用于检测乳腺癌的子宫内膜癌组织标志物和血浆标志物的鉴定。
通过EC组织样品与正常子宫内膜组织样品的RRBS鉴定用于检测EC、透明细胞EC、浆液性EC、癌肉瘤EC和子宫内膜样EC的候选甲基化标志物。为了鉴定甲基化DNA标志物,每个患者组165个样品(即,19个良性、34个腺癌、36个鳞状细胞癌、15个癌瘤子宫内膜癌、11个透明细胞子宫内膜癌、5个子宫内膜样子宫内膜癌1级、11个子宫内膜样子宫内膜癌2级、16个子宫内膜样子宫内膜癌3级和18个正常血沉棕黄层)进行RRBS过程,然后与经过亚硫酸氢盐转化的人类基因组进行比对。选择子宫内膜癌中相对于正常子宫内膜和血沉棕黄层的甲基化比率高的CpG区域并映射到它们的基因名称。
通过RRBS选择标志物后,共鉴定出61个甲基化标志物,并设计和订购了富集靶标的长探针定量放大信号测定(通用技术参见例如WO2017/075061和美国专利申请序列号15,841,006)。表21示出了用于61个甲基化标志物的标志物染色体区域。表22和23示出了标志物的引物信息和探针信息。图2还提供了用于61个甲基化标志物的标志物染色体区域以及相关的引物和探针信息。
表21.所鉴定的区分EC组织与正常子宫内膜组织的甲基化区域。
表22.表21中所示的标志物的引物信息。
表23.表21中所示的标志物的探针信息。
所有开发的测定都与向Quasar670报告的参考测定B3GALT6三联(参见表26)。对156个具有以下分布和亚型的良性和癌症样品进行测定:21个宫颈癌腺癌、20个宫颈癌鳞癌、13个癌肉瘤子宫内膜癌、11个透明细胞子宫内膜癌、10个浆液性子宫内膜癌、4个子宫内膜样子宫内膜癌1级、9个子宫内膜样子宫内膜癌2级,16个子宫内膜样子宫内膜癌3级、16个良性宫颈阴道、6个子宫内膜良性萎缩、3个子宫内膜良性增生紊乱、6个子宫内膜良性增生、子宫内膜良性分泌、4个无异型性的复杂子宫内膜增生、10个有异型性的复杂子宫内膜增生综合征以及2个无异型性的单纯子宫内膜增生。
每个甲基化标志物的灵敏度以每个亚型的95%截止值计算并列于表24和25中。表24示出了表21中所示标志物对于癌肉瘤EC、透明细胞EC和浆液性EC的95%的子宫内膜组织灵敏度。表25示出了表21中所示标志物对于子宫内膜样EC 1级、子宫内膜样EC 2级和子宫内膜样EC 3级的95%的子宫内膜组织灵敏度。
表24.表21中所示标志物对于癌肉瘤EC、透明细胞EC和浆液性EC的95%的子宫内膜组织灵敏度。
表25.表21中所示标志物对于子宫内膜样EC 1级、子宫内膜样EC 2级和子宫内膜样EC 3级的95%的子宫内膜组织灵敏度。
对于这类测试,设置并完成了多重PCR反应。每个多重PCR反应都使用中间引物混合物设置,所述中间引物混合物含有每个标志物2μM正向引物和2μM反向引物。多重PCR反应1由以下每个标志物组成:AIM1_C、AGRN_B、C17orf107_B、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B、GDF7_B、FKBP11_B、LHFPL2_B、AKR7A3、LRRC41_D、LOC100129726_B和B3GALT6。多重PCR反应2由以下每个标志物组成:MAX.chr10:22624470-22624553、LRRC8D_B、MAX.chr7:104624356-104624513、MAX.chr14:103021654-103021725、MDFI_B、SPDYA_B、RHBDL1_B、OBSCN_B、SFMBT2_E、SEPT9_D、ST3GAL2_B、JSRP1_B、ITPKA和B3GALT6。多重PCR反应3由以下每个标志物组成:ZNF323_B、VILL、ZMIZ1_D、SLC13A5_B、C8orf73_B、MAX.chr8:145103900-145103993、KBTBD11_B、ARL5C、TRIM71_B、LOC100192379_C、STX16_B、LOC440925_B和B3GALT6。多重PCR反应4由以下每个标志物组成:TSPYL5、MPZ_B、TRH、CXCL12、IRF4、CNTN4、GRIN2A、NOTCH3、PAX1、ZNF521、VSX1、JAM3和B3GALT6。多重PCR反应5由以下每个标志物组成:CRHR2、FAM19A5、ASCL1、GLT1D1、T、CAPN2、RYR2_F、PTGDR、BARX1、ZNF671_B、SIM2和B3GALT6。
每个多重PCR反应的最终浓度为0.2μM反应缓冲液、0.075μM引物混合物、0.025μMHotstart Go Taq(5U/μL),产生25μL预混液,其与50μL DNA模板组合,最终反应体积为75μL。多重PCR的热分布需要12个循环,即95°5分钟的预孵育阶段,95°30秒、64°60秒的两步扩增阶段,以及4°冷却阶段,无限进行。多重PCR完成后,使用Te将PCR产物按1:10稀释,随后每个LQAS反应使用10μL。每个LQAS测定都以三重形式开发,由2个甲基化标志物和B3GALT6作为参考基因组成。每个LQAS测定都是使用每个甲基化标志物和B3GALT6的每个引物2μM、5μM每个甲基化标志物探针、每个带有2500μM dNTP的FRET盒5μM构建的。
从多重PCR产物1开始,运行以下6个LQAS测定(参见表26):(1.)AIM1_C、AGRN_B、B3GALT6;(2.)C17orf107_B、MAX.chr7:104624386-104624529、B3GALT6;(3.)EMX2OS、DIDO1_B、B3GALT6;(4.)GDF7_B、FKBP11_B、B3GALT6;(5.)LHFPL2_B、AKR7A3、B3GALT6;(6.)LRRC41_D、LOC100129726_B、B3GALT6。从多重PCR产物2中,运行以下7个LQAS测定(参见表26):(1.)MAX.chr10:22624470-22624553、LRRC8D_B、B3GALT6;(2.)MAX.chr7:104624356-104624513、MAX.chr14:103021654-103021725、B3GALT6;(3.)MDFI、SPDYA_B、B3GALT6;(4.)RHBDL1_B、OBSCN_B、B3GALT6;(5.)SFMBT2_E、SEPT9_D、B3GALT6;(6.)ST3GAL2_B、JSRP1_B、B3GALT6;(7.)ITPKA、B3GALT6。从多重PCR产物3,运行以下6个LQAS测定(参见表26):(1.)ZNF323_B、VILL、B3GALT6;(2.)ZMIZ1_D、SLC13A5_B、B3GALT6;(3.)C8orf73_B、MAX.chr8:145103900-145103993、B3GALT6;(4.)KBTBD11_B、ARL5C、B3GALT6;(5.)TRIM71_B、LOC100192379_C、B3GALT6;(6.)STX16_B、LOC440925_B和B3GALT6。从多重PCR产物4,运行以下6个LQAS测定(参见表26):(1.)TSPYL5、MPZ_B、B3GALT6;(2.)TRH、CXCL12、B3GALT6;(3.)IRF4、CNTN4、B3GALT6;(4.)GRIN2A、NOTCH3、B3GALT6;(5.)PAX1、ZNF521、B3GALT6;(6.)VSX1、JAM3和B3GALT6。从多重PCR产物5,运行以下5个LQAS测定(参见表26):(1.)EMX1、ARHGEF4、BTACT;(2.)OPLAH、CYP26C1、BTACT;(3.)ZNF781、DLX4、BTACT;(4.)PTGDR、KLHDC7B、BTACT;(5.)GRIN2D、chr17_737和BTACT。从多重PCR产物6,运行以下6个LQAS测定(参见表27):(1.)CRHR2、FAM19A5、B3GALT6;(2.)ASCL1、GLT1D1、B3GALT6;(3.)T、CAPN2、B3GALT6;(4.)RYR2_F、PTGDR、B3GALT6;(5.)BARX1、ZNF671_B、B3GALT6;(6.)SIM2和B3GALT6。
表26.LQAS三重测定
所有LQAS测定均采用先前公布的标准条件进行设置和运行。
现在已经充分描述了本发明,本领域技术人员应理解,本发明可以在不影响本发明或其任何实施方案的范围下在广泛并等同范围的条件、制剂和其它参数内进行。本文中引用的所有专利、专利申请和公布都完全以引用的方式整体并入本文。
以引用的方式并入
本文中所提及的每一个专利文献和科技文章的全部公开内容都出于全部目的以引用的方式并入。
等效方案
在不脱离本发明的精神或基本特征的情况下,本发明能以其它具体形式来实施。因此,前述实施方案在所有方面都应被视为说明性的,而非是对本文中描述的本发明的限制。因此,本发明的范围是由随附权利要求书而非由上述描述所指示,并且属于权利要求书的等效含义和范围内的所有变化都意图包括在其中。
序列表
<110> 梅约医学教育与研究基金会(MAYO FOUNDATION FOR MEDICAL EDUCATION ANDRESEARCH)
精密科学发展有限责任公司(EXACT SCIENCES DEVELOPMENT COMPANY, LLC)
<120> 检测子宫内膜癌
<130> EXCTM-37456.601
<140> PCT/US2020/015059
<141> 2020-01-24
<150> US 62/796,384
<151> 2019-01-24
<160> 589
<170> PatentIn version 3.5
<210> 1
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 1
gcgcgcggtt ttgggagata agtac 25
<210> 2
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 2
aaaaaaaaca acccctcgcc tcgac 25
<210> 3
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 3
aggtttttag gatatttagt tgagtggcgg 30
<210> 4
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 4
acctcgatcc cgaattcgaa ttcgac 26
<210> 5
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 5
gttttcggtt attcggtgac gg 22
<210> 6
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 6
aaaaaactaa aaaacgaatc gcgct 25
<210> 7
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 7
tttaatgatc gattaatcgt aaaggtcgg 29
<210> 8
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 8
aaccaataaa ctcaaaacga ctaacgca 28
<210> 9
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 9
ttaggttttt agggggtttc ggcgt 25
<210> 10
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 10
atcgtcttca ctactctata ccgtc 25
<210> 11
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 11
aattgggtaa ggagaagtcg gtcgt 25
<210> 12
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 12
ataacgaaac ttaaacctcc ccgca 25
<210> 13
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 13
agttaagttt taacgggtgt ggcgg 25
<210> 14
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 14
aaacgtcgat aaaacgaacg tcgta 25
<210> 15
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 15
tatcgttgtt tcgagtcggg gacga 25
<210> 16
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 16
aaccgaaatt ccgacgacta cacgt 25
<210> 17
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 17
ggttcggagc ggtttaaata agcga 25
<210> 18
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 18
cttaaccctt cccgcctatc cgtc 24
<210> 19
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 19
ttgggggttg tcggtttttg gagac 25
<210> 20
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 20
ccgatctaaa taccccaaac gaaatcgaa 29
<210> 21
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 21
cgtttttaga tttagtggtg ggaatcgg 28
<210> 22
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 22
tcgaacgaaa aaaatcgaac tcgta 25
<210> 23
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 23
tttttcgcgg gtcgtttatt ttcgt 25
<210> 24
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 24
aaacgaataa actcgaacta tatcgaa 27
<210> 25
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 25
ttacgatcgg attatagggg ttacgg 26
<210> 26
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 26
taccgaatct aaaaacgaaa acgaa 25
<210> 27
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 27
ggggagttat aggggtgaag gtcgc 25
<210> 28
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 28
gcctccgcca aactcgctac gtc 23
<210> 29
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 29
tatttggcgc gtggggagag gtc 23
<210> 30
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 30
tcccttccga aaattctacg acgaa 25
<210> 31
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 31
ttttagggta aatagcgggt ttcgt 25
<210> 32
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 32
cgaccgccct acatacaatt catccg 26
<210> 33
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 33
gtgtgataga cgttagagcg gcgg 24
<210> 34
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 34
cgttttaatc aaaaaaatct cccgta 26
<210> 35
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 35
gggagaattc gagtagtagt tgtaaacgg 29
<210> 36
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 36
aataacctcg ctaccaacca cccgc 25
<210> 37
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 37
gggcgttgtt tcgttttttt tatcgt 26
<210> 38
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 38
gaaacgcgct tacccgtcga a 21
<210> 39
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 39
gttcgttatc gtttggtttt gtataacgt 29
<210> 40
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 40
tatatcttat catccgacgt ctcgca 26
<210> 41
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 41
tatttgggat ttagagaggt agcgg 25
<210> 42
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 42
ccaaaaaccg aaacctaaac gct 23
<210> 43
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 43
ttttatttcg tagacgattt ttcgt 25
<210> 44
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 44
gaaaaaaccg caactccgcg c 21
<210> 45
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 45
aataatagga attagaggtt gtcgg 25
<210> 46
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 46
aaataacaaa ctccgcgcgc gaa 23
<210> 47
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 47
tacggttcgt acgagtgagt ggacgt 26
<210> 48
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 48
acgccgaaaa cgaacaaaaa acgat 25
<210> 49
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 49
ggttttgggg gatttagggt tcgg 24
<210> 50
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 50
tccgcgaaaa cccctaccta acgtc 25
<210> 51
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 51
tttttcgtag cgatcgtagc ggcgt 25
<210> 52
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 52
acctactaaa caaaccaaaa acgaa 25
<210> 53
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 53
ttcgtttaga aggcgggtgg aaggtc 26
<210> 54
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 54
aaaaaatctc gcgcgaaaat acgct 25
<210> 55
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 55
ggaaggttag ggggaaattt gtatttcgt 29
<210> 56
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 56
cgtaacatcg tcatttctta accgcgat 28
<210> 57
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 57
tttcgtatta aaattttatg ggcgt 25
<210> 58
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 58
tctaatcccg cgaacgcaac cg 22
<210> 59
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 59
tagttttgtt taggggtagg aggaatagaa agcg 34
<210> 60
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 60
acaccaacgc ttaccccgcg aa 22
<210> 61
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 61
ttttcgatcg tggatgttcg gagtc 25
<210> 62
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 62
gaaaaccgcg cgactcttac cgaa 24
<210> 63
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 63
gggaggggtc gtaggagtgt tttcg 25
<210> 64
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 64
ataacgttct accgcctttc ccctacgc 28
<210> 65
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 65
gaaagcgaaa cggtttcggc gtc 23
<210> 66
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 66
caaacttccg aatcctaccc ccgc 24
<210> 67
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 67
tcgagagagg tcggtttttt ttatcgt 27
<210> 68
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 68
aaacttccga tcacgacccc acgtc 25
<210> 69
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 69
tcgttggtaa atggagttac gg 22
<210> 70
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 70
gaaaaaacta taaaaaaacg aacgat 26
<210> 71
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 71
gtatttatcg cgttttcgag ttcga 25
<210> 72
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 72
tataacgcga ccccaacgct 20
<210> 73
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 73
gtagtcggag ggagatttcg tcgg 24
<210> 74
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 74
ataaacttaa ccgaccacgc tcgaa 25
<210> 75
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 75
cgggttgtaa ttcgagtcgt cga 23
<210> 76
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 76
caaaacctcc gaaaaaaatc cgaa 24
<210> 77
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 77
gtatagggcg tcgtttttag ttcga 25
<210> 78
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 78
aaaaaatcta ccgaaaaatt ccgaa 25
<210> 79
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 79
ttggtttaat tcgttattcg tttcgt 26
<210> 80
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 80
aacaaacctt ttccgcttcg acgta 25
<210> 81
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 81
cgaagttcgg gtagggtaag cgttgc 26
<210> 82
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 82
cgacgtaaaa atacgaaacg cacgaa 26
<210> 83
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 83
gtgaggcggt tatacgagtt tcggc 25
<210> 84
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 84
caaaaaacct ccacaaaata aacgat 26
<210> 85
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 85
tttttcgagt cgttttattt cgcgg 25
<210> 86
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 86
gaactccgaa cgccgcttaa acgta 25
<210> 87
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 87
cgcgtaggtg tttaacgtga ttagcgc 27
<210> 88
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 88
cttacatcct caaaacccgc ccgac 25
<210> 89
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 89
ttatggtggc ggtgtcggga gttac 25
<210> 90
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 90
ccctctccta aaaaccccgc tcgat 25
<210> 91
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 91
agttcgcgtt cggttttttt gttcg 25
<210> 92
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 92
gtccgtcccg atcgcaatac ga 22
<210> 93
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 93
cgcgttgcgc ggaagttaga gtc 23
<210> 94
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 94
ccacataaaa tcgaaaaaac cgcgaa 26
<210> 95
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 95
gggtttataa gttcggaggt cga 23
<210> 96
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 96
cacccaacac ctaacgacga 20
<210> 97
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 97
agcgttttta gggagttcgg cgttc 25
<210> 98
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 98
aatcgaaaaa acgaaaaaaa tcgca 25
<210> 99
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 99
ggggcgtata tattagttat cgagcga 27
<210> 100
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 100
aaaaaaaacc ctaaaaaccg ccgaa 25
<210> 101
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 101
taggtcgttt cgtcgtgcgc 20
<210> 102
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 102
ataaccttac cgacgccgcc gct 23
<210> 103
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 103
tttttgaaga gatcgttttc gacgg 25
<210> 104
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 104
cccccttaaa ccttaacccg aa 22
<210> 105
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 105
ggcgtttcga ttttttcgtt cgg 23
<210> 106
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 106
ccgaaactcc aacatctacc taacacgcc 29
<210> 107
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 107
cgtaattttt ggcgagcgac gtttgc 26
<210> 108
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 108
caaccttcga aatcccccat ccgct 25
<210> 109
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 109
ggttgcgagt acggtaaggt tt 22
<210> 110
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 110
aaaactcaaa ataccgaaac gcc 23
<210> 111
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 111
ttgagagcgt tgttagggac gac 23
<210> 112
<400> 112
000
<210> 113
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 113
cgcgtttaac gccacctc 18
<210> 114
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 114
aacgtaaaat cgaactcgta aacgac 26
<210> 115
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 115
cgaagtttta tttcgattcg ggttgtatcg 30
<210> 116
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 116
ccacgccata tccccgc 17
<210> 117
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 117
aggttatcgg gtagcgttta gg 22
<210> 118
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 118
cgtacccctc ccccgctac 19
<210> 119
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 119
gtcgtttacg cgagcgacg 19
<210> 120
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 120
ctcgaacaaa acaaacgcta cgtaac 26
<210> 121
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 121
ggtttttatt tggagggttc ggac 24
<210> 122
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 122
actactcaat acgacgatat accgaac 27
<210> 123
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 123
tcgttcgttt tttcggtttt tggtc 25
<210> 124
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 124
ccttctaaac gaaaacaacg actaacgaaa 30
<210> 125
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 125
tagcgttttg tcgttttttt tttgcgt 27
<210> 126
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 126
cgcaaaaata cccccgaaaa ac 22
<210> 127
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 127
ggagggcggt tagtagcgt 19
<210> 128
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 128
acgatatcgc tacgcgacga aa 22
<210> 129
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 129
gttgtggtgt aatttgggtc gc 22
<210> 130
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 130
acacgcgcga tacgttacac 20
<210> 131
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 131
cgttcgtata gttcgaatag ggcg 24
<210> 132
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 132
cgacgccaac gaaaaactc 19
<210> 133
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 133
ggagaattcg agtagtagtt gtaaacgga 29
<210> 134
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 134
caaccacccg cccgcc 16
<210> 135
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 135
tgtttacgtg gtatcgttat tttttaatcg c 31
<210> 136
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 136
cgacgaccgc gaaaaaaaaa aacc 24
<210> 137
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 137
tcgtggggaa tagtaggacg gc 22
<210> 138
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 138
cctcccgaca aataaacgcg a 21
<210> 139
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 139
ggaggtaggt tcgcgcgg 18
<210> 140
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 140
ccaactcaat tcctcctccg c 21
<210> 141
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 141
gaggaggaat tgagttggcg c 21
<210> 142
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 142
caacccataa tccgatccta tcttcga 27
<210> 143
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 143
ttcgtacgag tgagtggacg 20
<210> 144
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 144
caaaaaacga ttcccccgca aa 22
<210> 145
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 145
tggagattta cgtcgagggc 20
<210> 146
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 146
ccacgatcga caaaacctac gt 22
<210> 147
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 147
gcgcgtgttt tggtcgc 17
<210> 148
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 148
tcgtccgcct acccgccc 18
<210> 149
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 149
ggagttacgt tgtttttggg tttcg 25
<210> 150
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 150
ctctcctaaa aaccccgctc 20
<210> 151
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 151
ggatcgggat cgaagtttgg agaa 24
<210> 152
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 152
cttatctccc aaaaccgcgc 20
<210> 153
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 153
ttggttgttt aatcgaaggg aagtaaac 28
<210> 154
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 154
ctacctccct taaacacgtc tcg 23
<210> 155
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 155
gggcgtagtt attttatagc gc 22
<210> 156
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 156
caccaaaaaa aaacgatcgc tacgaaa 27
<210> 157
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 157
cggggaagac ggaggtg 17
<210> 158
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 158
aaacccctac ctaacgtctc cc 22
<210> 159
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 159
cggggttgta gtattttaat gatcga 26
<210> 160
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 160
cttcaaccaa taaactcaaa acgactaacg 30
<210> 161
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 161
ggcgtttttt cgcggttttg 20
<210> 162
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 162
gcgtcccaca aaccccg 17
<210> 163
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 163
cgtagggtgg gtggttacgt tc 22
<210> 164
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 164
aacttcccac gacccg 16
<210> 165
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 165
gttacgcggt ttttattttt gtgatttttc g 31
<210> 166
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 166
ctcattaact tccaaaaaac aaactaactc gtc 33
<210> 167
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 167
gagttcgacg gtcgaggcg 19
<210> 168
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 168
actacgccct cccacgc 17
<210> 169
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 169
tcgttttagc ggcggaagg 19
<210> 170
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 170
ccgcgaacca ccgc 14
<210> 171
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 171
ggttgtagtt ggagggcgag 20
<210> 172
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 172
cgaaacgccc tcgcga 16
<210> 173
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 173
gttgtgtaag gagatgtgcg gttc 24
<210> 174
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 174
aaacgacgac gcgaacgaa 19
<210> 175
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 175
cgtagtgcgt tttcgcgagt c 21
<210> 176
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 176
cgccctaaaa cattaaaaat acgaaaccg 29
<210> 177
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 177
gtttcggggt ttgttaagag acg 23
<210> 178
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 178
actactacga atttcctacg attataactt cg 32
<210> 179
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 179
agtttttagt tcggttcgcg c 21
<210> 180
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 180
cccgaaaacg cttcgcaacg 20
<210> 181
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 181
gataaggtag ggaagttgtg gcg 23
<210> 182
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 182
cctctaatat cactaacaaa ccccatcg 28
<210> 183
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 183
cgcggtgagt tgcggtaac 19
<210> 184
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 184
cgaaatactt accgctatcg atctaatcga 30
<210> 185
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 185
ggtagttcga atttcggcgc 20
<210> 186
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 186
ctccctcccg acgctcg 17
<210> 187
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 187
gtagtttttc ggcggcgacg 20
<210> 188
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 188
ccttatttac cgccgtacgc t 21
<210> 189
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 189
ggtcgcgttt tgtttggcg 19
<210> 190
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 190
cgcgcgtcga aaaaaaacgc g 21
<210> 191
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 191
cgatcgtgta gaaggttgta gcg 23
<210> 192
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 192
tttcccgcaa ccaactatac gcg 23
<210> 193
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 193
cgggatttag cgggttcgg 19
<210> 194
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 194
cccgaaaacg aaaaacaaaa aacgac 26
<210> 195
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 195
tcggggtgtt ttcgtagttg ttaaatttac 30
<210> 196
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 196
cattctttta accgccaaaa cgcg 24
<210> 197
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 197
gggttttggt tttcgttagt ttagtttc 28
<210> 198
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 198
acaactctaa acgaccgaaa ataacg 26
<210> 199
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 199
gcggtcggag tttagttagc g 21
<210> 200
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 200
acctacgact acctcctaaa cgcg 24
<210> 201
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 201
gtcgtagttt tagtagtttt ttttgtcgtt cg 32
<210> 202
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 202
cgaccgccgc gactac 16
<210> 203
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 203
gacgcggggc gtttagt 17
<210> 204
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 204
cgactcgaaa cgaccccga 19
<210> 205
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 205
ggagttttag gcggcgttac g 21
<210> 206
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 206
accgcgaaaa cacccgac 18
<210> 207
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 207
gttcgcgcgg ttttacggt 19
<210> 208
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 208
cgcccttctc ctcccgc 17
<210> 209
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 209
ggaggtttcg cgtttcgatt a 21
<210> 210
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 210
cgaacgatcc ccgcctac 18
<210> 211
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 211
ggtttagcgc gggtttttcg 20
<210> 212
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 212
ccccgaactt cccgaact 18
<210> 213
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 213
ttttcgttga ttttattcga gtcgtc 26
<210> 214
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 214
gaaccctctt caaataaacc gc 22
<210> 215
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 215
tggtcgtttt agcgttatgt cg 22
<210> 216
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 216
cgaaaactac aaaccgcgc 19
<210> 217
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 217
cgttaatttg ttagatagag ggcg 24
<210> 218
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 218
tccgaacaac cgcctac 17
<210> 219
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 219
gttgtcggga gcggtagg 18
<210> 220
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 220
ccaatatccc gaaacgcgtc t 21
<210> 221
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 221
tttgtttcgg tttttggcg 19
<210> 222
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 222
cgccaccata aacgacc 17
<210> 223
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 223
ggttaggggt ggagttcgtt a 21
<210> 224
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 224
actccgaact ctactcatcc tttc 24
<210> 225
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 225
tcggcggttt ttagtaaaag cg 22
<210> 226
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 226
aaatctcccg tcccactcc 19
<210> 227
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 227
gggttcgggg atttataatt acgg 24
<210> 228
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 228
ctaaatcacc tcctactact aacgctaata ac 32
<210> 229
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 229
cgcgccgagg ccgtacccac gtcca 25
<210> 230
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 230
aggccacgga cgcgtcgtcg aacaccg 27
<210> 231
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 231
cgcgccgagg cgtcgaacac cttcgac 27
<210> 232
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 232
aggccacgga cgcgactacg ccacgtaaa 29
<210> 233
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 233
cgcgccgagg gtttcggttt ttgggagg 28
<210> 234
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 234
aggccacgga cgcgacaact aaaactccgt acg 33
<210> 235
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 235
cgcgccgagg cgggattttc ggtttcga 28
<210> 236
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 236
aggccacgga cgcgtttacg tatatagtcg gtagt 35
<210> 237
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 237
cgcgccgagg cgctcacgaa ctaaacgatc c 31
<210> 238
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 238
aggccacgga cgtcgttagg tttcgtttcg t 31
<210> 239
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 239
cgcgccgagg cggttttcgc ggga 24
<210> 240
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 240
aggccacgga cgcgacctcg aaccccaa 28
<210> 241
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 241
cgcgccgagg ccgctcgctc acaa 24
<210> 242
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 242
aggccacgga cgcggtttta cgaaatgtaa attt 34
<210> 243
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 243
cgcgccgagg cgtcgaggtc gtttcg 26
<210> 244
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 244
aggccacgga cggcggaagt gcgtt 25
<210> 245
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 245
cgcgccgagg cgcgggttag ttgtt 25
<210> 246
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 246
aggccacgga cgatacgcgc ctccca 26
<210> 247
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 247
cgcgccgagg cgttcgttat cgtttggttt 30
<210> 248
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 248
aggccacgga cgcctaccgc acacgc 26
<210> 249
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 249
cgcgccgagg cgatcctacc gacctcga 28
<210> 250
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 250
aggccacgga cgcgctcccg cccttct 27
<210> 251
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 251
cgcgccgagg cggttttaac gtaagtttga ttg 33
<210> 252
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 252
aggccacgga cgcggtcgag gtggga 26
<210> 253
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 253
cgcgccgagg gcgggtggag aagg 24
<210> 254
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 254
aggccacgga cggcgggtgg agaagg 26
<210> 255
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 255
aggccacgga cggcatttcc gacctttacg a 31
<210> 256
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 256
cgcgccgagg gaaaaataac cccgccc 27
<210> 257
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 257
aggccacgga cgcgtagggt tcgcgag 27
<210> 258
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 258
cgcgccgagg cgatacatcc gcgcg 25
<210> 259
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 259
aggccacgga cggcggattg agtttcgtg 29
<210> 260
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 260
aggccacgga cggcgcggtt attttttcgt 30
<210> 261
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 261
cgcgccgagg gcgcgtcgtt cgtatattt 29
<210> 262
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 262
aggccacgga cgcgtcggcg tcgtttt 27
<210> 263
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 263
cgcgccgagg gcgttaaaaa cctcgcg 27
<210> 264
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 264
cgcgccgagg gcgttatact ctttctctaa acac 34
<210> 265
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 265
aggccacgga cgcggcgatt tagttttttg tcg 33
<210> 266
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 266
cgcgccgagg gacctccgaa cttataaacc c 31
<210> 267
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 267
aggccacgga cgcgggaagt ttcgttagtg g 31
<210> 268
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 268
cgcgccgagg cgttaggttt ttttagtcgt cg 32
<210> 269
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 269
aggccacgga cgtctcgaaa cgaataaccg c 31
<210> 270
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 270
cgcgccgagg gctacgctaa acgccg 26
<210> 271
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 271
aggccacgga cggatcgaaa acacacaacc c 31
<210> 272
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 272
cgcgccgagg ggcgggcgta ttagt 25
<210> 273
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 273
aggccacgga cgcgggtcgc gtttagg 27
<210> 274
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 274
aggccacgga cgcgattttt cgggtagttt ttgg 34
<210> 275
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 275
cgcgccgagg ggtttttcgg tcgagatg 28
<210> 276
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 276
aggccacgga cgcgaccgta acaaaaaaac aaac 34
<210> 277
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 277
cgcgccgagg acgcgactaa aaaaaaccta ac 32
<210> 278
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 278
aggccacgga cgcgccgaaa caaactaatc c 31
<210> 279
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 279
cgcgccgagg cgcgaaactt caaaaatacg a 31
<210> 280
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 280
aggccacgga cgattcgcgt tcgagcg 27
<210> 281
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 281
aggccacgga cggcggtagt ggtcgtag 28
<210> 282
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 282
aggccacgga cgcgtttggc gtagatataa gc 32
<210> 283
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 283
aggccacgga cgccgcgcta ccgcta 26
<210> 284
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 284
cgcgccgagg ccgcgctacc gcta 24
<210> 285
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 285
aggccacgga cgcgaaaaat cccacgc 27
<210> 286
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 286
cgcgccgagg gcgtttcgat cgggg 25
<210> 287
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 287
aggccacgga cggcgggagg attttcgatt tc 32
<210> 288
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 288
cgcgccgagg cgtaactcca tctcgataac c 31
<210> 289
<211> 90
<212> DNA
<213> 智人(Homo sapiens)
<400> 289
gggctgcgag cacggcaagg tctctcaggc ttgtggacgt gggtacgggc gtctcggcac 60
cctgagcttt ctcccctacc cgccccagcg 90
<210> 290
<211> 90
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 290
gggttgcgag tacggtaagg ttttttaggt ttgtggacgt gggtacgggc gtttcggtat 60
tttgagtttt tttttttatt cgttttagcg 90
<210> 291
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 291
ggttgcgagt acggtaaggt tt 22
<210> 292
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 292
aaaactcaaa ataccgaaac gcc 23
<210> 293
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 293
cgcgccgagg ccgtacccac gtcca 25
<210> 294
<211> 93
<212> DNA
<213> 智人(Homo sapiens)
<400> 294
cgcggacgcc gagctccctg agagcgctgc cagggacgac gcggtgttcg acgacgaggt 60
ggcgccaaac gcggccagcg ataacgcctc ggc 93
<210> 295
<211> 93
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 295
cgcggacgtc gagttttttg agagcgttgt tagggacgac gcggtgttcg acgacgaggt 60
ggcgttaaac gcggttagcg ataacgtttc ggt 93
<210> 296
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 296
ttgagagcgt tgttagggac gac 23
<210> 297
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 297
cgcgtttaac gccacctc 18
<210> 298
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 298
aggccacgga cgcgtcgtcg aacaccg 27
<210> 299
<211> 97
<212> DNA
<213> 智人(Homo sapiens)
<400> 299
gagacgggct cgggccccgc ccaccggcgg gtgcagctga gggcgcggcc gaaggtgccc 60
gacgccgccc acgagctcga ctccacgctc ggctact 97
<210> 300
<211> 97
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 300
gagacgggtt cgggtttcgt ttatcggcgg gtgtagttga gggcgcggtc gaaggtgttc 60
gacgtcgttt acgagttcga ttttacgttc ggttatt 97
<210> 301
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 301
cgggtttcgt ttatcggcgg 20
<210> 302
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 302
aacgtaaaat cgaactcgta aacgac 26
<210> 303
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 303
cgcgccgagg cgtcgaacac cttcgac 27
<210> 304
<211> 139
<212> DNA
<213> 智人(Homo sapiens)
<400> 304
ggcggggctt aggggacgag gttagtacga agccccaccc cgacccgggc tgcaccgccc 60
cctccgcgct tacgtggcgc agccgcgggg acatggcgtg ggtggtgggc gtccgctggg 120
acacgttgag cacgatgac 139
<210> 305
<211> 139
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 305
ggcggggttt aggggacgag gttagtacga agttttattt cgattcgggt tgtatcgttt 60
ttttcgcgtt tacgtggcgt agtcgcgggg atatggcgtg ggtggtgggc gttcgttggg 120
atacgttgag tacgatgat 139
<210> 306
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 306
cgaagtttta tttcgattcg ggttgtatcg 30
<210> 307
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 307
ccacgccata tccccgc 17
<210> 308
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 308
aggccacgga cgcgactacg ccacgtaaa 29
<210> 309
<211> 101
<212> DNA
<213> 智人(Homo sapiens)
<400> 309
gccgaggcca ccgggcagcg tccaggtctc ggcctttggg aggggagcag cgggggaggg 60
gcacggggag gggcgagggc ggggcgcgcc tgggcctcgg c 101
<210> 310
<211> 101
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 310
gccgaggtta tcgggtagcg tttaggtttc ggtttttggg aggggagtag cgggggaggg 60
gtacggggag gggcgagggc ggggcgcgtt tgggtttcgg t 101
<210> 311
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 311
aggttatcgg gtagcgttta gg 22
<210> 312
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 312
cgtacccctc ccccgctac 19
<210> 313
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 313
cgcgccgagg gtttcggttt ttgggagg 28
<210> 314
<211> 90
<212> DNA
<213> 智人(Homo sapiens)
<400> 314
cgctgtgagt cgcccacgcg agcgacgtgg ggatacgggg cgcacggagt ctcagctgcc 60
gccacgcagc gcttgccctg cccgagcttc 90
<210> 315
<211> 90
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 315
cgttgtgagt cgtttacgcg agcgacgtgg ggatacgggg cgtacggagt tttagttgtc 60
gttacgtagc gtttgttttg ttcgagtttt 90
<210> 316
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 316
gtcgtttacg cgagcgacg 19
<210> 317
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 317
ctcgaacaaa acaaacgcta cgtaac 26
<210> 318
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 318
aggccacgga cgcgacaact aaaactccgt acg 33
<210> 319
<211> 110
<212> DNA
<213> 智人(Homo sapiens)
<400> 319
tgagggtcgg gactatctcc tcaccagggt ctccacttgg agggtccgga cgggactttc 60
ggtttcgagc ccagcctcag cccggcacac cgccgcactg agcagcagca 110
<210> 320
<211> 110
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 320
tgagggtcgg gattattttt ttattagggt ttttatttgg agggttcgga cgggattttc 60
ggtttcgagt ttagttttag ttcggtatat cgtcgtattg agtagtagta 110
<210> 321
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 321
ggtttttatt tggagggttc ggac 24
<210> 322
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 322
actactcaat acgacgatat accgaac 27
<210> 323
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 323
cgcgccgagg cgggattttc ggtttcga 28
<210> 324
<211> 129
<212> DNA
<213> 智人(Homo sapiens)
<400> 324
gccatcccgg ggctctgcgc cgtccgctct cccggctcct ggccgctcac gcacacagcc 60
ggtagctggt tttcgttagc cgctgccctc gcccagaagg cgggtggaag gtcgccagtt 120
ggacgcaca 129
<210> 325
<211> 129
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 325
gttatttcgg ggttttgcgt cgttcgtttt ttcggttttt ggtcgtttac gtatatagtc 60
ggtagttggt tttcgttagt cgttgttttc gtttagaagg cgggtggaag gtcgttagtt 120
ggacgtata 129
<210> 326
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 326
tcgttcgttt tttcggtttt tggtc 25
<210> 327
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 327
ccttctaaac gaaaacaacg actaacgaaa 30
<210> 328
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 328
aggccacgga cgcgtttacg tatatagtcg gtagt 35
<210> 329
<211> 119
<212> DNA
<213> 智人(Homo sapiens)
<400> 329
gtagcgttct gccgcctttc ccctgcgccc tctctgggga ccgctcagct cgtgagcgcc 60
ccccgggggc actcctgcga cccctccctt gctaggggcc tcctacagcc cgtggtcgg 119
<210> 330
<211> 119
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 330
gtagcgtttt gtcgtttttt ttttgcgttt tttttgggga tcgtttagtt cgtgagcgtt 60
tttcgggggt atttttgcga tttttttttt gttaggggtt ttttatagtt cgtggtcgg 119
<210> 331
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 331
tagcgttttg tcgttttttt tttgcgt 27
<210> 332
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 332
cgcaaaaata cccccgaaaa ac 22
<210> 333
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 333
cgcgccgagg cgctcacgaa ctaaacgatc c 31
<210> 334
<211> 109
<212> DNA
<213> 智人(Homo sapiens)
<400> 334
cggacccaga gcaccgcctg cggcctcacc taggggagag ggagggcggt tagcagcgcc 60
gccaggcccc gccccgcctt cccgccgcgc agcgacaccg tccaagtcc 109
<210> 335
<211> 109
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 335
cggatttaga gtatcgtttg cggttttatt taggggagag ggagggcggt tagtagcgtc 60
gttaggtttc gtttcgtttt ttcgtcgcgt agcgatatcg tttaagttt 109
<210> 336
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 336
ggagggcggt tagtagcgt 19
<210> 337
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 337
acgatatcgc tacgcgacga aa 22
<210> 338
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 338
aggccacgga cgtcgttagg tttcgtttcg t 31
<210> 339
<211> 88
<212> DNA
<213> 智人(Homo sapiens)
<400> 339
cgacgggaag cccgagaagc tgaggctgtg gtgcaacttg ggccgcggct cccgcgggaa 60
gcccaggtgc aacgcatcgc gcgtgcca 88
<210> 340
<211> 88
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 340
cgacgggaag ttcgagaagt tgaggttgtg gtgtaatttg ggtcgcggtt ttcgcgggaa 60
gtttaggtgt aacgtatcgc gcgtgtta 88
<210> 341
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 341
gttgtggtgt aatttgggtc gc 22
<210> 342
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 342
acacgcgcga tacgttacac 20
<210> 343
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 343
cgcgccgagg cggttttcgc ggga 24
<210> 344
<211> 84
<212> DNA
<213> 智人(Homo sapiens)
<400> 344
gctcaccgcc cgcccgcaca gctcgaacag ggcgggggga gcgttggggc ccgaggccga 60
gctcttcgct ggcgccgcct cccg 84
<210> 345
<211> 84
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 345
gtttatcgtt cgttcgtata gttcgaatag ggcgggggga gcgttggggt tcgaggtcga 60
gtttttcgtt ggcgtcgttt ttcg 84
<210> 346
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 346
cgttcgtata gttcgaatag ggcg 24
<210> 347
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 347
cgacgccaac gaaaaactc 19
<210> 348
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 348
aggccacgga cgcgacctcg aaccccaa 28
<210> 349
<211> 110
<212> DNA
<213> 智人(Homo sapiens)
<400> 349
cggcggagga agcgtggagt ccattgatct aggtacttgt ggggagggga gaacccgagc 60
agcagctgca aacggaaggg ctgtgagcga gcgggcgggc gggtggctgg 110
<210> 350
<211> 110
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 350
cggcggagga agcgtggagt ttattgattt aggtatttgt ggggagggga gaattcgagt 60
agtagttgta aacggaaggg ttgtgagcga gcgggcgggc gggtggttgg 110
<210> 351
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 351
ggagaattcg agtagtagtt gtaaacgga 29
<210> 352
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 352
caaccacccg cccgcc 16
<210> 353
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 353
cgcgccgagg ccgctcgctc acaa 24
<210> 354
<211> 87
<212> DNA
<213> 智人(Homo sapiens)
<400> 354
cttgtctacg tggcatcgtc atttcttaac cgcggtttta cgaaatgcaa atttccccct 60
ggccttcctc ctccgcggcc gtcgacc 87
<210> 355
<211> 87
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 355
tttgtttacg tggtatcgtt attttttaat cgcggtttta cgaaatgtaa attttttttt 60
ggtttttttt tttcgcggtc gtcgatt 87
<210> 356
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 356
tgtttacgtg gtatcgttat tttttaatcg c 31
<210> 357
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 357
cgacgaccgc gaaaaaaaaa aacc 24
<210> 358
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 358
aggccacgga cgcggtttta cgaaatgtaa attt 34
<210> 359
<211> 72
<212> DNA
<213> 智人(Homo sapiens)
<400> 359
ccgccccgtg gggaacagca ggacggcgcc gaggccgttt cgctttcctc cgcgcccatt 60
tgccgggagg gg 72
<210> 360
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 360
tcgtttcgtg gggaatagta ggacggcgtc gaggtcgttt cgtttttttt cgcgtttatt 60
tgtcgggagg gg 72
<210> 361
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 361
tcgtggggaa tagtaggacg gc 22
<210> 362
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 362
cctcccgaca aataaacgcg a 21
<210> 363
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 363
cgcgccgagg cgtcgaggtc gtttcg 26
<210> 364
<211> 131
<212> DNA
<213> 智人(Homo sapiens)
<400> 364
cggcctagga cgcgccctgc gtggaggcag gcccgcgcgg cggaagtgcg tttctggggc 60
tcctcctgaa gaatgcggag gaggaactga gctggcgcgc gggccagctg tcctctcttc 120
tgatcccgaa g 131
<210> 365
<211> 131
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 365
cggtttagga cgcgttttgc gtggaggtag gttcgcgcgg cggaagtgcg tttttggggt 60
tttttttgaa gaatgcggag gaggaattga gttggcgcgc gggttagttg tttttttttt 120
tgatttcgaa g 131
<210> 366
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 366
ggaggtaggt tcgcgcgg 18
<210> 367
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 367
ccaactcaat tcctcctccg c 21
<210> 368
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 368
aggccacgga cggcggaagt gcgtt 25
<210> 369
<211> 144
<212> DNA
<213> 智人(Homo sapiens)
<400> 369
gcccgcgcgg cggaagtgcg tttctggggc tcctcctgaa gaatgcggag gaggaactga 60
gctggcgcgc gggccagctg tcctctcttc tgatcccgaa gacaggatcg gattatgggt 120
tgttaccggc ttgtgcggcc ctgg 144
<210> 370
<211> 144
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 370
gttcgcgcgg cggaagtgcg tttttggggt tttttttgaa gaatgcggag gaggaattga 60
gttggcgcgc gggttagttg tttttttttt tgatttcgaa gataggatcg gattatgggt 120
tgttatcggt ttgtgcggtt ttgg 144
<210> 371
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 371
gaggaggaat tgagttggcg c 21
<210> 372
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 372
caacccataa tccgatccta tcttcga 27
<210> 373
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 373
cgcgccgagg cgcgggttag ttgtt 25
<210> 374
<211> 61
<212> DNA
<213> 智人(Homo sapiens)
<400> 374
cggctcgcac gagtgagtgg acgtgggagg cgcgcatctg cgggggaatc gccccttgcc 60
c 61
<210> 375
<211> 61
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 375
cggttcgtac gagtgagtgg acgtgggagg cgcgtatttg cgggggaatc gttttttgtt 60
t 61
<210> 376
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 376
ttcgtacgag tgagtggacg 20
<210> 377
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 377
caaaaaacga ttcccccgca aa 22
<210> 378
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 378
aggccacgga cgatacgcgc ctccca 26
<210> 379
<211> 97
<212> DNA
<213> 智人(Homo sapiens)
<400> 379
cgggaaagaa cgtggagatc cacgccgagg gcgcccgcca ccgcctggtt ctgcacaacg 60
taggttttgc cgaccgtggc ttctttggct gcgagac 97
<210> 380
<211> 97
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 380
cgggaaagaa cgtggagatt tacgtcgagg gcgttcgtta tcgtttggtt ttgtataacg 60
taggttttgt cgatcgtggt ttttttggtt gcgagat 97
<210> 381
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 381
tggagattta cgtcgagggc 20
<210> 382
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 382
ccacgatcga caaaacctac gt 22
<210> 383
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 383
cgcgccgagg cgttcgttat cgtttggttt 30
<210> 384
<211> 73
<212> DNA
<213> 智人(Homo sapiens)
<400> 384
gcgtgcaggg tgcgcgcgtg tcttggccgc gcgtggcggc gtgtgcggca ggggcgggca 60
ggcgggcgac tcg 73
<210> 385
<211> 73
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 385
gcgtgtaggg tgcgcgcgtg ttttggtcgc gcgtggcggc gtgtgcggta ggggcgggta 60
ggcgggcgat tcg 73
<210> 386
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 386
gcgcgtgttt tggtcgc 17
<210> 387
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 387
tcgtccgcct acccgccc 18
<210> 388
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 388
aggccacgga cgcctaccgc acacgc 26
<210> 389
<211> 174
<212> DNA
<213> 智人(Homo sapiens)
<400> 389
gggggctctc aggtggcgcg gccgcgaggc ggaccctgat ggccatggtg gcggtgccgg 60
gagccacgct gtccctgggc cccggcccga ggccggcagg accgagcggg gtccccagga 120
gaggggtggc ggggagctcg atctccacgc ggggaccaga ttttcggcct caaa 174
<210> 390
<211> 174
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 390
gggggttttt aggtggcgcg gtcgcgaggc ggattttgat ggttatggtg gcggtgtcgg 60
gagttacgtt gtttttgggt ttcggttcga ggtcggtagg atcgagcggg gtttttagga 120
gaggggtggc ggggagttcg atttttacgc ggggattaga ttttcggttt taaa 174
<210> 391
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 391
ggagttacgt tgtttttggg tttcg 25
<210> 392
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 392
ctctcctaaa aaccccgctc 20
<210> 393
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 393
cgcgccgagg cgatcctacc gacctcga 28
<210> 394
<211> 103
<212> DNA
<213> 智人(Homo sapiens)
<400> 394
gaggtggggg accgggaccg aagcttggag aagaccaaag tggtggtggt ggtggtgggg 60
tggggcagaa gggcgggagc gcgcggctct gggagacaag cac 103
<210> 395
<211> 103
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 395
gaggtggggg atcgggatcg aagtttggag aagattaaag tggtggtggt ggtggtgggg 60
tggggtagaa gggcgggagc gcgcggtttt gggagataag tat 103
<210> 396
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 396
ggatcgggat cgaagtttgg agaa 24
<210> 397
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 397
cttatctccc aaaaccgcgc 20
<210> 398
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 398
aggccacgga cgcgctcccg cccttct 27
<210> 399
<211> 138
<212> DNA
<213> 智人(Homo sapiens)
<400> 399
aaccacgctg tgcccgcgtg tgccgggcgg ggaggggagg ccgcagcccc agccccgggg 60
gcctggttgt ctaatcgaag ggaagtaaac ggccccaacg caagcctgac tgcgagacgt 120
gcccaaggga ggtaggtc 138
<210> 400
<211> 138
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 400
aattacgttg tgttcgcgtg tgtcgggcgg ggaggggagg tcgtagtttt agtttcgggg 60
gtttggttgt ttaatcgaag ggaagtaaac ggttttaacg taagtttgat tgcgagacgt 120
gtttaaggga ggtaggtt 138
<210> 401
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 401
ttggttgttt aatcgaaggg aagtaaac 28
<210> 402
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 402
ctacctccct taaacacgtc tcg 23
<210> 403
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 403
cgcgccgagg cggttttaac gtaagtttga ttg 33
<210> 404
<211> 104
<212> DNA
<213> 智人(Homo sapiens)
<400> 404
cgcaggaagc cctgggggcg cagccatccc acagcgcggc cgaggtggga ctgggggtcc 60
cgcagcgacc gcttttcttt ggtgggtctg cacgcaccta tccg 104
<210> 405
<211> 104
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 405
cgtaggaagt tttgggggcg tagttatttt atagcgcggt cgaggtggga ttgggggttt 60
cgtagcgatc gttttttttt ggtgggtttg tacgtattta ttcg 104
<210> 406
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 406
gggcgtagtt attttatagc gc 22
<210> 407
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 407
caccaaaaaa aaacgatcgc tacgaaa 27
<210> 408
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 408
aggccacgga cgcggtcgag gtggga 26
<210> 409
<211> 99
<212> DNA
<213> 智人(Homo sapiens)
<400> 409
cgggtgtttg tgtatatgtg ttgcggggaa gacggaggtg cgggtggaga aggggaggat 60
gtaccaaggg ccatggggag acgctaggca ggggcttcc 99
<210> 410
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 410
cgggtgtttg tgtatatgtg ttgcggggaa gacggaggtg cgggtggaga aggggaggat 60
gtattaaggg ttatggggag acgttaggta ggggttttt 99
<210> 411
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 411
cggggaagac ggaggtg 17
<210> 412
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 412
aaacccctac ctaacgtctc cc 22
<210> 413
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 413
cgcgccgagg gcgggtggag aagg 24
<210> 414
<211> 105
<212> DNA
<213> 智人(Homo sapiens)
<400> 414
cggcaagcta cggaacaggt ggcggggctg cagcacccca atgaccgatc aaccgcaaag 60
gccggaaatg cgtcagccgt tctgagccca ctggctgaag ccagg 105
<210> 415
<211> 105
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 415
cggtaagtta cggaataggt ggcggggttg tagtatttta atgatcgatt aatcgtaaag 60
gtcggaaatg cgttagtcgt tttgagttta ttggttgaag ttagg 105
<210> 416
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 416
cggggttgta gtattttaat gatcga 26
<210> 417
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 417
cttcaaccaa taaactcaaa acgactaacg 30
<210> 418
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 418
aggccacgga cggcatttcc gacctttacg a 31
<210> 419
<211> 88
<212> DNA
<213> 智人(Homo sapiens)
<400> 419
ccccgcacgg gggcgcctcc ccgcggccct ggggcggggc cacccctcgg ggtctgtggg 60
acgcgcctgc ccccaattct gccacccg 88
<210> 420
<211> 88
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 420
tttcgtacgg gggcgttttt tcgcggtttt ggggcggggt tatttttcgg ggtttgtggg 60
acgcgtttgt ttttaatttt gttattcg 88
<210> 421
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 421
ggcgtttttt cgcggttttg 20
<210> 422
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 422
gcgtcccaca aaccccg 17
<210> 423
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 423
cgcgccgagg gaaaaataac cccgccc 27
<210> 424
<211> 80
<212> DNA
<213> 智人(Homo sapiens)
<400> 424
gcgggcacac gcagggtggg tggtcacgcc cgcagggtcc gcgagcgcgg cgcagagcgc 60
gggccgtggg aagtttctcc 80
<210> 425
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 425
gcgggtatac gtagggtggg tggttacgtt cgtagggttc gcgagcgcgg cgtagagcgc 60
gggtcgtggg aagttttttt 80
<210> 426
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 426
cgtagggtgg gtggttacgt tc 22
<210> 427
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 427
aacttcccac gacccg 16
<210> 428
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 428
aggccacgga cgcgtagggt tcgcgag 27
<210> 429
<211> 94
<212> DNA
<213> 智人(Homo sapiens)
<400> 429
gtgccacgcg gccttcaccc ctgtgactcc ccgcagctcg cgcggatgca ccgacgagtc 60
agcttgtcct ctggaagcca atgagtctcc ccgg 94
<210> 430
<211> 94
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 430
gtgttacgcg gtttttattt ttgtgatttt tcgtagttcg cgcggatgta tcgacgagtt 60
agtttgtttt ttggaagtta atgagttttt tcgg 94
<210> 431
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 431
gttacgcggt ttttattttt gtgatttttc g 31
<210> 432
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 432
ctcattaact tccaaaaaac aaactaactc gtc 33
<210> 433
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 433
cgcgccgagg cgatacatcc gcgcg 25
<210> 434
<211> 86
<212> DNA
<213> 智人(Homo sapiens)
<400> 434
cggcgcacca gagtcccaag gagcccgacg gccgaggcgc ggattgagtc ccgtgtctgc 60
gtgggagggc gcagtcaggg caggcg 86
<210> 435
<211> 86
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 435
cggcgtatta gagttttaag gagttcgacg gtcgaggcgc ggattgagtt tcgtgtttgc 60
gtgggagggc gtagttaggg taggcg 86
<210> 436
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 436
gagttcgacg gtcgaggcg 19
<210> 437
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 437
actacgccct cccacgc 17
<210> 438
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 438
aggccacgga cggcggattg agtttcgtg 29
<210> 439
<211> 80
<212> DNA
<213> 智人(Homo sapiens)
<400> 439
cgccgcagtc cctcgcctca gcggcggaag gcgcggccac ctccccgccc tccagcggtg 60
gcccgcgggt ggtggagcgg 80
<210> 440
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 440
cgtcgtagtt tttcgtttta gcggcggaag gcgcggttat tttttcgttt tttagcggtg 60
gttcgcgggt ggtggagcgg 80
<210> 441
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 441
tcgttttagc ggcggaagg 19
<210> 442
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 442
ccgcgaacca ccgc 14
<210> 443
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 443
aggccacgga cggcgcggtt attttttcgt 30
<210> 444
<211> 78
<212> DNA
<213> 智人(Homo sapiens)
<400> 444
gcgggctgca gctggagggc gagcgcgccg cccgcacacc cacctcccgc actcccgccc 60
ctcgcgaggg cgtcccgc 78
<210> 445
<211> 78
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 445
gcgggttgta gttggagggc gagcgcgtcg ttcgtatatt tatttttcgt attttcgttt 60
ttcgcgaggg cgtttcgt 78
<210> 446
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 446
ggttgtagtt ggagggcgag 20
<210> 447
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 447
cgaaacgccc tcgcga 16
<210> 448
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 448
cgcgccgagg gcgcgtcgtt cgtatattt 29
<210> 449
<211> 121
<212> DNA
<213> 智人(Homo sapiens)
<400> 449
ccgatttcca gatctgcttg ctgtgcaagg agatgtgcgg ctcgccggcg ccgctctcct 60
ccaactcgtc cgcgtcgtcg tcctcctcgc agacgtccac gtcgtcgggg ggcggcggcg 120
g 121
<210> 450
<211> 121
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 450
tcgattttta gatttgtttg ttgtgtaagg agatgtgcgg ttcgtcggcg tcgttttttt 60
ttaattcgtt cgcgtcgtcg tttttttcgt agacgtttac gtcgtcgggg ggcggcggcg 120
g 121
<210> 451
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 451
gttgtgtaag gagatgtgcg gttc 24
<210> 452
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 452
aaacgacgac gcgaacgaa 19
<210> 453
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 453
aggccacgga cgcgtcggcg tcgtttt 27
<210> 454
<211> 122
<212> DNA
<213> 智人(Homo sapiens)
<400> 454
ggccgagctc cggcggccac tccgcagtgc gctctcgcga gccggggccg cgaggcctcc 60
aacgcggttc cgcaccccta atgccccagg gcggtgagca ccccgcggtt ccccgcccgc 120
ct 122
<210> 455
<211> 122
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 455
ggtcgagttt cggcggttat ttcgtagtgc gttttcgcga gtcggggtcg cgaggttttt 60
aacgcggttt cgtattttta atgttttagg gcggtgagta tttcgcggtt tttcgttcgt 120
tt 122
<210> 456
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 456
cgtagtgcgt tttcgcgagt c 21
<210> 457
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 457
cgccctaaaa cattaaaaat acgaaaccg 29
<210> 458
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 458
cgcgccgagg gcgttaaaaa cctcgcg 27
<210> 459
<211> 160
<212> DNA
<213> 智人(Homo sapiens)
<400> 459
cggtggaaaa gacagctgag cccccacctc ccttcacatt ccagaaaagt gtctgaaagg 60
cccggggcgc ttcggggctt gccaagagac ggtgtttaga gaaagagcat aacgcgaagt 120
cacaatcgca ggaaactcgc agcagccccc catccccgcc 160
<210> 460
<211> 160
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 460
cggtggaaaa gatagttgag tttttatttt tttttatatt ttagaaaagt gtttgaaagg 60
ttcggggcgt ttcggggttt gttaagagac ggtgtttaga gaaagagtat aacgcgaagt 120
tataatcgta ggaaattcgt agtagttttt tattttcgtt 160
<210> 461
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 461
gtttcggggt ttgttaagag acg 23
<210> 462
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 462
actactacga atttcctacg attataactt cg 32
<210> 463
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 463
cgcgccgagg gcgttatact ctttctctaa acac 34
<210> 464
<211> 165
<212> DNA
<213> 智人(Homo sapiens)
<400> 464
ctgcagcctc cagcccggcc cgcgcggcga cccagtcccc tgtcgcccga atcttccacc 60
gctgcgaagc gtccccgggc gagcgccctg ctctccgcgc tgcgcggaag ccagagccgg 120
tcctcacagt gaactcgccc agccctgctc gcggctctct cgatt 165
<210> 465
<211> 165
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 465
ttgtagtttt tagttcggtt cgcgcggcga tttagttttt tgtcgttcga attttttatc 60
gttgcgaagc gttttcgggc gagcgttttg tttttcgcgt tgcgcggaag ttagagtcgg 120
tttttatagt gaattcgttt agttttgttc gcggtttttt cgatt 165
<210> 466
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 466
agtttttagt tcggttcgcg c 21
<210> 467
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 467
cccgaaaacg cttcgcaacg 20
<210> 468
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 468
aggccacgga cgcggcgatt tagttttttg tcg 33
<210> 469
<211> 144
<212> DNA
<213> 智人(Homo sapiens)
<400> 469
cgcacaatcg gctgggacaa ggcagggaag ctgtggcgac ctgcaggggt tcacaagccc 60
ggaggccgat ggggtttgtc agtgacacca gaggggaaaa gcctcacaga gcaggaacac 120
cccccgccgc caggtgctgg gtgc 144
<210> 470
<211> 144
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 470
cgtataatcg gttgggataa ggtagggaag ttgtggcgat ttgtaggggt ttataagttc 60
ggaggtcgat ggggtttgtt agtgatatta gaggggaaaa gttttataga gtaggaatat 120
ttttcgtcgt taggtgttgg gtgt 144
<210> 471
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 471
gataaggtag ggaagttgtg gcg 23
<210> 472
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 472
cctctaatat cactaacaaa ccccatcg 28
<210> 473
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 473
cgcgccgagg gacctccgaa cttataaacc c 31
<210> 474
<211> 97
<212> DNA
<213> 智人(Homo sapiens)
<400> 474
cggcatgagc gcggtgagct gcggcaacgg gaagctccgc cagtggctga tcgaccagat 60
cgacagcggc aagtaccccg ggctggtgtg ggagaac 97
<210> 475
<211> 97
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 475
cggtatgagc gcggtgagtt gcggtaacgg gaagtttcgt tagtggttga tcgattagat 60
cgatagcggt aagtatttcg ggttggtgtg ggagaat 97
<210> 476
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 476
cgcggtgagt tgcggtaac 19
<210> 477
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 477
cgaaatactt accgctatcg atctaatcga 30
<210> 478
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 478
aggccacgga cgcgggaagt ttcgttagtg g 31
<210> 479
<211> 64
<212> DNA
<213> 智人(Homo sapiens)
<400> 479
ggcagcccga actccggcgc gccaggtttt tccagccgcc gcgagcgccg ggagggaggg 60
cagc 64
<210> 480
<211> 64
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 480
ggtagttcga atttcggcgc gttaggtttt tttagtcgtc gcgagcgtcg ggagggaggg 60
tagt 64
<210> 481
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 481
ggtagttcga atttcggcgc 20
<210> 482
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 482
ctccctcccg acgctcg 17
<210> 483
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 483
cgcgccgagg cgttaggttt ttttagtcgt cg 32
<210> 484
<211> 163
<212> DNA
<213> 智人(Homo sapiens)
<400> 484
cgcagtccct cggcggcgac gcggagcgcg gccacccgtt ccgagagcgc acggcggcaa 60
ataaggccag gataggtggc tggctggcga cgggggcgcc tgcggcggcg cgcgctgctg 120
tccgtggtgt tggaaccacg ctctccgccc gctcccgggc gtc 163
<210> 485
<211> 163
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 485
cgtagttttt cggcggcgac gcggagcgcg gttattcgtt tcgagagcgt acggcggtaa 60
ataaggttag gataggtggt tggttggcga cgggggcgtt tgcggcggcg cgcgttgttg 120
ttcgtggtgt tggaattacg tttttcgttc gttttcgggc gtt 163
<210> 486
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 486
gtagtttttc ggcggcgacg 20
<210> 487
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 487
ccttatttac cgccgtacgc t 21
<210> 488
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 488
aggccacgga cgtctcgaaa cgaataaccg c 31
<210> 489
<211> 128
<212> DNA
<213> 智人(Homo sapiens)
<400> 489
cgcccggggc gtcgggaggg ggcccgcgcg ggtcgcgccc tgcctggcgg tgggaccagc 60
tatcctcggc gcccagcgca gcgcgccccc tcccgacgcg cggtcggggc cgcagtggtc 120
gccctgcg 128
<210> 490
<211> 128
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 490
cgttcggggc gtcgggaggg ggttcgcgcg ggtcgcgttt tgtttggcgg tgggattagt 60
tattttcggc gtttagcgta gcgcgttttt tttcgacgcg cggtcggggt cgtagtggtc 120
gttttgcg 128
<210> 491
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 491
ggtcgcgttt tgtttggcg 19
<210> 492
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 492
cgcgcgtcga aaaaaaacgc g 21
<210> 493
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 493
cgcgccgagg gctacgctaa acgccg 26
<210> 494
<211> 153
<212> DNA
<213> 智人(Homo sapiens)
<400> 494
agctcgggaa cccgcgatac ccggccgggg gacgacaggg ggcgacaaac tgtaaggttt 60
tccctatgcc cgaccgtgca gaaggctgca gcgagggctg tgtgctcccg atcgcgcaca 120
gctggctgcg ggaaaggggc caggattgag acg 153
<210> 495
<211> 153
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 495
agttcgggaa ttcgcgatat tcggtcgggg gacgataggg ggcgataaat tgtaaggttt 60
tttttatgtt cgatcgtgta gaaggttgta gcgagggttg tgtgttttcg atcgcgtata 120
gttggttgcg ggaaaggggt taggattgag acg 153
<210> 496
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 496
cgatcgtgta gaaggttgta gcg 23
<210> 497
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 497
tttcccgcaa ccaactatac gcg 23
<210> 498
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 498
aggccacgga cggatcgaaa acacacaacc c 31
<210> 499
<211> 75
<212> DNA
<213> 智人(Homo sapiens)
<400> 499
gggccgcgcg gacctcggcg ggacccagcg ggcccgggcg ggcgcaccag ccgccctttg 60
tcctccgcct ccggg 75
<210> 500
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 500
gggtcgcgcg gatttcggcg ggatttagcg ggttcgggcg ggcgtattag tcgttttttg 60
tttttcgttt tcggg 75
<210> 501
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 501
cgggatttag cgggttcgg 19
<210> 502
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 502
cccgaaaacg aaaaacaaaa aacgac 26
<210> 503
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 503
cgcgccgagg ggcgggcgta ttagt 25
<210> 504
<211> 193
<212> DNA
<213> 智人(Homo sapiens)
<400> 504
gtctgcaaga gataaaaagc tagcccacga tccacccaca atcctcgtgt ccccggggtg 60
ccctcgcagt tgccaaacct acgggccgcg tttaggggaa gcctccgcgt cctggcggcc 120
aaaagaatgg gctccttcca gcttccccct accggatacc acctgcaaat ctattgccag 180
aggcgcagct ccc 193
<210> 505
<211> 188
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 505
gtttgtaaga gataaaaagt tagtttacga tttatttata attttcgtgt tttcggggtg 60
ttttcgtagt tgttaaattt acgggtcgcg tttaggggaa gttttcgcgt tttggcggtt 120
aaaagaatgg gtttttttta gttttttttt atcggatatt atttgtaaat ttattgttag 180
aggcgtag 188
<210> 506
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 506
tcggggtgtt ttcgtagttg ttaaatttac 30
<210> 507
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 507
cattctttta accgccaaaa cgcg 24
<210> 508
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 508
aggccacgga cgcgggtcgc gtttagg 27
<210> 509
<211> 111
<212> DNA
<213> 智人(Homo sapiens)
<400> 509
gcggggtcct ggcccccgcc agcccagccc cgatctcccg ggcagccttt gggcgccacc 60
tccggtcgcc cagagctgtc aagtggggac cttcccggag aggagccgcc g 111
<210> 510
<211> 111
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 510
gcggggtttt ggttttcgtt agtttagttt cgatttttcg ggtagttttt gggcgttatt 60
ttcggtcgtt tagagttgtt aagtggggat tttttcggag aggagtcgtc g 111
<210> 511
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 511
gggttttggt tttcgttagt ttagtttc 28
<210> 512
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 512
acaactctaa acgaccgaaa ataacg 26
<210> 513
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 513
aggccacgga cgcgattttt cgggtagttt ttgg 34
<210> 514
<211> 99
<212> DNA
<213> 智人(Homo sapiens)
<400> 514
cggcggtcgg agcccagcca gcggcttccc ggccgagatg cgcgctcagg aggcagccgc 60
aggtcgcgga gggcgggcgg cgctgccggg gtgtctgcg 99
<210> 515
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 515
cggcggtcgg agtttagtta gcggtttttc ggtcgagatg cgcgtttagg aggtagtcgt 60
aggtcgcgga gggcgggcgg cgttgtcggg gtgtttgcg 99
<210> 516
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 516
gcggtcggag tttagttagc g 21
<210> 517
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 517
acctacgact acctcctaaa cgcg 24
<210> 518
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 518
cgcgccgagg ggtttttcgg tcgagatg 28
<210> 519
<211> 99
<212> DNA
<213> 智人(Homo sapiens)
<400> 519
ggccagcagc cccagccgca gccccagcag cccttcctgc cgcccgcagc ctgtttcttt 60
gccacggccg cagccgcggc ggccgcagcc gccgcagcg 99
<210> 520
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 520
ggttagtagt tttagtcgta gttttagtag ttttttttgt cgttcgtagt ttgttttttt 60
gttacggtcg tagtcgcggc ggtcgtagtc gtcgtagcg 99
<210> 521
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 521
gtcgtagttt tagtagtttt ttttgtcgtt cg 32
<210> 522
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 522
cgaccgccgc gactac 16
<210> 523
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 523
aggccacgga cgcgaccgta acaaaaaaac aaac 34
<210> 524
<211> 69
<212> DNA
<213> 智人(Homo sapiens)
<400> 524
gggacccggg gacgcggggc gctcagccag gccccctcca gccgcgccgg ggccgtcccg 60
agccgcgcg 69
<210> 525
<211> 69
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 525
gggattcggg gacgcggggc gtttagttag gtttttttta gtcgcgtcgg ggtcgtttcg 60
agtcgcgcg 69
<210> 526
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 526
gacgcggggc gtttagt 17
<210> 527
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 527
cgactcgaaa cgaccccga 19
<210> 528
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 528
cgcgccgagg acgcgactaa aaaaaaccta ac 32
<210> 529
<211> 152
<212> DNA
<213> 智人(Homo sapiens)
<400> 529
ggtgcacctg tccccacacg tccctcgccc acggagcccc aggcggcgtt acgcacaccc 60
aggatcgtgg atcagcctgc cccggcgtcg ggtgtccccg cggctctcac catctggaaa 120
aggaaggtcc gcgcgcagag agggaaatgg ac 152
<210> 530
<211> 152
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 530
ggtgtatttg tttttatacg tttttcgttt acggagtttt aggcggcgtt acgtatattt 60
aggatcgtgg attagtttgt ttcggcgtcg ggtgttttcg cggtttttat tatttggaaa 120
aggaaggttc gcgcgtagag agggaaatgg at 152
<210> 531
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 531
ggagttttag gcggcgttac g 21
<210> 532
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 532
accgcgaaaa cacccgac 18
<210> 533
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 533
aggccacgga cgcgccgaaa caaactaatc c 31
<210> 534
<211> 138
<212> DNA
<213> 智人(Homo sapiens)
<400> 534
gggcccgcgc ggccccacgg tggtccagtt tacactcggg ccccgcactc ctgaagttcc 60
gcgcgggagg agaagggcgt ccctttcgca gctcgggcgc cgggtgcgcc gcgctgccac 120
ctggtggccg cagtggcc 138
<210> 535
<211> 138
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 535
gggttcgcgc ggttttacgg tggtttagtt tatattcggg tttcgtattt ttgaagtttc 60
gcgcgggagg agaagggcgt ttttttcgta gttcgggcgt cgggtgcgtc gcgttgttat 120
ttggtggtcg tagtggtt 138
<210> 536
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 536
gttcgcgcgg ttttacggt 19
<210> 537
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 537
cgcccttctc ctcccgc 17
<210> 538
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 538
cgcgccgagg cgcgaaactt caaaaatacg a 31
<210> 539
<211> 172
<212> DNA
<213> 智人(Homo sapiens)
<400> 539
tgcggggctg cttccccgcg tcctccgggc ccgggccgcc ctcctcccgc acagtgcgga 60
gcagggaggc cccgcgcctc gaccacccgc gcccgagcgt ccgcgcctcc tcctccgctc 120
tgcaggcggg gaccgcccgg cgctcggcac ccggcagcgc ggccccctcc ag 172
<210> 540
<211> 172
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 540
tgcggggttg ttttttcgcg tttttcgggt tcgggtcgtt tttttttcgt atagtgcgga 60
gtagggaggt ttcgcgtttc gattattcgc gttcgagcgt tcgcgttttt tttttcgttt 120
tgtaggcggg gatcgttcgg cgttcggtat tcggtagcgc ggtttttttt ag 172
<210> 541
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 541
ggaggtttcg cgtttcgatt a 21
<210> 542
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 542
cgaacgatcc ccgcctac 18
<210> 543
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 543
aggccacgga cgattcgcgt tcgagcg 27
<210> 544
<211> 67
<212> DNA
<213> 智人(Homo sapiens)
<400> 544
gggcccagcg cgggctcctc gcggtagtgg ccgcagctcg ggaagctcgg gggcgcggtg 60
tcctcgc 67
<210> 545
<211> 67
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 545
gggtttagcg cgggtttttc gcggtagtgg tcgtagttcg ggaagttcgg gggcgcggtg 60
ttttcgt 67
<210> 546
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 546
ggtttagcgc gggtttttcg 20
<210> 547
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 547
ccccgaactt cccgaact 18
<210> 548
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 548
aggccacgga cggcggtagt ggtcgtag 28
<210> 549
<211> 92
<212> DNA
<213> 智人(Homo sapiens)
<400> 549
ggccgcgacc cctccccgct gacctcactc gagccgccgc ctggcgcaga tataagcggc 60
ggcccatctg aagagggctc ggcaggcgcc cg 92
<210> 550
<211> 92
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 550
ggtcgcgatt ttttttcgtt gattttattc gagtcgtcgt ttggcgtaga tataagcggc 60
ggtttatttg aagagggttc ggtaggcgtt cg 92
<210> 551
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 551
ttttcgttga ttttattcga gtcgtc 26
<210> 552
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 552
gaaccctctt caaataaacc gc 22
<210> 553
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 553
aggccacgga cgcgtttggc gtagatataa gc 32
<210> 554
<211> 104
<212> DNA
<213> 智人(Homo sapiens)
<400> 554
gagccggagt cgcggtggcc gcctcagcgc catgtcgagg gttgctgagg ggccagcggc 60
agcgcggcgc ggcttgtagt ccccgcgcgc atgcgcccag cctg 104
<210> 555
<211> 104
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 555
gagtcggagt cgcggtggtc gttttagcgt tatgtcgagg gttgttgagg ggttagcggt 60
agcgcggcgc ggtttgtagt tttcgcgcgt atgcgtttag tttg 104
<210> 556
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 556
tggtcgtttt agcgttatgt cg 22
<210> 557
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 557
cgaaaactac aaaccgcgc 19
<210> 558
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 558
aggccacgga cgccgcgcta ccgcta 26
<210> 559
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 559
cgcgccgagg ccgcgctacc gcta 24
<210> 560
<211> 100
<212> DNA
<213> 智人(Homo sapiens)
<400> 560
ggcccggggc cgcctgggcc cctaggggct ggacgtcaac ctgttagata gagggcgtgg 60
gaccccccgc aggcggctgc tcggacgacc gcatccggag 100
<210> 561
<211> 100
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 561
ggttcggggt cgtttgggtt tttaggggtt ggacgttaat ttgttagata gagggcgtgg 60
gatttttcgt aggcggttgt tcggacgatc gtattcggag 100
<210> 562
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 562
cgttaatttg ttagatagag ggcg 24
<210> 563
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 563
tccgaacaac cgcctac 17
<210> 564
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 564
aggccacgga cgcgaaaaat cccacgc 27
<210> 565
<211> 117
<212> DNA
<213> 智人(Homo sapiens)
<400> 565
ccgtgggcgc ggacagctgc cgggagcggc aggcgtctcg atcggggacg caggcacttc 60
cgtccctgca gagcatcaga cgcgtctcgg gacactgggg acaacatctc ctccgcg 117
<210> 566
<211> 117
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 566
tcgtgggcgc ggatagttgt cgggagcggt aggcgtttcg atcggggacg taggtatttt 60
cgtttttgta gagtattaga cgcgtttcgg gatattgggg ataatatttt tttcgcg 117
<210> 567
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 567
gttgtcggga gcggtagg 18
<210> 568
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 568
ccaatatccc gaaacgcgtc t 21
<210> 569
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 569
cgcgccgagg gcgtttcgat cgggg 25
<210> 570
<211> 109
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 570
ttagcgggcc gggcggggga tcgggggtta ggggtggagt ccgccaaagg cccaaaggtg 60
atggtcatcg agatggagct acgaaaggat gagcagagcc cggagctcc 109
<210> 571
<211> 109
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 571
ttagcgggtc gggcggggga tcgggggtta ggggtggagt tcgttaaagg tttaaaggtg 60
atggttatcg agatggagtt acgaaaggat gagtagagtt cggagtttt 109
<210> 572
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 572
ggttaggggt ggagttcgtt a 21
<210> 573
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 573
actccgaact ctactcatcc tttc 24
<210> 574
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 574
cgcgccgagg cgtaactcca tctcgataac c 31
<210> 575
<211> 116
<212> DNA
<213> 智人(Homo sapiens)
<400> 575
aaggcgccgg cggctctcag taaaagcgaa tgtagccttt gtacttccga cctctcaatg 60
gtgaaatgag ctaatcacag gcccaccccg cggagtggga cgggagattc aatgag 116
<210> 576
<211> 116
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 576
aaggcgtcgg cggtttttag taaaagcgaa tgtagttttt gtattttcga ttttttaatg 60
gtgaaatgag ttaattatag gtttatttcg cggagtggga cgggagattt aatgag 116
<210> 577
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 577
tcggcggttt ttagtaaaag cg 22
<210> 578
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 578
aaatctcccg tcccactcc 19
<210> 579
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 579
cgcgccgagg cgcgaaataa acctataatt aactca 36
<210> 580
<211> 119
<212> DNA
<213> 智人(Homo sapiens)
<400> 580
gcctttgccc cggtttttgg cgcgggagga ctttcgaccc cgacttcggc cgctcatggt 60
ggcggcggag gcagcttcaa agacacgctg tgaccctgcg gctcctgacg ccagctctc 119
<210> 581
<211> 119
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 581
gtttttgttt cggtttttgg cgcgggagga ttttcgattt cgatttcggt cgtttatggt 60
ggcggcggag gtagttttaa agatacgttg tgattttgcg gtttttgacg ttagttttt 119
<210> 582
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 582
tttgtttcgg tttttggcg 19
<210> 583
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 583
cgccaccata aacgacc 17
<210> 584
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 584
aggccacgga cg 12
<210> 585
<211> 107
<212> DNA
<213> 智人(Homo sapiens)
<400> 585
gcctcggggc ccggggactc acaattacgg gcagagaaca catagtgaag agcacggtca 60
tcagcgccag cagcaggagg tgatccagct cctccagggg ctgaggg 107
<210> 586
<211> 107
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 586
gtttcggggt tcggggattt ataattacgg gtagagaata tatagtgaag agtacggtta 60
ttagcgttag tagtaggagg tgatttagtt tttttagggg ttgaggg 107
<210> 587
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 587
gggttcgggg atttataatt acgg 24
<210> 588
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 588
ctaaatcacc tcctactact aacgctaata ac 32
<210> 589
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 589
cgcgccgagg ccgtactctt cactatatat tctct 35
Claims (122)
1.一种方法,所述方法包括:
通过以下来测量人类个体的生物样品中的一种或多种基因的甲基化水平:
将所述生物样品中的基因组DNA用以甲基化特异性方式修饰DNA的试剂处理;
使用一组针对所选择的一种或多种基因的引物扩增经过处理的基因组DNA;以及
通过聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离以及靶标捕获确定所述一种或多种基因的甲基化水平;
其中所述一种或多种基因选自以下组中的一组:
(i)AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90;
(ii)EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B;
(iii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553;
(v)ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A;
(vi)DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422;
(vii)ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A;
(viii)SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A;
(ix)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B;
(x)SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC;
(xi)EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B;
(xii)EMX2OS和LRRC34;
(xiii)ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL;
(xiv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B;
(xv)SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL;
(xvi)EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B;
(xvii)MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C;
(xviii)MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL;
(xix)EMX2OS和LRRC41_D;
(xx)SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A;
(xxi)MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B;
(xxii)MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL;
(xxiii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(xxiv)SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A;
(xxv)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C;
(xxvi)TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B;以及
(xxvii)TSPYL5、MPZ_B、TRH和PTGDR。
2.如权利要求1所述的方法,其中将所述DNA用以甲基化特异性方式修饰DNA的试剂处理。
3.如权利要求2所述的方法,其中所述试剂包含甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂中的一种或多种。
4.如权利要求3所述的方法,其中将所述DNA用亚硫酸氢盐试剂处理以产生经过亚硫酸氢盐处理的DNA。
5.如权利要求1所述的方法,其中所述测量包括多重扩增。
6.如权利要求1所述的方法,其中测量至少一种甲基化标志基因的量包括使用一种或多种选自由以下组成的组的方法:甲基化特异性PCR、定量甲基化特异性PCR、甲基化特异性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序、瓣状核酸内切酶测定、PCR-瓣测定和亚硫酸氢盐基因组测序PCR。
7.如权利要求1所述的方法,其中所述样品包含血浆样品、血液样品或组织样品(例如子宫内膜组织)中的一种或多种。
8.如权利要求1所述的方法,其中所述一组针对所选择的一种或多种基因的引物在表10或22中叙述。
9.一种表征样品的方法,所述方法包括:
a)测量来自所述样品的DNA中的至少一种甲基化标志基因的量,其中所述至少一种甲基化标志基因为选自以下组中的一组的一种或多种基因:
(i)AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90;
(ii)EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B;
(iii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553;
(v)ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A;
(vi)DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422;
(vii)ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A;
(viii)SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A;
(ix)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B;
(x)SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC;
(xi)EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B;
(xii)EMX2OS和LRRC34;
(xiii)ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL;
(xiv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B;
(xv)SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL;
(xvi)EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B;
(xvii)MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C;
(xviii)MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL;
(xix)EMX2OS和LRRC41_D;
(xx)SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A;
(xxi)MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B;
(xxii)MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL;
(xxiii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(xxiv)SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A;
(xxv)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C;
(xxvi)TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B;以及
(xxvii)TSPYL5、MPZ_B、TRH和PTGDR;
b)测量所述DNA中的至少一种参考标志物的量;以及
c)将在所述DNA中测量的所述至少一种甲基化标志基因的所述量的值计算为在所述DNA中测量的所述参考标志基因的所述量的百分比,其中所述值指示在所述样品中测量的所述至少一种甲基化标志DNA的量。
10.如权利要求9所述的方法,其中所述至少一种参考标志物包含选自B3GALT6 DNA和β-肌动蛋白DNA的一种或多种参考标志物。
11.如权利要求9所述的方法,其中所述样品包含血浆样品、血液样品或组织样品(例如子宫内膜组织)中的一种或多种。
12.如权利要求9所述的方法,其中从所述样品提取所述DNA。
13.如权利要求9所述的方法,其中将所述DNA用以甲基化特异性方式修饰DNA的试剂处理。
14.如权利要求13所述的方法,其中所述试剂包含甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂中的一种或多种。
15.如权利要求14所述的方法,其中将所述DNA用亚硫酸氢盐试剂处理以产生经过亚硫酸氢盐处理的DNA。
16.如权利要求14所述的方法,其中使用一组针对所选择的一种或多种基因的引物扩增经过修饰的DNA。
17.如权利要求16所述的方法,其中所述一组针对所选择的一种或多种基因的引物在表10或22中叙述。
18.如权利要求9所述的方法,其中测量甲基化标志基因的量包括使用聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离以及靶标捕获中的一种或多种。
19.如权利要求18所述的方法,其中所述测量包括多重扩增。
20.如权利要求18所述的方法,其中测量至少一种甲基化标志基因的所述量包括使用一种或多种选自由以下组成的组的方法:甲基化特异性PCR、定量甲基化特异性PCR、甲基化特异性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序、瓣状核酸内切酶测定、PCR-瓣测定和亚硫酸氢盐基因组测序PCR。
21.一种用于表征生物样品的方法,所述方法包括:
(a)测量人类个体的生物样品中选自以下组中的一组的一种或多种基因的CpG位点的甲基化水平:
(i)AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90;
(ii)EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B;
(iii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553;以及
(v)ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A,
所述测量通过以下进行:
将所述生物样品中的基因组DNA用亚硫酸氢盐处理;
使用一组针对所选择的一种或多种基因的引物扩增经过亚硫酸氢盐处理的基因组DNA;以及
通过甲基化特异性PCR、定量甲基化特异性PCR、甲基化敏感性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序或亚硫酸氢盐基因组测序PCR确定所述CpG位点的所述甲基化水平;
(b)将所述甲基化水平与无EC的对照样品中的一组相应基因的甲基化水平进行比较;以及
(c)当在所述一种或多种基因中测量的所述甲基化水平高于在所述相应对照样品中测量的所述甲基化水平时确定所述个体患有EC。
22.如权利要求21所述的方法,其中所述一组针对所选择的一种或多种基因的引物在表10或22中叙述。
23.如权利要求21所述的方法,其中所述生物样品为血浆样品、血液样品或组织样品(例如子宫内膜组织)。
24.如权利要求21所述的方法,其中所述一种或多种基因由表1、8或21中所示的基因组坐标描述。
25.如权利要求21所述的方法,其中所述CpG位点存在于编码区或调控区中。
26.如权利要求21所述的方法,其中所述测量一种或多种基因的CpG位点的所述甲基化水平包括选自由以下组成的组的确定:确定所述CpG位点的甲基化评分和确定所述CpG位点的甲基化频率。
27.一种用于表征生物样品的方法,所述方法包括:
(a)测量人类个体的生物样品中选自以下组中的一组的一种或多种基因的CpG位点的甲基化水平:
(i)DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422;
(ii)ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A;
(iii)SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A;
(iv)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B;以及
(v)SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC,
所述测量通过以下进行:
将所述生物样品中的基因组DNA用亚硫酸氢盐处理;
使用一组针对所选择的一种或多种基因的引物扩增经过亚硫酸氢盐处理的基因组DNA;以及
通过甲基化特异性PCR、定量甲基化特异性PCR、甲基化敏感性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序或亚硫酸氢盐基因组测序PCR确定所述CpG位点的所述甲基化水平;
(b)将所述甲基化水平与无EC的对照样品中的一组相应基因的甲基化水平进行比较;以及
(c)当在所述一种或多种基因中测量的所述甲基化水平高于在所述相应对照样品中测量的所述甲基化水平时确定所述个体患有透明细胞EC。
28.如权利要求27所述的方法,其中所述一组针对所选择的一种或多种基因的引物在表10或22中叙述。
29.如权利要求27所述的方法,其中所述生物样品为血浆样品、血液样品或组织样品(例如子宫内膜组织)。
30.如权利要求27所述的方法,其中所述一种或多种基因由表1、8或21中所示的基因组坐标描述。
31.如权利要求27所述的方法,
其中若所述生物样品为组织样品,则所述一种或多种基因选自组i、ii、iii或iv;
其中若所述生物样品为血浆样品,则所述一种或多种基因在组v内。
32.如权利要求27所述的方法,其中所述测量一种或多种基因的CpG位点的甲基化水平包括选自由以下组成的组的确定:确定所述CpG位点的甲基化评分和确定所述CpG位点的甲基化频率。
33.一种用于表征生物样品的方法,所述方法包括:
(a)测量人类个体的生物样品中选自以下组中的一组的一种或多种基因的CpG位点的甲基化水平:
(i)EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B;
(ii)EMX2OS和LRRC34;
(iii)ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL;
(iv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B;以及
(v)SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL,
所述测量通过以下进行:
将所述生物样品中的基因组DNA用亚硫酸氢盐处理;
使用一组针对所选择的一种或多种基因的引物扩增经过亚硫酸氢盐处理的基因组DNA;以及
通过甲基化特异性PCR、定量甲基化特异性PCR、甲基化敏感性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序或亚硫酸氢盐基因组测序PCR确定所述CpG位点的所述甲基化水平;
(b)将所述甲基化水平与无EC的对照样品中的一组相应基因的甲基化水平进行比较;以及
(c)当在所述一种或多种基因中测量的所述甲基化水平高于在所述相应对照样品中测量的所述甲基化水平时确定所述个体患有癌肉瘤EC。
34.如权利要求33所述的方法,其中所述一组针对所选择的一种或多种基因的引物在表10或22中叙述。
35.如权利要求33所述的方法,其中所述生物样品为血浆样品、血液样品或组织样品(例如子宫内膜组织)。
36.如权利要求33所述的方法,其中所述一种或多种基因由表1、8或21中所示的基因组坐标描述。
37.如权利要求33所述的方法,
其中若所述生物样品为组织样品,则所述一种或多种基因选自组i、ii、iii或iv;
其中若所述生物样品为血浆样品,则所述一种或多种基因在组v内。
38.如权利要求33所述的方法,其中所述测量一种或多种基因的CpG位点的所述甲基化水平包括选自由以下组成的组的确定:确定所述CpG位点的甲基化评分和确定所述CpG位点的甲基化频率。
39.一种用于表征生物样品的方法,所述方法包括:
(a)测量人类个体的生物样品中选自以下组中的一组的一种或多种基因的CpG位点的甲基化水平:
(i)EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B;
(ii)MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C;
(iii)MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL;
(iv)EMX2OS和LRRC41_D;以及
(v)SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A,
所述测量通过以下进行:
将所述生物样品中的基因组DNA用亚硫酸氢盐处理;
使用一组针对所选择的一种或多种基因的引物扩增经过亚硫酸氢盐处理的基因组DNA;以及
通过甲基化特异性PCR、定量甲基化特异性PCR、甲基化敏感性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序或亚硫酸氢盐基因组测序PCR确定所述CpG位点的所述甲基化水平;
(b)将所述甲基化水平与无EC的对照样品中的一组相应基因的甲基化水平进行比较;以及
(c)当在所述一种或多种基因中测量的所述甲基化水平高于在所述相应对照样品中测量的所述甲基化水平时确定所述个体患有浆液性EC。
40.如权利要求39所述的方法,其中所述一组针对所选择的一种或多种基因的引物在表10或22中叙述。
41.如权利要求39所述的方法,其中所述生物样品为血浆样品、血液样品或组织样品(例如子宫内膜组织)。
42.如权利要求39所述的方法,其中所述一种或多种基因由表1、8或21中所示的基因组坐标描述。
43.如权利要求39所述的方法,
其中若所述生物样品为组织样品,则所述一种或多种基因选自组i、ii、iii或iv;
其中若所述生物样品为血浆样品,则所述一种或多种基因在组v内。
44.如权利要求39所述的方法,其中所述测量一种或多种基因的CpG位点的甲基化水平包括选自由以下组成的组的确定:确定所述CpG位点的甲基化评分和确定所述CpG位点的甲基化频率。
45.一种用于表征生物样品的方法,所述方法包括:
(a)测量人类个体的生物样品中选自以下组中的一组的一种或多种基因的CpG位点的甲基化水平:
(i)MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B;
(ii)MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL;
(iii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(iv)SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A;
(v)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C;
(vi)TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B;以及
(vii)TSPYL5、MPZ_B、TRH和PTGDR,
所述测量通过以下进行:
将所述生物样品中的基因组DNA用亚硫酸氢盐处理;
使用一组针对所选择的一种或多种基因的引物扩增经过亚硫酸氢盐处理的基因组DNA;以及
通过甲基化特异性PCR、定量甲基化特异性PCR、甲基化敏感性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序或亚硫酸氢盐基因组测序PCR确定所述CpG位点的所述甲基化水平;
(b)将所述甲基化水平与无EC的对照样品中的一组相应基因的甲基化水平进行比较;以及
(c)当在所述一种或多种基因中测量的所述甲基化水平高于在所述相应对照样品中测量的所述甲基化水平时确定所述个体患有子宫内膜样EC。
46.如权利要求45所述的方法,其中所述一组针对所选择的一种或多种基因的引物在表10或22中叙述。
47.如权利要求45所述的方法,其中所述生物样品为血浆样品、血液样品或组织样品(例如子宫内膜组织)。
48.如权利要求45所述的方法,其中所述一种或多种基因由表1、8或21中所示的基因组坐标描述。
49.如权利要求45所述的方法,
其中若所述生物样品为组织样品,则所述一种或多种基因选自组i、ii、iii、v、vi和vii;
其中若所述生物样品为血浆样品,则所述一种或多种基因在组iv内。
50.如权利要求45所述的方法,其中所述测量一种或多种基因的CpG位点的所述甲基化水平包括选自由以下组成的组的确定:确定所述CpG位点的甲基化评分和确定所述CpG位点的甲基化频率。
51.一种方法,所述方法包括:
(a)测量人类个体的生物样品中选自以下组中的一组的一种或多种基因的CpG位点的甲基化水平:
(i)AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90;
(ii)EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B;
(iii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553;
(v)ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A;
(vi)DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422;
(vii)ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A;
(viii)SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A;
(ix)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B;
(x)SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC;
(xi)EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B;
(xii)EMX2OS和LRRC34;
(xiii)ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL;
(xiv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B;
(xv)SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL;
(xvi)EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B;
(xvii)MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C;
(xviii)MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL;
(xix)EMX2OS和LRRC41_D;
(xx)SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A;
(xxi)MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B;
(xxii)MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL;
(xxiii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(xxiv)SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A;
(xxv)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C;
(xxvi)TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B;以及
(xxvii)TSPYL5、MPZ_B、TRH和PTGDR,
所述测量通过以下进行:
将所述生物样品中的基因组DNA用亚硫酸氢盐处理;
使用一组针对所选择的一种或多种基因的引物扩增经过亚硫酸氢盐处理的基因组DNA;以及
通过甲基化特异性PCR、定量甲基化特异性PCR、甲基化敏感性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序或亚硫酸氢盐基因组测序PCR确定所述CpG位点的所述甲基化水平。
52.如权利要求51所述的方法,其中所述一组针对所选择的一种或多种基因的引物在表10或22中叙述。
53.如权利要求51所述的方法,其中所述生物样品为血浆样品、血液样品或组织样品(例如子宫内膜组织)。
54.如权利要求51所述的方法,其中所述一种或多种基因由表1、8或21中所示的基因组坐标描述。
55.如权利要求51所述的方法,
其中若所述生物样品为组织样品,则所述一种或多种基因选自组i、ii、iii、vi、vii、viii、ix、xi、xii、xiii、xiv、xvi、xvii、xviii、xix、xxi、xxii、xxiii、xxv、xxvi或xxvii;
其中若所述生物样品为血浆样品,则所述一种或多种基因在组v、x、xv或xxiv内。
56.如权利要求51所述的方法,其中所述测量一种或多种基因的CpG位点的所述甲基化水平包括选自由以下组成的组的确定:确定所述CpG位点的甲基化评分和确定所述CpG位点的甲基化频率。
57.一种筛查从受试者获得的样品中的子宫内膜癌的方法,所述方法包括:
1)测定DNA甲基化标志物的甲基化状态,所述DNA甲基化标志物包含具有选自由以下组中的一组组成的组的注释的染色体区域:
(i)AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90;
(ii)EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B;
(iii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553;以及
(v)ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A,以及
2)当所述标志物的所述甲基化状态不同于在未患子宫内膜癌的受试者中测定的所述标志物的甲基化状态时将所述受试者鉴定为患有子宫内膜癌。
58.如权利要求57所述的方法,所述方法包括测定多种标志物。
59.如权利要求57所述的方法,其中所述标志物在高CpG密度启动子中。
60.如权利要求57所述的方法,其中所述样品为粪便样品、组织样品、子宫内膜组织样品、血浆样品或尿样品。
61.如权利要求57所述的方法,其中所述测定包括使用甲基化特异性聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。
62.如权利要求57所述的方法,其中所述测定包括使用甲基化特异性寡核苷酸。
63.如权利要求57所述的方法,
其中若所述样品为组织样品,则所述一种或多种基因选自组i、ii、iii、v、vi或vii;
其中若所述样品为血浆样品,则所述一种或多种基因在组iv内。
64.一种筛查从受试者获得的样品中的透明细胞子宫内膜癌的方法,所述方法包括:
1)测定DNA甲基化标志物的甲基化状态,所述DNA甲基化标志物包含具有选自由以下组中的一组组成的组的注释的染色体区域:
(i)DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422;
(ii)ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A;
(iii)SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A;
(iv)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B;以及
(v)SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC,以及
2)当所述标志物的所述甲基化状态不同于在未患透明细胞子宫内膜癌的受试者中测定的所述标志物的甲基化状态时将所述受试者鉴定为患有透明细胞子宫内膜癌。
65.如权利要求64所述的方法,所述方法包括测定多种标志物。
66.如权利要求64所述的方法,其中所述标志物在高CpG密度启动子中。
67.如权利要求64所述的方法,其中所述样品为粪便样品、组织样品、子宫内膜组织样品、血浆样品或尿样品。
68.如权利要求64所述的方法,其中所述测定包括使用甲基化特异性聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。
69.如权利要求64所述的方法,其中所述测定包括使用甲基化特异性寡核苷酸。
70.如权利要求64所述的方法,
其中若所述样品为组织样品,则所述一种或多种基因选自组i、ii、iii、v、vi或vii;
其中若所述样品为血浆样品,则所述一种或多种基因在组iv内。
71.一种筛查从受试者获得的样品中的癌肉瘤子宫内膜癌的方法,所述方法包括:
1)测定DNA甲基化标志物的甲基化状态,所述DNA甲基化标志物包含具有选自由以下组中的一组组成的组的注释的染色体区域:
(i)EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B;
(ii)EMX2OS和LRRC34;
(iii)ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL;
(iv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B;以及
(v)SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL,以及
2)当所述标志物的所述甲基化状态不同于在未患癌肉瘤子宫内膜癌的受试者中测定的所述标志物的甲基化状态时将所述受试者鉴定为患有癌肉瘤子宫内膜癌。
72.如权利要求71所述的方法,所述方法包括测定多种标志物。
73.如权利要求71所述的方法,其中所述标志物在高CpG密度启动子中。
74.如权利要求71所述的方法,其中所述样品为粪便样品、组织样品、子宫内膜组织样品、血浆样品或尿样品。
75.如权利要求71所述的方法,其中所述测定包括使用甲基化特异性聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。
76.如权利要求71所述的方法,其中所述测定包括使用甲基化特异性寡核苷酸。
77.如权利要求71所述的方法,
其中若所述样品为组织样品,则所述一种或多种基因选自组i、ii、iii、v、vi或vii;
其中若所述样品为血浆样品,则所述一种或多种基因在组iv内。
78.一种筛查从受试者获得的样品中的浆液性子宫内膜癌的方法,所述方法包括:
1)测定DNA甲基化标志物的甲基化状态,所述DNA甲基化标志物包含具有选自由以下组中的一组组成的组的注释的染色体区域:
(i)EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B;
(ii)EMX2OS和LRRC34;
(iii)ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL;
(iv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B;以及
(v)SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL,以及
2)当所述标志物的所述甲基化状态不同于在未患浆液性子宫内膜癌的受试者中测定的所述标志物的甲基化状态时将所述受试者鉴定为患有浆液性子宫内膜癌。
79.如权利要求78所述的方法,所述方法包括测定多种标志物。
80.如权利要求78所述的方法,其中所述标志物在高CpG密度启动子中。
81.如权利要求78所述的方法,其中所述样品为粪便样品、组织样品、子宫内膜组织样品、血浆样品或尿样品。
82.如权利要求78所述的方法,其中所述测定包括使用甲基化特异性聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。
83.如权利要求78所述的方法,其中所述测定包括使用甲基化特异性寡核苷酸。
84.如权利要求78所述的方法,
其中若所述样品为组织样品,则所述一种或多种基因选自组i、ii、iii、v、vi或vii;
其中若所述样品为血浆样品,则所述一种或多种基因在组iv内。
85.一种筛查从受试者获得的样品中的子宫内膜样性子宫内膜癌的方法,所述方法包括:
1)测定DNA甲基化标志物的甲基化状态,所述DNA甲基化标志物包含具有选自由以下组中的一组组成的组的注释的染色体区域:
(i)MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B;
(ii)MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL;
(iii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(iv)SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A;
(v)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C;
(vi)TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B;以及
(vii)TSPYL5、MPZ_B、TRH和PTGDR,以及
2)当所述标志物的所述甲基化状态不同于在未患子宫内膜样子宫内膜癌的受试者中测定的所述标志物的甲基化状态时将所述受试者鉴定为患有子宫内膜样子宫内膜癌。
86.如权利要求85所述的方法,所述方法包括测定多种标志物。
87.如权利要求85所述的方法,其中所述标志物在高CpG密度启动子中。
88.如权利要求85所述的方法,其中所述样品为粪便样品、组织样品、子宫内膜组织样品、血浆样品或尿样品。
89.如权利要求85所述的方法,其中所述测定包括使用甲基化特异性聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。
90.如权利要求85所述的方法,其中所述测定包括使用甲基化特异性寡核苷酸。
91.如权利要求85所述的方法,
其中若所述样品为组织样品,则所述一种或多种基因选自组i、ii、iii、v、vi或vii;
其中若所述样品为血浆样品,则所述一种或多种基因在组iv内。
92.一种用于表征来自人类患者的样品的方法,所述方法包括:
a)从人类患者的样品获得DNA;
b)测定DNA甲基化标志物的甲基化状态,所述DNA甲基化标志物包含具有选自由以下组中的一组组成的组的注释的染色体区域:
(i)AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90;
(ii)EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B;
(iii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553;
(v)ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A;
(vi)DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422;
(vii)ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A;
(viii)SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A;
(ix)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B;
(x)SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC;
(xi)EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B;
(xii)EMX2OS和LRRC34;
(xiii)ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL;
(xiv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B;
(xv)SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL;
(xvi)EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B;
(xvii)MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C;
(xviii)MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL;
(xix)EMX2OS和LRRC41_D;
(xx)SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A;
(xxi)MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B;
(xxii)MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL;
(xxiii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A;
(xxiv)SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A;
(xxv)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C;
(xxvi)TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B;以及
(xxvii)TSPYL5、MPZ_B、TRH和PTGDR;
c)将所述一种或多种DNA甲基化标志物的所测定的甲基化状态与未患子宫内膜癌、透明细胞子宫内膜癌、癌肉瘤子宫内膜癌、子宫内膜样子宫内膜癌和/或浆液性子宫内膜癌的人类患者的所述一种或多种DNA甲基化标志物的甲基化水平参考进行比较。
93.如权利要求92所述的方法,其中所述样品为粪便样品、组织样品、子宫内膜组织样品、血浆样品或尿样品。
94.如权利要求92所述的方法,所述方法包括测定多种DNA甲基化标志物。
95.如权利要求92所述的方法,
其中若所述生物样品为组织样品,则所述一种或多种基因选自组i、ii、iii、vi、vii、viii、ix、xi、xii、xiii、xiv、xvi、xvii、xviii、xix、xxi、xxii、xxiii、xxv、xxvi或xxvii;
其中若所述生物样品为血浆样品,则所述一种或多种基因在组v、x、xv或xxiv内。
96.如权利要求92所述的方法,其中所述测定包括使用甲基化特异性聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。
97.如权利要求92所述的方法,其中所述测定包括使用甲基化特异性寡核苷酸。
98.如权利要求92所述的方法,其中所述甲基化特异性寡核苷酸选自表10或22中叙述的一组针对所选择的一种或多种基因的引物或选自表23的探针。
99.一种用于表征从人类受试者获得的样品的方法,所述方法包括使包含DMR的核酸与亚硫酸氢盐试剂反应以产生与亚硫酸氢盐反应过的核酸;对所述与亚硫酸氢盐反应过的核酸进行测序以提供所述与亚硫酸氢盐反应过的核酸的核苷酸序列;将所述与亚硫酸氢盐反应过的核酸的所述核苷酸序列与来自未患子宫内膜癌的受试者的包含所述DMR的核酸的核苷酸序列进行比较以鉴定两个序列的差异。
100.一种用于表征从人类受试者获得的样品的系统,所述系统包括:分析组件,所述分析组件被配置用于确定样品的甲基化状态;软件组件,所述软件组件被配置用于将所述样品的所述甲基化状态与数据库中记录的对照样品或参考样品甲基化状态进行比较;以及警报组件,所述警报组件被配置用于基于甲基化状态的组合确定单个值并向用户发出关于子宫内膜癌相关的甲基化状态的警报。
101.如权利要求100所述的系统,其中所述EC相关的甲基化状态是针对子宫内膜癌、透明细胞子宫内膜癌、癌肉瘤子宫内膜癌、子宫内膜样子宫内膜癌以及浆液性子宫内膜癌中的一种或多种的。
102.如权利要求100所述的系统,其中所述样品包含含有DMR的核酸。
103.如权利要求100所述的系统,所述系统还包括用于分离核酸的组件。
104.如权利要求100所述的系统,所述系统还包括用于收集样品的组件。
105.如权利要求100所述的系统,其中所述样品为粪便样品、组织样品、子宫内膜组织样品、血浆样品或尿样品。
106.如权利要求100所述的系统,其中所述数据库包含含有DMR的核酸序列。
107.如权利要求100所述的系统,其中所述数据库包含来自未患子宫内膜癌、透明细胞子宫内膜癌、癌肉瘤子宫内膜癌、子宫内膜样子宫内膜癌和/或浆液性子宫内膜癌中的至少一种的受试者的核酸序列。
108.一种试剂盒,所述试剂盒包括:
1)亚硫酸氢盐试剂;以及
2)包含来自选自由表1、8和21的DMR 1-499组成的组的DMR的序列并具有与未患子宫内膜癌的受试者相关的甲基化状态的对照核酸。
109.一种试剂盒,所述试剂盒包括亚硫酸氢盐试剂和根据SEQ ID NO 1-288的寡核苷酸。
110.一种试剂盒,所述试剂盒包括用于从受试者获得样品的样品收集器;用于从所述样品分离核酸的试剂;亚硫酸氢盐试剂;以及根据SEQ ID NO 1-288的寡核苷酸。
111.根据权利要求110所述的试剂盒,其中所述样品为粪便样品、组织样品、子宫内膜组织样品、血浆样品或尿样品。
112.一种组合物,所述组合物包含含有DMR的核酸和亚硫酸氢盐试剂。
113.一种组合物,所述组合物包含含有DMR的核酸和根据SEQ ID NO 1-288的寡核苷酸。
114.一种组合物,所述组合物包含含有DMR的核酸和甲基化敏感性限制酶。
115.一种组合物,所述组合物包含含有DMR的核酸和聚合酶。
116.一种用于筛查从受试者获得的样品中的子宫内膜癌的方法,所述方法包括使包含DMR的核酸与亚硫酸氢盐试剂反应以产生与亚硫酸氢盐反应过的核酸;对所述与亚硫酸氢盐反应过的核酸进行测序以提供所述与亚硫酸氢盐反应过的核酸的核苷酸序列;将所述与亚硫酸氢盐反应过的核酸的所述核苷酸序列与来自未患子宫内膜癌的受试者的包含所述DMR的核酸的核苷酸序列进行比较以鉴定两个序列的差异;以及当存在差异时将所述受试者鉴定为患有子宫内膜癌。
117.一种用于筛查从受试者获得的样品中的子宫内膜癌的系统,所述系统包括:分析组件,所述分析组件被配置用于确定样品的甲基化状态;软件组件,所述软件组件被配置用于将所述样品的所述甲基化状态与数据库中记录的对照样品或参考样品甲基化状态进行比较;以及警报组件,所述警报组件被配置用于基于甲基化状态的组合确定单个值并向用户发出关于子宫内膜癌相关的甲基化状态的警报。
118.如权利要求117所述的系统,其中所述样品包含含有DNA甲基化标志物的核酸,所述DNA甲基化标志物包含选自由表1、8和21的DMR 1-499组成的组的差异甲基化区域(DMR)中的碱基。
119.如权利要求118所述的系统,所述系统还包括用于分离核酸的组件。
120.如权利要求118所述的系统,所述系统还包括用于收集样品的组件。
121.如权利要求118所述的系统,所述系统还包括用于收集粪便样品、子宫内膜组织样品和/或血浆样品的组件。
122.如权利要求118所述的系统,其中所述数据库包含来自未患子宫内膜癌的受试者的核酸序列。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962796384P | 2019-01-24 | 2019-01-24 | |
US62/796,384 | 2019-01-24 | ||
PCT/US2020/015059 WO2020154665A1 (en) | 2019-01-24 | 2020-01-24 | Detecting endometrial cancer |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113557308A true CN113557308A (zh) | 2021-10-26 |
CN113557308B CN113557308B (zh) | 2024-08-16 |
Family
ID=71735383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080017116.XA Active CN113557308B (zh) | 2019-01-24 | 2020-01-24 | 检测子宫内膜癌 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20220106644A1 (zh) |
EP (1) | EP3914733A4 (zh) |
JP (1) | JP2022518762A (zh) |
KR (1) | KR20210119474A (zh) |
CN (1) | CN113557308B (zh) |
AU (1) | AU2020211461A1 (zh) |
CA (1) | CA3127329A1 (zh) |
WO (1) | WO2020154665A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116162707A (zh) * | 2022-12-28 | 2023-05-26 | 武汉艾米森生命科技有限公司 | 检测cyth2基因或/和six3基因中的目标区域的甲基化水平的试剂的新应用 |
CN116790761A (zh) * | 2023-08-22 | 2023-09-22 | 湖南宏雅基因技术有限公司 | 一种子宫内膜良恶性病变的生物标志物及其应用 |
CN118064587A (zh) * | 2024-03-15 | 2024-05-24 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 用于子宫内膜癌早期检测的引物探针组合、甲基化检测试剂盒及其应用 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2474626B1 (en) | 2008-02-15 | 2014-08-13 | Mayo Foundation For Medical Education And Research | Detecting neoplasm from a stool sample |
ES2812753T3 (es) | 2014-03-31 | 2021-03-18 | Mayo Found Medical Education & Res | Detección de neoplasma colorectal |
EP3574110A4 (en) | 2017-01-27 | 2021-01-13 | Exact Sciences Development Company, LLC | DETECTION OF COLUMN NEOPLASIA BY ANALYSIS OF METHYLATED DNA |
US11898199B2 (en) | 2019-11-11 | 2024-02-13 | Universal Diagnostics, S.A. | Detection of colorectal cancer and/or advanced adenomas |
CN115997035A (zh) | 2020-06-30 | 2023-04-21 | 通用诊断股份公司 | 用于检测多种癌症类型的系统和方法 |
CN114645094B (zh) * | 2022-03-21 | 2023-10-20 | 武汉凯德维斯生物技术有限公司 | 一种子宫内膜癌的生物标志物及其应用 |
CN115725734B (zh) * | 2022-08-10 | 2023-10-13 | 人和未来生物科技(长沙)有限公司 | Znf781基因在制备宫颈癌诊断试剂中的应用 |
WO2024136659A1 (en) * | 2022-12-22 | 2024-06-27 | Methylomics B.V. | Methylation marker for cancer |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2899275A1 (en) * | 2012-09-19 | 2015-07-29 | Sysmex Corporation | Method for obtaining information about endometrial cancer, and marker and kit for obtaining information about endometrial cancer |
WO2015153283A1 (en) * | 2014-03-31 | 2015-10-08 | Mayo Foundation For Medical Education And Research | Detecting colorectal neoplasm |
US20160017430A1 (en) * | 2012-05-24 | 2016-01-21 | Fundació Institut D'investigació Biomèdica De Bellvitge (Idibell) | Method for the identification of the origin of a cancer of unknown primary origin by methylation analysis |
CN109563546A (zh) * | 2016-05-05 | 2019-04-02 | 精密科学发展有限责任公司 | 通过分析甲基化dna来检测肺肿瘤 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118028467A (zh) * | 2013-03-14 | 2024-05-14 | 梅奥医学教育和研究基金会 | 检测赘生物 |
-
2020
- 2020-01-24 AU AU2020211461A patent/AU2020211461A1/en active Pending
- 2020-01-24 WO PCT/US2020/015059 patent/WO2020154665A1/en unknown
- 2020-01-24 JP JP2021542425A patent/JP2022518762A/ja active Pending
- 2020-01-24 EP EP20744597.4A patent/EP3914733A4/en active Pending
- 2020-01-24 US US17/424,422 patent/US20220106644A1/en active Pending
- 2020-01-24 KR KR1020217026751A patent/KR20210119474A/ko unknown
- 2020-01-24 CN CN202080017116.XA patent/CN113557308B/zh active Active
- 2020-01-24 CA CA3127329A patent/CA3127329A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160017430A1 (en) * | 2012-05-24 | 2016-01-21 | Fundació Institut D'investigació Biomèdica De Bellvitge (Idibell) | Method for the identification of the origin of a cancer of unknown primary origin by methylation analysis |
EP2899275A1 (en) * | 2012-09-19 | 2015-07-29 | Sysmex Corporation | Method for obtaining information about endometrial cancer, and marker and kit for obtaining information about endometrial cancer |
WO2015153283A1 (en) * | 2014-03-31 | 2015-10-08 | Mayo Foundation For Medical Education And Research | Detecting colorectal neoplasm |
CN109563546A (zh) * | 2016-05-05 | 2019-04-02 | 精密科学发展有限责任公司 | 通过分析甲基化dna来检测肺肿瘤 |
Non-Patent Citations (2)
Title |
---|
RUI-LAN HUANG; PO-HSUAN SU; YU-PING LIAO; TZU-I WU; YA-TING HSU; WEI-YU LIN; HUI-CHEN WANG; YU-CHUN WENG; YU-CHE OU; TIM HUI-MING : "Integrated Epigenomics Analysis Reveals a DNA Methylation Panel for Endometrial Cancer Detection Using Cervical Scrapings", CLINICAL CANCER RESEARCH, vol. 23, no. 1, XP055446410, DOI: 10.1158/1078-0432.CCR-16-0863 * |
YING-CHIEH CHEN, CHUN-MING TSAO, CHIH-CHI KUO, MU-HSIEN YU, YA-WEN LIN, CHU-YING YANG, HSIN-JUNG LI, MING-DE YAN, TUN-JUN WANG, YU: "Quantitative DNA methylation analysis of selected genes in endometrial carcinogenesis", TAIWANESE JOURNAL OF OBSTETRICS AND GYNECOLOGY, vol. 54, no. 5, pages 572 - 579, XP055282084, DOI: 10.1016/j.tjog.2015.08.010 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116162707A (zh) * | 2022-12-28 | 2023-05-26 | 武汉艾米森生命科技有限公司 | 检测cyth2基因或/和six3基因中的目标区域的甲基化水平的试剂的新应用 |
CN116790761A (zh) * | 2023-08-22 | 2023-09-22 | 湖南宏雅基因技术有限公司 | 一种子宫内膜良恶性病变的生物标志物及其应用 |
CN116790761B (zh) * | 2023-08-22 | 2023-11-17 | 湖南宏雅基因技术有限公司 | 一种子宫内膜良恶性病变的生物标志物及其应用 |
CN118064587A (zh) * | 2024-03-15 | 2024-05-24 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 用于子宫内膜癌早期检测的引物探针组合、甲基化检测试剂盒及其应用 |
Also Published As
Publication number | Publication date |
---|---|
EP3914733A1 (en) | 2021-12-01 |
US20220106644A1 (en) | 2022-04-07 |
JP2022518762A (ja) | 2022-03-16 |
EP3914733A4 (en) | 2023-05-17 |
CN113557308B (zh) | 2024-08-16 |
CA3127329A1 (en) | 2020-07-30 |
WO2020154665A1 (en) | 2020-07-30 |
KR20210119474A (ko) | 2021-10-05 |
AU2020211461A1 (en) | 2021-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113557308B (zh) | 检测子宫内膜癌 | |
CN111655869B (zh) | 检测乳腺癌 | |
US11697853B2 (en) | Detecting prostate cancer | |
CN114729399A (zh) | 检测卵巢癌 | |
CN113811622B (zh) | 在血浆中检测胰腺导管腺癌 | |
CN115551880A (zh) | 检测胰腺神经内分泌肿瘤 | |
AU2021268333A1 (en) | Detecting melanoma | |
AU2021329899A1 (en) | Detecting non-hodgkin lymphoma |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20221208 Address after: Minn Applicant after: MAYO FOUNDATION FOR MEDICAL EDUCATION AND RESEARCH Applicant after: EXACT SCIENCES Corp. Address before: Minn Applicant before: MAYO FOUNDATION FOR MEDICAL EDUCATION AND RESEARCH Applicant before: EXACT SCIENCES DEVELOPMENT CO.,LLC |
|
GR01 | Patent grant | ||
GR01 | Patent grant |