CN111212918A - 甲基化分析方法 - Google Patents
甲基化分析方法 Download PDFInfo
- Publication number
- CN111212918A CN111212918A CN201880060005.XA CN201880060005A CN111212918A CN 111212918 A CN111212918 A CN 111212918A CN 201880060005 A CN201880060005 A CN 201880060005A CN 111212918 A CN111212918 A CN 111212918A
- Authority
- CN
- China
- Prior art keywords
- seq
- dna
- primers
- substantially similar
- sequences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000011987 methylation Effects 0.000 title claims description 232
- 238000007069 methylation reaction Methods 0.000 title claims description 232
- 238000004458 analytical method Methods 0.000 title description 34
- 238000000034 method Methods 0.000 claims abstract description 208
- 238000012544 monitoring process Methods 0.000 claims abstract description 13
- 239000000523 sample Substances 0.000 claims description 812
- 108020004414 DNA Proteins 0.000 claims description 749
- 102000053602 DNA Human genes 0.000 claims description 545
- 108090000623 proteins and genes Proteins 0.000 claims description 228
- 230000003321 amplification Effects 0.000 claims description 179
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 179
- 230000002441 reversible effect Effects 0.000 claims description 159
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical group OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 claims description 138
- 238000001514 detection method Methods 0.000 claims description 112
- 101000766268 Homo sapiens Branched-chain-amino-acid aminotransferase, cytosolic Proteins 0.000 claims description 99
- 102100037799 DNA-binding protein Ikaros Human genes 0.000 claims description 98
- 101000599038 Homo sapiens DNA-binding protein Ikaros Proteins 0.000 claims description 98
- 102100026437 Branched-chain-amino-acid aminotransferase, cytosolic Human genes 0.000 claims description 96
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical group NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 70
- 206010028980 Neoplasm Diseases 0.000 claims description 46
- 101001011441 Homo sapiens Interferon regulatory factor 4 Proteins 0.000 claims description 45
- 102100030126 Interferon regulatory factor 4 Human genes 0.000 claims description 45
- 150000007523 nucleic acids Chemical class 0.000 claims description 45
- 102000039446 nucleic acids Human genes 0.000 claims description 42
- 108020004707 nucleic acids Proteins 0.000 claims description 42
- 108091092240 circulating cell-free DNA Proteins 0.000 claims description 36
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 34
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 34
- 201000010099 disease Diseases 0.000 claims description 30
- 238000009396 hybridization Methods 0.000 claims description 27
- 238000012216 screening Methods 0.000 claims description 27
- 210000002381 plasma Anatomy 0.000 claims description 26
- 239000003795 chemical substances by application Substances 0.000 claims description 25
- 238000006460 hydrolysis reaction Methods 0.000 claims description 23
- 230000007062 hydrolysis Effects 0.000 claims description 22
- 239000003153 chemical reaction reagent Substances 0.000 claims description 21
- 238000003875 gradient-accelerated spectroscopy Methods 0.000 claims description 20
- 230000036961 partial effect Effects 0.000 claims description 19
- 238000003753 real-time PCR Methods 0.000 claims description 17
- 229940035893 uracil Drugs 0.000 claims description 17
- 238000011529 RT qPCR Methods 0.000 claims description 15
- 238000011144 upstream manufacturing Methods 0.000 claims description 14
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical group [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 claims description 13
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 claims description 13
- 108091029430 CpG site Proteins 0.000 claims description 12
- 108700009124 Transcription Initiation Site Proteins 0.000 claims description 12
- 210000004369 blood Anatomy 0.000 claims description 12
- 239000008280 blood Substances 0.000 claims description 12
- 206010003445 Ascites Diseases 0.000 claims description 10
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 10
- 230000002829 reductive effect Effects 0.000 claims description 10
- 210000003296 saliva Anatomy 0.000 claims description 10
- 210000002966 serum Anatomy 0.000 claims description 10
- 210000002700 urine Anatomy 0.000 claims description 10
- 239000012530 fluid Substances 0.000 claims description 9
- 239000000439 tumor marker Substances 0.000 claims description 7
- 108700039691 Genetic Promoter Regions Proteins 0.000 claims description 6
- 102000043138 IRF family Human genes 0.000 claims description 5
- 208000009956 adenocarcinoma Diseases 0.000 claims description 5
- 208000003200 Adenoma Diseases 0.000 claims description 4
- 206010001233 Adenoma benign Diseases 0.000 claims description 4
- 230000001613 neoplastic effect Effects 0.000 claims description 4
- 108091054729 IRF family Proteins 0.000 claims description 3
- 230000002068 genetic effect Effects 0.000 claims description 3
- HRZFUMHJMZEROT-UHFFFAOYSA-L sodium disulfite Chemical compound [Na+].[Na+].[O-]S(=O)S([O-])(=O)=O HRZFUMHJMZEROT-UHFFFAOYSA-L 0.000 claims description 3
- 229940001584 sodium metabisulfite Drugs 0.000 claims description 3
- 235000010262 sodium metabisulphite Nutrition 0.000 claims description 3
- 239000003550 marker Substances 0.000 claims description 2
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical class OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 claims 2
- 206010052360 Colorectal adenocarcinoma Diseases 0.000 claims 1
- 238000011901 isothermal amplification Methods 0.000 claims 1
- 230000003211 malignant effect Effects 0.000 claims 1
- 238000012340 reverse transcriptase PCR Methods 0.000 claims 1
- 230000007067 DNA methylation Effects 0.000 abstract description 33
- 230000035945 sensitivity Effects 0.000 abstract description 24
- 238000011161 development Methods 0.000 abstract description 16
- 230000030933 DNA methylation on cytosine Effects 0.000 abstract description 10
- 238000003745 diagnosis Methods 0.000 abstract description 8
- 230000008859 change Effects 0.000 abstract description 4
- 238000006243 chemical reaction Methods 0.000 description 90
- 238000003556 assay Methods 0.000 description 72
- 238000011282 treatment Methods 0.000 description 31
- 230000008685 targeting Effects 0.000 description 27
- 238000012360 testing method Methods 0.000 description 26
- 239000012472 biological sample Substances 0.000 description 23
- 108091034117 Oligonucleotide Proteins 0.000 description 22
- 201000011510 cancer Diseases 0.000 description 22
- 101000756632 Homo sapiens Actin, cytoplasmic 1 Proteins 0.000 description 21
- 230000000295 complement effect Effects 0.000 description 20
- 108091093088 Amplicon Proteins 0.000 description 19
- 125000003729 nucleotide group Chemical group 0.000 description 18
- 239000002773 nucleotide Substances 0.000 description 17
- 230000015556 catabolic process Effects 0.000 description 16
- 238000006731 degradation reaction Methods 0.000 description 16
- 238000013461 design Methods 0.000 description 15
- 230000018109 developmental process Effects 0.000 description 15
- 102000004169 proteins and genes Human genes 0.000 description 15
- 108091028043 Nucleic acid sequence Proteins 0.000 description 13
- 239000000203 mixture Substances 0.000 description 13
- 238000012408 PCR amplification Methods 0.000 description 12
- 241000124008 Mammalia Species 0.000 description 11
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 10
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 9
- 229940104302 cytosine Drugs 0.000 description 9
- 230000000670 limiting effect Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 8
- 239000002299 complementary DNA Substances 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 108020004635 Complementary DNA Proteins 0.000 description 7
- 108060004795 Methyltransferase Proteins 0.000 description 7
- 102000016397 Methyltransferase Human genes 0.000 description 7
- 108091036333 Rapid DNA Proteins 0.000 description 7
- 230000009471 action Effects 0.000 description 7
- 238000010804 cDNA synthesis Methods 0.000 description 7
- 208000035657 Abasia Diseases 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 6
- 230000002759 chromosomal effect Effects 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 238000011002 quantification Methods 0.000 description 6
- 125000006850 spacer group Chemical group 0.000 description 6
- 108010077544 Chromatin Proteins 0.000 description 5
- 108091029523 CpG island Proteins 0.000 description 5
- 108010006785 Taq Polymerase Proteins 0.000 description 5
- 238000001574 biopsy Methods 0.000 description 5
- 210000003483 chromatin Anatomy 0.000 description 5
- 238000002052 colonoscopy Methods 0.000 description 5
- 239000013068 control sample Substances 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 5
- 238000007855 methylation-specific PCR Methods 0.000 description 5
- 230000006798 recombination Effects 0.000 description 5
- 238000005215 recombination Methods 0.000 description 5
- 229940113082 thymine Drugs 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- 210000004881 tumor cell Anatomy 0.000 description 5
- 229930010555 Inosine Natural products 0.000 description 4
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 4
- 101100495925 Schizosaccharomyces pombe (strain 972 / ATCC 24843) chr3 gene Proteins 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 238000000137 annealing Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000010348 incorporation Methods 0.000 description 4
- 229960003786 inosine Drugs 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 238000004445 quantitative analysis Methods 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 3
- 206010009944 Colon cancer Diseases 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 230000001594 aberrant effect Effects 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 230000001351 cycling effect Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000009826 neoplastic cell growth Effects 0.000 description 3
- 238000002515 oligonucleotide synthesis Methods 0.000 description 3
- 244000052769 pathogen Species 0.000 description 3
- 230000001717 pathogenic effect Effects 0.000 description 3
- 238000004393 prognosis Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 108091006146 Channels Proteins 0.000 description 2
- 102100024811 DNA (cytosine-5)-methyltransferase 3-like Human genes 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 241000792859 Enema Species 0.000 description 2
- 102100028073 Fibroblast growth factor 5 Human genes 0.000 description 2
- 102100041000 Forkhead box protein I2 Human genes 0.000 description 2
- 101000909250 Homo sapiens DNA (cytosine-5)-methyltransferase 3-like Proteins 0.000 description 2
- 101001060267 Homo sapiens Fibroblast growth factor 5 Proteins 0.000 description 2
- 101000892878 Homo sapiens Forkhead box protein I2 Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 102000006890 Methyl-CpG-Binding Protein 2 Human genes 0.000 description 2
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 2
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 238000002944 PCR assay Methods 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 230000035508 accumulation Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 238000011319 anticancer therapy Methods 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- 239000013060 biological fluid Substances 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 238000000546 chi-square test Methods 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000011304 droplet digital PCR Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 239000007920 enema Substances 0.000 description 2
- 229940095399 enema Drugs 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 210000003608 fece Anatomy 0.000 description 2
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 230000006607 hypermethylation Effects 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000007857 nested PCR Methods 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 150000004713 phosphodiesters Chemical class 0.000 description 2
- 238000011321 prophylaxis Methods 0.000 description 2
- 238000002271 resection Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000000527 sonication Methods 0.000 description 2
- 238000011895 specific detection Methods 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 102100032270 tRNA (cytosine(38)-C(5))-methyltransferase Human genes 0.000 description 2
- 101710184308 tRNA (cytosine(38)-C(5))-methyltransferase Proteins 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- AOSFMYBATFLTAQ-UHFFFAOYSA-N 1-amino-3-(benzimidazol-1-yl)propan-2-ol Chemical compound C1=CC=C2N(CC(O)CN)C=NC2=C1 AOSFMYBATFLTAQ-UHFFFAOYSA-N 0.000 description 1
- 102100037425 17-beta-hydroxysteroid dehydrogenase 14 Human genes 0.000 description 1
- LOJNBPNACKZWAI-UHFFFAOYSA-N 3-nitro-1h-pyrrole Chemical compound [O-][N+](=O)C=1C=CNC=1 LOJNBPNACKZWAI-UHFFFAOYSA-N 0.000 description 1
- UDGUGZTYGWUUSG-UHFFFAOYSA-N 4-[4-[[2,5-dimethoxy-4-[(4-nitrophenyl)diazenyl]phenyl]diazenyl]-n-methylanilino]butanoic acid Chemical compound COC=1C=C(N=NC=2C=CC(=CC=2)N(C)CCCC(O)=O)C(OC)=CC=1N=NC1=CC=C([N+]([O-])=O)C=C1 UDGUGZTYGWUUSG-UHFFFAOYSA-N 0.000 description 1
- COCMHKNAGZHBDZ-UHFFFAOYSA-N 4-carboxy-3-[3-(dimethylamino)-6-dimethylazaniumylidenexanthen-9-yl]benzoate Chemical compound C=12C=CC(=[N+](C)C)C=C2OC2=CC(N(C)C)=CC=C2C=1C1=CC(C([O-])=O)=CC=C1C(O)=O COCMHKNAGZHBDZ-UHFFFAOYSA-N 0.000 description 1
- NMUSYJAQQFHJEW-UHFFFAOYSA-N 5-Azacytidine Natural products O=C1N=C(N)N=CN1C1C(O)C(O)C(CO)O1 NMUSYJAQQFHJEW-UHFFFAOYSA-N 0.000 description 1
- NMUSYJAQQFHJEW-KVTDHHQDSA-N 5-azacytidine Chemical compound O=C1N=C(N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NMUSYJAQQFHJEW-KVTDHHQDSA-N 0.000 description 1
- OZFPSOBLQZPIAV-UHFFFAOYSA-N 5-nitro-1h-indole Chemical compound [O-][N+](=O)C1=CC=C2NC=CC2=C1 OZFPSOBLQZPIAV-UHFFFAOYSA-N 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 102100032153 Adenylate cyclase type 8 Human genes 0.000 description 1
- 102100036793 Adhesion G protein-coupled receptor L3 Human genes 0.000 description 1
- 102100029233 Alpha-N-acetylneuraminide alpha-2,8-sialyltransferase Human genes 0.000 description 1
- 102100034608 Angiopoietin-2 Human genes 0.000 description 1
- 102000004888 Aquaporin 1 Human genes 0.000 description 1
- 108090001004 Aquaporin 1 Proteins 0.000 description 1
- 101001027057 Bacillus subtilis (strain 168) Flagellin Proteins 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- 102100025617 Beta-synuclein Human genes 0.000 description 1
- 102100024504 Bone morphogenetic protein 3 Human genes 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 102100040531 CKLF-like MARVEL transmembrane domain-containing protein 2 Human genes 0.000 description 1
- 102100040750 CUB and sushi domain-containing protein 1 Human genes 0.000 description 1
- 102100024318 Calcium/calmodulin-dependent 3',5'-cyclic nucleotide phosphodiesterase 1B Human genes 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 102100026681 Chromobox protein homolog 8 Human genes 0.000 description 1
- 206010065163 Clonal evolution Diseases 0.000 description 1
- 108091033380 Coding strand Proteins 0.000 description 1
- -1 DNA Chemical class 0.000 description 1
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 description 1
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 230000026641 DNA hypermethylation Effects 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 101100043975 Danio rerio sox21a gene Proteins 0.000 description 1
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 206010061819 Disease recurrence Diseases 0.000 description 1
- 102100035316 Doublesex- and mab-3-related transcription factor A2 Human genes 0.000 description 1
- 102100040976 EF-hand and coiled-coil domain-containing protein 1 Human genes 0.000 description 1
- 102100031785 Endothelial transcription factor GATA-2 Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 102100021109 Forkhead box protein B1 Human genes 0.000 description 1
- 102100037062 Forkhead box protein D2 Human genes 0.000 description 1
- 102100037060 Forkhead box protein D3 Human genes 0.000 description 1
- 102100020856 Forkhead box protein F1 Human genes 0.000 description 1
- 102100033925 GS homeobox 1 Human genes 0.000 description 1
- 102100030708 GTPase KRas Human genes 0.000 description 1
- 102000000393 Ghrelin Receptors Human genes 0.000 description 1
- 108010016122 Ghrelin Receptors Proteins 0.000 description 1
- 102000034615 Glial cell line-derived neurotrophic factor Human genes 0.000 description 1
- 108091010837 Glial cell line-derived neurotrophic factor Proteins 0.000 description 1
- 102100030651 Glutamate receptor 2 Human genes 0.000 description 1
- 102000003964 Histone deacetylase Human genes 0.000 description 1
- 108090000353 Histone deacetylase Proteins 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 102100030941 Homeobox even-skipped homolog protein 1 Human genes 0.000 description 1
- 102100022373 Homeobox protein DLX-5 Human genes 0.000 description 1
- 102100039542 Homeobox protein Hox-A2 Human genes 0.000 description 1
- 102100025110 Homeobox protein Hox-A5 Human genes 0.000 description 1
- 102100027886 Homeobox protein Nkx-2.2 Human genes 0.000 description 1
- 102100027890 Homeobox protein Nkx-2.3 Human genes 0.000 description 1
- 102100027876 Homeobox protein Nkx-2.6 Human genes 0.000 description 1
- 102100030634 Homeobox protein OTX2 Human genes 0.000 description 1
- 101000806245 Homo sapiens 17-beta-hydroxysteroid dehydrogenase 14 Proteins 0.000 description 1
- 101000775481 Homo sapiens Adenylate cyclase type 8 Proteins 0.000 description 1
- 101000928176 Homo sapiens Adhesion G protein-coupled receptor L3 Proteins 0.000 description 1
- 101000634075 Homo sapiens Alpha-N-acetylneuraminide alpha-2,8-sialyltransferase Proteins 0.000 description 1
- 101000924533 Homo sapiens Angiopoietin-2 Proteins 0.000 description 1
- 101000787265 Homo sapiens Beta-synuclein Proteins 0.000 description 1
- 101000762375 Homo sapiens Bone morphogenetic protein 3 Proteins 0.000 description 1
- 101000749427 Homo sapiens CKLF-like MARVEL transmembrane domain-containing protein 2 Proteins 0.000 description 1
- 101000892017 Homo sapiens CUB and sushi domain-containing protein 1 Proteins 0.000 description 1
- 101001117099 Homo sapiens Calcium/calmodulin-dependent 3',5'-cyclic nucleotide phosphodiesterase 1B Proteins 0.000 description 1
- 101000910841 Homo sapiens Chromobox protein homolog 8 Proteins 0.000 description 1
- 101000949728 Homo sapiens Doublesex- and mab-3-related transcription factor A2 Proteins 0.000 description 1
- 101000815518 Homo sapiens EF-hand and coiled-coil domain-containing protein 1 Proteins 0.000 description 1
- 101001066265 Homo sapiens Endothelial transcription factor GATA-2 Proteins 0.000 description 1
- 101000818727 Homo sapiens Forkhead box protein B1 Proteins 0.000 description 1
- 101001029314 Homo sapiens Forkhead box protein D2 Proteins 0.000 description 1
- 101001029308 Homo sapiens Forkhead box protein D3 Proteins 0.000 description 1
- 101000931494 Homo sapiens Forkhead box protein F1 Proteins 0.000 description 1
- 101001068303 Homo sapiens GS homeobox 1 Proteins 0.000 description 1
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 1
- 101001010449 Homo sapiens Glutamate receptor 2 Proteins 0.000 description 1
- 101000938552 Homo sapiens Homeobox even-skipped homolog protein 1 Proteins 0.000 description 1
- 101000901627 Homo sapiens Homeobox protein DLX-5 Proteins 0.000 description 1
- 101000962636 Homo sapiens Homeobox protein Hox-A2 Proteins 0.000 description 1
- 101001077568 Homo sapiens Homeobox protein Hox-A5 Proteins 0.000 description 1
- 101000632186 Homo sapiens Homeobox protein Nkx-2.2 Proteins 0.000 description 1
- 101000632181 Homo sapiens Homeobox protein Nkx-2.3 Proteins 0.000 description 1
- 101000632193 Homo sapiens Homeobox protein Nkx-2.6 Proteins 0.000 description 1
- 101000584400 Homo sapiens Homeobox protein OTX2 Proteins 0.000 description 1
- 101001053444 Homo sapiens Iroquois-class homeodomain protein IRX-1 Proteins 0.000 description 1
- 101000619910 Homo sapiens LIM/homeobox protein Lhx6 Proteins 0.000 description 1
- 101000893526 Homo sapiens Leucine-rich repeat transmembrane protein FLRT2 Proteins 0.000 description 1
- 101000945411 Homo sapiens Metal transporter CNNM1 Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000992164 Homo sapiens One cut domain family member 2 Proteins 0.000 description 1
- 101000613575 Homo sapiens Paired box protein Pax-1 Proteins 0.000 description 1
- 101000735539 Homo sapiens Pituitary adenylate cyclase-activating polypeptide Proteins 0.000 description 1
- 101000583616 Homo sapiens Polyhomeotic-like protein 2 Proteins 0.000 description 1
- 101001026914 Homo sapiens Protein KRBA1 Proteins 0.000 description 1
- 101000995332 Homo sapiens Protein NDRG4 Proteins 0.000 description 1
- 101000848199 Homo sapiens Protocadherin Fat 4 Proteins 0.000 description 1
- 101000735377 Homo sapiens Protocadherin-7 Proteins 0.000 description 1
- 101001121335 Homo sapiens Proton channel OTOP1 Proteins 0.000 description 1
- 101000632056 Homo sapiens Septin-9 Proteins 0.000 description 1
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 1
- 101000648552 Homo sapiens Sushi domain-containing protein 5 Proteins 0.000 description 1
- 101000692109 Homo sapiens Syndecan-2 Proteins 0.000 description 1
- 101000637031 Homo sapiens Trafficking protein particle complex subunit 9 Proteins 0.000 description 1
- 101000652337 Homo sapiens Transcription factor SOX-21 Proteins 0.000 description 1
- 101000587313 Homo sapiens Tyrosine-protein kinase Srms Proteins 0.000 description 1
- 101000784545 Homo sapiens Zinc finger and SCAN domain-containing protein 18 Proteins 0.000 description 1
- 101000915640 Homo sapiens Zinc finger protein 471 Proteins 0.000 description 1
- 101000760271 Homo sapiens Zinc finger protein 582 Proteins 0.000 description 1
- 101150016712 IKZF1 gene Proteins 0.000 description 1
- 108091029795 Intergenic region Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 102100024435 Iroquois-class homeodomain protein IRX-1 Human genes 0.000 description 1
- 102100022098 LIM/homeobox protein Lhx6 Human genes 0.000 description 1
- 102100040899 Leucine-rich repeat transmembrane protein FLRT2 Human genes 0.000 description 1
- 241001424413 Lucia Species 0.000 description 1
- 102100033593 Metal transporter CNNM1 Human genes 0.000 description 1
- 101710111879 Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 108091092878 Microsatellite Proteins 0.000 description 1
- 101710099430 Microtubule-associated protein RP/EB family member 3 Proteins 0.000 description 1
- 101150079937 NEUROD1 gene Proteins 0.000 description 1
- 206010061309 Neoplasm progression Diseases 0.000 description 1
- 108700020297 NeuroD Proteins 0.000 description 1
- 102100032063 Neurogenic differentiation factor 1 Human genes 0.000 description 1
- 102000028435 Neuropeptide Y4 receptor Human genes 0.000 description 1
- 108010002245 Neuropeptide Y4 receptor Proteins 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 102100031943 One cut domain family member 2 Human genes 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 102100040851 Paired box protein Pax-1 Human genes 0.000 description 1
- 102100041030 Pancreas/duodenum homeobox protein 1 Human genes 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 102100035733 Pituitary adenylate cyclase-activating polypeptide Human genes 0.000 description 1
- 102100030903 Polyhomeotic-like protein 2 Human genes 0.000 description 1
- 102100037318 Protein KRBA1 Human genes 0.000 description 1
- 102100034432 Protein NDRG4 Human genes 0.000 description 1
- 102100034547 Protocadherin Fat 4 Human genes 0.000 description 1
- 102100034941 Protocadherin-7 Human genes 0.000 description 1
- 102100026322 Proton channel OTOP1 Human genes 0.000 description 1
- 101710183548 Pyridoxal 5'-phosphate synthase subunit PdxS Proteins 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 230000006093 RNA methylation Effects 0.000 description 1
- 206010038111 Recurrent cancer Diseases 0.000 description 1
- 208000007660 Residual Neoplasm Diseases 0.000 description 1
- 208000006289 Rett Syndrome Diseases 0.000 description 1
- 108091006569 SLC32A1 Proteins 0.000 description 1
- 102000005031 SLC6A15 Human genes 0.000 description 1
- 108060007754 SLC6A15 Proteins 0.000 description 1
- 241000239226 Scorpiones Species 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 102100028024 Septin-9 Human genes 0.000 description 1
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 1
- 102100028859 Sushi domain-containing protein 5 Human genes 0.000 description 1
- 102100026087 Syndecan-2 Human genes 0.000 description 1
- 102100031926 Trafficking protein particle complex subunit 9 Human genes 0.000 description 1
- 102100024200 Transcription factor COE3 Human genes 0.000 description 1
- 102100030247 Transcription factor SOX-21 Human genes 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 102100029654 Tyrosine-protein kinase Srms Human genes 0.000 description 1
- 102100038170 Vesicular inhibitory amino acid transporter Human genes 0.000 description 1
- 102000013387 Vitamin D3 24-Hydroxylase Human genes 0.000 description 1
- 108010026102 Vitamin D3 24-Hydroxylase Proteins 0.000 description 1
- 102100020915 Zinc finger and SCAN domain-containing protein 18 Human genes 0.000 description 1
- 102100029037 Zinc finger protein 471 Human genes 0.000 description 1
- 102100024716 Zinc finger protein 582 Human genes 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000011394 anticancer treatment Methods 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 229960002756 azacitidine Drugs 0.000 description 1
- AZPBDRUPTRGILK-UHFFFAOYSA-N benzotriazol-1-ium-1-ylidenemethanediamine;4-methylbenzenesulfonate Chemical class CC1=CC=C(S(O)(=O)=O)C=C1.C1=CC=C2N(C(=N)N)N=NC2=C1 AZPBDRUPTRGILK-UHFFFAOYSA-N 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 150000001721 carbon Chemical group 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 108091006090 chromatin-associated proteins Proteins 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 239000012649 demethylating agent Substances 0.000 description 1
- 230000027832 depurination Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- MCWXGJITAZMZEV-UHFFFAOYSA-N dimethoate Chemical compound CNC(=O)CSP(=S)(OC)OC MCWXGJITAZMZEV-UHFFFAOYSA-N 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 108700021358 erbB-1 Genes Proteins 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 238000002795 fluorescence method Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000005021 gait Effects 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000012177 large-scale sequencing Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 208000037819 metastatic cancer Diseases 0.000 description 1
- 208000011575 metastatic malignant neoplasm Diseases 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 108091040808 miR-675 stem-loop Proteins 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 125000004433 nitrogen atom Chemical group N* 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical group [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000000171 quenching effect Effects 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 108010068698 spleen exonuclease Proteins 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 239000013077 target material Substances 0.000 description 1
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 230000005740 tumor formation Effects 0.000 description 1
- 230000005751 tumor progression Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/112—Disease subtyping, staging or classification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Pathology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
一种用于评估DNA甲基化的方法和试剂盒。更具体地说,一种以更高的灵敏度对全部或部分甲基化DNA的胞嘧啶甲基化进行定性或定量评估的方法。所述方法和试剂盒具有多种用途,包括但不限于病症诊断或监测以胞嘧啶甲基化变化为特征的表型的发展。
Description
技术领域
本发明总体上涉及一种用于评估DNA甲基化的方法。更具体地说,本发明涉及一种以更高的灵敏度对全部或部分甲基化DNA的胞嘧啶甲基化进行定性或定量评估的方法。本发明的方法具有多种用途,包括但不限于病症诊断或监测以胞嘧啶甲基化变化为特征的表型的发展。
背景技术
本说明书中对任何先前出版物(或从其衍生的信息)或任何已知事项的引用不是也不应该被视为承认或认可或以任何形式暗示该先前出版物(或从其衍生的信息)或已知事项构成本说明书所涉及的技术领域中的公知常识的一部分。
作者在本说明书中所引用的出版物的书目细节在具体实施方式后面按字母顺序列出。
DNA甲基化是哺乳动物中研究最深入的表观遗传修饰之一,是指在胞嘧啶(C)或腺嘌呤(A)核苷酸上增加一个甲基(CH3)。该甲基可以添加到胞嘧啶碱基的第五个碳原子或腺嘌呤碱基的第六个氮原子上。
DNA甲基化在动物细胞的基因调控中起作用。除了活性基因转录和低甲基化之间存在相关性外,转染实验还显示甲基部分的存在抑制了体内基因表达。此外,基因激活可以通过用5-氮杂胞苷(一种有效的去甲基化剂)处理细胞来诱导。甲基化似乎通过影响DNA与染色质蛋白和特异性转录因子的相互作用来影响基因表达。尽管甲基化模式在体细胞中非常稳定,但早期胚胎却显示出在DNA甲基化方面的明显改变。
因此,DNA甲基化对于健康的生长和发育至关重要,并且与各种过程如基因组印记、致癌作用和重复元素的抑制相关。其还能抑制逆转录病毒基因的表达,以及其它已经进入宿主体内并可能损害宿主的潜在危险的DNA序列的表达。此外,DNA甲基化在癌症的发展中起重要作用,并且是基因转录的关键调节因子。研究表明,启动子区域含有高浓度5-甲基胞嘧啶的基因是转录沉默的。
哺乳动物中60%到90%的CpG是甲基化的。甲基化的胞嘧啶残基随着时间的推移自发脱去氨基以形成T残基;因此,甲基化的CpG二核苷酸稳定地脱去氨基,以形成TpG二核苷酸,这可以由CpG二核苷酸在人类基因组中代表性不足(仅以预期频率的21%出现)的事实证明。CpG岛是CpG位点频率较高的区域,通常出现在多个基因的起点。
随着越来越多的证据证明监测DNA甲基化水平的诊断效用,可靠和准确地评估DNA甲基化的手段变得越来越重要。目前,甲基化特异性PCR是检测亚硫酸氢盐转化的DNA中甲基化CpG位点的常用方法。在该方法中,PCR寡核苷酸引物询问胞嘧啶-磷酸二酯-胍[CpG]位点中的甲基化胞嘧啶残基。甲基化荧光PCR是一种实时PCR变体,除甲基化特异性引物外,还使用5'-3'水解探针来询问甲基化的CpG位点,从而实现定量。
组织活检长期以来一直是病理学测试的生物材料来源,有助于残留病的诊断、预后、检测和治疗选择。越来越多的证据表明,大多数类型的癌症都会将DNA释放到血液中(循环肿瘤DNA-ctDNA),ctDNA的检测可能会对发病率和死亡率产生重大影响。ctDNA通常以非常低的水平存在,并且严重片段化,部分原因是细胞凋亡和坏死是ctDNA释放的主要来源(S.Jahr等人,2001;K.C.A.Chan等人,2004;F.Mouliere等人,2011;F.Diehl等人,2005;P.O.Delgado等人,2013;I.B.Roninson等人,2001)。通常,通过靶向肿瘤特异性体细胞基因组改变来检测ctDNA,例如在KRAS、BRAF和EGFR基因中,这些基因在来自匹配的正常细胞的DNA和健康受试者的循环无细胞DNA(ccfDNA-主要来源是白细胞)中缺失。大规模测序项目,如癌症基因组图谱(TCGA)和国际癌症基因组联盟(ICGC),揭示了在超过5-10%的特定组织类型的肿瘤中观察到非常少的体细胞突变(B.Vogelstein等人,2013),并且由于肿瘤异质性,基因中的突变模式非常多变(M.S.Lawrence等人,2013)。突变的多样性给基于DNA序列变化的癌症诊断测试的发展带来了挑战,因为需要查询大部分基因组才能实现具有足够灵敏度的测试。异常的DNA甲基化是大多数类型实体癌的特征,跟大多数突变相比,常见的超甲基化事件发生得更频繁。与突变靶不同,在癌症从早期到晚期的进化过程中,DNA甲基化模式相对稳定。因此,基于甲基化的检测对于监测ctDNA动态具有明显的理论优势,无需开发高度个体化的测定法(B.Vogelstein等人,2013;S.Garrigou等人,2016;P.Polak等人,2015;K.Warton等人,2015)。然而,ctDNA仅代表一种ccfDNA亚型。非肿瘤ccfDNA也是甲基化分析的潜在目标,以用于诊断、预后或监测目的。与ctDNA一样,ccfDNA也同样存在拷贝数很低的缺点,因此有可能导致假阴性结果。
然而,在检测低拷贝数的甲基化DNA,如ccfDNA(尤其是疾病特异性的ccfDNA,如ctDNA)方面存在一定复杂性。暂且不考虑检测和扩增拷贝数非常低的DNA分子存在的固有困难,检测甲基化变化通常还包括用亚硫酸氢盐溶液预处理DNA,亚硫酸氢盐溶液将未甲基化的胞嘧啶去氨基化以在DNA中产生尿嘧啶,然后在随后的PCR扩增过程中将尿嘧啶转化为胸腺嘧啶。亚硫酸氢盐处理不影响甲基化的胞嘧啶,因此可以很容易检测到。因此,由于不是所有的胞嘧啶都会被甲基化,天然双链分子中的两条互补链在亚硫酸氢盐转化后变成两条非互补的单链。因此,与未经亚硫酸氢盐处理的双链DNA的PCR扩增不同,在正向和反向引物重组到双链DNA(dsDNA)的两条相应链的互补序列的情况下,亚硫酸氢盐转化的DNA的起始拷贝数由于靶区中两条链的互补性丧失而立即减半。此外,亚硫酸氢盐处理的DNA的纯化过程中材料的损失和/或在亚硫酸氢盐处理的过程中,驱动亚硫酸氢盐转化过程所需的高酸碱度、高亚硫酸氢盐浓度和高温导致的DNA高度降解,还导致起始材料的固有损失。脱嘌呤导致随机链断裂时发生降解。因此,所需扩增子越长,完整模板分子的数量就越有限。这可能导致PCR扩增失败,或者由于模板分子的有限取样导致的甲基化水平的定量准确信息损失。最后,亚硫酸氢盐处理也导致单链DNA分子的随机破损(即破坏磷酸盐主链)。如果所述“破损”发生在靶扩增子区域,将导致DNA不可扩增和靶可检测性进一步受损。此外,根据目标基因的询问区域不同,DNA或者因亚硫酸氢盐转化过程而高度富含AT,或者在该区域出现在CpG岛时高度富含CG,这一过程降低了基因组的复杂性,但也给设计合适的PCR测定法带来困难。当所述降解或破损发生在靶扩增子区域时,起始模板会进一步损失。如果分析的焦点是含量已经非常低的ctDNA,由于不能可靠地扩增足够长度的DNA片段以进行靶特异性检测,这些因素的组合可能导致无法获得准确结果。
因此,需要开发改进的方法,以准确和灵敏地检测DNA甲基化,从而提高DNA甲基化分析应用(例如疾病的诊断、预后或监测)的灵敏度。在本发明的开发过程中已经确定,如果扩增反应被设计成利用不同的引物和/或探针组,这些引物和/或探针组本身被设计成能够同时扩增亚硫酸氢盐转化的目标DNA区域的靶链和非互补的相反链,则DNA甲基化分析,特别是定量分析的灵敏度会显著提高。由于在对多个生物样本进行DNA甲基化分析时,靶向两条互补的DNA链并没有使检测到的拷贝数增加,所以这一发现着实出人意料。然而,本发明人已经确定,当特异性扩增含量非常低(例如等于或低于检测限[LOD])的靶输入群体时,不仅灵敏度有所提高,而且所获得的拷贝数是当从靶链单独扩增100%所述输入靶群体时理论上获得的拷贝数的两倍。然而,已知甲基化分析中固有的亚硫酸氢盐转化步骤会导致输入DNA群体的降解和/或随机破损,从而严重降低可扩增的DNA的起始量。因此,尽管从逻辑上来说,相对于仅靶向一条链而言,将扩增反应设计成同时扩增靶链和相反链可能使输出加倍,但这种“加倍”是相对于亚硫酸氢盐转化步骤后存在的可扩增的DNA的量来计算的,而现在已经确定亚硫酸氢盐转化步骤降解和/或破损的DNA比先前认为的要多得多。然而,在本发明中却意外发现,观察到的拷贝数的“加倍”实际上是亚硫酸氢盐处理前的DNA含量的加倍,即由亚硫酸氢盐转化导致显著破损和降解之前的含量的加倍。这一结果完全违反常理,但意义重大,因为这是第一次常规并可靠地检测到了样本中极少拷贝数的甲基化DNA,而在此之前,现有技术方法没有足够的灵敏度来检测此类DNA。此外,应当理解的是,由于亚硫酸氢盐的降解和破损作用,技术人员不会考虑将扩增两条链作为提高输出的手段,因为亚硫酸氢盐降解会显著降低已经很少的DNA拷贝数,从而使基于扩增手段的甲基化分析无效。本发明人已确定,本发明的方法实际上产生了比理论上认为可能的输出至少多50%的加倍输出,因而能够开发出一种能够灵敏可靠地检测低拷贝数DNA甲基化的测定法。考虑到假阳性率没有增加但假阴性率显著降低,后一发现就更显得出人意料。基于这些发现,并考虑到另一出人意料的事实,即已测定由于破损引起的低拷贝数起始模板水平的降低不是如先前所认识的大约50%,而是高达90%,该方法功效的提高更令人惊讶。在开发本发明之前,根本无法从低拷贝数的DNA中获得临床有用的结果,原因是没有产生扩增产物,或者更糟的是,所获得的结果反映了比先前认为的高得多的假阴性结果的水平,从而对依赖于这些结果的患者的临床结果产生非常不利的影响。此外,认识到破损的发生(尽管不是问题的严重程度)后,曾为减轻这一问题作出过重大努力。然而,现有技术中的所有努力都集中在优化该方法的亚硫酸氢盐转化步骤上。但这些努力都没有成功,因为提高亚硫酸氢盐转化效率的技术本身就增加了DNA的降解。值得注意的是,当时没有认识到可以通过优化扩增步骤本身获得比优化现有技术亚硫酸氢盐转化更高的效率。因此,本发明能够实现一种可靠并准确的方法的开发,来对低拷贝数的DNA分子进行基于扩增的甲基化分析。
发明内容
在整个说明书和随后的权利要求中,除非上下文另有要求,否则词语“包括(comprise、comprises、comprising)”将被理解为暗示包括所陈述的整数或步骤或整数或步骤组,但不排除任何其它整数或步骤或整数或步骤组。
本文所用的术语“衍生于”应被理解为表示特定的整数或整数组源自指定的对象,但不一定直接从指定的来源获得。此外,本文使用的单数形式的“一个”和“所述”包括复数指代意义,除非上下文另有明确规定。
除非另有定义,本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。
本说明书包含使用程序Patentin 3.5版本制备的核苷酸序列信息,本文中在参考文献后给出。每个核苷酸序列在序列表中通过数字指示符<210>及其后面的顺序标识符识别(例如<210>1、<210>2等)。每个序列的长度、序列类型(DNA等)和原始有机体分别由数字指示符字段<211>、<212>和<213>中提供的信息指示。说明书中提到的核苷酸序列通过指示符SEQ ID NO:及其后面的顺序标识符来识别(例如SEQ ID NO:l、SEQ ID NO:2等)。说明书中提到的顺序标识符与序列表中的数字指示符字段<400>中提供的信息相关,数字指示符字段<400>后面跟顺序标识符(例如<400>1、<400>2等)。也就是说,在说明书中详细描述的SEQ ID NO:l与序列表中<400>1所示的序列相关。
本发明的一个方面涉及筛查目标DNA区域甲基化的方法,所述方法包括:
(i)将DNA样本与修饰未甲基化胞嘧啶残基的试剂接触,其中所述样本包括所述目标DNA区域的靶链和相反链;
(ii)将步骤(i)的DNA样本与以下物质接触:
a)第一组正向和反向引物,其用于扩增目标DNA区域的修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组正向和反向引物,其用于扩增目标DNA区域的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)如果步骤(a)和(b)的引物是甲基化特异性的,则任选一种或多种针对靶链和相反链中的每一条的探针,或者如果步骤(a)和(b)的引物不是甲基化特异性的,则任选一种或多种针对靶链和相反链的甲基化特异性探针,其中所述探针包含检测手段;
(iii)扩增步骤(ii)的DNA样本,其中如果使用步骤(ii)(c)的一种或多种探针,所述引物沿所述基因的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出,以获得假阴性结果发生率较低的结果。
更具体地,提供一种筛查目标DNA区域甲基化的改进方法,所述方法包括:
(i)将DNA样本与修饰未甲基化胞嘧啶残基的试剂接触,其中所述样本包括所述目标DNA区域的靶链和相反链,所述DNA样本包括所述目标DNA区域的低拷贝数;
(ii)将步骤(i)的DNA样本与以下物质接触:
a)第一组正向和反向引物,其用于扩增目标DNA区域的修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组正向和反向引物,其用于扩增目标DNA区域的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)如果步骤(a)和(b)的引物是甲基化特异性的,则任选一种或多种针对靶链和相反链中的每一条的探针,或者如果步骤(a)和(b)的引物不是甲基化特异性的,则任选一种或多种针对靶链和相反链的甲基化特异性探针,其中所述探针包含检测手段;
(iii)扩增步骤(ii)的DNA样本,其中如果使用步骤(ii)(c)的一种或多种探针,所述引物沿所述基因的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出。
另一方面,提供一种筛查基因或其区域甲基化的方法,所述方法包括:
(i)将DNA样本与修饰未甲基化胞嘧啶残基的试剂接触,其中所述样本包括所述基因靶的靶链和相反链,所述DNA样本包括所述目标DNA区域的低拷贝数;
(ii)将步骤(i)的DNA样本与以下物质接触:
a)第一组正向和反向引物,其用于扩增基因靶的修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组正向和反向引物,其用于扩增基因靶的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)如果步骤(a)和(b)的引物是甲基化特异性的,则任选一种或多种针对靶链和相反链中的每一条的探针,或者如果步骤(a)和(b)的引物不是甲基化特异性的,则任选一种或多种针对靶链和相反链的甲基化特异性探针,其中所述探针包含检测手段;
(iii)扩增步骤(ii)的DNA样本,其中如果使用步骤(ii)(c)的一种或多种探针,所述引物沿所述基因的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出。
另一方面,所述基因或基因区域是哺乳动物基因或基因区域。
又一方面,所述基因是大肠肿瘤标志物,更具体地,是以下一种或多种:
另一方面,提供一种筛查基因或其区域甲基化的方法,基因靶选自基本上由以下组成的列表:
所述方法包括:
(i)将DNA样本与修饰未甲基化胞嘧啶残基的试剂接触,其中所述样本包括所述基因或其区域的靶链和相反链,所述DNA样本包括所述目标基因区域的低拷贝数;
(ii)将步骤(i)的DNA样本与以下物质接触:
a)第一组正向和反向引物,其用于扩增基因靶的修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组正向和反向引物,其用于扩增基因靶的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)如果步骤(a)和(b)的引物是甲基化特异性的,则任选一种或多种针对靶链和相反链中的每一条的探针,或者如果步骤(a)和(b)的引物不是甲基化特异性的,则任选一种或多种针对靶链和相反链的甲基化特异性探针,其中所述探针包含检测手段;
(iii)扩增步骤(ii)的DNA样本,其中如果使用步骤(ii)(c)的一种或多种探针,所述引物沿所述基因的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出。
另一方面,提供一种筛查目标DNA区域甲基化的方法,所述方法包括:
(i)将DNA样本与亚硫酸氢盐试剂接触以将未甲基化的胞嘧啶残基转化为尿嘧啶,其中所述样本包括所述目标DNA区域的靶链和相反链,所述DNA样本包括所述目标基因区域的低拷贝数;
(ii)将步骤(i)的DNA样本与以下物质接触:
a)第一组正向和反向引物,其用于扩增目标DNA区域的修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组正向和反向引物,其用于扩增目标DNA区域的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)如果步骤(a)和(b)的引物是甲基化特异性的,则任选一种或多种针对靶链和相反链中的每一条的探针,或者如果步骤(a)和(b)的引物不是甲基化特异性的,则任选一种或多种针对靶链和相反链的甲基化特异性探针,其中所述探针包含检测手段;
(iii)扩增步骤(ii)的DNA样本,其中如果使用步骤(ii)(c)的一种或多种探针,所述引物沿所述基因的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出。
又一方面,提供一种筛查目标DNA区域甲基化的方法,所述方法包括:
(i)将DNA样本与亚硫酸氢盐试剂接触以将未甲基化的胞嘧啶残基转化为尿嘧啶,其中所述样本包括所述目标DNA区域的靶链和相反链,所述DNA样本包括所述目标基因区域的低拷贝数;
(ii)将步骤(i)的DNA样本与以下物质接触:
a)第一组甲基化特异性的正向和反向引物,其用于扩增目标DNA区域的修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组甲基化特异性的正向和反向引物,其用于扩增目标DNA区域的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)任选地一种或多种包括检测手段的探针;
(iii)扩增步骤(ii)的DNA样本,其中如果使用步骤(ii)(c)的一种或多种探针,所述引物沿所述DNA的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出。
在一个实施例中,修饰未甲基化胞嘧啶残基的所述试剂是亚硫酸氢钠。
在一个实施例中,所述目标DNA区域是基因靶。
在另一实施例中,所述基因靶选自基本上由以下组成的列表:
在又一实施例中,所述基因是BCAT1、IKZF1、IRF4、GRASP或CAHM中的一种或多种,特别是BCAT1和/或IKZF1。
在另一实施例中,所述DNA样本是血液、血浆、血清、唾液、粪便、腹水或尿液。
在另一实施例中,所述目标DNA区域是ccfDNA,例如疾病特异性ccfDNA,特别是ctDNA。
在又一实施例中,所述探针是非甲基化特异性探针。
在又一实施例中,所述探针是甲基化特异性探针。
又一方面,提供一种筛查目标DNA区域甲基化的方法,所述方法包括:
(i)将DNA样本与亚硫酸氢盐试剂接触以将未甲基化的胞嘧啶残基转化为尿嘧啶,其中所述样本包括所述目标DNA区域的靶链和相反链,所述DNA样本包括所述目标基因区域的低拷贝数;
(ii)将步骤(i)的DNA样本与以下物质接触:
a)第一组非甲基化特异性的正向和反向引物,其用于扩增目标DNA区域的修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组非甲基化特异性的正向和反向引物,其用于扩增目标DNA区域的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)一种或多种针对靶链和相反链的甲基化特异性探针,其中所述探针包括检测手段;
(iii)扩增步骤(ii)的DNA样本,其中如果使用步骤(ii)(c)的一种或多种探针,所述引物沿所述DNA的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出。
在又一实施例中,修饰未甲基化胞嘧啶残基的所述试剂是亚硫酸氢钠。在一个实施例中,所述目标DNA区域是基因靶。
在另一实施例中,所述基因靶标选自基本上由以下组成的列表:
在又一实施例中,所述基因是BCAT1、IKZF1、IRF4、GRASP或CAHM中的一种或多种,特别是BCAT1和/或IKZF1。
在另一实施例中,所述DNA样本是血液、血浆、血清、唾液、粪便、腹水或尿液。
在另一实施例中,所述目标DNA区域是ccfDNA,例如疾病特异性ccfDNA,特别是ctDNA。
在另一实施例中,所述探针是水解探针。
在另一方面,所述低拷贝数是少于100个测试的靶DNA/样本。在另一实施例中,所述低拷贝数是少于95个测试的靶DNA/样本、少于90个测试的靶DNA/样本、少于85个测试的靶DNA/样本、少于80个测试的靶DNA/样本、少于75个测试的靶DNA/样本、少于70个测试的靶DNA/样本、少于65个测试的靶DNA/样本、少于60个测试的靶DNA/样本、少于55个测试的靶DNA/样本、少于50个测试的靶DNA/样本、少于45个测试的靶DNA/样本、少于40个测试的靶DNA/样本、少于35个测试的靶DNA/样本、少于30个测试的靶DNA/样本、少于25个测试的靶DNA/样本、少于20个测试的靶DNA/样本、少于15个测试的靶DNA/样本、少于10个测试的靶DNA/样本或少于5个测试的靶DNA/样本。更具体地说,所述低拷贝数是少于50个测试的靶DNA/样本,更具体地少于40个测试的靶DNA/样本,更具体地少于30个测试的靶DNA/样本,更具体地少于20个测试的靶DNA/样本。在另一实施例中,所述低拷贝数是少于10个测试的靶DNA/样本,最具体地少于5个测试的靶DNA/样本。
又一方面,所述扩增是定量PCR,并且所述低拷贝数是LOD。
在又一实施例中,所述探针是一种或多种针对部分胞嘧啶甲基化区域的水解探针,其中所述一种或多种探针在所述区域共同杂交到至少两种不同的甲基化模式。
又一方面,所述基因是IKZF1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:13 5'-TTTGTATYGGAGTAGYGATTYGGGAGG-3'
SEQ ID NO:14 5'-TTTGTATCGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:15 5'-TTTGTATCGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:16 5'-TTTGTATCGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:17 5'-TTTGTATTGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:18 5'-TTTGTATCGGAGTAGTGATTTGGGAGG-3'
SEQ ID NO:19 5'-TTTGTATTGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:20 5'-TTTGTATTGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:21 5'-TTTGTATTGGAGTAGTGATTTGGGAGG-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:77(正向引物):Chr7(-);50,304,295-50,304,314
5'-CGCGTAGAAGGGCGT AGAGC-3'
SEQ ID NO:78(反向引物):Chr7(+);50,304,234-50,304,254
5'-GCGCGAACCGAAAAACTCGAC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:79 5'-AAYGAYGCACCCTCTCYGTATCCY-3'
SEQ ID NO:80 5'-AACGACGCACCCTCTCCGTATCCT-3'
SEQ ID NO:81 5'-AATGACGCACCCTCTCCGTATCCC-3'
SEQ ID NO:82 5'-AACGATGCACCCTCTCCGTATCCC-3'
SEQ ID NO:83 5'-AACGACGCACCCTCTCTGTATCCC-3'
SEQ ID NO:84 5'-AATGATGCACCCTCTCCGTATCCC-3'
SEQ ID NO:85 5'-AATGACGCACCCTCTCTGTATCCC-3'
SEQ ID NO:86 5'-AATGACGCACCCTCTCCGTATCCT-3'
SEQ ID NO:87 5'-AACGATGCACCCTCTCTGTATCCC-3'
SEQ ID NO:88 5'-AACGATGCACCCTCTCCGTATCCT-3'
SEQ ID NO:89 5'-AACGACGCACCCTCTCTGTATCCT-3'
SEQ ID NO:90 5'-AATGATGCACCCTCTCTGTATCCC-3'
SEQ ID NO:91 5'-AATGACGCACCCTCTCTGTATCCT-3'
SEQ ID NO:92 5'-AACGATGCACCCTCTCTGTATCCT-3'
SEQ ID NO:93 5'-AATGATGCACCCTCTCTGTATCCT-3'
SEQ ID NO:94 5'-AACGACGCACCCTCTCCGTATCCC-3'
SEQ ID NO:95 5'-AATGATGCACCCTCTCCGTATCCT-3'
或者基本相似的序列。
又一方面,所述基因是IKZF1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:13 5'-TTTGTATYGGAGTAGYGATTYGGGAGG-3'
SEQ ID NO:14 5'-TTTGTATCGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:15 5'-TTTGTATCGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:16 5'-TTTGTATCGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:17 5'-TTTGTATTGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:18 5'-TTTGTATCGGAGTAGTGATTTGGGAGG-3'
SEQ ID NO:19 5'-TTTGTATTGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:20 5'-TTTGTATTGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:21 5'-TTTGTATTGGAGTAGTGATTTGGGAGG-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:22(正向引物):Chr7(-);50,304,366-50,304,391
5'TTGTTTCGTAGTCGGTTCGGTTTCG 3'
SEQ ID NO:23(反向引物):Chr7(+);50,304,271-50,304,294
5'-AACGACGCACCCTCTCCGTATCCC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:245'-TTTTTYGGATYGTTGTTTYGGTATAGG-3'
SEQ ID NO:255'-TTTTTCGGATCGTTGTTTCGGTATAGG-3'
SEQ ID NO:265'-TTTTTCGGATCGTTGTTTTGGTATAGG-3'
SEQ ID NO:275'-TTTTTCGGATTGTTGTTTCGGTATAGG-3'
SEQ ID NO:285'-TTTTTTGGATCGTTGTTTCGGTATAGG-3'
SEQ ID NO:295'-TTTTTCGGATTGTTGTTTTGGTATAGG-3'
SEQ ID NO:305'-TTTTTTGGATTGTTGTTTCGGTATAGG-3'
SEQ ID NO:315'-TTTTTTGGATCGTTGTTTTGGTATAGG-3'
SEQ ID NO:325'-TTTTTTGGATTGTTGTTTTGGTATAGG-3'
或者基本相似的序列。
又一方面,所述基因是IKZF1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:135'-TTTGTATYGGAGTAGYGATTYGGGAGG-3'
SEQ ID NO:145'-TTTGTATCGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:155'-TTTGTATCGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:165'-TTTGTATCGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:175'-TTTGTATTGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:185'-TTTGTATCGGAGTAGTGATTTGGGAGG-3'
SEQ ID NO:195'-TTTGTATTGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:205'-TTTGTATTGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:21 5'-TTTGTATTGGAGTAGTGATTTGGGAGG-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:33(正向引物):Chr7(-);50,304,329-50,304,355
5'-CGGTCGTTTTTCGGATCGTTGTTTCGG-3'
SEQ ID NO:23(反向引物):Chr7(+);50,304,271-50,304,294
5'-AACGACGCACCCTCTCCGTATCCC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:34 5'-YGYGTAGAAGGGYGTAGAGYG-3'
SEQ ID NO:35 5'-CGCGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:36 5'-CGCGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:37 5'-CGCGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:38 5'-CGTGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:39 5'-TGTGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:40 5'-TGCGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:41 5'-CGTGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:42 5'-CGCGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:43 5'-TGTGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:44 5'-TGCGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:45 5'-TGCGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:46 5'-TGTGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:47 5'-TGTGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:48 5'-TGCGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:49 5'-CGTGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:50 5'-CGTGTAGAAGGGTGTAGAGCG-3'
或者基本相似的序列。
又一方面,所述基因是BCAT1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:97(正向引物):chrl2(+);24,949,138-24,949,164
5'-TTAGTGTTTTTTTGTTGATGTAATTCG-3'
SEQ ID NO:65(反向引物):chrl2(-);24,949,058-24,949,074
5'-CAATACCCGAAACGACGACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:66 5'-TTCGTCGCGAGAGGGTCGGTT-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:96(正向引物):chrl2(-);24,949,058-24,949,082
5'-TAGTGTTCGAGGCGGCGGCGAGTAT-3'
SEQ ID NO:62(反向引物):chrl2(+);24,949,140-24,949,159
5'-ATCTTCCTACTAATACAATCCGCTAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括以下序列:
SEQ ID NO:63 5'-GATCGGTTTTTTCGCGGCGGA-3'
或者基本相似的序列。
又一方面,所述基因是BCAT1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:64(正向引物):chrl2(+);24,949,131-24,949,159
5'-GTTTTTTTGTTGATGTAATTCGTTAGGTC-3'
SEQ ID NO:65(反向引物):chrl2(-);24,949,058-24,949,074
5'-CAATACCCGAAACGACGACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:66 5'-TTCGTCGCGAGAGGGTCGGTT-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:61(正向引物):chrl2(-);24,949,058-24,949,085
5'-T AGTGTTCGAGGCGGCGGCGAGTATACG-3'
SEQ ID NO:62(反向引物):chrl2(+);24,949,140-24,949,159
5'-ATCTTCCTACTAATACAATCCGCTAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括以下序列:
SEQ ID NO:63 5'-GATCGGTTTTTTCGCGGCGGA-3'
或者基本相似的序列。
又一方面,所述基因是IRF4,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:111(正向引物):Chr6(-):391,614-391,636
5'-TAAGTCGAGAGTCGGGGTCGGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
又一方面,所述基因是IRF4,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:114(正向引物):Chr6(-):391,614-391,630
5'-GAGAGTCGGGGTCGGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
又一方面,所述基因是IRF4,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:116(正向引物):Chr6(-):391,624-391,649
5'-GAGAGGGATTTTGTAAGTCGAGAGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
本发明的另一方面涉及一种诊断或监测患者病症的方法,所述病症的特征在于目标DNA区域甲基化的调节,所述方法包括:
(i)将DNA样本与修饰未甲基化胞嘧啶残基的试剂接触,其中所述样本包括所述目标DNA区域的靶链和相反链,所述DNA样本包括所述目标基因区域的低拷贝数;
(ii)将步骤(i)的DNA样本与以下物质接触:
a)第一组正向和反向引物,其用于扩增目标DNA区域的修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组正向和反向引物,其用于扩增目标DNA区域的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)如果步骤(a)和(b)的引物是甲基化特异性的,则任选一种或多种针对靶链和相反链中的每一条的探针,或者如果步骤(a)和(b)的引物不是甲基化特异性的,则任选一种或多种针对靶链和相反链的甲基化特异性探针,其中所述探针包含检测手段;
(iii)扩增步骤(ii)的DNA样本,其中如果使用步骤(ii)(c)的一种或多种探针,所述引物沿所述基因的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出。
本发明的另一方面涉及一种用于分析生物样本的试剂盒,其包括一种或多种用于根据本发明的方法检测一种或多种肿瘤标志物的引物和/或探针,以及有助于通过所述引物和/或探针进行检测的试剂。还可以包括其它手段,例如,接收生物样本。
另一方面,提供一种用于筛查目标DNA区域甲基化的试剂盒,所述试剂盒包括:
a)第一组正向和反向引物,其用于扩增目标DNA区域的靶链的一种或多种完全或部分甲基化形式,所述引物用于杂交到已被未甲基化胞嘧啶试剂修饰的目标DNA区域的形式;
b)第二组正向和反向引物,其用于扩增目标DNA区域的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)如果步骤(a)和(b)的引物是甲基化特异性的,则任选一种或多种针对靶链和相反链中的每一条的探针,或者如果步骤(a)和(b)的引物不是甲基化特异性的,则任选一种或多种针对靶链和相反链的甲基化特异性探针,其中所述探针包含检测手段。
附图说明
图1是示出亚硫酸氢盐处理如何导致非互补单个DNA链的示意图。A)用亚硫酸氢盐溶液处理DNA将未甲基化的胞嘧啶(C)残基转化为尿嘧啶(U)残基,而甲基化的胞嘧啶(mC)残基不受影响。因此,所得的亚硫酸氢盐处理的DNA链不再互补。在随后的PCR扩增过程中,尿嘧啶被DNA类似物胸腺嘧啶(T)取代。这样就能区分甲基化和非甲基化胞嘧啶。B)使用与顶部和底部链互补的寡核苷酸(FWD,REV)对野生型DNA进行PCR扩增,在1个循环后导致DNA材料加倍。C)除非有两个寡核苷酸引物组(亚硫酸氢盐转化和甲基化和/或未甲基化特异性),否则只有原始野生型DNA的靶链被扩增。
图2是使用亚硫酸氢盐和甲基化特异性寡核苷酸(引物/探针)检测2000pg完全甲基化和亚硫酸氢盐转化的DNA的BCAT1和IKZF1(灰色)中各自的靶区或靶区和相反靶区(红色)的A)BCAT1和B)IKZF1中靶甲基化区域的实时PCR扩增曲线的图示。ΔCt值为1表示扩增的模板量增加了一倍。
图3是在2000pg亚硫酸氢盐处理的完全甲基化的DNA(相当于约606个基因组拷贝)中,使用寡核苷酸(重组到A)靶区或B)靶区和相反靶区的引物探针)基于数字液滴PCR对ACTB、BCAT1和IKZF1中的靶甲基化区域进行定量的图示。显示了ACTB、BCAT1和IKZF1的靶链以及在B)中BCAT1和IKZF1的相反靶链的荧光群,表示为BCAT1’和IKZF1’。括号中的数字是指靶的确定拷贝数,拷贝数/孔。
图4是掺有各种量的完全甲基化的DNA(0-300pg/mL范围内)的混合人类血浆的图示。随后提取循环无细胞DNA并使用亚硫酸氢盐转化。使用图3中描述的分析方法,以一式三份的形式分析所得DNA的5至13个样本复制品。如果BCAT1和/或IKZF1的三个PCR复制品中任何一个呈阳性,则认为该样本呈阳性。检测限(LOD)用概率元分析计算。
图5是在掺有各种量的完全甲基化的DNA(0-500pg/mL范围内)的混合人类血浆中测量的PCR复制品阳性的图示。随后提取循环无细胞DNA并使用亚硫酸氢盐转化。使用亚硫酸氢盐和甲基化特异性寡核苷酸(引物/探针)分析所得的DNA,亚硫酸氢盐和甲基化特异性寡核苷酸(引物/探针)检测IKZF1和BCAT1中各自的靶区(红条;SEQ ID:11-21,64-66)或靶区和相反靶区(黑条;SEQ ID:11-21,77-95,62-63,96,65-66,97)。如果BCAT1和/或IKZF1的三个PCR复制品中任何一个呈阳性,则认为该样本呈阳性。
图6是使用图5中描述的测定法,在BCAT1和IKZF1中靶区(红色)或靶区和相反靶区(黑色)上的甲基化区域的基于qPCR的阳性的图示。在每种情况下,扩增每个样本中含有3pg(相当于大约1个基因组拷贝)的超声处理过、亚硫酸氢盐处理过且完全甲基化的DNA的多个复制品(n≥270),并测定所有样本的阳性水平。如果BCAT1和/或IKZF1的三个PCR复制品中任何一个呈阳性,则认为该样本呈阳性。
图7是使用亚硫酸氢盐和甲基化特异性寡核苷酸(引物/探针)检测2000pg完全甲基化和亚硫酸氢盐转化的DNA的IRF4中各自的靶区(黑色;SEQ ID:108-110)或靶区和相反靶区(红色;SEQ ID:108-110和111-113)的IRF4中靶甲基化区域的实时PCR扩增曲线的图示。ΔCt值为1表示扩增的模板量增加了一倍。
图8详细描述了实例中使用的IKZF1、BCAT1、IRF4和ACTB序列。
具体实施方式
本发明部分基于以下测定:如果扩增反应被设计成使用至少两组引物(和探针,如果要进行定量分析的话),其中至少一组引物被设计成杂交到并扩增亚硫酸氢盐转化的目标DNA区域的靶链,而另一组引物被设计成杂交到并扩增亚硫酸氢盐转化的目标DNA区域的相反链,则基于PCR的DNA甲基化分析的可靠性和灵敏度可以显著提高。鉴于针对低拷贝数DNA甲基化靶的基于扩增的分析的不可靠性和缺乏灵敏度的真实程度,该方法的开发是必要的,所述低拷贝数DNA甲基化靶例如循环无细胞DNA(ccfDNA)的甲基化标记,例如疾病特异性ccfDNA,特别是循环肿瘤DNA(ctDNA)。具体而言,除了目标双链DNA区域的亚硫酸氢盐转化导致产生两条非互补链的事实之外,亚硫酸氢盐转化步骤本身由于驱动转化过程所需的高酸碱度和高温也会导致DNA降解,其中两条非互补链不能被基于亚硫酸氢盐转化的DNA链之一设计的正向和反向引物组扩增(以对未处理的DNA进行PCR的常规方式)。然而,还进一步确定亚硫酸氢盐处理也可能导致DNA分子的两条链的随机破损(DNA磷酸主链的破坏)。当这种破损发生在靶扩增子区域时,DNA将不可扩增。
因此,由于使用现有技术中定量或定性进行基于亚硫酸氢盐转化的DNA甲基化分析的方法只能扩增一条链,同时亚硫酸氢盐转化过程的苛刻条件导致进一步的整体DNA降解,因而显著减少了可用于初始扩增的总的DNA拷贝数,从而导致灵敏度的显著降低-可能到了不能准确检测目标样本中的基因超甲基化的程度。然而,现在已经进一步确定,随机破损的发生不仅可能进一步降低可用起始材料的浓度,而且最关键的是,还会导致不可靠和不准确的结果,即不可接受的水平的假阴性结果,这对疾病诊断和筛查是非常不利的。尽管假阳性结果也是不利的,但这些患者至少有可能接受进一步的检测。然而,假阴性结果可能会导致患者被错误地归类为无病患者,从而导致潜在的致命后果。
亚硫酸氢盐转化的DNA的随机破损对其后获得的低拷贝数DNA的扩增结果的准确性的影响的严重程度是出乎意料的,因此需要重新设计和开发新的扩增方法,该方法除了显著提高获得的扩增结果的准确性之外,还提高了筛查试验的总体灵敏度。现有技术方法致力于通过优化亚硫酸氢盐转化步骤来提高效率,导致起始DNA群体的降解水平更高,这在目标DNA起始拷贝数非常低的情况下尤其成问题。然而,本发明人设计了一种方法,使得当扩增低丰度的靶输入群体时,不仅灵敏度有所提高,而且所获得的拷贝数是当从靶链单独扩增100%所述输入靶群体时理论上获得的拷贝数的两倍。这是通过设计扩增试验来实现的,该试验包括使用至少两组不同的引物和探针,这些引物和探针被设计成能够扩增甲基化的目标DNA区域的靶链和相反链。尽管从逻辑上来说,这种“加倍”是相对于亚硫酸氢盐转化步骤后存在的可扩增的DNA的量来计算的,而现在已经确定亚硫酸氢盐转化步骤降解和/或破损的DNA比先前认为的要多得多。在本发明中意外发现,观察到的拷贝数的“加倍”实际上是亚硫酸氢盐处理前的DNA含量的加倍,即由亚硫酸氢盐转化导致显著破损和降解之前的含量的加倍。因此,本发明方法的开发使得甲基化特异性扩增法的常规应用成为可能,该方法具有明显更高的灵敏度和准确性。在癌症诊断中,假阴性结果会对患者产生极其严重的后果。在评估DNA甲基化时,本发明的方法提供了确保高灵敏度的简单但稳健的手段。
本发明的一个方面涉及筛查目标DNA区域甲基化的方法,所述方法包括:
(i)将DNA样本与修饰未甲基化胞嘧啶残基的试剂接触,其中所述样本包括所述目标DNA区域的靶链和相反链;
(ii)将步骤(i)的DNA样本与以下物质接触:
a)第一组正向和反向引物,其用于扩增目标DNA区域的修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组正向和反向引物,其用于扩增目标DNA区域的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)如果步骤(a)和(b)的引物是甲基化特异性的,则任选一种或多种针对靶链和相反链中的每一条的探针,或者如果步骤(a)和(b)的引物不是甲基化特异性的,则任选一种或多种针对靶链和相反链的甲基化特异性探针,其中所述探针包含检测手段;
(iii)扩增步骤(ii)的DNA样本,其中如果使用步骤(ii)(c)的一种或多种探针,所述引物沿所述基因的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出,以获得假阴性结果发生率较低的结果。
更具体地,提供一种筛查目标DNA区域甲基化的改进方法,所述方法包括:
(i)将DNA样本与修饰未甲基化胞嘧啶残基的试剂接触,其中所述样本包括所述目标DNA区域的靶链和相反链,所述DNA样本包括所述目标DNA区域的低拷贝数;
(ii)将步骤(i)的DNA样本与以下物质接触:
a)第一组正向和反向引物,其用于扩增目标DNA区域的修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组正向和反向引物,其用于扩增目标DNA区域的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)如果步骤(a)和(b)的引物是甲基化特异性的,则任选一种或多种针对靶链和相反链中的每一条的探针,或者如果步骤(a)和(b)的引物不是甲基化特异性的,则任选一种或多种针对靶链和相反链的甲基化特异性探针,其中所述探针包含检测手段;
(iii)扩增步骤(ii)的DNA样本,其中如果使用步骤(ii)(c)的一种或多种探针,所述引物沿所述基因的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出。
在一个实施例中,从步骤(iv)获得的结果显示假阴性结果的发生率降低。
对“目标DNA区域”的引用应理解为对任何DNA区域或形式的引用,包括一个或多个接受甲基化状态分析的CpG位点(“岛”)。例如,可以是基因、基因的一部分、基因间区域或启动子。此处,对“基因”的引用应理解为对编码蛋白质产物的DNA分子的引用,无论该蛋白质产物是全长蛋白质还是蛋白质片段。然而,应当理解的是,有些已经被识别的基因并不一定能产生蛋白质产物,而只能被转录成RNA。因此,这里提到的“基因”应理解为包括两种类型的基因。就基因组DNA或由其转录的RNA而言,基因通常包括内含子和外显子区域。目标受试核酸区域也可以是基因组DNA的一部分,已知其不与任何特定基因相关联(例如通常称为“垃圾”DNA区域)。目标核酸靶还可以是通过重组产生的基因组DNA的任何区域,或者是基因组DNA的两个区域之间,或者是基因组DNA的一个区域和外源DNA的一个区域之间,例如病毒或引入的序列。作为分析对象的DNA不一定是基因组DNA,尽管通常认为重组表达的DNA,如cDNA,通常没有甲基化。然而,本发明应该被理解为包括可能被甲基化的任何来源或形式的DNA的分析。
当不以任何方式限制本发明时,DNA甲基化在细菌、植物和动物中是普遍的。DNA甲基化是一种对DNA的化学修饰,它在细胞分裂过程中是稳定的,不涉及生物体潜在的DNA序列的变化。染色质和DNA修饰是表观遗传学的两个重要特征,并在细胞分化过程中发挥作用,使细胞尽管含有相同的基因组材料,但仍能稳定地保持不同的特征。在真核生物中,DNA甲基化只发生在胞嘧啶嘧啶环的5号碳上。在哺乳动物中,DNA甲基化主要发生在CpG二核苷酸胞嘧啶的5号碳上。CpG二核苷酸约占人类基因组的1%。
哺乳动物中70-80%的CpG是甲基化的。CpG可以被分成称为“CpG岛”的聚簇,通常存在于多个基因的调节区的5’端。在多种疾病过程中,如癌症,基因启动子和/或CpG岛存在异常甲基化。低甲基化通常见于癌基因,而异常的DNA超甲基化通常与肿瘤抑制基因的可遗传转录沉默有关。DNA甲基化可能以两种方式影响基因的转录。首先,DNA的甲基化本身可能在物理上阻碍转录因子与基因的结合,从而阻断转录。第二,甲基化的DNA可能被称为甲基-CpG-结合域蛋白(MBD)的蛋白结合。然后,MBD蛋白向基因座募集额外的蛋白,如组蛋白去乙酰化酶和其它能修饰组蛋白的染色质重塑蛋白,从而形成致密的、无活性的染色质,称为沉默染色质。DNA甲基化和染色质结构之间的该联系非常重要。特别是,甲基-CpG结合蛋白2(MeCP2)的缺失与Rett综合征有关,甲基-CpG结合域蛋白2(MBD2)介导癌症中超甲基化基因的转录沉默。
人类DNA甲基化过程由三种酶执行,即DNA甲基转移酶1、3a和3b(DNMT1、DNMT3a和DNMT3b)。通常认为DNMT3a和DNMT3b是在发育早期建立DNA甲基化模式的从头甲基转移酶。DNMTl是提议的维持甲基转移酶,在DNA复制过程中负责将DNA甲基化模式复制到子链上。DNMT3L是一种与其它DNMT3s同源但没有催化活性的蛋白质。相反,DNMT3L通过增加其与DNA结合的能力和刺激其活性来协助从头甲基转移酶。最后,DNMT2已被鉴定为一种“神秘的”DNA甲基转移酶同源物,包含所有DNA甲基转移酶共有的所有10个序列基序;然而,DNMT2可能不会使DNA甲基化,而是能使一个小RNA甲基化。
因此,术语“甲基化”应理解为指在核酸区域(例如基因组DNA)中,通过DNA甲基转移酶对胞嘧啶或腺苷碱基的作用而添加的甲基的存在。基于此,检测完全或部分甲基化形式的DNA一般应理解为包括检测半甲基化的DNA。
在一个实施例中,所述目标核酸靶是DNA基因或基因区域,例如启动子区域。因此,对“基因靶”的引用应理解为对接受甲基化询问的基因或基因区域的引用。如本领域技术人员所理解的,对“基因”的引用包括基因的启动子区域。
对“基因区域”的引用应理解为对对应于基因的一部分而非整个基因的任何一段DNA的引用。例如,通过本发明的方法分析的DNA可以是片段化的,例如在体内循环过程中由于DNAse的作用,或者在其分离过程中,或者可以在通过本发明的方法分析之前作为初步步骤被切割。
根据本实施例,提供一种筛查基因或其区域甲基化的方法,所述方法包括:
(i)将DNA样本与修饰未甲基化胞嘧啶残基的试剂接触,其中所述样本包括所述基因靶的靶链和相反链,所述DNA样本包括所述目标基因区域的低拷贝数;
(ii)将步骤(i)的DNA样本与以下物质接触:
a)第一组正向和反向引物,其用于扩增基因靶的修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组正向和反向引物,其用于扩增基因靶的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)如果步骤(a)和(b)的引物是甲基化特异性的,则任选一种或多种针对靶链和相反链中的每一条的探针,或者如果步骤(a)和(b)的引物不是甲基化特异性的,则任选一种或多种针对靶链和相反链的甲基化特异性探针,其中所述探针包含检测手段;
(iii)扩增步骤(ii)的DNA样本,其中如果使用步骤(ii)(c)的一种或多种探针,所述引物沿所述基因的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出。
在另一实施例中,所述基因或基因区域是哺乳动物基因或基因区域。
在又一实施例中,所述基因是大肠肿瘤标志物,更具体地,是以下一种或多种:
这些基因在本文中通过参考基因名称和一组人类染色体坐标来指定。基因名称和染色体坐标都是本领域技术人员熟知和理解的。一般来说,一个基因可以通过参照其名称进行常规鉴定,通过这种方法可以常规获得其序列和染色体位置,或者通过参照其染色体坐标进行常规鉴定,通过这种方法也可以常规获得基因名称及其序列。
对“基因”的引用应理解为对这些分子的所有形式及其片段或变体的引用。如本领域技术人员所理解的,已知一些基因在个体之间表现出等位基因变异或单核苷酸多态性。所述变异包括单核苷酸多态性、不同大小的插入和缺失以及简单的序列重复,如二核苷酸和三核苷酸重复。变体包括来自相同区域的核酸序列,其具有至少90%、95%、98%、99%或更高的序列同一性,即相对于这里描述的基因具有一个或多个缺失、添加、替换、反向序列等。因此,本发明应被理解为包括此类变体,就目前的诊断应用而言,尽管个体之间可能存在实际核酸序列之间的微小遗传差异,但这些变体获得了相同的结果。因此,本发明应被理解为涉及由任何其它突变、多态性或等位基因变异产生的所有形式的DNA。
对应于上述基因的GRCh38/hg38染色体坐标如下:
(1)GRASP chr12:52006945-52015889
(2)IRX1 chr5:3596054-3601403
(3)SOX21 chr13:94709625-94712543
(4)FGF5 chr4:80266588-80291017
(5)ZNF471 chr19:56507843-56530214
(6)SUSD5 chr3:33150045-33219215
(7)FOXB1 chr15:60004222-60005943
(8)PDX1 chrl:27920031-27926314
(9)DLX5 chr7:97020390-97024831
(10)ONECUT2 chr18:57435685-57491298
(11)DMRTA2 chr1:50417551-50423447
(12)CMTM2 chr18:57435685-57491298
(13)OTX2 chr14:56,799,905-56,810,469
(14)LOC145845chr15:36864443-36886533
(15)EBF3 chr10:129835232-129963827
(16)SA111 chrl6:51135975-51151272
(17)CBX8 chr17:79794377-79797116
(69)BMP3 chr4:81030965-81057625
(18)ANGPT2 chr8:6499651-6563263
(19)LHX6 chr9:122202577-122221740
(20)NEUROD1 chr2:181668295-181680665
(21)AC 149644.1chr2:238882394-238893337
(22)CCDC48 chr3:129001629-129040742
(23)EVX1 chr7:27242545-27247819
(24)GHSR chr3:172443291-172448456
(25)HSD17B14 chrl9:48813017-48836677
(26)KRBA1 chr7:149715011-149734575
(27)OTOP1 chr4:4188726-4226894
(28)PPYR1 chrl0:47918739-47923524
(29)SRMS chr20:63539924-63547504
(30)ZNF582 chr19:56382751-56393601
(31)1RX2 chr5:2746165-2751655
(32)CSMD1 chr8:2935353-4994806
(33)MIR675,H19 chr1:1996759-1996831
(34)FOXD3 chr1:63323059-63325126
(70)NDRG4 chr16:58463645-58513619
(35)NKX2-6 chr8:23702451-23706598
(36)PAX1 chr20:21705659-21718486
(37)FOXD2 chr1:47436017-47440691
(38)SLC6A15 chr12:84859488-84912829
(39)PHC2 chr1:33323623-33375593
(40)FLRT2 chr14:85530025-85628696
(41)GATA2 chr3:128479422-128487921
(42)ADCY8 chr8:130780301-131040589
(43)CNNM1 chr10:99329099-99394330
(44)IKZF1 chr7:50304083-50405100
(45)NKX2-3 chr10:99532933-99536523
(46)PCDH7 chr4:30720415-31146801
(47)SNCB chr5:176620084-176630561
(48)ST8SIA1 chr12:22193391-22334714
(49)TRAPPC9 chr8:139727726-140458579
(50)NKX2-2 chr20:21511022-21514026
(51)SLC32A1 chr20:38724462-38729372
(52)HOXA5 chr7:27141052-27143668
(53)GDNF chr5:37812677-37839680
(54)FAT4 chr4:125316412-125492932
(55)HOXA2 chr7:27100354-27102775
(56)LPHN3 chr4:61201258-62072466
(57)ADCYAP1 chrl8:904943-912172
(58)GRIA2 chr4:157220584-157366074
(59)AQP1 chr7:30,91 1,855-30,925,516
(60)BCAT1 chrl2:24810024-24949459
(61)CYP24A1 chr20:54153449-54173977
(62)FOXI2 chr10:127737274-127741186
(63)GSX1 chrl3:27792643-27793952
(64)IRF4 chr6:391739-411443
(65)NPY chr7:24284188-24291865
(66)PDE1B chr12:54561444-54579239
(67)CAHM chr6:163413065-163413950
(68)SEPTIN9 chr17:77,281,451-77,499,029
(75)sox21 chr13:94709625-94712543
(76)slc6al5 chr12:84859488-84912829
(77)st8SIAI chr12:20063773-22437041
(72)ZSCAN18 chr19:58,084,482-58,l 18,426
(73)COL4AS chr1:110,148,958to 110,307,157
(78)FGF5 chr4:80268265-80291017
(74)FOXF1 chr16:86510527-86514464
(79)FOXI2 chr10:127737274-127741186
(71)SDC2 chr8:96493654-96611809
对这些基因的引用应理解为包括这些基因中每一个的转录起始位点上游5kb,特别是该基因的启动子区域。在不将本发明限制于任何理论或作用模式的情况下,IKZF1通常被理解为涵盖chr7:50304782-50405100(组合体GRCh38/hg38)。即从转录起始位点延伸到聚腺苷酸化位点。然而,IKZF1基因还有一个5’转录起始位点,其坐标,包括该起始位点,是Chr7:50304083-50405101。如果上游CpG岛也包括在内,则坐标为50303300-50405101。如果包含2kb的上游序列,则坐标为500302083-50405101。
如将在下文中更详细讨论的,本发明的方法可用于筛查一个基因的甲基化,或者其可适用于通过从原始生物样本中扩增分离的等分试样的DNA或在使用多重扩增方法扩增的单个等分试样的情况下,筛查给定生物样本中一个以上基因的甲基化。
本发明扩增方法的应用更出乎意料地实现了灵敏度的提高,该提高明显大于理论上通过对起始DNA样本进行亚硫酸氢盐处理后剩余的未降解/有破损的目标DNA区域的靶链和相反链进行扩增而实现的双倍提高。考虑到在扩增之前经过亚硫酸氢盐处理的起始DNA的高达90%被降解或者被切割,这一结果既出乎意料又违背直觉。本发明的方法能够对起始拷贝数非常低的基因靶进行常规的高度精确的甲基化分析,例如ccfDNA,例如疾病特异性ccfDNA,特别是ctDNA。此处,对“低拷贝数”的引用应理解为对样本中的DNA量等于或低于获得可靠和可重复扩增结果所需的水平的引用。在不将本发明限制于任何理论或作用模式的情况下,起始样本中低水平的靶DNA是一个众所周知的问题,其增加了在使用定量和定性扩增方法时获得错误结果的可能性,原因是产生可检测水平的扩增产物需要大量的扩增循环。在这点上,确定给定的样本源是否对应于低拷贝数样本通常可由技术人员确定。已知某些样本类型,例如那些被采集来评估ccfDNA标记物、ctDNA标记物、最小残留疾病标记物、肿瘤克隆进化标记物等的样本,其目标靶DNA的起始水平太低,从而不能使用现有技术的基于扩增的甲基化分析获得可靠和准确的结果。然而,也可能有其它样本源,其靶DNA的量是未知的。在这些情况下,本领域技术人员可以应用常规方法来确定起始靶DNA的量是否在本文定义的“低拷贝数”范围内,因此不能通过现有技术的扩增方法进行可靠的分析。就定量PCR而言,所说的“低拷贝数”也称为检测限(LOD)。LOD是一种众所周知的度量,可由本领域技术人员根据相关测定法或样本来确定。在不将本发明限制于任何理论或作用模式的情况下,在qPCR测定中,通过荧光信号的积累来检测阳性反应。Ct(循环阈值)定义为荧光信号越过阈值(即超过背景水平)所需的循环数。Ct水平与样本中靶核酸的量成反比(即Ct水平越低,样本中靶核酸的量越大)。Cts<29通常被认为是强阳性反应,表明样本中靶核酸丰富。Cts水平为30-37是阳性反应,通常表示中等量的靶核酸,Cts水平为38-40被认为是弱反应,表示最低量的靶核酸。随着获得结果所需的Ct循环数的增加,由此获得的结果的不准确性也会增加。如前所述,就qPCR(实时PCR)而言,本发明的方法能够准确和可重复地分析靶DNA甲基化,其中靶DNA的量低于现有技术qPCR方法的检测限。
在一个实施例中,所述低拷贝数是少于100个测试的靶DNA/样本。在另一实施例中,所述低拷贝数是少于95个测试的靶DNA/样本、少于90个测试的靶DNA/样本、少于85个测试的靶DNA/样本、少于80个测试的靶DNA/样本、少于75个测试的靶DNA/样本、少于70个测试的靶DNA/样本、少于65个测试的靶DNA/样本、少于60个测试的靶DNA/样本、少于55个测试的靶DNA/样本、少于50个测试的靶DNA/样本、少于45个测试的靶DNA/样本、少于40个测试的靶DNA/样本、少于35个测试的靶DNA/样本、少于30个测试的靶DNA/样本、少于25个测试的靶DNA/样本、少于20个测试的靶DNA/样本、少于15个测试的靶DNA/样本、少于10个测试的靶DNA/样本或少于5个测试的靶DNA/样本。更具体地,所述低拷贝数是少于50个测试的靶DNA/样本,更具体地少于40个测试的靶DNA/样本,更具体地少于30个测试的靶DNA/样本,更具体地少于20个测试的靶DNA/样本。在另一实施例中,所述低拷贝数是少于10个测试的靶DNA/样本,最具体地少于5个测试的靶DNA/样本。
在另一实施例中,所述扩增是定量PCR,并且所述低拷贝数是LOD。
相应地,提供一种筛查基因或其区域甲基化的方法,该基因靶选自基本上由以下组成的列表:
所述方法包括:
(i)将DNA样本与修饰未甲基化胞嘧啶残基的试剂接触,其中所述样本包括所述基因或其区域的靶链和相反链,所述DNA样本包括所述目标基因区域的低拷贝数;
(ii)将步骤(i)的DNA样本与以下物质接触:
a)第一组正向和反向引物,其用于扩增基因靶的修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组正向和反向引物,其用于扩增基因靶的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)如果步骤(a)和(b)的引物是甲基化特异性的,则任选一种或多种针对靶链和相反链中的每一条的探针,或者如果步骤(a)和(b)的引物不是甲基化特异性的,则任选一种或多种针对靶链和相反链的甲基化特异性探针,其中所述探针包含检测手段;
(iii)扩增步骤(ii)的DNA样本,其中如果使用步骤(ii)(c)的一种或多种探针,所述引物沿所述基因的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出。
在另一实施例中,所述DNA样本是包含目标DNA区域的低拷贝数的DNA样本。
在另一实施例中,所述目标DNA区域是ccfDNA,例如疾病特异性ccfDNA,特别是ctDNA。
在另一实施例中,所述基因是BCAT1、IKZF1、IRF4、GRASP和/或CAHM,特别是BCAT1和/或IKZF1。
根据本发明的方法测试的DNA可以从生物样本中分离。对“生物样本”的引用应理解为对任何来源(如动物、植物或细菌)的任何生物材料样本的引用,包括但不限于细胞材料、生物流体(如血液、血浆、血清、尿液、唾液、腹水、精液)、排泄物(粪便)、组织活检标本、手术标本或引入体内后被去除的流体(如由灌肠清洗液回收的溶液)。根据本发明的方法测试的生物样本可以直接测试,或者在测试之前需要某种形式的处理。例如,活检或手术样本可能需要在测试前均质化。或者,细胞样本可能需要在测试前渗透。此外,如果生物样本不是液体形式(而测试需要液体形式),可能需要添加试剂,如缓冲液,以使样本流动起来。
就目标DNA区域存在于生物样本中而言,可以直接测试生物样本,或者可以在测试之前分离生物样本中存在的全部或部分DNA。在又一实例中,样本可以在分析之前被部分纯化或以其它方式富集。例如,就生物样本包含非常多样的细胞群而言,可能需要富集特别相关亚群。在本发明的范围内,目标生物样本或由其衍生的分子在测试之前被处理,例如,活病毒的灭活。还应该理解的是,生物样本可以是临时收集的,或者在测试之前被储存(例如通过冷冻),或者在测试之前被处理(例如通过进行培养)。
根据本文公开的方法,选择哪种类型的样本最适合测试将取决于特定情形。例如,就筛查大肠肿瘤的发作或易发作性而言,所述样本优选为排泄物(粪便)样本、灌肠清洗液、手术切除、组织活检或生物流体,例如尿液、唾液、腹水或血液样本(例如全血、血清或血浆)。
更优选地,所述生物样本是血液样本、血浆、血清、唾液、粪便、腹水、尿液、活组织检查样本或粪便样本。
本发明的样本包括目标DNA区域的靶链和相反链。如本领域技术人员所理解的,染色体DNA包括两条互补的DNA链,它们杂交在一起形成一个分子。在本发明中,作为研究对象的DNA区域被定义为“靶链”,而互补链被称为“相反链”。本领域技术人员将理解,DNA双螺旋的两条链也经常被称为“有义”链、“编码”链、“正(+)”链、“顶”链或“上”链。后三个术语在目标DNA区域不产生蛋白质表达产物的情况下更常用。相应的互补链通常被称为“反义”链、“非编码”链、“负(-)”链、“下”链或“底”链。其应该被理解为是指在染色体基因座的背景下,与顶/+/上链互补的链,并且在其自然状态下,与顶链杂交以形成特征性的双螺旋结构。如本领域技术人员所理解的,这种命名法越来越显得不精确,因为已经确定存在多个不编码蛋白质的基因区域(因此不能正确地描述为在有义链或编码链上发现的),此外,根据技术人员如何定义这些链,基因可以在+/上链或-/下链上发现。即使是编码蛋白质的基因,现在也已知是在传统上被认为是-/底/反义链上发现的。因此,仅参照该术语,而不参照特定的染色体位置或参照人类基因组注释数据库中使用的特定+/-链命名法来鉴定和定义链可能是不精确的。就这一点而言,在本发明中,“靶链”是指包含目标区域的DNA链,两条链中的任一条,而“相反链”是指互补链。因此,根据基因在染色体双螺旋上的位置,靶链可以对应+/-(顶/底,上/下)链。
应当理解,在与修饰所述DNA的未甲基化胞嘧啶残基的试剂接触之前,本发明方法的步骤(i)的生物样本的靶链和相反链可以是杂交双链形式或非杂交单链形式。受试DNA是双链形式还是单链形式很可能取决于在根据本发明的方法开始测试之前对样本的处理(如果有的话)。此外,根据被选择来实现未甲基化胞嘧啶修饰的试剂,技术人员可以选择处理样本的DNA以促进双链或单链形式的形成。
如前所述,本发明的方法提供一种通过基于扩增的方法准确定性或定量分析DNA靶甲基化特征的手段。通过应用本发明的方法,由于在亚硫酸氢盐处理过程中磷酸糖DNA主链破损,结果偏差显著减少。就应用这种方法而言,本领域技术人员应该理解,任何现有的通过扩增和探测的组合来询问双链DNA序列的甲基化的扩增方法,都可以根据本发明的方法进行调整。例如,可以设计使用甲基化特异性引物或非甲基化特异性引物的扩增方法(如PCR)。根据示例性实施例,使用甲基化特异性引物(例如甲基化特异性PCR)。然而,也可以使用非甲基化特异性引物,尽管在这种情况下,甲基化询问将仅依赖于使用甲基化特异性探针获得的结果,因为无论是否被甲基化,这些引物都将扩增靶DNA。类似地,就所使用的探针而言,示例性实施例使用水解探针,从而能够实现实时PCR定量。然而,即使使用此类探针,定性分析所获得的读数也可能就足够了。或者,可以选择仅提供定性读数而不能进行定量分析的探针。
在第一步中,作为分析对象的核酸样本与修饰未甲基化胞嘧啶残基的试剂接触。这里使用的术语“修饰”是指试剂将未甲基化的胞嘧啶转化为另一种核苷酸,所述转化将原始核酸样本中的未甲基化胞嘧啶与甲基化胞嘧啶区分开。可以使用任何合适的试剂。在一个实施例中,该试剂是将未甲基化胞嘧啶转化为尿嘧啶的试剂,例如亚硫酸氢钠。然而,在本发明的方法中可以使用选择性修饰未甲基化胞嘧啶而不修饰甲基化胞嘧啶的其它等同修饰剂。例如,可以使用任何其它合适形式的亚硫酸氢盐,例如亚硫酸氢铵。亚硫酸氢钠容易与胞嘧啶的5,6-双键反应,但不与甲基化胞嘧啶反应,以生成磺化胞嘧啶中间体,该中间体在碱性或高温条件下脱氨基生成尿嘧啶。由于Taq聚合酶将尿嘧啶识别为胸腺嘧啶,将5-甲基胞嘧啶(m5C)识别为胞嘧啶,亚硫酸氢钠处理和PCR扩增的顺序组合导致未甲基化胞嘧啶残基最终转化为胸腺嘧啶(C→U→T),甲基化胞嘧啶残基(“mC”)最终转化为胞嘧啶(mC→mC→C)。因此,亚硫酸氢钠对基因组DNA的处理通过将未甲基化的胞嘧啶转化为尿嘧啶而产生甲基化依赖的序列差异。应当理解,就引物与步骤(i)的核酸的杂交而言,引物被设计成与修饰的(例如亚硫酸氢盐转化的)DNA或从中扩增的DNA杂交。在这点上,根据方法的设计,引物可以被设计成作为甲基化特异性引物或非甲基化特异性引物。
根据本实施例,提供一种筛查目标DNA区域甲基化的方法,所述方法包括:
(i)将DNA样本与亚硫酸氢盐试剂接触以将未甲基化的胞嘧啶残基转化为尿嘧啶,其中所述样本包括所述目标DNA区域的靶链和相反链,所述DNA样本包括所述目标DNA区域的低拷贝数;
(ii)将步骤(i)的DNA样本与以下物质接触:
a)第一组正向和反向引物,其用于扩增目标DNA区域的修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组正向和反向引物,其用于扩增目标DNA区域的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)如果步骤(a)和(b)的引物是甲基化特异性的,则任选一种或多种针对靶链和相反链中的每一条的探针,或者如果步骤(a)和(b)的引物不是甲基化特异性的,则任选一种或多种针对靶链和相反链的甲基化特异性探针,其中所述探针包含检测手段;
(iii)扩增步骤(ii)的DNA样本,其中如果使用步骤(ii)(c)的一种或多种探针,所述引物沿所述基因的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出。
在一个实施例中,所述目标DNA区域是基因靶。
在另一个实施例中,所述基因靶是以下一种或多种:
在另一实施例中,所述基因靶是BCAT1、IKZF1、IRF4、GRASP或CAHM中的一种或多种,特别是BCAT1和/或IKZF1。
在又一实施例中,步骤(iv)的结果显示假阴性结果的发生率降低。
在另一实施例中,所述DNA样本是血液、血浆、血清、唾液、粪便、腹水或尿液。
在另一实施例中,所述目标DNA区域是ccfDNA,例如疾病特异性ccfDNA,特别是ctDNA。
在一个实施例中,所述低拷贝数是少于100个测试的靶DNA/样本。在另一实施例中,所述低拷贝数是少于95个测试的靶DNA/样本、少于90个测试的靶DNA/样本、少于85个测试的靶DNA/样本、少于80个测试的靶DNA/样本、少于75个测试的靶DNA/样本、少于70个测试的靶DNA/样本、少于65个测试的靶DNA/样本、少于60个测试的靶DNA/样本、少于55个测试的靶DNA/样本、少于50个测试的靶DNA/样本、少于45个测试的靶DNA/样本、少于40个测试的靶DNA/样本、少于35个测试的靶DNA/样本、少于30个测试的靶DNA/样本、少于25个测试的靶DNA/样本、少于20个测试的靶DNA/样本、少于15个测试的靶DNA/样本、少于10个测试的靶DNA/样本或少于5个测试的靶DNA/样本。最具体地,所述低拷贝数是少于50个测试的靶DNA/样本,更具体地少于40个测试的靶DNA/样本,更具体地少于30个测试的靶DNA/样本,更具体地少于20个测试的靶DNA/样本。在另一实施例中,所述低拷贝数是少于10个测试的靶DNA/样本,最具体地少于5个测试的靶DNA/样本。
在另一实施例中,所述扩增是定量PCR,所述低拷贝数是LOD。一旦未甲基化胞嘧啶残基的转化完成,样本就可以进行扩增。如上文所详述的,本发明基于以下测定:即基于扩增的甲基化分析的输出可以出乎意料地显著增加,并且假阴性结果的发生率显著降低,其中扩增反应被设计成使用至少一组与修饰的靶链杂交的引物和探针,以及另一组与目标DNA区域的修饰的相反链杂交的引物和探针,这些链在亚硫酸氢盐处理后不再互补,从而使得靶链和相反链的甲基化分析能够独立进行。在检测作为疾病标记的低拷贝数基因靶的临床诊断应用中,本发明的方法不仅能够产生扩增产物并因此产生由于普遍的DNA降解事件降低了已经非常低水平的起始DNA靶材料的水平而在之前无法实现的结果,更重要的是,产生的结果受靶链随机破损作用的影响明显较小,靶链随机破损可能导致假阴性结果的产生,例如当破损出现在引物或探针杂交位点时。
就此而言,对“引物”的引用应理解为对包含核苷酸序列或其功能衍生物或类似物的任何分子的引用,其功能包括重组到位于目标甲基化区侧翼的互补DNA序列和扩增重组区下游的DNA序列。应当理解,引物可以包含非核酸成分。例如,引物还可以包含非核酸标签,例如荧光或酶标签,或者一些有助于分子使用或检测的其它非核酸成分。在另一实例中,引物可以是包含展示核酸侧链的肽骨架的蛋白质核酸。优选地,所述引物是单链DNA寡核苷酸。
适用于本发明的引物的设计和合成是本领域技术人员所熟知的。在一个实施例中,目标引物的长度为4至60个核苷酸,在另一个实施例中为10至50个核苷酸,在又一个实施例中为15至45个核苷酸,在又一个实施例中为20至40个核苷酸。
可以由本领域技术人员确定本发明方法中使用的引物的数量。关于引物的总数,需要考虑的变量是被扩增的核酸区域的大小和数量以及引物杂交的序列之间的距离。就进行嵌套式PCR而言,应当理解,针对靶链或相反链的“一组”引物是指用于对这些链之一的给定嵌套反应的所有引物,而不仅仅是最外面的正向和反向引物。还应当理解,无论选择多少引物作为扩增给定DNA链的一组引物的一部分,例如在设计嵌套反应的情况下,第一组中至少一些引物的序列将不同于第二组中至少一些引物的序列,因为前者被设计成选择性扩增靶链,而后者被设计成选择性扩增相反链。然而,如果选择使用内部嵌套引物,根据模板链序列的性质,两条链的引物可能是相同的,这并不是不可能的。
在一个实施例中,寡核苷酸引物是线性单链寡聚脱氧核糖核酸或核糖核酸分子,其能够与核酸的互补链进行序列特异性杂交。引物优选为DNA。本发明的引物具有足够的长度,以在扩增过程中提供特异性和有效的聚合引发(引物延伸)。确切的长度取决于多种因素,包括温度(扩增过程中)、缓冲液和核苷酸组成。优选地,引物是单链的,尽管如果链首先被分离,可以使用双链引物。可以使用任何合适的方法制备引物,例如本领域公知的常规磷酸三酯和磷酸二酯方法或自动化方法。
如前所述,本发明方法中使用的引物可以是任何合适的扩增目标核酸靶的引物。例如,引物可以是甲基化特异性引物或非甲基化特异性引物。“甲基化特异性”引物是指能够区分甲基化和非甲基化DNA的引物,例如亚硫酸氢盐转化的甲基化DNA和非甲基化DNA。这种甲基化特异性引物可以设计成通过例如仅与未转化的5-甲基胞嘧啶杂交(即引物与亚硫酸氢盐转化的甲基化DNA杂交),或者相反,与从未甲基化胞嘧啶转化的胸腺嘧啶杂交(即引物与亚硫酸氢盐转化的未甲基化DNA杂交),来区分甲基化和未甲基化的DNA。甲基化由此由特异性引物实现扩增的能力决定。如本领域技术人员所理解的,为了实现甲基化特异性鉴别,引物优选设计成与潜在的DNA甲基化位点(CpG二核苷酸)重叠,并特异性区分修饰的非甲基化DNA和甲基化DNA。例如,引物可以设计成与一至几个CpG序列重叠,优选一至五个CpG序列或一至四个CpG序列。
应当理解,在使用非甲基化特异性引物的情况下,所使用的探针组必须不包括不能区分甲基化DNA和未甲基化DNA的探针。在这点上,应该理解,在使用非甲基化特异性引物的情况下,第一组引物和第二组引物可以是相同的,因为靶向亚硫酸氢盐转化的靶链的非甲基化特异性区域的事实将意味着在亚硫酸氢盐转化后,相反链上的相应区域仍然是互补的。本领域技术人员完全有能力设计根据本发明的探针组,该探针组检测目标核酸区域的两种或多种甲基化模式,但不检测未甲基化的DNA。当使用的引物具有甲基化特异性时,探针组是否包括针对目标核酸靶的非甲基化形式的探针不太重要。
对所述引物“被设计用于扩增目标DNA区域的一种或多种完全或部分甲基化形式”的引用应被理解为是指所述引物能够扩增受试区域的全部或部分甲基化形式,这些扩增子随后被探针询问。如果引物是非甲基化特异性的,它将扩增受试区域的所有形式,而不管是否存在任何程度的甲基化。例如,引物可以设计成与位于形成部分胞嘧啶甲基化区域一部分的CpGs上游和下游的未甲基化的DNA区域杂交。在这种情况下,引物将扩增样本中存在的所有核酸分子的这一区域,因为引物被设计成与未甲基化但位于胞嘧啶甲基化区域附近的DNA位点杂交。在这种情况下,该方法的甲基化特异性将仅由探针提供,重要的是确保探针池不包括针对靶区域的完全未甲基化形式的探针。在另一实施例中,一个或多个引物可以是甲基化特异性的,并且被设计成与一个或多个胞嘧啶残基杂交,所述胞嘧啶残基是完全甲基化的,并且位于部分甲基化区域的上游和/或下游。通过设计甲基化特异性引物,可以实现甲基化特异性扩增。在另一实例中,一个或两个引物可以针对部分甲基化的残基本身。在这种情况下,为了获得良好的灵敏度,需要设计一种混杂杂交的引物或引物池,其将杂交到DNA靶的尽可能多的不同部分甲基化形式,并将其扩增,从而提高特异性。例如,这可以在应用多路分析的情况下实现。就合适的混杂引物或引物池的设计而言,下文提供的关于探针序列设计的描述也适用于这些引物的设计,这两种分子都是设计用于杂交到靶DNA区域的寡核苷酸。这种引物和探针的设计在专利公开第WO 2015/184498号中详细讨论。
在一个实施例中,所述引物是甲基化特异性的。
根据本实施例,提供一种筛查目标DNA区域甲基化的方法,所述方法包括:
(i)将DNA样本与亚硫酸氢盐试剂接触以将未甲基化的胞嘧啶残基转化为尿嘧啶,其中所述样本包括所述目标DNA区域的靶链和相反链,所述DNA样本包括所述目标DNA区域的低拷贝数;
(ii)将步骤(i)的DNA样本与以下物质接触:
a)第一组甲基化特异性的正向和反向引物,其用于扩增目标DNA区域的修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组甲基化特异性的正向和反向引物,其用于扩增目标DNA区域的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)任选地一种或多种包括检测手段的探针;
(iii)扩增步骤(ii)的DNA样本,其中如果使用步骤(ii)(c)的一种或多种探针,所述引物沿所述DNA的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出。
在另一实施例中,修饰未甲基化胞嘧啶残基的所述试剂是亚硫酸氢钠。
在又一实施例中,所述目标DNA区域是基因靶或其区域。
在又一实施例中,所述基因靶选自基本上由以下组成的列表:
在又一实施例中,所述基因是BCAT1、IKZF1、IRF4、GRASP或CAHM中的一种或多种,特别是BCAT1和/或IKZF1。
在又一实施例中,步骤(iv)的结果显示假阴性结果的发生率降低。
在另一实施例中,所述DNA样本是血液、血浆、血清、唾液、粪便、腹水或尿液。
在另一实施例中,所述目标DNA区域是ccfDNA,例如疾病特异性ccfDNA,特别是ctDNA。
在又一实施例中,所述探针是非甲基化特异性探针。
在一个实施例中,所述低拷贝数是少于100个测试的靶DNA/样本。在另一实施例中,所述低拷贝数是少于95个测试的靶DNA/样本、少于90个测试的靶DNA/样本、少于85个测试的靶DNA/样本、少于80个测试的靶DNA/样本、少于75个测试的靶DNA/样本、少于70个测试的靶DNA/样本、少于65个测试的靶DNA/样本、少于60个测试的靶DNA/样本、少于55个测试的靶DNA/样本、少于50个测试的靶DNA/样本、少于45个测试的靶DNA/样本、少于40个测试的靶DNA/样本、少于35个测试的靶DNA/样本、少于30个测试的靶DNA/样本、少于25个测试的靶DNA/样本、少于20个测试的靶DNA/样本、少于15个测试的靶DNA/样本、少于10个测试的靶DNA/样本或少于5个测试的靶DNA/样本。最具体地,所述低拷贝数是少于50个测试的靶DNA/样本,更具体地少于40个测试的靶DNA/样本,更具体地少于30个测试的靶DNA/样本,更具体地少于20个测试的靶DNA/样本。在另一实施例中,所述低拷贝数是少于10个测试的靶DNA/样本,最具体地少于5个测试的靶DNA/样本。
在另一实施例中,所述扩增是定量PCR,并且所述低拷贝数是LOD。
在又一实施例中,提供一种筛查目标DNA区域甲基化的方法,所述方法包括:
(i)将DNA样本与亚硫酸氢盐试剂接触以将未甲基化的胞嘧啶残基转化为尿嘧啶,其中所述样本包括所述目标DNA区域的靶链和相反链,所述DNA样本包括所述目标DNA区域的低拷贝数;
(ii)将步骤(i)的DNA样本与以下物质接触:
a)第一组非甲基化特异性的正向和反向引物,其用于扩增目标DNA区域的修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组非甲基化特异性的正向和反向引物,其用于扩增目标DNA区域的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)一种或多种针对靶链和相反链的甲基化特异性探针,其中所述探针包括检测手段;
(iii)扩增步骤(ii)的DNA样本,其中如果使用步骤(ii)(c)的一种或多种探针,所述引物沿所述DNA的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出。
在又一实施例中,修饰未甲基化胞嘧啶残基的所述试剂是亚硫酸氢钠。
在一个实施例中,所述目标DNA区域是基因靶。
在另一实施例中,所述基因靶选自基本上由以下组成的列表:
在又一实施例中,所述基因是BCAT1、IKZF1、IRF4、GRASP或CAHM中的一种或多种,特别是BCAT1和/或IKZF1。
在另一实施例中,所述DNA样本是血液、血浆、血清、唾液、粪便、腹水或尿液。
在又一实施例中,步骤(iv)的结果显示假阴性结果的发生率降低。
在另一实施例中,所述目标DNA区域是ccfDNA,例如疾病特异性ccfDNA,特别是ctDNA。
在一个实施例中,所述低拷贝数是少于100个测试的靶DNA/样本。在另一实施例中,所述低拷贝数是少于95个测试的靶DNA/样本、少于90个测试的靶DNA/样本、少于85个测试的靶DNA/样本、少于80个测试的靶DNA/样本、少于75个测试的靶DNA/样本、少于70个测试的靶DNA/样本、少于65个测试的靶DNA/样本、少于60个测试的靶DNA/样本、少于55个测试的靶DNA/样本、少于50个测试的靶DNA/样本、少于45个测试的靶DNA/样本、少于40个测试的靶DNA/样本、少于35个测试的靶DNA/样本、少于30个测试的靶DNA/样本、少于25个测试的靶DNA/样本、少于20个测试的靶DNA/样本、少于15个测试的靶DNA/样本、少于10个测试的靶DNA/样本或少于5个测试的靶DNA/样本。最具体地,所述低拷贝数是少于50个测试的靶DNA/样本,更具体地少于40个测试的靶DNA/样本,更具体地少于30个测试的靶DNA/样本,更具体地少于20个测试的靶DNA/样本。在另一实施例中,所述低拷贝数是少于10个测试的靶DNA/样本,最具体地少于5个测试的靶DNA/样本。
在另一实施例中,所述扩增是定量PCR,并且所述低拷贝数是LOD。
通过本发明的方法扩增的DNA区域的大小可以由本领域技术人员确定,并且将取决于诸如探针必须结合的区域的大小和引物所针对的CpG二核苷酸聚簇沿DNA靶序列的分布等因素。为此,本发明的扩增方法被设计成使得探针针对引物之间的DNA序列区域(即引物间序列)或与引物区域重叠的区域,从而选择性地与作为扩增产物的扩增子杂交。
应当理解,正向和反向引物“针对”目标靶应当理解为意指引物杂交到并扩增所讨论的靶的全部或部分。例如,当目标靶是基因靶时,引物可以被设计成杂交到并扩增基因的较小片段子区域,例如启动子区域的全部或部分。如本领域技术人员所理解的,通常希望产生和分析较小尺寸的扩增子,而不是大的扩增子。
如前所述,本发明的方法提供一种可靠且明显更灵敏和准确的手段,用于定量或定性筛查甲基化的DNA靶,特别是以低初始拷贝数存在的靶。就定量分析而言,甲基化分析测定需要使用可检测的探针,该探针用于与由扩增步骤产生的目标扩增子杂交。因此,对“探针”的引用应理解为指对包含核苷酸序列或其功能衍生物或类似物的任何分子的引用,其功能包括使所述核苷酸序列的至少一个区域与靶核酸分子的杂交。如前所述,本发明的方法提供一种可靠和准确的手段,用于定量(或定性)筛查甲基化的DNA靶,即使在部分甲基化存在的情况下。这是通过设计和应用探针或探针池来实现的,所述探针或探针池被设计用于检测给定相关区域的所有潜在部分甲基化模式。还进一步确定的是,使用这种类型的异质探针池确实能有效地杂交到并检测存在于被筛查的DNA样本中的DNA的全部部分甲基化形式。
因此,在另一实施例中,所述探针是一种或多种针对部分胞嘧啶甲基化区域的水解探针,其中所述一种或多种探针在所述区域共同杂交到至少两种不同的甲基化模式。
核酸探针可以包含非核酸成分。具体而言,核酸探针还包括检测手段,例如荧光标签或一些有助于分子功能的其它成分,例如分子的检测或固定。对“检测手段”的引用应理解为对能够实现探针检测的任何手段的结合的引用。检测手段可以促进定性或定量检测,尽管定量是特别有用的。检测手段可以采用可检测部分或试剂的形式,例如荧光团或放射性同位素。或者,检测手段可以使探针从反应混合物中物理分离出来以用于分析,例如通过磁珠或生物素-链霉亲和素系统。
在不以任何方式限制本发明的情况下,各个探针组分可以全部用相同的检测试剂(例如荧光团)标记,或者每个探针组分可以用不同的试剂(例如不同发射波长的荧光团)标记。例如,可以将探针混合物设计成所有探针组分都用相同的荧光团标记,即使混合物中存在不止一种探针特异性,因此任何一种或多种结合的探针将在实时PCR中给出阳性信号。一种替代方法是将不同的荧光团附着到不同的探针上,并区分杂交的探针特异性。例如,设计用于鉴定目标基因的多种不同部分甲基化形式的异质探针混合物,根据检测的波长来区分甲基化(或非甲基化)的碱基。例如,如果部分甲基化是早期癌症的一个特征,而完全甲基化是晚期癌症的一个特征,那么这种方法对于癌症分期可能是有用的。目前的实时PCR仪器可以检测多达六种不同的荧光团,但也有其它技术可以询问一个样本中的多个特征(例如,基于珠子的荧光分类)。在这种情况下,每个探针可以附着在一个可以独立分选的珠子上。
例如,本发明包括使用实时定量形式的PCR来执行该实施例,例如,TaqMan(Holland等人,Proc.Natl.Acad.Sci.USA,88,7276-7280,1991;Lee等人,NucleicAcidRes.21,3761-3766,1993)。例如,Eads等人在Nucl.Acids Res.28:E32,2000中提出的甲基化荧光方法使用改良的TaqMan水解探针测定来检测CpG二核苷酸的甲基化。基本上,该方法包括用亚硫酸氢盐处理核酸样本,并使用扩增反应(例如,PCR)扩增包含一种或多种CpG二核苷酸的核酸,所述CpG二核苷酸在肿瘤细胞中被甲基化,而在对照样本中不被甲基化。扩增反应在三种寡核苷酸、正向和反向引物以及探针的存在下进行,其中所述正向和反向引物位于目标区域的侧面,所述探针在两种引物之间杂交到一个或多个甲基化CpG二核苷酸的位点。探针用5’荧光报道分子和3’淬灭剂双重标记(反之亦然)。当探针完好无损时,猝灭剂染料会在接近时吸收报道分子的荧光。在重组到PCR产物后,探针被例如Taq DNA聚合酶的5’至3’核酸外切酶活性切割。所述切割从淬灭剂中释放报道分子,从而导致荧光信号增加,所述荧光信号可用于估计初始模板甲基化水平。通过使用与未突变核酸(即甲基化核酸)选择性杂交的探针或引物,甲基化水平得到确定,例如使用标准曲线。
或者,不使用需要切割的标记探针,而是使用如分子信标(参见,例如,Mhlanga和Malmberg,Methods 25:463-471,2001)的探针。分子信标是具有茎环结构的单链核酸分子。该环结构与肿瘤样本中而非对照样本中甲基化的一个或多个CpG二核苷酸周围的区域互补。茎结构是通过重组两个互补的“臂”形成的,这两个“臂”位于探针(环)的两侧。荧光部分结合到一个臂上,当分子信标没有结合到靶序列时抑制任何可检测荧光的淬灭部分结合到另一个臂上。一旦环区与其靶核酸结合,臂被分离,荧光是可检测的。然而,即使单个碱基错配也会显著改变样本中检测到的荧光水平。因此,特定碱基的存在与否取决于检测到的荧光水平。这种测定有助于检测核酸中的一个或多个未突变位点(即甲基化核苷酸)。
荧光标记的锁定核酸(LNA)分子或荧光标记的蛋白质-核酸(PNA)分子可用于检测核苷酸差异(如Simeonov和Nikiforov,Nucleic Acids Research,30(17):1-5,2002中所述)。LNA和PNA分子以高亲和力与核酸结合,特别是DNA。当探针与靶核酸杂交时,与LNA或PNA探针结合的荧光团(特别是红胺或六氯荧光素)发出明显更高水平的荧光。然而,荧光的增加水平没有到单个核苷酸错配发生时的水平。因此,在样本中检测到的荧光程度表明LNA或PNA探针与靶核酸之间存在错配,例如,在CpG二核苷酸中存在甲基化胞嘧啶。优选地,荧光标记的LNA或PNA技术用于检测核酸中的至少单个碱基变化,所述核酸先前已经使用例如本领域已知和/或本文所述的扩增方法进行了扩增。
对于熟练技术人员来说显而易见的是,通过将LNA或PNA探针固定到固体支持物上,LNA或PNA检测技术可适用于一种或多种标记的高通量检测,如Orum等人,Clin.Chem.45:1898-1905,1999中所述。
优选地,甲基化相关的序列差异通过基于荧光定量PCR的方法检测(实时定量PCR,Heid等人,Genome Res.6:986-994,1996;Gibson等人,Genome Res.6:995-1001,1996)()例如,和技术)。对于和技术,序列识别可以在两个步骤中的一个或两个中发生:(1)扩增步骤,或(2)荧光检测步骤。在FRET杂交的情况下,探针在上排布,FRET寡核苷酸中的一种或两种可用于区分序列差异。最优选地,在本文所有发明实施例中使用的扩增过程基于荧光的实时定量PCR(Heid等人,Genome Res.6:986-994,1996),并使用双标记荧光寡核苷酸探针(PCR,使用ABI棱镜7700序列检测系统,来自加利福尼亚州福斯特市的Perkin Elmer AppliedBiosystems公司)。
在一个实施例中,检测手段是荧光报道分子,更优选是水解探针。对“水解探针”的引用应理解为对双重标记的寡核苷酸的引用。在不将本发明限制于任何理论或作用模式的情况下,寡核苷酸的5’端用荧光报道分子标记,而3’端用淬灭剂分子标记。探针的序列对于扩增的靶分子中的目标区域是特异性的。水解探针的设计使得序列中的5’荧光团和3’淬灭剂放置得足够接近,从而抑制荧光。
水解探针被设计成在PCR扩增引物的结合位点之间结合目标区域。在PCR循环的延伸阶段,Taq DNA聚合酶在PCR引物的下游合成互补链。当延伸到达结合的水解探针时,TaqDNA聚合酶的5’-3’核酸外切酶活性降解水解探针。探针的切割将荧光报道分子与探针的其余部分(以及淬灭剂)分开,使报道分子发出荧光。Taq DNA聚合酶继续合成其余的新生链,因此探针的杂交不会抑制PCR。随着后期的PCR循环,荧光报道分子的释放量以及荧光累积增加。合适的报道分子和淬灭分子的实例包括:5’荧光报道分子染料6FAM(“FAM”;2,7二甲氧基-4,5-二氯-5-羧基-荧光素)、HEX、德克萨斯红、TEX615、Cy5和TET(6-羧基-4,7,2',7'-四氯荧光素);以及3’猝灭剂染料TAMRA(6-羧基四甲基罗丹明)、Dabecyl、黑洞猝灭剂1(BHQ-1)、BHQ-2、Iowa Black FQ和Iowa Black RQ(Livak等人,PCR Methods Appl.4:357-362,1995;Gibson等人,Genome Res.6:995-1001,1996;Heid等人,Genome Res.6:986-994,1996)。此外,探针可以通过包含内部猝灭剂如ZEN猝灭剂而被双重猝灭,以提供更强的猝灭并进一步减少背景荧光。
在一个实施例中,所述探针是水解探针。
在另一实施例中,所述探针是一种或多种针对部分胞嘧啶甲基化区域的水解探针,其中所述一种或多种探针在所述区域共同杂交到至少两种不同的甲基化模式。
本领域技术人员应该理解,就筛查一个以上的基因标记而言,可以选择设计这样的方法:即使用本发明的方法筛查一些但不是全部的基因标记,而使用标准的现有技术甲基化分析方法筛查其它的基因标记。例如,如果分析的对象是两个基因,一个基因可以基于亚硫酸氢盐(或等同物)转化的DNA的靶链和非互补的相反链的扩增来分析(即通过本发明的方法),而另一个基因可以单独进行靶链的标准甲基化特异性扩增。当其中一个标记不需要以与其它标记相同的灵敏度水平进行分析,从而不一定需要应用本发明的方法时,可以采用这种方式。在实例11中提供了这种分析设计的例子。
就本发明的方法被设计用于检测部分甲基化的DNA而言,本发明的探针被设计成能够在单个反应中杂交到表现出至少两种不同甲基化模式的DNA序列。例如,探针可以与完全甲基化的序列和一个或多个部分甲基化的序列杂交。在另一实例中,探针可以检测DNA序列的至少两种不同的部分甲基化形式。应该理解的是,就本发明的方法旨在提供一种准确且可重复的检测显示完全和部分甲基化形式的DNA靶的甲基化的手段而言,这种检测方法被设计成将探针聚焦于确实或被认为显示部分甲基化形式的DNA序列的一个离散区域。然而,本领域技术人员将理解,除了探针靶向的区域之外,DNA靶还可以在DNA序列的区域显示部分甲基化模式。因此,应当理解,本方法的本实施例限于检测和评估探针所针对的DNA区域的部分甲基化,而不是DNA靶的任何其它区域。因此,就筛查特定基因靶而言,本发明的方法被设计成检测在探针所针对的位点显示部分甲基化的该基因的所有部分甲基化形式。然而,就受试基因也可能在其序列的其它位点显示部分甲基化而言,如果探针不针对这些甲基化位点,这些部分甲基化的形式将不会被检测到。然而,本领域技术人员还应该理解,在讨论不止一个潜在的部分甲基化区域时,该方法可以包括使用针对多个这样的区域的探针,只要这些区域位于扩增引物对之间。
这里提到的与至少两个“所述区域的不同甲基化模式”杂交的一个或多个受试探针应理解为是指本发明方法中使用的探针都被设计成与相同的DNA序列区域杂交。然而,所述甲基化的DNA序列区域可能表现出完全甲基化或一系列部分甲基化的形式,这被称为“不同的甲基化模式”或“差异甲基化”。随着该区域甲基化CpG二核苷酸数量的增加,潜在的不同部分甲基化模式的数量也会增加。例如,除了在Chr7:50304323-50304349的IKZF1的完全甲基化形式之外,在扩增引物之间有7种不同的甲基化模式,包括6种部分甲基化形式和完全未甲基化形式。可以选择检测目标DNA靶的所有差异甲基化形式,但也可以根据具体情况仅筛查特定DNA靶的一些部分甲基化形式,而不是全部。例如,如果已知有两种主要的部分甲基化形式,可以选择只筛选这两种。本领域技术人员完全有能力进行这种评估并适当地设计探针组。
根据本实施例,提供一种筛查目标基因或其基因区域甲基化的方法,所述方法包括:
(i)将DNA样本与亚硫酸氢盐试剂接触,以将未甲基化的胞嘧啶残基转化为尿嘧啶,其中所述样本包含所述目标基因区域的靶链和相反链;
(ii)将步骤(i)的DNA样本与以下物质接触:
a)第一组甲基化特异性的正向和反向引物,其用于扩增目标基因区域的修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组甲基化特异性的正向和反向引物,其用于扩增目标DNA区域的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)一种或多种包括检测手段的甲基化特异性探针;
(iii)扩增步骤(ii)的DNA样本,其中如果使用步骤(ii)(c)的一种或多种探针,所述引物沿所述基因的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出。
在又一实施例中,所述基因是IKZF1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:13 5'-TTTGTATYGGAGTAGYGATTYGGGAGG-3'
SEQ ID NO:14 5'-TTTGTATCGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:15 5'-TTTGTATCGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:16 5'-TTTGTATCGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:17 5'-TTTGTATTGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:18 5'-TTTGTATCGGAGTAGTGATTTGGGAGG-3'
SEQ ID NO:19 5'-TTTGTATTGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:20 5'-TTTGTATTGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:21 5'-TTTGTATTGGAGTAGTGATTTGGGAGG-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:77(正向引物):Chr7(-);50,304,295-50,304,314
5'-CGCGTAGAAGGGCGT AGAGC-3'
SEQ ID NO:78(反向引物):Chr7(+);50,304,234-50,304,254
5'-GCGCGAACCGAAAAACTCGAC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:79 5'-AAYGAYGCACCCTCTCYGTATCCY-3'
SEQ ID NO:80 5'-AACGACGCACCCTCTCCGTATCCT-3'
SEQ ID NO:81 5'-AATGACGCACCCTCTCCGTATCCC-3'
SEQ ID NO:82 5'-AACGATGCACCCTCTCCGTATCCC-3'
SEQ ID NO:83 5'-AACGACGCACCCTCTCTGTATCCC-3'
SEQ ID NO:84 5'-AATGATGCACCCTCTCCGTATCCC-3'
SEQ ID NO:85 5'-AATGACGCACCCTCTCTGTATCCC-3'
SEQ ID NO:86 5'-AATGACGCACCCTCTCCGTATCCT-3'
SEQ ID NO:87 5'-AACGATGCACCCTCTCTGTATCCC-3'
SEQ ID NO:88 5'-AACGATGCACCCTCTCCGTATCCT-3'
SEQ ID NO:89 5'-AACGACGCACCCTCTCTGTATCCT-3'
SEQ ID NO:90 5'-AATGATGCACCCTCTCTGTATCCC-3'
SEQ ID NO:91 5'-AATGACGCACCCTCTCTGTATCCT-3'
SEQ ID NO:92 5'-AACGATGCACCCTCTCTGTATCCT-3'
SEQ ID NO:93 5'-AATGATGCACCCTCTCTGTATCCT-3'
SEQ ID NO:94 5'-AACGACGCACCCTCTCCGTATCCC-3'
SEQ ID NO:95 5'-AATGATGCACCCTCTCCGTATCCT-3'
或者基本相似的序列。
在又一实施例中,所述基因是IKZF1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:13 5'-TTTGTATYGGAGTAGYGATTYGGGAGG-3
SEQ ID NO:14 5'-TTTGTATCGGAGTAGCGATTCGGGAGG-3
SEQ ID NO:15 5'-TTTGTATCGGAGTAGCGATTTGGGAGG-3
SEQ ID NO:16 5'-TTTGTATCGGAGTAGTGATTCGGGAGG-3
SEQ ID NO:17 5'-TTTGTATTGGAGTAGCGATTCGGGAGG-3
SEQ ID NO:18 5'-TTTGTATCGGAGTAGTGATTTGGGAGG-3
SEQ ID NO:19 5'-TTTGTATTGGAGTAGCGATTTGGGAGG-3
SEQ ID NO:20 5'-TTTGTATTGGAGTAGTGATTCGGGAGG-3
SEQ ID NO:21 5'-TTTGTATTGGAGTAGTGATTTGGGAGG-3
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:22(正向引物):Chr7(-);50,304,366-50,304,391
5'-TTGTTTCGTAGTCGGTTCGGTTTCG 3'
SEQ ID NO:23(反向引物):Chr7(+);50,304,271-50,304,294
5'-AACGACGCACCCTCTCCGTATCCC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:24 5'-TTTTTYGGATYGTTGTTTYGGTATAGG-3'
SEQ ID NO:25 5'-TTTTTCGGATCGTTGTTTCGGTATAGG-3'
SEQ ID NO:26 5'-TTTTTCGGATCGTTGTTTTGGTATAGG-3'
SEQ ID NO:27 5'-TTTTTCGGATTGTTGTTTCGGTATAGG-3'
SEQ ID NO:28 5'-TTTTTTGGATCGTTGTTTCGGTATAGG-3'
SEQ ID NO:29 5'-TTTTTCGGATTGTTGTTTTGGTATAGG-3'
SEQ ID NO:30 5'-TTTTTTGGATTGTTGTTTCGGTATAGG-3'
SEQ ID NO:31 5'-TTTTTTGGATCGTTGTTTTGGTATAGG-3'
SEQ ID NO:32 5'-TTTTTTGGATTGTTGTTTTGGTATAGG-3'
或者基本相似的序列。
在又一实施例中,所述基因是IKZF1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:13 5'-TTTGTATYGGAGTAGYGATTYGGGAGG-3'
SEQ ID NO:14 5'-TTTGTATCGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:15 5'-TTTGTATCGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:16 5'-TTTGTATCGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:17 5'-TTTGTATTGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:18 5'-TTTGTATCGGAGTAGTGATTTGGGAGG-3'
SEQ ID NO:19 5'-TTTGTATTGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:20 5'-TTTGTATTGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:21 5'-TTTGTATTGGAGTAGTGATTTGGGAGG-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:33(正向引物):Chr7(-);50,304,329-50,304,355
5'-CGGTCGTTTTTCGGATCGTTGTTTCGG-3'
SEQ ID NO:23(反向引物):Chr7(+);50,304,271-50,304,294
5'-AACGACGCACCCTCTCCGTATCCC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:34 5'-YGYGTAGAAGGGYGTAGAGYG-3'
SEQ ID NO:35 5'-CGCGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:36 5'-CGCGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:37 5'-CGCGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:38 5'-CGTGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:39 5'-TGTGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:40 5'-TGCGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:41 5'-CGTGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:42 5'-CGCGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:43 5'-TGTGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:44 5'-TGCGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:45 5'-TGCGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:46 5'-TGTGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:47 5'-TGTGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:48 5'-TGCGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:49 5'-CGTGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:50 5'-CGTGTAGAAGGGTGTAGAGCG-3'
或者基本相似的序列。
在又一实施例中,所述基因是BCAT1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:97(正向引物):chrl2(+);24,949,138-24,949,164
5'-TTAGTGTTTTTTTGTTGATGTAATTCG-3'
SEQ ID NO:65(反向引物):chrl2(-);24,949,058-24,949,074
5'-CAATACCCGAAACGACGACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:66 5'-TTCGTCGCGAGAGGGTCGGTT-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:96(正向引物):chrl2(-);24,949,058-24,949,082
5'-TAGTGTTCGAGGCGGCGGCGAGTAT-3'
SEQ ID NO:62(反向引物):chrl2(+);24,949,140-24,949,159
5'-ATCTTCCTACTAATACAATCCGCTAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括以下序列:
SEQ ID NO:63 5'-GATCGGTTTTTTCGCGGCGGA-3'
或者基本相似的序列。
在又一实施例中,所述基因是BCAT1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:64(正向引物):chrl2(+);24,949,131-24,949,159
5'-GTTTTTTTGTTGATGTAATTCGTTAGGTC-3'
SEQ ID NO:65(反向引物):chrl2(-);24,949,058-24,949,074
5'-CAATACCCGAAACGACGACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:66 5'-TTCGTCGCGAGAGGGTCGGTT-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:61(正向引物):chrl2(-);24,949,058-24,949,085
5'-T AGTGTTCGAGGCGGCGGCGAGTATACG-3'
SEQ ID NO:62(反向引物):chrl2(+);24,949,140-24,949,159
5'-ATCTTCCTACTAATACAATCCGCTAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括以下序列:
SEQ ID NO:63 5'-GATCGGTTTTTTCGCGGCGGA-3'
或者基本相似的序列。
在又一实施例中,所述基因是IRF4,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:111(正向引物):Chr6(-):391,614-391,636
5'-TAAGTCGAGAGTCGGGGTCGGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
在又一实施例中,所述基因是IRF4,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:114(正向引物):Chr6(-):391,614-391,630
5'-GAGAGTCGGGGTCGGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
在又一实施例中,所述基因是IRF4,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3”
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA -3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:116(正向引物):Chr6(-):391,624-391,649
5'-GAGAGGGATTTTGTAAGTCGAGAGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
就本发明的方法利用不止一种针对靶和/或相反扩增产物的探针而言,应当理解,受试引物可以对应于上述公开的序列,或者基本相似的序列。或者,这些序列或基本相似的序列可以代表较大引物分子中的一个亚区。对“基本相似的序列”的引用应理解为是指对序列可能表现出一些微小的序列差异,但仍然能像与其基本相似的序列一样扩增相同的DNA靶的引用。
本发明的探针“共同”结合到待检测的部分和完全甲基化的序列范围。“共同”是指选择使用的探针群能够单独或通过单个探针的混杂杂交,结合到待检测的DNA靶的部分甲基化形式的范围内。在不将本发明限制于任何理论或作用模式的情况下,本领域技术人员可知探针要询问的DNA区域的序列,以及甲基化的CpG二核苷酸的位置。基于这一序列信息,并且如前面关于IKZF1所举例说明的,可以预测靶链和相反链上可能的全部和部分甲基化模式的全部范围。然后可以设计探针,使每个探针分别结合一种独特的甲基化模式,或者显示出混杂性并能结合一种以上的甲基化模式。针对完全甲基化序列的探针不会结合部分甲基化的序列,即使完全甲基化的序列和部分甲基化的序列之间的差异小到一个胞嘧啶残基缺乏甲基化。还已经确定,如果在扩增分析中使用甲基化特异性探针的异质池或者设计成混杂结合甲基化和非甲基化胞嘧啶的探针,可以获得与目标靶的甲基化相关的准确结果。
用于与一种特定的完全或部分甲基化序列模式杂交的探针可以通过本领域技术人员熟知的方法获得。关于表现出混杂性的探针,即可以结合一种以上的甲基化模式,也可以通过本领域技术人员已知的几种方法来实现。例如,探针中的一个或多个碱基位置(例如在5’-水解探针中)不是唯一的,而是两个碱基的混合物,即胞嘧啶或胸苷。如果只询问一个CpG位点的甲基化(或未甲基化),那么这种简并寡核苷酸将是两种不同寡核苷酸序列的混合物,例如--atCGat--和--atTGat--的混合物。如果询问两个CpG位点,那么简并寡核苷酸混合物将是四种不同序列的混合物。
如前所述,探针可以是检测探针的任何变体,如TaqMan、Scorpions、Beacons等。探针混合物可以按如下所述合成(在IKZF1实例的靶链的情况下):
(i)在一次合成中冗余8倍(通过在合成过程中混合C和T);
(ii)三种不同的双重冗余探针并混合;
(iii)一种两重和一种4倍冗余探针并混合;或者
(iv)八种不同的独特探针并混合。
探针也可以是单个序列,在每个被询问的C/T碱基上有一个脱碱基间隔子(例如5-硝基吲哚或3-硝基吡咯),或者在每个被询问的C/T碱基上有一个肌苷。含有一个或多个脱碱基间隔子的单序列“混杂”探针将只有一个退火温度,但是含有脱碱基间隔子的探针的解链温度将显著低于检测所有被询问的CpG位点甲基化的探针。因此,带有脱碱基间隔子的混杂探针要比仅针对甲基化CpG位点的探针长得多。肌苷允许与任何碱基配对,但优先顺序为C>A>G>T。由于该序列在探针的相反链上,在这种情况下,探针将重组到A(=T,未甲基化)或G(=C,甲基化)。这两个选项都没有混杂探针那么具体。因允许在3个位置与4个碱基中的一个配对,所以它们实际上是64倍简并的(相对于8倍),因此更依赖于引物的甲基化特异性。含脱碱基间隔子或肌苷的探针的优点是作为单一寡核苷酸组分,而不是8种寡核苷酸组分的混合物。
该探针还可以在每个潜在的部分甲基化的C位上有一个嘧啶(C或T)类似物。例如,类似物6H,8H-3,4-二氢嘧啶[4,5-c][1,2]恶嗪-7-酮是一个单一的“碱基”,它将与G和A(在相反链中是两个选项)碱基配对。一项研究显示,其对A(=T=未甲基化)的偏好是60%,对G(=C=甲基化)的偏好是40%。(Hill等人,Proc Natl Acad Sci U S A.,95:4258-4263,1998)。优点是这种探针是一种单一的寡核苷酸,它能以近似相等的亲和力结合所有8种可能的甲基化组合。应当理解,由于一些单个探针序列将包含胸苷而不是胞嘧啶碱基,这降低了退火温度,使得一些探针序列可能需要延伸长度以补偿较低的退火温度。另一种方法是包括提高退火温度的化学修饰(例如主凹槽结合基底)。还应该理解,探针简并位置的每个碱基的比例不必是50/50。例如,如果确定一个特定的C残基在80%的真正癌症病例中被甲基化,但是在20%的真正癌症病例中没有被甲基化,则可以制造一个在这个位置具有80%C和20%T的探针来匹配甲基化的发生率。
如上文详述的,探针序列也被设计成与相反链杂交。相反链上的这些探针序列设计在简并位置(或肌苷或如上所述的脱碱基间隔子)有一个G或A,以询问部分甲基化。上面提到的嘧啶类似物现在将变成结合T和C的嘌呤类似物,N6-甲氧基-2,6-二氨基嘌呤。
应当理解,这些原理可用于设计任何基因的扩增探针。
还对本发明的探针和/或引物进行评估,以确定它们不会自引发或形成引物二聚体(例如,与检测分析中使用的另一种探针或引物一起)。此外,通常评估探针或引物(或其序列)以确定其从靶核酸变性的温度(即探针或引物的解链温度,或Tm)。估计Tm的方法在本领域中是已知的,例如,如Santa Lucia,Proc.Natl.Acad.Sci.USA,95:1460-1465,1995或者Breslauer等人,Proc.Natl.Acad.Sci.USA,83:3746-3750,1986中所述。
生产/合成本发明探针或引物的方法是本领域已知的。例如,在Gait(Ed)(在Oligonucleotide Synthesis:A Practical Approach,IRL出版社,牛津,1984)中描述了寡核苷酸合成。例如,探针或引物可以通过生物合成(例如通过用限制性内切酶消化核酸)或通过化学合成获得。对于短序列(最多约100个核苷酸),优选化学合成。
对于更长的序列,分子生物学中使用的标准复制方法是有用的,例如,Ml3用于单链DNA,如Messing,Methods Enzymol,101,20-78,1983所述。寡核苷酸合成的其它方法包括,例如,磷酸三酯和磷酸二酯方法(Narang等人,Meth.Enzymol 68:90,1979)和支持物上的合成(Beaucage等人,Tetrahedron Letters 22:1859-1862,1981)以及磷酰胺化技术(Caruthers,M.H.等人,"Methods in Enzymology,"Vol.154,pp.287-314,1988),以及"Synthesis and Applications of DNA and RNA,"S.A.Narang,编辑,学术出版社,纽约,1987和所引用参考文献中描述的其它方法。包含锁定的核酸(LNA)的探针的合成如Nielsen等人,J.Chem.Soc.Perkin Trans.,1:3423,1997以及Singh和Wengel,Chem.Commun.1247,1998中所述。同时,包含肽-核酸(PNA)的探针的合成如Egholm等人,Am.Chem.Soc.,114:1895,1992;Egholm等人,Nature,365:566,1993以及Orum等人,Nucl.Acids Res.,21:5332,1993中所述。
使用位于目标甲基化区域侧面的引物来扩增本发明的DNA样本。如前所述,该“区域”可以被选择为包含基因长度的一小部分或大部分。在后一种情况下,产生的扩增子会很长。然而,在特定的实施例中,该区域可以对应于一个或多个CpG二核苷酸聚集的基因的更短的区段。在这种情况下,产生的扩增子将明显更短。
可以通过任何合适的方法促进引物和探针与靶DNA的相互作用。所述方法是本领域技术人员已知的。为此,应该理解,引物和探针可以在任何合适的时间点掺入反应管。虽然掺入通常在初始扩增循环开始之前,但一个或多个附加引物的掺入可以在初始扩增循环之后进行。引物的掺入方式将取决于技术人员如何进行扩增反应,但通常,为了便于使用和避免污染,通常希望能够在单个试管中进行整个反应。然而,可以使用实现本发明步骤的任何其它方法。因此,将样本与引物或探针寡核苷酸“接触”应理解为促进引物或探针与样本的混合,从而可以发生相互作用(例如杂交)。实现这一目标的手段对于本领域技术人员来说是已知的。
当要扩增多个甲基化的DNA区域时,技术人员可以设计多重扩增反应。所述多重扩增可以设计成在一个试管中扩增靶链和相反链,或者在单个试管中扩增靶链或相反链的多个区域。例如,当使用多于一对正向/反向引物时,针对两个或多个独立的基因或甲基化区域,可以将所有这些引物引入单个样本,并使用多重扩增技术扩增样本。或者,可以选择将样本分成多个等分试样,其中每个等分试样用一对单独的引物扩增。还应该理解的是,技术人员可以选择采用这种方法:即使用多组引物,只扩增一个甲基化区域,但其中多组引物反映了嵌套式PCR的应用。或者,可以进行几个单独的扩增反应,每个反应使用一个独特的引物对。当扩增两个或更多个独立的甲基化区域时,当分析一个以上基因的甲基化时,或者当试图分离靶链和相反链的扩增反应时,这些方法尤其适用。在这种情况下,如果要分析两个基因(例如BCAT1和IKZF1),可以将样本分成两等份,例如,在亚硫酸氢钠转化之后,然后使用一组或多组正向和反向引物扩增每个等份,所述引物针对该基因的相关甲基化序列区域。或者,可以在单一样本上进行多重反应,其中该反应在使用针对一个基因的选定甲基化序列区域的引物对和水解探针组以及使用针对另一个基因的选定甲基化序列区域的另一组引物和水解探针组方面进行多重反应。如本领域技术人员所熟知的,多重反应可以设计成在两个或更多个甲基化序列区域和/或两个或更多个基因或靶链和相反链的情况下用两组、三组或更多组引物和水解探针进行。应该理解的是,适当地设计多重或嵌套扩增反应在本领域技术人员的技能范围内。
本发明的扩增步骤导致杂交引物沿目标DNA靶延伸。如前所述,正是引物延伸分子的产生影响了杂交的双标记水解探针的检测。实现这一点的方法对于技术人员来说是已知的。在扩增子生产时产生的检测手段输出可以被定性或定量分析,其中后者是特别优选的方法。应当理解,只有当引物沿探针杂交的DNA序列延伸并置换、切割或以其它方式对探针进行修饰时,探针的检测才有效,所述修饰使其检测手段可以发挥其功能(例如被激活或被暴露),从而可通过定性或定量手段进行检测。
尽管该方法的优选应用是为诊断疾病发作(例如瘤形成发展或其易感性)而评估甲基化水平,但在某些情况下,可能需要检测所述甲基化水平的反向变化,例如,以监测针对调节肿瘤疾病(例如腺瘤或腺癌发展)的治疗或预防性治疗的有效性。例如,当甲基化水平升高表明个体已经发展为以腺瘤或腺癌发展为特征的疾病时,在治疗方案开始后筛查甲基化水平的降低可用于表明肿瘤细胞的成功清除。在另一实例中,可以使用该方法来测试肿瘤切除边缘处的组织,以便确定肿瘤的整个边缘是否已经被移除。
因此,本方法可用于诊断、预后、分类、疾病风险预测、疾病复发检测、多种类型肿瘤的治疗选择和肿瘤监测。可以检测任何进展阶段的癌症,例如原发性、转移性和复发性癌症。此外,这种方法还可应用于任何其它需要分析DNA和RNA甲基化的情况。
以肿瘤发展作为非限制性实例,本发明提供了用于确定哺乳动物(例如,人类)是否患有肿瘤、从哺乳动物获取的生物样本是否包含肿瘤细胞或来源于肿瘤细胞的DNA、估计哺乳动物发展肿瘤的风险或可能性、监测抗癌治疗的功效或在患有癌症的哺乳动物中选择合适的抗癌治疗的方法。这些方法是基于确定多种肿瘤细胞具有不同于正常细胞的甲基化状态。
本发明的方法可用于评估已知或怀疑存在瘤形成的个体,或作为常规临床试验,即用于不一定怀疑存在瘤形成的个体中。可以进行进一步的诊断测定来确认个体中肿瘤形成的状态。
此外,本方法可用于评估一个疗程的疗效。例如,可以通过监测患有癌症的哺乳动物的DNA甲基化随时间的变化来评估抗癌治疗的功效。例如,与治疗前或治疗早期取自哺乳动物的样本中的水平相比,治疗后取自哺乳动物的生物样本中任何相关诊断序列中甲基化的减少或缺失表明治疗有效。
因此,本发明的方法可用来一次性测试或持续监测被认为有疾病发展风险的个体,或监测治疗或预防性治疗方案的有效性。在这些情况下,绘制任何一类或多类生物样本中甲基化水平的调节图是个体状态或当前使用的治疗或预防方案的有效性的有价值的指标。因此,本发明的方法应理解为包括监测个体中甲基化水平相对于其正常水平或相对于从所述个体的生物样本中测定的一种或多种早期甲基化水平的增加或减少。
本发明的另一方面涉及一种诊断或监测患者病症的方法,所述病症的特征在于目标DNA区域甲基化的调节,所述方法包括:
(i)将DNA样本与修饰未甲基化胞嘧啶残基的试剂接触,其中所述样本包括所述目标DNA区域的靶链和相反链,所述DNA样本包括所述目标DNA区域的低拷贝数;
(ii)将步骤(i)的DNA样本与以下物质接触:
a)第一组正向和反向引物,其用于扩增目标DNA区域的修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组正向和反向引物,其用于扩增目标DNA区域的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)如果步骤(a)和(b)的引物是甲基化特异性的,则任选一种或多种针对靶链和相反链中的每一条的探针,或者如果步骤(a)和(b)的引物不是甲基化特异性的,则任选一种或多种针对靶链和相反链的甲基化特异性探针,其中所述探针包含检测手段;
(iii)扩增步骤(ii)的DNA样本,其中如果使用步骤(ii)(c)的一种或多种探针,所述引物沿所述基因的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出。
在一个实施例中,所述目标DNA区域是基因靶或其区域。
在另一实施例中,所述基因靶是ccfDNA,例如以下任一种或多种的疾病特异性ccfDNA:
在又一实施例中,所述基因是BCAT1、IKZF1、IRF4、GRASP或CAHM中的一种或多种,特别是BCAT1和/或IKZF1。
在又一实施例中,步骤(iv)的结果显示假阴性结果的发生率降低。
在另一实施例中,所述DNA样本是血液、血浆、血清、唾液、粪便、腹水或尿液。
在另一实施例中,所述目标DNA区域是ccfDNA,例如疾病特异性ccfDNA,特别是ctDNA。
在又一实施例中,所述引物和探针是甲基化特异性的。
在又一实施例中,所述引物不是甲基化特异性的,但所述探针是甲基化特异性的。
在又一实施例中,所述探针是一种或多种针对部分胞嘧啶甲基化区域的水解探针,其中所述一种或多种探针在所述区域共同杂交到至少两种不同的甲基化模式。
在一个实施例中,所述低拷贝数是少于100个测试的靶DNA/样本。在另一实施例中,所述低拷贝数是少于95个测试的靶DNA/样本、少于90个测试的靶DNA/样本、少于85个测试的靶DNA/样本、少于80个测试的靶DNA/样本、少于75个测试的靶DNA/样本、少于70个测试的靶DNA/样本、少于65个测试的靶DNA/样本、少于60个测试的靶DNA/样本、少于55个测试的靶DNA/样本、少于50个测试的靶DNA/样本、少于45个测试的靶DNA/样本、少于40个测试的靶DNA/样本、少于35个测试的靶DNA/样本、少于30个测试的靶DNA/样本、少于25个测试的靶DNA/样本、少于20个测试的靶DNA/样本、少于15个测试的靶DNA/样本、少于10个测试的靶DNA/样本或少于5个测试的靶DNA/样本。最具体地,所述低拷贝数是少于50个测试的靶DNA/样本,更具体地少于40个测试的靶DNA/样本,更具体地少于30个测试的靶DNA/样本,更具体地少于20个测试的靶DNA/样本。在另一实施例中,所述低拷贝数是少于10个测试的靶DNA/样本,最具体地少于5个测试的靶DNA/样本。
在另一实施例中,所述扩增是定量PCR,并且所述低拷贝数是LOD。
在又一实施例中,所述基因是IKZF1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:13 5'-TTTGTATYGGAGTAGYGATTYGGGAGG-3'
SEQ ID NO:14 5'-TTTGTATCGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:15 5'-TTTGTATCGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:16 5'-TTTGTATCGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:17 5'-TTTGTATTGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:18 5'-TTTGTATCGGAGTAGTGATTTGGGAGG-3'
SEQ ID NO:19 5'-TTTGTATTGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:20 5'-TTTGTATTGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:21 5'-TTTGTATTGGAGTAGTGATTTGGGAGG-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:77(正向引物):Chr7(-);50,304,295-50,304,314
5'-CGCGTAGAAGGGCGT AGAGC-3'
SEQ ID NO:78(反向引物):Chr7(+);50,304,234-50,304,254
5'-GCGCGAACCGAAAAACTCGAC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:79 5'-AAYGAYGCACCCTCTCYGTATCCY-3'
SEQ ID NO:80 5'-AACGACGCACCCTCTCCGTATCCT-3'
SEQ ID NO:81 5'-AATGACGCACCCTCTCCGTATCCC-3'
SEQ ID NO:82 5'-AACGATGCACCCTCTCCGTATCCC-3'
SEQ ID NO:83 5'-AACGACGCACCCTCTCTGTATCCC-3'
SEQ ID NO:84 5'-AATGATGCACCCTCTCCGTATCCC-3'
SEQ ID NO:85 5'-AATGACGCACCCTCTCTGTATCCC-3'
SEQ ID NO:86 5'-AATGACGCACCCTCTCCGTATCCT-3'
SEQ ID NO:87 5'-AACGATGCACCCTCTCTGTATCCC-3'
SEQ ID NO:88 5'-AACGATGCACCCTCTCCGTATCCT-3'
SEQ ID NO:89 5'-AACGACGCACCCTCTCTGTATCCT-3'
SEQ ID NO:90 5'-AATGATGCACCCTCTCTGTATCCC-3'
SEQ ID NO:91 5'-AATGACGCACCCTCTCTGTATCCT-3'
SEQ ID NO:92 5'-AACGATGCACCCTCTCTGTATCCT-3'
SEQ ID NO:93 5'-AATGATGCACCCTCTCTGTATCCT-3'
SEQ ID NO:94 5'-AACGACGCACCCTCTCCGTATCCC-3'
SEQ ID NO:95 5'-AATGATGCACCCTCTCCGTATCCT-3'
或者基本相似的序列。
在又一实施例中,所述基因是IKZF1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:13 5'-TTTGTATYGGAGTAGYGATTYGGGAGG-3'
SEQ ID NO:14 5'-TTTGTATCGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:15 5'-TTTGTATCGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:16 5'-TTTGTATCGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:17 5'-TTTGTATTGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:18 5'-TTTGTATCGGAGTAGTGATTTGGGAGG-3'
SEQ ID NO:19 5'-TTTGTATTGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:20 5'-TTTGTATTGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:21 5'-TTTGTATTGGAGTAGTGATTTGGGAGG-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:22(正向引物):Chr7(-);50,304,366-50,304,391
5'TTGTTTCGTAGTCGGTTCGGTTTCG-3'
SEQ ID NO:23(反向引物):Chr7(+);50,304,271-50,304,294
5'-AACGACGCACCCTCTCCGTATCCC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:24 5'-TTTTTYGGATYGTTGTTTYGGTATAGG-3'
SEQ ID NO:25 5'-TTTTTCGGATCGTTGTTTCGGTATAGG-3'
SEQ ID NO:26 5'-TTTTTCGGATCGTTGTTTTGGTATAGG-3'
SEQ ID NO:27 5'-TTTTTCGGATTGTTGTTTCGGTATAGG-3'
SEQ ID NO:28 5'-TTTTTTGGATCGTTGTTTCGGTATAGG-3'
SEQ ID NO:29 5'-TTTTTCGGATTGTTGTTTTGGTATAGG-3'
SEQ ID NO:30 5'-TTTTTTGGATTGTTGTTTCGGTATAGG-3'
SEQ ID NO:31 5'-TTTTTTGGATCGTTGTTTTGGTATAGG-3'
SEQ ID NO:32 5'-TTTTTTGGATTGTTGTTTTGGTATAGG-3'
或者基本相似的序列。
在又一实施例中,所述基因是IKZF1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'-GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:13 5'-TTTGTATYGGAGTAGYGATTYGGGAGG-3'
SEQ ID NO:14 5'-TTTGTATCGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:15 5'-TTTGTATCGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:16 5'-TTTGTATCGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:17 5'-TTTGTATTGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:18 5'-TTTGTATCGGAGTAGTGATTTGGGAGG-3'
SEQ ID NO:19 5'-TTTGTATTGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:20 5'-TTTGTATTGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:21 5'-TTTGTATTGGAGTAGTGATTTGGGAGG-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:33(正向引物):Chr7(-);50,304,329-50,304,355
5'-CGGTCGTTTTTCGGATCGTTGTTTCGG-3'
SEQ ID NO:23(反向引物):Chr7(+);50,304,271-50,304,294
5'-AACGACGCACCCTCTCCGTATCCC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:34 5'-YGYGTAGAAGGGYGTAGAGYG-3'
SEQ ID NO:35 5'-CGCGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:36 5'-CGCGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:37 5'-CGCGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:38 5'-CGTGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:39 5'-TGTGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:40 5'-TGCGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:41 5'-CGTGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:42 5'-CGCGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:43 5'-TGTGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:44 5'-TGCGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:45 5'-TGCGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:46 5'-TGTGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:47 5'-TGTGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:48 5'-TGCGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:49 5'-CGTGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:50 5'-CGTGTAGAAGGGTGTAGAGCG-3'
或者基本相似的序列。
在又一实施例中,所述基因是BCAT1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:97(正向引物):chrl2(+);24,949,138-24,949,164
5'-TTAGTGTTTTTTTGTTGATGTAATTCG-3'
SEQ ID NO:65(反向引物):chrl2(-);24,949,058-24,949,074
5'-CAATACCCGAAACGACGACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:66 5'-TTCGTCGCGAGAGGGTCGGTT-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:96(正向引物):chrl2(-);24,949,058-24,949,082
5'-TAGTGTTCGAGGCGGCGGCGAGTAT-3'
SEQ ID NO:62(反向引物):chrl2(+);24,949,140-24,949,159
5'-ATCTTCCTACTAATACAATCCGCTAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括以下序列:
SEQ ID NO:63 5'-GATCGGTTTTTTCGCGGCGGA-3'
或者基本相似的序列。
在又一实施例中,所述基因是BCAT1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:64(正向引物):chrl2(+);24,949,131-24,949,159
5'-GTTTTTTTGTTGATGTAATTCGTTAGGTC-3'
SEQ ID NO:65(反向引物):chrl2(-);24,949,058-24,949,074
5'-CAATACCCGAAACGACGACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:66 5'-TTCGTCGCGAGAGGGTCGGTT-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:61(正向引物):chrl2(-);24,949,058-24,949,085
5'-T AGTGTTCGAGGCGGCGGCGAGTATACG-3'
SEQ ID NO:62(反向引物):chrl2(+);24,949,140-24,949,159
5'-ATCTTCCTACTAATACAATCCGCTAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括以下序列:
SEQ ID NO:63 5'-GATCGGTTTTTTCGCGGCGGA-3'
或者基本相似的序列。
在又一实施例中,所述基因是IRF4,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:111(正向引物):Chr6(-):391,614-391,636
5'-TAAGTCGAGAGTCGGGGTCGGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
在又一实施例中,所述基因是IRF4,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:114(正向引物):Chr6(-):391,614-391,630
5'-GAGAGTCGGGGTCGGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
在又一实施例中,所述基因是IRF4,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3”
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:116(正向引物):Chr6(-):391,624-391,649
5'-GAGAGGGATTTTGTAAGTCGAGAGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
本发明的另一方面涉及一种用于分析生物样本的试剂盒,其包括一种或多种用于根据本发明的方法检测一种或多种肿瘤标志物的引物和/或探针,以及有助于通过所述引物和/或探针进行检测的试剂。还可以包括其它手段,例如,接收生物样本。另一方面,提供一种用于筛查目标DNA区域甲基化的试剂盒,所述试剂盒包括:
a)第一组正向和反向引物,其用于扩增目标DNA区域的靶链的一种或多种完全或部分甲基化形式,所述引物用于杂交到已被未甲基化胞嘧啶试剂修饰的目标DNA区域的形式;
b)第二组正向和反向引物,其用于扩增目标DNA区域的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)如果步骤(a)和(b)的引物是甲基化特异性的,则任选一种或多种针对靶链和相反链中的每一条的探针,或者如果步骤(a)和(b)的引物不是甲基化特异性的,则任选一种或多种针对靶链和相反链的甲基化特异性探针,其中所述探针包含检测手段;
在另一实施例中,所述DNA区域是以下基因中的一种或多种:
并且其中所述基因包括转录起始位点上游5kb。
在另一实施例中,所述基因是基因BCAT1、IKZF1、IRF4、GRASP或CAHM中的一个或多个,或者是转录起始位点上游5kb。
在另一实施例中,所述基因选自(i)BCAT1和IKZF1;(ii)BCAT1、IKZF1和IRF4;(iii)BCAT1、IKZF1和GRASP;(iv)BCAT1、IKZF1和CAHM;(iv)BCAT1、IKZF1、IRF4和GRASP;(v)BCAT1、IKZF1、IRF4和CAHM或(vi)BCAT1、IKZF1、IRF4、GRASP和CAHM,或这些基因转录起始位点上游5kb。
在又一实施例中,所述试剂将未甲基化的胞嘧啶残基修饰为尿嘧啶,并且所述试剂可以是亚硫酸氢盐,例如亚硫酸氢钠或焦亚硫酸钠。
在又一实施例中,所述试剂盒包含甲基化特异性引物,但不包含探针。
在另一实施例中,所述试剂盒包括甲基化特异性引物和非甲基化特异性探针。
在又一实施例中,所述试剂盒包括甲基化特异性引物和甲基化特异性探针。
在另一实施例中,所述试剂盒包括非甲基化特异性引物和甲基化特异性探针。
在又一实施例中,所述探针是水解探针。
在又一实施例中,所述探针共同杂交到所述目标DNA区域的所有完全和部分甲基化模式。
在另一实施例中,所述基因是IKZF1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:13 5'-TTTGTATYGGAGTAGYGATTYGGGAGG-3'
SEQ ID NO:14 5'-TTTGTATCGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:15 5'-TTTGTATCGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:16 5'-TTTGTATCGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:17 5'-TTTGTATTGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:18 5'-TTTGTATCGGAGTAGTGATTTGGGAGG-3'
SEQ ID NO:19 5'-TTTGTATTGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:20 5'-TTTGTATTGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:21 5'-TTTGTATTGGAGTAGTGATTTGGGAGG-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:77(正向引物):Chr7(-);50,304,295-50,304,314
5'-CGCGTAGAAGGGCGT AGAGC-3'
SEQ ID NO:78(反向引物):Chr7(+);50,304,234-50,304,254
5'-GCGCGAACCGAAAAACTCGAC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:79 5'-AAYGAYGCACCCTCTCYGTATCCY-3'
SEQ ID NO:80 5'-AACGACGCACCCTCTCCGTATCCT-3'
SEQ ID NO:81 5'-AATGACGCACCCTCTCCGTATCCC-3'
SEQ ID NO:82 5'-AACGATGCACCCTCTCCGTATCCC-3'
SEQ ID NO:83 5'-AACGACGCACCCTCTCTGTATCCC-3'
SEQ ID NO:84 5'-AATGATGCACCCTCTCCGTATCCC-3'
SEQ ID NO:85 5'-AATGACGCACCCTCTCTGTATCCC-3'
SEQ ID NO:86 5'-AATGACGCACCCTCTCCGTATCCT-3'
SEQ ID NO:87 5'-AACGATGCACCCTCTCTGTATCCC-3'
SEQ ID NO:88 5'-AACGATGCACCCTCTCCGTATCCT-3'
SEQ ID NO:89 5'-AACGACGCACCCTCTCTGTATCCT-3'
SEQ ID NO:90 5'-AATGATGCACCCTCTCTGTATCCC-3'
SEQ ID NO:91 5'-AATGACGCACCCTCTCTGTATCCT-3'
SEQ ID NO:92 5'-AACGATGCACCCTCTCTGTATCCT-3'
SEQ ID NO:93 5'-AATGATGCACCCTCTCTGTATCCT-3'
SEQ ID NO:94 5'-AACGACGCACCCTCTCCGTATCCC-3'
SEQ ID NO:95 5'-AATGATGCACCCTCTCCGTATCCT-3'
或者基本相似的序列。
在又一实施例中,所述基因是IKZF1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:13 5'-TTTGTATYGGAGTAGYGATTYGGGAGG-3'
SEQ ID NO:14 5'-TTTGTATCGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:15 5'-TTTGTATCGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:16 5'-TTTGTATCGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:17 5'-TTTGTATTGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:18 5'-TTTGTATCGGAGTAGTGATTTGGGAGG-3'
SEQ ID NO:19 5'-TTTGTATTGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:20 5'-TTTGTATTGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:21 5'-TTTGTATTGGAGTAGTGATTTGGGAGG-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:22(正向引物):Chr7(-);50,304,366-50,304,391
5'TTGTTTCGTAGTCGGTTCGGTTTCG 3'
SEQ ID NO:23(反向引物):Chr7(+);50,304,271-50,304,294
5'-AACGACGCACCCTCTCCGTATCCC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:24 5'-TTTTTYGGATYGTTGTTTYGGTATAGG-3'
SEQ ID NO:25 5'-TTTTTCGGATCGTTGTTTCGGTATAGG-3'
SEQ ID NO:26 5'-TTTTTCGGATCGTTGTTTTGGTATAGG-3'
SEQ ID NO:27 5'-TTTTTCGGATTGTTGTTTCGGTATAGG-3'
SEQ ID NO:28 5'-TTTTTTGGATCGTTGTTTCGGTATAGG-3'
SEQ ID NO:29 5'-TTTTTCGGATTGTTGTTTTGGTATAGG-3'
SEQ ID NO:30 5'-TTTTTTGGATTGTTGTTTCGGTATAGG-3'
SEQ ID NO:31 5'-TTTTTTGGATCGTTGTTTTGGTATAGG-3'
SEQ ID NO:32 5'-TTTTTTGGATTGTTGTTTTGGTATAGG-3'
或者基本相似的序列。
在又一实施例中,所述基因是IKZF1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'-GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:13 5'-TTTGTATYGGAGTAGYGATTYGGGAGG-3'
SEQ ID NO:14 5'-TTTGTATCGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:15 5'-TTTGTATCGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:16 5'-TTTGTATCGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:17 5'-TTTGTATTGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:18 5'-TTTGTATCGGAGTAGTGATTTGGGAGG-3'
SEQ ID NO:19 5'-TTTGTATTGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:20 5'-TTTGTATTGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:21 5'-TTTGTATTGGAGTAGTGATTTGGGAGG-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:33(正向引物):Chr7(-);50,304,329-50,304,355
5'-CGGTCGTTTTTCGGATCGTTGTTTCGG-3'
SEQ ID NO:23(反向引物):Chr7(+);50,304,271-50,304,294
5'-AACGACGCACCCTCTCCGTATCCC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:34 5'-YGYGTAGAAGGGYGTAGAGYG-3'
SEQ ID NO:35 5'-CGCGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:36 5'-CGCGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:37 5'-CGCGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:38 5'-CGTGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:39 5'-TGTGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:40 5'-TGCGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:41 5'-CGTGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:42 5'-CGCGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:43 5'-TGTGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:44 5'-TGCGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:45 5'-TGCGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:46 5'-TGTGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:47 5'-TGTGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:48 5'-TGCGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:49 5'-CGTGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:50 5'-CGTGTAGAAGGGTGTAGAGCG-3'
或者基本相似的序列。
在又一实施例中,所述基因是BCAT1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:97(正向引物):chrl2(+);24,949,138-24,949,164
5'-TTAGTGTTTTTTTGTTGATGTAATTCG-3'
SEQ ID NO:65(反向引物):chrl2(-);24,949,058-24,949,074
5'-CAATACCCGAAACGACGACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:66 5'-TTCGTCGCGAGAGGGTCGGTT-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:96(正向引物):chrl2(-);24,949,058-24,949,082
5'-TAGTGTTCGAGGCGGCGGCGAGTAT-3'
SEQ ID NO:62(反向引物):chrl2(+);24,949,140-24,949,159
5'-ATCTTCCTACTAATACAATCCGCTAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括以下序列:
SEQ ID NO:63 5'-GATCGGTTTTTTCGCGGCGGA-3'
或者基本相似的序列。
在又一实施例中,所述基因是BCAT1,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:64(正向引物):chrl2(+);24,949,131-24,949,159
5'-GTTTTTTTGTTGATGTAATTCGTTAGGTC-3'
SEQ ID NO:65(反向引物):chrl2(-);24,949,058-24,949,074
5'-CAATACCCGAAACGACGACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:66 5'-TTCGTCGCGAGAGGGTCGGTT-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:61(正向引物):chrl2(-);24,949,058-24,949,085
5'-T AGTGTTCGAGGCGGCGGCGAGTATACG-3'
SEQ ID NO:62(反向引物):chrl2(+);24,949,140-24,949,159
5'-ATCTTCCTACTAATACAATCCGCTAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括以下序列:
SEQ ID NO:63 5'-GATCGGTTTTTTCGCGGCGGA-3'
或者基本相似的序列。
在又一实施例中,所述基因是IRF4,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:111(正向引物):Chr6(-):391,614-391,636
5'-TAAGTCGAGAGTCGGGGTCGGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
在又一实施例中,所述基因是IRF4,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:114(正向引物):Chr6(-):391,614-391,630
5'-GAGAGTCGGGGTCGGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
在又一实施例中,所述基因是IRF4,并且:
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3”
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA -3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:116(正向引物):Chr6(-):391,624-391,649
5'-GAGAGGGATTTTGTAAGTCGAGAGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
参考以下非限制性实例进一步描述本发明。
实例1
亚硫酸氢盐处理对可PCR扩增DNA的不利影响。
为了确定亚硫酸氢盐处理对PCR扩增有多大影响,使用液滴数字PCR(ddPCR)比较亚硫酸氢盐处理前后扩增子的定量。
按照标准操作,通过测量260纳米处的吸光度来估计完全甲基化的人类基因组DNA(Millipore)的浓度。计算出预期的等量DNA拷贝数,并用亚硫酸氢钠处理一部分DNA。亚硫酸氢盐处理之前和之后的可PCR扩增的DNA拷贝的实际量通过使用ACTB测定法的ddPCR来确定。如图1所示,在亚硫酸氢盐处理之前用于估计DNA拷贝的ddPCR ACTB测定法检测并扩增目标区域[SEQ ID 67-71]中的两条互补链,而在亚硫酸氢盐处理之后用于估计DNA拷贝的测定法仅检测并扩增一条DNA链[SEQ ID 72-76]。因此,可以预期野生型DNA的拷贝数是亚硫酸氢盐处理DNA的两倍。然而,观察到的损失实际上比预期高10-40%(表1)。
此外,对作为模板输入的亚硫酸氢盐转化的DNA上的BCAT1[SEQ ID 57-58和64-66]或IKZF1[SEQ ID 3、4、11-13]的靶链特异性测定进行评估,以确定DNA损失和/或降解是否是序列特异性的。表1显示,一般来说,BCAT1和IKZF1以相似的量被定量,但是在亚硫酸氢盐处理的DNA中,它们比ACTB扩增得更少。这表明,DNA破损/降解可能是序列特异性的,并且可能反映了这样的事实,即在BCAT1和IKZF1中靶向的扩增子区域是甲基化的,而靶向的ACTB扩增子区域不是来自已知被甲基化的区域。
表1:亚硫酸氢盐处理前后可扩增DNA量的测定。
实例2
靶向亚硫酸氢盐转化的DNA的双链
完全甲基化的人类基因组DNA(2000pg/孔;Millipore)作为模板,并使用定制的Epitect快速DNA亚硫酸氢盐试剂盒(Qiagen)在QIAcube HT(Qiagen)上进行亚硫酸氢盐转化。设计了靶向BCAT1[SEQ ID 64-66和61-63]和IKZF1[SEQ ID 11-21和22-32]的一条或两条链上的区域的qPCR测定。PCR反应包括15μL 2x Quantitect mastermix,每200nM正向和反向引物和每100nM探针与无核酸酶的水组成3μL,和12μL模板DNA(166.7pg/μL),以如下条件循环:在光循环器(Light Cycler)480(Roche)上,95℃,15分钟;[95℃,15秒;62℃,40秒]x50;40℃,10秒。
图2显示了A)BCAT1和B)IKZF1的扩增结果。可以看出,当使用靶向DNA两条链的引物时,与使用靶向单链的引物相比,BCAT1和IKZF1产生的扩增子的量大约是后者的两倍,因此证实该技术按预期起作用。
实例3
亚硫酸氢盐转化的DNA单链或双链扩增的ddPCR定量
液滴数字PCR(ddPCR)通过将DNA分配成大约20,000个离散的液滴来提供绝对定量,然后这些液滴作为单个反应囊泡用于终点PCR扩增。在PCR扩增之后,对液滴进行荧光评估,作为该特定液滴中在开始时至少含有一个DNA分子的指标。计算荧光阳性液滴的数量,并使用泊松分布计算原始样本中的DNA拷贝数,以模拟每个液滴包含一个或多个DNA分子的可能性。因为PCR扩增是终点,所以反应的效率并不重要,而且该技术提供的定量是一种更准确的测量。
为了证实实例2中观察到的现象是否与PCR扩增效率无关,使用ddPCR重复上述实验。完全甲基化的人类基因组DNA(2000pg/孔;Millipore)作为模板,并使用定制的Epitect快速DNA亚硫酸氢盐试剂盒(Qiagen)在QIAcube HT(Qiagen)上进行亚硫酸氢盐转化。设计了靶向ACTB[SEQ ID 74-76]靶链上的区域和靶向BCAT1[SEQ ID 64-66和61-63]和IKZF1[SEQ ID 11-21和22-32]的靶链或靶链和相反链上的区域的ddPCR测定。PCR反应包括用于探针的10μL 2x ddPCR超混合液(Supermix)(不含dUTP;BioRad),每450nM正向和反向引物和每50-200nM探针与不含核酸酶的水组成2μL,和8μL模板DNA(250pg/μL)。用FAM标记的探针检测IKZF1扩增子,用HEX探针检测ACTB,用FAM探针检测BCAT1的靶链,用HEX探针检测靶相反链。使用QX200手动液滴发生器(BioRad)产生液滴,随后以如下条件循环:在C1000(BioRad)上,95℃,10分钟;[94℃,30秒;58℃,1分钟]x45;98℃,10分钟。在QX200液滴读取器(BioRad)上读取液滴,使用Quantasoft分析专业版(Quantasoft Analysis Pro)软件(BioRad)分析结果,并比较阳性液滴的数量。
图3显示了A)靶链特异性扩增和B)双链扩增的定量结果。在两种测定中,BCAT1、IKZF1和ACTB的靶链都显示出荧光群,并且在同时检测靶链和相反链的测定中,相反链上的BCAT1和IKZF1扩增子观察到额外的群。括号中给出的数值是指由Quantasoft软件测定的每个孔中每个扩增基因的拷贝数,可以看出,与靶特异性链测定相比,BCAT1和IKZF1在靶链和相反链测定中扩增的拷贝数大约是靶特异性链测定的两倍(分别为179v 380拷贝/孔,212%和237v 428拷贝/孔,180%)。在两种测定中,ACTB仅在靶特异性链上被扩增,并且在两次PCR中以大致相等的量存在,298v 265拷贝/孔。亚硫酸氢盐处理导致PCR可扩增材料损失30-57%,这与之前的结果一致,但确实证明了亚硫酸氢盐处理过程中破损的随机性质。
这些结果证实,尽管由于亚硫酸氢盐诱导的降解和破损导致起始模板的显著损失,亚硫酸氢盐转化后靶向非互补DNA的两条链确实出乎意料地导致两倍量的DNA被扩增。
实例4
低DNA输入下甲基化特异性PCR灵敏度提高
当DNA输入量非常低时,例如在少量血浆中寻找甲基化循环肿瘤DNA时,检测的灵敏度是本领域中的一个重要问题。为了测试这一点,在过量未甲基化DNA的情况下,将非常低浓度的甲基化的DNA掺入样本,并在检测靶链或靶链和相反链的测定中进行检测的比较。
使用定制的Epitect快速DNA亚硫酸氢盐试剂盒(Qiagen)对完全甲基化的人类基因组DNA(Millipore)和白细胞未甲基化的DNA(Roche)在QIAcube HT(Qiagen)上进行亚硫酸氢盐转化,并以1∶1667的比例混合。在用于靶向ACTB[SEQ ID 74-76]的靶链上的区域和BCAT1[SEQ ID 64-66和61-63]和IKZF1[SEQ ID 11-21和22-32]的一个或两个链上的区域的qPCR测定中,将该DNA混合物的45个样本以一式三份的形式进行分析。ACTB扩增用作对照,以确保PCR有效。PCR反应包括15μL2x Quantitect mastermix,每200nM正向和反向引物和每100nM探针与不含核酸酶的水组成3μL,和12μL模板DNA(每孔含有3pg甲基化的DNA和5ng未甲基化的DNA,相当于1拷贝甲基化的DNA和1515拷贝未甲基化的DNA)。对照样本仅含有5ng亚硫酸氢盐转化的、未甲基化的DNA。以如下条件循环:在光循环器480(Roche)上,95℃,15分钟;[95℃,15秒;62℃,40秒]x50;40℃,10秒。如果BCAT1和/或IKZF1的一个或多个复制品呈阳性,则样本被视为阳性。
使用靶链特异性PCR总共检测到73%的样本,而当两条链都被靶向时,检测到93%的样本(表2)。仅含5ng未甲基化DNA的样本中没有检测阳性。根据费歇尔的精确双尾试验(p=0.02)确定,这种检测的增加在统计学上是显著的,并且表明靶向两条非互补的DNA链在检测非常少量的甲基化的DNA((每份样本约1个拷贝)时有更高的灵敏度。
表2:靶向含有非常少量甲基化DNA的样本上的bisDNA的单链或双链的测定中的样本阳性
实例5
改进的等离子体检测
在来自30岁以下假定为阴性的白人受试者的混合血浆中掺入完全甲基化的DNA(掺入范围:2.3-300pg/mL,P0-P300),以模拟真实的临床样本。按照制造商的说明(Qiagen),在QIASymphony自动化平台上,使用DSP病毒/病原体midi试剂盒,从4.5mL样本(每个浓度16个复制品)中提取DNA。然后使用定制的Epitect快速DNA亚硫酸氢盐试剂盒(Qiagen)在QIAube HT(Qiagen)上对洗脱的DNA进行亚硫酸氢盐转化。通过用于扩增ACTB[SEQ ID 74-76]的靶链和BCAT1[SEQ ID 64-66和61-63]和IKZF1[SEQ ID 11-21和22-32]的一个或两个链的qPCR测定方法,以一式三份的形式(每个浓度8个样本复制品)分析所得亚硫酸氢盐转化的DNA。使用ACTB扩增作为对照,以确保提取、亚硫酸氢盐转化和PCR有效。PCR反应包括15μL 2x Quantitect mastermix,每200nM正向和反向引物和每100nM探针与无核酸酶的水组成3μL,和12μL模板DNA,以如下条件循环:在光循环器480(Roche)上,95℃,15分钟;[95℃,15秒;62℃,40秒]x50;40℃,10秒。如果任一条DNA链上的BCAT1和/或IKZF1的一个复制品呈阳性,则样本被认为是阳性。使用Probit分析计算各个测定的检测限(LOD)。
图4是Probit分析的图示,显示单链PCR的检测限为51.83pg/mL血浆(约15.7拷贝/毫升),同时检测靶特异性链和相反链的PCR测定的检测限为26.98pg/mL(约8.2拷贝/毫升)。与仅针对靶链的测定相比,在靶向两条链的分析中,模拟临床样本中的LOD几乎是一半(52%),再次证明了本发明在具有低浓度甲基化DNA的样本中的实用性。
实例6
改进临床样本检测
对从经结肠镜检查确诊为结肠直肠癌或无疾病证据的患者收集的血浆进行测试,以确定本发明的临床实用性。
根据制造商的说明(Qiagen),使用DSP病毒/病原体midi试剂盒,从44例经结肠镜检查证实的结直肠癌患者和44例无疾病证据(NED)的患者中提取9mL(2×4.5mL)血浆。然后使用定制的Epitect快速DNA亚硫酸氢盐试剂盒(Qiagen)在QIAube HT(Qiagen)上对洗脱的DNA进行亚硫酸氢盐转化。将每个样本的亚硫酸氢盐转化的DNA分成6等份。通过用于扩增ACTB[SEQ ID 74-76]的靶链和BCAT1[SEQ ID 64-66和61-63]和IKZF1[SEQ ID 11-21和22-32]的一条或两条链的qPCR测定方法,以一式三份的形式分析样本。使用ACTB扩增作为对照,以确保提取、亚硫酸氢盐转化和PCR有效。PCR反应包括15μL 2x Quantitectmastermix,每200nM正向和反向引物和每100nM探针与无核酸酶的水组成3μL,和12μL模板DNA,以如下条件循环:在光循环器480(Roche)上,95℃,15分钟;[95℃,15秒;62℃,40秒]x50;40℃,10秒。如果任一条DNA链上的BCAT1和/或IKZF1的一个复制品呈阳性,则样本被认为是阳性。
表3总结了结果,单链和双链测定之间在总体测定阳性以及单个或全部BCAT1或IKZF1复制品阳性方面的任何差异,均使用双尾McNemar X2检验进行评估。靶链特异性PCR(以下称为“单链测定”)检测到23/44(52%)的癌症样本,而靶向bis DNA双链的测定(以下称为“双链测定”)检测到30/44(68%,p=0.07)。与单链测定相比,除了测定阳性率的总体增加外,双链测定中BCAT1(p=0.0002)、IKZF1(p=0.0018)和综合(p=0.000)总体复制品阳性率也有显著的统计学增加。当观察癌症阶段时,双链测定中的BCAT1和IKZF1阳性率都高于单链测定,在某些阶段统计上也是如此。在44个NED样本中,单链测定未检测到任何阳性样本,而双链测定检测到2/44(4.5%),两个样本均具有单一BCAT1复制品阳性,晚期Ct分别为40.48和43.97。这种差异没有统计学意义。
这些结果证实了当前方法的临床实用性,证明临床疾病患者血浆中无细胞肿瘤DNA的检测增加,而无疾病证据患者的非特异性检测没有显著增加。
表3提取自患者血浆样本的DNA中的测定阳性和甲基化的BCAT和/或IKZF1复制品阳性,所述患者为经结肠镜检查确认的癌症患者或无疾病证据的患者,使用针对靶链的单链测定或针对bis DNA双链的测定进行扩增。
实例7
改进的等离子体检测
在来自30岁以下假定健康的供体的混合血浆中掺入完全甲基化的DNA(掺入范围:0-500pg/mL),以模拟真实的临床样本。使用QS DSP病毒/病原体midi或QS DSP循环DNA试剂盒(Qiagen),在QIASymphony自动化平台上从4.5mL样本中提取DNA。然后使用定制的Epitect快速DNA亚硫酸氢盐试剂盒(Qiagen)在QIAube HT(Qiagen)上对洗脱的DNA进行亚硫酸氢盐转化。通过用于扩增ACTB[SEQ ID 74-76]的靶链和BCAT1[SEQ ID 62-63、96、65-66、97]和IKZF1[SEQ ID 11-21、77-95]的一条或两条链的qPCR测定方法,对所得亚硫酸氢盐转化的DNA以一式三份的形式进行分析(每个浓度12-24个样本复制品)。使用ACTB扩增作为对照,以确保提取、亚硫酸氢盐转化和PCR有效[SEQ IdS 74-76]。PCR反应包括15μL 2xQuantitect mastermix,每200nM正向和反向引物和每100nM探针与无核酸酶的水组成3μL,和12μL模板DNA,以如下条件循环:在光循环器480(Roche)上,95℃,15分钟;[95℃,15秒;62℃,40秒]x50;40℃,10秒。甲基化的DNA浓度和试验阳性之间的关系通过概率回归模型来评估,并且每种方法的LOD被估计为导致95%确定阳性结果的概率的浓度。样本通过实时PCR以一式三份的形式进行检测,如果检测到甲基化BCAT1或IKZF1的三个复制品中的任何一个,则认为样本为阳性(总共6个复制品)。当同时检测靶区域和相反靶区域时,与仅检测靶区域相比,观察到检测限提高了2倍(分别是10.7pg/mL和21.4pg/mL)。灵敏度的提高也反映在PCR复制品阳性的增加上。参见表4和图5。
表4|单链和双链测定之间的复制品和样本阳性的比较
实例8
低DNA输入下甲基化特异性PCR灵敏度提高
通过超声波破碎通用甲基化人类基因组DNA(Zymo,类别#D5011),以反映血浆中发现的循环无细胞DNA(ccfDNA)(约100-500bp片段)。使用ddPCR对片段化的DNA进行亚硫酸氢盐转化和定量[SEQ ID 11-21,64-66,74-76],并在每份样本(45μL)1250拷贝亚硫酸氢盐转化的未甲基化DNA的前提下稀释至约1基因组拷贝甲基化DNA。通过用于靶向ACTB[SEQ ID74-76]的靶链区域和BCAT1[SEQ ID 62-63,96,65-66,97]和IKZF1[SEQ ID 11-21,77-95]的一个或两个链的区域的qPCR测定方法,以一式三份的形式分析45个样本。
PCR反应包括15μL 2x Quantitect mastermix,每200nM正向和反向引物和每100nM探针与无核酸酶的水组成3μL,和12μL模板DNA。对照样本仅包含1250拷贝亚硫酸氢盐转化的、未甲基化的DNA。以如下条件循环:在光循环器480(Roche)上,95℃,15分钟;[95℃,15秒;62℃,40秒]x50;40℃,10秒。如果BCAT1和/或IKZF1的一个或多个复制品呈阳性,则样本被视为阳性。
使用靶链特异性PCR总共检测到37%的样本,而当两条链都被靶向时,检测到67%的样本(p值=<0.001;费歇尔的精确双尾试验;图6)。与仅靶向BCAT1和IKZF1的一条链的测定相比,使用不同批次的PCR Mastermix和寡核苷酸混合物,用靶向BCAT1和的IKZF1两条链的测定进行多次试验,所述测定的阳性率持续提高,如图6所示。这表明通过靶向两条非互补的DNA链,在检测非常少量的甲基化DNA(每份样本约1个拷贝)时,获得了更高的灵敏度。
实例9
灵敏度提高的临床证明
对从经结肠镜检查确诊为结肠直肠癌或无疾病证据的患者收集的血浆进行测试,以确定本发明的临床实用性(2x4.5 mL)。研究组包括1,576名受试者,包括1,536名结肠镜检查确认的受试者和40名假定健康的供体(30岁以下)。如实例7所述分离循环的DNA,进行亚硫酸氢盐转化并进行PCR分析。
表5总结了结果,单链和双链测定之间在总体测定阳性以及单个或全部BCAT1或IKZF1复制品阳性方面的任何差异,均使用双尾McNemar X2检验进行评估。靶链特异性PCR(以下称为“单链测定”)检测到106/177(59.9%)的癌症样本,而靶向bis DNA双链的测定(以下称为“双链测定”)检测到127/177(70.1%,p=0.0067)。除了测定阳性率的总体增加外,双链测定中的BCAT1、IKZF1阳性与单链测定相比也有显著增加。当观察癌症阶段时,双链测定中的BCAT1和IKZF1阳性率都高于单链测定。在1072份来自无肿瘤的受试者的样本中,单链测定检测到78份(7.3%),而双链分析检测到163份(15.2%)(p=0.0019)。
这些结果通过证明临床疾病患者血浆中无细胞肿瘤DNA的检测增加证实了本发明的临床实用性。
表5 1,576份单链和双链测定临床样本分析结果汇总
1麦克尼马尔卡方检验(McNemar’s Chi Square Test)
实例10
靶向亚硫酸氢盐转化的DNA的双链
完全甲基化的人类基因组DNA(2000pg/孔;Millipore)作为模板,并使用定制的Epitect快速DNA亚硫酸氢盐试剂盒(Qiagen)在QIAcube HT(Qiagen)上进行亚硫酸氢盐转化。设计了靶向IRF4[SEQ ID 108-110和111-113]的一条或两条链上的区域的qPCR测定。PCR反应包括15μL 2x Quantitect mastermix,每200nM正向和反向引物和每100nM探针与无核酸酶的水组成3μL,和12μL模板DNA(166.7pg/μL),以如下条件循环:在光循环器480(Roche)上,95℃,15分钟;[95℃,15秒;62℃,40秒]x50;40℃,10秒。
图7显示了IRF4的扩增结果。可以看出,当使用靶向DNA两条链的引物时,与使用靶向单链的引物相比,IKZF1产生的扩增子的量大约是后者的两倍,因此证实了该技术在另一不同基因上的作用跟预期相同。
实例11
低DNA输入下甲基化特异性PCR灵敏度提高
通过超声波破碎通用甲基化人类基因组DNA(Millipore,类别#S7821),以反映血浆中发现的循环无细胞DNA(ccfDNA)(约100-500bp片段)。使用ddPCR对片段化的DNA进行亚硫酸氢盐转化和定量[SEQ ID 11-21,64-66,74-76],并在每份样本(45μL)1250拷贝亚硫酸氢盐转化的未甲基化DNA(Millipore,类别#7822)的前提下稀释至约1基因组拷贝甲基化DNA。通过用于靶向ACTB[SEQ ID 74-76]、IKZF1[SEQ ID 11-21]和IRF4[SEQ ID 108-110]的靶链区域和BCAT1[SEQ ID 62-63、96、65-66、97]的一个或两个链的区域的qPCR测定方法,以一式三份的形式分析45个样本。
PCR反应包括15μL 2x Quantitect mastermix,每200nM正向和反向引物和每100nM探针与无核酸酶的水组成3μL,和12μL模板DNA。对照样本仅包含1250拷贝亚硫酸氢盐转化的、未甲基化的DNA。以如下条件循环:在光循环器480(Roche)上,95℃,15分钟;[95℃,15秒;62℃,40秒]x50;40℃,10秒。在FAM通道上检测到IKZF1和IRF4,而在HEX通道上检测到BCAT1的两条链。如果BCAT1、IKZF1和/或IRF4的一个或多个复制品呈阳性,则样本被视为阳性。
使用单靶链特异性PCR检测到总共23.7%(IKZF1)和22.2%(BCAT1)的复制品和77.8%的样本,而当两条链都被靶向时(p值分别为0.0169、0.0001和0.069,费歇尔的精确双尾试验;表6)检测到35.6%(IKZF1和IRF4的单链)和45.2%(双链BCAT1)的复制品和93.3%的样本。这表明通过靶向两条非互补的DNA链,或者在靶链上添加额外的标记物,在检测非常少量的甲基化DNA(每份样本约1个拷贝)时,获得了更高的灵敏度。
表6:单链和双链测定中的复制品和样本阳性。
本领域技术人员将会理解,除了具体描述的那些之外,这里描述的本发明可以适当变化和修改。应当理解,本发明包括所有这些变化和修改。本发明还包括本说明书中单独或共同提及或指出的所有步骤、特征、组合物和化合物,以及任何两个或更多个所述步骤或特征的任何和所有组合。
参考文献
A.R.Thierry,F.Mouliere,S.El Messaoudi,C.Mollevi,E.Lopez-Crapez,F.Rolet,B.Gillet,C.Gongora,P.Dechelotte,B.Robert,M.Del Rio,P.-J.Lamy,F.Bibeau,M.Nouaille,V.Loriot,A.-S.Jarrousse,F.Molina,M.Mathonnet,D.Pezet,andM.Ychou,"Clinical validation of the detection of KRAS and BRAF mutations fromcirculating tumor DNA.,"Nature Med,vol.20,no.4,pp.430-435,Apr.2014.
B.Vogelstein,N.Papadopoulos,V.E.Velculescu,S.Zhou,L.A.Diaz,andK.W.Kinzler,"Cancer genome landscapes.,"Science,vol.339,no.6127,pp.1546-1558,Mar.2013.
C.Bettegowda,M.Sausen,R.J.Leary,I.Kinde,Y.Wang,N.Agrawal,B.R.Bartlett,H.Wang,B.Luber,R.M.Alani,E.S.Antonarakis,N.S.Azad,A.Bardelli,H.Brem,J.L.Cameron,C.C.Lee,L.A.Fecher,G.L.Gallia,P.Gibbs,D.Le,R.L.Giunto,M.Goggins,M.D.Hogarty,M.Holdhoff,S.-M.Hong,Y.Jiao,H.H.Juhl,J.J.Kim,G.Siravegna,D.A.Laheru,C.Lauricella,M.Lim,E.J.Lipson,S.K.N.Marie,G.J.Netto,K.S.Oliner,A.Olivi,L.Olsson,G.J.Riggins,A.Sartore-Bianchi,K.Schmidt,L.-M.Shih,S.M.Oba-Shinjo,S.Siena,D.Theodorescu,J.Tie,T.T.Harkins,S.Veronese,T.-L.Wang,J.D.Weingart,C.L.Wolfgang,L.D.Wood,D.Xing,R.H.Hruban,J.Wu,P.J.Allen,C.M.Schmidt,M.A.Choti,V.E.Velculescu,K.W.Kinzler,B.Vogelstein,N.Papadopoulos,and L.A.Diaz,"Detection of circulating tumor DNA in early-and late-stagehuman malignancies.,"Sci Transl Med,vol.6,no.224,pp.224ra24-224ra24,Feb.2014.
F.Diehl,M.Li,D.Dressman,Y.He,D.Shen,S.Szabo,L.A.Diaz,S.N.Goodman,K.A.David,H.Juhl,K.W.Kinzler,and B.Vogelstein,"Detection and quantificationof mutations in the plasma of patients with colorectal tumors.,"Proceedingsof the National Academy of Sciences,vol.102,no.45,pp.16368-16373,Nov.2005.
F.Mouliere,B.Robert,E.Arnau Peyrotte,M.Del Rio,M.Ychou,F.Molina,C.Gongora,and A.R.Thierry,"High fragmentation characterizes tumour-derivedcirculating DNA.,"PLoS ONE,vol.6,no.9,p.e23418,2011.
H.Schwarzenbach,D.S.B.Hoon,and K.Pantel,"Cell-free nucleic acids asbiomarkers in cancer patients.,"Nat Rev Cancer,vol.11,no.6,pp.426-437,Jun.2011.
I.B.Roninson,E.V.Broude,and B.D.Chang,"If not apoptosis,then what?Treatment-induced senescence and mitotic catastrophe in tumor cells.,"DrugResist.Updat,vol.4,no.5,pp.303-313,Oct.2001.
K.C.A.Chan,J.Zhang,A.B.Y.Hui,N.Wong,T.K.Lau,T.N.Leung,K-W.Lo,D.W.S.Huang,and Y.M.D.Lo,"Size distributions of maternal and fetal DNA inmaternal plasma.,"Clin Chem,vol.50,no.1,pp.88-92,Jan.2004.
K.Warton and G.Samimi,"Methylation of cell-free circulating DNA inthe diagnosis of cancer.,"Front Mol Biosci,vol.2,p.13,2015.
M.S.Lawrence,P.Stojanov,P.Polak,G.V.Kryukov,K.Cibulskis,A.Sivachenko,S.L.Carter,C.Stewart,C.H.Mermel,S.A.Roberts,A.Kiezun,P.S.Hammerman,A.McKenna,Y.Drier,L.Zou,A.H.Ramos,T.J.Pugh,N.Stransky,E.Helman,J.Kim,C.Sougnez,L.Ambrogio,E.Nickerson,E.Shefler,M.L.Cortes,D.Auclair,G.Saksena,D.Voet,M.Noble,D.DiCara,P.Lin,L.Lichtenstein,D.I.Heiman,T.Fennell,M.Imielinski,B.Hernandez,E.Hodis,S.Baca,A.M.Dulak,J.Lohr,D.-A.Landau,C.J.Wu,J.Melendez-Zajgla,A.Hidalgo-Miranda,A.Koren,S.A.McCarroll,J.Mora,R.S.Lee,B.Crompton,R.Onofno,M.Parkin,W.Winckler,K.Ardlie,S.B.Gabriel,C.W.M.Roberts,J.A.Biegel,K.Stegmaier,A.J.Bass,L.A.Garraway,M.Meyerson,T.R.Golub,D.A.Gordenin,S.Sunyaev,E.S.Lander,and G.Getz,"Mutational heterogeneity in cancer and thesearch for new cancer-associated genes,"Nature,vol.499,no.7457,pp.214-218,Jul.2013.
P.Bordi,M.Del Re,R.Danesi,and M.Tiseo,"Circulating DNA in diagnosisand monitoring EGFR gene mutations in advanced non-small cell lung cancer.,"Transl Lung Cancer Res,vol.4,no.5,pp.584-597,Oct.2015.
P.O.Delgado,B.C.A.Alves,F.de S.Gehrke,R.K.Kumyoshi,M.L.Wroclavski,A.Del Gig o,and F.L.A.Fonseca,"Characterization of cell-free circulating DNAin plasma in patients with prostate cancer.,"Tumour Biol.,vol.34,no.2,pp.983-986,Apr.2013.
P.Polak,R.Karlic,A.Koren,R.Thurman,R.Sandstrom,M.S.Lawrence,A.Reynolds,E.Rynes,K.Vlahovicek,J.A.Stamatoyannopoulos,and S.R.Sunyaev,"Cell-of-origin chromatin organization shapes the mutational landscape of cancer.,"Nature,vol.518,no.7539,pp.360-364,Feb.2015.
S.El Messaoudi,F.Mouliere,S.Du Manoir,C.Bascoul-Mollevi,B.Gillet,M.Nouaille,C.Fiess,E.Crapez,F.Bibeau,C.Theillet,T.Mazard,D.Pezet,M.Mathonnet,M.Ychou,and A.R.Thierry,"Circulating DNA as a Strong Multimarker PrognosticTool for Metastatic Colorectal Cancer Patient Management Care.,"Clin CancerRes,vol.22,no.12,pp.3067-3077,Jun.2016.
S.Garrigou,G.Perkins,F.Garlan,C.Normand,A.Didelot,D.Le Corre,S.Peyvandi,C.Mulot,R.Niarra,P.Aucouturier,G.Chatellier,P.Nizard,K.Perez-Toralla,E.Zonta,C.Charpy,A.Pujals,C.Barau,O.Bouche,J.-F.Emile,D.Pezet,F.Bibeau,J.B.Hutchison,D.R.Link,A.Zaanan,P.Laurent-Puig,I.Sobhani,andV.Taly,"A Study of Hypermethylated Circulating Tumor DNA as a UniversalColorectal Cancer Biomarker.,"Clin Chem,vol.62,no.8,pp.1129-1139,Aug.2016.
S.Jahr,H.Hentze,S.Englisch,D.Hardt,F.O.Fackelmayer,R.D.Hesch,andR.Knippers,"DNA fragments in the blood plasma of cancer patients:quantitations and evidence for their origin from apoptotic and necroticcells.,"Cancer Research,vol.61,no.4,pp.1659-1665,Feb.2001.
Y.Li,X.-H.Fu,J.-Q.Yuan,Z.-Y.Yang,C.Mao,X.-M.Dong,J.-L.Tang,and S.-Y.Wang,"Colorectal cancer:using blood samples and tumor tissue to detect K-ras mutations.,"Expert Rev Anticancer Ther,vol.15,no.6,pp.715-725,Jun.2015.
序列表
<110> 临床基因组学
<120> 甲基化分析方法
<130> 526382PCT
<150> AU2017903772
<151> 2017-09-15
<160> 116
<170> PatentIn version 3.5
<210> 1
<211> 159
<212> DNA
<213> 智人
<400> 1
cgcgcgagcc gggggactcg gcgacggggc ggggacggga cgacgcaccc tctccgtgtc 60
ccgctctgcg cccttctgcg cgccccgctc cctgtaccgg agcagcgatc cgggaggcgg 120
ccgagaggtg cgcgcggggc cgagccggct gcggggcag 159
<210> 2
<211> 159
<212> DNA
<213> 智人
<400> 2
ctgccccgca gccggctcgg ccccgcgcgc acctctcggc cgcctcccgg atcgctgctc 60
cggtacaggg agcggggcgc gcagaagggc gcagagcggg acacggagag ggtgcgtcgt 120
cccgtccccg ccccgtcgcc gagtcccccg gctcgcgcg 159
<210> 3
<211> 159
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 3
cgcgcgagtc gggggattcg gcgacggggc ggggacggga cgacgtattt ttttcgtgtt 60
tcgttttgcg tttttttgcg cgtttcgttt tttgtatcgg agtagcgatt cgggaggcgg 120
tcgagaggtg cgcgcggggt cgagtcggtt gcggggtag 159
<210> 4
<211> 159
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 4
ctaccccgca accgactcga ccccgcgcgc acctctcgac cgcctcccga atcgctactc 60
cgatacaaaa aacgaaacgc gcaaaaaaac gcaaaacgaa acacgaaaaa aatacgtcgt 120
cccgtccccg ccccgtcgcc gaatcccccg actcgcgcg 159
<210> 5
<211> 159
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 5
tgtgtgagtt gggggatttg gtgatggggt ggggatggga tgatgtattt tttttgtgtt 60
ttgttttgtg tttttttgtg tgttttgttt tttgtattgg agtagtgatt tgggaggtgg 120
ttgagaggtg tgtgtggggt tgagttggtt gtggggtag 159
<210> 6
<211> 159
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 6
ctaccccaca accaactcaa ccccacacac acctctcaac cacctcccaa atcactactc 60
caatacaaaa aacaaaacac acaaaaaaac acaaaacaaa acacaaaaaa aatacatcat 120
cccatcccca ccccatcacc aaatccccca actcacaca 159
<210> 7
<211> 159
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 7
cgcgcgaacc gaaaaactcg acgacgaaac gaaaacgaaa cgacgcaccc tctccgtatc 60
ccgctctacg cccttctacg cgccccgctc cctataccga aacaacgatc cgaaaaacga 120
ccgaaaaata cgcgcgaaac cgaaccgact acgaaacaa 159
<210> 8
<211> 159
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 8
ttgtttcgta gtcggttcgg tttcgcgcgt atttttcggt cgtttttcgg atcgttgttt 60
cggtataggg agcggggcgc gtagaagggc gtagagcggg atacggagag ggtgcgtcgt 120
ttcgttttcg tttcgtcgtc gagtttttcg gttcgcgcg 159
<210> 9
<211> 159
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 9
cacacaaacc aaaaaactca acaacaaaac aaaaacaaaa caacacaccc tctccatatc 60
ccactctaca cccttctaca caccccactc cctataccaa aacaacaatc caaaaaacaa 120
ccaaaaaata cacacaaaac caaaccaact acaaaacaa 159
<210> 10
<211> 159
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 10
ttgttttgta gttggtttgg ttttgtgtgt attttttggt tgttttttgg attgttgttt 60
tggtataggg agtggggtgt gtagaagggt gtagagtggg atatggagag ggtgtgttgt 120
tttgtttttg ttttgttgtt gagttttttg gtttgtgtg 159
<210> 11
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 11
gacgacgtat ttttttcgtg tttc 24
<210> 12
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 12
gcgcacctct cgaccg 16
<210> 13
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<220>
<221> Y
<222> (8)..(8)
<223> Y = T or C
<220>
<221> Y
<222> (16)..(16)
<223> Y = T or C
<220>
<221> Y
<222> (21)..(21)
<223> Y = T or C
<400> 13
tttgtatygg agtagygatt ygggagg 27
<210> 14
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 14
tttgtatcgg agtagcgatt cgggagg 27
<210> 15
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 15
tttgtatcgg agtagcgatt tgggagg 27
<210> 16
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 16
tttgtatcgg agtagtgatt cgggagg 27
<210> 17
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 17
tttgtattgg agtagcgatt cgggagg 27
<210> 18
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 18
tttgtatcgg agtagtgatt tgggagg 27
<210> 19
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 19
tttgtattgg agtagcgatt tgggagg 27
<210> 20
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 20
tttgtattgg agtagtgatt cgggagg 27
<210> 21
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 21
tttgtattgg agtagtgatt tgggagg 27
<210> 22
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 22
ttgtttcgta gtcggttcgg tttcg 25
<210> 23
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 23
aacgacgcac cctctccgta tccc 24
<210> 24
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<220>
<221> Y
<222> (6)..(6)
<223> Y = T or C
<220>
<221> Y
<222> (11)..(11)
<223> Y = T or C
<220>
<221> Y
<222> (19)..(19)
<223> Y = T or C
<400> 24
tttttyggat ygttgtttyg gtatagg 27
<210> 25
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 25
tttttcggat cgttgtttcg gtatagg 27
<210> 26
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 26
tttttcggat cgttgttttg gtatagg 27
<210> 27
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 27
tttttcggat tgttgtttcg gtatagg 27
<210> 28
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 28
ttttttggat cgttgtttcg gtatagg 27
<210> 29
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 29
tttttcggat tgttgttttg gtatagg 27
<210> 30
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 30
ttttttggat tgttgtttcg gtatagg 27
<210> 31
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 31
ttttttggat cgttgttttg gtatagg 27
<210> 32
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 32
ttttttggat tgttgttttg gtatagg 27
<210> 33
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 33
cggtcgtttt tcggatcgtt gtttcgg 27
<210> 34
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<220>
<221> Y
<222> (1)..(1)
<223> Y = T or C
<220>
<221> Y
<222> (3)..(3)
<223> Y = T or C
<220>
<221> Y
<222> (13)..(13)
<223> Y = T or C
<220>
<221> Y
<222> (20)..(20)
<223> Y = T or C
<400> 34
ygygtagaag ggygtagagy g 21
<210> 35
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 35
cgcgtagaag ggcgtagagc g 21
<210> 36
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 36
cgcgtagaag ggcgtagagt g 21
<210> 37
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 37
cgcgtagaag ggtgtagagt g 21
<210> 38
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 38
cgtgtagaag ggtgtagagt g 21
<210> 39
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 39
tgtgtagaag ggtgtagagt g 21
<210> 40
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 40
tgcgtagaag ggcgtagagc g 21
<210> 41
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 41
cgtgtagaag ggcgtagagc g 21
<210> 42
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 42
cgcgtagaag ggtgtagagc g 21
<210> 43
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 43
tgtgtagaag ggcgtagagc g 21
<210> 44
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 44
tgcgtagaag ggtgtagagc g 21
<210> 45
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 45
tgcgtagaag ggcgtagagt g 21
<210> 46
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 46
tgtgtagaag ggtgtagagc g 21
<210> 47
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 47
tgtgtagaag ggcgtagagt g 21
<210> 48
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 48
tgcgtagaag ggtgtagagt g 21
<210> 49
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 49
cgtgtagaag ggcgtagagt g 21
<210> 50
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 50
cgtgtagaag ggtgtagagc g 21
<210> 51
<211> 107
<212> DNA
<213> 智人
<400> 51
cagtgcccga ggcggcggcg agtacacgtg gcgggctgga ttgcagaccg gccctctcgc 60
ggcggagact cgcgacctag cggattgcat cagcaggaag acactaa 107
<210> 52
<211> 107
<212> DNA
<213> 智人
<400> 52
ttagtgtctt cctgctgatg caatccgcta ggtcgcgagt ctccgccgcg agagggccgg 60
tctgcaatcc agcccgccac gtgtactcgc cgccgcctcg ggcactg 107
<210> 53
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 53
tagtgttcga ggcggcggcg agtatacgtg gcgggttgga ttgtagatcg gttttttcgc 60
ggcggagatt cgcgatttag cggattgtat tagtaggaag atattaa 107
<210> 54
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 54
ttaatatctt cctactaata caatccgcta aatcgcgaat ctccgccacg aaaaaaccga 60
tctacaatcc aacccgccac gtatactcgc cgccgcctcg aacacta 107
<210> 55
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 55
tagtgtttga ggtggtggtg agtatatgtg gtgggttgga ttgtagattg gtttttttgt 60
ggtggagatt tgtgatttag tggattgtat tagtaggaag atattaa 107
<210> 56
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 56
ttaatatctt cctactaata caatccacta aatcacaaat ctccaccaca aaaaaaccaa 60
tctacaatcc aacccaccac atatactcac caccacctca aacacta 107
<210> 57
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 57
caatacccga aacgacgacg aatacacgta acgaactaaa ttacaaaccg accctctcgc 60
gacgaaaact cgcgacctaa cgaattacat caacaaaaaa acactaa 107
<210> 58
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 58
ttagtgtttt tttgttgatg taattcgtta ggtcgcgagt tttcgtcgcg agagggtcgg 60
tttgtaattt agttcgttac gtgtattcgt cgtcgtttcg ggtattg 107
<210> 59
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 59
caatacccaa aacaacaaca aatacacata acaaactaaa ttacaaacca accctctcac 60
aacaaaaact cacaacctaa caaattacat caacaaaaaa acactaa 107
<210> 60
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 60
ttagtgtttt tttgttgatg taatttgtta ggttgtgagt ttttgttgtg agagggttgg 60
tttgtaattt agtttgttat gtgtatttgt tgttgttttg ggtattg 107
<210> 61
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 61
tagtgttcga ggcggcggcg agtatacg 28
<210> 62
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 62
atcttcctac taatacaatc cgctaaatc 29
<210> 63
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 63
atcggttttt tcgcggcgga 20
<210> 64
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 64
gtttttttgt tgatgtaatt cgttaggtc 29
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 65
caatacccga aacgacgacg 20
<210> 66
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 66
ttcgtcgcga gagggtcggt t 21
<210> 67
<211> 134
<212> DNA
<213> 智人
<400> 67
ctcagccaat gggacctgct cctcccttga aggttgcaga ggccacagcc tggtgggaaa 60
gatgaccacc acccagcaca cagtggcaga cacaggttca cagtccagaa gacttgctga 120
gcctcctcca tcac 134
<210> 68
<211> 134
<212> DNA
<213> 智人
<400> 68
gtgatggagg aggctcagca agtcttctgg actgtgaacc tgtgtctgcc actgtgtgct 60
gggtggtggt catctttccc accaggctgt ggcctctgca accttcaagg gaggagcagg 120
tcccattggc tgag 134
<210> 69
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 69
ggaggaggct cagcaagtc 19
<210> 70
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 70
ctcagccaat gggacctg 18
<210> 71
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 71
acctgtgtct gccactgtgt gct 23
<210> 72
<211> 89
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 72
caaaataaaa tacaaaacaa acctaatccc caaacaaaac ctatattacc actaaacctc 60
cattcaacta accaaaaaac aaaaactcc 89
<210> 73
<211> 89
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 73
ggagtttttg ttttttggtt agttgaatgg aggtttagtg gtaatatagg ttttgtttgg 60
ggattaggtt tgttttgtat tttattttg 89
<210> 74
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 74
ggagtttttg ttttttggtt agttg 25
<210> 75
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 75
caaaataaaa tacaaaacaa acctaatcc 29
<210> 76
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 76
atggaggttt agtggtaata taggttttgt ttgg 34
<210> 77
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 77
cgcgtagaag ggcgtagagc 20
<210> 78
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 78
gcgcgaaccg aaaaactcga c 21
<210> 79
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<220>
<221> Y
<222> (3)..(3)
<223> Y = T or C
<220>
<221> Y
<222> (6)..(6)
<223> Y = T or C
<220>
<221> Y
<222> (17)..(17)
<223> Y = T or C
<220>
<221> Y
<222> (24)..(24)
<223> Y = T or C
<400> 79
aaygaygcac cctctcygta tccy 24
<210> 80
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 80
aacgacgcac cctctccgta tcct 24
<210> 81
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 81
aatgacgcac cctctccgta tccc 24
<210> 82
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 82
aacgatgcac cctctccgta tccc 24
<210> 83
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 83
aacgacgcac cctctctgta tccc 24
<210> 84
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 84
aatgatgcac cctctccgta tccc 24
<210> 85
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 85
aatgacgcac cctctctgta tccc 24
<210> 86
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 86
aatgacgcac cctctccgta tcct 24
<210> 87
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 87
aacgatgcac cctctctgta tccc 24
<210> 88
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 88
aacgatgcac cctctccgta tcct 24
<210> 89
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 89
aacgacgcac cctctctgta tcct 24
<210> 90
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 90
aatgatgcac cctctctgta tccc 24
<210> 91
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 91
aatgacgcac cctctctgta tcct 24
<210> 92
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 92
aacgatgcac cctctctgta tcct 24
<210> 93
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 93
aatgatgcac cctctctgta tcct 24
<210> 94
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 94
aacgacgcac cctctccgta tccc 24
<210> 95
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 95
aatgatgcac cctctccgta tcct 24
<210> 96
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 96
tagtgttcga ggcggcggcg agtat 25
<210> 97
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 97
ttagtgtttt tttgttgatg taattcg 27
<210> 98
<211> 126
<212> DNA
<213> 智人
<400> 98
cggcgcgcgg agggtcgcca agggcgcggg aaccccaccc cggccgcggc agcccccagc 60
cttcacgccg gccctgaggc tcgcccgccc ggccggcccc ggctctcggc ttgcaaagtc 120
cctctc 126
<210> 99
<211> 126
<212> DNA
<213> 智人
<400> 99
gagagggact ttgcaagccg agagccgggg ccggccgggc gggcgagcct cagggccggc 60
gtgaaggctg ggggctgccg cggccggggt ggggttcccg cgcccttggc gaccctccgc 120
gcgccg 126
<210> 100
<211> 126
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 100
cggcgcgcgg agggtcgtta agggcgcggg aattttattt cggtcgcggt agtttttagt 60
ttttacgtcg gttttgaggt tcgttcgttc ggtcggtttc ggttttcggt ttgtaaagtt 120
tttttt 126
<210> 101
<211> 126
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 101
aaaaaaaact ttacaaaccg aaaaccgaaa ccgaccgaac gaacgaacct caaaaccgac 60
gtaaaaacta aaaactaccg cgaccgaaat aaaattcccg cgcccttaac gaccctccgc 120
gcgccg 126
<210> 102
<211> 126
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 102
tggtgtgtgg agggttgtta agggtgtggg aattttattt tggttgtggt agtttttagt 60
ttttatgttg gttttgaggt ttgtttgttt ggttggtttt ggtttttggt ttgtaaagtt 120
tttttt 126
<210> 103
<211> 126
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 103
aaaaaaaact ttacaaacca aaaaccaaaa ccaaccaaac aaacaaacct caaaaccaac 60
ataaaaacta aaaactacca caaccaaaat aaaattccca cacccttaac aaccctccac 120
acacca 126
<210> 104
<211> 126
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 104
cgacgcgcga aaaatcgcca aaaacgcgaa aaccccaccc cgaccgcgac aacccccaac 60
cttcacgccg accctaaaac tcgcccgccc gaccgacccc gactctcgac ttacaaaatc 120
cctctc 126
<210> 105
<211> 126
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐序列
<400> 105
gagagggatt ttgtaagtcg agagtcgggg tcggtcgggc gggcgagttt tagggtcggc 60
gtgaaggttg ggggttgtcg cggtcggggt ggggttttcg cgtttttggc gatttttcgc 120
gcgtcg 126
<210> 106
<211> 126
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 106
caacacacaa aaaatcacca aaaacacaaa aaccccaccc caaccacaac aacccccaac 60
cttcacacca accctaaaac tcacccaccc aaccaacccc aactctcaac ttacaaaatc 120
cctctc 126
<210> 107
<211> 126
<212> DNA
<213> 人工序列
<220>
<223> 亚硫酸氢盐转化序列
<400> 107
gagagggatt ttgtaagttg agagttgggg ttggttgggt gggtgagttt tagggttggt 60
gtgaaggttg ggggttgttg tggttggggt ggggtttttg tgtttttggt gattttttgt 120
gtgttg 126
<210> 108
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 108
ggcgcgggaa ttttatttc 19
<210> 109
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 109
aaaccgaccg aacgaacg 18
<210> 110
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 110
aaaaccgacg taaaaactaa aaactaccgc ga 32
<210> 111
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 111
taagtcgaga gtcggggtcg gtc 23
<210> 112
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 112
cgacgcgcga aaaatc 16
<210> 113
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 113
ccaaccttca cgccgaccct aaaactcg 28
<210> 114
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 114
gagagtcggg gtcggtc 17
<210> 115
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 115
ccttcacgcc gaccctaaaa ctcg 24
<210> 116
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 116
gagagggatt ttgtaagtcg agagtc 26
Claims (64)
1.一种筛查目标DNA区域甲基化的方法,所述方法包括:
(i)将DNA样本与修饰未甲基化胞嘧啶残基的试剂接触,其中所述样本包括所述目标DNA区域的靶链和相反链;
(ii)将步骤(i)的所述DNA样本与以下物质接触:
a)第一组正向和反向引物,其用于扩增所述目标DNA区域的所述修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组正向和反向引物,其用于扩增所述目标DNA区域的所述修饰相反链的一种或多种完全或部分甲基化形式;以及
c)如果步骤(a)和(b)的所述引物是甲基化特异性的,则任选一种或多种针对所述靶链和相反链中的每一条的探针,或者如果步骤(a)和(b)的所述引物不是甲基化特异性的,则任选一种或多种针对所述靶链和相反链的甲基化特异性探针,其中所述探针包含检测手段;
(iii)扩增步骤(ii)的所述DNA样本,其中如果使用步骤(ii)(c)的一种或多种所述探针,所述引物沿所述基因的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出。
2.一种诊断或监测患者病症的方法,所述病症的特征在于目标DNA区域甲基化的调节,所述方法包括:
(i)将DNA样本与修饰未甲基化胞嘧啶残基的试剂接触,其中所述样本包括所述目标DNA区域的靶链和相反链;
(ii)将步骤(i)的所述DNA样本与以下物质接触:
a)第一组正向和反向引物,其用于扩增所述目标DNA区域的所述修饰靶链的一种或多种完全或部分甲基化形式;
b)第二组正向和反向引物,其用于扩增所述目标DNA区域的所述修饰相反链的一种或多种完全或部分甲基化形式;以及
c)如果步骤(a)和(b)的所述引物是甲基化特异性的,则任选一种或多种针对所述靶链和相反链中的每一条的探针,或者如果步骤(a)和(b)的所述引物不是甲基化特异性的,则任选一种或多种针对所述靶链和相反链的甲基化特异性探针,其中所述探针包含检测手段;
(iii)扩增步骤(ii)的所述DNA样本,其中如果使用步骤(ii)(c)的一种或多种所述探针,所述引物沿所述基因的延伸影响所述杂交探针的检测;以及
(iv)定性或定量分析步骤(iii)的检测输出。
3.根据权利要求1或2所述的方法,其中所述DNA样本包含所述目标DNA区域的低拷贝数。
4.根据权利要求1至3中任一项所述的方法,其中分析所述目标DNA区域内一个或多个CpG位点的甲基化。
5.根据权利要求3所述的方法,其中所述病症是肿瘤疾病。
6.根据权利要求1至5中任一项所述的方法,其中所述目标核酸靶是DNA基因或基因区域。
7.根据权利要求1至6中任一项所述的方法,其中所述DNA是基因组DNA。
8.根据权利要求6或7所述的方法,其中所述基因区是启动子区。
9.根据权利要求6至8中任一项所述的方法,其中所述基因是哺乳动物基因。
10.根据权利要求6至9中任一项所述的方法,其中所述基因是肿瘤标志物,例如大肠肿瘤标志物,特别是腺瘤或腺癌的标志物。
12.根据权利要求10所述的方法,其中所述大肠肿瘤标志物是基因BCAT1、IKZF1、IRF4、GRASP或CAHM中的一个或多个,或者是所述转录起始位点上游5kb。
13.根据权利要求10所述的方法,其中所述大肠肿瘤标志物选自(i)BCAT1和IKZF1;(ii)BCAT1、IKZF1和IRF4;(iii)BCAT1、IKZF1和GRASP;(iv)BCAT1、IKZF1和CAHM;(iv)BCAT1、IKZF1、IRF4和GRASP;(v)BCAT1、IKZF1、IRF4和CAHM或(vi)BCAT1、IKZF1、IRF4、GRASP和CAHM,或这些基因转录起始位点上游5kb。
14.根据权利要求1至13中任一项所述的方法,其中所述试剂将未甲基化的胞嘧啶残基修饰为尿嘧啶。
15.根据权利要求14所述的方法,其中所述试剂是亚硫酸氢盐。
16.根据权利要求15所述的方法,其中所述亚硫酸氢盐是亚硫酸氢钠或焦亚硫酸钠。
17.根据权利要求1至16中任一项所述的方法,其中所述方法使用甲基化特异性引物,但不使用探针。
18.根据权利要求1至16中任一项所述的方法,其中所述方法使用甲基化特异性引物和非甲基化特异性探针。
19.根据权利要求1至16中任一项所述的方法,其中所述方法使用甲基化特异性引物和甲基化特异性探针。
20.根据权利要求1至16中任一项所述的方法,其中所述方法使用非甲基化特异性引物和甲基化特异性探针。
21.根据权利要求1至16和18至20中任一项所述的方法,其中所述探针是水解探针。
22.根据权利要求1至21中任一项所述的方法,其中所述探针共同杂交到所述目标DNA区域的所有完全和部分甲基化模式。
23.根据权利要求1至22中任一项所述的方法,其中所述基因是IKZF1,并且
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:135'-TTTGTATYGGAGTAGYGATTYGGGAGG-3'
SEQ ID NO:14 5'-TTTGTATCGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:15 5'-TTTGTATCGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:16 5'-TTTGTATCGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:17 5'-TTTGTATTGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:18 5'-TTTGTATCGGAGTAGTGATTTGGGAGG-3'
SEQ ID NO:19 5'-TTTGTATTGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:20 5'-TTTGTATTGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:21 5'-TTTGTATTGGAGTAGTGATTTGGGAGG-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:77(正向引物):Chr7(-);50,304,295-50,304,314
5'-CGCGTAGAAGGGCGTAGAGC-3'
SEQ ID NO:78(反向引物):Chr7(+);50,304,234-50,304,254
5'-GCGCGAACCGAAAAACTCGAC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:79 5'-AAYGAYGCACCCTCTCYGTATCCY-3'
SEQ ID NO:80 5'-AACGACGCACCCTCTCCGTATCCT-3'
SEQ ID NO:81 5'-AATGACGCACCCTCTCCGTATCCC-3'
SEQ ID NO:82 5'-AACGATGCACCCTCTCCGTATCCC-3'
SEQ ID NO:83 5'-AACGACGCACCCTCTCTGTATCCC-3'
SEQ ID NO:84 5'-AATGATGCACCCTCTCCGTATCCC-3'
SEQ ID NO:85 5'-AATGACGCACCCTCTCTGTATCCC-3'
SEQ ID NO:86 5'-AATGACGCACCCTCTCCGTATCCT-3'
SEQ ID NO:87 5'-AACGATGCACCCTCTCTGTATCCC-3'
SEQ ID NO:88 5'-AACGATGCACCCTCTCCGTATCCT-3'
SEQ ID NO:89 5'-AACGACGACCCTCTCTGTATCCT-3'
SEQ ID NO:90 5'-AATGATGCACCCTCTCTGTATCCC-3'
SEQ ID NO:91 5'-AATGACGCACCCTCTCTGTATCCT-3'
SEQ ID NO:92 5'-AACGATGCACCCTCTCTGTATCCT-3'
SEQ ID NO:93 5'-AATGATGCACCCTCTCTGTATCCT-3'
SEQ ID NO:94 5'-AACGACGCACCCTCTCCGTATCCC-3'
SEQ ID NO:95 5'-AATGATGCACCCTCTCCGTATCCT-3'
或者基本相似的序列。
24.根据权利要求1至22中任一项所述的方法,其中所述基因是IKZF1,并且
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:13 5'-TTTGTATYGGAGTAGYGATTYGGGAGG-3'
SEQ ID NO:14 5'-TTTGTATCGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:15 5'-TTTGTATCGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:16 5'-TTTGTATCGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:17 5'-TTTGTATTGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:18 5'-TTTGTATCGGAGTAGTGATTTGGGAGG-3'
SEQ ID NO:19 5'-TTTGTATTGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:20 5'-TTTGTATTGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:21 5'-TTTGTATTGGAGTAGTGATTTGGGAGG-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:22(正向引物):Chr7(-);50,304,366-50,304,391
5'-TTGTTTCGTAGTCGGTTCGGTTTCG 3'
SEQ ID NO:23(反向引物):Chr7(+);50,304,271-50,304,294
5'-AACGACGCACCCTCTCCGTATCCC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:24 5'-TTTTTYGGATYGTTGTTTYGGTATAGG-3'
SEQ ID NO:25 5'-TTTTTCGGATCGTTGTTTCGGTATAGG-3'
SEQ ID NO:26 5'-TTTTTCGGATCGTTGTTTTGGTATAGG-3'
SEQ ID NO:27 5'-TTTTTCGGATTGTTGTTTCGGTATAGG-3'
SEQ ID NO:28 5'-TTTTTTGGATCGTTGTTTCGGTATAGG-3'
SEQ ID NO:29 5'-TTTTTCGGATTGTTGTTTTGGTATAGG-3'
SEQ ID NO:30 5'-TTTTTTGGATTGTTGTTTCGGTATAGG-3'
SEQ ID NO:31 5'-TTTTTTGGATCGTTGTTTTGGTATAGG-3'
SEQ ID NO:32 5'-TTTTTTGGATTGTTGTTTTGGTATAGG-3'
或者基本相似的序列。
25.根据权利要求1至22中任一项所述的方法,其中所述基因是IKZF1,并且
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'-GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:13 5'-TTTGTATYGGAGTAGYGATTYGGGAGG-3'
SEQ ID NO:14 5'-TTTGTATCGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:15 5'-TTTGTATCGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:16 5'-TTTGTATCGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:17 5'-TTTGTATTGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:18 5'-TTTGTATCGGAGTAGTGATTTGGGAGG-3'
SEQ ID NO:19 5'-TTTGTATTGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:20 5'-TTTGTATTGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:21 5'-TTTGTATTGGAGTAGTGATTTGGGAGG-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:33(正向引物):Chr7(-);50,304,329-50,304,355
5'-CGGTCGTTTTTCGGATCGTTGTTTCGG-3'
SEQ ID NO:23(反向引物):Chr7(+);50,304,271-50,304,294
5'-AACGACGCACCCTCTCCGTATCCC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:34 5'-YGYGTAGAAGGGYGTAGAGYG-3'
SEQ ID NO:35 5'-CGCGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:36 5'-CGCGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:37 5'-CGCGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:38 5'-CGTGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:39 5'-TGTGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:40 5'-TGCGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:41 5'-CGTGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:42 5'-CGCGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:43 5'-TGTGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:44 5'-TGCGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:45 5'-TGCGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:46 5'-TGTGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:47 5'-TGTGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:48 5'-TGCGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:49 5'-CGTGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:50 5'-CGTGTAGAAGGGTGTAGAGCG-3'
或者基本相似的序列。
26.根据权利要求1至22中任一项所述的方法,其中所述基因是BCAT1,并且
(i)所述第一组引物包括以下序列:
SEQ ID NO:97(正向引物):chrl2(+);24,949,138-24,949,164
5'-TTAGTGTTTTTTTGTTGATGTAATTCG-3'
SEQ ID NO:65(反向引物):chrl2(-);24,949,058-24,949,074
5'-CAATACCCGAAACGACGACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:66 5'-TTCGTCGCGAGAGGGTCGGTT-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:96(正向引物):chrl2(-);24,949,058-24,949,082
5'-TAGTGTTCGAGGCGGCGGCGAGTAT-3'
SEQ ID NO:62(反向引物):chrl2(+);24,949,140-24,949,159
5'-ATCTTCCTACTAATACAATCCGCTAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括以下序列:
SEQ ID NO:63 5'-GATCGGTTTTTTCGCGGCGGA-3'
或者基本相似的序列。
27.根据权利要求1至22中任一项所述的方法,其中所述基因是BCAT1,并且
(i)所述第一组引物包括以下序列:
SEQ ID NO:64(正向引物):chrl2(+);24,949,131-24,949,159
5'-GTTTTTTTGTTGATGTAATTCGTTAGGTC-3'
SEQ ID NO:65(反向引物):chrl2(-);24,949,058-24,949,074
5'-CAATACCCGAAACGACGACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:66 5'-TTCGTCGCGAGAGGGTCGGTT-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:61(正向引物):chrl2(-);24,949,058-24,949,085
5'-T AGTGTTCGAGGCGGCGGCGAGTATACG-3'
SEQ ID NO:62(反向引物):chrl2(+);24,949,140-24,949,159
5'-ATCTTCCTACTAATACAATCCGCTAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括以下序列:
SEQ ID NO:63 5'-GATCGGTTTTTTCGCGGCGGA-3'
或者基本相似的序列。
28.根据权利要求1至22中任一项所述的方法,其中所述基因是IRF4,并且
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:111(正向引物):Chr6(-):391,614-391,636
5'-TAAGTCGAGAGTCGGGGTCGGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
29.根据权利要求1至22中任一项所述的方法,其中所述基因是IRF4,并且
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:114(正向引物):Chr6(-):391,614-391,630
5'-GAGAGTCGGGGTCGGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
30.根据权利要求1至22中任一项所述的方法,其中所述基因是IRF4,并且
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:116(正向引物):Chr6(-):391,624-391,649
5'-GAGAGGGATTTTGTAAGTCGAGAGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
31.根据权利要求1-30中任一项所述的方法,其中分析两个或多个基因区域的甲基化。
32.根据权利要求1-31中任一项所述的方法,其中所述DNA样本从血液、血浆、血清、唾液、粪便、腹水或尿液中分离。
33.根据权利要求1-32中任一项所述的方法,其中所述DNA样本是循环无细胞DNA或循环肿瘤DNA。
34.根据权利要求1-33中任一项所述的方法,其中所述扩增是PCR、逆转录酶PCR、qPCR、等温扩增或信号扩增。
35.根据权利要求2所述的方法,其中所述病症是肿瘤疾病。
36.根据权利要求35所述的方法,其中所述肿瘤疾病是恶性的。
37.根据权利要求35所述的方法,其中所述病症是腺瘤或腺癌。
38.根据权利要求37所述的方法,其中所述腺癌是结肠直肠腺癌。
39.根据权利要求3-38中任一项所述的方法,其中所述低拷贝数是少于100个测试的靶DNA/样本、少于95个测试的靶DNA/样本、少于90个测试的靶DNA/样本、少于85个测试的靶DNA/样本、少于80个测试的靶DNA/样本、少于75个测试的靶DNA/样本、少于70个测试的靶DNA/样本、少于65个测试的靶DNA/样本、少于60个测试的靶DNA/样本、少于55个测试的靶DNA/样本、少于50个测试的靶DNA/样本、少于45个测试的靶DNA/样本、少于40个测试的靶DNA/样本、少于35个测试的靶DNA/样本、少于30个测试的靶DNA/样本、少于25个测试的靶DNA/样本、少于20个测试的靶DNA/样本、少于15个测试的靶DNA/样本、少于10个测试的靶DNA/样本或少于5个测试的靶DNA/样本。
40.根据权利要求3-38中任一项所述的方法,其中所述低拷贝数是少于50个测试的靶DNA/样本、少于40个测试的靶DNA/样本、少于30个测试的靶DNA/样本或少于20个测试的靶DNA/样本。
41.根据权利要求3-38中任一项所述的方法,其中所述低拷贝数是少于10个测试的靶DNA/样本或少于5个测试的靶DNA/样本。
42.根据权利要求3-38中任一项所述的方法,其中所述扩增是定量PCR,并且所述低拷贝数是LOD。
43.根据权利要求1-42中任一项所述的方法,其中步骤(iv)的结果显示假阴性结果的发生率降低。
44.根据权利要求1-43中任一项所述的方法,其中所述DNA是人类DNA。
45.根据权利要求1-44中任一项所述的方法,其中多个DNA区域是筛查的对象,但是至少一个所述DNA区域是使用仅扩增目标DNA区域的靶链的方法来筛查的。
46.一种用于筛查目标DNA区域甲基化的试剂盒,所述试剂盒包括:
a)第一组正向和反向引物,其用于扩增所述目标DNA区域的靶链的一种或多种完全或部分甲基化形式,所述引物用于杂交到已被未甲基化胞嘧啶试剂修饰的所述目标DNA区域的形式;
b)第二组正向和反向引物,其用于扩增所述目标DNA区域的修饰相反链的一种或多种完全或部分甲基化形式;以及
c)如果步骤(a)和(b)的所述引物是甲基化特异性的,则任选一种或多种针对所述靶链和相反链中的每一条的探针,或者如果步骤(a)和(b)的所述引物不是甲基化特异性的,则任选一种或多种针对所述靶链和相反链的甲基化特异性探针,其中所述探针包含检测手段;
48.根据权利要求47所述的试剂盒,其中所述基因是基因BCAT1、IKZF1、IRF4、GRASP或CAHM中的一个或多个,或者是所述转录起始位点上游5kb。
49.根据权利要求48所述的试剂盒,其中所述基因选自(i)BCAT1和IKZF1;(ii)BCAT1、IKZF1和IRF4;(iii)BCAT1、IKZF1和GRASP;(iv)BCAT1、IKZF1和CAHM;(iv)BCAT1、IKZF1、IRF4和GRASP;(v)BCAT1、IKZF1、IRF4和CAHM或(vi)BCAT1、IKZF1、IRF4、GRASP和CAHM或这些基因转录起始位点上游5kb。
50.根据权利要求46至49中任一项所述的试剂盒,其中所述试剂将未甲基化的胞嘧啶残基修饰为尿嘧啶,并且所述试剂可以是亚硫酸氢盐,例如亚硫酸氢钠或焦亚硫酸钠。
51.根据权利要求46至50中任一项所述的试剂盒,其中所述试剂盒包括甲基化特异性引物,但不包括探针。
52.根据权利要求46至50中任一项所述的试剂盒,其中所述试剂盒包括甲基化特异性引物和非甲基化特异性探针。
53.根据权利要求46至50中任一项所述的试剂盒,其中所述试剂盒包括甲基化特异性引物和甲基化特异性探针。
54.根据权利要求46至50中任一项所述的试剂盒,其中所述试剂盒包括非甲基化特异性引物和甲基化特异性探针。
55.根据权利要求46至54中任一项所述的试剂盒,其中所述探针是水解探针。
56.根据权利要求46至55中任一项所述的试剂盒,其中所述探针共同杂交到所述目标DNA区域的所有完全和部分甲基化模式。
57.根据权利要求47所述的试剂盒,其中所述基因是IKZF1,并且
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'-GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:13 5'-TTTGTATYGGAGTAGYGATTYGGGAGG-3'
SEQ ID NO:14 5'-TTTGTATCGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:15 5'-TTTGTATCGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:16 5'-TTTGTATCGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:17 5'-TTTGTATTGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:18 5'-TTTGTATCGGAGTAGTGATTTGGGAGG-3'
SEQ ID NO:19 5'-TTTGTATTGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:20 5'-TTTGTATTGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:21 5'-TTTGTATTGGAGTAGTGATTTGGGAGG-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:77(正向引物):Chr7(-);50,304,295-50,304,314
5'-CGCGTAGAAGGGCGTAGAGC-3'
SEQ ID NO:78(反向引物):Chr7(+);50,304,234-50,304,254
5'-GCGCGAACCGAAAAACTCGAC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:79 5'-AAYGAYGCACCCTCTCYGTATCCY-3'
SEQ ID NO:80 5'-AACGACGCACCCTCTCCGTATCCT-3'
SEQ ID NO:81 5'-AATGACGCACCCTCTCCGTATCCC-3'
SEQ ID NO:82 5'-AACGATGCACCCTCTCCGTATCCC-3'
SEQ ID NO:83 5'-AACGACGCACCCTCTCTGTATCCC-3'
SEQ ID NO:84 5'-AATGATGCACCCTCTCCGTATCCC-3'
SEQ ID NO:85 5'-AATGACGCACCCTCTCTGTATCCC-3'
SEQ ID NO:86 5'-AATGACGCACCCTCTCCGTATCCT-3'
SEQ ID NO:87 5'-AACGATGCACCCTCTCTGTATCCC-3'
SEQ ID NO:88 5'-AACGATGCACCCTCTCCGTATCCT-3'
SEQ ID NO:89 5'-AACGACGCACCCTCTCTGTATCCT-3'
SEQ ID NO:90 5'-AATGATGCACCCTCTCTGTATCCC-3'
SEQ ID NO:91 5'-AATGACGCACCCTCTCTGTATCCT-3'
SEQ ID NO:92 5'-AACGATGCACCCTCTCTGTATCCT-3'
SEQ ID NO:93 5'-AATGATGCACCCTCTCTGTATCCT-3'
SEQ ID NO:94 5'-AACGACGCACCCTCTCCGTATCCC-3'
SEQ ID NO:95 5'·-AATGATGCACCCTCTCCGTATCCT-3'
或者基本相似的序列。
58.根据权利要求47所述的试剂盒,其中所述基因是IKZF1,并且
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:13 5'-TTTGTATYGGAGTAGYGATTYGGGAGG-3'
SEQ ID NO:14 5'-TTTGTATCGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:15 5'-TTTGTATCGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:16 5'-TTTGTATCGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:17 5'-TTTGTATTGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:18 5'-TTTGTATCGGAGTAGTGATTTGGGAGG-3'
SEQ ID NO:19 5'-TTTGTATTGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:20 5'-TTTGTATTGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:21 5'-TTTGTATTGGAGTAGTGATTTGGGAGG-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:22(正向引物):Chr7(-);50,304,366-50,304,391
5'-TTGTTTCGT AGTCGGTTCGGTTTCG 3'
SEQ ID NO:23(反向引物):Chr7(+);50,304,271-50,304,294
5'-AACGACGCACCCTCTCCGTATCCC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:24 5'-TTTTTYGGATYGTTGTTTYGGTAT AGG-3'
SEQ ID NO:25 5'-TTTTTCGGATCGTTGTTTCGGTATAGG-3'
SEQ ID NO:26 5'-TTTTTCGGATCGTTGTTTTGGTATAGG-3'
SEQ ID NO:27 5'-TTTTTCGGATTGTTGTTTCGGTATAGG-3'
SEQ ID NO:28 5'-TTTTTTGGATCGTTGTTTCGGTATAGG-3'
SEQ ID NO:29 5'-TTTTTCGGATTGTTGTTTTGGTATAGG-3'
SEQ ID NO:30 5'-TTTTTTGGATTGTTGTTTCGGTATAGG-3'
SEQ ID NO:31 5'-TTTTTTGGATCGTTGTTTTGGTATAGG-3'
SEQ ID NO:32 5'-TTTTTTGGATTGTTGTTTTGGTATAGG-3'
或者基本相似的序列。
59.根据权利要求47所述的试剂盒,其中所述基因是IKZF1,并且
(i)所述第一组引物包括以下序列:
SEQ ID NO:11(正向引物):Chr7(+);50,304,271-50,304,294
5'-GACGACGTATTTTTTTCGTGTTTC-3'
SEQ ID NO:12(反向引物):Chr7(-);50,304,350-50,304,365
5'-GCGCACCTCTCGACCG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:13 5'-TTTGTATYGGAGTAGYGATTYGGGAGG-3'
SEQ ID NO:14 5'-TTTGTATCGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:15 5'-TTTGTATCGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:16 5'-TTTGTATCGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:17 5'-TTTGTATTGGAGTAGCGATTCGGGAGG-3'
SEQ ID NO:18 5'-TTTGTATCGGAGTAGTGATTTGGGAGG-3'
SEQ ID NO:19 5'-TTTGTATTGGAGTAGCGATTTGGGAGG-3'
SEQ ID NO:20 5'-TTTGTATTGGAGTAGTGATTCGGGAGG-3'
SEQ ID NO:21 5'-TTTGTATTCGAGTAGTGATTTGGGAGG-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:33(正向引物):Chr7(-);50,304,329-50,304,355
5'-CGGTCGTTTTTCGGATCGTTGTTTCGG-3'
SEQ ID NO:23(反向引物):Chr7(+);50,304,271-50,304,294
5'-AACGACGCACCCTCTCCGTATCCC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:34 5'-YGYGTAGAAGGGYGTAGAGYG-3'
SEQ ID NO:35 5'-CGCGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:36 5'-CGCGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:37 5'-CGCGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:38 5'-CGTGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:39 5'-TGTGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:40 5'-TGCGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:41 5'-CGTGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:42 5'-CGCGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:43 5'-TGTGTAGAAGGGCGTAGAGCG-3'
SEQ ID NO:44 5'-TGCGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:45 5'-TGCGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:46 5'-TGTGTAGAAGGGTGTAGAGCG-3'
SEQ ID NO:47 5'-TGTGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:48 5'-TGCGTAGAAGGGTGTAGAGTG-3'
SEQ ID NO:49 5'-CGTGTAGAAGGGCGTAGAGTG-3'
SEQ ID NO:50 5'-CGTGTAGAAGGGTGTAGAGCG-3'
或者基本相似的序列。
60.根据权利要求47所述的试剂盒,其中所述基因是BCAT1,并且
(i)所述第一组引物包括以下序列:
SEQ ID NO:97(正向引物):chrl2(+);24,949,138-24,949,164
5'-TTAGTGTTTTTTTGTTGATGTAATTCG-3'
SEQ ID NO:65(反向引物):chrl2(-);24,949,058-24,949,074
5'-CAATACCCGAAACGACGACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:66 5'-TTCGTCGCGAGAGGGTCGGTT-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:96(正向引物):chrl2(-);24,949,058-24,949,082
5'-TAGTGTTCGAGGCGGCGGCGAGTAT-3'
SEQ ID NO:62(反向引物):chrl2(+);24,949,140-24,949,159
5'-ATCTTCCTACTAATACAATCCGCTAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括以下序列:
SEQ ID NO:63 5'-GATCGGTTTTTTCGCGGCGGA-3'
或者基本相似的序列。
61.根据权利要求47所述的试剂盒,其中所述基因是BCAT1,并且
(i)所述第一组引物包括以下序列:
SEQ ID NO:64(正向引物):chrl2(+);24,949,131-24,949,159
5'-GTTTTTTTGTTGATGTAATTCGTTAGGTC-3'
SEQ ID NO:65(反向引物):chrl2(-);24,949,058-24,949,074
5'-CAATACCCGAAACGACGACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:66 5'-TTCGTCGCGAGAGGGTCGGTT-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:61(正向引物):chrl2(-);24,949,058-24,949,085
5'-T AGTGTTCGAGGCGGCGGCGAGTATACG-3'
SEQ ID NO:62(反向引物):chrl2(+);24,949,140-24,949,159
5'-ATCTTCCTACTAATACAATCCGCTAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括以下序列:
SEQ ID NO:63 5'-GATCGGTTTTTTCGCGGCGGA-3'
或者基本相似的序列。
62.根据权利要求47所述的试剂盒,其中所述基因是IRF4,并且
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:111(正向引物):Chr6(-):391,614-391,636
5'-TAAGTCGAGAGTCGGGGTCGGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
63.根据权利要求47所述的试剂盒,其中所述基因是IRF4,并且
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:114(正向引物):Chr6(-):391,614-391,630
5'-GAGAGTCGGGGTCGGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
64.根据权利要求47所述的试剂盒,其中所述基因是IRF4,并且
(i)所述第一组引物包括以下序列:
SEQ ID NO:108(正向引物):Chr6(+):391,546-391,564
5'-GGCGCGGGAATTTTATTTC-3'
SEQ ID NO:109(反向引物):Chr6(-):391,605-391,622
5'-AAACCGACCGAACGAACG-3'
或者基本相似的序列,并且针对所述第一组引物的扩增产物的探针包括以下序列:
SEQ ID NO:110 5'-AAAACCGACGTAAAAACTAAAAACTACCGCGA-3'
或者基本相似的序列;以及
(ii)所述第二组引物包括以下序列:
SEQ ID NO:116(正向引物):Chr6(-):391,624-391,649
5'-GAGAGGGATTTTGTAAGTCGAGAGTC-3'
SEQ ID NO:112(反向引物):Chr6(+):391,524-391,539
5'-CGACGCGCGAAAAATC-3'
或者基本相似的序列,并且针对所述第二组引物的扩增产物的探针包括一个或多个选自以下的序列:
SEQ ID NO:113 5'-CCAACCTTCACGCCGACCCTAAAACTCG-3'
SEQ ID NO:115 5'-CCTTCACGCCGACCCTAAAACTCG-3'
或者基本相似的序列。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AU2017903772 | 2017-09-15 | ||
AU2017903772A AU2017903772A0 (en) | 2017-09-15 | Method for methylation analysis | |
PCT/AU2018/051003 WO2019051554A1 (en) | 2017-09-15 | 2018-09-14 | PROCESS FOR ANALYZING METHYLATION |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111212918A true CN111212918A (zh) | 2020-05-29 |
Family
ID=65722259
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880060005.XA Pending CN111212918A (zh) | 2017-09-15 | 2018-09-14 | 甲基化分析方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20200283854A1 (zh) |
EP (1) | EP3682028A1 (zh) |
JP (1) | JP2020534820A (zh) |
CN (1) | CN111212918A (zh) |
AU (1) | AU2018333844A1 (zh) |
MX (1) | MX2020002787A (zh) |
WO (1) | WO2019051554A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113249407A (zh) * | 2021-06-02 | 2021-08-13 | 上海南方模式生物科技股份有限公司 | 一种用于同源重组的载体及其应用 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112159844B (zh) * | 2020-05-25 | 2022-05-03 | 浙江中创生物医药有限公司 | 结直肠癌dna甲基化的检测方法及试剂 |
CN112921103A (zh) * | 2021-03-25 | 2021-06-08 | 四川省食品药品检验检测院(四川省药品质量研究所、四川省医疗器械检测中心) | 定量分析肉制品中牛源性成分的引物组及其应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011135058A2 (en) * | 2010-04-30 | 2011-11-03 | Mdxhealth Sa | Methods for detecting epigenetic modifications |
CN105026580A (zh) * | 2013-03-15 | 2015-11-04 | 雅培分子公司 | 重亚硫酸盐转化的核苷酸序列的检测 |
CN105339507A (zh) * | 2013-02-21 | 2016-02-17 | 托马生物科学公司 | 用于核酸分析的方法、组合物和试剂盒 |
CN106687600A (zh) * | 2014-06-05 | 2017-05-17 | 临床基因组学私人有限公司 | 用于甲基化分析的方法 |
-
2018
- 2018-09-14 JP JP2020515071A patent/JP2020534820A/ja active Pending
- 2018-09-14 CN CN201880060005.XA patent/CN111212918A/zh active Pending
- 2018-09-14 US US16/645,749 patent/US20200283854A1/en not_active Abandoned
- 2018-09-14 WO PCT/AU2018/051003 patent/WO2019051554A1/en unknown
- 2018-09-14 AU AU2018333844A patent/AU2018333844A1/en not_active Abandoned
- 2018-09-14 EP EP18855223.6A patent/EP3682028A1/en not_active Withdrawn
- 2018-09-14 MX MX2020002787A patent/MX2020002787A/es unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011135058A2 (en) * | 2010-04-30 | 2011-11-03 | Mdxhealth Sa | Methods for detecting epigenetic modifications |
CN105339507A (zh) * | 2013-02-21 | 2016-02-17 | 托马生物科学公司 | 用于核酸分析的方法、组合物和试剂盒 |
CN105026580A (zh) * | 2013-03-15 | 2015-11-04 | 雅培分子公司 | 重亚硫酸盐转化的核苷酸序列的检测 |
CN106687600A (zh) * | 2014-06-05 | 2017-05-17 | 临床基因组学私人有限公司 | 用于甲基化分析的方法 |
Non-Patent Citations (2)
Title |
---|
DAVID S. SHAMES ET AL.: ""Methods for detecting DNA methylation in tumors: From bench to bedside"" * |
程全等: ""DNA甲基化与肺癌的研究进展"" * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113249407A (zh) * | 2021-06-02 | 2021-08-13 | 上海南方模式生物科技股份有限公司 | 一种用于同源重组的载体及其应用 |
Also Published As
Publication number | Publication date |
---|---|
WO2019051554A1 (en) | 2019-03-21 |
MX2020002787A (es) | 2020-07-22 |
JP2020534820A (ja) | 2020-12-03 |
EP3682028A1 (en) | 2020-07-22 |
US20200283854A1 (en) | 2020-09-10 |
AU2018333844A1 (en) | 2020-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106687600B (zh) | 用于甲基化分析的方法 | |
EP2250287B1 (en) | Detection and prognosis of lung cancer | |
JP5902843B2 (ja) | Igf2遺伝子の対立遺伝子特異的な発現を判定するための一塩基多型ならびに新規および公知の多型の組み合わせ | |
EP3524688B1 (en) | Multiple detection method of methylated dna | |
EP2885427B1 (en) | Colorectal cancer methylation marker | |
CN114096680A (zh) | 用于检测dna样品中的甲基化改变的方法和系统 | |
US10260102B2 (en) | Methods and compositions for detecting mutation in the human EZH2 gene | |
KR20210099044A (ko) | 폐 신생물 검출에서 메틸화된 dna, rna, 및 단백질의 특성화 | |
EP2699695A2 (en) | Prostate cancer markers | |
US20090042195A1 (en) | Methods and systems for screening for and diagnosing dna methylation associated abnormalities and sex chromosome aneuploidies | |
CN111212918A (zh) | 甲基化分析方法 | |
US20230193395A1 (en) | Methods and kits for screening colorectal neoplasm | |
US20180223367A1 (en) | Assays, methods and compositions for diagnosing cancer | |
AU2010213727A1 (en) | Combinations of polymorphisms for determining allele-specific expression of IGF2 | |
Class et al. | Patent application title: Detection and Prognosis of Cervical Cancer Inventors: Wim Van Criekinge (Sart-Tilman, BE) Valerie Deregowski (Sart-Tilman, BE) Luc Dehaspe (Sart-Tilman, BE) G. Bea A. Wisman (Groningen, NL) Ate Gj Van Der Zee (Groningen, NL) EMd Schuuring (Groningen, NL) Assignees: OncoMethylome Sciences SA |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200529 |
|
WD01 | Invention patent application deemed withdrawn after publication |