CN113046413A - 从血液特异性靶向捕获人类基因组和转录组区域的方法 - Google Patents
从血液特异性靶向捕获人类基因组和转录组区域的方法 Download PDFInfo
- Publication number
- CN113046413A CN113046413A CN202110270831.0A CN202110270831A CN113046413A CN 113046413 A CN113046413 A CN 113046413A CN 202110270831 A CN202110270831 A CN 202110270831A CN 113046413 A CN113046413 A CN 113046413A
- Authority
- CN
- China
- Prior art keywords
- target
- oligonucleotide
- nucleic acid
- circular
- oligonucleotide probe
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 453
- 210000004369 blood Anatomy 0.000 title abstract description 12
- 239000008280 blood Substances 0.000 title abstract description 12
- 241000282414 Homo sapiens Species 0.000 title abstract description 9
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 398
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 392
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 392
- 238000012163 sequencing technique Methods 0.000 claims abstract description 275
- 239000002773 nucleotide Substances 0.000 claims abstract description 259
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 238
- 108020004414 DNA Proteins 0.000 claims abstract description 62
- 238000006243 chemical reaction Methods 0.000 claims abstract description 16
- 108020005187 Oligonucleotide Probes Proteins 0.000 claims description 575
- 239000002751 oligonucleotide probe Substances 0.000 claims description 575
- 239000013615 primer Substances 0.000 claims description 431
- 230000000295 complement effect Effects 0.000 claims description 289
- 108091034117 Oligonucleotide Proteins 0.000 claims description 249
- 239000000523 sample Substances 0.000 claims description 247
- 239000007787 solid Substances 0.000 claims description 234
- 230000003321 amplification Effects 0.000 claims description 212
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 212
- 238000005096 rolling process Methods 0.000 claims description 151
- 230000000903 blocking effect Effects 0.000 claims description 145
- 230000008569 process Effects 0.000 claims description 139
- 230000000694 effects Effects 0.000 claims description 105
- 229910019142 PO4 Inorganic materials 0.000 claims description 67
- 239000010452 phosphate Substances 0.000 claims description 66
- 229920002477 rna polymer Polymers 0.000 claims description 66
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 46
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 claims description 42
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 34
- 239000003155 DNA primer Substances 0.000 claims description 33
- 102000053602 DNA Human genes 0.000 claims description 32
- 108091028664 Ribonucleotide Proteins 0.000 claims description 23
- 239000002336 ribonucleotide Substances 0.000 claims description 23
- 125000002652 ribonucleotide group Chemical group 0.000 claims description 23
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 20
- 239000011541 reaction mixture Substances 0.000 claims description 16
- 108010068698 spleen exonuclease Proteins 0.000 claims description 11
- 230000008878 coupling Effects 0.000 claims description 8
- 238000010168 coupling process Methods 0.000 claims description 8
- 238000005859 coupling reaction Methods 0.000 claims description 8
- 108020004635 Complementary DNA Proteins 0.000 claims description 6
- 108010010677 Phosphodiesterase I Proteins 0.000 claims description 5
- 102100034343 Integrase Human genes 0.000 claims 2
- 230000035772 mutation Effects 0.000 abstract description 62
- 230000011987 methylation Effects 0.000 abstract description 49
- 238000007069 methylation reaction Methods 0.000 abstract description 49
- 101710163270 Nuclease Proteins 0.000 abstract description 40
- 108020004638 Circular DNA Proteins 0.000 abstract description 29
- 108020004999 messenger RNA Proteins 0.000 abstract description 11
- 208000005443 Circulating Neoplastic Cells Diseases 0.000 abstract description 10
- 210000001808 exosome Anatomy 0.000 abstract description 9
- 108091070501 miRNA Proteins 0.000 abstract description 8
- 230000008685 targeting Effects 0.000 abstract description 6
- 230000005945 translocation Effects 0.000 abstract description 5
- 230000014509 gene expression Effects 0.000 abstract description 4
- 210000000601 blood cell Anatomy 0.000 abstract description 3
- -1 exosomes Proteins 0.000 abstract description 3
- 238000011896 sensitive detection Methods 0.000 abstract description 3
- 239000002679 microRNA Substances 0.000 abstract 1
- 239000000047 product Substances 0.000 description 464
- 239000012634 fragment Substances 0.000 description 131
- 125000005647 linker group Chemical group 0.000 description 121
- 238000003776 cleavage reaction Methods 0.000 description 71
- 102000003960 Ligases Human genes 0.000 description 70
- 108090000364 Ligases Proteins 0.000 description 70
- 230000007017 scission Effects 0.000 description 68
- 239000010432 diamond Substances 0.000 description 66
- 108700011259 MicroRNAs Proteins 0.000 description 60
- 108060002716 Exonuclease Proteins 0.000 description 55
- 102000013165 exonuclease Human genes 0.000 description 55
- 230000029087 digestion Effects 0.000 description 46
- 238000009396 hybridization Methods 0.000 description 43
- 235000021317 phosphate Nutrition 0.000 description 41
- 206010028980 Neoplasm Diseases 0.000 description 33
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical group N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 32
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 31
- 208000034454 F12-related hereditary angioedema with normal C1Inh Diseases 0.000 description 30
- 208000016861 hereditary angioedema type 3 Diseases 0.000 description 30
- 102100031780 Endonuclease Human genes 0.000 description 28
- 238000006073 displacement reaction Methods 0.000 description 28
- 239000012467 final product Substances 0.000 description 28
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 27
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 27
- 238000011144 upstream manufacturing Methods 0.000 description 26
- 239000002299 complementary DNA Substances 0.000 description 23
- 239000002131 composite material Substances 0.000 description 20
- 238000007481 next generation sequencing Methods 0.000 description 20
- 108090000623 proteins and genes Proteins 0.000 description 20
- 238000003786 synthesis reaction Methods 0.000 description 20
- 238000001514 detection method Methods 0.000 description 19
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 18
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 18
- 108010042407 Endonucleases Proteins 0.000 description 17
- 210000004027 cell Anatomy 0.000 description 17
- 238000004132 cross linking Methods 0.000 description 17
- 238000011282 treatment Methods 0.000 description 17
- 229960002685 biotin Drugs 0.000 description 16
- 235000020958 biotin Nutrition 0.000 description 16
- 239000011616 biotin Substances 0.000 description 16
- 201000011510 cancer Diseases 0.000 description 15
- 210000002381 plasma Anatomy 0.000 description 13
- 238000013461 design Methods 0.000 description 12
- 102000004190 Enzymes Human genes 0.000 description 11
- 108090000790 Enzymes Proteins 0.000 description 11
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 11
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 11
- 108091093088 Amplicon Proteins 0.000 description 10
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 10
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 10
- 238000013459 approach Methods 0.000 description 10
- 108091008146 restriction endonucleases Proteins 0.000 description 10
- 108010037497 3'-nucleotidase Proteins 0.000 description 9
- 108091029430 CpG site Proteins 0.000 description 9
- 150000002500 ions Chemical class 0.000 description 9
- 230000008901 benefit Effects 0.000 description 8
- 230000004927 fusion Effects 0.000 description 8
- 108010017826 DNA Polymerase I Proteins 0.000 description 7
- 102000004594 DNA Polymerase I Human genes 0.000 description 7
- 102000004533 Endonucleases Human genes 0.000 description 7
- 108020004682 Single-Stranded DNA Proteins 0.000 description 7
- 201000010099 disease Diseases 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 230000001404 mediated effect Effects 0.000 description 7
- 230000002441 reversible effect Effects 0.000 description 7
- 239000000758 substrate Substances 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- 108010063362 DNA-(Apurinic or Apyrimidinic Site) Lyase Proteins 0.000 description 6
- 102000010719 DNA-(Apurinic or Apyrimidinic Site) Lyase Human genes 0.000 description 6
- 238000012408 PCR amplification Methods 0.000 description 6
- 108010090804 Streptavidin Proteins 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000006384 oligomerization reaction Methods 0.000 description 6
- 230000000865 phosphorylative effect Effects 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 230000035945 sensitivity Effects 0.000 description 6
- 238000007841 sequencing by ligation Methods 0.000 description 6
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 6
- 108091035707 Consensus sequence Proteins 0.000 description 5
- 239000011324 bead Substances 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 230000037452 priming Effects 0.000 description 5
- 238000011002 quantification Methods 0.000 description 5
- 230000003252 repetitive effect Effects 0.000 description 5
- 238000001712 DNA sequencing Methods 0.000 description 4
- 108091000080 Phosphotransferase Proteins 0.000 description 4
- 230000004913 activation Effects 0.000 description 4
- 238000009833 condensation Methods 0.000 description 4
- 230000005494 condensation Effects 0.000 description 4
- 238000012350 deep sequencing Methods 0.000 description 4
- 238000007834 ligase chain reaction Methods 0.000 description 4
- 102000020233 phosphotransferase Human genes 0.000 description 4
- 238000012175 pyrosequencing Methods 0.000 description 4
- 210000002966 serum Anatomy 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- UBKVUFQGVWHZIR-UHFFFAOYSA-N 8-oxoguanine Chemical class O=C1NC(N)=NC2=NC(=O)N=C21 UBKVUFQGVWHZIR-UHFFFAOYSA-N 0.000 description 3
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 3
- 102100029764 DNA-directed DNA/RNA polymerase mu Human genes 0.000 description 3
- 102100040870 Glycine amidinotransferase, mitochondrial Human genes 0.000 description 3
- 101000893303 Homo sapiens Glycine amidinotransferase, mitochondrial Proteins 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical class NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 230000001605 fetal effect Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 239000002077 nanosphere Substances 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 238000010839 reverse transcription Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000007789 sealing Methods 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 2
- 108020005198 Long Noncoding RNA Proteins 0.000 description 2
- 208000024556 Mendelian disease Diseases 0.000 description 2
- 241000713869 Moloney murine leukemia virus Species 0.000 description 2
- KDLHZDBZIXYQEI-UHFFFAOYSA-N Palladium Chemical compound [Pd] KDLHZDBZIXYQEI-UHFFFAOYSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 101710086015 RNA ligase Proteins 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 241000191967 Staphylococcus aureus Species 0.000 description 2
- 241000589596 Thermus Species 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- 241001493065 dsRNA viruses Species 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 238000011049 filling Methods 0.000 description 2
- 230000006607 hypermethylation Effects 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 239000002071 nanotube Substances 0.000 description 2
- 108700025694 p53 Genes Proteins 0.000 description 2
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 2
- 230000035790 physiological processes and functions Effects 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 239000002987 primer (paints) Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- JTBBWRKSUYCPFY-UHFFFAOYSA-N 2,3-dihydro-1h-pyrimidin-4-one Chemical compound O=C1NCNC=C1 JTBBWRKSUYCPFY-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- CKOMXBHMKXXTNW-UHFFFAOYSA-N 6-methyladenine Chemical compound CNC1=NC=NC2=C1N=CN2 CKOMXBHMKXXTNW-UHFFFAOYSA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 101150003340 CYP2C19 gene Proteins 0.000 description 1
- 101100452003 Caenorhabditis elegans ape-1 gene Proteins 0.000 description 1
- 108091029523 CpG island Proteins 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 108010000577 DNA-Formamidopyrimidine Glycosylase Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000579497 Falsibacillus pallidus Species 0.000 description 1
- 102100030708 GTPase KRas Human genes 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 241000224466 Giardia Species 0.000 description 1
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 1
- 101000883798 Homo sapiens Probable ATP-dependent RNA helicase DDX53 Proteins 0.000 description 1
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 244000141359 Malus pumila Species 0.000 description 1
- 235000011430 Malus pumila Nutrition 0.000 description 1
- 235000015103 Malus silvestris Nutrition 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108010047956 Nucleosomes Proteins 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102100038236 Probable ATP-dependent RNA helicase DDX53 Human genes 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 230000007022 RNA scission Effects 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241001116459 Sequoia Species 0.000 description 1
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 1
- 208000003028 Stuttering Diseases 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical group OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 241000557720 Thermus brockianus Species 0.000 description 1
- 241001522143 Thermus scotoductus Species 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 238000002669 amniocentesis Methods 0.000 description 1
- 230000001640 apoptogenic effect Effects 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000002052 colonoscopy Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000011901 isothermal amplification Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 125000001921 locked nucleotide group Chemical group 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 210000001623 nucleosome Anatomy 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 229910052763 palladium Inorganic materials 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000003793 prenatal diagnosis Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 229920001169 thermoplastic Polymers 0.000 description 1
- 239000004416 thermosoftening plastic Substances 0.000 description 1
- DHCDFWKWKRSZHF-UHFFFAOYSA-L thiosulfate(2-) Chemical compound [O-]S([S-])(=O)=O DHCDFWKWKRSZHF-UHFFFAOYSA-L 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1068—Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6809—Methods for determination or identification of nucleic acids involving differential detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6848—Nucleic acid amplification reactions characterised by the means for preventing contamination or increasing the specificity or sensitivity of an amplification reaction
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
- C12Q1/6855—Ligating adaptors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biomedical Technology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Saccharide Compounds (AREA)
Abstract
本发明涉及一种用于从血液(即,从无细胞循环DNA、外来体、微RNA、循环肿瘤细胞或总血细胞)高度特异性地靶向捕获人类基因组和转录组的区域的方法,以允许使用组合的核酸酶、连接、聚合酶和大规模并行测序反应的高度灵敏地检测突变、表达、拷贝数、易位、可变剪接和甲基化变化。所述方法产生适于在多个平台上测序的不同环状嵌合单链核酸构建体的集合。在一些实施方案中,所述集合的每个构建体包含来自宿主生物体的原始基因组DNA的第一单链区段和连接至所述第一单链区段且包含对所述宿主生物体而言为外源性的核苷酸序列的第二单链合成核酸区段。这些嵌合构建体适用于识别和枚举突变、拷贝变化、易位和甲基化变化。在其它实施方案中,输入mRNA、IncRNA或miRNA用来生成反映特异性mRNA、IncRNA的拼接位点变体、易位和miRNA的存在和拷贝数的环状DNA产物。
Description
本申请是申请号为201580042765.4、申请日为2015年6月8日、发明名称为“从血液特异性靶向捕获人类基因组和转录组区域的方法”的中国发明专利申请的分案申请,原申请为国际申请号为PCT/US2015/034724的国家阶段申请,该国际申请要求2014年6月6日提交的美国临时专利申请系列第62/009,047号和2015年3月20日提交的美国临时专利申请系列第62/136,093号的权益,所述申请中的每个在此通过引用全部并入本文。
发明领域
本发明涉及一种用于从血液(即,从无细胞循环DNA、外来体、微RNA、循环肿瘤细胞或总血细胞)高度特异性地靶向捕获人类基因组和转录组的区域的方法,以允许使用组合的核酸酶、连接、聚合酶和测序反应高度灵敏地检测突变、表达、拷贝数、易位、可变剪接和甲基化变化。
发明背景
DNA测序的进展有望标准化和开发非侵入式分子诊断来改善产前护理、移植功效、癌症和其它疾病检测以及个性化治疗。当前,未确定患有易患疾病或早期疾病的患者,并且那些患有疾病的患者没有得到最佳治疗--这都是因为诊断水平的失败。
在癌症领域中,需要开发此类技术用于早期检测、指导疗法和监测复发-全部来自血液样品。这包括需要开发:(i)已知基因中的单碱基突变、小插入和小缺失突变(当以无细胞DNA的1%至0.01%存在时)的高灵敏度检测;(ii)启动子高甲基化和低甲基化(当以无细胞DNA的1%至0.01%存在时)的高灵敏度检测;(iii)从肿瘤衍生的外来体或RISC复合物分离的肿瘤特异性mRNA、lncRNA和miRNA或血液中的循环肿瘤细胞的精确定量;(iv)从循环肿瘤细胞分离的DNA中的肿瘤特异性拷贝变化的精确定量;(v)从循环肿瘤细胞分离的DNA中的突变、启动子高甲基化和低甲基化的精确定量。所有这些(从循环肿瘤细胞分离的DNA的肿瘤特异性拷贝变化的定量除外)都需要聚焦基因组的靶基因或区域的测序。可替代地,测定来自原始片段的两条链的序列信息或甲基化状态提供急需确认的罕见事件。
正常血浆含有从经历正常生理过程的正常细胞中释放的核酸(即外来体,细胞凋亡)。在应激、炎症、感染或损伤的条件下,可能有额外释放的核酸。通常,从凋亡细胞释放的DNA的平均长度为160bp,而来自胎儿细胞的DNA的平均长度为约140bp。来自癌症患者的血浆含有从经历异常生理过程的癌细胞中释放的核酸,以及循环肿瘤细胞(CTC)内的核酸。同样地,来自孕妇的血浆含有从胎儿细胞释放的核酸。
开发可靠的诊断和筛选测试面临许多挑战。第一个挑战是区分发源于肿瘤或胎儿的指示疾病(即早期癌症)的那些标记对比存在发源于正常组织的相同标记。还需要平衡检查的标记的数量和测试成本以及测定的特异性和灵敏度。这是一个需要解决疾病如癌症中的生物变异的挑战。在许多情况下,测定应充当筛选工具,从而需要使用辅助诊断随访(即结肠镜检查、羊膜穿刺术)。加上生物学问题,需要可靠地检测核酸序列突变或启动子甲基化差异,或可靠地量化来自极少量初始细胞(即来自CTC)或者在癌症或胎儿特异性信号存在大多数发源于正常细胞的大多数核酸时的DNA或RNA拷贝数量。最后,技术挑战是区分由检测所需疾病特异性核酸差异所产生的真实信号对比由存在于样品中的正常核酸产生的错误信号对比在没有疾病特异性核酸差异存在下产生的错误信号。
举例来说,考虑检测血浆中存在p53基因中具有突变或具有甲基化启动子区域的循环肿瘤DNA的挑战。此类样品将含有大部分源自正常细胞的无细胞DNA,其中肿瘤DNA可能仅包含总无细胞DNA的0.01%。因此,如果试图通过全测序寻找此类突变DNA的存在,将需要对100,000个基因组测序才能鉴定10个具有突变的基因组。这将要求对300,000GB的DNA测序,工作量超出当前测序技术的能力,更不用提大量的数据管理问题。为避免这个问题,许多小组试图捕获特异性靶区域或对所考虑的区域进行PCR扩增。序列捕获受到遗失的困扰,使得有可能捕获到了所需序列的90-95%,但错过所需片段。可替代地,PCR扩增提供了引入与真实突变难以区分的罕见错误的风险。此外,PCR丢失甲基化信息。虽然传统上使用亚硫酸氢盐处理来测定启动子甲基化的存在,但这也破坏了DNA样品且缺乏识别无细胞DNA中的多个甲基化变化的能力。
有许多用于降低错误率和改善测序运行的精确度的不同方法。通过反复给相同的DNA区域测序,可在高错误率的存在下实现一致性准确性(consensus accuracy)。然而,高错误率使得非常难以鉴定低丰度的序列变体,例如,在试图在正常DNA存在下鉴定癌症突变时。因此,需要低错误率才能检测相对低丰度的突变。
第一种称为标签化扩增子深度测序(TAm-Seq)方法(Forshew等人,“NoninvasiveIdentification and Monitoring of Cancer Mutations by Targeted Deep Sequencingof Plasma DNA,”Sci Transl Med.4(136):136(2012))的方法基于设计引物来扩增涵盖选定癌症相关基因区域(包括TP53、EGFR、BRAF和KRAS)的5995个碱基。这种方法能够以2%至65%的频率鉴定p53基因中的突变。在这种方法中,将引物设计成在具有许多PCR引物的多重反应中预先扩增DNA(持续15个循环)。这产生了所需和非所需产物,随后进行单重PCR,以进一步扩增所需产物中每个。在标准下一代测序之前,使片段经受最后的条码PCR。这种方法的优点是它使用经时间检验的多重PCR-PCR,这对于扩增少量起始核酸而言是无可比拟的。缺点是这种方法在早期数轮扩增中无法区分真实突变与PCR错误。因此,虽然2%的灵敏度(即检测50wt等位基因中的一个突变等位基因)足以在作出治疗决定之前评估晚期癌症,但对于早期检测而言不够灵敏。
第一方法的变型称为安全测序系统“Safe-SeqS”(Kinde等人,“Detection andQuantification of Rare Mutations with Massively Parallel Sequencing,”ProcNatl Acad Sci U S A 108(23):9530-5(2011)),其中将随机剪切基因组DNA附接至连接至基因组DNA的接头的末端。所述方法证实,绝大多数通过基因组测序描述的突变实际上是错误,并将假定测序错误减少至少70倍。同样,称为超灵敏深度测序的方法(Narayan等人,“Ultrasensitive Measurement of Hotspot Mutations in Tumor DNA in Blood UsingError-suppressed Multiplexed Deep Sequencing,”Cancer Res.72(14):3492-8(2012))将条码附在引物上以进行巢式PCR扩增。可假定,开发出附接条码的类似系统来检测罕见突变和拷贝数变化,这依赖于生物信息学工具(Talasaz,A.;Systems and Methods toDetect Rare Mutations and Copy Number Variation,美国专利申请US 2014/0066317A1,2014年3月6日)。使用成对末端读序来覆盖含有假定突变的区域。利用这种方法追踪晚期癌症患者的血浆中的已知突变。这些方法需要许多读段来建立共有序列。这两种方法要求延伸跨过靶DNA,且因此,无法区分真实突变与聚合酶产生的错误,特别是在跨过受损碱基,如脱氨基胞嘧啶进行拷贝时。最后,这些方法不提供关于片段内CpG位点的甲基化状态的信息。
称为双重测序的第二方法(Schmitt等人,“Detection of Ultra-Rare Mutationsby Next-Generation Sequencing,”Proc Natl Acad Sci U S A 109(36):14508-13(2012))基于使用含有12碱基随机化标签的双重接头。通过扩增输出靶DNA的上链和下链,给定片段获得独特标识符(每个末端由12个碱基组成),使得可经由测序追踪。将共享一组独特标签的序列读段归入配对家族,其成员具有上链或下链方向上的链标识符。每个家族对反映一个双链DNA片段的扩增。存在于只有一个或几个家族成员中的突变表示出现在扩增晚期的测序错误或PCR引入的错误。出现在一个成对家族的许多或所有成员中的突变由第一轮扩增期间的PCR错误引起,诸如可能在跨过诱变DNA损伤位点拷贝时出现。另一方面,存在于DNA片段的两条链上的真实突变出现在一个家族对的所有成员中。然而,具有真实突变的家族对中可同时出现人为突变,除了那些在第一轮PCR扩增期间出现的突变以外都可以独立鉴定,且在产生错误校正的单链共有序列时被忽略。然后可比较从个别DNA双链体的两条链的每一条获得的序列,以获得双链体共有序列,这消除了第一轮PCR期间出现的剩余错误。这种方法的优点是明确地区分真实突变与PCR错误或诱变DNA损伤,并达到3.8x10-10的格外低的错误率。这种方法的缺点是许多片段需要测序,以获得一个家族对中每条链的至少五个成员(即每个原始片段最少10个序列读段,但由于波动通常需要多得多)。另外,所述方法尚未对cfDNA进行测试,cfDNA往往比从完整基因组DNA产生的片段更小,且因此需要对更多片段测序才能涵盖所有潜在突变。最后,所述方法不提供关于片段内CpG位点的甲基化状态的信息。
称为单分子分子倒置探针的smMIP的第三方法(Hiatt等人,“Single MoleculeMolecular Inversion Probes for Targeted,High-Accuracy Detection of Low-Frequency Variation,”Genome Res.23(5):843-54(2013)组合单分子标记与多重捕获来高度灵敏地检测低频率亚克隆变异。所述方法声称临床标本中的错误率为2.6x10-5。这种方法的缺点是许多片段需要测序,以获得一个家族对中每条链的至少五个成员(即每个原始片段最少10个序列读段,但由于波动通常需要多得多)。另外,该方法要求延伸跨过靶DNA,且因此无法区分真实突变与聚合酶产生的错误,特别是在跨过受损碱基如脱氨基胞嘧啶进行拷贝时。另外,所述方法尚未对cfDNA进行测试,cfDNA往往比从完整基因组DNA产生的片段更小,且因此需要给更多片段测序才能涵盖所有潜在突变。最后,所述方法不提供关于片段内CpG位点的甲基化状态的信息。
称为环形测序的第四方法(Lou等人,“High-throughput DNA Sequencing Errorsare Reduced by Orders of Magnitude Using Circle Sequencing,”Proc Natl AcadSci U S A 110(49):19872-7(2013),还参见Mutational and fitness landscapes of anRNA virus revealed through population sequencing.Acevedo A,Brodsky L,AndinoR.,Nature.2014年1月30日;505(7485):686-90;和Library preparation for highlyaccurate population sequencing of RNA viruses.Acevedo A,Andino R.NatProtoc.2014年7月;9(7):1760-9.)基于将DNA或RNA剪切至约150个碱基,变性形成单链,使那些单链环化,使用随机六聚体引物和phi29 DNA聚合酶进行滚环扩增(在尿嘧啶-DNA糖基化酶和甲酰胺基嘧啶-DNA糖基化酶存在下),重新将产物剪切成约500个碱基,然后以标准下一代测序继续处理。此方法的优点是滚环扩增制备原始靶DNA的多个串联拷贝,以使得聚合酶错误可能只出现在一个拷贝中,但真实突变出现在所有拷贝中。读段家族的大小平均为3个拷贝,因为所述拷贝彼此物理连接。所述方法还使用尿嘧啶-DNA糖基化酶和甲酰胺基嘧啶-DNA糖基化酶来移除含有受损碱基的靶,以消除此类错误。这种技术的优点是使测序错误率从当前水平的约0.1至1x10-2变成低至7.6x10-6的比率。后面的错误率现在足以在100至10,000倍过量野生型DNA存在下区分血浆中的癌症突变。另一优点是相同序列的2-3个拷贝物理连接,从而允许验证从单个片段产生的序列数据的真实突变,与之相比利用双重测序方法是至少10个片段。然而,所述方法不提供测定拷贝数变化的能力,也不提供关于片段内的CpG位点的甲基化状态的信息。
由Complete Genomics开发的第五方法(Drmanac等人,“Human GenomeSequencing Using Unchained Base Reads on Self-Assembling DNA Nanoarrays,”Science 327(5961):78-81(2010))基于在纳米球阵列上使用连接读段。基因组DNA的约400个核苷酸与接头环化,裂解,重新与其它接头环化,并最终重新环化后含有约四个接头。DNA利用phi 29DNA聚合酶经历滚环扩增,以产生纳米球。然后将这些纳米球放在阵列上,并利用基于连接的方法测序。这种方法的与本文相关的特征点是可产生相同序列的多个串联拷贝,随后给单个滚环扩增产物测序。因为同一序列被连接酶或聚合酶询问多次(通过合成方法组合滚环测序和其它测序),所以每个碱基的错误率显著下降。正因如此,直接给滚环产物测序提供许多上述环形测序方法的相同优点。
称为SMRT–单分子实时测序的第六方法(Flusberg等人,“Direct Detection ofDNA Methylation During Single-Molecule,Real-Time Sequencing,”Nat Methods 7(6):461-5(2010))基于将发夹环添加至DNA片段的末端上,并允许具有链置换活性的DNA聚合酶在共价闭环周围延伸,从而提供关于两条互补链的序列信息。具体地说,单个聚合酶分子催化荧光标记核苷酸并入互补核酸链中。当在甲基化碱基对面并入核苷酸时,聚合酶减慢或“卡顿(stutter)”,且所得荧光脉冲允许直接检测DNA模板中的经修饰的核苷酸,包括N6-甲基腺嘌呤、5-甲基胞嘧啶和5-羟甲基胞嘧啶。这种方法的准确性有所提升,特别是在聚合酶可围绕闭环来回移动几次时,从而允许测定共有序列。虽然所述技术被设计用于提供关于“哑铃”形底物(基本上含有线性DNA片段的两条互补序列)的序列信息,但它也可以应用在单链环状底物上。
本发明涉及克服本领域中的这些缺陷和其它缺陷。
发明概要
本发明的第一方面涉及不同的环状嵌合单链核酸构建体的集合。所述集合的每个构建体包含来自宿主生物体的原始基因组DNA的第一单链区段和连接至第一单链区段且包含对宿主生物体而言为外源性的核苷酸序列的第二单链合成核酸区段。所述第二单链合成核酸区段包含独特标识符部分,其中所述独特标识符部分和原始基因组DNA的区段的核苷酸序列区分所述集合中的一个嵌合单链核酸构建体与所述集合中的所有其它嵌合单链核酸构建体。所述集合的嵌合单链核酸构建体是环化的且适于滚环扩增和/或测序。
本发明的另一方面涉及包含不同环状嵌合单链核酸构建体的集合的系统。所述集合的每个构建体包含来自宿主生物体的原始基因组DNA的第一单链区段和连接至第一单链区段且包含对宿主生物体而言为外源性的核苷酸序列的第二单链核酸区段。所述第二单链核酸区段的核苷酸序列包含第一固体载体引物特异性部分、第二固体载体引物特异性部分和患者标识符序列。所述集合的嵌合单链核酸构建体是环化的且适于滚环扩增和/或测序。所述系统进一步包括延伸产物的集合,每个延伸产物包含与来自所述集合的嵌合单链核酸构建体互补的两条或更多条串联线性序列。所述集合中的每个延伸产物与所述集合的其互补环状嵌合单链核酸构建体杂交。
本发明的另一方面涉及包含不同的环状嵌合单链核酸构建体的集合的系统。每个构建体包含来自宿主生物体的原始基因组DNA的第一单链区段和连接至第一单链区段且包含对宿主生物体而言为外源性的核苷酸序列的第二单链核酸区段。所述第二单链核酸区段的核苷酸序列包含第一固体载体引物特异性部分、第二固体载体引物特异性部分和患者标识符序列。所述集合的嵌合单链核酸构建体适于滚环扩增和/或测序。所述系统进一步包含:一个或多个寡核苷酸扩增引物,每个引物包含至少第一核苷酸序列部分,其与所述集合的嵌合单链核酸构建体的第一固体载体引物特异性部分或第二固体载体引物特异性部分互补;以及适用于滚环扩增的聚合酶。
本发明的其它方面涉及使用本发明的集合和系统对样品中的多个核酸分子测序的方法。
本发明的另一个方面涉及一种用于识别样品中的一个或多个靶核糖核酸分子的方法,所述靶核糖核酸分子与样品中的其它核酸分子的差异为一个或多个碱基。该方法包括提供包含可能含有一个或多个碱基差异的一个或多个靶核糖核酸分子的样品,以及在样品中生成所述一个或多个靶核糖核酸分子(如果存在于样品中)的cDNA。所述方法进一步包括提供一个或多个第一寡核苷酸探针,每个第一寡核苷酸探针包含:(a)3'cDNA靶标特异性序列部分;(b)5'cDNA靶标特异性部分;以及其它部分,所述其它部分包含(i)独特标识符序列、(ii)患者标识符序列、(iii)一条或多条引物结合序列或(i)、(ii)和(iii)的任何组合;以及在有效地使所述第一寡核苷酸探针的3'和5'靶标特异性部分以碱基特异性方式与所述cDNA的互补区域杂交的条件下,使所述样品与所述一个或多个第一寡核苷酸探针接触。产生适于连接杂交至其互补cDNA的第一寡核苷酸探针的3'和5'端的一个或多个可连接结,并连接在所述一个或多个连接结处的一个或多个第一寡核苷酸探针以形成包含连接至第一寡核苷酸探针的其它部分的靶核糖核酸序列的脱氧核糖核酸拷贝的环状连接产物。所述方法进一步包括检测和区分样品中的环状连接产物,以识别与样品中的其它核糖核酸分子的差异在于一个或多个碱基的一个或多个靶核糖核酸分子的存在。
本发明的另一个方面涉及一种用于识别样品中的一个或多个核酸分子的方法,所述核酸分子可能包含彼此连接的不同的第一靶和第二靶区域。该方法包括提供可能含有包含彼此连接的不同的第一靶和第二靶区域的一个或多个核酸分子的样品,并提供一个或多个寡核苷酸探针组,每个探针组包含:(i)包含5'第一靶标特异性部分、3'第二靶标特异性部分和其它部分的第一寡核苷酸探针,以及(ii)包含5'第二靶标特异性部分、3'第一靶标特异性部分和其它部分的第二寡核苷酸探针,其中探针组的第一或第二寡核苷酸探针的其它部分包含:(i)独特标识符序列、(ii)患者标识符序列、(iii)一条或多条引物结合序列或(i)、(ii)和(iii)的任何组合。该方法进一步包括在有效地使探针组的第一和第二寡核苷酸探针以碱基特异性方式与其相应的核酸分子(如果存在于样品中)的第一和第二靶区域杂交的条件下,使样品与一个或多个寡核苷酸探针组接触;以及产生适于在探针组与互补的核酸分子的第一和第二靶区域杂交时将所述探针组的第一寡核苷酸探针的3'端连接至第二寡核苷酸探针的5'端以及将所述探针组的第一寡核苷酸探针的5'端连接至第二寡核苷酸探针的3'端的一个或多个可连接结。在所述一个或多个可连接结处连接探针组的第一和第二寡核苷酸,以形成包含连接至其它部分的对应于核酸分子的第一和第二不同靶区域的核苷酸序列的环状连接产物,并且检测和区分样品中的环状连接产物,从而识别样品中包含彼此连接的不同的第一靶和第二靶区域的一个或多个核酸分子的存在(如果有的话)。
本发明的另一个方面涉及一种用于识别样品中的一个或多个靶核糖核酸分子的方法,所述靶核糖核酸分子与样品中的其它核酸分子的差异为一个或多个碱基。该方法包括提供包含可能含有一个或多个碱基差异的一个或多个靶核糖核酸分子的样品,并将核苷酸接头附接至样品中的靶核糖核酸分子的3’和5’端。该方法进一步包括提供一个或多个寡核苷酸探针,每个寡核苷酸探针包括:(a)与靶核糖核酸分子的3'核苷酸接头互补的3'部分;(b)与靶核糖核酸分子的5'核苷酸接头互补的5'部分;以及(c)其它部分,所述其它部分包含:(i)独特标识符序列、(ii)患者标识符序列、(iii)一条或多条引物结合序列或(i)、(ii)和(iii)的任何组合。在有效地使所述寡核苷酸探针的3'和5'部分以碱基特异性方式与靶核糖核酸分子(如果存在于样品中)上的互补核苷酸接头杂交的条件下,使所述样品与所述一个或多个寡核苷酸探针接触。延伸杂交的寡核苷酸探针的3'端以产生所述一个或多个靶核糖核酸分子的补体,并将所述寡核苷酸探针的3'延伸端连接到所述寡核苷酸探针的5'端,以形成包含互补于所述靶核糖核酸分子的3'核苷酸接头的序列、互补于所述靶核糖核酸分子的5'核苷酸接头的序列、所述一个或多个靶核糖核酸分子的补体和所述寡核苷酸探针的其它部分的环状连接产物。该方法进一步包括检测和区分样品中的环状连接产物,从而识别与样品中的其它核酸分子的差异在于一个或多个碱基的一个或多个靶核糖核酸分子的存在。
本发明的另一个方面涉及一种用于识别样品中的一个或多个靶核糖核酸分子的方法,所述靶核糖核酸分子与样品中的其它核酸分子的差异为一个或多个碱基。该方法包括提供包含可能含有一个或多个碱基差异的一个或多个靶核糖核酸分子的样品,并将核苷酸接头连接至样品中的靶核糖核酸分子的3’和5’端,其中所述核苷酸接头通过其它部分彼此连接,所述其它部分包含:(i)独特标识符序列、(ii)患者标识符序列、(iii)一条或多条引物结合序列或(i)、(ii)和(iii)的任何组合,由此所述连接形成包含靶核糖核酸分子、3'和5'核苷酸接头序列和其它部分的环状连接产物。该方法进一步包括提供一个或多个第一寡核苷酸引物,其包含与所述环状连接产物的3'或5'核苷酸接头序列互补的核苷酸序列;以及使所述一个或多个第一寡核苷酸引物以碱基特异性方式与所述环状连接产物杂交。延伸所述第一寡核苷酸引物的3'端以产生所述环状连接产物的补体,并且检测和区分所述样品中的环状连接产物补体,从而识别与所述样品中的其它核酸分子的差异为一个或多个碱基的一个或多个靶核糖核酸分子的存在。
本发明的另一个方面涉及一种用于识别样品中的一个或多个靶核糖核酸分子的方法,所述靶核糖核酸分子与样品中的其它核酸分子的差异为一个或多个碱基。该方法包括提供包含可能含有一个或多个碱基差异的一个或多个靶核糖核酸分子的样品,并提供一个或多个寡核苷酸探针组,每个组包含:(a)具有5'茎环部分和与靶核糖核酸分子的3'部分互补的3'部分的第一寡核苷酸探针;(b)具有与靶核糖核酸分子的5'端的拷贝互补的3'部分、与第一寡核苷酸探针的5'茎环部分互补的5'部分以及其它部分的第二寡核苷酸探针,所述其它部分包含:(i)独特靶标识符序列、(ii)患者标识符序列、(iii)引物结合序列或(i)、(ii)和(iii)的任何组合。该方法进一步包括掺混所述样品、来自探针组的一个或多个第一寡核苷酸探针和逆转录酶,以形成逆转录酶反应,以及延伸杂交至其互补性靶核糖核酸分子的第一寡核苷酸探针的3'端,以产生所述靶核糖核苷酸分子(如果存在于所述样品中)的补体。使探针组中的所述一个或多个第二寡核苷酸探针与包含所述靶核糖核苷酸序列的补体的延伸的第一寡核苷酸探针杂交,并在杂交至延伸的第一寡核苷酸探针的每个第二寡核苷酸探针的3'和5'端之间产生一个或多个可连接结。该方法进一步包括连接每个第二寡核苷酸探针的3'和5'端,以形成包含连接至所述第二寡核苷酸探针的其它部分的靶核糖核酸序列的脱氧核糖核酸拷贝的环状连接产物。检测和区分样品中的环状连接产物,从而识别与样品中的其它核酸分子的差异在于一个或多个碱基的一个或多个靶核糖核酸分子的存在。
本发明的意义在于,它教导了一种用于从血液(即,从无细胞循环DNA、外来体、微RNA、循环肿瘤细胞或总血细胞)高度特异性地靶向捕获人类基因组和转录组的区域的方法,以允许适用于高通量诊断模式的高度灵敏地检测突变、表达、拷贝数、易位、可变剪接和甲基化变化。本发明的单链构建体适合通过一些不同技术读出,所述技术包括下一代测序,且被设计成读出技术不可知。为了最大化捕获的灵敏度,本发明不仅利用杂交,而且利用聚合酶延伸和连接以减少假阳性。为了最大化特异性,用核酸外切酶消化未连接的探针,保留环化靶序列。可通过给通过滚环扩增产生的原始基因组序列的串联重复序列测序获得其它特异性。最后,本发明提出一种捕获由通过滚环扩增在表面上产生的原始基因组序列产生的串联重复序列,然后通过合成给它们测序,从而允许高度准确地进行突变检测、甲基化状态和转录组计算的方法。所述方法特别适用于鉴定直接来自血液的癌症特异性标记,以筛选癌症以及监测功效和复发。所述方法还适用于直接来自母本血液的拷贝异常和孟德尔疾病(Mendelian diseases)的产前诊断。
附图简述
图1示出了用于扩增本发明的环状嵌合单链核酸构建体以准备下一代测序的一种方法。该方法使用利用随机六聚体的滚环扩增(RCA)或滚环复制(RCR)。
图2示出了从RCA产物产生适于测序的双链核酸分子的串联线性拷贝的方法。
图3示出了用于产生适于测序的核酸分子的串联线性拷贝的方法。该方法特异性地选择在初始靶DNA中的所有BstU1位点处甲基化的片段。
图4示出了用于扩增本发明的环状嵌合单链核酸构建体以准备下一代测序的替代方法。这种方法使用利用在溶液中或在表面上的单一特异性引物进行的RCA。
图5说明了一种用于在捕获到测序流动池表面上之前将RCA或RCR中生成的线性DNA扩增子缩合成紧凑结构的方法。
图6描绘了使用本发明的系统和方法对样品中的多个核酸分子测序的方法。
图7描绘了用于扩增核酸分子并将所得扩增子捕获在适于下一代测序的固体载体上的方法。
图8示出了对根据本发明的方法制备的位于固体载体表面上的扩增子测序的过程。
图9描绘了用于扩增核酸分子并将所得扩增子捕获在适于下一代测序的固体载体上的方法。根据在图8中所示的方法对固定的扩增子测序。
图10描绘了用于扩增核酸分子并将所得扩增子捕获在适于下一代测序的固体载体上的另一种方法。根据在图8中所示的方法对固定的扩增子测序。
图11描绘了用于扩增核酸分子并将所得扩增子捕获在适于下一代测序的固体载体上的另一种方法。根据在图8中所示的方法对固定的扩增子测序。
图12描绘了环状靶滚环扩增产生用于捕获在含有双引物的固体载体上的单链串联重复模板DNA。
图13描绘了生成本发明的环状嵌合单链核酸构建体的方法。
图14描绘了生成和扩增本发明的环状嵌合单链核酸构建体的方法。
图15描绘了生成本发明的环状嵌合单链核酸构建体的方法。
图16描绘了生成和扩增本发明的环状嵌合单链核酸构建体的方法。
图17描绘了生成本发明的环状嵌合单链核酸构建体的方法。
图18描绘了生成和扩增本发明的环状嵌合单链核酸构建体的方法。
图19描绘了生成本发明的环状嵌合单链核酸构建体的方法。
图20描绘了生成和扩增本发明的环状嵌合单链核酸构建体的方法。
图21描绘了生成本发明的环状嵌合单链核酸构建体的方法。
图22描绘了生成和扩增本发明的环状嵌合单链核酸构建体的方法。
图23描绘了生成本发明的环状嵌合单链核酸构建体的方法。
图24描绘了生成和扩增本发明的环状嵌合单链核酸构建体的方法。
图25描绘了生成本发明的环状嵌合单链核酸构建体的方法。
图26描绘了生成和扩增本发明的环状嵌合单链核酸构建体的方法。
图27示出了检测在已知基因序列中的相邻HinP1位点处的甲基化的方法。
图28描绘了检测在整个基因组中的相邻HinP1位点处的甲基化的过程。
图29描绘了生成含有相邻AciI甲基化位点的本发明的环状嵌合单链核酸构建体的方法。
图30描绘了生成和扩增含有相邻AciI甲基化位点的本发明的环状嵌合单链核酸构建体的方法。
图31描绘了生成含有相邻AciI甲基化位点的本发明的环状嵌合单链核酸构建体的方法。
图32描绘了生成和扩增含有相邻AciI甲基化位点的本发明的环状嵌合单链核酸构建体的方法。
图33示出了检测在整个基因组中的相邻AciI位点处的甲基化的过程。
图34描绘了生成含有相邻的未甲基化HinP1I位点的本发明的环状嵌合单链核酸构建体的方法。
图35描绘了生成和扩增含有相邻的未甲基化HinP1I位点的本发明的环状嵌合单链核酸构建体的方法。
图36描绘了生成含有位于HaeIII限制性位点之间的相邻甲基化AciI位点的本发明的环状嵌合单链核酸构建体的方法。
图37描绘了生成和扩增含有位于HaeIII限制性位点之间的相邻甲基化AciI位点的本发明的环状嵌合单链核酸构建体的方法。
图38示出了用于产生含有位于cfDNA或剪切的总基因组DNA的已知基因组区域中的HaeIII位点之间的甲基化Bsh1236I位点的本发明嵌合环状单链核酸构建体的过程。
图39描绘了生成含有接近5’HaeIII限制性位点的一个或多个甲基化AciI位点的本发明的环状嵌合单链核酸构建体的方法。
图40描绘了生成和扩增含有接近5’HaeIII限制性位点的一个或多个甲基化AciI位点的本发明的环状嵌合单链核酸构建体的方法。
图41示出了用于产生适于检测靠近基因组DNA的已知区域中的5’-HaeIII位点的甲基化Bsh1236I位点的嵌合环状单链核酸构建体的过程。
图42描绘了生成含有接近3’HaeIII限制性位点的一个或多个甲基化AciI位点的本发明的环状嵌合单链核酸构建体的方法。
图43描绘了生成和扩增含有接近3’HaeIII限制性位点的一个或多个甲基化AciI位点的本发明的环状嵌合单链核酸构建体的方法。
图44示出了用于产生适于检测靠近cfDNA或剪切的总基因组DNA的已知基因组区域中的3’-HaeIII位点的甲基化Bsh1236I位点的嵌合环状单链核酸构建体的过程。
图45示出了用于产生适于检测在基因组DNA的已知区域中的相邻甲基化Bsh1236I位点的嵌合环状单链核酸构建体的过程。
图46示出了用于产生适于检测靠近基因组DNA的已知区域中的Bsh1236I位点的所有甲基化CpG位点的嵌合环状单链核酸构建体的过程。
图47描绘了生成含有相邻的未甲基化HinP1I位点的本发明的环状嵌合单链核酸构建体的方法。
图48描绘了生成和扩增含有相邻的未甲基化HinP1I位点的本发明的环状嵌合单链核酸构建体的方法。
图49描绘了生成含有位于HaeIII限制性位点之间的相邻甲基化AciI位点的本发明的环状嵌合单链核酸构建体的方法。
图50描绘了生成和扩增含有位于HaeIII限制性位点之间的相邻甲基化AciI位点的本发明的环状嵌合单链核酸构建体的方法。
图51描绘了用于检测已知基因组区域中的甲基化相邻HinP1I位点的过程。
图52描绘了用于检测已知基因组区域中的未甲基化相邻AciI位点的过程。
图53描绘了生成含有在已知基因组区域中的未甲基化相邻HinP1I位点的本发明的环状嵌合单链核酸构建体的方法。
图54描绘了生成和扩增含有在已知基因组区域中的未甲基化相邻HinP1I位点的本发明的环状嵌合单链核酸构建体的方法。
图55描绘了生成含有在已知基因组区域中的未甲基化相邻HinP1I位点的本发明的环状嵌合单链核酸构建体的方法。
图56描绘了生成和扩增含有在已知基因组区域中的未甲基化相邻HinP1I位点的本发明的环状嵌合单链核酸构建体的方法。
图57示出了用于检测已知基因组区域中的未甲基化相邻HinP1I位点的过程。
图58描绘了生成含有在已知基因组区域中的未甲基化相邻Hph1位点的本发明的环状嵌合单链核酸构建体的方法。
图59描绘了生成和扩增含有在已知基因组区域中的未甲基化相邻Hph1位点的本发明的环状嵌合单链核酸构建体的方法。
图60描绘了生成含有在已知基因组区域中的未甲基化相邻Hph1位点的本发明的环状嵌合单链核酸构建体的方法。
图61描绘了生成和扩增含有在已知基因组区域中的未甲基化相邻Hph1位点的本发明的环状嵌合单链核酸构建体的方法。
图62示出了用于检测已知基因组区域中的未甲基化相邻Hph1位点的过程。
图63示出了从适于测序的cfDNA或剪切基因组DNA产生嵌合环状单链核酸靶构建体的过程。
图64示出了从适于测序的cfDNA或剪切基因组DNA产生嵌合环状单链核酸靶构建体的过程。
图65示出了从适于测序的cfDNA或剪切基因组DNA产生嵌合环状单链核酸靶构建体的过程。
图66示出了用于从cfDNA生成测序即用模板的接头设计和连接。
图67示出了用于测序、识别和验证cfDNA的两个靶链中的突变的“缺口”接头设计。
图68示出了使用C3加尾、连接、含rG接头的RNA酶H2活化、缺口填充和连接的用于测序、识别和验证cfDNA的两个靶链中的突变的接头设计。
图69示出了使用具有有限rA插入的dA加尾、C3加尾、连接、含rG接头的RNA酶H2活化、缺口填充和连接的用于测序和识别cfDNA的任一条靶链中的突变的接头设计。
图70示出了从适于测序的cfDNA或剪切基因组DNA产生嵌合环状单链核酸靶构建体的过程。
图71示出了从涉及RNA酶H2活化的cfDNA产生嵌合环状单链核酸靶构建体的过程。
图72示出了从涉及RNA酶H2活化的cfDNA产生嵌合环状单链核酸靶构建体的另一个示例性过程。
图73示出了具有杂交引物的包含原始靶cfDNA的单链环状DNA的生成。
图74示出了具有含捕获基团的杂交引物的包含原始靶cfDNA的单链环状DNA的生成。
图75示出了使用靶标特异性引物的RNA酶H2解阻生成具有杂交引物的包含原始靶cfDNA的单链环状DNA。
图76示出了使用靶标特异性引物的RNA酶H2解阻生成具有含捕获基团的杂交引物的包含原始靶cfDNA的单链环状DNA。
图77示出了从适于测序的cfDNA或剪切基因组DNA产生嵌合环状单链核酸靶构建体的过程。
图78示出了从适于测序的cfDNA或剪切基因组DNA产生嵌合环状单链核酸靶构建体的过程。
图79示出了使用随后可用于滚环扩增的靶标特异性引物的捕获来富集靶标特异性单链环状DNA的过程。
图80示出了使用随后可用于滚环扩增的缺口型串联靶标特异性引物的捕获来富集靶标特异性单链环状DNA的过程。
图81示出了使用随后可用于滚环扩增的靶标特异性引物富集靶标特异性单链环状DNA的过程。
图82示出了生成和富集适于测序的基因组靶标特异性单链串联重复延伸产物的过程。
图83示出了生成和富集适于测序的基因组靶标特异性单链串联重复延伸产物的过程。
图84示出了生成和富集适于测序的基因组靶标特异性单链串联重复延伸产物的过程。
图85示出了生成和富集适于测序的基因组靶标特异性单链串联重复延伸产物的过程。
图86示出了生成和富集适于测序的基因组靶标特异性单链串联重复延伸产物的过程。
图87示出了生成和富集适于测序的基因组靶标特异性单链串联重复延伸产物的过程。
图88示出了生成和富集适于测序的基因组靶标特异性单链串联重复延伸产物的过程。
图89示出了生成和富集适于测序的基因组靶标特异性单链串联重复延伸产物的过程。
图90示出了沿无细胞DNA(cfDNA)靶片段(长度为160个核苷酸)的集合的增量为10个核苷酸碱基的寡核苷酸探针(“oligo”)家族的图谱。每个寡核苷酸探针含有20个碱基的3'靶标特异性部分、60个碱基的5'靶标特异性部分、10个碱基的接头(黑条)以及20至160个碱基的复合标识符序列(细线)。
图91示出了沿cfDNA靶片段(长度为160个核苷酸)的集合的增量为10个核苷酸碱基的寡核苷酸探针(“oligo”)家族的图谱。每个寡核苷酸探针含有20个碱基的3'靶标特异性部分、80个碱基的5'靶标特异性部分、10个碱基的接头(黑条)以及20至160个碱基的复合标识符序列(细线)。
图92示出了沿cfDNA靶片段(长度为160个核苷酸)的集合的增量为10个核苷酸碱基的寡核苷酸探针(“oligo”)家族的图谱。每个寡核苷酸探针含有50个碱基的3'靶标特异性部分、60个碱基的5'靶标特异性部分、10个碱基的接头(黑条)以及20至160个碱基的复合标识符序列(细线)。
图93示出了沿cfDNA靶片段(长度为160个核苷酸)的集合的增量为10个核苷酸碱基的寡核苷酸探针(“oligo”)家族的图谱。每个寡核苷酸探针含有50个碱基的3'靶标特异性部分、80个碱基的5'靶标特异性部分、10个碱基的接头(黑条)以及20至160个碱基的复合标识符序列(细线)。
图94示出了沿cfDNA靶片段(长度为160个核苷酸)的集合的增量为10个核苷酸碱基的寡核苷酸探针(“oligo”)家族的图谱。每个寡核苷酸探针含有50个碱基的3'靶标特异性部分、50个碱基的5'靶标特异性部分、3’和5’10个碱基的接头(黑条)以及20至160个碱基的复合标识符序列(细线)。
图95示出了沿cfDNA靶片段(长度为160个核苷酸)的集合的增量为10个核苷酸碱基的寡核苷酸探针(“oligo”)家族的图谱。每个寡核苷酸探针含有60个碱基的3'靶标特异性部分、60个碱基的5'靶标特异性部分、3’和5’10个碱基的接头(黑条)以及20至160个碱基的复合标识符序列(细线)。
图96示出了沿cfDNA靶片段(长度为160个核苷酸)的集合的增量为10个核苷酸碱基的寡核苷酸探针(“oligo”)家族的图谱。每个寡核苷酸探针含有50个碱基的3'靶标特异性部分、50个碱基的5'靶标特异性部分以及20至160个碱基的复合标识符序列(细线)。
图97示出了沿cfDNA靶片段(长度为160个核苷酸)的集合的增量为10个核苷酸碱基的寡核苷酸探针(“oligo”)家族的图谱。每个寡核苷酸探针含有60个碱基的3'靶标特异性部分、60个碱基的5'靶标特异性部分以及20至160个碱基的复合标识符序列(细线)。
图98示出了沿cfDNA靶片段(长度为160个核苷酸)的集合的增量为10个核苷酸碱基的寡核苷酸探针(“oligo”)家族的图谱。每个寡核苷酸探针含有70个碱基的3'靶标特异性部分、70个碱基的5'靶标特异性部分以及20至160个碱基的复合标识符序列(细线)。
图99示出了沿cfDNA靶片段(长度为160个核苷酸)的集合的增量为10个核苷酸碱基的寡核苷酸探针(“oligo”)家族的图谱。每个寡核苷酸探针含有80个碱基的3'靶标特异性部分、80个碱基的5'靶标特异性部分以及20至160个碱基的复合标识符序列(细线)。
图100说明了如何以重叠拼接策略设计寡核苷酸探针以对更大的连续靶区域(作为实例显示约500个碱基)测序。
图101说明了如何以重叠拼接策略设计寡核苷酸探针以对更大的连续靶区域(作为实例显示约500个碱基)测序。
图102说明了如何以重叠拼接策略设计寡核苷酸探针以对更大的连续靶区域(作为实例显示约500个碱基)测序。
图103说明了如何以重叠拼接策略设计寡核苷酸探针以对更大的连续靶区域(作为实例显示约500个碱基)测序。
图104示出了跨越一段基因组DNA中的相邻160bp基因靶而拼接的靶标特异性相位标记寡核苷酸。
图105示出了跨越一段基因组DNA中的相邻160bp基因靶而拼接的靶标特异性相位标记寡核苷酸。
图106示出了跨越一段基因组DNA中的相邻160bp基因靶而拼接的靶标特异性相位标记寡核苷酸。
图107示出了跨越一段基因组DNA中的相邻160bp基因靶而拼接的靶标特异性相位标记寡核苷酸。
图108描绘了生成含有靶核糖核酸分子的脱氧核糖核酸序列拷贝的环状嵌合单链核酸构建体的方法。所述环状构建体适用于根据本发明的方法进行的RCA和测序。
图109描绘了生成包含含有推定基因融合的靶核糖核酸分子的脱氧核糖核酸序列拷贝的环状嵌合单链核酸构建体的方法。所述环状构建体适用于根据本发明的方法进行的RCA和测序。
图110描绘了生成包含含有推定基因融合的靶核糖核酸分子的脱氧核糖核酸序列拷贝的环状嵌合单链核酸构建体的方法。所述环状构建体适用于根据本发明的方法进行的RCA和测序。
图111描绘了生成包含含有特定外显子的靶核糖核酸分子的脱氧核糖核酸序列拷贝的环状嵌合单链核酸构建体的方法。所述环状构建体适用于根据本发明的方法进行的RCA和测序。
图112描绘了生成包含含有特定外显子的靶核糖核酸分子的脱氧核糖核酸序列拷贝的环状嵌合单链核酸构建体的方法。所述环状构建体适用于根据本发明的方法进行的RCA和测序。
图113描绘了生成包含含有多态性的DNA片段的环状嵌合单链核酸构建体的方法。所述环状构建体适用于根据本发明的方法进行的RCA和测序。
图114描绘了生成含有与靶miRNA序列互补的脱氧核糖核酸序列的环状嵌合单链核酸构建体的方法。所述环状构建体适用于根据本发明的方法进行的RCA和测序。
图115描绘了生成含有与靶miRNA序列互补的脱氧核糖核酸序列的环状嵌合单链核酸构建体的方法。所述环状构建体适用于根据本发明的方法进行的RCA和测序。
图116描绘了生成含有与靶miRNA序列互补的脱氧核糖核酸序列的环状嵌合单链核酸构建体的方法。所述环状构建体适用于根据本发明的方法进行的RCA和测序。
图117描绘了生成含有与靶miRNA序列互补的脱氧核糖核酸序列的环状嵌合单链核酸构建体的方法。所述环状构建体适用于根据本发明的方法进行的RCA和测序。
发明详述
本发明的第一方面涉及不同的环状嵌合单链核酸构建体的集合。所述集合的每个构建体包含来自宿主生物体的原始基因组DNA的第一单链区段和连接至第一单链区段且包含对宿主生物体而言为外源性的核苷酸序列的第二单链合成核酸区段。所述第二单链合成核酸区段包含独特标识符部分,其中所述独特标识符部分和原始基因组DNA的区段的核苷酸序列区分所述集合中的一个嵌合单链核酸构建体与所述集合中的所有其它嵌合单链核酸构建体。所述集合的嵌合单链核酸构建体是环化的且适于滚环扩增和/或测序。
根据本发明的这个方面,所述集合通常包含1,000个与4,000,000,000个之间的环状嵌合单链核酸构建体。下文详细描述了制备所述集合的环状嵌合单链核酸构建体的方法。
所述嵌合核酸构建体的第一单链区段包含来自宿主的原始基因组DNA的区段。原始基因组DNA的这个区段可以是作为基因组DNA碎裂的直接产物的核酸片段(即,未向片段末端添加一个或多个接头部分)或基因组DNA的已经添加接头的核酸片段。原始基因组DNA区段可以衍生自任何基因组,例如,动物、植物、原生动物、真菌、细菌或病毒基因组,诸如人类、苹果树、贾第虫、酵母、金黄色葡萄球菌(Staphylococcus aureus)或乳头瘤病毒的基因组。DNA的区段可以从任何新鲜、冷冻或固定的(例如,福尔马林固定的和石蜡包埋的)生物来源分离,包括但不限于组织、细胞、血清、血浆、血液或外来体。
所述集合的核酸构建体的第二单链合成核酸区段例如经由磷酸二酯键共价连接至第一单链区段。第二单链合成核酸区段包含标识符序列。在一个实施方案中,所述标识符序列是条码。条码通常是与原始基因组DNA区段的序列共同使用以区分集合中的每个核酸构建体和另一个核酸构建体的8-12个核苷酸的碱基序列。当基因组DNA的片段具有相似的序列时,重要的是标识符或条码序列足够相异,以使得没有两个核酸构建体是相同的。对于包含约10,000个基因组当量(在1ml无细胞DNA中的近似基因组)的集合而言,具有8个核苷酸的独特标识符序列包含足够的多样性(65,536)以确保每个环状构建体是独特的。对于包含约1,000,000个基因组当量(来自10ml血液中的总细胞的近似基因组)的集合而言,具有12个核苷酸的独特标识符序列包含足够的多样性(16,777,216)以确保每个环状构建体是独特的。此外,当基因组DNA或者是随机片段化或以生物方式片段化(即,如在无细胞DNA中)时,基因组DNA和合成的核酸之间的结点将提供协助区分每种环状构建体的额外独特序列。
在另一个实施方案中,所述标识符序列包含如下文所述的一个或多个引物结合位点和/或患者标识符序列。引物结合位点不仅被用来促进扩增,而且还可以单独或与患者标识符序列组合地作为识别序列区段,以用于区分集合中的个别环状构建体。因此,所述集合的核酸构建体的第二单链区段的标识符序列可以包含条码序列、一条或多条引物序列、患者标识符序列或其任何组合。
所述集合的嵌合核酸构建体是环化的,即共价闭合的环化核酸分子。根据本发明的这个方面,环化构建体是完全单链的。在本发明的其它方面,环化构建体可以是部分双链的或完全双链的。
本发明的另一方面涉及用于扩增核酸分子的方法。该方法包括提供如上所述的本发明的不同环状嵌合单链核酸构建体的集合,并将该集合与聚合酶和多个短引物(6至10个核苷酸,其中所述序列的部分包含随机碱基和/或核苷酸类似物;例如,随机六聚体、七聚体、八聚体)掺混以形成扩增反应。所述短引物中的一个或多个与所述集合的一个或多个环状嵌合单链核酸构建体的一部分互补。所述扩增反应混合物经受一种或多种杂交和延伸处理,其中一个或多个短引物与环状嵌合单链核酸构建体杂交且聚合酶延伸杂交的引物以产生多个延伸产物。每个延伸产物包含与来自集合的嵌合单链核酸构建体互补的两条或更多条串联线性序列。
图1(步骤A-D)提供了上述扩增核酸分子的方法的示例性说明。图1的步骤A示出了集合的环状嵌合单链核酸构建体和多个随机六聚体引物。环状构建体中的原始基因组DNA的第一单链区段显示为单一细黑线。原始基因组DNA区段内的突变用(*)表示。环状构建体的独特标识符序列显示为双线。杂交六聚体引物连续延伸以扩增环形靶是使用具有链置换能力的聚合酶,例如Phi29 DNA聚合酶或类似物(图1中描绘为菱形)来实现的。如图1步骤B中所示,杂交的引物的聚合酶延伸最终将置换初始引物,产生单链尾。一个或多个六聚体引物可以随后与单链尾巴杂交,并继续如图1,步骤C和1D中所示以聚合酶介导延伸那些杂交引物,以形成不同长度的双链延伸产物,每个延伸产物含有两条或更多条与环形构建体互补的串联线性序列。
通过这种扩增方法形成的双链延伸产物的集合适于广泛的任一种下一代测序(NGS)方案(例如454焦磷酸测序、通过合成进行的Ion TorrentTM测序、通过连接进行的SOLiDTM测序或通过合成系统进行的MiSeqTM或HiSeqTM测序)。按照NGS方案,双链延伸产物经过片段化以使得靶DNA的一个或多个串联互补拷贝在单一片段内。将接头附接至DNA片段的5’和3’端,以允许利用簇或珠粒扩增进行标准文库制备和模板生成。在测序期间生成原始DNA分子的所有物理连接的互补拷贝的共有序列。因为片段内的真实突变(*)将以2倍或3倍呈现,所以它们可以轻易地与聚合酶错误区分开来。
根据本发明的这个和所有方面,本发明的嵌合环状核酸构建体和其延伸产物的测序可以使用本领域中已知的任何测序方法进行,所述测序方法包括但不限于以下测序方法:荧光引物杂交、分子信标杂交、引物延伸、连接酶检测反应、连接酶链反应、焦磷酸测序、基于核酸外切酶的测序、基于荧光的边合成边测序、基于荧光的边连接边测序、基于纳米孔和纳米管的测序、基于离子的边合成边测序和基于离子的边连接边测序。如本文中所用,“测序”包括用来获得多核苷酸靶标或模板的至少10个连续核苷酸的同一性的方法。
在本发明的另一方面,所述集合的每个环状核酸构建体包含来自宿主生物体的原始基因组DNA的第一单链区段和连接至第一单链区段且包含对宿主生物体而言为外源性的核苷酸序列的第二单链合成核酸区段。所述第二单链合成核酸区段包含独特标识符部分和初级引物结合位点,其中独特标识符部分、初级引物结合位点和原始基因组DNA的区段的核苷酸序列区分所述集合中的一个嵌合单链核酸构建体与所述集合中的所有其它嵌合单链核酸构建体。所述集合的嵌合单链核酸构建体是环化的且适于滚环扩增和/或测序。
本发明的另一个方面涉及一种用于产生适于测序的核酸分子的串联线性拷贝的方法。该方法包括提供如上所述的本发明的不同环状嵌合单链核酸构建体的集合,并将该集合与具有链置换活性的聚合酶和一个或多个初级引物掺混以形成滚环延伸反应。所述一个或多个初级引物与所述集合的一个或多个环状嵌合单链核酸构建体的部分互补。使所述滚环延伸反应混合物经受一种或多种杂交和延伸处理,其中一个或多个引物与环状嵌合单链核酸构建体杂交且聚合酶延伸杂交的引物以产生多个延伸产物。每个延伸产物包含与来自集合的嵌合单链核酸构建体互补的两条或更多条串联线性序列。
图2(步骤A-C)提供了上述扩增核酸分子的方法的示例性说明。图2的步骤A示出了集合的环状嵌合单链核酸构建体和杂交的初级引物。环状构建体中的原始基因组DNA的第一单链区段显示为单一细黑线。原始基因组DNA区段内的突变用(*)表示。环状构建体的独特标识符序列和初级引物结合位点显示为略粗线。杂交引物连续延伸以扩增环形靶是使用具有链置换能力的聚合酶,例如Phi29或Bst DNA聚合酶或类似物(图2中描绘为菱形)来实现的。如图2步骤B中所示,杂交的引物的聚合酶延伸最终将置换初始引物,产生单链尾。使延伸产物从所述环变性(参见图2,步骤C)。提供一个或多个次级引物组,其中每个引物组包含:(a)具有与从初级引物形成的单链延伸产物的第一部分互补的核苷酸序列的第一次级未甲基化引物,以及(b)具有与所述单链延伸产物的第二部分互补的核苷酸序列的第二次级甲基化引物。单链延伸产物与次级引物组、缺乏链置换活性的聚合酶、连接酶和在彼此杂交时裂解单链延伸产物和第一次级引物的核酸内切酶(即,核酸内切酶裂解未甲基化的双链识别序列)掺混。
如图2的步骤C中所示,第一和第二次级引物杂交至单链延伸产物的互补区域。聚合酶延伸杂交的引物,以形成具有与下游的杂交次级引物的连接结。如图2的步骤C中所示,连接酶将延伸的次级引物连接在一起以形成双链延伸产物。核酸内切酶在延伸产物和第一次级引物杂交处裂解这两者,以形成包含靶基因组DNA序列的串联线性拷贝的双链片段。双链延伸产物片段中的串联线性序列的数量反映了在上述方法中使用的第一和第二次级引物的比率。这些串联拷贝片段适于使用如上所述的本领域中已知的任何测序方法测序。对于NGS测序,附接接头以允许标准簇扩增或珠粒扩增和成对末端读序。真突变(*)将出现2次或3次,因此与聚合酶错误区分开来。
本发明的另一个方面涉及一种用于产生核酸分子的串联线性拷贝的方法,如果靶标在原始基因组DNA中是甲基化的(甲基化碱基被描绘成“m”,参见图3)。过程基本上与上文所述相同,将Bst聚合酶用于在BstU1(CG^CG)限制性核酸内切酶的存在下连续延伸杂交的初级引物(图3,步骤B)。BstU1将裂解双链DNA(如果未甲基化),但不裂解杂交的甲基化/未甲基化DNA,也不裂解未甲基化单链DNA(图3,步骤B)。(参见Zierhut和Diffley,“BreakDosage,Cell Cycle Stage and DNA Replication Influence DNA Double Strand BreakResponse,”EMBO J.27(13):1875-85(2008),其在此通过引用整体并入。)由于聚合酶在滚环扩增期间产生钯的若干拷贝,且由于未甲基化CGCG位点在双链形式时被BstU1裂解,所以这个过程特异性地选择原始靶DNA中所有位点BstU1被甲基化的片段。虽然图3说明了利用BstUI限制性核酸内切酶的该方法,但可以利用裂解双链DNA(如果未甲基化),但不裂解杂交的甲基化/未甲基化DNA,也不裂解未甲基化单链DNA的其它核酸内切酶来选择性扩增甲基化基因组DNA。这些核酸内切酶包括但不限于嗜热酶BstHHI(识别GCGC;HhaI的同裂酶)、BsiSI(识别CCGG;HpaII的同裂酶)和TaiI(识别ACGT;MaeII的同裂酶)。所有这些酶都对内部CpG序列的甲基化敏感。该系列中的最后一种酶(TaqI限制酶)对CpG位点处的甲基化不敏感,所以不适用于上述技术。
在本发明的另一个方面,所述集合的每个环状核酸构建体包含连接至第二单链合成核酸区段的来自宿主生物体的原始基因组DNA的第一单链区段,其中所述第二单链区段包含一个或多个引物特异性序列(例如,第一和/或第二固体载体引物特异性部分)以及任选的患者标识符序列。根据本发明的这个方面,第二单链区段可以包含或不包含独特标识符部分。所述集合的嵌合单链核酸构建体是环化的且适于如本文所述的滚环扩增和/或测序。
第二单链区段的患者标识符序列用于识别原始基因组DNA的患者来源。患者标识符序列通常包含约5至8个核苷酸的长度,并且被设计成区分来自不同患者的序列。在优选的实施方案中,患者标识符序列彼此在至少3个位置上有所不同,从而使得在测序中的单个碱基错误仍允许正确的患者标识符序列的阳性识别。在当前临床实验室实践中,样品的批处理通常被设计成与96和384孔板格式兼容,使得8、16、24、48、96或384个样本同时被处理。
本发明的另一方面涉及包含不同的环状嵌合单链核酸构建体的集合的系统。所述集合的每个构建体包含来自宿主生物体的原始基因组DNA的第一单链区段和连接至第一单链区段且包含对宿主生物体而言为外源性的核苷酸序列的第二单链核酸区段。所述第二单链核酸区段的核苷酸序列包含第一固体载体引物特异性部分、第二固体载体引物特异性部分和患者标识符序列。所述集合的嵌合单链核酸构建体是环化的且适于滚环扩增和/或测序。所述系统进一步包括延伸产物的集合,每个延伸产物包含与来自所述集合的嵌合单链核酸构建体互补的两条或更多条串联线性序列。所述集合中的每个延伸产物与所述集合的其互补环状嵌合单链核酸构建体杂交。图4在步骤B提供了本发明的该系统的示例性描绘。
本发明的该系统可以进一步包含具有多个固定的第一寡核苷酸引物的固体载体。所述固体载体上的每个第一寡核苷酸引物具有与集合的嵌合单链核酸构建体的第一固体载体引物特异性部分的核苷酸序列相同并且与延伸产物的第一固体载体引物特异性部分互补的核苷酸序列。因此,所述固体载体上的一个或多个第一寡核苷酸引物可以经由第一固体载体引物特异性部分杂交至延伸产物的集合的延伸产物。图4的步骤C提供了本发明的该系统的示例性描绘。
所述固体载体可以由各种各样的材料制成。基材可以是生物的、非生物的、有机的、无机的或这些中任何的组合,并作为颗粒、链状物、沉淀物、凝胶、片、管、球、珠、容器、毛细管、垫、薄片、薄膜、板、载片、圆盘、膜等存在。所述基材可以具有任何方便的形状,如圆盘、正方形、圆形等。所述基材优选是平坦的,但可以采用多种替代的表面构造。例如,所述基材可以含有杂交发生在其上的凸起或凹陷区域。所述基材和其表面优选形成在其上进行本文中所描述的测序反应的刚性载体。
在本发明的系统和方法中可以利用用于模板制备的市售的下一代测序固体载体平台。例如,在本发明的系统和方法中可以使用Flow Cell、LifeIonSphereTM和乳液PCR珠粒和454乳液PCR珠粒。因此,所述环状嵌合单链核酸构建体的第一固体载体引物特异性部分被设计成与固定在市售NGS固体载体上的引物相同。因此,包含第一固体载体引物特异性部分的补体的延伸产物能够与NGS固体载体表面上的引物杂交。
本发明的该系统可以进一步包含如图5步骤A中所示的交联寡核苷酸的集合。交联寡核苷酸是具有核苷酸序列的两个或更多个重复的寡核苷酸,其中重复的核苷酸序列具有与集合中的嵌合单链核酸构建体的第二单链核酸区段的至少一部分相同的序列。因此,交联寡核苷酸的重复核苷酸序列与嵌合核酸构建体的延伸产物的核苷酸序列的至少一部分(即,延伸产物的对应于第二单链区段的部分)互补。重复核苷酸序列可以具有约10至25个核苷酸的长度。如图5的步骤B-D中所描绘,每个交联寡核苷酸的核苷酸序列重复中的一个或多个与延伸产物的集合的延伸产物的串联线性序列杂交,形成缩合结构。
如图5的步骤E-H中所示,可以将结合至一个或多个交联寡核苷酸的缩合延伸产物捕获在具有多个固定的第一寡核苷酸引物的固体载体上。如上所述,固体载体上的第一寡核苷酸引物具有与延伸产物的第一固体载体引物特异性部分互补的核苷酸序列(即,与嵌合单链核酸构建体的第一固体载体引物特异性部分的核苷酸序列相同的核苷酸序列)。如图5的步骤E中所示,缩合延伸产物结构的一条或多条串联线性序列可以与固体载体上的一个或多个第一寡核苷酸引物杂交,从而固定所述缩合结构。所述交联寡核苷酸可以被设计成含有被酶裂解的可裂解连接(在图5步骤E和F中描绘为三角形)。合适的可裂解连接包括但不限于核糖核苷酸、脱氧尿嘧啶、无嘌呤位点和8-氧代鸟嘌呤。例如,交联寡核苷酸可以含有由APE 1核酸内切酶、Endo III、Endo IV、Endo VIII、Fpg或hOGG1裂解的无嘌呤位点。交联寡核苷酸的裂解允许缩合结构瓦解且延伸产物的个别串联序列通过杂交至固体载体表面上的相邻引物被局部捕获,从而产生地毯样结构(图5,步骤F)。如图5的步骤G中所示,这种方法确保了原始靶基因组DNA序列的数百至数千个串联互补拷贝被彼此相邻地捕获,并适用于后续测序。
本发明的另一方面涉及包含不同的环状嵌合单链核酸构建体的集合的系统。每个构建体包含来自宿主生物体的原始基因组DNA的第一单链区段和连接至第一单链区段且包含对宿主生物体而言为外源性的核苷酸序列的第二单链核酸区段。所述第二单链核酸区段的核苷酸序列包含第一固体载体引物特异性部分、第二固体载体引物特异性部分和患者标识符序列。所述集合的嵌合单链核酸构建体适于滚环扩增和/或测序。所述系统进一步包含:一个或多个寡核苷酸扩增引物,每个引物包含至少第一核苷酸序列部分,其与所述集合的嵌合单链核酸构建体的第一固体载体引物特异性部分或第二固体载体引物特异性部分互补。最后,该系统还具有适用于滚环扩增的聚合酶。
本发明的该系统的示例性描绘示于图4步骤A中。所述环状嵌合核酸构建体含有原始基因组DNA区段(细黑线),该原始DNA区段内的目标单碱基替代或突变由星号(*)表示。所述构建体的第二单链区段包含嵌合构建体的第一固体载体引物特异性部分(描绘为粗黑线)和第二固体载体引物特异性部分(描绘为双黑线)。适用于引发所述嵌合构建体的滚环扩增的扩增引物可以与所述构建体的第一固体载体引物特异性部分的区段互补(如图4步骤A的左图中所示);与所述嵌合构建体的第一和第二固体载体引物特异性部分的区段互补(如图4步骤A的中间图和右图中所示);或与所述构建体的第二固体载体引物特异性部分的部分互补(如图9步骤A中所示)。在后一种实施方案中,与所述嵌合构建体的第二固体载体引物特异性部分互补的扩增引物被固定在固体载体上,从而将在滚环扩增期间形成的延伸产物直接栓系到所述固体载体上。在一个替代性实施方案中,扩增引物可以包含能够如图4步骤D和图10步骤A中所示被栓系到固体载体上的其它部分。在一个实施方案中,所述其它部分包含与固定在固体载体上的捕获寡核苷酸的核苷酸序列互补的独特核苷酸序列。在另一个实施方案中,所述其它部分包含与固定在固体载体上的第一或第二固体寡核苷酸引物互补的核苷酸序列。在另一个实施方案中,所述其它部分是被固定在固体载体上的捕获结合伴侣捕获的捕获部分。所述捕获部分和捕获结合伴侣本质上不必是核酸。例如,所述捕获部分可以是生物素基团或His-Tag,它们将分别被固定的链霉亲和素或NTA基质捕获。
在另一个实施方案中,所述一个或多个寡核苷酸扩增引物包含:(i)与所述集合的嵌合单链核酸构建体的原始基因组DNA区段互补的第一核苷酸序列;(ii)3'部分,其包含可裂解核苷酸或核苷酸类似物和阻断所述寡核苷酸扩增引物的3'聚合酶延伸的阻断基团;和(iii)包含可裂解核苷酸或核苷酸类似物和捕获基团的5'部分,其中所述捕获基团能够被固定到固体载体上。
在另一个实施方案中,所述一个或多个寡核苷酸扩增引物包含:(a)第一寡核苷酸扩增引物,其具有(i)与所述集合的嵌合单链核酸构建体的原始基因组DNA区段的第一部分互补的第一核苷酸序列;和(ii)3'部分,其包含可裂解核苷酸或核苷酸类似物和阻断所述第一寡核苷酸扩增引物的3'聚合酶延伸的阻断基团;及(b)第二寡核苷酸扩增引物,其具有(i)与所述集合的嵌合单链核酸构建体的原始基因组DNA区段的第二部分互补的第一核苷酸序列;和(ii)包含可裂解核苷酸或核苷酸类似物和捕获基团的5'部分,其中所述捕获基团能够被固定到固体载体上。
根据本发明的这个方面,所述系统可以进一步包含具有多个固定的第一寡核苷酸引物的固体载体。所述固体载体上的第一寡核苷酸引物具有与集合的嵌合单链核酸构建体的第一固体载体引物特异性部分的核苷酸序列相同的核苷酸序列(参见例如,图6,步骤B)。该系统的固体载体可以进一步包含多个固定的第二寡核苷酸引物,其具有与集合的嵌合单链核酸构建体的第二固体载体引物特异性部分的核苷酸序列互补的核苷酸序列(参见例如,图5,步骤B)。如上所述,用于模板制备的市售NGS固体载体平台(例如,FlowCell、Life Technologies等)适用于本发明的系统。
本发明的该系统还可以包含如上所述的交联寡核苷酸(即,具有核苷酸序列的两个或更多个重复的寡核苷酸,其中重复的核苷酸序列具有与集合中的嵌合单链核酸构建体的第二单链核酸区段的至少一部分相同的序列)的集合。
根据本发明的这个方面,该系统的聚合酶是适用于滚环扩增的链置换聚合酶。示例性链置换聚合酶包括但不限于:phi29 DNA聚合酶、Bst DNA聚合酶(大片段或5'→3'外切)、Bsu DNA聚合酶(大片段或5'→3'外切)、Deep(外切)聚合酶、克列诺片段(3'→5'外切)、DNA聚合酶I(5'→3'外切)、M-MuLV逆转录酶、(外切)DNA聚合酶和PyroPhage 3173 DNA聚合酶。其它示例性链置换聚合酶包括那些具有热稳定性和链置换活性的聚合酶,如SD DNA聚合酶(突变Taq DNA聚合酶)(参见Fu的美国专利申请公开第2012/0115145号、Ignatov等人的WO2014/161712和Ignatov等人,“A Strong StandDisplacement Activity of Thermostable DNA Polymerase Markedly Improves theResults of DNA Amplification,”BioTechniques 57:81087(2014),其在此通过引用整体并入);AptaHotTaq聚合酶(具有5'侧翼核酸内切酶活性的热稳定性5'→3'聚合酶);衍生自嗜热病毒和微生物的聚合酶(参见Schoenfeld等人的美国专利申请公开2012/0083018,以及Schoenfeld等人的美国专利第8,093,030号,其在此通过引用整体并入;衍生自Thermusantranikianii和Thermus brockianus的聚合酶(如Hjorleifsdottir等人的WO2006/030455以及Hjorleifsdottir等人的美国专利申请公开第2008/0311626号中所公开,所述文献在此通过引用整体并入);衍生自水管致黑栖热菌(Thermus scotoductus)的热稳定性聚合酶(参见Rech等人的WO2007/076461,其在此通过引用整体并入);以及衍生自苍白芽孢杆菌(Bacillus pallidus)的I型DNA聚合酶(参见Hamilton的美国专利第5,736,373号,其在此通过引用整体并入)。本领域中已知的其它链置换聚合酶也适用于本系统和本发明的相关方法。
本发明的另一个方面涉及一种使用该系统对多个核酸分子测序的方法。根据该方法,将杂交至集合的互补环状嵌合单链核酸构建体的寡核苷酸扩增引物与聚合酶掺混,以形成滚环扩增反应混合物。所述滚环扩增反应混合物经受延伸处理,其中聚合酶延伸一个或多个杂交的寡核苷酸扩增引物以产生多个初级延伸产物。每个初级延伸产物包含一条或多条串联线性序列,每个串联线性序列与集合中的环状嵌合单链核酸构建体互补。可以对环状嵌合单链核酸构建体直接测序,例如,环状嵌合构建体是用于合成测序的模板。或者,由滚环扩增反应形成的初级延伸产物是用于测序的模板。如上所述,可以利用本领域中已知的任何测序方法对环状核酸构建体或初级延伸产物测序。
在一个实施方案中,初级延伸产物在测序前被固定在固体载体上。合适的固体载体包含至少多个第一寡核苷酸引物,每个第一寡核苷酸引物具有与集合的嵌合单链核酸构建体的第一固体载体引物特异性部分的核苷酸序列相同的核苷酸序列(即,具有与初级延伸产物的第一固体载体引物特异性部分互补的序列)。合适的固体载体包括但不限于那些市售的并且在下一代测序平台中用于模板制备的固体载体,例如flow cell,Life TechnologiesTMIon SphereTM。初级延伸产物与固体载体上的第一寡核苷酸引物杂交并且如下文更详细所述在载体上测序。
所述固体载体可以进一步包括多个第二寡核苷酸引物。第二引物具有与嵌合单链核酸构建体的第二固体载体引物特异性引物部分互补的核苷酸序列。如图9步骤B中所描绘和本文中更详细地描述,嵌合核酸构建体的滚环扩增可以由固体载体上的第二寡核苷酸引物引发。该方法可以用于将初级延伸产物直接栓系到固体载体上。
如图5的步骤A-G中所描绘,交联寡核苷酸可以用于缩合从滚环扩增反应所形成的生长的初级延伸产物。如图5的步骤A中所示,DNA聚合酶(实心菱形)围绕包含原始基因组区段的环状构建体延伸扩增引物。随着聚合酶继续延伸,生长的初级延伸产物通过杂交至交联寡核苷酸的互补重复区域而缩合(如图5的步骤B中所示)。该过程如图5的步骤C和D中所示继续进行,产生数百至数千个靶DNA的串联互补拷贝的缩合结构。通过改变具有不同互补序列的寡核苷酸的数目以及在给定寡核苷酸内的串联重复的数目,圆环或“交联结”的数目可以变化,从而提供了控制所述结构的“紧凑度”的机会。如图5的步骤E中所示,缩合的初级延伸产物可以经由初级延伸产物与互补的第一寡核苷酸引物的杂交固定在固体载体上。如图5的步骤E中所示,缩合结构在一些位置上与互补的引物杂交。交联寡核苷酸包含可裂解连接,并且在裂解后,缩合结构开始瓦解(图5,步骤F)。初级延伸产物的个别环通过杂交至固体载体表面上的相邻第一引物被局部捕获,从而产生地毯样结构(图5,步骤G)。这种方法确保了靶标的数百至数千个串联拷贝被彼此相邻地捕获,并适用于后续测序。
图6描绘了根据本发明的示例性测序方法。如图6的步骤A中所示,过程开始于DNA聚合酶(例如,Phi29聚合酶;实心菱形)延伸与环状嵌合核酸构建体模板杂交的扩增引物以产生初级延伸产物。延伸产物与固体载体上的第一寡核苷酸引物杂交(图6,步骤B)。如图6的步骤C中所示,从滚环扩增反应形成的生长的延伸产物通过与表面上的相邻的第一寡核苷酸引物杂交被局部捕获在固体载体上,从而产生地毯样结构。如图6的步骤D中所示,这种方法确保了原始基因组DNA区段的数百至数千个串联互补拷贝被彼此相邻地捕获以用于后续测序。
一旦初级延伸产物被固定在固体载体上(图6,步骤D),靠近固体载体上的第一寡核苷酸引物的3'端杂交测序引物(如图6的步骤E中所示)。任选地,PNA或阻断寡核苷酸可以靠近第一寡核苷酸引物的5'端杂交(同样如图6的步骤E中所描绘)。初级延伸产物是用于由测序引物引发的合成测序反应的模板(如图6的步骤F中所描绘)。测序一直持续到所形成的次级合成测序延伸产物由于PNA或阻断寡核苷酸而无法进一步延伸(图6,步骤G)。
为了对相反链测序(即,为了获得初级延伸产物的序列),固体载体上的第一寡核苷酸引物没有被阻断。具有5'-3'核酸酶活性的聚合酶(实心菱形)在固体载体上延伸栓系测序引物,同时消化通过合成反应测序所得产物,如图6,步骤H中所示。如图6,步骤I中所示,聚合酶(实心菱形)延伸链,直到其由于PNA或阻断寡核苷酸(宽条纹线)而无法继续。这会生成模板的单长度拷贝,每个模板包含原始基因组DNA序列的拷贝。如图6的步骤J中所示,使原始初级延伸产物和环状模板变性和洗掉。使第二测序引物与每个单长度模板链杂交(如图6的步骤K中所示),且使用合成测序获得固定化模板的序列(如图6的步骤L和M中所示)。
图7描绘了根据本发明的另一种示例性测序方法。该方法包括环状嵌合核酸构建体的滚环扩增以及将初级延伸产物捕获在具有第一和第二寡核苷酸引物的固体载体上。如图7的步骤A中所示,链置换DNA聚合酶(实心菱形)在环化模板上延伸扩增引物,以产生单链初级延伸产物。固体载体表面上的第一寡核苷酸引物含有位于其3'端的可移除阻断基团,这使得它们在滚环扩增过程中无法延伸(图7,步骤B)。阻断基团是防止聚合酶或其它酶扩增、延伸寡核苷酸或以生产性方式与寡核苷酸反应的化学部分。在这个实例中,所述阻断基团防止3'端的聚合酶延伸。合适的阻断基团包括但不限于C3-间隔基、C18-间隔基、终止子核苷酸、2'-O-甲基核糖核苷酸衍生物、3'磷酸、或3'或2'OH部分的其它修饰。阻断基团本身可以是可裂解的,诸如通过使用可逆终止子核苷酸,或3'磷酸,或阻断基团和任选一些额外的核苷酸可以通过在可裂解连接处裂解(然后释放游离的3'OH端)去除。合适的可裂解连接包括但不限于核糖核苷酸、脱氧尿嘧啶、无嘌呤位点和8-氧代鸟嘌呤。如图7的步骤C中所示,当滚环扩增继续进行而产生生长的初级延伸产物时,该产物通过与固体载体表面上的相邻的第一寡核苷酸引物杂交被局部捕获,从而产生地毯样结构。这种方法确保了靶标的数百至数千个串联拷贝被彼此相邻地捕获在固体载体表面上(图7,步骤D)。
如图7的步骤E中所示,将阻断基团从固体载体上的杂交至初级延伸产物的第一寡核苷酸引物中移除。阻断基团可以通过裂解可裂解连接来移除。核糖核苷酸可裂解连接可以用RNA酶H裂解;脱氧尿嘧啶可裂解连接可以用UDG和AP核酸内切酶裂解,或使用UDG、EndoVIII和T4激酶裂解;无嘌呤位点可裂解连接可以用Tth Endo IV、Endo IV或AP核酸内切酶裂解;且8-氧代鸟嘌呤可裂解连接可以用Fgp裂解。一旦引物未被阻断,它就会延伸,从而利用缺乏5'→3'核酸酶活性的聚合酶(实心菱形)在固体载体上的数百至数千个位置拷贝初级延伸产物(图7,步骤F)。这产生环化模板的单长度次级延伸产物。如图7的步骤G中所示,使初级延伸产物和环状模板变性并洗掉,以使得所述模板的所得的次级延伸产物适用于如图8的步骤A-I中所描绘的后续测序。
图8说明了捕获在具有第一和第二寡核苷酸引物的固体载体上的滚环扩增靶标(例如,次级延伸产物)的测序。图8步骤A显示如图7中所描述从杂交的初级延伸产物的聚合酶介导的延伸产生的单长度次级延伸产物。测序过程开始于将测序引物杂交至次级延伸产物(如图8步骤A中所示)。使用合成测序来获得固定的次级延伸产物的序列(图8,步骤B)。测序一直持续到延伸产物到达栓系的第一寡核苷酸引物的末端(图8,步骤C)。合成测序产物从拴系的次级延伸产物变性且单链次级延伸产物杂交至固体载体上的第二寡核苷酸引物(如图8的步骤D中所示)。通过延伸杂交的第二寡核苷酸引物以产生次级延伸产物的全长拷贝(即,三级延伸产物)来拷贝次级延伸产物(图8,步骤E)。次级延伸产物被裂解、变性并洗掉(图8,步骤E-F),留下适用于后续测序的栓系的三级延伸产物。使测序引物与三级延伸产物杂交(图8,步骤G),并进行合成测序以获得三级产物的序列(如图8的步骤H和I中所示)。
可以使用如本文所描述和描绘的合成测序来实现次级和三级延伸产物的测序。合成测序包括基于荧光的边合成边测序和基于离子的边合成边测序。还可以采用其它合适的测序方法,包括例如但不限于:荧光引物杂交、分子信标杂交、引物延伸、基于核酸外切酶的测序、连接酶检测反应、连接酶链反应、焦磷酸测序、基于荧光的边连接边测序、基于纳米孔和纳米管的测序以及基于离子的边连接边测序。
图9描绘了根据本发明的另一种示例性测序方法。如图9的步骤A中所示,该实施方案包括将嵌合环状核酸构建体与固体载体上的未阻断的第二寡核苷酸引物直接杂交。第二引物用作扩增引物,以引发环状构建体的滚环扩增。所生成的初级延伸产物被直接栓系到固体载体上(图9,步骤A)。通过滚环扩增产生的初级延伸产物杂交至固体载体上的含有可移除的3'阻断基团的第一寡核苷酸引物(如图9的步骤B和C中所示),从而产生多个“地毯环”结构。去除第一引物的3'阻断基团(图9,步骤D),以允许第一引物被合适的聚合酶(例如,缺乏5'→3'核酸酶活性的聚合酶)延伸,从而产生由数百至数千个共价连接至固体载体表面上的单长度次级延伸产物构成的表面(图9,步骤E)。如图9的步骤E-F中所示,用裂解第一引物的位点特异性裂解试剂或酶处理表面且随后进行变性步骤会释放初级延伸产物,留下共价连接的次级延伸产物,所述次级延伸产物适用于如图8的步骤A-I中所示和所述的后续测序。
图10描绘了根据本发明的另一种示例性测序方法。在这个实施方案中,扩增引物包含短单链尾,即,被捕获在固体载体上的其它部分。如图10的步骤A中所描绘,所述其它部分可以包含与固体载体表面上的捕获探针或引物的核苷酸序列互补的核苷酸序列。所述其它部分和其互补的捕获探针或引物的杂交直接将通过滚环扩增形成的初级延伸产物栓系到固体载体上。当滚环扩增继续进行而产生包含嵌合环状结构的串联互补拷贝的生长的初级延伸产物时,该初级延伸产物通过与表面上的3'阻断型第一寡核苷酸引物杂交被局部捕获,从而在表面上形成多个地毯环结构(图10,步骤B和C)。解除对第一引物的阻断(图10,步骤D),并利用缺乏5'→3'核酸酶活性的聚合酶使其延伸,以形成具有均匀长度的多个次级延伸产物(图10,步骤E)。变性会释放初级延伸产物,并留下与原始环化模板具有相同含义且全部在其3'端具有限定的测序引物结合序列的共价连接的次级延伸产物。共价连接的次级延伸产物是用于如图8中所示的测序的合适模板。
图11说明了根据本发明的另一种示例性测序方法。在图11的步骤A中,Phi29 DNA聚合酶(实心菱形)在嵌合环模板上延伸扩增引物,以产生短单链初级延伸产物。使聚合酶和初级延伸产物从环状模板变性。如图11的步骤B中所示,初级延伸产物与固体载体上的第一引物杂交。通过固定的第一寡核苷酸引物在多个位置的聚合酶延伸(实心菱形)拷贝初级延伸产物。合适的聚合酶包括如上所述的缺乏5'→3'核酸酶活性的聚合酶。这产生单长度次级延伸产物(图11,步骤C)。使初级延伸产物变性并洗掉(如图11的步骤D中所示)。使用簇扩增方法扩增留下的单链次级延伸产物,其中次级延伸产物与固体载体上的第二寡核苷酸引物杂交(如图11的步骤E中所示)。利用聚合酶延伸第二引物(图11,步骤F),以形成三级延伸产物。变性(图11,步骤G)之后,次级和三级延伸产物与固体载体上的互补的第一和第二引物杂交(图11,步骤H)。如图11I中所示,杂交的引物经过聚合酶延伸形成次级和三级延伸产物的拷贝。使延伸产物变性,并重复所述过程以产生足够用于使用图8中所描绘的方法对每条链测序的模板(图11,步骤J)。形成具有有限(短)RCA扩增的共价附接的相同拷贝的替代性方式包括Sequoia扩增(Barany等人的WO2013/012440,该文献以引用的方式整体并入本文中)和wildfire扩增(Ma等人,“Isothermal Amplification Method for Next-Generation Sequencing,”.Proc Natl Acad Sci U S A 10(35):14320-3(2013),该文献以引用的方式整体并入本文中)。
图12说明了根据本发明的另一种示例性测序方法,其类似于图11中所呈现的方法。在图12的步骤A中,Phi29或Bst DNA聚合酶(实心菱形)在嵌合环模板上延伸扩增引物,以产生长单链初级延伸产物。使聚合酶和初级延伸产物从环状模板变性。如图12的步骤B中所示,初级延伸产物与固体载体上的多于一个孔或区域内的多个第一引物杂交。由于初级延伸产物是长的,所以它可以延伸进入具有引物的固体表面的多个孔或离散区域中。长延伸产物的这种性质的优点在于:相同的靶标将在多个相邻的孔或区域中测序,从而提供低丰度突变的额外验证。如图12的步骤C中所示,通过固定的第一寡核苷酸引物在多个位置的聚合酶延伸(实心菱形)拷贝初级延伸产物。合适的聚合酶包括如上所述的缺乏5'→3'核酸酶活性的聚合酶。这产生单长度次级延伸产物,除了当在生成串联重复延伸产物的孔之间桥接时以外(图12,步骤C和D)。使初级延伸产物变性并洗掉(如图12的步骤E中所示)。使用簇扩增方法扩增留下的单链次级延伸产物,其中次级延伸产物与固体载体上的第二寡核苷酸引物杂交(如图11的步骤E-I中所示)。使延伸产物变性,并重复所述过程以产生足够用于使用图8中所描绘的方法对每条链测序的模板(参见图11,步骤J)。
本发明的另一方面涉及制备是本文所述的系统和方法的组成部分的环状嵌合单链核酸构建体的方法。下文描述了一些示例性方法并且在附图中描绘了这些方法。
用于制备环状嵌合单链核酸构建体的一种合适的方法包括提供含有一个或多个靶基因组DNA区段的样品。所述靶基因组DNA区段可以潜在地含有对于检测来说受关注的一个或多个碱基差异或一个或多个甲基化残基。所述方法进一步包括提供一个或多个第一寡核苷酸探针,每个第一寡核苷酸探针包含:(a)5'靶标特异性部分;(b)3'靶标特异性部分;和(c)其它部分。所述其它部分是核苷酸序列,其包含:(i)患者标识符序列;(ii)第一固体载体引物特异性部分;和(iii)第二固体载体引物特异性部分。在有效地使第一寡核苷酸探针的3'靶标特异性部分以碱基特异性方式与靶基因组DNA区段的互补3'端杂交以及使第一寡核苷酸探针的5'靶标特异性部分以碱基特异性方式与靶基因组DNA区段(如果存在于样品中)的互补5'端杂交的条件下,使样品和一个或多个第一寡核苷酸探针接触。杂交后,产生适于连接杂交至第一寡核苷酸探针的靶基因组DNA区段的3'和5'端的一个或多个可连接结,且靶基因组DNA片段在所述一个或多个连接结处连接在一起以形成集合的环状嵌合单链核酸构建体。
图13,步骤A-E示出了用于产生如上所述的适于测序的嵌合环状单链核酸“靶”构建体的示例性方法。在此实施方案中,原始基因组区段包含平均长度为160bp的无细胞DNA(cfDNA)的区段,或剪切至约160bp片段的基因组DNA的区段(“靶寡核苷酸”或“DNA区段”)。所述过程开始于将短接头连接至DNA区段(粗黑条,图13,步骤A)。如图13的步骤B中所示,含有与靶DNA区段的5'和3'端互补并与3'接头互补的序列的寡核苷酸探针杂交至DNA区段。邻近图13步骤B中的靶DNA寡核苷酸的3'端的成环区域是靶寡核苷酸的不与寡核苷酸探针互补的区域。如该图中所示,靶寡核苷酸区段和寡核苷酸探针之间的非互补的小区域不影响形成嵌合环状构建体的过程。
寡核苷酸探针的其它部分(显示为粗黑条)还可以含有独特标识符序列、患者标识符序列、引物结合序列和/或可裂解连接(图13,步骤B,左图,描绘在粗条内的可裂解连接被标记为“U”)。所述寡核苷酸探针还可以在一端含有阻断基团(图13,步骤B,右图;探针具有5'阻断基团)。如图13的步骤C中所示,聚合酶(实心菱形)延伸DNA区段的杂交短接头3'端以拷贝寡核苷酸探针的其它部分。在此实施方案中使用的聚合酶可以包含核酸外切酶活性,例如,5'至3'核酸外切酶活性或3'至5'核酸外切酶活性。在延伸后,5'-核酸酶在靶DNA的匹配的5'-重叠碱基处裂解移除5'接头区域,从而留下可连接的5'-磷酸根。聚合酶还使用靶DNA区段作为模板来延伸寡核苷酸探针的3'端(图13,步骤C),但不裂解阻断基团(图13,步骤C,左侧)。在图13的步骤D(左图)中,连接酶(实心圆)共价地密封延伸的靶基因组DNA区段的3'端和5'端之间以及延伸的寡核苷酸探针的3'端和5'端之间的连接结,以形成环状连接产物。在环化寡核苷酸探针的可裂解连接(例如,dU的UDG裂解,实心三角形)处引入缺口,以使得寡核苷酸探针易发生核酸外切酶消化(图13,步骤E,左图)。如图13的步骤D(右图)中所示,连接酶(实心圆)共价地密封延伸的靶基因组DNA区段的3'端和5'端之间的连接结;然而,寡核苷酸探针上的5'阻断基团防止寡核苷酸探针的环化。如图13的步骤E中所示,核酸外切酶消化所有未连接的或有缺口的寡核苷酸产物(即,寡核苷酸探针),只留下连接至含有例如独特标识符序列、引物结合序列或患者标识符序列的其它部分的包含原始靶DNA区段的所需单链环状核酸构建体。如上所述,所得环化产物适用于滚环扩增和环形测序。
图14步骤A-E中所描绘的过程与图13步骤A-E中所示的过程基本上相同;然而,寡核苷酸探针包含在其3'端上的阻断基团(3'-Blk)、一个或多个可裂解连接(“r”)、引物结合序列和任选的5'捕获基团(“Z”)(参见图14,步骤B)。聚合酶(实心菱形)延伸DNA区段的杂交短接头3'端以拷贝寡核苷酸探针的其它部分。DNA区段的5'端在重叠匹配碱基处的核酸酶裂解产生可连接的5'-磷酸根(图14,步骤C)。在图14的步骤D中,连接酶(实心圆)共价密封延伸的末端以形成环状靶连接产物。寡核苷酸探针的3'阻断基团防止寡核苷酸探针的延伸。随后,通过在可裂解连接处的裂解,例如核糖核苷酸“r”的RNA酶(实心三角形)裂解,移除阻断基团(图14,步骤D)。如图14的步骤E中所示,具有链置换活性的聚合酶(实心菱形)延伸寡核苷酸探针的自由的3'端以启动滚环扩增。通过滚环扩增形成的初级延伸产物适用于测序。可以在滚环扩增之前或之后将任选的5'Z基团捕获在固体载体上。一旦被捕获,与引物结合的环状连接产物或其延伸物可以经由在可裂解连接处的裂解从固体载体释放,无论是在滚环扩增之前或之后。
图15和图17示出了如图13中所描绘的用于产生适于测序的嵌合环状单链核酸“靶”构建体的类似过程。靶基因组DNA衍生自平均长度为160bp的cfDNA或剪切至约160bp片段的基因组DNA。所述过程开始于将短接头连接至DNA区段(粗黑条,图15,步骤A和图17,步骤A)。如图15的步骤B和图17的步骤B中所示,含有与DNA区段的5'和3'端互补并与DNA区段的3'接头互补的序列的寡核苷酸探针杂交至靶DNA区段。在图15步骤B中所描绘的实施方案中,寡核苷酸探针包含一个区域,即与靶寡核苷酸的3'端非互补的核苷酸序列部分(图15步骤B中靠近寡核苷酸探针的3'端的环出部分)。此外,靶寡核苷酸的5'端(包括接头)不与寡核苷酸探针互补,从而形成侧翼。在图17步骤B的实施方案中,寡核苷酸探针和靶寡核苷酸分别包含与靶寡核苷酸或探针寡核苷酸非互补的核苷酸序列部分。这些非互补区域被描绘为靠近寡核苷酸探针的3'端的成环区域和靠近靶寡核苷酸的5'端的成环区域(图17,步骤B)。这些区域不影响形成环化核酸构建体的整体过程。
寡核苷酸探针的其它部分(显示为粗黑条)可以含有独特标识符序列、患者标识符序列、引物结合序列和/或可裂解连接(在粗条内描绘为“U”(图15,步骤B和图17,步骤B,左图)。所述寡核苷酸探针还可以在一端上含有阻断基团(图15,步骤B和图17,步骤B,右图;阻断基团在寡核苷酸探针的5’端上)。如图15的步骤C和图17的步骤C中所示,聚合酶(实心菱形)延伸DNA区段的杂交短接头3'端以拷贝寡核苷酸探针的其它部分。在此实施方案中使用的聚合酶可以包含核酸外切酶活性,例如,5'至3'核酸外切酶活性或3'至5'核酸外切酶活性。在延伸后,5'-核酸酶在靶DNA的匹配的5'-重叠碱基处裂解移除5'接头区域,从而留下可连接的5'-磷酸根(图15,步骤C和图17,步骤C)。聚合酶还使用靶DNA区段作为模板来延伸寡核苷酸探针的3'端(图15,步骤C和图17,步骤C)。所述探针的5'上的阻断基团(图15,步骤C和图17,步骤C,左侧)未裂解。在图15的步骤D和图17的步骤D(左图)中,连接酶(实心圆)共价地密封延伸的靶基因组DNA区段的3'端和5'端之间以及延伸的寡核苷酸探针的3'端和5'端之间的连接结,以形成环状连接产物。在环化寡核苷酸探针的可裂解连接(例如,dU的UDG裂解,实心三角形)处引入缺口,以使得寡核苷酸探针易发生核酸外切酶消化(图15,步骤E和图17,步骤E,左图)。如图15的步骤D和图17的步骤D(右图)中所示,连接酶(实心圆)共价地密封延伸的靶基因组DNA区段的3'端和5'端之间的连接结;然而,寡核苷酸探针上的5'阻断基团防止寡核苷酸探针的环化。如图15的步骤E和图17的步骤E中所示,核酸外切酶消化所有未连接的或有缺口的寡核苷酸产物(即,寡核苷酸探针),只留下连接至含有例如独特标识符序列、引物结合序列或患者标识符序列的其它部分的包含原始靶DNA区段的所需单链环状核酸构建体。如上所述,所得环化产物适用于滚环扩增和环形测序。
图16和图18中所描绘的过程基本上分别与图15和图17中所示的过程相同;然而,寡核苷酸探针包含在其3'端上的阻断基团(3’-Blk)、一个或多个可裂解连接、引物结合序列和任选的5'捕获基团(“Z”)(参见图16的步骤B和图18的步骤B)。聚合酶(实心菱形)延伸DNA区段的杂交短接头3'端以拷贝寡核苷酸探针的其它部分。DNA区段的5'端在重叠匹配碱基处的核酸酶裂解产生可连接的5'-磷酸根(图16,步骤C和图18,步骤C)。在图16的步骤D和图18的步骤D中,连接酶(实心圆)共价密封延伸的末端以形成环状连接产物。寡核苷酸探针的3'阻断基团防止寡核苷酸探针的延伸。随后,通过在可裂解连接处的裂解,例如核糖核苷酸“r”的RNA酶(实心三角形)裂解,移除阻断基团。如图16的步骤E和图18的步骤E中所示,具有链置换活性的聚合酶(实心菱形)延伸寡核苷酸探针的自由的3'端以启动滚环扩增。通过滚环扩增形成的初级延伸产物适用于测序。可以在滚环扩增之前或之后将任选的5'Z基团捕获在固体载体上。一旦被捕获,与引物结合的环状连接产物或其延伸物可以经由在可裂解连接处的裂解从固体载体释放,无论是在滚环扩增之前或之后。
图19和图21示出了用于产生如上参照图13、15和17所述的适于测序的嵌合环状单链核酸“靶”构建体的类似过程。靶基因组DNA衍生自平均长度为160bp的cfDNA或剪切至约160bp片段的基因组DNA。在此实施方案中,过程开始于由末端转移酶介导短核苷酸序列尾加成到靶寡核苷酸链的3'端上(靶寡核苷酸的3'端上的粗黑条;图19,步骤A和图21,步骤A)。如图19的步骤B和图21的步骤B中所示,含有与DNA区段的5'和3'端互补并与DNA区段的3'接头互补的序列的寡核苷酸探针杂交至靶DNA区段。在图19步骤B中所描绘的实施方案中,DNA寡核苷酸包含一个区域,即在其3'端上的与探针寡核苷酸非互补的核苷酸序列部分(图19步骤B中靠近靶寡核苷酸的3'端的环出部分)。此外,靶寡核苷酸的5'端不与寡核苷酸探针互补,从而形成侧翼。在图21步骤B的实施方案中,寡核苷酸探针包含与靶寡核苷酸非互补的核苷酸序列部分。该非互补区域被描绘成邻近寡核苷酸探针的3'端的环状区域。在图21步骤B中的靶寡核苷酸的5'端不与寡核苷酸探针互补,从而形成适于核酸酶裂解的侧翼。靶寡核苷酸和探针寡核苷酸之间的这些非互补性区域不影响形成环化核酸构建体的整体过程。
寡核苷酸探针的其它部分(显示为粗黑条)可以含有独特标识符序列、患者标识符序列、引物结合序列和/或可裂解连接(在粗条内标记为“U”)(图19,步骤B和图21,步骤B,左图)。所述寡核苷酸探针还可以在一端上含有阻断基团(例如,图19,步骤B和图21,步骤B,右图显示阻断基团在寡核苷酸探针的5’端上)。如图19的步骤C和图21的步骤C中所示,聚合酶(实心菱形)延伸DNA区段的杂交短接头3'端以拷贝寡核苷酸探针的其它部分。在此实施方案中使用的聚合酶可以包含核酸外切酶活性,例如,5'至3'核酸外切酶活性或3'至5'核酸外切酶活性。在延伸后,5'-核酸酶在靶DNA的匹配的5'-重叠碱基处裂解移除5'接头区域,从而留下可连接的5'-磷酸根。聚合酶还使用靶DNA区段作为模板来延伸寡核苷酸探针的3'端(图19,步骤C和图21,步骤C)。所述探针的5'上的阻断基团(图19,步骤C和图21,步骤C,右侧)未裂解。在图19的步骤D和图21的步骤D(左图)中,连接酶(实心圆)共价地密封延伸的靶基因组DNA区段的3'端和5'端之间以及延伸的寡核苷酸探针的3'端和5'端之间的连接结,以形成环状连接产物。在环化寡核苷酸探针的可裂解连接(例如,dU的UDG裂解,实心三角形)处引入缺口,以使得寡核苷酸探针易发生核酸外切酶消化(图19,步骤E和图21,步骤E,左图)。如图19的步骤D和图21的步骤D(右图)中所示,连接酶(实心圆)共价地密封延伸的靶基因组DNA区段的3'端和5'端之间的连接结;然而,寡核苷酸探针上的5'阻断基团防止寡核苷酸探针的环化。如图19的步骤E和图21的步骤E中所示,核酸外切酶消化所有未连接的或有缺口的寡核苷酸产物(即,寡核苷酸探针),只留下连接至含有例如独特标识符序列、引物结合序列或患者标识符序列的其它部分的包含原始靶DNA区段的所需单链环状核酸构建体。如上所述,所得环化产物适用于滚环扩增和环形测序。
图20和图22中所描绘的过程基本上分别与图19和图21中所示的过程相同;然而,寡核苷酸探针包含在其3'端上的阻断基团(3’-Blk)、一个或多个可裂解连接(“r”)、引物结合序列和任选的5'捕获基团(“Z”)(如图20的步骤B和图22的步骤B中所示)。聚合酶(实心菱形)延伸DNA区段的杂交短接头3'端以拷贝寡核苷酸探针的其它部分。DNA区段的5'端在重叠匹配碱基处的核酸酶裂解产生可连接的5'-磷酸根(图20,步骤C和图22,步骤C)。在图20的步骤D和图22的步骤D中,连接酶(实心圆)共价密封靶标的延伸的3'端至其5'端以形成环状连接产物。寡核苷酸探针的3'阻断基团防止寡核苷酸探针的延伸。随后,通过在可裂解连接处的裂解,例如核糖核苷酸“r”的RNA酶(实心三角形)裂解,移除阻断基团。如图20的步骤E和图22的步骤E中所示,具有链置换活性的聚合酶(实心菱形)延伸寡核苷酸探针的自由的3'端以启动滚环扩增。通过滚环扩增形成的初级延伸产物适用于测序。可以在滚环扩增之前或之后将任选的5'Z基团捕获在固体载体上。一旦被捕获,与引物结合的环状连接产物或其延伸物可以经由在可裂解连接处的裂解从固体载体释放,无论是在滚环扩增之前或之后。
图23和图25示出了用于产生如上参照图13、15、17、19和21所述的适于测序的嵌合环状单链核酸“靶”构建体的类似过程。靶基因组DNA衍生自平均长度为160bp的cfDNA或剪切至约160bp片段的基因组DNA。在图23和图25的实施方案中,没有将3'或5'接头或尾巴添加到基因组DNA片段上。如图23的步骤B和图25的步骤B中所示,含有与DNA区段的5'和3'端互补的序列的寡核苷酸探针杂交至靶DNA区段。在图23步骤B中所描绘的实施方案中,DNA寡核苷酸的3'和5'端不与寡核苷酸探针互补,从而形成两个非杂交侧翼。在图25步骤B的实施方案中,DNA寡核苷酸的3'和5'端与寡核苷酸探针互补。
寡核苷酸探针的其它部分(显示为粗黑条)可以含有独特标识符序列、患者标识符序列、引物结合序列和/或可裂解连接(在粗条内标记为“U”(图23,步骤B和图25,步骤B,左图)。所述寡核苷酸探针还可以在一端上含有阻断基团(例如,图23,步骤B和图25,步骤B,右图;阻断基团在寡核苷酸探针的5’端上)。如图23的步骤C中所示,具有3’核酸酶活性的聚合酶(实心菱形)去除靶寡核苷酸的单链3'端,然后延伸DNA区段的3'端以拷贝寡核苷酸探针的其它部分。由聚合酶介导的靶寡核苷酸的3'端的延伸也发生在图25步骤B的过程中。延伸后,在图23步骤C和图25步骤C的过程中,5'-核酸酶在靶DNA的匹配的5'-重叠碱基处裂解移除5'接头区域,从而留下可连接的5'-磷酸根。聚合酶还使用靶DNA区段作为模板来延伸寡核苷酸探针的3'端(图23,步骤C和图25,步骤C)。所述探针的5'上的阻断基团(图23,步骤C和图25,步骤C,右侧)未裂解。在图23的步骤D和图25的步骤D(左图)中,连接酶(实心圆)共价地密封延伸的靶基因组DNA区段的3'端和5'端之间以及延伸的寡核苷酸探针的3'端和5'端之间的连接结,以形成环状连接产物。在环化寡核苷酸探针的可裂解连接(例如,dU的UDG裂解,实心三角形)处引入缺口,以使得寡核苷酸探针易发生核酸外切酶消化(图23,步骤E和图25,步骤E,左图)。如图23的步骤D和图25的步骤D(右图)中所示,连接酶(实心圆)共价地密封延伸的靶基因组DNA区段的3'端和5'端之间的连接结;然而,寡核苷酸探针上的5'阻断基团防止寡核苷酸探针的环化。如图23的步骤E和图25的步骤E中所示,核酸外切酶消化所有未连接的或有缺口的寡核苷酸产物(即,寡核苷酸探针),只留下连接至含有例如独特标识符序列、引物结合序列或患者标识符序列的其它部分的包含原始靶DNA区段的所需单链环状核酸构建体。如上所述,所得环化产物适用于滚环扩增和环形测序。
寡核苷酸探针(例如,在图25中所描绘的过程中使用的寡核苷酸探针)的3'和5'靶标特异性部分可以被设计为包含与靶基因组DNA区段的一个或多个核苷酸错配。这种设计特征确保了可连接的环化核酸构建体的靶基因组DNA区段可以与可连接的环化核酸构建体的聚合酶延伸部分区分开来(即,在图25E中,环化构建体的实线可以与构建体的虚线区分开来)。
图24和图26中所描绘的过程基本上分别与图23和图25中所示的过程相同;然而,寡核苷酸探针包含在其3'端上的阻断基团(3'-Blk)、一个或多个可裂解连接、引物结合序列和任选的5'捕获基团(“Z”)(图24的步骤B和图26的步骤B)。聚合酶(实心菱形)延伸DNA区段的杂交3'端以拷贝寡核苷酸探针的其它部分。在图24步骤C的实施方案中,聚合酶在延伸之前裂解靶寡核苷酸的3'非互补侧翼。DNA区段的5'端在重叠匹配碱基处的核酸酶裂解产生可连接的5'-磷酸根(图24,步骤C和图26,步骤C)。在图24的步骤D和图26的步骤D中,连接酶(实心圆)共价密封DNA区段的延伸的3'端至其5'端以形成环状连接产物。寡核苷酸探针的3'阻断基团防止寡核苷酸探针的延伸。随后,通过在可裂解连接处的裂解,例如核糖核苷酸“r”的RNA酶(实心三角形)裂解,移除阻断基团。如图24的步骤E和图26的步骤E中所示,具有链置换活性的聚合酶(实心菱形)延伸寡核苷酸探针的自由的3'端以启动滚环扩增。通过滚环扩增形成的初级延伸产物适用于测序。可以在滚环扩增之前或之后将任选的5'Z基团捕获在固体载体上。一旦被捕获,与引物结合的环状连接产物或其延伸物可以经由在可裂解连接处的裂解从固体载体释放,无论是在滚环扩增之前或之后。
图27示出了形成含有相邻甲基化HinP1I位点(GCGC)的单链环化核酸构建体的过程。所述环化核酸构建体适用于甲基化HinP1I位点的检测和/或测序。如图27的步骤A中所示,过程开始于在未甲基化HinP1I识别位点处利用HinP1I裂解cfDNA或基因组DNA,以形成约160bp的基因组DNA区段。靶寡核苷酸片段内的甲基化HinP1I位点由‘m’表示。如图27的步骤B中所示,具有独特标识符序列(粗黑线)和靠近寡核苷酸探针的3'和5'端的未甲基化HinP1I序列(即,与cfDNA的HinP1I位点互补)的寡核苷酸探针与具有甲基化HinP1I位点(左图)或未甲基化HinP1I位点(右图)的靶cfDNA寡核苷酸杂交。寡核苷酸探针的5'端包含阻断基团且3'端与靶寡核苷酸错配以防止聚合酶延伸。在图27步骤C中,杂交至基因组靶区段的寡核苷酸探针经受HinP1I(实心三角形)裂解。如果探针和靶寡核苷酸都不包含甲基化HinP1I位点,则HinP1I裂解靶寡核苷酸和探针寡核苷酸,从而使未甲基化靶序列不经受进一步测定。如果靶寡核苷酸含有甲基化HinP1I位点,但探针寡核苷酸不含甲基化HinP1I位点(如图27步骤C的左图中所示),则HinP1I只裂解探针寡核苷酸,从而在探针上产生可延伸3'-OH和可连接的5'-磷酸根。聚合酶(实心菱形)延伸寡核苷酸探针的自由3'端,且连接酶(实心圆)共价密封寡核苷酸探针的3'延伸端和5'端,从而形成共价闭合的连接产物(图27,步骤D)。HinP1I的热失活或聚合酶合并修饰的核苷酸防止HinP1I再裂解。如图27步骤E中所示,核酸外切酶消化会移除所有未连接的或裂解的产物,从而只留下包含靶DNA的补体和独特标识符序列的所需单链环状DNA构建体。该环化连接产物适用于滚环扩增和后续测序。
图28示出了用于发现在整个基因组中的相邻HinP1I位点(GCGC)处的甲基化的过程。该过程包括用HinP1I裂解基因组DNA并将具有阻断型5'端的短接头(粗黑线)连接到裂解的基因组片段上(如图28步骤A中所示)。“m”指示甲基化HinP1I位点。在图28的步骤B中,利用5'阻断引物进行的有限PCR扩增产生未甲基化产物。当被HinP1I(实心三角形)裂解时,只有在原始靶中甲基化的相邻HinP1I位点(GCGG)产生未被阻断的片段。如图28步骤C中所示,连接(实心圆)在含有任选的独特标识符序列(灰色填充双线)、任选的患者标识符序列(灰色填充双线),且具有阻断的3'端或含硫代硫酸的主链(****)的接头(双线)上,以抑制随后被3'-核酸外切酶(实心三角形)消化。只有两侧都连接有接头的片段仍将为双链。在图28的步骤D中,接头的游离端通过以下方式具备连接能力:(i)使5'端磷酸化;(ii)去除阻断的3'基团;或(iii)使用5'核酸酶活性裂解掉匹配的5'重叠碱基或侧翼,留下可连接的5'-磷酸根;或其任何组合。在图28的步骤E中,连接条件被设计成有利于寡聚作用。连接产物包含最初在靶DNA中甲基化的相邻HinP1I序列以及可选的独特标识符和/或患者标识符序列。最终产物适用于任选的额外步骤和后续测序。
图29示出了用于产生适于在始于平均长度为160bp的cfDNA或剪切至约160bp片段的基因组DNA(“靶寡核苷酸”或“DNA区段”)的已知基因组区域中检测在相邻AciI位点(GCGG)处的甲基化的嵌合环状单链核酸构建体的过程。如图29的步骤A中所示,所述过程开始于将耐亚硫酸氢盐的接头(粗黑线)附接在基因组DNA区段的3'和5'端上(例如,通过连接)。用亚硫酸氢盐处理基因组DNA会将未甲基化胞嘧啶转化为尿嘧啶,从而产生单链产物(图29步骤A中的“m”代表甲基化AciI位点)。进行有限PCR以产生双链产物,并用AciI(实心三角形)裂解所得的PCR产物。只有原始靶区段中的甲基化位点仍为GCGG并经受AciI裂解以产生可连接的末端。如图29的步骤B中所示,含有与裂解的靶核苷酸的5'和3'侧互补的序列和任选的5’阻断基团的寡核苷酸探针与其相应的互补靶核苷酸互补。除了靶标特异性部分,寡核苷酸探针还包含其它部分。该其它部分是可以包含独特标识符序列、患者标识符序列和一个或多个引物结合位点的核苷酸序列部分。如图29步骤C中所示,缺乏5'-3'的活性的聚合酶(实心菱形)延伸靶寡核苷酸的3'端,以拷贝探针的其它部分并产生与靶寡核苷酸的5'端的可连接结。聚合酶还使用靶寡核苷酸作为模板来延伸寡核苷酸探针,但不裂解该探针的5'阻断基团(如果存在)。在图29步骤D中,连接酶(实心圆)共价密封靶寡核苷酸的3'和5'端以形成含有靶(亚硫酸氢盐处理和拷贝)DNA区段的环状连接产物。寡核苷酸探针上的5'阻断基团防止寡核苷酸探针链的环化。如图29步骤E中所示,核酸外切酶消化所有未连接的或有缺口的产物,只留下由亚硫酸氢盐转化的靶DNA的补体和独特标识符序列组成的所需单链环状DNA。最终产物适用于使用任何上述方法进行环形测序。
图30示出了用于产生适于在始于平均长度为160bp的cfDNA或剪切至约160bp片段的基因组DNA的已知基因组区域中检测在相邻AciI位点(GCGG)处的甲基化的嵌合环状单链核酸构建体的过程。如图30A中所示,所述过程开始于将耐亚硫酸氢盐的接头(粗黑线)附接到基因组DNA区段的3'和5'端上(例如,通过连接)。基因组DNA区段中的“m”表示甲基化AciI位点。用亚硫酸氢盐处理cfDNA和/或基因组DNA区段会将未甲基化C’转化为U’,并产生单链产物。进行有限PCR以产生双链产物,并用AciI(实心三角形,只有原始靶中的甲基化位点仍为GCGG)裂解所得的PCR产物,以产生可连接的末端。如图30的步骤B中所示,含有与裂解的靶PCR产物的5'和3'侧互补的序列的寡核苷酸探针杂交至其相应的互补靶核苷酸。所述寡核苷酸探针可以具有在其3'端上的阻断基团(3'-Blk)、一个或多个可裂解连接和/或任选的5'捕获基团(“Z”)。除了靶标特异性部分,寡核苷酸探针还包含其它部分。该其它部分是可以包含独特标识符序列、患者标识符序列和一个或多个引物结合位点的核苷酸序列部分。如图30步骤C中所示,缺乏5'-3'的活性的聚合酶(实心菱形)延伸靶寡核苷酸的3'端,以拷贝探针的其它部分并产生与靶寡核苷酸的5'端的可连接结。在图30步骤D中,连接酶(实心圆)共价密封靶寡核苷酸的3'和5'端以形成含有靶(亚硫酸氢盐处理,拷贝)DNA区段的环状连接产物。寡核苷酸探针上的3'阻断基团防止寡核苷酸探针链的延伸和环化。随后通过在可裂解连接处形成缺口(例如,核糖核苷酸r的RNA酶裂解)去除3'阻断基团允许由聚合酶介导的寡核苷酸探针的延伸(图30,步骤D)。如图30的步骤E中所示,具有链置换活性的聚合酶(实心菱形)延伸自由的3'端以进行滚环扩增。该延伸产物适用于使用任何本文所述的方法测序。可以在滚环扩增之前或之后将任选的5'Z基团捕获在固体载体上。一旦被捕获,与引物结合的环状连接产物或其延伸物可以经由在可裂解连接处的裂解从固体载体释放,无论是在滚环扩增之前或之后。
图31示出了用于产生适于在始于平均长度为160bp的cfDNA或剪切至约160bp片段的基因组DNA的已知基因组区域中检测在相邻AciI位点(GCGG)处的甲基化的嵌合环状单链核酸构建体的过程(m代表甲基化AciI位点)。如图31的步骤A中所示,所述过程开始于将耐亚硫酸氢盐的接头(粗黑线)附接到基因组DNA区段的3'和5'端上(例如,通过连接)。用亚硫酸氢盐处理cfDNA和/或基因组DNA区段会将未甲基化C’转化为U’,并产生单链产物。进行有限PCR以产生双链产物,并用AciI(实心三角形)裂解所得的PCR产物。只有原始靶中的甲基化位点仍为GCGG并经受AciI裂解以产生可连接的末端。如图31步骤B中所示,双链体寡核苷酸探针与裂解的靶DNA区段杂交。所述双链体探针包含第一寡核苷酸探针链,其含有与靶DNA区段的5'和3'侧互补的核苷酸序列,所述核苷酸序列彼此被其它部分隔开。所述其它部分包含独特标识符部分和/或患者标识符部分和/或一个或多个引物结合序列。双链体寡核苷酸探针的第二寡核苷酸探针(具有圆环的粗黑线)含有与第一寡核苷酸探针的其它部分互补的序列。第二寡核苷酸探针的成环区域表示非互补区。如图31步骤C中所示,双链体探针与裂解的基因组DNA区段的杂交在DNA区段的3'端和第二寡核苷酸探针的5'端之间以及在第二寡核苷酸探针的3'端和裂解的基因组区段的5'之间形成两个可连接结。连接酶(实心圆)共价地密封所述连接结以形成含有靶(亚硫酸氢盐处理,拷贝)DNA区段的环状连接产物(图31,步骤C)。如图31步骤D中所示,核酸外切酶消化会移除所有未连接的或有缺口的产物,只留下适用于使用任何本文所述的方法进行环形测序的所需单链环状连接产物。
图32示出了基本上与图31中所示和所述相同的用于产生适用于检测相邻AciI位点处的甲基化的嵌合环状单链核酸构建体的过程。在图32中所描绘的实施方案中,双链体探针的第一寡核苷酸探针具有任选的5'捕获基团(“Z”)(图32,步骤B)。在连接第二寡核苷酸探针和靶(经亚硫酸氢盐处理,拷贝)DNA片段以形成环化连接产物(图32,步骤C)后,使用链置换聚合酶延伸第一寡核苷酸探针的3'端。滚环扩增产生包含与环化连接产物互补的串联线性序列(图32,步骤D)且适用于使用本文所述的方法测序的第一初级延伸产物。
图33示出了从已剪切至150bp的平均尺寸或从平均尺寸为160bp的cfDNA开始的用于发现整个基因组中的相邻AciI位点(GCGG)处的甲基化的过程。如图33的步骤A中所示,所述过程开始于将短接头附接(例如,经由连接)到DNA区段的3'和5'端上(粗黑线)。5'接头含有阻断基团。用亚硫酸氢盐处理基因组DNA会将未甲基化C’转化为U’,并产生单链产物。如图33的步骤B中所示,利用5'阻断引物进行的有限PCR扩增产生未甲基化产物。当被AciI(实心三角形)裂解时,只有在原始靶中甲基化的相邻AciI位点(GCGG)产生未被阻断的片段。如图33步骤C中所示,附接包含独特标识符序列和/或患者标识符序列的接头(灰色双线)(例如,通过连接到AciI裂解产物)。所述接头含有3'阻断基团或含硫代磷酸根的主链(****)以抑制随后被3'-核酸外切酶(实心三角形)消化。只有两侧都附接有接头的片段仍为双链(图33,步骤C,下图)。如图33的步骤D中所示,接头端通过以下方式具备连接能力(实心圆):(i)使5'端磷酸化;(ii)去除阻断的3'基团;或(iii)使用5'核酸酶活性裂解掉匹配的5'重叠碱基或侧翼以产生可连接的5'-磷酸根;或(iv)这些技术的任何组合。连接条件被设计成有利于寡聚作用。图33步骤E示出了由被亚硫酸氢盐转化的靶DNA(主要由CpG岛引起)的补体组成的具有任选的独特标识符和/或患者标识符序列的连接产物。最终产物适用于另外的步骤和后续测序。
图34示出了用于产生适于在始于平均长度为160bp的cfDNA或剪切至约160bp片段的基因组DNA的基因组的限定区域中检测未甲基化相邻HinP1I位点的嵌合环状单链核酸构建体的过程。如图34的步骤A中所示,所述过程开始于基因组DNA在GCGC识别位点(实心三角形)处的HinP1I裂解,生成可连接的3'和5'端。如图34的步骤B中所示,含有与裂解的靶DNA区段的5'和3'侧互补的序列的寡核苷酸探针杂交至其相应的裂解的靶DNA区段。所述寡核苷酸探针还包含其它核苷酸部分,其含有独特标识符序列和任选的患者标识符序列。在图34的实施方案中,寡核苷酸探针还具有在一端(例如,5'端)上的阻断基团。缺乏5'-3'活性的聚合酶(实心菱形)延伸杂交的靶DNA区段的3'端,以拷贝探针的其它部分并形成与所述靶的5'端上的可连接的磷酸根的连接结(图34中,步骤C)。聚合酶还使用靶DNA区段作为模板来延伸寡核苷酸探针,但不裂解在其5'端上的阻断基团。在图34的步骤D中,连接酶(实心圆)共价密封DNA区段的3'延伸端和5'端之间的结以形成环状连接产物。寡核苷酸探针上的5'阻断基团防止寡核苷酸探针的环化。或者,在包含于所述其它部分中的可裂解连接处引入缺口,例如所述其它部分含有使用UDG裂解的尿嘧啶核苷酸。如图34步骤E中所示,所有未连接的或有缺口的产物的核酸外切酶消化只留下连接至其它识别核苷酸序列(例如,独特标识符序列)的包含原始靶DNA区段的所需单链环状DNA。最终产物适用于滚环扩增和环形测序。
图35示出了基本上与图34中所示和所述相同的用于产生适用于检测在基因组的限定区域内的未甲基化相邻HinP1I位点的嵌合环状单链核酸构建体的过程。在图35中所描绘的实施方案中,寡核苷酸探针含有与靶DNA区段的5'和3'侧互补的序列,所述序列被其它核苷酸部分隔开。另外,所述寡核苷酸探针还具有在其3'端上的阻断基团(3'-Blk)、一个或多个可裂解连接(其中可裂解连接被描绘成“r”)和任选的5'捕获基团(“Z”)(图35,步骤B)。利用聚合酶延伸杂交的靶DNA区段的3'端,以形成与靶DNA区段的5'端上的可连接的磷酸根的连接结。在连接靶DNA区段的3'延伸端和5'端以形成环化连接产物(图35,步骤C)后,寡核苷酸探针上的3'阻断基团被去除(例如,核糖核苷酸连接的RNA酶H裂解)(图35,步骤D),且缺乏5'-3'活性的聚合酶(实心菱形)使用环化DNA连接产物作为模板延伸寡核苷酸探针(图35,步骤E)。滚环扩增产生包含与环化连接产物互补的串联线性序列的初级延伸产物(图35,步骤E)。初级延伸产物适用于使用本文所述的方法测序。可以在滚环扩增之前或之后将任选的5'Z基团捕获在固体载体上。一旦被捕获,与引物结合的环状连接产物或其延伸物可以经由在可裂解连接处的裂解从固体载体释放,无论是在滚环扩增之前或之后。
图36和图37示出了用于产生适于检测位于cfDNA或剪切的总基因组DNA的已知基因组区域中的HaeIII位点之间的甲基化AciI位点的嵌合环状单链核酸构建体的过程。用AciI(实心三角形,GCGG)和HaeIII(实心三角形,GGCC)裂解基因组DNA,以产生可连接的3'和5'端;m代表裂解区段内的甲基化位点(图36,步骤A和图37,步骤A)。在图36的实施方案中,含有与靶DNA区段的5'和3'侧互补的5’和3’端序列的寡核苷酸探针与裂解的DNA区段杂交(图36,步骤B)。所述寡核苷酸探针还包含其它核苷酸部分,其含有独特标识符序列、患者标识符序列和/或一个或多个引物结合位点中的一个或多个。所述寡核苷酸探针还可以在一个末端上具有阻断基团(例如,如图36步骤B中所示的5’阻断基团)。缺乏5'-3'活性的聚合酶(实心菱形)延伸杂交的靶DNA区段的3'端,以拷贝探针的其它部分并形成与所述靶的5'端上的可连接的磷酸根的连接结(图36中,步骤C)。聚合酶还使用靶DNA区段作为模板来延伸寡核苷酸探针,但不裂解在其5'端上的阻断基团。在图36的步骤D中,连接酶(实心圆)共价地密封DNA区段的3'延伸端和5'端之间的结以形成环状连接产物。寡核苷酸探针上的5'阻断基团防止寡核苷酸探针的环化。或者,在包含于所述其它部分中的可裂解连接处引入缺口,例如所述其它部分含有使用UDG裂解的尿嘧啶核苷酸。如图36步骤E中所示,所有未连接的或有缺口的产物的核酸外切酶消化只留下连接至其它识别核苷酸序列(例如,独特标识符序列)的包含原始靶DNA区段的所需单链环状DNA。最终产物适用于滚环扩增和环形测序。
在图37中所描绘的实施方案中,寡核苷酸探针含有与靶DNA区段的5'和3'侧互补的序列,所述序列被其它核苷酸部分隔开。另外,所述寡核苷酸探针还具有在其3'端上的阻断基团(3'-Blk)、一个或多个可裂解连接(其中可裂解连接描绘在“r”处)和任选的5'捕获基团(“Z”)(图37,步骤B)。在连接靶DNA区段的3'延伸端和5'端以形成环化连接产物(图37,步骤C)后,寡核苷酸探针上的3'阻断基团被去除(例如,核糖核苷酸连接的RNA酶H裂解)(图37,步骤D),且缺乏5'-3'活性的聚合酶(实心菱形)使用环化DNA连接产物作为模板延伸寡核苷酸探针(图37,步骤E)。滚环扩增产生包含与环化连接产物互补的串联线性序列的初级延伸产物(图37,步骤E)。初级延伸产物适用于使用本文所述的方法测序。可以在滚环扩增之前或之后将任选的5'Z基团捕获在固体载体上。一旦被捕获,与引物结合的环状连接产物或其延伸物可以经由在可裂解连接处的裂解从固体载体释放,无论是在滚环扩增之前或之后。
图38示出了用于产生适于检测位于cfDNA或剪切的总基因组DNA的已知基因组区域中的HaeIII位点之间的甲基化Bsh1236I位点的嵌合环状单链核酸构建体的过程。用Bsh1236I(CGCG)和HaeIII(实心三角形,GGCC)裂解基因组DNA,以产生可连接的3'和5'端;m代表裂解区段内的甲基化位点(图38,步骤A)。在图38的实施方案中,含有与靶DNA区段的5'和3'侧互补的5’和3’端序列的寡核苷酸探针与裂解的DNA区段杂交(图38,步骤B)。所述寡核苷酸探针还包含其它核苷酸部分,其含有独特标识符序列、患者标识符序列和/或一个或多个引物结合位点中的一个或多个。所述寡核苷酸探针还可以在一个末端上具有阻断基团(例如,如图38步骤B中所示的5’阻断基团)。缺乏5'-3'活性的聚合酶(实心菱形)延伸杂交的靶DNA区段的3'端,以拷贝探针的其它部分并形成与所述靶的5'端上的可连接的磷酸根的连接结(图38中,步骤C)。聚合酶还使用靶DNA区段作为模板来延伸寡核苷酸探针,但不裂解在其5'端上的阻断基团。在图38的步骤D中,连接酶(实心圆)共价地密封DNA区段的3'延伸端和5'端之间的结以形成环状连接产物。寡核苷酸探针上的5'阻断基团防止寡核苷酸探针的环化。或者,在包含于所述其它部分中的可裂解连接处引入缺口,例如所述其它部分含有使用UDG裂解的尿嘧啶核苷酸。如图38步骤E中所示,所有未连接的或有缺口的产物的核酸外切酶消化只留下连接至其它识别核苷酸序列(例如,独特标识符序列)的包含原始靶DNA区段的所需单链环状DNA。最终产物适用于在BstUI(CGCG)的存在下使用Bst聚合酶进行滚环扩增,以确保原始靶中的甲基化位点不被裂解,且随后通过测序加以识别。这个实例展现了BstUI限制性核酸内切酶的利用。然而,在该方法中还可以利用裂解双链DNA(如果未甲基化),但不裂解掺混的甲基化/未甲基化DNA,也不裂解未甲基化单链DNA的其它核酸内切酶。这些包括但不限于嗜热酶BstHHI(识别GCGC;HhaI的同裂酶)、BsiSI(识别CCGG;HpaII的同裂酶)和TaiI(识别ACGT;MaeII的同裂酶)。
图39和图36示出了用于产生适于检测靠近基因组DNA的已知区域中的5’-HaeIII位点的甲基化AciI位点的嵌合环状单链核酸构建体的过程。该方法适用于检测在剪切至160bp的平均尺寸的基因组DNA或具有160bp的平均尺寸的cfDNA中的甲基化AciI位点。用AciI(GCGG)和HaeIII(GGCC)裂解基因组DNA,以产生可连接的5'端(图39,步骤A和图40,步骤A)。在图39中所描绘的实施方案中,含有与靶基因组DNA区段的5'和3'侧互补的5’和3’端序列的寡核苷酸探针与裂解的DNA区段杂交(图39,步骤B)。所述寡核苷酸探针还包含其它核苷酸部分,其包含独特标识符序列、患者标识符序列和/或一个或多个引物结合位点中的一个或多个。所述寡核苷酸探针还可以在一个末端上具有阻断基团(例如,如图39步骤B中所示的5’阻断基团)。具有3'-5'核酸酶活性但缺乏5'-3'活性的聚合酶(实心菱形)移除单链3'端,然后延伸杂交的靶DNA区段的3'端,以拷贝探针的其它部分并形成与所述靶的5'端上的可连接的磷酸根的连接结(图39中,步骤C)。聚合酶还使用靶DNA区段作为模板来延伸寡核苷酸探针,但不裂解在其5'端上的阻断基团。在图39的步骤D中,连接酶(实心圆)共价地密封DNA区段的3'延伸端和5'端之间的结以形成环状连接产物。寡核苷酸探针上的5'阻断基团防止寡核苷酸探针的环化。或者,在包含于所述其它部分中的可裂解连接处引入缺口,例如所述其它部分含有使用UDG裂解的尿嘧啶核苷酸。如图39步骤E中所示,所有未连接的或有缺口的产物的核酸外切酶消化只留下连接至其它识别核苷酸序列(例如,独特标识符序列)的包含原始靶DNA区段的所需单链环状DNA。最终产物适用于滚环扩增和环形测序。
在图40中所描绘的实施方案中,寡核苷酸探针含有与裂解的靶DNA区段的5'和3'侧互补的5’和3’端序列,所述序列被其它核苷酸部分隔开。另外,所述寡核苷酸探针还具有在其3'端上的阻断基团(3'-Blk)、一个或多个可裂解连接(其中可裂解连接描绘在“r”处)和任选的5'捕获基团(“Z”)(图40,步骤A)。在连接靶DNA区段的3'延伸端和5'端以形成环化连接产物(图40,步骤C)后,寡核苷酸探针上的3'阻断基团被去除(例如,核糖核苷酸连接的RNA酶H裂解)(图40,步骤D),且缺乏5'-3'活性的聚合酶(实心菱形)使用环化DNA连接产物作为模板延伸寡核苷酸探针(图40,步骤E)。滚环扩增产生包含与环化连接产物互补的串联线性序列的初级延伸产物(图40,步骤E)。初级延伸产物适用于使用本文所述的方法测序。可以在滚环扩增之前或之后将任选的5'Z基团捕获在固体载体上。一旦被捕获,与引物结合的环状连接产物或其延伸物可以经由在可裂解连接处的裂解从固体载体释放,无论是在滚环扩增之前或之后。
图41示出了用于产生适于检测靠近基因组DNA的已知区域中的5’-HaeIII位点的甲基化Bsh1236I位点的嵌合环状单链核酸构建体的过程。该方法适用于检测在剪切至150bp的平均尺寸的基因组DNA或具有160bp的平均尺寸的cfDNA中的甲基化Bsh1236I位点。用Bsh1236I(CGCG)和HaeIII(GGCC)裂解基因组DNA,以产生可连接的5'端(图41,步骤A)。在图41中所描绘的实施方案中,含有与靶基因组DNA区段的5'和3'侧互补的5’和3’端序列的寡核苷酸探针与裂解的DNA区段杂交(图41,步骤B)。所述寡核苷酸探针还包含其它核苷酸部分,其包含独特标识符序列、患者标识符序列和/或一个或多个引物结合位点中的一个或多个。所述寡核苷酸探针还可以在一个末端上具有阻断基团(例如,如图41步骤B中所示的5’阻断基团)。具有3’-5’核酸酶活性但缺乏5'-3'活性的聚合酶(实心菱形)移除靶DNA区段的单链3'端,然后延伸杂交的靶DNA区段的裂解3'端,以拷贝探针的其它部分并形成与所述靶的5'端上的可连接的磷酸根的连接结(图41中,步骤C)。聚合酶还使用靶DNA区段作为模板来延伸寡核苷酸探针,但不裂解在其5'端上的阻断基团。在图41的步骤D中,连接酶(实心圆)共价地密封DNA区段的3'延伸端和5'端之间的结以形成环状连接产物。寡核苷酸探针上的5'阻断基团防止寡核苷酸探针的环化。或者,在包含于所述其它部分中的可裂解连接处引入缺口,例如所述其它部分含有使用UDG裂解的尿嘧啶核苷酸。如图41步骤E中所示,所有未连接的或有缺口的产物的核酸外切酶消化只留下连接至其它识别核苷酸序列(例如,独特标识符序列)的包含原始靶DNA区段的所需单链环状DNA。最终产物适用于在BstUI(CGCG)的存在下使用Bst聚合酶进行滚环扩增,以确保原始靶中的甲基化位点随后通过测序被识别。这个实例展现了BstUI限制性核酸内切酶的利用。然而,可替代地可以利用裂解双链DNA(如果未甲基化),但不裂解掺混的甲基化/未甲基化DNA,也不裂解未甲基化单链DNA的其它核酸内切酶。这些包括但不限于嗜热酶BstHHI(识别GCGC;HhaI的同裂酶)、BsiSI(识别CCGG;HpaII的同裂酶)和TaiI(识别ACGT;MaeII的同裂酶)。
图42和图43示出了用于产生适于检测靠近cfDNA或剪切的总基因组DNA的已知基因组区域中的3’-HaeIII位点的甲基化AciI位点的嵌合环状单链核酸构建体的过程。用AciI(GCGG)和HaeIII(GGCC)裂解基因组DNA,以产生可延伸3'端(图42,步骤A和图43,步骤A)。在图42的实施方案中,含有与靶DNA区段的5'和3'侧互补的5’和3’端序列的寡核苷酸探针与裂解的DNA区段杂交(图42,步骤B)。所述寡核苷酸探针还包含其它核苷酸部分,其含有独特标识符序列、患者标识符序列和/或一个或多个引物结合位点中的一个或多个。所述寡核苷酸探针还可以在一个末端上具有阻断基团(例如,如图42B中所示的5’阻断基团)。缺乏5'-3'活性的聚合酶(实心菱形)延伸杂交的靶DNA区段的3'端,以拷贝探针的其它部分。聚合酶的5'核酸酶活性裂解靶DNA区段的匹配的5'重叠碱基,从而产生可连接的5’磷酸根(图42,步骤C)。聚合酶还使用靶DNA区段作为模板来延伸寡核苷酸探针,但不裂解在其5'端上的阻断基团。在图42的步骤D中,连接酶(实心圆)共价地密封DNA区段的3'延伸端和5'端之间的结以形成含有原始基因组DNA区段的环状连接产物。寡核苷酸探针上的5'阻断基团防止寡核苷酸探针的环化。或者,在包含于所述其它部分中的可裂解连接处引入缺口,例如所述其它部分含有使用UDG裂解的尿嘧啶核苷酸。如图42步骤E中所示,所有未连接的或有缺口的产物的核酸外切酶消化只留下连接至其它识别核苷酸序列(例如,独特标识符序列)的包含原始靶DNA区段的所需单链环状DNA。最终产物适用于滚环扩增和环形测序。
在图43的实施方案中,寡核苷酸探针含有与靶DNA区段的5'和3'侧互补的序列,所述序列被其它核苷酸部分隔开。另外,所述寡核苷酸探针还具有在3'端上的阻断基团(3'-Blk)、一个或多个可裂解连接(其中可裂解连接描绘在“r”处)和任选的5'捕获基团(“Z”)(图43,步骤B)。在连接靶DNA区段的3'延伸端和5'端以形成环化连接产物(图43,步骤C)后,寡核苷酸探针上的3'阻断基团被去除(例如,核糖核苷酸连接的RNA酶H裂解)(图43,步骤D),且缺乏5'-3'活性的聚合酶(实心菱形)使用环化DNA连接产物作为模板延伸寡核苷酸探针(图43,步骤E)。滚环扩增产生包含与环化连接产物互补的串联线性序列的初级延伸产物(图43,步骤E)。初级延伸产物适用于使用本文所述的方法测序。可以在滚环扩增之前或之后将任选的5'Z基团捕获在固体载体上。一旦被捕获,与引物结合的环状连接产物或其延伸物可以经由在可裂解连接处的裂解从固体载体释放,无论是在滚环扩增之前或之后。
图44示出了用于产生适于检测靠近cfDNA或剪切的总基因组DNA的已知基因组区域中的3’-HaeIII位点的甲基化Bsh1236I位点的嵌合环状单链核酸构建体的过程。用Bsh1236I(CGCG)和HaeIII(GGCC)裂解基因组DNA,以产生可延伸3'端(图44,步骤A)。在图44的实施方案中,含有与靶DNA区段的5'和3'侧互补的5’和3’端序列的寡核苷酸探针与裂解的DNA区段杂交(图44,步骤B)。所述寡核苷酸探针还包含其它核苷酸部分,其含有独特标识符序列、患者标识符序列和/或一个或多个引物结合位点中的一个或多个。所述寡核苷酸探针还可以在一个末端上具有阻断基团(例如,如图44步骤B中所示的5’阻断基团)。缺乏5'-3'活性的聚合酶(实心菱形)延伸杂交的靶DNA区段的3'端,以拷贝探针的其它部分。聚合酶的5'核酸酶活性裂解靶DNA区段的匹配的5'重叠碱基,从而产生可连接的5’磷酸根(图44,步骤C)。聚合酶还使用靶DNA区段作为模板来延伸寡核苷酸探针,但不裂解在其5'端上的阻断基团。在图44的步骤D中,连接酶(实心圆)共价地密封DNA区段的3'延伸端和5'端之间的结以形成含有原始基因组DNA区段的环状连接产物。寡核苷酸探针上的5'阻断基团防止寡核苷酸探针的环化。或者,在包含于所述其它部分中的可裂解连接处引入缺口,例如所述其它部分含有使用UDG裂解的尿嘧啶核苷酸。如图44步骤E中所示,所有未连接的或有缺口的产物的核酸外切酶消化只留下连接至其它识别核苷酸序列(例如,独特标识符序列)的包含原始靶DNA区段的所需单链环状DNA。最终产物适用于在BstUI(CGCG)的存在下使用Bst聚合酶进行滚环扩增,以确保原始靶中的甲基化位点随后通过测序被识别。这个实例展现了BstUI限制性核酸内切酶的使用。然而,可以使用裂解双链DNA(如果未甲基化),但不裂解掺混的甲基化/未甲基化DNA,也不裂解未甲基化单链DNA的其它核酸内切酶。这些包括但不限于嗜热酶BstHHI(识别GCGC;HhaI的同裂酶)、BsiSI(识别CCGG;HpaII的同裂酶)和TaiI(识别ACGT;MaeII的同裂酶)。
图45示出了用于产生适于检测在基因组DNA的已知区域中的相邻甲基化Bsh1236I位点的嵌合环状单链核酸构建体的过程。该方法适用于检测在剪切至150bp的平均尺寸的基因组DNA或具有160bp的平均尺寸的cfDNA中的甲基化Bsh1236I位点。用Bsh1236I(CGCG)在靶DNA中的未甲基化识别位点处裂解基因组DNA(图45,步骤A)。在图45中所描绘的实施方案中,含有与靶基因组DNA区段的5'和3'侧互补的5’和3’端序列的寡核苷酸探针与DNA区段杂交(图45,步骤B)。所述寡核苷酸探针还包含其它核苷酸部分,其包含独特标识符序列、患者标识符序列和/或一个或多个引物结合位点中的一个或多个。所述寡核苷酸探针还可以在一个末端上具有阻断基团(例如,如图44步骤B中所示的5’阻断基团)。具有3'-5活性的聚合酶(实心菱形)移除靶标的单链3'端,然后延伸杂交的靶DNA区段的3'端,以拷贝探针的其它部分。聚合酶的5'-3'核酸酶活性裂解靶DNA区段的匹配的5'重叠碱基,从而产生可连接的5’磷酸根(图45,步骤C)。聚合酶还使用靶DNA区段作为模板来延伸寡核苷酸探针,但不裂解在其5'端上的阻断基团。在图45的步骤D中,连接酶(实心圆)共价地密封DNA区段的3'延伸端和5'端之间的结以形成环状连接产物。寡核苷酸探针上的5'阻断基团防止寡核苷酸探针的环化。或者,在包含于所述其它部分中的可裂解连接处引入缺口,例如所述其它部分含有使用UDG裂解的尿嘧啶核苷酸。如图45步骤E中所示,所有未连接的或有缺口的产物的核酸外切酶消化只留下连接至其它识别核苷酸序列(例如,独特标识符序列)的包含原始靶DNA区段的所需单链环状DNA。最终产物适用于在BstUI(CGCG)的存在下使用Bst聚合酶进行滚环扩增。因此,原始靶中的甲基化位点被扩增且随后通过测序被识别。这个实例展现了BstUI限制性核酸内切酶的利用。然而,可以使用裂解双链DNA(如果未甲基化),但不裂解掺混的甲基化/未甲基化DNA,也不裂解未甲基化单链DNA的其它核酸内切酶。这些包括但不限于嗜热酶BstHHI(识别GCGC;HhaI的同裂酶)、BsiSI(识别CCGG;HpaII的同裂酶)和TaiI(识别ACGT;MaeII的同裂酶)。
图46示出了用于产生适于检测靠近基因组DNA的已知区域中的Bsh1236I位点的所有甲基化CpG位点的嵌合环状单链核酸构建体的过程。该方法适用于检测在剪切至150bp的平均尺寸的基因组DNA或具有160bp的平均尺寸的cfDNA中靠近甲基化Bsh1236I位点的所有甲基化CpG位点。用Bsh1236I(CGCG)在未甲基化识别位点处裂解基因组DNA(图46,步骤A)。亚硫酸氢盐处理将未甲基化C’转化为U’并使所述链为非互补性。在图46中所描绘的实施方案中,含有与经亚硫酸氢盐处理的甲基化靶基因组DNA区段的5'和3'侧互补的5’和3’端序列的寡核苷酸探针与DNA区段杂交(图46,步骤B)。所述寡核苷酸探针还包含其它核苷酸部分,其包含独特标识符序列、患者标识符序列和/或一个或多个引物结合位点中的一个或多个。所述寡核苷酸探针还可以在一个末端上具有阻断基团(例如,如图46步骤B中所示的5’阻断基团)。具有3'-5'活性的聚合酶(实心菱形)移除经亚硫酸氢盐处理的靶标的单链3'端,然后延伸杂交的靶DNA区段的3'端以拷贝探针的其它部分。聚合酶的5'-3'核酸酶活性裂解经亚硫酸氢盐处理的靶DNA区段的匹配的5'重叠碱基,从而产生可连接的5’磷酸根(图46,步骤C)。聚合酶还使用经亚硫酸氢盐处理的靶DNA区段作为模板来延伸寡核苷酸探针,但不裂解在其5'端上的阻断基团。在图46的步骤D中,连接酶(实心圆)共价地密封DNA区段的3'延伸端和5'端之间的结以形成环状连接产物。寡核苷酸探针上的5'阻断基团防止寡核苷酸探针的环化。如图46步骤E中所示,所有未连接的或有缺口的产物的核酸外切酶消化只留下连接至其它识别核苷酸序列(例如,独特标识符序列)的包含经亚硫酸氢盐处理的原始靶DNA区段的所需单链环状DNA。最终产物适用于在BstUI(CGCG)的存在下使用Bst聚合酶进行滚环扩增,以确保未被亚硫酸氢盐转化的位点在原始靶中是甲基化的,且所有其它甲基化CpG位点通过测序被识别。这个实例展现了BstUI限制性核酸内切酶的使用。然而,可以使用裂解双链DNA(如果未甲基化),但不裂解掺混的甲基化/未甲基化DNA或未甲基化单链DNA,并且保留甲基化位点的限制性识别的其它核酸内切酶。这包括但不限于嗜热酶TaiI(识别ACGT;MaeII的同裂酶)。
图47和图48示出了用于产生适于检测cfDNA或剪切的总基因组DNA的已知基因组区域中的未甲基化相邻HinP1I位点的嵌合环状单链核酸构建体的过程。用HinP1I(GCGC)(实心三角形)裂解基因组DNA,以产生可连接的3'和5'端(图47,步骤A和图48,步骤A)。如图47步骤B中所示,双链体寡核苷酸探针与裂解的靶DNA区段杂交。所述双链体探针包含第一寡核苷酸探针链,其含有与靶DNA区段的5'和3'侧互补的核苷酸序列,所述核苷酸序列被其它部分隔开。所述其它部分包含独特标识符部分和/或患者标识符部分和/或一个或多个引物结合序列。双链体寡核苷酸探针的第二寡核苷酸探针(具有圆环的粗黑线)含有与第一寡核苷酸探针的其它部分互补的序列。第二寡核苷酸探针的成环区域表示非互补区。如图47步骤C中所示,双链体探针与裂解的基因组DNA区段的杂交形成两个可连接结(即,在DNA区段的3'端和第二寡核苷酸探针的5'端之间,以及在第二寡核苷酸探针的3'端和裂解的基因组区段的5'之间)。连接酶(实心圆)共价地密封所述连接结以形成含有基因组DNA区段的环状连接产物(图47,步骤C)。如图47步骤D中所示,核酸外切酶消化会移除所有未连接的或有缺口的产物,只留下适用于使用任何本文所述的方法进行环形测序的所需单链环状连接产物。
在图48中所描绘的实施方案中,双链体探针的第一寡核苷酸探针含有与靶DNA区段的5'和3'侧互补的序列,所述序列被其它核苷酸部分隔开。此外,第一寡核苷酸探针还具有任选的5'捕获基团(“Z”)(图48,步骤B)。在靶DNA片段和第二寡核苷酸探针之间的两个连接结处连接形成图48步骤C的环化连接产物后,具有链置换活性的聚合酶(实心菱形)使用含DNA的环化连接产物作为模板延伸第一寡核苷酸探针(图48,步骤D)。滚环扩增产生包含与环化连接产物互补的串联线性序列的初级延伸产物(图48,步骤D)。初级延伸产物适用于使用本文所述的方法测序。可以在滚环扩增之前或之后将任选的5'Z基团捕获在固体载体上。一旦被捕获,与引物结合的环状连接产物或其延伸物可以经由在可裂解连接处的裂解从固体载体释放,无论是在滚环扩增之前或之后。
图49和图50示出了用于产生适于检测位于cfDNA或剪切的总基因组DNA的已知基因组区域中的HaeIII位点之间的甲基化(“m”)AciI位点的嵌合环状单链核酸构建体的过程。用AciI(实心三角形,GCGG)和HaeIII(实心三角形,GGCC)裂解基因组DNA,以产生可连接的3'和5'端(图49,步骤A和图50,步骤A)。如图49步骤B和图50步骤B中所示,双链体寡核苷酸探针与裂解的靶DNA区段杂交。在图49中所描绘的实施方案中,双链体探针包含第一寡核苷酸探针链,其含有与靶DNA区段的5'和3'侧互补的核苷酸序列,所述核苷酸序列被其它部分隔开。所述其它部分包含独特标识符部分和/或患者标识符部分和/或一条或多条引物结合序列(步骤49,步骤B)。双链体寡核苷酸探针的第二寡核苷酸探针(具有圆环的粗黑线)含有与第一寡核苷酸探针的其它部分互补的序列(步骤49,步骤B)。第二寡核苷酸探针的成环区域表示非互补区。如图49步骤C中所示,双链体探针与裂解的基因组DNA区段的杂交形成两个可连接结(即,在DNA区段的3'端和第二寡核苷酸探针的5'端之间,以及在第二寡核苷酸探针的3'端和裂解的基因组区段的5'之间)。连接酶(实心圆)共价地密封所述连接结以形成含有甲基化基因组DNA区段的环状连接产物(图49,步骤C)。如图49步骤D中所示,核酸外切酶消化会移除所有未连接的或有缺口的产物,只留下适用于使用任何本文所述的方法进行环形测序的所需单链环状连接产物。
在图50中所描绘的实施方案中,双链体探针的第一寡核苷酸探针含有与靶DNA区段的5'和3'侧互补的序列,所述序列被其它核苷酸部分隔开。此外,第一寡核苷酸探针还具有任选的5'捕获基团(“Z”)(图50,步骤B)。在靶DNA片段和第二寡核苷酸探针之间的两个连接结处连接形成环化甲基化连接产物(图50,步骤C)后,具有链置换活性的聚合酶(实心菱形)使用含DNA的环化连接产物作为模板延伸第一寡核苷酸探针(图50,步骤D)。滚环扩增产生包含与环化连接产物互补的串联线性序列的初级延伸产物(图50,步骤D)。初级延伸产物适用于使用本文所述的方法测序。可以在滚环扩增之前或之后将任选的5'Z基团捕获在固体载体上。一旦被捕获,与引物结合的环状连接产物或其延伸物可以经由在可裂解连接处的裂解从固体载体释放,无论是在滚环扩增之前或之后。
图51示出了用于发现基因组DNA的已知区域中的未甲基化相邻HinP1I位点(GCGC)的过程。基因组DNA(无论是从全细胞分离的,还是作为血浆中的cfDNA)包含通过天然酶促过程或剪切形成的末端。需要通过将短接头附接至DNA末端的3'和5'端(例如,经由连接附接接头)来阻断这些末端用于后续步骤。如图51步骤A中所示,5'端接头包含阻断基团(粗黑线)。用HinP1I(GCGC)(实心三角形)裂解附接有接头的DNA(图51,步骤A)。当被HinP1I裂解时,只有在原始基因组DNA中未甲基化的相邻HinP1I位点(GCGG)产生未被阻断的片段。如图51步骤B中所示,将包含独特标识符序列和/或患者标识符序列的长接头(部分灰色的双线)附接至HinP1I裂解的DNA片段。所述长接头含有3'端阻断基团或含硫代磷酸根的主链(****)以抑制随后被3'-核酸外切酶(实心三角形)消化。只有两侧都附接有接头的片段仍将为双链。如图51的步骤C中所示,接头的游离端通过以下方式具备连接能力:(i)使5'端磷酸化;(ii)去除3'阻断基团;或(iii)使用5'核酸酶活性裂解掉匹配的5'重叠碱基或侧翼以产生可连接的5'-磷酸根;或(iv):(i)、(ii)、(iii)的任何组合。连接(实心圆)条件被设计成有利于寡聚作用。如图51步骤D中所示,连接产物是由连接至独特标识符序列和/或患者标识符序列的最初在基因组DNA中未甲基化的相邻HinP1I序列组成。最终产物适用于后续测序。
图52示出了用于发现整个基因组的已知区域中的甲基化相邻AciI位点(GCGG)的过程。用AciI(实心三角形)裂解基因组DNA;m代表甲基化位点。如图52步骤A中所示,通过例如连接将具有5'端阻断基团的短接头(粗黑线)附接到被AciI消化的DNA。用HaeIII(GGCC)裂解附接有接头的DNA。当被HaeIII裂解时,只有在原始基因组DNA中具有甲基化AciI位点的相邻HaeIII位点(GGCC)产生未被阻断的片段。在图52的步骤B中,将包含独特标识符序列和/或患者标识符序列的长接头(部分灰色的双线)附接至HaeIII裂解的DNA片段。所述长接头含有3'端阻断基团或含硫代磷酸根的主链(****)以抑制随后被3'-核酸外切酶(实心三角形)消化。只有两侧都附接有接头的片段仍将为双链。如图52的步骤C中所示,接头的游离端通过以下方式具备连接能力:(i)使5'端磷酸化;(ii)去除3'阻断基团;或(iii)使用5'核酸酶活性裂解掉匹配的5'重叠碱基或侧翼以产生可连接的5'-磷酸根;或(iv):(i)、(ii)、(iii)的任何组合。连接(实心圆)条件被设计成有利于寡聚作用。如图52步骤D中所示,连接产物是由连接至独特标识符序列和/或患者标识符序列的最初在基因组DNA中的AciI位点处甲基化的相邻HaeIII序列组成。最终产物适用于后续测序。
图53和图54示出了用于产生适于检测cfDNA或剪切的总基因组DNA的已知基因组区域中的未甲基化相邻HinP1I位点的嵌合环状单链核酸构建体的过程。如图53步骤A和图54步骤A中所示,用HinP1I(GCGC)裂解基因组DNA以产生可连接的3'和5'端。被HinP1I消化的DNA的亚硫酸氢盐处理将未甲基化C’转化为U’。在图53的实施方案中,含有与靶DNA区段的5'和3'侧互补的5’和3’端序列的寡核苷酸探针与裂解的DNA区段杂交(图53,步骤B)。所述寡核苷酸含有独特标识符序列、任选的患者标识符序列和在一端上的可选阻断基团。缺乏5'-3'活性的聚合酶(实心菱形)延伸靶DNA区段的3'端,以使其与靶的5'端上的可连接的磷酸根齐平(图53,步骤C)。聚合酶还在靶上延伸寡核苷酸探针,但不裂解5'阻断基团。在图53的步骤D中,连接酶(实心圆)共价密封延伸的靶DNA区段末端以形成环状连接产物。阻断基团防止寡核苷酸探针的环化。如图53步骤E中所示,核酸外切酶消化去除所有未连接的或有缺口的产物,只留下由亚硫酸氢盐转化型原始靶DNA和独特标识符序列组成的所需单链环状DNA。最终产物适用于滚环扩增和环形测序。
在图54的实施方案中,寡核苷酸探针含有与靶DNA区段的5'和3'侧互补的序列,所述序列被其它核苷酸部分隔开。另外,所述寡核苷酸探针还具有在3'端上的阻断基团(3'-Blk)、一个或多个可裂解连接(其中可裂解连接描绘在“r”处)和任选的5'捕获基团(“Z”)(图54,步骤B)。在连接靶DNA区段的3'延伸端和5'端以形成环化连接产物(图54,步骤C)后,寡核苷酸探针上的3'阻断基团被去除(例如,核糖核苷酸连接的RNA酶H裂解)(图54,步骤D),且缺乏5'-3'活性的聚合酶(实心菱形)使用环化DNA连接产物作为模板延伸寡核苷酸探针(图54,步骤E)。滚环扩增产生包含与环化连接产物互补的串联线性序列的初级延伸产物(图54,步骤E)。初级延伸产物适用于使用本文所述的方法测序。可以在滚环扩增之前或之后将任选的5'Z基团捕获在固体载体上。一旦被捕获,与引物结合的环状连接产物或其延伸物可以经由在可裂解连接处的裂解从固体载体释放,无论是在滚环扩增之前或之后。
图55和图56示出了用于产生适于检测cfDNA或剪切的总基因组DNA的已知基因组区域中的未甲基化相邻HinP1I位点的嵌合环状单链核酸构建体的过程。如图55步骤A和图56步骤A中所示,用HinP1I(GCGC)(实心三角)裂解基因组DNA以产生可连接的3'和5'端。被HinP1I消化的DNA的亚硫酸氢盐处理将未甲基化的C’转化为U’(图55,步骤A和图56,步骤A)。如图55步骤B和图56步骤B中所示,双链体寡核苷酸探针与裂解的靶DNA区段杂交。在图55中所描绘的实施方案中,双链体探针包含第一寡核苷酸探针链,其含有与靶DNA区段的5'和3'侧互补的核苷酸序列,所述核苷酸序列被其它部分隔开。所述其它部分包含独特标识符部分和/或患者标识符部分和/或一条或多条引物结合序列(步骤55,步骤B)。双链体寡核苷酸探针的第二寡核苷酸探针(具有圆环的粗黑线)含有与第一寡核苷酸探针的其它部分互补的序列(步骤55,步骤B)。第二寡核苷酸探针的成环区域表示非互补区。如图55步骤C中所示,双链体探针与被HinP1I消化和亚硫酸氢盐处理的基因组DNA的杂交形成两个可连接结(即,在DNA区段的3'端和第二寡核苷酸探针的5'端之间,以及在第二寡核苷酸探针的3'端和DNA区段的5'之间)。连接酶(实心圆)共价地密封所述连接结以形成含有经亚硫酸氢盐处理的基因组DNA区段的环状连接产物(图55,步骤C)。如图55步骤D中所示,核酸外切酶消化会移除所有未连接的或有缺口的产物,只留下适用于使用任何本文所述的方法进行环形测序的所需单链环状连接产物。
在图56中所描绘的实施方案中,双链体探针的第一寡核苷酸探针含有与靶DNA区段的5'和3'侧互补的序列,所述序列被其它核苷酸部分隔开。此外,第一寡核苷酸探针还具有任选的5'捕获基团(“Z”)(图56,步骤B)。在靶DNA片段和第二寡核苷酸探针之间的两个连接结处连接形成环化连接产物(图56,步骤C)后,具有链置换活性的聚合酶(实心菱形)使用含DNA的环化连接产物作为模板延伸第一寡核苷酸探针(图56,步骤D)。滚环扩增产生包含与环化连接产物互补的串联线性序列的初级延伸产物(图56,步骤D)。初级延伸产物适用于使用本文所述的方法测序。可以在滚环扩增之前或之后将任选的5'Z基团捕获在固体载体上。一旦被捕获,与引物结合的环状连接产物或其延伸物可以经由在可裂解连接处的裂解从固体载体释放,无论是在滚环扩增之前或之后。
图57示出了用于发现在cfDNA或剪切的总基因组DNA的已知基因组区域中的未甲基化相邻HinP1I位点(GCGC)的过程。基因组DNA(无论是从全细胞分离的,还是作为血浆中的cfDNA)包含通过天然酶促过程或剪切形成的末端。需要通过将短接头附接至DNA末端的3'和5'端(例如,经由连接附接接头)来阻断这些末端用于后续步骤。如图57步骤A中所示,5'端接头包含阻断基团(粗黑线)。用HinP1I(GCGC)(实心三角形)裂解附接有接头的DNA(图57,步骤A)。当被HinP1I裂解时,只有在原始基因组DNA中未甲基化的相邻HinP1I位点(GCGG)产生未被阻断的片段。如图57步骤B中所示,将包含独特标识符序列和/或患者标识符序列的长接头(部分灰色的双线)附接至HinP1I裂解的DNA片段。所述长接头含有3'端阻断基团或含硫代磷酸根的主链(****)以抑制随后被3'-核酸外切酶(实心三角形)消化。只有两侧都附接有接头的片段仍将为双链。如图57的步骤C中所示,接头的游离端通过以下方式具备连接能力:(i)使5'端磷酸化;(ii)去除3'阻断基团;或(iii)使用5'核酸酶活性裂解掉匹配的5'重叠碱基或侧翼以产生可连接的5'-磷酸根;或(iv):(i)、(ii)、(iii)的任何组合。连接(实心圆)条件被设计成有利于寡聚作用。如图57步骤D中所示,连接产物的亚硫酸氢盐处理将未甲基化C’转化为U’。连接产物包含被亚硫酸氢盐转化的DNA,最初在靶DNA中未甲基化的相邻HinP1I序列连接至独特标识符和/或患者标识符序列。最终产物适用于另外的步骤和后续测序。
图58和图59示出了用于产生适于检测cfDNA或剪切的总基因组DNA的已知基因组区域中的未甲基化相邻“HphI”位点的嵌合环状单链核酸构建体的过程。如图58步骤A和图59步骤A中所示,将短接头附接(例如,通过连接)到cfDNA片段或剪切的基因组DNA上。用亚硫酸氢盐处理附接有接头的DNA以将未甲基化C’转化为U’。进行有限PCR,并用HphI裂解所得的PCR产物(只有未甲基化GGCGA->GGTGA),以产生可连接的末端(图58步骤A和图59步骤A)。在图58的实施方案中,含有与消化的靶PCR区段的5'和3'侧互补的5’和3’端序列的寡核苷酸探针与裂解的DNA区段杂交(图58,步骤B)。所述寡核苷酸探针还包含其它核苷酸部分,其含有独特标识符序列、患者标识符序列和/或一个或多个引物结合位点中的一个或多个。所述寡核苷酸探针还可以在一个末端上具有阻断基团(例如,如图58步骤B中所示的5’阻断基团)。缺乏5'-3'活性的聚合酶(实心菱形)延伸杂交的靶DNA区段的3'端,以拷贝探针的其它部分并形成与杂交靶DNA区段的5'端的连接结(图58中,步骤C)。聚合酶还使用靶DNA区段作为模板来延伸寡核苷酸探针,但不裂解在其5'端上的阻断基团。在图58的步骤D中,连接酶(实心圆)共价地密封DNA区段的3'延伸端和5'端之间的结以形成含有由PCR产生的HphI消化型DNA区段的环状连接产物。寡核苷酸探针上的5'阻断基团防止寡核苷酸探针的环化。或者,在包含于所述其它部分中的可裂解连接处引入缺口,例如所述其它部分含有使用UDG裂解的尿嘧啶核苷酸。如图58步骤E中所示,所有未连接的或有缺口的产物的核酸外切酶消化只留下包含连接至其它识别核苷酸序列(例如,独特标识符序列)的由PCR产生的HphI消化型DNA区段的所需单链环状DNA。最终产物适用于滚环扩增和环形测序。
在图59的实施方案中,寡核苷酸探针还含有与消化的靶PCR区段的5'和3'侧互补的序列,所述序列被其它核苷酸部分隔开。另外,所述寡核苷酸探针还具有在其3'端上的阻断基团(3'-Blk)、一个或多个可裂解连接(其中可裂解连接描绘在“r”处)和任选的5'捕获基团(“Z”)(图59,步骤B)。在连接靶PCR区段的3'延伸端和5'端以形成环化连接产物(图59,步骤C)后,寡核苷酸探针上的3'阻断基团被去除(例如,核糖核苷酸连接的RNA酶H裂解)(图59,步骤D),且缺乏5'-3'活性的聚合酶(实心菱形)使用环化DNA连接产物作为模板延伸寡核苷酸探针(图59,步骤E)。滚环扩增产生包含与环化连接产物互补的串联线性序列的初级延伸产物(图58,步骤E)。初级延伸产物适用于使用本文所述的方法测序。可以在滚环扩增之前或之后将任选的5'Z基团捕获在固体载体上。一旦被捕获,与引物结合的环状连接产物或其延伸物可以经由在可裂解连接处的裂解从固体载体释放,无论是在滚环扩增之前或之后。
图60和图61示出了用于产生适于检测cfDNA或剪切的总基因组DNA的已知基因组区域中的未甲基化相邻“HphI”位点的嵌合环状单链核酸构建体的过程。如图60步骤A和图61步骤A中所示,将短接头附接(例如,通过连接)到cfDNA片段或剪切的基因组DNA上。用亚硫酸氢盐处理附接有接头的DNA以将未甲基化C’转化为U’。进行有限PCR,并用HphI裂解所得的PCR产物(只有未甲基化GGCGA->GGTGA),以产生可连接的末端(图60步骤A和图61步骤A)。如图60步骤B和图61步骤B中所示,双链体寡核苷酸探针与裂解的靶DNA区段杂交。在图60中所描绘的实施方案中,双链体探针包含第一寡核苷酸探针链,其含有与靶PCR区段的5'和3'侧互补的核苷酸序列。第一寡核苷酸探针的这些靶标特异性部分被其它部分隔开,所述其它部分包含独特标识符部分和/或患者标识符部分和/或一条或多条引物结合序列(步骤60,步骤B)。双链体寡核苷酸探针的第二寡核苷酸探针(具有圆环的粗黑线)含有与第一寡核苷酸探针的其它部分互补的序列(步骤60,步骤B)。第二寡核苷酸探针的成环区域表示非互补区。如图60步骤C中所示,双链体探针与被HphI消化的PCR产物的杂交形成两个可连接结(即,在DNA区段的3'端和第二寡核苷酸探针的5'端之间,以及在第二寡核苷酸探针的3'端和DNA区段的5'之间)。连接酶(实心圆)共价地密封所述连接结以形成含有HphI消化区段的环状连接产物(图60,步骤C)。如图60步骤D中所示,核酸外切酶消化会移除所有未连接的或有缺口的产物,只留下适用于使用任何本文所述的方法进行环形测序的所需单链环状连接产物。
在图61中所描绘的实施方案中,双链体探针的第一寡核苷酸探针含有与靶DNA区段的5'和3'侧互补的序列,所述序列被其它核苷酸部分隔开。此外,第一寡核苷酸探针还具有任选的5'捕获基团(“Z”)(图61,步骤B)。在HphI消化PCR片段和第二寡核苷酸探针之间的两个连接结处连接形成环化连接产物(图61,步骤C)后,具有链置换活性的聚合酶(实心菱形)使用环化连接产物作为模板延伸第一寡核苷酸探针(图61,步骤D)。滚环扩增产生包含与环化连接产物互补的串联线性序列的初级延伸产物(图61,步骤D)。初级延伸产物适用于使用本文所述的方法测序。可以在滚环扩增之前或之后将5'Z基团捕获在固体载体上。一旦被捕获,与引物结合的环状连接产物或其延伸物可以经由在可裂解连接处的裂解从固体载体释放,无论是在滚环扩增之前或之后。
图62示出了用于发现在cfDNA或剪切的总基因组DNA的已知基因组区域中的未甲基化相邻HphI位点的过程。基因组DNA(无论是从全细胞分离的,还是作为血浆中的cfDNA)包含通过天然酶促过程或剪切形成的末端。需要通过将短接头附接至DNA末端的3'和5'端(例如,经由连接附接接头)来阻断这些末端用于后续步骤。如图62步骤A中所示,5'端接头包含阻断基团(粗黑线)。用亚硫酸氢盐处理附接有接头的DNA以将未甲基化C’转化为U’。如图62步骤B中所示,利用5'阻断型引物进行的有限PCR扩增产生未甲基化双链产物。当被HphI(实心三角形)裂解时,只有在原始靶中未甲基化的相邻HphI位点(未甲基化GGCGA->GGTGA)产生未被阻断的片段。如图62步骤C中所示,将包含独特标识符序列和/或患者标识符序列的接头(灰色填充双线)附接至HphI裂解的DNA片段。所述接头含有3'端阻断基团或含硫代磷酸根的主链(****)以抑制随后被3'-核酸外切酶(实心三角形)消化。只有两侧都附接有接头的片段仍将为双链。如图62的步骤D中所示,接头的游离端通过以下方式具备连接能力:(i)使5'端磷酸化;(ii)去除3'阻断基团;或(iii)使用5'核酸酶活性裂解掉匹配的5'重叠碱基或侧翼以产生可连接的5'-磷酸根;或(iv):(i)、(ii)、(iii)的任何组合。连接(实心圆)条件被设计成有利于寡聚作用。如图62步骤E中所示,连接产物包含在最初在基因组DNA中未甲基化的相邻HphI序列内的被亚硫酸氢盐转化的DNA未甲基化的补体,具有任选的独特标识符和/或患者标识符序列。最终产物适用于任选的额外步骤和后续测序。
用于产生集合的不同环状嵌合单链核酸构建体的另一种合适的方法包括提供包含可能含有一个或多个碱基差异或一个或多个甲基化残基的一个或多个靶基因组DNA区段的样品以及将核苷酸接头序列附接至所述靶基因组DNA区段的3'和5'端。附接的核苷酸接头任选地包含:(i)患者标识符序列;(ii)第一固体载体引物特异性部分;(iii)第二固体载体引物特异性部分;和/或(iv)独特标识符序列。提供一个或多个第一寡核苷酸探针,其中每个第一寡核苷酸探针包含:(a)与所述附接有接头的靶基因组DNA区段的3'接头部分互补的部分;(b)与所述附接有接头的靶基因组DNA区段的5'接头部分互补的部分;和(c)任选的其它部分。所述其它部分任选地包含:(i)患者标识符序列;(ii)第一固体载体引物特异性部分;(iii)第二固体载体引物特异性部分;和/或(iv)独特标识符序列。在有效地使第一寡核苷酸探针的3'和5'部分以碱基特异性方式与所述附接有接头的靶基因组DNA区段(如果存在于所述样品中)的互补接头杂交的条件下,使所述样品与所述一个或多个第一寡核苷酸探针接触。产生了适用于连接杂交至第一寡核苷酸探针的附接有接头的靶基因组DNA区段的3'和5'端的一个或多个可连接结。所述附接有接头的靶基因组DNA区段在一个或多个连接结处的连接形成所述集合的不同的环状嵌合单链核酸构建体。
图63示出了用于产生如上所述的适于测序的嵌合环状单链核酸靶构建体的示例性相关过程。在这些实施方案中,原始基因组区段包括cfDNA的区段(~160bp)或剪切基因组DNA的区段(~160bp),它们含有例如肿瘤特异性突变、SNP或多态性重复序列。所述过程开始于将短接头连接到DNA区段的3’和5’端上(粗黑条,图63,步骤A)。描绘于图63的右图中的过程的附接接头包含可连接的5’磷酸根基团,而描绘于图63的左图中的过程的附接接头不包含可连接的5’磷酸根基团。含有与靶DNA区段的5'和3'接头互补的核苷酸序列和5'阻断基团的寡核苷酸探针(粗黑线)与它们的相应靶DNA区段杂交(图63,步骤A)。所述寡核苷酸探针的接头特异性部分被其它部分隔开。该其它部分包含任选的独特标识符部分和/或患者标识符部分和/或一条或多条引物结合序列。聚合酶(实心菱形)延伸杂交的靶DNA区段的3'接头端,形成与靶DNA区段的5'接头端的连接结(图63,步骤B)。在图63步骤C中所示的实施方案中,具有5'-核酸酶活性的聚合酶在延伸后裂解5'接头上的匹配的5'-重叠碱基,生成可连接的5'-磷酸根。在图63步骤C的右图中所描绘的实施方案中,可以利用缺乏5'→3'核酸酶活性的聚合酶,因为靶DNA区段的5'接头包含可连接的5'端。聚合酶还使用杂交的环化靶DNA区段作为模板来延伸寡核苷酸探针的3'端,直到其达到所述探针的5'阻断基团。如图63的步骤D中所示,连接酶(实心圆)共价密封DNA区段的延伸的3'端和5'端以形成环状连接产物。寡核苷酸探针上的5'阻断基团防止聚合酶延伸的寡核苷酸探针的环化。如图63的步骤E中所示,核酸外切酶消化去除所有未连接的或有缺口的产物,只留下所需的单链环化DNA连接产物。这些环化连接产物适于任选用独特或重复序列(例如,四核苷酸重复)捕获,或使用独特靶向引物进行滚环延伸,以及后续测序。
图64示出了用于产生如上所述的适于测序的嵌合环状单链核酸靶构建体的另一种示例性过程。在此实施方案中,靶基因组DNA区段是具有适于连接或延伸的5'和3'端的双链靶基因组DNA区段(图64,步骤B)。靶基因组DNA区段附接有核苷酸接头序列。根据这个实施方案,所述核苷酸接头包括第一和第二接头寡核苷酸,其中(i)第一接头寡核苷酸包含5'单链部分、一个或多个可裂解核苷酸或核苷酸类似物、独特标识符序列、与第二接头寡核苷酸互补的3'端和3'-OH;以及(ii)第二接头寡核苷酸包含5'-OH端、与第一接头寡核苷酸互补的5'部分和任选的3'-阻断端。第二接头寡核苷酸与第一接头寡核苷酸的其互补部分杂交形成适于附接至靶基因组DNA区段的复合接头。
如图64步骤C-D中所示,在适用于以下目的的条件下掺混所述双链靶基因组DNA与所述复合接头、连接酶和聚合酶:(i)所述复合接头的第一接头寡核苷酸的3'-OH连接至所述双链靶基因组DNA区段的5'端;(ii)聚合酶延伸所述双链靶基因组DNA区段的3'端,以形成所述复合接头的第一接头寡核苷酸的互补拷贝;和(iii)裂解所述一个或多个可裂解核苷酸或核苷酸类似物,以形成附接有接头的靶基因组DNA区段。含有与靶DNA区段的接头的5'和3'单链部分互补的核苷酸序列的寡核苷酸探针(细黑双线)与它们的相应靶DNA区段杂交(图64,步骤F)。所述寡核苷酸探针包含患者标识符序列、引物结合位点和在3'端上的错配尾。聚合酶(实心菱形)延伸杂交的靶DNA区段的3'接头端,形成与靶DNA区段的5'接头端的连接结(图64,步骤G)。如图64的步骤H中所示,连接酶(实心圆)共价密封附接有接头的DNA区段的3'和5'端以形成环状连接产物。这些环化连接产物适于任选用独特或重复序列(例如,四核苷酸重复)捕获,或使用独特靶向引物进行滚环延伸,以及后续测序。
图65示出了用于产生如上所述的适于测序的嵌合环状单链核酸靶构建体的示例性相关过程。在这些实施方案中,原始基因组区段包括cfDNA的区段(~160bp)或剪切基因组DNA的区段(~160bp),它们含有例如肿瘤特异性突变、SNP或多态性重复序列。所述过程开始于将包含单链部分(细黑双线)和双链部分(粗黑条)的复合接头连接到DNA区段的3'和5'端上(图65,步骤A)。描绘于图65步骤B(右图)中的过程的附接接头包含可连接的5’磷酸根基团,而描绘于图65步骤B(左图)中的过程的附接接头不包含可连接的5’磷酸根基团。含有与靶DNA区段的接头的5'和3'单链部分互补的核苷酸序列的寡核苷酸探针(细黑双线)与它们的相应靶DNA区段杂交。聚合酶(实心菱形)延伸杂交的靶DNA区段的3'接头端,形成与靶DNA区段的5'接头端的连接结(图65,步骤C)。在图65步骤C中所示的实施方案中,具有5'-核酸酶活性的聚合酶在延伸后裂解5'接头上的匹配的5'-重叠碱基,生成可连接的5'-磷酸。如图65的步骤D中所示,连接酶(实心圆)共价密封附接有接头的DNA区段的3'和5'端以形成环状连接产物。如图65的步骤E中所示,核酸外切酶消化去除所有未连接的或有缺口的产物,只留下所需的单链环化DNA连接产物。这些环化连接产物适于任选用独特或重复序列(例如,四核苷酸重复)捕获,或使用独特靶向引物进行滚环延伸,以及后续测序。
用于附接接头的标准方法图解说明于图66中并且为本领域技术人员所熟知。在这些实施方案中,原始基因组区段包括cfDNA的区段(~160bp)或剪切基因组DNA的区段(~160bp),它们含有例如肿瘤特异性突变、SNP或多态性重复序列。利用具有3’-5’核酸外切酶活性的聚合酶(诸如T4聚合酶或DNA聚合酶I大(克列诺(Klenow))片段)修复DNA片段的末端,这延伸凹陷的3’端或降解3’悬突端,直到它们与5’端齐平(图66,步骤A)。用T4激酶使5’端磷酸化,并用缺乏3’->5’核酸酶活性的DNA聚合酶I大(克列诺)片段将额外的A碱基附接至3’端(图66,步骤B和C)。使用T4连接酶连接在具有3'T悬突的接头上(图66,步骤D)。在这幅图中,使用接头的引物部分1和3分别确定任选的患者标识符序列和独特标识符序列1和2。使用引物部分2和3’分别测定正向和反向靶DNA的序列。这个产物适用于使原始靶上链或下链环化,如上文图63和65中所示。
虽然标准方法提供在接头的单链部分上引入独特序列的机会,但这些序列不允许上链序列与下链序列精确匹配。为得到这类构建体,如图67中所示修改标准方法。在这些实施方案中,原始基因组区段包括cfDNA的区段(~160bp)或剪切基因组DNA的区段(~160bp),它们含有例如肿瘤特异性突变、SNP或多态性重复序列。利用具有3’-5’核酸外切酶活性的聚合酶(诸如T4聚合酶或DNA聚合酶I大(克列诺)片段)修复DNA片段的末端,这延伸凹陷的3’端或降解3’悬突端,直到它们与5’端齐平(图67,步骤A)。任选地用T4激酶使5’端磷酸化(图67,步骤B),并利用缺乏3’→5’核酸酶活性的DNA聚合酶I大(克列诺)片段将A碱基悬突添加至3’端。
在此实施方案中,接头序列包含第一、第二和第三寡核苷酸。第一寡核苷酸包含第一固体载体引物特异性部分、一条或多条第一患者标识符序列、第一测序引物结合位点和与第三寡核苷酸互补的3'端。第二寡核苷酸包含与第三寡核苷酸的5’端互补的区域,且第三寡核苷酸包含与第二寡核苷酸互补的5’端、第二测序引物结合位点、与第一寡核苷酸的3’端互补的部分、第二患者标识符序列和第二固体载体引物特异性部分。第三寡核苷酸与第一和第二寡核苷酸的互补部分杂交形成复合接头。如图67,步骤D中所示,双链靶基因组DNA区段与复合接头、连接酶和聚合酶在适用于将复合接头的第二和第三寡核苷酸分别连接至双链靶基因组DNA区段的5’和3’端的条件下掺混。聚合酶延伸复合接头的第一寡核苷酸的3’端,以产生与复合接头的第二寡核苷酸的5’端上的连接结(图67,步骤E)。如果复合接头的第二寡核苷酸的5’端未被磷酸化,聚合酶应具有5’-3’核酸酶活性,以释放适合连接的5’磷酸根。如果第二寡核苷酸的5’端被磷酸化,聚合酶应缺乏5’-3’核酸酶活性,从而允许一直延伸到接头,随后以连接酶密封缺口。如图67步骤E中所示,连接酶在所述连接结处共价密封复合接头的第一和第二寡核苷酸,以形成附接接头的双链靶基因组DNA。在这个实施方案中,使用接头的引物部分1和3分别确定任选的患者标识符序列1和2(参见图67,步骤F)。使用接头的引物部分2和3’分别测定正向和反向靶DNA以及独特标识符序列1和2的序列。这个产物适用于使原始靶链的每条链环化,如上文图63和65中所示。在测定这些链的序列时,独特标识符序列1和2将能够使得上链序列与下链序列精确匹配,因而允许独立地验证原始靶分子的两条链上的低丰度突变。
图68例示另一种将引物序列附接至靶DNA,使得它适用于产生嵌合环状单链核酸靶构建体,并允许上链序列与下链序列精确匹配的方法。在这些实施方案中,原始基因组区段包括cfDNA的区段(~160bp)或剪切基因组DNA的区段(~160bp),它们含有例如肿瘤特异性突变、SNP或多态性重复序列。利用具有3’-5’核酸外切酶活性的聚合酶(诸如T4聚合酶或DNA聚合酶I大(克列诺)片段)修复DNA片段的末端,这延伸凹陷的3’端或降解3’悬突端,直到它们与5’端齐平(图68,步骤A)。任选地用T4激酶使5’端磷酸化(图68,步骤B)。逆转录酶如莫洛尼鼠白血病病毒逆转录酶(M-MLV RT,New England Biolabs)或Superscript II或III逆转录酶(Life Technologies)将三个C碱基附接至每个靶的3’端(图68,步骤C)。
在这个实施方案中,接头序列包含(i)在3’端包含第一固体载体引物特异性部分、一条或多条第一患者标识符序列、第一测序引物结合位点和核糖鸟苷碱基的第一接头寡核苷酸,和(ii)包含第二测序引物结合位点、第二患者标识符序列、第二固体载体引物特异性部分和与所述第一寡核苷酸互补的5’部分的第二接头寡核苷酸。双链靶基因组DNA区段与接头序列、逆转录酶和连接酶掺混形成逆转录连接反应混合物。第一接头寡核苷酸的核糖鸟苷碱基与双链靶基因组DNA区段的3’胞嘧啶悬突杂交(图68,步骤D)。逆转录酶经历链转换,且双链靶基因组DNA区段的3’杂交端经过延伸产生与第一接头寡核苷酸的第一患者标识符序列互补的序列和与第二接头寡核苷酸的5’端的连接结(图68,步骤D)。双链靶基因组DNA区段的延伸3’端连接至第二寡核苷酸的5’端的连接结。RNA酶H2裂解第一接头寡核苷酸的核糖鸟苷碱基,从而释放适合聚合酶介导的延伸的3’OH(图68,步骤E)。延伸第一接头寡核苷酸的3’端,并连接至双链靶基因组DNA的5’端(图68,步骤F)。如果第二接头或靶DNA的5’端未被磷酸化,聚合酶应具有5’-3’核酸酶活性,以释放适合连接的5’磷酸根。如果第二接头和靶被磷酸化,如图68中所示,聚合酶应缺乏5’-3’核酸酶活性,从而允许分别一直延伸至第二引物或靶的5’端,随后以连接酶密封缺口。如图68,步骤G中所示,使用接头的引物部分1和3分别测定任选的患者标识符序列1和2。使用接头的引物部分2和3’分别测定正向和反向靶DNA以及独特标识符序列1和2的序列。这个产物适用于使原始靶链的每条链环化,如上文图63和65中所示。在测定这些链的序列时,独特标识符序列1和2将能够使得上链序列与下链序列精确匹配,因而允许独立地验证原始靶分子的两条链上的低丰度突变。
图69例示另一种将引物序列附接至靶DNA,使得它适用于产生嵌合环状单链核酸靶构建体。在这个实施方案中,原始基因组区段包括cfDNA的区段(~160bp)或剪切基因组DNA的区段(~160bp),它们含有例如肿瘤特异性突变、SNP或多态性重复序列。使片段变性,以使靶成为单链(图69,步骤A)。使用dATP和ATP的混合物,利用末端转移酶给3’端加上尾,以使得平均添加50-100个碱基,且在最初的30个碱基中并入至少一个可裂解rATP(图69,步骤B)。根据这个实施方案,提供一组或多组寡核苷酸,其中每个组包含i)包含第二固体载体引物特异性部分、一条或多条患者标识符序列、测序引物结合位点和与靶基因组DNA区段的延伸区域互补的包含一个或多个可裂解核苷酸的单核苷酸重复区域的引物寡核苷酸,和(ii)包含第一固体载体引物特异性部分、一条或多条患者标识符序列、测序引物结合位点的第一接头寡核苷酸。第一接头寡核苷酸在其3’具有两个核糖鸟苷碱基和锁核酸尿苷碱基(rGrG+G)。如图69,步骤B中所描绘,所述过程涉及使含有5’引物结合位点(3和4)、任选的患者和独特标识符(2)、3’端的(T,dU)30VN序列和可裂解连接处(dU)的引物寡核苷酸与靶基因组DNA的末端转移酶延伸区域杂交(图69,步骤B)。逆转录酶如莫洛尼鼠白血病病毒逆转录酶(M-MLV RT,New England Biolabs)或Superscript II或III逆转录酶(LifeTechnologies)延伸引物,以得到靶的全长拷贝,并将三个C碱基附接至延伸靶序列的3’端(图68,步骤C)。具有3’rGrG+G的第一接头寡核苷酸与延伸靶序列的三个C碱基杂交,如图68,步骤C中所示。逆转录酶经历链转换,并拷贝第一接头寡核苷酸(图69,步骤D)。RNA酶H2裂解RNA碱基,释放A尾巴中以及邻近第一接头寡核苷酸的rGrG+G的DNA的3’OH(图69,步骤D).具有5’→3’核酸酶活性的聚合酶复制引物寡核苷酸区域,延伸第一接头寡核苷酸并释放靶DNA上的5’磷酸根(图69,步骤F)。连接酶密封第一接头寡核苷酸的缺口,以将第一接头连接至原始靶链(图69,步骤G)。随后,将缺口引入引物寡核苷酸的可裂解连接处(例如dU的UDG裂解),使得靶的拷贝将不会经历进一步扩增,因其缺乏第一引物结合区域。在这幅图中,使用引物部分1和3分别测定任选的患者标识符序列和独特标识符序列1和2(图69,步骤H)。使用引物部分2和3’分别测定正向和反向靶DNA的序列。当使用引物3’时,对于初始环,使用没有终止子的TTP,使得仪器不耗费时间来给T30区域测序。这个产物适用于使原始靶上链或下链环化,如上文图63和65中所示。
图70示出了用于产生如上所述的适于测序的嵌合环状单链核酸靶构建体的另一种示例性过程。在这些实施方案中,原始基因组区段包括cfDNA的区段(~160bp)或剪切基因组DNA的区段(~160bp),它们含有例如肿瘤特异性突变、SNP或多态性重复序列。所述过程开始于将短接头连接到DNA区段的3’和5’端上(粗黑条,图70,步骤A)。所附接的接头的5'端任选地包含可连接的磷酸根。含有与靶DNA区段的独特或重复部分(即,AGAT重复)以及接头的5'和3'侧互补的序列的寡核苷酸探针与其相应的靶DNA区段杂交(如图70步骤B中所示)。所述寡核苷酸探针还包含其它部分,其含有独特标识符序列、患者标识符序列、可连接的5’磷酸根和可裂解连接(dU)中的一个或多个。聚合酶(实心菱形)延伸靶DNA区段和寡核苷酸探针的杂交3'端(图70,步骤C),以分别形成与靶DNA区段和探针的相应5'端的连接结。在靶片段或探针上不存在可连接的5’磷酸根的情况下,聚合酶5'-核酸酶活性裂解匹配的5'-重叠碱基,产生可连接的5'-磷酸根。如图70的步骤D中所示,连接酶(实心圆)共价密封寡核苷酸探针和靶区段的相邻末端,形成环状互锁连接产物。随后,在寡核苷酸探针的可裂解连接处(例如,dU的UDG裂解,实心三角形)引入缺口。如图70的步骤E中所示,核酸外切酶消化去除所有未连接的或有缺口的产物,只留下包含连接至独特标识符序列的原始靶DNA区段的所需单链环状构建体。最终产物适用于任选的额外步骤和后续测序。
图71示出了用于产生如上所述的适于测序的嵌合环状单链核酸靶构建体的另一种示例性过程。在这些实施方案中,原始基因组区段包括cfDNA的区段(~160bp)或剪切基因组DNA的区段(~160bp),它们含有例如肿瘤特异性突变、SNP或独特序列。所述过程开始于将短接头连接到DNA区段的3’和5’端上(粗黑条/白条,图71,步骤A)。所附接的接头的5'端任选地包含可连接的磷酸根。含有与靶DNA区段的独特序列以及接头的5'和3'侧互补的序列的寡核苷酸探针与其相应的靶DNA区段杂交(如图71步骤B中所示)。所述寡核苷酸探针还包含其它部分,其含有独特标识符序列、患者标识符序列、任选的可连接的5’磷酸根和任选的可裂解连接(dU)中的一个或多个。在一个实施方案中,所述寡核苷酸探针的3'端进一步包括一些额外的碱基和一个阻断基团,其被释放,以形成只有在与作为阻断基团的靶标(例如核糖核苷酸碱基)和作为裂解核酸酶的RNA酶H2(星)杂交时被核酸酶裂解的游离3’OH(图71,步骤C)。聚合酶(实心菱形)延伸靶DNA区段和寡核苷酸探针的杂交3'端(图71,步骤C),以分别形成与靶DNA区段和探针的相应5'端的连接结。在靶片段或探针上不存在可连接的5’磷酸根的情况下,聚合酶5'-核酸酶活性裂解匹配的5'-重叠碱基,产生可连接的5'-磷酸根。如图71的步骤D中所示,连接酶(实心圆)共价密封寡核苷酸探针和靶区段的相邻末端,形成环状互锁连接产物。随后,在寡核苷酸探针的可裂解连接处(例如,dU的UDG裂解,实心三角形)引入缺口。如图71的步骤E中所示,核酸外切酶消化去除所有未连接的或有缺口的产物,只留下包含连接至任选的患者标识符序列或独特标识符序列的原始靶DNA区段的所需单链环状构建体。最终产物适用于任选的额外步骤和后续测序。
图72示出了用于产生如上所述的适于测序的嵌合环状单链核酸靶构建体的另一种示例性过程。在这些实施方案中,原始基因组区段包括cfDNA的区段(~160bp)或剪切基因组DNA的区段(~160bp),它们含有例如肿瘤特异性突变、SNP或独特序列。所述过程开始于将短接头连接到DNA区段的3’和5’端上(粗黑条/白条,图72,步骤A)。所附接的接头的5'端任选地包含可连接的磷酸根。含有与靶DNA区段的独特序列以及接头的5'和3'侧互补的序列的寡核苷酸探针与其相应的靶DNA区段杂交(如图71步骤B中所示)。所述寡核苷酸探针还包含其它部分,其含有独特标识符序列、患者标识符序列、可连接的5’磷酸根和任选的可裂解连接(dU)中的一个或多个。在一个实施方案中,所述寡核苷酸探针的3'端进一步包括一些额外的碱基和一个阻断基团,其被释放,以形成只有在与作为阻断基团的靶(例如核糖核苷酸碱基)和作为裂解核酸酶的RNA酶H2(星)杂交时被核酸酶裂解的游离3’OH。当寡核苷酸探针杂交到靶上时,释放的3'OH端现在适用于直接连接到5'磷酸化末端(图72,步骤C)。聚合酶(实心菱形)延伸靶DNA区段的杂交3'端(图72,步骤C),以形成与靶DNA区段的相应5'端的连接结。在靶片段的接头上不存在可连接的5’磷酸根的情况下,聚合酶5'-核酸酶活性裂解匹配的5'-重叠碱基,产生可连接的5'-磷酸根。如图72的步骤D中所示,连接酶(实心圆)共价密封靶区段的相邻末端,形成环状互锁连接产物。随后,在寡核苷酸探针的可裂解连接处(例如,dU的UDG裂解,实心三角形)引入缺口。如图72的步骤E中所示,核酸外切酶消化去除所有未连接的或有缺口的产物,只留下包含连接至任选的患者标识符序列或独特标识符序列的原始靶DNA区段的所需单链环状构建体。最终产物适用于任选的额外步骤和后续测序。
图73示出以杂交的靶-特异性寡核苷酸产生嵌合环状单链核酸靶构建体的示例性过程,所述产物适于引发如上文所述的滚环扩增和测序。在这些实施方案中,原始基因组区段包括cfDNA的区段(~160bp)或剪切基因组DNA的区段(~160bp),它们含有例如肿瘤特异性突变、SNP或独特序列。所述过程开始于将包含单链部分(细黑双线)和双链部分(粗黑条)的复合接头连接到DNA区段的3'和5'端上(图73,步骤A)。图73左图中所描绘的过程的附接接头含有可连接的5’磷酸根基团,而图73右图中所描绘的过程的附接接头不含可连接的5’磷酸根基团。含有与靶DNA区段(粗黑线)的独特序列以及附接至靶DNA区段的接头(细黑双线)的5'和3'单链部分互补的核苷酸序列的寡核苷酸探针与其相应的靶DNA区段杂交(如图73步骤B中所示)。所述寡核苷酸探针还含有任选的独特标识符序列、任选的患者标识符序列、在5'端上的任选磷酸以及一个或多个可裂解连接(dU)。在一个实施方案中,所述寡核苷酸探针的3'端进一步包括一些额外的碱基和一个阻断基团,其被释放,以形成只有在与作为阻断基团的靶(例如核糖核苷酸碱基)和作为裂解核酸酶的RNA酶H2(星)杂交时被核酸酶裂解的游离3’OH。聚合酶(实心菱形)延伸靶DNA区段和寡核苷酸探针的杂交3'端(图73,步骤C),以分别形成与靶DNA区段和探针的相应5'端的连接结。在靶片段或探针上不存在可连接的5’磷酸根的情况下,聚合酶5'-核酸酶活性裂解匹配的5'-重叠碱基,产生可连接的5'-磷酸根。如图73的步骤D中所示,连接酶(实心圆)共价密封寡核苷酸探针和靶区段的相邻末端,形成环状互锁连接产物。随后,在寡核苷酸探针的可裂解连接处(例如,dU的UDG裂解,实心三角形)引入一个或多个缺口。如图73的步骤E中所示,裂解的寡核苷酸片段从靶DNA上脱落,只留下具有靶标特异性杂交引物的包含原始靶DNA区段的所需单链环状构建体。最终产物适用于滚环扩增、任选的额外步骤和后续测序。
图74描绘以杂交的靶-特异性寡核苷酸产生嵌合环状单链核酸靶构建体的另一个示例性过程,所述产物适于引发如上文所述的滚环扩增和测序。这个实施方案的步骤与图73,步骤A-E中所示实施方案类似。然而,在这个实施方案中,寡核苷酸探针还包含将产物捕获在固体载体(即链霉亲和素涂覆的固体载体)上的捕获基团(Z)(即生物素)。如图74的步骤E中所示,裂解的寡核苷酸片段从靶DNA上脱落,只留下具有靶标特异性杂交引物的包含原始靶DNA区段的所需单链环状构建体,所述靶标特异性杂交引物还含有用于后续捕获步骤的捕获基团(Z)。最终产物适用于滚环扩增、任选的额外步骤和后续测序。
图75示出以杂交的靶-特异性寡核苷酸产生嵌合环状单链核酸靶构建体的另一个示例性过程,所述产物适于引发如上文所述的滚环扩增和测序。在这些实施方案中,原始基因组区段包括cfDNA的区段(~160bp)或剪切基因组DNA的区段(~160bp),它们含有例如肿瘤特异性突变、SNP或独特序列。所述过程开始于将包含单链部分(细黑双线)和双链部分(粗黑条)的复合接头连接到DNA区段的3'和5'端上(图75,步骤A)。图75左侧所描绘的过程的附接接头含有可连接的5’磷酸根基团,而图75右侧所描绘的过程的附接接头不含可连接的5’磷酸根基团。含有与靶DNA区段(粗黑线)的独特序列以及靶DNA区段的附接接头(细黑双线)的5'和3'单链部分互补的核苷酸序列的寡核苷酸探针与其相应的靶DNA区段杂交(如图75步骤B中所示)。所述寡核苷酸探针还任选地含有独特标识符序列、任选的患者标识符序列、在5'端上的任选磷酸以及一个或多个可裂解连接(dU)。在一个实施方案中,所述寡核苷酸探针的3'端进一步包括一些额外的碱基和一个阻断基团,其被释放,以形成只有在与作为阻断基团的靶(例如核糖核苷酸碱基)和作为裂解核酸酶的RNA酶H2(星)杂交时被核酸酶裂解的游离3’OH。因为寡核苷酸探针的末端在RNA酶H2裂解之后彼此相邻,所以它们适用于用连接酶密封(图75,步骤C)。聚合酶(实心菱形)延伸靶DNA区段的杂交3'端(图75,步骤C,右图),以形成与靶DNA区段的相应5'端的连接结。在靶片段上不存在可连接的5’磷酸根的情况下,聚合酶5'-核酸酶活性裂解匹配的5'-重叠碱基,产生可连接的5'-磷酸根。如图75的步骤D中所示,连接酶(实心圆)共价密封靶区段的相邻末端,形成环状互锁连接产物。随后,在寡核苷酸探针的可裂解连接处(例如,dU的UDG裂解,实心三角形)引入一个或多个缺口。如图75的步骤E中所示,裂解的寡核苷酸片段从靶DNA上脱落,只留下具有靶标特异性杂交引物的包含原始靶DNA区段的所需单链环状构建体。最终产物适用于滚环扩增、任选的额外步骤和后续测序。
图76是以杂交的靶-特异性寡核苷酸产生嵌合环状单链核酸靶构建体的另一个示例性过程,所述产物适于如上文所述的滚环扩增和测序。该实施方案的步骤类似于在图75步骤A-E中所描绘的那些。然而,在这个实施方案中,寡核苷酸探针还包含将产物捕获在固体载体(即链霉亲和素涂覆的固体载体)上的捕获基团(Z)(即生物素)。如图76的步骤E中所示,裂解的寡核苷酸片段从靶DNA上脱落,只留下具有靶标特异性杂交引物的包含原始靶DNA区段的所需单链环状构建体,所述靶标特异性杂交引物还含有用于后续捕获步骤的捕获基团(Z)。最终产物适用于滚环扩增、任选的额外步骤和后续测序。
图77示出了用于产生如上所述的适于测序的嵌合环状单链核酸靶构建体的另一种示例性过程。在这些实施方案中,原始基因组区段包括cfDNA的区段(~160bp)或剪切基因组DNA的区段(~160bp),它们含有例如肿瘤特异性突变、SNP或多态性重复序列。所述过程开始于将短接头连接到DNA区段的3’和5’端上(粗黑条,图77,步骤A)。所附接的接头的5'端任选地包含可连接的磷酸(图77,步骤B,左图)。含有与靶DNA区段的独特或重复部分(即,AGAT重复)以及附接接头的5'和3'侧互补的序列的寡核苷酸探针与其相应的靶DNA区段杂交(如图77步骤B中所示)。所述寡核苷酸探针还包含其它部分,其含有独特标识符序列、患者标识符序列、可连接的5’磷酸根和可裂解连接(dU)中的一个或多个。图77,步骤C示出了3个dNTP(即dTTP、dCTP、dATP)用于聚合酶(实心菱形)介导靶DNA区段和寡核苷酸探针的3’端的延伸的用途。靶DNA区段的3'端的延伸形成与靶DNA区段的相应5'端的连接结。在靶DNA区段上不存在可连接的5’磷酸根的情况下(图77,步骤C),聚合酶的5'-核酸酶活性裂解匹配的5'-重叠碱基,产生可连接的5'-磷酸根。在图77的步骤D中,连接酶(实心圆)共价密封靶DNA区段的相邻末端以形成环状连接产物。核酸外切酶消化去除所有未连接的或有缺口的产物,只留下包含连接至独特标识符序列的原始靶DNA区段的所需单链环状构建体。最终产物适用于任选的额外步骤和后续测序。
图78示出了用于产生如上所述的适于测序的嵌合环状单链核酸靶构建体的另一种示例性过程。在这些实施方案中,原始基因组区段包括cfDNA的区段(~160bp)或剪切基因组DNA的区段(~160bp),它们含有例如肿瘤特异性突变、SNP或多态性重复序列。所述过程开始于将短接头连接到DNA区段的3’和5’端上(粗黑条,图78,步骤A)。所述过程的附接接头含有独特标识符序列,以及任选的患者标识符序列和可连接的5’磷酸根基团。如图78步骤B中所示,含有与靶DNA区段的独特或重复部分(即,AGAT重复)以及附接接头的5'和3'侧互补的序列的寡核苷酸探针与其相应的靶DNA区段杂交。所述寡核苷酸探针还包含任选的可裂解连接(dU)和5'可连接的磷酸根基团。当附接靶DNA区段的接头的5'端和/或寡核苷酸探针的5'端不含有可连接的5'端(图78,左图),而是包含侧翼或重叠碱基(图78,步骤B,右图),5'-核酸酶活性(实心菱形)在匹配5'-重叠碱基或侧翼处裂解,留下可连接的-5'-磷酸根(图78,步骤C)。如图78的步骤D中所示,连接酶(实心圆)共价密封寡核苷酸探针和靶DNA区段的相邻末端,形成环状互锁连接产物。随后,在寡核苷酸探针的可裂解连接(例如,dU的UDG裂解,实心三角形)处引入缺口,且核酸外切酶消化去除所有未连接的或有缺口的产物,只留下包含连接至独特标识符序列的原始基因组靶DNA的所需单链环状DNA。最终产物适用于任选的额外步骤和后续测序。
图63、65和70-78中例示用于产生适用于测序的嵌合环状单链核酸靶构建体的程序,以及图66、67、68和69中例示用于在产生嵌合环状单链核酸靶构建体的过程中将接头附接至靶DNA上的程序的共同点是否将原始靶DNA捕获进入单链环中。在一些实施方案中,寡核苷酸探针提供了一些靶选择性(图70-78),并且在一些情况下,产品既包括单链环中的原始靶DNA以及适用于滚环扩增或直接捕获和后续测序的靶标特异性杂交引物(图73-76)。对于其中最终产物是嵌合环状单链核酸靶没有杂交的引物的那些方法,图79-81举例说明了三种用于以非常高的特异性杂交靶标特异性引物,接着捕获,洗去非靶核酸,以及随后滚环扩增的不同方法。
图79示出了用于富集如上所述的适于测序的所需靶标特异性嵌合环状单链核酸靶构建体的示例性过程。靶标特异性寡核苷酸引物经设计包含阻断3’基团,如果且只有与靶杂交时,所述基团通过可裂解核糖核苷酸连接处的RNA酶H2裂解释放(Dobosy等人,“RNA酶H-Dependent PCR(rhPCR):Improved Specificity and Single NucleotidePolymorphism Detection Using Blocked Cleavable Primers,”BMC Biotechnol.11:80(2011),该文献以引用的方式整体并入本文中)以及任选的5’捕获基团(例如,生物素部分)(参见图79,步骤B)。包含所需靶的环状DNA通过引物上的捕获基团将杂交引物/环构建体捕获在固体载体上富集,例如,链霉亲和素捕获生物素部分。通过洗涤移除不含靶的环。在可裂解连接处引入缺口(例如核糖核苷酸r的RNA酶裂解),以从固体载体释放含靶的环,并在引物上产生3’-OH基团。具有链置换活性的聚合酶延伸引物的释放3’端,以进行滚环扩增(参见图80,步骤B)。该延伸产物适用于后续测序。
图80示出了用于富集如上所述的适于测序的所需靶标特异性嵌合环状单链核酸靶构建体的另一种示例性过程。在这个实施方案中,靶标特异性寡核苷酸引物经设计以包含5’15-20个碱基的锚序列、3-5个错配碱基、6-10个与靶互补的匹配碱基(Chun等人,“DualPriming Oligonucleotide System for the Multiplex Detection of RespiratoryViruses and SNP Genotyping of CYP2C19 Gene,”Nucleic Acids Res.35(6):e40(2007),该文献以引用的方式整体并入本文中)。如图79中所示,寡核苷酸引物还包含阻断3’基团,如果且只有在于靶杂交时,所述基团才在可裂解核糖核苷酸连接处通过RNA酶H2裂解释放;以及任选的5’捕获基团(即生物素部分)(参见图80,步骤B)。包含所需靶的环状DNA通过捕获基团将杂交引物/环构建体捕获在固体载体上富集,例如,链霉亲和素捕获生物素部分。通过洗涤移除不含靶的环。在可裂解连接处引入缺口(例如核糖核苷酸r的RNA酶裂解),以从固体载体释放含靶的环,并在引物上产生3’-OH基团(图80,步骤C)。具有链置换活性的聚合酶延伸引物的释放3’端,以进行滚环扩增(图80,步骤D)。该延伸产物适用于后续测序。
图81示出了用于富集如上所述的适于测序的所需靶标特异性嵌合环状单链核酸靶构建体的另一种示例性过程。在这个实施方案中,两个相邻寡核苷酸与环状构建体的靶标特异性部分杂交。上游寡核苷酸引物包含任选的5’捕获基团(例如,生物素部分)。下游寡核苷酸引物经设计包含5’磷酸根和阻断3’基团,如果且只有与靶杂交时,阻断3’基团通过可裂解核糖核苷酸连接处的RNA酶H2裂解释放(图81,步骤B)。在靶存在下,连接酶将两个寡核苷酸彼此共价连接(图81,步骤B)。包含所需靶的环状DNA可以通过捕获基团将杂交引物/环状构建体捕获在固体载体上富集,例如,链霉亲和素捕获生物素部分。通过洗涤移除不含靶的环。在可裂解连接处引入缺口(例如核糖核苷酸r的RNA酶裂解),以从固体载体释放含靶的环,并在下游寡核苷酸上产生3’-OH基团(图81,步骤C)。具有链置换活性的聚合酶延伸释放3’端,以进行滚环扩增(图81,步骤D)。该延伸产物适用于后续测序。
因此,图55、56、65、70和71-78中例示用于产生适用于测序的嵌合环状单链核酸靶构建体的程序,以及图79-81中例示的程序提供用于产生具有杂交的靶标特异性或引物结合位点引物的嵌合环状单链核酸靶构建体,且适用于滚环扩增,随后接着测序的实施例。图82-89例示用于捕获或进一步富集所需靶的不同策略。
图82示出了用于靶富集的示例性过程。在这个实施方案中,利用链置换聚合酶延伸与嵌合环状单链核酸靶构建体杂交的靶标特异性引物,以产生包含两个或更多个串联拷贝的串联拷贝的嵌合环状单链构建体的单链延伸产物(图82,步骤B)。与延伸产物互补的寡核苷酸杂交。这些寡核苷酸任选地含有阻断或错配3’端,并在5’端含有捕获基团Z(例如,生物素部分)(图82,步骤C)。将靶标特异性串联重复延伸产物捕获在固体载体上,并洗涤掉其它核酸。将寡核苷酸捕获在固体载体上使串联重复延伸产物变性(图82,步骤C)。该延伸产物适用于测序。
图83示出了用于靶标特异性富集的另一个示例性过程。在这个实施方案中,靶标特异性寡核苷酸引物与嵌合环状单链核酸靶杂交,且在5’端包含捕获基团Z(即生物素部分)。嵌合环状单链核酸靶构建体被捕获在固体载体上,且其它核酸被洗掉(图83,步骤A)。利用具有5’->3’核酸酶活性的聚合酶延伸原始杂交引物,以在聚合酶裂解含有捕获基团的杂交寡核苷酸的5’部分时产生从固体载体如聚合酶裂解的带缺口环(图83,步骤B)。原始聚合酶通过加热或蛋白酶失活。以链置换聚合酶延伸带缺口环的3’端,以产生靶DNA的串联拷贝的单链(图83,步骤C)。该延伸产物适用于测序。
图84示出了用于靶标特异性富集的另一个示例性过程。在这个实施方案中,两个靶标特异性寡核苷酸与嵌合环状单链核酸靶杂交,如图84步骤B中所示。寡核苷酸的3’端任选地被阻断或错配,且在5’端含有捕获基团Z(即生物素部分)。嵌合环状单链核酸靶构建体被捕获在固体载体上,且其它核酸被洗掉。使用具有链置换活性的聚合酶延伸一个杂交引物,以产生靶DNA的串联拷贝的单链,并从固体载体释放延伸产物,如图84,步骤C中所示。该延伸产物适用于测序。
图85示出了用于靶标特异性富集的另一个示例性过程。在本实施例中,第一靶标特异性寡核苷酸与嵌合环状单链核酸靶杂交。该寡核苷酸的3’端任选地被阻断或错配,且在5’端含有捕获基团Z(即生物素部分)。嵌合环状单链核酸靶构建体被捕获在固体载体上,且其它核酸被洗掉。第二靶标特异性引物与捕获的环状构建体杂交(图85,步骤B)。引入具有链置换活性的聚合酶,以延伸第二引物,产生含有靶DNA的串联拷贝的单链延伸产物,并从固体载体释放延伸产物(图85,步骤C)。该延伸产物适用于测序。
图86和87示出了用于靶标特异性富集的示例性过程。在这些实施方案中,引物结合位点引物与嵌合环状单链核酸靶杂交,并利用链置换聚合酶延伸产生含有靶DNA的串联拷贝的单链延伸产物(图86,步骤A-B和图87,步骤A-B)。与延伸产物互补的靶标特异性寡核苷酸杂交。所述杂交寡核苷酸的3’端任选地被阻断或错配,且在5’端含有捕获基团Z(即生物素部分)。将靶标特异性串联重复延伸产物捕获在固体载体上,并洗涤掉其它核酸(图86,步骤C和图87,步骤C)。在图86中,将寡核苷酸捕获在固体载体上使串联重复延伸产物变性(图86,步骤D)。该延伸产物适用于测序。在图87中,与延伸产物互补的其它靶标特异性引物杂交。以链置换聚合酶延伸从固体载体释放原始延伸产物,同时制备其它拷贝(图87,步骤D)。原始延伸产物和其它拷贝适用于测序。
图88示出了用于靶标特异性富集的另一个示例性过程。在这个实施方案中,第一靶标特异性引物和第二引物结合位点特异性寡核苷酸与嵌合环状单链核酸构建体(参见图88,步骤A-B)。第二寡核苷酸的3’端任选地被阻断或错配,且在5’端含有捕获基团Z(即生物素部分)。嵌合环状单链核酸靶构建体被捕获在固体载体上,且其它核酸被洗掉。利用具有链置换活性的聚合酶延伸第一靶标特异性杂交引物,以产生含有靶DNA的串联拷贝的单链延伸产物,并从固体载体释放延伸产物。该延伸产物适用于测序。
图89示出了用于靶标特异性富集的另一个示例性过程。在这个实施方案中,引物结合位点特异性寡核苷酸起初与嵌合环状单链核酸靶构建体杂交。该寡核苷酸的3’端任选地被阻断或错配,且在5’端含有捕获基团Z(即生物素部分)。嵌合环状单链核酸靶构建体被捕获在固体载体上,且其它核酸被洗掉(图89,步骤A)。第二靶标特异性引物与捕获的环状构建体杂交。使用具有链置换活性的聚合酶产生含有靶DNA的串联拷贝的单链延伸产物,并从固体载体释放所述延伸产物。该延伸产物适用于测序。
图90-99示出不同的寡核苷酸探针结构的重叠效果。每幅图中的寡核苷酸探针的5’(上游)靶标特异性部分、3’(下游)靶标特异性部分、间隙长度和只有3’-或者5’-和3’-锚定末端存在差异,以覆盖160核苷酸cfDNA靶区段。靶基因组DNA片段以10碱基增量移动,模拟通过核小体保护产生的所有可能160nt靶的“家族”。
图90示出适用于检测源自cfDNA的附接所有可能的160个核苷酸接头(黑条)的片段的寡核苷酸探针。在这个实施方案中,寡核苷酸探针锚定至示出的cfDNA片段家族的3’-接头附接末端,且含有60碱基5’或上游靶标特异性部分(灰条)、20碱基3’或下游靶标特异性部分(灰条)、10碱基接头特异性部分(黑条)和20碱基标识符序列(5’靶标特异性部分与接头部分之间的细线,其示出在上游和下游特异性部分之下)。为了说明性目的使用20个碱基作为标识符序列;当如图1中所示扩增和测序嵌合环状DNA时,其可以含有12个碱基的独特标识符序列和8个碱基的患者标识符序列。可替代地,当如图4-12中所示使用患者标识符、适用于固相捕获的第一和第二引物特异性部分和测序引物结合区域时,标识符部分可在40至80个碱基的范围内。图13中提供这幅图的与其靶cfDNA片段杂交的寡核苷酸探针的例证。图90中所示寡核苷酸探针上的3’靶标特异性部分与接头部分之间的长度变化的极细线对应接近图13-16中所示靶区段的3’端的成环区域的长度。由此可知,探针区域和与接头区域互补的区域彼此物理连接。
图91中所示寡核苷酸探针设计类似于图90。在这个实施方案中,寡核苷酸探针锚定至示出的cfDNA片段家族的3’-接头附接末端,且含有80碱基5’或上游靶标特异性部分、20碱基3’或下游靶标特异性部分、10碱基接头特异性部分(粗黑条)和20-160碱基标识符序列。图13-16中也提供这幅图的与其靶cfDNA片段杂交的寡核苷酸探针的例证。
图92示出适用于检测源自cfDNA的附接所有可能的核苷酸接头(黑条)的片段的寡核苷酸探针的一种变型。在这个实施方案中,寡核苷酸探针锚定至示出的cfDNA片段家族的3’-接头附接末端,且含有60碱基5’或上游靶标特异性部分(灰条)、50碱基3’或下游靶标特异性部分(灰条)、10碱基接头特异性部分(黑条)和20-160碱基标识符序列(5’靶标特异性部分与接头部分之间的细线)。使用20个碱基作为标识符序列只是为了说明目的;如上文参照图90所述的替代性长度也合适。图13和15中提供这幅图的与其靶cfDNA片段杂交的寡核苷酸探针的例证。图92中所示cfDNA片段的3’接头与cfDNA的3’端之间的变化长度的极细线对应图13-16中所示寡核苷酸探针的成环区域的长度。由此可知,探针区域和与接头区域互补的区域彼此物理连接。
图93中所示寡核苷酸探针设计类似于图92。在这个实施方案中,寡核苷酸探针锚定至示出的cfDNA片段家族的3’-接头附接末端,且含有80碱基5’或上游靶标特异性部分、50碱基3’或下游靶标特异性部分、10碱基接头特异性部分(粗黑条)、40碱基间隔基段和20-160碱基标识符序列。图13-16中提供这幅图的与其靶cfDNA片段杂交的寡核苷酸探针的例证。
图94示出适用于检测源自cfDNA的附接所有可能的160个核苷酸接头(黑条)的片段的寡核苷酸探针的一种轻微变型。在这个实施方案中,寡核苷酸探针锚定至示出的cfDNA片段家族的3’-接头附接末端,且含有50碱基5’或上游靶标特异性部分(灰条)、50碱基3’或下游靶标特异性部分(灰条)、10碱基3’接头特异性部分(黑条)、10碱基5’接头特异性部分(黑条)和20-80碱基标识符序列(5’与3’靶标特异性部分之间的细线,示出在灰条和接头部分之下)。图14中提供这幅图的与其靶cfDNA片段杂交的寡核苷酸探针的例证。图94中示出的靶cfDNA片段的变化长度的极细线对应图14的寡核苷酸探针中的成环区域,且图94的寡核苷酸探针的变化长度的极细线对应图17和18的靶DNA片段的成环区域。由此可知,探针区域和与接头区域互补的区域彼此物理连接。
图95中所示寡核苷酸探针设计类似于图94。在这个实施方案中,寡核苷酸探针锚定至示出的cfDNA片段家族的3’-接头和5’接头附接末端。所述探针含有60碱基5’或上游靶标特异性部分、60碱基3’或下游靶标特异性部分、10碱基3’接头特异性部分、10碱基5’接头特异性部分和20–80碱基标识符序列。图17和18中也提供这幅图的与其靶cfDNA片段杂交的寡核苷酸探针的例证。
图96示出适用于检测源自cfDNA的所有可能160个核苷酸非接头附接片段的寡核苷酸探针设计的另一变型(深灰条)。在这个实施方案中,寡核苷酸探针含有50碱基5’或上游靶标特异性部分(灰条和黑线)、50碱基3’或下游靶标特异性部分(灰条和黑线)和20-80碱基标识符序列(5’与3’靶标特异性部分之间的细线,且示出在灰条之下)。灰色探针区域内的短竖直黑线象征与原始靶单碱基错配,使得可容易鉴定真正靶DNA和探针拷贝。图23-26中提供这幅图的与其靶cfDNA片段杂交的寡核苷酸探针的例证。
图97中所示寡核苷酸探针设计类似于图96。在这个实施方案中,寡核苷酸探针含有60碱基5’或上游靶标特异性部分、60碱基3’或下游靶标特异性部分和20-160碱基标识符序列。图23、24、25和26中也提供这幅图的与其靶cfDNA片段杂交的寡核苷酸探针的例证。
图98中所示的寡核苷酸探针设计类似于图96。在这个实施方案中,寡核苷酸探针含有70碱基5’或上游靶标特异性部分、70碱基3’或下游靶标特异性部分和20-160碱基标识符序列。图23、24、25和26中也提供这幅图的与其靶cfDNA片段杂交的寡核苷酸探针的例证。
图99中所示寡核苷酸探针设计类似于图96。在这个实施方案中,寡核苷酸探针含有80碱基5’或上游靶标特异性部分、80碱基3’或下游靶标特异性部分和20-160碱基标识符序列。图23-26中也提供这幅图的与其靶cfDNA片段杂交的寡核苷酸探针的例证。
图100至103示出具有3’和/或5’接头区域的靶标特异性寡核苷酸探针在覆盖相邻160bp靶区域时对靶区域的覆盖。具体地说,图100说明了如何以重叠拼接策略设计寡核苷酸探针以对更大的连续区域(作为实例显示约500个碱基)测序。所检测的靶区域序列以深灰色部分绘出。未检测的靶区域序列绘成浅灰色部分,且接头绘成黑色部分。这幅图中的每个连续纵向分组示出通过移动随机生成的cfDNA片段(或随机剪切片段)中找到的160bp靶区域获得的探针覆盖。靶区域以10碱基增量连续移动,以展示单个探针对靶区域的覆盖。从左到右的每个连续纵向分组示出第二、第三和第四不同探针的靶区域覆盖和探针重叠。这里示出的寡核苷酸探针结构(每个纵向分组之下)含有60碱基5’或上游靶标特异性探针部分、50碱基3’或下游探针、10碱基接头部分和20-160bp标识符区域(细线)。
图101示出了如图100中所示的如何以重叠拼接策略设计用于对更大连续区域测序的寡核苷酸探针的类似说明。这里示出的寡核苷酸探针结构含有80碱基5’或上游靶标特异性探针部分、50碱基3’或下游探针、10碱基接头部分和20-160bp标识符区域(细线)。
图102示出了如图100中所示的如何以重叠拼接策略设计用于对更大连续区域测序的寡核苷酸探针的类似说明。这里示出的寡核苷酸探针结构含有50碱基5’或上游靶标特异性探针部分、50碱基3’或下游探针、10碱基5’和3’接头部分和20-160bp标识符区域(细线)。
图103示出了如图100中所示的如何以重叠拼接策略设计用于对更大连续区域测序的寡核苷酸探针的类似说明。这里示出的寡核苷酸探针结构含有60碱基5’或上游靶标特异性探针部分、60碱基3’或下游探针、10碱基5’和3’接头部分和20-160bp标识符区域(细线)。
图104至107示出没有3’或5’接头的靶标特异性相位标记的寡核苷酸在覆盖相邻160bp靶基因区域时对靶区域的覆盖(代表图20和22中所示过程)。具有50碱基5’-和3’-靶标特异性区域的寡核苷酸探针含有单个碱基错配/10碱基(纵向散列标记)。所检测的靶区域序列(深灰色);未检测的靶区域序列(浅灰色)。具体地说,图104示出在一大片基因组DNA中覆盖相邻160bp基因靶(未附接接头的靶区段)的靶标特异性相位标记的寡核苷酸。5’-和3’-靶标特异性探针具有单个碱基错配/10碱基(纵向散列标记)。图中的每个连续分组示出模拟移动cfDNA中找到的160bp靶区域的探针覆盖。靶区域以10碱基增量连续移动,以展示单个探针对靶区域的覆盖。从左到右的每个连续分组示出第二、第三和第四不同探针的靶区域覆盖和探针重叠。这幅图中所示的寡核苷酸探针含有50碱基5’或上游靶标特异性部分、50碱基3’或下游靶标特异性部分和20-160碱基序列标识符区域。
图105示出了如图104中所示的跨越相邻的160bp基因靶拼接靶标特异性相位标记寡核苷酸的类似方法。这幅图中所示的寡核苷酸探针含有60碱基5’或上游靶标特异性部分、60碱基3’或下游靶标特异性部分和20-160碱基序列标识符区域。
图106示出了如图104中所示的跨越相邻的160bp基因靶拼接靶标特异性相位标记寡核苷酸的类似方法。这幅图中所示的寡核苷酸探针含有70碱基5’或上游靶标特异性部分、70碱基3’或下游靶标特异性部分和20-160碱基序列标识符区域。
图107示出了如图104中所示的跨越相邻的160bp基因靶拼接靶标特异性相位标记寡核苷酸的类似方法。这幅图中所示的寡核苷酸探针含有80碱基5’或上游靶标特异性部分、80碱基3’或下游靶标特异性部分和20-160碱基序列标识符区域。
本发明的另一个方面涉及一种用于识别样品中的一个或多个靶核糖核酸分子的方法,所述靶核糖核酸分子与样品中的其它核酸分子的差异为一个或多个碱基。该方法包括提供包含可能含有一个或多个碱基差异的一个或多个靶核糖核酸分子的样品,以及在样品中生成所述一个或多个靶核糖核酸分子(如果存在于样品中)的cDNA。所述方法进一步包括提供一个或多个第一寡核苷酸探针,每个第一寡核苷酸探针包含:(a)3'cDNA靶标特异性序列部分;(b)5'cDNA靶标特异性部分;以及其它部分,所述其它部分包含(i)独特标识符序列、(ii)患者标识符序列、(iii)一条或多条引物结合序列或(i)、(ii)和(iii)的任何组合。在有效地使所述第一寡核苷酸探针的3'和5'靶标特异性部分以碱基特异性方式与所述cDNA的互补区域杂交的条件下,使所述样品与所述一个或多个第一寡核苷酸探针接触。产生适于连接杂交至其互补cDNA的第一寡核苷酸探针的3'和5'端的一个或多个可连接结,并连接在所述一个或多个连接结处的第一寡核苷酸探针以形成包含连接至第一寡核苷酸探针的其它部分的靶核糖核酸序列的脱氧核糖核酸拷贝的环状连接产物。所述方法进一步包括检测和区分样品中的环状连接产物,以识别与样品中的其它核糖核酸分子的差异在于一个或多个碱基的一个或多个靶核糖核酸分子的存在。
根据本发明的这个方面,图108示出以靶标特异性捕获用于测序的mRNA或lncRNA转录物的过程。如图108步骤A中所示,使含有所需靶区域的mRNA或lncRNA逆转录(逆转录–实心菱形),以产生互补DNA(cDNA)分子。如图108步骤B中所示,含有与cDNA靶区域互补的5’和3’序列的寡核苷酸探针与cDNA分子杂交。所述寡核苷酸探针的靶标特异性部分被其它部分隔开。所述其它部分包含独特标识符部分、任选的患者标识符部分和任选的5’磷酸根。如果有必要的话,聚合酶(实心菱形)延伸寡核苷酸探针的杂交3’端,以产生滑到寡核苷酸探针的5’端的3’端(图108,步骤C)。在5'端上没有可连接的磷酸的情况下,具有5'核酸酶活性的聚合酶裂解5'端上的匹配的5'-重叠碱基,产生5'-磷酸(图108,步骤C,左图)。如图108的步骤D中所示,连接酶(实心圆)共价密封延伸的或可连接的末端以形成环状连接产物。最后,如图108步骤E中所示,核酸外切酶消化去除所有未连接或有缺口的产物,只留下包含与独特标识符序列或患者标识符序列连接的靶核糖核酸序列的cDNA拷贝的所需单链环状构建体。该产物适用于使用任何本文所述的方法进行滚环扩增和测序。
本发明的另一个方面涉及一种用于识别样品中的一个或多个核酸分子的方法,所述核酸分子可能包含彼此连接的不同的第一靶和第二靶区域(例如,推定的基因融合)。该方法包括提供可能含有包含彼此连接的不同的第一靶和第二靶区域的一个或多个核酸分子的样品,并提供一个或多个寡核苷酸探针组,每个探针组包含:(i)包含5'第一靶标特异性部分、3'第二靶标特异性部分和其它部分的第一寡核苷酸探针,以及(ii)包含5'第二靶标特异性部分、3'第一靶标特异性部分和其它部分的第二寡核苷酸探针,其中探针组的第一或第二寡核苷酸探针的其它部分包含:(i)独特标识符序列、(ii)患者标识符序列、(iii)一条或多条引物结合序列或(i)、(ii)和(iii)的任何组合。该方法进一步包括在有效地使探针组的第一和第二寡核苷酸探针以碱基特异性方式与其相应的核酸分子(如果存在于样品中)的第一和第二靶区域杂交的条件下,使样品与一个或多个寡核苷酸探针组接触;以及产生适于在探针组与互补的核酸分子的第一和第二靶区域杂交时将所述探针组的第一寡核苷酸探针的3'端连接至第二寡核苷酸探针的5'端以及将所述探针组的第一寡核苷酸探针的5'端连接至第二寡核苷酸探针的3'端的一个或多个可连接结。在所述一个或多个可连接结处连接探针组的所述第一和第二寡核苷酸,以形成包含连接至其它部分的对应于核酸分子的所述第一和第二不同靶区域的核苷酸序列的环状连接产物。检测并区分样品中的环状连接产物,从而确定样品中存在(如果有的话)一个或多个包含彼此连接的不同的第一靶和第二靶区域的核酸分子。
根据本发明的这个方面,图109,步骤A-E示出用于检测mRNA中的特异性推定基因融合。含有推定基因融合的mRNA逆转录产生cDNA分子(图109,步骤A)。对于每个潜在靶,提供包含第一和第二寡核苷酸探针的第二寡核苷酸探针。第一探针具有5’第一靶标特异性部分和3’第二靶标特异性部分,而第二探针具有5’第二靶标特异性部分和3’第一靶标特异性部分。每个探针的靶标特异性部分被核苷酸序列隔开,所述核苷酸序列含有独特标识符序列、患者标识符序列、一条或多条引物结合序列或其任何组合。寡核苷酸探针与其靶cDNA分子的相应互补部分杂交,如图109,步骤B中所示。如果寡核苷酸探针含有可连接的5’端,连接酶共价密封杂交寡核苷酸的相邻末端,以产生环状连接产物,如图109,步骤D中所示(左图)。如果寡核苷酸探针含有5’侧翼或重叠核苷酸碱基,5’核酸酶裂解5’端,以产生可连接的5’磷酸根(图109,步骤C),然后连接(图109,步骤D,右图)。核酸外切酶消化移除所有未连接的或线性产物,只留下包含与独特识别序列、患者识别序列和/或捕获序列(例如,引物结合序列)连接的来自基因融合产物的上游和下游序列的所需单链环化DNA构建体。这种产物适用于如本文所述的滚环扩增和后续测序。
图110示出图109中描绘用于检测mRNA中的特异性推定基因融合的方法的变型。在这个实施方案中,第一和第二寡核苷酸探针与其cDNA分子的相应互补区域的杂交,如图110,步骤B中所示。聚合酶延伸每个第一和第二探针的杂交3’端,以形成与第二和第一探针的杂交5’端的连接结,分别如图110,步骤C中所示。当寡核苷酸探针具有5’-OH(图110的左侧,步骤C),聚合酶的5’-核酸酶活性裂解匹配的5’重叠碱基,留下可连接的5’磷酸根。连接酶(实心圆)共价密封杂交的第一和第二寡核苷酸探针的相邻末端,形成环状连接产物(图110,步骤D)。核酸外切酶消化移除未连接的或线性产物,只留下包含与独特标识符序列、患者标识符序列和/或捕获序列(即,引物结合序列)连接的来自基因融合产物的上游和下游序列的所需单链环状DNA构建体。这种产物适用于如本文所述的滚环扩增和后续测序。
图111示出按照本发明的这个方面的另一个过程,其适用于检测和量化mRNA或lncRNA中的特异性外显子。在这个实施方案中,含有所需外显子的mRNA或lncRNA被逆转录为cDNA(图111,步骤A)。如图111,步骤B中所示,对于每个潜在靶,提供两个寡核苷酸探针,每个探针含有与cDNA分子的每个外显子的独特部分互补的3’和5’靶标特异性序列。每个探针的靶标特异性部分被核苷酸序列隔开,所述核苷酸序列含有独特标识符序列、患者标识符序列、一条或多条引物结合序列或其任何组合。探针杂交,在靶的cDNA上彼此相邻,如图111,步骤B中所示。如果寡核苷酸探针含有可连接的5’端,连接酶共价密封杂交寡核苷酸的相邻末端,以产生环状连接产物,如图111,步骤D中所示(左图)。如果寡核苷酸探针含有5’侧翼或重叠核苷酸碱基,5’核酸酶裂解5’端,以产生可连接的5’磷酸根(图111,步骤C),然后连接(图111,步骤D,右图)。核酸外切酶消化移除所有未连接的或线性产物,只留下包含与独特标识符序列、患者标识符序列和/或捕获序列(例如,引物结合序列)连接的所需外显子的cDNA序列的所需单链环化DNA构建体。这种产物适用于如本文所述的滚环扩增和后续测序。
图112示出图111中描绘用于检测和量化mRNA或lncRNA的中特异性外显子的方法的变型。在这个实施方案中,第一和第二寡核苷酸探针与其cDNA分子的相应互补区域的杂交,如图112,步骤B中所示。聚合酶延伸每个第一和第二探针的杂交3’端,以形成与第二和第一探针的杂交5’端的连接结,分别如图112,步骤C中所示。当寡核苷酸探针具有5’-OH(图110的左侧,步骤C),聚合酶的5’-核酸酶活性裂解匹配的5’重叠碱基,留下可连接的5’磷酸根。连接酶(实心圆)共价密封杂交的第一和第二寡核苷酸探针的相邻延伸末端,形成环状连接产物(图112,步骤D)。核酸外切酶消化移除未连接的或线性产物,只留下包含与独特标识符序列、患者标识符序列和/或捕获序列(即,引物结合序列)连接的所需外显子的cDNA序列的所需单链环状DNA构建体。这种产物适用于如本文所述的滚环扩增和后续测序。
图113示出了根据本发明的这个方面的另一种方法,其适用于检测基因组DNA的相同链上的已知多态性。如图113,步骤A中所示,靶基因组DNA片段的上游和下游区域含有多态性。如图113,步骤B中所示,对于每个潜在靶,提供两个寡核苷酸探针,每个探针含有与含有多态性的DNA的上游和下游部分互补的3’和5’靶标特异性序列。每个探针的靶标特异性部分被核苷酸序列隔开,所述核苷酸序列含有独特标识符序列、患者标识符序列、一条或多条引物结合序列或其任何组合。探针杂交,在靶基因组DNA序列上彼此相邻,如图113,步骤B中所示。如果寡核苷酸探针含有可连接的5’端,连接酶共价密封杂交寡核苷酸的相邻末端,以产生环状连接产物,如图113,步骤D中所示(左图)。如果寡核苷酸探针含有5’侧翼或重叠核苷酸碱基,5’核酸酶裂解5’端,以产生可连接的5’磷酸根(图113,步骤C),然后连接(图113,步骤D,右图)。核酸外切酶消化移除所有未连接或线性产物,只留下包含与独特标识符序列、患者标识符序列和/或捕获序列(例如,引物结合序列)连接的包含多态性的基因组DNA的上游和下游序列的所需单链环化DNA构建体。这种产物适用于如本文所述的滚环扩增和后续测序。
本发明的另一个方面涉及一种用于识别样品中的一个或多个靶miRNA分子的方法,所述靶miRNA分子与样品中的其它核酸分子的差异为一个或多个碱基。该方法包括提供包含可能含有一个或多个碱基差异的一个或多个靶miRNA分子的样品,并将核苷酸接头附接至样品中的靶miRNA分子的3’和5’端。该方法进一步包括提供一个或多个寡核苷酸探针,每个寡核苷酸探针包括:(a)与靶miRNA分子的3'核苷酸接头互补的3'部分;(b)与靶miRNA分子的5'核苷酸接头互补的5'部分;以及(c)其它部分,所述其它部分包含:(i)独特标识符序列、(ii)患者标识符序列、(iii)一条或多条引物结合序列或(i)、(ii)和(iii)的任何组合。在有效地使所述寡核苷酸探针的3'和5'部分以碱基特异性方式与靶miRNA分子(如果存在于样品中)上的互补核苷酸接头杂交的条件下,使所述样品与所述一个或多个寡核苷酸探针接触。延伸杂交寡核苷酸探针的3’端以产生一个或多个靶miRNA分子的互补序列,并将寡核苷酸探针的3’延伸序列连接至寡核苷酸探针的5’端,以形成环状连接产物,其包含与靶miRNA分子的3’核苷酸接头互补的序列、与靶miRNA分子的5’核苷酸接头互补的序列、一个或多个靶miRNA分子的互补序列和寡核苷酸探针的其它部分。该方法进一步包括检测和区分样品中的环状连接产物,从而识别与样品中的其它核酸分子的差异在于一个或多个碱基的一个或多个靶miRNA分子的存在。
根据本发明的这个方面,图114示出了用于检测miRNA的通用群体的过程。用于所述过程的起始材料是从血清或血浆或外来体分离的miRNA(图114,步骤A)。如图114,步骤B中所示,将核苷酸接头附接至样品中靶核糖核酸分子的3’和5’端。如在图114,步骤B中所示,3'接头在其3'端包含阻断基团且在其5'端包含磷酸根基团,以促进使用T4 RNA连接酶(实心圆)连接至靶miRNA分子的3'端。在其5’端也包含阻断基团的5’接头使用T4 RNA连接酶类似地连接至miRNA分子的5’端。含有与靶miRNA的3'核苷酸接头互补的3'部分和与靶miRNA的5'核苷酸接头互补的5'部分的寡核苷酸探针与其接头所附靶miRNA分子杂交(图114,步骤C)。所述寡核苷酸探针还含有包含独特标识符序列、患者标识符序列、一条或多条引物结合序列或其任何组合的核苷酸序列。缺乏5’-3’活性的逆转录酶(实心菱形)延伸杂交寡核苷酸探针的3’端,拷贝miRNA序列,直到其与寡核苷酸探针的可连接的5’端相邻(图114,步骤D)。如图114的步骤E中所示,T4 DNA连接酶(实心圆)共价密封寡核苷酸探针的延伸的3'端以形成环状连接产物。UDG和AP核酸内切酶(实心三角形)使miRNA缺口(图114,步骤E),且核酸外切酶消化所有未连接的或带缺口的产物,只留下包含与独特识别序列连接的miRNA靶的拷贝的所需单链环状核酸构建体。这种产物适用于如本文所述的滚环扩增和环形测序。
本发明的另一个方面涉及一种用于识别样品中的一个或多个靶miRNA分子的方法,所述靶miRNA分子与样品中的其它核酸分子的差异为一个或多个碱基。该方法包括提供包含可能含有一个或多个碱基差异的一个或多个靶miRNA分子的样品,并将核苷酸接头连接至样品中的靶miRNA分子的3’和5’端。所述核苷酸接头通过其它部分彼此连接,所述其它部分包含:(i)独特标识符序列、(ii)患者标识符序列、(iii)一条或多条引物结合序列或(i)、(ii)和(iii)的任何组合,由此所述连接形成包含靶miRNA分子、3'和5'核苷酸接头序列和其它部分的环状连接产物。此方法还包括提供一个或多个第一寡核苷酸引物,其包含与环形连接产物的3'或5'核苷酸接头序列互补的核苷酸序列,并以碱基特异性方式使所述一个或多个第一寡核苷酸引物与环形连接产物杂交。延伸第一寡核苷酸引物的3’端,以产生环状连接产物的互补序列,并检测和区分样品中的环状连接产物,从而识别与样品中的其它核酸分子的差异在于一个或多个碱基的一个或多个靶miRNA分子的存在。
根据本发明的这个方面,图115示出了用于检测特定miRNA序列的过程。从血清或外来体分离的miRNA(图115,步骤A)的5’端被磷酸化。如图115步骤B中所示,将连接核苷酸接头连接至样品中靶核糖核酸分子的3’和5’端。所述核苷酸接头通过含有独特标识符序列、3'核糖核苷酸、患者标识符序列、一条或多条引物结合序列或其任何组合的核苷酸序列而连接。如图115步骤B中所示的具有与偶联接头的3'端互补的3'序列、与偶联接头的5'端互补的5'序列以及与靶miRNA互补的序列的寡核苷酸探针促进偶联核苷酸接头的连接。核苷酸接头与miRNA分子的连接形成含有靶miRNA分子的环化连接产物。如图115的步骤C中所示,核酸外切酶消化去除所有未连接的产物(例如,寡核苷酸探针),只留下含有靶miRNA的所需单链环化构建体。如图115,步骤D中所示,5’磷酸化引物与环化构建体杂交,且具有逆转录酶活性(菱形),但缺乏5’-3’活性的聚合酶延伸在环化构建体周围的杂交引物,从而产生miRNA分子的互补拷贝。连接酶(实心圆)共价密封延伸引物的3’端和磷酸化5’端,以产生第二环化连接产物,如图115,步骤E中所示。UDG和AP核酸内切酶(实心三角形)使原始miRNA分子缺口,且核酸外切酶消化移除所有未连接或缺口产物,只留下包含与独特识别序列连接的miRNA靶的拷贝的所需单链环状核酸构建体。这种产物适用于如本文所述的滚环扩增和环形测序。
图116示出图115中描绘用于检测特异性miRNA序列的方法的变型。在这个变型中,利用序列内具有3’阻断基团和内部间隔基(“X”),且与靶miRNA序列互补的寡核苷酸探针将偶联核苷酸接头连接至靶miRNA(图116,步骤B,左图)。偶联接头连接至靶miRNA形成环化连接产物,如图116,步骤B中所示(左图)。含有硫代磷酸根的5’OH引物与环化连接产物杂交,如图116,步骤C中所示。具有逆转录酶活性和5’-3’核酸酶活性(实心菱形)的聚合酶延伸杂交引物的3’端,以形成环化连接产物和其中所含靶miRNA分子的互补拷贝(图116,步骤C和图116,步骤D,左图)。聚合酶的5’-核酸酶活性裂解引物的匹配5’-重叠碱基,留下可连接的5’磷酸根(图116,步骤D,左图)。连接酶(实心圆)共价密封延伸末端,以产生环状连接产物,如图116,步骤E中所示。UDG和AP核酸内切酶(实心三角形)使原始miRNA分子缺口(图116,步骤E,左图),且核酸外切酶消化移除所有未连接或带缺口的产物只留下包含与独特识别序列偶联的miRNA靶的拷贝的所需单链环状DNA(图116,步骤F,左图)。这种产物适用于如本文所述的滚环扩增和环形测序。在不存在靶miRNA时,如图116,步骤B-E,右图所示,用5'-3'核酸酶延伸引物,产生具有双链断裂的缺口。带缺口产物不连接,且维持线性(图116,步骤E,右图)。这些线性产物通过核酸外切酶消化从分析中移除(图116,步骤F)。
本发明的另一个方面涉及一种用于识别样品中的一个或多个靶miRNA分子的方法,所述靶miRNA分子与样品中的其它核酸分子的差异为一个或多个碱基。该方法包括提供包含可能含有一个或多个碱基差异的一个或多个靶miRNA分子的样品,并提供一个或多个寡核苷酸探针组,每个组包含:(a)具有5'茎环部分和与靶miRNA分子的3'部分互补的3'部分的第一寡核苷酸探针;(b)具有与靶miRNA分子的5'端的拷贝互补的3'部分、与第一寡核苷酸探针的5'茎环部分互补的5'部分以及其它部分的第二寡核苷酸探针,所述其它部分包含:(i)独特靶标识符序列、(ii)患者标识符序列、(iii)引物结合序列或(i)、(ii)和(iii)的任何组合。所述方法还包括掺混样品、来自探针组的一个或多个第一寡核苷酸探针和逆转录酶,以形成逆转录酶反应,并延伸与其互补靶miRNA分子杂交的第一寡核苷酸探针的3'端,生成靶miRNA分子的互补序列,如果存在于样品中。探针组的一个或多个第二寡核苷酸探针与包含靶miRNA序列的互补序列的延伸第一寡核苷酸探针杂交,并在每个与延伸第一寡核苷酸探针杂交的第二寡核苷酸的3’与5’端之间形成一个或多个可连接结。所述方法还包括连接每个第二寡核苷酸探针的3’和5’端,以形成环状连接产物,每种产物包含与第二寡核苷酸探针的其它部分偶联的靶miRNA序列的脱氧核糖核酸拷贝。检测和区分样品中的环状连接产物,从而识别与样品中的其它核酸分子的差异在于一个或多个碱基的一个或多个靶miRNA分子的存在。
根据本发明的这个方面,图117示出了用于检测特定miRNA序列的方法。从血清、血浆或外来体分离的miRNA与第一寡核苷酸探针杂交,所述探针具有与靶miRNA的3’端互补的序列和在其5’端上的茎-环(图117,步骤B)。所述第一寡核苷酸探针的茎环区还含有可裂解连接(dU)。利用逆转录酶(实心菱形)延伸第一寡核苷酸探针,从而形成miRNA分子的互补拷贝。如图117,步骤C中所示,含有与延伸第一寡核苷酸探针的3’端互补的3’序列和与第一寡核苷酸探针的5’茎-环互补的5’序列的第二寡核苷酸探针与第一寡核苷酸探针的互补区域杂交。所述第二寡核苷酸探针还可以含有独特标识符序列、患者标识符序列、一条或多条引物结合序列、5’磷酸根或其任何组合。聚合酶(实心菱形)延伸第二寡核苷酸探针的3'端,产生miRNA序列的互补拷贝并且使所述探针的3'端邻近其5'端,以形成连接结。(图117,步骤D)。聚合酶还延伸第一寡核苷酸探针的3’端(利用杂交的第二寡核苷酸探针作为模板),以产生与其5’端的连接结(图117,步骤D)。如图117,步骤E中所示,连接酶(实心圆)共价密封第一和第二寡核苷酸探针的3'和5'端的每个相应连接结,以产生环化的连接产物。在第一寡核苷酸探针的可裂解连接处(例如,dU的UDG裂解,和AP核酸内切酶-实心三角形)引入缺口。如图117,步骤E中所示,核酸外切酶消化除去所有未连接或带缺口的产物,只留下所需的单链环化核酸构建体(即,第二寡核苷酸探针),其包含与独特识别序列连接的miRNA靶序列的拷贝。这种产物适用于如本文所述的滚环扩增和环形测序。
实施方式1.一种不同环状嵌合单链核酸构建体的集合,每个构建体包含:
来自宿主生物体的原始基因组DNA的第一单链区段;和
连接至所述第一单链区段且包含对所述宿主生物体而言为外源性的核苷酸序列的第二单链合成核酸区段,所述核苷酸序列包含独特标识符部分,其中所述独特标识符部分和所述原始基因组DNA的区段的核苷酸序列区分所述集合的一个嵌合单链核酸构建体与所述集合的所有其它嵌合单链核酸构建体,所述集合的所述嵌合单链核酸构建体是环化的且适于滚环扩增和/或测序。
实施方式2.一种用于扩增核酸分子的方法,所述方法包括:
提供根据实施方式1所述的不同环状嵌合单链核酸构建体的集合;
将所述不同环状嵌合单链核酸构建体的集合与聚合酶和多个长度为6至10个核苷酸且包含随机碱基和/或核苷酸类似物的短引物掺混,其中所述短引物中的一个或多个与所述集合的一个或多个环状嵌合单链核酸构建体的一部分互补,借此所述掺混形成扩增反应混合物;以及
使所述扩增反应混合物经受一种或多种杂交和延伸处理,其中所述一个或多个短引物与所述环状嵌合单链核酸构建体杂交且所述聚合酶延伸杂交的短引物以产生多个延伸产物,每个延伸产物包含两条或更多条串联线性序列,其中每个串联线性序列与来自所述集合的嵌合单链核酸构建体互补。
实施方式3.一种用于产生核酸分子的串联线性拷贝的方法,所述方法包括:
提供根据实施方式1所述的不同环状嵌合单链核酸构建体的集合;
将所述不同环状嵌合单链核酸构建体的集合与具有链置换活性的聚合酶和一个或多个初级引物掺混,其中所述一个或多个初级引物与所述集合的一个或多个环状嵌合单链核酸构建体的一部分互补,借此所述掺混形成滚环延伸混合物;
使所述滚环延伸混合物经受一种或多种杂交和延伸处理,其中所述一个或多个初级引物与所述环状嵌合单链核酸构建体杂交且所述聚合酶延伸杂交的初级引物以产生单链延伸产物,每个单链延伸产物包含两条或更多条串联线性序列,其中每个串联线性序列与来自所述集合的嵌合单链核酸构建体互补;
提供一个或多个次级引物组,每个次级引物组包含(a)包含与从所述一个或多个初级引物形成的单链延伸产物的第一部分互补的核苷酸序列的第一次级引物,和(b)包含与单链延伸产物的第二部分互补的核苷酸序列的第二次级引物,所述第二部分不同于从所述一个或多个初级引物形成的所述单链延伸产物的第一部分且从所述第一部分移位;
提供在所述单链延伸产物和第一次级引物彼此杂交时裂解所述单链延伸产物和第一次级引物的核酸内切酶;
将所述单链延伸产物与缺乏链置换活性的聚合酶、连接酶、所述核酸内切酶和所述一个或多个次级引物组掺混,以形成延伸-连接-裂解反应混合物;
使所述延伸-连接-裂解反应混合物经受杂交和延伸处理,其中所述第一和第二次级引物与所述单链延伸产物杂交,所述聚合酶延伸杂交的次级引物,所述连接酶连接所述延伸的杂交次级引物以形成双链延伸产物,且所述核酸内切酶在所述第一次级引物与所述单链延伸产物杂交的位置处裂解所述双链延伸产物以产生双链延伸产物片段,其中所述双链延伸产物片段包含与来自所述集合的嵌合单链核酸构建体互补的两条或更多条串联线性序列。
实施方式4.根据实施方式3所述的方法,其中所述双链延伸产物片段中的串联线性序列的数目是由所述延伸-连接-裂解反应混合物中的第一和第二次级引物的比率确定。
实施方式5.根据实施方式3所述的方法,其中所述滚环延伸混合物进一步包含:
甲基敏感性限制性核酸内切酶,其中在所述使所述滚环延伸混合物经受所述一种或多种杂交和延伸处理期间,如果所述识别序列是未甲基化的,则所述核酸内切酶在识别序列处未甲基化裂解双链DNA,从而只从包含原始甲基化基因组DNA的第一单链区段的嵌合单链核酸构建体选择性地形成单链延伸产物。
实施方式6.根据实施方式2、3、4或5中任一项所述的方法,其进一步包括:
对所述多个延伸产物或双链延伸产物片段测序。
实施方式7.根据实施方式6所述的方法,其中在所述测序前将通用接头序列附接至所述延伸产物或其片段的5'和3'端,或所述双链延伸产物片段的5'和3'端。
实施方式8.根据实施方式6所述的方法,其中使用选自由以下所组成的组的方法进行所述测序:荧光引物杂交、分子信标杂交、引物延伸、基于核酸外切酶的测序、连接酶检测反应、连接酶链反应、焦磷酸测序、基于荧光的边合成边测序、基于荧光的边连接边测序、基于纳米孔的测序、基于离子的边合成边测序和基于离子的边连接边测序。
实施方式9.一种系统,其包括:
不同环状嵌合单链核酸构建体的集合,每个构建体包含:
来自宿主生物体的原始基因组DNA的第一单链区段和
连接至所述第一单链区段且包含对所述宿主生物体而言为外源性的核苷酸序列的第二单链核酸区段,所述核苷酸序列包含第一固体载体引物特异性部分、第二固体载体引物特异性部分和患者标识符序列,借此所述集合的所述嵌合单链核酸构建体是环化的且适于滚环扩增和/或测序;以及
延伸产物的集合,每个延伸产物包含两条或更多条串联线性序列,其中每个串联线性序列与来自所述集合的嵌合单链核酸构建体互补,其中所述集合中的每个延伸产物与所述集合的其互补环状嵌合单链核酸构建体杂交。
实施方式10.根据实施方式9所述的系统,其进一步包含:
固体载体,其上固定有多个第一寡核苷酸引物,每个第一寡核苷酸引物包含与所述集合的嵌合单链核酸构建体的第一固体载体引物特异性部分的核苷酸序列相同的核苷酸序列,其中所述固体载体上的多个第一寡核苷酸引物的一个或多个与所述延伸产物的集合的延伸产物杂交。
实施方式11.根据实施方式9所述的系统,其进一步包含:
交联寡核苷酸的集合,每个交联寡核苷酸包含核苷酸序列的两个或更多个重复,其中所述核苷酸序列与所述集合中的嵌合单链核酸构建体的第二单链核酸片段的核苷酸序列的一部分相同,其中每个交联寡核苷酸的一条或多条所述核苷酸序列重复与所述延伸产物的集合的延伸产物的串联线性序列的互补部分杂交。
实施方式12.根据实施方式11所述的系统,其进一步包含:
固体载体,其上固定有多个第一寡核苷酸引物,每个第一寡核苷酸引物包含与所述集合的嵌合单链核酸构建体的第一固体载体引物特异性部分的核苷酸序列相同的核苷酸序列,其中与交联寡核苷酸杂交的所述延伸产物的串联线性序列与所述固体载体上的一个或多个第一寡核苷酸引物杂交。
实施方式13.一种系统,其包括:
不同环状嵌合单链核酸构建体的集合,每个构建体包含:
来自宿主生物体的原始基因组DNA的第一单链区段和
连接至所述第一单链区段且包含对所述宿主生物体而言为外源性的核苷酸序列的第二单链核酸区段,所述核苷酸序列包含第一固体载体引物特异性部分、第二固体载体引物特异性部分和患者标识符序列,借此所述集合的所述嵌合单链核酸构建体适于滚环扩增和/或测序;
一个或多个寡核苷酸扩增引物,每个扩增引物包含至少第一核苷酸序列,其与所述集合的嵌合单链核酸构建体的一部分互补;以及
适用于滚环扩增的聚合酶。
实施方式14.根据实施方式13所述的系统,其中所述一个或多个寡核苷酸扩增引物包含与所述集合的嵌合单链核酸构建体的第二固体载体引物特异性部分互补的第一核苷酸序列,且所述一个或多个扩增引物被固定在固体载体上。
实施方式15.根据实施方式13所述的系统,其中所述一个或多个寡核苷酸扩增引物包含:(i)与所述集合的嵌合单链核酸构建体的第一固体载体引物特异性部分互补的第一核苷酸序列和(ii)与所述集合的嵌合单链核酸构建体的第二固体载体引物特异性部分互补的第二核苷酸序列。
实施方式16.根据实施方式13所述的系统,其中所述一个或多个寡核苷酸扩增引物包含(i)与所述集合的嵌合单链核酸构建体的原始基因组DNA区段互补的第一核苷酸序列,(ii)3'部分,其包含可裂解核苷酸或核苷酸类似物和阻断所述寡核苷酸扩增引物的3'聚合酶延伸的阻断基团和(iii)包含可裂解核苷酸或核苷酸类似物与捕获基团的5'部分,所述捕获基团能够固定到固体载体上。
实施方式17.根据实施方式13所述的系统,其中所述一个或多个寡核苷酸扩增引物包含:(a)第一寡核苷酸扩增引物,其具有(i)与所述集合的嵌合单链核酸构建体的原始基因组DNA区段的第一部分互补的第一核苷酸序列,和(ii)3'部分,其包含可裂解核苷酸或核苷酸类似物与阻断所述第一寡核苷酸扩增引物的3'聚合酶延伸的阻断基团,以及(b)第二寡核苷酸扩增引物,其具有(i)与所述集合的嵌合单链核酸构建体的原始基因组DNA区段的第二部分互补的第一核苷酸序列,和(ii)包含可裂解核苷酸或核苷酸类似物与捕获基团的5'部分,所述捕获基团能够固定到固体载体上。
实施方式18.根据实施方式13所述的系统,其中所述一个或多个扩增引物包含能够被拴系到固体载体上的部分。
实施方式19.根据实施方式13所述的系统,其进一步包含:
固体载体,其上固定有多个第一寡核苷酸引物,每个第一寡核苷酸引物包含与所述集合的嵌合单链核酸构建体的第一固体载体引物特异性部分的核苷酸序列相同的核苷酸序列。
实施方式20.根据实施方式19所述的系统,其中所述固体载体进一步包含:
多个固定的第二寡核苷酸引物,每个第二寡核苷酸引物包含与所述集合的嵌合单链核酸构建体的第二固体载体引物特异性部分的核苷酸序列互补的核苷酸序列。
实施方式21.根据实施方式13所述的系统,其进一步包含:
交联寡核苷酸的集合,每个交联寡核苷酸包含核苷酸序列的两个或更多个重复,其中所述核苷酸序列与所述集合的嵌合单链核酸构建体的第二单链核酸片段的核苷酸序列的至少一部分相同。
实施方式22.根据实施方式13所述的系统,其中所述聚合酶是链置换聚合酶。
实施方式23.一种用于对多个核酸分子测序的方法,所述方法包括:
提供根据实施方式13所述的系统;
将杂交至所述集合的环状嵌合单链核酸构建体的一个或多个寡核苷酸扩增引物与所述聚合酶掺混,以形成滚环扩增反应混合物;
使所述滚环扩增反应混合物经受延伸处理,其中所述聚合酶延伸所述一个或多个杂交的寡核苷酸扩增引物以产生多个初级延伸产物,每个初级延伸产物包含一条或多条串联线性序列,其中每个串联线性序列与所述集合中的环状嵌合单链核酸构建体互补;以及
对所述环状嵌合单链核酸构建体直接测序或对其所述多个初级延伸产物测序。
实施方式24.根据实施方式23所述的方法,其中所述滚环扩增反应混合物进一步包含:
甲基敏感性限制性核酸内切酶,其中在所述使滚环扩增反应混合物经受所述延伸处理期间,如果所述识别序列是未甲基化的,则所述核酸内切酶在识别序列处未甲基化裂解双链DNA,从而只从包含原始甲基化基因组DNA的第一单链区段的嵌合单链核酸构建体选择性地形成初级延伸产物。
实施方式25.根据实施方式23所述的方法,其进一步包括:
提供其上固定有多个第一寡核苷酸引物的固体载体,每个第一寡核苷酸引物包含与所述集合的嵌合单链核酸构建体的第一固体载体引物特异性部分的核苷酸序列相同的核苷酸序列和
在所述测序前使所述多个初级延伸产物与所述固体载体上的所述多个第一寡核苷酸引物的一个或多个杂交。
实施方式26.根据实施方式25所述的方法,其中所述固体载体上的两个或更多个第一寡核苷酸引物与初级延伸产物的两条或更多条串联线性序列杂交,所述方法进一步包括:
使用聚合酶延伸所述两个或更多个杂交的第一寡核苷酸引物以形成多个固定的次级延伸产物,每个次级延伸产物包含与所述杂交的初级延伸产物的一个串联线性序列互补的核苷酸序列;以及
使所述初级延伸产物从所述固体载体上的第一寡核苷酸引物变性,借此所述测序包括对所述固定的次级延伸产物测序。
实施方式27.根据实施方式25所述的方法,其中所述固体载体上的两个或更多个第一寡核苷酸引物与初级延伸产物的两条或更多条串联线性序列杂交,所述方法进一步包括:
将测序引物杂交至所述固体载体上的所述初级延伸产物的每个串联线性序列,其中所述测序引物与所述串联线性序列的一个区域杂交,所述区域位于杂交至所述固体载体上的所述第一寡核苷酸引物的所述串联线性序列的区域的5'侧;
延伸所述测序引物;以及
基于所述延伸对所述固体载体上的初级延伸产物的每个串联线性序列测序。
实施方式28.根据实施方式23所述的方法,其中所述一个或多个扩增引物包含(i)与所述嵌合单链核酸构建体的第一固体载体引物特异性部分互补的第一核苷酸序列部分和(ii)与所述嵌合单链核酸构建体的第二固体载体引物特异性部分互补的第二核苷酸序列部分。
实施方式29.根据实施方式23所述的方法,其中所述一个或多个扩增引物包含其它部分,所述其它部分能够栓系到所述固体载体上,所述方法进一步包括:
在所述经受之前或期间将所述初级延伸产物的其它部分捕获在所述固体载体上。
实施方式30.根据实施方式25所述的方法,其中所述一个或多个寡核苷酸扩增引物包含与所述集合的环状嵌合单链核酸构建体的第二固体载体引物特异性部分互补的第一核苷酸序列部分,并且被固定在所述固体载体上,从而将在所述经受期间形成的多个初级延伸产物栓系到所述固体载体上。
实施方式31.根据实施方式23所述的方法,其中使用选自由以下所组成的组的方法进行所述测序:荧光引物杂交、分子信标杂交、引物延伸、基于核酸外切酶的测序、连接酶检测反应、连接酶链反应、焦磷酸测序、基于荧光的边合成边测序、基于荧光的边连接边测序、基于纳米孔的测序、基于离子的边合成边测序和基于离子的边连接边测序。
实施方式32.根据实施方式23所述的方法,其进一步包括;
提供交联寡核苷酸的集合,每个交联寡核苷酸包含核苷酸序列的两个或更多个重复,其中所述核苷酸序列与所述集合的环状嵌合单链核酸构建体的第二单链核酸片段的核苷酸序列的至少一部分相同;以及
将初级延伸产物的一条或多条串联线性序列捕获在所述集合的交联寡核苷酸上,从而在所述测序之前将所述初级延伸产物缩合成紧凑结构。
实施方式33.根据实施方式23所述的方法,其中通过包括以下步骤的方法来制备所述集合的环状嵌合单链核酸构建体:
提供含有一个或多个靶基因组DNA区段的样品;
提供一个或多个第一寡核苷酸探针,每个第一寡核苷酸探针包含(a)5'靶标特异性部分,(b)3'靶标特异性部分,和(c)其它部分,所述其它部分包含(i)患者标识符序列,(ii)第一固体载体引物特异性部分,和(iii)第二固体载体引物特异性部分;
在有效地使第一寡核苷酸探针的所述3'靶标特异性部分以碱基特异性方式与靶基因组DNA区段的互补3'端杂交以及使所述第一寡核苷酸探针的5'靶标特异性部分以碱基特异性方式与所述靶基因组DNA区段(如果存在于样品中)的互补5'端杂交的条件下,使所述样品和所述一个或多个第一寡核苷酸探针接触;
在杂交至所述第一寡核苷酸探针的每个靶基因组DNA区段的3'和5'端之间产生可连接结;以及
连接每个靶基因组DNA区段的连接结以形成所述集合的不同的环状嵌合单链核酸构建体。
实施方式34.根据实施方式33所述的方法,其中所述产生一个或多个可连接结包括:
利用聚合酶延伸所述靶基因组DNA区段的杂交3'端,以形成与所述靶基因组DNA区段的杂交5'端的连接结。
实施方式35.根据实施方式34所述的方法,其中所述聚合酶包含5'至3'核酸外切酶活性或3'至5'核酸外切酶活性。
实施方式36.根据实施方式33所述的方法,其中所述产生一个或多个可连接结包括:
释放所述靶基因组DNA区段上的适于连接的3'OH和/或5’磷酸根。
实施方式37.根据实施方式33所述的方法,其中所述第一寡核苷酸探针的其它部分包含可裂解的核苷酸或核苷酸类似物。
实施方式38.根据实施方式33所述的方法,其进一步包括:
在所述连接后从所述样品中移除未连接的靶基因组DNA区段、第一寡核苷酸探针和其它非环化的核酸分子。
实施方式39.根据实施方式33所述的方法,其中每个第一寡核苷酸探针进一步包含可移除的3'阻断基团和/或适于捕获在固体载体上的5'捕获基团。
实施方式40.根据实施方式33所述的方法,其中所述产生一个或多个可连接结包括:
提供一个或多个第二寡核苷酸探针,每个第二寡核苷酸探针包含与所述第一寡核苷酸探针的其它部分的至少一部分互补的核苷酸序列;以及
在所述接触期间,使所述第二寡核苷酸探针杂交至所述第一寡核苷酸探针的其它部分,其中所述杂交形成在所述靶基因组DNA区段和所述第二寡核苷酸探针之间的可连接结。
实施方式41.根据实施方式33所述的方法,其进一步包括:
将核苷酸接头附接至所述靶基因组DNA区段的一端或两端,其中一个或多个所述接头与所述第一寡核苷酸探针的其它部分的区域杂交,且在所述接触期间,所述一个或多个核苷酸接头以碱基特异性方式与所述第一寡核苷酸探针的其它部分的其互补区域杂交。
实施方式42.根据实施方式34所述的方法,其中所述一个或多个第一寡核苷酸探针的3'和5'靶标特异性部分被设计成含有与所述靶基因组DNA区段的一个或多个核苷酸错配,其中在所述延伸以形成一个或多个连接结后,所述靶基因组DNA区段可以与所述聚合酶延伸部分区分开来。
实施方式43.根据实施方式23所述的方法,其中通过包括以下步骤的方法来制备所述集合的不同的环状嵌合单链核酸构建体:
提供含有一个或多个靶基因组DNA区段的样品,其中所述靶基因组DNA区段可能含有一个或多个碱基差异或一个或多个甲基化残基;
将核苷酸接头附接至所述靶基因组DNA区段的3'和5'端,以形成附接有接头的靶基因组DNA区段;
提供一个或多个第一寡核苷酸探针,每个第一寡核苷酸探针包含(a)与所述靶基因组DNA区段的3'核苷酸接头互补的3'部分,(b)与所述靶基因组DNA区段的5'核苷酸接头互补的5'部分,和(c)其它部分,所述其它部分包含(i)患者标识符序列,(ii)第一固体载体引物特异性部分,和/或(iii)第二固体载体引物特异性部分;
在有效地使所述第一寡核苷酸探针以碱基特异性方式与所述附接有接头的靶基因组DNA区段(如果存在于所述样品中)的互补核苷酸接头序列杂交的条件下,使所述样品与所述一个或多个第一寡核苷酸探针接触;
产生适用于偶联杂交至所述第一寡核苷酸探针的所述靶基因组DNA区段的3'和5'端的一个或多个可连接结;以及
在所述一个或多个连接结处连接所述靶基因组DNA区段,以形成所述集合的不同的环状嵌合单链核酸构建体。
实施方式44.根据实施方式43所述的方法,其中所述第一寡核苷酸探针进一步包含3'靶标特异性部分和/或5'靶标特异性部分。
实施方式45.根据实施方式43所述的方法,其中所述产生一个或多个可连接结包括:
利用聚合酶延伸所述靶基因组DNA区段的杂交3'端,以形成与所述靶基因组DNA区段的杂交5'端的连接结。
实施方式46.根据实施方式45所述的方法,其中所述聚合酶包含5'至3'核酸外切酶活性或3'至5'核酸外切酶活性。
实施方式47.根据实施方式43所述的方法,其中所述产生一个或多个可连接结包括:
释放所述靶基因组DNA区段上的适于连接的3'OH和/或5’磷酸根。
实施方式48.根据实施方式43所述的方法,其中所述靶基因组DNA区段是具有适于连接或延伸的5'和3'端的双链靶基因组DNA区段,且所述核苷酸接头序列包含第一和第二接头寡核苷酸,其中(i)所述第一接头寡核苷酸包含5'单链部分、一个或多个可裂解核苷酸或核苷酸类似物、独特标识符序列、与所述第二接头寡核苷酸互补的3'端以及3'-OH,且(ii)所述第二接头寡核苷酸包含5'-OH端、与所述第一接头寡核苷酸互补的5'部分以及任选的3'-阻断端,其中所述第二接头寡核苷酸与所述第一接头寡核苷酸的其互补部分杂交形成复合接头;所述附接包括:
在适用于以下目的的条件下掺混所述双链靶基因组DNA区段与所述复合接头、连接酶和聚合酶:(i)所述复合接头的第一接头寡核苷酸的3'-OH连接至所述双链靶基因组DNA区段的5'端,和(ii)聚合酶延伸所述双链靶基因组DNA区段的3'端,以形成所述复合接头的第一接头寡核苷酸的互补拷贝,和(iii)裂解所述一个或多个可裂解核苷酸或核苷酸类似物,以形成适于所述接触的附接有接头的靶基因组DNA区段。
实施方式49.根据实施方式48所述的方法,其中所述第一接头寡核苷酸包含其它部分,所述其它部分包含(i)固体载体引物特异性部分,(ii)患者标识符序列,(iii)一条或多条引物结合序列,或(i)、(ii)和(iii)的任何组合。
实施方式50.根据实施方式43所述的方法,其中所述一个或多个第一寡核苷酸探针具有包含可裂解核苷酸或核苷酸类似物的3'部分和阻断基团,以使得所述第一寡核苷酸探针的3'端不适用于聚合酶延伸或连接,所述方法进一步包括:
在所述接触期间裂解所述第一寡核苷酸探针的可裂解核苷酸或核苷酸类似物,从而在所述连接之前释放所述第一寡核苷酸探针上的3'OH。
实施方式51.根据实施方式43所述的方法,其进一步包括:
在所述连接后从所述样品中移除未连接的靶基因组DNA区段、第一寡核苷酸探针和其它非环化的核酸分子。
实施方式52.根据实施方式23所述的方法,其中通过包括以下步骤的方法来制备所述集合的不同的环状嵌合单链核酸构建体:
提供含有一个或多个靶基因组DNA区段的样品,其中所述靶基因组DNA区段具有3'和5'端;
将接头序列附接至所述靶基因组DNA区段的3'和5'端,其中所述接头序列包含(i)一条或多条患者标识符序列,(ii)第一固体载体引物特异性部分,和(iii)第二固体载体引物特异性部分,以形成附接有接头的靶基因组DNA区段;
提供一个或多个第一寡核苷酸探针,每个第一寡核苷酸探针包含(a)与所述附接有接头的靶基因组DNA区段的3'接头序列互补的部分,和(b)与所述附接有接头的靶基因组DNA区段的5'接头序列互补的部分;以及
在有效地使所述第一寡核苷酸探针以碱基特异性方式与所述附接有接头的靶基因组DNA区段(如果存在于所述样品中)的互补3'和5'接头序列杂交的条件下,使所述样品与所述一个或多个第一寡核苷酸探针接触;
产生适用于偶联杂交至所述第一寡核苷酸探针的所述附接有接头的靶基因组DNA区段的3'和5'端的一个或多个可连接结;以及
在所述一个或多个连接结处连接所述附接有接头的靶基因组DNA区段,以形成所述集合的不同的环状嵌合单链核酸构建体。
实施方式53.根据实施方式52所述的方法,其中所述第一寡核苷酸探针进一步包含3'靶基因组DNA特异性部分和/或5'靶基因组DNA特异性部分。
实施方式54.根据实施方式52所述的方法,其中所述产生一个或多个可连接结包括:
利用聚合酶延伸所述附接有接头的靶基因组DNA区段的3'端,以与所述附接有接头的靶基因组DNA区段的5'端形成连接结。
实施方式55.根据实施方式54所述的方法,其中所述聚合酶包含5'至3'核酸外切酶活性或3'至5'核酸外切酶活性。
实施方式56.根据实施方式52所述的方法,其中所述产生一个或多个可连接结包括:
释放所述附接有接头的靶基因组DNA区段上的适于连接的3'OH和/或5’磷酸根。
实施方式57.根据实施方式56所述的方法,其中所述一个或多个第一寡核苷酸探针具有包含可裂解核苷酸或核苷酸类似物的3'部分和阻断基团,以使得第一寡核苷酸探针的3'端不适用于聚合酶延伸或连接,所述方法进一步包括:
在所述接触期间裂解所述第一寡核苷酸探针的可裂解核苷酸或核苷酸类似物,从而释放所述第一寡核苷酸探针上的3'OH;以及
延伸所述第一寡核苷酸探针的3'端,以与其5'端形成连接结;以及
在所述附接有接头的靶基因组DNA区段的连接期间,在所述连接结处连接所述第一寡核苷酸探针的3'和5'端。
实施方式58.根据实施方式52所述的方法,其进一步包括:
在所述连接后从所述样品中移除未连接的附接有接头的靶基因组DNA区段、第一寡核苷酸探针和其它非环化的核酸分子。
实施方式59.根据实施方式57所述的方法,其中所述一个或多个第一寡核苷酸探针含有一个或多个可裂解核苷酸,所述方法进一步包括;
在所述连接后裂解所述一个或多个第一寡核苷酸探针的所述可裂解核苷酸以及
移除所述裂解的一个或多个第一寡核苷酸探针的不与所述靶基因组DNA区段互补的部分,从而形成适于滚环扩增的环状嵌合单链核酸构建体,所述环状嵌合单链核酸构建体具有与其杂交的靶基因组DNA特异性寡核苷酸。
实施方式60.根据实施方式59所述的方法,其中与所述环状嵌合单链核酸构建体杂交的所述靶基因组DNA特异性寡核苷酸包含捕获部分,所述方法进一步包括:
提供含有多个固定的捕获部分结合伴侣的固体载体;以及
在有效地使所述捕获部分结合至其在所述固体载体上的捕获部分结合伴侣的条件下,使所述固体载体与杂交至含有所述捕获部分的所述靶基因组DNA特异性寡核苷酸的所述环状嵌合单链核酸构建体接触,从而固定所述环状嵌合单链核酸构建体。
实施方式61.根据实施方式52所述的方法,其中所述靶基因组DNA区段是具有适于连接的5'和3'端的双链靶基因组DNA区段,且所述接头序列包含第一、第二和第三寡核苷酸,其中(i)所述第一寡核苷酸包含所述第一固体载体引物特异性部分、一条或多条第一患者标识符序列、第一测序引物结合位点和与所述第三寡核苷酸互补的3'端,(ii)所述第二寡核苷酸包含与所述第三寡核苷酸的5'端互补的区域,且(iii)所述第三寡核苷酸包含与所述第二寡核苷酸互补的5’端、第二测序引物结合位点、与所述第一寡核苷酸的3’端互补的部分、第二患者标识符序列、独特标识符序列和所述第二固体载体引物特异性部分,其中所述第三寡核苷酸与所述第一和第二寡核苷酸的互补部分杂交形成复合接头;所述附接包括:
在适用于以下目的的条件下掺混所述双链靶基因组DNA区段与所述复合接头、连接酶和聚合酶:(i)所述复合接头的第二和第三寡核苷酸分别连接至所述双链靶基因组DNA区段的5'和3'端,(ii)聚合酶延伸所述复合接头的第一寡核苷酸的3'端,以与所述复合接头的第二寡核苷酸在5'端处形成连接结,和(iii)在所述连接结处连接所述复合接头的第一和第二寡核苷酸,以形成在两条靶链上都包含独特标识符序列且适于所述接触的附接有接头的双链靶基因组DNA。
实施方式62.根据实施方式52所述的方法,其中所述靶基因组DNA区段是具有3'端胞嘧啶悬突的双链靶基因组DNA区段,且所述接头序列包含(i)第一接头寡核苷酸,其包含所述第一固体载体引物特异性部分、一条或多条第一患者标识符序列、第一测序引物结合位点、独特标识符序列、在从3'端开始的第二和第三位置处的两个核糖鸟苷碱基以及在其3'端上的一个锁核酸鸟苷碱基,和(ii)第二接头寡核苷酸,其包含第二测序引物结合位点、第二患者标识符序列、所述第二固体载体引物特异性部分以及与所述第一寡核苷酸互补的5'部分;所述附接包括:
掺混所述双链靶基因组DNA区段与所述接头序列、逆转录酶和连接酶,以形成逆转录-连接反应混合物;
使所述逆转录-连接反应混合物经受适用于以下目的的条件:(i)使所述第一接头寡核苷酸的核糖鸟苷和锁核酸鸟苷碱基与所述双链靶基因组DNA区段的3'胞嘧啶悬突杂交,(iv)延伸所述双链靶基因组DNA区段的3'杂交端,以产生与所述第一接头寡核苷酸的独特标识符序列互补的序列以及与所述第二接头寡核苷酸的5'端的连接结,和(v)在所述连接结处将所述双链靶基因组DNA区段的延伸的3'端连接至所述第二寡核苷酸的5'端;
掺混所述逆转录-连接反应混合物与RNA酶、聚合酶和连接酶,以形成核酸酶-聚合酶-连接反应混合物;
使所述核酸酶-聚合酶-连接延伸反应混合物经受适用于以下目的的条件:(i)去除所述第一接头寡核苷酸的核糖鸟苷碱基,(ii)在所述去除之后延伸所述第一接头寡核苷酸的3'端,以形成与所述双链靶基因组DNA的5'端的连接结,和(iii)在所述连接结处将所述延伸的第一接头寡核苷酸连接至所述双链靶基因组DNA区段的5'端,以形成在两条靶链上都包含独特标识符序列且适于所述接触的附接有接头的双链靶基因组DNA。
实施方式63.根据实施方式52所述的方法,其中所述靶基因组DNA区段为单链且包含适于末端转移酶延伸的3'端,所述附接包括:
掺混所述单链靶基因组DNA、末端转移酶以及脱氧单核苷酸和核糖单核苷酸的混合物,以形成末端转移酶反应混合物;
使所述末端转移酶反应混合物经受适用于使用脱氧单核苷酸和核糖单核苷酸延伸所述靶基因组DNA区段的3'OH以在所述靶基因组DNA区段上形成单核苷酸延伸区域的条件;
提供一组或多组寡核苷酸,每个组包含:(i)引物寡核苷酸,其包含所述第二固体载体引物特异性部分、一条或多条患者标识符序列、测序引物结合位点以及与所述靶基因组DNA区段的延伸区域互补的包含一个或多个可裂解核苷酸的单核苷酸重复区域,和(ii)第一接头寡核苷酸,其包含所述第一固体载体引物特异性部分、一条或多条患者标识符序列、测序引物结合位点以及两个核糖鸟苷碱基和在其3'端上的锁核酸鸟苷碱基;
掺混所述末端转移酶反应混合物、所述一组或多组寡核苷酸和逆转录酶,以形成逆转录反应混合物;
使所述逆转录反应混合物经受适用于以下目的的条件:(i)使所述引物寡核苷酸与所述靶基因组DNA区段的延伸区域杂交,(ii)延伸所述引物寡核苷酸以产生所述靶基因组DNA区段的补体,所述补体在其3'端再延伸三个胞嘧啶碱基,(iii)通过rG3-C3碱基配对使所述第一接头寡核苷酸与所述靶基因组DNA的延伸补体杂交,(iv)延伸所述靶DNA的补体,以产生与所述第一接头寡核苷酸互补的序列;
掺混所述逆转录反应混合物与RNA酶、聚合酶和连接酶,并且以形成核酸酶-聚合酶-连接反应混合物;
使所述核酸酶-聚合酶-连接延伸反应混合物经受适用于以下目的的条件:(i)裂解所述靶基因组DNA区段的延伸补体中的一个或多个核糖单核苷酸以释放3'OH,(ii)延伸所述释放的3'OH以产生所述引物寡核苷酸序列的拷贝,和(iii)裂解所述第一接头寡核苷酸的核糖鸟苷碱基,并延伸所述裂解的第一接头寡核苷酸的3'端,以形成与所述靶基因组DNA区段的5'端的连接结,和(iv)将所述延伸的第一接头寡核苷酸连接至所述靶基因组DNA区段,以产生适于所述接触的附接有接头的双链靶基因组DNA区段。
实施方式64.根据实施方式23所述的方法,其进一步包括:
提供一个或多个捕获寡核苷酸,所述捕获寡核苷酸包含与所述初级延伸产物的一部分互补的核苷酸序列,且包含捕获部分;
在适用于所述一个或多个捕获寡核苷酸与在所述经受期间形成的互补性初级延伸产物之间的杂交的条件下使所述滚环扩增反应混合物与所述一个或多个捕获寡核苷酸接触;
经由结合至固定在固体载体上的合适结合伴侣的捕获部分将杂交的捕获寡核苷酸-初级延伸产物复合体捕获在所述固体载体上;
从所述滚环扩增反应混合物移除未杂交的捕获寡核苷酸和初级延伸产物;以及
在所述测序之前从结合至所述固体载体的所述捕获寡核苷酸释放所述初级延伸产物,以形成富集初级延伸产物的样品。
实施方式65.根据实施方式64所述的方法,其中所述释放包括:
在适于引物寡核苷酸以碱基特异性方式与所述初级延伸产物的互补部分杂交以及适于聚合酶延伸杂交的引物寡核苷酸的条件下,将一种或多种引物寡核苷酸、所述聚合酶和结合至所述固体载体的所述捕获寡核苷酸-初级延伸产物复合体掺混,所述引物寡核苷酸包含与所述初级延伸产物的一部分互补的核苷酸序列,其中所述延伸在所述测序之前释放杂交的初级延伸产物。
实施方式66.根据实施方式23所述的方法,其进一步包括:
提供一个或多个捕获寡核苷酸,所述捕获寡核苷酸包含与所述环状嵌合单链核酸构建体的一部分互补的核苷酸序列,且包含捕获部分;
在适于所述一个或多个捕获寡核苷酸与所述集合的互补环状嵌合单链核酸构建体之间的杂交的条件下,使环状嵌合单链核酸构建体的集合与所述一个或多个捕获寡核苷酸在所述掺混之前或期间接触;
经由结合至固定在固体载体上的合适结合伴侣的捕获部分将杂交的捕获寡核苷酸-环状嵌合单链核酸构建体复合体捕获在所述固体载体上;
移除未杂交的捕获寡核苷酸和所述集合的环状嵌合单链核酸构建体;以及
在所述经受之前释放与结合至所述固体载体的所述捕获寡核苷酸杂交的所述环状嵌合单链核酸构建体,以形成富集环状嵌合单链核酸构建体的样品。
实施方式67.一种用于识别样品中的与所述样品中的其它核酸分子的差异为一个或多个碱基的一个或多个靶核糖核酸分子的方法,所述方法包括:
提供含有可能含有一个或多个碱基差异的一个或多个靶核糖核酸分子的样品;
在所述样品中生成所述一个或多个靶核糖核酸分子(如果存在于所述样品中)的cDNA;
提供一个或多个第一寡核苷酸探针,每个第一寡核苷酸探针包含:(a)3'cDNA靶标特异性序列部分,(b)5'cDNA靶标特异性部分,以及其它部分,所述其它部分包含(i)独特标识符序列、(ii)患者标识符序列、(iii)一条或多条引物结合序列或(i)、(ii)和(iii)的任何组合;
在有效地使所述第一寡核苷酸探针的3'和5'靶标特异性部分以碱基特异性方式与所述cDNA的互补区域杂交的条件下,使所述样品与所述一个或多个第一寡核苷酸探针接触;
产生适于偶联杂交至其互补cDNA的第一寡核苷酸探针的3'和5'端的一个或多个可连接结;
在所述一个或多个连接结处连接所述一个或多个第一寡核苷酸探针,以形成包含偶联至所述第一寡核苷酸探针的其它部分的靶核糖核酸序列的脱氧核糖核酸拷贝的环状连接产物;以及
检测和区分所述样品中的所述环状连接产物,以识别与所述样品中的其它核糖核酸分子的差异为一个或多个碱基的一个或多个靶核糖核酸分子的存在。
实施方式68.根据实施方式67所述的方法,其进一步包括:
在所述检测之前从所述样品中移除未连接的第一寡核苷酸探针和其它非环化的核酸分子。
实施方式69.根据实施方式67所述的方法,其中所述检测和区分包括:
对所述样品中的所述环状连接产物测序。
实施方式70.一种用于识别样品中的一个或多个可能包含彼此连接的不同的第一靶和第二靶区域的核酸分子的方法,所述方法包括:
提供可能含有一个或多个包含彼此连接的不同的第一靶和第二靶区域的核酸分子的样品;
提供一个或多个寡核苷酸探针组,每个探针组包含(i)包含5'第一靶标特异性部分、3'第二靶标特异性部分和其它部分的第一寡核苷酸探针,和(ii)包含5'第二靶标特异性部分、3'第一靶标特异性部分和其它部分的第二寡核苷酸探针,其中探针组的所述第一或第二寡核苷酸探针的其它部分包含(i)独特标识符序列、(ii)患者标识符序列、(iii)一条或多条引物结合序列或(i)、(ii)和(iii)的任何组合;
在有效地使探针组的第一和第二寡核苷酸探针以碱基特异性方式与所述核酸分子(如果存在于所述样品中)的其相应的第一和第二靶区域杂交的条件下,使所述样品与所述一个或多个寡核苷酸探针组接触;
产生适于在所述探针组与核酸分子的互补第一和第二靶区域杂交时将所述探针组的第一寡核苷酸探针的3'端偶联至第二寡核苷酸探针的5'端以及将所述探针组的第一寡核苷酸探针的5'端偶联至第二寡核苷酸探针的3'端的一个或多个可连接结;
在所述一个或多个可连接结处连接探针组的所述第一和第二寡核苷酸,以形成包含对应于偶联至其它部分的核酸分子的所述第一和第二不同靶区域的核苷酸序列的环状连接产物;以及
检测和区分所述样品中的所述环状连接产物,从而识别所述样品中包含彼此连接的不同的第一靶和第二靶区域的一个或多个核酸分子的存在(如果有的话)。
实施方式71.根据实施方式70所述的方法,其中所述产生一个或多个可连接结包括:
用聚合酶延伸所述第一和/或第二寡核苷酸探针的3'端,以分别与所述第二和/或第一寡核苷酸探针的5'端形成连接结。
实施方式72.根据实施方式71所述的方法,其中所述聚合酶包含5'至3'核酸外切酶活性或3'至5'核酸外切酶活性。
实施方式73.根据实施方式70所述的方法,其中所述产生一个或多个可连接结包括:
释放所述第一和/或第二寡核苷酸探针上的适于连接的3'OH和/或5’磷酸根。
实施方式74.根据实施方式70所述的方法,其进一步包括:
在所述检测之前从所述样品中移除未连接的第一和第二寡核苷酸探针,以及其它非环化的核酸分子。
实施方式75.根据实施方式70所述的方法,其中所述检测和区分包括:
对所述样品中的所述环状连接产物测序。
实施方式76.一种用于识别样品中的与所述样品中的其它核酸分子的差异为一个或多个碱基的一个或多个靶核糖核酸分子的方法,所述方法包括:
提供包含可能含有一个或多个碱基差异的一个或多个靶核糖核酸分子的样品;
将核苷酸接头附接到所述样品中的所述靶核糖核酸分子的3'和5'端;
提供一个或多个寡核苷酸探针,每个寡核苷酸探针包含(a)与所述靶核糖核酸分子的3'核苷酸接头互补的3'部分,(b)与所述靶核糖核酸分子的5'核苷酸接头互补的5'部分,以及(c)其它部分,所述其它部分包含(i)独特标识符序列、(ii)患者标识符序列、(iii)一条或多条引物结合序列或(i)、(ii)和(iii)的任何组合;
在有效地使所述寡核苷酸探针的3'和5'部分以碱基特异性方式与所述靶核糖核酸分子(如果存在于所述样品中)上的互补核苷酸接头杂交的条件下,使所述样品与所述一个或多个寡核苷酸探针接触;
延伸杂交的寡核苷酸探针的3'端以产生所述一个或多个靶核糖核酸分子的补体;
将所述寡核苷酸探针的3'延伸端连接到所述寡核苷酸探针的5'端,以形成环状连接产物,所述环状连接产物包含与所述靶核糖核酸分子的3'核苷酸接头互补的序列、与所述靶核糖核酸分子的5'核苷酸接头互补的序列、所述一个或多个靶核糖核酸分子的补体和所述寡核苷酸探针的其它部分;以及
检测和区分所述样品中的所述环状连接产物,从而识别与所述样品中的其它核酸分子的差异为一个或多个碱基的一个或多个靶核糖核酸分子的存在。
实施方式77.根据实施方式76所述的方法,其进一步包括:
在所述连接后从所述样品中移除未连接的第一寡核苷酸探针和其它非环化的核酸分子。
实施方式78.根据实施方式76所述的方法,其中所述检测和区分包括:
对所述样品中的所述环状连接产物测序。
实施方式79.一种用于识别样品中的与所述样品中的其它核酸分子的差异为一个或多个碱基的一个或多个靶核糖核酸分子的方法,所述方法包括:
提供含有可能含有一个或多个碱基差异的一个或多个靶核糖核酸分子的样品;
将核苷酸接头连接至所述样品中的所述靶核糖核酸分子的3'和5'端,其中所述核苷酸接头通过其它部分彼此连接,所述其它部分包含(i)独特标识符序列、(ii)患者标识符序列、(iii)一条或多条引物结合序列或(i)、(ii)和(iii)的任何组合,由此所述连接形成包含所述靶核糖核酸分子、所述3'和5'核苷酸接头序列和所述其它部分的环状连接产物;
提供一个或多个第一寡核苷酸引物,其包含与所述环状连接产物的3'或5'核苷酸接头序列互补的核苷酸序列;
使所述一个或多个第一寡核苷酸引物以碱基特异性方式与所述环状连接产物杂交;
延伸所述第一寡核苷酸引物的3'端以产生所述环状连接产物的补体;以及
检测和区分所述样品中的所述环状连接产物补体,从而识别与所述样品中的其它核酸分子的差异为一个或多个碱基的一个或多个靶核糖核酸分子的存在。
实施方式80.根据实施方式77所述的方法,其中所述检测和区分包括:
对所述样品中的所述环状连接产物测序。
实施方式81.一种用于识别样品中的与所述样品中的其它核酸分子的差异为一个或多个碱基的一个或多个靶核糖核酸分子的方法,所述方法包括:
提供含有可能含有一个或多个碱基差异的一个或多个靶核糖核酸分子的样品;
提供一个或多个寡核苷酸探针组,每个组包含(a)具有5'茎环部分以及与所述靶核糖核酸分子的3'部分互补的3'部分的第一寡核苷酸探针,(b)具有与所述靶核糖核酸分子的5'端的拷贝互补的3'部分、与所述第一寡核苷酸探针的5'茎环部分互补的5'部分以及其它部分的第二寡核苷酸探针,所述其它部分包含(i)独特靶标识符序列、(ii)患者标识符序列、(iii)引物结合序列或(i)、(ii)和(iii)的任何组合;
掺混所述样品、来自探针组的所述一个或多个第一寡核苷酸探针和逆转录酶,以形成逆转录酶反应;
延伸杂交至其互补靶核糖核酸分子的所述第一寡核苷酸探针的3'端,以产生所述靶核糖核苷酸分子(如果存在于所述样品中)的补体;
使探针组的所述一个或多个第二寡核苷酸探针与包含所述靶核糖核苷酸序列的补体的所述延伸的第一寡核苷酸探针杂交;
在杂交至延伸的第一寡核苷酸探针的每个第二寡核苷酸探针的3'和5'端之间产生一个或多个可连接结;
连接每个第二寡核苷酸探针的3'和5'端,以形成包含偶联至所述第二寡核苷酸探针的其它部分的靶核糖核酸序列的脱氧核糖核酸拷贝的环状连接产物;以及
检测和区分所述样品中的所述环状连接产物,从而识别与所述样品中的其它核酸分子的差异为一个或多个碱基的一个或多个靶核糖核酸分子的存在。
实施方式82.根据实施方式81所述的方法,其中所述检测和区分包括:
对所述样品中的所述环状连接产物序列测序。
实施例
预测性实施例1-已知基因(例如Braf、K-ras、p53)中的高敏感性突变标记(当以1%至0.01%存在时)、单碱基突变、小片段插入和小片段缺失突变。
致癌基因中的突变变化通常发生在不连续区域或位置中并且通常可以推进肿瘤进展。这些基因和其突变的列表可以参见公开数据库例如桑格基因组中心(Sanger GenomeCenter)“COSMIC”数据库。血清中此类突变的存在是体内一些肿瘤组织的强烈指标。传统上,此类突变已使用等位基因特异性PCR扩增加以识别。这种方法易于进行初始错误扩增,接着进行错误产物的扩增。其他人已使用数字PCR以试图定量血清中的突变DNA。然而,肿瘤抑制基因(例如p53和APC)中的突变变化过多以致无法使用等位基因特异性PCR方法进行覆盖。因此,所述方法已改为跨蛋白质的所有外显子的深度测序。当输入DNA有限时,重要的是实现不同区域的相等扩增以确保相同普遍覆盖深度。已多次尝试使用分子倒置探针(MIP)实现相等扩增,参见例如Akhras等人,“Connector Inversion Probe Technology:APowerful One-Primer Multiplex DNA Amplification System for NumerousScientific Applications,”PLoS One 2(9):e915(2007);Hiatt等人,“Single MoleculeMolecular Inversion Probes for Targeted,High-Accuracy Detection of Low-Frequency Variation,”Genome Res.23(5):843-54(2013),这些文献在此通过引用整体并入。然而,这些技术依赖于制造基因组DNA的拷贝,并因此具有引入额外错误的风险。
方法综述:思路为精确捕获覆盖目标区域或外显子的靶DNA的每一个片段,附接独特标识符序列和任选患者标识,环形测序并将它们环化以供后续测序例如环形测序。使原始靶DNA链环化并测序。这避免了由延伸(并且环化)杂交的寡核苷酸造成的聚合酶诱导型错误,这种错误将会导致假阳性。这种方法的优势在于获得必要时的拷贝数量信息(即,病毒载量、肿瘤内染色体失衡、无创性产前诊断中的非整倍体检测)和以所需最少测序获得突变数据。
变型1.1:(图13-16).在所述变型中,将短接头连接到DNA靶标(平均长度约160个碱基的cfDNA)。为捕获所需区域,使包含以下的寡核苷酸探针与靶标进行杂交:与靶标的5’侧序列互补的5’探针区域、独特标识符序列、任选的患者标识符序列、与接头的3’端互补的序列以及与靶标的3’侧序列互补的3’探针区域。所述寡核苷酸可以含有位于一个末端(所示5’端)上的任选的阻断基团,或任选的可裂解接头。取决于探针设计和靶片段的始末碱基,靶标的一部分可以在3’接头与与3’探针互补的靶标的一部分之间环出(loop out)一个单链区域(图13和14),或者靶序列的5’端的一部分可以不杂交,或者来自所述寡核苷酸的3’探针序列的一部分可以环出(图15和16)。聚合酶的添加允许寡核苷酸的3’端在靶标上延伸,以及3’端接头延伸通过独特标识符序列和任选患者标识符序列。
选择杂交条件使得与靶标的3’侧序列的互补的3’探针区域的杂交将靶标上的接头的3’端局部集中到其补体,使得其正确杂交并且容易通过聚合酶延伸。然而,如果寡核苷酸探针与靶DNA之间的互补性不够充分,那么靶标上的接头的3’端将不会与其补体杂交,并且几乎不会通过聚合酶进行延伸。寡核苷酸的3’端在靶标上延伸会增强探针与靶标的缔合,并且因此增加接头的3’端与其补体正确杂交并且通过聚合酶延伸的能力。聚合酶(或Fen核酸酶)的5’→3’核酸酶裂解活性在靶标的5’侧与探针的5’部分互补的位置或其附近裂解靶标的匹配的5’-重叠碱基,从而使真正靶标留出可连接的5’-磷酸根。聚合酶还使寡核苷酸在靶标上延伸,并且产生可连接的5’-磷酸根(图13和15,步骤D的左侧),或者不裂解寡核苷酸的5’端上的阻断基团(图13和15,步骤D的右侧)。
连接酶共价密封延伸的3’端到可连接的5’-磷酸根以产生环状连接产物。阻断基团阻止寡核苷酸探针环化(图13和15,步骤D,右侧),或者可替代地在可裂解连接处引入缺口(例如,UDG裂解dU,接着以AP核酸内切酶裂解脱嘌呤主链,图13和15,步骤D,左侧)。任选地添加尿嘧啶-DNA糖基化酶(UDG)和甲酰胺基嘧啶-DNA糖基化酶(Fpg,也称为8-氧代鸟嘌呤DNA糖基化酶,其充当N-糖基化酶和AP-裂解酶)可以用于使含受损碱基的靶标缺口。随后添加核酸外切酶以消化所有未连接的或有缺口的产物,从而只留下由原始靶DNA和独特标识符序列组成的所需单链环状DNA。这种产物适用于滚环扩增和环形测序或直接SMRT测序。
这种方法需要具有靶依赖性5’→3’核酸酶活性的酶,使得可连接的5’-磷酸根仅在5’探针区域和5’靶区域之间存在合适的杂交和互补性时产生。当使用具有5’→3’核酸酶裂解活性的聚合酶时,挑战在于避免聚合酶以其破坏5’靶区域(即,缺口-平移)的方式沿5’探针区域延伸短接头而无需连接步骤。破坏原始靶DNA并用延伸的DNA来代替的缺口-平移可能无意引入聚合酶错误,其将会被增殖并且被错误称为突变。这可以通过以下方式来最小化:在分布延伸的条件下在连接酶的存在下使用具有和不具有5’->3’核酸酶裂解活性的聚合酶的混合物(例如,以1:20的比例),使得大多数延伸是通过不具有核酸酶活性的聚合酶进行,直到需要具有核酸酶活性的聚合酶以产生可连接结,接着进行聚合酶解离和连接事件以产生所需环状连接产物。
cfDNA(具有140到170个核苷酸范围的大小)反映围绕核小体单元的染色体DNA的裂解。此类裂解事件可以稍微分阶段,或更随机,从而产生诸多可以均匀或不均匀分布的片段。因此,需要设计将提供与片段断裂位置无关的覆盖的寡核苷酸探针。
图90-93提供不同寡核苷酸探针设计以覆盖跨250个碱基区域的片段的一些实例。在这些图中,潜在靶片段(跨区域偏移10个碱基)由深灰色条表示,接头由短黑色条表示,探针区域表示为浅灰色条,独特序列标识符和任选患者标识符表示为黑色粗线,以及两条序列之间的连接示意性绘示为细线。图100和101说明了如何设计多个探针以覆盖约500个碱基的连续区域。
在图90中,上游5’探针区域(60个碱基)与靶碱基50-110互补,而下游3’探针区域(20个碱基)与靶碱基140-160互补。出于所述实施例的目的,接头是10个碱基,且复合标识符序列是20个碱基(序列标识符为12个碱基,且患者标识符为8个碱基)。当靶标为位置1至160时,这个探针设计将允许140个碱基产物(其中110个碱基(即,位置50至160)提供靶序列信息)的环化。当靶标为位置11至170时,这个探针设计将允许150个碱基产物(其中120个碱基(即位置50至170)提供靶序列信息)的环化。利用这个设计,根据分别从位置51至81开始并在位置210至240结束的靶标将推导出最大160个碱基的序列信息。在所述图中,当靶标是从位置61至250时,不形成环化产物。然而由于5’探针区域和靶标的5’侧之间的互补性的更短区域,一些产物可能形成,所以存在它们不始终杂交的顾虑。另外,这个设计的顾虑之处在于3’侧的90个碱基的靶“环出”区域可能过长以致无法使接头的3’端与寡核苷酸上的补体(图解右侧的短黑色条)有效杂交。
在图91中,上游5’探针区域(80个碱基)与靶碱基30-110互补,而下游3’探针区域(20个碱基)与靶碱基140-160互补。所述图类似于图90,只是5’探针区域更长。对于前4个靶标实例,更长寡核苷酸允许捕获更多靶DNA,使得所得环含有原始靶DNA的20个额外碱基。
图100和101说明了如何以重叠拼接策略设计寡核苷酸探针以对更大连续区域(本文中显示约500个碱基)测序。图100描绘使用图90中的设计的四种“连续”探针,而图101描绘使用图91中的设计的四种“连续”探针。描绘可在区域上产生的潜在160bp片段(偏移10个碱基)。在底层,显示覆盖其上方的所有那些片段的寡核苷酸。如果靶标中的区域是呈浅灰色,那么将不提供可靠序列信息。如果靶标中的区域是呈深灰色,那么将提供良好的序列信息。在所述图中,所列探针依序命名为#1、#2、#3、#4等。对于多路延伸连接步骤,将奇数探针#1、#3、#5汇集于第一寡核苷酸池组中,并且随后将偶数探针#2、#4、#6汇集于第二池组中。这种方法避免相邻寡核苷酸(即#1和#2)竞争结合到相同靶链。一旦已发生延伸-环化,那么可合并这两个池并且可进行核酸外切酶和后续步骤例如滚环扩增和环形测序或直接SMRT测序。
用于高敏感性检测已知基因(例如Braf、K-ras、p53)中的单碱基突变、小片段插入或小片段缺失突变(当以1%至0.01%存在时)的详细方案(V1.1):
1.1.a.以cfDNA(或者例如从CTC分离的基因组DNA,剪切到约150bp)开始,用T4聚合酶和T4激酶修复末端,接着用克列诺(外-)和dATP添加单碱基3’A悬突。接头具有单碱基3’T悬突,使得用T4连接酶的连接将接头附接在片段两端。任选地,从未连接的接头纯化靶DNA。
1.1.b.在寡核苷酸探针(包含与靶标的5’侧序列互补的5’探针区域、独特标识符序列、任选的患者标识符序列、与接头的3’端互补的序列和与靶标的3’侧序列互补的3’探针区域)的存在下,使两个末端均含有接头的靶DNA变性(94℃1分钟),并且通过冷却到所需温度(例如,50℃持续2小时)使寡核苷酸与所需片段上的其互补区杂交。在退火步骤之后或在程序开始时,添加Taq聚合酶和热稳定连接酶(优选自菌株AK16D)、dNTP和任选的KlenTaq(缺乏核酸酶活性的Taq聚合酶)。允许在杂交温度下进行延伸和连接,并且任选地升高温度(例如60℃)以确保完成延伸和连接,以产生环状产物。
1.1.c.任选地,裂解在可裂解连接处的寡核苷酸探针链(例如使用UDG和AP核酸内切酶裂解U)。添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接的或有缺口的产物,仅留下由原始靶DNA、接头序列、独特标识符序列和任选患者标识符序列组成的所需单链环状DNA。这种产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶)以产生所需序列的串联重复,接着使用下一代测序或者可替代地使用接头序列作为引物结合位点在共价闭合模板上进行直接SMRT测序来识别靶标。
注释1:寡核苷酸探针可以在5’侧含有任选阻断基团以干扰聚合酶的后续5’-3’核酸酶活性,使得所述寡核苷酸探针不环化。可替代地,可裂解连接可以包括在原始寡核苷酸探针中。
注释2:可使用Fen核酸酶代替具有5’-3’核酸酶活性的聚合酶以在靶标的5’侧产生可连接的5’磷酸根。
注释3:可以在分配延伸的条件(即,更高盐浓度)下使用Taq聚合酶(具有5’->3’核酸酶活性)和KlenTaq(没有5’->3’核酸酶裂解活性的Taq聚合酶)的1:20混合物,以使靶DNA由于缺口平移产生的降解最小化。
注释4:连接延伸过程可以在两个或更多个反应管中进行,一组含有“奇数”编号探针,第二组含有“偶数”编号探针以避免探针竞争相同靶DNA链。可随后汇集单独的反应物。
变型1.2.(图17-18).在所述变型中,目的在于捕获所有靶DNA序列,与探针在何处结合靶标无关。与之前一样,将短接头连接到DNA靶标(平均长度约160个碱基的cfDNA)。为捕获所需区域,使包含以下的寡核苷酸探针与靶标进行杂交:与靶标的5’侧序列互补的5’探针区域、与接头的5’端互补的序列、独特标识符序列、任选的患者标识符序列、与接头的3’端互补的序列和与靶标的3’侧序列互补的3’探针区域。所述寡核苷酸探针可以含有位于一个末端(所示5’端)上的任选的阻断基团,或任选的可裂解接头。取决于探针设计和靶片段的始末碱基,靶标或探针序列的一部分可以在3’接头和与3’探针互补的靶标的部分之间以及在5’接头和与5’探针互补的靶的部分之间环出单链区域(图17)。聚合酶的添加允许寡核苷酸的3’端在靶标上延伸,以及3’端接头延伸通过独特标识符序列和任选的患者标识符序列,直到其邻接到靶标上的5’接头。
选择杂交条件使得与靶标的3’侧序列的互补的3’探针区域的杂交将靶标上的接头的3’端局部集中,使得其正确杂交并且容易通过聚合酶延伸。接头的5’端可以设计得稍微更长,以使得一旦聚合酶延伸3’接头,其不正好延伸通过5’接头互补序列,直到其命中与5’探针区域杂交的5’靶部分。然而,3’接头和5’接头区域与寡核苷酸探针上的各自补体的“组合”杂交效果应仍具有低于杂交温度的Tm,使得错误靶标与寡核苷酸探针的随机杂交(如果有的话)几乎不导致延伸和连接以产生环状产物。
此变型要求寡核苷酸探针含有与3’和5’接头链互补的序列,其中那些序列仅间隔约20个碱基。由于此序列与接头链(其继而彼此互补)互补,因此需要避免寡核苷酸探针的自我配对。一种解决方案是连接含有内部泡(internal bubble)的接头,使得两个接头在用于接头连接的低温(16℃或甚至4℃,利用T4连接酶)下保持双链特性。另外,5’接头可以设计得比3’接头更长。最后,接头内的互补性的区域可以设计成具有细微错配或核苷酸类似物(即,G:T和T:G;或I:A),其在互补寡核苷酸探针中更不稳定(即,C:A和A:C;或C:T),使得所述寡核苷酸探针在总体杂交温度(即,50℃)下较不可能以环的形式形成内部自我配对。
例如,与T:A匹配相比,接头中A束中间的I:A错配将使Tm降低2.4℃,但寡核苷酸中的互补错配C:T使Tm降低10.1℃(7.7℃差异)。同样地,与G:C匹配相比,接头中A束中间的G:T错配将使Tm降低10.2℃,但寡核苷酸中的互补错配A:C使Tm降低18.0℃(7.8℃差异)。参见Kawase等人,“Studies on nucleic acid interactions.I.Stabilities of mini-duplexes(dG2A4XA4G2-dC2T4YT4C2)and self-complementary d(GGGAAXYTTCCC)containing deoxyinosine and other mismatched bases,”Nucleic Acids Res.14(19):7727-36(1986),其在此通过引用整体并入)。因此,与接头自我配对相比,预期将此类错配放置在接头内将使寡核苷酸自我配对的Tm降低约15.5℃。精确量可以根据序列上下文来改变,然而本领域的技术人员应明白:在4℃或16℃连接温度下保持双链的接头DNA双链体中使用I:A和G:T错配远足以确保寡核苷酸内间隔约20个碱基的互补序列在50C的更高杂交温度下将不会自我配对(即,具有20个碱基环的发夹)。
寡核苷酸的3’端在靶标上延伸会增强探针与靶标的缔合,并且因此增加接头的3’端与其补体正确杂交并通过聚合酶延伸的能力。聚合酶(或Fen核酸酶)的5’->3’核酸酶裂解活性裂解5’接头的匹配的5’-重叠碱基,从而在接头上留出可连接的5’-磷酸根。聚合酶还使寡核苷酸在靶标上延伸,并且产生可连接的5’-磷酸根或者不裂解寡核苷酸的5’端上的阻断基团。
连接酶将延伸的3’端共价密封到可连接的5’-磷酸根以产生环状连接产物。阻断基团阻止寡核苷酸探针环化或者可替代地在可裂解连接引入缺口(例如,UDG裂解dU,接着以AP核酸内切酶裂解脱嘌呤主链)。任选地添加尿嘧啶-DNA糖基化酶(UDG)和甲酰胺基嘧啶-DNA糖基化酶(Fpg,也称为8-氧代鸟嘌呤DNA糖基化酶,其充当N-糖基化酶和AP-裂解酶)可以用于使含受损碱基的靶标缺口。随后添加核酸外切酶以消化所有未连接的或有缺口的产物,从而只留下由原始靶DNA和独特标识符序列组成的所需单链环状DNA。这种产物适用于滚环扩增和环形测序或直接SMRT测序。
此处的挑战在于避免聚合酶以其破坏5’接头(即,缺口-平移)的方式延伸3’接头而无需连接步骤。这可以通过将硫代磷酸根键并入5’磷酸根末端(其将通过聚合酶的5’->3’核酸酶活性来释放)的第2位和第3位中来完成。为使由于聚合酶延伸一个碱基太多(其将不可能连接到下游接头)导致的那些碱基的聚合酶位移最小化,连接结处的靶碱基将优选在3’侧富含AT和在5’侧富含GC。
一种替代方法是使用5’接头,所述5’接头在与所需5’磷酸根邻接的位置处含有脱嘌呤(AP)位点。使用热稳定EndoIII(例如Tma EndoIII)释放此5’磷酸根。当接头结合到靶标时,此酶裂解AP位点,从而留下5’磷酸根。核酸内切酶还裂解单链接头,但效率更低,因此与模板杂交的接头将为优选的底物。当使用热稳定EndoIII时,所用的PCR聚合酶将缺乏5’->3’核酸外切酶活性。
如上所述,缺口平移问题也可以如下最小化:通过使用具有和不具有5’->3’核酸酶裂解活性的聚合酶混合物(例如,比率为1:20)在分配延伸条件下,在连接酶存在下,使得大多数延伸借助不具有核酸酶活性的聚合酶,直到需要具有核酸酶活性的聚合酶来产生可连接结,随后聚合酶解离和连接事件,以产生所需环状连接产物。
图94和95提供不同寡核苷酸探针设计以覆盖跨250个碱基区域的片段的一些实例。在这些图中,潜在靶片段(跨区域偏移10个碱基)由深灰色条表示,接头由短黑色条表示,探针区域表示为浅灰色条,独特序列标识符和任选患者标识符表示为黑色粗线,以及所述的两条序列之间的连接示意性绘示为细线。图102和103说明了如何设计多个探针以覆盖约500个碱基的连续区域。
在图94中,上游5’探针区域(50个碱基)与靶碱基50-100互补,而下游3’探针区域(50个碱基)与靶碱基150-200互补。对于这个实例的目的,3’接头为10个碱基,而复合标识符序列为20个碱基(序列标识符为12个碱基,且患者标识符为8个碱基),而5’接头绘示为10个碱基,然而在另一个实施方案中,其将稍微更长,约12至18个碱基。当靶标为位置1至160时,此探针设计将允许200个碱基产物(其中160个碱基均提供靶序列信息)的环化。这些探针经过设计使得与靶标是1至160直到91至250无关,它们应仍形成延伸产物,其环化以形成约200个碱基的产物。
在图95中,上游5’探针区域(60个碱基)与靶碱基40-100互补,而下游3’探针区域(60个碱基)与靶碱基140-200互补。此图类似于图94,除了3’和5’探针区域更长。此探针设计可以更有效在末端处捕获靶标(即,靶标1至160;11至170;81至240;和91至250)。
图102和103说明了如何以重叠拼接策略设计寡核苷酸探针以对更大连续区域(本文中显示约500个碱基)测序。图102描绘使用图94中的设计的四种“连续”探针,而图103描绘使用图95中的设计的四种“连续”探针。描绘可在区域上产生的潜在160bp片段(偏移10个碱基)。在底层,显示覆盖其上方的所有那些片段的寡核苷酸。在所述图中,所列探针依序命名为#1、#2、#3、#4等。对于多路延伸连接步骤,将奇数探针#1、#3、#5汇集于第一寡核苷酸池组中,并且随后将偶数探针#2、#4、#6汇集于第二池组中。这种方法避免相邻寡核苷酸(即#1和#2)竞争结合到相同靶链。一旦已发生延伸-环化,那么可合并这两个池并且可进行核酸外切酶和后续步骤例如滚环扩增和环形测序或直接SMRT测序。
用于高敏感性检测已知基因(例如Braf、K-ras、p53)中的单碱基突变、小片段插入或小片段缺失突变(当以1%至0.01%存在时)的详细方案(V1.2):
1.2.a.以cfDNA(或者例如从循环肿瘤细胞(CTC)分离的基因组DNA,剪切到约150bp)开始,用T4聚合酶和T4激酶修复末端,接着用克列诺(外-)和dATP添加单碱基3’A悬突。接头具有单碱基3’T悬突,使得在4℃下使用T4连接酶进行的连接将接头附接在片段的两个末端。任选地,从未连接的接头纯化靶DNA。
1.2.b.在寡核苷酸探针(包含与靶标的5’侧序列互补的5’探针区域、与接头的5’端互补的序列、独特标识符序列、任选的患者标识符序列、与接头的3’端互补的序列和与靶标的3’侧序列互补的3’探针区域)的存在下,使两个末端均含有接头的靶DNA变性(94℃,1分钟),并且通过冷却到所需温度(例如,50℃持续2小时)使寡核苷酸与所需片段上的其互补区杂交。在退火步骤之后或在程序开始时,添加Taq聚合酶和/或KlenTaq(缺乏核酸酶活性的Taq聚合酶)和热稳定连接酶(优选自菌株AK16D)、dNTP。允许在杂交温度下进行延伸和连接,并且任选地升高温度(例如60℃)以确保完成延伸和连接,以产生环状产物。
1.2.c.任选地,裂解可裂解连接处的寡核苷酸探针(例如用UDG和AP核酸内切酶裂解U)。添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接的或有缺口的产物,仅留下由原始靶DNA、接头序列、独特标识符序列和任选的患者标识符序列组成的所需单链环状DNA。这种产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶)以产生所需序列的串联重复,接着使用下一代测序识别靶标,或者可替代地使用接头序列作为引物结合位点,在共价闭合模板上进行直接SMRT测序。
注释1:寡核苷酸探针可以在5’侧含有任选的阻断基团以干扰聚合酶的后续5’-3’核酸酶活性,使得寡核苷酸探针不环化。可替代地,可裂解接头可以被包括在原始寡核苷酸探针中。
注释2:可使用Fen核酸酶代替具有5’-3’核酸酶活性的聚合酶以在靶标的5’侧产生可连接的5’磷酸根。
注释3:5’端接头可以经过合成以将硫代磷酸根键包含在5’磷酸根末端(其将通过聚合酶的5’->3’核酸酶活性来释放)的第2位和第3位中。为使由于聚合酶延伸一个碱基太多(其将不可能连接到下游接头)导致的那些碱基的聚合酶位移最小化,连接结处的靶碱基将优选在3’侧富含AT和在5’侧富含GC。
注释4:当使用KlenTaq聚合酶(不具有5’->3’核酸酶裂解活性的Taq聚合酶)时,5’端接头可以经过合成以在与所需5’磷酸根邻接的位置含有脱嘌呤(AP)位点。使用热稳定EndoIII(例如Tma EndoIII)释放此5’磷酸根。当此酶结合到靶标时,所述酶裂解AP位点,从而留下5’磷酸根。核酸内切酶还裂解单链寡核苷酸,但效率更低,因此与模板杂交的接头将为优选的底物。
注释5:当使用KlenTaq聚合酶(不具有5’->3’核酸酶裂解活性的Taq聚合酶)时,5’端接头可以经过合成以含有5’磷酸根。可替代地,5’磷酸根可以使用T4激酶在连接到靶DNA之前或在连接步骤之后添加。
注释6:可以在分配延伸的条件(即,更高盐浓度)下使用Taq聚合酶(具有5’->3’核酸酶活性)和KlenTaq(没有5’->3’核酸酶裂解活性的Taq聚合酶)的1:20混合物,以使靶DNA由于缺口平移产生的降解最小化。
注释7:连接延伸过程可以在两个或更多个反应管中进行,一组含有“奇数”编号的探针,第二组含有“偶数”编号的探针以避免探针竞争相同的靶DNA链。可随后汇集单独的反应物。
注释8:含有单碱基3’“T”悬突的接头的实例是以寡核苷酸iSx-003-ShAdT(上链)和iSx-004-pShAdB(下链)(参见表1)的形式提供的。以增强与接头区域结合的稍长接头的实例是以寡核苷酸iSx-006-MdAdT(上链)和iSx-007-pMdAdB(下链)(参见表1)的形式提供的。接头iSx-003-ShAdT和iSx-006-MdAdT(参见表1)可以在5’端附近含有任选的硫代磷酸根基团以防止缺口-平移和促进具有接头末端的靶标的环化。接头iSx-004-pShAdB和iSx-007-pMdAdB(参见表1)可以在3’端附近或3’端处含有任选的硫代磷酸根基团以防止降解(如果使用具有校对活性的聚合酶)和促进具有接头末端的靶标的环化。
注释9:如果没有额外碱基添加到靶DNA(即,跳过克列诺步骤),那么使用平端连接。为避免接头与接头连接,接头的平端未经磷酸化。含有平端的接头的实例是以寡核苷酸iSx-003-ShAdT(上链)和iSx-005-ShAdB(下链)(参见表1)的形式提供。
注释10:当设计与更长接头序列一起使用的寡核苷酸(包含与商用仪器一起使用的“条码”和“索引”序列)时,可以必要地使用PCR、链置换扩增或其组合来组装寡核苷酸。在PCR期间,使用dUTP代替TTP并入尿嘧啶,其适用于后续通过UDG裂解。反链引物可被磷酸化,从而允许使用λ核酸外切酶或类似的5’->3’核酸外切酶将其消化。dA30序列可以附接到正向引物的5’端,从而实现链置换扩增。适用于组装扩增以测序含有热点突变的KRAS、BRAF和TP53外显子5-8的区域的寡核苷酸的实例显示于表1(下文)中并且包括以下:(i)KRAS正向和反向靶区域(iSx-001-bkA30、iSx-016-bkA30-KRSF11、iSx-017-pKRSF12、iSx-008-701F、iSx-009-501R、iSx-018-pKRSF13和iSx-018-pKRSR14)和(iSx-015-pKRSF10、iSx-017-pKRSF12、iSx-008-701F、iSx-009-501R、iSx-018-pKRSF13、iSx-019-bkA30-KRSR15和iSx-001-bkA30);(ii)BRAF正向和反向靶区域(iSx-001-bkA30、iSx-023-bkA30-BRF-F11、iSx-024-pBRF-F12、iSx-008-701F、iSx-009-501R、iSx-025-pBRF-F13和iSx-026-pBRF-R14)和(iSx-022-pBRF-F10、iSx-024-pBRF-F12、iSx-008-701F、iSx-009-501R、iSx-025-pBRF-F13、iSx-027-bkA30-pBRF-R15和iSx-001-bkA30);(iii)TP53外显子5上游正向和反向靶区域(iSx-001-bkA30、iSx-035-bkA30-pTP53e5F11、iSx-036-pTP53e5F12、iSx-008-701F、iSx-009-501R、iSx-037-pTP53e5F13、iSx-038-pTP53e5R14)和(iSx-034-pTP53e5F10、iSx-036-pTP53e5F12、iSx-008-701F、iSx-009-501R、iSx-037-pTP53e5F13、iSx-039-bkA30-TP53e5R15和iSx-001-bkA30);(iv)TP53外显子5下游正向和反向靶区域(iSx-001-bkA30、iSx-043-bkA30-TP53e5F21、iSx-044-pTP53e5F22、iSx-008-701F.iSx-009-501R、iSx-045-pTP53e5F23和iSx-046-pTP53e5R24)和(iSx-042-pTP53e5F20、iSx-044-pTP53e5F22、iSx-008-701F.iSx-009-501R、iSx-045-pTP53e5F23、iSx-047-bkA30-TP53e5R25和iSx-001-bkA30);(v)TP53外显子6正向和反向靶区域(iSx-001-bkA30、iSx-053-bkA30-TP53e6F31、iSx-054-pTP53e6F32、iSx-008-701F、iSx-009-501R、iSx-055-pTP53e6F33和iSx-056-pTP53e6R34)和(iSx-052-pTP53e6F30、iSx-054-pTP53e6F32、iSx-008-701F、iSx-009-501R、iSx-055-pTP53e6F33、iSx-057-bkA30-TP53e6R35和iSx-001-bkA30);(vi)TP53外显子7正向和反向靶区域(iSx-001-bkA30、iSx-063-bkA30-TP53e7F41、iSx-064-pTP53e7F42、iSx-008-701F、iSx-009-501R、iSx-065-pTP53e7F43和iSx-066-pTP53e7R44)和(iSx-062-pTP53e7F40、iSx-064-pTP53e7F42、iSx-008-701F、iSx-009-501R、iSx-065-pTP53e7F43、iSx-067-pTP53e7R45和iSx-001-bkA30);和(vii)TP53外显子8正向和反向靶区域(iSx-001-bkA30、iSx-073-bkA30-TP53e8F51、iSx-074-pTP53e8F52、iSx-008-701F、iSx-009-501R、iSx-075-pTP53e8F53和iSx-076-pTP53e8R54)和(iSx-072-pTP53e8F50、iSx-074-pTP53e8F52、iSx-008-701F、iSx-009-501R、iSx-075-pTP53e8F53、iSx-077-bkA30-TP53e8R55和iSx-001-bkA30)。
注释11:在产生包含含有热点突变的KRAS、BRAF和TP53外显子5-8的靶区域的环状产物后,这些区域可以使用靶标特异性引物经受滚环扩增以产生串联重复产物。这些产物可以在固体载体上以靶标特异性寡核苷酸捕获所需靶标之前或之后产生(参见下文注释12)。引物可以含有内部可裂解核苷酸碱基或脱碱基位点例如1’,2’-二脱氧核糖(dSpacer),从而实现在滚环扩增期间并入dUTP以保护免于带入污染。此类引物的实例显示于下表1中并且包括以下:(i)KRAS正向和反向引物(iSx-108-KRS-rcF26、iSx-109-KRS-rcR27);(ii)BRAF正向和反向引物(iSx-118-BRF-rcF26、iSx-119-BRF-rcR27);(iii)TP53外显子5正向和反向引物(iSx-128-TP53e5-rcF66、iSx-129-TP53e5-rcR67;iSx-130-TP53e5-rcF68、iSx-131-TP53e5-rcR69);(iv)TP53外显子6正向和反向引物(iSx-138-TP53e6-rcF76、iSx-139-TP53e6-rcR77);(v)TP53外显子7正向和反向引物(iSx-148-TP53e7-rcF86、iSx-149-TP53e7-rcR87);和(vi)TP53外显子8正向和反向引物(iSx-158-TP53e8-rcF96、iSx-159-TP53e8-rcR97)。
注释12:在产生包含含有热点突变的KRAS、BRAF和TP53外显子5-8的靶区域的环状产物和/或产生串联重复产物后,这些产物可以通过与更长寡核苷酸杂交来捕获,所述更长寡核苷酸含有适用于在固体载体上后续捕获的捕获基团。含有适用于经由涂覆有链霉亲和素的固体表面捕获的生物素基团的此类引物的实例显示于下表1中并且包括以下:(i)KRAS正向和反向捕获寡核苷酸(iSx-013-KRS-bcF1、iSx-014-KRS-bcR2);(ii)BRAF正向和反向捕获寡核苷酸(iSx-020-BRF-bcF1、iSx-021-BRF-bcR2);(iii)TP53外显子5正向和反向捕获寡核苷酸(iSx-030-TP53e5-bcF1、iSx-031-TP53e5-bcR2、iSx-032-TP53e5-bcF3、iSx-033-TP53e5-bcR4);(iv)TP53外显子6正向和反向捕获寡核苷酸(iSx-050-TP53e6-bcF5、iSx-051-TP53e6-bcR6);(v)TP53外显子7正向和反向捕获寡核苷酸(iSx-060-TP53e7-bcF7、iSx-061-TP53e7-bcR8);和(vi)TP53外显子8正向和反向捕获寡核苷酸(iSx-070-TP53e8-bcF9、iSx-071-TP53e8-bcR10)。
注释13:以利用以上引物和接头设计产生的上述产物,在簇或珠粒扩增或在商业仪器上捕获在流动池的孔、地址或表面后,可使用以下引物起始测序反应:(i)iLx-003-PEsqP1,成对末端测序引物1;(ii)iLx-004-BrCdR1,索引引物,条码读段1;(iii)iLx-001-P5-BrCdR2,条码读段2;和(iv)iLx-005-PEsqP2,成对末端测序引物2(参见表1的引物序列)。
变型1.3:(参见例如图19–22).在此变型中,不是将短接头连接到DNA靶标,而是使用末端转移酶附接短单核苷酸尾巴(平均长度约160个碱基的cfDNA)。剩余步骤与图13和15中的一样。通过末端转移酶难以控制附接碱基数量。因此,寡核苷酸内的同型核苷酸束(即polyA)的长度决定杂交Tm。还可以必要地使用具有3’->5’校对活性的聚合酶以移除一些过量的同型核苷酸束,直到其与其补体齐平,并且适用于以聚合酶进行延伸。
变型1.4:(参见例如图23-26).在此变型中,没有任何东西附接到DNA靶标(平均长度约160个碱基的cfDNA)。为捕获所需区域,使包含以下的寡核苷酸与靶标进行杂交:与靶标的5’侧序列互补的5’探针区域、独特标识符序列、任选的患者标识符序列、任选的引物结合序列和与靶标的3’侧序列互补的3’探针区域。5’和3’探针区域含有规律间隔(即,10、12或15个碱基)的任选错配。所述寡核苷酸可以含有位于一个末端(所示5’端)上的任选的阻断基团,或任选的可裂解接头。取决于探针设计和靶片段的始末碱基,靶序列的5’或3’端的一部分可以不杂交(图23)。含有3’->5’和5’->3’核酸酶活性的聚合酶或聚合酶组的添加允许寡核苷酸的3’端在靶标上延伸,以及靶标的单链3’端的任选消化,直到其与寡核苷酸的3’探针区域齐平(图23),接着使靶标的3’端延伸通过独特标识符序列和任选的患者标识符序列。
选择杂交条件使得与靶标的3’侧序列互补的3’探针区域的杂交以及与靶标的5’侧序列的互补的5’探针区域的杂交在与仅一侧杂交的靶标上变得丰富(并且将形成不会环化的非生产性延伸产物)。寡核苷酸探针的3’端在靶标上延伸会增强所述探针与所述靶标的缔合。聚合酶(或Fen核酸酶)的5’->3’核酸酶裂解活性在靶标的5’侧与探针的5’部分互补的位置处或其附近裂解靶标的匹配的5’-重叠碱基,从而从真正靶标留下可连接的5’-磷酸根。聚合酶还使用模板处的靶标延伸寡核苷酸探针,并且产生可连接的5’-磷酸根(图23和22的左侧),或者不裂解所述寡核苷酸的5’端上的阻断基团(图23和25的右侧)。
连接酶将延伸的3’端共价密封到可连接的5’-磷酸根以产生环状连接产物。阻断基团阻止寡核苷酸探针环化(右侧),或者可替代地,在可裂解连接处引入缺口(例如,UDG裂解dU,接着以AP核酸内切酶裂解脱嘌呤主链,左侧)。任选地添加尿嘧啶-DNA糖基化酶(UDG)和甲酰胺基嘧啶-DNA糖基化酶(Fpg,也称为8-氧代鸟嘌呤DNA糖基化酶,其充当N-糖基化酶和AP-裂解酶)可以用于使含受损碱基的靶标缺口。随后添加核酸外切酶以消化所有未连接的或有缺口的产物,从而只留下由原始靶DNA和独特标识符序列组成的所需单链环状DNA。这种产物适用于滚环扩增和环形测序或直接SMRT测序。
这种方法要求酶或酶组具有靶标依赖性5’->3’和3’->5’核酸酶活性,使得可连接的5’-磷酸根仅在5’探针区域和与5’靶区域之间存在合适杂交和互补性时产生。当使用具有5’->3’核酸酶活性的聚合酶时,挑战在于避免聚合酶以其破坏5’靶区域(亦即,缺口-平移)的方式沿5’探针区域延伸短接头而无需连接步骤。破坏原始靶DNA并用延伸的DNA来代替的缺口-平移可能无意引入聚合酶错误,其将会增殖并且被错误称为突变。这可以通过以下方式来最小化:在分布延伸的条件下在连接酶的存在下使用具有和不具有5’->3’核酸酶裂解活性的聚合酶的混合物(例如,以1:20的比例),使得大多数延伸是通过不具有核酸酶活性的聚合酶进行,直到需要具有核酸酶活性的聚合酶以产生可连接结,接着进行聚合酶解离和连接事件以产生所需环状连接产物。如图25和26中所绘的寡核苷酸探针设计的使用可以不需要具有3’->5’核酸酶活性的聚合酶。在初始反应中使用T4激酶以在靶标的5’端附接磷酸根也可以用于产生可连接的5’磷酸根,并且无需具有5’->3’核酸酶活性的聚合酶。
图96-99提供不同寡核苷酸探针设计以覆盖跨250个碱基区域的片段的一些实例。在这些图中,潜在靶片段(跨区域偏移10个碱基)由深灰色条表示,探针区域表示为浅灰色条,其中灰色条中的黑色细线指示错配碱基,以及独特序列标识符和任选的患者标识符表示为黑色粗线。图104-107说明了如何设计多个探针以覆盖约500个碱基连续区域。
在图96中,上游5’探针区域(50个碱基)与靶碱基40-90互补,而下游3’探针区域(50个碱基)与靶碱基150-200互补。对于这个实例的目的,每10个碱基中存在错配,而复合标识符序列为20个碱基(序列标识符为12个碱基,且患者标识符为8个碱基)。当靶标为位置1至160时,这个探针设计将允许180个碱基产物(其中110个碱基(即位置50至160)提供靶序列信息)的环化。当靶标为位置11至170时,这个探针设计将允许180个碱基产物(其中120个碱基(即位置50至170)提供靶序列信息)的环化。利用这个设计,分别从位置31至51开始并在位置190至210结束的靶标推导出最大140个碱基的序列信息。在图中,当靶标是从位置81至250时,无环状产物形成。一些产物可以形成,然而因为5’探针区域和靶标的5’侧之间的互补性的短区域,所以存在它们不始终杂交的顾虑。
在图97中,上游5’探针区域(60个碱基)与靶碱基30-90互补,而下游3’探针区域(60个碱基)与靶碱基150-210互补。此图类似于图96,只是5’和3’探针区域更长。对于前5个靶标实例,更长寡核苷酸允许捕获更多靶DNA,使得所得环含有原始靶DNA的20个额外碱基。
图98和99延伸图96和97的趋向,分别延伸70和80个碱基的探针区域。与之前一样,更长探针区域确保覆盖更多的靶标。错配有助于从探针的聚合酶拷贝中区分真正靶标。当讨论的DNA含有野生型碱基时,其源自靶标以及与其邻接的DNA序列。当所述DNA含有探针上错配碱基的补体时,那么已知所述碱基产生自探针。
图104-107说明了如何以重叠拼接策略设计寡核苷酸探针以对更大连续区域(本文中显示约500个碱基)测序。分别地,图104描绘使用图96中的设计的四种“连续”探针,而图105-107描绘使用图97-99中的设计的四种“连续”探针。描绘可在区域上产生的潜在160bp片段(偏移10个碱基)。在底层,显示覆盖其上方的所有那些片段的寡核苷酸。如果靶标中的区域是呈浅灰色,那么将不提供可靠序列信息。如果靶标中的区域是呈深灰色,那么将提供可靠序列信息。在此图中,所列探针依序命名为#1、#2、#3、#4等。对于多路延伸连接步骤,将奇数探针#1、#3、#5汇集于第一寡核苷酸池组中,并且随后将偶数探针#2、#4、#6汇集于第二池组中。这种方法避免相邻寡核苷酸(即#1和#2)竞争结合到相同靶链。一旦已发生延伸-环化,可以合并这两个池并且可以进行核酸外切酶和后续步骤(例如滚环扩增和环形测序)或者可替代地,使用任选的引物结合序列作为引物结合位点,在共价闭合模板上进行直接SMRT测序。
用于高敏感性检测已知基因(例如Braf、K-ras、p53)中的单碱基突变、小片段插入或小片段缺失突变(当以1%至0.01%存在时)的详细方案
1.4.a.以cfDNA(或者例如从CTC分离的基因组DNA,剪切到约150bp)开始,在寡核苷酸(包含与靶标的5’侧序列互补的5’探针区域、独特标识符序列、任选的患者标识符序列、任选的引物结合序列和与靶标的3’侧序列互补的3’探针区域)的存在下,使靶标DNA变性(94℃1分钟),并且通过冷却到所需温度(例如,40℃或45℃持续2小时)使寡核苷酸杂交到所需片段上的其互补区。降低所述反应物的温度,并且在退火步骤后添加DNA聚合酶(即,T4聚合酶具有强3'->5'校对活性)和DNA聚合酶1(具有弱3'->5'校对活性,但具有良好5'->3'活性)及任选克列诺片段(无5'->3'活性))、DNA连接酶(T4连接酶或大肠杆菌连接酶)和dNTP。使其在23℃或30℃下进行延伸和连接,并且任选地升高温度(例如37℃)以确保完成延伸和连接,以产生环状产物。
1.4.b.任选地,在可裂解连接处裂解寡核苷酸探针(例如,使用UDG和AP核酸内切酶裂解的U)。添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接的或有缺口的产物,仅留下由原始靶DNA、接头序列、独特标识符序列和任选的患者标识符序列组成的所需单链环状DNA。这种产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶)以产生所需序列的串联重复,接着使用下一代测序或者可替代地使用接头序列作为引物结合位点在共价闭合模板上进行直接SMRT测序来识别靶标。
注释1:寡核苷酸探针可以在5’侧含有任选的阻断基团以干扰聚合酶的后续5’-3’核酸酶活性,使得寡核苷酸探针不环化。可替代地,可裂解连接可被包括在原始寡核苷酸中。
注释2:可使用Fen核酸酶代替具有5’-3’核酸酶活性的聚合酶以在靶标的5’侧产生可连接的5’磷酸根。
注释3:T4聚合酶(具有5’->3’核酸酶活性)和DNA聚合酶I(弱3’->5’校对,但良好5’->3’活性)和克列诺(不具有5’->3’核酸酶裂解活性的DNA聚合酶I)的1:20混合物可以在分布延伸(即更高盐浓度)的条件下使用以使靶DNA由于缺口平移产生的降解最小化。
注释4:连接延伸过程可以在两个或更多个反应管中进行,一组含有“奇数”编号的探针,第二组含有“偶数”编号的探针以避免探针竞争相同靶DNA链。可随后汇集单独的反应物。
注释5:在探针序列中以规律间隔(即,10、12或15个碱基)使用错配碱基允许从通过拷贝探针链所产生的序列中区分真正靶DNA序列。下文注释6中所列的寡核苷酸在靶序列区域中约每15个碱基含有错配碱基。
注释6:当设计与更长接头序列一起使用的寡核苷酸(包含与商用仪器一起使用的“条码”和“索引”序列)时,可以必要地使用PCR、链置换扩增或其组合来组装寡核苷酸。在PCR期间,使用dUTP代替TTP并入尿嘧啶,其适用于后续通过UDG裂解。反链引物可以被磷酸化,从而允许使用λ核酸外切酶或类似5’->3’核酸外切酶将其消化。dA30序列可以附接到正向引物的5’端,从而实现链置换扩增。适用于组装扩增以对含有热点突变的KRAS、BRAF和TP53外显子5-8的区域测序的寡核苷酸的实例显示于表1(下文)中并且包括以下:(i)KRAS正向和反向靶区域(iSx-001-bkA30、iSx-103-bkA30-KRSF21、iSx-104-pKRSF22、iSx-100-705F、iSx-101-502R、iSx-105-pKRSF23和iSx-106-pKRSR24)和(iSx-102-pKRSF20、iSx-104-pKRSF22、iSx-100-705F、iSx-101-502R、iSx-105-pKRSF23、iSx-107-bkA30-KRSR25和iSx-001-bkA30);(ii)BRAF正向和反向靶区域(iSx-001-bkA30、iSx-113-bkA30-BRF-F21、iSx-114-pBRF-F22、iSx-100-705F、iSx-101-502R、iSx-115-pBRF-F23和iSx-116-pBRF-R24)和(iSx-112-pBRF-F20、iSx-114-pBRF-F22、iSx-100-705F、iSx-101-502R、iSx-115-pBRF-F23、iSx-117-bkA30-BRF-R25和iSx-001-bkA30);(iii)TP53外显子5正向和反向靶区域(iSx-001-bkA30、iSx-123-bkA30-TP53e5F61、iSx-124-pTP53e5F62、iSx-100-705F、iSx-101-502R、iSx-125-pTP53e5F63和iSx-126-pTP53e5R64)和(iSx-122-pTP53e5F60、iSx-124-pTP53e5F62、iSx-100-705F、iSx-101-502R、iSx-125-pTP53e5F63、iSx-127-bkA30-TP53e5F65和iSx-001-bkA30);(iv)TP53外显子6正向和反向靶区域(iSx-001-bkA30、iSx-133-bkA30-TP53e6F71、iSx-134-pTP53e6F72、iSx-100-705F、iSx-101-502R、iSx-135-pTP53e6F73和iSx-136-pTP53e6R74)和(iSx-132-pTP53e6F70、iSx-134-pTP53e6F72、iSx-100-705F、iSx-101-502R、iSx-135-pTP53e6F73、iSx-137-bkA30-TP53e6F75和iSx-001-bkA30);(v)TP53外显子7正向和反向靶区域(iSx-001-bkA30、iSx-143-bkA30-TP53e7F81、iSx-144-pTP53e7F82、iSx-100-705F、iSx-101-502R、iSx-145-pTP53e7F83和iSx-146-pTP53e7R84)和(iSx-142-pTP53e7F80、iSx-144-pTP53e7F82、iSx-100-705F、iSx-101-502R、iSx-145-pTP53e7F83、iSx-147-bkA30-TP53e7R85和iSx-001-bkA30);和(vi)TP53外显子8正向和反向靶区域(iSx-001-bkA30、iSx-153-bkA30-TP53e8F91、iSx-154-pTP53e8F92、iSx-100-705F、iSx-101-502R、iSx-155-pTP53e8F93和iSx-156-pTP53e8R94)和(iSx-152-pTP53e8F90、iSx-154-pTP53e8F92、iSx-100-705F、iSx-101-502R、iSx-155-pTP53e8F93、iSx-157-bkA30-TP53e8R95和iSx-001-bkA30)。
注释7:在产生包含含有热点突变的KRAS、BRAF和TP53外显子5-8的靶区域的环状产物后,这些区域可以经受使用靶标特异性引物的滚环扩增以产生串联重复产物。这些产物可以在固体载体上以靶标特异性寡核苷酸捕获所需靶标之前或之后产生(参见下文注释8)。引物可以含有内部可裂解核苷酸碱基或脱碱基位点例如1’,2’-二脱氧核糖(dSpacer),从而实现在滚环扩增期间并入dUTP以保护免于带入污染。此类引物的实例显示于表1(下文)中并且包括以下:(i)KRAS正向和反向引物(iSx-108-KRS-rcF26、iSx-109-KRS-rcR27);(ii)BRAF正向和反向引物(iSx-118-BRF-rcF26、iSx-119-BRF-rcR27);(iii)TP53外显子5正向和反向引物(iSx-128-TP53e5-rcF66、iSx-129-TP53e5-rcR67;iSx-130-TP53e5-rcF68、iSx-131-TP53e5-rcR69);(iv)TP53外显子6正向和反向引物(iSx-138-TP53e6-rcF76、iSx-139-TP53e6-rcR77);(v)TP53外显子7正向和反向引物(iSx-148-TP53e7-rcF86、iSx-149-TP53e7-rcR87);和(vi)TP53外显子8正向和反向引物(iSx-158-TP53e8-rcF96、iSx-159-TP53e8-rcR97)。
注释8:在产生包含含有热点突变的KRAS、BRAF和TP53外显子5-8的靶区域的环状产物和/或产生串联重复产物后,这些产物可以通过与更长寡核苷酸杂交来捕获,所述更长寡核苷酸含有适用于在固体载体上后续捕获的捕获基团。含有适用于经由涂覆有链霉亲和素的固体表面捕获的生物素基团的此类寡核苷酸的实例显示于表1(下文)中并且包括以下:(i)KRAS正向和反向捕获寡核苷酸(iSx-013-KRS-bcF1、iSx-014-KRS-bcR2);(ii)BRAF正向和反向捕获寡核苷酸(iSx-020-BRF-bcF1、iSx-021-BRF-bcR2);(iii)TP53外显子5正向和反向捕获寡核苷酸(iSx-030-TP53e5-bcF1、iSx-031-TP53e5-bcR2;iSx-032-TP53e5-bcF3、iSx-033-TP53e5-bcR4);(iv)TP53外显子6正向和反向捕获寡核苷酸(iSx-050-TP53e6-bcF5、iSx-051-TP53e6-bcR6);(v)TP53外显子7正向和反向捕获寡核苷酸(iSx-060-TP53e7-bcF7、iSx-061-TP53e7-bcR8);和(vi)TP53外显子8正向和反向捕获寡核苷酸(iSx-070-TP53e8-bcF9、iSx-071-TP53e8-bcR10)。
注释9:以利用以上引物和接头设计产生的上述产物,在簇或珠粒扩增或在商业仪器上捕获在流动池的孔、地址或表面后,可使用以下引物起始测序反应:(i)iLx-003-PEsqP1,成对末端测序引物1;(ii)iLx-004-BrCdR1,索引引物,条码读段1;(iii)iLx-001-P5-BrCdR2,条码读段2;和(iv)iLx-005-PEsqP2,成对末端测序引物2(引物序列在下表1中提供)。
预测性实施例2-血浆DNA中的启动子高甲基化(当以1%至0.01%存在时)的高灵敏度甲基化标记物检测
启动子甲基化在调节基因表达中起到重要作用。基因的启动子通常具有高CpG含量的区域,称为“CpG岛”。当具有启动子CpG岛的基因如肿瘤抑制基因关闭时,通常伴随着启动子内的大多数CpG序列和第一外显子区域甲基化。有两种传统方法来检测甲基化变化。
第一种方法利用甲基敏感性限制酶,其中基因组DNA在未甲基化时裂解,且随后利用位于所述位点侧翼的引物进行PCR扩增。如果DNA被甲基化,其应该被扩增,如果未甲基化,不应该扩增。这种技术的缺点是消化并不总是完全,且另外在相同序列的大部分未甲基化时,寻找低水平的甲基化DNA并不准确,在血浆检测下也是这种情况。
第二种方法称为“甲基特异性PCR”,并基于DNA的亚硫酸氢盐处理,这就将未甲基化的C’转化为U’。如果碱基被甲基化,那么它未被转化。甲基特异性PCR基于使用引物和TaqMan探针,所述探针具有针对本应被甲基化但未被甲基化的所得被转化序列的特异性。甲基特异性PCR的优点是能够检测极低水平的甲基化DNA。这种技术的另一改进是使用阻断寡核苷酸,其与以亚硫酸氢盐转化的未甲基化DNA的序列杂交,因此富集扩增以亚硫酸氢盐转化的甲基化DNA。缺点是亚硫酸氢盐处理通过产生缺口破坏原始DNA完整性的50%至90%。当以来自血浆的DNA(平均长度为约160个碱基)开始时,这可成为重大问题。另外,C’转化为U’将序列复杂性从4种碱基减少为3种碱基。因为被转化的序列现在富含更多A:T,因此也需要更长的PCR引物。因此,可出现非特异性扩增,因为引物更有可能在密切相关但不正确的序列处误引发。这通常使嵌套式-PCR方法成为必要,这带来携带污染风险,且通常对于多重扩增来说并不理想。
方法概述:理念是忠实拷贝在目标区域的相邻限制位点含有甲基化的靶DNA的每个片段,附接独特标识符序列和任选的患者标识符,并使它们成环以进行随后的测序。使寡核苷酸DNA链成环并测序。这种方法提供以下优点:获得拷贝数信息(需要时),以及以所需的最少测序获得甲基化数据。
检测相邻位置处的甲基化
变型2.1:(参见例如图27)。在这个变型中,起初以HinP1I裂解DNA,以显著减少未甲基化靶标的量。为捕获所需甲基化区域,使包含与靶标的5’侧的序列互补的5’探针区域、独特标识符序列、任选的患者标识符序列和与靶标的3’侧的序列互补的3’探针区域的寡核苷酸与靶标杂交。所述寡核苷酸在接近上游探针的3’端和下游探针的阻断的5’端或不可连接端两处包含未甲基化HinP1I序列。3’端含有与靶标的错配,或被阻断以防止通过聚合酶延伸。如果靶DNA被甲基化,HinP1I将使探针靶杂交体的未甲基化链缺口,从而释放可延伸3’OH端和可连接的5’-磷酸根(图27的左侧)。如果靶标未甲基化,两条链均裂解,从而破坏靶模板(图27的右侧)。添加缺乏链置换活性及3’->5’和5’->3’核酸酶活性的连接酶和聚合酶能够延伸甲基化靶标上的探针的释放的3’端,然后连接至所述探针的释放的5’端,以形成含独特标识符序列、任选的患者标识符序列的环状产物。未连接的产物通过核酸外切酶消化来消除。这个环状产物适用任选的附加步骤和后续测序。
通过坚持使用限制性核酸内切酶产生3’OH和5’磷酸根,这避免了错误信号,且还应去除任何非特异性连接信号。因此,基因组DNA的在纯化后为单链或不被裂解的任何罕见片段将不会形成生产性底物,且将被核酸外切酶处理步骤破坏。
启动子甲基化的高灵敏度检测的详细方案:
2.1a.用一种或多种甲基敏感性酶(AciI、HinP1I、Hpy99I和HpyCH4IV)裂解分离的cfDNA或富含甲基的DNA。在这个实施例中,使用HinP1I。加热杀死核酸内切酶(65℃持续15分钟),并使DNA变性(94℃1分钟)。
2.1b.使靶DNA在寡核苷酸探针(包含与靶标的5’侧的序列互补的5’探针区域、独特标识符序列、任选的患者标识符序列、任选的引物结合位点和与靶标的3’侧序列互补的3’探针区域)存在下变性(94℃1分钟),并通过冷却至所需温度(例如40-50℃持续2小时)使寡核苷酸与它们在所需片段上的互补区域杂交。寡核苷酸含有在靠近探针的3’和5’端含有未甲基化HinP1I序列,所述寡核苷酸经设计以含有错配、阻断基团或缺乏磷酸化,使得它们不是聚合酶或连接酶的底物。冷却至37℃并添加HinP1I,如果靶DNA被甲基化,HinP1I将使探针靶杂交体的未甲基化链缺口,从而释放可延伸3’OH端和可连接的5’-磷酸根。加热杀死核酸内切酶(65℃持续15分钟)。在退火步骤之后或在限制性核酸内切酶缺口步骤之后,添加KlenTaq(缺乏核酸酶活性的Taq聚合酶)和热稳定连接酶(优选来自菌株AK16D)、dNTP。允许在50℃下延伸和连接,并任选地升高温度(例如60℃),以确保完成延伸和连接,以产生环状产物。
2.1.c.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下由甲基化DNA的拷贝、独特标识符序列和任选的患者标识符序列组成的所需单链环状DNA。这个环状产物适用于任选的附加步骤和后续测序。
注释1:寡核苷酸可能缺乏5’磷酸根,或在5’侧含有任选的阻断基团,使得寡核苷酸的5’端不适用于连接。寡核苷酸可在3’侧含有3’错配、3’发夹或任选的阻断基团,使得寡核苷酸的3’端不适用于在靶标上延伸。在两种情况下,阻断基团只在与甲基化靶标杂交时通过探针的限制性酶缺口释放。
注释2:以上实施例使用KlenTaq,一种缺乏链置换活性以及3’->5’和5’->3’核酸酶活性的聚合酶。如果寡核苷酸在3’侧具有阻断基团,那么可以使用具有3’->5’核酸酶活性的聚合酶,而如果阻断基团在5’侧,那么可使用具有5’->3’核酸酶活性的聚合酶。
注释3:在该实施例中,限制性核酸内切酶(HinP1I)通过在65℃下孵育15分钟热灭活。替代方法(或在使用热不敏感酶如BstUI时)是以提供对同源核酸内切酶的重新裂解有抗性的限制位点的核苷酸类似物(即5-甲基-dCTP或α-硫代磷酸dCTP)延伸。如果寡核苷酸的5’侧上的限制位点未通过使用核苷酸类似物(即HinP1I)转化为抗性形式,那么这种情况可通过使用5’侧上具有阻断基团的寡核苷酸以及含有5’->3’核酸酶活性的聚合酶解决。起初,通过限制性核酸内切酶的缺口活性移除阻断基团。随后在使用核苷酸类似物的延伸步骤期间,含有5’->3’核酸酶活性缺口的聚合酶通过识别位点平移,用提供难以进一步裂解的位点的核苷酸置换。
注释4:在以上实施例中,进一步最小化通过识别序列的缺口平移路径,寡核苷酸与5’探针部分的限制位点直接相邻的部分可经合成以含有硫代磷酸根键。因为聚合酶延伸一个碱基太多次(这将使得无法连接至下游引物),为使所述聚合酶最少置换那些碱基,连接结处的靶碱基将优选地在3’侧富含AT,且在5’侧富含GC。
注释5:寡核苷酸探针的靶标特异性部分经设计使得它们甚至在释放非生产性3’和5’端后仍将与靶标杂交。如果靶标含有与探针部分重叠的额外限制位点,那么探针可经合成以在那些位置具有5-甲基-dC。如果靶标在那些位置处被甲基化,那么所述位点将在靶标和寡核苷酸探针处被甲基化,且因此难以有缺口。然而,如果靶标在那些位置处不被甲基化,那么所述位点将在靶链上将缺口,从而干扰探针与(缩短的)靶标杂交。
注释6.环状产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶),以产生与所需序列互补的串联重复,随后在共价闭合模板上利用下一代测序或可替代的直接SMRT测序,使用引物结合序列作为引物结合位点识别靶标。
注释7.如果寡核苷酸探针还包含任选的引物结合位点(即通用引物结合位点),其将适合于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
相邻甲基敏感性限制位点处甲基化状态的数据库。
当前TCGA数据库含有关于许多不同组织位点的人类基因组上的约450,000个CpG位点的甲基化状态的信息,正常信息和肿瘤信息。然而,它并未涵盖相邻HinP1I位点的所有甲基化状态,也不会区分同一条基因组DNA上的两个位点都被甲基化。
因此,为使以上测定方法最有用,创建相邻甲基敏感性限制位点处的甲基化状态的数据库将是有帮助的。一种这样的方法示出在图28中。
方法概述:理念是生成只有片段的两端都含有在原始基因组DNA中被甲基化的限制位点才能形成的小片段的文库。所述片段具有附接有任选的独特标识符和任选的患者标识符序列的接头,所述接头现在能够连接产生片段多聚体,所述多聚体则是附加步骤和后续测序的底物。
变型2.1.1:(参见例如图28)。这种方法示出如何发现整个基因组的相邻HinP1I位点(GC*GC)处的甲基化。起始材料可为平均长度为约160bp的完整基因组DNA或cfDNA。用HinP1I裂解基因组DNA,以使DNA在未甲基化HinP1I位点断裂。将非连接端含阻断的5’端的短接头连接在靶片段的两端:补平HinP1I裂解端和修复端。(这些接头不在连接结重新产生HinP1I位点)。使用未甲基化dNTP和5’阻断的引物进行几轮PCR扩增产生现在在剩余的HinP1I位点处未甲基化的产物。然后用HinP1I裂解这些产物。当用HinP1I裂解时,只有含有在原始靶标中被甲基化的相邻HinP1I位点(GCGC)的PCR扩增子将产生两端未阻断的片段(即对于接头来说是可连接的)。将含有任选的独特标识符序列和任选的患者标识符序列的接头连接至这些新产生的补平HinP1I裂解端。这些新接头含有阻断的3’端(在其非连接侧)或含硫代磷酸根的主链(在图28中示为****)。添加双链3’核酸外切酶(即核酸外切酶III)后,一侧或两侧含原始短接头的片段将被消化并变成单链。只有具有连接至两侧的新接头的片段仍将为双链,因为3’阻断基团或硫代磷酸根抑制3’核酸外切酶消化。使含有剩余接头的片段的游离端变成可连接,方式为(i)使5’端磷酸化,(ii)移除阻断的3’基团,或(iii)利用5’-核酸酶活性裂解匹配的5’-重叠碱基或侧翼,留下可连接的5’-磷酸根或其任何组合。连接条件经设计以利于多聚化,例如通过使用拥挤试剂(即20%PEG)和/或通过混合两组连接产物,其中第一组的非回文5’接头悬突与第二组的非回文5’接头悬突互补。连接产物由最初在靶DNA中被甲基化且具有任选的独特标识符和/或患者标识符序列的相邻HinP1I序列组成。这个产物适用于任选的附加步骤和后续测序。
用于产生相邻甲基敏感性限制位点处的甲基化状态的数据库的详细方案:
2.1.1a.用一种或多种甲基敏感性酶(AciI、HinP1I、Hpy99I和HpyCH4IV)裂解分离的基因组DNA或富含甲基的DNA。在这个实施例中,使用HinP1I。任选地,加热杀死核酸内切酶(65℃持续15分钟)。连接在非连接端的5’端被阻断的接头上。用T4聚合酶和T4激酶修复靶标端,随后用克列诺(外-)和dATP产生单碱基3’A悬突。接头具有单碱基3’T悬突,使得用T4连接酶的连接将接头附接在片段两端。
(参见下文注释1。)
2.1.1b.添加5’阻断的引物、Taq聚合酶和dNTP,并进行几个PCR循环,以产生剩余HinP1I位点处现在未甲基化的产物。
2.1.1.c.添加HinP1I以裂解含此类位点的产物。当用HinP1I裂解时,只有含有在原始靶标中被甲基化的相邻HinP1I位点(GCGC)的PCR扩增子将产生两端未阻断的片段(即对于接头来说是可连接的)。来自Taq聚合酶的残余聚合酶将补平2-碱基悬突(任选地将温度升至60℃)。移除dNTP(经由离心柱),只回添dATP以产生单碱基3’A悬突。
2.1.1.d.使用T4连接酶,使连接端具有单碱基3’T悬突的接头(含有任选的独特标识符序列和任选的患者标识符序列)附接至裂解并补平的靶序列的单碱基A悬突。接头的5’非连接侧含有5’悬突,且任选地未被磷酸化。接头的3’非连接侧含有3’阻断基团和/或硫代磷酸根以抑制3’核酸外切酶消化。
2.1.1.e.添加3’核酸外切酶(即核酸外切酶III)并在37℃下消化。一侧或两侧含原始短接头的片段将被消化并变成单链。只有新接头连接至两侧的片段仍将为双链。核酸外切酶也将使接头成为单链。任选地,用离心柱移除所需片段的消化产物。
2.1.1.f.使含有剩余接头的片段的游离端变成可连接,方式为(i)使用T4激酶使5’端磷酸化,(ii)移除阻断的3’基团,或(iii)利用Taq聚合酶的5’->3’核酸酶活性裂解匹配的5’-重叠碱基或侧翼,留下可连接的5’-磷酸根或其任何组合。连接条件经设计以利于多聚化。连接产物由具有最初在靶DNA中被甲基化且具有任选的独特标识符和/或患者标识符序列的相邻HinP1I序列的靶片段的多聚体组成。这个产物适用于任选的附加步骤和后续测序。
注释1:关于接头连接:作为在接头与含单碱基T悬突的接头连接之前进行补平、修复末端和A加尾(tailing)的替代方式,可利用由HinP1I产生的5’CpG悬突。可利用克列诺(外-)和dCTP产生单碱基3’C悬突。接头具有单碱基3’C悬突,使得用T4连接酶的连接将接头附接在片段两端。可替代地,可直接使用具有CG悬突的接头,不补平位点,但所述接头经设计,使得如果它们自身连接,它们产生AclI位点(AA^CGTT)。因此,在37℃下,在接头和T4连接酶存在下以HinP1I(G^CGC)、AclI位点(AA^CGTT)裂解基因组DNA。片段彼此的连接被HinP1I裂解,接头彼此的连接被AclI裂解,然而接头与片段末端的连接不被任一酶裂解,所以这种3-酶连接混合物充当“生化选择”,以富集所需产物。
注释:2:阻断的接头的3’端可经合成以在阻断内部位置处含有尿嘧啶或脱嘌呤(AP)位点,并在用UDG和AP核酸内切酶处理后释放可连接的3’端。
注释3:可使用Fen核酸酶代替具有5’-3’核酸酶活性的聚合酶以在靶标的5’侧产生可连接的5’磷酸根。
注释4:连接将有利于形成多聚体,方式是通过使用拥挤试剂(即20%PEG)和/或通过混合两组连接产物,其中第一组的非回文5’接头悬突与第二组的非回文5’接头悬突互补。
利用亚硫酸氢盐处理检测相邻位置处的甲基化
以上方法对于识别和枚举含有相邻甲基化HinP1I位点作为此DNA片段内的甲基化替代品的片段是理想的。然而,对于一些应用,重要的是识别给定区域内的个别CpG位点的甲基化状态。因此,可能有必要用亚硫酸氢盐处理输入DNA,将常规C而不是甲基-C’转化为U’。
利用亚硫酸氢盐的方法概述:理念是忠实拷贝在目标区域的在序列的相邻AciI限制位点(G*CGG)处被甲基化的靶DNA的每个片段,用亚硫酸氢盐处理,附接独特标识符序列、任选的引物结合序列和任选的患者标识符,并使它们成环,以进行随后的测序。使寡核苷酸DNA链成环并测序。这种方法提供以下优点:获得拷贝数信息(需要时),以及以所需的最少测序获得甲基化数据。
所述理念利用识别序列对AciI的独特性质。所述酶裂解一个方向上的3.5碱基识别序列G^CGG,和第二方向上的C^CGC。如果用亚硫酸氢盐在第一方向(G*CGG)上处理甲基化的AciI位点,那么所述位点将保持不变(G*CGG),而在第二方向(C*CGC)上处理时,它将发生变化(U*CGU,其中*C表示5-meC)。几轮PCR扩增后,将5-甲基C转化为C,同时将U转化为T。因此,第一方向上的甲基化的AciI位点保持GCGG,第一方向上的未甲基化的AciI位点被转化为GTGG,第二方向上的甲基化的AciI位点被转化为TCGT,且第二方向上的未甲基化的AciI位点被转化为TTGT。当用AciI裂解时,只有原始靶标中被甲基化的相邻AciI位点将产生3’和5’端都是可连接的片段。
这种方法的一个独特特征在于亚硫酸氢盐转化产生两条非互补链。因此,上链将具有相邻G*CGG序列,且即使存在间插C*CGC序列也无关紧要,因为它被转化为U*CGU,在PCR后转化为不被认为是AciI位点的TCGT。另外,即使存在间插G*CGG或GCGG(即未甲基化)位点,它也不会被AciI缺口,因为它将在为单链的区域中。甚至更好地,形式C*CGC的上链上的序列将为下链上的G*CGG。下链也可以用于询问甲基化状态,且因为两个序列现在极为不同,上链和下链的寡核苷酸探针将不会彼此杂交,只会与转化的靶标杂交。因此,这种方法允许利用上链和下链的信息获得关于启动子的详细甲基化状态。
用亚硫酸氢盐处理DNA以将未甲基化的DNA转化为不可被限制性酶裂解的序列(但如果被甲基化,它仍可被相同限制性酶裂解)的原理可扩展至一些附加的限制位点。例如,BstUI位点(CG^CG)在亚硫酸氢盐转化后保留其相同序列,只要两个CG位点都被甲基化(即*CG*CG)。同样,Hpy99I位点(CGWCG^)在亚硫酸氢盐转化后也保留其相同序列,只要两个CG位点都被甲基化(即*CGW*CG)。在不同类型的实施例中,HpyCH2IV(A^CGT)将裂解形式A*CGT和A*CGC在亚硫酸氢盐转化后的序列,因为它们都变成A*CGT。因此,下文针对AciI考虑的变型同样有效,但不限于限制性核酸内切酶BstUI、Hpy99I、HpyCH2IV和它们的同裂酶。
变型2.2:(参见例如图29-30).在这个变型中,将含5-甲基C的短接头连接至DNA末端。然后用亚硫酸氢盐处理DNA,这使得所述链不互补,所以它们变成单链。几轮PCR扩增产生现在在剩余的AciI位点未甲基化的产物。然后用AciI裂解这些产物。只有含有在原始靶标中被甲基化的相邻AciI位点(GCGG)的PCR扩增子将产生现在两端可连接的片段。为捕获所需区域,包含与靶标的5’侧的序列互补的5’探针区域、独特标识符序列、任选的引物结合序列、任选的患者标识符序列和与靶标的3’侧的序列互补的3’探针区域的寡核苷酸探针与靶标杂交。添加缺乏链置换活性及3’->5’和5’->3’核酸酶活性的连接酶和聚合酶能够延伸未甲基化靶标的3’端,然后连接至所述靶标的5’端,以形成含独特标识符序列、任选的患者标识符序列和任选的引物结合位点的环状产物。未连接的产物通过核酸外切酶消化来消除。这个环状产物适用于任选的附加步骤和后续测序。
通过坚持使用限制性核酸内切酶产生3’OH和5’磷酸根,这避免了错误信号,且还应去除任何非特异性连接信号。因此,基因组DNA的在纯化后为单链或不被裂解的任何罕见片段将不会形成生产性底物,且将被核酸外切酶处理步骤破坏。
启动子甲基化的高灵敏度检测的详细方案:
2.2.a.连接在含有5-甲基C的接头上,以在亚硫酸氢盐转化后保留序列。用T4聚合酶和T4激酶修复靶端,随后用克列诺(外-)和dATP产生单碱基3’A悬突。接头具有单碱基3’T悬突,使得用T4连接酶的连接将接头附接在片段两端。cfDNA与亚硫酸氢盐孵育,将常规C而不是甲基-C转化为U。亚硫酸氢盐处理使上链和下链发生不同转化,使得在处理后,所述链将不再彼此互补且解开链。
2.2.b.添加引物、Taq聚合酶和dNTP,并进行几个PCR循环,以产生在剩余AciI位点处现在未甲基化的产物。
2.2.c.添加AciI以裂解含此类位点的产物。当用AciI裂解时,只有含有在原始靶标中被甲基化的相邻AciI位点(GCGG)的PCR扩增子将产生两端未阻断的片段(即对于接头来说是可连接的)。来自Taq聚合酶的残余聚合酶将补平2-碱基悬突(任选地将温度升至60℃)。
2.2.d.使靶DNA在寡核苷酸探针(包含与靶标的5’侧的序列互补的5’探针区域、独特标识符序列、任选的患者标识符序列、任选的引物结合位点和与靶标的3’侧序列互补的3’探针区域)存在下变性(94℃1分钟),并通过冷却至所需温度(例如50℃-60℃持续2小时)使寡核苷酸与它们在所需片段上的互补区域杂交。添加KlenTaq(缺乏核酸酶活性的Taq聚合酶)和热稳定连接酶(优选来自菌株AK16D)、dNTP,以允许在50℃下延伸和连接,并任选地升高温度(例如60℃),以确保完成延伸和连接,以产生环状产物。
2.2.e.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下由甲基化DNA的拷贝、独特标识符序列和任选的患者标识符序列组成的所需单链环状DNA。这个环状产物适用于任选的附加步骤和后续测序。
注释1.寡核苷酸可缺乏5’磷酸根,或在5’侧含有任选的阻断基团,使得寡核苷酸的5’端不适用于连接。
注释2.以上实施例使用KlenTaq,一种缺乏链置换活性以及3’->5’和5’->3’核酸酶活性的聚合酶。如果寡核苷酸在5’侧具有阻断基团,那么可以使用具有5’->3’核酸酶活性的聚合酶。
注释3.环状产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶),以产生所需序列的串联重复,随后在共价闭合模板上利用下一代测序或可替代地直接SMRT测序,使用引物结合序列作为引物结合位点识别靶标。
注释4.如果寡核苷酸还包含任选的引物结合位点(即通用引物结合位点),其将适用于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
在变型2.2中,使用聚合酶和连接酶形成含有独特标识符序列、任选的患者标识符序列和任选的引物结合位点的共价闭合环。这也可以只使用连接酶完成。
变型2.3:(参见例如图31-32).在这个变型中,将含5-甲基C的短接头连接至DNA末端。然后用亚硫酸氢盐处理DNA,这使得所述链不互补,所以它们变成单链。几轮PCR扩增产生现在在剩余的AciI位点未甲基化的产物。然后用AciI裂解这些产物。只有含有在原始靶标中被甲基化的相邻AciI位点(GCGG)的PCR扩增子将产生现在两端可连接的片段。为捕获所需的未甲基化区域,部分双链寡核苷酸对与靶标杂交,所述部分双链寡核苷酸对包含具有与靶标的5’侧序列互补的5’探针区域、任选的引物结合序列、任选的患者标识符序列和与靶标的3’侧序列互补的3’探针区域的第一寡核苷酸探针,以及包含与所述第一寡核苷酸探针链互补的5’区域、独特标识符序列和与所述第一寡核苷酸探针链互补的3’区域的第二寡核苷酸探针。添加连接酶允许靶标的3’端连接至第二寡核苷酸探针的5’端,且允许靶标的5’端连接至第二寡核苷酸探针的3’端,以形成含有独特标识符序列、任选的患者标识符序列和任选的引物结合位点的环状产物。未连接的产物通过核酸外切酶消化来消除。这个环状产物适用于任选的附加步骤和后续测序。
通过坚持使用限制性核酸内切酶产生3’OH和5’磷酸根,这避免了错误信号,且还应去除任何非特异性连接信号。因此,基因组DNA的在纯化后为单链且不被裂解的任何罕见片段将不会形成生产性底物,且将被核酸外切酶处理步骤破坏。
启动子未甲基化的高灵敏度检测的详细方案:
2.3.a.连接在含有5-甲基C的接头上,以在亚硫酸氢盐转化后保留序列。用T4聚合酶和T4激酶修复靶端,随后用克列诺(外-)和dATP产生单碱基3’A悬突。接头具有单碱基3’T悬突,使得用T4连接酶的连接将接头附接在片段两端。cfDNA与亚硫酸氢盐孵育,将常规C而不是甲基-C转化为U。亚硫酸氢盐处理使上链和下链发生不同转化,使得在处理后,所述链将不再彼此互补,且解开链。
2.3.b.添加引物、Taq聚合酶和dNTP,并进行几个PCR循环,以产生在剩余AciI位点处现在未甲基化的产物。
2.3.c.添加AciI以裂解含此类位点的产物。当用AciI裂解时,只有含有在原始靶标中被甲基化的相邻AciI位点(GCGG)的PCR扩增子将产生两端未阻断的片段(即对于接头来说是可连接的)。来自Taq聚合酶的残余聚合酶将补平2-碱基悬突(任选地将温度升至60℃)。
2.3.d.使靶DNA在部分双链寡核苷酸对(包含具有与靶标的5’侧序列互补的5’探针区域、任选的引物结合序列、任选的患者标识符序列和与靶标的3’侧序列互补的3’探针区域的第一寡核苷酸探针,以及包含与所述第一寡核苷酸探针互补的5’区域、独特标识符序列和与所述第一寡核苷酸探针互补的3’区域的第二寡核苷酸探针)存在下变性(94℃1分钟),并允许寡核苷酸通过冷却至所需温度(例如50℃-60℃持续2小时)与所需片段上的互补区域杂交。添加热稳定连接酶(优选来自菌株AK16D),以允许在60℃下连接产生环状产物。
2.3.e.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下由甲基化DNA的拷贝、独特标识符序列和任选的患者标识符序列组成的所需单链环状DNA。这个环状产物适用于任选的附加步骤和后续测序。
注释1.环状产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶),以产生所需序列的串联重复,随后在共价闭合模板上利用下一代测序或可替代地直接SMRT测序,使用引物结合序列作为引物结合位点识别靶标。
注释2.如果寡核苷酸还包含任选的引物结合位点(即通用引物结合位点),其将适用于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
相邻甲基敏感性限制位点(AciI位点)处甲基化状态的数据库。
当前TCGA数据库含有关于许多不同组织位点的人类基因组上的约450,000个CpG位点的甲基化状态的信息,正常信息和肿瘤信息。然而,它并未涵盖相邻AciI位点的所有甲基化状态,也不会区分同一条基因组DNA上的两个位点都被甲基化。
因此,为使以上测定方法最有用,创建相同方向的相邻AciI限制位点(GCGG)处的甲基化状态的数据库将是有帮助的。这种方法也将包括另一方向的相邻AciI限制位点(CCGC),因为它们在亚硫酸氢盐转化后在相反链上将为GCGG。一种这样的方法示出在图33中。
方法概述:理念是生成只有片段的两端都含有在原始基因组DNA中被甲基化的限制位点才能形成的小片段的文库。这种理念利用识别序列对AciI的独特性质。所述酶裂解一个方向上的3.5碱基识别序列G^CGG,和另一方向上的C^CGC。以甲基化AciI位点开始并用亚硫酸氢盐处理。在第一方向(G*CGG)上,所述位点将保持不变,而在第二方向上,它将发生变化(U*CGU,其中*C表示5-meC)。几轮PCR扩增后,第一位点转化为GCGG,被AciI识别,而第二位点转化为TCGT,不被裂解。因此,AciI也可用于在亚硫酸氢盐处理后识别独特甲基化的序列。所述片段具有附接有任选的独特标识符和任选的患者标识符序列的接头,所述接头现在能够连接产生片段多聚体,所述多聚体则是附加步骤和后续测序的底物。
变型2.3.1:(参见例如图33)。这种方法示出如何发现整个基因组的相邻AciI位点(GC*GG)处的甲基化。起始材料可为平均长度为约160bp的完整基因组DNA或cfDNA。将非连接端含有阻断的5’端的短接头连接至DNA末端上。亚硫酸氢盐处理DNA,将常规C但非甲基-C转化为U。使用未甲基化dNTP和5’阻断引物进行几轮PCR扩增产生现在在剩余的AciI位点处未甲基化的产物。然后用AciI裂解这些产物。当用AciI裂解时,只有含有在原始靶标中被甲基化的相邻AciI位点(GCGG)的PCR扩增子将产生两端未阻断的片段(即对于接头来说可连接的)。将含有任选的独特标识符序列和任选的患者标识符序列的接头连接至这些新产生的补平AciI裂解端上。这些新接头含有在其非连接侧的阻断的3’端或含硫代磷酸根的主链(在图33中示为****)。添加双链3’核酸外切酶(即核酸外切酶III)后,一侧或两侧含原始短接头的片段将被消化并变成单链。只有具有连接至两侧的新接头的片段仍将为双链,因为3’阻断基团或硫代磷酸根抑制3’核酸外切酶消化。使含有剩余接头的片段的游离端变成可连接,方式为(i)使5’端磷酸化,(ii)移除阻断的3’基团,或(iii)利用5’-核酸酶活性裂解匹配的5’-重叠碱基或侧翼,留下可连接的5’-磷酸根或其任何组合。连接条件经设计以利于多聚化,例如通过使用拥挤试剂(即20%PEG)和/或通过混合两组连接产物,其中第一组的非回文5’接头悬突与第二组的非回文5’接头悬突互补。连接产物由最初在靶DNA中被甲基化且具有任选的独特标识符和/或患者标识符序列的相同方向的相邻AciI序列(即GCGG)组成。这个产物适用于任选的附加步骤和后续测序。
用于产生相邻AciI限制位点处的甲基化状态的数据库的详细方案:
2.3.1.a.连接在非连接端的5’端被阻断的接头上。用T4聚合酶和T4激酶修复靶端,随后用克列诺(外-)和dATP产生单碱基3’A悬突。接头具有单碱基3’T悬突,使得用T4连接酶的连接将接头附接在片段两端上。cfDNA与亚硫酸氢盐孵育,将常规C而不是甲基-C转化为U。亚硫酸氢盐处理使上链和下链发生不同转化,使得在处理后,所述链将不再彼此互补,且解开链。
2.3.1.b.添加5’阻断的引物、Taq聚合酶和dNTP,并进行几个PCR循环,以产生在剩余AciI位点处现在未甲基化的产物。
2.3.1.c.添加AciI以裂解含此类位点的产物。当用AciI裂解时,只有含有在原始靶标中被甲基化的相邻AciI位点(GCGG)的PCR扩增子将产生两端未阻断的片段(即对于接头来说可连接的)。来自Taq聚合酶的残余聚合酶将补平2-碱基悬突(任选地将温度升至60℃)。移除dNTP(经由离心柱),只回添dATP以产生单碱基3’A悬突。
2.3.1.d.使用T4连接酶,使连接端具有单碱基3’T悬突的接头(含有任选的独特标识符序列和任选的患者标识符序列)附接至裂解并补平的靶序列的单碱基A悬突。接头的5’非连接侧含有5’悬突,且任选地未被磷酸化。接头的3’非连接侧含有3’阻断基团和/或硫代磷酸根以抑制3’核酸外切酶消化。
2.3.1.e.添加3’核酸外切酶(即核酸外切酶III)并在37℃下消化。一侧或两侧含原始短接头的片段将被消化并变成单链。只有新接头连接至两侧的片段仍将为双链。核酸外切酶也将使接头成为单链。任选地,用离心柱移除所需片段的消化产物。
2.3.1.f.使含有剩余接头的片段的游离端变成可连接,方式为(i)使用T4激酶使5’端磷酸化,(ii)移除阻断的3’基团,或(iii)利用Taq聚合酶的5’->3’核酸酶活性裂解匹配的5’-重叠碱基或侧翼,留下可连接的5’-磷酸根或其任何组合。连接条件经设计以利于多聚化。连接产物由具有最初在靶DNA中被甲基化且具有任选的独特标识符和/或患者标识符序列的相邻AciI序列的靶片段的多聚体组成。这个产物适用于任选的附加步骤和后续测序。
注释:1:阻断的接头的3’端可经合成以在阻断内部位置处含有尿嘧啶或脱嘌呤(AP)位点,并在用UDG和AP核酸内切酶处理后释放可连接的3’端。
注释2:可使用Fen核酸酶代替具有5’-3’核酸酶活性的聚合酶以在靶标的5’侧产生可连接的5’磷酸根。
注释3:连接将有利于形成多聚体,方式是通过使用拥挤试剂(即20%PEG)和/或通过混合两组连接产物,其中第一组的非回文5’接头悬突与第二组的非回文5’接头悬突互补。
预测性实施例3-总血浆DNA中的启动子低甲基化(当以1%至0.1%存在时)的高灵敏度未甲基化标记物检测.
肿瘤中的大多数甲基化变化是由于低甲基化造成。当此类低甲基化出现在先前被甲基化的启动子区域时,可导致基因如癌基因表达增加。另外,重复元件区域和移动元件通常被总体甲基化沉默,但在肿瘤变得低甲基化时此类沉默失效。
虽然甲基敏感性限制性酶可用于帮助选择性扩增和识别低水平甲基化的序列,但这种方法无法识别低水平未甲基化的序列。可使用亚硫酸氢盐处理和针对亚硫酸氢盐修饰的未甲基化DNA的PCR引物,但此类引物富含AT,且可能难以扩增所有所需片段,特别是在试图进行多重PCR时。
方法概述:理念是忠实拷贝在目标区域的相邻限制位点处未被甲基化的靶DNA的每个片段,附接独特标识符序列、任选的引物结合序列和任选的患者标识符,并使它们成环,以进行随后的测序。使寡核苷酸DNA链成环并测序。这种方法提供以下优点:获得拷贝数信息(需要时),以及以所需的最少测序获得未甲基化数据。
变型3.1:(参见例如,图34和35)。在这个变型中,用HinP1I(或其它甲基化敏感性限制性核酸内切酶)裂解DNA,以产生可连接的3’端和5’端。为捕获所需未甲基化的区域,包含与靶标的5’侧序列互补的5’探针区域、独特标识符序列、任选的引物结合序列、任选的患者标识符序列和与靶标的3’侧序列互补的3’探针区域的寡核苷酸探针与靶标杂交。添加缺乏链置换活性及3’->5’和5’->3’核酸酶活性的连接酶和聚合酶能够延伸未甲基化的靶标的3’端,然后连接至所述靶标的5’端,以形成含独特标识符序列、任选的患者标识符序列和任选的引物结合位点的环状产物。未连接的产物通过核酸外切酶消化来消除。这个环状产物适用于任选的附加步骤和后续测序。
通过坚持使用限制性核酸内切酶产生3’OH和5’磷酸根,这避免了错误信号,且还应去除任何非特异性连接信号。因此,基因组DNA的在纯化后为单链或不被裂解的任何罕见片段将不会形成生产性底物,且将被核酸外切酶处理步骤破坏。
启动子未甲基化的高灵敏度检测的详细方案:
3.1a.用一种或多种甲基敏感性酶(AciI、HinP1I、Hpy99I和HpyCH4IV)裂解分离的cfDNA。这个实施例说明了HinP1I的使用。加热杀死核酸内切酶(65℃持续15分钟),并使DNA变性(94℃1分钟)。
3.1b.使靶DNA在寡核苷酸(包含与靶标5’侧的序列互补的5’探针区域、独特标识符序列、任选的患者标识符序列、任选的引物结合位点和与靶标的3’侧序列互补的3’探针区域)存在下变性(94℃1分钟),并通过冷却至所需温度(例如50℃-60℃持续2小时)使寡核苷酸与它们在所需片段上的互补区域杂交。添加KlenTaq(缺乏核酸酶活性的Taq聚合酶)和热稳定连接酶(优选来自菌株AK16D)、dNTP,以允许在50℃下延伸和连接,并任选地升高温度(例如60℃),以确保完成延伸和连接,以产生环状产物。
3.1.c.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下由甲基化DNA的拷贝、独特标识符序列和任选的患者标识符序列组成的所需单链环状DNA。这个环状产物适用于任选的附加步骤和后续测序。
注释1.寡核苷酸可缺乏5’磷酸根,或在5’侧含有任选的阻断基团,使得寡核苷酸的5’端不适用于连接。
注释2.以上实施例使用KlenTaq,一种缺乏链置换活性以及3’->5’和5’->3’核酸酶活性的聚合酶。如果寡核苷酸在5’侧具有阻断基团,那么可以使用具有5’->3’核酸酶活性的聚合酶。
注释3.环状产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶),以产生所需序列的串联重复,随后在共价闭合模板上利用下一代测序或可替代地直接SMRT测序,使用引物结合序列作为引物结合位点识别靶标。当使用直接SMRT测序时,可直接确定原始模板DNA失去甲基化状态。
注释4.如果寡核苷酸还包含任选的引物结合位点(即通用引物结合位点),其将适用于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
注释5.可使用相同方法鉴定在启动子区域处被甲基化的区域(参见例如,图36和37)。用甲基敏感性酶(AciI、HinP1I、Hpy99I和HpyCH4IV)的混合物以及甲基不敏感性酶(HaeIII和MspI)裂解分离的cfDNA。图示出这种情况,其中甲基化AciI位点在两个HaeIII位点内部并且与所述两个HaeIII位点侧接。即使只有一个甲基不敏感限制位点,这种方法也有效(参见例如,图39、40、42、43)。如果甲基不敏感性限制性核酸内切酶释放活性3’端,那么所述末端将通过Taq聚合酶(具有5’-3’核酸酶活性)在寡核苷酸上延伸,且所述聚合酶将延伸并裂解靶标中的额外5’序列,从而在靶标上产生适合连接以产生环状产物的可连接的5’磷酸根(图39)。如果甲基不敏感限制性核酸内切酶释放活性5’磷酸根,那么使用具有3’-5’核酸酶活性的聚合酶将消化靶标中的额外3’序列(如果需要),那么一旦滑到寡核苷酸探针的互补序列,聚合酶将使靶链向上延伸至靶标上的可连接的5’磷酸根,且缺口被连接酶密封以产生环状产物(图40)。核酸外切酶消化后,从甲基敏感性限制性核酸内切酶裂解存活下来的链是此区域的甲基化标记。另外,当对共价闭合模板使用直接SMRT测序时,可确定原始模板DNA的甲基化状态。
注释6.可使用相同方法鉴定启动子区域中Bsh1236I位点处被甲基化的区域(参见例如,图38、41、44、45、46)。用Bsh1236I(CGCG)以及甲基不敏感酶(HaeIII)裂解分离的cfDNA。图38示出这种情况,其中甲基化Bsh1236I位点在两个HaeIII位点内部并且与所述两个HaeIII位点侧接。即使只有一个甲基不敏感限制位点,这种方法也有效(参见例如,41、44、45)。如果甲基不敏感限制性核酸内切酶释放活性3’端,那么所述末端将通过Taq聚合酶(具有5’-3’核酸酶活性)在寡核苷酸上延伸,且所述聚合酶将延伸并裂解靶标中的额外5’序列,从而在靶标上产生适用于连接以产生环状产物的可连接的5’磷酸根(图38)。如果甲基不敏感限制性核酸内切酶释放活性的5’磷酸根,那么使用具有3’-5’核酸酶活性的聚合酶将消化靶标中的额外3’序列(如果需要),那么一旦滑到寡核苷酸探针上的互补序列,聚合酶将使靶标链向上延伸至靶标上的可连接的5’磷酸根,且缺口被连接酶密封,以产生环状产物(图41&45)。核酸外切酶消化后,从甲基敏感性限制性核酸内切酶裂解存活下来的链是此区域的甲基化标记。利用Bst聚合酶在BstUI(CGCG)存在下进行滚环复制确保位点在原始样品中被甲基化。
在变型3.1中,使用聚合酶和连接酶形成含有独特标识符序列、任选的患者标识符序列和任选的引物结合位点的共价闭合环。这也可以只使用连接酶完成。
变型3.2:(参见例如,图47和48)。在这个变型中,用HinP1I(或其它甲基化敏感性限制性核酸内切酶)裂解DNA,以产生可连接的3’端和5’端。为捕获所需未甲基化的区域,部分双链寡核苷酸对与靶标杂交,所述部分双链寡核苷酸对包含具有与靶标的5’侧序列互补的5’探针区域、任选的引物结合序列、任选的患者标识符序列和与靶标的3’侧序列互补的3’探针区域的第一寡核苷酸探针,以及包含与所述第一探针互补的5’区域、独特标识符序列和与所述第一探针互补的3’区域的第二寡核苷酸探针。添加连接酶允许靶标的3’端连接至第二寡核苷酸探针的5’端,且允许靶标的5’端连接至第二寡核苷酸探针的3’端,以形成含有独特标识符序列、任选的患者标识符序列和任选的引物结合位点的环状产物。未连接的产物通过核酸外切酶消化来消除。这个环状产物适用于任选的附加步骤和后续测序。
通过坚持使用限制性核酸内切酶产生3’OH和5’磷酸根,这避免了错误信号,且还应去除任何非特异性连接信号。因此,基因组DNA的在纯化后为单链或不被裂解的任何罕见片段将不会形成生产性底物,且将被核酸外切酶处理步骤破坏。
启动子未甲基化的高灵敏度检测的详细方案:
3.2.a.用一种或多种甲基敏感性酶(AciI、HinP1I、Hpy99I和HpyCH4IV)裂解分离的cfDNA。在这个实施例中,使用HinP1I。加热杀死核酸内切酶(65℃持续15分钟),并使DNA变性(94℃1分钟)。
3.2.b.使靶DNA在部分双链寡核苷酸对(包含具有与靶标的5’侧序列互补的5’探针区域、任选的引物结合序列、任选的患者标识符序列和与靶标的3’侧序列互补的3’探针区域的第一寡核苷酸探针,以及包含与所述第一链互补的5’区域、独特标识符序列和与所述第一链互补的3’区域的第二寡核苷酸探针)存在下变性(94℃1分钟),并允许寡核苷酸通过冷却至所需温度(例如50℃-60℃持续2小时)与所需片段上的互补区域杂交。添加热稳定连接酶(优选来自菌株AK16D),以允许在60℃下连接产生环状产物。
3.2.c.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下由甲基化的DNA的拷贝、独特标识符序列和任选的患者标识符序列组成的所需单链环状DNA。这个环状产物适用于任选的附加步骤和后续测序。
注释1.环状产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶),以产生所需序列的串联重复,随后在共价闭合模板上利用下一代测序或可替代地直接SMRT测序,使用引物结合序列作为引物结合位点识别靶标。当使用直接SMRT测序时,可直接确定原始模板DNA失去甲基化状态。
注释2.如果寡核苷酸还包含任选的引物结合位点(即通用引物结合位点),其将适用于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
注释3.可使用相同方法鉴定启动子区域被甲基化的区域(参见例如,图49和51)。用甲基敏感性酶(AciI、HinP1I、Hpy99I和HpyCH4IV)的混合物以及甲基不敏感酶(HaeIII和MspI)裂解分离的cfDNA。这些图示出在两个HaeIII位点内部并且与所述两个HaeIII位点侧接的甲基化AciI位点。从甲基敏感性限制性核酸内切酶裂解存活下来的链是此区域的甲基化标记。另外,当对共价闭合模板使用直接SMRT测序时,可确定原始模板DNA的甲基化状态。
相邻甲基敏感性限制位点处未甲基化状态的数据库
当前TCGA数据库含有关于许多不同组织位置的人类基因组上的约450,000个CpG位点的甲基化状态的信息,正常信息和肿瘤信息。然而,它并未涵盖相邻HinP1I位点的所有未甲基化状态,也不会区分同一条基因组DNA上的两个位点都未被甲基化。
因此,为使以上测定方法最有用,创建相邻甲基敏感性限制位点处的未甲基化状态的数据库将是有帮助的。一种这样的方法示出在图51中。
方法概述:理念是生成只有片段的两端都含有在原始基因组DNA中未被甲基化的限制位点才能形成的小片段的文库。所述片段具有附接有任选的独特标识符和任选的患者标识符序列的接头,所述接头现在能够连接产生片段多聚体,所述多聚体则是附加步骤和后续测序的底物。
变型3.2.1:(参见例如图51)。这种方法示出如何发现整个基因组的相邻HinP1I位点(GCGC)处的未甲基化。起始材料可为平均长度为约160bp的完整基因组DNA或cfDNA。将非连接端含有阻断的5’端的短接头连接至靶DNA上。用HinP1I裂解基因组DNA,以使DNA在未甲基化的HinP1I位点处断裂。将含有任选的独特标识符序列和任选的患者标识符序列的接头连接至这些新产生的补平HinP1I裂解端断行。这些新接头含有在其非连接侧的阻断的3’端或含硫代磷酸根的主链(在图51中示为****)。添加双链3’核酸外切酶(即核酸外切酶III)后,一侧或两侧含原始短接头的片段将被消化并变成单链。只有具有连接至两侧的新接头的片段仍将为双链,因为3’阻断基团或硫代磷酸根抑制3’核酸外切酶消化。使含有剩余接头的片段的游离端变成可连接,方式为(i)使5’端磷酸化,(ii)移除阻断的3’基团,或(iii)利用5’-核酸酶活性裂解匹配的5’-重叠碱基或侧翼,留下可连接的5’-磷酸根或其任何组合。连接条件经设计以利于多聚化,例如通过使用拥挤试剂(即20%PEG)和/或通过混合两组连接产物,其中第一组的非回文5’接头悬突与第二组的非回文5’接头悬突互补。连接产物由最初在靶DNA中未被甲基化且具有任选的独特标识符和/或患者标识符序列的相邻HinP1I序列组成。这个产物适用于任选的附加步骤和后续测序。
用于产生相邻甲基敏感性限制位点处的甲基化状态的数据库的详细方案:
3.2.1a.连接在非连接端的5’端被阻断的接头上。用T4聚合酶和T4激酶修复靶端,随后用克列诺(外-)和dATP产生单碱基3’A悬突。接头具有单碱基3’T悬突,使得用T4连接酶的连接将接头附接在片段两端。用一种或多种甲基敏感性酶(AciI、HinP1I、Hpy99I和HpyCH4IV)裂解分离的基因组DNA或富含甲基的DNA。在这个实施例中,使用HinP1I。任选地,加热杀死核酸内切酶(65℃持续15分钟)。
3.2.1.b.添加HinP1I以裂解含此类位点的产物。当用HinP1I裂解时,只有含有在原始靶标中未被甲基化的相邻HinP1I位点(GCGC)的靶标将产生两端未阻断的片段(即对于接头来说是可连接的)。来自Taq聚合酶的残余聚合酶将补平2-碱基悬突(任选地将温度升至60℃)。移除dNTP(经由离心柱),并只回添dATP以产生单碱基3’A悬突。
3.2.1.c.使用T4连接酶,使连接端具有单碱基3’T悬突的接头(含有任选的独特标识符序列和任选的患者标识符序列)附接至裂解并补平的靶序列的单碱基A悬突。接头的5’非连接侧含有5’悬突,且任选地未被磷酸化。接头的3’非连接侧含有3’阻断基团和/或硫代磷酸根以抑制3’核酸外切酶消化。
3.2.1.d.添加3’核酸外切酶(即核酸外切酶III)并在37℃下消化。一侧或两侧含原始短接头的片段将被消化并变成单链。只有新接头连接至两侧的片段仍将为双链。核酸外切酶也将使接头成为单链。任选地,用离心柱移除所需片段的消化产物。
3.2.1.1.e.使含有剩余接头的片段的游离端变成可连接的,方式为(i)使用T4激酶使5’端磷酸化,(ii)移除阻断的3’基团,或(iii)利用Taq聚合酶的5’->3’核酸酶活性裂解匹配的5’-重叠碱基或侧翼,留下可连接的5’-磷酸根或其任何组合。连接条件经设计以利于多聚化。连接产物由具有最初在靶DNA中被甲基化且具有任选的独特标识符和/或患者标识符序列的相邻HinP1I序列的靶片段的多聚体组成。这个产物适用于任选的附加步骤和后续测序。
注释:1:阻断的接头的3’端可经合成以在阻断内部位置处含有尿嘧啶或脱嘌呤(AP)位点,并在用UDG和AP核酸内切酶处理后释放可连接的3’端。
注释2:可使用Fen核酸酶代替具有5’-3’核酸酶活性的聚合酶以在靶标的5’侧产生可连接的5’磷酸根。
注释3:连接将有利于形成多聚体,方式是通过使用拥挤试剂(即20%PEG)和/或通过混合两组连接产物,其中第一组的非回文5’接头悬突与第二组的非回文5’接头悬突互补。
注释4.可使用相同方法鉴定启动子区域被甲基化的区域(参见例如,图52)。用甲基敏感性酶(AciI、HinP1I、Hpy99I和HpyCH4IV)的混合物裂解分离的cfDNA,并连接在具有阻断的5’端的短接头上。然后用甲基不敏感性酶(HaeIII和MspI)裂解靶标。此图中示出AciI和HaeIII。从甲基敏感性限制性核酸内切酶裂解存活下来的链是此区域的甲基化标记。当用HaeIII裂解时,只有原始靶标中具有甲基化AciI位点的相邻HaeIII位点(GGCC)才产生未阻断的片段。更长接头的后续连接如上所述。当对连接产物使用直接SMRT测序时,可确定原始模板DNA的甲基化状态。
检测启动子区域中的未甲基化相邻位点
可能所需测定启动子区域中的两个甲基敏感限制位点之间的CpG序列的未甲基化状态。这与以上方法类似,且包括额外的亚硫酸氢盐步骤。
方法综述:理念是忠实拷贝在目标区域的相邻限制位点未被甲基化的靶DNA的每个片段,用亚硫酸氢盐处理,附接独特标识符序列、任选的引物结合序列和任选的患者标识符,并使它们成环,以进行随后的测序。使寡核苷酸DNA链成环并测序。这种方法提供以下优点:获得拷贝数信息(需要时),以及以所需的最少测序获得未甲基化数据。
变型3.3:(参见例如,图53和54)。在这个变型中,用HinP1I(或其它甲基化敏感性限制性核酸内切酶)裂解DNA,以产生可连接的3’端和5’端。然后用亚硫酸氢盐处理DNA,这使得这些链不互补,所以它们变成单链。为捕获所需未甲基化区域,包含与靶标的5’侧的序列互补的5’探针区域、独特标识符序列、任选的引物结合序列、任选的患者标识符序列和与靶标的3’侧的序列互补的3’探针区域的寡核苷酸探针与靶标杂交。添加缺乏链置换活性及3’->5’和5’->3’核酸酶活性的连接酶和聚合酶能够延伸未甲基化的靶标的3’端,然后连接至所述靶标的5’端,以形成含独特标识符序列、任选的患者标识符序列和任选的引物结合位点的环状产物。未连接的产物通过核酸外切酶消化来消除。这个环状产物适用于任选的附加步骤和后续测序。
通过坚持使用限制性核酸内切酶产生3’OH和5’磷酸根,这避免了错误信号,且还应去除任何非特异性连接信号。因此,基因组DNA的在纯化后为单链或不被裂解的任何罕见片段将不会形成生产性底物,且将被核酸外切酶处理步骤破坏。
启动子未甲基化的高灵敏度检测的详细方案:
3.3.a.用一种或多种甲基敏感性酶(AciI、HinP1I、Hpy99I和HpyCH4IV)裂解分离的cfDNA。这个实施例描述HinP1I。加热杀死核酸内切酶(65℃持续15分钟),并使DNA变性(94℃1分钟)。cfDNA与亚硫酸氢盐孵育,将常规C而不是甲基-C转化为U。亚硫酸氢盐处理使上链和下链发生不同转化,使得在处理后,所述链将不再彼此互补,且解开链。
3.3.b.使靶DNA在寡核苷酸(包含与靶标的5’侧的序列互补的5’探针区域、独特标识符序列、任选的患者标识符序列、任选的引物结合位点和与靶标的3’侧序列互补的3’探针区域)存在下变性(94℃1分钟,如果需要),并通过冷却至所需温度(例如50℃-60℃持续2小时)使寡核苷酸与它们在所需片段上的互补区域杂交。添加KlenTaq(缺乏核酸酶活性的Taq聚合酶)和热稳定连接酶(优选来自菌株AK16D)、dNTP,以允许在50℃下延伸和连接,并任选地升高温度(例如60℃),以确保完成延伸和连接,以产生环状产物。
3.3.c.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下由甲基化的DNA的拷贝、独特标识符序列和任选的患者标识符序列组成的所需单链环状DNA。这个环状产物适用于任选的附加步骤和后续测序。
注释1.寡核苷酸可缺乏5’磷酸根,或在5’侧含有任选的阻断基团,使得寡核苷酸的5’端不适用于连接。
注释2.以上实施例使用KlenTaq,一种缺乏链置换活性以及3’->5’和5’->3’核酸酶活性的聚合酶。如果寡核苷酸在5’侧具有阻断基团,那么可以使用具有5’->3’核酸酶活性的聚合酶。
注释3.环状产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶),以产生所需序列的串联重复,随后在共价闭合模板上利用下一代测序或可替代地直接SMRT测序,使用引物结合序列作为引物结合位点识别靶标。
注释4.如果寡核苷酸还包含任选的引物结合位点(即通用引物结合位点),其将适用于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
在变型3.3中,使用聚合酶和连接酶形成含有独特标识符序列、任选的患者标识符序列和任选的引物结合位点的共价闭合环。这也可以只使用连接酶完成。
变型3.4:(参见例如,图55和56)。在这个变型中,用HinP1I(或其它甲基化敏感性限制性核酸内切酶)裂解DNA,以产生可连接的3’端和5’端,随后进行亚硫酸氢盐处理。为捕获所需未甲基化的区域,部分双链寡核苷酸对与靶标杂交,所述部分双链寡核苷酸对包含具有与靶标的5’侧序列互补的5’探针区域、任选的引物结合序列、任选的患者标识符序列和与靶标的3’侧序列互补的3’探针区域的第一寡核苷酸探针,以及包含与所述第一探针互补的5’区域、独特标识符序列和与所述第一探针互补的3’区域的第二寡核苷酸探针。添加连接酶允许靶标的3’端连接至第二寡核苷酸探针的5’端,且允许靶标的5’端连接至第二寡核苷酸探针的3’端,以形成含有独特标识符序列、任选的患者标识符序列和任选的引物结合位点的环状产物。未连接的产物通过核酸外切酶消化来消除。这个环状产物适用于任选的附加步骤和后续测序。
通过坚持使用限制性核酸内切酶产生3’OH和5’磷酸根,这避免了错误信号,且还应去除任何非特异性连接信号。因此,基因组DNA的在纯化后为单链或不被裂解的任何罕见片段将不会形成生产性底物,且将被核酸外切酶处理步骤破坏。
启动子未甲基化的高灵敏度检测的详细方案
3.4.a.用一种或多种甲基敏感性酶(AciI、HinP1I、Hpy99I和HpyCH4IV)裂解分离的cfDNA。这个实施例使用HinP1I。加热杀死核酸内切酶(65℃持续15分钟),并使DNA变性(94℃1分钟)。cfDNA与亚硫酸氢盐孵育,将常规C而不是甲基-C转化为U。亚硫酸氢盐处理使上链和下链发生不同转化,使得在处理后,所述链将不再彼此互补,且解开链。
3.4.b.使靶DNA在部分双链寡核苷酸对(包含具有与靶标的5’侧序列互补的5’探针区域、任选的引物结合序列、任选的患者标识符序列和与靶标的3’侧序列互补的3’探针区域的第一寡核苷酸探针,以及包含与所述第一链互补的5’区域、独特标识符序列和与所述第一链互补的3’区域的第二寡核苷酸探针)存在下变性(94℃1分钟),并允许寡核苷酸通过冷却至所需温度(例如50℃-60℃持续2小时)与所需片段上的互补区域杂交。添加热稳定连接酶(优选来自菌株AK16D),以允许在60℃下连接产生环状产物。
3.4.c.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下由甲基化DNA的拷贝、独特标识符序列和任选的患者标识符序列组成的所需单链环状DNA。这个环状产物适用于任选的附加步骤和后续测序。
注释1.环状产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶),以产生所需序列的串联重复,随后在共价闭合模板上利用下一代测序或可替代地直接SMRT测序,使用引物结合序列作为引物结合位点识别靶标。当使用直接SMRT测序时,可直接确定原始模板DNA失去甲基化状态。
注释2.如果寡核苷酸还包含任选的引物结合位点(即通用引物结合位点),其将适用于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
相邻甲基敏感性限制位点处未甲基化状态的数据库.
当前TCGA数据库含有关于许多不同组织位置的人类基因组上的约450,000个CpG位点的甲基化状态的信息,正常信息和肿瘤信息。然而,它并未涵盖相邻HinP1I位点和这些位点间的CpG位点的所有未甲基化状态,也不会区分同一条基因组DNA上的两个位点都未被甲基化。
因此,为使以上测定方法最有用,创建相邻甲基敏感性限制位点处的未甲基化状态的数据库将是有帮助的。一种这样的方法示出在图57中。
方法综述:理念是生成只有片段的两端都含有在原始基因组DNA中未被甲基化的限制位点才能形成的小片段的文库。所述片段具有附接有任选的独特标识符和任选的患者标识符序列的接头,所述接头现在能够连接产生片段多聚体,然后用亚硫酸氢盐处理,以显露甲基化或未甲基化的位置,所述多聚体则是附加步骤和后续测序的底物。
变型3.4.1:(参见例如图57)。这种方法示出如何发现整个基因组的相邻HinP1I位点(GCGC)处的未甲基化。起始材料可为平均长度为约160bp的完整基因组DNA或cfDNA。将非连接端处含有阻断的5’端的短接头连接至靶DNA上。用HinP1I裂解基因组DNA,以使DNA在未甲基化的HinP1I位点处断裂。将含有任选的独特标识符序列和任选的患者标识符序列的接头连接至这些新产生的补平HinP1I裂解端上。这些新接头含有在其非连接侧的阻断的3’端或含硫代磷酸根的主链(在图57中示为****)。添加双链3’核酸外切酶(即核酸外切酶III)后,一侧或两侧含原始短接头的片段将被消化并变成单链。只有具有连接至两侧的新接头的片段仍将为双链,因为3’阻断基团或硫代磷酸根抑制3’核酸外切酶消化。使含有剩余接头的片段的游离端变成可连接,方式为(i)使5’端磷酸化,(ii)移除阻断的3’基团,或(iii)利用5’-核酸酶活性裂解匹配的5’-重叠碱基或侧翼,留下可连接的5’-磷酸或其任何组合。连接条件经设计以利于多聚化,例如通过使用拥挤试剂(即20%PEG)和/或通过混合两组连接产物,其中第一组的非回文5’接头悬突与第二组的非回文5’接头悬突互补。连接产物由最初在靶DNA中未被甲基化且具有任选的独特标识符和/或患者标识符序列的相邻HinP1I序列组成。然后产物与亚硫酸氢盐孵育,将常规C而不是甲基-C转化为U。亚硫酸氢盐处理使上链和下链发生不同转化,使得在处理后,所述链将不再彼此互补,且解开链。这些单链产物适用于任选的附加步骤和后续测序。
用于产生相邻甲基敏感性限制位点处的甲基化状态的数据库的详细方案:
3.4.1a.连接在非连接端的5’端被阻断的接头上。用T4聚合酶和T4激酶修复靶端,随后用克列诺(外-)和dATP产生单碱基3’A悬突。接头具有单碱基3’T悬突,使得用T4连接酶的连接将接头附接在片段两端。用一种或多种甲基敏感性酶(AciI、HinP1I、Hpy99I和HpyCH4IV)裂解分离的基因组DNA或富含甲基的DNA。在这个实施例中,使用HinP1I。任选地,加热杀死核酸内切酶(65℃持续15分钟)。
3.4.1.b.添加HinP1I以裂解含此类位点的产物。当用HinP1I裂解时,只有含有在原始靶标中未被甲基化的相邻HinP1I位点(GCGC)的靶标将产生两端未阻断的片段(即对于接头来说是可连接的)。来自Taq聚合酶的残余聚合酶将补平2-碱基悬突(任选地将温度升至60℃)。移除dNTP(经由离心柱),只回添dATP以产生单碱基3’A悬突。
3.4.1.c.使用T4连接酶,使连接端具有单碱基3’T悬突的接头(含有任选的独特标识符序列和任选的患者标识符序列)附接至裂解并补平的靶标序列的单碱基A悬突。接头的5’非连接侧含有5’悬突,且任选地未被磷酸化。接头的3’非连接侧含有3’阻断基团和/或硫代磷酸根以抑制3’核酸外切酶消化。
3.4.1.d.添加3’核酸外切酶(即核酸外切酶III)并在37℃下消化。一侧或两侧含原始短接头的片段将被消化并变成单链。只有新接头连接至两侧的片段仍将为双链。核酸外切酶也将使接头成为单链。任选地,用离心柱移除所需片段的消化产物。
3.4.1.1.e.使含有剩余接头的片段的游离端变成可连接的,方式为(i)使用T4激酶使5’端磷酸化,(ii)移除阻断的3’基团,或(iii)利用Taq聚合酶的5’->3’核酸酶活性裂解匹配的5’-重叠碱基或侧翼,留下可连接的5’-磷酸根或其任何组合。连接条件经设计以利于多聚化。连接产物由具有最初在靶DNA中被甲基化且具有任选的独特标识符和/或患者标识符序列的相邻HinP1I序列的靶片段的多聚体组成。连接产物与亚硫酸氢盐孵育,将常规C而不是甲基-C转化为U。亚硫酸氢盐处理使上链和下链发生不同转化,使得在处理后,这些链将不再彼此互补,且解开链。这些单链产物适用于任选的附加步骤和后续测序。
注释:1:更长阻断接头的3’端可经合成以在阻断内部位置处含有尿嘧啶或脱嘌呤(AP)位点,并在用UDG和AP核酸内切酶处理后释放可连接的3’端。另外,这些接头可经合成具有5-甲基C,使得在用亚硫酸氢盐处理后,它们保持原始状态。
注释2:可使用Fen核酸酶代替具有5’-3’核酸酶活性的聚合酶以在靶标的5’侧产生可连接的5’磷酸根。
注释3:连接将有利于形成多聚体,方式是通过使用拥挤试剂(即20%PEG)和/或通过混合两组连接产物,其中第一组的非回文5’接头悬突与第二组的非回文5’接头悬突互补。
检测给定区域内的个别CpG位点的未甲基化状态
以上方法对于识别和枚举含有相邻未甲基化的HinP1I位点作为此DNA片段内的未甲基化替代品的片段是理想的。然而,对于一些应用,重要的是识别给定区域内的个别CpG位点的未甲基化状态。因此,可能有必要用亚硫酸氢盐处理输入DNA,将常规C而不是甲基-C转化为U。
利用亚硫酸氢盐的方法概述:理念是忠实拷贝在目标区域的在序列的相邻HphI限制位点(GGTGA)处未被甲基化的靶DNA的每个片段,用亚硫酸氢盐处理(将GGCGA转化为GGTGA),附接独特标识符序列、任选的引物结合序列和任选的患者标识符,并使它们成环,以进行随后的测序。使寡核苷酸DNA链成环并测序。这种方法提供以下优点:获得拷贝数信息(需要时),以及以所需的最少测序获得甲基化数据。
所述理念利用识别序列对HphI的独特性质。所述酶裂解一个方向上的4.5碱基识别序列GGTGA,和另一方向上的TCACC。如果用亚硫酸氢盐在第一方向上处理未甲基化的GGCGA位点,所述位点将变成HphI识别序列GGTGA。几轮PCR扩增后,5-甲基C被转化为C,而U被转化为T。当用HphI裂解时,只有原始靶标中的未甲基化的相邻位点将产生3’端和5’端都是可连接的片段。
这种方法的一个独特特征在于亚硫酸氢盐转化产生两条非互补链。因此,上链将具有相邻的GGCGA或GGTGA序列,且即使存在间插TCACC序列也无关紧要,因为它被转化为TUAUU,其不被认为是HphI位点。甚至更好地,形式TCGCC的上链上的序列将为下链上的GGCGA。下链也可以用于询问甲基化状态,且因为两条序列现在极为不同,上链和下链的寡核苷酸探针将不会彼此杂交,只会与转化的靶标杂交。因此,这种方法允许利用上链和下链的信息获得关于启动子的详细甲基化状态。
用亚硫酸氢盐处理DNA以将未甲基化DNA转化为可被限制性酶裂解的序列(但如果被甲基化,它不可被相同限制性酶裂解)的原理可扩展至一些附加限制位点。例如,序列CCGTC将被转化为BccI位点(CCATC),只要内部CG不被甲基化。(这是由相反链即GACGG转化为BccI的相反链识别序列;即GATGG造成的)。同样,序列GGACG将被转化为FokI位点(GGATG),只要内部CG不被甲基化。因此,下文针对HphI考虑的变型同样有效,但不限于限制性核酸内切酶BccI、FokI和它们的同裂酶。
变型3.5:(参见例如,图58和59)。在这个变型中,将含5-甲基C的短接头连接至DNA末端上。然后用亚硫酸氢盐处理DNA,这使得这些链不互补,所以它们变成单链。几轮PCR扩增产生现在在HphI位点处未甲基化的产物。然后用HphI裂解这些产物。只有含有在原始靶标中未被甲基化的相邻“HphI”位点(GGCGA或GGTGA)的PCR扩增子将产生现在在两端可连接的片段。为捕获所需区域,包含与靶标的5’侧序列互补的5’探针区域、独特标识符序列、任选的引物结合序列、任选的患者标识符序列和与靶标的3’侧序列互补的3’探针区域的寡核苷酸探针与靶标杂交。添加缺乏链置换活性及3’->5’和5’->3’核酸酶活性的连接酶和聚合酶能够延伸未甲基化的靶标的3’端,然后连接至所述靶标的5’端,以形成含独特标识符序列、任选的患者标识符序列和任选的引物结合位点的环状产物。未连接的产物通过核酸外切酶消化来消除。这个环状产物适用于任选的附加步骤和后续测序。
通过坚持使用限制性核酸内切酶产生3’OH和5’磷酸根,这避免了错误信号,且还应去除任何非特异性连接信号。因此,基因组DNA的在纯化后为单链或不被裂解的任何罕见片段将不会形成生产性底物,且将被核酸外切酶处理步骤破坏。
启动子未甲基化的高灵敏度检测的详细方案:
3.5.a.连接在含有5-甲基C的接头上,以在亚硫酸氢盐转化后保留序列。用T4聚合酶和T4激酶修复靶端,随后用克列诺(外-)和dATP产生单碱基3’A悬突。接头具有单碱基3’T悬突,使得用T4连接酶的连接将接头附接在片段两端。cfDNA与亚硫酸氢盐孵育,将常规C而不是甲基-C转化为U。亚硫酸氢盐处理使上链和下链发生不同转化,使得在处理后,这些链将不再彼此互补,且解开链。
3.5.b.添加引物、Taq聚合酶和dNTP,并进行几个PCR循环,以产生在剩余HphI位点处现在未甲基化的产物。
3.5.c.添加HphI以裂解含此类位点的产物。当用HphI裂解时,只有含有在原始靶标中未被甲基化的相邻HphI位点(GGCGA或GGTGA)的PCR扩增子将产生两端未阻断的片段(即对于接头来说是可连接的)。
3.5.d.使靶DNA在寡核苷酸(包含与靶标的5’侧序列互补的5’探针区域、独特标识符序列、任选的患者标识符序列、任选的引物结合位点和与靶标的3’侧序列互补的3’探针区域)存在下变性(94℃1分钟),并通过冷却至所需温度(例如50℃-60℃持续2小时)使寡核苷酸与它们在所需片段上的互补区域杂交。添加KlenTaq(缺乏核酸酶活性的Taq聚合酶)和热稳定连接酶(优选来自菌株AK16D)、dNTP,以允许在50℃下延伸和连接,并任选地升高温度(例如60℃),以确保完成延伸和连接,以产生环状产物。
3.5.e.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下由甲基化DNA的拷贝、独特标识符序列和任选的患者标识符序列组成的所需单链环状DNA。这个环状产物适用于任选的附加步骤和后续测序。
注释1.寡核苷酸可缺乏5’磷酸根,或在5’侧含有任选的阻断基团,使得寡核苷酸的5’端不适用于连接。
注释2.以上实施例使用KlenTaq,一种缺乏链置换活性以及3’->5’和5’->3’核酸酶活性的聚合酶。如果寡核苷酸在5’侧具有阻断基团,那么可以使用具有5’->3’核酸酶活性的聚合酶。
注释3.环状产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶),以产生所需序列的串联重复,随后在共价闭合模板上利用下一代测序或可替代地直接SMRT测序,使用引物结合序列作为引物结合位点识别靶标。
注释4.如果寡核苷酸探针还包含任选的引物结合位点(即通用引物结合位点),其将适用于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
在变型3.5中,使用聚合酶和连接酶形成含有独特标识符序列、任选的患者标识符序列和任选的引物结合位点的共价闭合环。这也可以只使用连接酶完成。
变型3.6:(参见例如,图60和61)。在这个变型中,将含5-甲基C的短接头连接至DNA末端上。然后用亚硫酸氢盐处理DNA,这使得这些链不互补,所以它们变成单链。几轮PCR扩增产生现在在HphI位点处未甲基化的产物。然后用HphI裂解这些产物。只有含有在原始靶标中未被甲基化的相邻“HphI”位点(GGCGA或GGTGA)的PCR扩增子将产生现在两端可连接的片段。为捕获所需未甲基化区域,部分双链寡核苷酸对与靶标杂交,所述部分双链寡核苷酸对包含具有与靶标的5’侧序列互补的5’探针区域、任选的引物结合序列、任选的患者标识符序列和与靶标的3’侧序列互补的3’探针区域的第一寡核苷酸探针,以及包含与所述第一链互补的5’区域、独特标识符序列和与所述第一链互补的3’区域的第二寡核苷酸探针。添加连接酶允许靶标的3’端连接至第二寡核苷酸探针的5’端,且允许靶标的5’端连接至第二寡核苷酸探针的3’端,以形成含有独特标识符序列、任选的患者标识符序列和任选的引物结合位点的环状产物。未连接的产物通过核酸外切酶消化来消除。这个环状产物适用于任选的附加步骤和后续测序。
通过坚持使用限制性核酸内切酶产生3’OH和5’磷酸根,这避免了错误信号,且还应去除任何非特异性连接信号。因此,基因组DNA的在纯化后为单链或不被裂解的任何罕见片段将不会形成生产性底物,且将被核酸外切酶处理步骤破坏。
启动子未甲基化的高灵敏度检测的详细方案:
3.6.a.连接在含有5-甲基C的接头上,以在亚硫酸氢盐转化后保留序列。用T4聚合酶和T4激酶修复靶端,随后用克列诺(外-)和dATP产生单碱基3’A悬突。接头具有单碱基3’T悬突,使得用T4连接酶的连接将接头附接在片段两端。cfDNA与亚硫酸氢盐孵育,将常规C而不是甲基-C转化为U。亚硫酸氢盐处理使上链和下链发生不同转化,使得在处理后,这些链将不再彼此互补,且解开链。
3.6.b.添加引物、Taq聚合酶和dNTP,并进行几个PCR循环,以产生在剩余HphI位点处现在未甲基化的产物。
3.6.c.添加HphI以裂解含此类位点的产物。当用HphI裂解时,只有含有在原始靶标中未被甲基化的相邻HphI位点(GGCGA或GGTGA)的PCR扩增子将产生两端未阻断的片段(即对于接头来说是可连接的)。
3.6.d.使靶DNA在部分双链寡核苷酸对(包含具有与靶标的5’侧序列互补的5’探针区域、任选的引物结合序列、任选的患者标识符序列和与靶标的3’侧序列互补的3’探针区域的第一寡核苷酸探针,以及包含与所述第一链互补的5’区域、独特标识符序列和与所述第一链互补的3’区域的第二寡核苷酸探针)存在下变性(94℃1分钟),并允许寡核苷酸通过冷却至所需温度(例如50℃-60℃持续2小时)与所需片段上的互补区域杂交。添加热稳定连接酶(优选来自菌株AK16D),以允许在60℃下连接产生环状产物。
3.6.e.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下由甲基化DNA的拷贝、独特标识符序列和任选的患者标识符序列组成的所需单链环状DNA。这个环状产物适用于任选的附加步骤和后续测序。
注释1.环状产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶),以产生所需序列的串联重复,随后在共价闭合模板上利用下一代测序或可替代地直接SMRT测序,使用引物结合序列作为引物结合位点识别靶标。
注释2.如果寡核苷酸探针还包含任选的引物结合位点(即通用引物结合位点),其将适用于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
相邻HphI限制位点处甲基化状态的数据库
当前TCGA数据库含有关于许多不同组织位置的人类基因组上的约450,000个CpG位点的甲基化状态的信息,正常信息和肿瘤信息。然而,它并未涵盖相邻AciI位点的所有未甲基化状态,也不会区分同一条基因组DNA上的两个位点都被甲基化。
因此,为使以上测定方法最有用,创建相同方向的相邻HphI限制位点(将GGCGA转化为GGTGA)处的甲基化状态的数据库将是有帮助的。这种方法也将包括另一方向的相邻HphI限制位点(TCACC和TCGCC),因为它们在亚硫酸氢盐转化后在相反链上将为GGTGA。一种这样的方法示出在图62中。
方法综述:理念是生成只有片段的两端都含有在原始基因组DNA中未被甲基化的被转化GGCGA(至GGTGA)才能形成的小片段的文库。所述理念利用识别序列对HphI的独特性质。所述酶裂解一个方向上的4.5碱基识别序列GGTGA,和另一方向上的TCACC。如果用亚硫酸氢盐在第一方向上处理未甲基化的GGCGA位点,所述位点将变成HphI识别序列GGTGA。几轮PCR扩增后,5-甲基C被转化为C,而U被转化为T。当用HphI裂解时,只有原始靶标中的未甲基化的相邻位点将产生3’端和5’端都可连接的片段。所述片段具有附接有任选的独特标识符和任选的患者标识符序列的接头,所述接头现在能够连接产生片段多聚体,所述多聚体则是附加步骤和后续测序的底物。
变型3.6.1:(参见例如图62)。在这个变型中,将含5-甲基C的短接头连接至DNA末端上。然后用亚硫酸氢盐处理DNA,这使得这些链不互补,所以它们变成单链。几轮PCR扩增产生现在在HphI位点处未甲基化的产物。然后用HphI裂解这些产物。只有含有在原始靶标中未被甲基化的相邻“HphI”位点(GGCGA或GGTGA)的PCR扩增子将产生现在两端可连接的片段。为捕获所需区域,包含与靶标的5’侧序列互补的5’探针区域、独特标识符序列、任选的引物结合序列、任选的患者标识符序列和与靶标的3’侧序列互补的3’探针区域的寡核苷酸与靶标杂交。添加缺乏链置换活性及3’->5’和5’->3’核酸酶活性的连接酶和聚合酶能够延伸未甲基化靶标的3’端,然后连接至所述靶标的5’端,以形成含独特标识符序列、任选的患者标识符序列和任选的引物结合位点的环状产物。未连接的产物通过核酸外切酶消化来消除。这个环状产物适用于任选的附加步骤和后续测序。
变型3.6.1:(参见例如图62)。这种方法示出如何发现整个基因组的相邻“HphI”位点(GGCGA或GGTGA)处的未甲基化。起始材料可为平均长度为约160bp的完整基因组DNA或cfDNA。将非连接端处含有阻断的5’端的短接头连接至DNA末端上。亚硫酸氢盐处理DNA,将常规C但非甲基-C转化为U。使用未甲基化的dNTP和5’阻断的引物进行几轮PCR扩增产生现在在剩余的HphI位点处未甲基化的产物。然后用HphI裂解这些产物。当用HphI裂解时,只有含有在原始靶标中未被甲基化的相邻HphI位点(GGCGA和GGTGA)的PCR扩增子将产生两端未阻断的片段(即对于接头来说是可连接的)。将含有任选的独特标识符序列和任选的患者标识符序列的接头连接至这些新产生的HphI裂解端上。这些新接头含有在其非连接侧处的阻断的3’端或含硫代磷酸根的主链(在图62中示为****)。添加双链3’核酸外切酶(即核酸外切酶III)后,一侧或两侧含原始短接头的片段将被消化并变成单链。只有具有连接至两侧的新接头的片段仍将为双链,因为3’阻断基团或硫代磷酸根抑制3’核酸外切酶消化。使含有剩余接头的片段的游离端变成可连接的,方式为(i)使5’端磷酸化,(ii)移除阻断的3’基团,或(iii)利用5’-核酸酶,或其任何组合。连接条件经设计以利于多聚化,例如通过使用拥挤试剂(即20%PEG)和/或通过混合两组连接产物,其中第一组的非回文5’接头悬突与第二组的非回文5’接头悬突互补。连接产物由最初在靶DNA中被甲基化且具有任选的独特标识符和/或患者标识符序列的相同方向的相邻AciI序列(即GCGG)组成。这个产物适用于任选的附加步骤和后续测序。
用于产生相邻“HphI”限制位点处的未甲基化状态的数据库的详细方案:
3.6.1.a.连接在非连接端的5’端被阻断的接头上。用T4聚合酶和T4激酶修复靶端,随后用克列诺(外-)和dATP产生单碱基3’A悬突。接头具有单碱基3’T悬突,使得用T4连接酶的连接将接头附接在片段两端。cfDNA与亚硫酸氢盐孵育,将常规C而不是甲基-C转化为U。亚硫酸氢盐处理使上链和下链发生不同转化,使得在处理后,所述链将不再彼此互补,且解开链。
3.6.1.b.添加5’阻断的引物、Taq聚合酶和dNTP,并进行几个PCR循环,以产生在剩余HphI位点处现在未甲基化的产物。
3.6.1.c.添加HphI以裂解含此类位点的产物。当用HphI裂解时,只有含有在原始靶标中未被甲基化的相邻HphI位点(GGCGA或GGTGA)的PCR扩增子将产生两端未阻断的片段(即对于接头来说是可连接的)。用T4聚合酶和T4激酶修复靶末端。移除dNTP(经由离心柱),只回添dATP以产生单碱基3’A悬突。
3.6.1.d.使用T4连接酶,使连接端具有单碱基3’T悬突的接头(含有任选的独特标识符序列和任选的患者标识符序列)附接至裂解并补平的靶序列的单碱基A悬突。接头的5’非连接侧含有5’悬突,且任选地未被磷酸化。接头的3’非连接侧含有3’阻断基团和/或硫代磷酸根以抑制3’核酸外切酶消化。
3.6.1.e.添加3’核酸外切酶(即核酸外切酶III)并在37℃下消化。一侧或两侧含原始短接头的片段将被消化并变成单链。只有新接头连接至两侧的片段仍将为双链。核酸外切酶也将使接头成为单链。任选地,用离心柱移除所需片段的消化产物。
3.6.1.f.使含有剩余接头的片段的游离端变成可连接,方式为(i)使用T4激酶使5’端磷酸化,(ii)移除阻断的3’基团,或(iii)利用Taq聚合酶的5’->3’核酸酶活性裂解匹配的5’-重叠碱基或侧翼,留下可连接的5’-磷酸根或其任何组合。连接条件经设计以利于多聚化。连接产物由具有最初在靶DNA中被甲基化且具有任选的独特标识符和/或患者标识符序列的相邻AciI序列的靶片段的多聚体组成。这个产物适用于任选的附加步骤和后续测序。
注释:1:阻断的接头的3’端可经合成以在阻断内部位置处含有尿嘧啶或脱嘌呤(AP)位点,并在用UDG和AP核酸内切酶处理后释放可连接的3’端。
注释2:可使用Fen核酸酶代替具有5’-3’核酸酶活性的聚合酶以在靶标的5’侧产生可连接的5’磷酸根。
注释3:连接将有利于形成多聚体,方式是通过使用拥挤试剂(即20%PEG)和/或通过混合两组连接产物,其中第一组的非回文5’接头悬突与第二组的非回文5’接头悬突互补。
预测性实施例4-精确量化从循环肿瘤细胞分离的DNA中的肿瘤特异性拷贝变化。
肿瘤DNA的拷贝变化可以是强结果预测因子。在过去几年中,大多数拷贝数工作是在SNP芯片上执行的,其中生物信息学方法求取某一区域上的信号平均值,以测定相对拷贝数。对于低细胞数量,使用数字PCR方法获得起始分子的精确计数。
方法综述:一般来讲,拷贝变化出现在DNA的大型区域,诸如染色体臂。因为存在极少数量的肿瘤细胞,可通过同时询问给定染色体臂的多个区域,并加和所得信号或求取其平均数来提高精确度。同样,在一些肿瘤中扩增特定基因(即Her2-neu,IGF2),这样可预测结果或指导疗法。
除拷贝变化以外,丧失杂合性后不仅可对染色体计数,还可以寻找传统上在多态SNP内丧失杂合性或在目标区域内的标记物。最异源性标记物在重复序列中。本文中示出利用四核苷酸重复序列的概念,尽管也可以考虑三-和二-核苷酸重复序列。
下一章节中将提出用于量化从循环肿瘤细胞分离的DNA的肿瘤特异性拷贝变化的详细方案,所述方案给来自循环肿瘤细胞的突变评分,因为总体方法极其类似。
预测性实施例5-检测从循环肿瘤细胞分离的DNA或cfDNA中的突变
循环肿瘤细胞提供浓缩含突变的DNA的优势,所以不再需要寻找过量野生型序列中的低水平突变。然而,因为有少量起始DNA分子,重要的是精确地扩增所有区域,并核实真实地存在的突变。
方法综述:本文的方法类似于如上文所述的寻找已知的常见点突变,或测定数个外显子序列的方法。然而,当处理少量输入DNA时,可能存在聚合酶错误。这个问题通过使用环形测序或SMRT测序解决。
因为DNA是从几个捕获的肿瘤细胞获得,如果存在突变,那么其应该存在于一些(如果不是大多数)捕获的细胞中。
下文描述了用于检测从循环肿瘤细胞分离的DNA中的突变的详细方案,包括量化拷贝数,因为所述方法极为类似。
变型5.1:(参见例如图63)。本文的总体理念是将所有cfDNA或CTC DNA转化为单链环,其中每个片段含有独特标识符序列、任选的患者标识符序列和任选的引物结合序列。一旦发生所述转化,现在环适用于进行原始测序,利用生物素化探针进行序列特异性捕获所需靶标,或适用于滚环扩增,并利用生物素化探针提高所需靶标的捕获。
在这个变型中,目标是捕获所有靶和非靶DNA序列,但不使用探针结合至靶标。将接头连接至DNA靶标(平均长度为约160个碱基的cfDNA)。为捕获所有序列,包含与接头的5’端互补的5’序列、独特标识符序列、任选的患者标识符序列、任选的引物结合序列和与接头的3’端互补的序列的寡核苷酸探针与靶标杂交。寡核苷酸可在一端(示出的5’端)含有任选的阻断基团。添加聚合酶允许寡核苷酸的3’端在靶标上延伸,以及允许3’端接头延伸通过独特标识符序列、任选的引物结合序列和任选的患者标识符序列,直到它与所述靶标上的5’接头毗邻。
接头的5’端可以设计得稍微更长,以使得一旦聚合酶延伸3’接头,其不正好延伸通过5’接头互补序列,直到其命中与5’探针区域杂交的5’靶部分。
这个变型要求寡核苷酸探针含有与3’和5’接头链互补的序列,那些序列只被约20-40个碱基分开。因为所述序列与接头链互补,进而互相互补,重要的是阻止寡核苷酸探针内的两条序列正好形成具有20-40个碱基环的内部发夹。一种解决方案是连接含有内部泡的接头,使得两个接头在接头连接所用的低温(16℃或甚至4℃,用T4连接酶)下保持双链性质。此外,5’接头可经设计以长于3’接头。最终,接头内互补性的区域可经设计以具有微弱错配(即G:T和T:G),其在互补寡核苷酸探针中较不稳定(即C:A和A:C),使得寡核苷酸探针不太可能在总体杂交温度(即40-50℃)下形成内部发夹。
靶标上寡核苷酸的3’端的延伸改善探针与靶标的缔合,且因此增加接头的3’端正确地与其互补序列杂交及通过聚合酶延伸的能力。聚合酶(或Fen核酸酶)的5’->3’核酸酶裂解活性裂解5’接头的匹配5’-重叠碱基,从而在接头上留下可连接的5’-磷酸根。聚合酶还延伸靶标上的寡核苷酸,且不裂解寡核苷酸的5’端上的阻断基团。
连接酶将延伸的3’端共价地密封至可连接的5’-磷酸根,以产生环状连接产物。阻断基团阻止寡核苷酸探针环化。任选地添加尿嘧啶-DNA糖基化酶(UDG)和甲酰胺基嘧啶-DNA糖基化酶(Fpg,也称为8-氧代鸟嘌呤DNA糖基化酶,其充当N-糖基化酶和AP-裂解酶)可以用于使含受损碱基的靶标缺口。随后添加核酸外切酶以消化所有未连接的或有缺口的产物,从而只留下由原始靶DNA和独特标识符序列组成的所需单链环状DNA。这个产物适用于利用生物素化探针序列特异性地捕获所需靶标,其与滚环扩增和环形测序或直接SMRT测序结合。
这里的挑战是避免聚合酶在没有连接步骤(即缺口平移)的情况下以破坏5’接头的方式延伸3’接头。这可以通过在距离5’磷酸根端的第二位和第三位并入硫代磷酸根键实现(硫代磷酸根键将由聚合酶的5’->3’核酸酶活性释放)。因为聚合酶延伸一个碱基太多次(这将使得无法连接至下游引物),为使所述聚合酶最少置换那些碱基,连接结处的靶碱基将优选地在3’侧富含AT,且在5’侧富含GC。
替代方法是使用在毗邻所需5’磷酸根的位置处含有脱嘌呤(AP)位点的5’接头。使用热稳定EndoIII(例如Tma EndoIII)释放该5’磷酸根。当引物结合至靶标时,这种酶裂解留下5’磷酸根的AP位点。核酸内切酶也裂解单链引物,但效率更低,因此与模板杂交的引物将为优选的底物。当使用热稳定性EndoIII时,所用的PCR聚合酶将缺乏5’->3’核酸外切酶活性。
如上所述,缺口平移问题也可以如下最小化:通过使用具有和不具有5’->3’核酸酶裂解活性的聚合酶混合物(例如比例为1:20)在分配延伸条件下,在连接酶存在下,使得大多数延伸借助不具有核酸酶活性的聚合酶,直到需要具有核酸酶活性的聚合酶来产生可连接结,随后聚合酶解离和连接事件,以产生所需环状连接产物。
精确地量化从循环肿瘤细胞分离的DNA或cfDNA中的已知基因(例如Braf、K-ras、p53)中的肿瘤特异性拷贝变化或检测其突变的详细方案:
5.1.a.以cfDNA或从CTC分离的基因组DNA(剪切至约150bp)开始,用T4聚合酶和T4激酶修复末端,随后利用克列诺(外-)和dATP添加单碱基3’A悬突。接头具有单碱基3’T悬突,使得在4℃下用T4连接酶的连接将接头附接在片段两端。任选地,从未连接的接头纯化靶DNA。
5.1.b.使两端含接头的靶DNA在寡核苷酸探针(包含与接头的5’端互补的5’序列、独特标识符序列、任选的患者标识符序列、任选的引物结合序列和与接头的3’端互补的序列)存在下变性(94℃1分钟),并通过冷却至所需温度(例如40-50℃持续30分钟)使寡核苷酸探针与它们在所需片段上的互补区域杂交。寡核苷酸探针可在5’端含有任选的阻断基团。在退火步骤之后或在程序开始时添加Taq聚合酶和/或KlenTaq(缺乏核酸酶活性的Taq聚合酶)和热稳定连接酶(优选来自菌株AK16D)、dNTP。允许在杂交温度下延伸和连接,并任选地升高温度(例如60℃),以确保完成延伸和连接,以产生环状产物。
5.1.c.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下由原始靶DNA、接头序列、独特标识符序列、任选的引物结合序列和任选的患者标识符序列组成的所需单链环状DNA。这个产物适用于利用生物素化探针序列特异性捕获所需靶标或适用于滚环扩增(利用与引物结合序列互补的引物和phi-29聚合酶),以产生所需序列的串联重复,随后利用生物素化探针改善捕获所需靶标。此后可利用下一代测序或者可替代地直接SMRT测序在共价闭合模板上利用接头序列或任选的引物结合序列作为引物结合位点鉴定靶标。
注释1:寡核苷酸可在5’侧含有任选的阻断基团,以干扰聚合酶的后续5’-3’核酸酶活性,使得寡核苷酸探针不环化。
注释2:可使用Fen核酸酶替代具有5’-3’核酸酶活性的聚合酶,以在靶标的5’侧产生可连接的5’磷酸根。
注释3:5’端接头可经合成以在距离5’磷酸根端的第二位和第三位包含硫代磷酸根键(硫代磷酸根键将由聚合酶的5’->3’核酸酶活性释放)。因为聚合酶延伸一个碱基太多次(这将使得无法连接至下游引物),为使所述聚合酶最少置换那些碱基,连接结处的靶碱基将优选地在3’侧富含AT,且在5’侧富含GC。
注释:4:当使用KlenTaq聚合酶(没有5’->3’核酸酶裂解活性的Taq聚合酶)时,5’端接头可经合成以在毗邻所需5’磷酸根的位置处含有脱嘌呤(AP)位点。使用热稳定EndoIII(例如Tma EndoIII)释放该5’磷酸根。当引物结合至靶标时,这种酶裂解留下5’磷酸根的AP位点。核酸内切酶也裂解单链引物,但效率更低,因此与模板杂交的引物将为优选的底物。
注释5:当使用KlenTaq聚合酶(不具有5’->3’核酸酶裂解活性的Taq聚合酶)时,5’端接头可以经过合成以含有5’磷酸根。可替代地,可在连接至靶DNA之前或在连接步骤之后利用T4激酶添加5’磷酸根。
注释6:可以在分配延伸的条件(即,更高盐浓度)下使用Taq聚合酶(具有5’->3’核酸酶活性)和KlenTaq(没有5’->3’核酸酶裂解活性的Taq聚合酶)的1:20混合物,以使靶DNA由于缺口平移产生的降解最小化。
注释7:捕获靶标的串联重复拷贝(通过滚环扩增生成)提供多价结合以改善正确靶标的捕获的独特有点。这使得杂交/捕获条件更严格,导致更高捕获效率和更少捕获非所需序列。这种方法也可以用于捕获所有含重复序列(即AGAT四核苷酸重复)的靶标,允许给杂合性遗失、拷贝数变化、单体型分析、建立亲权(paternity)和其它应用评分。
注释8:独特序列标识符即使在滚环或其它选择/扩增步骤后,可以唯一地对每条原始靶序列进行评分,从而允许精确地量化每个靶标的原始拷贝数。
注释9:可在接头两侧添加独特标识符序列。如果未向靶DNA添加额外碱基(即跳过克列诺步骤),那么使用平端连接。为避免接头-至-接头连接,接头的平端未磷酸化。提供含有独特标识符和平端的接头的实例作为寡核苷酸iSx-201-MdAdT(上链)和iSx-202-MdLgAdB-bk(下链)(参见表1)。上链更长,从而在非连接侧上产生5’单链悬突。下链具有5’-OH,且任选地含有避免延伸的3’阻断基团,以及与上链的独特标识符序列配对时充当通用碱基的内部5-硝基吲哚基团。在连接平端接头后,将独特序列附接至双链DNA靶标的5’端,通过用聚合酶延伸3’端拷贝那些序列。任选地,上链含有后续用UDG和FPG裂解以释放5’磷酸根的dU碱基,适用于在后续步骤中连接和环化。接头iSx-201-MdAdT(参见表1)可含有毗邻新释放的5’磷酸根的任选的硫代磷酸根基团,以防止缺口平移和促进靶标与接头末端环化。
注释10:当设计与更长接头序列一起使用的寡核苷酸(包含与商用仪器一起使用的“条码”和“索引”序列)时,可以必要地使用PCR、链置换扩增或其组合来组装寡核苷酸。在PCR期间,使用dUTP替代TTP掺入尿嘧啶,适用于后续通过UDG裂解。反义链引物可经磷酸化,从而允许其利用λ核酸外切酶或类似的5’->3’核酸外切酶消化。dA30序列可以附接到正向引物的5’端,实现链置换扩增。用于组装适用于与以上接头一起使用的反向互补序列的寡核苷酸的实例为:iSx-204-bkA30-Lk-F2、iSx-205-r503-F3、iSx-206-d701-R4和iSx-207-Lk-R5(参见表1)。
注释11:在附接的另一变型中,可在接头的两侧添加独特标识符序列,一条链还包含与商业仪器一起使用的“条码”或“索引”序列(参见例如,图64)。通过分割接头与杂交寡核苷酸之间的长区域,可直接合成不同序列,并将长度保持在约100个碱基。提供含有索引或条码序列、独特标识符和平端的接头的实例作为寡核苷酸iSx-211-r702-LgAdT(上链)和iSx-202-MdLgAdB-bk(下链,与上面相同)(参见表1)。上链明显更长,从而在非连接侧上产生5’单链悬突。下链具有5’-OH,且任选地含有避免延伸的3’阻断基团,以及与上链的独特标识符序列配对时充当通用碱基的内部5-硝基吲哚基团。在连接平端接头后,将独特序列附接至双链DNA靶标的5’端,通过用聚合酶延伸3’端拷贝那些序列。任选地,上链含有后续用UDG和FPG裂解以释放5’磷酸根的dU碱基,适用于在后续步骤中连接和环化。桥接寡核苷酸iSx-212-r503-R4(参见表1)与含裂解的5’磷酸根的接头以及延伸的长3’端杂交,从而允许用聚合酶延伸,并用连接酶环化。
注释12:以利用以上引物和接头设计产生的上述产物,在簇或珠粒扩增或在商业仪器上捕获在流动池的孔、地址或表面后,可使用以下引物起始测序反应:(i)iLx-003-PEsqP1,成对末端测序引物1;(ii)iLx-004-BrCdR1,索引引物,条码读段1;(iii)iLx-001-P5-BrCdR2,条码读段2;和(iv)iLx-005-PEsqP2,成对末端测序引物2(下表1中提供的引物序列)。
以上程序使用具有5’OH的接头。变型5.2使用具有5’磷酸根的接头来避免一些与使用具有5’-3’核酸酶活性的聚合酶相关的潜在问题(参见例如图63)。
精确地量化从循环肿瘤细胞分离的DNA或cfDNA中的已知基因(例如Braf、K-ras、p53)中的肿瘤特异性拷贝变化或检测其突变的详细方案:
5.2.a.以cfDNA或从CTC分离的基因组DNA(剪切至约150bp)开始,用T4聚合酶和T4激酶修复末端,随后利用克列诺(外-)和dATP添加单碱基3’A悬突。接头具有单碱基3’T悬突,使得在4℃下用T4连接酶的连接将接头附接在片段两端。5’接头含有磷酸根基团(任选地利用T4激酶添加)。
5.2.b.使两端含接头的靶DNA在寡核苷酸探针(包含与接头的5’端互补的5’序列、独特标识符序列、任选的患者标识符序列、任选的引物结合序列和与接头的3’端互补的序列)存在下变性(94℃1分钟),并通过冷却至所需温度(例如40-50℃持续30分钟)使寡核苷酸探针与它们在所需片段上的互补区域杂交。寡核苷酸探针可在5’端含有任选的阻断基团。在退火步骤之后或在程序开始时添加KlenTaq(缺乏核酸酶活性的Taq聚合酶)和热稳定连接酶(优选来自菌株AK16D)、dNTP。允许在杂交温度下延伸和连接,并任选地升高温度(例如60℃),以确保完成延伸和连接,以产生环状产物。
5.2.c.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下由原始靶DNA、接头序列、独特标识符序列、任选的引物结合序列和任选的患者标识符序列组成的所需单链环状DNA。这个产物适用于利用生物素化探针序列特异性捕获所需靶标或适用于滚环扩增(利用与引物结合序列互补的引物和phi-29聚合酶),以产生所需序列的串联重复,随后利用生物素化探针改善所需靶标的捕获。此后利用下一代测序或者可替代地直接SMRT测序在共价闭合模板上利用接头序列或任选的引物结合序列作为引物结合位点鉴定靶标。
注释1:寡核苷酸可在5’侧含有任选的阻断基团或5’OH,使得寡核苷酸探针不环化。
注释2:接头可经合成具有5’磷酸根,或可利用T4激酶附接磷酸根。
注释3:捕获靶标的串联重复拷贝(通过滚环扩增生成)提供多价结合以改善正确靶标的捕获的独特有点。这使得杂交/捕获条件更严格,导致更高捕获效率和更少捕获非所需序列。这种方法也可以用于捕获所有含重复序列(即AGAT四核苷酸重复)的靶标,允许给杂合性遗失、拷贝数变化、单体型分析、建立亲权和其它应用评分。
注释4:独特序列标识符即使在滚环或其它选择/扩增步骤后,可以唯一地对每条原始靶序列进行评分,从而允许精确地量化每个靶标的原始拷贝数。
注释5:促进环化的接头和互补寡核苷酸的实例分别为:iSx-220-d503-AdT1、iSx-221-pd707-AdB2和iSx-222-Lk-uRC1(参见表1)。接头iSx-220-d503-AdT1(参见表1)可在距离5’端的第二位和第三位含有任选的硫代磷酸根基团,以防止缺口平移,并促进靶标与接头末端环化。
图64和65中描述的方法使用通用接头捕获和环化总基因组DNA,然后随后的步骤,诸如利用生物素化探针捕获所需靶标,以选择靶标进行序列分析。在杂交之前或杂交之后,将生物素化探针捕获在珠粒上,所以即使在第二中情况下,杂交步骤可为液体,最终存在液体至固体的步骤,且这些步骤可导致更低产率或片段遗失。
变型5.3描述替代性方法,其中捕获步骤发生在液体中,方式是使用设计用于在靶标上彼此接近或邻近地杂交的探针,然后产生供靶标末端上接头杂交、延伸和连接以产生共价闭合的环状靶标的“着陆点(landing pad)”。在选择含有重复DNA的靶标时,这种方法尤其有用。
精确地量化从循环肿瘤细胞分离的DNA或cfDNA中的已知基因(例如Braf、K-ras、p53)中的肿瘤特异性拷贝变化或检测其突变的详细方案:
5.3.a.以cfDNA或从CTC分离的基因组DNA(剪切至约150bp)开始,用T4聚合酶和T4激酶修复末端,随后利用克列诺(外-)和dATP添加单碱基3’A悬突。接头具有单碱基3’T悬突,使得在4℃下用T4连接酶的连接将接头附接在片段两端。接头可经合成具有5’磷酸根,或可利用T4激酶附接磷酸根。任选地,从未连接的接头纯化靶DNA。
5.3.b.使两端含有接头的靶DNA在寡核苷酸探针(包含与靶标的独特或重复部分(即AGAT重复)互补的5’序列、任选的间隔基域、与接头的5’端互补的序列、独特标识符序列、任选的患者标识符序列、任选的引物结合序列、任选的间隔基域、与接头的3’端互补的序列和与靶标的独特或重复部分(即AGAT重复)互补且与靶标互补的5’序列毗邻的3’序列)存在下变性(94℃1分钟),并允许寡核苷酸通过冷却至所需温度与它们在所需片段上的互补区域杂交(例如50℃持续2小时)。寡核苷酸可在5’侧含有任选的阻断基团。在退火步骤之后或在程序开始时添加Taq聚合酶和/或KlenTaq(缺乏核酸酶活性的Taq聚合酶)和热稳定连接酶(优选来自菌株AK16D)、dNTP。在接头序列具有5’磷酸根的情况中,KlenTaq延伸3’端,直到它与可连接的5’端(图70的左侧)直接毗邻。在接头序列具有5’OH的情况下,聚合酶的5’->3’核酸酶活性裂解匹配的5’-重叠碱基,以产生可连接的5’磷酸根(图70的右侧)。允许在杂交温度下延伸和连接,并任选地升高温度(例如60℃),以确保完成延伸和连接,以产生环状产物。
5.3.c.任选地,在可裂解连接处裂解寡核苷酸探针(例如,使用UDG和AP核酸内切酶裂解的U)。添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下由原始靶DNA、接头序列、独特标识符序列、任选的引物结合序列和任选的患者标识符序列组成的所需的单链环状DNA。这个产物适用于利用生物素化探针序列特异性捕获所需靶标或适用于滚环扩增(利用与引物结合序列互补的引物和phi-29聚合酶),以产生所需序列的串联重复,随后利用生物素化探针改善所需靶标的捕获。此后利用下一代测序或者可替代地直接SMRT测序在共价闭合模板上利用接头序列或任选的引物结合序列作为引物结合位点鉴定靶标。
注释1:寡核苷酸可在5’侧含有任选的阻断基团,以干扰聚合酶的后续5’-3’核酸酶活性,使得寡核苷酸探针不环化。可替代地,可裂解连接可被包括在原始寡核苷酸中。
注释2:可使用Fen核酸酶替代具有5’-3’核酸酶活性的聚合酶,以在靶标的5’侧产生可连接的5’磷酸根。
注释3:5’端接头可经合成以在距离5’磷酸根端的第二位和第三位包含硫代磷酸根键(硫代磷酸根键将由聚合酶的5’->3’核酸酶活性释放)。因为聚合酶延伸一个碱基太多次(这将使得无法连接至下游引物),为使所述聚合酶最少置换那些碱基,连接结处的靶碱基将优选地在3’侧富含AT,且在5’侧富含GC。
注释:4:当使用KlenTaq聚合酶(没有5’->3’核酸酶裂解活性的Taq聚合酶)时,5’端接头可经合成以在毗邻所需5’磷酸根的位置处含有脱嘌呤(AP)位点。使用热稳定EndoIII(例如Tma EndoIII)释放该5’磷酸根。当引物结合至靶标时,这种酶裂解留下5’磷酸根的AP位点。核酸内切酶也裂解单链引物,但效率更低,因此与模板杂交的引物将为优选的底物。
注释5:当使用KlenTaq聚合酶(不具有5’->3’核酸酶裂解活性的Taq聚合酶)时,5’端接头可以经过合成以含有5’磷酸根。可替代地,可在连接至靶DNA之前或在此连接步骤之后利用T4激酶添加5’磷酸根。
注释6:可以在分配延伸的条件(即,更高盐浓度)下使用Taq聚合酶(具有5’->3’核酸酶活性)和KlenTaq(没有5’->3’核酸酶裂解活性的Taq聚合酶)的1:20混合物,以使靶DNA由于缺口平移产生的降解最小化。
注释7:捕获靶标的串联重复拷贝(通过滚环扩增生成)提供多价结合以改善捕获正确靶标的独特优点。这使得杂交/捕获条件更严格,导致更高的捕获效率和更少的捕获非所需序列。这种方法也可以用于捕获所有含重复序列(即AGAT四核苷酸重复)的靶标,允许对杂合性遗失、拷贝数变化、单体型分析、建立亲权和其它应用评分。
注释8:独特序列标识符即使在滚环或其它选择/扩增步骤后,可以唯一地对每条原始靶序列进行评分,从而允许精确地量化每个靶标的原始拷贝数。
注释9:可利用单碱基T悬突连接在由“索引”或“条码”序列组成的接头两侧添加独特标识符序列(参见例如,图67)。用T4聚合酶修复靶标末端,用T4激酶使5’端磷酸化。利用缺乏3’->5’核酸酶活性的克列诺片段向靶标的3’端添加A碱基。在30℃下用T4连接酶连接在具有3’T悬突的3-片“缺口”接头上。使用缺乏3’->5’核酸酶活性的克列诺片段补平缺口,并在T4连接酶存在下连接至小接头链。任选地,使用缺乏3’->5’核酸酶活性的DNA聚合酶补平缺口,并在T4连接酶存在下连接至小接头链。此类3-片接头寡核苷酸的实例为:iSx-223-d504-AdT3、iSx-224-pSmAdT4和iSx-225-pd708-N6AdB5(参见表1)。接头iSx-223-d504-AdT3(参见表1)可在距离5’端的第二位和第三位处含有任选的硫代磷酸根基团,以防止缺口平移并促进靶标与接头末端环化。
注释10:利用平端连接在由“索引”或“条码”组成的序列的接头两侧添加独特标识符序列。用T4聚合酶修复靶标末端。在30℃下用T4连接酶连接在具有3’磷酸根和齐平悬突的3-片“缺口”接头上。在37℃下使用缺乏3’->5’核酸酶活性的克列诺片段补平缺口,加热至50℃,以使小接头变性。使用Taq DNA聚合酶(缺乏3’->5’核酸酶活性,但具有5’-3’核酸酶活性)补平缺口,并用热稳定连接酶连接至靶标。此类3-片接头寡核苷酸的实例为:iSx-226-d505-AdT6、iSx-227-SmAdT7p和iSx-225-pd708-N6AdB5(与上面相同;参见表1)。接头iSx-226-d505-AdT6(参见表1)可在距离5’端的第二位和第三位含有任选的硫代磷酸根基团,以防止缺口平移,并促进靶标与接头末端环化。
注释11:利用逆转录在由“索引”或“条码”序列组成的接头两侧添加独特标识符序列。用T4聚合酶修复靶标末端,用T4激酶使5’端磷酸化(参见例如,图68)。利用逆转录酶向靶标的3’端添加3个C碱基。使接头对杂交,其中第一接头具有在3’端上的rGrG+G(+G是LNA,rG3的符号)、引物结合位点以及任选的患者和独特标识符和5’磷酸根,而第二接头具有引物结合位点以及患者标识符。逆转录酶经历链转换并拷贝独特标识符来填补缺口。连接酶将延伸的靶标共价密封至第二接头。RNA酶H2裂解RNA碱基,从而释放第一接头序列中的rG3(rGrG+G)的3’0H。聚合酶填补缺口,且连接酶共价地密封延伸的末端。此类接头寡核苷酸的实例为:iSx-228-d506-AdT83+G和iSx-229-pd709-AdB6。接头iSx-228-d506-AdT83+G(参见表1)可在距离5’端的第二位和第三位含有任选的硫代磷酸根基团,以防止缺口平移,并促进靶标与接头末端环化。
注释12:一个变型是使用包含多个可裂解键的寡核苷酸,使得在延伸/连接并用裂解剂处理后,在靶链上生成独特引物,适用于滚环扩增产生串联重复产物。下表1中示出此类适用于产生包含含热点突变的KRAS、BRAF和TP53外显子5-8的靶区域的环状产物的寡核苷酸的实例,且包括:(i)KRAS正向和反向靶标延伸/连接寡核苷酸(iSx-232-KRS-T32、iSx-233-KRS-B33);(ii)BRAF正向和反向靶标延伸/连接寡核苷酸(iSx-234-BRF-T34、iSx-235-BRF-B35);(iii)TP53外显子5正向和反向靶标延伸/连接寡核苷酸(iSx-241-TP53e5-T41、iSx-242-TP53e5-B42、iSx-243-TP53e5-T43、iSx-244-TP53e5-B44);(iv)TP53外显子6正向和反向靶标延伸/连接寡核苷酸(iSx-245-TP53e6-T45、iSx-246-TP53e6-B46);(v)TP53外显子7正向和反向靶标延伸/连接寡核苷酸(iSx-247-TP53e7-T47、iSx-248-TP53e7-B48);和(vi)TP53外显子8正向和反向靶标延伸/连接寡核苷酸(iSx-249-TP53e8-T49、iSx-250-TP53e8-B50)。上述延伸/连接寡核苷酸可在距离5’端的第二位和第三位含有任选的硫代磷酸根基团,以防止缺口平移,并促进互补靶标上的环化。
注释13:可替代地,在产生包含含热点突变的KRAS、BRAF和TP53外显子5-8的靶区域的环状产物后,这些区域可利用新添加的靶标特异性引物进行滚环扩增,以产生串联重复产物。这些产物可在用靶标特异性寡核苷酸在固体载体上捕获所需靶之前或之后产生(参见下文注释8)。引物可含有内部可裂解核苷酸碱基或无碱基位点,诸如1’,2’-双脱氧核糖(dSpacer),使得可在滚环扩增期间掺入dUTP,以防止携带污染。下表1中示出此类引物的实例,且包括以下:(i)KRAS正向和反向引物(iSx-108-KRS-rcF26、iSx-109-KRS-rcR27);(ii)BRAF正向和反向引物(iSx-118-BRF-rcF26、iSx-119-BRF-rcR27);(iii)TP53外显子5正向和反向引物(iSx-128-TP53e5-rcF66、iSx-129-TP53e5-rcR67;iSx-130-TP53e5-rcF68、iSx-131-TP53e5-rcR69);(iv)TP53外显子6正向和反向引物(iSx-138-TP53e6-rcF76、iSx-139-TP53e6-rcR77);(v)TP53外显子7正向和反向引物(iSx-148-TP53e7-rcF86、iSx-149-TP53e7-rcR87);和(vi)TP53外显子8正向和反向引物(iSx-158-TP53e8-rcF96、iSx-159-TP53e8-rcR97)。
注释14:在产生包含含热点突变的KRAS、BRAF和TP53外显子5-8的靶区域的环状产物,和/或产生串联重复产物后,这些产物可通过与更长寡核苷酸杂交被捕获,所述更长寡核苷酸含有适用于后续在固体载体上捕获的捕获基团。下表1中示出了此类含有适用于经由涂覆链霉亲和素的固体表面捕获的生物素基团的捕获寡核苷酸的实例,且包括以下:(i)KRAS正向和反向捕获寡核苷酸(iSx-013-KRS-bcF1、iSx-014-KRS-bcR2);(ii)BRAF正向和反向捕获寡核苷酸(iSx-020-BRF-bcF1、iSx-021-BRF-bcR2);(iii)TP53外显子5正向和反向捕获寡核苷酸(iSx-030-TP53e5-bcF1、iSx-031-TP53e5-bcR2;iSx-032-TP53e5-bcF3、iSx-033-TP53e5-bcR4);(iv)TP53外显子6正向和反向捕获寡核苷酸(iSx-050-TP53e6-bcF5、iSx-051-TP53e6-bcR6);(v)TP53外显子7正向和反向捕获寡核苷酸(iSx-060-TP53e7-bcF7、iSx-061-TP53e7-bcR8);和(vi)TP53外显子8正向和反向捕获寡核苷酸(iSx-070-TP53e8-bcF9、iSx-071-TP53e8-bcR10)。
注释15:以利用以上引物和接头设计产生的上述产物,在簇或珠粒扩增或在商业仪器上捕获在流动池的孔、地址或表面后,可使用以下引物起始测序反应:(i)iLx-003-PEsqP1,成对末端测序引物1;(ii)iLx-004-BrCdR1,索引引物,条码读段1;(iii)iLx-001-P5-BrCdR2,条码读段2;和(iv)iLx-005-PEsqP2,成对末端测序引物2(下表1中提供了引物序列)。
图70中所述方法利用两种寡核苷酸探针以及含接头的靶标的连接,产生环状联锁连接产物。随后,在可裂解连接处引入缺口。对于重复序列,3’端可只使用如下文在变型5.4中所述的3dNTP延伸,参见例如图77。
精确地量化从循环肿瘤细胞分离的DNA或cfDNA中的已知基因(例如Braf、K-ras、p53)中的肿瘤特异性拷贝变化或检测其突变的详细方案:
5.4.a.以cfDNA或从CTC分离的基因组DNA(剪切至约150bp)开始,用T4聚合酶和T4激酶修复末端,随后利用克列诺(外-)和dATP添加单碱基3’A悬突。接头具有单碱基3’T悬突,使得在4℃下用T4连接酶的连接将接头附接在片段两端。接头可经合成具有5’磷酸根,或可利用T4激酶附接磷酸根。任选地,从未连接的接头纯化靶DNA。
5.4.b.使两端含接头的靶DNA在寡核苷酸探针(包含与接头的5’端互补的5’序列、独特标识符序列、任选的患者标识符序列、任选的引物结合序列、任选的间隔基域、与接头的3’端互补的序列和与靶标的独特或重复部分(即AGAT重复)互补的3’序列)存在下变性(94℃1分钟),并通过冷却至所需温度(例如50℃持续2小时)使寡核苷酸探针与它们在所需片段上的互补区域杂交。寡核苷酸探针可在5’侧含有任选的阻断基团。在退火步骤之后或在程序开始时添加Taq聚合酶和/或KlenTaq(缺乏核酸酶活性的Taq聚合酶)和热稳定连接酶(优选来自菌株AK16D),以及对于AGAT重复的实例,只有三种互补核苷酸(即dTTP、dCTP、dATP)。在接头序列具有5’磷酸根的情况中,KlenTaq延伸3’端,直到它与可连接的5’端(图77的左侧)直接毗邻。在接头序列具有5’OH的情况下,聚合酶的5’->3’核酸酶活性裂解匹配的5’-重叠碱基,以产生可连接的5’磷酸根(图77的右侧)。允许在杂交温度下延伸和连接,并任选地升高温度(例如60℃),以确保完成延伸和连接,以产生环状产物。
5.4.c.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下所需的由原始靶DNA、接头序列、独特标识符序列、任选的引物结合序列和任选的患者标识符序列组成的单链环状DNA。这个产物适用于利用生物素化探针序列特异性捕获所需靶标或适用于滚环扩增(利用与引物结合序列互补的引物和phi-29聚合酶),以产生所需序列的串联重复,随后利用生物素化探针改善所需靶标的捕获。此后利用下一代测序或者可替代地直接SMRT测序在共价闭合模板上利用接头序列或任选的引物结合序列作为引物结合位点鉴定靶标。
注释1:寡核苷酸可在5’侧含有任选的阻断基团,以干扰聚合酶的后续5’-3’核酸酶活性,使得寡核苷酸探针不环化。
注释2:可使用Fen核酸酶替代具有5’-3’核酸酶活性的聚合酶,以在靶标的5’侧产生可连接的5’磷酸根。
注释3:5’端接头可经合成以在距离5’磷酸根端的第二位和第三位含有硫代磷酸根键(硫代磷酸根键将由聚合酶的5’->3’核酸酶活性释放)。因为聚合酶延伸一个碱基太多次(这将使得无法连接至下游引物),为使所述聚合酶最少置换那些碱基,连接结处的靶碱基将优选地在3’侧富含AT,且在5’侧富含GC。
注释:4:当使用KlenTaq聚合酶(没有5’->3’核酸酶裂解活性的Taq聚合酶)时,5’端接头可经合成以在毗邻所需5’磷酸根的位置处含有脱嘌呤(AP)位点。使用热稳定EndoIII(例如Tma EndoIII)释放该5’磷酸根。当引物结合至靶标时,这种酶裂解留下5’磷酸根的AP位点。核酸内切酶也裂解单链引物,但效率更低,因此与模板杂交的引物将为优选的底物。
注释5:当使用KlenTaq聚合酶(不具有5’->3’核酸酶裂解活性的Taq聚合酶)时,5’端接头可以经过合成以含有5’磷酸根。可替代地,可在连接至靶DNA之前或在此连接步骤之后利用T4激酶添加5’磷酸根。
注释6:可以在分配延伸的条件(即,更高盐浓度)下使用Taq聚合酶(具有5’->3’核酸酶活性)和KlenTaq(没有5’->3’核酸酶裂解活性的Taq聚合酶)的1:20混合物,以使靶DNA由于缺口平移产生的降解最小化。
注释7:捕获靶标的串联重复拷贝(通过滚环扩增生成)提供多价结合以改善正确靶标的捕获的独特有点。这使得杂交/捕获条件更严格,导致更高捕获效率和更少捕获非所需序列。这种方法也可以用于捕获所有含重复序列(即AGAT四核苷酸重复)的靶标,允许为杂合性遗失、拷贝数变化、单体型分析、建立亲权和其它应用评分。
注释8:独特序列标识符即使在滚环或其它选择/扩增步骤后,可以唯一地对每条原始靶序列进行评分,从而允许精确地量化每个靶标的原始拷贝数。
为避免聚合酶延伸和缺口平移问题,程序可不进行聚合酶延伸步骤,只利用连接酶或连接酶结合聚合酶的5’-3’核酸酶活性,如图78中所示(v5.5)。诀窍是将独特标识符序列附接至接头。
精确地量化从循环肿瘤细胞分离的DNA或cfDNA中的已知基因(例如Braf、K-ras、p53)中的肿瘤特异性拷贝变化或检测其突变的详细方案:
5.5.a.以cfDNA或从CTC分离的基因组DNA(剪切至约150bp)开始,用T4聚合酶和T4激酶修复末端,随后利用克列诺(外-)和dATP添加单碱基3’A悬突。接头具有单碱基3’T悬突,使得在4℃下用T4连接酶的连接将接头附接在片段两端。接头在接头的5’单链侧含有独特标识符序列,且可经合成具有5’磷酸根,或者可利用T4激酶附接磷酸根。任选地,从未连接的接头和/或dNTP纯化靶DNA。
5.5.b.使两端含有接头的靶DNA在寡核苷酸(包含与靶标的独特或重复部分(即AGAT重复)互补的5’序列、任选的间隔基域、与接头的5’端互补的序列、任选的患者标识符序列、任选的引物结合序列、任选的间隔基域、与接头的3’端互补的序列及与靶标的独特或重复部分(即AGAT重复)互补且与靶标互补的5’序列直接毗邻或有单碱基或侧翼重叠的3’序列)存在下变性(94℃1分钟),并允许寡核苷酸通过冷却至所需温度(例如50℃持续2小时)与它们在所需片段上的互补区域杂交。寡核苷酸可在5’侧含有任选的阻断基团。任选地,在退火步骤之后或在程序开始时添加Taq聚合酶和热稳定连接酶(优选来自菌株AK16D)。在接头序列具有5’磷酸根的情况中,3’接头与可连接的5’端直接相邻(图78的左侧)。在接头序列具有5’OH的情况下,聚合酶的5’->3’核酸酶活性裂解匹配的5’-重叠碱基或侧翼,以产生可连接的5’磷酸根(图78的右侧)。允许进行任选的侧翼裂解,并在杂交温度下连接,并任选地升高温度(例如60℃),以确保完成连接,以产生环状产物。
5.5.c.任选地,在可裂解连接处裂解寡核苷酸探针(例如,使用UDG和AP核酸内切酶裂解的U)。添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下由原始靶DNA、接头序列、独特标识符序列、任选的引物结合序列和任选的患者标识符序列组成的所需的单链环状DNA。这个产物适用于利用生物素化探针序列特异性捕获所需靶标或适用于滚环扩增(利用与引物结合序列互补的引物和phi-29聚合酶),以产生所需序列的串联重复,随后利用生物素化探针改善所需靶标的捕获。此后利用下一代测序或者可替代地直接SMRT测序在共价闭合模板上利用接头序列或任选的引物结合序列作为引物结合位点鉴定靶标。
注释1:寡核苷酸可在5’侧含有任选的阻断基团,以干扰聚合酶的后续5’-3’核酸酶活性,使得寡核苷酸探针不环化。可替代地,可裂解连接可被包括在原始寡核苷酸中。
注释2:可使用Fen核酸酶替代具有5’-3’核酸酶活性的聚合酶,以在靶标的5’侧产生可连接的5’磷酸根。
注释3:捕获靶标的串联重复拷贝(通过滚环扩增生成)提供多价结合以改善正确靶标的捕获的独特优点。这使得杂交/捕获条件更严格,导致更高捕获效率和更少捕获非所需序列。这种方法也可以用于捕获所有含重复序列(即AGAT四核苷酸重复)的靶标,允许给杂合性遗失、拷贝数变化、单体型分析、建立亲权和其它应用评分。
注释4:独特序列标识符即使在滚环或其它选择/扩增步骤后,可以唯一地对每条原始靶序列进行评分,从而允许精确地量化每个靶标的原始拷贝数。
预测性实施例6--精确地量化从外来体、循环肿瘤细胞或包含循环肿瘤细胞的总血细胞分离的肿瘤特异性mRNA或lncRNA。(例如十二种预测结果或指导处理的表达标记物)。
肿瘤特异性mRNA或lncRNA表达的变化是以组织特异性方式给疾病状态分类的强有力工具。这包括精确检测和量化mRNA或lncRNA的特定外显子(参见例如,图108、111、112)或检测和量化mRNA中存在的复发性基因融合(参见例如,图109和110)。从外来体或循环肿瘤细胞分离总或聚-A mRNA或聚-A lncRNA,并利用用于这个过程的逆转录酶转化为cDNA。利用标准设计规则获得通常横跨特异性转录物的外显子-内含子边界的区域的最大特异性,通过使用外显子特异性引物产生cDNA。可替代地,可以使用随机六聚体引发来拷贝整个转录组,或可以使用聚dT引物来富集所有转录物的3’端。
含有与毗邻但分离的区域互补的序列的寡核苷酸与cDNA靶标杂交。图108和112示出外显子检测和量化方法,所述方法在5’与3’寡核苷酸间使用缺口(即10-20个核苷酸),其中使用聚合酶延伸靶结合序列的3’端以拷贝靶序列中的一些,并封闭所述缺口以产生适用于后续连接的可连接结,以形成环状产物。在一个实施方案中,寡核苷酸探针的5'与3'端间的缺口为10-20个核苷酸。然而,可将待拷贝的缺口裁制为用于后续测序步骤中的读取的长度。图111示出外显子检测和量化方法,其中两个靶结合序列相互毗邻且不存在缺口。
这些报道子环的枚举可通过各种量化方法进行,所述量化方法包括但不限于下一代测序。除允许通过环形成同时多重检测许多靶序列以外,下一代测序作为读出提供关于报道子环的额外信息(两个独特标识符),所述信息轻易将真正连接产物与连接假象区分开来,从而增加测定的灵敏度。
图109和110描述用于检测和量化mRNA中存在的复发性基因融合的两种变化形式。因为两个基因的融合结方式不严密,从一个基因的两个5’端与另一个基因的3’端缺失序列的数百至数千碱基长度,所以难以设计含有未确定融合结的上游和下游的几十个探针对的测定,所以本文所述方法利用两个半圆式寡核苷酸探针,每个的一端在上游外显子中且另一端在下游外显子中。只有在其间毗邻一个缺口的两个探针(四个末端)或者在cDNA靶标上彼此紧邻的两个探针(四个末端)杂交后,才可连接形成单个环状产物。后续消化未连接的寡核苷酸探针(利用核酸外切酶)留下环状产物,所述环状产物在一个变型中(参见例如图109)不含来自原始靶cDNA的额外序列信息(无缺口)。在另一个变型中(参见例如图110),聚合酶延伸每个靠近缺口的探针的3’端,直到聚合酶遇到附近探针的各自5’端。这两个报道子环含有独特标识符序列、任选的患者标识符序列以及它们中的一个、任选的引物结合位点。这些报道子环的枚举可通过各种量化方法进行,所述量化方法包括但不限于下一代测序。除允许同时多重检测许多融合转录物以外,下一代测序提供关于报道子环的额外信息(独特标识符的两个拷贝),所述信息轻易将真正连接产物与连接假象区分开来。两个变化形式(图109和110)中的每个还示出两种产生可连接的5’端的方法。所述探针在杂交前具有5’-磷酸根(图左侧)或使用Taq聚合酶的5’->3’核酸酶活性裂解匹配的5’-重叠碱基或侧翼,从而产生可连接的5’-磷酸根(图右侧)。
用于检测和量化从外来体、循环肿瘤细胞或包含循环肿瘤细胞的总血细胞分离的mRNA或lncRNA中的外显子的详细方案。
变型6.1,参见例如图108:6.1.a从外来体、循环肿瘤细胞或包含循环肿瘤细胞的总血细胞分离的总或聚-A mRNA或聚-A lncRNA开始通过使用逆转录酶和外显子特异性引物产生cDNA。
6.1.b.使靶cDNA在寡核苷酸(包含与朝向5’侧的一部分cDNA互补的5’探针区域、独特标识符序列、任选的患者标识符序列、任选的引物结合序列和与朝向3’侧的另一部分cDNA互补的3’探针区域)存在下变性(94℃ 1分钟),并通过冷却至所需温度(例如40-50℃持续30分钟)使寡核苷酸与它们在所需片段上的互补区域杂交。寡核苷酸可在5’端含有任选的磷酸根基团或匹配的5’-重叠碱基或侧翼。任选地,在退火步骤之后或在程序开始时添加Taq聚合酶和/或KlenTaq(缺乏核酸酶活性的Taq聚合酶)和热稳定连接酶(优选来自菌株AK16D)及任选的dNTP。在寡核苷酸在结点处具有直接毗邻3’OH的5’磷酸根的情况中,两个末端可利用连接酶直接连结(图108的右侧)。在寡核苷酸具有5’磷酸根且5’与3’端之间具有缺口的情况下,用KlenTaq延伸3’OH。在寡核苷酸具有5’OH的情况下,Taq聚合酶的5’->3’核酸酶活性裂解匹配的5’-重叠碱基或侧翼,以产生可连接的5’磷酸根(图108的左侧)。允许在杂交温度下进行延伸和连接,并且任选地升高温度(例如60℃)以确保完成延伸和连接,以产生环状产物。
6.1.c.添加外切核酸酶I(以3’->5’方向消化单链DNA)和外切核酸酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下包含一小段的原始靶DNA的拷贝、独特标识符序列、任选的引物结合序列和任选的患者标识符序列组成的所需单链环状cDNA。这种产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶),以产生所需序列的串联重复,随后在共价闭合模板上利用下一代测序或可替代地直接SMRT测序,使用引物结合序列作为引物结合位点识别靶标。
注释1:可使用Fen核酸酶替代具有5’-3’核酸酶活性的聚合酶,以在靶标的5’侧产生可连接的5’磷酸根。
注释2:寡核苷酸引物的5’端可经合成以在距离5’磷酸根端的第二位和第三位含有硫代磷酸根键(硫代磷酸根键将由聚合酶的5’->3’核酸酶活性释放)。因为聚合酶延伸一个碱基太多次(这将使得无法连接至下游引物),为使所述聚合酶最少置换那些碱基,连接结处的靶碱基将优选地在3’侧富含AT,且在5’侧富含GC。
注释:3:当使用KlenTaq聚合酶(没有5’->3’核酸酶裂解活性的Taq聚合酶)时,5’端接头可经合成以在毗邻所需5’磷酸根的位置处含有脱嘌呤(AP)位点。使用热稳定EndoIII(例如Tma EndoIII)释放该5’磷酸根。当引物结合至靶标时,这种酶裂解留下5’磷酸根的AP位点。核酸内切酶也裂解单链引物,但效率更低,因此与模板杂交的引物将为优选的底物。
注释4:当使用KlenTaq聚合酶(不具有5’->3’核酸酶裂解活性的Taq聚合酶)时,5’端接头可以经过合成以含有5’磷酸根。可替代地,可在连接至靶DNA之前或在连接步骤之后利用T4激酶添加5’磷酸根。
注释5:可以在分配延伸的条件(即,更高盐浓度)下使用Taq聚合酶(具有5’->3’核酸酶活性)和KlenTaq(没有5’->3’核酸酶裂解活性的Taq聚合酶)的1:20混合物,以使靶DNA由于缺口平移产生的降解最小化。
注释6:如果寡核苷酸还包含任选的引物结合位点(即通用引物结合位点),其将适用于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
注释7:MMLV逆转录酶可经工程化以在50℃-60℃下从总输入RNA(InvitrogenSuperscript III)合成cDNA。可替代地,已使Tth或Tma DNA聚合酶工程化以提高其逆转录酶活性(可能需要添加Mn辅因子)。最终,嗜热PyroPhage 3173 DNA聚合酶具有链置换活性和逆转录活性,且也可以使用。
用于检测和量化从外来体、循环肿瘤细胞或包含循环肿瘤细胞的总血细胞分离的mRNA中的基因融合的详细方案;:
变型6.2(参见例如图109):6.2.a.从外来体或CTC分离的mRNA首先通过逆转录酶转化为cDNA,以此方式横跨任何可能融合转录物的结点。在优选的方法中,使用外显子特异性引物。
6.2.b.使靶cDNA在两个寡核苷酸(第一个包含与靶外显子#1的独特部分互补的5-’序列、独特标识符序列、任选的患者标识符序列、任选的引物结合序列和与靶外显子#2的独特部分互补的3’-序列,且第二个包含与靶外显子#2的独特部分互补的5’-序列、独特标识符序列、任选的患者标识符序列和与靶外显子#1的独特部分互补的3’序列)存在下变性(94℃1分钟),并通过冷却至所需温度(例如50℃持续2小时)下使寡核苷酸与它们在所需片段上的互补区域杂交。在退火步骤之后或在程序开始时添加热稳定连接酶(优选来自菌株AK16D)以及任选的Taq聚合酶和dNTP。在两条寡核苷酸序列具有5’磷酸根的情况下,不需要聚合酶(图109的左侧)。在两条寡核苷酸序列具有5’OH的情况下,聚合酶的5’->3’核酸酶活性裂解匹配的5’-重叠碱基,以产生可连接的5’磷酸根(图109的右侧)。允许在杂交温度下侧翼裂解和连接,并任选地升高温度(例如60℃),以确保完成侧翼裂解和连接,以产生环状产物。
6.2.c.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下所需的由原始靶DNA、接头序列、独特标识符序列、任选的引物结合序列和任选的患者标识符序列组成的单链环状DNA。这种产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶),以产生所需序列的串联重复,随后在共价闭合模板上利用下一代测序或直接SMRT测序,使用引物结合序列作为引物结合位点识别靶标。
注释1:可使用Fen核酸酶代替具有5’-3’核酸酶活性的聚合酶以在靶标的5’侧产生可连接的5’磷酸根。
注释2:如果寡核苷酸还包含任选的引物结合位点(即通用引物结合位点),其将适用于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
注释3:在使用两个桥接寡核苷酸探针的系统中,每个探针含有独特标识符序列、任选的患者标识符序列和任选的引物结合位点,建议所述寡核苷酸中只有一个而不是两个含有引物结合位点(寡核苷酸上游或下游)。对于另一水平的假阳性检测,建议探针上游和下游的独特标识符序列不同。
注释4:MMLV逆转录酶可经工程化以在50℃-60℃下从总输入RNA(InvitrogenSuperscript III)合成cDNA。可替代地,已使Tth或Tma DNA聚合酶工程化以提高其逆转录酶活性(可能需要添加Mn辅因子)。最终,嗜热PyroPhage 3173 DNA聚合酶具有链置换活性和逆转录活性,且也可以使用。
用于检测和量化从外来体、循环肿瘤细胞或包含循环肿瘤细胞的总血细胞分离的mRNA中的基因融合的另一变型的详细方案;
变型6.3(参见例如图110):6.3.a.从外来体或CTC分离的mRNA首先通过逆转录酶转化为cDNA,以此方式横跨任何可能融合转录物的结点。在优选的方法中,使用外显子特异性引物。
6.3.b.使靶cDNA在两个寡核苷酸(第一个包含与靶外显子#1的独特部分互补的5-’序列、独特标识符序列、任选的患者标识符序列、任选的引物结合序列和与靶外显子#2的独特部分互补的3’-序列,且第二个包含与靶外显子#2的独特部分互补的5’-序列、独特标识符序列、任选的患者标识符序列和与靶外显子#1的独特部分互补的3’序列)存在下变性(94℃1分钟),并通过冷却至所需温度(例如50℃持续2小时)下使寡核苷酸与它们在所需片段上的互补区域杂交。在退火步骤之后或在程序开始时添加Taq聚合酶和/或KlenTaq(缺乏核酸酶活性的Taq聚合酶)、热稳定连接酶(优选来自菌株AK16D)和dNTP。在两条寡核苷酸序列具有5’磷酸根的情况中,KlenTaq延伸3’端,直到它与可连接的5’端(图110的左侧)直接毗邻。在两条寡核苷酸序列具有5’OH的情况下,聚合酶的5’->3’核酸酶活性裂解匹配的5’-重叠碱基,以产生可连接的5’磷酸根(图110的右侧)。允许在杂交温度下进行延伸和连接,并且任选地升高温度(例如60℃)以确保完成延伸和连接,以产生环状产物。
6.3.c.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下由原始靶DNA、接头序列、独特标识符序列、任选的引物结合序列和任选的患者标识符序列组成的所需的单链环状DNA。这种产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶),以产生所需序列的串联重复,随后在共价闭合模板上利用下一代测序或可替代地直接SMRT测序,使用引物结合序列作为引物结合位点识别靶标。
注释1:可使用Fen核酸酶代替具有5’-3’核酸酶活性的聚合酶以在靶标的5’侧产生可连接的5’磷酸根。
注释2:寡核苷酸引物的5’端可经合成以在距离5’磷酸根端的第二和第三位含有硫代磷酸根键(硫代磷酸根键将由聚合酶的5’->3’核酸酶活性释放)。因为聚合酶延伸一个碱基太多次(这将使得无法连接至下游引物),为使所述聚合酶最少置换那些碱基,连接结处的靶碱基将优选地在3’侧富含AT,且在5’侧富含GC。
注释:3:当使用KlenTaq聚合酶(没有5’->3’核酸酶裂解活性的Taq聚合酶)时,5’端接头可经合成以在毗邻所需5’磷酸根的位置处含有脱嘌呤(AP)位点。使用热稳定EndoIII(例如Tma EndoIII)释放该5’磷酸根。当引物结合至靶标时,这种酶裂解留下5’磷酸根的AP位点。核酸内切酶也裂解单链引物,但效率更低,因此与模板杂交的引物将为优选的底物。
注释4:当使用KlenTaq聚合酶(不具有5’->3’核酸酶裂解活性的Taq聚合酶)时,5’端接头可以经过合成以含有5’磷酸根。可替代地,5’磷酸根可以使用T4激酶在连接到靶DNA之前或在连接步骤之后添加。
注释5:可以在分配延伸的条件(即,更高盐浓度)下使用Taq聚合酶(具有5’->3’核酸酶活性)和KlenTaq(没有5’->3’核酸酶裂解活性的Taq聚合酶)的1:20混合物,以使靶DNA由于缺口平移产生的降解最小化。
注释6:如果寡核苷酸还包含任选的引物结合位点(即通用引物结合位点),其将适用于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
注释7:在使用两个桥接寡核苷酸探针的系统中,每个探针含有独特标识符序列、任选的患者标识符序列和任选的引物结合位点,建议所述寡核苷酸中只有一个而不是两个含有引物结合位点(寡核苷酸上游或下游)。对于另一水平的假阳性检测,建议探针上游和下游的独特标识符序列不同。
注释8:MMLV逆转录酶可经工程化以在50℃-60℃下从总输入RNA(InvitrogenSuperscript III)合成cDNA。可替代地,已使Tth或Tma DNA聚合酶工程化以提高其逆转录酶活性(可能需要添加Mn辅因子)。最终,嗜热PyroPhage 3173 DNA聚合酶具有链置换活性和逆转录活性,且也可以使用。
用于检测和量化从外来体、循环肿瘤细胞或包含循环肿瘤细胞的总血细胞分离的mRNA中的含特定外显子(可能彼此不毗邻)的mRNA的详细方案;
变型6.4(参见例如图111)6.4.a.从外来体或CTC分离的mRNA首先通过逆转录酶转化为cDNA,以此方式包括两个外显子区域。在优选的方法中,使用外显子特异性引物。
6.4.b.使靶cDNA在两个寡核苷酸(第一个包含与靶外显子#1的独特部分互补的5’-序列、独特标识符序列、任选的患者标识符序列、任选的引物结合序列和与靶外显子#2的独特部分互补的3’-序列,且第二个包含与靶外显子#2的独特部分互补的5’-序列、独特标识符序列、任选的患者标识符序列和与靶外显子#1的独特部分互补的3’序列)存在下变性(94℃1分钟),并通过冷却至所需温度(例如50℃持续2小时)下使寡核苷酸与它们在所需片段上的互补区域杂交。在退火步骤之后或在程序开始时添加热稳定连接酶(优选来自菌株AK16D)以及任选的Taq聚合酶和dNTP。在两条寡核苷酸序列具有5’磷酸根的情况下,不需要聚合酶(图111的左侧)。在两条寡核苷酸序列具有5’OH的情况下,聚合酶的5’->3’核酸酶活性裂解匹配的5’-重叠碱基,以产生可连接的5’磷酸根(图111的右侧)。允许在杂交温度下侧翼裂解和连接,并任选地升高温度(例如60℃),以确保完成侧翼裂解和连接,以产生环状产物。
6.4.c.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下由原始靶DNA、接头序列、独特标识符序列、任选的引物结合序列和任选的患者标识符序列组成的所需的单链环状DNA。这种产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶),以产生所需序列的串联重复,随后在共价闭合模板上利用下一代测序或可替代地直接SMRT测序,使用引物结合序列作为引物结合位点识别靶标。
注释1:可使用Fen核酸酶代替具有5’-3’核酸酶活性的聚合酶以在靶标的5’侧产生可连接的5’磷酸根。
注释2:如果寡核苷酸还包含任选的引物结合位点(即通用引物结合位点),其将适用于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
注释3:在使用两个桥接寡核苷酸探针的系统中,每个探针含有独特标识符序列、任选的患者标识符序列和任选的引物结合位点,建议所述寡核苷酸中只有一个而不是两个含有引物结合位点(寡核苷酸上游或下游)。对于另一水平的假阳性检测,建议探针上游和下游的独特标识符序列不同。
注释4:MMLV逆转录酶可经工程化以在50℃-60℃下从总输入RNA(InvitrogenSuperscript III)合成cDNA。可替代地,已使Tth或Tma DNA聚合酶工程化以提高其逆转录酶活性(可能需要添加Mn辅因子)。最终,嗜热PyroPhage 3173 DNA聚合酶具有链置换活性和逆转录活性,且也可以使用。
用于检测和量化从外来体、循环肿瘤细胞或包含循环肿瘤细胞的总血细胞分离的mRNA中的含特定外显子(可能彼此不毗邻)的mRNA的详细方案;
变型6.5(参见例如图112):6.5.a.从外来体或CTC分离的mRNA首先通过逆转录酶转化为cDNA,以此方式包括两个外显子区域。在优选的方法中,使用外显子特异性引物。
6.5.b.使靶cDNA在两个寡核苷酸(第一个包含与靶外显子#1的独特部分互补的5-’序列、独特标识符序列、任选的患者标识符序列、任选的引物结合序列和与靶外显子#2的独特部分互补的3’-序列,且第二个包含与靶外显子#2的独特部分互补的5’-序列、独特标识符序列、任选的患者标识符序列和与靶外显子#1的独特部分互补的3’序列)存在下变性(94℃1分钟),并通过冷却至所需温度(例如50℃持续2小时)下使寡核苷酸与它们在所需片段上的互补区域杂交。在退火步骤之后或在程序开始时添加Taq聚合酶和/或KlenTaq(缺乏核酸酶活性的Taq聚合酶)、热稳定连接酶(优选来自菌株AK16D)和dNTP。在两条寡核苷酸序列具有5’磷酸根的情况中,KlenTaq延伸3’端,直到它与可连接的5’端(图112的左侧)直接毗邻。在两条寡核苷酸序列具有5’OH的情况下,聚合酶的5’->3’核酸酶活性裂解匹配的5’-重叠碱基,以产生可连接的5’磷酸根(图112的右侧)。允许在杂交温度下进行延伸和连接,并且任选地升高温度(例如60℃)以确保完成延伸和连接,以产生环状产物。
6.5.c.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下由原始靶DNA、接头序列、独特标识符序列、任选的引物结合序列和任选的患者标识符序列组成的所需的单链环状DNA。这种产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶),以产生所需序列的串联重复,随后在共价闭合模板上利用下一代测序或可替代地直接SMRT测序,使用引物结合序列作为引物结合位点识别靶标。
注释1:可使用Fen核酸酶代替具有5’-3’核酸酶活性的聚合酶以在靶标的5’侧产生可连接的5’磷酸根。
注释2:寡核苷酸引物的5’端可经合成以在距离5’磷酸根端的第二位和第三位含有硫代磷酸根键(硫代磷酸根键将由聚合酶的5’->3’核酸酶活性释放)。因为聚合酶延伸一个碱基太多次(这将使得无法连接至下游引物),为使所述聚合酶最少置换那些碱基,连接结处的靶碱基将优选地在3’侧富含AT,且在5’侧富含GC。
注释:3:当使用KlenTaq聚合酶(没有5’->3’核酸酶裂解活性的Taq聚合酶)时,5’端接头可经合成以在毗邻所需5’磷酸根的位置处含有脱嘌呤(AP)位点。使用热稳定EndoIII(例如Tma EndoIII)释放该5’磷酸根。当引物结合至靶标时,这种酶裂解留下5’磷酸根的AP位点。核酸内切酶也裂解单链引物,但效率更低,因此与模板杂交的引物将为优选的底物。
注释4:当使用KlenTaq聚合酶(不具有5’->3’核酸酶裂解活性的Taq聚合酶)时,5’端接头可以经过合成以含有5’磷酸根。可替代地,5’磷酸根可以使用T4激酶在连接到靶DNA之前或在连接步骤之后添加。
注释5:可以在分配延伸的条件(即,更高盐浓度)下使用Taq聚合酶(具有5’->3’核酸酶活性)和KlenTaq(没有5’->3’核酸酶裂解活性的Taq聚合酶)的1:20混合物,以使靶DNA由于缺口平移产生的降解最小化。
注释6:如果寡核苷酸还包含任选的引物结合位点(即通用引物结合位点),其将适用于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
注释7:在使用两个桥接寡核苷酸探针的系统中,每个探针含有独特标识符序列、任选的患者标识符序列和任选的引物结合位点,建议所述寡核苷酸中只有一个而不是两个含有引物结合位点(寡核苷酸上游或下游)。对于另一水平的假阳性检测,建议探针上游和下游的独特标识符序列不同。
注释8:MMLV逆转录酶可经工程化以在50℃-60℃下从总输入RNA(InvitrogenSuperscript III)合成cDNA。可替代地,已使Tth或Tma DNA聚合酶工程化以提高其逆转录酶活性(可能需要添加Mn辅因子)。最终,嗜热PyroPhage 3173 DNA聚合酶具有链置换活性和逆转录活性,且也可以使用。
预测性实施例7--精确地量化从外来体或阿尔古蛋白分离的肿瘤特异性miRNA。(例如十二种预测结果或指导处理的microRNA标记物)。
已将MicroRNA(miRNA)鉴定为存在肿瘤、其分类和预兆的潜在组织特异性标记物。miRNA作为与Ago2蛋白形成的复合物或通过封装为外来体存在于血清和血浆中。
图114–117描述用于捕获miRNA序列,供后续通过高精度测序枚举的方法。在所有已知的方法中,方法涉及制备靶miRNA序列的cDNA拷贝,靶miRNA序列被转化为合适的环状DNA。
用于捕获、识别和量化存在于未经任何选择的血清、血浆或外来体的所有miRNA物质的详细方案:
变型7.1(参见例如图114)7.1.a.从外来体或CTC分离miRNA。利用具有5’-磷酸根的DNA接头将通用接头连接至miRNA的3’端,并利用RNA连接酶1阻断3’端。
7.1.b.用T4激酶使经修饰的miRNA的5’端磷酸化。利用具有5’磷酸根和阻断的3’端的DNA接头将通用接头连接至经修饰的接头的5’端。
7.1.c.移除过量接头后,使核酸在寡核苷酸(包含与接头的5’-和3’端互补的序列、独特标识符序列、任选的患者标识符序列、任选的引物结合序列)存在下变性(94℃1分钟),并通过冷却至所需温度(例如40-50℃持续30分钟)使寡核苷酸与它们在所需片段上的互补区域杂交。添加缺乏5’-3’活性的逆转录酶(即利用Mn2+辅因子的Tth DNA聚合酶)、热稳定连接酶(优选来自菌株AK16D)和dNTP;在退火步骤之后或在程序开始时添加所述组分。允许在杂交温度下进行延伸和连接,并且任选地升高温度(例如60℃)以确保完成延伸和连接,以产生环状产物。
7.1.d.添加UDG和AP核酸内切酶使原始靶标中的miRNA缺口,添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下包含原始靶miRNA的拷贝、独特标识符序列、任选的引物结合序列和任选的患者标识符序列的所需单链环状DNA。这个产物适用于滚环扩增(使用与引物结合序列互补的引物和phi-29聚合酶),以产生所需序列的串联重复。此后利用下一代测序或者可替代地直接SMRT测序在共价闭合模板上利用任选的引物结合序列作为引物结合位点鉴定靶标。
注释1.如果寡核苷酸还包含任选的引物结合位点(即,通用引物结合位点),那么环状DNA将适用于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
设计所述方法的后续变型(参见例如,图115–117),以捕获从血清、血浆或外来体分离的总miRNA的特定miRNA序列。这些方法利用与靶miRNA序列的全部或一部分互补的捕获探针,但随后制备原始miRNA序列的cDNA拷贝,且因此能够检测miRNA或捕获物中由于错误杂交而引起的单碱基变化。
用于捕获、识别和量化存在于未经任何选择的血清、血浆或外来体的特定miRNA物质的详细方案:
变型7.2(参见例如图115)7.2.a.从外来体或CTC分离miRNA。用T4激酶使分离的miRNA磷酸化。使寡核苷酸对杂交,其中第一寡核苷酸包含与miRNA靶标互补、与独特5’-和3’-接头序列侧接的序列,而第二寡核苷酸包含5’-磷酸化末端,接着为独特3’-接头的互补序列、独特标识符序列、任选的患者标识符序列、任选的引物结合序列和独特5’-接头的互补序列,其最后的碱基为核糖核苷酸碱基。存在T4 RNA连接酶2来共价密封miRNA的末端,从而产生环状连接产物。
7.2.b.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接的寡核苷酸,只留下所需的单链环状miRNA-DNA嵌合体。在80℃下加热持续20分钟使核酸外切酶失活。
7.2.c.向环状产物添加通用的5’-磷酸化引物,在37℃下杂交。添加缺乏5’-3’核酸外切酶活性的逆转录酶(利用Mn2+辅因子的Tth DNA聚合酶)、热稳定连接酶(优选来自菌株AK16D)和dNTP;在退火步骤之后或在程序开始时添加所述组分。允许在杂交温度下延伸和连接,并任选地升高温度(例如60℃),以确保完成延伸和连接,以产生现在含有原始靶miRNA的拷贝的环状产物。
7.2.d.添加UDG和AP核酸内切酶使原始靶标中的miRNA缺口,添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下包含原始靶miRNA的拷贝、独特标识符序列、任选的引物结合序列和任选的患者标识符序列的所需的单链环状DNA。这个产物适用于滚环扩增(利用与引物结合序列互补的引物和phi-29聚合酶),以产生所需序列的串联重复。此后利用下一代测序或者可替代地直接SMRT测序在共价闭合模板上利用任选的引物结合序列作为引物结合位点鉴定靶标。
注释1.如果寡核苷酸还包含任选的引物结合位点(即,通用引物结合位点),那么环状DNA将适用于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
所述方法的后续变型利用C6或C18间隔基,这允许拷贝靶miRNA,但防止完成环状产物,且因此消除低水平的所需miRNA的假阳性检测。在相对于5’端的第二位和第三位处含有硫代磷酸根的通用引物的缺口平移无法跨越靶miRNA结合互补序列中间的C6或C18间隔基,从而能够破坏任何未连接的miRNA探针。
用于捕获、识别和量化存在于未经任何选择的血清、血浆或外来体的特定miRNA物质的详细方案:
变型7.3(参见例如图116):7.3.a.从外来体或CTC分离miRNA。用T4激酶使分离的miRNA磷酸化。使寡核苷酸对杂交,其中第一寡核苷酸包含与含有单个C6或C18间隔基的miRNA靶标互补、与独特5’-和3’-接头序列侧接的序列,而第二寡核苷酸包含5’-磷酸化末端,接着为独特3’-接头的互补序列、独特标识符序列、任选的患者标识符序列、任选的引物结合序列和独特5’-接头的互补序列,其最后的碱基为核糖核苷酸碱基。杂交混合物中还存在在距离5’端第二位和第三位含有硫代磷酸根键的通用引物。提供T4 RNA连接酶2来共价密封miRNA的末端,从而产生环状连接产物。
7.3.b.添加具有5’-3’核酸外切酶活性的逆转录酶(利用Mn2+辅因子的Tth DNA聚合酶)和热稳定连接酶(优选来自菌株AK16D),在退火步骤之后或在程序开始时添加dNTP。允许在杂交温度下延伸和连接,并任选地升高温度(例如60℃),以确保完成延伸和连接,以产生现在含有原始靶miRNA的拷贝的环状产物。
7.3.c.添加UDG和AP核酸内切酶以使原始靶标中的miRNA缺口,然后添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下包含原始靶miRNA的拷贝、独特标识符序列、任选的引物结合序列和任选的患者标识符序列的所需单链环状DNA。这个产物适用于滚环扩增(利用与引物结合序列互补的引物和phi-29聚合酶),以产生所需序列的串联重复。此后利用下一代测序或者可替代地直接SMRT测序在共价闭合模板上利用任选的引物结合序列作为引物结合位点鉴定靶标。
注释1.如果寡核苷酸还包含任选的引物结合位点(即,通用引物结合位点),那么环状DNA将适用于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
另一变型(图117)利用与靶miRNA的一部分互补的茎-环捕获探针。详细方案如下文所述:
用于捕获、识别和量化存在于未经任何选择的血清、血浆或外来体的特定miRNA物质的详细方案:
变型7.4(参见例如图117):7.4.a.从外来体或CTC分离miRNA。使由形成茎-环的5’端、与靶miRNA的一部分互补的突出3’-区域组成的茎-环探针杂交。环部分含有独特标识符序列、任选的患者标识符序列、任选的引物结合序列和任选的可裂解连接。用逆转录酶和dNTP延伸茎-环探针的3’端。
7.4.b.使核酸在寡核苷酸(包含与5’-茎-环序列互补的序列和延伸cDNA的3’端)存在下变性(94℃1分钟)。此外,阻断5’端,以防止缺口平移。)并通过冷却至所需温度(例如40-50℃持续30分钟)使寡核苷酸与其在所需片段上的互补区域杂交。
7.4.c.添加KlenTaq(缺乏核酸酶活性的Taq聚合酶)和热稳定连接酶(优选来自菌株AK16D),在退火步骤之后或在程序开始时添加dNTP。KlenTaq延伸3’端,直到它与可连接的5’端直接毗邻。允许在杂交温度下进行延伸和连接,并且任选地升高温度(例如60℃)以确保完成延伸和连接,以产生环状产物。
7.4.d.在可裂解连接处裂解寡核苷酸探针(例如,使用UDG和AP核酸内切酶裂解的U)。添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接的产物和过量探针,只留下包含一小段的原始靶DNA的拷贝、独特标识符序列、任选的引物结合序列和任选的患者标识符序列组成的所需单链环状cDNA。这种产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶),以产生所需序列的串联重复,随后在共价闭合模板上利用下一代测序或可替代地直接SMRT测序,使用引物结合序列作为引物结合位点识别靶标。
注释1.如果寡核苷酸还包含任选的引物结合位点(即,通用引物结合位点),那么环状DNA将适用于PCR扩增,随后利用下一代测序、TaqMan测定、UniTaq测定、实时PCR测定、数字PCR、微阵列、杂交或其它检测方法识别靶标。
预测性实施例8--孕妇血浆样品的产前诊断的临床需要。
在产前护理领域中,迫切需要开发用于常见非整倍性(诸如三体性21、18或13)、小片段缺失(诸如由杜氏肌营养不良(Duchenne muscular dystrophy,DMD)基因的缺失引起的那些)、其它小拷贝数异常(诸如与自闭症有关的那些)、确定潜在临床表现的平衡易位、可导致与印记相关的疾病如安格尔曼综合征(Angelman’s syndrome)或普拉德-威利综合征(Prader-Willi syndrome)的甲基化变化、负责诸如亨廷顿氏病(Huntington’sdisease)的疾病的三联体重复变化、点突变(诸如在负责囊性纤维化的CFTR基因中的那些)的非侵入式测定。
综述:最近的工作已证明,血浆中胎儿DNA占母体DNA的百分比在第一个、第二个和第三个三月期中分别为约6%、20%和26%。由于DNA的降解方式,母体DNA通常为约160个碱基,且仍与H1组蛋白相关,而胎儿DNA为约140个碱基,且与组蛋白不缔合。根据临床需求,且在知道将提供最佳护理时,可开发出具有足够灵敏度来检测合适三月期中的胎儿DNA的测试。
存在约3,500种隐性遗传病症,其中基因是已知。最常见病症是由DNA拷贝异常引起的,诸如在三体性21中的额外染色体或是诸如杜氏肌营养不良(DMD)基因的基因的一部分的缺失。在考虑产前筛查时,需要平衡遗传病症的可能性对比手术风险。当前,护理标准推荐35岁待产妇女在第17周期间进行羊膜穿刺术,因为1/200的三体性21或其它染色体非整倍性现在与手术后的自然流产匹配。
在考虑使用本文所述核酸测序方法进行产前筛查时,推荐两个水平的测试。为低成本筛查所有孕期的三体性21、13和18,本发明的测序方法可用于快速识别染色体21、13和18上的差异化表达的基因,例如识别那些在胎儿中因为甲基化沉默而关闭的但成人中是开启的基因。在三个对照染色体,即2、5、7上识别类似的区域。即使在从第一个三月期的母亲血清分离DNA时,也可以通过比较对照染色体区域中的甲基化DNA与未甲基化DNA快速计算起源于胎儿的DNA的百分比–在本文的实施例中,将为6%。如果在任何其它染色体处存在三体性(即,三体性21),那么来自此染色体的启动子将示出约9%的甲基化,换句话说,稍微比正常二体性情况高50%。推荐对1,000个基因组当量评分,使得三体性情况的计数为90个的甲基化拷贝容易与正常样品的60个甲基化拷贝区分。
作为此程序的第一步骤,为了识别那些在胎儿DNA中在最早发育阶段被甲基化、但在母体DNA中从不被甲基化的启动子区域(即WBC)。这需要通过比较从怀有二倍体胎儿、含有三体性的胎儿和未怀孕的女性分离的cfDNA的甲基化模式依据经验进行。为了关于使用用于NIPD的表观遗传标记的一般综述,参见Patsalis等人,“A New Non-invasivePrenatal Diagnosis of Down syndrome through Epigenetic Markers and Real-timeqPCR,”Expert Opin Biol Ther.12增刊1:S155-61(2012),该文献以引用的方式整体并入本文中。作为实例,检测单个标记物PDE9A处的甲基化状态,参见Lim等人,“Non-invasiveEpigenetic Detection of Fetal Trisomy 21in First Trimester Maternal Plasma,”PLoS One 6(11):e27709(2011),该文献以引用的方式整体并入本文中。本文所述方法将能够快速得多地识别此类标记物。为识别整个基因组的毗邻HinP1I位点处的甲基化,将使用图28中概述的方法。可替代地,当聚焦选定染色体上的已知基因时,可针对特定靶区域设计探针,并如图27中对甲基化评分。这种方法还将用在最后的产前筛查测试中。为获得更充足甲基化位点,即整个基因组的HaeIII位点间的毗邻AciI位点,将使用图36中概述的方法。当聚焦已知基因时,可针对特定靶区域设计探针,并如图36、37、39和40中给甲基化评分。如果以上方法未产生足够标记物,可利用图33中所概述方法识别整个基因组的毗邻AciI位点处的甲基化位点。对于这些位点,可使用图29和31中概述的更多靶向方法。
可替代地,存在某些在胎儿发育期间开启,在成人组织或血液中关闭的基因。在这些条件下,重要的是通过比较从怀有二倍体胎儿、含有三体性的胎儿和未怀孕者的女性分离的cfDNA的未甲基化模式识别未甲基化启动子区域。为识别甲基化模式的全基因组损失,可使用图51、57或62中所述方法。为识别选定染色体上的未甲基化已知基因时,可针对特定靶区域设计探针,并如图53、55、58、60中对未甲基化评分。这种方法还将用在最后的产前筛查测试中。
另外,以上方法将能够精确地量化基因组中其它位置处的甲基化变化,所述甲基化变化可导致与印记相关的疾病,诸如安格尔曼综合征或普拉德-威利综合征。本发明测定甲基化状态和同时通过SNP或重复序列多态性检测测定缺失是在父体染色体上还是在母体染色体上(即,检测上游或下游顺位(cis-located)母体或父体鉴定SNP或重复序列多态性)的能力将改善其诊断辨别印记疾病。
最近已经报道了对染色体片段计数以用于非侵入式产前诊断(被称为DANSR)的基于连接酶的方法(Sparks等人,“Selective Analysis of Cell-free DNA in MaternalBlood for Evaluation of Fetal Trisomy,”Prenat Diagn.32(1):3-9(2012),该文献以引用的方式整体并入本文中)。这种方法基于在染色体臂上的连接反应中使用3个片段:含有上游通用序列的左侧片段、中间片段和含有下游通用序列的右侧片段。连接反应后,从输入引物分离产物,进行PCR扩增和测序。假连接(即上游直接连接至错误下游引物,没有中间段)容易通过测序区分,且少于5%。本发明也可以通过从整个基因组的连接产物捕获特异性靶标(如图63-69中所述),或通过在初始连接事件期间使用靶标特异性探针(如图13-26或图70-78中所述)使用这种方法靶标特异性。
因为以上方法取决于计数染色体区域,技术的精确度可通过利用此类区域中的多态性提高。图70、77和78描述一组用于捕获含有重复序列多态性的片段的技术。这些多态性将允许鉴定整个基因组或确定地方处的拷贝数差异,拷贝增加或拷贝减少–这也与癌症基因组分析相关。三体性可起源于第一次减数分裂期间或第二次减数分裂期间的不分离。我们以精子发生为例。如果不分离出现在第一次减数分裂时,那么同源染色体在后期期间移向同一极。当这些随后分裂形成配子时,两个将为二体(含有每份亲本染色体的1份),且两个将为零体(null-somic)。如果这些配子使整倍体卵受精,所得受精卵将为2个三体(1+1+1)和两个单体。另一方面,如果不分离出现在第二次减数分裂时,那么姐妹染色单体在后期期间移向同一极。当这些随后分裂形成配子时,一个将为二体(含有相同亲本染色体的2份)和一个将为零体,且两个将为整倍体(每个1份染色体)。如果这些配子使整倍体卵受精,所得受精卵将为1个三体(2+1)和一个单体,以及两个整倍体(二体)。对于母体染色体同样适用。因此,三体性胎儿可具有不同的父体和母体染色体的多个组合。
可使用母体DNA的1,000个基因组当量和胎儿DNA的100个基因组当量的实例说明通过对存在拷贝对比存在多态性评分进行区分的差异。当使用高度多态性标记物,诸如具有四核苷酸重复,所述多态性中的3种或所有4种都不同是寻常的。结果将与这些情况作比较,其中母体或父体染色体的标记物是相同或不同的。将染色体2用作对照,并将21用作三体性的实例
情况1(只有拷贝数)
情况2(母体标记纯合的,母体不分离,第一次减数分裂)
*注释:因为等位基因2M1和2M2是相同的,所以总计=2,100。同样,因为等位基因21M1和21M2是相同的,所以总计=2,200。父本等位基因可以是杂合或纯合的
情况3(母体标记纯合的,母体不分离,第二次减数分裂)
*注释:因为等位基因2M1和2M2是相同的,所以总计=2,100。同样,因为等位基因21M1和21M2是相同的,所以总计=2,200。父本等位基因可以是杂合或纯合的
情况4(母体标记杂合的,母体不分离,第一次减数分裂)
情况5(母体标记杂合的,母体不分离,第二次减数分裂)
*注释:存在另一个三体性组合,其中2个等位基因21M1拷贝在受精卵中。
情况6(母体标记纯合的,父本不分离,第一次减数分裂)
*注释:因为等位基因2M1和2M2是相同的,所以总计=2,100。同样,因为等位基因21M1和21M2是相同的,所以总计=2,100。父本等位基因可以是杂合或纯合的
情况7(母体标记纯合的,父本不分离,第二次减数分裂)
*注释:因为等位基因2M1和2M2是相同的,所以总计=2,100。同样,因为等位基因21M1和21M2是相同的,所以总计=2,100。父本等位基因可以是杂合或纯合的
情况8(母体标记杂合的,父本不分离,第一次减数分裂)
情况9(母体标记杂合的,父本不分离,第二次减数分裂)
*注释:存在另一个三体性组合,其中2个等位基因21P2拷贝在受精卵中。
由这个分析可清楚区分三体性,最有用的标记物是其中母本基因座为多态性且父本基因座不同于两个母本等位基因的那些标记物。父本基因座不必为多态性。对于诸如在杜氏肌营养不良中存在的X-连锁缺失,方法较简单,因为该疾病在男孩中最明显。再次比较染色体2与缺失区域中的X染色体将产生:
情况10(母本标记物杂合的,遗传X-连锁缺失)
*注释:遗传区域的缺失
情况11(母本标记物杂合的,胎儿不含X-连锁缺失)
*注释:遗传区域的缺失
情况11(母本标记物杂合的,散发性X-连锁缺失)
*注释:遗传区域的缺失
情况10示出遗传杜氏肌营养不良,其中母亲是携带者。在这些条件下,两个X-染色体等位基因的总量的量出现在一半其它的位置。在情况11中,胎儿未患有该疾病,且在情况12中,该疾病是出现在胎儿中的散发性突变。Y染色体标记物确认了男性中的胎儿。以上示出将如何在DMD基因座上进行基因型分型。如果先前知道母亲是携带者,那么可测定具有相邻多态性的缺失的相位调整(参见下文),那么也可以使用这些相邻的多态性验证胎儿是否也携带缺失,且胎儿是否为男性,以及是否易患所述疾病。这种方法可用于寻找X-连锁和常染色体显性变化。
为测定胎儿是否在含有关于大致3,500种其它病症中的一种的遗传性或散发性突变,包括缺失、点突变或异常甲基化,将推荐更复杂的分析。序列分析容易测定在双亲中存在隐性等位基因。如果突变在双亲中不同,那么可通过评价来自母体血清的无细胞DNA来测定儿童是否是疾病的复合杂合子。为获得分析母体血清中胎儿DNA的完整答案,可能需要这个测定的两部分。首先建立围绕疾病基因的重复区域中的母本SNP或多态性的相位。这可以通过从母亲的白血细胞或父亲的唾液分离高分子量DNA完成。
测定精确单体型或相位可通过使用由Complete Genomics开发的方法的变型(参见Peters等人,“Accurate Whole-genome Sequencing and Haplotyping from 10to20Human Cells,”Nature 487(7406):190-5(2012),该文献以引用的方式整体并入本文中)完成。对于本申请,将HMW DNA分配到96或384孔板中,使得每个孔具有不足一条染色体。随后,使用全基因组扩增测定哪个孔含有染色体,然后测定所考虑的基因的母本疾病等位基因的96个相邻SNP或重复序列多态性的相位。一旦完成,对来自父亲的疾病等位基因的存在评分(如上文方法4中所述),并利用测序验证从母亲遗传的染色体也含有疾病等位基因。本文描述多种用于捕获整个基因组的DNA的重复序列的方法,所述方法可用于鉴定来自原始或全基因组扩增的DNA的多态性。
测定来自二倍体基因组的单体型的能力仍然是技术上极具挑战性和昂贵的任务,这基本上依赖在通过测序或一些其它技术进行基因型分型之前物理分离染色体或亚染色体片段。以下描述用于捕获基因组DNA的相同链上的两个区域,以允许测定由所述两个区域限定的单体型结构的快速且简单的程序。
对于每个潜在靶标,两个寡核苷酸同时杂交,每条寡核苷酸含有与与靶标上的两种多态性中的每种侧接的上游和下游部分互补的序列。这些多态性可为四核苷酸、三核苷酸或二核苷酸重复或SNP。信息量最多的多态性是两条母本染色体中是多态性,以及在转移至胎儿的父亲染色体中是多态性的多态性。使用聚合酶从两个3’端中的每个延伸,以封闭缺口和测定位于两对侧接结合序列间的多态性的基因型。两种靶标多态性不一定彼此毗邻,且可被其它多态性分隔开。两种目标多态性间的距离只受到通过两个寡核苷酸中所含四条结合序列桥接的概率的限制。每个寡核苷酸含有独特标识符序列、任选的患者标识符序列、任选的引物结合序列和在5’端上的任选的磷酸根。
用于测定两种已知多态性间的单体型的详细方案:
变型8.1(参见例如图113):8.1.a.通过产生高(>15kb)分子量材料的方法分离基因组DNA。
8.1.b.使靶DNA在两个寡核苷酸(第一个包含与靶多态性#1上游的独特区域互补的5-’序列、独特标识符序列、任选的患者标识符序列、任选的引物结合序列和与靶多态性#2下游的独特区域互补的3’-序列,且第二个包含与靶多态性#2上游的独特区域互补的5’-序列、独特标识符序列、任选的患者标识符序列和与靶多态性#1下游的独特区域互补的3’序列)存在下变性(94℃1分钟),并通过冷却至所需温度(例如50℃持续2小时)下使寡核苷酸与它们在所需片段上的互补区域杂交。在退火步骤之后或在程序开始时添加Taq聚合酶和/或KlenTaq(缺乏核酸酶活性的Taq聚合酶)和热稳定连接酶(优选来自菌株AK16D)、dNTP。在两条寡核苷酸序列具有5’磷酸根的情况中,KlenTaq延伸3’端,直到它与可连接的5’端(图113的左侧)直接毗邻。在两条寡核苷酸序列具有5’OH的情况下,聚合酶的5’->3’核酸酶活性裂解匹配的5’-重叠碱基,以产生可连接的5’磷酸根(图113的右侧)。允许在杂交温度下进行延伸和连接,并且任选地升高温度(例如60℃)以确保完成延伸和连接,以产生环状产物。
8.1.c.添加核酸外切酶I(以3’->5’方向消化单链DNA)和核酸外切酶III(以3’->5’方向消化双链DNA),以消化所有未连接或有缺口的产物,只留下由原始靶DNA、接头序列、独特标识符序列、任选的引物结合序列和任选的患者标识符序列组成的所需单链环状DNA。这种产物适用于滚环扩增(使用随机六聚体引物和phi-29聚合酶),以产生所需序列的串联重复,随后在共价闭合模板上利用下一代测序或可替代地直接SMRT测序,使用引物结合序列作为引物结合位点识别靶标。
注释1:这种方法还容易建立具有实际导致疾病的突变的单体型(即相位)。引物经设计使得一个多态性位点是实际的疾病基因。
注释2:在使用两个桥接寡核苷酸探针的系统中,每个探针含有独特标识符序列、任选的患者标识符序列和任选的引物结合位点,建议所述寡核苷酸中只有一个而不是两个含有引物结合位点(寡核苷酸上游或下游)。对于另一水平的假阳性检测,建议探针上游和下游的独特标识符序列不同。
注释3:重要的是最大限度形成连接产物,其中两条寡结合序列实际上由一连续段的DNA接合,并最小限度形成桥联片段并不连续的连接产物。
为了进行示意性的说明,考虑以下实施例。上游区域被命名为"X"且具有AGAT四核苷酸重复,而下游区域被命名为"Y"且具有CA二核苷酸重复。下文将上游区域X示为“X-上”,上游引物结合位点;AGAT(n),四核苷酸重复区域和“X-dn”,下游引物结合位点。下文将下游区域Y示为“Y-上”,上游引物结合位点;CA(n),二核苷酸重复区域和“Y-dn”,下游引物结合位点。在这个实施例中,两个区域间隔10kb,且两条母体染色体将具有以下形式:
X-上AGAT(12)X-dn.........(10kb).......Y-上CA(23)Y-dn
X-上AGAT(16)X-dn.........(10kb).......Y-上CA(18)Y-dn
然后添加结合至下部链的连接-延伸引物(如图113中所示)。它们将具有以下形式:
(左侧)5'X-dn-引物位点-标识符#1-Y-上3'
(右侧)5'Y-dn-标识符#2-X-上3'
(在这个实施例中,引物结合位点只在左侧引物中。)
然后由单体型定义的2种可能的连接产物(在引物结合位点是线性化的,所以更容易追踪)将具有以下形式:
引物位点-标识符#1-Y-上CA(23)Y-dn-标识符#2-X-上AGAT(12)X-dn
引物位点-标识符#1-Y-上CA(18)Y-dn-标识符#2-X-上AGAT(16)X-dn
可通过稀释反应物在相同染色体片段上最大限度形成源自连续位点的正确产物,使得源自非连续位点的产物的概率变得无穷小。另外,因为引物大大超过染色体DNA,所以如果两个片段不连续,则每个片段有极高概率已经具有与之结合的“左”和“右”复合引物(即4个结合至两个独立片段的引物)。只有当两个片段是连续的时候,两个区域才有更高概率通过“左”和“右”复合引物中的每一个结合在一起。这是简单的实验,通过产生不同靶浓度相对于连接延伸引物的不同稀释液的条件矩阵来优化正确连接产物的产率。
如果有源自两个在一起的不同染色体区域的不正确连接产物,那么将错误地产生CA(23)与AGAT(16)在一起,且CA(18)与AGAT(12)在一起的产物。
作为一个实例,考虑最坏的情况,其中80%的连接产物源自不连续的桥接片段。为简便起见,假定1,000基因组当量。注意,如果产物源自桥接的片段,那么它们来自相同母体染色体与来自相反染色体(即各自400)的可能性相等。但那些源自连续DNA的产物将只会源自相同母体染色体(即各自200)。因此,应该有以下组合:
CA(23)和AGAT(12)600(=400+200)
CA(23)和AGAT(16)400
CA(18)和AGAT(12)400
CA(18)和AGAT(16)600(=400+200)
即使这些数字在最不利方向上波动50(相当于90%连接产物源自桥接片段),仍将在每条染色体处明确地将单体型区分为CA(23)和AGAT(12);以及CA(18)和AGAT(16)。
CA(23)和AGAT(12)550(=400-50+200)
CA(23)和AGAT(16)450(=400+50)
CA(18)和AGAT(12)450(=400+50)
CA(18)和AGAT(16)550(=400-50+200)
可替代地,在第二方法中,该疾病基因可分成20种最常见遗传疾病,以及常染色体显性疾病,然后分成17组各自涵盖平均200个基因的更不常突变的基因。每组基因将被数组捕获探针覆盖,然后依据亲本测序分析的结果,母体血液将被赋予适当患者标识符,并评价17个专业探针捕获组中的一组或多组。
以上方法中的第一种将识别遗传性和散发性突变,以及测定胎儿是否从母亲遗传带有突变的区域。这种方法还应能够测定存在x-连锁遗传疾病的缺失、其它染色体缺失、胎儿的异常甲基化、由三核苷酸重复引起的疾病和由染色体易位或其它重排引起的疾病。
第二方法将确定被询问基因的疾病条件。关键问题将是家族得到正确答案的重要性。明确确定双亲是否是携带者以及突变是否不同,相对明确地确定父亲的疾病等位基因是否存在于胎儿中。如果其不存在,则胎儿将无疾病或是携带者。如果其存在,则遗传母本等位基因并获得疾病的可能性是50%。如果已经确定母本等位基因的单体型,那么可使用单体型标记物验证存在或不存在遗传母本等位基因。还可以谨慎地进行羊膜穿刺术,并直接测试母本等位基因的存在。当前的建议是如上所述对基因测序并对父本疾病等位基因评分。如果存在或如果父本和母本的疾病特异性突变相同,那么医师建议羊膜穿刺术。
本发明方法也可以用于不平衡的染色体易位的非侵入式产前诊断和植入前遗传诊断(PGD)。携带染色体易位的个体的不孕、流产、死产和/或怀有具有出生缺陷的小孩的风险增加。植入前遗传诊断能够区分具有正确数量的遗传物质的胚胎(平衡/正常)和由于易位而缺乏遗传物质的胚胎(不平衡)。许多其中一个成员是易位携带者的夫妇经历流产或在得知怀有不平衡的染色体组时不得不面对困难决定。基于PGD的本发明方法将通过在已知转移的胚胎具有平衡的染色体易位的概念之前减少不得不处理这些特定情况的可能性。
也可以在植入前筛选中采用对染色体特异性SNP或重复序列多态性评分的方法。与怀孕相反,其中只有三体性21、18和13应对(以及X和Y染色体异常)体外受精,其它染色体异常仍可允许在16、32或更高细胞数阶段生长。因此,整个基因组的多态性将需要对染色体区域的适当拷贝数和损失或增加计数。被询问的多态性数量越高,可越精细地测定拷贝数变化。
预测性实施例9--胎儿的亲权测试(例如产前护理支持)
综述:基本方法是寻找存在于父亲中但不存在于母亲中的等位基因的存在。有两种一般方法来实现这一点。可以从SNP开始,其中常见的等位基因的频率约为70-75%,以便母亲的主要等位基因是纯合型的机会为约50%。从约48个SNP开始,在约一半(24个)的SNP中,母亲的常见等位基因将是纯合的,并且有50%的机会父亲的次要等位基因将是杂合的或纯合的。类似于寻找突变,对母本血液中的次要等位基因的存在进行简单评分,但也将存在的量进行量化,目的只是确认它是来自父亲的次要等位基因。第二种方法是从频率约50%的等位基因开始,然后母亲的一个等位基因有50%的机会是纯合的,然后父亲在此位置处有75%的机会将具有另一个等位基因。区别父亲的信息量少一点,但是更多的位置将提供信息。第三种方法是使用重复序列多态性,其中存在高度多态性,使得父亲的等位基因在给定位置处与母亲任一等位基因不同的可能性高。这将需要最少量的等位基因。在所有这些条件下,医师必须小心尊重母亲的隐私,以防丈夫并非胎儿父亲(无亲权)。
表1:本公开的寡核苷酸序列
/3Phos/=3'磷酸根
/3SpC3/=3'C3间隔基(阻断的3’端)
/5Phos/=5’磷酸根
/5SpC3/=5'C3间隔基(阻断的5’端)
/52-Bio/=5'双重生物素
/idSp/=内部1',2'-二脱氧核糖(dSpacer)
/i5NitInd/=内部5-硝基吲哚
+G=LNA(锁核酸)胍
N=任何碱基
rG=核糖-胍
U=脱氧尿苷
*=硫代硫酸根主链
尽管已经在本文中详细描绘和描述了优选的实施方案,但是对相关领域的技术人员来说显而易见的是,可以在不背离本发明的精神的情况下进行各种修改、添加、替换等并且因此将其视为在如随附权利要求书中所限定的本发明的范围内。
序列表
<110> 康奈尔大学
<120> 从血液特异性靶向捕获人类基因组和转录组区域的方法
<130> 29543.7452 (6632-03-PC)
<140> PCT/US2015/034724
<141> 2015-06-08
<150> US 62/009,047
<151> 2014-06-06
<150> US 62/136,093
<151> 2015-03-20
<160> 154
<170> PatentIn 3.5版
<210> 1
<211> 33
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 1
acactctttc cctacacgac gctcttccga tct 33
<210> 2
<211> 33
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 2
gatcggaaga gcacacgtct gaactccagt cac 33
<210> 3
<211> 29
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 3
aatgatacgg cgaccaccga gatctacac 29
<210> 4
<211> 34
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 4
gtgactggag ttcagacgtg tgctcttccg atct 34
<210> 5
<211> 30
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 5
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 30
<210> 6
<211> 14
<212> DNA
<213> 人工
<220>
<223> 短接头T悬突
<400> 6
tgctcttccg atct 14
<210> 7
<211> 12
<212> DNA
<213> 人工
<220>
<223> 底部接头T悬突
<400> 7
gatcggaaga gc 12
<210> 8
<211> 13
<212> DNA
<213> 人工
<220>
<223> 短接头平端
<400> 8
agatcggaag agc 13
<210> 9
<211> 18
<212> DNA
<213> 人工
<220>
<223> 中间接头T悬突
<400> 9
tcgacgctct tccgatct 18
<210> 10
<211> 16
<212> DNA
<213> 人工
<220>
<223> 中间接头T悬突
<400> 10
gatcggaaga gcacac 16
<210> 11
<211> 29
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (10)..(10)
<223> 位置10处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (15)..(15)
<223> 位置15处的N是脱氧尿苷
<400> 11
aggcaagagn gcctngacga tacagctaa 29
<210> 12
<211> 59
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (40)..(40)
<223> 位置40处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (45)..(45)
<223> 位置45处的N是脱氧尿苷
<400> 12
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aggcaagagn gcctngacga tacagctaa 59
<210> 13
<211> 84
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 13
aggcaagagt gccttgacga tacagctaat tcagaatcat tttgtggacg agatcggaag 60
agcacacgtc tgaactccag tcac 84
<210> 14
<211> 77
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (42)..(42)
<223> 位置42处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (50)..(50)
<223> 位置50处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (64)..(64)
<223> 位置64处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (73)..(73)
<223> 位置73处的N是脱氧尿苷
<400> 14
gagcacacgt ctgaactcca gtcaccgagt aatatctcgt angccgtctn ctgcttgaca 60
cacncgcaat ganacgg 77
<210> 15
<211> 78
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (42)..(42)
<223> 位置42处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (55)..(55)
<223> 位置55处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (67)..(67)
<223> 位置67处的N是脱氧尿苷
<400> 15
gagcgtcgtg tagggaaaga gtgtaggcta tagtgtagat cncggtggtc gccgnatcat 60
tgcgagngtg tcaagcag 78
<210> 16
<211> 83
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 16
acactctttc cctacacgac gctcttccga tctttattat aaggcctgct gaaaatgact 60
gaatataaac ttgtggtagt tgg 83
<210> 17
<211> 37
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (15)..(15)
<223> 位置15处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (22)..(22)
<223> 位置22处的N是脱氧尿苷
<400> 17
ccaactacca caagnttata tncagtcatt ttcagca 37
<210> 18
<211> 67
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (45)..(45)
<223> 位置45处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (52)..(52)
<223> 位置52处的N是脱氧尿苷
<400> 18
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa ccaactacca caagnttata tncagtcatt 60
ttcagca 67
<210> 19
<211> 30
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (11)..(11)
<223> 位置11处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (20)..(20)
<223> 位置20处的N是脱氧尿苷
<400> 19
ctcgatggag ngggtcccan cagtttgaac 30
<210> 20
<211> 60
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (41)..(41)
<223> 位置41处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (50)..(50)
<223> 位置50处的N是脱氧尿苷
<400> 20
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa ctcgatggag ngggtcccan cagtttgaac 60
<210> 21
<211> 84
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 21
ctcgatggag tgggtcccat cagtttgaac agttgtctgg atccattttg agatcggaag 60
agcacacgtc tgaactccag tcac 84
<210> 22
<211> 83
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 22
acactctttc cctacacgac gctcttccga tcttttcttc atgaagacct cacagtaaaa 60
ataggtgatt ttggtctagc tac 83
<210> 23
<211> 41
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (16)..(16)
<223> 位置16处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (27)..(27)
<223> 位置27处的N是脱氧尿苷
<400> 23
gtagctagac caaaancacc tattttnact gtgaggtctt c 41
<210> 24
<211> 71
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (46)..(46)
<223> 位置46处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (57)..(57)
<223> 位置57处的N是脱氧尿苷
<400> 24
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gtagctagac caaaancacc tattttnact 60
gtgaggtctt c 71
<210> 25
<211> 25
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (10)..(10)
<223> 位置10处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (18)..(18)
<223> 位置18处的N是脱氧尿苷
<400> 25
gtgcagctgn gggttgantc cacac 25
<210> 26
<211> 55
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (40)..(40)
<223> 位置40处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (48)..(48)
<223> 位置48处的N是脱氧尿苷
<400> 26
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gtgcagctgn gggttgantc cacac 55
<210> 27
<211> 83
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 27
gtgcagctgt gggttgattc cacacccccg cccggcaccc gcgtccgcga gatcggaaga 60
gcacacgtct gaactccagt cac 83
<210> 28
<211> 83
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 28
acactctttc cctacacgac gctcttccga tcttcctaca gtactcccct gccctcaaca 60
agatgttttg ccaactggcc aag 83
<210> 29
<211> 29
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (11)..(11)
<223> 位置11处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (21)..(21)
<223> 位置21处的N是脱氧尿苷
<400> 29
cttggccagt nggcaaaaca ncttgttga 29
<210> 30
<211> 59
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (41)..(41)
<223> 位置41处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (51)..(51)
<223> 位置51处的N是脱氧尿苷
<400> 30
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa cttggccagt nggcaaaaca ncttgttga 59
<210> 31
<211> 26
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (10)..(10)
<223> 位置10处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (15)..(15)
<223> 位置15处的N是脱氧尿苷
<400> 31
gagcgctgcn caganagcga tggtga 26
<210> 32
<211> 56
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (40)..(40)
<223> 位置40处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (45)..(45)
<223> 位置45处的N是脱氧尿苷
<400> 32
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gagcgctgcn caganagcga tggtga 56
<210> 33
<211> 84
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 33
gagcgctgct cagatagcga tggtgagcag ctggagctgg agagacgaca agatcggaag 60
agcacacgtc tgaactccag tcac 84
<210> 34
<211> 83
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 34
acactctttc cctacacgac gctcttccga tcttccgcgc catggccatc tacaagcagt 60
cacagcacat gacggaggtt gtg 83
<210> 35
<211> 27
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (12)..(12)
<223> 位置12处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (20)..(20)
<223> 位置20处的N是脱氧尿苷
<400> 35
cacaacctcc gncatgtgcn gtgactg 27
<210> 36
<211> 57
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (42)..(42)
<223> 位置42处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (50)..(50)
<223> 位置50处的N是脱氧尿苷
<400> 36
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa cacaacctcc gncatgtgcn gtgactg 57
<210> 37
<211> 31
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (11)..(11)
<223> 位置11处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (22)..(22)
<223> 位置22处的N是脱氧尿苷
<400> 37
gaaacacttt ncgacatagt gnggtggtgc c 31
<210> 38
<211> 61
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (41)..(41)
<223> 位置41处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (52)..(52)
<223> 位置52处的N是脱氧尿苷
<400> 38
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaaacacttt ncgacatagt gnggtggtgc 60
c 61
<210> 39
<211> 84
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 39
gaaacacttt tcgacatagt gtggtggtgc cctatgagcc gcctgaggtc agatcggaag 60
agcacacgtc tgaactccag tcac 84
<210> 40
<211> 83
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 40
acactctttc cctacacgac gctcttccga tctggcccct cctcagcatc ttatccgagt 60
ggaaggaaat ttgcgtgtgg agt 83
<210> 41
<211> 27
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (15)..(15)
<223> 位置15处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (20)..(20)
<223> 位置20处的N是脱氧尿苷
<400> 41
actccacacg caaanttccn tccactc 27
<210> 42
<211> 57
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (45)..(45)
<223> 位置45处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (50)..(50)
<223> 位置50处的N是脱氧尿苷
<400> 42
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa actccacacg caaanttccn tccactc 57
<210> 43
<211> 28
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (12)..(12)
<223> 位置12处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (18)..(18)
<223> 位置18处的N是脱氧尿苷
<400> 43
cctcaccatc ancacacngg aagactcc 28
<210> 44
<211> 58
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (42)..(42)
<223> 位置42处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (48)..(48)
<223> 位置48处的N是脱氧尿苷
<400> 44
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa cctcaccatc ancacacngg aagactcc 58
<210> 45
<211> 84
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 45
cctcaccatc atcacactgg aagactccag gtcaggagcc acttgccacc agatcggaag 60
agcacacgtc tgaactccag tcac 84
<210> 46
<211> 83
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 46
acactctttc cctacacgac gctcttccga tctgctctga ctgtaccacc atccactaca 60
actacatgtg taacagttcc tgc 83
<210> 47
<211> 34
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (12)..(12)
<223> 位置12处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (20)..(20)
<223> 位置20处的N是脱氧尿苷
<400> 47
gcaggaactg tnacacatgn agttgtagtg gatg 34
<210> 48
<211> 64
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (42)..(42)
<223> 位置42处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (50)..(50)
<223> 位置50处的N是脱氧尿苷
<400> 48
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gcaggaactg tnacacatgn agttgtagtg 60
gatg 64
<210> 49
<211> 24
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (15)..(15)
<223> 位置15处的N是脱氧尿苷
<400> 49
gggagagacc ggcgnacaga ggaa 24
<210> 50
<211> 54
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (45)..(45)
<223> 位置45处的N是脱氧尿苷
<400> 50
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gggagagacc ggcgnacaga ggaa 54
<210> 51
<211> 84
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (15)..(15)
<223> 位置15处的N是脱氧尿苷
<400> 51
gggagagacc ggcgnacaga ggaagagaat ctccgcaaga aaggagagcc agatcggaag 60
agcacacgtc tgaactccag tcac 84
<210> 52
<211> 83
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 52
acactctttc cctacacgac gctcttccga tctctctttt cctatcctga gtagtggtaa 60
tctactggga cggaacagct ttg 83
<210> 53
<211> 28
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (7)..(7)
<223> 位置7处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (14)..(14)
<223> 位置14处的N是脱氧尿苷
<400> 53
caaagcngtt ccgncccagt agattacc 28
<210> 54
<211> 58
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (37)..(37)
<223> 位置37处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (44)..(44)
<223> 位置44处的N是脱氧尿苷
<400> 54
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa caaagcngtt ccgncccagt agattacc 58
<210> 55
<211> 25
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (12)..(12)
<223> 位置12处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (17)..(17)
<223> 位置17处的N是脱氧尿苷
<400> 55
gtaggcaaga gngcttngac gatac 25
<210> 56
<211> 55
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (42)..(42)
<223> 位置42处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (47)..(47)
<223> 位置47处的N是脱氧尿苷
<400> 56
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gtaggcaaga gngcttngac gatac 55
<210> 57
<211> 119
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (81)..(85)
<223> n是a、c、g或t
<400> 57
gtaggcaaga gtgctttgac gatacagctg attcagaatc atttcgtgga cgaatatgac 60
ccaacaatag aggtagatct nnnnnagatc ggaagagcac acgtctgaac tccagtcac 119
<210> 58
<211> 77
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (42)..(42)
<223> 位置42处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (50)..(50)
<223> 位置50处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (64)..(64)
<223> 位置64处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (73)..(73)
<223> 位置73处的N是脱氧尿苷
<400> 58
gagcacacgt ctgaactcca gtcacttctg aatatctcgt angccgtctn ctgcttgaca 60
cacncgcaat ganacgg 77
<210> 59
<211> 78
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (42)..(42)
<223> 位置42处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (55)..(55)
<223> 位置55处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (67)..(67)
<223> 位置67处的N是脱氧尿苷
<400> 59
gagcgtcgtg tagggaaaga gtgtgcctct atgtgtagat cncggtggtc gccgnatcat 60
tgcgagngtg tcaagcag 78
<210> 60
<211> 118
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (34)..(38)
<223> n是a、c、g或t
<400> 60
acactctttc cctacacgac gctcttccga tctnnnnnct aatatggtca cattttcatt 60
gtttttatta taaggtctgc tgaaaatgac cgaatataaa cttgtagtag ttggagct 118
<210> 61
<211> 31
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (10)..(10)
<223> 位置10处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (20)..(20)
<223> 位置20处的N是脱氧尿苷
<400> 61
agctccaacn actacaagtn tatattcggt c 31
<210> 62
<211> 61
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (40)..(40)
<223> 位置40处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (50)..(50)
<223> 位置50处的N是脱氧尿苷
<400> 62
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa agctccaacn actacaagtn tatattcggt 60
c 61
<210> 63
<211> 21
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (4)..(4)
<223> 位置4处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (10)..(10)
<223> 位置10处的N是脱氧尿苷
<400> 63
aaanctcgan ggagcgggtc c 21
<210> 64
<211> 51
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (34)..(34)
<223> 位置34处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (40)..(40)
<223> 位置40处的N是脱氧尿苷
<400> 64
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaanctcgan ggagcgggtc c 51
<210> 65
<211> 119
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (81)..(85)
<223> n是a、c、g或t
<400> 65
aaatctcgat ggagcgggtc ccatcagttc gaacagttgt ctgggtccat tttgtggata 60
gtaagaattg aggctgtttt nnnnnagatc ggaagagcac acgtctgaac tccagtcac 119
<210> 66
<211> 118
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (34)..(38)
<223> n是a、c、g或t
<400> 66
acactctttc cctacacgac gctcttccga tctnnnnntt tccttcactt actacacctc 60
ggatatattt cttcacgaag acctcacagt gaaaataggt gatttcggtc tagctaca 118
<210> 67
<211> 30
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (7)..(7)
<223> 位置7处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (17)..(17)
<223> 位置17处的N是脱氧尿苷
<400> 67
tgtagcnaga ccgaaancac ctattttcac 30
<210> 68
<211> 60
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (37)..(37)
<223> 位置37处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (47)..(47)
<223> 位置47处的N是脱氧尿苷
<400> 68
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa tgtagcnaga ccgaaancac ctattttcac 60
<210> 69
<211> 18
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (7)..(7)
<223> 位置7处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (15)..(15)
<223> 位置15处的N是脱氧尿苷
<400> 69
aggcgcngcc cccancat 18
<210> 70
<211> 48
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (37)..(37)
<223> 位置37处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (45)..(45)
<223> 位置45处的N是脱氧尿苷
<400> 70
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aggcgcngcc cccancat 48
<210> 71
<211> 119
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (81)..(85)
<223> n是a、c、g或t
<400> 71
aggcgctgcc cccatcatga gcgctgctcg gatagcgatg gtgaacagct ggagctggaa 60
agacgacagg gctggctgcc nnnnnagatc ggaagagcac acgtctgaac tccagtcac 119
<210> 72
<211> 118
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (34)..(38)
<223> n是a、c、g或t
<400> 72
acactctttc cctacacgac gctcttccga tctnnnnntg tgggtcgatt ccacaccccc 60
acccggcacc cgcgttcgcg ccatggccat ttacaagcag tcacaacaca tgacggag 118
<210> 73
<211> 29
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (11)..(11)
<223> 位置11处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (20)..(20)
<223> 位置20处的N是脱氧尿苷
<400> 73
ctccgtcatg ngttgtgacn gcttgtaaa 29
<210> 74
<211> 59
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (41)..(41)
<223> 位置41处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (50)..(50)
<223> 位置50处的N是脱氧尿苷
<400> 74
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa ctccgtcatg ngttgtgacn gcttgtaaa 59
<210> 75
<211> 26
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (8)..(8)
<223> 位置8处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (18)..(18)
<223> 位置18处的N是脱氧尿苷
<400> 75
aacacttntc gacacagngt ggtggt 26
<210> 76
<211> 56
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (38)..(38)
<223> 位置38处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (48)..(48)
<223> 位置48处的N是脱氧尿苷
<400> 76
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aacacttntc gacacagngt ggtggt 56
<210> 77
<211> 119
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (81)..(85)
<223> n是a、c、g或t
<400> 77
aacacttttc gacacagtgt ggtggtgcct tatgagccgc ctgaagtctg gtttgcaacc 60
ggagtctctg ggaggaaggg nnnnnagatc ggaagagcac acgtctgaac tccagtcac 119
<210> 78
<211> 118
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (34)..(38)
<223> n是a、c、g或t
<400> 78
acactctttc cctacacgac gctcttccga tctnnnnnct cactgactgc tcttaggtct 60
agcccctcct cagcacctta tccgagtgga gggaaatttg cgtgtagagt atttggat 118
<210> 79
<211> 31
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (11)..(11)
<223> 位置11处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (23)..(23)
<223> 位置23处的N是脱氧尿苷
<400> 79
atccaaatac nctacacgca aanttccctc c 31
<210> 80
<211> 61
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (41)..(41)
<223> 位置41处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (53)..(53)
<223> 位置53处的N是脱氧尿苷
<400> 80
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa atccaaatac nctacacgca aanttccctc 60
c 61
<210> 81
<211> 21
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (8)..(8)
<223> 位置8处的N是脱氧尿苷
<400> 81
ggcggcanga accgaagacc c 21
<210> 82
<211> 51
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (38)..(38)
<223> 位置38处的N是脱氧尿苷
<400> 82
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa ggcggcanga accgaagacc c 51
<210> 83
<211> 119
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (81)..(85)
<223> n是a、c、g或t
<400> 83
ggcggcatga accgaaggcc catcctcact atcatcacac tggaggactc caggtcagga 60
accacttgcc accctgtaca nnnnnagatc ggaagagcac acgtctgaac tccagtcac 119
<210> 84
<211> 118
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (34)..(38)
<223> n是a、c、g或t
<400> 84
acactctttc cctacacgac gctcttccga tctnnnnntg gcctcacctt gggcctgtgt 60
catctcctag gttggttctg actgtaccac tatccactac aactatatgt gtaacagt 118
<210> 85
<211> 35
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (12)..(12)
<223> 位置12处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (23)..(23)
<223> 位置23处的N是脱氧尿苷
<400> 85
actgttacac anatagttgt agnggatagt ggtac 35
<210> 86
<211> 65
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (42)..(42)
<223> 位置42处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (53)..(53)
<223> 位置53处的N是脱氧尿苷
<400> 86
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa actgttacac anatagttgt agnggatagt 60
ggtac 65
<210> 87
<211> 21
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (9)..(9)
<223> 位置9处的N是脱氧尿苷
<400> 87
agagaccgnc gcacggagga a 21
<210> 88
<211> 51
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (39)..(39)
<223> 位置39处的N是脱氧尿苷
<400> 88
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa agagaccgnc gcacggagga a 51
<210> 89
<211> 119
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (9)..(9)
<223> 位置9处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (81)..(85)
<223> n是a、c、g或t
<400> 89
agagaccgnc gcacggagga agagaatctt cgcaagaaag gagaacctca ccacgagcta 60
cccccaggga gcaccaagcg nnnnnagatc ggaagagcac acgtctgaac tccagtcac 119
<210> 90
<211> 118
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (34)..(38)
<223> n是a、c、g或t
<400> 90
acactctttc cctacacgac gctcttccga tctnnnnntt actgcttctt gcttctcttc 60
tcctatcctg agtaatggta atctactgga acggaacagc tttgaagtgc gtgtttgt 118
<210> 91
<211> 26
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (13)..(13)
<223> 位置13处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (21)..(21)
<223> 位置21处的N是脱氧尿苷
<400> 91
acaaacacgc acntcaaagc ngttcc 26
<210> 92
<211> 56
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (43)..(43)
<223> 位置43处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (51)..(51)
<223> 位置51处的N是脱氧尿苷
<400> 92
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa acaaacacgc acntcaaagc ngttcc 56
<210> 93
<211> 34
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (30)..(30)
<223> 位置30处的N是核糖尿苷
<400> 93
aaggcctgct gaaaatgctg aatataaacn tgta 34
<210> 94
<211> 36
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (32)..(32)
<223> 位置32处的N是核糖鸟苷
<400> 94
cgtccacaaa atgattcgaa ttagctgtat cntcag 36
<210> 95
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (35)..(35)
<223> 位置35处的N是核糖腺苷
<400> 95
tcagatatat ttcttcatga gacctcacag taaanataa 39
<210> 96
<211> 33
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (29)..(29)
<223> 位置29处的N是核糖尿苷
<400> 96
acaaaatgga tccagcaact gttcaaacng ata 33
<210> 97
<211> 30
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (26)..(26)
<223> 位置26处的N是核糖腺苷
<400> 97
cgccatggcc atcacaagca gtcacngcat 30
<210> 98
<211> 29
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (25)..(25)
<223> 位置25处的N是核糖鸟苷
<400> 98
gctgctcacc atcctatctg agcancgca 29
<210> 99
<211> 32
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (28)..(28)
<223> 位置28处的N是核糖腺苷
<400> 99
cttcctacag tactccctgc cctcaacnag ac 32
<210> 100
<211> 29
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (25)..(25)
<223> 位置25处的N是核糖鸟苷
<400> 100
ggcggaggtg tgaatcaacc cacanctgt 29
<210> 101
<211> 33
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (29)..(29)
<223> 位置29处的N是核糖尿苷
<400> 101
cctcagcatc ttatcgagtg gaaggaaant tgt 33
<210> 102
<211> 24
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (20)..(20)
<223> 位置20处的N是核糖胞嘧啶
<400> 102
cggctcatag ggaccaccan actg 24
<210> 103
<211> 35
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (31)..(31)
<223> 位置31处的N是核糖腺苷
<400> 103
ctctgactgt accaccacca ctacaactac ntgta 35
<210> 104
<211> 31
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (27)..(27)
<223> 位置27处的N是核糖尿苷
<400> 104
ctgacctgga gtcttcagtg tgatganggt a 31
<210> 105
<211> 33
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (29)..(29)
<223> 位置29处的N是核糖腺苷
<400> 105
tgagtagtgg taatctactg gacggaacng ctc 33
<210> 106
<211> 32
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (28)..(28)
<223> 位置28处的N是核糖胞嘧啶
<400> 106
gctccccttt cttgggagat tctcttcntc ta 32
<210> 107
<211> 70
<212> DNA
<213> 人工
<220>
<223> KRAS上链捕获oligo
<400> 107
tttttttttt gctggtggcg taggcaagag tgccttgacg atacagctaa ttcagaatca 60
ttttgtggac 70
<210> 108
<211> 70
<212> DNA
<213> 人工
<220>
<223> KRAS下链捕获oligo
<400> 108
tttttttttt acgccaccag ctccaactac cacaagttta tattcagtca ttttcagcag 60
gccttataat 70
<210> 109
<211> 70
<212> DNA
<213> 人工
<220>
<223> BRAF上链捕获oligo
<400> 109
tttttttttt gctacagtga aatctcgatg gagtgggtcc catcagtttg aacagttgtc 60
tggatccatt 70
<210> 110
<211> 70
<212> DNA
<213> 人工
<220>
<223> BRAF下链捕获oligo
<400> 110
tttttttttt gatttcactg tagctagacc aaaatcacct atttttactg tgaggtcttc 60
atgaagaaat 70
<210> 111
<211> 70
<212> DNA
<213> 人工
<220>
<223> TP53外显子5.1上链捕获oligo
<400> 111
tttttttttt aagacctgcc ctgtgcagct gtgggttgat tccacacccc cgcccggcac 60
ccgcgtccgc 70
<210> 112
<211> 70
<212> DNA
<213> 人工
<220>
<223> TP53外显子5.1下链捕获oligo
<400> 112
tttttttttt cacagggcag gtcttggcca gttggcaaaa catcttgttg agggcaggag 60
agtactgtag 70
<210> 113
<211> 70
<212> DNA
<213> 人工
<220>
<223> TP53外显子5.2上链捕获oligo
<400> 113
tttttttttt aggcgctgcc cccaccatga gcgctgctca gatagcgatg gtgagcagct 60
ggagctggag 70
<210> 114
<211> 70
<212> DNA
<213> 人工
<220>
<223> TP53外显子5.2下链捕获oligo
<400> 114
tttttttttt gggcagcgcc tcacaacctc cgtcatgtgc tgtgactgct tgtagatggc 60
catggcgcgg 70
<210> 115
<211> 70
<212> DNA
<213> 人工
<220>
<223> TP53外显子6上链捕获oligo
<400> 115
tttttttttt ttggatgaca gaaacacttt tcgacatagt gtggtggtgc cctatgagcc 60
gcctgaggtc 70
<210> 116
<211> 70
<212> DNA
<213> 人工
<220>
<223> TP53外显子6下链捕获oligo
<400> 116
tttttttttt gtcatccaaa tactccacac gcaaatttcc ttccactcgg ataagatgct 60
gaggaggagc 70
<210> 117
<211> 70
<212> DNA
<213> 人工
<220>
<223> TP53外显子7上链捕获oligo
<400> 117
tttttttttt ggcggcatga accggaggcc catcctcacc atcatcacac tggaagactc 60
caggtcagga 70
<210> 118
<211> 70
<212> DNA
<213> 人工
<220>
<223> TP53外显子7下链捕获oligo
<400> 118
tttttttttt catgccgccc atgcaggaac tgttacacat gtagttgtag tggatggtgg 60
tacagtcaga 70
<210> 119
<211> 70
<212> DNA
<213> 人工
<220>
<223> TP53外显子8上链捕获oligo
<400> 119
tttttttttt tgtcctggga gagaccgacg cacagaggaa gagaatctcc gcaagaaagg 60
agagcctcac 70
<210> 120
<211> 70
<212> DNA
<213> 人工
<220>
<223> TP53外显子8下链捕获oligo
<400> 120
tttttttttt cccaggacat gcacaaacac gcacctcaaa gctgttccgt cccagtagat 60
taccactact 70
<210> 121
<211> 42
<212> DNA
<213> 人工
<220>
<223> 平端接头
<220>
<221> misc_feature
<222> (6)..(6)
<223> 位置6处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (12)..(12)
<223> 位置12处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (21)..(21)
<223> 位置21处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (35)..(39)
<223> n是a、c、g或t
<400> 121
gtgacnggag tncagacgtg ngctcttccg atctnnnnng cc 42
<210> 122
<211> 21
<212> DNA
<213> 人工
<220>
<223> 平端接头
<220>
<221> misc_feature
<222> (4)..(8)
<223> 位置4-8处的N是5'硝基吲哚
<220>
<221> misc_feature
<222> (12)..(12)
<223> 位置12处的N是脱氧尿苷
<400> 122
ggcnnnnnag ancggaagag c 21
<210> 123
<211> 27
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (4)..(4)
<223> 位置4处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (15)..(15)
<223> 位置15处的N是脱氧尿苷
<400> 123
agancggaag agcgncgtgt agggaaa 27
<210> 124
<211> 57
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (34)..(34)
<223> 位置34处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (45)..(45)
<223> 位置45处的N是脱氧尿苷
<400> 124
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa agancggaag agcgncgtgt agggaaa 57
<210> 125
<211> 92
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (4)..(4)
<223> 位置4处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (15)..(15)
<223> 位置15处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (31)..(31)
<223> 位置31处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (49)..(49)
<223> 位置49处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (64)..(64)
<223> 位置64处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (80)..(80)
<223> 位置80处的N是脱氧尿苷
<400> 125
agancggaag agcgncgtgt agggaaagag ngtaggatag ggtgtaganc tcggtggtcg 60
ccgnatcatt gcgagtgtgn caagcagaag ac 92
<210> 126
<211> 82
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (19)..(19)
<223> 位置19处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (31)..(31)
<223> 位置31处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (49)..(49)
<223> 位置49处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (65)..(65)
<223> 位置65处的N是脱氧尿苷
<400> 126
aaaaaggaag agcacacgnc tgaactccag ncaccgagta atatctcgna tgccgtcttc 60
tgctngacac actcgcaatg at 82
<210> 127
<211> 27
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (19)..(19)
<223> 位置19处的N是脱氧尿苷
<400> 127
aaaaaggaag agcacacgnc tgaactc 27
<210> 128
<211> 52
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (44)..(44)
<223> 位置44处的N是脱氧尿苷
<400> 128
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa ggaagagcac acgnctgaac tc 52
<210> 129
<211> 84
<212> DNA
<213> 人工
<220>
<223> 长D702平端接头
<220>
<221> misc_feature
<222> (10)..(10)
<223> 位置10处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (27)..(27)
<223> 位置27处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (35)..(35)
<223> 位置35处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (48)..(48)
<223> 位置48处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (54)..(54)
<223> 位置54处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (63)..(63)
<223> 位置63处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (77)..(81)
<223> n是a、c、g或t
<400> 129
gcgagtgtgn caagcagaag acggcanacg agatnccgga gagtgacngg agtncagacg 60
tgngctcttc cgatctnnnn ngcc 84
<210> 130
<211> 100
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (18)..(18)
<223> 位置18处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (33)..(33)
<223> 位置33处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (51)..(51)
<223> 位置51处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (64)..(64)
<223> 位置64处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (80)..(80)
<223> 位置80处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (96)..(96)
<223> 位置96处的N是脱氧尿苷
<400> 130
agatcggaag agcgtcgngt agggaaagag tgnaggatag ggtgtagatc ncggtggtcg 60
ccgnatcatt gcgagtgtgn caagcagaag acggcntttt 100
<210> 131
<211> 70
<212> DNA
<213> 人工
<220>
<223> D503硫代磷酸根接头
<400> 131
aatgatacgg cgaccaccga gatctacacc ctatcctaca ctctttccct acacgacgct 60
cttccgatct 70
<210> 132
<211> 65
<212> DNA
<213> 人工
<220>
<223> D707接头
<400> 132
gatcggaaga gcacacgtct gaactccagt cacagcttca gatctcgtat gccgtcttct 60
gcttg 65
<210> 133
<211> 67
<212> DNA
<213> 人工
<220>
<223> 通用反向接头桥接
<220>
<221> misc_feature
<222> (9)..(9)
<223> 位置9处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (22)..(22)
<223> 位置22处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (38)..(38)
<223> 位置38处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (55)..(55)
<223> 位置55处的N是脱氧尿苷
<400> 133
tgtagatcnc ggtggtcgcc gnatcattgc gagtgtgnca agcagaagac ggcanacgag 60
atttttt 67
<210> 134
<211> 70
<212> DNA
<213> 人工
<220>
<223> D504硫代磷酸根接头
<400> 134
aatgatacgg cgaccaccga gatctacacg gctctgaaca ctctttccct acacgacgct 60
cttccgatct 70
<210> 135
<211> 11
<212> DNA
<213> 人工
<220>
<223> 小5'-phos接头
<400> 135
cctccgaccg t 11
<210> 136
<211> 82
<212> DNA
<213> 人工
<220>
<223> D708修饰接头
<220>
<221> misc_feature
<222> (11)..(16)
<223> n是a、c、g或t
<400> 136
cggtcggagg nnnnnnagat cggaagagca cacgtctgaa ctccagtcac gcgcattaat 60
ctcgtatgcc gtcttctgct tg 82
<210> 137
<211> 70
<212> DNA
<213> 人工
<220>
<223> D505硫代磷酸根接头
<400> 137
aatgatacgg cgaccaccga gatctacaca ggcgaagaca ctctttccct acacgacgct 60
cttccgatct 70
<210> 138
<211> 9
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 138
ctccgaccg 9
<210> 139
<211> 79
<212> DNA
<213> 人工
<220>
<223> D506 - 2rG-LNA接头
<220>
<221> misc_feature
<222> (71)..(76)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (77)..(78)
<223> 位置77-78处的N是核糖鸟苷
<220>
<221> misc_feature
<222> (79)..(79)
<223> 位置79处的N是锁核酸鸟苷
<400> 139
aatgatacgg cgaccaccga gatctacact aatcttaaca ctctttccct acacgacgct 60
cttccgatct nnnnnnnnn 79
<210> 140
<211> 65
<212> DNA
<213> 人工
<220>
<223> D709接头
<400> 140
gatcggaaga gcacacgtct gaactccagt caccatagcc gatctcgtat gccgtcttct 60
gcttg 65
<210> 141
<211> 107
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (20)..(20)
<223> 位置20处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (40)..(40)
<223> 位置40处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (50)..(50)
<223> 位置50处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (66)..(66)
<223> 位置66处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (80)..(80)
<223> 位置80处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (96)..(96)
<223> 位置96处的N是脱氧尿苷
<400> 141
cgatacagct aattcagaan cattttgtgg acgaattttn aggtcgccgn atcattgcga 60
gtgtgncaag cagaagacgn tttttgctgg tggcgnaggc aagagtg 107
<210> 142
<211> 115
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (27)..(27)
<223> 位置27处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (49)..(49)
<223> 位置49处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (59)..(59)
<223> 位置59处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (75)..(75)
<223> 位置75处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (89)..(89)
<223> 位置89处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (106)..(106)
<223> 位置106处的N是脱氧尿苷
<400> 142
ttatattcag tcattttcag caggccntat aataaaaata atgattttna ggtcgccgna 60
tcattgcgag tgtgncaagc agaagacgnt ttttacgcca ccagcnccaa ctacc 115
<210> 143
<211> 110
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (14)..(14)
<223> 位置14处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (20)..(20)
<223> 位置20处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (36)..(36)
<223> 位置36处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (46)..(46)
<223> 位置46处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (62)..(62)
<223> 位置62处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (76)..(76)
<223> 位置76处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (94)..(94)
<223> 位置94处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (100)..(100)
<223> 位置100处的N是脱氧尿苷
<400> 143
gtttgaacag ttgnctggan ccattttgtg gttttnaggt cgccgnatca ttgcgagtgt 60
gncaagcaga agacgntttt tgctacagtg aaanctcgan ggagtgggtc 110
<210> 144
<211> 130
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (16)..(16)
<223> 位置16处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (29)..(29)
<223> 位置29处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (47)..(47)
<223> 位置47处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (57)..(57)
<223> 位置57处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (73)..(73)
<223> 位置73处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (87)..(87)
<223> 位置87处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (107)..(107)
<223> 位置107处的N是脱氧尿苷
<400> 144
gtcttcatga agaaanatat ctgaggtgna gtaagtaaag gattttnagg tcgccgnatc 60
attgcgagtg tgncaagcag aagacgnttt ttgatttcac tgtagcnaga ccaaaatcac 120
ctatttttac 130
<210> 145
<211> 92
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (13)..(13)
<223> 位置13处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (24)..(24)
<223> 位置24处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (34)..(34)
<223> 位置34处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (50)..(50)
<223> 位置50处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (64)..(64)
<223> 位置64处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (76)..(76)
<223> 位置76处的N是脱氧尿苷
<400> 145
tgattccaca ccnccgccct tttnaggtcg ccgnatcatt gcgagtgtgn caagcagaag 60
acgnttttta agaccngccc tgtgcagctg tg 92
<210> 146
<211> 104
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (15)..(15)
<223> 位置15处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (35)..(35)
<223> 位置35处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (45)..(45)
<223> 位置45处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (61)..(61)
<223> 位置61处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (75)..(75)
<223> 位置75处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (88)..(88)
<223> 位置88处的N是脱氧尿苷
<400> 146
catcttgttg agggnaggag agtactgtag ttttnaggtc gccgnatcat tgcgagtgtg 60
ncaagcagaa gacgnttttt cacagggnag gtcttggcca gttg 104
<210> 147
<211> 95
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (17)..(17)
<223> 位置17处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (31)..(31)
<223> 位置31处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (41)..(41)
<223> 位置41处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (57)..(57)
<223> 位置57处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (71)..(71)
<223> 位置71处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (83)..(83)
<223> 位置83处的N是脱氧尿苷
<400> 147
gctcagatag cgatggngag cagctgtttt naggtcgccg natcattgcg agtgtgncaa 60
gcagaagacg ntttttaggc gcngccccca ccatg 95
<210> 148
<211> 96
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (21)..(21)
<223> 位置21处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (31)..(31)
<223> 位置31处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (41)..(41)
<223> 位置41处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (57)..(57)
<223> 位置57处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (71)..(71)
<223> 位置71处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (80)..(80)
<223> 位置80处的N是脱氧尿苷
<400> 148
gtgctgtgac tgcttgtaga nggccatttt naggtcgccg natcattgcg agtgtgncaa 60
gcagaagacg ntttttgggn agcgcctcac aacctc 96
<210> 149
<211> 105
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (15)..(15)
<223> 位置15处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (27)..(27)
<223> 位置27处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (37)..(37)
<223> 位置37处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (53)..(53)
<223> 位置53处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (67)..(67)
<223> 位置67处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (78)..(78)
<223> 位置78处的N是脱氧尿苷
<400> 149
ccctatgagc cgccngaggt ctttttnagg tcgccgnatc attgcgagtg tgncaagcag 60
aagacgnttt ttttgganga cagaaacact tttcgacata gtgtg 105
<210> 150
<211> 107
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (22)..(22)
<223> 位置22处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (32)..(32)
<223> 位置32处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (42)..(42)
<223> 位置42处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (58)..(58)
<223> 位置58处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (72)..(72)
<223> 位置72处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (88)..(88)
<223> 位置88处的N是脱氧尿苷
<400> 150
tcggataaga tgctgaggag gngccagttt tnaggtcgcc gnatcattgc gagtgtgnca 60
agcagaagac gntttttgtc atccaaanac tccacacgca aatttcc 107
<210> 151
<211> 98
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (22)..(22)
<223> 位置22处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (32)..(32)
<223> 位置32处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (42)..(42)
<223> 位置42处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (58)..(58)
<223> 位置58处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (72)..(72)
<223> 位置72处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (85)..(85)
<223> 位置85处的N是脱氧尿苷
<400> 151
accatcatca cactggaaga cnccaggttt tnaggtcgcc gnatcattgc gagtgtgnca 60
agcagaagac gntttttggc ggcangaacc ggagaccc 98
<210> 152
<211> 103
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (23)..(23)
<223> 位置23处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (36)..(36)
<223> 位置36处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (46)..(46)
<223> 位置46处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (62)..(62)
<223> 位置62处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (76)..(76)
<223> 位置76处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (86)..(86)
<223> 位置86处的N是脱氧尿苷
<400> 152
atgtagttgt agtggatggt ggnacagtca gttttnaggt cgccgnatca ttgcgagtgt 60
gncaagcaga agacgntttt tcatgncgcc catgcaggaa ctg 103
<210> 153
<211> 99
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (25)..(25)
<223> 位置25处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (34)..(34)
<223> 位置34处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (44)..(44)
<223> 位置44处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (60)..(60)
<223> 位置60处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (74)..(74)
<223> 位置74处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (85)..(85)
<223> 位置85处的N是脱氧尿苷
<400> 153
ggaagagaat ctccgcaaga aaggngagct tttnaggtcg ccgnatcatt gcgagtgtgn 60
caagcagaag acgntttttt gtccngggag agaccggcg 99
<210> 154
<211> 107
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (17)..(17)
<223> 位置17处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (35)..(35)
<223> 位置35处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (45)..(45)
<223> 位置45处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (61)..(61)
<223> 位置61处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (75)..(75)
<223> 位置75处的N是脱氧尿苷
<220>
<221> misc_feature
<222> (90)..(90)
<223> 位置90处的N是脱氧尿苷
<400> 154
gttccgtccc agtagantac cactactcag ttttnaggtc gccgnatcat tgcgagtgtg 60
ncaagcagaa gacgnttttt cccaggacan gcacaaacac gcacctc 107
Claims (26)
1.一种系统,其包括:
不同环状嵌合单链核酸构建体的集合,每个构建体包含:
来自宿主生物体的原始基因组DNA的第一单链区段和
连接至所述第一单链区段且包含对所述宿主生物体而言为外源性的核苷酸序列的第二单链核酸区段,所述核苷酸序列包含第一固体载体引物特异性部分、第二固体载体引物特异性部分和患者标识符序列,借此所述集合的所述嵌合单链核酸构建体是环化的且适于滚环扩增和/或测序;以及
延伸产物的集合,每个延伸产物包含两条或更多条串联线性序列,其中每个串联线性序列与来自所述集合的嵌合单链核酸构建体互补,其中所述集合中的每个延伸产物与所述集合的其互补环状嵌合单链核酸构建体杂交。
2.根据权利要求1所述的系统,其进一步包含:
固体载体,其上固定有多个第一寡核苷酸引物,每个第一寡核苷酸引物包含与所述集合的嵌合单链核酸构建体的第一固体载体引物特异性部分的核苷酸序列相同的核苷酸序列,其中所述固体载体上的多个第一寡核苷酸引物的一个或多个与所述延伸产物的集合的延伸产物杂交。
3.一种系统,其包括:
不同环状嵌合单链核酸构建体的集合,每个构建体包含:
来自宿主生物体的原始基因组DNA的第一单链区段和
连接至所述第一单链区段且包含对所述宿主生物体而言为外源性的核苷酸序列的第二单链核酸区段,所述核苷酸序列包含第一固体载体引物特异性部分、第二固体载体引物特异性部分和患者标识符序列,借此所述集合的所述嵌合单链核酸构建体适于滚环扩增和/或测序;
一个或多个寡核苷酸扩增引物,每个扩增引物包含至少第一核苷酸序列,其与所述集合的嵌合单链核酸构建体的一部分互补;以及
适用于滚环扩增的聚合酶。
4.根据权利要求3所述的系统,其中所述一个或多个寡核苷酸扩增引物包含与所述集合的嵌合单链核酸构建体的第二固体载体引物特异性部分互补的第一核苷酸序列,且所述一个或多个扩增引物被固定在固体载体上。
5.根据权利要求3所述的系统,其中所述一个或多个寡核苷酸扩增引物包含:(i)与所述集合的嵌合单链核酸构建体的第一固体载体引物特异性部分互补的第一核苷酸序列和(ii)与所述集合的嵌合单链核酸构建体的第二固体载体引物特异性部分互补的第二核苷酸序列。
6.根据权利要求3所述的系统,其中所述一个或多个寡核苷酸扩增引物包含(i)与所述集合的嵌合单链核酸构建体的原始基因组DNA区段互补的第一核苷酸序列,(ii)3’部分,其包含可裂解核苷酸或核苷酸类似物和阻断所述寡核苷酸扩增引物的3’聚合酶延伸的阻断基团和(iii)包含可裂解核苷酸或核苷酸类似物与捕获基团的5’部分,所述捕获基团能够固定到固体载体上。
7.根据权利要求3所述的系统,其中所述一个或多个寡核苷酸扩增引物包含:(a)第一寡核苷酸扩增引物,其具有(i)与所述集合的嵌合单链核酸构建体的原始基因组DNA区段的第一部分互补的第一核苷酸序列,和(ii)3’部分,其包含可裂解核苷酸或核苷酸类似物与阻断所述第一寡核苷酸扩增引物的3’聚合酶延伸的阻断基团,以及(b)第二寡核苷酸扩增引物,其具有(i)与所述集合的嵌合单链核酸构建体的原始基因组DNA区段的第二部分互补的第一核苷酸序列,和(ii)包含可裂解核苷酸或核苷酸类似物与捕获基团的5’部分,所述捕获基团能够固定到固体载体上。
8.根据权利要求3所述的系统,其中所述一个或多个扩增引物包含能够被拴系到固体载体上的部分。
9.根据权利要求3所述的系统,其进一步包含:
固体载体,其上固定有多个第一寡核苷酸引物,每个第一寡核苷酸引物包含与所述集合的嵌合单链核酸构建体的第一固体载体引物特异性部分的核苷酸序列相同的核苷酸序列。
10.一种用于对多个核酸分子测序的方法,所述方法包括:
提供根据权利要求3所述的系统;
将杂交至所述集合的环状嵌合单链核酸构建体的一个或多个寡核苷酸扩增引物与所述聚合酶掺混,以形成滚环扩增反应混合物;
使所述滚环扩增反应混合物经受延伸处理,其中所述聚合酶延伸所述一个或多个杂交的寡核苷酸扩增引物以产生多个初级延伸产物,每个初级延伸产物包含一条或多条串联线性序列,其中每个串联线性序列与所述集合中的环状嵌合单链核酸构建体互补;以及
对所述环状嵌合单链核酸构建体直接测序或对其所述多个初级延伸产物测序。
11.根据权利要求10所述的方法,其中通过包括以下步骤的方法来制备所述集合的环状嵌合单链核酸构建体:
提供含有一个或多个靶基因组DNA区段的样品;
提供一个或多个第一寡核苷酸探针,每个第一寡核苷酸探针包含(a)5’靶标特异性部分,(b)3’靶标特异性部分,和(c)其它部分,所述其它部分包含(i)患者标识符序列,(ii)第一固体载体引物特异性部分,和(iii)第二固体载体引物特异性部分;
在有效地使第一寡核苷酸探针的所述3’靶标特异性部分以碱基特异性方式与靶基因组DNA区段的互补3’端杂交以及使所述第一寡核苷酸探针的5’靶标特异性部分以碱基特异性方式与所述靶基因组DNA区段(如果存在于样品中)的互补5’端杂交的条件下,使所述样品和所述一个或多个第一寡核苷酸探针接触;
在杂交至所述第一寡核苷酸探针的每个靶基因组DNA区段的3’和5’端之间产生可连接结;以及
连接每个靶基因组DNA区段的连接结以形成所述集合的不同的环状嵌合单链核酸构建体。
12.根据权利要求10所述的方法,其中通过包括以下步骤的方法来制备所述集合的不同的环状嵌合单链核酸构建体:
提供含有一个或多个靶基因组DNA区段的样品,其中所述靶基因组DNA区段可能含有一个或多个碱基差异或一个或多个甲基化残基;
将核苷酸接头附接至所述靶基因组DNA区段的3’和5’端,以形成附接有接头的靶基因组DNA区段;
提供一个或多个第一寡核苷酸探针,每个第一寡核苷酸探针包含(a)与所述靶基因组DNA区段的3’核苷酸接头互补的3’部分,(b)与所述靶基因组DNA区段的5’核苷酸接头互补的5’部分,和(c)其它部分,所述其它部分包含(i)患者标识符序列,(ii)第一固体载体引物特异性部分,和/或(iii)第二固体载体引物特异性部分;
在有效地使所述第一寡核苷酸探针以碱基特异性方式与所述附接有接头的靶基因组DNA区段(如果存在于所述样品中)的互补核苷酸接头序列杂交的条件下,使所述样品与所述一个或多个第一寡核苷酸探针接触;
产生适用于偶联杂交至所述第一寡核苷酸探针的所述靶基因组DNA区段的3’和5’端的一个或多个可连接结;以及
在所述一个或多个连接结处连接所述靶基因组DNA区段,以形成所述集合的不同的环状嵌合单链核酸构建体。
13.根据权利要求10所述的方法,其中通过包括以下步骤的方法来制备所述集合的不同的环状嵌合单链核酸构建体:
提供含有一个或多个靶基因组DNA区段的样品,其中所述靶基因组DNA区段具有3’和5’端;
将接头序列附接至所述靶基因组DNA区段的3’和5’端,其中所述接头序列包含(i)一条或多条患者标识符序列,(ii)第一固体载体引物特异性部分,和(iii)第二固体载体引物特异性部分,以形成附接有接头的靶基因组DNA区段;
提供一个或多个第一寡核苷酸探针,每个第一寡核苷酸探针包含(a)与所述附接有接头的靶基因组DNA区段的3’接头序列互补的部分,和(b)与所述附接有接头的靶基因组DNA区段的5’接头序列互补的部分;以及
在有效地使所述第一寡核苷酸探针以碱基特异性方式与所述附接有接头的靶基因组DNA区段(如果存在于所述样品中)的互补3’和5’接头序列杂交的条件下,使所述样品与所述一个或多个第一寡核苷酸探针接触;
产生适用于偶联杂交至所述第一寡核苷酸探针的所述附接有接头的靶基因组DNA区段的3’和5’端的一个或多个可连接结;以及
在所述一个或多个连接结处连接所述附接有接头的靶基因组DNA区段,以形成所述集合的不同的环状嵌合单链核酸构建体。
14.一种用于识别样品中的一个或多个可能包含彼此连接的不同的第一靶和第二靶区域的核酸分子的方法,所述方法包括:
提供可能含有一个或多个包含彼此连接的不同的第一靶和第二靶区域的核酸分子的样品;
提供一个或多个寡核苷酸探针组,每个探针组包含(i)包含5’第一靶标特异性部分、3’第二靶标特异性部分和其它部分的第一寡核苷酸探针,和(ii)包含5’第二靶标特异性部分、3’第一靶标特异性部分和其它部分的第二寡核苷酸探针,其中探针组的所述第一或第二寡核苷酸探针的其它部分包含(i)独特标识符序列、(ii)患者标识符序列、(iii)一条或多条引物结合序列或(i)、(ii)和(iii)的任何组合;
在有效地使探针组的第一和第二寡核苷酸探针以碱基特异性方式与所述核酸分子(如果存在于所述样品中)的其相应的第一和第二靶区域杂交的条件下,使所述样品与所述一个或多个寡核苷酸探针组接触;
产生适于在所述探针组与核酸分子的互补第一和第二靶区域杂交时将所述探针组的第一寡核苷酸探针的3’端偶联至第二寡核苷酸探针的5’端以及将所述探针组的第一寡核苷酸探针的5’端偶联至第二寡核苷酸探针的3’端的一个或多个可连接结;
在所述一个或多个可连接结处连接探针组的所述第一和第二寡核苷酸,以形成包含对应于偶联至其它部分的核酸分子的所述第一和第二不同靶区域的核苷酸序列的环状连接产物;以及
检测和区分所述样品中的所述环状连接产物,从而识别所述样品中包含彼此连接的不同的第一靶和第二靶区域的一个或多个核酸分子的存在(如果有的话)。
15.根据权利要求14所述的方法,其中所述产生一个或多个可连接结包括:
用聚合酶延伸所述第一和/或第二寡核苷酸探针的3’端,以分别与所述第二和/或第一寡核苷酸探针的5’端形成连接结。
16.根据权利要求15所述的方法,其中所述聚合酶包含5’至3’核酸外切酶活性或3’至5’核酸外切酶活性。
17.根据权利要求14所述的方法,其中所述产生一个或多个可连接结包括:
释放所述第一和/或第二寡核苷酸探针上的适于连接的3’OH和/或5’磷酸根。
18.根据权利要求14所述的方法,其进一步包括:
在所述检测之前从所述样品中移除未连接的第一和第二寡核苷酸探针,以及其它非环化的核酸分子。
19.根据权利要求14所述的方法,其中所述检测和区分包括:对所述样品中的所述环状连接产物测序。
20.一种用于识别样品中的与所述样品中的其它核酸分子的差异为一个或多个碱基的一个或多个靶核糖核酸分子的方法,所述方法包括:
提供包含可能含有一个或多个碱基差异的一个或多个靶核糖核酸分子的样品;
将核苷酸接头附接到所述样品中的所述靶核糖核酸分子的3’和5’端;
提供一个或多个寡核苷酸探针,每个寡核苷酸探针包含(a)与所述靶核糖核酸分子的3’核苷酸接头互补的3’部分,(b)与所述靶核糖核酸分子的5’核苷酸接头互补的5’部分,以及(c)其它部分,所述其它部分包含(i)独特标识符序列、(ii)患者标识符序列、(iii)一条或多条引物结合序列或(i)、(ii)和(iii)的任何组合;
在有效地使所述寡核苷酸探针的3’和5’部分以碱基特异性方式与所述靶核糖核酸分子(如果存在于所述样品中)上的互补核苷酸接头杂交的条件下,使所述样品与所述一个或多个寡核苷酸探针接触;
延伸杂交的寡核苷酸探针的3’端以产生所述一个或多个靶核糖核酸分子的补体;
将所述寡核苷酸探针的3’延伸端连接到所述寡核苷酸探针的5’端,以形成环状连接产物,所述环状连接产物包含与所述靶核糖核酸分子的3’核苷酸接头互补的序列、与所述靶核糖核酸分子的5’核苷酸接头互补的序列、所述一个或多个靶核糖核酸分子的补体和所述寡核苷酸探针的其它部分;以及
检测和区分所述样品中的所述环状连接产物,从而识别与所述样品中的其它核酸分子的差异为一个或多个碱基的一个或多个靶核糖核酸分子的存在。
21.根据权利要求20所述的方法,其进一步包括:
在所述连接后从所述样品中移除未连接的第一寡核苷酸探针和其它非环化的核酸分子。
22.根据权利要求20所述的方法,其中所述检测和区分包括:对所述样品中的所述环状连接产物测序。
23.一种用于识别样品中的与所述样品中的其它核酸分子的差异为一个或多个碱基的一个或多个靶核糖核酸分子的方法,所述方法包括:
提供含有可能含有一个或多个碱基差异的一个或多个靶核糖核酸分子的样品;
将核苷酸接头连接至所述样品中的所述靶核糖核酸分子的3’和5’端,其中所述核苷酸接头通过其它部分彼此连接,所述其它部分包含(i)独特标识符序列、(ii)患者标识符序列、(iii)一条或多条引物结合序列或(i)、(ii)和(iii)的任何组合,由此所述连接形成包含所述靶核糖核酸分子、所述3’和5’核苷酸接头序列和所述其它部分的环状连接产物;
提供一个或多个第一寡核苷酸引物,其包含与所述环状连接产物的3’或5’核苷酸接头序列互补的核苷酸序列;
使所述一个或多个第一寡核苷酸引物以碱基特异性方式与所述环状连接产物杂交;
延伸所述第一寡核苷酸引物的3’端以产生所述环状连接产物的补体;以及
检测和区分所述样品中的所述环状连接产物补体,从而识别与所述样品中的其它核酸分子的差异为一个或多个碱基的一个或多个靶核糖核酸分子的存在。
24.根据权利要求23所述的方法,其中所述检测和区分包括:对所述样品中的所述环状连接产物测序。
25.一种用于识别样品中的与所述样品中的其它核酸分子的差异为一个或多个碱基的一个或多个靶核糖核酸分子的方法,所述方法包括:
提供含有可能含有一个或多个碱基差异的一个或多个靶核糖核酸分子的样品;
提供一个或多个寡核苷酸探针组,每个组包含(a)具有5’茎环部分以及与所述靶核糖核酸分子的3’部分互补的3’部分的第一寡核苷酸探针,(b)具有与所述靶核糖核酸分子的5’端的拷贝互补的3’部分、与所述第一寡核苷酸探针的5’茎环部分互补的5’部分以及其它部分的第二寡核苷酸探针,所述其它部分包含(i)独特靶标识符序列、(ii)患者标识符序列、(iii)引物结合序列或(i)、(ii)和(iii)的任何组合;
掺混所述样品、来自探针组的所述一个或多个第一寡核苷酸探针和逆转录酶,以形成逆转录酶反应;
延伸杂交至其互补靶核糖核酸分子的所述第一寡核苷酸探针的3’端,以产生所述靶核糖核苷酸分子(如果存在于所述样品中)的补体;
使探针组的所述一个或多个第二寡核苷酸探针与包含所述靶核糖核苷酸序列的补体的所述延伸的第一寡核苷酸探针杂交;
在杂交至延伸的第一寡核苷酸探针的每个第二寡核苷酸探针的3’和5’端之间产生一个或多个可连接结;
连接每个第二寡核苷酸探针的3’和5’端,以形成包含偶联至所述第二寡核苷酸探针的其它部分的靶核糖核酸序列的脱氧核糖核酸拷贝的环状连接产物;以及
检测和区分所述样品中的所述环状连接产物,从而识别与所述样品中的其它核酸分子的差异为一个或多个碱基的一个或多个靶核糖核酸分子的存在。
26.根据权利要求25所述的方法,其中所述检测和区分包括:对所述样品中的所述环状连接产物序列测序。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462009047P | 2014-06-06 | 2014-06-06 | |
US62/009,047 | 2014-06-06 | ||
US201562136093P | 2015-03-20 | 2015-03-20 | |
US62/136,093 | 2015-03-20 | ||
CN201580042765.4A CN106661631B (zh) | 2014-06-06 | 2015-06-08 | 从血液特异性靶向捕获人类基因组和转录组区域的方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580042765.4A Division CN106661631B (zh) | 2014-06-06 | 2015-06-08 | 从血液特异性靶向捕获人类基因组和转录组区域的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113046413A true CN113046413A (zh) | 2021-06-29 |
Family
ID=54767613
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110270831.0A Pending CN113046413A (zh) | 2014-06-06 | 2015-06-08 | 从血液特异性靶向捕获人类基因组和转录组区域的方法 |
CN201580042765.4A Active CN106661631B (zh) | 2014-06-06 | 2015-06-08 | 从血液特异性靶向捕获人类基因组和转录组区域的方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580042765.4A Active CN106661631B (zh) | 2014-06-06 | 2015-06-08 | 从血液特异性靶向捕获人类基因组和转录组区域的方法 |
Country Status (12)
Country | Link |
---|---|
US (3) | US10407722B2 (zh) |
EP (4) | EP3889271B1 (zh) |
JP (3) | JP7008407B2 (zh) |
CN (2) | CN113046413A (zh) |
AU (2) | AU2015269103B2 (zh) |
CA (2) | CA3213538A1 (zh) |
DK (1) | DK3152331T3 (zh) |
ES (3) | ES2935285T3 (zh) |
IL (1) | IL249126B (zh) |
PT (3) | PT3889271T (zh) |
SG (2) | SG11201610134PA (zh) |
WO (1) | WO2015188192A2 (zh) |
Families Citing this family (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11859246B2 (en) * | 2013-12-11 | 2024-01-02 | Accuragen Holdings Limited | Methods and compositions for enrichment of amplification products |
AU2015269103B2 (en) * | 2014-06-06 | 2021-12-23 | Cornell University | Method for identification and enumeration of nucleic acid sequence, expression, copy, or DNA methylation changes, using combined nuclease, ligase, polymerase, and sequencing reactions |
WO2016170182A1 (en) * | 2015-04-24 | 2016-10-27 | Qiagen Gmbh | Method for immobilizing a nucleic acid molecule on a solid support |
WO2016170179A1 (en) | 2015-04-24 | 2016-10-27 | Qiagen Gmbh | Method for immobilizing a nucleic acid molecule on solid support |
CN108603180A (zh) | 2015-11-25 | 2018-09-28 | 豪夫迈·罗氏有限公司 | 聚合酶复合体的纯化 |
WO2017096322A1 (en) * | 2015-12-03 | 2017-06-08 | Accuragen Holdings Limited | Methods and compositions for forming ligation products |
US20210214781A1 (en) * | 2016-02-14 | 2021-07-15 | Abhijit Ajit Patel | Measurement of nucleic acid |
RU2742355C2 (ru) * | 2016-04-07 | 2021-02-05 | Те Борд Оф Трастиз Оф Те Лилэнд Стэнфорд Джуниор Юниверсити | Неинвазивная диагностика путем секвенирования 5-гидроксиметилированной бесклеточной днк |
JP2019526230A (ja) * | 2016-07-01 | 2019-09-19 | ナテラ, インコーポレイテッド | 核酸突然変異検出のための組成物及び方法 |
JP6860662B2 (ja) * | 2016-10-31 | 2021-04-21 | エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft | キメラ生成物の同定のためのバーコードを付けられた環状ライブラリーの構築 |
JP6847499B2 (ja) * | 2016-12-20 | 2021-03-24 | エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft | 環状コンセンサスシークエンシングのための一本鎖環状dnaライブラリー |
CN109234388B (zh) * | 2017-07-04 | 2021-09-14 | 深圳华大生命科学研究院 | 用于dna高甲基化区域富集的试剂、富集方法及应用 |
EP3682025A1 (en) * | 2017-09-14 | 2020-07-22 | H. Hoffnabb-La Roche Ag | Novel method for generating circular single-stranded dna libraries |
US10350307B2 (en) * | 2017-09-18 | 2019-07-16 | General Electric Company | In vivo RNA or protein expression using double-stranded concatemeric DNA including phosphorothioated nucleotides |
CN111542616A (zh) * | 2017-11-03 | 2020-08-14 | 夸登特健康公司 | 脱氨引起的序列错误的纠正 |
WO2019024341A1 (zh) * | 2017-11-27 | 2019-02-07 | 深圳华大生命科学研究院 | 一种体液游离dna的文库构建方法及其应用 |
EP3724353A1 (en) | 2017-12-11 | 2020-10-21 | UMC Utrecht Holding B.V. | Methods for preparing nucleic acid molecules for sequencing |
WO2019157339A1 (en) * | 2018-02-09 | 2019-08-15 | Children's Medical Center Corporation | Compositions and methods for identifying a single-nucleotide variant |
JP7013960B2 (ja) * | 2018-03-13 | 2022-02-01 | 株式会社リコー | 核酸検出方法及び核酸検出装置、並びに、核酸検出キット |
US11203782B2 (en) | 2018-03-29 | 2021-12-21 | Accuragen Holdings Limited | Compositions and methods comprising asymmetric barcoding |
AU2019249422A1 (en) * | 2018-04-02 | 2020-10-15 | Grail, Llc | Methylation markers and targeted methylation probe panels |
JP7348603B2 (ja) * | 2018-04-02 | 2023-09-21 | エニュメラ・モレキュラー・インコーポレイテッド | 核酸分子を計数するための方法、システム、および組成物 |
CN110456034B (zh) * | 2018-05-07 | 2022-07-22 | 上海市第十人民医院 | 一种循环肿瘤细胞的检测方法 |
CN112601823A (zh) | 2018-06-12 | 2021-04-02 | 安可济控股有限公司 | 用于形成连接产物的方法和组合物 |
US10704094B1 (en) | 2018-11-14 | 2020-07-07 | Element Biosciences, Inc. | Multipart reagents having increased avidity for polymerase binding |
US10876148B2 (en) * | 2018-11-14 | 2020-12-29 | Element Biosciences, Inc. | De novo surface preparation and uses thereof |
GB2598656B (en) * | 2018-11-15 | 2023-10-04 | Element Biosciences Inc | Methods for generating circular nucleic acid molecules |
CN113811391A (zh) * | 2019-02-25 | 2021-12-17 | 艾勒根公司 | 使用微流体位置编码设备的方法 |
EP3998349A3 (en) | 2019-03-01 | 2022-08-24 | Mercy Bioanalytics, Inc. | Compositions and methods for target protein detection on exosomes using proximal ligation |
WO2020180813A1 (en) * | 2019-03-06 | 2020-09-10 | Qiagen Sciences, Llc | Compositions and methods for adaptor design and nucleic acid library construction for rolony-based sequencing |
WO2020206170A1 (en) | 2019-04-02 | 2020-10-08 | Progenity, Inc. | Methods, systems, and compositions for counting nucleic acid molecules |
WO2020232081A2 (en) * | 2019-05-13 | 2020-11-19 | Rapid Genomics Llc | Capture and analysis of target genomic regions |
US11639521B2 (en) * | 2019-06-03 | 2023-05-02 | The Chinese University Of Hong Kong | Method for determining the copy number of a tandem repeat sequence |
CN112175939A (zh) * | 2019-07-03 | 2021-01-05 | 华大青兰生物科技(无锡)有限公司 | 一种基于同源序列的核酸拼接方法及其应用 |
CN114616338A (zh) * | 2019-08-22 | 2022-06-10 | 新加坡国立大学 | 生成哑铃形dna载体的方法 |
WO2021036995A1 (en) * | 2019-08-23 | 2021-03-04 | Nanjing University | Direct microrna sequencing using enzyme assisted sequencing |
CN114641581A (zh) * | 2019-10-28 | 2022-06-17 | 深圳华大智造科技股份有限公司 | Dna接头寡核苷酸 |
CA3156589A1 (en) * | 2019-11-06 | 2021-05-14 | David M. Kurtz | Methods and systems for analyzing nucleic acid molecules |
CN111154820B (zh) * | 2020-01-13 | 2021-12-21 | 上海韦翰斯生物医药科技有限公司 | 一种降低核酸扩增复制滑移率的方法 |
MX2021015806A (es) * | 2020-02-26 | 2022-04-27 | Illumina Inc | Kits para genotipificacion. |
EP4114966A1 (en) * | 2020-03-03 | 2023-01-11 | Pacific Biosciences Of California, Inc. | Methods and compositions for sequencing double stranded nucleic acids |
CN115427586A (zh) * | 2020-03-18 | 2022-12-02 | 深圳华大智造科技股份有限公司 | 大规模平行测序中的恢复阶段 |
US20230279483A1 (en) * | 2022-03-04 | 2023-09-07 | Element Biosciences, Inc. | Double-stranded splint adaptors and methods of use |
EP4001432A1 (en) * | 2020-11-13 | 2022-05-25 | Miltenyi Biotec B.V. & Co. KG | Algorithmic method for efficient indexing of genetic sequences using associative arrays |
WO2022101162A1 (en) * | 2020-11-13 | 2022-05-19 | Miltenyi Biotec B.V. & Co. KG | Paired end sequential sequencing based on rolling circle amplification |
CN112631562B (zh) * | 2020-12-01 | 2022-08-23 | 上海欧易生物医学科技有限公司 | 基于python的二代测序样本混样方法、应用、设备、计算机可读存储介质 |
ES2960777T3 (es) * | 2021-03-18 | 2024-03-06 | Genomill Health Oy | Métodos para la cuantificación paralela precisa de ácidos nucleicos en muestras diluidas o no purificadas |
US11783912B2 (en) | 2021-05-05 | 2023-10-10 | The Board Of Trustees Of The Leland Stanford Junior University | Methods and systems for analyzing nucleic acid molecules |
CN113552191B (zh) * | 2021-07-28 | 2023-11-21 | 江苏师范大学 | 基于多层dna放大回路检测甲基化dna的比例型电化学传感器的构建方法 |
CN117858958A (zh) * | 2021-08-16 | 2024-04-09 | 10X基因组学有限公司 | 包含分割条形码区的探针和使用方法 |
WO2023122104A2 (en) * | 2021-12-21 | 2023-06-29 | Ultima Genomics, Inc. | Systems and methods for library preparation adapters |
IL293202A (en) * | 2022-05-22 | 2023-12-01 | Nucleix Ltd | Useful combinations of restriction enzymes |
US20240011022A1 (en) * | 2022-07-05 | 2024-01-11 | Element Biosciences, Inc. | Pcr-free library preparation using double-stranded splint adaptors and methods of use |
US20240068010A1 (en) * | 2022-08-31 | 2024-02-29 | Genomill Health Oy | Highly sensitive methods for accurate parallel quantification of variant nucleic acids |
WO2024084440A1 (en) * | 2022-10-19 | 2024-04-25 | Biofidelity Ltd | Nucleic acid enrichment and detection |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080096258A1 (en) * | 2006-10-24 | 2008-04-24 | Christian Korfhage | Rolling circle amplification of circular genomes |
CN101213311A (zh) * | 2005-04-29 | 2008-07-02 | J·克雷格·文特尔研究院 | 利用滚环扩增扩增和克隆单个dna分子 |
WO2012003374A2 (en) * | 2010-07-02 | 2012-01-05 | The Board Of Trustees Of The Leland Stanford Junior University | Targeted sequencing library preparation by genomic dna circularization |
WO2013036929A1 (en) * | 2011-09-09 | 2013-03-14 | The Board Of Trustees Of The Leland Stanford Junior | Methods for obtaining a sequence |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1736554B1 (en) * | 1996-05-29 | 2013-10-09 | Cornell Research Foundation, Inc. | Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions |
US5736373A (en) | 1996-09-23 | 1998-04-07 | Becton, Dickinson And Company | Thermostable DNA polymerase from Bacillus pallidus |
US20040086892A1 (en) | 2002-11-06 | 2004-05-06 | Crothers Donald M. | Universal tag assay |
WO2006030455A1 (en) | 2004-09-17 | 2006-03-23 | Prokaria Ehf. | Dna polymerases having strand displacement activity |
US20080311626A1 (en) | 2004-09-17 | 2008-12-18 | Arkea Hf | Dna Polymerases Having Strand Displacement Activity |
JP2008527979A (ja) | 2005-01-12 | 2008-07-31 | アプレラ コーポレイション | 核酸の選択的増幅のための組成物、方法およびキット |
US20120083018A1 (en) | 2005-10-06 | 2012-04-05 | Schoenfeld Thomas W | Thermostable dna polymerases and methods of use |
CA2624324A1 (en) | 2005-10-06 | 2007-04-19 | Lucigen Corporation | Thermostable viral polymerases and methods of use |
WO2007076461A1 (en) | 2005-12-22 | 2007-07-05 | Ge Healthcare Bio-Sciences Corp. | Thermostable dna polymerase from thermus scotoductus |
WO2007092538A2 (en) * | 2006-02-07 | 2007-08-16 | President And Fellows Of Harvard College | Methods for making nucleotide probes for sequencing and synthesis |
DE102006020885A1 (de) | 2006-05-05 | 2007-11-08 | Qiagen Gmbh | Einführung von Sequenzelementen in Nukleinsäuren |
JP4962899B2 (ja) | 2006-08-31 | 2012-06-27 | 東洋製罐株式会社 | 環状1本鎖dnaの製造方法 |
US8962253B2 (en) * | 2009-04-13 | 2015-02-24 | Somagenics Inc. | Methods and compositions for detection of small RNAs |
EP2425240A4 (en) * | 2009-04-30 | 2012-12-12 | Good Start Genetics Inc | METHOD AND COMPOSITION FOR EVALUATING GENETIC MARKERS |
US9249192B2 (en) * | 2009-08-21 | 2016-02-02 | Virginia Tech Intellectual Properties, Inc. | Infectious genomic DNA clone and serological profile of Torque teno sus virus 1 and 2 |
EP4212630A1 (en) * | 2009-11-06 | 2023-07-19 | The Chinese University of Hong Kong | Size-based genomic analysis |
GB201018714D0 (en) | 2010-11-05 | 2010-12-22 | Oxitec Ltd | Strand displacement activity of modified polymerases and uses thereof |
WO2012106546A2 (en) | 2011-02-02 | 2012-08-09 | University Of Washington Through Its Center For Commercialization | Massively parallel continguity mapping |
US10373705B2 (en) * | 2011-06-07 | 2019-08-06 | Koninklijke Philips N.V. | Providing nucleotide sequence data |
US9670540B2 (en) | 2011-07-21 | 2017-06-06 | Cornell University | Methods and devices for DNA sequencing and molecular diagnostics |
US20150126376A1 (en) | 2012-06-14 | 2015-05-07 | Fred Hutchinson Cancer Research Center | Compositions and methods for sensitive mutation detection in nucleic acid molecules |
US20140066317A1 (en) | 2012-09-04 | 2014-03-06 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
WO2014047561A1 (en) | 2012-09-21 | 2014-03-27 | The Broad Institute Inc. | Compositions and methods for labeling of agents |
US10017820B2 (en) * | 2013-03-05 | 2018-07-10 | Agilent Technologies, Inc. | Detection of genomic rearrangements by sequence capture |
CN113832216A (zh) * | 2013-03-15 | 2021-12-24 | 莱尔·J·阿诺德 | 使用发卡寡核苷酸扩增核酸的方法 |
US9896671B2 (en) | 2013-04-05 | 2018-02-20 | Bioron Gmbh | DNA polymerases |
MX2016007605A (es) * | 2013-12-11 | 2017-01-13 | Accuragen Inc | Composiciones y metodos para detectar variantes poco frecuentes de una secuencia. |
AU2015269103B2 (en) * | 2014-06-06 | 2021-12-23 | Cornell University | Method for identification and enumeration of nucleic acid sequence, expression, copy, or DNA methylation changes, using combined nuclease, ligase, polymerase, and sequencing reactions |
-
2015
- 2015-06-08 AU AU2015269103A patent/AU2015269103B2/en active Active
- 2015-06-08 ES ES21157460T patent/ES2935285T3/es active Active
- 2015-06-08 EP EP21157460.3A patent/EP3889271B1/en active Active
- 2015-06-08 US US15/316,778 patent/US10407722B2/en active Active
- 2015-06-08 EP EP15802743.3A patent/EP3152331B1/en active Active
- 2015-06-08 DK DK15802743T patent/DK3152331T3/da active
- 2015-06-08 SG SG11201610134PA patent/SG11201610134PA/en unknown
- 2015-06-08 PT PT211574603T patent/PT3889271T/pt unknown
- 2015-06-08 CN CN202110270831.0A patent/CN113046413A/zh active Pending
- 2015-06-08 ES ES19178828T patent/ES2864531T3/es active Active
- 2015-06-08 ES ES15802743T patent/ES2748457T3/es active Active
- 2015-06-08 SG SG10201810862YA patent/SG10201810862YA/en unknown
- 2015-06-08 CN CN201580042765.4A patent/CN106661631B/zh active Active
- 2015-06-08 EP EP19178828.0A patent/EP3567122B1/en active Active
- 2015-06-08 PT PT191788280T patent/PT3567122T/pt unknown
- 2015-06-08 CA CA3213538A patent/CA3213538A1/en active Pending
- 2015-06-08 EP EP22201393.0A patent/EP4170044A1/en active Pending
- 2015-06-08 JP JP2016571229A patent/JP7008407B2/ja active Active
- 2015-06-08 PT PT158027433T patent/PT3152331T/pt unknown
- 2015-06-08 CA CA2950295A patent/CA2950295C/en active Active
- 2015-06-08 WO PCT/US2015/034724 patent/WO2015188192A2/en active Application Filing
-
2016
- 2016-11-22 IL IL249126A patent/IL249126B/en active IP Right Grant
-
2019
- 2019-07-29 US US16/524,527 patent/US11486002B2/en active Active
-
2021
- 2021-08-27 JP JP2021138555A patent/JP2022001050A/ja active Pending
-
2022
- 2022-03-18 AU AU2022201907A patent/AU2022201907A1/en active Pending
- 2022-10-07 US US18/045,032 patent/US20230295718A1/en active Pending
-
2024
- 2024-03-13 JP JP2024038531A patent/JP2024060054A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101213311A (zh) * | 2005-04-29 | 2008-07-02 | J·克雷格·文特尔研究院 | 利用滚环扩增扩增和克隆单个dna分子 |
US20080096258A1 (en) * | 2006-10-24 | 2008-04-24 | Christian Korfhage | Rolling circle amplification of circular genomes |
WO2012003374A2 (en) * | 2010-07-02 | 2012-01-05 | The Board Of Trustees Of The Leland Stanford Junior University | Targeted sequencing library preparation by genomic dna circularization |
WO2013036929A1 (en) * | 2011-09-09 | 2013-03-14 | The Board Of Trustees Of The Leland Stanford Junior | Methods for obtaining a sequence |
Non-Patent Citations (1)
Title |
---|
张俊 等: "滚环扩增技术的原理及其应用的研究", 生物信息学, vol. 10, no. 1, 15 March 2012 (2012-03-15), pages 12 - 14 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11486002B2 (en) | Method for identification and enumeration of nucleic acid sequence, expression, copy, or DNA methylation changes, using combined nuclease, ligase, polymerase, and sequencing reactions | |
US11209424B2 (en) | Method for relative quantification of nucleic acid sequence, expression, or copy changes, using combined nuclease, ligation, and polymerase reactions | |
US20240002906A1 (en) | Methods, compositions, and kits for preparing nucleic acid libraries | |
CA3085420A1 (en) | Methods for preparing nucleic acid molecules for sequencing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |