CN111315895A - 用于产生环状单链dna文库的新型方法 - Google Patents
用于产生环状单链dna文库的新型方法 Download PDFInfo
- Publication number
- CN111315895A CN111315895A CN201880059003.9A CN201880059003A CN111315895A CN 111315895 A CN111315895 A CN 111315895A CN 201880059003 A CN201880059003 A CN 201880059003A CN 111315895 A CN111315895 A CN 111315895A
- Authority
- CN
- China
- Prior art keywords
- nucleic acid
- universal
- sequence
- target nucleic
- strands
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 60
- 108020004414 DNA Proteins 0.000 title claims description 22
- 102000053602 DNA Human genes 0.000 title description 16
- 108020004682 Single-Stranded DNA Proteins 0.000 title description 4
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 132
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 129
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 129
- 238000012163 sequencing technique Methods 0.000 claims abstract description 47
- 108091034117 Oligonucleotide Proteins 0.000 claims description 53
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 31
- 108091093088 Amplicon Proteins 0.000 claims description 30
- 230000003321 amplification Effects 0.000 claims description 30
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 30
- 230000000295 complement effect Effects 0.000 claims description 21
- 230000037452 priming Effects 0.000 claims description 10
- 230000029087 digestion Effects 0.000 claims description 8
- 239000012634 fragment Substances 0.000 claims description 5
- 239000003446 ligand Substances 0.000 claims description 4
- 101710163270 Nuclease Proteins 0.000 claims description 3
- 239000000427 antigen Substances 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 claims description 2
- 230000009977 dual effect Effects 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 abstract 1
- 239000013615 primer Substances 0.000 description 90
- 239000000523 sample Substances 0.000 description 47
- 108060002716 Exonuclease Proteins 0.000 description 16
- 102000013165 exonuclease Human genes 0.000 description 16
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 11
- 238000006243 chemical reaction Methods 0.000 description 11
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 10
- 125000003729 nucleotide group Chemical group 0.000 description 10
- 206010028980 Neoplasm Diseases 0.000 description 9
- 239000002773 nucleotide Substances 0.000 description 9
- 238000003752 polymerase chain reaction Methods 0.000 description 9
- 239000012082 adaptor molecule Substances 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- 102000012410 DNA Ligases Human genes 0.000 description 6
- 108010061982 DNA Ligases Proteins 0.000 description 6
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 6
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 6
- 239000011324 bead Substances 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 101100310856 Drosophila melanogaster spri gene Proteins 0.000 description 5
- 210000004369 blood Anatomy 0.000 description 5
- 239000008280 blood Substances 0.000 description 5
- 239000012530 fluid Substances 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 238000001847 surface plasmon resonance imaging Methods 0.000 description 5
- 108091035707 Consensus sequence Proteins 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000012149 elution buffer Substances 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000026731 phosphorylation Effects 0.000 description 4
- 238000006366 phosphorylation reaction Methods 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 239000002096 quantum dot Substances 0.000 description 4
- 238000007363 ring formation reaction Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 102100031780 Endonuclease Human genes 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000012678 infectious agent Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 244000052769 pathogen Species 0.000 description 3
- 210000002381 plasma Anatomy 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 239000002987 primer (paints) Substances 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 206010036790 Productive cough Diseases 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000012467 final product Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 210000004880 lymph fluid Anatomy 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 210000003802 sputum Anatomy 0.000 description 2
- 208000024794 sputum Diseases 0.000 description 2
- 210000001179 synovial fluid Anatomy 0.000 description 2
- 210000001138 tear Anatomy 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- 108020004634 Archaeal DNA Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 102100029764 DNA-directed DNA/RNA polymerase mu Human genes 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 1
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 239000012807 PCR reagent Substances 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 208000005228 Pericardial Effusion Diseases 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 108010017842 Telomerase Proteins 0.000 description 1
- 101710183280 Topoisomerase Proteins 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 210000003567 ascitic fluid Anatomy 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 210000000941 bile Anatomy 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 108091092240 circulating cell-free DNA Proteins 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000006482 condensation reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 210000002726 cyst fluid Anatomy 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 238000003402 intramolecular cyclocondensation reaction Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000004912 pericardial fluid Anatomy 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 230000000865 phosphorylative effect Effects 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000010926 purge Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 108091078962 reverse transcriptase family Proteins 0.000 description 1
- 102000042455 reverse transcriptase family Human genes 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000011451 sequencing strategy Methods 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1068—Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明是经由夹板连接而制备和使用文库诸如单链环状核酸模板的测序文库的新型方法。
Description
发明领域
本发明涉及核酸分析领域,且更具体地,涉及制备用于核酸测序的环状模板。
发明背景
环状核酸模板在核酸分析中具有多种应用。将直链核酸转化成环状形式用于扩增(例如,通过滚环扩增(RCA))和随后的检测和定量,参见美国专利号RE44265。环状模板在测序中的应用也是本领域已知的。参见美国专利号7,302,146和8,153,375。当前的测序策略也要求,将辅助序列诸如引物结合位点和条形码引入模板中。本发明是制备适合用于测序的环状核酸模板的新型的有效方法。所述方法允许制备基本上无限制长度的模板。
发明内容
在一些实施方案中,本发明是从靶核酸形成环状分子的方法,所述方法包括:用包含通用环化序列和靶标特异性序列的第一和第二双组分扩增引物扩增靶核酸以产生双链扩增子;分离所述双链扩增子的链;使所述扩增子的链与环化寡核苷酸接触以产生杂交结构,其中所述链中的通用环化序列与所述环化寡核苷酸杂交,使得所述链的末端可连接地靠近;和连接所述链的末端,由此形成环状分子。所述靶核酸可以包含选自无细胞血浆DNA、声处理的DNA和限制性消化的DNA的基因组片段。在一些实施方案中,在所述第一和第二扩增引物上的通用序列是独特的。所述第一或第二扩增引物的通用序列可以包含测序引物。在一些实施方案中,所述通用引物包含SED ID NO: 1和2。在一些实施方案中,所述第一和第二扩增引物中的仅一种包含5’-磷酸酯基团。
在一些实施方案中,通过核酸酶消化或通过物理方式分离所述双链扩增子的链。
在一些实施方案中,所述环化寡核苷酸包含捕获部分的配体。在一些实施方案中,所述配体-捕获部分对选自生物素-抗生蛋白链菌素、抗体-抗原或寡核苷酸-互补捕获寡核苷酸。在一些实施方案中,所述环化寡核苷酸包含SED ID NO: 3。在一些实施方案中,所述环化寡核苷酸是Y-形结构,其具有与所述双组分引物中的通用环化序列互补的单链区域。
在一些实施方案中,本发明是制备用于测序的环状靶核酸的文库,其包括:用包含通用环化序列和靶标特异性序列的第一和第二双组分扩增引物扩增靶核酸以产生双链扩增子;分离所述双链扩增子的链;使所述链与环化寡核苷酸接触以产生杂交结构,其中所述链中的通用环化序列与所述环化寡核苷酸杂交,使得每条链的末端可连接地靠近;和连接所述链的末端,由此形成环状靶核酸的文库。在一些实施方案中,所述靶核酸包含通用衔接子序列,其包含缀合至所述靶序列的通用引物结合位点。
在一些实施方案中,本发明是一种确定样品中的双链靶核酸的序列的方法,所述方法包括: 将通用引物结合位点连接至样品中的靶核酸的末端以形成衔接的靶核酸;用第一和第二双组分扩增引物扩增所述衔接的靶核酸,以产生双链扩增子,所述双组分扩增引物包含与通用引物结合位点互补的通用引物和通用环化序列;分离所述双链扩增子的链;使所述链与环化寡核苷酸接触以产生杂交结构,其中所述链中的通用环化序列与所述环化寡核苷酸杂交,使得每条链的末端可连接地靠近;连接所述链的末端,由此形成环状靶核酸;使所述样品与测序引物接触,所述测序引物与所述双组分引物的通用序列之一互补;和用核酸聚合酶延伸所述测序引物,由此确定所述靶核酸的序列。在一些实施方案中,通过连接包含所述通用引发位点的衔接子,连接所述通用引发位点。
在一些实施方案中,本发明是一种确定样品中的双链靶核酸的序列的方法,所述方法包括: 用包含靶标特异性序列和通用环化序列的第一和第二双组分扩增引物扩增所述靶核酸以产生双链扩增子;分离所述双链扩增子的链;使所述链与环化寡核苷酸接触以产生杂交结构,其中所述链中的通用环化序列与所述环化寡核苷酸杂交,使得每条链的末端可连接地靠近;和连接所述链的末端,由此形成环状靶核酸;使所述样品与测序引物接触,所述测序引物与所述双组分引物的通用序列之一互补;和用核酸聚合酶延伸所述测序引物,由此确定所述靶核酸的序列。
在一些实施方案中,本发明是一种用于确定靶核酸的序列的试剂盒,所述试剂盒包含:第一和第二双组分扩增引物,其包含通用环化序列和靶标结合序列;环化寡核苷酸,其至少部分地与双组分引物中的通用环化序列互补,使得包含所述双组分引物的链的末端可以可连接地靠近。在一些实施方案中,所述试剂盒也包含DNA聚合酶和DNA连接酶。在一些实施方案中,所述第一和第二双组分扩增引物中的仅一种在5’-末端处被磷酸化。在一些实施方案中,所述环化寡核苷酸包含捕获部分的配体。在一些实施方案中,所述环化寡核苷酸是Y-形结构,其具有与所述双组分引物中的通用环化序列互补的单链区域。
附图说明
图1显示了环化方法的一般路线图。
图2显示了环化方法的详细路线图。
图3显示了在各种条件下单链环状DNA的产率。
图4显示了单链DNA文库的测序的结果。
具体实施方式
定义
以下定义有助于本公开内容的理解。
术语“样品”表示含有或假定含有靶核酸的任何组合物。这包括从个体分离的组织或流体的样品,例如,皮肤、血浆、血清、脊髓液、淋巴液、滑液、尿液、泪水、血细胞、器官和肿瘤,并且也表示从取自个体的细胞建立的体外培养物的样品,包括福尔马林固定的石蜡包埋组织(FFPET)和从其分离的核酸。样品还可以包括无细胞材料,诸如含有无细胞DNA(cfDNA)或循环肿瘤DNA (ctDNA)的无细胞血液级分。
术语“核酸”表示核苷酸(例如,天然的和非天然的核糖核苷酸和脱氧核糖核苷酸)的聚合物,包括DNA、RNA及其亚类,诸如cDNA、mRNA等。核酸可以是单链的或双链的,且通常含有5'-3'磷酸二酯键,尽管在一些情况下,核苷酸类似物可能具有其它键。核酸可以包括天然存在的碱基(腺苷、鸟苷、胞嘧啶、尿嘧啶和胸苷)以及非天然碱基。非天然碱基的一些实例包括在例如Seela等人, (1999) Helv. Chim. Acta 82:1640中描述的那些。非天然碱基可以具有特定功能,例如,增加核酸双链体的稳定性、抑制核酸酶消化或阻断引物延伸或链聚合。
术语“多核苷酸”和“寡核苷酸”可互换使用。多核苷酸是单链或双链核酸。寡核苷酸是有时用于描述较短多核苷酸的术语。寡核苷酸可以由至少6个核苷酸或约15-50个核苷酸构成。通过本领域已知的任意合适方法制备寡核苷酸,例如,通过涉及直接化学合成的方法,如以下文献中所述:Narang等人(1979) Meth. Enzymol. 68:90-99;Brown等人(1979)Meth. Enzymol. 68:109-151; Beaucage等人(1981) Tetrahedron Lett. 22:1859-1862;Matteucci等人(1981) J. Am. Chem. Soc. 103:3185-3191。
术语“引物”表示与靶核酸中的序列(“引物结合位点”)杂交且能够在适合这种合成的条件下充当沿着核酸的互补链的合成的起始点的单链寡核苷酸。
术语“衔接子”意指可以被添加至另一个序列以便将额外的特性输入该序列的核苷酸序列。衔接子通常是这样的寡核苷酸:其可以是单链或双链的,或者可以同时具有单链部分和双链部分。
术语“连接”表示接合两条核酸链的缩合反应,其中一个分子的5'-磷酸酯基团与另一个分子的3'-羟基基团反应。连接通常是由连接酶或拓扑异构酶催化的酶促反应。连接可以接合两条单链以产生一个单链分子。连接还可以接合两条链(每条链属于一个双链分子),因此接合两个双链分子。连接还可以将双链分子的两条链接合至另一个双链分子的两条链,因此接合两个双链分子。连接还可以接合在双链分子内的链的两个末端,因此修复双链分子中的切口。
术语“条形码”表示可以检测和鉴别的核酸序列。可以将条形码掺入多种核酸中。条形码是足够长的,例如2、5、20个核苷酸,使得在样品中,可以将掺入条形码的核酸根据所述条形码区分或分组。
术语“多重标识符”或“MID”表示鉴别靶核酸的来源(例如,衍生出核酸的样品)的条形码。来自相同样品的所有或基本上所有的靶核酸将共享相同的MID。可以将来自不同来源或样品的靶核酸混合并同时测序。使用MID,可以将序列读出分配至靶核酸来源的各个样品。
术语“独特分子标识符”或“UID”表示鉴别与其附接的核酸的条形码。来自相同样品的所有或基本上所有的靶核酸将具有不同的UID。源自相同原始靶核酸的所有或基本上所有的后代(例如,扩增子)将共享相同的UID。
术语“通用引物”和“通用引发结合位点”或“通用引发位点”表示存在于(通常,通过体外添加至)不同靶核酸的引物和引物结合位点。使用衔接子或使用具有在5'-部分中的通用引发位点的靶标特异性(非通用)引物将通用引发位点添加至多种靶核酸。所述通用引物可以结合通用引发位点并指导从所述通用引发位点的引物延伸。
更一般而言,术语“通用”表示可以添加至任何靶核酸并独立于靶核酸序列执行它的功能的核酸分子(例如,引物或其它寡核苷酸)。通用分子可以通过使互补物例如通用引物与通用引物结合位点杂交或使通用环化寡核苷酸与通用引物序列杂交来执行它的功能。
本文中使用的术语“靶序列”、“靶核酸”或“靶标”表示要检测或分析的样品中的核酸序列的一部分。术语靶标包括靶序列的所有变体,例如,一种或多种突变型变体和野生型变体。
术语“测序”表示确定靶核酸中的核苷酸的序列的任何方法。
本发明是制备环状靶核酸分子和这样的分子的文库用于下游分析诸如核酸测序的方法。如在图1中所示,所述方法包括寡核苷酸探针用于环化核酸分子的用途。首先,所述核酸分子具有添加至每个末端的通用序列。然后使在每个末端处具有通用序列的核酸成为单链并与探针接触,所述探针与通用序列的至少一部分互补。所述探针杂交以实现单链环状(sscDNA)分子的环化和形成。
所述方法具有胜过现有环化方法(例如,USRE44265和US2012003657)的优点。与该方法相比,本发明的方法使用附接至靶序列的通用环化序列。本发明的方法不使用含有多个限制位点的非靶寡核苷酸,所述限制位点插入在靶分子的末端之间以确保限制位点的存在(参见USRE44265,其中的图2)。在US2012003657中使用了相同的策略(参见其中的图1A),其中使用含有测序引物结合位点的“载体”寡核苷酸。本发明使用更有效的分子内环化而不是用辅助寡核苷酸的分子间连接。
本发明包括检测样品中的靶核酸。在一些实施方案中,所述样品源自受试者或患者。在一些实施方案中,所述样品可以包含源自受试者或患者的实体组织或实体瘤的片段,例如通过活组织检查。所述样品还可以包含体液(例如,尿液、痰液、血清、血浆或淋巴液、唾液、痰液、汗液、泪液、脑脊髓液、羊水、滑液、心包液、腹膜液、胸膜液、囊液、胆汁、胃液、肠液和/或粪便样品)。所述样品可以包含其中可能存在肿瘤细胞的全血或血液级分。在一些实施方案中,所述样品、尤其是液体样品可以包含无细胞材料,诸如无细胞DNA或RNA,包括无细胞肿瘤DNA或肿瘤RNA。在一些实施方案中,所述样品是无细胞样品,例如无细胞血液来源的样品,其中存在无细胞肿瘤DNA或肿瘤RNA。在其它实施方案中,所述样品是含有或被怀疑含有传染性病原体或源自传染性病原体的核酸的培养样品,例如,培养物或培养上清液。在一些实施方案中,所述传染性病原体是细菌、原生动物、病毒或支原体。
靶核酸是可能存在于样品中的目标核酸。在一些实施方案中,所述靶核酸是基因或基因片段。在其它实施方案中,所述靶核酸含有遗传变体,例如,多态性,包括单核苷酸多态性或变体(SNP或SNV),或导致例如基因融合的遗传重排。在一些实施方案中,所述靶核酸包含生物标志物。在其它实施方案中,所述靶核酸是特定生物体所特有的,例如,有助于鉴别病原生物体,或病原生物体所特有的,例如,药物敏感性或药物抗性。在其它实施方案中,所述靶核酸是人受试者所特有的,例如,定义受试者的独特HLA或KIR基因型的HLA或KIR序列。在其它实施方案中,样品中的所有序列都是靶核酸,例如,在鸟枪基因组测序中。
在本发明的一个实施方案中,将双链靶核酸转化为本发明的模板构型。在一些实施方案中,所述靶核酸在自然界中以单链形式(例如,RNA,包括mRNA、微RNA、病毒RNA;或单链病毒DNA)存在。将单链靶核酸转化为双链形式以实现请求保护的方法的另外步骤。
可以将较长靶核酸片段化,尽管在一些应用中,可能需要较长靶核酸来实现较长阅读。在一些实施方案中,所述靶核酸被天然地片段化,例如,循环的无细胞DNA (cfDNA)或化学降解的DNA诸如在保存的样品中发现的DNA。在其它实施方案中,所述靶核酸在体外被片段化,例如,通过物理方式诸如声处理或通过内切核酸酶消化,例如,限制性消化。
在一些实施方案中,本发明是包括扩增靶核酸的步骤的方法。所述扩增可以是通过聚合酶链式反应(PCR)或利用寡核苷酸引物的任意其它方法。在PCR Strategies(M. A.Innis, D. H. Gelfand, 和J. J. Sninsky编, 1995, Academic Press, San Diego, CA)第14章; PCR Protocols : A Guide to Methods and Applications (M. A. Innis, D.H. Gelfand, J. J. Sninsky, 和T. J. White编, Academic Press, NY, 1990)中描述了多种PCR条件。
所述扩增可以利用包含通用环化序列和靶标特异性序列的第一和第二双组分扩增引物以产生双链扩增子(图2)。在一些实施方案中,正在查询确定的靶标或靶核酸组。在这样的实施方案中,可以使用靶标特异性扩增引物。引物可以具有由在引物的3’-部分中的靶标特异性序列和在引物的5’-部分中的通用序列构成的双组分结构。通常,将靶标特异性引物用作一对独特的寡核苷酸,例如,正向引物和反向引物。对于后续步骤,可以将不同的通用序列添加至正向引物和反向引物的5’-部分以便在所述方法的后续步骤中区分互补链(即,(+)和(-)链)。在一些实施方案中,所述双组分引物的通用序列包含测序引物结合位点。
所述扩增也可以利用通用衔接子序列,其包含缀合至所述靶序列的通用引物结合位点。在其它实施方案中,正在查询多个靶核酸,例如,存在于样品(例如,被怀疑含有一种或多种未知病原性生物体的样品)中的全基因组或所有核酸。在这样的实施方案中,靶标特异性的引物不是有利的,且使用通用引物。在这样的实施方案中,添加通用引物结合位点,例如,通过连接含有通用引物结合位点序列的衔接子分子。通常,独立于靶核酸的序列添加这样的衔接子,例如,通过连接。在这样的实施方案中,靶核酸在每个末端接受相同的衔接子分子。为了区分得到的衔接的靶核酸的链,衔接子可以具有Y-结构,参见例如,美国专利号8,053,192、8,182,989和8,822,150。
在本发明的一些实施方案中,所述衔接子分子连接至所述靶核酸。所述连接可以是平端连接或更有效的粘性末端连接。通过链填充,即通过DNA聚合酶延伸3'-端以消除5'-突出端,可以使靶核酸或衔接子末端变平。在一些实施方案中,通过将单个核苷酸添加至衔接子的3'-末端并将单个互补核苷酸添加至靶核酸的3'-末端,例如通过DNA聚合酶或末端转移酶,可以使平端的衔接子和靶核酸具有粘性。在其它实施方案中,所述衔接子和所述靶核酸可以通过用限制性内切核酸酶消化而获得粘性末端(突出端)。后一种选择对于已知含有限制性酶识别位点的已知靶序列是更有利的。在上述实施方案中的每一个中,所述衔接子分子可以通过下文进一步描述的合成衔接子寡核苷酸的设计而获得所需末端(平端、单碱基延伸或多碱基突出端)。在一些实施方案中,可能需要其它酶促步骤来完成连接。在一些实施方案中,可以使用多核苷酸激酶将5'-磷酸酯添加至靶核酸分子和衔接子分子。
在一些实施方案中,所述衔接子分子是体外合成的人工序列。在其它实施方案中,所述衔接子分子是已知具有所需二级结构的体外合成的天然存在的序列。在其它实施方案中,所述衔接子分子是分离的天然存在的分子或分离的非天然存在的分子。
在一些实施方案中,本发明包括将条形码引入靶核酸中。对各个分子测序通常需要分子条形码诸如在例如美国专利号7,393,665、8,168,385、8,481,292、8,685,678和8,722,368中所述的。独特的分子条形码是通常在体外操作的最早步骤期间添加给样品(诸如患者的样品)中的每种分子的短人工序列。所述条形码标记所述分子和它的后代。所述独特分子条形码(UID)具有多种用途。条形码允许跟踪样品中的每种单个核酸分子以评估例如循环的肿瘤DNA (ctDNA)分子在患者的血液中的存在和量,以便不经活组织检查而检测和监测癌症。独特的分子条形码还可以用于测序误差校正。单个靶分子的整个后代用相同条形码标记并形成带条形码的家族。不被带条形码的家族的所有成员共享的序列变异被作为伪像抛弃且不是真突变。条形码还可以用于位置两分(positional deduplication)和靶标定量,因为整个家族代表原始样品中的单一分子。参见美国专利申请14/209,807和14/774,518。
在本发明的一些实施方案中,双组分扩增引物包含一个或多个条形码。在其它实施方案中,衔接子包含一个或多个条形码。条形码可以是在样品发生混合(多重化)的情况下用于鉴别样品的来源的多重样品ID (MID)。条形码也可以充当用于鉴别每种原始分子和它的后代的独特分子ID (UID)。条形码也可以是UID和MID的组合。在一些实施方案中,将单个条形码用作UID和MID。
在一些实施方案中,每个条形码包含预定义的序列。在其它实施方案中,所述条形码包含随机序列。条形码可以是1-20个核苷酸长。
在一些实施方案中,所述方法查询靶核酸的两条链中的仅一条。本发明包括分离双链扩增子的链的步骤。在一些实施方案中,将一条链降解并将另一条链保留用于所述方法的后续步骤。在一些实施方案中,对所述扩增子进行外切核酸酶处理(例如,通过病毒外切核酸酶、T7或λ外切核酸酶)。在一些实施方案中,可以将所述引物或衔接子修饰成包括5’-或3’-末端保护(诸如硫代磷酸酯)以特异性地靶向用于外切核酸酶消化的替代链。通过物理方式,即,碱性变性或热变性,也可以分离两条链。在其它实施方案中,用能够选择性地结合具有亲和配体的链的亲和试剂捕获期望的链。在一些实施方案中,将引物生物素化并用抗生蛋白链菌素捕获所述链。
在一些实施方案中,将靶核酸的末端磷酸化。在一些实施方案中,将一种引物的5’-末端磷酸化,以便实现外切核酸酶(例如,λ外切核酸酶)对一条链的降解。在其它实施方案中,为该目的将衔接子的5’-末端磷酸化。磷酸化的和非磷酸化的衔接子的混合物(例如,相等混合物)可以用于确保衔接的靶分子的单个5’-末端被磷酸化。
在其它实施方案中,磷酸化对于后续连接步骤而言是必要的。引物、衔接子或在链分离步骤以后的单链分子的磷酸化可以例如使用多核苷酸激酶(PNK)诸如T4 PNK执行。
在一些实施方案中,所述方法包括环化步骤。该步骤包括使扩增子的5’-磷酸化的链与环化寡核苷酸接触以产生杂交结构,其中所述链中的通用环化序列与所述环化寡核苷酸杂交,使得所述链的末端可连接地靠近。所述环化寡核苷酸可以是直链寡核苷酸或两个寡核苷酸的Y-形组合。所述Y-形结构包含与双组分引物中的通用环化序列互补的单链区域。所述环化寡核苷酸也可以包含捕获部分,其用于被捕获对(诸如生物素-抗生蛋白链菌素、抗体-抗原或捕获寡核苷酸-互补寡核苷酸)中的亲和试剂捕获。所述环化寡核苷酸可以是在溶液中游离的或结合至固体支持物,例如,通过上述的捕获部分。所述捕获也可以发生在杂交以后或下述的连接步骤以后。
在一些实施方案中,本发明进一步包括连接步骤,该步骤包括连接与环化寡核苷酸杂交的链的末端,由此形成环状分子。将所述链的5’-末端磷酸化,从而实现所述连接步骤。
在一些实施方案中,本发明包括外切核酸酶消化步骤,其中从反应混合物除去可能包含过量的寡核苷酸的直链核酸或未环化的扩增子。终产物是含有测序引物结合位点的环状ssDNA模板。
在一些实施方案中,本发明是一种制备环状靶核酸的文库的方法。所述方法包括使用通用引物的扩增步骤。将通用引物结合位点添加至样品中的核酸,例如,通过衔接子连接以产生衔接的分子的文库。在所述文库中的分子包含被通用序列(例如,通用引物结合位点和测序引物结合位点)侧接的靶序列。所述环化寡核苷酸可以与所述衔接子中所含的序列互补。在其它实施方案中,所述衔接子仅包含通用引物结合位点,且通用引物引入在所述衔接子中不存在的额外序列。所述通用引物可以是包含通用引物结合位点和例如测序引物结合位点的双组分扩增引物。然后对所述扩增子进行上述方法的步骤以产生单链分子的文库。
在一些实施方案中,本发明包括通过核酸测序来检测样品中的靶核酸。可以将多种核酸(包括样品中的所有核酸)转化成本发明的模板构型并测序。在一些实施方案中,可以对本文描述的环状分子的文库进行核酸测序。
通过本领域已知的任意方法可以执行测序。特别有利的是高通量单分子测序。这样的技术的例子包括Illumina HiSeq平台(Illumina, San Diego, Cal.)、Ion Torrent平台(Life Technologies, Grand Island, NY)、利用SMRT的Pacific BioSciences平台(Pacific Biosciences, Menlo Park, Cal.)或利用纳米孔技术的平台(诸如由OxfordNanopore Technologies (Oxford, UK)或Roche Sequencing Solutions (Santa Clara,Cal.)制造的那些)和任意其它目前存在的或将来的涉及或不涉及合成测序(sequencingby synthesis)的DNA测序技术。测序步骤可以利用平台特异性的测序引物。可以将这些引物的结合位点引入如本文中所述的本发明的方法中,即,通过成为衔接子或扩增引物的一部分。在一些实施方案中,所述测序平台不需要特异性测序引物且不将测序引物结合位点引入环状分子。
在一些实施方案中,本发明是确定双链靶核酸的序列的方法。在该实施方案中,使连接的单链环状核酸与测序引物(其与存在于ssDNA中的测序引物结合位点互补)接触并用核酸聚合酶延伸所述测序引物,由此确定所述靶核酸的序列。
本发明的方法能够在终产物(单链环状靶核酸分子)中包含测序引物结合位点,这允许靶分子的直接测序。利用这样的构造,可能将ssDNA的同一链测序多次并因此产生共有序列。值得注意的是,本发明的方法可适用于多种靶核酸大小。在一些实施方案中,所述靶核酸短至100个碱基对和长至1万个碱基。
在一些实施方案中,所述测序步骤涉及序列分析,其包括序列比对的步骤。在一些实施方案中,使用比对来确定来自多个序列(例如,具有相同条形码(UID)的多个)的共有序列。在一些实施方案中,使用条形码(UID)来确定来自都具有相同条形码(UID)的多个序列的共有序列。在其它实施方案中,使用条形码(UID)来消除伪像,即,存在于一些但并非全部具有相同条形码(UID)的序列中的变异。可以消除这样的源自PCR误差或测序误差的伪像。
在一些实施方案中,通过定量样品中具有每种条形码(UID)的序列的相对数目,可以定量样品中的每种序列的数目。每个UID代表在原始样品中的单个分子,且计数与每种序列变体相关的不同UID可以确定在原始样品中的每种序列的分数。本领域技术人员将能够确定为确定共有序列所必需的序列阅读的数目。在一些实施方案中,所述有关数目是准确定量结果所必需的阅读/UID (“序列深度”)。在一些实施方案中,期望的深度是5-50个阅读/UID。
在一些实施方案中,本发明是一种用于执行本发明的方法的试剂盒。所述试剂盒包含:第一和第二双组分扩增引物,其包含靶标结合序列和任选的与所述环化寡核苷酸互补的通用序列;环化寡核苷酸,其至少部分地与所述双组分引物中的两种通用环化序列互补,使得包含所述双组分引物的链的末端可以可连接地靠近。所述试剂盒也可以包含DNA连接酶(在一些实施方案中,使用T4 DNA连接酶、Taq DNA连接酶或大肠杆菌DNA连接酶)、多核苷酸激酶和DNA聚合酶,诸如扩增聚合酶或测序聚合酶。聚合酶的非限制性例子包括原核DNA聚合酶(例如Pol I、Pol II、Pol III、Pol IV和Pol V)、真核DNA聚合酶、古细菌DNA聚合酶、端粒酶、逆转录酶和RNA聚合酶。逆转录酶是从RNA模板合成DNA的、RNA依赖性的DNA聚合酶。逆转录酶家族含有DNA聚合酶功能性和RNA酶H功能性,其降解与DNA发生碱基配对的RNA。
在一些实施方案中,所述DNA聚合酶具有链置换活性且不具有5’-3-外切核酸酶活性。在一些实施方案中,使用Phi29聚合酶及其衍生物,参见美国专利号5,001,050、5,576,204、7,858747和8921086。在一些实施方案中,所述聚合酶具有3’-5’外切核酸酶活性,该活性有利地从扩增子链除去3’-A突出端。在一些实施方案中,具有5’-3’和3’-5’外切核酸酶活性的重组热球菌衍生的高保真度DNA聚合酶能够产生平端产物。参见Frey, B.和Suppman, B. (1995). BioChemica. 2, 34-35。
实施例
实施例1. 从HIV-B参照序列形成单链环.
用于试验的DNA材料是从Genewiz定购的合成质粒DNA。从HIV-B参照序列设计质粒以靶向约3.2kb的pol基因区域,其具有用于克隆方法的载体骨架pUC57 (总计约6.2kb)。使用标准程序将所述质粒转化进大肠杆菌感受态细胞,克隆,提取,并纯化。将纯化的质粒DNA用限制性酶线性化,并将消化过的质粒DNA使用Bioanalzyer定量并稀释至108拷贝/mL用于PCR扩增。
使用下述引物:
每个50uL PCR反应包含Phusion DNA聚合酶(New England BioLabs, Ipswich,Mass)、正向和反向靶标特异性引物和106个拷贝的HIV Genewiz DNA模板。
按照生产商的推荐在热循环仪中执行PCR扩增。使用Fragment Analyzer或Bioanalyzer和Qubit dsDNA Broad Range进行PCR QC评估以确定是否存在任何脱靶产物和PCR反应是否是有效的。使用SPRI珠子将PCR产物纯化以除去过量的引物和PCR试剂。将每份珠子清除物(cleanup)在TrisHCl pH 8.0中洗脱,并计算向外切核酸酶反应中输入2ug的体积量。
使用λ外切核酸酶的外切核酸酶反应包含λ外切核酸酶和2 ug的dsDNA扩增子。将反应物在具有加热盖的热循环仪中在37℃温育30 min,随后在75℃热灭活10 min。
将产物用SPRI珠子纯化以准备用于工作流中的下一反应,在30uL洗脱缓冲液中洗脱,并在Qubit ssDNA和dsDNA试剂盒以及Bioanalyzer上测量以确定外切核酸酶反应的效率。
用T4多核苷酸激酶执行磷酸化。单链DNA模板的磷酸化将实现连接。
将产物用SPRI珠子纯化以准备用于工作流中的下一反应,并在30uL洗脱缓冲液中洗脱,并直接地进入-连接(环化)反应,不需要QC步骤。
用DNA连接酶和环化寡核苷酸执行连接。将具有引物序列尾巴和M13尾巴的互补序列的长探针用于环化。
在49 uL体积中将5’-磷酸化的ssDNA模板与10 ul的20uM直链探针混合,并加入Taq DNA连接酶以便允许环化和连接发生。
将连接后产物用SPRI珠子纯化以准备用于工作流中的下一反应,并在45uL洗脱缓冲液中洗脱。在Qubit ssDNA和dsDNA试剂盒上测量连接后产物。
在制备单链环状靶核酸的最终步骤中,用外切核酸酶Exo I和Exo III的混合物或用Exo VII除去直链的或未环化的核酸。将反应物在37℃温育30分钟。
将产物用SPRI珠子纯化,在20uL洗脱缓冲液中洗脱,并用Qubit ssDNA和dsDNA以及Bioanalzyer High Sensitivity进行QC以确定经纯化的最终文库的产率和大小。示例性的ss和dsDNA文库产率显示在图3上。
实施例2. 测序单链环状模板.
根据生产商的说明书在Pacific BioSciences RSII仪器(Pacific BioSciences,Menlo Park, Cal.)上对上述的单链环状分子测序。结果显示在表1和图4中。
表1.
文库ID | 聚合酶阅读长度 | 空的(P0) | 生产的(P1) | 其它(P2) |
T7 | 7373 | 57722 (38%) | 59226 (39%) | 33344 (22%) |
λ | 15081 | 68401 (46%) | 61531 (41%) | 20360 (14%) |
Claims (16)
1.一种从靶核酸形成环状分子的方法,所述方法包括:
a)用包含通用环化序列和靶标特异性序列的第一和第二双组分扩增引物扩增所述靶核酸以产生双链扩增子;
b)分离所述双链扩增子的链;
c)使所述扩增子的链与环化寡核苷酸接触以产生杂交结构,其中所述链中的所述通用环化序列与所述环化寡核苷酸杂交,使得所述链的末端可连接地靠近;和
d)连接所述链的末端,由此形成环状分子。
2.根据权利要求1所述的方法,其中所述靶核酸包含选自无细胞血浆DNA、声处理的DNA和限制性消化的DNA的基因组片段。
3.根据权利要求1所述的方法,其中所述第一和第二扩增引物上的通用序列是独特的。
4.根据权利要求1所述的方法,其中所述第一或第二扩增引物的通用序列包含测序引物。
5.根据权利要求1所述的方法,其中所述第一和第二扩增引物中的仅一种包含5’-磷酸酯基团。
6.根据权利要求1所述的方法,其中通过核酸酶消化而分离所述双链扩增子的链。
7.根据权利要求1所述的方法,其中通过物理方式而分离所述双链扩增子的链。
8.根据权利要求1所述的方法,其中所述环化寡核苷酸包含捕获部分的配体。
9.根据权利要求8所述的方法,其中所述配体-捕获部分对选自生物素-抗生蛋白链菌素、抗体-抗原或寡核苷酸-互补捕获寡核苷酸。
10.根据权利要求1所述的方法,其中所述环化寡核苷酸是Y-形结构,其具有与所述双组分引物中的通用环化序列互补的单链区域。
11.一种制备用于测序的环状靶核酸的文库的方法,所述方法包括:
a)用包含通用环化序列和靶标特异性序列的第一和第二双组分扩增引物扩增所述靶核酸以产生双链扩增子;
b)分离所述双链扩增子的链;
c)使所述链与环化寡核苷酸接触以产生杂交结构,其中所述链中的所述通用环化序列与所述环化寡核苷酸杂交,使得每条链的末端可连接地靠近;和
d)连接所述链的末端,由此形成环状靶核酸的文库。
12.根据权利要求11所述的方法,其中所述靶核酸包含通用衔接子序列,所述通用衔接子序列包含缀合至所述靶序列的通用引物结合位点。
13.一种确定样品中的双链靶核酸的序列的方法,所述方法包括:
a)将通用引物结合位点连接至样品中的靶核酸的末端以形成衔接的靶核酸;
b)用第一和第二双组分扩增引物扩增所述衔接的靶核酸,以产生双链扩增子,所述双组分扩增引物包含与所述通用引物结合位点互补的通用引物和通用环化序列;
c)分离所述双链扩增子的链;
d)使所述链与环化寡核苷酸接触以产生杂交结构,其中所述链中的所述通用环化序列与所述环化寡核苷酸杂交,使得每条链的末端可连接地靠近;和;
e)连接所述链的末端,由此形成环状靶核酸;
f)使所述样品与测序引物接触,所述测序引物与所述双组分引物的通用序列之一互补;和
g)用核酸聚合酶延伸所述测序引物,由此确定所述靶核酸的序列。
14.根据权利要求13所述的方法,其中通过连接包含所述通用引发位点的衔接子,连接所述通用引发位点。
15.一种确定样品中的双链靶核酸的序列的方法,所述方法包括:
a)用包含靶标特异性序列和通用环化序列的第一和第二双组分扩增引物扩增所述靶核酸以产生双链扩增子;
b)分离所述双链扩增子的链;
c)使所述链与环化寡核苷酸接触以产生杂交结构,其中所述链中的所述通用环化序列与所述环化寡核苷酸杂交,使得每条链的末端可连接地靠近;
d)连接所述链的末端,由此形成环状靶核酸;
e) 使所述样品与测序引物接触,所述测序引物与所述双组分引物的通用序列之一互补;和
f)用核酸聚合酶延伸所述测序引物,由此确定所述靶核酸的序列。
16.一种用于确定靶核酸的序列的试剂盒,所述试剂盒包含:
a)第一和第二双组分扩增引物,其包含通用环化序列和靶标结合序列;
b)环化寡核苷酸,其至少部分地与所述双组分引物中的所述通用环化序列互补,使得包含所述双组分引物的链的末端可以可连接地靠近。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762558753P | 2017-09-14 | 2017-09-14 | |
US62/558753 | 2017-09-14 | ||
PCT/EP2018/074761 WO2019053132A1 (en) | 2017-09-14 | 2018-09-13 | NEW METHOD FOR THE GENERATION OF CIRCULAR SINGLE STRAND DNA LIBRARIES |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111315895A true CN111315895A (zh) | 2020-06-19 |
Family
ID=63586715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880059003.9A Pending CN111315895A (zh) | 2017-09-14 | 2018-09-13 | 用于产生环状单链dna文库的新型方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20200308576A1 (zh) |
EP (1) | EP3682025A1 (zh) |
JP (1) | JP2020532976A (zh) |
CN (1) | CN111315895A (zh) |
WO (1) | WO2019053132A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230279382A1 (en) * | 2022-03-04 | 2023-09-07 | Element Biosciences, Inc. | Single-stranded splint strands and methods of use |
US11200446B1 (en) | 2020-08-31 | 2021-12-14 | Element Biosciences, Inc. | Single-pass primary analysis |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030152925A1 (en) * | 2001-12-08 | 2003-08-14 | Jong-Yoon Chun | Annealing control primer system for regulating primer annealing specificity and its applications |
CN101460633A (zh) * | 2006-03-14 | 2009-06-17 | 基尼宗生物科学公司 | 用于核酸测序的方法和装置 |
CN102864498A (zh) * | 2012-09-24 | 2013-01-09 | 天津工业生物技术研究所 | 一种长片段末端文库的构建方法 |
US20150284789A1 (en) * | 2013-06-07 | 2015-10-08 | Keygene N.V. | Method for targeted sequencing |
CN105400776A (zh) * | 2014-09-12 | 2016-03-16 | 深圳华大基因科技有限公司 | 寡核苷酸接头及其在构建核酸测序单链环状文库中的应用 |
WO2016037394A1 (zh) * | 2014-09-12 | 2016-03-17 | 深圳华大基因科技有限公司 | 一种核酸单链环状文库的构建方法和试剂 |
CN105624272A (zh) * | 2014-10-29 | 2016-06-01 | 深圳华大基因科技有限公司 | 基因组预定区域核酸测序文库的构建方法及装置 |
CN105917036A (zh) * | 2013-08-19 | 2016-08-31 | 雅培分子公司 | 下一代测序文库 |
CN105985945A (zh) * | 2015-01-30 | 2016-10-05 | 深圳华大基因研究院 | mRNA片段化方法及基于其构建测序文库的方法 |
WO2016201142A1 (en) * | 2015-06-09 | 2016-12-15 | Life Technologies Corporation | Methods, systems, compositions, kits, apparatus and computer-readable media for molecular tagging |
CN106554957A (zh) * | 2015-09-30 | 2017-04-05 | 中国农业科学院深圳农业基因组研究所 | 测序文库及其制备和应用 |
CN106661575A (zh) * | 2014-10-14 | 2017-05-10 | 深圳华大基因科技有限公司 | 一种接头元件和使用其构建测序文库的方法 |
CN106661631A (zh) * | 2014-06-06 | 2017-05-10 | 康奈尔大学 | 使用组合的核酸酶、连接酶、聚合酶和测序反应识别和枚举核酸序列、表达、拷贝或dna甲基化变化的方法 |
CN107002291A (zh) * | 2014-11-26 | 2017-08-01 | 深圳华大基因研究院 | 一种核酸的双接头单链环状文库的构建方法和试剂 |
CN107002292A (zh) * | 2014-11-26 | 2017-08-01 | 深圳华大基因研究院 | 一种核酸的双接头单链环状文库的构建方法和试剂 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5001050A (en) | 1989-03-24 | 1991-03-19 | Consejo Superior Investigaciones Cientificas | PHφ29 DNA polymerase |
US5198543A (en) | 1989-03-24 | 1993-03-30 | Consejo Superior Investigaciones Cientificas | PHI29 DNA polymerase |
GB2378245A (en) | 2001-08-03 | 2003-02-05 | Mats Nilsson | Nucleic acid amplification method |
US7315019B2 (en) | 2004-09-17 | 2008-01-01 | Pacific Biosciences Of California, Inc. | Arrays of optical confinements and uses thereof |
US7393665B2 (en) | 2005-02-10 | 2008-07-01 | Population Genetics Technologies Ltd | Methods and compositions for tagging and identifying polynucleotides |
US7858747B2 (en) | 2005-08-30 | 2010-12-28 | Novo Nordisk A/S | Expression of proteins in E.coli |
CA2633524A1 (en) | 2005-12-22 | 2007-07-05 | Pacific Biosciences Of California, Inc. | Polymerases for nucleotide analogue incorporation |
EP2121983A2 (en) | 2007-02-02 | 2009-11-25 | Illumina Cambridge Limited | Methods for indexing samples and sequencing multiple nucleotide templates |
CA2991818C (en) | 2008-03-28 | 2022-10-11 | Pacific Biosciences Of California, Inc. | Compositions and methods for nucleic acid sequencing |
US20120003657A1 (en) | 2010-07-02 | 2012-01-05 | Samuel Myllykangas | Targeted sequencing library preparation by genomic dna circularization |
PT2623613T (pt) | 2010-09-21 | 2016-10-11 | Population Genetics Tech Ltd | Aumento da confiança da designação de alelos por contagem molecular |
WO2018112806A1 (zh) * | 2016-12-21 | 2018-06-28 | 深圳华大智造科技有限公司 | 将线性测序文库转换为环状测序文库的方法 |
-
2018
- 2018-09-13 CN CN201880059003.9A patent/CN111315895A/zh active Pending
- 2018-09-13 JP JP2020512423A patent/JP2020532976A/ja active Pending
- 2018-09-13 WO PCT/EP2018/074761 patent/WO2019053132A1/en unknown
- 2018-09-13 EP EP18769674.5A patent/EP3682025A1/en not_active Withdrawn
-
2020
- 2020-03-03 US US16/808,173 patent/US20200308576A1/en not_active Abandoned
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030152925A1 (en) * | 2001-12-08 | 2003-08-14 | Jong-Yoon Chun | Annealing control primer system for regulating primer annealing specificity and its applications |
CN101460633A (zh) * | 2006-03-14 | 2009-06-17 | 基尼宗生物科学公司 | 用于核酸测序的方法和装置 |
US20100028873A1 (en) * | 2006-03-14 | 2010-02-04 | Abdelmajid Belouchi | Methods and means for nucleic acid sequencing |
CN102864498A (zh) * | 2012-09-24 | 2013-01-09 | 天津工业生物技术研究所 | 一种长片段末端文库的构建方法 |
US20150284789A1 (en) * | 2013-06-07 | 2015-10-08 | Keygene N.V. | Method for targeted sequencing |
CN105917036A (zh) * | 2013-08-19 | 2016-08-31 | 雅培分子公司 | 下一代测序文库 |
CN106661631A (zh) * | 2014-06-06 | 2017-05-10 | 康奈尔大学 | 使用组合的核酸酶、连接酶、聚合酶和测序反应识别和枚举核酸序列、表达、拷贝或dna甲基化变化的方法 |
WO2016037394A1 (zh) * | 2014-09-12 | 2016-03-17 | 深圳华大基因科技有限公司 | 一种核酸单链环状文库的构建方法和试剂 |
CN105400776A (zh) * | 2014-09-12 | 2016-03-16 | 深圳华大基因科技有限公司 | 寡核苷酸接头及其在构建核酸测序单链环状文库中的应用 |
CN106661575A (zh) * | 2014-10-14 | 2017-05-10 | 深圳华大基因科技有限公司 | 一种接头元件和使用其构建测序文库的方法 |
CN105624272A (zh) * | 2014-10-29 | 2016-06-01 | 深圳华大基因科技有限公司 | 基因组预定区域核酸测序文库的构建方法及装置 |
CN107002291A (zh) * | 2014-11-26 | 2017-08-01 | 深圳华大基因研究院 | 一种核酸的双接头单链环状文库的构建方法和试剂 |
CN107002292A (zh) * | 2014-11-26 | 2017-08-01 | 深圳华大基因研究院 | 一种核酸的双接头单链环状文库的构建方法和试剂 |
CN105985945A (zh) * | 2015-01-30 | 2016-10-05 | 深圳华大基因研究院 | mRNA片段化方法及基于其构建测序文库的方法 |
WO2016201142A1 (en) * | 2015-06-09 | 2016-12-15 | Life Technologies Corporation | Methods, systems, compositions, kits, apparatus and computer-readable media for molecular tagging |
CN106554957A (zh) * | 2015-09-30 | 2017-04-05 | 中国农业科学院深圳农业基因组研究所 | 测序文库及其制备和应用 |
Non-Patent Citations (1)
Title |
---|
TIMOKRATIS KARAMITROS等: "A novel method for the multiplexed target enrichment of MinION next generation sequencing libraries using PCR-generated baits" * |
Also Published As
Publication number | Publication date |
---|---|
WO2019053132A1 (en) | 2019-03-21 |
JP2020532976A (ja) | 2020-11-19 |
EP3682025A1 (en) | 2020-07-22 |
US20200308576A1 (en) | 2020-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11155855B2 (en) | Single stranded circular DNA libraries for circular consensus sequencing | |
EP3532635B1 (en) | Barcoded circular library construction for identification of chimeric products | |
WO2012003374A2 (en) | Targeted sequencing library preparation by genomic dna circularization | |
US11168360B2 (en) | Circularization methods for single molecule sequencing sample preparation | |
US20210115510A1 (en) | Generation of single-stranded circular dna templates for single molecule sequencing | |
JP2022160661A (ja) | 単一分子配列決定のための一本鎖環状dna鋳型の作成 | |
WO2019086531A1 (en) | Linear consensus sequencing | |
JP2016534745A (ja) | Dnaライブラリーの調製のためのdnaアダプター分子およびその生成法および使用 | |
US11085068B2 (en) | Method for generating single-stranded circular DNA libraries for single molecule sequencing | |
US20200308576A1 (en) | Novel method for generating circular single-stranded dna libraries | |
US11345955B2 (en) | Hybridization-extension-ligation strategy for generating circular single-stranded DNA libraries | |
US20240076653A1 (en) | Method for constructing multiplex pcr library for high-throughput targeted sequencing | |
CN115279918A (zh) | 用于测序的新型核酸模板结构 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200619 |
|
WD01 | Invention patent application deemed withdrawn after publication |