CN111542532B - 酶法合成寡核苷酸的方法和体系 - Google Patents
酶法合成寡核苷酸的方法和体系 Download PDFInfo
- Publication number
- CN111542532B CN111542532B CN201880078052.7A CN201880078052A CN111542532B CN 111542532 B CN111542532 B CN 111542532B CN 201880078052 A CN201880078052 A CN 201880078052A CN 111542532 B CN111542532 B CN 111542532B
- Authority
- CN
- China
- Prior art keywords
- single stranded
- primer
- template
- polymerase
- oligonucleotide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108091034117 Oligonucleotide Proteins 0.000 title claims abstract description 133
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000002194 synthesizing effect Effects 0.000 title claims description 10
- 102000004190 Enzymes Human genes 0.000 title description 39
- 108090000790 Enzymes Proteins 0.000 title description 39
- 230000002441 reversible effect Effects 0.000 claims abstract description 38
- 125000003729 nucleotide group Chemical group 0.000 claims description 55
- 239000002773 nucleotide Substances 0.000 claims description 52
- 150000007523 nucleic acids Chemical class 0.000 claims description 42
- 102000039446 nucleic acids Human genes 0.000 claims description 33
- 108020004707 nucleic acids Proteins 0.000 claims description 33
- 238000009396 hybridization Methods 0.000 claims description 25
- 239000007787 solid Substances 0.000 claims description 16
- 230000000295 complement effect Effects 0.000 claims description 13
- 239000003153 chemical reaction reagent Substances 0.000 claims description 8
- 239000012634 fragment Substances 0.000 claims description 7
- 108091027568 Single-stranded nucleotide Proteins 0.000 claims 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 abstract description 70
- 238000003786 synthesis reaction Methods 0.000 abstract description 37
- 230000015572 biosynthetic process Effects 0.000 abstract description 36
- 230000002255 enzymatic effect Effects 0.000 abstract description 16
- -1 deoxyribonucleotide triphosphates Chemical class 0.000 abstract description 15
- 239000001226 triphosphate Substances 0.000 abstract description 10
- 235000011178 triphosphate Nutrition 0.000 abstract description 10
- 108091028664 Ribonucleotide Proteins 0.000 abstract description 5
- 239000002336 ribonucleotide Substances 0.000 abstract description 5
- 125000002652 ribonucleotide group Chemical group 0.000 abstract description 4
- 238000006911 enzymatic reaction Methods 0.000 abstract description 2
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 abstract 3
- 239000005547 deoxyribonucleotide Substances 0.000 abstract 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 abstract 1
- 238000006243 chemical reaction Methods 0.000 description 69
- 108020004414 DNA Proteins 0.000 description 47
- 102000053602 DNA Human genes 0.000 description 47
- 239000000758 substrate Substances 0.000 description 43
- 239000000243 solution Substances 0.000 description 42
- 102100031780 Endonuclease Human genes 0.000 description 37
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 37
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 36
- 241000713869 Moloney murine leukemia virus Species 0.000 description 28
- 238000004458 analytical method Methods 0.000 description 27
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 26
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 26
- 239000011324 bead Substances 0.000 description 23
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 19
- 239000007790 solid phase Substances 0.000 description 18
- 230000000694 effects Effects 0.000 description 15
- 238000003776 cleavage reaction Methods 0.000 description 14
- 230000007017 scission Effects 0.000 description 14
- 108020004682 Single-Stranded DNA Proteins 0.000 description 13
- 238000010348 incorporation Methods 0.000 description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 description 12
- 239000000499 gel Substances 0.000 description 12
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 9
- 229920002477 rna polymer Polymers 0.000 description 9
- 229940035893 uracil Drugs 0.000 description 9
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 239000011541 reaction mixture Substances 0.000 description 8
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 7
- PBVAJRFEEOIAGW-UHFFFAOYSA-N 3-[bis(2-carboxyethyl)phosphanyl]propanoic acid;hydrochloride Chemical compound Cl.OC(=O)CCP(CCC(O)=O)CCC(O)=O PBVAJRFEEOIAGW-UHFFFAOYSA-N 0.000 description 7
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 7
- 239000007791 liquid phase Substances 0.000 description 7
- 238000002515 oligonucleotide synthesis Methods 0.000 description 7
- 235000000346 sugar Nutrition 0.000 description 7
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 6
- 238000003752 polymerase chain reaction Methods 0.000 description 6
- OZFPSOBLQZPIAV-UHFFFAOYSA-N 5-nitro-1h-indole Chemical compound [O-][N+](=O)C1=CC=C2NC=CC2=C1 OZFPSOBLQZPIAV-UHFFFAOYSA-N 0.000 description 5
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 5
- 101900297506 Human immunodeficiency virus type 1 group M subtype B Reverse transcriptase/ribonuclease H Proteins 0.000 description 5
- 108010090804 Streptavidin Proteins 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- RGWHQCVHVJXOKC-SHYZEUOFSA-N dCTP Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 description 5
- 238000010511 deprotection reaction Methods 0.000 description 5
- 238000011033 desalting Methods 0.000 description 5
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 4
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 4
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 4
- 108091093094 Glycol nucleic acid Proteins 0.000 description 4
- 229910021380 Manganese Chloride Inorganic materials 0.000 description 4
- GLFNIEUTAYBVOC-UHFFFAOYSA-L Manganese chloride Chemical compound Cl[Mn]Cl GLFNIEUTAYBVOC-UHFFFAOYSA-L 0.000 description 4
- 108091093037 Peptide nucleic acid Proteins 0.000 description 4
- 108091046915 Threose nucleic acid Proteins 0.000 description 4
- 239000013504 Triton X-100 Substances 0.000 description 4
- 229920004890 Triton X-100 Polymers 0.000 description 4
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 4
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 4
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 4
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 4
- 235000011130 ammonium sulphate Nutrition 0.000 description 4
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 4
- 239000011565 manganese chloride Substances 0.000 description 4
- 235000002867 manganese chloride Nutrition 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 239000000178 monomer Substances 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- LZJGQIVWUKFTRD-UHFFFAOYSA-N 7-nitro-1h-indole Chemical compound [O-][N+](=O)C1=CC=CC2=C1NC=C2 LZJGQIVWUKFTRD-UHFFFAOYSA-N 0.000 description 3
- 108060002716 Exonuclease Proteins 0.000 description 3
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical compound [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 description 3
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 239000013543 active substance Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000000576 coating method Methods 0.000 description 3
- 239000004205 dimethyl polysiloxane Substances 0.000 description 3
- 102000013165 exonuclease Human genes 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000010931 gold Substances 0.000 description 3
- 229910052737 gold Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000011572 manganese Substances 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 150000002739 metals Chemical class 0.000 description 3
- 229920000435 poly(dimethylsiloxane) Polymers 0.000 description 3
- 229920002401 polyacrylamide Polymers 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000001915 proofreading effect Effects 0.000 description 3
- 239000011535 reaction buffer Substances 0.000 description 3
- 230000035484 reaction time Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- MPCAJMNYNOGXPB-UHFFFAOYSA-N 1,5-Anhydro-mannit Natural products OCC1OCC(O)C(O)C1O MPCAJMNYNOGXPB-UHFFFAOYSA-N 0.000 description 2
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 2
- 208000035657 Abasia Diseases 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 230000006820 DNA synthesis Effects 0.000 description 2
- 108010082610 Deoxyribonuclease (Pyrimidine Dimer) Proteins 0.000 description 2
- 102000004099 Deoxyribonuclease (Pyrimidine Dimer) Human genes 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 101001066878 Homo sapiens Polyribonucleotide nucleotidyltransferase 1, mitochondrial Proteins 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 102000002681 Polyribonucleotide nucleotidyltransferase Human genes 0.000 description 2
- GWEVSGVZZGPLCZ-UHFFFAOYSA-N Titan oxide Chemical compound O=[Ti]=O GWEVSGVZZGPLCZ-UHFFFAOYSA-N 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 150000003926 acrylamides Chemical class 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 229920001222 biopolymer Polymers 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- HGCIXCUEYOPUTN-UHFFFAOYSA-N cis-cyclohexene Natural products C1CCC=CC1 HGCIXCUEYOPUTN-UHFFFAOYSA-N 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical group NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 239000005549 deoxyribonucleoside Substances 0.000 description 2
- 239000005546 dideoxynucleotide Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- KWIUHFFTVRNATP-UHFFFAOYSA-N glycine betaine Chemical compound C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 229910052748 manganese Inorganic materials 0.000 description 2
- 229910001437 manganese ion Inorganic materials 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 150000004713 phosphodiesters Chemical group 0.000 description 2
- 229920002120 photoresistant polymer Polymers 0.000 description 2
- 229920003229 poly(methyl methacrylate) Polymers 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 239000004926 polymethyl methacrylate Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 2
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 2
- JTBBWRKSUYCPFY-UHFFFAOYSA-N 2,3-dihydro-1h-pyrimidin-4-one Chemical compound O=C1NCNC=C1 JTBBWRKSUYCPFY-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- HCGYMSSYSAKGPK-UHFFFAOYSA-N 2-nitro-1h-indole Chemical class C1=CC=C2NC([N+](=O)[O-])=CC2=C1 HCGYMSSYSAKGPK-UHFFFAOYSA-N 0.000 description 1
- FTBBGQKRYUTLMP-UHFFFAOYSA-N 2-nitro-1h-pyrrole Chemical class [O-][N+](=O)C1=CC=CN1 FTBBGQKRYUTLMP-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 102100038687 5'-nucleotidase domain-containing protein 3 Human genes 0.000 description 1
- IIBWUFDOKZOLAY-OVRZYLCMSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3h-purin-6-one;9-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-3h-purin-6-one Chemical class C1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1.O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 IIBWUFDOKZOLAY-OVRZYLCMSA-N 0.000 description 1
- 240000005020 Acaciella glauca Species 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- JBRZTFJDHDCESZ-UHFFFAOYSA-N AsGa Chemical compound [As]#[Ga] JBRZTFJDHDCESZ-UHFFFAOYSA-N 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- QGPNBXOLVRTTAX-UHFFFAOYSA-N C(C=C)(=O)N.P(=O)#C[N+](CCO)(C)C Chemical compound C(C=C)(=O)N.P(=O)#C[N+](CCO)(C)C QGPNBXOLVRTTAX-UHFFFAOYSA-N 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- KKZFLSZAWCYPOC-VPENINKCSA-N Deoxyribose 5-phosphate Chemical compound O[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 KKZFLSZAWCYPOC-VPENINKCSA-N 0.000 description 1
- 108091027757 Deoxyribozyme Proteins 0.000 description 1
- 101001058087 Dictyostelium discoideum Endonuclease 4 homolog Proteins 0.000 description 1
- LTMHDMANZUZIPE-AMTYYWEZSA-N Digoxin Natural products O([C@H]1[C@H](C)O[C@H](O[C@@H]2C[C@@H]3[C@@](C)([C@@H]4[C@H]([C@]5(O)[C@](C)([C@H](O)C4)[C@H](C4=CC(=O)OC4)CC5)CC3)CC2)C[C@@H]1O)[C@H]1O[C@H](C)[C@@H](O[C@H]2O[C@@H](C)[C@H](O)[C@@H](O)C2)[C@@H](O)C1 LTMHDMANZUZIPE-AMTYYWEZSA-N 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 229910052581 Si3N4 Inorganic materials 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- UCKMPCXJQFINFW-UHFFFAOYSA-N Sulphide Chemical compound [S-2] UCKMPCXJQFINFW-UHFFFAOYSA-N 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 239000002168 alkylating agent Substances 0.000 description 1
- 229940100198 alkylating agent Drugs 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- PNEYBMLMFCGWSK-UHFFFAOYSA-N aluminium oxide Inorganic materials [O-2].[O-2].[O-2].[Al+3].[Al+3] PNEYBMLMFCGWSK-UHFFFAOYSA-N 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 125000002344 aminooxy group Chemical group [H]N([H])O[*] 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 229960003237 betaine Drugs 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 238000007413 biotinylation Methods 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 208000035269 cancer or benign tumor Diseases 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- CREMABGTGYGIQB-UHFFFAOYSA-N carbon carbon Chemical compound C.C CREMABGTGYGIQB-UHFFFAOYSA-N 0.000 description 1
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 229910001429 cobalt ion Inorganic materials 0.000 description 1
- XLJKHNWPARRRJB-UHFFFAOYSA-N cobalt(2+) Chemical compound [Co+2] XLJKHNWPARRRJB-UHFFFAOYSA-N 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 239000005289 controlled pore glass Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 230000027832 depurination Effects 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- LTMHDMANZUZIPE-PUGKRICDSA-N digoxin Chemical compound C1[C@H](O)[C@H](O)[C@@H](C)O[C@H]1O[C@@H]1[C@@H](C)O[C@@H](O[C@@H]2[C@H](O[C@@H](O[C@@H]3C[C@@H]4[C@]([C@@H]5[C@H]([C@]6(CC[C@@H]([C@@]6(C)[C@H](O)C5)C=5COC(=O)C=5)O)CC4)(C)CC3)C[C@@H]2O)C)C[C@@H]1O LTMHDMANZUZIPE-PUGKRICDSA-N 0.000 description 1
- 229960005156 digoxin Drugs 0.000 description 1
- LTMHDMANZUZIPE-UHFFFAOYSA-N digoxine Natural products C1C(O)C(O)C(C)OC1OC1C(C)OC(OC2C(OC(OC3CC4C(C5C(C6(CCC(C6(C)C(O)C5)C=5COC(=O)C=5)O)CC4)(C)CC3)CC2O)C)CC1O LTMHDMANZUZIPE-UHFFFAOYSA-N 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000001215 fluorescent labelling Methods 0.000 description 1
- HZXMRANICFIONG-UHFFFAOYSA-N gallium phosphide Chemical compound [Ga]#P HZXMRANICFIONG-UHFFFAOYSA-N 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 229910052732 germanium Inorganic materials 0.000 description 1
- GNPVGFCGXDBREM-UHFFFAOYSA-N germanium atom Chemical compound [Ge] GNPVGFCGXDBREM-UHFFFAOYSA-N 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 125000003147 glycosyl group Chemical group 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 239000000383 hazardous chemical Substances 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- AMGQUBHHOARCQH-UHFFFAOYSA-N indium;oxotin Chemical compound [In].[Sn]=O AMGQUBHHOARCQH-UHFFFAOYSA-N 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000031700 light absorption Effects 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910001425 magnesium ion Inorganic materials 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 238000003499 nucleic acid array Methods 0.000 description 1
- 229940046166 oligodeoxynucleotide Drugs 0.000 description 1
- 238000002966 oligonucleotide array Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- XEBWQGVWTUSTLN-UHFFFAOYSA-M phenylmercury acetate Chemical compound CC(=O)O[Hg]C1=CC=CC=C1 XEBWQGVWTUSTLN-UHFFFAOYSA-M 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 125000003367 polycyclic group Chemical group 0.000 description 1
- 229920000098 polyolefin Polymers 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 235000003499 redwood Nutrition 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 108010018600 ribonucleotide polymerase Proteins 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 150000003376 silicon Chemical class 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- HQVNEWCFYHHQES-UHFFFAOYSA-N silicon nitride Chemical compound N12[Si]34N5[Si]62N3[Si]51N64 HQVNEWCFYHHQES-UHFFFAOYSA-N 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 108010068698 spleen exonuclease Proteins 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 239000012536 storage buffer Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- BFKJFAAPBSQJPD-UHFFFAOYSA-N tetrafluoroethene Chemical group FC(F)=C(F)F BFKJFAAPBSQJPD-UHFFFAOYSA-N 0.000 description 1
- 150000003568 thioethers Chemical class 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/34—Polynucleotides, e.g. nucleic acids, oligoribonucleotides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1252—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1276—RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6834—Enzymatic or biochemical coupling of nucleic acids to a solid phase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07007—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
Abstract
本发明涉及在聚合酶存在下由单链固定化引物酶法合成寡核苷酸的方法、过程和系统。利用本发明的方法,在脱氧核糖核苷酸三磷酸或核糖核苷酸三磷酸存在下,可从单链固定化引物酶法合成单链寡核苷酸。双脱氧核糖核苷酸三磷酸酯、带有可逆终止子的脱氧核糖核苷酸三磷酸酯或带有可逆终止子的核糖核苷酸三磷酸酯可以酶法添加到引物或其延伸产物的末端。根据本发明的方法,单链引物可与模板结合,所形成的双链结构可使聚合酶在3’端延伸引物。
Description
交叉引用
本申请要求2017年10月4日提交的第62/568,205号美国临时专利申请和2018年9月5日提交的第62/727,174号美国临时专利申请的权益,其全部内容通过引用结合到本文中。
序列表
本即时申请包含序列表,该序列表已以ASCII格式电子提交,并通过引用整体并入本文。所述ASCII副本创建于2018年10月18日,名为38558-733_601_SL.txt,大小为7,632字节。
背景
合成核酸(如寡核苷酸)在分子生物学、法医学和医学诊断等许多领域发挥着重要作用。寡核苷酸已成为现代生物技术和医学研究的重要工具。例如,寡核苷酸已被广泛应用于各种技术中,包括诊断探测法、聚合酶链式反应(PCR)、基因表达的反义抑制和核酸组装。寡核苷酸合成可能涉及基因组编辑,例如依赖CRISPR、DNAzymes(即通过体外选择获得的催化活性脱氧核苷酸(DNA)分子)、DNA折纸、用于数据存储的DNA和空间转录组学的应用。寡核苷酸的广泛应用也促进了核酸阵列的发展,例如脱氧核糖核酸(DNA)和核糖核酸(RNA)阵列。
设计的核酸序列通过使用聚合酶链反应(PCR)或连接酶链反应(LCR)方法连接相应的(先前合成的)寡核苷酸,一次组装一个。参见,如Smith等人,“通过全基因组组装生成合成基因组:合成寡核苷酸的X174噬菌体”,Proc.Natl.Acad.Sci.USA,100(26):15440-5(2003).Gibson是一种分子克隆方法,它允许在单个等温反应中连接多个DNA片段。参见,如Gibson等人,“酶法组装高达几百千碱基的DNA分子”。Nature Methods.6(5):343–345构建长寡核苷酸需要同时合成多个基因序列。然而,最先进的的寡核苷酸合成基本上是通过化学合成逐个完成的。参见Zhou等人,“寡脱氧核苷酸的微流控PicoArray合成和多个DNA序列的同时组装”,Nucleic Acids Res.,11:32(18):5409-17(2004)。
概述
通过聚合酶催化反应合成单链、固定化或液相寡核苷酸是可取的。本发明提供了通过使用一种酶来完成这种酶合成的方法,该酶需要不超过7个碱基对,即可从游离3’端延伸单链、固定寡核苷酸。在一些实施例中,酶法合成需要1、2、3、4、5、6或7个碱基配对,以从其游离3’端延伸单链、固定寡核苷酸。本发明还提供了通过使用改良聚合酶完成这种酶合成的方法,该聚合酶需要不超过7个碱基配对,即可将单链式溶液相寡核苷酸从其游离3’端延伸出来。在某些情况下,酶法合成需要1、2、3、4、5、6或7个碱基配对,才能从其游离3’端延伸出单链的液相寡核苷酸。
在一个方面,本发明提供了一种合成单链寡核苷酸的方法,包括:(a)提供包含游离3’端、聚合酶和核苷酸试剂的单链引物;(b)通过聚合酶将单链引物从游离3’端延伸至核苷酸试剂;聚合酶需要不超过7个碱基配对来延伸单链引物。
在一些实施例中,所述核苷酸试剂为带有3’端终止子的可逆终止核苷酸。在一些实施例中,单链引物还包括附着于基底的5’端。在一些实施例中,聚合酶是一种改良的聚合酶。在一些实施例中,该方法还包括:(c)从可逆终止核苷酸中去除3’端终止子。在一些实施例中,该方法还包括:(d)重复步骤(a)-(c)。在一些实施例中,(d)中的重复步骤将单链引物从游离3’端延伸,从而合成包含该单链引物的单链寡核苷酸产物。
在一些实施例中,该方法还包括在(b)之后和(c)之前:(b1)在聚合酶或末端脱氧核苷酸转移酶(TdT)存在的情况下,用双脱氧核苷酸试剂处理单链引物。
在一些实施例中,该方法还包括在(a)之后和(b)之前:(a1)将单链引物上的杂交位点与模板杂交,并且杂交位点位于3’端且包含不超过7个碱基。在一些实施例中,所述模板是单链引物、附着于基底上的相邻单链核酸或溶液中的多个单链核酸模板中的一种。在一些实施例中,模板是相邻的单链核酸,相邻的单链核酸与单链引物的序列一致性不超过5%、不超过10%、不超过15%、不超过20%、不超过25%、不超过30%、不超过35%、不超过40%、不超过45%、不超过50%、不超过55%、不超过60%、不超过65%、不超过70%、不超过75%、不超过80%、不超过85%、不超过90%或不超过95%。在一些实施例中,模板是相邻的单链核酸,并且相邻的单链核酸与单链寡核苷酸具有100%的序列一致性。在一些实施例中,相邻的单链核酸与单链引物具有至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的序列一致性。在一些实施例中,相邻的单链核酸与单链引物具有约25%、约30%、约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%或约95%的序列一致性。在一些实施例中,相邻的单链核酸与单链引物实质上不具有序列一致性。在一些实施例中,溶液中的多个单链核酸模板是多个二聚体、多个三聚体、多个四聚体、多个五聚体、多个六聚体、多个七聚体、多个八聚体、多个九聚体、多个十聚体、多个十一聚体或多个十二聚体。在一些实施例中,溶液中的多个单链核酸模板是多个长度超过10个碱基的寡核苷酸。在一些实施例中,多个单链核酸模板包括随机序列。
在一些实施例中,杂交位点包括1、2、3、4、5、6或7个碱基。在一些实施例中,在(a1)中存在模板的情况下,(b)中延伸的效率得以提高。在一些实施例中,聚合酶需要1、2、3、4、5、6或7个碱基对来延伸单链引物。在一些实施例中,延伸在约20℃到约99℃之间进行。在一些实施例中,延伸在约50℃到约75℃之间进行。在一些实施例中,延伸在约55℃到约65℃之间进行。在一些实施例中,延伸在约60℃下进行。
在一些实施例中,该酶是脱氧核糖核酸(DNA)聚合酶、RNA聚合酶或逆转录酶。在一些实施例中,经修饰的脱氧核糖核酸(DNA)聚合酶是一种嗜热DNA聚合酶,与未经修饰的DNA聚合酶相比,其降低了3’至5’校对外切酶活性。在一些实施例中,与未经修饰的DNA聚合酶相比,经修饰的DNA聚合酶具有不超过6%的3’到5’校正外切核酸酶活性。在一些实施例中,与未经修饰的DNA聚合酶相比,经修饰的DNA聚合酶具有不超过1%、不超过2%、不超过3%、不超过4%或不超过5%的3’至5’校正外切核酸酶活性。
在一些实施例中,经修饰的逆转录酶是莫洛尼鼠白血病病毒(M-MLV)逆转录酶或人类免疫缺陷病毒1型逆转录酶。在一些实施例中,经修饰的逆转录酶是修饰的莫洛尼鼠白血病病毒(M-MLV)逆转录酶或修饰的人类免疫缺陷病毒1型逆转录酶。在一些实施例中,酶可被修饰以增加延伸效率、使用3’-修饰的底物、或降低温度或pH敏感性等提高效率。在一些实施例中,多个单链核酸模板包含随机序列。
在一些实施例中,单链引物包含尿嘧啶。在一些实施例中,该方法还包括:在尿嘧啶上切割单链引物。在一些实施例中,尿嘧啶位于单链引物的3’末端的最后一个碱基处。
在一些实施例中,该酶是DNA聚合酶。在一些实施例中,DNA聚合酶未经修饰。在一些实施例中,DNA聚合酶经修饰。在一些实施例中,该酶是9°Nm TM DNA聚合酶。在一些实施例中,该酶被修饰为9°NmTM DNA聚合酶。在一些实施例中,经修饰的9°NmTM DNA聚合酶与9°NmTM DNA聚合酶(New England Biolabs,Inc.)的序列一致性为至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%。在一些实施例中,经修饰的9°NmTM DNA聚合酶与°NmTM DNA Polymerase(New England Biolabs,Inc.)聚合酶的序列一致性为约25%、约30%、约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约90%或约95%。
在一些实施例中,逆转录酶是莫洛尼鼠白血病病毒(M-MLV)逆转录酶或人类免疫缺陷病毒1型逆转录酶。在一些实施例中,逆转录酶是经修饰的莫洛尼鼠白血病病毒(M-MLV)逆转录酶或经修饰的人类免疫缺陷病毒1型逆转录酶。在一些实施例中,经修饰的M-MLV逆转录酶与M-MLV逆转录酶具有至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的序列一致性。在一些实施例中,经修饰的M-MLV逆转录酶与M-MLV逆转录酶(Sigma-Aldrich)具有约25%、约30%、约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%或约95%的序列一致性。在一些实施例中,经修饰的逆转录酶是经修饰的莫洛尼鼠白血病病毒(M-MLV)逆转录酶或经修饰的人类免疫缺陷病毒1型逆转录酶。
在一些实施例中,该方法重复其步骤,使其重复从游离3’端延伸单链引物,从而合成包含单链引物的单链寡核苷酸产物。在一些实施例中,该方法还包括:切割单链寡核苷酸产物。在一些实施例中,该方法还包括:切割合成的生长链或杂交的复合物。在一些实施例中,切割合成生长链或杂交复合物包括使用限制性内切酶、使用合成生长链或杂交复合物中的可切割连接物(例如,连接到生长链5’端和生长链与链5'端之间的可切割连接物,或者用转座酶瞄准5’端的位置。在一些实施例中,切割将酶法合成的寡核苷酸割去。在一些实施例中,在生长链/杂交复合物的酶合成片段内切割并移除模板寡核苷酸。在一些实施例中,切割发生在通用模板寡核苷酸(UTO)内。在一些实施例中,切割位于通用模板寡核苷酸(UTO)的3’-端。在一些实施例中,切割发生在单链引物内。在一些实施例中,切割移除序列包括单链引物的至少一部分。在一些实施例中,去除的序列包含单链引物。
在一些实施例中,单链引物包含尿嘧啶。在一些实施例中,该方法还包括:在尿嘧啶处切割单链引物。在一些实施例中,尿嘧啶位于单链引物3’端的最后一个碱基处。在一些实施例中,经修饰的聚合酶需要1、2、3、4、5、6或7个碱基对来延伸单链引物。
通过以下的详细描述,本发明的其他方面和优点对于本领域的技术人员来说将变得显而易见,其中仅示出和描述了本发明的说明性实施例。技术人员将会认识到,本发明具有实现其他不同的实施例的能力,并且其若干细节易于修改,所有这些都不偏离本公开内容。因此,附图和说明应被视为是说明性的,而非限制性的。
通过引用合并
本说明书中提到的所有出版物,专利和专利申请都以相同的程度通过引用并入本文,就如同每个单独的出版物,专利或专利申请被明确地单独地指出并通过引用并入一样。
附图简要说明
本发明的新特点在所附权利要求书中有详细的阐述。参考下面对示例性实施例(其中使用了本发明的原理)的详细描述及其附图,将有助于更好地理解本发明的特征和优点:
图1a示出了酶法合成寡核苷酸的示例方法:(i)使用脱氧核苷酸转移酶,(ii)使用DNA/RNA聚合酶和逆转录酶,(iii)使用连接酶。
图1b示出了使用化学阻断的底物进行聚合酶介导的固相合成寡核苷酸的示例方法。
图1c示出了一个变性PAGE分析示例,该分析通过在20个碱基的单链寡核苷酸模板的3’-OH端连续加入两个具有可逆终止子的碱基来延伸该模板。
图1d示出了使用Duplase-3基于通用模板寡核苷酸合成20碱基单链DNA片段(GCTGTATCGGCTGAATCGTA(SEQ ID:1))的变性PAGE分析示例。
图2a示出了两个模板的示例,这两个模板用于与M-MLV逆转录酶(RT)和脱氧核糖核苷三磷酸(dNTP)或3’-O-叠氮甲基dNTP的延伸反应,其中使用(i)20碱基单链固相寡核苷酸;或(ii)与模板杂交的33碱基引物。图2a按出现顺序依次展示了序列ID号2、2、2、2、2、2、7和8。
图2b示出了对(i)对图2a(i)所示的单链DNA使用Superscript IV M-MLV-RT;或(ii)对图2a(ii)所示的双链DNA使用Superscript IV M-MLV-RT的延伸产物的变性PAGE分析。
图2c示出了对(i)对图2a(i)所示的单链DNA使用SMARTScribe RT;或(ii)对图2a(ii)所示的双链DNA使用SMARTScribe RT的延伸产物的变性PAGE分析。
图3a显示了在使用四个20碱基单链序列作为引物和模板于Duplase-3反应的单链DNA的序列特异性延伸的示例。图3a按出现顺序依次展示了SEQ ID号2、2、2、2、2、2、2和9-11。
图3b示出了通过分子间反应延伸表面结合的寡核苷酸的示例,一个20碱基的序列紧邻一个30碱基的序列,后者内部有一个CAA,多聚T序列可以杂交(其中两个碱基)并使用三磷酸脱氧鸟苷(dGTP)进行延伸。图3b按出现顺序依次展示了SEQ ID号5、5、5、5、6和5。
图4a使用变性PAGE示出了在以脱氧腺苷三磷酸(dATP)、脱氧胸苷三磷酸(dTTP)、脱氧胞苷三磷酸(dCTP)或脱氧鸟苷三磷酸为底物,在Duplase-1(如(i))、Duplase-2(如(ii))或Duplase-3(如(iii))存在下在双链底物上延伸产物的保真度。图4a按出现顺序依次展示了SEQ ID号12和8。
图4b使用变性PAGE示出了在3’-O-叠氮甲基-dATP、3’-O-叠氮甲基-dTTP、3’-O-叠氮甲基-dCTP或3’-O-叠氮甲基-dGTP作为底物和Duplase-1(如(i))、Duplase-2(如(ii))或Duplase-3(如(iii))存在下,在单链20碱基底物(CACTGATTACCCTACACGAG(序列ID号:2))上延伸产物的保真度。图4b按出现顺序依次展示了SEQ ID号2、2、13和2。
图5示出了对Duplase-3在20碱基单链寡核苷酸中掺入核糖核苷酸的进行变性PAGE分析的示例。
图6示出了对Duplase-3在不同的二价金属存在的情况下将核苷酸掺入20碱基单链寡核苷酸中的PAGE分析示例。图6按出现顺序分别展示了SEQ ID号2、2、13和2。
图7a示出了对Duplase-3在溶液中没有模板的情况下,在不同温度下将核苷酸掺入59碱基单链寡核苷酸中的结果进行变性PAGE分析的示例。
图7b示出了对Duplase-3在溶液中存在3’-磷酸封闭随机六聚体模板的情况下,在不同温度下将核苷酸掺入59碱基单链寡核苷酸中的结果进行变性PAGE分析的示例。
图8a示出了一个变性PAGE分析的示例,其通过向反应溶液中添加随机分子,增强了Duplase-3对短固相寡核苷酸的延伸。符号“-T”表示没有随机分子,符号“+T”表示有随机分子。
图8b示出了溶液中不同的六聚体杂交到固相上的序列的可能结果。图8b展示了序列ID号14为“TTTTTTTTTTTTTTTTTT”。
图8c示出了如图8b所示用Duplase-3和六聚体延伸一个序列的结果的变性PAGE分析。
图8d示出溶液中不同的五聚体与固相上的序列(CACTGAATTCCCTACACGAG,序列ID号:3)杂交的可能结果。
图8e示出了在图8d所示的Duplase-3和五聚体存在的情况下,用图8d中的五聚体延伸其中固相上的寡核苷酸的结果的变性PAGE分析。
图9示出了对Duplase-3在3’-磷酸封闭随机分子存在的情况下,将核苷酸掺入20碱基单链寡核苷酸中的结果进行变性PAGE分析的示例。
图10示出了在实验中和本文所展示的图中使用的寡核苷酸序列的列表。图10按出现顺序依次展示了序列ID号15-26、23和27-30。
图11a示出了使用Duplase-3延伸20碱基寡核苷酸后进行变性PAGE分析的示例。
图11b示出了使用Duplase-3延伸20碱基寡核苷酸后进行变性PAGE分析的又一示例。
详细描述
本发明提供了酶法合成单链、固定化或液相寡核苷酸的方法。本文公开的方法可以使用经修饰或未经修饰的酶,包括聚合酶,它不需要超过7个碱基对来延伸固定化的或液相引物。本文公开的方法可在经修饰或未经修饰的聚合酶对固定化的或液相引物进行延伸反应时使用模板。在一些实施例中,本文公开的方法使用修饰的聚合酶。在一些实施例中,本文公开的过程可在经修饰的聚合酶对固定化引物进行延伸反应时使用模板。
目前,随着DNA和RNA在治疗学、高通量基因分型、合成生物学和数据存储等方面的新应用,对更长、更准确的寡核苷酸的需求正在增加。这些新的应用对分步收率/步进产率/逐步产率(量)提出了很高的要求,但目前的化学合成方法可以达到98.5-99.5%的分步效率。非酶法合成中化学反应所需的环境可能与光刻胶化学法不兼容,从而限制了可嵌入阵列中的复杂程度。参见McGall等人,“使用半导体光刻胶光导合成高密度寡核苷酸阵列”,Proc.Natl.Acad.Sci.USA,93:13555-60(1996)。此外,寡核苷酸的合成每年产生30多万加仑的危险化学废物,这增加了对发开酶法合成方法的需求。参见LeProust等人,“通过新的脱嘌呤控制方法合成高质量长(150mer)寡核苷酸库”,Nucleic Acids Res.,38(8):2522-40(2010)。因此,酶法合成寡核苷酸的需求还没有得到满足。
本文使用的术语仅用于描述特定情况,并无限制之意。本文使用的单数形式“a”、“an”和“the”也可以包含复数形式,除非上下文另有明确指示。此外,如果“including”,“includes”,“having”,“has”,“with”或其变体可用于详细说明和/或权利要求书中,则该等术语的含义类似于“comprising(包括)”一词。
术语“about(大约)”或“approximately(近似)”可指在特定值的可接受误差范围内,如本领域普通技术人员所确定的那样,这将部分取决于如何测量或确定该值,即测量系统的局限性。例如,根据本领域的实践,“大约”可以表示约正负10%。或者,“大约”可以表示给定值的至多20%,至多10%,至多5%或至多1%的范围。或者,特别是关于生物系统或过程,该术语可以意指在值的数量级内,值的5倍以内或2倍以内。如果在申请书和权利要求书中可以描述特定值,除非另有说明,否则应当假定“大约”一词的含义在特定值的可接受误差范围内。此外,在提供了值的范围和/或子范围的情况下,范围和/或子范围可以包括范围和/或子范围的端点。
本文中使用的术语“基本上(substantially)”可指接近给定值100%的值。例如,一种“基本上局部化”的活性剂可以表示,相对于活性剂、盐或代谢物的总量,按重量计约90%的活性剂、盐或代谢物可以存在。在某些情况下,该术语可指至少约为总量的90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.9%或99.99%。在某些情况下,该术语可指约为总量的100%。
在本文中,核苷酸缩写为3个字母。第一个字母表示含氮基(例如,A表示腺嘌呤,G表示鸟嘌呤),第二个字母表示磷酸盐的数量(单、双、三),第三个字母是P,表示磷酸盐。以核糖为糖的核苷三磷酸,即核糖核苷三磷酸,通常缩写为NTP,而以脱氧核糖为糖的核苷三磷酸,即脱氧核糖核苷三磷酸,则缩写为dNTP。例如,dATP代表脱氧腺苷三磷酸。NTP是RNA的基础,而dNTP是DNA的基础。在某些情况下,核苷酸缩写为2个字母。例如,dA表示dATP,N3-dA表示3’-O-叠氮甲基-dATP。在某些情况下,其他改性糖也可用于生长链的合成。例如,异核苷酸(XNA)是天然核酸DNA和RNA的合成替代物,作为储存信息的生物聚合物,其糖链不同。XNA研究类型可以包括一些合成XNA,例如1,5-脱水己糖醇核酸(HNA)、环己烯核酸(CeNA)、苏糖核酸(TNA)、乙二醇核酸(GNA)、锁定核酸(LNA)和肽核酸(PNA)。
本文中使用的术语“寡核苷酸”通常指核苷酸链。在某些情况下,寡核苷酸的长度小于200个残基,例如,在15到100个核苷酸之间。在一些情况下,寡核苷酸可包含至少/大约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70或90个碱基。在某些情况下,寡核苷酸可包含至少/大约100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、1万、2万、3万、4万、5万、6万、7万、8万、9万、10万、20万、40万、50万、60万、70万、80万、90万、100万、200万、300万、400万、500万、600万、700万、800万、900万或1000万个碱基。在某些情况下,寡核苷酸可包含超过100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、1万、2万、3万、4万、5万、6万、7万、8万、9万、10万、20万、40万、50万、60万、70万、80万、90万、100万、200万,300万,400万,500万,600万,700万,800万,900万或1000万个碱基。这些寡核苷酸的碱基可以是约3到5个,约1到50个,约8到12个,约15到25个,约25到35个,约35到45个,或约45到55个。寡核苷酸(也称为“oligo”)可以是任何类型的寡核苷酸(例如,引物)。寡核苷酸可包含天然核苷酸、非天然核苷酸或其组合。
本文中使用的术语“固定化”通常指在两个反应基团之间形成共价键。例如,反应基团的聚合是固定化的一种形式。碳-碳共价键的形成是固定化的一个例子。在某些情况下,当讨论将诸如DNA、RNA或寡核苷酸之类的生物分子连接到固体载体上时,可以使用化学键(包括但不限于共价键)来实现“固定化”。例如,在某些情况下,这种连接包括I-LinkerTM、胺修饰的寡核苷酸与活化羧基或琥珀酰亚胺酯共价连接、巯基修饰的寡核苷酸通过烷基化试剂如碘乙酰胺或马来酰亚胺共价连接、acryditeTM修饰的寡核苷酸通过硫醚、地高辛NHS酯、胆固醇-TEG共价连接、固定化链霉亲和素捕获的生物素修饰的寡核苷酸等。参阅“将寡核苷酸粘附到固体载体上的策略”(可在2018年9月14日的“sfvideo.blob.core.windows.net/sitefinity/docs/default-source/technical-report/attaching-oligos-to-solid-supports.pdf?sfvrsn=47483407_6,”检索到)。
在本发明的方法和系统中,可以将引物附着到固体底物上。引物可以直接或通过连接剂与底物结合。连接剂可以包括例如氨基酸、多肽、核苷酸、寡核苷酸或其他不干扰探针功能的有机分子。引物或连接剂可包含可裂解基团。例如,引物可包含尿嘧啶基。脱氧尿苷(dU)可以代替DNA寡核苷酸中的dT。尿嘧啶-N-去糖基化酶(UNG)可以去除碱基(dU),使寡核苷酸易在dU位点发生断链。此外,USER(尿嘧啶特异性切除试剂)酶可在尿嘧啶的位置产生单核苷酸间隙。USER酶可能是尿嘧啶DNA糖基化酶(UDG)和DNA糖基化酶-裂解酶核酸内切酶VIII的混合物。UDG可能催化尿嘧啶基的切除,形成一个无碱基(无嘧啶)位点,同时使磷酸二酯主链保持完整。核酸内切酶VIII的裂解酶活性破坏了无碱基位点3’和5’侧的磷酸二酯主链,从而释放了无碱基的脱氧核糖。
在某些情况下,本发明的方法和系统包括使用未附着于固体底物而停留在液相的引物。
固体底物可以是生物的、非生物的、有机的、无机的,也可以是其中任何一种的组合。例如,底物可以以一种或多种粒子、链、沉淀物、凝胶、片状、管状、球状、容器、毛细管、垫片、切片、膜、板、载玻片或半导体集成芯片等形式存在。固体底物可以是平坦的,也可以呈现不同的表面结构。例如,固体底物可包含发生合成或沉积的凸起或凹陷区域。在一些例子中,可以选择固体底物以提供适当的光吸收特性。例如,底物可以是聚合的LangmuirBlodgett膜、功能化玻璃(例如,可控孔径玻璃)、二氧化硅、氧化钛,氧化铝,氧化铟锡(ITO)、硅(Si)、锗(Ge)、砷化镓(GaAs)、磷化镓(GaP)、二氧化硅(SiO2)、氮化硅(SiN4)、改性硅、半导体集成电路(IC)芯片的顶层介电层,或各种凝胶或聚合物中的任何一种,例如(聚)四氟乙烯、(聚)偏二氟乙烯、聚苯乙烯、聚碳酸酯、聚二甲基硅氧烷(PDMS)、聚甲基丙烯酸甲酯(PMMA)、多环聚烯烃或其组合。
固体底物可包括聚合物涂层或凝胶,例如聚丙烯酰胺凝胶或PDMS凝胶。凝胶和涂层还可以包括用于修改其物理化学性质,例如疏水性,的成分。例如,聚丙烯酰胺凝胶或涂层可在其聚合物结构中包含改性丙烯酰胺单体,如乙氧基丙烯酰胺单体、磷酰胆碱丙烯酰胺单体、甜菜碱丙烯酰胺单体及其组合。
酶法合成寡核苷酸
在某些情况下,如图1a-1d所示,可以在可逆终止核酸存在的情况下,采用酶促寡核苷酸合成方法来延伸表面结合的单链寡核苷酸。本文中使用的术语“可逆终止核酸”或“可逆终止子”通常指可以可逆地终止引物延伸的经修饰的核苷酸类似物。例如,可逆终止子可以是含有共价修饰(例如在其3’-OH基团上)的经修饰的核酸,一旦经修饰的核酸掺入到生长链中,就可以阻止聚合酶的进一步合成。这种共价修饰随后可以被移除,例如使用化学物质或特定酶,以允许聚合酶添加下一个互补核苷酸。如图1a所示,固相酶法寡核苷酸合成的方法可以通过不同的方法来实现,这些方法使用不同种类的作用于DNA和RNA的酶。图1a所示为(i)末端脱氧核苷酸转移酶(TdT),(ii)DNA/RNA聚合酶和逆转录酶,以及(iii)连接酶。本发明中可用于合成生长链的具有核苷酸转移酶活性的其他酶包括,例如,多核苷酸磷酸化酶(PNPase),它是一种双功能酶,具有3’到5’磷酸核糖核酸外切酶活性和3’末端寡核苷酸聚合酶活性。
在某些情况下,酶促寡核苷酸合成方法可在可逆终止核酸和一种酶的存在下进行,该酶被配置为可延长液相单链寡核苷酸。
图1b详细说明了DNA聚合酶延伸表面结合的单链寡核苷酸的过程。DNA聚合酶可以催化可逆终止子掺入表面结合的单链寡核苷酸(即起始引物)上。如图1b(i)所示,模板链可以是发夹结构和顺式延伸的初生链本身,与初生链杂交的相邻链,或与初生链杂交的溶液中的另一寡核苷酸。由于新添加的核苷酸上存在3’-或阻断基(或终止基),表面结合的单链寡核苷酸不能延伸超过一个碱基。在单个掺入之后,可通过去保护恢复3’-羟基。现在可以重复此过程以添加第二,第三个碱基。
在某些情况下,可使用化学可裂解的可逆终止剂3’-O-叠氮甲基-dNTP,并且可使用三(2-羧乙基)盐酸膦(TCEP)实现脱保护。也可以使用其他可逆终止剂,包括可酶解的、特定pH值下可分解的酸性或碱性不稳定的连接剂,或紫外(UV)可裂解的核苷酸,或氨氧基可逆终止剂。其他还原剂可将可逆终止剂3’-o-叠氮甲基-脱氧核糖核酸(3’-o-脱氧核糖核酸)掺入生长链后脱保护。
DNA/RNA聚合酶和逆转录酶需要双链底物来延伸新生链。在一些情况下,本文公开了一种使用引物和兼容的DNA聚合酶合成DNA或RNA序列的方法。在某些情况下,一种需要碱基配对的DNA聚合酶,例如需要1、2、3、4、5或6个碱基配对,可用于驱动添加核苷酸以延伸引物。在某些情况下,引物可以与通用模板(包含3碱基序列的所有可能组合)杂交。单碱基的延伸可以通过使用经修饰的核苷酸底物例如可逆终止子来控制。例如,由于所用的聚合酶可能仅需要在引物的3’端进行两个碱基配对,即可添加单个核苷酸,如果模板上的第三个碱基(紧邻配对的碱基对,例如T)与要添加的所需碱基(例如A)互补,可以通过DNA聚合酶处理所需核苷酸(例如dATP),并添加碱基A以延伸引物(如图1b所示(ii),R是终止子,因此新生物不能进一步延伸。但是,如果模板上的第三个碱基(例如G)不是所需的互补碱基(例如T),并且唯一可用的底物碱基是经修饰的dATP可逆终止子,则该酶可能由于错误的掺入反应而掺入碱基A,或者在此条件下不会延伸引物。然而,由于模板可能有其他杂交位点可用,并且引物/模板复合物可能经历了几轮解离/缔合,因此在适当的杂交条件下,引物可能与模板以不同的模板序列形成正确的构型。因此,该变性和杂交的过程可以重复进行,直到引物与模板序列杂交,以允许聚合酶结合,然后以所需序列延伸一个碱基(例如,A)。例如,如果要添加的所需碱基是“A”,并且模板包含以下序列:TNN(例如,模板序列是:TTTTTACCTCTGTATGCATCGATAGGTCCGGGAAGCCCACAAACTAATTTCAGAGTGACGTTACTTGGCGCTTTTTT(序列ID号:4)),则引物可以在高温下与模板瞬时杂交。在将引物与具有T作为下一个未杂交碱基的子序列(即上文讨论的第三个碱基)杂交后,DNA聚合酶可以处理溶液中的dATP可逆终止子,并将位于3’端的包含终止子基团的新碱基A延伸至引物。在某些情况下,UTO可包括通用碱基,例如5-硝基吲哚(5-NI)或7-硝基吲哚(7-NI)类似物。在某些情况下,UTO可能包括两个、三个或三个以上的通用碱基。本文所用的“通用碱基”可指可以与来自天然核苷酸的所有四个标准碱基配对的碱基。通用碱基可以与其他碱基任意配对。示例可能包括2’-脱氧肌苷(次黄嘌呤脱氧核苷酸)衍生物、硝基唑类似物、硝基吲哚类似物和疏水性芳香族非氢键碱(强堆积效应)。
然后可以除去3’端的终止基团(如图1b(iii)所示,OH是3’OH,可以被聚合酶或其他酶进一步延伸)。此后,通过重复上述过程,下一个所需的碱基可以被添加到游离3’OH中。在某些情况下,模板本身也可以作为引物,称为自启动寡核苷酸(SPO)或通用模板寡核苷酸(UTO)。引物也可以以可切割的碱基(例如,U碱基)开始或包含该碱基。这将使合成的序列可以从引物的“U”位置切割,这样固定化的序列就可以从与引物结合的固体底物上移除。
图1c显示了使用可逆终止子在固体表面上的20碱基单链寡核苷酸上按顺序掺入两个碱基的结果。对20个碱基的模板进行变性PAGE分析(掺入3’-O-叠氮基甲基-dTTP(+1个碱基)后,切割3’-O-叠氮基甲基封端基团,并掺入3’-O-叠氮基甲基-dCTP(+2个碱基))。符号*表示未延伸的对照组。图1d显示了在通用模板寡核苷酸上合成20碱基单链DNA片段的结果。使用Duplase-3在通用模板寡核苷酸上合成20碱基序列GCTGTATCGGCTGAATCGTA(序列ID号:1),期间在添加4、8、12、16和20碱基后,可进行变性PAGE分析。符号*表示未延伸的对照组。
在某些情况下,本申请的延伸方法可允许在没有全长互补模板的情况下,在酶的存在下合成与底物结合的单链核酸序列。在某些情况下,当模板中与合成的底物结合的单链核酸序列互补的最长序列的长度为1、2、3、4、5或6个碱基,且模板中最长的互补序列比合成的与底物结合的单链核酸序列的全长短时,本申请的延伸方法可允许在酶存在的情况下合成底物结合的单链核酸序列。在某些情况下,当与底物结合的单链核酸序列的全长是从第一个添加到底物的碱基计算起时(即,从第一次延伸反应添加的第一个碱基开始,到最后一次延伸反应添加的最后一个碱基结束),模板中最长的互补序列比合成的与底物结合的单链核酸序列的全长至少短3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个碱基。在某些情况下,对于合成的与底物结合的单链核酸序列中的任意三个连续碱基,模板中存在互补序列。在某些情况下,对于合成的与底物结合的单链核酸序列中的任意四个连续碱基,模板中存在互补序列。在某些情况下,对于合成的与底物结合的单链核酸序列中的任意五个连续碱基,模板中存在互补序列。在某些情况下,对于合成的与底物结合的单链核酸序列中的任意六个连续碱基,模板中存在互补序列。
用于延伸反应的酶
使用可逆终止子的延伸反应可能需要催化域足够大以容纳3’-封端基团的酶。为此可以开发一些改进的DNA聚合酶。例如,逆转录酶(RT)可能具有模板切换“钳制”能力,这是SMART cDNA合成的基础。莫洛尼鼠白血病病毒(M-MLV)RT和人类免疫缺陷病毒1型RT可能只需要两个碱基杂交即可获得这种活性,M-MLV RT可以在引物延伸反应中在双链DNA上掺入可逆终止子。SMART模板切换可能需要在不存在模板的情况下在新合成的cDNA的3’端添加核苷酸,使用锰作为二价离子辅因子来增强其活性。例如,M-MLV逆转录酶,SuperScriptIV和SMARTScribe可以在单链DNA上掺入天然dNTP(图2)。M-MLV RT可掺入可逆终止子。Superscript IV和SMARTScribe或都可以在双链DNA模板上掺入3’-O-叠氮甲基可逆终止子,但可能无法在单链模板上掺入可逆终止子。
图2显示M-MLV逆转录酶(RT)可以在单链DNA上掺入dNTP,并且M-MLV RT能够使用可逆终止子作为底物。在某些情况下,可以修饰M-MLV RT,以掺入可逆终止子。在某些情况下,未经修饰的M-MLV RT可能不像经修饰的M-MLV RT那样高效地掺入3’-O-叠氮甲基dNTP。在某些情况下,M-MLV RT可掺入可逆终止子。图2a显示了用M-MLV-RT延伸的DNA序列的试验。可使用20碱基单链固相寡核苷酸(如图2a(i)所示)或与模板杂交的33碱基引物(如图2a(ii)所示)实现延伸。两个序列都可以使用模板来检测鸟苷的掺入。图2b示出了使用Superscript IV延伸的结果。图2b(i)示出Superscript IV可以在单链DNA上掺入dGTP,但不能掺入3’-O-叠氮基甲基-dGTP。从图2b(i i)可以看出,在图2b(i)相同的反应条件下,双链DNA上的两种核苷酸都可以延伸。符号*表示未延伸的对照物。图2c示出了使用SMARTScribe延伸的结果。图2c(i)显示SMARTScribe可以在单链DNA上掺入dGTP,但不能掺入3’O-叠氮甲基-dGTP。从图2c(ii)可以看出,在图2c(i)相同的反应条件下,双链DNA上的两种核苷酸都可以延伸。符号*表示未延伸的对照物。
在某些情况下,使用了经修饰的9°NTMDNA聚合酶,该酶能够使用可逆终止子作为新碱基的来源,在固体表面延伸单链引物。在某些情况下,寡核苷酸既充当引物又充当模板。在某些情况下,这种经饰的9°NTMDNA聚合酶可以称为Duplase(可在加利福尼亚州帕洛阿尔托市的Centrillion Technologies购买)。Duplases可能仅需要两个碱基的杂交进行延伸(图3)。例如,当溶液中核苷酸浓度低至2μM时,Duplase-1(也称为CENT1,参见US20160355541)可以在短至一分钟的反应时间内沿双链DNA底物有效地掺入可逆终止子。单链寡核苷酸的延伸可能需要更长的延伸时间和更高的核苷酸浓度。
如图3a所示,单链DNA的序列特异性延伸可以通过Duplase-3(Duplase的另一个例子)完成。图3a还显示了在与Duplase-3和3’O-叠氮基甲基-dNTP反应中用作引物和模板的四个20个碱基的序列的变性PAGE分析。在这些自为引物的反应中,自为引物的寡核苷酸(SPO)被称为SPO 1-4。通过仅将引物上的最后两个3’碱基杂交,Duplase-3可以用模板化的碱基扩展寡核苷酸。符号*表示未延伸的对照物。如图3b所示,表面结合的寡核苷酸的延伸可以通过分子间反应来完成。如图3b右侧所示,序列为TTTTTTTTTTTTTTTTTTTT(20个碱基)(序列ID号:5)和TTTTTTTCAATTTTTTTTTTTTTTTTTTTTTTTT(30个碱基(序列ID号:6))的寡核苷酸可以固定在磁珠上,可以在同一珠子上使用一种寡核苷酸或两种寡核苷酸。可以通过使PAGE变性来分析样品(参见图3b的左侧)。泳道1和3可以使用右侧(i)所示的珠子。泳道2和4可以使用右侧(ii)所示的珠子。泳道1和2可以是未使用Duplase-3延伸的对照样品。泳道3和4可以使用Duplase-3和Cy5-ddGTP进行延伸。然后,所有样品都可以用末端脱氧核苷酸转移酶(TdT)和荧光素-12-ddUTP进行标记,这样任何没有用Cy5-ddGTP延伸的引物都可以用荧光素进行标记。如变性PAGE凝胶上泳道3所示,Duplase-3可能无法有效延伸20个碱基的多聚T序列。但是,如泳道4所示,当30个碱基的序列TTTTTTTCAATTTTTTTTTTTTTTTTTTTTTT(序列ID号:6)与20个碱基的多聚T寡核苷酸固定在同一表面上时,该20聚体的延伸信号在PAGE凝胶上表现得很强。这可能演示了如何在相邻模板寡核苷酸存在的情况下合成由连接剂连接到载体上的表面结合的寡核苷酸;在生长链合成完成后,模板寡核苷酸可以被切下。
图3显示仅分子间反应就可促进表面结合的寡核苷酸的延伸。多聚T序列不能与其他多聚T序列杂交。当表面结合的寡核苷酸仅为多聚T序列时,延伸可能受限。然而,当第二个模板寡核苷酸也结合到同一表面,使得多聚T序列可以与相邻的第二模板寡核苷酸杂交时,可以实现稳健的延伸。
图4显示了三种Duplase酶保真度的比较分析。图4a示出了在双链底物上的保真度。可以使用图4a所示的两个寡核苷酸序列进行引物延伸反应。较短的序列是引物,较长的序列是固定在底物上的模板。延伸反应完成后,可以从表面结合的模板上剥离已延伸的较短引物链,并对其进行变性PAGE分析。如图4a所示,以dATP、dTTP、dCTP或dGTP为底物,以Duplase-1(如(i))、Duplase-2(如(ii))或Duplase-3(如(iii))为底物,进行腺嘌呤对侧延伸。通过观察变性PAGE凝胶可知,从Duplase-1到Duplase-2保真度降低。符号*表示未延伸的引物对照。图4b示出了使用三个不同的Duplase进行的单链底物的延伸。如图4b所示,可在Duplase-1(如(i))、Duplase-2(如(ii))或Duplase-3(如(iii))存在的情况下,使用表面结合的单链寡核苷酸与溶液中的3’-O-叠氮甲基-dATP、3’-O-叠氮甲基-dTTP、3’-O-叠氮甲基-dCTP或3’-O-叠氮甲基-dGTP进行延伸反应。符号*表示未延伸的引物对照。随着聚合酶保真度的降低,掺入未被相邻链或发夹结构模板化的碱基的能力可能会增强。图4a中传统的引物延伸反应表明,Duplase-1比Duplase-2保真度高,后者又比Duplase-3保真度高。酶保真度的降低增加了错误掺入或错误掺入事件的概率,从而增加了非模板化碱基被添加到短的表面结合的寡核苷酸的机会。酶的性质越混杂,单链引物的反应产物的产率可能越高。Duplase-3可用于单链核酸序列的控制合成。
此外,Duplases可以使用核糖核苷酸作为底物(见图5),从而合成单链RNA序列。如图5所示,Duplase-3可在单链寡核苷酸上掺入核糖核苷酸。图5示出了在NTP或dNTP存在下用Duplase-3延伸的20碱基单链表面结合寡核苷酸的变性PAGE分析。符号*表示未延伸的对照物。在某些情况下,包括例如各种Duplase在内的聚合酶可以掺入非天然碱基,或掺入与天然糖主链不同的糖主链的核苷酸,修饰的核苷酸(如荧光标记的dNTP或生物素化的dNTP或硫代修饰的dNTP等)。
延伸反应条件
为了使延伸反应起作用,错误掺入可能导致在溶液中添加核苷酸时延伸率增加。例如,反应温度和使用的金属离子可能会有一些影响。例如,锰可以改变聚合酶底物结合口袋的几何形状,从而使其打开,以便与非配对碱基进行聚合。另外,聚合酶的保真度可能是温度敏感的,因为较高的反应温度可以导致较低的保真度和较高的掺入率。Duplase可能是嗜热的,其活性随着反应温度的升高而增加,最高可达75℃左右。
图6显示了使用不同的二价离子可以实现单链寡核苷酸的延伸。单链寡核苷酸的合成反应可以在不同的二价金属存在下进行。对用Duplase-3和dATP、dTTP、dCTP和dGTP进行延伸的20碱基单链表面结合寡核苷酸的变性PAGE分析发现,在使用镁、锰或钴离子作为反应溶液的辅助因子时,可能会出现不同的延伸结果。如图6所示,三种金属都可以实现模板化碱基的延伸。但锰离子可以实现非模板化碱基的延伸。
图7显示,单链寡核苷酸的延伸可在各种温度下实现,包括在约60℃下。延伸反应温度可能会对使用Duplase-3的单链延伸产生影响。对用Duplase-3和dCTP扩展的59个碱基的固相寡核苷酸进行的变性PAGE分析可能表明,不同的反应温度下可能会产生不同的效果。图7a示出了在没有模板的情况下,在约40℃、约50℃、约60℃、约70℃、约80℃、约90℃或约100℃的溶液中进行反应的结果。图7b示出了在3’-磷酸封闭的随机六聚体模板存在的情况下,在约40℃、约50℃、约60℃、约70℃、约80℃、约90℃或约100℃的溶液中进行反应的结果。
单链寡核苷酸可在高达约40℃、约50℃、约60℃、约70℃、约80℃、约90℃或约100℃的温度下延伸,在该温度下它们可杂交两个碱基、三个碱基、四个碱基、五个碱基或六个碱基。单链寡核苷酸可在20℃到80℃(包括20℃和80℃)的温度下延伸。在某些情况下,可以基于以下因素来调节延伸温度:例如,寡核苷酸的稳定性、双链复合物的杂交、固定或附着在载体上的寡核苷酸的稳定性等。
在溶液中使用模板
可以通过添加溶液中模板来增强表面结合的寡核苷酸的延伸。可以对这些溶液中的模板进行3’端修饰,以防止它们在与引物竞争的反应中被聚合酶延长。例如,在本发明的单链核酸延伸反应中,可使用随机六聚体引发。在本文中,随机物是由序列是随机的碱基组成的。反应混合物中每N位置的四种碱基的所有组合都存在。例如,随机六聚体由六个碱基组成,其序列在所有六个位置上都是随机的。
如图8所示,随机六聚体可在Duplase-3和固相结合引物反应中增加模板对应碱基和非模板对应碱基的添加。图8a示出了在反应溶液中加入随机物时固相结合寡核苷酸的延伸。如本文所使用的,随机物是其序列是随机的核酸。变性PAGE分析可显示20碱基寡核苷酸与Duplase-3和3’-O-叠氮甲基-dNTP延伸的结果,延伸反应中未向溶液中添加模板(-T),或向反应溶液中添加3’-磷酸封闭的随机六聚体(+T)。符号*表示未反应的对照物。图8b示出溶液中不同模板与固相结合的序列的可能杂交配对。使用的模板可以是六聚体。图8c显示,聚合酶需要至少三个碱基与溶液中的模板杂交才能成功扩增引物。在存在或不存在六聚体的情况下,用Duplase-3和Cy5-ddGTP扩展的序列并进行变性PAGE分析。图8c所示的一些序列已列出的3’-磷酸封闭的六聚体可用于反应溶液中。符号*表示未反应的对照物。符号-T表示没有添加模板的反应。在Duplase-3存在的情况下,与可以使3个或更多碱基与序列杂交的模板的反应可能可以使G碱基更好的掺入。用Duplase-3延伸后,所有样品用末端脱氧核苷酸转移酶(TdT)和荧光素-12-ddUTP孵育,以标记任何未用Duplase-3延伸的引物。图8d示出了溶液中不同模板与固相结合寡核苷酸(CACTGAATTCCCTACACGAG(序列ID号:3))可能的杂交配对。使用的模板可以是五聚体。瞬时杂交反应中可能出现的序列排列如图8d所示。图8e示出了图8d所示的固相寡核苷酸在溶液中加入特定、随机和半随机模板后的延伸结果。用Duplase-3和3’-O-azidomethyl-dCTP延伸后,可显示序列CACTGAATTCCCTACACGAG(序列ID号:3)的变性PAGE分析。一些3’-磷酸封闭五聚体可以用在反应溶液中,它们的序列被列出。标志*表示未反应的对照物。符号-T表示没有添加模板的反应。
与单链寡核苷酸的延伸反应类似,溶液中随机模板的反应可以在40℃左右、50℃左右、60℃左右、70℃左右进行(图7b)。
图9显示了溶液中不同长度(6、9、12、15、18、21或混合的6+9碱基)的随机物的反应产率。变性PAGE分析显示了用Duplase-3和3’-O-叠氮甲基-dATP延伸的20碱基固相寡核苷酸与溶液中3’-磷酸封闭的随机模板的结果。符号*表示未延伸的对照物。符号-T表示未添加溶液中模板的对照样品。
当有三个连续的核苷酸与溶液中的靶标杂交,并且与溶液中的寡核苷酸结合的固相引物的3’至少有一个突出(overhang)碱基时,Duplase可以使得生长链链式伸长(图8)。当有2个、3个、4个、5个、6个或7个连续的核苷酸与溶液中的靶标杂交,并且与溶液中的寡核苷酸结合的固相引物的3’至少有一个突出(overhang)碱基时,Duplase可以使得生长链链式伸长(图8)。理论上,五聚体可能存在1024种可能的序列组合。因此,储备能够与任何可能的序列完美杂交并模板化的溶液中模板可能是不切实际的。对于具有固定5’碱基的半随机序列XNNNN,存在四种不同的序列组合,其中X为将要被添加的碱基的模板,N为随机碱基(A,T,C或G)。半随机序列XYNNN具有两个固定的5’碱基,共有16种可能的序列组合,其中X为将要被添加的碱基的模板,Y与固相寡核苷酸的最后一个碱基互补。例如,当固相引物的3’碱基为胞嘧啶时,AGNNN将作为模板使得胸腺嘧啶掺入。半随机序列增加了延伸引物的产量(图8)。半随机序列的例子可能包括,例如,NXYNN或NNXTN。
通用模板寡核苷酸
通用模板寡核苷酸(UTOs)可用于模板化任何碱基,通过循环可逆终止使酶法合成任何序列成为可能。例如,它们可以设计为本文所述的UTO-1或通用碱基,如一个或多个5-硝基吲哚或7-硝基吲哚碱。一种这样的通用碱可能包括5-硝基-1-吲哚-3’-脱氧核糖(5-NI)。然而,可能没有一个通用的碱基能够满足所有的要求;能够与所有天然碱基以同等程度配对,通过DNA聚合酶进行DNA合成,并直接掺入每个天然核苷酸。由于DNA聚合酶与许多通用碱基缺乏氢键结合,因此在与大多数通用碱基相对或在其之后的位置可能不能很好地掺入核苷酸。此外,即使聚合酶可以克服这一障碍并在相对通用碱基的位置掺入核苷酸,聚合酶也不可能在缺乏氢键的位置继续进行DNA合成。连续的内部5-NI碱基不能改善Duplase对序列的延伸。
通用模板寡核苷酸UTO-1(如图10所示)可以包含所有密码子,并且包含作为间隔子的3’和5’端的序列。可以使用尿嘧啶DNA糖基化酶和无嘌呤/无嘧啶内切核酸酶联合酶解3’脱氧尿嘧啶,以分离出任何酶合成的片段。所有的ANN、TNN、CNN和GNN序列都可能包含在UTO-1中,这意味着引物3’端任何2-碱基的组合都可以在重复合成步骤中模板化,以掺入任意A、T、C和G碱基。例如,可以以UTO-1为模板,使用Duplase-3合成20碱基序列的酶合成寡核苷酸-1(ESO-1)。图10还示出了本申请中讨论的用于延伸反应、测序文库制备和序列分析的寡核苷酸序列的示例。对寡核苷酸的修饰(例如5’-生物素化、3’-脱氧尿嘧啶、3’-磷酸盐和硫键),按照根据IDT公司的订购规范在图10示出。
在合成生长链之后,可以通过其他方式来切割UTO。在某些情况下,UTO酶切会切下酶法合成的寡核苷酸。在某些情况下,UTO切割发生在生长链/杂交复合物的酶合成片段内,从而去除UTO。在某些情况下,UTO切割发生在UTO内部。在一些实施例中,切割发生在UTO的3’-端。在一些实施例中,切割发生在UTO的5’-端。在某些情况下,UTO切割使用光化学裂解。在某些情况下,UTO切割使用酸性或碱性条件来实现。
酶法合成寡核苷酸的方法
可逆终止子可以用一种聚合酶进行酶法纯化,这样的聚合酶可以掺入dNTP,但不能掺入3’-O-叠氮甲基dNTP,如Taq或Klenow聚合酶。可逆终止子裂解后的中和作用也可能阻止下一碱基的合成。
当使用3’-O-叠氮甲基可逆终止子时,TCEP可立即用碘乙酰胺等试剂中和。
通过使用更高浓度的聚合酶或其他酶,可以提高分步效率(图11)。变性PAGE分析显示了在含有1μg Duplase-3、200mM NaCl和20mM Tris-HCl(在pH 8.0时)(如图11a所示)或2μg Duplase-3、80mM NaCl和8mM Tris-HCl(在pH 8.0时)(如图11b所示)的反应中,使用3’-O-叠氮甲基可逆终止子,通过Duplase-3对20碱基寡核苷酸进行延伸的结果。
在加入每个可逆终止子之后,在其去保护之前加入封端步骤,可以提高寡核苷酸的合成产率。实现这一点的一种方法可以是使用双脱氧核苷酸和TdT和/或Duplase进行延伸。在上述条件下,未使用可逆终止子延伸的寡核苷酸可能会被截断,并且可能无法在随后的步骤中延伸。
如果在合成过程中添加的最后一个碱基被修饰为仅选择全长序列,或者如果后续使用需要3’OH,则该封端步骤可以提供一种简单的纯化方法。例如,可以在最后的合成步骤中用生物素化的碱修饰3’端;然后,可以在涂有链霉亲和素的表面捕获全长的寡核苷酸,并且留下截短的寡核苷酸。另一种纯化方法可能涉及使用3’核酸外切酶无法识别的3’基团核苷酸进行合成,从而使用酶促反应去除合成不完全的寡核苷酸。
在某些情况下,其他经过修饰的糖基也可用于生长链的合成。例如,异种核酸(XNA)是天然核酸DNA和RNA的合成替代物,作为储存信息的生物聚合物,其糖链不同。研究中的XNA的类型可包括合成型XNA,例如,1,5-脱水己糖醇核酸(HNA)、环己烯核酸(CeNA)、苏糖核酸(TNA)、乙二醇核酸(GNA)、锁核酸(LNA)和肽核酸(PNA)。荧光标记的核苷酸和其他非天然核苷酸也可能是酶延伸的底物。
工程改造聚合酶可能可以使合成更快、更有效。错误掺入率较高的低保真度聚合酶可能不需要溶液的中的碱基有对应的模板。UTO可能可以进一步缩短,使得它的唯一功能为促进3’端的杂交。如果3’端有杂交,但溶液中的碱基没有对应的模板,而是由低保真度聚合酶添加,则反应时间也可能会缩短。
材料与方法
双链DNA的引物延伸分析
将引物在RB缓冲液(1M氯化钠,2 5mM Tris-HCl pH 7.5,0.01%TWEEN20)中加热至70℃持续5分钟,然后在55℃持续15分钟,然后在25℃持续5分钟后,将其与固定在链霉亲和素包被的磁珠(Dynabeads MyOne Streptavidin T1,Thermo Fisher,Waltham,MA)上的生物素化靶序列杂交。每25μL反应体积使用0.1mg磁珠。通过在选定温度下添加核苷酸开始反应,并通过添加1.6倍体积的RB缓冲液终止反应。在室温条件下,用0.1N氢氧化钠将杂交引物从磁珠结合模板上洗脱10分钟,并通过变性PAGE进行分析。所有寡核苷酸均购自Integrated DNA Technologies(IDT,Redwood City,CA)。其序列如图10所示。
在固体表面制备单链DNA以进行延伸
将单链寡核苷酸固定在链霉亲和素包被的磁珠上。每25μL反应体积用0.1mg磁珠。在选定的温度下加入核苷酸开始反应,加入1.6体积的RB缓冲液终止反应。
引物与Duplase酶的延伸反应
对于双链DNA上的反应,如前所述,用固定化模板和杂交引物制备磁珠。将磁珠在反应缓冲液中洗涤,然后重悬于反应混合物中,该反应混合物含有最终浓度为20mM的Tris-HCl(pH8.8)、10mM硫酸铵、10mM KCl、0.1%Triton X-100、2mM硫酸镁、1mg/mL牛血清白蛋白(Sigma-Aldrich,St.Louis,MO)、4μg/mL聚乙烯吡咯烷酮10和1μg酶。将反应混合物预热至45℃,并添加核苷酸至终浓度为2μM。反应进行一分钟后停止,进行PAGE分析。尽管缓冲液成分、反应时间和温度以及核苷酸浓度在为研究目的而进行的各种实验中存在很大差异,但单链DNA上的延伸反应仍按前面所述进行。下文中介绍了合成20碱基ESO-1序列的最佳条件。
可逆终止子的去保护
掺入可逆终止子后,将磁珠重悬于pH9.0的50mM TCEP(Gold Bio,Olivette,MO)中,并在60℃下孵育10分钟。除去TCEP溶液,并将磁珠重悬于RB缓冲液中,并转移到新的反应容器中。
用UTO-1合成20碱基ESO-1序列
如前所述,用固定化UTO-1制备磁珠。将0.2Mg珠子用于50μL反应中,其中含有200mM NaCl、20mM Tris(pH 8.0)、8mM MnCl2、1μg Duplase-3和100μM 3’-O-叠氮甲基-dNTP。反应持续一小时后停止。通过掺入3’-O-叠氮基甲基-dCTP,然后用TCEP去保护,并掺入3’-O-叠氮基甲基-dGTP,然后用TCEP去保护,来合成序列ESO-1。在第一次合成中,加入4、8、12、16和20个碱基后,从溶液中除去0.025mg的磁珠,从磁珠上洗脱寡核苷酸,并通过变性PAGE进行分析。下一步的数量也做相应调整。在最后的掺入/裂解步骤后,使用带有ESO-1序列的寡核苷酸进行测序。
用MMLV逆转录酶进行延伸反应
本文检测了两种MMLV逆转录酶,Superscript IV(Thermo Fisher)和SMARTScribe(Clonetech,Mountain View,CA),测试了它们将核苷酸掺入双链和单链寡核苷酸上的能力。用Zeba旋转脱盐柱(Thermo-Fisher)对两种酶进行脱盐,以从酶存储缓冲液中去除2-巯基乙醇。蛋白质在脱盐前后用Qubit(Thermo Fisher)定量,并通过SDS-PAGE分析。对于双链DNA上的反应,如前所述,用固定化模板和杂交引物制备磁珠。将磁珠在反应缓冲液中洗涤,然后重悬于反应混合物中,该反应混合物含有最终浓度为20mM的Tris-HCl(pH8.8)、10mM硫酸铵、10mM KCl、0.1%Triton X-100、4mM MnCl2和3μL脱盐酶。对于Superscript IV,将反应混合物预热至50℃,对于SMARTScribe,将其反应混合物预热至42℃,并添加核苷酸至终浓度为10μM。反应持续两个小时。对于单链DNA上的反应,如前所述制备磁珠并用单链寡核苷酸固定。将磁珠在反应缓冲液中洗涤,然后重悬于22μL反应混合物中,该反应混合物含有最终浓度为20mM的Tris-HCl(pH8.8)、10mM硫酸铵、10mM KCl、0.1%Triton X-100、4mMMnCl2和10μM核苷酸。将Superscript IV的反应混合物预热至50℃,然后加入3μL脱盐酶开始反应。对于SMARTScribe,将反应混合物加热至72℃,并在冰上快速冷却。然后将样品在42℃下孵育,并添加3μL脱盐酶开始反应。反应持续两个小时。
用末端脱氧核苷酸转移酶(TdT)对寡核苷酸进行荧光标记
(可以使用TdT(New England Biolabs,Ipswich,MA)和荧光素-12-ddUTP(PerkinElmer,San Jose,CA)对寡核苷酸进行末端标记,以对不易被SYBR-Gold染色的序列的标记。方法是在20mM Tris HCl(pH7.5)、10mM硫酸铵、10mM KCl、0.1%Triton X-100和0.5mMMnCl2中孵育0.1mg含有5μM核苷酸和20U酶的磁珠。反应在37℃下进行3小时,然后在75℃下酶热失活20分钟。
对含有20碱基合成ESO-1序列的SPO-13进行测序
使用TdT(Roche,Santa Clara,CA)和Duplase-1将仍在磁珠上的SPO-13-ESO-1寡核苷酸聚腺苷酸化。使用PCR将Illumina接头添加到这些序列中,分别用poly(T)-尾P7接头序列,P7-Poly(T),具有PCR-ESO1-FPCR序列的寡核苷酸与Illumina P5和P7接头进行重复,并使用bioanalyzer和qPCR分析文库的质量。所有寡核苷酸均购自IDT。用90%PhiX和10%PCR制备的4pm库对MiSeq纳米流动池(Illumina)进行簇生成。使用V2试剂盒(Illumina)运行150步配对末端循环,并通过手动排序首次输出序列读取来识别ESO-1序列。
变性PAGE
样品在6%或15%的聚丙烯酰胺TBE-尿素凝胶(Thermo Fisher)中进行电泳分离。凝胶在室温下在SYBR Gold(Thermo-Fisher)中染色5-10分钟,并在Bio-Rad-ChemiDoc-MP系统上成像。染色前后观察荧光产物。
尽管本发明的优选实施例已经在本文中示出和描述,但是对于本领域技术人员来说,显而易见的是,这些实施例仅供示例。在不脱离本发明的情况下,本领域技术人员将对其做出诸多改变和替换。应当理解,在实施本发明时,可以采用本文所描述实施例的各种替代方案。以下权利要求限定了本发明的范围,并包括了在这些权利要求范围内的方法和结构及其等同物。
Claims (9)
1.一种合成单链寡核苷酸的方法,包括:
(a)提供固定在固体表面上的包含游离3’端和5’端的单链引物、聚合酶和核苷酸试剂,其中所述核苷酸试剂带有3’端终止子的可逆终止子核苷酸,并且所述聚合酶是duplase;
(b)使所述单链引物上的杂交位点与模板上的互补片段杂交,其中所述杂交位点在所述3’端且包含不超过7个碱基;
(c)通过所述聚合酶用所述核苷酸试剂从所述游离3’端延伸所述单链引物;以及
(d)从所述互补片段分离所述杂交位点,由此形成固定在所述固体表面上的延伸的单链引物;
其中所述聚合酶需要不超过7个碱基配对来延伸所述单链引物。
2.根据权利要求1的方法,其中所述聚合酶是修饰的duplase。
3.根据权利要求1的方法,还包括:
(e)从所述可逆终止子核苷酸移除所述3’端终止子。
4.根据权利要求3所述的方法,还包括:
(f)重复步骤(a)-(e)。
5.根据权利要求1的方法,其中所述模板是固定在所述固体表面上的所述单链引物、或相邻的单链核酸。
6.根据权利要求5的方法,其中所述模板是所述相邻的单链核酸,并且其中所述相邻的单链核酸与所述单链引物的序列一致性不超过5%、不超过10%、不超过15%、不超过20%、不超过25%、不超过30%、不超过35%、不超过40%、不超过45%、不超过50%、不超过55%、不超过60%、不超过65%、不超过70%、不超过75%、不超过80%、不超过85%、不超过90%、不超过95%或100%。
7.根据权利要求5的方法,其中所述模板是所述相邻的单链核酸,并且其中所述相邻的单链核酸与所述单链引物具有100%的序列一致性。
8.根据权利要求1的方法,其中所述杂交点长度为1、2、3、4、5、6或7个碱基。
9.根据权利要求4的方法,其中(f)中的所述重复从所述游离3’端延伸所述单链引物,从而合成包含所述单链引物的单链核苷酸产物。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762568205P | 2017-10-04 | 2017-10-04 | |
US62/568,205 | 2017-10-04 | ||
US201862727174P | 2018-09-05 | 2018-09-05 | |
US62/727,174 | 2018-09-05 | ||
PCT/US2018/053776 WO2019070593A1 (en) | 2017-10-04 | 2018-10-01 | METHOD AND SYSTEM FOR ENZYMATIC SYNTHESIS OF OLIGONUCLEOTIDES |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410185551.3A Division CN118048419A (zh) | 2017-10-04 | 2018-10-01 | 酶法合成寡核苷酸的方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111542532A CN111542532A (zh) | 2020-08-14 |
CN111542532B true CN111542532B (zh) | 2024-03-15 |
Family
ID=65995252
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880078052.7A Active CN111542532B (zh) | 2017-10-04 | 2018-10-01 | 酶法合成寡核苷酸的方法和体系 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11414687B2 (zh) |
EP (1) | EP3692049A4 (zh) |
CN (1) | CN111542532B (zh) |
WO (1) | WO2019070593A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021104514A1 (en) * | 2019-11-29 | 2021-06-03 | Bgi Shenzhen Co., Ltd. | Enzymatic synthesis of oligonucleotides |
GB202012544D0 (en) | 2020-08-12 | 2020-09-23 | Nuclera Nucleics Ltd | Methods relating to de novo enzymatic mucleic acid synthesis |
CN111944886B (zh) * | 2020-08-24 | 2022-09-27 | 北京梓熙生物科技有限公司 | 一种合成寡聚脱氧核糖核苷酸的方法和试剂盒 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050019793A1 (en) * | 2003-04-14 | 2005-01-27 | Nurith Kurn | Global amplification using a randomly primed composite primer |
CN103228798A (zh) * | 2010-09-24 | 2013-07-31 | 斯坦福大学托管董事会 | 使用固定的引物直接捕获、扩增及测序靶标dna |
US20140242579A1 (en) * | 2013-02-28 | 2014-08-28 | Centrillion Technology Holdings Corporation | Reversible terminator molecules and methods of their use |
US20150329855A1 (en) * | 2011-12-22 | 2015-11-19 | Ibis Biosciences, Inc. | Amplification primers and methods |
CN106460232A (zh) * | 2014-05-23 | 2017-02-22 | 生捷科技控股公司 | 用于原位合成的探针阵列的寡核苷酸探针倒转方法 |
CN106446605A (zh) * | 2015-08-13 | 2017-02-22 | 生捷科技控股公司 | 产生聚合物阵列的方法 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5518900A (en) * | 1993-01-15 | 1996-05-21 | Molecular Tool, Inc. | Method for generating single-stranded DNA molecules |
US5795714A (en) * | 1992-11-06 | 1998-08-18 | Trustees Of Boston University | Method for replicating an array of nucleic acid probes |
AU2320597A (en) * | 1996-03-19 | 1997-10-10 | Molecular Tool, Inc. | Method for determining the nucleotide sequence of a polynucleotide |
US6245507B1 (en) * | 1998-08-18 | 2001-06-12 | Orchid Biosciences, Inc. | In-line complete hyperspectral fluorescent imaging of nucleic acid molecules |
JP2001245698A (ja) * | 1999-11-22 | 2001-09-11 | Xiao Bing Wang | 核酸検出法 |
US7078208B2 (en) | 2000-05-26 | 2006-07-18 | Invitrogen Corporation | Thermostable reverse transcriptases and uses thereof |
US6824980B2 (en) * | 2000-06-08 | 2004-11-30 | Xiao Bing Wang | Isometric primer extension method and kit for detection and quantification of specific nucleic acid |
US7148049B2 (en) * | 2002-04-02 | 2006-12-12 | Roche Molecular Systems, Inc. | Thermostable or thermoactive DNA polymerase molecules with attenuated 3′-5′ exonuclease activity |
WO2004092331A2 (en) * | 2003-04-08 | 2004-10-28 | Li-Cor, Inc. | Composition and method for nucleic acid sequencing |
WO2005090607A1 (en) * | 2004-03-08 | 2005-09-29 | Rubicon Genomics, Inc. | Methods and compositions for generating and amplifying dna libraries for sensitive detection and analysis of dna methylation |
US20050260609A1 (en) * | 2004-05-24 | 2005-11-24 | Lapidus Stanley N | Methods and devices for sequencing nucleic acids |
US9017973B2 (en) * | 2008-03-19 | 2015-04-28 | Intelligent Biosystems, Inc. | Methods and compositions for incorporating nucleotides |
US8563240B2 (en) * | 2008-12-31 | 2013-10-22 | Intel Corporation | Nucleic acid sequencing and electronic detection |
EP2652148B1 (en) * | 2010-12-17 | 2016-11-30 | Life Technologies Corporation | Methods, compositions, systems, apparatuses and kits for nucleic acid amplification |
US9624539B2 (en) * | 2011-05-23 | 2017-04-18 | The Trustees Of Columbia University In The City Of New York | DNA sequencing by synthesis using Raman and infrared spectroscopy detection |
KR102321863B1 (ko) * | 2015-01-12 | 2021-11-08 | 10엑스 제노믹스, 인크. | 핵산 시퀀싱 라이브러리의 제조 방법 및 시스템 및 이를 이용하여 제조한 라이브러리 |
WO2016182984A1 (en) * | 2015-05-08 | 2016-11-17 | Centrillion Technology Holdings Corporation | Disulfide-linked reversible terminators |
US10844430B2 (en) * | 2018-01-24 | 2020-11-24 | Qiagen Sciences, Llc | DNA sequencing reaction additive |
-
2018
- 2018-10-01 CN CN201880078052.7A patent/CN111542532B/zh active Active
- 2018-10-01 US US16/651,544 patent/US11414687B2/en active Active
- 2018-10-01 EP EP18865235.8A patent/EP3692049A4/en not_active Withdrawn
- 2018-10-01 WO PCT/US2018/053776 patent/WO2019070593A1/en unknown
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050019793A1 (en) * | 2003-04-14 | 2005-01-27 | Nurith Kurn | Global amplification using a randomly primed composite primer |
CN103228798A (zh) * | 2010-09-24 | 2013-07-31 | 斯坦福大学托管董事会 | 使用固定的引物直接捕获、扩增及测序靶标dna |
US20150329855A1 (en) * | 2011-12-22 | 2015-11-19 | Ibis Biosciences, Inc. | Amplification primers and methods |
US20140242579A1 (en) * | 2013-02-28 | 2014-08-28 | Centrillion Technology Holdings Corporation | Reversible terminator molecules and methods of their use |
CN106460232A (zh) * | 2014-05-23 | 2017-02-22 | 生捷科技控股公司 | 用于原位合成的探针阵列的寡核苷酸探针倒转方法 |
CN106446605A (zh) * | 2015-08-13 | 2017-02-22 | 生捷科技控股公司 | 产生聚合物阵列的方法 |
Also Published As
Publication number | Publication date |
---|---|
US11414687B2 (en) | 2022-08-16 |
US20200263218A1 (en) | 2020-08-20 |
EP3692049A1 (en) | 2020-08-12 |
EP3692049A4 (en) | 2021-06-23 |
CN111542532A (zh) | 2020-08-14 |
WO2019070593A1 (en) | 2019-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10415087B2 (en) | Methods for adding adapters to nucleic acids and compositions for practicing the same | |
EP3797170B1 (en) | Polynucleotide synthesis method, system and kit | |
CA2948951C (en) | Synthesis of double-stranded nucleic acids | |
EP3570972B1 (en) | Methods and reagents for synthesising polynucleotide molecules | |
US9822394B2 (en) | Nucleic acid sample preparation | |
CA2467577A1 (en) | Multiplex pcr | |
AU2002366098A2 (en) | Multiplex PCR | |
US20230087259A1 (en) | Polymer synthesis using electrowetting devices | |
KR102398479B1 (ko) | 카피수 보존 rna 분석 방법 | |
CN111542532B (zh) | 酶法合成寡核苷酸的方法和体系 | |
WO2021128441A1 (en) | Controlled strand-displacement for paired-end sequencing | |
KR20240024835A (ko) | 비이드-기반 핵산의 조합 인덱싱을 위한 방법 및 조성물 | |
CN118048419A (zh) | 酶法合成寡核苷酸的方法和系统 | |
IL296604A (en) | Methods and preparations for preparing nucleic acid libraries | |
JP7191115B2 (ja) | エンドヌクレアーゼ媒介移動平衡(EM-SEq)による核酸の増幅のための方法 | |
WO2021083195A1 (en) | Dna linker oligonucleotides | |
CN107937389B (zh) | 阵列上连接组装 | |
AU2022280886A1 (en) | Oligo-modified nucleotide analogues for nucleic acid preparation | |
WO2023014728A1 (en) | Assembly of long nucleic acids by ligation using indexed splint oligos | |
CN116710573A (zh) | 插入段和标识无变性测序方法 | |
CN117940577A (zh) | 用于化学裂解表面结合的多核苷酸的高碘酸盐组合物和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |