CN111187797B - 用于合成具有预先确定的序列的核酸的方法 - Google Patents
用于合成具有预先确定的序列的核酸的方法 Download PDFInfo
- Publication number
- CN111187797B CN111187797B CN201911113592.7A CN201911113592A CN111187797B CN 111187797 B CN111187797 B CN 111187797B CN 201911113592 A CN201911113592 A CN 201911113592A CN 111187797 B CN111187797 B CN 111187797B
- Authority
- CN
- China
- Prior art keywords
- solid phase
- synthesis
- tank
- reagent
- deprotection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 138
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 102
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 99
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 99
- 230000002194 synthesizing effect Effects 0.000 title claims abstract description 25
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 245
- 230000015572 biosynthetic process Effects 0.000 claims description 232
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical group CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 claims description 168
- 239000007790 solid phase Substances 0.000 claims description 146
- 239000007787 solid Substances 0.000 claims description 139
- 239000003153 chemical reaction reagent Substances 0.000 claims description 114
- 238000010511 deprotection reaction Methods 0.000 claims description 76
- 239000000969 carrier Substances 0.000 claims description 65
- 125000002637 deoxyribonucleotide group Chemical group 0.000 claims description 61
- 239000005547 deoxyribonucleotide Substances 0.000 claims description 59
- 238000006243 chemical reaction Methods 0.000 claims description 54
- 238000005406 washing Methods 0.000 claims description 54
- 239000000178 monomer Substances 0.000 claims description 51
- 125000002652 ribonucleotide group Chemical group 0.000 claims description 49
- 238000007254 oxidation reaction Methods 0.000 claims description 48
- 230000003647 oxidation Effects 0.000 claims description 47
- 150000008300 phosphoramidites Chemical group 0.000 claims description 46
- 108091028664 Ribonucleotide Proteins 0.000 claims description 43
- 239000002336 ribonucleotide Substances 0.000 claims description 43
- 238000005915 ammonolysis reaction Methods 0.000 claims description 38
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 claims description 36
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 claims description 36
- 150000003536 tetrazoles Chemical class 0.000 claims description 35
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 claims description 33
- WFDIJRYMOXRFFG-UHFFFAOYSA-N Acetic anhydride Chemical compound CC(=O)OC(C)=O WFDIJRYMOXRFFG-UHFFFAOYSA-N 0.000 claims description 30
- 239000013638 trimer Substances 0.000 claims description 29
- 125000003636 chemical group Chemical group 0.000 claims description 27
- 239000003599 detergent Substances 0.000 claims description 20
- 239000000539 dimer Substances 0.000 claims description 20
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 claims description 18
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 17
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 claims description 15
- 229910052740 iodine Inorganic materials 0.000 claims description 15
- 239000011630 iodine Substances 0.000 claims description 15
- 239000000203 mixture Substances 0.000 claims description 15
- 239000000463 material Substances 0.000 claims description 14
- 125000001981 tert-butyldimethylsilyl group Chemical group [H]C([H])([H])[Si]([H])(C([H])([H])[H])[*]C(C([H])([H])[H])(C([H])([H])[H])C([H])([H])[H] 0.000 claims description 14
- 239000000376 reactant Substances 0.000 claims description 13
- 238000002791 soaking Methods 0.000 claims description 13
- 239000007800 oxidant agent Substances 0.000 claims description 11
- YNJBWRMUSHSURL-UHFFFAOYSA-N trichloroacetic acid Chemical compound OC(=O)C(Cl)(Cl)Cl YNJBWRMUSHSURL-UHFFFAOYSA-N 0.000 claims description 11
- KILYGFICLVHKJG-UHFFFAOYSA-N CC=1NC=CN1.[N] Chemical compound CC=1NC=CN1.[N] KILYGFICLVHKJG-UHFFFAOYSA-N 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 9
- 238000001668 nucleic acid synthesis Methods 0.000 claims description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 9
- 230000003287 optical effect Effects 0.000 claims description 8
- 230000000977 initiatory effect Effects 0.000 claims description 6
- 239000007788 liquid Substances 0.000 claims description 4
- 239000002096 quantum dot Substances 0.000 claims description 4
- 239000011521 glass Substances 0.000 claims description 3
- SYNVVSZZLHLYEB-UHFFFAOYSA-N (2-methylpropan-2-yl)oxysilicon Chemical compound CC(C)(C)O[Si] SYNVVSZZLHLYEB-UHFFFAOYSA-N 0.000 claims description 2
- 239000004033 plastic Substances 0.000 claims description 2
- 229920003023 plastic Polymers 0.000 claims description 2
- 239000012070 reactive reagent Substances 0.000 claims description 2
- 229910001220 stainless steel Inorganic materials 0.000 claims description 2
- 239000010935 stainless steel Substances 0.000 claims description 2
- 230000002045 lasting effect Effects 0.000 claims 1
- 210000004027 cell Anatomy 0.000 description 93
- 238000004128 high performance liquid chromatography Methods 0.000 description 33
- 239000002773 nucleotide Substances 0.000 description 29
- 125000003729 nucleotide group Chemical group 0.000 description 29
- 108020004414 DNA Proteins 0.000 description 27
- 238000002474 experimental method Methods 0.000 description 25
- 239000000047 product Substances 0.000 description 25
- 239000002904 solvent Substances 0.000 description 24
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 21
- 239000012190 activator Substances 0.000 description 19
- 239000000243 solution Substances 0.000 description 18
- 239000000543 intermediate Substances 0.000 description 17
- 238000011282 treatment Methods 0.000 description 16
- -1 aliphatic radical Chemical class 0.000 description 15
- 150000001875 compounds Chemical class 0.000 description 15
- 238000012545 processing Methods 0.000 description 14
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 13
- 238000002444 silanisation Methods 0.000 description 13
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 10
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 10
- 230000006820 DNA synthesis Effects 0.000 description 10
- 229910021529 ammonia Inorganic materials 0.000 description 10
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 10
- NJSVDVPGINTNGX-UHFFFAOYSA-N [dimethoxy(propyl)silyl]oxymethanamine Chemical compound CCC[Si](OC)(OC)OCN NJSVDVPGINTNGX-UHFFFAOYSA-N 0.000 description 9
- 238000002493 microarray Methods 0.000 description 9
- 125000006239 protecting group Chemical group 0.000 description 9
- ISIJQEHRDSCQIU-UHFFFAOYSA-N tert-butyl 2,7-diazaspiro[4.5]decane-7-carboxylate Chemical compound C1N(C(=O)OC(C)(C)C)CCCC11CNCC1 ISIJQEHRDSCQIU-UHFFFAOYSA-N 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 239000002253 acid Substances 0.000 description 8
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 8
- 238000004140 cleaning Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 230000001590 oxidative effect Effects 0.000 description 8
- 239000012048 reactive intermediate Substances 0.000 description 8
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 7
- 239000003795 chemical substances by application Substances 0.000 description 7
- 238000005859 coupling reaction Methods 0.000 description 7
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 7
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 239000004696 Poly ether ether ketone Substances 0.000 description 6
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 6
- 210000000692 cap cell Anatomy 0.000 description 6
- 230000008878 coupling Effects 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 6
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 6
- 230000004907 flux Effects 0.000 description 6
- 229920002530 polyetherether ketone Polymers 0.000 description 6
- 238000001308 synthesis method Methods 0.000 description 6
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Natural products O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 5
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 5
- 125000003277 amino group Chemical group 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 235000013928 guanylic acid Nutrition 0.000 description 5
- 239000004226 guanylic acid Substances 0.000 description 5
- OJMIONKXNSYLSR-UHFFFAOYSA-N phosphorous acid Chemical compound OP(O)O OJMIONKXNSYLSR-UHFFFAOYSA-N 0.000 description 5
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 4
- 229960005305 adenosine Drugs 0.000 description 4
- 125000001931 aliphatic group Chemical group 0.000 description 4
- 125000003118 aryl group Chemical group 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 125000003396 thiol group Chemical group [H]S* 0.000 description 4
- LTPSRQRIPCVMKQ-UHFFFAOYSA-N 2-amino-5-methylbenzenesulfonic acid Chemical compound CC1=CC=C(N)C(S(O)(=O)=O)=C1 LTPSRQRIPCVMKQ-UHFFFAOYSA-N 0.000 description 3
- 125000002103 4,4'-dimethoxytriphenylmethyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C(*)(C1=C([H])C([H])=C(OC([H])([H])[H])C([H])=C1[H])C1=C([H])C([H])=C(OC([H])([H])[H])C([H])=C1[H] 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 3
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 102100027370 Parathymosin Human genes 0.000 description 3
- 230000006819 RNA synthesis Effects 0.000 description 3
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 230000002411 adverse Effects 0.000 description 3
- 238000005576 amination reaction Methods 0.000 description 3
- 125000003710 aryl alkyl group Chemical group 0.000 description 3
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 3
- 239000012141 concentrate Substances 0.000 description 3
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Natural products NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 3
- 229940104302 cytosine Drugs 0.000 description 3
- 239000007791 liquid phase Substances 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 238000007086 side reaction Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 125000002221 trityl group Chemical group [H]C1=C([H])C([H])=C([H])C([H])=C1C([*])(C1=C(C(=C(C(=C1[H])[H])[H])[H])[H])C1=C([H])C([H])=C([H])C([H])=C1[H] 0.000 description 3
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 3
- 229940045145 uridine Drugs 0.000 description 3
- MCTWTZJPVLRJOU-UHFFFAOYSA-N 1-methyl-1H-imidazole Chemical compound CN1C=CN=C1 MCTWTZJPVLRJOU-UHFFFAOYSA-N 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- BAVYZALUXZFZLV-UHFFFAOYSA-N Methylamine Chemical compound NC BAVYZALUXZFZLV-UHFFFAOYSA-N 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 239000004793 Polystyrene Substances 0.000 description 2
- 238000001237 Raman spectrum Methods 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N Thymine Natural products CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 2
- HDCSDYVMDSSIAQ-UUOKFMHZSA-N [(2R,3S,4R,5R)-5-(2-amino-6-oxo-1H-purin-9-yl)-3,4-dihydroxyoxolan-2-yl]methyl dihydrogen phosphite Chemical compound P(O)(O)OC[C@@H]1[C@H]([C@H]([C@@H](O1)N1C=NC=2C(=O)NC(N)=NC1=2)O)O HDCSDYVMDSSIAQ-UUOKFMHZSA-N 0.000 description 2
- 125000003342 alkenyl group Chemical group 0.000 description 2
- 125000000304 alkynyl group Chemical group 0.000 description 2
- 125000006242 amine protecting group Chemical group 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 125000003236 benzoyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C(*)=O 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 238000005229 chemical vapour deposition Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- JXTHNDFMNIQAHM-UHFFFAOYSA-N dichloroacetic acid Chemical compound OC(=O)C(Cl)Cl JXTHNDFMNIQAHM-UHFFFAOYSA-N 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 239000004519 grease Chemical group 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 125000001072 heteroaryl group Chemical group 0.000 description 2
- 125000000592 heterocycloalkyl group Chemical group 0.000 description 2
- 238000012988 high-throughput synthesis Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 229920002223 polystyrene Polymers 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 229910052710 silicon Inorganic materials 0.000 description 2
- 239000010703 silicon Substances 0.000 description 2
- 238000010532 solid phase synthesis reaction Methods 0.000 description 2
- 238000010189 synthetic method Methods 0.000 description 2
- ILMRJRBKQSSXGY-UHFFFAOYSA-N tert-butyl(dimethyl)silicon Chemical group C[Si](C)C(C)(C)C ILMRJRBKQSSXGY-UHFFFAOYSA-N 0.000 description 2
- 150000007970 thio esters Chemical group 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000007740 vapor deposition Methods 0.000 description 2
- WYTZZXDRDKSJID-UHFFFAOYSA-N (3-aminopropyl)triethoxysilane Chemical compound CCO[Si](OCC)(OCC)CCCN WYTZZXDRDKSJID-UHFFFAOYSA-N 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- OAKJQQAXSVQMHS-UHFFFAOYSA-N Hydrazine Chemical compound NN OAKJQQAXSVQMHS-UHFFFAOYSA-N 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical class O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- GCHCDBOIRFPABI-UHFFFAOYSA-N NP(O)O.C1=NN=NN1.C1=NN=NN1 Chemical compound NP(O)O.C1=NN=NN1.C1=NN=NN1 GCHCDBOIRFPABI-UHFFFAOYSA-N 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 238000001069 Raman spectroscopy Methods 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- NQHAZTDQFIYTQD-UHFFFAOYSA-N SOS Chemical group SOS NQHAZTDQFIYTQD-UHFFFAOYSA-N 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 239000005864 Sulphur Substances 0.000 description 1
- DHXVGJBLRPWPCS-UHFFFAOYSA-N Tetrahydropyran Chemical compound C1CCOCC1 DHXVGJBLRPWPCS-UHFFFAOYSA-N 0.000 description 1
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Natural products O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 125000006241 alcohol protecting group Chemical group 0.000 description 1
- 125000003172 aldehyde group Chemical group 0.000 description 1
- 125000003545 alkoxy group Chemical group 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 125000005336 allyloxy group Chemical group 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 125000003368 amide group Chemical group 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 235000011114 ammonium hydroxide Nutrition 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000012298 atmosphere Substances 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 239000000919 ceramic Substances 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 125000000332 coumarinyl group Chemical group O1C(=O)C(=CC2=CC=CC=C12)* 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 229960005215 dichloroacetic acid Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 125000004185 ester group Chemical group 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 238000003682 fluorination reaction Methods 0.000 description 1
- 125000002485 formyl group Chemical class [H]C(*)=O 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000005984 hydrogenation reaction Methods 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- IJGRMHOSHXDMSA-UHFFFAOYSA-N nitrogen Substances N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920001343 polytetrafluoroethylene Polymers 0.000 description 1
- 239000004810 polytetrafluoroethylene Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000006884 silylation reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 125000001412 tetrahydropyranyl group Chemical group 0.000 description 1
- 125000003831 tetrazolyl group Chemical group 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 238000007862 touchdown PCR Methods 0.000 description 1
- 125000004665 trialkylsilyl group Chemical group 0.000 description 1
- 125000000025 triisopropylsilyl group Chemical group C(C)(C)[Si](C(C)C)(C(C)C)* 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/34—Polynucleotides, e.g. nucleic acids, oligoribonucleotides
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Microbiology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Saccharide Compounds (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本申请涉及核酸的化学合成。本申请提供了一种合成各自独立地具有预先确定的序列的n种(n≥2)目标核酸分子的方法。
Description
技术领域
本申请涉及生物化学领域。特别地,本申请涉及具有预先确定的序列的核酸分子的化学合成。本申请提供了一种合成各自独立地具有预先确定的序列的n种(n≥2)目标核酸分子的方法。
背景
自二十世纪五十年代Todd,Khorana课题组第一次报道了DNA合成(Michelwn,A.M.,Todd,A.R.J.Chem.Soc.,1955;Gilham,P.T.,Khorana,H.G.,J.A.m.Cliem.Soc.,1958)以来,DNA的合成方法经历了长期的发展。目前经典的合成方法包括:八十年代发展起来的柱式合成法,以及九十年代发展起来的基于微阵列的高通量合成法。这些方法基本上为固相合成法,其中,以单个脱氧核糖核苷酸为单元进行合成,并且其合成过程大多涉及基于亚磷酰胺化学的四步骤循环:即脱保护、偶联、加帽和氧化步骤。由于每一步反应的不完全性、伴随可能发生的副反应(如脱腺苷等)以及反应物浓度随反应进展的降低,随着DNA单链的延长,DNA合成的错误率急剧上升,产量急剧下降。此外,柱式合成法的缺点还在于试剂使用量大且通量低,导致合成成本较高,费时费力。而基于微阵列的合成方法虽然通量较高且试剂使用量少,但是其错误率相对较高,产量低,且不稳定。
目前,一些商业化的DNA合成仪已经进入市场。根据上述合成原理,这些合成仪相应地可以分为两种:柱式合成仪(例如Dr.Oligo 192和Mermade192)和微阵列合成仪(例如CustomArray合成仪)。柱式合成仪使用电磁阀来控制试剂的添加,在尺寸为厘米级别的多孔反应柱上进行固相合成反应。微阵列合成仪则是在微米级别的反应孔内进行固相合成反应。通过在一张芯片上设置成千上万个反应孔,微阵列合成仪大大提高了合成通量,且在一定程度上减少了试剂的消耗;然而,其缺点是产量低,反应不易控制,且错误率较高。此外,当使用微阵列合成仪合成DNA时,所获得的产物通常为混合物,难以对不同的DNA分子进行分离和纯化,这也增加了后续操作的成本。
在RNA的化学合成中,核糖核苷的5’-OH、糖环外的氨基及磷酸羟基的保护与DNA基本相同。因此,RNA的化学合成可使用上述DNA合成仪(柱式合成仪和微阵列合成仪)来进行。但是,由于核糖核苷酸的糖环上包含两个羟基(2’-OH和3’-OH),因此,在RNA合成过程中,需要进行额外的步骤,即对糖环上的2’-OH进行保护和脱保护。
与DNA的化学合成类似,由于每一步反应的不完全性、伴随可能发生的副反应以及反应物浓度随反应进展的降低,常见的RNA化学合成方法也具有下述缺点:随着单链RNA长度的增加,合成的错误率急剧上升,产量急剧下降。这导致了DNA和RNA合成产物的长度和产量受到了极大的限制。类似地,当使用柱式合成仪合成RNA时,合成通量低而且试剂利用率低,这导致合成成本较高,费时费力。当使用微阵列合成仪合成RNA时,尽管合成通量有所提高,但是其错误率相对较高,产量低,并且所获得的产物通常为混合物,难以对不同的核酸分子进行分离和纯化。
另外,从进样方式方上来说,在合成DNA和RNA过程中,柱式合成仪和微阵列合成仪均通过预先铺设的管线,将试剂加载到合成柱或者合成芯片上,且加入的试剂大大过量,这造成了试剂的极大浪费和低试剂使用率。此外,试剂输入和输出管线的单独铺设也进一步增加了合成成本。
总的来说,核酸合成的化学合成方法仍存在着缺陷,本领域需要开发新的低成本、低错误率和高通量的合成方法。
发明内容
在本申请中,除非另有定义,否则本文所用的全部技术和科学术语都具有本申请所属领域普通技术人员所通常理解的含义。在本申请的实施方案中,可以使用与本文所述的那些方法和材料类似或等同的方法和材料,下文仅仅是描述了例示性的适合的方法和材料。将所有公开出版物、专利申请、专利和其它参考文献并入本文作为参考。此外,所述材料、方法和实施例仅仅是示范性的而非限制性的。同时,为了更好地理解本发明,本申请中也提供了相关术语的定义和解释。当本申请中提供的术语定义和解释与本申请所属领域普通技术人员所通常理解的意思相冲突时,以本申请提供的术语定义和解释为准。
本申请发明人经过一系列研究,开发了一种新的低成本、低错误率和高通量的核酸合成方法。简言之,本发明提出了一种基于识别-分选策略的合成核酸的方法。本发明的合成核酸的方法涉及了识别-分选策略以及“合成池”浸泡策略,能够精确控制合成过程,灵活控制合成通量,并且能够实现对合成试剂的循环利用。由此,除了能够实现灵活控制通量之外,本发明的方法及装置还极大降低了物料成本,缩短了每步化学反应的时间,而且优化了整个合成流程,降低了错误率,提高了合成效率。
合成方法
因此,在第一方面,本申请提供了一种合成n种核酸分子的方法,其中,所述n种核酸分子各自具有预先确定的序列,n为≥2的整数,所述方法包括以下步骤:
(1)提供n个固相载体,其中,每一个固相载体各自独立地携带编码,并且,每一个固相载体与其所携带的编码具有唯一对应关系;并且,每一个固相载体被确定用于合成一种核酸分子,并且携带用于起始核酸合成的化学基团(例如端部基团);
(2)提供:
-多个合成池,每一个合成池各自独立地含有反应试剂,所述反应试剂能够将一个构建单元连接至固相载体上携带的化学基团,其中,所述构建单元选自具有5’-保护基的亚磷酰胺单体或低聚体(例如二聚体、三聚体或四聚体);并且,每一个合成池对应于一种构建单元;所述多个合成池的集合至少涵盖了所述n种核酸分子所包含的构建单元的所有种类;
-至少一个洗涤池,其包含洗涤剂;
-至少一个盖帽池,其包含盖帽试剂;
-至少一个氧化池,其包含氧化试剂;以及
-至少一个脱保护池,其包含脱保护试剂;
(3)将所有固相载体接触浸泡入盖帽池,并与其中的盖帽试剂反应;然后,将该固相载体浸泡入洗涤池,用洗涤剂洗涤,以去除固相载体上残留的反应试剂;
(4)将所有固相载体浸泡入脱保护池,并与其中的脱保护试剂反应;然后,将该固相载体浸泡入洗涤池,用洗涤剂洗涤,以去除固相载体上残留的反应试剂;
(5)识别每一个固相载体携带的编码,并根据编码与固相载体的唯一对应关系,以及每一个固相载体待合成的目标核酸的序列,确定每一个固相载体待连接的构建单元的种类;
(6)根据前一步骤确定的待连接的构建单元的种类,分选每一个固相载体,并使每一个固相载体浸泡入对应于所述种类的构建单元的合成池并进行反应,从而将一个所述种类的构建单元连接至所述固相载体上携带的化学基团;然后,将所有固相载体浸泡入洗涤池,用洗涤剂洗涤,以去除固相载体上残留的反应试剂;
(7)将所有固相载体浸泡入盖帽池,并与其中的盖帽试剂反应;然后,将该固相载体浸泡入洗涤池,用洗涤剂洗涤,以去除固相载体上残留的反应试剂;
(8)将所有固相载体浸泡入氧化池,并与其中的氧化试剂反应;然后,将所有固相载体浸泡入洗涤池,用洗涤剂洗涤,以去除固相载体上残留的反应试剂;
(9)任选地,重复步骤(4)-(8)一次或多次;
从而,在固相载体上合成具有预先确定序列的n种核酸分子。
易于理解的是,当步骤(4)-(8)重复一次或多次之后,所述固相载体相应地已连接有一个或多个构建单元,此时,如再次重复步骤(4)-(8)时,在该次循环的步骤(5)中,还会根据每一个固相载体已经历的反应,来确定每一个固相载体待连接的构建单元的种类。
在某些实施方案中,所述方法用于同时合成2-5种,5-10种,10-20种,20-50种,50-100种,100-200种,200-500种,500-1000种,1000-2000种,2000-5000种,5000-10000种,104-105种,105-106种,106-107种,或更多种核酸分子。
构建单元
易于理解,目标核酸分子的序列即为构建单元(例如脱氧核糖核苷酸或核糖核苷酸)的排列顺序,彼此相邻的两个构建单元通过共价键(例如磷酸二酯键)连接以形成目标核酸分子。
还易于理解的是,包含于所述核酸分子中的“至少两个构建单元”是彼此独立的,可以相同或不同,并且各自独立地可以选自各种核苷酸,包括但不限于腺嘌呤核糖核苷酸,腺嘌呤脱氧核糖核苷酸,鸟嘌呤核糖核苷酸,鸟嘌呤脱氧核糖核苷酸,胞嘧啶核糖核苷酸,胞嘧啶脱氧核糖核苷酸,尿嘧啶核糖核苷酸,胸腺嘧啶脱氧核糖核苷酸,次黄嘌呤核苷酸。此外,包含于所述目标核酸分子中的构建单元可以是经修饰或未经修饰的,例如携带甲基化、乙酰化、氢化、氟化、硫化修饰或保护基团。
还易于理解的是,在本发明中,所述构建单元并不局限于单体核苷酸。在某些实施方案中,所述构建单元可以选自例如,单体核苷酸,单体核苷酸的低聚体(例如二聚体、三聚体或四聚体),或其任何组合。在某些情况下,将单体核苷酸的低聚体(例如二聚体、三聚体或四聚体)用作构建单元是有利的,这可以提高合成的效率,延长能够合成的核酸分子的长度,减少添加构建单元所需的连接反应的数目。
易于理解,在某些情况下,当选择单体核苷酸的低聚体(例如二聚体、三聚体或四聚体)作为构建单元时,待合成的目标核酸分子可能并非恰好是所述低聚体的整数倍,无法仅依赖于所述低聚体来完成合成。因此,在某些实施方案中,所使用的构建单元为,单体核苷酸的低聚体(例如二聚体、三聚体或四聚体)与单体核苷酸的组合。在某些实施方案中,还可以使用单体核苷酸的二聚体和三聚体的组合作为构建单元。
例如,当所述目标核酸分子为DNA时,所述构建单元可以包括,4种脱氧核糖核苷酸(单碱基构建单元);或者,可以包括,4种脱氧核糖核苷酸(单碱基构建单元)和16种脱氧核糖核苷酸二聚体(双碱基构建单元);或者,可以包括,4种脱氧核糖核苷酸(单碱基构建单元)和64种脱氧核糖核苷酸三聚体(三碱基构建单元);或者,可以包括,16种脱氧核糖核苷酸二聚体(双碱基构建单元)和64种脱氧核糖核苷酸三聚体(三碱基构建单元);或者,可以包括,4种脱氧核糖核苷酸(单碱基构建单元),16种脱氧核糖核苷酸二聚体(双碱基构建单元),和64种脱氧核糖核苷酸三聚体(三碱基构建单元)。
例如,当所述目标核酸为RNA时,所述构建单元可以包括,4种核糖核苷酸(单碱基构建单元);或者,可以包括,4种核糖核苷酸(单碱基构建单元)和16种核糖核苷酸二聚体(双碱基构建单元);或者,可以包括,4种核糖核苷酸(单碱基构建单元)和64种核糖核苷酸三聚体(三碱基构建单元);或者,可以包括,16种核糖核苷酸二聚体(双碱基构建单元)和64种核糖核苷酸三聚体(三碱基构建单元);或者,可以包括,4种核糖核苷酸(单碱基构建单元),16种核糖核苷酸二聚体(双碱基构建单元),和64种核糖核苷酸三聚体(三碱基构建单元)。
另外,还易于理解的是,当所使用的构建单元为单体核苷酸的低聚体(例如二聚体、三聚体或四聚体)与单体核苷酸的组合,并且涵盖了所有种类的单体核苷酸时,所述低聚体不必是穷举性的。例如,当所述目标核酸为DNA时,所述构建单元可以包括,4种脱氧核糖核苷酸(单碱基构建单元),以及任选地,任意种类(例如1-16种)的脱氧核糖核苷酸二聚体(双碱基构建单元)和/或任意种类(例如1-64种)的脱氧核糖核苷酸三聚体(三碱基构建单元)。当所述目标核酸为RNA时,所述构建单元可以包括,4种核糖核苷酸(单碱基构建单元),以及任选地,任意种类(例如1-16种)的核糖核苷酸二聚体(双碱基构建单元)和/或任意种类(例如1-64种)的核糖核苷酸三聚体(三碱基构建单元)。然而,在某些实施方案中,所使用的构建单元包括了穷举性的单体核苷酸以及穷举性的单体核苷酸的低聚体(例如二聚体、三聚体或四聚体)。
在某些实施方案中,所述具有5’-保护基的亚磷酰胺单体或低聚体具有式I所示的结构,
其中,
X1独立地是-O-或-S-;
X2独立地是-O-、-S-或-NR-,其中R是-H,取代或未取代的烷基,取代或未取代的芳基,或是胺保护基;
X3独立地是-O-、-S-、-CH2-或-(CH2)2-;
X4独立地是=O或=S;
R1是保护基团;
R2独立地是-H、-F、-NHR6、-CH2R6或-OR6,其中R6是-H,取代或未取代的脂族基团,取代或未取代的芳基,取代或未取代的芳烷基,或是保护基,例如醇保护基,如叔丁基二甲基甲硅烷基,或是胺保护基;
R3独立地是-OCH2CH2CN,-SCH2CH2CN,取代或未取代的脂族基团,-OR7或-SR7,其中R7是取代或未取代的脂族基团,取代或未取代的芳基,或是取代或未取代的芳烷基,THP,4-甲氧基四氢吡喃基或2-氟苯基甲氧基哌啶-4-基;
R4和R5各自独立地是取代或未取代的脂族基团,取代或未取代的芳族基团,取代或未取代的芳烷基;或者,R4和R5与它们所键合的氮一起形成一个杂环烷基或杂芳基,其中杂环烷基或杂芳基优选是五或六元环;和
各B独立地是被修饰或未被修饰的核苷碱基;
n是0或正整数。
在某些实施方案中,n可以选自0、1、2、3、4、5、6、7或更大的正整数。在某些实施方案中,n为0。在此类实施方案中,合成池中所提供的构建单元选自亚磷酰胺单体。在某些实施方案中,n为大于等于1的正整数。在此类实施方案中,合成池中所提供的构建单元选自亚磷酰胺低聚体。在某些实施方案中,n为1、2或3。优选地,n为0或1。
在某些实施方案中,X1是-O-;X2是-O-;X3是-O-;X4是=O;X5是-OH。
在某些实施方案中,R1是酸不稳定的保护基团或三烷基甲硅烷基,例如叔丁基二甲基甲硅烷基或三异丙基甲硅烷基。在某些实施方案中,R1是取代的或未取代的三苯甲基,9-(苯基)咕吨基(也称为“pixyl”)或四氢吡喃基(也称为“THP”)。在某些实施方案中,R1是未被取代的三苯甲基、一烷氧基三苯甲基、二烷氧基三苯甲基、三烷氧基三苯甲基、THP或9-苯基咕吨基。在某些示例性实施方案中,R1是4,4’-二甲氧基三苯甲基(也称为“DMT”)。
在某些实施方案中,R2表示C-烯丙基。在某些实施方案中,R2是-H、-O或-OCH2CH2OMe。
在某些实施方案中,R3独立地是-OCH2CH2CN、-SCH2CH2CN、4-氰基丁-2-烯硫基、4-氰基丁-2-烯氧基、烯丙基硫基、烯丙基氧基、2-丁烯硫基或2-丁烯氧基。在某些实施方案中,R3是-OCH2CH2CN或-SCH2CH2CN。在某些实施方案中,所述方法还包括用碱处理合成的寡核苷酸,以从-OCH2CH2CN或-SCH2CH2CN中除去-CH2CH2CN。
在某些实施方案中,R4和R5各自为异丙基。
在某些实施方案中,例如当存在一个或多个无碱基部分时,B还可以是H。
在某些示例性实施方案中,所述具有5’-保护基的亚磷酰胺单体或多聚体具有式II所示的结构,
其中,
B和R2的定义与式I中相同;
R8是取代或未被取代的三苯甲基,例如4,4’-二甲氧基三苯甲基;
R10和R11独立地各自为取代或未被取代的脂族基团;R10和R11优选为异丙基;
m是0或1。
在某些实施方案中,所述具有5’-保护基的亚磷酰胺单体或低聚体选自5'-羟基被DMT保护、3’-羟基被亚磷酰胺保护的脱氧核糖核苷酸单体或低聚体。在此类实施方案中,所述方法用于DNA合成。在某些示例性实施方案中,所述具有5’-保护基的亚磷酰胺单体或低聚体选自图1所示的化合物以及图2A-2C所示的化合物。
在某些实施方案中,所述具有5’-保护基的亚磷酰胺单体或低聚体选自5'-羟基被DMT保护、2'-羟基被TBDMS(叔丁基甲基硅基醚)保护、3’-羟基被亚磷酰胺保护的核糖核苷酸单体或低聚体。在此类实施方案中,所述方法用于RNA合成。
合成池
如本申请中所定义的,目标核酸分子中的n个构建单元是彼此独立的。换言之,所述的n个构建单元可以完全相同,部分相同,或者彼此完全不同。这完全取决于期望的目标核酸分子的序列本身(例如,目标核酸分子中不同构建单元的排列顺序)。因此,尽管目标核酸分子含有n个构建单元,但是目标核酸分子所涉及的构建单元的种类数目可以在1-n之间(包括端点);也即,1≤构建单元的种类数目≤n。相应地,在本发明方法的步骤(2)中,合成池的数目至少为构建单元的种类的数目。
在某些实施方案中,合成池的数目为目标核酸分子所涉及的构建单元的种类的数目。在这种情况下,每一个合成池即对应于一个种类的构建单元。换言之,每一个合成池中的反应试剂能够在固相载体携带的化学基团的末端添加一个构建单元;并且,每一个合成池各自涉及不同的构建单元,并且所有合成池的集合涵盖了构建单元的所有种类。例如,当目标核酸为DNA时,其可以包含4种构建单元,即,腺嘌呤脱氧核糖核苷酸,鸟嘌呤脱氧核糖核苷酸,胞嘧啶脱氧核糖核苷酸,和胸腺嘧啶脱氧核糖核苷酸。在这种情况下,无论目标核酸分子含有多少个构建单元(即,无论DNA含有多少个脱氧核糖核苷酸),都可针对这4种构建单元,设置4种合成池,其中,每一种合成池对应于一种构建单元。由此,通过设置4种合成池,本发明的方法即可以用于合成任意长度的DNA。
然而,易于理解的是,在本发明方法的步骤(2)中,可以提供比构建单元的种类数目更多的合成池。一种可能的情况是,目标核酸分子含有多个某一种类的构建单元,为了确保有充足的反应试剂进行反应以便能够添加多个该种类的构建单元,可以针对该种类的构建单元提供两个或更多个相同的合成池。例如,当目标核酸分子富含CG时,针对C和G这两种构建单元的每一种,各自提供两个或更多个相同的合成池,以确保有足够的反应试剂来添加多个C和多个G。另一种可能的情况是,不考虑目标核酸分子实际包含的构建单元的种类数目,针对目标核酸分子可能涉及的所有种类的构建单元的每一种,分别提供一个合成池,以便于操作。
因此,在某些实施方案中,合成池的数目大于目标核酸分子所涉及的构建单元的种类的数目。然而,在任何情况下,所述多个合成池的集合都应当至少涵盖目标核酸分子中的n个构建单元的所有种类,以使得目标核酸分子能够被完整合成。
在本申请中,每一个合成池各自独立地含有反应试剂,所述反应试剂允许将一个构建单元连接至固相载体上携带的化学基团的末端。在某些实施方案中,所述反应试剂包含构建单元和亚磷酰胺活化剂。
当待连接/添加的构建单元为脱氧核糖核苷酸时,所述构建单元可以为5’-羟基被保护、且3’-羟基被活化的脱氧核糖核苷酸。由此,所述构建单元能够通过活化的3’-羟基与固相载体上携带的化学基团的反应,而连接至所述化学基团的末端。与此同时,构建单元的5’-羟基的保护可避免或减少不期望的副产物的产生。当待连接/添加的构建单元为核糖核苷酸时,所述构建单元可以为5’-羟基被保护、且核糖上的2’-羟基被保护,且3’-羟基被活化的核糖核苷酸。由此,所述构建单元能够通过活化的3’-羟基与固相载体上携带的化学基团的反应,而连接至所述化学基团的末端。与此同时,反应试剂的5’-羟基和2’-羟基的保护可避免或减少不期望的副产物的产生。
用于保护和活化核苷酸(脱氧核糖核苷酸或核糖核苷酸)的羟基的方法和试剂是本领域技术人员熟知的。例如,可使用二甲氧基三苯甲基(DMT)来保护核苷酸(脱氧核糖核苷酸或核糖核苷酸)的5’-羟基;和/或,可通过使亚磷酰胺保护的核苷酸单体与四氮唑活化剂反应,形成亚磷酰胺四唑活性中间体,从而活化核苷酸(脱氧核糖核苷酸或核糖核苷酸)的3’-羟基。
在某些实施方案中,所涉及的构建单元为4种脱氧核糖核苷酸单体(单碱基单元)。在此类实施方案中,可提供四种合成池(第一、第二、第三、第四合成池),其分别用于添加脱氧核糖核苷酸A、T、C和G。例如,第一合成池可包含,5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的腺苷酸以及四氮唑活化剂,二者可反应生成3'端被活化、5'-羟基仍然被DMT保护的腺苷亚磷酸活性中间体;第二合成池可包含,5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的鸟苷酸以及四氮唑活化剂,二者可反应生成3'端被活化、5'-羟基仍然被DMT保护的鸟苷亚磷酸活性中间体;第三合成池可包含,5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的胞苷酸以及四氮唑活化剂,二者可反应生成3'端被活化、5'-羟基仍然被DMT保护的胞苷亚磷酸活性中间体;且,第四合成池可包含,5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的胸苷酸以及四氮唑活化剂,二者可反应生成3'端被活化、5'-羟基仍然被DMT保护的胸苷亚磷酸活性中间体。由此,当将固相载体与第一、第二、第三或第四合成池接触时,其中的腺苷、鸟苷、胞苷或胸苷的亚磷酸活性中间体将与固相载体反应,从而将5’-羟基被DMT保护的腺苷酸、鸟苷酸、胞苷酸或胸苷酸连接至固相载体携带的化学基团(例如,端部基团或中间体化合物)的末端。
在某些实施方案中,所涉及的构建单元为4种脱氧核糖核苷酸单体(单碱基单元),以及任意种类(0-16种)的脱氧核糖核苷酸二聚体(双碱基单元)。在此类实施方案中,可提供4种单碱基合成池(其分别用于添加4种脱氧核糖核苷酸单体),以及0-16种双碱基合成池(其用于添加脱氧核糖核苷酸二聚体)。在某些实施方案中,所涉及的构建单元为4种脱氧核糖核苷酸单体(单碱基单元),以及16种脱氧核糖核苷酸二聚体(双碱基单元)。在此类实施方案中,可提供4种单碱基合成池,其分别用于添加4种脱氧核糖核苷酸单体(A、T、C和G),以及16种双碱基合成池,其分别用于添加16种脱氧核糖核苷酸二聚体(AA、AT、AC、AG、TA、TT、TC、TG、CA、CT、CC、CG、GA、GT、GC、GG)。在此类实施方案中,每一个合成池可包含,一种5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的脱氧核糖核苷酸单体或二聚体以及四氮唑活化剂,二者可反应生成3'端被活化、5'-羟基仍然被DMT保护的亚磷酸活性中间体。
在某些实施方案中,所涉及的构建单元为4种脱氧核糖核苷酸单体(单碱基单元),任意种类(0-16种)的脱氧核糖核苷酸二聚体(双碱基单元),以及任意种类(0-64种)的脱氧核糖核苷酸三聚体(三碱基单元)。在此类实施方案中,可提供4种单碱基合成池(其分别用于添加4种脱氧核糖核苷酸单体),0-16种双碱基合成池(其用于添加脱氧核糖核苷酸二聚体),以及0-64种三碱基合成池(其用于添加脱氧核糖核苷酸三聚体)。在某些实施方案中,所涉及的构建单元为4种脱氧核糖核苷酸单体(单碱基单元),16种脱氧核糖核苷酸二聚体(双碱基单元),以及64种脱氧核糖核苷酸三聚体(三碱基单元)。在此类实施方案中,可提供4种单碱基合成池,其分别用于添加4种脱氧核糖核苷酸单体(A、T、C和G),16种双碱基合成池,其分别用于添加16种脱氧核糖核苷酸二聚体(AA、AT、AC、AG、TA、TT、TC、TG、CA、CT、CC、CG、GA、GT、GC、GG),以及64种三碱基合成池,其分别用于添加64种脱氧核糖核苷酸三聚体(AAA、AAT、AAC、AAG、ATA、ATT、ATC、ATG、ACA、ACT、ACC、ACG、AGA、AGT、AGC、AGG、TAA、TAT、TAC、TAG、TTA、TTT、TTC、TTG、TCA、TCT、TCC、TCG、TGA、TGT、TGC、TGG、CAA、CAT、CAC、CAG、CTA、CTT、CTC、CTG、CCA、CCT、CCC、CCG、CGA、CGT、CGC、CGG、GAA、GAT、GAC、GAG、GTA、GTT、GTC、GTG、GCA、GCT、GCC、GCG、GGA、GGT、GGC、GGG)。在此类实施方案中,每一个合成池可包含,一种5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的脱氧核糖核苷酸单体或二聚体或三聚体以及四氮唑活化剂,二者可反应生成3'端被活化、5'-羟基仍然被DMT保护的亚磷酸活性中间体。
在某些实施方案中,每一个合成池可包含,一种5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的脱氧核糖核苷酸单体或低聚体(例如,0.1-0.5M脱氧核糖核苷酸单体或低聚体的乙腈溶液)以及四氮唑活化剂(例如,0.5-1M四唑的乙腈溶液),二者可反应生成3'端被活化、5'-羟基仍然被DMT保护的亚磷酸活性中间体。
在某些实施方案中,所涉及的构建单元为4种核糖核苷酸单体(单碱基单元)。在此类实施方案中,可提供四种合成池(第一、第二、第三、第四合成池),其分别用于添加核糖核苷酸A、U、C和G。例如,第一合成池可包含,5'-羟基被DMT保护、2'-羟基被TBDMS保护、3’-羟基被亚磷酰胺保护的腺苷酸以及四氮唑活化剂,二者可反应生成3'端被活化、5'-羟基被DMT保护、2'-羟基被TBDMS保护的腺苷亚磷酸活性中间体;第二合成池可包含,5’-羟基被DMT保护、2'-羟基被TBDMS保护、3’-羟基被亚磷酰胺保护的鸟苷酸以及四氮唑活化剂,二者可反应生成3'端被活化、5'-羟基被DMT保护、2'-羟基被TBDMS保护的鸟苷亚磷酸活性中间体;第三合成池可包含,5’-羟基被DMT保护、2'-羟基被TBDMS保护、3’-羟基被亚磷酰胺保护的胞苷酸以及四氮唑活化剂,二者可反应生成3'端被活化、5'-羟基被DMT保护、2'-羟基被TBDMS保护的胞苷亚磷酸活性中间体;且,第四合成池可包含,5’-羟基被DMT保护、2'-羟基被TBDMS保护、3’-羟基被亚磷酰胺保护的尿苷酸以及四氮唑活化剂,二者可反应生成3'端被活化、5'-羟基被DMT保护、2'-羟基被TBDMS保护的尿苷亚磷酸活性中间体。由此,当将固相载体与第一、第二、第三或第四合成池接触时,其中的腺苷、鸟苷、胞苷或尿苷的亚磷酸活性中间体将与固相载体反应,从而将5’-羟基被DMT保护、2'-羟基被TBDMS保护的腺苷酸、鸟苷酸、胞苷酸或尿苷酸连接至固相载体携带的化学基团(例如,端部基团或中间体化合物)的末端。
在某些实施方案中,所涉及的构建单元为4种核糖核苷酸单体(单碱基单元),以及任意种类(0-16种)的核糖核苷酸二聚体(双碱基单元)。在此类实施方案中,可提供4种单碱基合成池(其分别用于添加4种核糖核苷酸单体),以及0-16种双碱基合成池(其用于添加核糖核苷酸二聚体)。在某些实施方案中,所涉及的构建单元为4种核糖核苷酸单体(单碱基单元),以及16种核糖核苷酸二聚体(双碱基单元)。在此类实施方案中,可提供4种单碱基合成池,其分别用于添加4种核糖核苷酸单体(A、U、C和G),以及16种双碱基合成池,其分别用于添加16种核糖核苷酸二聚体(AA、AU、AC、AG、UA、UU、UC、UG、CA、CU、CC、CG、GA、GU、GC、GG)。在此类实施方案中,每一个合成池可包含,一种5’-羟基被DMU保护、2'-羟基被TBDMS保护、3’-羟基被亚磷酰胺保护的核糖核苷酸单体或二聚体以及四氮唑活化剂,二者可反应生成3'端被活化、5'-羟基被DMU保护、2'-羟基被TBDMS保护的亚磷酸活性中间体。
在某些实施方案中,所涉及的构建单元为4种核糖核苷酸单体(单碱基单元),任意种类(0-16种)的核糖核苷酸二聚体(双碱基单元),以及任意种类(0-64种)的核糖核苷酸三聚体(三碱基单元)。在此类实施方案中,可提供4种单碱基合成池(其分别用于添加4种核糖核苷酸单体),0-16种双碱基合成池(其用于添加核糖核苷酸二聚体),以及0-64种三碱基合成池(其用于添加核糖核苷酸三聚体)。在某些实施方案中,所涉及的构建单元为4种核糖核苷酸单体(单碱基单元),16种核糖核苷酸二聚体(双碱基单元),以及64种核糖核苷酸三聚体(三碱基单元)。在此类实施方案中,可提供4种单碱基合成池,其分别用于添加4种核糖核苷酸单体(A、U、C和G),16种双碱基合成池,其分别用于添加16种核糖核苷酸二聚体(AA、AU、AC、AG、UA、UU、UC、UG、CA、CU、CC、CG、GA、GU、GC、GG),以及64种三碱基合成池,其分别用于添加64种核糖核苷酸三聚体(AAA、AAU、AAC、AAG、AUA、AUU、AUC、AUG、ACA、ACU、ACC、ACG、AGA、AGU、AGC、AGG、UAA、UAU、UAC、UAG、UUA、UUU、UUC、UUG、UCA、UCU、UCC、UCG、UGA、UGU、UGC、UGG、CAA、CAU、CAC、CAG、CUA、CUU、CUC、CUG、CCA、CCU、CCC、CCG、CGA、CGU、CGC、CGG、GAA、GAU、GAC、GAG、GUA、GUU、GUC、GUG、GCA、GCU、GCC、GCG、GGA、GGU、GGC、GGG)。在此类实施方案中,每一个合成池可包含,一种5’-羟基被DMT保护、2'-羟基被TBDMS保护、3’-羟基被亚磷酰胺保护的核糖核苷酸单体或二聚体或三聚体以及四氮唑活化剂,二者可反应生成3'端被活化、5'-羟基被DMT保护、2'-羟基被TBDMS保护的亚磷酸活性中间体。
在某些实施方案中,每一个合成池可包含,一种5’-羟基被DMT保护、2'-羟基被TBDMS保护、3’-羟基被亚磷酰胺保护的核糖核苷酸单体或低聚体(例如,0.1-0.5M核糖核苷酸单体或二聚体或三聚体的乙腈溶液)以及四氮唑活化剂(例如,0.5-1M四唑的乙腈溶液),二者可反应生成3'端被活化、5'-羟基被DMT保护、2'-羟基被TBDMS保护的亚磷酸活性中间体。
固相载体
如本文所使用的,术语“固相载体”意指目标核酸分子可以与其附接的任何不可溶的基底或基质。此类固相载体可以由任何期望的材料制成,只要所述材料应不会不利地影响反应试剂的活性或者与反应试剂发生不期望的副反应。优选地,所述固相载体由惰性材料制成。在某些优选的实施方案中,所述固相载体由选自下列的材料制成:玻璃、陶瓷、金属(例如金颗粒)、硅片(硅晶)、聚四氟乙烯、乳胶、葡聚糖、聚苯乙烯(修饰或未经修饰的,例如聚乙二醇包覆的聚苯乙烯)、聚丙烯、聚酰胺(例如聚丙烯酰胺,聚二甲基丙烯酰胺)、聚乙二醇,或其任何组合。此类固相载体可以具有任何期望的形状。例如,固相载体可以是片状,棱柱体形(例如长方体)、球形、锥体形、圆柱体形、不规则形状、或其任何组合等。在某些实施方案中,所述固相载体是芯片。
在某些实施方案中,固相载体表面要经过硅烷化处理,以进行表面氨基修饰。因此,在某些实施方案中,所述固相载体表面是硅烷化的。对固相载体表面进行硅烷化处理的方法是本领域技术人员熟知的,例如可采用气相沉积法(CVD)、溶液浸泡、简易负压气相沉积法等一种或多种处理,其中硅烷化试剂为一端为烷氧基硅基团,一端为氨基的试剂,可选自APTMS、APTES等,优选的,采用APTMS为硅烷化试剂。
在某些实施方案中,所述固相载体是50%硅烷化芯片。在某些实施方案中,所述50%硅烷化芯片通过溶液浸泡法并使用经硅烷化试剂(APTMS:PTMS=1:1)制备。本领域技术人员理解,“50%硅烷化芯片”是指,该硅烷化芯片使用浓度为50%的硅烷化试剂制备获得,通常而言,修饰后的芯片表面大概有50%的面积进行了硅烷化。
在某些实施方案中,所述固相载体的体积为2*2*0.45mm。
在某些情况下,所述固相载体在使用前是经保护的(也即,所述固相载体上的基团是经保护的)。因此,在某些实施方案中,在步骤(1)之前,对固相载体进行预处理(例如,以去除固相载体上携带的保护基团)。在某些实施方案中,在步骤(1)之前,将固相载体浸泡入含有脱保护试剂的脱保护池,并与其中的脱保护试剂反应;然后,将固相载体浸泡入含有洗涤剂的洗涤池进行清洗。
如本文所使用的,固相载体上携带有化学基团,其能够与合成池中的反应试剂发生反应(偶联反应或连接反应),从而将一个构建单元连接至所述化学基团的末端。在某些优选的实施方案中,此类化学基团可以为端部基团或者中间体化合物。
如本文所使用的,术语“端部基团”是指,能够起始合成反应的反应性基团。此类反应性基团包括但不限于酯基、脂基、硫酯基、邻硝基苄基、香豆素基团、羟基、巯基、巯醚基、羧基、醛基、氨基、胺基、酰胺基、烯基、炔基、或其任何组合。例如,当目标化合物为核酸时,所述端部基团可以为游离的羟基或巯基,或者,也可以为被保护基团(例如DMT)保护的羟基或巯基,该保护基团可以在脱保护试剂中脱除,暴露出可用于连接核苷酸的活性基团。
在某些实施方案中,可以通过下述方法获得本发明的携带有化学基团(端部基团)的固相载体:提供氨基化修饰的固相载体(例如,对芯片进行硅烷化处理,以进行氨基化修饰);对氨基化修饰的固相载体连接Linker分子,该Linker分子始端为带有可与氨基反应的官能团,末端为带有可脱除保护基的羟基、巯基等可与核苷酸单体反应的活性基团,从而获得表面携带有端部基团的固相载体。
在某些实施方案中,用酸、碱、光或热等处理时可将保护基去除以暴露出可反应的活性基团。在某些实施方案中,Linker分子中间可以是酯基、脂基、硫酯基、邻硝基苄基、香豆素基团、羟基、巯基、巯醚基、羧基、醛基、氨基、胺基、酰胺基、烯基、炔基中任意一种或多种官能团的化合物。在某些实施方案中,Linker的始端官能团为羧基,末端为三苯甲基保护的羟基,例如4,4’-二甲氧基三苯甲基,可以用二氯乙酸、三氯乙酸或三氟乙酸的有机溶剂(如二氯甲烷,乙腈)的溶液处理时将其去除。在某些实施方案中,Linker分子为UniversalLinker。
如本申请中所使用的,术语“中间体化合物”是相对于待使用所述固相载体合成的目标化合物而言的。通常而言,中间体化合物含有比目标化合物更少的构建单元。例如,当目标化合物含有n个构建单元时,中间体化合物可以含有1个至(n-1)个构建单元。例如,当目标化合物为含有500个构建单元(核苷酸)的核酸时,中间体化合物可以为含有1-499个构建单元(核苷酸)的核酸。
编码
在本申请中,固相载体携带有编码。应当理解,此处的编码意指,任何可以用于区分和鉴别固相载体身份的特征。此类特征包括但不限于,数字,符号,图形,识别码(例如条形码,二维码),光信号(例如荧光,化学发光,拉曼光谱),量子点,磁信号,电信号,或其任何组合。
在某些实施方案中,所述固相载体携带的编码通过单一特征来确定。例如,所述固相载体携带的编码可以为数字(例如二进制,十进制或十六进制数字),识别码(例如条形码,二维码),光信号,或射频识别(Radio Frequency Identification,RFID)标签。在某些实施方案中,所述固相载体携带的编码为识别码,例如条形码或二维码。
在某些实施方案中,所述固相载体携带的编码为至少两个或更多个特征的组合。例如,所述固相载体携带的编码可以为识别码(例如条形码或二维码)与电信号的组合,识别码(例如条形码或二维码)和光信号(例如荧光)的组合,识别码(例如条形码或二维码)与数字的组合,识别码(例如条形码或二维码)与RFID标签的组合,RFID标签与电信号的组合,RFID标签和光信号(例如荧光)的组合,RFID标签与数字的组合,数字和光信号(例如荧光)的组合,或数字、图形和识别码(例如条形码或二维码)的组合等等。
编码的一个重要功能是用于区分和鉴别固相载体。如本文中所使用的,表述“每一个固相载体与其所携带的编码具有唯一对应关系”意指,每一个固相载体对应于一个独特的编码。换言之,各个固相载体所携带的编码是彼此不同的。由于每一个固相载体与其所携带的编码具有唯一对应关系,因此,可通过识别所述编码,方便地区分多个固相载体,或者从多个固相载体中快速、方便地寻找和鉴别感兴趣的固相载体。进一步,当一种固相载体用于合成一种目标核酸分子时,通过编码,可以快速、方便地寻找和鉴别目标固相载体,以及相应地,如果尚未完成合成,确定待使用该固相载体合成的目标核酸分子的序列,或者如果已经完成合成,确定该固相载体上携带的目标核酸分子的序列。
在本发明的方法中,可使用各种方式来识别固相载体上携带的编码。在某些实施方案中,使用检测器(例如,能够识别数字,符号,图形,识别码(例如条形码,二维码),RFID标签,光信号(例如荧光,化学发光,拉曼光谱),量子点,磁信号,电信号,或其任何组合的检测器)来检测固相载体上携带的编码,并使用处理器来分析所述检测器检测到的信号,从而识别固相载体的身份(编码)。用于检测/识别数字,符号,图形,条形码,二维码,RFID标签,荧光,发光,量子点,拉曼光谱等各种方法和仪器是本领域技术人员熟知的,包括但不限于光信号识别器、磁信号识别器、电信号识别器、图像识别器、或其任何组合。例如,此类仪器可以为,二维条码检测仪、条形码检测仪、或RFID标签阅读器等。
进一步,通过使用编码,可对至少两个或更多个固相载体进行识别和区分,由此,可同时使用至少两个或更多个固相载体来实施本发明的方法;并且,在本发明方法实施过程中,针对每一个固相载体,可根据待合成的目标核酸分子的序列,移动所述固相载体,使之按照所述序列中构建单元的排列顺序,与对应合成池进行接触和反应,从而按照所述排列顺序,将对应种类的构建单元逐个添加/连接至固相载体的化学基团上,从而在所述固相载体上合成和产生期望的目标核酸分子。因此,通过使用各自具有独特编码的至少两个或更多个固相载体,本发明的方法可同时合成至少两种或更多种目标核酸分子。因此,在某些实施方案中,所述方法使用至少两个或更多个所述固相载体,用于同时合成至少两种或更多种目标核酸分子。
在某些实施方案中,所述方法用于同时合成2-5种,5-10种,10-20种,20-50种,50-100种,100-200种,200-500种,500-1000种,1000-2000种,2000-5000种,5000-10000种,104-105种,105-106种,106-107种,或更多种核酸分子。
各种池及反应
如本文中所使用的,仅仅出于描述方便和清楚的目的,通过所实现的功能来区分不同步骤可能涉及的各种池(合成池,洗涤池,盖帽池,氧化池,脱保护池等)。然而,易于理解,各种池(合成池,洗涤池,盖帽池,氧化池,脱保护池等)均意指能够容纳试剂的任何装置或容器(包括但不限于槽、渠、孔、试管、杯、皿等),其不限于任何特定的形状、尺寸、和材料。例如,各种池(合成池,洗涤池,盖帽池,氧化池,脱保护池等)可以具有任何期望的形状,例如方形、球形、锥形、圆柱体形、不规则形状、或其任何组合等。各种池(合成池,洗涤池,盖帽池,氧化池,脱保护池等)可以具有任何期望的尺寸(体积),例如其尺寸(体积)可以根据所需要容纳的反应试剂的体积而进行确定和调整。在某些优选的实施方案中,各种池(合成池,洗涤池,盖帽池,氧化池,脱保护池等)能够容纳至少1μL、至少2μL、至少5μL、至少10μL、至少20μL、至少50μL、至少100μL、至少200μL、至少500μL、至少1mL、至少2mL、至少5mL、至少10mL、至少20mL、至少50mL、至少100mL、至少200mL、至少500mL、至少1L或更多的溶液。在某些实施方案中,各种池能够容纳100-500μL(例如100-400μL,100-300μL)的溶液。各种池(合成池,洗涤池,盖帽池,氧化池,脱保护池等)可以由任何合适的材料制成,只要所述材料应不会不利地影响反应试剂的活性。在某些实施方案中,各种池(合成池,洗涤池,盖帽池,氧化池,脱保护池等)由惰性材料制成,所述惰性材料至少是对于所述池所包含的试剂来说是化学惰性的,从而不会不利地影响试剂的活性。在某些优选的实施方案中,各种池(合成池,洗涤池,盖帽池,氧化池,脱保护池等)可由玻璃、金属诸如不锈钢、聚合材料如塑料等制成。在某些优选的实施方案中,各种池(合成池,洗涤池,盖帽池,氧化池,脱保护池等)是一端开口的。在此类实施方案中,例如可通过所述开口,将固相载体浸泡至池中,以便固相载体上携带的化学基团与池中的反应试剂进行反应。
在本发明的方法中,每一个合成池包含一种所述构建单元和以及四唑。在某些实施方案中,所述合成池包含0.1-0.5M的构建单元的乙腈溶液以及0.5-1M的四唑的乙腈溶液。在某些实施方案中,所述构建单元的乙腈溶液和四唑的乙腈溶液的体积比为1:1-1:3,优选为2:3。在本发明方法的任何偶联步骤中,将经过分选的固相载体与对应于确定种类的构建单元的合成池接触并反应,进行一次或多次(例如,1次,2次,3次),从而将一个所述种类的构建单元连接至所述固相载体上携带的化学基团。在某些情况下,将分选的固相载体与合成池接触并反应一次或多次是有利的,这能提高构建单元(核糖核苷酸单体或二聚体或三聚体)与化学基团的偶联/连接效率,使固相载体上尽可能多的化学基团均增加(连接)一个构建单元。超过一次的接触/反应不会导致多个构建单元同时连接至化学基团上,这是因为所使用的构建单元的5’-羟基被DMT保护,不能继续进行额外的偶联/连接反应。在某些实施方案中,将固相载体与合成池接触2次。在某些实施方案中,将固相载体与洗涤池接触2次,每次持续60s。
在本发明的方法中,洗涤池包含洗涤剂,所述洗涤剂是已知用于在核酸合成反应中洗涤固相载体的各种洗涤剂。在某些实施方案中,所述洗涤剂可以为乙腈。易于理解,各个洗涤步骤各自独立地可以共用相同的洗涤池,也可以使用不同的洗涤池。在某些实施方案中,各个洗涤步骤共用相同的洗涤池。在任何步骤的洗涤步骤中,将固相载体与洗涤池接触一次或多次(例如,1次,2次,3次)。在某些实施方案中,将固相载体与洗涤池接触3次。在某些实施方案中,将固相载体与洗涤池接触3次,每次持续10s。
在本发明的方法中,盖帽池包含盖帽试剂,所述盖帽试剂是已知用于实施核酸合成反应中盖帽步骤的任何试剂。在某些实施方案中,所述盖帽试剂可以包含,乙酸酐/吡啶/四氢呋喃(乙酸酐/吡啶/四氢呋喃的体积比为1:1:1至1:5:10,例如1:1:1至1:1:10,优选为1:1:8),以及N-甲基咪唑的乙腈溶液,(N-甲基咪唑与乙腈的质量体积比为10%-20%w/v,,例如15%-20%w/v,优选为17%-18%w/v,例如17.6%w/v)。
在本发明方法的任何盖帽步骤中,将固相载体与盖帽池接触一次或多次(例如,1次,2次,3次)。在某些实施方案中,将固相载体与盖帽池接触2次。在某些实施方案中,将固相载体与盖帽池接触2次,每次持续20s。在本发明的方法中,在固相载体上进行预定核酸序列合成之前,先进行盖帽处理,以封闭固相载体表面端部基团不完整的区域,使其无法偶联构建单元,从而提高合成效率。
在本发明的方法中,氧化池包含氧化试剂,所述氧化试剂是已知用于核酸合成反应中将亚磷酸酯键氧化为磷酸酯键的任何试剂。在某些实施方案中,所述氧化试剂包含碘溶液,例如碘在水/吡啶/四氢呋喃(水、吡啶和四氢呋喃的体积比为2:10:88至5:25:70,其中,三者体积分数之和为100%,优选地,其体积比为2:20:78)中的溶液(碘浓度为0.01-0.1M,例如0.01-0.05M,优选为0.01M)。
在本发明方法的任何氧化步骤中,将固相载体与氧化池接触一次或多次(例如,1次,2次,3次)。在某些实施方案中,将固相载体与氧化池接触2次。在某些实施方案中,将固相载体与氧化池接触2次,每次持续20s。
在本发明的方法中,脱保护池包含脱保护试剂,所述脱保护试剂是已知用于核酸合成反应中去除化学基团的5’-羟基的保护基团DMT(二甲氧基三苯甲基)的任何试剂。在某些实施方案中,所述脱保护试剂包含三氯乙酸的二氯甲烷溶液(三氯乙酸与二氯甲烷的质量体积比为2%至10%w/v,例如2%-5%w/v;优选地为3%w/v)。在本发明方法的任何脱保护步骤中,将固相载体与脱保护池接触一次或多次(例如,1次,2次,3次)。在某些实施方案中,在步骤(6)中,将固相载体与脱保护池接触2次。在某些实施方案中,在步骤(6)中,将固相载体与脱保护池接触2次,每次持续15s。
识别、分选及反应
在本申请中,待合成的目标核酸分子包含至少两个或更多个构建单元,并且,可通过逐个装配构建单元来合成所述目标核酸分子。如上文所述,每进行一次步骤(4)-(8),即在固相载体携带的化学基团上添加/连接一个构建单元。由此,本发明的方法通过重复进行步骤(4)-(8),将构建单元按照一定的顺序(即,待合成的目标核酸分子的序列)逐个添加/连接至固相载体携带的化学基团上,从而最终合成/产生目标核酸。
在每一次循环重复中,首先需要识别每一个固相载体携带的编码,并利用编码与固相载体的唯一对应关系,确定每一个固相载体的身份以及待使用该固相载体合成的目标核酸分子的序列。进一步,由于每一次循环重复只添加一个构建单元,因此,根据已经进行的循环重复次数以及这些循环重复添加的构建单元的种类,以及目标核酸分子序列,就可以确定每一个固相载体在当前循环重复中需要添加/连接的构建单元的种类。在此基础上,可以对每一个固相载体进行分选,使每一个固相载体与对应于所确定种类的构建单元的合成池接触(例如浸泡)并进行反应,从而在每一个固相载体上添加/连接一个正确种类的构建单元。通过n次循环重复,所述固相载体将能够按照所述目标核酸分子中n个构建单元的排列顺序,逐次接触(例如浸泡入)分别与所述n个构建单元对应的合成池,并与合成池中的反应试剂反应,从而,将n个构建单元逐一装配连接至固相载体上,产生所述目标核酸分子。图3-4分别示意性描述了本发明方法用于合成DNA及RNA的流程。
在某些实施方案中,当将本申请的方法的合成顺序是从3’端至5’端合成。例如,当待合成的目标核酸为包含序列TAGCTA(从5’端至3’端)的DNA时,通过循环重复进行步骤(4)-(8)六次,其中,按照循环重复的次序,固相载体依次接触(例如浸泡入)用于添加核苷酸A的合成池(第1个循环),用于添加核苷酸T的合成池(第2个循环),用于添加核苷酸C的合成池(第3个循环),用于添加核苷酸G的合成池(第4个循环),用于添加核苷酸A的合成池(第5个循环),以及用于添加核苷酸T的合成池(第6个循环),从而,将核苷酸A、T、C、G、A、T逐一装配连接至固相载体上,产生序列为5’-TAGCTA-3’的DNA。
在某些实施方案中,本发明的方法用于同时合成至少2种,至少5种,至少10种,至少20种,至少50种,至少100种,至少200种,至少500种,至少1000种,至少2000种,至少5000种,至少10000种,至少105种,至少106种,至少107种,或更多种目标核酸。相应地,在此类实施方案中,可使用至少2种,至少5种,至少10种,至少20种,至少50种,至少100种,至少200种,至少500种,至少1000种,至少2000种,至少5000种,至少10000种,至少105种,至少106种,至少107种,或更多种固相载体,并且每一种固相载体各自携带一个独特的编码。
在某些优选的实施方案中,本发明的方法用于同时合成2-5种,5-10种,10-20种,20-50种,50-100种,100-200种,200-500种,500-1000种,1000-2000种,2000-5000种,5000-10000种,104-105种,105-106种,106-107种,或更多种目标核酸。相应地,在此类实施方案中,可使用2-5种,5-10种,10-20种,20-50种,50-100种,100-200种,200-500种,500-1000种,1000-2000种,2000-5000种,5000-10000种,104-105种,105-106种,106-107种,或更多种固相载体,并且每一种固相载体各自携带一个独特的编码。
多种固相载体以及独特编码的组合使用,使得能够在接触合成池之前,对多种固相载体进行识别和分选,例如将即将接触相同合成池/相同反应试剂(或者,即将添加相同构建单元)的多种固相载体组合在一起,然后再将它们与相同的合成池接触。
因此,在某些优选的实施方案中,在每一次移动固相载体之前,对每一个固相载体进行识别和分选,即将与相同试剂接触的固相载体组合在一起,然后再进行移动。
例如,当待合成的至少两种或更多种目标核酸均为DNA时,可将所有固相载体组合在一起,进行清洗步骤(即,与含有洗涤剂的洗涤池接触),盖帽步骤(即,与含有盖帽试剂的盖帽池接触),氧化步骤(即,与含有氧化试剂的氧化池接触),脱保护步骤(即,与含有脱保护试剂的脱保护池接触),或其任何组合。此外,在合成步骤中,可对每一个固相载体进行识别和分选,即将接触相同合成池/相同反应试剂(或者,即将添加相同脱氧核糖核苷酸)的固相载体组合在一起,然后再进行连接/聚合反应。例如,可将即将添加脱氧核糖核苷酸A的所有固相载体组合在一起,然后一起移动并接触(例如浸泡入)用于添加脱氧核糖核苷酸A的第一合成池。类似地,可将即将添加脱氧核糖核苷酸T的所有固相载体组合在一起,然后一起移动并接触(例如浸泡入)用于添加脱氧核糖核苷酸T的第二合成池;可将即将添加脱氧核糖核苷酸C的所有固相载体组合在一起,然后一起移动并接触(例如浸泡入)用于添加脱氧核糖核苷酸C的第三合成池;和/或,可将即将添加脱氧核糖核苷酸G的所有固相载体组合在一起,然后一起移动并接触(例如浸泡入)用于添加脱氧核糖核苷酸G的第四合成池。
在某些实施方案中,在每一次移动之前,对每一个固相载体进行识别、分选和组合是特别有利的,这可以减少移动装置控制多个固相载体移动的复杂性,提高移动效率,简化移动路线和流程,并有效提高反应的通量和试剂的利用率。
额外步骤
在某些实施方案中,本发明的方法还包括下述步骤:(10)对固相载体进行氨解反应,然后收集、纯化从固相载体分离的DNA分子。
在某些实施方案中,在步骤(10)中,在进行氨解反应之前,先利用编码对固相载体进行分选,以获得具有期望核酸分子的固相载体;或者,将所有固相载体混合在一起,并进行氨解反应,从而收集获得含有至少两种核酸分子的文库。
在某些实施方案中,在所述方法的步骤(2)中,还提供氨解池,其包含用于进行氨解反应的试剂。在某些实施方案中,步骤(10)包括以下步骤:将所有固相载体浸泡入氨解池,并与其中的氨解反应;或者,识别每一个固相载体携带的编码,并根据编码与固相载体的唯一对应关系,分选具有期望核酸分子的固相载体,然后将分选出的固相载体浸泡入氨解池,并与其中的氨解反应。
在某些实施方案中,用于进行氨解反应的试剂可以选自氨水,氨气,甲胺,或其任何组合。在某些优选的实施方案中,氨解反应可以在选自下列的温度下进行:室温到120℃,例如,室温到60℃,60-90℃,90-120℃。在某些优选的实施方案中,氨解反应可以进行0.5h-48h,例如0.5-2h,2-5h,5-10h,10-18h,18-24h。
在某些优选的实施方案中,在氨解反应后,对目标DNA进行分离和纯化,例如,可使用MOP,PAGE,PAGE Plus,HPLC或其任何组合对目标DNA进行分离和纯化。
在某些优选的实施方案中,在氨解反应后,对目标RNA进行分离和纯化,例如,可使用PAGE,PAGE Plus,HPLC或其任何组合对目标RNA进行分离和纯化。在某些优选的实施方案中,分离和纯化在无RNase的环境中进行。例如,在某些优选的实施方案中,用于分离和纯化的所有试剂和设备都不含RNase(即,RNase-free),避免RNase污染。
设备及基于设备的合成方法
在另一方面,本申请提供了一种用于合成核酸分子的设备,其包括:
-编码识别器,其能够识别固相载体上携带的编码,并产生信号;
-固相载体分选器,其能够对固相载体进行分选;
-驱动固相载体移动的驱动装置;
-中央处理器,其能够接收编码识别器识别编码所产生的信号,并发出指令控制固相载体分选器分选固相载体和/或控制驱动装置移动固相载体;优选地,所述中央处理器集成了控制程序,所述控制程序能够根据目标核酸分子的预先确定的序列,确定固相载体的分选方案和移动方案;
-存储器,其用于存储待合成的目标核酸分子的序列,固相载体与编码的对应关系,待合成的目标核酸分子与固相载体的对应关系,和/或,每一个固相载体已经历的反应;
-一个或多个合成池,所述合成池各自独立地用于容纳反应试剂;
-至少一个洗涤池,其用于容纳洗涤剂;
-至少一个盖帽池,其用于容纳盖帽试剂;
-至少一个氧化池,其用于容纳氧化试剂;
-至少一个脱保护池,其用于容纳脱保护试剂;
任选地,所述设备还包括:
-至少一个固相载体,所述固相载体各自独立地携带能够被编码识别器识别的编码,并且,每一个固相载体与其所携带的编码具有唯一对应关系.
以上所述合成池、洗涤池、盖帽池、氧化池、脱保护池和/或固相载体如第一方面所定义。
本发明第一方面所述的方法可以通过上述设备完成。
因此,在某些实施方案中,如下进行所述方法的步骤(4)-(8):
(3)中央处理器向驱动装置发出指令:移动所有固相载体,使之浸泡入盖帽池,并进行盖帽反应;然后,移动所有固相载体,使之浸泡入洗涤池,并进行洗涤;
(4)中央处理器向驱动装置发出指令:移动所有固相载体,使之浸泡入脱保护池,并进行脱保护反应;然后,移动所有固相载体,使之浸泡入洗涤池,并进行洗涤;
(5)中央处理器向编码识别器发出指令:识别每一个固相载体携带的编码,并向中央处理器返回识别信号;中央处理器根据返回的识别信号识别编码,并根据固相载体与编码的对应关系、待合成的核酸分子与固相载体的对应关系和每一个固相载体已经历的反应,确定每一个固相载体待合成的核酸的序列,以及每一个固相载体待连接的构建单元的种类;
(6)中央处理器根据前一步骤确定的待连接的构建单元的种类,向固相载体分选器和驱动装置发出指令:分选每一个固相载体,并移动每一个固相载体,使每一个固相载体浸泡入对应于所述种类的构建单元的合成池并进行偶联反应;然后,中央处理器向驱动装置发出指令:移动所有固相载体,使之浸泡入洗涤池,并进行洗涤;
(7)中央处理器向驱动装置发出指令:移动所有固相载体,使之浸泡入盖帽池,并进行盖帽反应;然后,移动所有固相载体,使之浸泡入洗涤池,并进行洗涤;
(8)中央处理器向驱动装置发出指令:移动所有固相载体,使之浸泡入氧化池,并进行氧化反应;然后,移动所有固相载体,使之浸泡入洗涤池,并进行洗涤;
(9)任选地,重复步骤(3)-(8)一次或多次。
在某些实施方案中,所述方法还包括:
(10)中央处理器向驱动装置发出指令:移动所有固相载体,使之浸泡入氨解池,并进行氨解反应;或者,
中央处理器向编码识别器发出指令:识别每一个固相载体携带的编码,并向中央处理器返回识别信号;中央处理器根据返回的识别信号识别编码,并根据固相载体与编码的对应关系,确定每一个固相载体上的核酸分子的序列;
中央处理器根据前一步骤确定的每一个固相载体上的核酸分子的序列,向固相载体分选器和驱动装置发出指令:分选具有期望核酸分子的固相载体,并移动所述固相载体,使之浸泡入氨解池并进行氨解反应。
有益效果
本申请发明人开发了一种基于识别-分选策略的合成核酸分子的方法。在本发明的方法中,利用编码-识别-分选技术,对每一个的固相载体进行编码,该编码对应于一种具有预先设定序列的目标核酸分子,并且该编码在后续的合成过程中可以高效率地被识别。由此,在合成过程中,可以利用编码来精确分选每个固相载体,控制每个固相载体的移动方案和反应流程。通过同时对多个的固相载体进行精确控制,本发明的方法可以实现多种目标核酸的高通量化学合成、且错误率低。
进一步,利用编码-识别-分选技术,本发明的方法可以将需要进行相同步骤的固相载体集中到同一个池中(例如,将需要进行同一合成反应步骤的固相载体集中到同一合成池中;或者,将需要进行洗涤步骤的所有固相载体集中到同一洗涤池中)。由此,在保证高通量合成的同时,本发明的方法可以提高每一个池中的试剂的使用效率,节省试剂,降低生产成本。
本申请提出的基于识别-分选策略的合成方法为商业化核酸合成提供了一条全新途径,且具有广阔的应用市场。
附图说明
图1示出了4种用于DNA合成的亚磷酰胺单体的非限制性实例。其中,Bz为本甲酰基,ib为异丁酰基。
图2A-2C示出了16种用于DNA合成的亚磷酰胺二聚体的非限制性实例。其中,Bz为本甲酰基,ib为异丁酰基。
图3示意性描述了本发明方法用于合成DNA的流程。
图4示意性描述了本发明方法用于合成RNA的流程。
图5显示了T5标样的HPLC图谱。
图6显示了T10标样的HPLC图谱。
图7显示了实验1中合成T5的HPLC图谱。
图8显示了实验1中合成T10的HPLC图谱。
图9显示了实验2中合成T5的HPLC图谱。
图10显示了实验2中合成T10的HPLC图谱。
图11显示了实验6中合成T5的HPLC图谱。
图12显示了实验9中合成T10的HPLC图谱。
图13显示了实验10中合成T10的HPLC图谱。
图14显示了实验11中合成T10的HPLC图谱。
图15显示了实验10中合成T5的HPLC图谱。
图16显示了实验11中合成T5的HPLC图谱。
图17显示了实施例4中合成产物的凝胶电泳图。其中,Ctrl:标准合成引物(由商业合成仪Dr.Oligo 192合成)对照;泳道1:氨解第一组/50%硅烷化芯片;泳道2:氨解第二组/50%硅烷化芯片mix;泳道3:氨解第一组/网格芯片;4:氨解第二组/网格芯片。
具体实施方式
现参照下列意在举例说明本发明(而非限定本发明)的实施例来描述本发明。
除非特别指明,否则基本上按照本领域内熟知的以及在各种参考文献中描述的常规方法进行实施例中描述的实验和方法。另外,实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。本领域技术人员知晓,实施例以举例方式描述本发明,且不意欲限制本发明所要求保护的范围。本文中提及的全部公开案和其他参考资料以其全文通过引用合并入本文。
以下实施例涉及的主要试剂、耗材来源如下:
合成固相载体:常规芯片和网格芯片,2*2*0.45mm,ACN(乙腈)(北京迪纳兴科)、去保护试剂:3%TCA Deblock(北京迪纳兴科)、活化剂:0.25M Activator(北京迪纳兴科)、亚磷酰胺单体A、T、C、G(Sigma Aldrich)、氧化剂:0.05M Oxidizing(北京迪纳兴科)、CAP A:乙酸酐/吡啶/四氢呋喃1/1/8(北京迪纳兴科)、CAP B:17.6%w/v氮-甲基咪唑/乙腈(北京迪纳兴科)、氨水(国药)、T5:TTTTT,T10:TTTTTTTTTT标样(北京六合)、TA克隆试剂盒:pMDTM19-T(TaKaRa)。
T5、T10标样的HPLC图谱分别如图5-6所示。
实施例1:T5及T10合成及检测
准备合成单体、反应试剂及反应池
1、提供8种池:
-4种合成池(第一、第二、第三、第四合成池),其分别用于添加脱氧核糖核苷酸A、T、C和G;其中,
第一合成池包含,45μL 5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的腺苷酸(0.1M;溶剂为乙腈)以及70μL四唑(0.5M;溶剂为乙腈);
第二合成池包含,45μL 5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的鸟苷酸(0.1M;溶剂为乙腈)以及70μL四唑(0.5M;溶剂为乙腈);
第三合成池包含,45μL 5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的胞苷酸(0.1M;溶剂为乙腈)以及70μL四唑(0.5M;溶剂为乙腈);
第四合成池包含,45μL 5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的胸苷酸(0.1M;溶剂为乙腈)以及70μL四唑(0.5M;溶剂为乙腈);
-脱保护池,其包含150μL 10%三氯乙酸/二氯甲烷作为脱保护试剂;
-盖帽池,其包含75μL试剂A(乙酸酐/吡啶/四氢呋喃1/1/8)和75μL试剂B(17.6%w/v氮-甲基咪唑/乙腈)作为盖帽试剂;
-氧化池,其包含150μL 0.01M碘液(水/吡啶/四氢呋喃2/20/78)氧化剂;
-洗涤池,其包含250μL乙腈作为清洗液。
以上反应池由PEEK(聚醚醚酮)制备,为15mL的圆柱体。
2、准备固相载体
以CVD硅烷化芯片(硅烷化试剂为APTMS,CVD法制备,规格为2*2*0.45mm)为固相载体,每个芯片正反面均携带有特异性的二维码作为编码信号,并且是经化学修饰的,可用于起始DNA合成反应。
方法1.1
(1)将所有芯片移动并浸入脱保护池,其包含200μL去保护试剂TCA,共浸入两次,每次持续反应15s;
(2)将所有芯片移动并浸入洗涤池,其包含乙腈,共浸入3次,每次持续10s;
(3)将所有芯片移动并浸入第四合成池,其包含45μL亚磷酰胺单体T和70μL活化剂,共浸入3次,每次持续60s;
(4)将所有芯片移动并浸入洗涤池,共浸入1次,持续10s;
(5)将所有芯片移动并浸入盖帽池,其包含85μL试剂A和85μL试剂B组成的盖帽试剂,共浸入1次,每次持续20s;
(6)将所有芯片移动并浸入清洗池,共浸入1次;;
(7)将所有芯片移动并浸入氧化池,其包含175μL氧化剂,共浸入1次,每次持续20s;
(8)将所有芯片移动并浸入清洗池,共浸入3次;至此一个循环完成。
如果需要合成T5引物,需要将上述合成步骤循环5次,最后去保护,氨水氨解,处理后得到T5产物。如果需要合成T10引物,需要将上述合成步骤循环10次,最后去保护,氨水氨解,处理后得到T10产物。
方法1.2
在方法1.1的步骤(1)之前,将所有芯片移动并浸入盖帽池,其包含75μL试剂A和75μL试剂B组成的盖帽试剂,共浸入两次,每次20s;随后,将所有芯片移动并浸入清洗池,其包含乙腈,共浸入3次;其余步骤与方法1.1相同。
如果需要合成T5引物,在执行上述合成步骤之后,再循环步骤(1)-(8)4次,最后去保护,氨水氨解,处理后得到T5产物。如果需要合成T10引物,在执行上述合成步骤之后,再循环步骤(1)-(8)9次,最后去保护,氨水氨解,处理后得到T10产物。
T5、T10合成测试结果
对通过实验1或实验2合成的T5引物或T10引物进行Nanodrop定量测定单片合成量,并通过HPLC分析测定HPLC纯度,计算单步合成效率(单步合成效率由HPLC纯度分析获得,例如:合成T10的HPLC纯度为80%,则单步合成效率为)。结果如下表所示。实验1中合成T5和T10的HPLC图谱分别如图7-8所示。实验2中合成T5和T10的HPLC图谱分别如图9-10所示。从以上结果可知,在脱保护之前先对芯片进行盖帽处理,能够显著提高合成效率,每一循环的合成效率由93.7%提高到95.7%,而整个合成过程需要5个循环,整个过程的合成效率提高了(95.7%)5-(93.7%)5,当合成的序列越长,反应循环数越多,合成效率提高就越显著。
表1:合成测试结果
实施例2:T5及T10合成及检测
准备合成单体、反应试剂及反应池
1、提供8种池:
4种合成池(第一、第二、第三、第四合成池),其分别用于添加脱氧核糖核苷酸A、T、C和G;其中,
第一合成池包含,45μL 5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的腺苷酸(0.1M;溶剂为乙腈)以及80μL四唑(0.5M;溶剂为乙腈);
第二合成池包含,45μL 5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的鸟苷酸(0.1M;溶剂为乙腈)以及80μL四唑(0.5M;溶剂为乙腈);
第三合成池包含,45μL 5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的胞苷酸(0.1M;溶剂为乙腈)以及80μL四唑(0.5M;溶剂为乙腈);
第四合成池包含,45μL 5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的胸苷酸(0.1M;溶剂为乙腈)以及80μL四唑(0.5M;溶剂为乙腈);
-脱保护池,其包含200μL 10%三氯乙酸/二氯甲烷作为脱保护试剂;
-盖帽池,其包含75μL试剂A(乙酸酐/吡啶/四氢呋喃1/1/8)和75μL试剂B(17.6%w/v氮-甲基咪唑/乙腈)作为盖帽试剂;
-氧化池,其包含150μL 0.01M碘液(水/吡啶/四氢呋喃2/20/78)氧化剂;
-洗涤池,其包含250μL乙腈作为清洗液。
以上反应池由PEEK(聚醚醚酮)制备,为15mL的圆柱体。
2、准备固相载体
以CVD硅烷化芯片(硅烷化试剂为APTMS,CVD法制备)、网格芯片、1%硅烷化芯片(硅烷化试剂为APTMS:PTMS=1:99,液相浸泡法制备)、50%硅烷化芯片(硅烷化试剂为APTMS:PTMS=1:1,液相浸泡法制备)、100%硅烷化芯片(硅烷化试剂为APTMS,液相浸泡法制备)为固相载体,规格均为2*2*0.45mm,每个芯片正反面均携带有特异性的二维码作为编码信号,并且是经化学修饰的,可用于起始DNA合成反应。
方法2.1
(1)将所有芯片移动并浸入盖帽池,共浸入2次,每次持续20s;
(2)将所有芯片移动并浸入清洗池,共浸入3次,每次持续10s;
(3)将所有芯片移动并浸入脱保护池,共浸入两次,每次持续反应15s;
(4)将所有芯片移动并浸入洗涤池,共浸入3次,每次持续10s;
(5)将所有芯片移动并浸入第四合成池,共浸入4次,每次持续60s;
(6)将所有芯片移动并浸入洗涤池,共浸入1次,持续10s;
(7)将所有芯片移动并浸入盖帽池,共浸入2次,每次持续20s;
(8)将所有芯片移动并浸入清洗池,共浸入1次,每次持续10s;
(9)将所有芯片移动并浸入氧化池,共浸入2次,每次持续20s;
(10)将所有芯片移动并浸入清洗池,共浸入3次,每次持续10s;至此一个循环完成。
如果需要合成T5引物,需要在执行上述合成步骤之后,再循环步骤(3)-(10)4次,最后去保护,氨水氨解,处理后得到T5产物。如果需要合成T10引物,需要在执行上述合成步骤之后,再循环步骤(3)-(10)9次,最后去保护,氨水氨解,处理后得到T10产物。
T5、T10合成测试结果
使用如上所述的方法2.1合成T5引物或T10引物,并对合成产物进行Nanodrop定量测定单片合成量,并通过HPLC分析测定HPLC纯度,计算单步合成效率。结果如下表所示。实验6中合成T5的HPLC图谱如图11所示。从中可知,50%硅烷化芯片的单片合成效率最高。
表2:合成测试结果
实施例3:T5及T10合成及检测
准备合成单体、反应试剂及反应池
1、提供8种池:
4种合成池(第一、第二、第三、第四合成池),其分别用于添加脱氧核糖核苷酸A、T、C和G;其中,
第一合成池包含,40μL 5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的腺苷酸(0.1M;溶剂为乙腈)以及60μL四唑(0.5M;溶剂为乙腈);
第二合成池包含,40μL 5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的鸟苷酸(0.1M;溶剂为乙腈)以及60μL四唑(0.5M;溶剂为乙腈);
第三合成池包含,40μL 5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的胞苷酸(0.1M;溶剂为乙腈)以及60μL四唑(0.5M;溶剂为乙腈);
第四合成池包含,40μL 5’-羟基被DMT保护、3’-羟基被亚磷酰胺保护的胸苷酸(0.1M;溶剂为乙腈)以及60μL四唑(0.5M;溶剂为乙腈);
-脱保护池,其包含150μL 10%三氯乙酸/二氯甲烷作为脱保护试剂;
-盖帽池,其包含75μL试剂A(乙酸酐/吡啶/四氢呋喃1/1/8)和75μL试剂B(17.6%w/v氮-甲基咪唑/乙腈)作为盖帽试剂;
-氧化池,其包含150μL 0.01M碘液(水/吡啶/四氢呋喃2/20/78)氧化剂;
-洗涤池,其包含250μL乙腈作为清洗液。
以上反应池由PEEK(聚醚醚酮)制备,为15mL的圆柱体。
2、准备固相载体
以CVD硅烷化芯片、网格芯片、50%硅烷化(APTMS:PTMS=1:1)为固相载体,规格均为2*2*0.45mm,每个芯片正反面均携带有特异性的二维码作为编码信号,并且是经化学修饰的,可用于起始DNA合成反应。
方法3.1
(1)将所有芯片移动并浸入盖帽池,共浸入2次,每次持续20s;
(2)将所有芯片移动并浸入洗涤池,共浸入3次,每次持续10s;
(3)将所有芯片移动并浸入脱保护池,共浸入两次,每次持续反应15s;
(4)将所有芯片移动并浸入洗涤池,共浸入3次,每次持续10s;
(5)将所有芯片移动并浸入第四合成池,共浸入2次,每次持续60s;
(6)将所有芯片移动并浸入洗涤池,共浸入1次,持续10s;
(7)将所有芯片移动并浸入盖帽池,共浸入2次,每次持续20s;
(8)将所有芯片移动并浸入清洗池,共浸入1次,每次持续10s;
(9)将所有芯片移动并浸入氧化池,共浸入2次,每次持续20s;
(10)将所有芯片移动并浸入清洗池,共浸入3次,每次持续10s;至此一个循环完成。
如果需要合成T5引物,需要在执行上述合成步骤之后,再循环步骤(3)-(10)4次,最后去保护,氨水氨解,处理后得到T5产物。如果需要合成T10引物,需要在执行上述合成步骤之后,再循环步骤(3)-(10)9次,最后去保护,氨水氨解,处理后得到T10产物。
T5、T10合成测试结果
使用如上所述的方法3.1合成T5引物或T10引物,并对合成产物进行Nanodrop定量测定单片合成量,并通过HPLC分析测定HPLC纯度,计算单步合成效率。结果如下表所示。实验9-11中合成T10的HPLC图谱分别如图12-14所示。实验10-11中合成T5的HPLC图谱分别如图15-16所示。
表3:合成测试结果
在使用相同芯片以及相同反应步骤下,横向比较实施例1、2与3的不同反应次数,结果如下:
当使用CVD芯片时,实施例1中的实验2所得T10引物,HPLC纯度为64.9%,单步合成效率为95.7%;实施例2中的实验3所得T10引物,HPLC纯度为69.6%,单步合成效率为96.4%;实施例3中的实验10所得T10引物,HPLC纯度为81.89%,单步合成效率为98%;显然,实施例3的反应条件最佳,所得产品的纯度更高,单步合成效率也更高。
当使用网格芯片时,实施例2中的实验4所得T5引物,HPLC纯度为92.9%,单步合成效率为98.5%;实施例3中的实验11所得T5引物,HPLC纯度为96.1%,单步合成效率为99.2%;显然,实施例3的反应条件最佳,所得产品的纯度更高,单步合成效率也更高。
从以上分析可知,实施例3的反应条件(次数)最佳,产品纯度较高,单步合成效率也较高。并且,比较实施例3中的实验9-11,发现T10引物的纯度以及单步合成效率最高的是采用50%硅烷化芯片的条件下获得的,因此综合以上实施例中的所有实验可知,在采用50%硅烷化芯片作为合成载体,在第一次合成反应之前先对芯片进行盖帽处理,然后在后续的每一个循环中偶联2次、盖帽2次、氧化2次的条件下,所得合成产物纯度最高、合成效率也最高。
实施例4:DNA合成
本实施例采用实施例3的合成方法,分别合成5条寡核苷酸(引物-1~引物-5),其序列分别如SEQ ID NOs:1-5所示。分别取10片50%硅烷化芯片(规格:2*2*0.45mm,双面具有二维码)或网格芯片(规格:2*2*0.45mm,双面具有二维码),进行实施例3中方法3.1所述的合成循环,合成循环如下:
(1)将所有芯片移动并浸入盖帽池,共浸入2次,每次持续20s;
(2)将所有芯片移动并浸入洗涤池,共浸入3次,每次持续10s;
(3)将所有芯片移动并浸入脱保护池,共浸入两次,每次持续反应15s;
(4)将所有芯片移动并浸入洗涤池,共浸入3次,每次持续10s;
(5)识别每一个芯片携带的二维码,并根据二维码与芯片的唯一对应关系,确定每一个芯片待合成的核酸序列,以及每一个芯片待连接的亚磷酰胺单体(A、T、C、G)的种类;
(6)根据步骤(5)确定的待连接的亚磷酰胺单体种类,分选每一个芯片,并使之与对应的第一合成池、第二合成池、第三合成池或第四合成池接触并进行反应,共浸入2次,每次持续60s;
(7)将所有芯片移动并浸入洗涤池,共浸入1次,持续10s;
(8)将所有芯片移动并浸入盖帽池,共浸入2次,每次持续20s;
(9)将所有芯片移动并浸入清洗池,共浸入1次,每次持续10s;
(10)将所有芯片移动并浸入氧化池,共浸入2次,每次持续20s;
(11)将所有芯片移动并浸入清洗池,共浸入3次,每次持续10s。
在执行上述合成步骤之后,再循环步骤(3)-(11)39次以合成SEQ ID NO:1-4,或再循环步骤(3)-(11)34次以合成SEQ ID NO:5。
最后去保护,分两组进行氨解反应:采用Biolytic氨解仪进行氨解,氨气氛围,60psi压力,90℃,氨解2h,具体操作请参照仪器说明书。第一组(no-mix):利用二维码对芯片进行分选,获得具有5种不同目标核酸分子的5种50%硅烷化芯片或网格芯片,将每种芯片中的9片单独进行氨解,以获得每种目标核酸分子的no-mix产物。第二组(mix):取每种芯片中的1片混合在一起,随后进行氨解反应,从而收集获得含有5种目标核酸分子的混合物,进行Nanodrop定量。处理后得到目标no-mix/mix产物各50μL。Nanodrop定量结果如下表所示。
表4:Nanodrop定量结果
随后进行基于一步法PCA/PCR反应策略的小片段基因组装、跑胶胶图验证组装后的目标条带的大小,最后通过切胶回收、TA克隆转化、送Sanger测序,以确定目标条带序列的正确性。具体如下:
取10μL样品,分别加入4μL dNTPs、5μL Buffer、4μL首尾引物、0.5μL DNA聚合酶,用水将其体积补至50μL混匀,进行一步法PCA/PCR反应。使用降落PCR扩增35个循环后,产物于12℃保存。取2μL PCR产物点样至胶孔中,调节电压为180V,电泳时间为30min,进行跑胶检测。凝胶电泳结果如图17所示。从胶图中可看出,对于50%硅烷化芯片,不管是5条引物单独氨解再进行基因组装(条带1,第一组),还是5条引物先混合再进行氨解(条带2,第二组),其组装产物都可看到清晰的大小正确的条带;同样的,对于网格芯片,不管是5条引物单独氨解再进行基因组装(条带3,第一组),还是5条引物先混合再进行氨解(条带4,第二组),其组装产物也都可以看到清晰的大小正确的条带。
最后,将条带大小正确的PCR产物切胶回收后,利用TaKaRa公司的TA克隆试剂盒(pMDTM19-T)进行克隆转化实验,菌落PCR验证条带正确的TA克隆转化子送Sanger测序。Sanger测试结果如下表所示。
表5:Sanger测试结果
以上结果表明,50%硅烷化芯片效果更佳,且no-mix组测序结果错误率为0%,mix组测序结果错误率仅为0.22%。以上实施例及实验结果均表明本发明提出的基于浸泡-分选的合成核酸的方法可行,且最终优化的反应流程及合成载体整体合成效果好,与目前商业化主流合成效果有可比性,同时结合该合成方法的高合成通量(理论上合成通量无上限,取决于合成载体及合成腔室的尺寸)、试剂消耗量少的特点,本发明提出的一种合成n种(n≥2)目标核酸的方法可行性高,且有很大优势。
尽管本发明的具体实施方式已经得到详细的描述,但本领域技术人员将理解:根据已经公布的所有教导,可以对细节进行各种修改和变动,并且这些改变均在本发明的保护范围之内。本发明的全部分为由所附权利要求及其任何等同物给出。
SEQUENCE LISTING
<110> 深圳华大生命科学研究院
深圳华大基因科技有限公司
<120> 用于合成具有预先确定的序列的核酸的方法
<130> IDC190310
<150> CN201811356007.1
<151> 2018-11-15
<160> 5
<170> PatentIn version 3.5
<210> 1
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物-1
<400> 1
gcattagtca ccagggaccg accgtgctta ttgttgatat 40
<210> 2
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物-2
<400> 2
gacgattagt cgtgggtcat atatcaacaa taagcacggt 40
<210> 3
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物-3
<400> 3
atgacccacg actaatcgtc acagggcggc tactatgagg 40
<210> 4
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物-4
<400> 4
aatcacgaga tatcccgcgc cctcatagta gccgccctgt 40
<210> 5
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物-5
<400> 5
taaaaccggc ttctgaatca cgagatatcc cgcgc 35
Claims (47)
1.一种合成n种核酸分子的方法,其中,所述n种核酸分子各自具有预先确定的序列,n为≥2的整数,所述方法包括以下步骤:
(1)提供n个固相载体,其中,每一个固相载体各自独立地携带编码,并且,每一个固相载体与其所携带的编码具有唯一对应关系;并且,每一个固相载体被确定用于合成一种核酸分子,并且携带用于起始核酸合成的化学基团;
(2)提供:
-多个合成池,每一个合成池各自独立地含有反应试剂,所述反应试剂能够将一个构建单元连接至固相载体上携带的化学基团,其中,所述构建单元选自具有5’-保护基的亚磷酰胺单体或低聚体;并且,每一个合成池对应于一种构建单元;所述多个合成池的集合至少涵盖了所述n种核酸分子所包含的构建单元的所有种类;
-至少一个洗涤池,其包含洗涤剂;
-至少一个盖帽池,其包含盖帽试剂;
-至少一个氧化池,其包含氧化试剂;以及
-至少一个脱保护池,其包含脱保护试剂;
(3)将所有固相载体浸泡入盖帽池,并与其中的盖帽试剂反应;然后,将该固相载体浸泡入洗涤池,用洗涤剂洗涤,以去除固相载体上残留的反应试剂;
(4)将所有固相载体浸泡入脱保护池,并与其中的脱保护试剂反应;然后,将该固相载体浸泡入洗涤池,用洗涤剂洗涤,以去除固相载体上残留的反应试剂;
(5)识别每一个固相载体携带的编码,并根据编码与固相载体的唯一对应关系,以及每一个固相载体待合成的目标核酸的序列,确定每一个固相载体待连接的构建单元的种类;
(6)根据前一步骤确定的待连接的构建单元的种类,分选每一个固相载体,并使每一个固相载体浸泡入对应于所述种类的构建单元的合成池并进行反应,从而将一个所述种类的构建单元连接至所述固相载体上携带的化学基团;然后,将所有固相载体浸泡入洗涤池,用洗涤剂洗涤,以去除固相载体上残留的反应试剂;
(7)将所有固相载体浸泡入盖帽池,并与其中的盖帽试剂反应;然后,将该固相载体浸泡入洗涤池,用洗涤剂洗涤,以去除固相载体上残留的反应试剂;
(8)将所有固相载体浸泡入氧化池,并与其中的氧化试剂反应;然后,将所有固相载体浸泡入洗涤池,用洗涤剂洗涤,以去除固相载体上残留的反应试剂;
(9)任选地,重复步骤(4)-(8)一次或多次;
从而,在固相载体上合成具有预先确定序列的n种核酸分子。
2.权利要求1所述的方法,其中,所述方法还包括下述步骤:(10)对固相载体进行氨解反应,然后收集、纯化从固相载体分离的核酸分子。
3.权利要求2所述的方法,其中,在步骤(10)中,在进行氨解反应之前,先利用编码对固相载体进行分选,以获得具有期望核酸分子的固相载体;或者,将所有固相载体混合在一起,并进行氨解反应,从而收集获得含有至少两种核酸分子的文库。
4.权利要求1-3任一项所述的方法,其中,所述具有5’-保护基的亚磷酰胺单体或低聚体选自5'-羟基被DMT保护、3’-羟基被亚磷酰胺保护的脱氧核糖核苷酸单体或低聚体;或者,所述具有5’-保护基的亚磷酰胺单体或低聚体选自5'-羟基被DMT保护、2'-羟基被TBDMS(叔丁基甲基硅基醚)保护、3’-羟基被亚磷酰胺保护的核糖核苷酸单体或低聚体。
5.权利要求4所述的方法,其中,所述低聚体是二聚体、三聚体或四聚体。
6.权利要求1-3任一项所述的方法,其中,所述洗涤剂是乙腈。
7.权利要求1-3任一项所述的方法,其中,所述盖帽试剂包含第一试剂和第二试剂,其中所述第一试剂包含乙酸酐/吡啶/四氢呋喃混合物,所述第二试剂包含氮-甲基咪唑的乙腈溶液。
8.权利要求7所述的方法,其中,乙酸酐、吡啶和四氢呋喃的体积比为1:1:1至1:5:10。
9.权利要求7所述的方法,其中,乙酸酐、吡啶和四氢呋喃的体积比为1:1:1至1:1:10。
10.权利要求7所述的方法,其中,乙酸酐、吡啶和四氢呋喃的体积比为1:1:8。
11.权利要求7所述的方法,其中,所述第二试剂包含氮-甲基咪唑的乙腈溶液。
12.权利要求11所述的方法,其中,所述溶液中氮-甲基咪唑的浓度为10%-20%w/v。
13.权利要求11所述的方法,其中,所述溶液中氮-甲基咪唑的浓度为15%-20%w/v。
14.权利要求11所述的方法,其中,所述溶液中氮-甲基咪唑的浓度为17%-18%w/v。
15.权利要求7所述的方法,所述第一试剂和第二试剂的体积比为1:1至1:2。
16.权利要求7所述的方法,所述第一试剂和第二试剂的体积比为1:1。
17.权利要求1-3任一项所述的方法,其中,所述氧化试剂包括碘溶液。
18.权利要求17所述的方法,其中,所述碘溶液是碘在水/吡啶/四氢呋喃混合物中的溶液。
19.权利要求18所述的方法,其中,水、吡啶和四氢呋喃的体积比为2:10:88至5:25:70,其中,三者体积分数之和为100%。
20.权利要求18所述的方法,其中,水、吡啶和四氢呋喃的体积比为2:20:78。
21.权利要求17所述的方法,其中,所述碘溶液中碘的浓度为0.01-0.1M。
22.权利要求21所述的方法,其中,所述碘溶液中碘的浓度为0.01-0.05M。
23.权利要求21所述的方法,其中,所述碘溶液中碘的浓度为0.01M。
24.权利要求1-3任一项所述的方法,其中,所述脱保护试剂包括三氯乙酸的二氯甲烷或乙腈溶液。
25.权利要求24所述的方法,其中,所述脱保护试剂包括三氯乙酸的二氯甲烷溶液。
26.权利要求25所述的方法,其中,三氯乙酸与二氯甲烷的质量体积比为2%至10%w/v。
27.权利要求25所述的方法,其中,三氯乙酸与二氯甲烷的质量体积比为2%-5%w/v。
28.权利要求25所述的方法,其中,三氯乙酸与二氯甲烷的质量体积比为3%w/v。
29.权利要求1-3任一项所述的方法,其中,每一个合成池包含一种所述构建单元和四唑。
30.权利要求29所述的方法,其中,所述合成池包含浓度为0.1-0.5M的构建单元的乙腈溶液以及浓度为0.5-1M的四唑的乙腈溶液。
31.权利要求30所述的方法,其中,所述构建单元的乙腈溶液和四唑的乙腈溶液的体积比为1:1至1:3。
32.权利要求31所述的方法,其中,所述构建单元的乙腈溶液和四唑的乙腈溶液的体积比为2:3。
33.权利要求1-3任一项所述的方法,其中,所述合成池、洗涤池、盖帽池、氧化池和/或脱保护池各自独立地具有选自下列的一个或多个特征:
(a)所述合成池、洗涤池、盖帽池、氧化池和/或脱保护池各自独立地为能够容纳液体试剂的装置或容器;
(b)所述合成池、洗涤池、盖帽池、氧化池和/或脱保护池各自独立地为方形、球形、锥形、圆柱体形、不规则形状、或其任何组合;
(c)所述合成池、洗涤池、盖帽池、氧化池和/或脱保护池各自独立地能够容纳至少1μL、至少2μL、至少5μL、至少10μL、至少20μL、至少50μL、至少100μL、至少200μL、至少500μL、至少1mL、至少2mL、至少5mL、至少10mL、至少20mL、至少50mL、至少100mL、至少200mL、至少500mL、至少1L或更多的溶液;
(d)所述合成池、洗涤池、盖帽池、氧化池和/或脱保护池各自独立地由惰性材料制成;和
(e)所述合成池、洗涤池、盖帽池、氧化池和/或脱保护池各自独立地是一端开口的。
34.权利要求33所述的方法,其中,所述合成池、洗涤池、盖帽池、氧化池和/或脱保护池各自独立地各自独立地能够容纳100-500μL的溶液。
35.权利要求33所述的方法,其中,所述合成池、洗涤池、盖帽池、氧化池和/或脱保护池各自独立地由玻璃、不锈钢或塑料制成。
36.权利要求1-3任一项的方法,其中,所述固相载体选自50%硅烷化芯片。
37.权利要求1-3任一项的方法,其中,所述方法具备以下特征:
在步骤(3)和(7)中,将所有固相载体浸泡入盖帽池2次;
在步骤(4)中,将所有固相载体浸泡入脱保护池2次;
在步骤(6)中,使每一个固相载体浸泡入所述合成池2次;
在步骤(8)中,将所有固相载体浸泡入氧化池2次。
38.权利要求37所述的方法,其中,所述方法进一步具备以下特征:
在步骤(3)和(7)中,将所有固相载体浸泡入洗涤池1次;
在步骤(4)和(8)中,将所有固相载体浸泡入洗涤池3次。
39.权利要求37所述的方法,其中:
在步骤(3)和(7)中,将所有固相载体浸泡入盖帽池2次,每次持续20s;
在步骤(4)中,将所有固相载体浸泡入脱保护池2次,每次持续15s;
在步骤(6)中,使每一个固相载体浸泡入所述合成池2次,每次持续60s;
在步骤(8)中,将所有固相载体浸泡入氧化池2次,每次持续20s。
40.权利要求38所述的方法,其中:
在步骤(3)和(7)中,将所有固相载体浸泡入洗涤池1次,每次持续10s;
在步骤(4)和(8)中,将所有固相载体浸泡入洗涤池3次,每次持续10s。
41.权利要求1-3任一项的方法,其中,所述编码选自数字,符号,图形,识别码,光信号,量子点,磁信号,电信号,或其任何组合。
42.权利要求41的方法,其中,所述编码选自识别码。
43.权利要求41的方法,其中,所述编码为条形码或二维码。
44.用于合成核酸分子的设备,其包括:
-编码识别器,其能够识别固相载体上携带的编码,并产生信号;
-固相载体分选器,其能够对固相载体进行分选;
-驱动固相载体移动的驱动装置;
-中央处理器,其能够接收编码识别器识别编码所产生的信号,并发出指令控制固相载体分选器分选固相载体和/或控制驱动装置移动固相载体;
-存储器,其用于存储待合成的目标核酸分子的序列,固相载体与编码的对应关系,待合成的目标核酸分子与固相载体的对应关系,和/或,每一个固相载体已经历的反应;
-一个或多个合成池,所述合成池各自独立地用于容纳反应试剂;
-至少一个洗涤池,其用于容纳洗涤剂;
-至少一个盖帽池,其用于容纳盖帽试剂;
-至少一个氧化池,其用于容纳氧化试剂;
-至少一个脱保护池,其用于容纳脱保护试剂。
45.权利要求44所述的设备,其中,所述中央处理器集成了控制程序,所述控制程序能够根据目标核酸分子的预先确定的序列,确定固相载体的分选方案和移动方案。
46.权利要求44所述的设备,其中,所述设备还包括:
-至少一个固相载体,所述固相载体各自独立地携带能够被编码识别器识别的编码,并且,每一个固相载体与其所携带的编码具有唯一对应关系。
47.权利要求44-46任一项所述的设备,其中,所述合成池、洗涤池、盖帽池、氧化池、脱保护池和/或固相载体如权利要求1-41任一项中所定义。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2018113560071 | 2018-11-15 | ||
CN201811356007 | 2018-11-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111187797A CN111187797A (zh) | 2020-05-22 |
CN111187797B true CN111187797B (zh) | 2024-01-05 |
Family
ID=70703202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911113592.7A Active CN111187797B (zh) | 2018-11-15 | 2019-11-14 | 用于合成具有预先确定的序列的核酸的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111187797B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111704644B (zh) * | 2020-08-18 | 2020-12-04 | 苏州金唯智生物科技有限公司 | 一种氨解液及氨解方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104603286A (zh) * | 2012-04-24 | 2015-05-06 | Gen9股份有限公司 | 在体外克隆中分选核酸和多重制备物的方法 |
CN108728431A (zh) * | 2018-04-24 | 2018-11-02 | 厦门纽克泰生物技术有限公司 | 核酸合成固相载体、制备方法及含有该载体的核酸合成装置、核酸合成方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1176151B1 (en) * | 2000-07-28 | 2014-08-20 | Agilent Technologies, Inc. | Synthesis of polynucleotides using combined oxidation/deprotection chemistry |
US20040152081A1 (en) * | 2003-01-31 | 2004-08-05 | Leproust Eric M. | Viscosity control during polynucleotide synthesis |
US8202985B2 (en) * | 2005-10-31 | 2012-06-19 | Agilent Technologies, Inc. | Monomer compositions for the synthesis of polynucleotides, methods of synthesis, and methods of deprotection |
-
2019
- 2019-11-14 CN CN201911113592.7A patent/CN111187797B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104603286A (zh) * | 2012-04-24 | 2015-05-06 | Gen9股份有限公司 | 在体外克隆中分选核酸和多重制备物的方法 |
CN108728431A (zh) * | 2018-04-24 | 2018-11-02 | 厦门纽克泰生物技术有限公司 | 核酸合成固相载体、制备方法及含有该载体的核酸合成装置、核酸合成方法 |
Non-Patent Citations (1)
Title |
---|
成军等.《现代肝炎病毒分子生物学》.人民军医出版社,1997,第327页第5段,第328页第6段. * |
Also Published As
Publication number | Publication date |
---|---|
CN111187797A (zh) | 2020-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3794012B1 (en) | Compositions and methods for chemical cleavage and deprotection of surface-bound oligonucleotides | |
EP1585755B1 (en) | Methods and compositions for the tandem synthesis of two or more oligonuleotides on the same solid support | |
EP0593422B1 (en) | Method of synthesizing oligonucleotides adaptable to large scale syntheses | |
CA2362939C (en) | Method for producing polymers | |
Caruthers | A brief review of DNA and RNA chemical synthesis | |
EP1713936B1 (en) | Genetic analysis by sequence-specific sorting | |
US20180201968A1 (en) | Azidomethyl Ether Deprotection Method | |
US6451998B1 (en) | Capping and de-capping during oligonucleotide synthesis | |
UA48119C2 (uk) | Спосіб визначення послідовності молекули нуклеїнової кислоти (варіанти) та набір для використання при визначенні послідовності нуклеїнової кислоти | |
CA2749227A1 (en) | Bead bound combinatorial oligonucleoside phosphorothioate and phosphorodithioate aptamer libraries | |
CN113166974B (zh) | 一种生物芯片及其制备方法与应用 | |
JPH11501936A (ja) | 光除去可能な保護基を用いた核酸合成 | |
WO2001046464A1 (en) | Branched compound for use in nucleic acid detection and analysis reactions | |
CN101155821B (zh) | 用于寡核苷酸合成的亚磷酰胺活化剂 | |
CN111187797B (zh) | 用于合成具有预先确定的序列的核酸的方法 | |
CN110891961B (zh) | 制备伊美司他(imetelstat)的改良方法 | |
Yin et al. | Long oligos: direct chemical synthesis of genes with up to 1,728 nucleotides | |
EP3309252B1 (en) | On-array ligation assembly | |
Xiao et al. | Omission of column washing operations in the solid phase synthesis of oligonucleotides | |
Bader et al. | Oligonucleotide microsynthesis of a 200-mer and of one-dimensional arrays on a surface hydroxylated polypropylene tape | |
RU2292350C1 (ru) | Способ получения 5`-аминоалкилфосфат олигодезоксирибонуклеотидов | |
US20030044827A1 (en) | Method for immobilizing DNA | |
CN116574790A (zh) | 一种多核苷酸的测序方法 | |
Pon | Chemical synthesis of oligonucleotides: from dream to automation | |
CN113564235A (zh) | 脱氧核糖寡核苷酸测序方法和试剂盒 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |