CN117070514B - 非天然rna的制备方法及产品 - Google Patents
非天然rna的制备方法及产品 Download PDFInfo
- Publication number
- CN117070514B CN117070514B CN202311335114.7A CN202311335114A CN117070514B CN 117070514 B CN117070514 B CN 117070514B CN 202311335114 A CN202311335114 A CN 202311335114A CN 117070514 B CN117070514 B CN 117070514B
- Authority
- CN
- China
- Prior art keywords
- substrate
- donor
- acceptor
- seq
- modification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000002360 preparation method Methods 0.000 title claims abstract description 27
- 239000000758 substrate Substances 0.000 claims abstract description 316
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract description 84
- 101710086015 RNA ligase Proteins 0.000 claims abstract description 47
- 239000002773 nucleotide Substances 0.000 claims abstract description 31
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 31
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 claims abstract description 29
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims abstract description 21
- 239000000370 acceptor Substances 0.000 claims description 114
- 238000012986 modification Methods 0.000 claims description 89
- 230000004048 modification Effects 0.000 claims description 88
- 125000006239 protecting group Chemical group 0.000 claims description 36
- 238000000034 method Methods 0.000 claims description 29
- 108091028664 Ribonucleotide Proteins 0.000 claims description 27
- 239000002336 ribonucleotide Substances 0.000 claims description 27
- 125000002652 ribonucleotide group Chemical group 0.000 claims description 27
- 108020004707 nucleic acids Proteins 0.000 claims description 20
- 102000039446 nucleic acids Human genes 0.000 claims description 20
- 239000002243 precursor Substances 0.000 claims description 20
- 150000007523 nucleic acids Chemical class 0.000 claims description 19
- -1 hexitol nucleic acid Chemical class 0.000 claims description 11
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 claims description 9
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 claims description 9
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 claims description 9
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 claims description 9
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 claims description 8
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 claims description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 6
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 claims description 6
- 229910052739 hydrogen Inorganic materials 0.000 claims description 4
- 239000001257 hydrogen Substances 0.000 claims description 4
- 230000000415 inactivating effect Effects 0.000 claims description 4
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims description 4
- 125000001731 2-cyanoethyl group Chemical group [H]C([H])(*)C([H])([H])C#N 0.000 claims description 3
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 claims description 3
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical group CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 claims description 3
- IVRMZWNICZWHMI-UHFFFAOYSA-N azide group Chemical group [N-]=[N+]=[N-] IVRMZWNICZWHMI-UHFFFAOYSA-N 0.000 claims description 3
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 claims description 3
- 229940104302 cytosine Drugs 0.000 claims description 3
- 238000010511 deprotection reaction Methods 0.000 claims description 3
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 claims description 3
- 229940045145 uridine Drugs 0.000 claims description 3
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical class [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 claims description 2
- 150000004713 phosphodiesters Chemical class 0.000 claims 1
- 102000004190 Enzymes Human genes 0.000 abstract description 15
- 108090000790 Enzymes Proteins 0.000 abstract description 15
- 238000006555 catalytic reaction Methods 0.000 abstract description 5
- 101001095863 Enterobacteria phage T4 RNA ligase 1 Proteins 0.000 abstract description 3
- 230000006819 RNA synthesis Effects 0.000 abstract description 2
- 108090000364 Ligases Proteins 0.000 description 67
- 102000003960 Ligases Human genes 0.000 description 67
- 238000006243 chemical reaction Methods 0.000 description 29
- 150000001413 amino acids Chemical group 0.000 description 16
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 14
- 235000001014 amino acid Nutrition 0.000 description 13
- 230000015572 biosynthetic process Effects 0.000 description 13
- 238000004704 ultra performance liquid chromatography Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 12
- 125000001153 fluoro group Chemical group F* 0.000 description 12
- 238000003786 synthesis reaction Methods 0.000 description 11
- 229940024606 amino acid Drugs 0.000 description 10
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 10
- 108090000623 proteins and genes Proteins 0.000 description 9
- 230000003197 catalytic effect Effects 0.000 description 8
- 239000003814 drug Substances 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 239000003153 chemical reaction reagent Substances 0.000 description 7
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 241000607598 Vibrio Species 0.000 description 6
- 238000005119 centrifugation Methods 0.000 description 6
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 230000002194 synthesizing effect Effects 0.000 description 6
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 5
- 101710188536 RNA ligase 1 Proteins 0.000 description 5
- 101710093506 RNA-editing ligase 1, mitochondrial Proteins 0.000 description 5
- 239000012467 final product Substances 0.000 description 5
- 230000002779 inactivation Effects 0.000 description 5
- 239000012071 phase Substances 0.000 description 5
- 102000004169 proteins and genes Human genes 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 239000006228 supernatant Substances 0.000 description 5
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 238000007036 catalytic synthesis reaction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 230000002209 hydrophobic effect Effects 0.000 description 4
- 239000002244 precipitate Substances 0.000 description 4
- 235000018102 proteins Nutrition 0.000 description 4
- 238000010532 solid phase synthesis reaction Methods 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 101710188535 RNA ligase 2 Proteins 0.000 description 3
- 101710204104 RNA-editing ligase 2, mitochondrial Proteins 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 241001515965 unidentified phage Species 0.000 description 3
- 101000942941 Arabidopsis thaliana DNA ligase 6 Proteins 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 241000588748 Klebsiella Species 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 238000002869 basic local alignment search tool Methods 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 238000011033 desalting Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 150000002431 hydrogen Chemical class 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 239000002054 inoculum Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000010802 sludge Substances 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- 241001519901 Acidobacteria bacterium Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 102100033195 DNA ligase 4 Human genes 0.000 description 1
- 241000305135 Diplonema papillatum Species 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000935963 Escherichia phage AR1 Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- YCKRFDGAMUMZLT-UHFFFAOYSA-N Fluorine atom Chemical group [F] YCKRFDGAMUMZLT-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 101000927810 Homo sapiens DNA ligase 4 Proteins 0.000 description 1
- 241001451295 Klebsiella phage KP15 Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 238000010357 RNA editing Methods 0.000 description 1
- 230000026279 RNA modification Effects 0.000 description 1
- 208000035977 Rare disease Diseases 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000205188 Thermococcus Species 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241001442399 Trypanosoma brucei gambiense Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 241000210655 Vibrio phage nt-1 Species 0.000 description 1
- 241000726445 Viroids Species 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 150000001450 anions Chemical class 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 239000012043 crude product Substances 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 229910052731 fluorine Chemical group 0.000 description 1
- 239000011737 fluorine Chemical group 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 108700021021 mRNA Vaccine Proteins 0.000 description 1
- 229940126582 mRNA vaccine Drugs 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000009711 regulatory function Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 150000003290 ribose derivatives Chemical class 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 108010058826 tRNA splicing ligase Proteins 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y605/00—Ligases forming phosphoric ester bonds (6.5)
- C12Y605/01—Ligases forming phosphoric ester bonds (6.5) forming phosphoric ester bonds (6.5.1)
- C12Y605/01003—RNA ligase (ATP) (6.5.1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/531—Stem-loop; Hairpin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2330/00—Production
- C12N2330/50—Biochemical production, i.e. in a transformed host cell
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/55—Design of synthesis routes, e.g. reducing the use of auxiliary or protecting groups
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Saccharide Compounds (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明提供了一种非天然RNA的制备方法及产品。其中,上述非天然RNA的制备方法包括:利用RNA连接酶将底物供体的3'端与底物受体的5'端连接形成磷酸二酯键,连接不需要模板链,制备获得非天然RNA,底物供体和/或底物受体中包括一个或多个非天然核苷酸;底物受体的5'端为磷酸基团;底物供体的3'端为羟基基团;RNA连接酶包括RNA连接酶家族Rnl1和Rnl2中任意的一种或多种酶。能够解决现有技术中难以利用酶催化制备非天然RNA的问题,适用于RNA合成领域。
Description
技术领域
本发明涉及RNA合成领域,具体而言,涉及一种非天然RNA的制备方法及产品。
背景技术
核糖核酸是存在于生物细胞以及部分病毒、类病毒中的遗传信息载体。在很长的一段时间内,RNA被认为只是在基因与蛋白质之间进行信息传递的分子。其实,在生命起源之初,RNA是唯一的生命分子,既可储存信息,也具有酶的功能。RNA除了充当蛋白质合成的信使之外(mRNA),还具有着非常重要的调控功能,非转录RNA包括miRNA,siRNA,lncRNA,piwiRNA等等。其中,仅miRNA分子就有400多种,调控至少三分之一的人类基因。从20世纪70年代起,基因载体技术、基因克隆技术、基因编辑技术等给现代基因疗法技术带来了深刻的影响。同时RNA编辑技术实现了从遗传水平对人体细胞中特定的核苷酸进行编辑,这一技术不仅可以用作研究工具,而且可作为由突变引发的疾病的临时治疗方法。
近年来,RNA药物领域飞速发展,一方面是以siRNA和ASO为代表的小核酸药物在罕见病等领域大放异彩,另一方面是以mRNA疫苗为代表的mRNA药物在新冠疫情中发挥了重要的作用。目前寡核苷酸(12-30个核苷酸)通用的合成方法多为固相合成法,而固相合成是将核酸固定在固相载体上完成合成反应的,最常用的固相载体为可控微孔玻璃珠(CPG),但是载量有限,一般为70-80 μmol/g。但是固相合成核苷酸链存在很大的缺点,合成的寡核苷酸初产物纯度低,且合成链长受限,一般用于合成25个核苷酸以内的链长,随着合成链长的增加,产率降低,引物合成至~80nt链长时粗品纯度只有~40%,过低的纯度同时影响了纯化的收率,导致了纯化的低收率,因此极大限制了核苷酸链的合成。同时还存在有机试剂用量大,加大了三废处理的困难,对环境的污染较严重。
天然的寡核苷酸在体内容易被降解,特异性低,并且具有毒副作用,因此,药物寡核苷酸通常以特定的化学修饰来增强其在体内的稳定性,提高特异性,并降低毒副作用,这些化学修饰有氟代、甲基及甲氧乙基修饰等。相较于传统的蛋白水平发挥作用的药物相比,核酸药物具有高特异性、高效性、长效性等明显的优势,但是由于天然核酸对核酸内切酶或外切酶都非常敏感,极易被降解,因此核酸药物使用化学修饰来提高稳定性和降低免疫原性、增强特异性。单化学修饰的核酸属于人为创造的,并非天然的,因此天然的酶对非天然的核酸的活性是未知的。
酶法催化合成是一种绿色高效的方式,反应条件比较温和,对有机试剂需求小甚至不需要有机试剂,因此是一种比较有前景的催化方式。利用连接酶合成核苷酸链,可以实现绿色催化,同时合成链长不受限制,可以解决固相合成的技术瓶颈。但连接酶连接单链RNA的应用多限制于天然的RNA链,文献或专利中对于酶法催化合成非天然单链RNA的报道几乎没有。
发明内容
本发明的主要目的在于提供一种非天然RNA的制备方法及产品,以解决现有技术中难以利用酶催化制备非天然RNA的问题。
为了实现上述目的,根据本发明的第一个方面,提供了一种非天然RNA的制备方法,该制备方法包括:利用RNA连接酶将底物供体的3'端与底物受体的5'端连接形成磷酸二酯键,连接不需要模板链,制备获得非天然RNA,底物供体和/或底物受体中包括一个或多个非天然核苷酸;底物受体的5'端为磷酸基团;底物供体的3'端为羟基基团;RNA连接酶包括RNA连接酶家族Rnl1和Rnl2中任意的一种或多种酶。
进一步地,RNA连接酶包括:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21或SEQ ID NO:22所示的RNA连接酶中的一种或多种;或与SEQ ID NO:1~ SEQ ID NO:8、SEQ ID NO:15~SEQID NO:22中所示的任一RNA连接酶具有70%以上同一性,且具有催化磷酸二酯键形成活性的酶。
进一步地,制备方法中的底物供体包括一个或n个,n为大于等于2的整数,当底物供体为n个时,制备方法包括:第一底物供体与第一底物受体连接,形成第二底物受体;第二底物供体再与第二底物受体连接,形成第三底物受体;直至第n-1底物供体与第n-1底物受体连接,形成第n底物受体;第n底物供体与第n底物受体连接,形成非天然RNA。
进一步地,第一底物受体的5'端为磷酸基团;第n底物供体的5'端为5'保护基;第二底物供体至第n-1底物供体的5'端为羟基;第二底物供体至第n底物供体的3'端为羟基。
进一步地,第二底物受体的前体至第n底物受体的前体的5'端均为5'保护基,5'保护基包括羟基;在将第二底物受体至第n底物受体与相应底物供体连接前,将第二底物受体的前体至第n底物受体的前体上的5'保护基替换为磷酸基团;利用多聚核苷酸激酶分别将第二底物受体至第n底物受体的前体的5'端修饰为磷酸基团,获得5'端为磷酸基团的底物受体,并失活多聚核苷酸激酶。
进一步地,制备方法中的底物受体包括一个或n个,n为大于等于2的整数; 当底物受体为n个时,制备方法包括:将第一底物供体与第一底物受体连接,形成第二底物供体;将第二底物受体与第二底物供体连接,形成第三底物供体;直至将第n-1底物受体与第n-1底物供体连接,形成第n底物供体;将第n底物受体与第n底物供体连接,形成非天然RNA。
进一步地,底物受体的3'端为保护基团;第二底物供体的前体至第n底物供体的前体和非天然RNA的前体的3'端均为保护基团;在将第二底物供体至第n底物供体与相应底物受体连接前,对保护基团进行脱保护,获得3'端为羟基的底物供体或非天然RNA。
进一步地,非天然核苷酸包括:具有核糖2'位修饰、核糖骨架修饰、碱基修饰或磷酸骨架修饰中的一种或多种的核糖核苷酸;核糖2'位修饰包括2'-甲氧基修饰、2'-氟修饰、2'-甲氧乙基修饰、2'-FANA修饰、锁核酸修饰或己糖醇核酸修饰;核糖骨架修饰包括将核苷酸中的核糖替换为ribuloNA、TNA、tPhoNA或dXNA;碱基修饰包括脱氮腺嘌呤C7修饰、脱氮鸟苷C7修饰、胞嘧啶C5修饰或尿苷C5修饰;磷酸骨架修饰包括PS修饰。
进一步地,底物供体和/或底物受体中含有1个或多个非天然核苷酸;底物供体的3'端碱基和/或底物受体的5'端碱基为非天然核苷酸。
进一步地,底物供体和/或底物受体由非天然核苷酸组成。
进一步地,底物供体和底物受体的长度均为2-500 nt。
进一步地,非天然RNA的长度>3 nt。
进一步地,底物受体的3'端为保护基团;底物供体的5'端为5'保护基。
进一步地,保护基团包括N-乙酰半乳糖胺基团、磷酸基团、-O-NH2、叠氮基、氰乙基、烯丙基或2-硝基苄基;5'保护基包括羟基、氢或甲基。
根据本发明的第二个方面,提供了一种非天然RNA,该非天然RNA包括利用上述制备方法制备获得的所述非天然RNA。
应用本发明的技术方案,上述制备方法中,通过RNA连接酶催化合成的方法组装非天然RNA片段,从而合成更长的非天然RNA链,无需模板链的引入即可实现特异性高效性的连接。可实现高效催化,较化学法合成非天然RNA能有效提高效率和收率。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明实施例的多条底物供体和底物受体连接制备非天然RNA的示意图。
图2示出了根据本发明实施例的多条底物受体和底物供体连接制备非天然RNA的示意图。
图3示出了根据本发明实施例2的SDS-PAGE凝胶电泳结果图。
图4示出了根据本发明实施例3的SDS-PAGE凝胶电泳结果图。
图5示出了根据本发明实施例3的UPLC色谱图。
图6示出了根据本发明实施例4的UPLC色谱图。
图7示出了根据本发明实施例4的UPLC色谱图。
图8示出了根据本发明实施例4的L96的结构示意图。
图9示出了根据本发明实施例5的底物9、10和11的结构示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将结合实施例来详细说明本发明。
如背景技术所提到的,利用连接酶连接单链RNA的应用多限制于天然的RNA链,文献或专利中对于酶法催化合成非天然单链RNA的报道几乎没有。因而,在本申请中发明人尝试开发一种非天然RNA的制备方法,利用RNA连接酶催化合成的方法组装非天然RNA片段,从而合成更长的非天然RNA链,因而提出了本申请的一系列保护方案。
在本申请第一种典型的实施方式中,提供了一种非天然RNA的制备方法,该制备方法包括:利用RNA连接酶将底物供体的3'端与底物受体的5'端连接形成磷酸二酯键,连接不需要模板链,制备获得非天然RNA,底物供体和/或底物受体中包括一个或多个非天然核苷酸;底物受体的5'端为磷酸基团;底物供体的3'端为羟基基团;RNA连接酶包括RNA连接酶家族Rnl1和Rnl2中任意的一种或多种酶。
在上述制备方法中,利用RNA连接酶连接底物供体和底物受体,能够在不需要模板链的情况下完成连接,将底物供体的5'端和底物受体的3'端以磷酸二酯键连接。其中,底物供体的5'端为磷酸基团,底物受体的3'端为羟基基团。
底物受体或底物供体的数量包括1个或多个,若底物受体的数量为多个时,可以通过RNA连接酶进行分步连接,将底物受体连接至底物供体上形成新的底物供体后,再将新的底物受体连接在新的底物供体上;相似地,若底物供体的数量为多个时,通过RNA连接酶进行分步连接,将底物供体连接在底物受体上形成新的底物受体后,再将新的底物供体连接在新的底物受体上。利用上述方法能够实现多个底物受体和底物供体的连接,实现对于长链非天然RNA的制备,防止由于RNA片段过长影响连接效率和RNA稳定性。
在本申请中,底物供体和底物受体的概念并不限制底物的具体性质,仅将在RNA连接中位于5'方向的底物定义为底物供体,位于3'方向的底物定义为底物受体。在不同的反应中,相同的反应底物可能为底物供体,也可能为底物受体。
在一种优选的实施例中,RNA连接酶包括:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21或SEQ ID NO:22所示的RNA连接酶中的一种或多种,或与上述SEQ ID NO:1~8、SEQ ID NO:15~SEQ ID NO:22中所示的任一RNA连接酶具有70%以上同一性的酶,优选为75%以上同一性、80%以上同一性、85%以上同一性、90%以上同一性、95%以上同一性、98%以上同一性、99%以上同一性、99.5%以上同一性、99.9%以上同一性,且具有催化上述磷酸二酯键形成活性的酶。
上述所示的RNA连接酶是在本申请中筛选出的能够连接非天然RNA的RNA连接酶。其中非天然RNA中包括单化学修饰的核酸,属于人为创造的并非天然的,因此天然的酶对非天然的核酸的活性是未知的。在本申请中,通过对现有的RNA连接酶进行大规模筛选,获得了上述能够不依赖模板链即能够连接非天然RNA的RNA连接酶。
本申请中的同一性(Identity)是指氨基酸序列或核酸序列之间的“同一性”,即氨基酸序列或核酸序列中的种类相同的氨基酸残基或核苷酸的比率的总计。氨基酸序列或核酸序列的同一性可以利用BLAST(Basic Local Alignment Search Tool)、FASTA等比对程序来确定。
70%、75%、80%、85%、90%、95%、99%以上(比如85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.5%、99%、99.5%、99.6%、99.7%、99.8%以上,甚至99.9%以上)同一性且具有相同功能的蛋白质,其活性位点、活性口袋、活性机制、蛋白结构等均和a)序列提供的蛋白质大概率相同。
如本文所用,氨基酸残基缩写如下:丙氨酸(Ala;A)、天冬酰胺(Asn;N)、天冬氨酸(Asp;D)、精氨酸(Arg;R)、半胱氨酸(Cys;C)、谷氨酸(Glu;E)、谷氨酰胺(Gln;Q)、甘氨酸(Gly;G)、组氨酸(His;H)、异亮氨酸(Ile;I)、亮氨酸(Leu;L)、赖氨酸(Lys;K)、蛋氨酸(Met;M)、苯丙氨酸(Phe;F)、脯氨酸(Pro;P),丝氨酸(Ser;S)、苏氨酸(Thr;T)、色氨酸(Trp;W)、酪氨酸(Tyr;Y)和缬氨酸(Val;V)。
取代、替换等规则,一般情况下,哪些氨基酸性质类似,替换后的效果也类似。例如,在上述同源蛋白中,可发生保守的氨基酸替换。“保守的氨基酸替换”包括但不限于:
疏水性氨基酸(Ala、Cys、Gly、Pro、Met、Val、Ile、Leu)被其他疏水性氨基酸取代;
侧链粗大的疏水性氨基酸(Phe、Tyr、Trp)被其他侧链粗大的疏水性氨基酸取代;
侧链带正电的氨基酸(Arg、His、Lys)被其他侧链带正电的氨基酸取代;
侧链有极性不带电的氨基酸(Ser、Thr、Asn、Gln)被其他侧链有极性不带电的氨基酸取代。
本领域技术人员也可以根据现有技术中的“blosum62评分矩阵”等本领域技术人员熟知的氨基酸替换规则对氨基酸进行保守替换。
在一种优选的实施例中,制备方法中的底物供体包括一个或n个,n为大于等于2的整数,当底物供体为n个时,制备方法包括:第一底物供体与第一底物受体连接,形成第二底物受体;第二底物供体再与第二底物受体连接,形成第三底物受体;直至第n-1底物供体与第n-1底物受体连接,形成第n底物受体;第n底物供体与第n底物受体连接,形成非天然RNA。
在一种优选的实施例中,第一底物受体的5'端为磷酸基团;第n底物供体的5'端为5'保护基;第二底物供体至第n-1底物供体的5'端为羟基;第二底物供体至第n底物供体的3'端为羟基。
在一种优选的实施例中,第二底物受体的前体至第n底物受体的前体的5'端均为5'保护基,5'保护基包括但不限于羟基;在将第二底物受体至第n底物受体与相应底物供体连接前,将第二底物受体的前体至第n底物受体的前体上的5'保护基替换为磷酸基团;利用多聚核苷酸激酶分别将第二底物受体至第n底物受体的前体的5'端均修饰为磷酸基团,获得5'端为磷酸基团的底物受体,并失活多聚核苷酸激酶。
上述底物供体为n个,表示在制备方法中有n个作为底物原料的底物供体,逐渐连接在底物受体上形成新的底物受体;新的底物受体进一步地与新的底物供体连接,从而实现将底物受体和n个底物供体相连接。在利用上述方法以此连接多条底物供体和底物受体时,由于新生成的底物受体的前体的5'端不是磷酸基团,因此需要利用多聚核苷酸激酶,将底物受体和底物供体连接形成的新的底物供体的前体的5'端(即原底物受体的5'端碱基)修饰为磷酸基团,再利用RNA连接酶催化新的底物受体的3'端的羟基与该磷酸基团相连。反应步骤如图1所示。图1中的底物1即为上述第一底物受体,底物2即为上述第一底物供体,底物3即为上述第二底物供体。
在一种优选的实施例中,上述制备方法中的底物受体包括一个或n个,n为大于等于2的整数;当底物受体为n个时,制备方法包括:将第一底物供体与第一底物受体连接,形成第二底物供体;将第二底物受体与第二底物供体连接,形成第三底物供体;直至将第n-1底物受体与第n-1底物供体连接,形成第n底物供体;将第n底物受体与第n底物供体连接,形成非天然RNA。
在上述制备方法中,上述底物受体为n个,表示在制备方法中有n个作为底物原料的底物受体,逐步连接在底物供体上形成新的底物供体;新的底物供体进一步地与新的底物受体连接,从而实现将底物供体和n个底物受体相连接。反应步骤如图2所示。图2中的底物1即为上述第一底物供体,底物2即为上述第一底物受体,底物3即为上述第二底物受体。
在一种优选的实施例中,底物受体的3'端为保护基团;第二底物供体至第n底物供体的前体和非天然RNA的前体的3'端均为保护基团;在将第二底物供体至第n底物供体与相应底物受体连接前,对保护基团进行脱保护,获得3'端为羟基的底物供体或非天然RNA。
为了防止底物受体自连影响反应收率和产物纯度,底物受体的3'端为保护基团,当底物受体与底物供体连接形成新的底物供体后,此种新的底物供体的3'端为保护基团,需要对新的底物供体进行脱保护,获得3'端为羟基的新的底物供体,从而实现进一步地与新的底物受体的连接。
在一种优选的实施例中,非天然核苷酸包括但不限于:具有核糖2'位修饰、核糖骨架修饰、碱基修饰或磷酸骨架修饰中的一种或多种的核糖核苷酸;优选地,核糖2'位修饰包括但不限于2'-甲氧基修饰、2'-氟修饰、2'-甲氧乙基修饰、2'-FANA修饰、锁核酸修饰或己糖醇核酸修饰;优选地,核糖骨架修饰包括但不限于将核苷酸中的核糖替换为ribuloNA、TNA、tPhoNA、或dXNA;优选地,碱基修饰包括但不限于脱氮腺嘌呤C7修饰、脱氮鸟苷C7修饰、胞嘧啶C5修饰、或尿苷C5修饰;磷酸骨架修饰包括PS修饰。
其中,锁核酸修饰为;己糖醇核酸修饰为/>;2’甲氧基乙基修饰为/>;2’甲氧基修饰为/>;2’氟修饰为;2'-FANA为/>;ribuloNA为/>;TNA为;tPhoNA为/>;dXNA为/>;PS修饰为。上述结构中Base均表示碱基,R表示羟基、氢、甲氧基、甲氧乙基或氟修饰。上述对于非天然核苷酸的修饰参见文献:Duffy K , Arangundy-Franklin S , HolligerP . Modified nucleic acids: replication, evolution, and next-generationtherapeutics[J]. BMC Biology, 2020, 18(1):112。
在一种优选的实施例中,底物供体和/或底物受体中含有1个或多个非天然核苷酸;优选地,底物供体的3'端碱基和/或底物受体的5'端碱基为非天然核苷酸;优选地,底物供体和/或底物受体由非天然核苷酸组成。
非天然核苷酸(xeno-nucleic acid,XNA)是一类具有非天然骨架或核酸碱基的核酸分子。非天然核糖核苷酸,即为具有非天然骨架或核酸碱基的核糖核苷酸。上述底物供体和/或底物受体中含有非天然核苷酸,连接制备的RNA中即含有非天然核苷酸,属于非天然RNA。若底物供体的3'端碱基和/或底物受体的5'端碱基为非天然核苷酸时,虽然连接处的碱基与天然碱基不同,属于人为创造的非天然碱基,上述RNA连接酶也能够发挥连接活性。
在一种优选的实施例中,底物供体和底物受体的长度均为2-500 nt,包括但不限于2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、60、80、100、150、200、300、400和500nt。
在一种优选的实施例中,非天然RNA的长度>3 nt,利用具有上述长度的底物供体和底物受体连接形成的非天然RNA,通过对一个或多个的底物受体和底物供体进行连接,能够获得长度>3 nt的非天然RNA。上述非天然RNA的长度包括但不限于4、5、6、7、8、9、10、12、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000nt。
在一种优选的实施例中,底物受体的3'端为保护基团;优选地,底物供体的5'端为5'保护基;优选地,保护基团包括GalNac(N-乙酰半乳糖胺基团)、磷酸基团、-O-NH2、叠氮基(-C-N=N+=N-,3'-O-azidomethyl)、氰乙基(-C-CN,3'-O-2-cyanoethyl)、烯丙基(-C-C=C,3'-O-allyl)、2-硝基苄基(3'-O-2-nitrobenzyl);优选地,5'保护基包括羟基、氢或甲基。
在本申请第二种典型的实施方式中,提供了一种非天然RNA,该非天然RNA包括利用上述制备方法制备获得的非天然RNA。
本申请中使用的连接酶的序列、来源和所属家族如下。
连接酶1,SEQ ID NO:1,Bacteriophage,RNA ligase 2:
MFKKYSSLENHYNSKFIEKLYSLGLTGGEWVAREKIHGTNFSLIIERDKVTCAKRTGPILPAEDFFGYEIILKNYADSIKAVQDIMETSAVVSYQVFGEFAGPGIQKNVDYCDKDFYVFDIIVTTESGDVTYVDDYMMESFCNTFKFKMAPLLGRGKFEELIKLPNDLDSVVQDYNFTVDHAGLVDANKCVWNAEAKGEVFTAEGYVLKPCYPSWLRNGNRVAIKCKNSKFSEKKKSDKPIKAKVELSEADNKLVGILACYVTLNRVNNVISKIGEIGPKDFGKVMGLTVQDILEETSREGITLTQADNPSLIKKELVKMVQDVLRPAWIELVS。
连接酶2,SEQ ID NO:2,Vibrio phage ,RNA ligase 2:
MSFVKYTSLENSYRQAFVDKCDMLGVREWVALEKIHGANFSFIVEFKPNEAQDGAEFTVTPAKRTSTIGANVMGDYDFYGCTSVVEAHTAKMEAISNWLWARGIINVGETIIVYGELAGKGVQKEVNYGDKDFWAYDILLPETGKFLDWDVVLEACEFAKVKTTHEIARGTLDELLRIDPLFRSFHTPADVDGDNVAEGFVVKQLRNEKRLHNGSRAILKVKNDKFKEKKNKAGKTPRAAVVLTEEQEKLHAAFSCYLTENRLRNVLSKLETVTQKQFGMISGLFIKDAKDEFERDELNETAIARDDWDVIKRSLTNIANEILRKNWLDILDGNF。
连接酶3,SEQ ID NO:3,Bacteriophage AR1,RNA ligase 1:
MQELFNNLMELCKDSQRKFFYSDDVSASGRTYRIFSYNYASYSDWLLPDALECRGIMFEMDGEKPVRIASRPMEKFFNLNENPFTMNIDLNDVDYILTKEDGSLVSTYLDGDEILFKSKGSIKSEQALMANGILMNINHHQLRDRLKELAEDGFTANFEFVAPTNRIVLAYQEMKIILLNIRENETGEYISYDDIYKDAALRPYLVERYEIDSPKWVEEAKNAENIEGYVAVMKDGSHFKIKSDWYVSLHSTKSSLDNPEKLFKTIIDGASDDLKAMYADDEYSYRKIEAFETTYLKYLDRALFLVLDCHNKHCGKDRKTYAMEAQGVAKGAGMDHLFGIIMSLYQGYDSQEKVMCEIEQNFLKNYKKFIPEGY。
连接酶4,SEQ ID NO:4,Bacteriophage dhaeg ,RNA ligase 2:
MFKKYSSLENHYNSKFIEKLRTNGLTGGEWVAREKIHGTNFSLIIERDAVTCAKRTGPILPAEDFYGYEIVLKNYADSIKSIQDIMETSAAVSYQVFGEFAGTGIQKNVDYGDKDFYVFDIIVTTESGDVTYVDDYMMESFCKTFKFKMAPLLGRGKFEDLIKLPNDLDSVLPDYNFTVDNVGLAEANAHVWNAEAKGEVFTAEGYVLKPCYPLWLPNGNRVAIKCKNSKFSEKKKTDKPIKVAVVLSQDDLDLLQQFTDYVTVNRINNVISKIGEVSPKDFGKVMGLTVQDILEEAAREELELTDAENPVEVKKQLIECVKDTLRAVWIELVSK。
连接酶5,SEQ ID NO:5,Klebsiella phage KP179,RNA ligase 1:
MLELYKNLMNLCESSEVAKFFYKDFTGPMDGKFRVFSYHYASYSEWLKPDALECRGIMFEMDGDTPIRIASRPMEKFFNLNENPLTMGIDISDVEYIMDKADGSLVSSYVDDGYLYLKSKTSLYSDQARQASALLNSEEYSSLHQVILELTLDGYTVNMEFVSPNNRVVLAYQEPQLFVLNVRNNTTGEYIKYDDLYANAKIRPYLINAYGISDPTTWVEGVRELEGVEGYIAVLNTGQRFKVKTEWYSALHHTKDSITSNERLFASVVSANSDDLRSLFAGDEYAIKKISAFEQAYLDYLGKSLELCQSFYDEYRGRARKDYAIAAQKATVNQRHLFGVIMNMYEGTVDVDKLLKDLERVFLKYWAGYVPKEYEKEIELSEE。
连接酶6,SEQ ID NO:6,Vibrio phage,RNA ligase 1:
MTTQELYNHLMTLTDDAEGKFFFADHISPLGEKLRVFSYHIASYSDWLLPGALEARGIMFQLDEQDKMVRIVSRPMEKFFNLNENPFTMDLDLTTTVQLMDKADGSLISTYLTGENFALKSKTSIFSEQAVAANRYIKLPENRDLWEFCDDLTQAGCTVNMEWCAPNNRIVLEYPEAKLVILNIRDNETGDYVSFDDIPLPALMRVKKWLVDEYDPETAHADDFVEKLRATKGIEGMILRLANGQSVKIKTQWYVDLHSQKDSVNVPKKLVTTILNNNHDDLYALFADDKPTIDRIREFDSHVSKTVSASFHAVSQFYVKNRHMSRKDYAIAGQKTLKPWEFGVAMIAYQNQTVEGVYEALVGAYLKRPELLIPEKYLNEA。
连接酶7,SEQ ID NO:7,Escherichia phage JN02,RNA ligase 1:
MEKLYYNLLSLCKSSSDRKFFYSDDVSPIGKKYRIFSYNFASYSDWLLPDALECRGIMFEMDGETPVRIASRPMEKFFNLNENPFTLSINLDDVKYLMTKEDGSLVSTYLDGGTVRFKSKGSIKSDQAVSATSILLDIDHKNLADRLLELCNDGFTANFEYVAPTNKIVLTYPEKRLILLNIRDNNTGEYIEYDDIYLDPVFRKYLVDRFEVPEGDWTSDVKSSTNIEGYVAVMKDGSHFKLKTDWYVALHTTRDSISSPEKLFLAIVNGASDDLKAMYADDEFSFKKVELFEKAYLDFLDRSFYICLDTYDKHKGKDRKTYAIEAQAVCKGAQTPWLFGIIMNLYQGGSKEQMMTALESVFIKNHKNFIPEGY。
连接酶8,SEQ ID NO:8,Klebsiella phage KP15,RNA ligase 2:
MFKKYSSLTNHYEGKFINGVIMNGLTGGVWVAREKIHGANFSFITDDGITVTPAKRTDVVKPAEDFYGCSAVVAKYSPGIRKMWETLKKTGTYDDLVIQVYGEFAGRGVQKDVDYGEKDFYVFDIRVNGEFLPDNLCSLISRSHGLKMAPLLGYGTFEEIKELPITFESVVNKANSGIGSDNTVYGEFVYPIMDVEEGNIAEGFVMKPVSPAFMPNGERVAIKCKTTKFTEKKAKKATRFNAPVSLSEKDKNQLDEFVCYLTENRVKNVLSKLDLASITAKDFGRIMGLTVQDAIEEISRNHGPFIEQFEDPAMAKKLFVTEAQNMIRPVWGKILNHEF。
连接酶9,SEQ ID NO:9,Thermococcus,RNA ligase 2-like:
MVSSYFRNLLLKLGLPEERLEVLEGKGALAEDEFEGIRYVRFRDSARNFRRGTVVFETGEAVLGFPHIKRVVQLENGIRRVFKNKPFYVEEKVDGYNVRVVKVKDKILAITRGGFVCPFTTERIEDFVNFDFFKDYPNLVLVGEMAGPESPYLVEGPPYVKEDIEFFLFDIQEKGTGRSLPAEERYRLAEEYGIPQVERFGLYDSSKVGELKELIEWLSEEKREGIVMKSPDMRRIAKYVTPYANINDIKIGSHIFFDLPHGYFMGRIKRLAFYLAENHVRGEEFENYAKALGTALLRPFVESIHEVANGGEVDETFTVRVKNITTAHKMVTHFERLGVKIHIEDIEDLGNGYWRITFKRVYPDATREIRELWNGLAFVD。
连接酶10,SEQ ID NO:10,Archaea,tRNA-splicing ligase :
MVVPLKRIDKIRWEIPKFDKRMRVPGRVYADEVLLEKMKNDRTLEQATNVAMLPGIYKYSIVMPDGHQGYGFPIGGVAAFDVKEGVISPGGIGYDINCGVRLIRTNLTEKEVRPRIKQLVDTLFKNVPSGVGSQGRIKLHWTQIDDVLVDGAKWAVDNGYGWERDLERLEEGGRMEGADPEAVSQRAKQRGAPQLGSLGSGNHFLEVQVVDKIFDPEVAKAYGLFEGQVVVMVHTGSRGLGHQVASDYLRIMERAIRKYRIPWPDRELVSVPFQSEEGQRYFSAMKAAANFAWANRQMITHWVRESFQEVFKQDPEGDLGMDIVYDVAHNIGKVEEHEVDGKRVKVIVHRKGATRAFPPGHEAVPRLYRDVGQPVLIPGSMGTASYILAGTEGAMKETFGSTCHGAGRVLSRKAATRQYRGDRIRQELLNRGIYVRAASMRVVAEEAPGAYKNVDNVVKVVSEAGIAKLVARMRPIGVAKGAAALEH。
连接酶11,SEQ ID NO:11,thermophilic bacteriophage,RNA ligase 1:
MESMNVKYPVEYLIEHLNSFESPEVAVESLRKEGIMCKNRGDLYMFKYHLGCKFDKIYHLACRGAILRKTDSGWKVLSYPFDKFFNWGEELQPEIVNYYQTLRYASPLNEKRKAGFMFKLPMKLVEKLDGTCVVLYYDEGWKIHTLGSIDANGSIVKNGMVTTHMDKTYRELFWETFEKKYPPYLLYHLNSSYCYIFEMVHPDARVVVPYEEPNIILIGVRSVDPEKGYFEVGPSEEAVRIFNESGGKINLKLPAVLSQEQNYTLFRANRLQELFEEVTPLFKSLRDGYEVVYEGFVAVQEIAPRVYYRTKIKHPVYLELHRIKTTITPEKLADLFLENKLDDFVLTPDEQETVMKLKEIYTDMRNQLESSFDTIYKEISEQVSPEENPGEFRKRFALRLMDYHDKSWFFARLDGDEEKMQKSEKKLLTERIEKGLFK。
连接酶12,SEQ ID NO:12,Diplonema papillatum,RNA ligase 2:
MPLSQGAALIRSPTVTAEEKVDGSNLAVYLDASGAVTCQNRGKFVTPSSGSQWGGQLATWLESHYCELVSLLRQRYILYGEWLLARHSIRYQSLPDYFVAFDVYDRTARRFLSAKKRNAFLSQSTIPVVKPLAVGPFAEADILRLLGSPSRYGAAKVEGIYLRSDSGAWLQQRAKVVNSDFLQTIDDDGHWQKRVLEKNQLKY。
连接酶13,SEQ ID NO:13,virus,RNA ligase 2-like:
MVYICIDTGSHAKGYAVESSDTDYHIYTKCDRETFEKFIDNKELLKNRHAKDESGNDVKYVDLYTGLIGILTGKSPELSMFSKREDFKDKYGIENLQLYEFVTKLMTVSMVKIIYTLMRYKILNNAKGLLQLMFNYVYVEYYLDYKRAPKSTKILNMLFNVGDEIKITMDKNNQLVVNDLNVLDLNKNNGGYKIDETLTLFVKNVKLLKLYVKLMQRGEYQQEWTEYFQQWKQQLQDRLHHVPEPPERTDIRHNIVMYALNERGPVMPEDENKIVYQIYPSVSHLDQGKKGTLADKEIIVQEKLDGCNFRIICNQNKITYGSRNTYRPDGNFMNYYRIRKDLETCMRSLQARFNDGFIVYGELMGWKDDAKTTPINVINYVDQKESLKYYAYEIQLYGGEFVPFVEAQELLTNVGFNTIPCHKYLYNDFVERLNFKSLMFPQSPLEGFIIRCGNLIYKLKSDYKDLNKLKIEKGPFEWLTCDYIKSNCDAIDKSDMMKILIFCYNMCKVKNYNEKLLFNKVFNLFRQQFNLNHNDYKNLYKQYVNMCKCTEYK。
连接酶14,SEQ ID NO:14,Archaea,RNA ligase 3:
MVSSVYKEILVKLGLTEDRIETLEMKGGIIEDEFDGIRYVRFKDSAGKLRRGTVVIDEEYVIPGFPHIKRIINLRSGIRRIFKRGEFYVEEKVDGYNVRVVMYKGKMLGITRGGFICPFTTERIPDFVPQEFFKDNPNLILVGEMAGPESPYLVEGPPYVKEDIQFFLFDVQEIKTGRSLPVEERLKIAEEYGINHVEVFGKYTKDDVDELYQLIERLSKEGREGIIMKSPDMKKIVKYVTPYANINDIKIGARVFYELPPGYFTSRISRLAFYLAEKRIKGEEFERVAKELGSALLQPFVESIFDVEQEEDIHELFKVRVKRIETAYKMVTHFEKLGLKIEIVDIEEIKDGWRITFKRLYPDATNEIRELIGGKAFVD。
连接酶15,SEQ ID NO: 15, Trypanosoma brucei gambiense, RNA ligase 2:
MLRCLGVRHFRRTPLLFVGGDGSIFERYTEIDNSNERRINALKGCGMFEDEWIATEKVHGANFGIYSIEGEKMIRYAKRSGIMPPNEHFFGYHILIPELQRYVTSIREMLCEKQKKKLHVVLINGELFGGKYDHPSVPKTRKTVMVAGKPRTISAVQTDSFPQYSPDLHFYAFDIKYKETEGGDYTTLVYDEAIELFQRVPGLLYARAVIRGPMSKVAAFDVERFVTTIPPLVGMGNYPLTGNWAEGLVVKHSRLGMAGFDPKGPTVLKFKCTAFQEISTDRAQGPRVDEMRNVRRDSINRAGVQLPDLESIVQDPIQLEASKLLLNHVCENRLKNVLSKIGTEPFEKEEMTPDQLATLLAKDAMKDFLKDTEPSIVNIPVLIRKDLTRYVIFESRRLVCSQWKDILKRQSPDFSE。
连接酶16,SEQ ID NO: 16, Acidobacteria bacterium, RNA ligase 1:
MKQMYDNLKALTQKNDMFFSSIQTTPSNKPVEIFSYHIASYSDWLEPDAIECRGIMFDITDKENPVILSRPMEKFFNLGENPLALPEDVLPLVKTIEEKRDGSLISTYLDDGKLYTKSKGSLYSDQANDSNRFLMRSENKDFKQALKTLAELGYTANMEYTSPKNQIVLKYEKQELIVLNIRNTETGDYLTLDDLAELDAENPEHTIYTHIAERFVDYEEVDGMSDEDVERIRDMKGIEGYVLVGQNQRVKLKTDWYVNLHRLKDNINNNRRLVESVVESRTDDLRQLFEHDQGSIDKIKEFEQYVLSKIKSCLAEVRTVYERVKHLDRKHYAINAQRYVDYTPLFSVIMRQFDDYNEENVVENIKQIALKNVDDFIPMHYK。
连接酶17,SEQ ID NO: 17, Klebsiella phage KP27, RNA ligase 2:
MFKKYSSLTNHYEGKFINGVIMNGLTGGVWVAREKIHGANFSFITDDGITVTPAKRTDVVKPAEDFYGCSAVVAKYSPGIRKMWETLKKTGTYDDLVIQVYGEFAGRGVQKDVDYGEKDFYVFDIRVNGEFLPDNLCSLISRSHGLKMAPLLGYGTFEEIKELPITFESVVNKANSGIGSDNTVYGEFVYPIMDVEEGNIAEGFVMKPVSPAFMPNGERVAIKCKTTKFTEKKAKKATRFNAPVSLSEKDKNQLDEFVCYLTENRVKNVLSKLDLASITAKDFGRIMGLTVQDAIEEISRNHGPFLEQFEDPAMAKKLFVTEAQNMIRPVWGKILNHEF。
连接酶18,SEQ ID NO: 18, Vibrio phage, RNA ligase 2:
MNVQELYKNLMSLADDAEGKFFFADHLSPLGEKFRVFSYHIASYSDWLLPGALEARGIMFQLDDNDEMIRIVSRPMEKFFNLNENPFTMELDLTTTVQLMDKADGSLISTYLSGENFALKSKTSIFSEQAVAANRYIKKPENRDLWEFCDDCTQAGLTVNMEWCAPNNRIVLEYPEAKLVILNIRDNETGDYVSFDDIPQSALMRVKQWLVDEYDPATAHEPDFVEKLRDTKGIEGMILRLANGQSVKIKTQWYVDLHSQKDSVNVPKKLVTTILNGNHDDLYALFADDKPTIERIREFDSHVTKTLTNSFNAVRQFYARNRHLARKDYAIAGQKVLKPWEFGVAMIAYQKQTVEGVYESLVTAYLKRPELAIPEKYLNGV。
连接酶19,SEQ ID NO: 19, Vibrio phage JN02, RNA ligase 2:
MFKKYSSLENHYNSKFIEKLYTNGLTTGVWVAREKIHGTNFSLIIERDNVTCAKRTGPILPAEDFYGYEIVLKKYDKAIKAVQEVMESISTSVPVSYQVFGEFAGGGIQKGVDYGEKDFYVFDIIINTESDDTYYMSDYEMQDFCNTFGFKMAPMLGRGTFDSLIMIPNDLDSVLAAYNSTASEDLVEANNCVFDANVIGDNTAEGYVLKPCFPKWLSNGTRVAIKCKNSKFSEKKKSDKPVKTQVPLTEIDKNLLDVLACYVTLNRVNNVISKIGTVTPKDFGKVMGLTVQDILEETSREGIVLTSSDNPNLVKKELVRMVQDVLRPAWIELVS。
连接酶20,SEQ ID NO: 20, Vibrio phage JS98, RNA ligase 2:
MFKKYSSLENHYNSKFIEKLRTNGLTGGEWVAREKIHGTNFSLIIERDAVTCAKRTGPILPAEDFYGYEIVLKNYADSIKSVQHLIESINYQSYQIYGELAGPGIQKNVDYGDKDFYVFDIRVTKEDGTESVLTDTLMEAFCIIHKFKVAPCLATGSFEDLIKLPNDFDSVIPDYNFAVDNAGLTIANSTDFIPKVEGKVFTAEGFVLKPDIPTWLPNGNRVAIKCKNSKFSEKKKSDKPIKAAVVLSQDDMDLMWQFTDYVTVNRINNVISKIGEVSKKDFGKVMGLTVQDILEEAAREELELTDAENPVEVKKQLVECVKDTLRAVWIELVS。
连接酶21,SEQ ID NO: 21, Vibrio phage nt-1, RNA ligase 2:
MNELYNNLMTLAESAEGKFFFADHLSPQGEKFRVFSYHIASYSDWLLPDALEARGIMFQLDENDEMIRIVSRPMEKFFNLGENPFTMDLDLTTTVQLMDKADGSLISTYLTGDNFALKSKTSIYSEQAVAANRYIKHVDNRDLWEFCDDCAAQNFTVNMEWCAPNNRIVLEYTEPKLIILNIRDNETGQYVSFDDIPIGALTRIKKWLVDEYDPMTAHVDDFVETLKAKKGIEGMILRLASGQSVKIKTTWYVDLHAQKDSVNSPKKLVTTILNKNHDDLYALFADDKPTIERIREFDDHVSKKVVESFHAVSQYYTKNRHLSRKDFAIAGQKALKPWEFGVAMIAYQNQTVEGVVTMLINAYLKRPELLIPEKYLSEV。
连接酶22,SEQ ID NO: 22, Vibrio phage phi-ST2, RNA ligase 2:
MSFVKYTSLENSYRQAFVDKCDMLGVKEWVALEKIHGANFSFIVEFKPSTEEVPGEMSVTPAKRTSTIGANAMGDYDFYGCTSVVEAHIEKMQDISNWLFANDFIKNDETIIVYGELAGKGIQKEVNYGDKDFWAYDILCPETGEFLDWDVVLKACKFAGVKTTHEIARGTLDELLKIDPLFRSFHTPADVDSENVAEGFVVKQLKAEKRLHNGSRAILKVKNEKFKEKKNKQGKTPRAKVVLTEEQEKLHAAFSCYLTENRLRNVLSKIGKVEAKQFGMVSGLFVKDAKDEFERDERDEVAIPRDDWDVIKRSLVNVANEILRKNWLNIVDGTF。
下面将结合具体的实施例来进一步详细解释本申请的有益效果。
实施例1 RNA连接酶纯化制备
将编码RNA连接酶的基因构建与pET28a(+)载体上,并转化入大肠杆菌BL21(DE3)表达菌株。表达菌株以0.1%的接种量接种至5 mL LB培养基中(含50 µg/mL),于37℃培养16h。得到的培养液以1%的接种量转接到500 mL LB培养基中,于37℃培养至OD600=0.6时,加入0.1 mM的IPTG,在20℃诱导16 h。得到的诱导培养液经离心获得菌泥。菌泥用裂解缓冲液(50 mM Tris-Cl pH8.0, 0~500 mM NaCl,10%甘油)重悬,使得菌体终浓度为10%,经超声破碎,离心后得到粗酶液。粗酶液中加入10 mM咪唑,用0.22 µm滤膜过滤后得到的酶液用镍柱进行纯化,经过脱盐换液后,用强阴离子柱进行二次纯化,得到的酶液经脱盐换液后储存于30%甘油中。
实施例2 RNA连接酶催化非模板依赖性的非天然RNA连接
将底物1和底物2加入到干净的试剂瓶中(底物1和底物2的序列如表1所示),配制反应体系,使得终体积为100 µL,底物1和底物2的浓度为500 µM,ATP浓度为1 mM,Tris-HCl(pH 7.5 @ 25℃)浓度为50 mM,MgCl2浓度为10 mM,DTT(二硫苏糖醇)浓度为1 mM,连接酶的浓度为0.2 mg/mL。将反应体系于16℃反应16 h。得到的反应体系经80℃ 5 min失活连接酶,经12000 rpm离心去除沉淀,上清以SDS-PAGE和UPLC进行检测。结果显示连接酶6和酶8能催化终产品的合成,SDS-PAGE电泳图如图3所示,其中泳道1为Marker,泳道2为对照组(无连接酶),泳道3为利用连接酶9催化的体系,泳道4为利用连接酶10催化的体系,泳道5为利用连接酶11催化的体系,泳道6为利用连接酶13催化的体系,泳道7为利用连接酶6催化的体系,泳道8为利用连接酶8催化的体系,泳道9为利用连接酶12催化的体系。UPLC的结果显示底物已经基本反应完全转化完全。表明连接酶催化合成非天然的RNA的方法是成功的。
表1
。
其中,A、C、G或U后的m表示对于该核糖核苷酸的2'甲氧基修饰,f表示对于该核糖核苷酸的2'氟修饰。
底物1的第1、2、3、4、5、6、8、12和13位核糖核苷酸上具有2'甲氧基修饰,7、9、10和11位核糖核苷酸上具有2'氟修饰。
底物2的第1、2、5和6位核糖核苷酸上具有2'甲氧基修饰,3和4位核糖核苷酸上具有2'氟修饰。
然而并非所有的连接酶都能实现非天然RNA的拼接,以上述同样的条件进行反应,连接酶9、10、11、12就不具备这种活性,连接酶13产生大量的底物剩余和杂质条带的生成。
实施例3 RNA连接酶催化非模板依赖性的短链非天然RNA连接
将底物3和底物4加入到干净的试剂瓶中(底物3和底物4的序列如表2所示),配制反应体系,使得终体积为100 µL,RNA片段3和4的浓度为1000 µM,ATP浓度为1.5 mM,Tris-HCl(pH 7.5 @ 25℃)浓度为50 mM,MgCl2浓度为10 mM,DTT浓度为1 mM,连接酶的浓度为0.2 mg/mL。将反应体系于16℃反应16 h。得到的反应体系经80℃ 5 min失活连接酶,经12000 rpm离心去除沉淀,上清以SDS-PAGE和UPLC进行检测。结果显示在没有加入连接酶的对照体系中(孔道3),没有目标产品的生成,而加入RNA连接酶的体系中发现了终产品的合成,SDS-PAGE电泳图如图4所示,其中泳道1为利用连接酶6催化的体系,泳道2为利用连接酶11催化的体系,泳道3为对照组(无连接酶),对于其他连接酶的进行相同的筛选。但是由于底物3和4较短。在SDS-PAGE中不能清晰的观测底物的剩余情况,因此用UPLC检测反应的情况。结果显示底物已经基本反应完全转化完全,利用连接酶7催化的反应的UPLC色谱图如图5所示。表明连接酶催化合成非天然的RNA的方法是成功的。所用的RNA连接酶及催化活性如表3所示。
表2
。
其中,A、C、G或U后的m表示对于该核糖核苷酸的2'甲氧基修饰,f表示对于该核糖核苷酸的2'氟修饰。
底物3的第1、2、5和6位核糖核苷酸上具有2'甲氧基修饰,3和4位核糖核苷酸上具有2'氟修饰。
底物4的第1、2、5、6、9和10位核糖核苷酸上具有2'甲氧基修饰,3、4、7和8位核糖核苷酸上具有2'氟修饰。
表3
。
注:本申请中“+++”表示催化活性70%~100%,“++”表示催化活性60%~70%(不包括70%的端点值),“-”表示基本无催化活性。
实施例4 RNA连接酶催化非模板依赖性的长链非天然RNA连接
将底物7和8加入到干净的试剂瓶中,配制反应体系,使得终体积为100 µL,底物7和8的浓度为300 µM,ATP浓度为0.6 mM,Tris-HCl(pH 7.5 @ 25℃)浓度为50 mM,MgCl2浓度为10 mM,DTT浓度为1 mM,连接酶的浓度为0.2 mg/mL。将反应体系于37℃反应16 h。得到的反应体系经80℃ 5 min失活连接酶,经12000 rpm离心去除沉淀,上清以SDS-PAGE和UPLC进行检测。利用连接酶4催化的反应的UPLC色谱图如图6所示。结果显示加入RNA连接酶的体系中有产品的生成,表明连接酶催化合成非天然的RNA的方法是成功的。所用的RNA连接酶及催化活性如表4所示。
表4
。
将底物5和6加入到干净的试剂瓶中,配制反应体系,使得终体积为100 µL,底物5和6的浓度为100 µM,ATP浓度为0.2 mM,Tris-HCl(pH 7.5 @ 25℃)浓度为50 mM,MgCl2浓度为10 mM,DTT浓度为1 mM,连接酶的浓度为0.2 mg/mL。将反应体系于37℃反应16 h。得到的反应体系经80℃ 5 min失活连接酶,经12000 rpm离心去除沉淀,上清以SDS-PAGE和UPLC进行检测。利用连接酶5催化的反应的UPLC色谱图如图7所示,结果显示在加入RNA连接酶的体系中有终产品的生成,表明连接酶催化合成非天然的RNA的方法是成功的。所用的RNA连接酶及催化活性如表5所示。
底物5、6、7和8的序列如表6所示。
表5
。
表6
。
其中,L96的结构如图8所示,其中表示L96基团连接的碱基;A、C、G或U后的m表示对于该核糖核苷酸的2'甲氧基修饰。
底物5、6、7和8的所有核糖核苷酸上都具有2'甲氧基修饰。
实施例5 RNA连接酶催化合成多片段的非天然RNA底物连接
Step1:将底物10和11加入到干净的试剂瓶中,配制反应体系,使得终体积为100 µL,底物10和11的浓度为800 µM,ATP浓度为1.6 mM,Tris-HCl(pH 7.5 @ 25℃)浓度为50mM,MgCl2浓度为10 mM,DTT浓度为1 mM,连接酶的浓度为0.2 mg/mL。将反应体系于16℃反应16 h。经检测底物已经消耗完全。
Step2:加入10 U/µL的T4多聚核苷酸激酶8 µL,将反应体系于37℃反应6 h,得到的反应体系于80℃ 5 min失活T4多聚核苷酸激酶和连接酶。
Step3:加入与底物10等摩尔数的底物9,补加等摩尔的ATP,最终体系底物浓度为200 µM,加入0.2 mg/mL的连接酶,于16℃反应16 h。得到的终反应体系于80℃ 5 min失活连接酶,经12000 rpm离心去除沉淀,上清以SDS-PAGE和UPLC进行检测。结果显示在最终的体系中有终产品的生成。终产品由5'端至3'端由底物9、底物10和底物11连接而成,产品的转化率达到60%以上,表明RNA连接酶催化合成非天然的RNA的方法是成功的。所用的RNA连接酶及催化活性如表7所示。
底物9、10和11的序列如表8所示,底物9、10和11的示意图如图9所示。
表7
。
表8
。
其中,A、C、G或U后的m表示对于该核糖核苷酸的2'甲氧基修饰,f表示对于该核糖核苷酸的2'氟修饰。
底物9的第1、2、5和6位核糖核苷酸上具有2'甲氧基修饰,3和4位核糖核苷酸上具有2'氟修饰。
底物10的第3、4、7和8位核糖核苷酸上具有2'甲氧基修饰,1、2、5和6位核糖核苷酸上具有2'氟修饰。
底物11的第1、2、5、6、9和10位核糖核苷酸上具有2'甲氧基修饰,3、4、7和8位核糖核苷酸上具有2'氟修饰。
从以上的描述中,可以看出,本发明上述的实施例实现了如下技术效果:本发明发现了部分RNA连接酶能够连接非天然核苷酸,利用上述制备方法,通过上述RNA连接酶催化合成的方法,能够连接组装2条或更多条非天然RNA片段,从而合成更长的非天然RNA链,无需模板链的引入即可实现特异性高效性的连接。可实现高效催化,较化学法合成非天然RNA能有效提高效率和收率。也克服了现有技术中难以利用现有的用于连接天然核酸的RNA连接酶连接非天然核苷酸的问题。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种非天然RNA的制备方法,其特征在于,所述制备方法包括:
利用RNA连接酶将底物供体的3'端与底物受体的5'端连接形成磷酸二酯键,所述连接不需要模板链,制备获得所述非天然RNA,
所述底物供体和/或所述底物受体中包括一个或多个非天然核苷酸;
所述底物受体的5'端为磷酸基团;
所述底物供体的3'端为羟基基团;
所述RNA连接酶为:
SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22所示的RNA连接酶中的一种或多种;
所述底物供体和所述底物受体由所述非天然核苷酸组成;
所述非天然RNA的长度>3 nt。
2.根据权利要求1所述的制备方法,其特征在于,所述制备方法中的所述底物供体包括一个或n个,n为2或3,
当所述底物供体为n个时,所述制备方法包括:
第一底物供体与第一底物受体连接,形成第二底物受体;
第二底物供体再与所述第二底物受体连接,形成第三底物受体;
直至第n-1底物供体与第n-1底物受体连接,形成第n底物受体;
第n底物供体与所述第n底物受体连接,形成所述非天然RNA。
3.根据权利要求2所述的制备方法,其特征在于,
所述第一底物受体的5'端为磷酸基团;
所述第n底物供体的5'端为5'保护基;
所述第二底物供体至所述第n-1底物供体的5'端为羟基;
所述第二底物供体至所述第n底物供体的3'端为羟基。
4.根据权利要求3所述的制备方法,其特征在于,所述第二底物受体的前体至所述第n底物受体的前体的5'端均为所述5'保护基,所述5'保护基包括羟基;
在将所述第二底物受体至所述第n底物受体与相应所述底物供体连接前,将所述第二底物受体的前体至所述第n底物受体的前体上的所述5'保护基替换为磷酸基团;
利用多聚核苷酸激酶分别将所述第二底物受体的前体至所述第n底物受体的前体的5'端均修饰为磷酸基团,获得5'端为磷酸基团的所述底物受体,并失活所述多聚核苷酸激酶。
5.根据权利要求1所述的制备方法,其特征在于,所述制备方法中的所述底物受体包括一个或n个,n为2或3;
当所述底物受体为n个时,所述制备方法包括:
将第一底物供体与所述第一底物受体连接,形成第二底物供体;
将第二底物受体与所述第二底物供体连接,形成第三底物供体;
直至将第n-1底物受体与第n-1底物供体连接,形成第n底物供体;
将第n底物受体与所述第n底物供体连接,形成所述非天然RNA。
6.根据权利要求5所述的制备方法,其特征在于,所述底物受体的3'端为保护基团;相应地,连接获得的所述第二底物供体的前体至所述第n底物供体的前体的3'端均为所述保护基团;
在将所述第二底物供体至所述第n底物供体与相应所述底物受体连接前,对所述保护基团进行脱保护,获得3'端为羟基的所述底物供体或所述非天然RNA。
7.根据权利要求1所述的制备方法,其特征在于,所述非天然核苷酸包括:具有核糖2'位修饰、核糖骨架修饰、碱基修饰或磷酸骨架修饰中的一种或多种的核糖核苷酸;
所述核糖2'位修饰包括2'-甲氧基修饰、2'-氟修饰、2'-甲氧乙基修饰、2'-FANA修饰、锁核酸修饰或己糖醇核酸修饰;
所述核糖骨架修饰包括将核苷酸中的核糖替换为ribuloNA、TNA、tPhoNA或dXNA;
所述碱基修饰包括脱氮腺嘌呤C7修饰、脱氮鸟苷C7修饰、胞嘧啶C5修饰或尿苷C5修饰;
所述磷酸骨架修饰包括PS修饰。
8.根据权利要求1所述的制备方法,其特征在于,所述底物供体和所述底物受体的长度均为2-50 nt。
9.根据权利要求1所述的制备方法,其特征在于,所述底物受体的3'端为保护基团;所述底物供体的5'端为5'保护基。
10.根据权利要求9所述的制备方法,其特征在于,所述保护基团包括N-乙酰半乳糖胺基团、磷酸基团、-O-NH2、叠氮基、氰乙基、烯丙基或2-硝基苄基;所述5'保护基包括羟基、氢或甲基。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311335114.7A CN117070514B (zh) | 2023-10-16 | 2023-10-16 | 非天然rna的制备方法及产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311335114.7A CN117070514B (zh) | 2023-10-16 | 2023-10-16 | 非天然rna的制备方法及产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117070514A CN117070514A (zh) | 2023-11-17 |
CN117070514B true CN117070514B (zh) | 2024-04-26 |
Family
ID=88717619
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311335114.7A Active CN117070514B (zh) | 2023-10-16 | 2023-10-16 | 非天然rna的制备方法及产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117070514B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118127102B (zh) * | 2024-05-10 | 2024-08-06 | 天津凯莱英生物科技有限公司 | 酶法合成具有3’-o-磷酸修饰的核酸的方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1408025A (zh) * | 1999-09-22 | 2003-04-02 | 锦可贝基因技术公司 | 改良多聚核苷酸合成的方法和成分 |
WO2019036638A1 (en) * | 2017-08-18 | 2019-02-21 | Modernatx, Inc. | METHODS FOR PREPARING MODIFIED RNA |
CN111971396A (zh) * | 2018-03-30 | 2020-11-20 | 住友化学株式会社 | 单链rna的制造方法 |
CN112105627A (zh) * | 2017-12-29 | 2020-12-18 | 斯克利普斯研究所 | 非天然碱基对组合物及使用方法 |
CN115491399A (zh) * | 2022-10-21 | 2022-12-20 | 中国海洋大学 | 一种制备腺苷酸化核酸产物的方法 |
CN115896215A (zh) * | 2022-10-21 | 2023-04-04 | 凯莱英生命科学技术(天津)有限公司 | 阿糖类核苷一锅法生物合成的方法及组合物 |
-
2023
- 2023-10-16 CN CN202311335114.7A patent/CN117070514B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1408025A (zh) * | 1999-09-22 | 2003-04-02 | 锦可贝基因技术公司 | 改良多聚核苷酸合成的方法和成分 |
WO2019036638A1 (en) * | 2017-08-18 | 2019-02-21 | Modernatx, Inc. | METHODS FOR PREPARING MODIFIED RNA |
CN112105627A (zh) * | 2017-12-29 | 2020-12-18 | 斯克利普斯研究所 | 非天然碱基对组合物及使用方法 |
CN111971396A (zh) * | 2018-03-30 | 2020-11-20 | 住友化学株式会社 | 单链rna的制造方法 |
CN115491399A (zh) * | 2022-10-21 | 2022-12-20 | 中国海洋大学 | 一种制备腺苷酸化核酸产物的方法 |
CN115896215A (zh) * | 2022-10-21 | 2023-04-04 | 凯莱英生命科学技术(天津)有限公司 | 阿糖类核苷一锅法生物合成的方法及组合物 |
Non-Patent Citations (1)
Title |
---|
唐愫等.分子生物学基础.杭州大学出版社,1992,第80页第1段. * |
Also Published As
Publication number | Publication date |
---|---|
CN117070514A (zh) | 2023-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5700667A (en) | Strategy for the production of RNA from immobilized templates | |
CN107532210B (zh) | Dna合成的方法 | |
EP3481838B1 (en) | Novel processes for the production of oligonucleotides | |
JP7438259B2 (ja) | オリゴヌクレオチドの産生のための新規プロセス | |
CN117070514B (zh) | 非天然rna的制备方法及产品 | |
CN117070583B (zh) | 抑制PCSK9基因表达的siRNA的制备方法 | |
WO2024119625A1 (zh) | 双链rna的合成方法及rna连接酶在双链rna合成中的应用 | |
JP2023519953A (ja) | クラス2のii型crisprシステム | |
WO2017028548A1 (zh) | 镜像核酸复制体系 | |
JP4762481B2 (ja) | 無細胞タンパク質合成用転写鋳型の設計および構築、並びにこれを用いる希釈バッチ方式コムギ胚芽無細胞タンパク質合成法 | |
TW202405168A (zh) | 製造含有寡核苷酸之聚核苷酸的新穎方法 | |
CN117070513B (zh) | 含有硫代磷酸酯键的rna及其制备方法 | |
JP2023505188A (ja) | 核酸組成物 | |
Groaz et al. | Hexitol nucleic acid (HNA): from chemical design to functional genetic polymer | |
CN115975974A (zh) | 适合体外合成rna的t7-rna聚合酶突变体及其应用 | |
CN118460652B (zh) | 一种治疗非动脉性缺血性视神经病变的siRNA的制备方法 | |
CN118460653B (zh) | 一种治疗α1-抗胰蛋白酶缺乏症的siRNA的制备方法 | |
CN107460177A (zh) | 可利用化学修饰核苷酸的rna聚合酶突变体 | |
KR20220061480A (ko) | 하이드로겔화 핵산을 이용한 고분자량 단백질 생산용 원형 핵산 템플릿의 제조방법 및 고분자량 단백질 생산 시스템 | |
WO2020193610A1 (en) | Method and products for producing rna molecules | |
CN118460651A (zh) | 制备Cemdisiran的方法 | |
CN118460652A (zh) | 一种治疗非动脉性缺血性视神经病变的siRNA的制备方法 | |
CN117070512B (zh) | tRNA及其生物合成方法 | |
CN118460650A (zh) | 一种Nedosiran的制备方法 | |
CN118460656A (zh) | 一种Lumasiran的制备方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |