CN117070513A - 含有硫代磷酸酯键的rna及其制备方法 - Google Patents
含有硫代磷酸酯键的rna及其制备方法 Download PDFInfo
- Publication number
- CN117070513A CN117070513A CN202311335112.8A CN202311335112A CN117070513A CN 117070513 A CN117070513 A CN 117070513A CN 202311335112 A CN202311335112 A CN 202311335112A CN 117070513 A CN117070513 A CN 117070513A
- Authority
- CN
- China
- Prior art keywords
- substrate
- seq
- rna
- ligase
- modification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000002360 preparation method Methods 0.000 title abstract description 36
- 239000000758 substrate Substances 0.000 claims abstract description 261
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract description 151
- 238000012986 modification Methods 0.000 claims abstract description 140
- 230000004048 modification Effects 0.000 claims abstract description 138
- 101710086015 RNA ligase Proteins 0.000 claims abstract description 83
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 claims abstract description 62
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims abstract description 43
- 238000000034 method Methods 0.000 claims abstract description 43
- 125000000446 sulfanediyl group Chemical group *S* 0.000 claims abstract description 29
- 238000006555 catalytic reaction Methods 0.000 claims abstract description 20
- 108090000790 Enzymes Proteins 0.000 claims abstract description 10
- 102000004190 Enzymes Human genes 0.000 claims abstract description 10
- 238000006467 substitution reaction Methods 0.000 claims abstract description 10
- 125000004430 oxygen atom Chemical group O* 0.000 claims abstract description 6
- 229910052717 sulfur Inorganic materials 0.000 claims abstract description 6
- 125000004434 sulfur atom Chemical group 0.000 claims abstract description 6
- 239000002336 ribonucleotide Substances 0.000 claims description 50
- 108091028664 Ribonucleotide Proteins 0.000 claims description 48
- 125000002652 ribonucleotide group Chemical group 0.000 claims description 48
- 108091081021 Sense strand Proteins 0.000 claims description 42
- 230000000692 anti-sense effect Effects 0.000 claims description 42
- 102000040650 (ribonucleotides)n+m Human genes 0.000 claims description 36
- 229910019142 PO4 Inorganic materials 0.000 claims description 31
- 239000002773 nucleotide Substances 0.000 claims description 28
- 125000003729 nucleotide group Chemical group 0.000 claims description 28
- 239000010452 phosphate Substances 0.000 claims description 28
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 claims description 27
- 102000039446 nucleic acids Human genes 0.000 claims description 17
- 108020004707 nucleic acids Proteins 0.000 claims description 17
- 125000006239 protecting group Chemical group 0.000 claims description 17
- 150000007523 nucleic acids Chemical class 0.000 claims description 16
- -1 hexitol nucleic acid Chemical class 0.000 claims description 12
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 claims description 11
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 claims description 10
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 claims description 9
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 claims description 9
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 claims description 9
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 claims description 9
- 238000004519 manufacturing process Methods 0.000 claims description 9
- 230000003197 catalytic effect Effects 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 8
- 229910021645 metal ion Inorganic materials 0.000 claims description 7
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 claims description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 6
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 claims description 6
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 claims description 4
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 claims description 3
- 229940104302 cytosine Drugs 0.000 claims description 3
- 229910052739 hydrogen Inorganic materials 0.000 claims description 3
- 239000001257 hydrogen Substances 0.000 claims description 3
- 230000009870 specific binding Effects 0.000 claims description 3
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 claims description 3
- 229940045145 uridine Drugs 0.000 claims description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical compound OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 claims description 2
- 229910000147 aluminium phosphate Inorganic materials 0.000 claims description 2
- 125000004122 cyclic group Chemical group 0.000 claims description 2
- 235000011007 phosphoric acid Nutrition 0.000 claims 2
- 150000003016 phosphoric acids Chemical class 0.000 claims 1
- 238000006243 chemical reaction Methods 0.000 description 38
- 235000021317 phosphate Nutrition 0.000 description 28
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 23
- 239000000047 product Substances 0.000 description 23
- 150000001413 amino acids Chemical group 0.000 description 16
- 239000003814 drug Substances 0.000 description 16
- 101710188535 RNA ligase 2 Proteins 0.000 description 14
- 101710204104 RNA-editing ligase 2, mitochondrial Proteins 0.000 description 14
- 235000001014 amino acid Nutrition 0.000 description 13
- 125000001153 fluoro group Chemical group F* 0.000 description 13
- 101710188536 RNA ligase 1 Proteins 0.000 description 11
- 101710093506 RNA-editing ligase 1, mitochondrial Proteins 0.000 description 11
- 229940024606 amino acid Drugs 0.000 description 10
- 238000004704 ultra performance liquid chromatography Methods 0.000 description 9
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 229940079593 drug Drugs 0.000 description 7
- 108090000623 proteins and genes Proteins 0.000 description 7
- 102000004169 proteins and genes Human genes 0.000 description 7
- 101000942941 Arabidopsis thaliana DNA ligase 6 Proteins 0.000 description 6
- 108091028075 Circular RNA Proteins 0.000 description 6
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 6
- 235000018102 proteins Nutrition 0.000 description 6
- 102000003960 Ligases Human genes 0.000 description 5
- 108090000364 Ligases Proteins 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000001502 gel electrophoresis Methods 0.000 description 5
- 125000001731 2-cyanoethyl group Chemical group [H]C([H])(*)C([H])([H])C#N 0.000 description 4
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical group CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 description 4
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 description 4
- 230000002209 hydrophobic effect Effects 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 241000588722 Escherichia Species 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 108020004459 Small interfering RNA Proteins 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000004202 carbamide Substances 0.000 description 3
- 238000001819 mass spectrum Methods 0.000 description 3
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 3
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 3
- 238000007363 ring formation reaction Methods 0.000 description 3
- 238000010532 solid phase synthesis reaction Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 241000989055 Cronobacter Species 0.000 description 2
- 241001150138 Escherichia phage JS98 Species 0.000 description 2
- 241000701533 Escherichia virus T4 Species 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- 241001302042 Methanothermobacter thermautotrophicus Species 0.000 description 2
- 108700011259 MicroRNAs Proteins 0.000 description 2
- 241000224437 Naegleria gruberi Species 0.000 description 2
- 241000522615 Pyrococcus horikoshii Species 0.000 description 2
- 241000545779 Thermococcus barophilus Species 0.000 description 2
- 241000607598 Vibrio Species 0.000 description 2
- 241001482325 Vibrio phage VH7D Species 0.000 description 2
- 241000210655 Vibrio phage nt-1 Species 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 239000000074 antisense oligonucleotide Substances 0.000 description 2
- 238000012230 antisense oligonucleotides Methods 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 238000002869 basic local alignment search tool Methods 0.000 description 2
- 238000010170 biological method Methods 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000009510 drug design Methods 0.000 description 2
- 238000009509 drug development Methods 0.000 description 2
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 101150033305 rtcB gene Proteins 0.000 description 2
- 239000004055 small Interfering RNA Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 102000004506 Blood Proteins Human genes 0.000 description 1
- 108010017384 Blood Proteins Proteins 0.000 description 1
- 241000588923 Citrobacter Species 0.000 description 1
- 241000192091 Deinococcus radiodurans Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241001451295 Klebsiella phage KP15 Species 0.000 description 1
- 241000398390 Klebsiella phage KP27 Species 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 125000000998 L-alanino group Chemical group [H]N([*])[C@](C([H])([H])[H])([H])C(=O)O[H] 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 125000000393 L-methionino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(SC([H])([H])[H])([H])[H] 0.000 description 1
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108091008103 RNA aptamers Proteins 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 241001339229 Rhodothermus phage RM378 Species 0.000 description 1
- 241000204568 Salmonella phage STP4-a Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241001614077 Shigella phage Sf22 Species 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 241001275947 Vibrio phage KVP40 Species 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000035508 accumulation Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- XCWFZHPEARLXJI-UHFFFAOYSA-N fomivirsen Chemical compound C1C(N2C3=C(C(NC(N)=N3)=O)N=C2)OC(CO)C1OP(O)(=S)OCC1OC(N(C)C(=O)\N=C(\N)C=C)CC1OP(O)(=S)OCC1OC(N2C3=C(C(NC(N)=N3)=O)N=C2)CC1OP(O)(=S)OCC1OC(N2C(NC(=O)C(C)=C2)=O)CC1OP(O)(=S)OCC1OC(N2C(NC(=O)C(C)=C2)=O)CC1OP(O)(=S)OCC1OC(N2C(NC(=O)C(C)=C2)=O)CC1OP(O)(=S)OCC1OC(N2C3=C(C(NC(N)=N3)=O)N=C2)CC1OP(O)(=S)OCC1OC(N2C(N=C(N)C=C2)=O)CC1OP(O)(=S)OCC(C(C1)OP(S)(=O)OCC2C(CC(O2)N2C(N=C(N)C=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C(NC(=O)C(C)=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C(NC(=O)C(C)=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C(N=C(N)C=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C(NC(=O)C(C)=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C(NC(=O)C(C)=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C(N=C(N)C=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C(NC(=O)C(C)=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C(NC(=O)C(C)=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C3=C(C(NC(N)=N3)=O)N=C2)OP(O)(=S)OCC2C(CC(O2)N2C(N=C(N)C=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C3=C(C(NC(N)=N3)=O)N=C2)O)OC1N1C=C(C)C(=O)NC1=O XCWFZHPEARLXJI-UHFFFAOYSA-N 0.000 description 1
- 229960001447 fomivirsen Drugs 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 229910001425 magnesium ion Inorganic materials 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 239000006225 natural substrate Substances 0.000 description 1
- 230000003285 pharmacodynamic effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y605/00—Ligases forming phosphoric ester bonds (6.5)
- C12Y605/01—Ligases forming phosphoric ester bonds (6.5) forming phosphoric ester bonds (6.5.1)
- C12Y605/01003—RNA ligase (ATP) (6.5.1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/315—Phosphorothioates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/532—Closed or circular
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2330/00—Production
- C12N2330/50—Biochemical production, i.e. in a transformed host cell
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/55—Design of synthesis routes, e.g. reducing the use of auxiliary or protecting groups
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Enzymes And Modification Thereof (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
本发明提供了一种含有硫代磷酸酯键的RNA及其制备方法。其中,制备方法包括:利用RNA连接酶催化底物的3'羟基与5'硫代磷酸连接,形成含有硫代磷酸酯键的RNA;5'硫代磷酸包括含有硫代修饰的5'磷酸,硫代修饰包括5'磷酸的P‑OH或P=O中的氧原子被硫原子取代,相应地变为P‑SH或P=S;RNA连接酶包括RNA连接酶家族1、2或3中任意的一种或多种酶;包括:SEQ ID NO:1‑22等序列所示的RNA连接酶中的一种或多种。能够解决现有技术中的难以利用酶催化方法制备含有硫代磷酸酯键的RNA的问题,适用于RNA制备领域。
Description
技术领域
本发明涉及RNA制备领域,具体而言,涉及一种含有硫代磷酸酯键的RNA及其制备方法。
背景技术
RNA药物是近年来的新型药物,其按作用机制分为三类:一是以核酸为靶向,抑制或激活基因表达活性的小核酸类药物,包括反义寡核苷酸(antisense oligonucleotide,ASO)、小干扰RNA(small interfering RNA,siRNA)、微小RNA(microRNA,miRNA)、小激活RNA(small activating RNA,saRNA)等;二是以蛋白为靶向,调节蛋白质活性的RNA适配体(RNAaptamer);三是编码治疗性蛋白或抗原的信使RNA(messenger RNA,mRNA)。RNA药物有很多优点,如靶向性强,设计简便、研发周期短,候选靶点丰富等。自美国FDA在1998年批准上市第一款RNA药物fomivirsen(已撤市)后,截至目前,市面上有几十种RNA药物,同时有更多的RNA药物正处在研发和临床研究阶段。
稳定性化学修饰是核酸药物设计策略的关键之一。安全性与疗效是 RNA 靶向药物设计与开发所面临的主要挑战,也是早期药物研发失败的主要原因。寡核苷酸的磷酸二酯键的硫代修饰,即核苷酸间磷酸二酯键的P-OH或P=O中的氧原子被硫原子取代,已经被广泛应用于RNA药物的开发。RNA药物磷酸二酯键的硫代修饰具有增加核酸酶抗性和促进与血浆蛋白结合的双重作用,能够延长药物的清除半衰期,增加药物的体内循环时间,改善药物的药代动力学。与此同时,硫代修饰会引入手性,使两种取向具有明显不同的药代动力学和药效学性质,影响药物的开发;硫代修饰也会降低寡核苷酸对靶标的亲和力。但现有技术中对于硫代寡核苷酸的合成主要是在固相合成过程中用硫代试剂进行化学反应制备,尚无利用酶催化等生物学方法制备含有硫代磷酸酯键的RNA的研究。
发明内容
本发明的主要目的在于提供一种含有硫代磷酸酯键的RNA及其制备方法,以解决现有技术中的难以利用酶催化方法制备含有硫代磷酸酯键的RNA的问题。
为了实现上述目的,根据本发明的第一个方面,提供了一种含有硫代磷酸酯键的RNA的制备方法,该制备方法包括:利用RNA连接酶催化底物的3'羟基与5'硫代磷酸连接,形成含有硫代磷酸酯键的RNA;5'硫代磷酸包括含有硫代修饰的5'磷酸,硫代修饰包括5'磷酸的P-OH或P=O中的氧原子被硫原子取代,相应地变为P-SH或P=S;RNA连接酶家族1、2或3中任意的一种或多种酶。
进一步地,RNA连接酶包括SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21或SEQ IDNO:22所示的RNA连接酶中的一种或多种;或与SEQ ID NO:1~SEQ ID NO:22中所示的任一种RNA连接酶具有70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%乃至99.9%以上同一性的酶,且具有催化3'羟基与5'硫代磷酸连接的活性的蛋白。
进一步地,底物包括单链RNA或双链RNA,相应地,含有硫代磷酸酯键的RNA包括含有硫代磷酸酯键的单链RNA或含有硫代磷酸酯键的双链RNA;底物包括1个、2个或更多个。
进一步地,当底物为1个,底物为单链RNA时,底物的5'端为5'硫代磷酸,底物的3'端为3'羟基,底物的5'端和底物的3'端在RNA连接酶的催化下连接、环化,获得环状的含有硫代磷酸酯键的单链RNA。
进一步地,利用夹板指导单链RNA的环化,夹板与单链RNA的从3'端至5'端的至少3个碱基特异性结合,夹板与单链RNA的从5'端至3'端的至少3个碱基特异性结合,夹板上的与单链RNA的3'端特异性结合的碱基,和与单链RNA的5'端特异性结合的碱基相邻。
进一步地,当底物为2个,底物为单链RNA时,底物包括第一底物和第二底物,第一底物的3'端为3'羟基,第二底物的5'端为5'硫代磷酸,第一底物的3'端和第二底物的5'端在RNA连接酶的催化下连接,获得线性的含有硫代磷酸酯键的单链RNA。
进一步地,第二底物的3'端为3'保护基,且第一底物的5'端为5'保护基。
进一步地,当底物为2个,底物为双链RNA时,底物包括正义链和反义链,底物包括第一底物和第二底物;第一底物的正义链的3'端为3'羟基,第一底物的反义链的5'端为5'磷酸;第二底物的正义链的5'端为5'磷酸,第二底物的反义链的3'端为3'羟基;第一底物的反义链和第二底物的正义链的5'磷酸中至少有一个为5'硫代磷酸;第一底物的正义链的3'端和第二底物的正义链的5'端,在RNA连接酶的催化下连接;第一底物的反义链的5'端和第二底物的反义链的3'端,在RNA连接酶的催化下连接;获得线性的含有硫代磷酸酯键的双链RNA。
进一步地,第一底物的反义链和第二底物的正义链的3'端均为3'保护基;第一底物的正义链的5'端和第二底物的反义链的5'端均为5'保护基。
进一步地,第一底物和第二底物均为正义链和反义链长度不同的双链RNA,第一底物的正义链的3'端与第二底物的反义链的3'端互补配对,或第一底物的反义链的5'端与第二底物的正义链5'端互补配对,使第一底物的正义链的3'端与第二底物的正义链的5'端相邻,第一底物的反义链的5'端与第二底物的反义链的3'端相邻。
进一步地,制备方法中还包括利用夹板指导第一底物和第二底物连接;夹板与第一底物的从3'端至5'端的至少3个碱基特异性结合,夹板与第二底物的从5'端至3'端的至少3个碱基特异性结合。
进一步地,夹板上的与第一底物的3'端特异性结合的碱基,和与第二底物的5'端特异性结合的碱基相邻。
进一步地,重复利用制备方法,将3个或更多个底物进行多次连接,每次连接的底物的数量为2个,依次连接获得含有硫代磷酸酯键的RNA。
进一步地,制备方法包括利用夹板指导3个或更多个底物连接;夹板与底物均存在至少3个碱基特异性结合。
进一步地,特异性结合在夹板上的底物的碱基相邻,相邻的碱基分别为不同底物的5'端和3'端,5'端为5'磷酸,5'磷酸中至少有一个为5'硫代磷酸;3'端为羟基。
进一步地,RNA连接酶的催化体系包括:1-20000 µM所述底物,1-100000 μM ATP ,5-100 mM Tris-HCl ,0.1-20 mM 二价金属离子,0-10 mM二硫苏糖醇,0.001-10 mg/mLRNA连接酶。
进一步地,RNA连接酶催化的温度为4-50℃,催化的时间为0.1-24 h;二价金属离子来源于MgCl2或MgSO4。
进一步地,底物中包括一个或多个非天然核苷酸,含有硫代磷酸酯键的RNA包括含有硫代磷酸酯键的非天然RNA。
进一步地,底物中的非天然核苷酸的数量≥2,底物的5'端和/或3'端为非天然核苷酸。
进一步地,底物由非天然核苷酸组成。
进一步地,非天然核苷酸包括:具有如下一种或多种修饰的核糖核苷酸:核糖2'位修饰、核糖骨架修饰、碱基修饰或磷酸骨架修饰;核糖2'位修饰包括2'-甲氧基修饰、2'-氟修饰、2'-氢修饰、2'-甲氧乙基修饰、2'-FANA修饰、锁核酸修饰或己糖醇核酸修饰;核糖骨架修饰包括将核苷酸中的核糖替换为ribuloNA、TNA、tPhoNA或dXNA;碱基修饰包括脱氮腺嘌呤C7修饰、脱氮鸟苷C7修饰、胞嘧啶C5修饰或尿苷C5修饰;磷酸骨架修饰包括PS修饰。
为了实现上述目的,根据本发明的第二个方面,提供了一种含有硫代磷酸酯键的RNA,该含有硫代磷酸酯键的RNA包括利用上述制备方法制备获得的含有硫代磷酸酯键的RNA。
应用本发明的技术方案,利用上述制备方法和RNA连接酶,将底物的3'羟基与5'硫代磷酸连接,能够将一条底物连接为环状RNA或将多条底物连接为线性RNA,从而制备获得现有技术中难以获得的含有硫代磷酸酯键的RNA。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明实施例的制备方法示意图,其中,图1中a示出了利用上述方法连接2条单链RNA的示意图;图1中b示出了利用上述制备方法利用夹板指导2条单链RNA底物连接的示意图;图1中c示出了利用上述制备方法连接2条双链RNA的示意图;图1中d示出了利用上述制备方法环化底物形成单链环状RNA的示意图。
图2示出了根据本发明实施例1的凝胶电泳图。
图3示出了根据本发明实施例2的凝胶电泳图。
图4示出了根据本发明实施例2的UPLC色谱图。
图5示出了根据本发明实施例2的UPLC色谱图。
图6示出了根据本发明实施例3的UPLC色谱图。
图7示出了根据本发明实施例3的质谱图。
图8示出了根据本发明实施例4的UPLC色谱图。
图9示出了根据本发明实施例4的质谱图。
图10示出了根据本发明实施例5的UPLC色谱图。
图11示出了根据本发明实施例6的凝胶电泳图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将结合实施例来详细说明本发明。
如背景技术所提到的,现有技术中尚无利用酶催化等生物学方法制备含有硫代磷酸酯键的RNA的研究。对于RNA连接酶而言,不同的RNA连接酶对连接底物的长度、修饰、单双链等具有不同的要求,尤其是催化含有硫代磷酸的、或含有非天然核苷酸等困难底物连接时,会有催化活性低、产物连接错误等问题。在本申请中发明人尝试开发一种利用RNA连接酶制备含有硫代磷酸酯键的RNA的方法,因而提出了本申请的一系列保护方案。
在本申请第一种典型的实施方式中,提供了一种含有硫代磷酸酯键的RNA的制备方法,该制备方法包括:利用RNA连接酶催化底物的3'羟基与5'硫代磷酸连接,形成含有硫代磷酸酯键的RNA;5'硫代磷酸包括含有硫代修饰的5'磷酸,硫代修饰包括5'磷酸中P-OH或P=O的氧原子被硫原子取代,相应地,变为P-SH或P=S;RNA连接酶家族1、2或3中任意的一种或多种酶;RNA连接酶包括SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21或SEQ ID NO:22所示的RNA连接酶中的一种或多种;或与SEQ ID NO:1~ SEQ ID NO:22中所示的任一种RNA连接酶具有70%以上同一性的酶,优选为75%以上同一性、80%以上同一性、85%以上同一性、90%以上同一性、95%以上同一性、98%以上同一性、99%以上同一性、99.5%以上同一性、99.9%以上同一性,且具有催化3'羟基与5'硫代磷酸连接的活性的蛋白。
利用上述RNA连接酶,能够催化3'羟基与5'硫代磷酸连接,形成与磷酸二酯键类似的硫代磷酸酯键,制备获得含有硫代磷酸酯键的RNA。在本申请中,5’(5’端)磷酸/磷酸基团/磷酸根均指核酸链5’端核苷酸5号位C原子上的磷酸基团。5'磷酸硫代修饰,包括5’硫代修饰为5'磷酸的P-OH或P=O中的氧原子被硫原子取代,相应地变为P-SH或P=S,并不特指P-SH或特指P=S。5'磷酸硫代修饰的结构包括、/>或/>中的一种或多种。
SEQ ID NO:1(ligase-1,Escherichia phage T4,RNA ligase 1(RNA连接酶家族1,Rnl1)):
MQELFNNLMELCKDSQRKFFYSDDVSASGRTYRIFSYNYASYSDWLLPDALECRGIMFEMDGEKPVRIASRPMEKFFNLNENPFTMNIDLNDVDYILTKEDGSLVSTYLDGDEILFKSKGSIKSEQALMANGILMNINHHRLRDRLKELAEDGFTANFEFVAPTNRIVLAYQEMKIILLNVRENETGEYISYDDIYKDATLRPYLVERYEIDSPKWIEEAKNAENIEGYVAVMKDGSHFKIKSDWYVSLHSTKSSLDNPEKLFKTIIDGASDDLKAMYADDEYSYRKIEAFETTYLKYLDRALFLVLDCHNKHCGKDRKTYAMEAQGVAKGAGMDHLFGIIMSLYQGYDSQEKVMCEIEQNFLKNYKKFIPEGY。
SEQ ID NO:2(ligase-2,Salmonella phage STP4-a,RNA ligase 2(RNA连接酶家族2,Rnl2)):
MFKKYSSLENHYNNKFISKIRFEGKDGGLWVAREKIHGTNFSIIVSKDSVSACKRSGPILPSESFYGHEIILKNYDESIKTIQRCMNANELGSVSSYQIFGEFAGQGIQKEVDYGEKDFYVFDILVNTQNGNVLYMDDMMMTSFCNEFGFKMAPFIGCGSFDELIQLPNNFTSVIKAYNEAAKDDLKEVNLCVFDPLVTDDNVAEGYVLKPVYPDFFNNGTRIAIKSKNSRFTEKKKSDKPIKPKAVLTSNDSTVLANLCEYSTWNRVSNVISHIGEVKAKDFGKVMGLTIQDIFIEAKREGVDIVHADNPDLVKRELQTVVSNTIREKWLEIVS。
SEQ ID NO:3(ligase-3,Escherichia phage T4,RNA ligase 2):
MFKKYSSLENHYNSKFIEKLYSLGLTGGEWVAREKIHGTNFSLIIERDKVTCAKRTGPILPAEDFFGYEIILKNYADSIKAVQDIMETSAVVSYQVFGEFAGPGIQKNVDYCDKDFYVFDIIVTTESGDVTYVDDYMMESFCNTFKFKMAPLLGRGKFEELIKLPNDLDSVVQDYNFTVDHAGLVDANKCVWNAEAKGEVFTAEGYVLKPCYPSWLRNGNRVAIKCKNSKFSEKKKSDKPIKAKVELSEADNKLVGILACYVTLNRVNNVISKIGEIGPKDFGKVMGLTVQDILEETSREGITLTQADNPSLIKKELVKMVQDVLRPAWIELVS。
SEQ ID NO:4(ligase-4,Vibrio phage KVP40,RNA ligase 2):
MSFVKYTSLENSYRQAFVDKCDMLGVREWVALEKIHGANFSFIVEFKPNEAQDGAEFTVTPAKRTSTIGANVMGDYDFYGCTSVVEAHTAKMEAISNWLWARGIINVGETIIVYGELAGKGVQKEVNYGDKDFWAYDILLPETGKFLDWDVVLEACEFAKVKTTHEIARGTLDELLRIDPLFRSFHTPADVDGDNVAEGFVVKQLRNEKRLHNGSRAILKVKNDKFKEKKNKAGKTPRAAVVLTEEQEKLHAAFSCYLTENRLRNVLSKLETVTQKQFGMISGLFIKDAKDEFERDELNETAIARDDWDVIKRSLTNIANEILRKNWLDILDGNF。
SEQ ID NO:5(ligase-5,Yersinia phage fPS-2,RNA ligase 2):
MFKKYSSLENHYNSKFIEKLYSLGLTGGEWVAREKIHGTNFSLIIERDKVTCAKRTGPILPAEDFFGYEIILKNYADSIKAVQDIMETSAVVSYQVFGEFAGPGIQKNVDYGDKDFYVFDIIVTTESGGVTYVDDYMMESFCNSFGFKIAPLLGRGKFEDLIKLPNDLDSVVQDYNFTVDHAGLVDANKCVWNAEAKGEVFTAEGYVLKPCYPSWLPNRNRVAIKCKNSKFSEKKKSDKPIKAKVELSEADNKLVGILACYVTLNRVNNVISKIGEIGPKDFGKVMGLTVQDILEETSREGITLTQADNPSLIKKELVKMVQDVLRPAWIELVS。
SEQ ID NO:6(ligase-6,Vibrio phage nt-1,RNA ligase 2):
MSFVKYTSLENSYRQAFVDKCDMLGVRDWVALEKIHGANFSFIVEFDGGYTVTPAKRTSIIGATATGDYDFYGCTSVVEAHKEKVELVANFLWLNEYINLYEPIIIYGELAGKGIQKEVNYGDKDFWAFDIFLPQREEFVDWDTCVAAFTNAEIKYTKELARGTLDELLRIDPLFKSLHTPAEHEGDNVAEGFVVKQLHSEKRLQSGSRAILKVKNEKFKEKKKKEGKTPTKLVLTPEQEKLHAEFSCYLTENRLKNVLSKLGTVNQKQFGMISGLFVKDAKDEFERDELNEVAIDRDDWNAIRRSLTNIANEILRKNWLNILDGNF。
SEQ ID NO:7(ligase-7,Shigella phage Sf22,RNA ligase 1):
MQELFNNLMELCKDSQRKFFYSDDVSASGRTYRIFSYNYASYSDWLLPDALECRGIMFEMDGEKPVRIASRPMEKFFNLNENPFTMNIDLNDVDYILTKEDGSLVSTYLDGDEILFKSKGSIKSEQALMANGILMNINHHQLRDRLKELAEDGFTANFEFVAPTNRIVLAYQEMKIILLNIRENETGEYISYDDIYKDAALRPYLVERFEVDSPKWIEEAKNAENIEGYVAVMKDGSHFKIKSDWYVSLHSTKSSLDNPEKLFKTIIDGASDDLKAMYADDEYSYRKIEAFETTYLKYLDRALFLVLDCHNKHCGKDRKTYAMEAQGVAKGAGMEHLFGIIMSLYQGYDSQEKVMCEIEQNFLKNYKKFIPEGY。
SEQ ID NO:8(ligase-8,Vibrio phage VH7D,RNA ligase 1):
MNVQELYKNLMSLADDAEGKFFFADHLSPLGEKFRVFSYHIASYSDWLLPGALEARGIMFQLDDNDEMIRIVSRPMEKFFNLNENPFTMELDLTTTVQLMDKADGSLISTYLSGENFALKSKTSIFSEQAVAANRYIKKPENRDLWEFCDDCTQAGLTVNMEWCAPNNRIVLEYPEAKLVILNIRDNETGDYVSFDDIPQSALMRVKQWLVDEYDPATAHEPDFVEKLRDTKGIEGMILRLANGQSVKIKTQWYVDLHSQKDSVNVPKKLVTTILNGNHDDLYALFADDKPTIERIREFDSHVTKTLTNSFNAVRQFYARNRHLARKDYAIAGQKVLKPWEFGVAMIAYQKQTVEGVYESLVTAYLKRPELAIPEKYLNGV。
SEQ ID NO:9(ligase-9,Bacteriophage dhaeg,RNA ligase 2):
MFKKYSSLENHYNSKFIEKLRTNGLTGGEWVAREKIHGTNFSLIIERDAVTCAKRTGPILPAEDFYGYEIVLKNYADSIKSIQDIMETSAAVSYQVFGEFAGTGIQKNVDYGDKDFYVFDIIVTTESGDVTYVDDYMMESFCKTFKFKMAPLLGRGKFEDLIKLPNDLDSVLPDYNFTVDNVGLAEANAHVWNAEAKGEVFTAEGYVLKPCYPLWLPNGNRVAIKCKNSKFSEKKKTDKPIKVAVVLSQDDLDLLQQFTDYVTVNRINNVISKIGEVSPKDFGKVMGLTVQDILEEAAREELELTDAENPVEVKKQLIECVKDTLRAVWIELVSK。
SEQ ID NO:10(ligase-10,Klebsiella phage KP27,RNA ligase 2):
MFKKYSSLTNHYEGKFINGVIMNGLTGGVWVAREKIHGANFSFITDDGITVTPAKRTDVVKPAEDFYGCSAVVAKYSPGIRKMWETLKKTGTYDDLVIQVYGEFAGRGVQKDVDYGEKDFYVFDIRVNGEFLPDNLCSLISRSHGLKMAPLLGYGTFEEIKELPITFESVVNKANSGIGSDNTVYGEFVYPIMDVEEGNIAEGFVMKPVSPAFMPNGERVAIKCKTTKFTEKKAKKATRFNAPVSLSEKDKNQLDEFVCYLTENRVKNVLSKLDLASITAKDFGRIMGLTVQDAIEEISRNHGPFLEQFEDPAMAKKLFVTEAQNMIRPVWGKILNHEF。
SEQ ID NO:11(ligase-11,Vibrio phage V05,RNA ligase 1):
MTTQELYNHLMTLTDDAEGKFFFADHISPLGEKLRVFSYHIASYSDWLLPGALEARGIMFQLDEQDKMVRIVSRPMEKFFNLNENPFTMDLDLTTTVQLMDKADGSLISTYLTGENFALKSKTSIFSEQAVAANRYIKLPENRDLWEFCDDLTQAGCTVNMEWCAPNNRIVLEYPEAKLVILNIRDNETGDYVSFDDIPLPALMRVKKWLVDEYDPETAHADDFVEKLRATKGIEGMILRLANGQSVKIKTQWYVDLHSQKDSVNVPKKLVTTILNNNHDDLYALFADDKPTIDRIREFDSHVSKTVSASFHAVSQFYVKNRHMSRKDYAIAGQKTLKPWEFGVAMIAYQNQTVEGVYEALVGAYLKRPELLIPEKYLNEA。
SEQ ID NO:12(ligase-12,Rhodothermus phage RM378,RNA ligase 1):
MESMNVKYPVEYLIEHLNSFESPEVAVESLRKEGIMCKNRGDLYMFKYHLGCKFDKIYHLACRGAILRKTDSGWKVLSYPFDKFFNWGEELQPEIVNYYQTLRYASPLNEKRKAGFMFKLPMKLVEKLDGTCVVLYYDEGWKIHTLGSIDANGSIVKNGMVTTHMDKTYRELFWETFEKKYPPYLLYHLNSSYCYIFEMVHPDARVVVPYEEPNIILIGVRSVDPEKGYFEVGPSEEAVRIFNESGGKINLKLPAVLSQEQNYTLFRANRLQELFEEVTPLFKSLRDGYEVVYEGFVAVQEIAPRVYYRTKIKHPVYLELHRIKTTITPEKLADLFLENKLDDFVLTPDEQETVMKLKEIYTDMRNQLESSFDTIYKEISEQVSPEENPGEFRKRFALRLMDYHDKSWFFARLDGDEEKMQKSEKKLLTERIEKGLFK。
SEQ ID NO:13(ligase-13,Citrobacter phage CkP1,RNA ligase 1):
MKKLFKNLMALCDEADESKFFYRDDISPSGLKYRIFSYNYASYSDWIRPDALECRGIMFEMIDDKPVRIASRPMEKFFNLNETPFTMNLDLSKAKYMLDKADGSLVSTFLDGNILKFKSKSSIKSEQSYFSTAMLTESRHEALLARLLDLASDGFTANFEYVSPDNRIVLPYQEKQLILLNIRDNDTGEYVDYEDIFKDGVLRQYLVQRHEITDSNFVEDIRKLTDIEGFVFVMEDGLRFKLKTDWYCALHHTKDSITNNERLFESIVNNASDDLKAMFAGDEFAVNKINKFEENYLKYLGESLHLINTTYHELRGRDRKDYAIESQNRANKSGLGFLFSIIMKMYNGGMDHDTRVKNLSELFMKNYKQFVPKEFI。
SEQ ID NO:14(ligase-14,Escherichia phage JN02,RNA ligase 1):
MEKLYYNLLSLCKSSSDRKFFYSDDVSPIGKKYRIFSYNFASYSDWLLPDALECRGIMFEMDGETPVRIASRPMEKFFNLNENPFTLSINLDDVKYLMTKEDGSLVSTYLDGGTVRFKSKGSIKSDQAVSATSILLDIDHKNLADRLLELCNDGFTANFEYVAPTNKIVLTYPEKRLILLNIRDNNTGEYIEYDDIYLDPVFRKYLVDRFEVPEGDWTSDVKSSTNIEGYVAVMKDGSHFKLKTDWYVALHTTRDSISSPEKLFLAIVNGASDDLKAMYADDEFSFKKVELFEKAYLDFLDRSFYICLDTYDKHKGKDRKTYAIEAQAVCKGAQTPWLFGIIMNLYQGGSKEQMMTALESVFIKNHKNFIPEGY。
SEQ ID NO:15(ligase-15,Klebsiella phage KP179,RNA ligase 1):
MLELYKNLMNLCESSEVAKFFYKDFTGPMDGKFRVFSYHYASYSEWLKPDALECRGIMFEMDGDTPIRIASRPMEKFFNLNENPLTMGIDISDVEYIMDKADGSLVSSYVDDGYLYLKSKTSLYSDQARQASALLNSEEYSSLHQVILELTLDGYTVNMEFVSPNNRVVLAYQEPQLFVLNVRNNTTGEYIKYDDLYANAKIRPYLINAYGISDPTTWVEGVRELEGVEGYIAVLNTGQRFKVKTEWYSALHHTKDSITSNERLFASVVSANSDDLRSLFAGDEYAIKKISAFEQAYLDYLGKSLELCQSFYDEYRGRARKDYAIAAQKATVNQRHLFGVIMNMYEGTVDVDKLLKDLERVFLKYWAGYVPKEYEKEIELSEE。
SEQ ID NO:16(ligase-16,Vibrio phage nt-1,RNA ligase 1):
MNELYNNLMTLAESAEGKFFFADHLSPQGEKFRVFSYHIASYSDWLLPDALEARGIMFQLDENDEMIRIVSRPMEKFFNLGENPFTMDLDLTTTVQLMDKADGSLISTYLTGDNFALKSKTSIYSEQAVAANRYIKHVDNRDLWEFCDDCAAQNFTVNMEWCAPNNRIVLEYTEPKLIILNIRDNETGQYVSFDDIPIGALTRIKKWLVDEYDPMTAHVDDFVETLKAKKGIEGMILRLASGQSVKIKTTWYVDLHAQKDSVNSPKKLVTTILNKNHDDLYALFADDKPTIERIREFDDHVSKKVVESFHAVSQYYTKNRHLSRKDFAIAGQKALKPWEFGVAMIAYQNQTVEGVVTMLINAYLKRPELLIPEKYLSEV。
SEQ ID NO:17(ligase-17,Vibrio phage VH7D,RNA ligase 2):
MSFVKYTSLENSYRQAFVDKCDMLGVKEWVALEKIHGANFSFIVEFKPSTEEVPGEMSVTPAKRTSTIGANAMGDYDFYGCTSVVEAHIEKMQDISNWLFANDFIKNDETIIVYGELAGKGIQKEVNYGDKDFWAYDILCPETGEFLDWDVVLKACKFAGVKTTHEIARGTLDELLKIDPLFRSFHTPADVDSENVAEGFVVKQLKAEKRLHNGSRAILKVKNEKFKEKKNKQGKTPRAKVVLTEEQEKLHAAFSCYLTENRLRNVLSKIGKVEAKQFGMVSGLFVKDAKDEFERDERDEVAIPRDDWDVIKRSLVNVANEILRKNWLNIVDGTF。
SEQ ID NO:18(ligase-18,Klebsiella phage KP15,RNA ligase 2):
MFKKYSSLTNHYEGKFINGVIMNGLTGGVWVAREKIHGANFSFITDDGITVTPAKRTDVVKPAEDFYGCSAVVAKYSPGIRKMWETLKKTGTYDDLVIQVYGEFAGRGVQKDVDYGEKDFYVFDIRVNGEFLPDNLCSLISRSHGLKMAPLLGYGTFEEIKELPITFESVVNKANSGIGSDNTVYGEFVYPIMDVEEGNIAEGFVMKPVSPAFMPNGERVAIKCKTTKFTEKKAKKATRFNAPVSLSEKDKNQLDEFVCYLTENRVKNVLSKLDLASITAKDFGRIMGLTVQDAIEEISRNHGPFIEQFEDPAMAKKLFVTEAQNMIRPVWGKILNHEF。
SEQ ID NO:19(ligase-19,Vibrio phage JN02,RNA ligase 2):
MFKKYSSLENHYNSKFIEKLYTNGLTTGVWVAREKIHGTNFSLIIERDNVTCAKRTGPILPAEDFYGYEIVLKKYDKAIKAVQEVMESISTSVPVSYQVFGEFAGGGIQKGVDYGEKDFYVFDIIINTESDDTYYMSDYEMQDFCNTFGFKMAPMLGRGTFDSLIMIPNDLDSVLAAYNSTASEDLVEANNCVFDANVIGDNTAEGYVLKPCFPKWLSNGTRVAIKCKNSKFSEKKKSDKPVKTQVPLTEIDKNLLDVLACYVTLNRVNNVISKIGTVTPKDFGKVMGLTVQDILEETSREGIVLTSSDNPNLVKKELVRMVQDVLRPAWIELVS。
SEQ ID NO:20(ligase-20,Escherichia phage JS98,RNA ligase 2):
MFKKYSSLENHYNSKFIEKLRTNGLTGGEWVAREKIHGTNFSLIIERDAVTCAKRTGPILPAEDFYGYEIVLKNYADSIKSVQHLIESINYQSYQIYGELAGPGIQKNVDYGDKDFYVFDIRVTKEDGTESVLTDTLMEAFCIIHKFKVAPCLATGSFEDLIKLPNDFDSVIPDYNFAVDNAGLTIANSTDFIPKVEGKVFTAEGFVLKPDIPTWLPNGNRVAIKCKNSKFSEKKKSDKPIKAAVVLSQDDMDLMWQFTDYVTVNRINNVISKIGEVSKKDFGKVMGLTVQDILEEAAREELELTDAENPVEVKKQLVECVKDTLRAVWIELVS。
SEQ ID NO:21(ligase-21,Escherichia phage JS98,RNA ligase 3(RNA连接酶家族3,Rnl3)):
MVSSVYKEILVKLGLTEDRIETLEMKGGIIEDEFDGIRYVRFKDSAGKLRRGTVVIDEEYVIPGFPHIKRIINLRSGIRRIFKRGEFYVEEKVDGYNVRVVMYKGKMLGITRGGFICPFTTERIPDFVPQEFFKDNPNLILVGEMAGPESPYLVEGPPYVKEDIQFFLFDVQEIKTGRSLPVEERLKIAEEYGINHVEVFGKYTKDDVDELYQLIERLSKEGREGIIMKSPDMKKIVKYVTPYANINDIKIGARVFYELPPGYFTSRISRLAFYLAEKRIKGEEFERVAKELGSALLQPFVESIFDVEQEEDIHELFKVRVKRIETAYKMVTHFEKLGLKIEIVDIEEIKDGWRITFKRLYPDATNEIRELIGGKAFVD。
SEQ ID NO:22(ligase-22,fungus Deinococcus radiodurans,RNA ligase 2):
MAERQVIKERAQLFPHPNAERLELCKVGTFQLVVRKGEYRDGDPIVIAPEKAVLPPQLAGLYTNADTGASYLHGAEKNRVGSVRLRGEVSQGVILPLDGLEDAPFGEDLAERLGITFWEPPVPVSMAGEVEPRPPAQHYKHHDVEQFGIYVSEFASGEEVMVTEKLHGTQGVYFRTAEGRWLVTSKGLSRGGLTLREAASNVYWQAARNSNLFAEADAAFSGGEVQIFGEVVPVQKGFSYGQHKPTVFVFKVVYDGLRLPRRDWPQWVLDHAVPVLYEGPFDEATVRKLRGGLETVSGKGLHIREGVVVAPKVPRFAADGSDLSVKLISDAYAKKETGEEYS。
本说明书中的同一性(Identity)是指氨基酸序列或核酸序列之间的“同一性”,即氨基酸序列或核酸序列中的种类相同的氨基酸残基或核苷酸的比率的总计。氨基酸序列或核酸序列的同一性可以利用BLAST(Basic Local Alignment Search Tool)、FASTA等比对程序来确定。
70%、75%、80%、85%、90%、95%、99%以上(比如85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.5%、99%、99.5%、99.6%、99.7%、99.8%以上,甚至99.9%以上)同一性且具有相同功能的蛋白质,其活性位点、活性口袋、活性机制、蛋白结构等均和a)序列提供的蛋白质大概率相同。
如本文所用,氨基酸残基缩写如下:丙氨酸(Ala;A)、天冬酰胺(Asn;N)、天冬氨酸(Asp;D)、精氨酸(Arg;R)、半胱氨酸(Cys;C)、谷氨酸(Glu;E)、谷氨酰胺(Gln;Q)、甘氨酸(Gly;G)、组氨酸(His;H)、异亮氨酸(Ile;I)、亮氨酸(Leu;L)、赖氨酸(Lys;K)、蛋氨酸(Met;M)、苯丙氨酸(Phe;F)、脯氨酸(Pro;P),丝氨酸(Ser;S)、苏氨酸(Thr;T)、色氨酸(Trp;W)、酪氨酸(Tyr;Y)和缬氨酸(Val;V)。
取代、替换等规则,一般情况下,哪些氨基酸性质类似,替换后的效果也类似。例如,在上述同源蛋白中,可发生保守的氨基酸替换。“保守的氨基酸替换”包括但不限于:
疏水性氨基酸(Ala、Cys、Gly、Pro、Met、Val、Ile、Leu)被其他疏水性氨基酸取代;
侧链粗大的疏水性氨基酸(Phe、Tyr、Trp)被其他侧链粗大的疏水性氨基酸取代;
侧链带正电的氨基酸(Arg、His、Lys)被其他侧链带正电的氨基酸取代;
侧链有极性不带电的氨基酸(Ser、Thr、Asn、Gln)被其他侧链有极性不带电的氨基酸取代。
本领域技术人员也可以根据现有技术中的“blosum62评分矩阵”等本领域技术人员熟知的氨基酸替换规则对氨基酸进行保守替换。
在一种优选的实施例中,底物包括单链RNA或双链RNA,相应地,含有硫代磷酸酯键的RNA包括含有硫代磷酸酯键的单链RNA或含有硫代磷酸酯键的双链RNA;底物包括1个、2个或更多个。
上述底物的长度≥2nt,包括但不限于2、5、10、15、20、30、40、50、70、100、150、200、300、500、1000、2000、5000nt。链的长度增加仍可进行连接,尽管在一定程度上会降低连接效率。
上述制备方法中所用的底物的个数包括1个或2个。当底物个数为1时,该底物的3'端连接有羟基,5'端连接有硫代磷酸,利用上述制备方法和RNA连接酶,能够将底物的3'羟基与5'硫代磷酸相连,使底物自身环化,形成含有硫代磷酸酯键的RNA。当底物个数为2时,底物包括第一底物和第二底物,第一底物的3'端连接有羟基,第二底物的5'端连接有硫代磷酸,利用上述制备方法和RNA连接酶,能够将第一底物的3'端和第二底物的5'端以硫代磷酸酯键相连,形成含有硫代磷酸酯键的RNA。
在一种优选的实施例中,当底物为1个,底物为单链RNA时,底物的5'端为5'硫代磷酸,底物的3'端为3'羟基,底物的5'端和底物的3'端在RNA连接酶的催化下连接、环化,获得环状的含有硫代磷酸酯键的单链RNA;优选地,利用夹板指导单链RNA的环化,夹板与单链RNA的从3'端至5'端的至少3个碱基特异性结合,夹板与单链RNA的从5'端至3'端的至少3个碱基特异性结合,夹板上的与单链RNA的3'端特异性结合的碱基,和与单链RNA的5'端特异性结合的碱基相邻。
利用上述制备方法,能够将底物的5'端和3'端首尾连接,形成单链环状RNA。上述单链环状RNA的制备中,也包括利用夹板指导单链RNA的环化,夹板能够分别于底物单链RNA的5'端和3'端的碱基特异性结合,从而利用夹板减少5'端和3'端的空间距离,便于RNA连接酶催化连接。
上述RNA连接酶包括但不限于ligase-1(SEQ ID NO:1),ligase-4(SEQ ID NO:4),ligase-7(SEQ ID NO:7),ligase-8(SEQ ID NO:8),ligase-9(SEQ ID NO:9),ligase-10(SEQ ID NO:10),ligase-11(SEQ ID NO:11),ligase-12(SEQ ID NO:12),ligase-13(SEQID NO:13),ligase-14(SEQ ID NO:14),ligase-15(SEQ ID NO:15),ligase-16(SEQ IDNO:16),ligase-18(SEQ ID NO:18),ligase-19(SEQ ID NO:19)中的任意一种或多种。
在一种优选的实施例中,当底物为2个,底物为单链RNA时,底物包括第一底物和第二底物,第一底物的3'端为3'羟基,第二底物的5'端为5'硫代磷酸,第一底物的3'端和第二底物的5'端在RNA连接酶的催化下连接,获得线性的含有硫代磷酸酯键的单链RNA;优选地,第二底物的3'端为3'保护基,且第一底物的5'端为5'保护基。
利用上述制备方法,能够将第一底物与第二底物相连接,形成单链线性RNA。上述5'保护基包括但不限于羟基、N-乙酰半乳糖胺基团、-O-NH2、叠氮基、氰乙基、烯丙基或2-硝基苄基等基团。上述3'保护基包括但不限于磷酸基团、N-乙酰半乳糖胺基团、-O-NH2、叠氮基、氰乙基、烯丙基或2-硝基苄基等基团。为了防止底物自身环化,单个底物的不能同时具有5'硫代磷酸和3'端羟基,即上述3'保护基不为羟基即可,上述5'保护基不为磷酸即可。
上述RNA连接酶包括但不限于ligase-1(SEQ ID NO:1),ligase-2(SEQ ID NO:2),ligase-3(SEQ ID NO:3),ligase-4(SEQ ID NO:4),ligase-5(SEQ ID NO:5),ligase-6(SEQ ID NO:6),ligase-7(SEQ ID NO:7),ligase-8(SEQ ID NO:8),ligase-9(SEQ ID NO:9),ligase-10(SEQ ID NO:10),ligase-11(SEQ ID NO:11),ligase-12(SEQ ID NO:12),ligase-13(SEQ ID NO:13),ligase-14(SEQ ID NO:14),ligase-15(SEQ ID NO:15),ligase-16(SEQ ID NO:16),ligase-17(SEQ ID NO:17),ligase-18(SEQ ID NO:18),ligase-19(SEQ ID NO:19),ligase-2(SEQ ID NO:20)中的任意一种或多种。
在一种优选的实施例中,当底物为2个,底物为双链RNA时,底物包括正义链和反义链,底物包括第一底物和第二底物;第一底物的正义链的3'端为3'羟基,第一底物的反义链的5'端为5'磷酸;第二底物的正义链的5'端为5'磷酸,第二底物的反义链的3'端为3'羟基;第一底物的反义链和第二底物的正义链的5'磷酸中至少有一个为5'硫代磷酸;第一底物的正义链的3'端和第二底物的正义链的5'端,在RNA连接酶的催化下连接;第一底物的反义链的5'端和第二底物的反义链的3'端,在RNA连接酶的催化下连接;获得线性的含有硫代磷酸酯键的双链RNA;优选地,第一底物的反义链的3'端和第二底物的正义链的3'端均为3'保护基;优选地,第一底物的正义链的5'端和第二底物的反义链的5'端均为5'保护基;优选地,第一底物和第二底物均为正义链和反义链长度不同的双链RNA,第一底物的正义链的3'端与第二底物的反义链的3'端互补配对,或第一底物的反义链的5'端与第二底物的正义链5'端互补配对,使第一底物的正义链的3'端与第二底物的正义链的5'端相邻,第一底物的反义链的5'端与第二底物的反义链的3'端相邻。
利用上述制备方法,能够将2条双链RNA通过2条磷酸二酯键连接,磷酸二酯键中至少有一条为硫代磷酸酯键,获得线性的双链RNA。优选地,为了防止底物自身发生环化,含有5'磷酸的单链上对应的3'端不为羟基。当上述第一底物和第二底物均为正义链、反义链长度不同的双链RNA,且第一底物中的部分碱基能够与第二底物中的部分碱基进行互补配对时,即表示在第一底物和第二底物中存在能够互补配对的粘性末端,利用此种底物进行连接,能够获得较好的连接效率。
上述RNA连接酶包括但不限于ligase-2(SEQ ID NO:2),ligase-3(SEQ ID NO:3),ligase-4(SEQ ID NO:4),ligase-5(SEQ ID NO:5),ligase-6(SEQ ID NO:6),ligase-9(SEQ ID NO:9),ligase-10(SEQ ID NO:10),ligase-11(SEQ ID NO:11),ligase-14(SEQID NO:14),ligase-17(SEQ ID NO:17),ligase-18(SEQ ID NO:18),ligase-19(SEQ IDNO:19),ligase-20(SEQ ID NO:20),ligase-22(SEQ ID NO:22)中的任意一种或多种。
上述5'保护基包括但不限于羟基、N-乙酰半乳糖胺基团、磷酸基团、-O-NH2、叠氮基、氰乙基、烯丙基或2-硝基苄基等基团。上述3'保护基包括但不限于磷酸基团、N-乙酰半乳糖胺基团、-O-NH2、叠氮基、氰乙基、烯丙基或2-硝基苄基等基团。第一底物的反义链的3'端和第二底物的正义链的3'端各自独立地选自上述3'保护基,不为羟基即可。第一底物的正义链的5'端和第二底物的反义链的5'端各自独立地选自上述5'保护基,不为磷酸即可。
在一种优选的实施例中,制备方法中还包括利用夹板指导第一底物和第二底物连接;优选地,夹板与第一底物的从3'端至5'端的至少3个碱基特异性结合,夹板与第二底物的从5'端至3'端的至少3个碱基特异性结合;优选地,夹板上的与第一底物的3'端特异性结合的碱基,和与第二底物的5'端特异性结合的碱基相邻。
在上述制备方法中,能够利用夹板指导第一底物和第二底物的连接。第一底物和第二底物均能够与夹板特异性结合,结合后第一底物的3'端和第二底物的5'端之间存在缺刻,上述RNA连接酶能够将该缺刻以硫代磷酸酯键连接,从而实现含有硫代磷酸酯键的RNA的制备。上述夹板包括DNA序列或RNA序列。
上述RNA连接酶包括但不限于ligase-2(SEQ ID NO:2),ligase-3(SEQ ID NO:3),ligase-4(SEQ ID NO:4),ligase-5(SEQ ID NO:5),ligase-6(SEQ ID NO:6),ligase-7(SEQ ID NO:7),ligase-8(SEQ ID NO:8),ligase-9(SEQ ID NO:9),ligase-10(SEQ IDNO:10),ligase-11(SEQ ID NO:11),ligase-14(SEQ ID NO:14),ligase-16(SEQ ID NO:16),ligase-17(SEQ ID NO:17),ligase-18(SEQ ID NO:18),ligase-19(SEQ ID NO:19),ligase-20(SEQ ID NO:20),ligase-21(SEQ ID NO:21),ligase-22(SEQ ID NO:22)中的任意一种或多种。
在一种优选的实施例中,重复利用制备方法,能够将3个或更多个底物进行多次连接,每次连接的底物的数量为2个,依次连接获得含有硫代磷酸酯键的RNA。
在一种优选的实施例中,制备方法包括利用夹板指导3个或更多个底物连接;优选地,夹板与底物均存在至少3个碱基特异性结合;优选地,特异性结合在夹板上的底物的碱基相邻,相邻的碱基分别为不同底物的5'端和3'端,5'端为5'磷酸,5'磷酸中至少有一个为5'硫代磷酸,更优选为均为5'硫代磷酸;3'端为羟基。
利用上述制备方法,可以利用一条夹板实现同时对多条底物进行连接,上述RNA连接酶能够对多个底物之间存在的缺刻进行连接,获得含有一个或多个硫代磷酸酯键的RNA。
图1为上述制备方法的示意图,其中,图1中a示出了利用上述方法连接2条单链RNA的示意图;图1中b示出了利用上述制备方法利用夹板指导2条单链RNA底物连接的示意图图1中c示出了利用上述制备方法连接2条双链RNA的示意图;图1中d示出了利用上述制备方法环化底物形成单链环状RNA的示意图。如图1中d所示,对于单链RNA的环化,包括利用夹板指导单链环状RNA环化,以及不利于夹板、利用RNA连接酶直接催化单链RNA环化。
在一种优选的实施例中,RNA连接酶的催化体系包括:1-20000 µM所述底物,1-40000 μM ATP ,5-100 mM Tris-HCl ,0.1-20 mM 二价金属离子,0-10 mM二硫苏糖醇,0.001-10 mg/mL RNA连接酶;优选地,RNA连接酶催化的温度为4-50℃,包括但不限于4、10、15、20、25、30、35、40、45或50℃;RNA连接酶催化的时间为0.1-24 h,包括但不限于0.1、0.5、1、2、3、4、5、7、10、15、20或24 h;优选地,二价金属离子包括但不限于镁离子,二价金属离子来源于包括但不限于MgCl2或MgSO4等试剂。
上述底物的浓度包括但不限于1、5、10、20、50、100、200、500、1000、2000、3000、4000、5000、8000、10000、15000或20000 µM,ATP的浓度包括但不限于1、10、20、50、100、200、500、1000、1500、2000、3000、4000、5000、8000、10000、20000或40000 µM,RNA连接酶的浓度包括但不限于0.001、0.01、0.02、0.05、0.1、0.2、0.5、1、1.5、2、5或10 mg/mL。
在一种优选的实施例中,底物中包括一个或多个非天然核苷酸,含有硫代磷酸酯键的RNA包括含有硫代磷酸酯键的非天然RNA;优选地,底物中的非天然核苷酸的数量≥2 ;优选地,底物的5'端和/或3'端为非天然核苷酸;优选地,底物由非天然核苷酸组成;优选地,非天然核苷酸包括:具有如下一种或多种修饰的核糖核苷酸:核糖2'位修饰、核糖骨架修饰、碱基修饰或磷酸骨架修饰;优选地,核糖2'位修饰包括2'-甲氧基修饰、2'-氟修饰、2'-氢修饰、2'-甲氧乙基修饰、2'-FANA修饰、锁核酸修饰或己糖醇核酸修饰;优选地,核糖骨架修饰包括将核苷酸中的核糖替换为ribuloNA、TNA、tPhoNA或dXNA;优选地,碱基修饰包括脱氮腺嘌呤C7修饰、脱氮鸟苷C7修饰、胞嘧啶C5修饰或尿苷C5修饰;磷酸骨架修饰包括PS修饰。
其中,锁核酸修饰为;己糖醇核酸修饰为/>;2'甲氧基乙基修饰为/>;2'甲氧基修饰为/>;2'氟修饰为;2'-FANA为/>;ribuloNA为/>;TNA为;tPhoNA为/>;dXNA为/>;PS修饰为。上述结构中Base均表示碱基。上述对于非天然核苷酸的修饰参见文献:Duffy K , Arangundy-Franklin S , Holliger P . Modified nucleic acids:replication, evolution, and next-generation therapeutics[J]. BMC Biology,2020, 18(1):112。非天然核苷酸(xeno-nucleic acid,XNA)是一类具有非天然骨架或核酸碱基的核酸分子。非天然核糖核苷酸,即为具有非天然骨架或核酸碱基的核糖核苷酸。上述底物中含有非天然核苷酸,连接制备的RNA中即含有非天然核苷酸,属于非天然tRNA。若底物供体的3'端碱基和/或底物受体的5'端碱基为非天然碱基时,虽然连接处的碱基与天然碱基不同,属于人为创造的非天然碱基,上述RNA连接酶也能够发挥连接活性。/>
在非天然核苷酸中,2'修饰增加了2'的空间位阻如甲氧基,或改变了2'基团性质如氟代,本申请公开的制备方法能够连接2'修饰核酸,故利用上述制备方法对于作为连接酶的天然底物的、且具有2'羟基的天然核酸也能够进行连接。
在本申请第二种典型的实施方式中,提供了一种含有硫代磷酸酯键的RNA,该含有硫代磷酸酯键的RNA包括利用上述制备方法制备获得的含有硫代磷酸酯键的RNA。
下面将结合具体的实施例来进一步详细解释本申请的有益效果。
实施例1 含硫代修饰的单链RNA的连接:
本实施例设计了两个单链非天然RNA底物F1和sF2。F1长度为13nt,5'为羟基,3'为羟基;sF2为10nt,5'磷酸硫代修饰,3'端被3'保护基封闭。
F1:SEQ ID NO:23:UmCmCmUmUmAmGfUmCfAfGfUmAm。
sF2:SEQ ID NO:24:GmAmUmAmUmUmUmUmAmUm。
其中,A、C、G或U后的m表示对于该核糖核苷酸的2'甲氧基修饰,f表示对于该核糖核苷酸的2'氟代修饰。
F1的第1、2、3、4、5、6、8、12和13位核糖核苷酸上具有2'甲氧基修饰,7、9、10和11位核糖核苷酸上具有2'氟修饰。
sF2的第1、2、3、4、5、6、7、8、9和10位核糖核苷酸上具有2'甲氧基修饰。
F1的3’羟基与sF2的5’硫代磷酸在RNA连接酶的催化下,形成硫代磷酸酯键,连接成一条23nt的单链RNA。
利用RNA连接酶进行连接反应,配制连接反应体系为50mM Tris-HCl(pH7.5)、10mMMgCl2、1mM DTT(二硫苏糖醇)、400μM ATP、200μM F1、200μM sF2,并在16℃条件下反应16h,反应完成后在80℃孵育5min终止反应。
利用尿素变性聚丙烯酰胺凝胶电泳对反应体系进行检测,凝胶电泳检测结果如图2所示,blank为未加RNA连接酶的阴性对照组,与blank相比,RNA连接酶ligase-1(SEQ IDNO:1),ligase-2(SEQ ID NO:2),ligase-3(SEQ ID NO:3),ligase-4(SEQ ID NO:4),ligase-5(SEQ ID NO:5),ligase-6(SEQ ID NO:6),ligase-7(SEQ ID NO:7),ligase-8(SEQ ID NO:8),ligase-9(SEQ ID NO:9),ligase-10(SEQ ID NO:10),ligase-11(SEQ IDNO:11),ligase-12(SEQ ID NO:12),ligase-13(SEQ ID NO:13),ligase-14(SEQ ID NO:14),ligase-15(SEQ ID NO:15),ligase-16(SEQ ID NO:16),ligase-17(SEQ ID NO:17),ligase-18(SEQ ID NO:18),ligase-19(SEQ ID NO:19),ligase-20(SEQ ID NO:20)的反应体系在21nt和25nt之间检测到新的RNA条带,液质联用分析检测新条带的分子量和F1与sF2连接产物理论分子量一致。
而在RNA连接酶ligase-23 (Methanothermobacter thermautotrophicus, RNAligase 3, NCBI Reference Sequence: WP_048060995.1),ligase-24 (Naegleriagruberi, RNA ligase 5, NCBI Reference Sequence: XP_002669268.1),ligase-25(Pyrococcus horikoshii, RNA ligase RtcB, PDB: 4DWR_A),ligase-26 (Thermococcusbarophilus, RNA ligase 1, NCBI Reference Sequence: WP_013466453.1),ligase-27(Cronobacter phage, RNA ligase 2, NCBI Reference Sequence: YP_003858534.1)的反应体系中未检测到连接产物条带,说明仅有特定的野生型RNA连接酶才可以催化含硫代修饰的单链RNA的连接反应。
UPLC检测分析RNA连接酶的催化活性如下表1。
表1
。
注:“+”表示0-1%(不包括端点值0%)的产物体系纯度,“++”表示1-2%(不包括端点值1%)的产物体系纯度,“+++”表示2-3%(不包括端点值2%)的产物体系纯度,“++++”表示3-4%(不包括端点值3%)的产物体系纯度。在本申请中,“产物体系纯度”表示在反应产物中,目标产物与反应体系中总成分(目标产物+剩余底物)的比值,可通算液相色谱结果中不同成分的曲线下面积进行计算。
实施例2 含硫代修饰的单链RNA的连接(夹板法):
本实施例设计了两个单链非天然RNA底物P11和P15以及夹板P14。P11长度为9nt,3'为羟基;P15为6nt,5'磷酸硫代修饰;P14为15nt的RNA序列;P13为无硫代修饰的与P14互补配对的15nt单链RNA。
P11:AmCfGmGfGmGfUmCfAm。
P15:CfUmGfAmGfUm。
P14:SEQ ID NO:25:AmCfUmCfAmGfUmGfAmCfCmCfCmGfUm。
P13:SEQ ID NO:26:AmCfGmGfGmGfUmCfAmCfUmGfAmGfUm。
其中,A、C、G或U后的m表示对于该核糖核苷酸的2'甲氧基修饰,f表示对于该核糖核苷酸的2'氟代修饰。
P11的第1、3、5、7和9位核糖核苷酸上具有2'甲氧基修饰,2、4、6和8位核糖核苷酸上具有2'氟修饰。
P15的第2、4和6位核糖核苷酸上具有2'甲氧基修饰,1、3和5位核糖核苷酸上具有2'氟修饰。
P14的第1、3、5、7、9、11、13和15位核糖核苷酸上具有2'甲氧基修饰,2、4、6、8、10、12和14位核糖核苷酸上具有2'氟修饰。
P13的第1、3、5、7、9、11、13和15位核糖核苷酸上具有2'甲氧基修饰,2、4、6、8、10、12和14位核糖核苷酸上具有2'氟修饰。
P11和P15与夹板P14退火,形成有缺口的互补配对的双链结构,在RNA连接酶的催化下,P11的3’羟基和P15的5’硫代磷酸形成硫代磷酸酯键,连接成一条15nt的RNA。
利用RNA连接酶进行连接反应,配制连接反应体系为50mM Tris-HCl(pH7.5)、10mMMgCl2、1mM DTT、1mM ATP、20μM P11、20μM P15、20μM P14,并在16℃条件下反应16h,反应完成后在80℃孵育5min终止反应。
利用尿素变性聚丙烯酰胺凝胶电泳对反应体系进行检测,凝胶电泳检测结果如图3所示,blank为未加RNA连接酶的阴性对照组,与blank相比,RNA连接酶ligase-2(SEQ IDNO:2),ligase-3(SEQ ID NO:3),ligase-4(SEQ ID NO:4),ligase-6(SEQ ID NO:6),ligase-7(SEQ ID NO:7),ligase-8(SEQ ID NO:8),ligase-9(SEQ ID NO:9),ligase-10(SEQ ID NO:10),ligase-11(SEQ ID NO:11),ligase-14(SEQ ID NO:14),ligase-16(SEQID NO:16),ligase-17(SEQ ID NO:17),ligase-18(SEQ ID NO:18),ligase-19(SEQ IDNO:19),ligase-20(SEQ ID NO:20),ligase-21(SEQ ID NO:21),ligase-22(SEQ ID NO:22)的反应体系在P13+P14标品的对应位置检测到新的RNA条带。质谱分析检测反应体系中存在与P11与P15连接产物理论分子量一致的新分子量。
而在RNA连接酶ligase-23 (Methanothermobacter thermautotrophicus, RNAligase 3, NCBI Reference Sequence: WP_048060995.1),ligase-24 (Naegleriagruberi, RNA ligase 5, NCBI Reference Sequence: XP_002669268.1),ligase-25(Pyrococcus horikoshii, RNA ligase RtcB, PDB: 4DWR_A),ligase-26 (Thermococcusbarophilus, RNA ligase 1, NCBI Reference Sequence: WP_013466453.1),ligase-27(Cronobacter phage, RNA ligase 2, NCBI Reference Sequence: YP_003858534.1)的反应体系中同样未检测到连接产物条带,说明仅特定的野生型RNA连接酶能催化含硫代修饰的单链RNA的夹板法连接反应。
UPLC检测反应前谱图如图4所示,反应后谱图如图5所示,对比可知,夹板P14与连接产物互补配对后形成新的反应产物峰。UPLC分析RNA连接酶的催化活性如下表2。
表2
。
注:“+”表示0-10%(不包括端点值0%)的产物体系纯度,“++”表示10-20%(不包括端点值10%)的产物体系纯度,“+++”表示20-30%(不包括端点值20%)的产物体系纯度,“++++”表示30-40%(不包括端点值30%)的产物体系纯度。
实施例3 含硫代修饰的单链RNA的连接(夹板法):
本实施例设计了两个单链非天然RNA底物SN-1和SN-2以及DNA夹板Nus-R。SN-1长度为8nt,5'为羟基,3'为羟基;SN-2为10nt,5'磷酸硫代修饰,3’为3’保护基;Nus-R为16nt的DNA序列。
SN-1:UmsCmsAmsCmsUmsUmsUmsCms。
SN-2:SEQ ID NO:27:AmsUmsAmsAmsUmsGmsCmsUmsGmsGms。
Nus-R:SEQ ID NO:28:dAdGdCdAdTdTdAdTdGdAdAdAdGdTdGdA。
其中,A、C、G或U后的m表示对于该核糖核苷酸的2'甲氧基修饰,s表示对于该核糖核苷酸的5'磷酸的硫代修饰,A、C、G或T前的d表示核苷酸为脱氧核糖核苷酸(DNA)。
SN-1的第1、2、3、4、5、6、7和8位核糖核苷酸上具有2'甲氧基修饰和,1、2、3、4、5、6、7和8位核糖核苷酸上具有5'磷酸的硫代修饰。
SN-2的第1、2、3、4、5、6、7、8、9和10位核糖核苷酸上具有2'甲氧基修饰和,1、2、3、4、5、6、7、8、9和10位核糖核苷酸上具有5'磷酸的硫代修饰。
Nus-R的第1-16位的核苷酸均为脱氧核糖核苷酸(DNA)。
利用下述RNA连接酶进行连接反应,配制连接反应体系为50 mM Tris-HCl(pH7.5)、10 mM MgCl2、1 mM DTT、1 mM ATP、100 μM SN-1、100 μM SN-2、100 μM Nus-R,0.2 mg/mL ligase,并在16℃条件下反应16h,反应完成后在80℃孵育5min终止反应。
UPLC检测结果如图6所示,在RNA连接酶ligase-2(SEQ ID NO:2),ligase-3(SEQID NO:3),ligase-4(SEQ ID NO:4),ligase-5(SEQ ID NO:5),ligase-6(SEQ ID NO:6),ligase-9(SEQ ID NO:9),ligase-10(SEQ ID NO:10),ligase-11(SEQ ID NO:11),ligase-14(SEQ ID NO:14),ligase-17(SEQ ID NO:17),ligase-18(SEQ ID NO:18),ligase-19(SEQ ID NO:19),ligase-20(SEQ ID NO:20),ligase-22(SEQ ID NO:22)的反应体系中检测到新峰。利用液质联用对该新峰进行鉴定,结果如图7所示,检测到新峰的分子量和SN-1与SN-2连接产物理论分子量一致。
实施例4 含硫代修饰的单链RNA的连接:
本实施例设计了两个单链非天然RNA底物SN-1和SN-2。SN-1长度为8nt,5'为羟基,3'为羟基;SN-2为10nt,5'磷酸硫代修饰,3’为3’保护基。
SN-1:UmsCmsAmsCmsUmsUmsUmsCms。
SN-2:SEQ ID NO:27:AmsUmsAmsAmsUmsGmsCmsUmsGmsGms。
其中,A、C、G或U后的m表示对于该核糖核苷酸的2'甲氧基修饰,s表示对于该核糖核苷酸的5'磷酸的硫代修饰。
SN-1的第1、2、3、4、5、6、7和8位核糖核苷酸上具有2'甲氧基修饰和,1、2、3、4、5、6、7和8位核糖核苷酸上具有5'磷酸的硫代修饰。
SN-2的第1、2、3、4、5、6、7、8、9和10位核糖核苷酸上具有2'甲氧基修饰和,1、2、3、4、5、6、7、8、9和10位核糖核苷酸上具有5'磷酸的硫代修饰。
利用RNA连接酶进行连接反应,配制连接反应体系为50 mM Tris-HCl(pH7.5)、10mM MgCl2、1 mM DTT、1 mM ATP、100 μM SN-1、100 μM SN-2,0.2 mg/mL ligase,并在16℃条件下反应16h,反应完成后在80℃孵育5min终止反应。
UPLC检测结果如图8所示,在RNA连接酶ligase-1(SEQ ID NO:1),ligase-4(SEQID NO:4),ligase-7(SEQ ID NO:7),ligase-8(SEQ ID NO:8),ligase-9(SEQ ID NO:9),ligase-10(SEQ ID NO:10),ligase-11(SEQ ID NO:11),ligase-12(SEQ ID NO:12),ligase-13(SEQ ID NO:13),ligase-14(SEQ ID NO:14),ligase-15(SEQ ID NO:15),ligase-16(SEQ ID NO:16),ligase-18(SEQ ID NO:18),ligase-19(SEQ ID NO:19)的反应体系中检测到新峰。利用液质联用对该新峰进行鉴定,结果如图9所示,检测到新峰的分子量和SN-1与SN-2连接产物理论分子量一致。
实施例5 含硫代修饰的双链RNA的连接:
本实施例设计了4个单链非天然RNA,d1长度12nt,5'为羟基,3'为羟基;d2长度9nt,5'磷酸硫代修饰,3’为3’保护基;d3长度9nt,5'磷酸硫代修饰;d4长度14nt,3'为羟基。其中,d1和d3能够互补配对形成双链RNA,d2和d4能够互补配对形成双链RNA,上述两条双链RNA可作为双链RNA连接的两条底物。
d1:SEQ ID NO:29:UmAmsCmsUmCmUmGfAmGfUfCfUm。
d2:AmsUmUmGmAmUmAmUmsUms。
d3:CmsAfGmAmGmUmAmUmsAms。
d4:SEQ ID NO:30:AmAfsUmsAmUmCfAmAmUmAmGmAmCmUf。
其中,A、C、G或U后的m表示对于该核糖核苷酸的2'甲氧基修饰,f表示对于该核糖核苷酸的2'氟代修饰,s表示对于该核糖核苷酸的5'磷酸的硫代修饰。
d1的第1、2、3、4、5、6、8和12位核糖核苷酸上具有2'甲氧基修饰,第7、9、10和11位核糖核苷酸上具有2'氟代修饰和,2和3位核糖核苷酸具有5'磷酸的硫代修饰。
d2的第1、2、3、4、5、6、7、8和9位核糖核苷酸上具有2'甲氧基修饰,第1、8和9位核糖核苷酸具有5'磷酸的硫代修饰。
d3的第1、3、4、5、6、7、8和9位核糖核苷酸上具有2'甲氧基修饰,第2位核糖核苷酸上具有2'氟代修饰,第1、8和9位核糖核苷酸具有5'磷酸的硫代修饰。
d4的第1、3、4、5、7、8、9、10、11、12和13位核糖核苷酸上具有2'甲氧基修饰,第2、6和14位核糖核苷酸上具有2'氟代修饰,第2和3位核糖核苷酸具有5'磷酸的硫代修饰。
利用RNA连接酶进行连接反应,配制连接反应体系为50 mM Tris-HCl(pH7.5)、10mM MgCl2、1 mM DTT、1 mM ATP、50 μM d1、50 μM d2、50 μM d3、50 μM d4,0.2 mg/mLligase,并在16℃条件下反应16h,反应完成后在80℃孵育5min终止反应。
UPLC检测结果如图10所示,在RNA连接酶ligase-2(SEQ ID NO:2),ligase-3(SEQID NO:3),ligase-4(SEQ ID NO:4),ligase-5(SEQ ID NO:5),ligase-6(SEQ ID NO:6),ligase-9(SEQ ID NO:9),ligase-10(SEQ ID NO:10),ligase-11(SEQ ID NO:11),ligase-14(SEQ ID NO:14),ligase-17(SEQ ID NO:17),ligase-18(SEQ ID NO:18),ligase-19(SEQ ID NO:19),ligase-20(SEQ ID NO:20),ligase-22(SEQ ID NO:22)的反应体系中检测到与产物标品对应的两个新峰。对两个产物峰进行质谱鉴定,均与连接产物的理论分子量一致。
实施例6 含硫代修饰的单链RNA的环化:
本实施例设计了1个单链非天然RNA底物C1,长度24nt,5'磷酸硫代修饰,3'为羟基。
C1:SEQ ID NO:31:GmsAmCmUmGmAmCmAmGmAmUmGmGmCmCmUmAmUmAmAmCmGmUmGm。
其中,A、C、G或U后的表示对于该核糖核苷酸的2'甲氧基修饰,s表示对于该核糖核苷酸的5'磷酸的硫代修饰。
C1的第1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23和24位核糖核苷酸上具有2'甲氧基修饰,第1位核糖核苷酸上具有5'磷酸的硫代修饰。
利用RNA连接酶进行环化反应,配制连接反应体系为50 mM Tris-HCl(pH7.5)、10mM MgCl2、1 mM DTT、20 μM ATP、10 μM C1,0.2 mg/mL ligase,并在37℃条件下反应16h。
在RNA连接酶ligase-1(SEQ ID NO:1),ligase-4(SEQ ID NO:4),ligase-7(SEQID NO:7),ligase-8(SEQ ID NO:8),ligase-9(SEQ ID NO:9),ligase-10(SEQ ID NO:10),ligase-11(SEQ ID NO:11),ligase-12(SEQ ID NO:12),ligase-13(SEQ ID NO:13),ligase-14(SEQ ID NO:14),ligase-15(SEQ ID NO:15),ligase-16(SEQ ID NO:16),ligase-18(SEQ ID NO:18),ligase-19(SEQ ID NO:19)反应体系中通过质谱分析均检测到产物分子量。利用尿素变性聚丙烯酰胺凝胶电泳分析反应体系中的条带,如图11所示,在C1条带下方检测到新的条带,即为环化产物条带。
目前合成RNA的主要方法是固相合成法。合成目标需要的RNA需要多次累积,并且在进行合成RNA链时,随着链长的增加收率降低,得到的产物中的杂质也变多,导致纯化过程繁琐,以致成本大大增加。针对固相合成存在的种种不足,很多新型的合成RNA的方法都在研究中,使用RNA连接酶连接反应生成RNA的方法就是其中之一。RNA连接酶是一类可以连接短RNA片段的酶,使用此方法具有效率高,成本低和环保等优点。
从以上的描述中,可以看出,本发明上述的实施例实现了如下技术效果:本申请中开发了一种含有硫代磷酸酯键的RNA的制备方法,利用上述制备方法和RNA连接酶,将底物的3'羟基与5'硫代磷酸连接,能够制备获得现有技术中难以获得的含有硫代磷酸酯键的RNA。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (22)
1.一种含有硫代磷酸酯键的RNA的制备方法,其特征在于,所述制备方法包括:
利用RNA连接酶催化底物的3'羟基与5'硫代磷酸连接,形成所述含有硫代磷酸酯键的RNA;
所述5'硫代磷酸包括含有硫代修饰的5'磷酸,所述硫代修饰包括所述5'磷酸的P-OH或P=O中的氧原子被硫原子取代,相应地变为P-SH或P=S;
所述RNA连接酶包括RNA连接酶家族1、2或3中任意的一种或多种酶。
2.根据权利要求1所述的制备方法,其特征在于,所述RNA连接酶包括:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQID NO:20、SEQ ID NO:21或SEQ ID NO:22所示的RNA连接酶中的一种或多种;或
与SEQ ID NO:1~SEQ ID NO:22中所示的任一种RNA连接酶具有70%以上同一性的酶,且具有催化3'羟基与5'硫代磷酸连接的活性的蛋白。
3.根据权利要求1所述的制备方法,其特征在于,所述底物包括单链RNA或双链RNA,相应地,所述含有硫代磷酸酯键的RNA包括含有硫代磷酸酯键的单链RNA或含有硫代磷酸酯键的双链RNA;
所述底物包括1个、2个或更多个。
4.根据权利要求3所述的制备方法,其特征在于,当所述底物为1个,所述底物为所述单链RNA时,所述底物的5'端为所述5'硫代磷酸,所述底物的3'端为所述3'羟基,
所述底物的5'端和所述底物的3'端在所述RNA连接酶的催化下连接、环化,获得环状的所述含有硫代磷酸酯键的单链RNA。
5.根据权利要求4所述的制备方法,其特征在于,利用夹板指导所述单链RNA的环化,所述夹板与所述单链RNA的从3'端至5'端的至少3个碱基特异性结合,所述夹板与所述单链RNA的从5'端至3'端的至少3个碱基特异性结合,所述夹板上的与所述单链RNA的3'端特异性结合的碱基,和与所述单链RNA的5'端特异性结合的碱基相邻。
6.根据权利要求3所述的制备方法,其特征在于,当所述底物为2个,所述底物为所述单链RNA时,所述底物包括第一底物和第二底物,所述第一底物的3'端为所述3'羟基,所述第二底物的5'端为所述5'硫代磷酸,
所述第一底物的3'端和所述第二底物的5'端在所述RNA连接酶的催化下连接,获得线性的所述含有硫代磷酸酯键的单链RNA。
7.根据权利要求6所述的制备方法,其特征在于,所述第二底物的3'端为3'保护基,且所述第一底物的5'端为5'保护基。
8.根据权利要求3所述的制备方法,其特征在于,当所述底物为2个,所述底物为所述双链RNA时,所述底物包括正义链和反义链,所述底物包括第一底物和第二底物;
所述第一底物的正义链的3'端为所述3'羟基,所述第一底物的反义链的5'端为5'磷酸;
所述第二底物的正义链的5'端为所述5'磷酸,所述第二底物的反义链的3'端为所述3'羟基;
所述第一底物的反义链和所述第二底物的正义链的5'磷酸中至少有一个为所述5'硫代磷酸;
所述第一底物的正义链的3'端和所述第二底物的正义链的5'端,在所述RNA连接酶的催化下连接;所述第一底物的反义链的5'端和所述第二底物的反义链的3'端,在所述RNA连接酶的催化下连接;
获得线性的所述含有硫代磷酸酯键的双链RNA。
9.根据权利要求8所述的制备方法,其特征在于,所述第一底物的反义链的3'端和所述第二底物的正义链的3'端均为3'保护基;
所述第一底物的正义链的5'端和所述第二底物的反义链的5'端均为5'保护基。
10.根据权利要求9所述的制备方法,其特征在于,所述第一底物和第二底物均为正义链和反义链长度不同的双链RNA,
所述第一底物的正义链的3'端与所述第二底物的反义链的3'端互补配对,或
所述第一底物的反义链的5'端与所述第二底物的正义链5'端互补配对,
使所述第一底物的正义链的3'端与所述第二底物的正义链的5'端相邻,所述第一底物的反义链的5'端与所述第二底物的反义链的3'端相邻。
11.根据权利要求6所述的制备方法,其特征在于,所述制备方法中还包括利用夹板指导所述第一底物和所述第二底物连接;
所述夹板与所述第一底物的从3'端至5'端的至少3个碱基特异性结合,所述夹板与所述第二底物的从5'端至3'端的至少3个碱基特异性结合。
12.根据权利要求11所述的制备方法,其特征在于,所述夹板上的与所述第一底物的3'端特异性结合的碱基,和与所述第二底物的5'端特异性结合的碱基相邻。
13.根据权利要求6-10中任一项所述的制备方法,其特征在于,重复利用所述制备方法,将3个或更多个所述底物进行多次连接,每次连接的所述底物的数量为2个,依次连接获得所述含有硫代磷酸酯键的RNA。
14.根据权利要求3所述的制备方法,其特征在于,所述制备方法包括利用夹板指导3个或更多个所述底物连接;
所述夹板与所述底物均存在至少3个碱基特异性结合。
15.根据权利要求14所述的制备方法,其特征在于,特异性结合在所述夹板上的所述底物的碱基相邻,相邻的所述碱基分别位于不同底物的5'端和3'端,
所述5'端为5'磷酸,所述5'磷酸中至少有一个为所述5'硫代磷酸;
所述3'端为羟基。
16.根据权利要求1所述的制备方法,其特征在于,所述RNA连接酶的催化体系包括:1-20000 µM所述底物,1-100000 μM ATP ,5-100 mM Tris-HCl ,0.1-20 mM 二价金属离子,0-10 mM二硫苏糖醇,0.001-10 mg/mL所述RNA连接酶。
17.根据权利要求16所述的制备方法,其特征在于,所述RNA连接酶催化的温度为4-50℃,催化的时间为0.1-24 h;
所述二价金属离子来源于MgCl2或MgSO4。
18.根据权利要求1所述的制备方法,其特征在于,所述底物中包括一个或多个非天然核苷酸,所述含有硫代磷酸酯键的RNA包括含有硫代磷酸酯键的非天然RNA。
19.根据权利要求18所述的制备方法,其特征在于,所述底物中的非天然核苷酸的数量≥2,所述底物的5'端和/或3'端为所述非天然核苷酸。
20.根据权利要求19所述的制备方法,其特征在于,所述底物由所述非天然核苷酸组成。
21.根据权利要求18至20中任一项所述的制备方法,其特征在于,
所述非天然核苷酸包括具有如下一种或多种修饰的核糖核苷酸:核糖2'位修饰、核糖骨架修饰、碱基修饰或磷酸骨架修饰;
所述核糖2'位修饰包括2'-甲氧基修饰、2'-氟修饰、2'-氢修饰、2'-甲氧乙基修饰、2'-FANA修饰、锁核酸修饰或己糖醇核酸修饰;
所述核糖骨架修饰包括将核苷酸中的核糖替换为ribuloNA、TNA、tPhoNA或dXNA;
所述碱基修饰包括脱氮腺嘌呤C7修饰、脱氮鸟苷C7修饰、胞嘧啶C5修饰或尿苷C5修饰;
所述磷酸骨架修饰包括PS修饰。
22.一种含有硫代磷酸酯键的RNA,其特征在于,所述含有硫代磷酸酯键的RNA包括利用权利要求1至21中任一项所述的制备方法制备获得的所述含有硫代磷酸酯键的RNA。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311335112.8A CN117070513B (zh) | 2023-10-16 | 2023-10-16 | 含有硫代磷酸酯键的rna及其制备方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311335112.8A CN117070513B (zh) | 2023-10-16 | 2023-10-16 | 含有硫代磷酸酯键的rna及其制备方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117070513A true CN117070513A (zh) | 2023-11-17 |
CN117070513B CN117070513B (zh) | 2024-04-26 |
Family
ID=88717617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311335112.8A Active CN117070513B (zh) | 2023-10-16 | 2023-10-16 | 含有硫代磷酸酯键的rna及其制备方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117070513B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110540992A (zh) * | 2019-08-21 | 2019-12-06 | 武汉泽智生物医药有限公司 | 增强靶基因沉默效率的siRNA分子及其应用 |
CN111235198A (zh) * | 2020-01-20 | 2020-06-05 | 深圳市瑞吉生物科技有限公司 | 规模化合成长链rna的方法及其定点修饰的方法 |
CN111971396A (zh) * | 2018-03-30 | 2020-11-20 | 住友化学株式会社 | 单链rna的制造方法 |
CN113439085A (zh) * | 2019-02-18 | 2021-09-24 | 味之素株式会社 | 包含互补部分的修饰寡核苷酸的制造方法 |
CN115491399A (zh) * | 2022-10-21 | 2022-12-20 | 中国海洋大学 | 一种制备腺苷酸化核酸产物的方法 |
CN115807048A (zh) * | 2022-07-19 | 2023-03-17 | 中国海洋大学 | 一种制备双链rna的方法 |
-
2023
- 2023-10-16 CN CN202311335112.8A patent/CN117070513B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111971396A (zh) * | 2018-03-30 | 2020-11-20 | 住友化学株式会社 | 单链rna的制造方法 |
CN113439085A (zh) * | 2019-02-18 | 2021-09-24 | 味之素株式会社 | 包含互补部分的修饰寡核苷酸的制造方法 |
CN110540992A (zh) * | 2019-08-21 | 2019-12-06 | 武汉泽智生物医药有限公司 | 增强靶基因沉默效率的siRNA分子及其应用 |
CN111235198A (zh) * | 2020-01-20 | 2020-06-05 | 深圳市瑞吉生物科技有限公司 | 规模化合成长链rna的方法及其定点修饰的方法 |
CN115807048A (zh) * | 2022-07-19 | 2023-03-17 | 中国海洋大学 | 一种制备双链rna的方法 |
CN115491399A (zh) * | 2022-10-21 | 2022-12-20 | 中国海洋大学 | 一种制备腺苷酸化核酸产物的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117070513B (zh) | 2024-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220073962A1 (en) | Methods for rna analysis | |
AU743469B2 (en) | Mirror-symmetrical selection and evolution of nucleic acids | |
JP3512818B2 (ja) | 合成触媒オリゴヌクレオチド及び核酸の目標配列の切断方法 | |
Sosson et al. | Enzyme-free ligation of dimers and trimers to RNA primers | |
WO2014144039A1 (en) | Characterization of mrna molecules | |
AU2014375404A9 (en) | Methods for RNA analysis | |
WO1996004403A1 (en) | Systematic evolution of ligands by exponential enrichment: chimeric selex | |
TW202113078A (zh) | 於半合成生物體中複製、轉錄及轉譯之試劑及方法 | |
WO2008120016A1 (en) | Modified nucleic acids | |
Wang et al. | Preparation of small RNAs using rolling circle transcription and site-specific RNA disconnection | |
US20220041645A1 (en) | Method for producing modified oligonucleotide comprising complementary portion | |
AU2018318135A1 (en) | Stabilized nucleic acids encoding messenger ribonucleic acid (MRNA) | |
EP4337331A1 (en) | Modified mrna, modified non-coding rna, and uses thereof | |
Musier-Forsyth et al. | Acceptor helix interactions in a class II tRNA synthetase: photoaffinity crosslinking of an RNA miniduplex substrate | |
EP4227412A1 (en) | Engineered guide rna for increasing efficiency of crispr/cas12f1 (cas14a1) system, and use thereof | |
Brinkman et al. | Nucleoside analogs in ADAR guide strands targeting 5′-UA [combining low line] sites | |
CN117070513B (zh) | 含有硫代磷酸酯键的rna及其制备方法 | |
US20220056425A1 (en) | Rna polymerase for synthesis of modified rna | |
CN117070514B (zh) | 非天然rna的制备方法及产品 | |
EP3775216A1 (en) | Oligonucleotide-mediated sense codon reassignment | |
Hollenstein | Enzymatic synthesis of base-modified nucleic acids | |
WO2024051143A1 (zh) | 利用rna连接酶制备寡核苷酸的方法 | |
CN117070583B (zh) | 抑制PCSK9基因表达的siRNA的制备方法 | |
WO2024119625A1 (zh) | 双链rna的合成方法及rna连接酶在双链rna合成中的应用 | |
Brinkman et al. | Chemical Biology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |