CN117568337A - 一种基于人源tRNA的自环化RNA - Google Patents
一种基于人源tRNA的自环化RNA Download PDFInfo
- Publication number
- CN117568337A CN117568337A CN202311532224.2A CN202311532224A CN117568337A CN 117568337 A CN117568337 A CN 117568337A CN 202311532224 A CN202311532224 A CN 202311532224A CN 117568337 A CN117568337 A CN 117568337A
- Authority
- CN
- China
- Prior art keywords
- rna
- trna
- sequence
- ribozyme
- human
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108020004566 Transfer RNA Proteins 0.000 claims abstract description 677
- 241000282414 Homo sapiens Species 0.000 claims abstract description 485
- 108091092562 ribozyme Proteins 0.000 claims abstract description 257
- 108090000994 Catalytic RNA Proteins 0.000 claims abstract description 241
- 102000053642 Catalytic RNA Human genes 0.000 claims abstract description 241
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract description 197
- 108091028075 Circular RNA Proteins 0.000 claims abstract description 93
- 239000002243 precursor Substances 0.000 claims abstract description 57
- 238000000034 method Methods 0.000 claims abstract description 48
- 239000013598 vector Substances 0.000 claims abstract description 48
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 43
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 38
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 30
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 30
- 229910019142 PO4 Inorganic materials 0.000 claims abstract description 28
- 239000010452 phosphate Substances 0.000 claims abstract description 25
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 claims abstract description 24
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims abstract description 11
- 230000004071 biological effect Effects 0.000 claims abstract description 9
- 108020005098 Anticodon Proteins 0.000 claims description 71
- 238000001890 transfection Methods 0.000 claims description 57
- 239000002773 nucleotide Substances 0.000 claims description 55
- 125000003729 nucleotide group Chemical group 0.000 claims description 55
- 230000036961 partial effect Effects 0.000 claims description 54
- 108090000623 proteins and genes Proteins 0.000 claims description 50
- 238000000338 in vitro Methods 0.000 claims description 43
- 238000003776 cleavage reaction Methods 0.000 claims description 39
- 230000000295 complement effect Effects 0.000 claims description 39
- 238000013518 transcription Methods 0.000 claims description 38
- 230000035897 transcription Effects 0.000 claims description 38
- 108020004414 DNA Proteins 0.000 claims description 34
- 102000004169 proteins and genes Human genes 0.000 claims description 34
- 230000007017 scission Effects 0.000 claims description 34
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 claims description 28
- 238000007363 ring formation reaction Methods 0.000 claims description 27
- 108091026890 Coding region Proteins 0.000 claims description 25
- 108700026244 Open Reading Frames Proteins 0.000 claims description 22
- 101710086015 RNA ligase Proteins 0.000 claims description 18
- 108091027757 Deoxyribozyme Proteins 0.000 claims description 17
- 230000009471 action Effects 0.000 claims description 12
- 238000004519 manufacturing process Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 11
- 108091008146 restriction endonucleases Proteins 0.000 claims description 10
- 238000010008 shearing Methods 0.000 claims description 9
- 108010053770 Deoxyribonucleases Proteins 0.000 claims description 7
- 102000016911 Deoxyribonucleases Human genes 0.000 claims description 7
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 claims description 6
- 201000010099 disease Diseases 0.000 claims description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 6
- 230000002163 immunogen Effects 0.000 claims description 6
- 230000001225 therapeutic effect Effects 0.000 claims description 5
- 102000004190 Enzymes Human genes 0.000 claims description 4
- 108090000790 Enzymes Proteins 0.000 claims description 4
- 229940022005 RNA vaccine Drugs 0.000 claims description 4
- 108700021021 mRNA Vaccine Proteins 0.000 claims description 4
- 108090001102 Hammerhead ribozyme Proteins 0.000 claims description 3
- 229910000147 aluminium phosphate Inorganic materials 0.000 claims description 3
- 108090001052 hairpin ribozyme Proteins 0.000 claims description 3
- 238000004804 winding Methods 0.000 claims description 3
- 108091092512 GIR1 branching ribozyme Proteins 0.000 claims description 2
- 108091027874 Group I catalytic intron Proteins 0.000 claims description 2
- 108091029499 Group II intron Proteins 0.000 claims description 2
- 108091080980 Hepatitis delta virus ribozyme Proteins 0.000 claims description 2
- 241000726445 Viroids Species 0.000 claims description 2
- 239000003814 drug Substances 0.000 claims description 2
- 101150117187 glmS gene Proteins 0.000 claims description 2
- 108090000883 varkud satellite ribozyme Proteins 0.000 claims description 2
- 238000005538 encapsulation Methods 0.000 claims 1
- 230000003053 immunization Effects 0.000 claims 1
- 238000002649 immunization Methods 0.000 claims 1
- 210000004027 cell Anatomy 0.000 description 119
- 230000001293 nucleolytic effect Effects 0.000 description 32
- 239000013612 plasmid Substances 0.000 description 32
- 108060001084 Luciferase Proteins 0.000 description 23
- 239000005089 Luciferase Substances 0.000 description 23
- 230000014509 gene expression Effects 0.000 description 20
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 19
- 241000700605 Viruses Species 0.000 description 19
- 235000021317 phosphate Nutrition 0.000 description 19
- 230000004048 modification Effects 0.000 description 18
- 238000012986 modification Methods 0.000 description 18
- 108091092195 Intron Proteins 0.000 description 16
- 108090000364 Ligases Proteins 0.000 description 16
- 102000003960 Ligases Human genes 0.000 description 16
- 239000012634 fragment Substances 0.000 description 16
- 108700024394 Exon Proteins 0.000 description 15
- 239000013642 negative control Substances 0.000 description 14
- 101150033305 rtcB gene Proteins 0.000 description 14
- 125000006850 spacer group Chemical group 0.000 description 12
- 239000000758 substrate Substances 0.000 description 11
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 10
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 10
- 239000002299 complementary DNA Substances 0.000 description 10
- 238000013461 design Methods 0.000 description 10
- 239000005090 green fluorescent protein Substances 0.000 description 10
- 238000010276 construction Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 238000011144 upstream manufacturing Methods 0.000 description 8
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 229910052791 calcium Inorganic materials 0.000 description 7
- 239000011575 calcium Substances 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000005847 immunogenicity Effects 0.000 description 7
- 238000001638 lipofection Methods 0.000 description 7
- 108020004999 messenger RNA Proteins 0.000 description 7
- 102000040430 polynucleotide Human genes 0.000 description 7
- 108091033319 polynucleotide Proteins 0.000 description 7
- 239000002157 polynucleotide Substances 0.000 description 7
- 108090000765 processed proteins & peptides Proteins 0.000 description 7
- 102000004008 5'-Nucleotidase Human genes 0.000 description 6
- 150000001413 amino acids Chemical class 0.000 description 6
- 239000003153 chemical reaction reagent Substances 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 6
- 238000010362 genome editing Methods 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 108010043671 prostatic acid phosphatase Proteins 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 239000013603 viral vector Substances 0.000 description 6
- 102000004127 Cytokines Human genes 0.000 description 5
- 108090000695 Cytokines Proteins 0.000 description 5
- 238000010357 RNA editing Methods 0.000 description 5
- 230000026279 RNA modification Effects 0.000 description 5
- 238000011529 RT qPCR Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 108091070501 miRNA Proteins 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 101100245773 Dictyostelium discoideum psiC gene Proteins 0.000 description 4
- 108020005004 Guide RNA Proteins 0.000 description 4
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- -1 interfering RNAs Proteins 0.000 description 4
- 230000003834 intracellular effect Effects 0.000 description 4
- 229920001184 polypeptide Polymers 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 238000010839 reverse transcription Methods 0.000 description 4
- 229920002477 rna polymer Polymers 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 108091023037 Aptamer Proteins 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 3
- 241000283073 Equus caballus Species 0.000 description 3
- 101000926535 Homo sapiens Interferon-induced, double-stranded RNA-activated protein kinase Proteins 0.000 description 3
- 102100034170 Interferon-induced, double-stranded RNA-activated protein kinase Human genes 0.000 description 3
- 108090000638 Ribonuclease R Proteins 0.000 description 3
- 239000006227 byproduct Substances 0.000 description 3
- 239000006285 cell suspension Substances 0.000 description 3
- 229940088598 enzyme Drugs 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 230000028993 immune response Effects 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000000504 luminescence detection Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000001177 retroviral effect Effects 0.000 description 3
- 238000003151 transfection method Methods 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- OZFAFGSSMRRTDW-UHFFFAOYSA-N (2,4-dichlorophenyl) benzenesulfonate Chemical compound ClC1=CC(Cl)=CC=C1OS(=O)(=O)C1=CC=CC=C1 OZFAFGSSMRRTDW-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- 108091032955 Bacterial small RNA Proteins 0.000 description 2
- 241000709675 Coxsackievirus B3 Species 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- 239000012591 Dulbecco’s Phosphate Buffered Saline Substances 0.000 description 2
- 241000710188 Encephalomyocarditis virus Species 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 101710091919 Eukaryotic translation initiation factor 4G Proteins 0.000 description 2
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 2
- 101000857677 Homo sapiens Runt-related transcription factor 1 Proteins 0.000 description 2
- 241000709701 Human poliovirus 1 Species 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- 108091008103 RNA aptamers Proteins 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 108091027544 Subgenomic mRNA Proteins 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 102100035140 Vitronectin Human genes 0.000 description 2
- 108010031318 Vitronectin Proteins 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 238000010805 cDNA synthesis kit Methods 0.000 description 2
- 238000005251 capillar electrophoresis Methods 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 2
- 102000050291 human RUNX1 Human genes 0.000 description 2
- 238000003670 luciferase enzyme activity assay Methods 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 1
- KHWCHTKSEGGWEX-RRKCRQDMSA-N 2'-deoxyadenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 KHWCHTKSEGGWEX-RRKCRQDMSA-N 0.000 description 1
- NCMVOABPESMRCP-SHYZEUOFSA-N 2'-deoxycytosine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 NCMVOABPESMRCP-SHYZEUOFSA-N 0.000 description 1
- LTFMZDNNPPEQNG-KVQBGUIXSA-N 2'-deoxyguanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 LTFMZDNNPPEQNG-KVQBGUIXSA-N 0.000 description 1
- 108010037497 3'-nucleotidase Proteins 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- ZXIATBNUWJBBGT-JXOAFFINSA-N 5-methoxyuridine Chemical compound O=C1NC(=O)C(OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZXIATBNUWJBBGT-JXOAFFINSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- 101150059573 AGTR1 gene Proteins 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 241000317943 Acute bee paralysis virus Species 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 244000144730 Amygdalus persica Species 0.000 description 1
- 102100037435 Antiviral innate immune response receptor RIG-I Human genes 0.000 description 1
- 101710127675 Antiviral innate immune response receptor RIG-I Proteins 0.000 description 1
- 241001261139 Aphid lethal paralysis virus Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241001589086 Bellapiscis medius Species 0.000 description 1
- 241000318498 Black queen cell virus Species 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 1
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 1
- 244000308180 Brassica oleracea var. italica Species 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 241000219193 Brassicaceae Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 102000000905 Cadherin Human genes 0.000 description 1
- 108050007957 Cadherin Proteins 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 102100038909 Caveolin-2 Human genes 0.000 description 1
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 description 1
- 241000710777 Classical swine fever virus Species 0.000 description 1
- 241000710127 Cricket paralysis virus Species 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 241000709661 Enterovirus Species 0.000 description 1
- 241001529459 Enterovirus A71 Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 108090000386 Fibroblast Growth Factor 1 Proteins 0.000 description 1
- 102000003971 Fibroblast Growth Factor 1 Human genes 0.000 description 1
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 1
- 102100036264 Glucose-6-phosphatase catalytic subunit 1 Human genes 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 241000711549 Hepacivirus C Species 0.000 description 1
- 241000709721 Hepatovirus A Species 0.000 description 1
- 235000005206 Hibiscus Nutrition 0.000 description 1
- 235000007185 Hibiscus lunariifolius Nutrition 0.000 description 1
- 244000284380 Hibiscus rosa sinensis Species 0.000 description 1
- 101000971171 Homo sapiens Apoptosis regulator Bcl-2 Proteins 0.000 description 1
- 101000806663 Homo sapiens Aquaporin-4 Proteins 0.000 description 1
- 101000740062 Homo sapiens BAG family molecular chaperone regulator 1 Proteins 0.000 description 1
- 101000896157 Homo sapiens Baculoviral IAP repeat-containing protein 2 Proteins 0.000 description 1
- 101100275820 Homo sapiens CSDE1 gene Proteins 0.000 description 1
- 101000740981 Homo sapiens Caveolin-2 Proteins 0.000 description 1
- 101000804865 Homo sapiens E3 ubiquitin-protein ligase XIAP Proteins 0.000 description 1
- 101000899240 Homo sapiens Endoplasmic reticulum chaperone BiP Proteins 0.000 description 1
- 101100281008 Homo sapiens FGF2 gene Proteins 0.000 description 1
- 101000846416 Homo sapiens Fibroblast growth factor 1 Proteins 0.000 description 1
- 101000930910 Homo sapiens Glucose-6-phosphatase catalytic subunit 1 Proteins 0.000 description 1
- 101000972291 Homo sapiens Lymphoid enhancer-binding factor 1 Proteins 0.000 description 1
- 101100519221 Homo sapiens PDGFB gene Proteins 0.000 description 1
- 101000864780 Homo sapiens Pulmonary surfactant-associated protein A1 Proteins 0.000 description 1
- 101100462513 Homo sapiens TP53 gene Proteins 0.000 description 1
- 101000775102 Homo sapiens Transcriptional coactivator YAP1 Proteins 0.000 description 1
- 101000808011 Homo sapiens Vascular endothelial growth factor A Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 241000430519 Human rhinovirus sp. Species 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 101001046872 Mus musculus Hypoxia-inducible factor 1-alpha Proteins 0.000 description 1
- 101100140104 Mus musculus Rbm3 gene Proteins 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108010019160 Pancreatin Proteins 0.000 description 1
- 241001674048 Phthiraptera Species 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- 102100040990 Platelet-derived growth factor subunit B Human genes 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 108090001087 RNA ligase (ATP) Proteins 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241001492664 Solenopsis <angiosperm> Species 0.000 description 1
- 241000256247 Spodoptera exigua Species 0.000 description 1
- 102000006290 Transcription Factor TFIID Human genes 0.000 description 1
- 108010083268 Transcription Factor TFIID Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102100031873 Transcriptional coactivator YAP1 Human genes 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 241001223089 Tremovirus A Species 0.000 description 1
- 241000219793 Trifolium Species 0.000 description 1
- 108091027572 Twister ribozyme Proteins 0.000 description 1
- 101001001642 Xenopus laevis Serine/threonine-protein kinase pim-3 Proteins 0.000 description 1
- 239000000980 acid dye Substances 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 239000003124 biologic agent Substances 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 238000012832 cell culture technique Methods 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 1
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 239000007857 degradation product Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 201000002491 encephalomyelitis Diseases 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000012091 fetal bovine serum Substances 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 102000057121 human AQP4 Human genes 0.000 description 1
- 102000051711 human BCL2 Human genes 0.000 description 1
- 102000046317 human CSDE1 Human genes 0.000 description 1
- 102000048874 human LEF1 Human genes 0.000 description 1
- 102000054741 human SFTPA1 Human genes 0.000 description 1
- 102000058223 human VEGFA Human genes 0.000 description 1
- 102000052732 human XIAP Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 230000002519 immonomodulatory effect Effects 0.000 description 1
- 230000009851 immunogenic response Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 208000024191 minimally invasive lung adenocarcinoma Diseases 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 108700040054 mouse Nkx6-2 Proteins 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 231100000590 oncogenic Toxicity 0.000 description 1
- 230000002246 oncogenic effect Effects 0.000 description 1
- 229940055695 pancreatin Drugs 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 108091029536 tRNA precursor Proteins 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000037303 wrinkles Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/7105—Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/34—Polynucleotides, e.g. nucleic acids, oligoribonucleotides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/532—Closed or circular
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Veterinary Medicine (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Epidemiology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
本发明提供一种可在细胞内自环化的RNA(Automatic Circulating RNA,acRNA)及其前体RNA(precursor RNA,preRNA),该前体RNA(preRNA)从5'至3'方向按顺序包含:5'端基于人源tRNA设计的核酶剪接元件;具有生物学活性的RNA序列;3'端基于人源tRNA设计的核酶剪接元件,该自环化RNA(acRNA)从5'至3'方向按顺序包含:5'端形成羟基的人源tRNA序列;具有生物学活性的RNA序列;3'端形成2',3'‑环磷酸的人源tRNA序列;以及还提供一种制备以上前体RNA的核酸载体以及生成环状RNA的方法。
Description
技术领域
本发明涉及生物技术领域,具体涉及一种自环化RNA(Automatic CirculatingRNA,acRNA),环状RNA及其制备方法。
背景技术
环状RNA(Circular RNA,circRNA)是一类不具有5'端帽子和3'端polyA尾巴,且5'端与3'端以共价健形成环状结构的RNA分子。有报道称circRNA可参与调节基因转录、miRNA活性的中和以及RNA结合蛋白的结合,也可作为模板翻译成蛋白质(Yang,Y.,et al.,“Extensive translation of circular RNAs driven by N(6)-methyladenosine,”,CellResearch,27(5):626-641(2017);Abe,N.,et al.,“Rolling Circle Translation ofCircular RNAin Living Human Cells”,Scientific Reports,5:16435(2015);Gao,X.,etal.,“Circular RNA-encoded oncogenic E-cadherin variant promotes glioblastomatumorigenicity through activation of EGFR-STAT3signalling,”Nature CellBiology,23(3):278-291(2021);Pamudurti,NR.,et al.,“Translation of CircRNAs,”Molecular Cell,66(1):9-21(2017))。与线性RNA相比,circRNA由于其共价闭合的环状头尾结构不易被RNA降解系统识别,具有更强的稳定性。随着RNA疫苗的发展,circRNA由于其高度的稳定性和简单的生产工艺,已成为核酸药物领域的研究热点。此外,circRNA具有调控基因表达的作用,可作为生物传感器,也可作为疾病治疗或诊断的生物标记物,是治疗人类疾病的热门靶点。
近年来,人们对开发circRNA的合成技术越来越感兴趣。排列内含子和外显子法(permuted introns and exons,PIE)是目前研究最多、应用最广泛的circRNA合成方法。2018年,Daneil Aderson等人利用改良的PIE法证实外源性circRNA可在真核细胞中稳定、高效表达蛋白(Anderson,D.,et al.,“Engineering circular RNA for potent andstable translation in eukaryotic cells”,Nat Commun.2018Jul 6;9(1):2629)。然而,由于PIE法是通过自发的分子内共价连接反应生成circRNA,其反应特点使之也可能发生分子间连接产生副产物,且连接效率低,环化效率不稳定。随着目标RNA的长度增长,环化成功率会大幅下降,副产物大量增加。此外,为除去非环化的RNA和富集circRNA,一般还需要通过RNase R将未环化的RNA去除。但是由于环状RNA和线性的RNA性质接近,很难在分离柱上获得基线分离,加之RNase R常残留对环状RNA非特异的降解活性,使得在体外大规模制备环状RNA存在很高的成本,且因难以避免的质控副产物和富集步骤带来的降解产物以及额外的RNase R酶残留,环状RNA的商业化质控也面临很大挑战。
除此之外,已有研究通过利用后生动物的tRNA内含子环化机制,在体外或细胞内合成短小的环状RNA适配体(RNA aptamer),有效提高了RNA适配体调节蛋白质的功能(Litke JL,Jaffrey SR.Highly efficient expression of circular RNA aptamers incells using autocatalytic transcripts.Nat Biotechnol.2019Jun;37(6):667-675.)。该方法可实现短小RNA的环化,然而该方法目前只用于短小的RNA适配体(Broccoli,长度仅49nt)的环化,此外,该方法使用的是果蝇tRNA的部分序列,特别是该tRNA的内含子部分,这些非人源化的序列存在一定的潜在安全性风险,比如可能引入额外的免疫原性反应,或干扰细胞内其他内源性RNA的正常功能。因此,如何设计出成本更低、高品质和更安全可用于长序列基因表达的环化RNA,仍是本领域亟待解决的问题。
以上提及的文献均以全文引入本文。
发明内容
本发明发现,人源tRNA的有效序列可进行细胞内的自环化,并构建了通用型自环化RNA(Automatic Circulating RNA,acRNA)的框架模板,可方便的用于制备不同大小的自环化RNA。本发明通过利用细胞内天然的tRNA剪接机制,可以在细胞内进行RNA高效的自环化,无需进行体外环化和富集,极大的降低了现有PIE等体外环化方法的高成本和纯化难度。同时,由于本发明采用了人源化的tRNA序列,也降低了潜在的安全性风险。本发明提供的含人源tRNA部分序列的acRNA,还可携带长序列的目的基因片段,可成功用于蛋白质稳定表达、基因编辑,RNA编辑等多种应用。
如本文所用,转运核糖核酸(transfer ribonucleic acid,tRNA)是一种比较小的RNA,成熟的tRNA一般由74-93个核苷酸构成,其二级结构为四茎三环的三叶草结构,三环即D环、反密码子环和TΨC环,四个茎,即D茎(与D环联接的茎)、反密码子茎(与反密码子环联接)、TΨC茎(与TΨC环联接)和氨基酸接受茎,如图1A所示。tRNA基因可根据其是否含有内含子分为两类,其中含有内含子的tRNA基因首先转录出含内含子的tRNA前体,除了上述茎/环结构外(除尚未形成的反密码子环外),还含有内含子茎和内含子环(如图1B所示),在转录出前体tRNA后的成熟过程中,前体tRNA(precursor tRNA,pre-tRNA)需要经过一系列转录后加工和修饰,去掉内含子部分,形成反密码子环,完成碱基修饰后才能生成成熟的tRNA。在pre-tRNA的成熟过程中,至关重要的一步是“tRNA剪接”,用于除去内含子和把外显子连接起来。剪接后,外显子一侧会形成反密码子环,内含子一侧的内含子茎的游离端也会被连接起来形成一个小的环状RNA,如图1B所示。在已知的生物中,原核和真核生物中均发现有一部分tRNA基因存在内含子,这些内含子序列必须经过tRNA剪接被精确地去除。目前发现的人类tRNA基因中,含有内含子的tRNA根据其反密码子和可携带的氨基酸残基可分为7类:人源tRNATyr-GTA(SEQ ID NO:1~13)、tRNATyr-ATA(SEQ ID NO:14)、tRNAIle-TAT(SEQID NO:15~19)、tRNAArg-TCT(SEQ ID NO:20~23)、tRNALeu-CAA(SEQ ID NO:24~28)、tRNAPro-AGG(SEQ ID NO:29)或tRNAPhe-GAA(如SEQ ID NO:30)。在真核生物中,tRNA剪接分为“剪”和“接”两个过程:前者负责将pre-tRNA中的内含子去除,由TSEN复合物执行;后者负责将切开的两个外显子连接,由tRNA连接酶(RtcB)介导。
一方面,本发明提供一种能够形成自环化RNA(acRNA)的前体RNA(preRNA),前体RNA为一种线性RNA,从5'至3'方向按顺序包含以下结构域:
a:5'端基于人源tRNA设计的核酶剪接元件;
x:具有生物学活性的RNA序列;
d:3'端基于人源tRNA设计的核酶剪接元件,
其中,5'端基于人源tRNA设计的核酶剪接元件和/或3'端基于人源tRNA设计的核酶剪接元件均包含核酶识别序列和人源tRNA的部分序列,且5'端基于人源tRNA设计的核酶剪接元件可以在自剪切核酶或DNA核酶的作用下被切割并生成5'-羟基;3'端基于人源tRNA设计的核酶剪接元件可以在自剪切核酶或DNA核酶的作用下被切割并生成2',3'-环磷酸。特别地,所述核酶识别序列与具有生物学活性的RNA序列之间存在至少部分人源tRNA的序列,例如部分3'端人源tRNA位于所述5'端基于人源tRNA设计的核酶剪接元件的3’端,或部分5'端人源tRNA位于所述3'端基于人源tRNA设计的核酶剪接元件的5’端。
在一些实施方案中,所述具有生物学活性的RNA序列包括但不限于基因编辑中使用的引导RNAs(如gRNA、sgRNA、crRNA、omegaRNA和pegRNA等),RNA编辑中使用的自招募RNA(arRNA),反义RNA,干扰RNA,微小RNA(microRNA),长链非编码RNA(lncRNA)和自放大RNA(saRNA)以及编码所需蛋白质如抗原的RNA等RNA序列中的一种或多种。
在一些实施方案中,a和d之间x序列的总核苷酸数量或具有生物学活性的RNA序列的总核苷酸数量大于100nt。在一些实施方案中,a和d之间x序列的总核苷酸数量或具有生物学活性的RNA序列的总核苷酸数量大于500nt。在一些实施方案中,a和d之间x序列的总核苷酸数量或具有生物学活性的RNA序列的总核苷酸数量大于1000nt。在一些实施方案中,a和d之间x序列的总核苷酸数量或具有生物学活性的RNA序列的总核苷酸数量大于2000nt。在一些实施方案中,a和d之间x序列的总核苷酸数量或具有生物学活性的RNA序列的总核苷酸数量大于5000nt。在一些实施方案中,a和d之间x序列的总核苷酸数量大于6000nt。在一些实施方案中,a和d之间x序列的总核苷酸数量或具有生物学活性的RNA序列的总核苷酸数量大于7000nt。在一些实施方案中,a和d之间x序列的总核苷酸数量或具有生物学活性的RNA序列的总核苷酸数量大于8000nt。在一些实施方案中,a和d之间x序列的总核苷酸数量或具有生物学活性的RNA序列的总核苷酸数量大于9000nt。在一些实施方案中,a和d之间x序列的总核苷酸数量或具有生物学活性的RNA序列的总核苷酸数量大于10000nt。
在一些实施方案中,x序列的总核苷酸数量或具有生物学活性的RNA序列的总核苷酸数量为A至B个nt,其中A小于B并且A是1至2000的整数以及B是100至20000的整数,例如A和B独立地选自5、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、250、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、3000、4000、5000、6000、7000、8000、9000、10000、11000、12000、13000、14000、15000、16000、17000、18000、19000和20000。例如,x序列的总核苷酸数量或具有生物学活性的RNA序列的总核苷酸数量为10-20000、10-15000、10-10000、10-5000、10-2000、10-1500、10-1400、10-1300、10-1200、10-1100、50-20000、50-15000、50-10000、50-5000、50-2000、50-1500、50-1400、50-1300、50-1200、50-1100、100-20000、100-15000、100-10000、100-5000、100-2000、100-1500、100-1400、100-1300、100-1200、100-1100、500-20000、500-15000、500-10000、500-5000、500-2000、500-1500、500-1400、500-1300、500-1200、1000-20000、1000-15000、1000-10000、1000-5000、1000-2000、1000-1500、1000-1400、1000-1300、1000-1200、2000-20000、2000-15000、2000-10000、2000-5000、2000-4000、2000-3000或2000-2500个nt。
在一些实施方案中,具有生物学活性的RNA序列包含或为蛋白编码序列(CDS)及内部核糖体进入位点(IRES)。具体地,前体RNA从5'至3'方向按顺序包含以下结构域:
a:5'端基于人源tRNA设计的核酶剪接元件;
b:内部核糖体进入位点(IRES);
c:蛋白编码区(CDS);
d:3'端基于人源tRNA设计的核酶剪接元件。
所述5'端基于人源tRNA设计的核酶剪接元件可以在自剪切核酶或DNA核酶的作用下被切割并生成5'-羟基;所述3'端基于人源tRNA设计的核酶剪接元件可以在自剪切核酶或DNA核酶的作用下被切割并生成2',3'-环磷酸。
在一些实施方案中,上述结构域的核苷酸序列之间可包括不同序列的间隔物,或者其中某两个结构域的核苷酸序列之间包括间隔物,以便进一步提高细胞内的稳定性或表达效率。
进一步地,前体RNA为以下结构:
a-b-c-d
a、b、c、d结构域按顺序依次连接,上述结构域的b和/或c也可以由其他具有其他生物学功能的序列取代。
在一些实施方案中,5'端基于人源tRNA设计的核酶剪接元件和3'端基于人源tRNA设计的核酶剪接元件的人源tRNA的部分序列分别选自人源tRNA的外显子全长/截短序列,且5'端的人源tRNA的部分序列与3'端的人源tRNA的部分序列包含人源tRNA中能够部分互补并至少形成反密码子茎的核苷酸序列。
在一些实施方案中,5'端基于人源tRNA设计的核酶剪接元件和3'端基于人源tRNA设计的核酶剪接元件的人源tRNA的部分序列分别选自人源tRNA的内含子序列,且5'端的人源tRNA的部分序列与3'端的人源tRNA的部分序列包含人源tRNA中能够部分互补并形成内含子茎的核苷酸序列。
在一些实施方案中,3'端和5'端基于人源tRNA设计的核酶剪接元件包括人源tRNA的部分序列和核酶识别序列,优选地人源tRNA的部分序列至少包含能够在核酶切割后部分互补并形成含内含子的人源tRNA剪接位点处特有的末端局部双链RNA(反密码子茎或内含子茎)序列。除此之外,5'端基于人源tRNA设计的核酶剪接元件的3’端,和/或3'端基于人源tRNA设计的核酶剪接元件的5’端,也可以含有(或不含)额外的所述人源tRNA的其他茎或环结构。所形成的tRNA剪接位点末端的反密码子茎或反密码子茎+其他茎+环或内含子茎的结构均是RtcB连接酶的有效底物。
在一些实施方案中,基于tRNA设计的核酶剪接元件为包含外显子中反密码子茎的tRNA部分序列和核酶识别序列组成。在一些实施方案中,基于tRNA设计的核酶剪接元件为tRNA的全部或部分外显子序列(至少含反密码子茎)和核酶识别序列组成。在一些实施方案中,以tRNA内含子茎和核酶识别序列组成作为tRNA核酶剪接元件。制备模板质粒时,将目标序列插入上述外显子(至少含反密码子茎)远离反密码子环一侧或内含子茎靠近内含子环一侧。当体外转录生成preRNA后,被核酶(RNA核酶或另加DNA核酶)切割时,切割位点发生在插入目标序列位置的反密码子茎或内含子茎的另一侧,从而产生适合连接的末端,即形成反密码子环的开环末端或远离内含子环的内含子茎的游离末端。接着,在体外或体内RNA连接酶(RtcB)的作用下,外显子(至少含反密码子茎)的反密码子环的开环末端侧或内含子茎远离内含子环的游离末端一侧被连接成环。
如本文所用,基于人源tRNA设计的核酶剪接元件包含“人源tRNA的部分序列”或“人源tRNA序列”是指该元件包含的至少部分核糖核酸碱基序列与天然的人源tRNA序列的一部分或全部是相同的。需要指出的是,该部分核糖核酸碱基序列与天然的人源tRNA序列的一部分或全部可以不是100%完全相同。在一些实施方案中,该部分核糖核酸碱基序列可以包含一或多种修饰(例如人源tRNA序列未包含的修饰),例如用于提高核酸分子稳定性的修饰,这些修饰是本领域技术人员已知的或者根据技术知识可以合理确定的。在一些实施方案中,该部分核糖核酸碱基序列可以存在部分突变,例如用于提高核酶剪切的活性,这些突变是本领域技术人员已知的或者根据技术知识可以合理确定的。
如本文所用,“全长外显子”或“外显子全长序列”,指人源tRNA组成所有外显子茎/环结构的外显子序列。“截短外显子”或“外显子截短序列”,指人源tRNA外显子中至少能组成反密码子茎,但可以缺失其他tRNA茎/环的外显子序列。
如本文所用,5'端基于人源tRNA设计的核酶剪接元件和3'端基于人源tRNA设计的核酶剪接元件包含人源tRNA的外显子序列,是指该5'端元件包含了人源tRNA外显子两条序列中的一条的一部分或全部序列,3'端元件包含了人源tRNA外显子两条序列中的另一条的一部分或全部序列,和在一起涵盖了外显子的全部或部分序列。
如本文所用,“形成的tRNA剪接位点末端的反密码子茎或反密码子茎+其他茎+环或内含子茎的结构”中的茎和环是指所述序列根据碱基互补配对原则理论上可以形成人源tRNA中的茎和/或环,即D茎、反密码子茎、TΨC茎、氨基酸接受茎和内含子茎之一,以及D环、反密码子环和TΨC环之一。其中,茎至少应包含反密码子茎或内含子茎,在包含反密码子茎的同时,还以添加D茎、TΨC茎或氨基酸接受茎的一部分或全部,例如茎一般应至少含3个以上和10个以下配对碱基(如3、4、5、6、7、8、9或10个成对碱基),也可以添加环,优选是完整的D环、反密码子环或TΨC环。
在一些实施方案中,所述人源tRNA序列来自含有内含子的人源tRNATyr-GTA(SEQID NO:1~13)、tRNATyr-ATA(SEQ ID NO:14)、tRNAIle-TAT(SEQ ID NO:15~19)、tRNAArg-TCT(SEQ ID NO:20~23)、tRNALeu-CAA(SEQ ID NO:24~28)、tRNAPro-AGG(SEQ ID NO:29)或tRNAPhe-GAA(如SEQ ID NO:30)中的一或多种。
在一些实施方案中,基于人源tRNA设计的核酶剪接元件的核酶识别序列包含自剪切RNA核酶序列或与DNA核酶互补的序列。
在一些实施方案中,人源tRNA部分序列为人源tRNATyr-GTA的全长外显子,核酶识别序列为自剪切RNA核酶序列,5'端和3'端基于人源tRNA设计的核酶剪接元件自剪切后可部分互补并形成含反密码子茎、D茎、TΨC茎、氨基酸接受茎、D环、反密码子环和TΨC环。优选地,5'端基于人源tRNA设计的核酶剪接元件的序列如下所示(下划线斜体为tRNA序列):
和/或
3'端基于人源tRNA设计的核酶剪接元件的序列如下所示(下划线斜体为tRNA序列):
在一些实施方案中,人源tRNA部分序列为人源tRNATyr-GTA的全长外显子,核酶识别序列为DNA核酶互补序列。优选地,5'端核酶剪接元件包含SEQ ID NO:33所示的序列,3'端的DNA核酶序列包含SEQ ID NO:34所示的序列,5'端的DNA核酶互补序列对应的DNA核酶包含SEQ ID NO:35所示的序列,3'端DNA核酶互补序列对应的DNA核酶包含SEQ ID NO:36所示的序列。
本发明还提供一种自环化RNA,所述自环化RNA为上述任意所述前体RNA剪切后形成的RNA,自环化RNA的5'端剪切后形成羟基,3'端剪切后形成2',3'-环磷酸。
在一些实施方案中,自环化RNA从5'至3'方向按顺序包含以下结构域:
a':5'端形成羟基的人源tRNA的序列;
b:内部核糖体进入位点(IRES);
c:蛋白编码区(CDS);
d':3'端形成2',3'-环磷酸的人源tRNA的序列。
在一些实施方案中,上述结构域的b和/或c也可以由其他具有生物学功能的序列取代。
进一步地,该自环化RNA为一种线性RNA,如下所示,
在一些实施方案中,a'、b、c、d'四个结构域按顺序依次连接,即前体RNA的结构为5'羟基-5'端人源tRNA部分序列-内部核糖体进入位点(IRES)-蛋白编码区(CDS)-3'端人源tRNA部分序列-2',3'环磷酸。
在一些实施方案中,人源tRNA序列为人源tRNATyr-GTA的全长外显子,5'端形成羟基的人源tRNA序列如下所示;
5'-OH-AACCTTAGGTCGCTGGTTCAATTCCGGCTCGAAGG……-3'(SEQ ID NO:37)
3'端形成2',3'-环磷酸的人源tRNA序列如下所示:
5'-……CCTTCGATAGCTCAGCTGGTAGAGCGGAGGTCTGTAG-2',3'-环磷酸(SEQ ID NO:38)。
在一些实施方案中,人源tRNA序列为人源tRNATyr-GTA的截短外显子,5'端形成羟基的人源tRNA序列如下所示;
5'-OH-AACCTT……-3'(SEQ ID NO:39)
3'端形成2',3'-环磷酸的人源tRNA序列如下所示:
5'-……TAGCTCAGCTGGTAGAGCGGAGGTCTGTAG-2',3'-环磷酸(SEQ ID NO:40)。
本发明提供的acRNA,以人源tRNA内部的有效序列作为人源tRNA剪接元件的人源tRNA序列,不仅免疫原性低,可在细胞内直接自动成环,安全高效,而且可携带长序列的目的基因片段,可成功用于蛋白质稳定表达、基因编辑,RNA编辑等多种应用。
在进一步的实施方案中,5'端人源tRNA序列与3'端人源tRNA序列均为同一所述人源tRNA的部分序列,且5'端人源tRNA序列与3'端人源tRNA序列至少包含能够在核酶切割后部分互补,并形成含内含子的人源tRNA剪接位点处特有的末端局部双链RNA(反密码子茎或内含子茎)序列,除此之外,5'端基于人源tRNA设计的核酶剪接元件的3’端,和/或3'端基于人源tRNA设计的核酶剪接元件的5’端,也可以含有(或不含)额外的所述人源tRNA的其他茎或环结构。所形成的tRNA剪接位点末端的反密码子茎或反密码子茎+其他茎+环或内含子茎的结构均是RtcB连接酶的有效底物。
在进一步的一些实施方案中,5'端和3'端人源tRNA序列均为同一人源tRNA的部分序列,且5'端人源tRNA序列与3'端人源tRNA序列至少包含能够在核酶切割后部分互补,并形成含内含子的人源tRNA剪接位点处特有的末端局部双链RNA(反密码子茎或内含子茎)序列,除此之外,5'端基于人源tRNA设计的核酶剪接元件的3’端,和/或3'端基于人源tRNA设计的核酶剪接元件的5’端,也可以含有(或不含)额外的所述人源tRNA的其他茎或环结构。所形成的tRNA剪接位点末端的反密码子茎或反密码子茎+其他茎+环或内含子茎的结构均是RtcB连接酶的有效底物。具体的,可以包含能够形成一个或多个人源tRNA的茎环的序列。
本发明所说的5'端人源tRNA序列与3'端人源tRNA序列可部分互补,是指5'人源tRNA序列与3'人源tRNA序列可部分碱基互补配对形成完整或不完整的反密码子茎或内含子茎,在包含反密码子茎的同时,还可以添加D茎、TΨC茎或氨基酸接受茎的一部分或全部,例如茎一般应至少含3个以上以及10个以下配对碱基(如3、4、5、6、7、8、9或10个成对碱基),也可以添加环,优选是完整的D环、反密码子环或TΨC环。
本申请提供的人源tRNA,为包含内含子的tRNA。参见图1B、1C,本发明将tRNA拆分为外显子部分和内含子部分。在一些实施方案中,tRNA去除内含子后剩余的两条外显子分别作为5'端和3'端的tRNA序列,内部核糖体进入位点(IRES)及蛋白编码区(CDS)等目标序列连接在原tRNA远离反密码子环一侧开放的外显子的两端,原内含子被剪切后留下的开口可以被剪切后形成5'-羟基和2'、3'-环磷酸后通过连接酶连接起来形成反密码子环,进而形成环状RNA。在一些实施方案中,tRNA去除外显子后剩余一条内含子序列,内部核糖体进入位点(IRES)及蛋白编码区(CDS)等目标序列插入到内含子序列的内含子环一侧,被插入的内含子茎的两条链分别作为5'端和3'端的tRNA序列,被剪切后获得5'-羟基和2'、3'-环磷酸后通过连接酶连接起来,进而形成环状RNA。
本发明提供的基于核酶设计剪接元件包括5'端人源tRNA序列或3'端人源tRNA序列和核酶识别序列,其中,5'人源tRNA序列与3'人源tRNA序列至少包含能够在核酶切割后部分互补并形成含内含子的人源tRNA剪接位点处特有的末端局部双链RNA(反密码子茎或内含子茎)序列,除此之外,5'端基于人源tRNA设计的核酶剪接元件的3’端,和/或3'端基于人源tRNA设计的核酶剪接元件的5’端,也可以含有(或不含)额外的所述人源tRNA的其他茎或环结构。所形成的tRNA剪接位点末端的反密码子茎或反密码子茎+其他茎+环或内含子茎的结构均是RtcB连接酶的有效底物。
在一些进一步的实施方案中,人源tRNA为人源tRNATyr-GTA(SEQ ID NO:1~13)、tRNATyr-ATA(SEQ ID NO:14)、tRNAIle-TAT(SEQ ID NO:15~19)、tRNAArg-TCT(SEQ ID NO:20~23)、tRNALeu-CAA(SEQ ID NO:24~28)、tRNAPro-AGG(SEQ ID NO:29)或tRNAPhe-GAA(如SEQID NO:30)中的一或多种。
在一些进一步的实施方案中,人源tRNATyr-GTA的外显子或内含子序列部分(SEQID NO:1~13,大写部分为外显子,小写部分为内含子)被用于设计5'端和3'端的核酶剪接元件。
在一些进一步的实施方案中,人源tRNATyr-ATA的外显子或内含子序列部分(SEQID NO:14,大写部分为外显子,小写部分为内含子)被用于设计5'端和3’端的核酶剪接元件。
在一些进一步的实施方案中,人源tRNAIle-TAT的外显子或内含子序列部分(SEQID NO:15~19,大写部分为外显子,小写部分为内含子)被用于设计5'端和3'端的核酶剪接元件。
在一些进一步的实施方案中,人源tRNAArg-TCT的外显子或内含子序列部分(SEQID NO:20~23,大写部分为外显子,小写部分为内含子)被用于设计5'端和3’端的核酶剪接元件。
在一些进一步的实施方案中,人源tRNALeu-CAA的外显子或内含子序列部分(SEQID NO:24~28,大写部分为外显子,小写部分为内含子)被用于设计5'端和3’端的核酶剪接元件。
在一些进一步的实施方案中,人源tRNAPro-AGG的外显子或内含子序列部分(SEQID NO:29,大写部分为外显子,小写部分为内含子)被用于设计5'端和3’端的核酶剪接元件。
在一些进一步的实施方案中,人源tRNAPhe-GAA的外显子或内含子序列部分(SEQID NO:30,大写部分为外显子,小写部分为内含子)被用于设计5'端和3’端的核酶剪接元件。
在一些进一步的实施方案中,人源tRNA为人源tRNATyr-GTA,5'端核酶剪接元件的人源tRNA全长外显子序列如下所示:
5'-AACCTTAGGTCGCTGGTTCAATTCCGGCTCGAAGG-3'(SEQ ID NO:41),和/或
3'端核酶剪接元件的人源tRNA全长外显子序列如下所示:
5'-CCTTCGATAGCTCAGCTGGTAGAGCGGAGGTCTGTAG-3'(SEQ ID NO:42)。
在一些实施方案中,5'端核酶剪接元件的人源tRNA序列为SEQ ID NO:41序列的全部或其中的一部分。在一些实施方案中,3'端核酶剪接元件的人源tRNA序列为SEQ ID NO:42序列的全部或其中的一部分。在一些实施方案中,5'端核酶剪接元件的人源tRNA序列为SEQ ID NO:41序列的全部或其中的一部分,3'端核酶剪接元件的人源tRNA序列为SEQ IDNO:42序列的全部或其中的一部分,5'端人源tRNA序列与3'端人源tRNA序列至少包含能够在核酶切割后部分互补,并形成含内含子的人源tRNA剪接位点处特有的末端局部双链RNA(反密码子茎)序列,除此之外,5'端基于人源tRNA设计的核酶剪接元件的3’端,和/或3'端基于人源tRNA设计的核酶剪接元件的5’端,也可以含有(或不含)额外的所述人源tRNA的其他茎或环结构。所形成的tRNA剪接位点末端的反密码子茎或反密码子茎+其他茎+环的结构均是RtcB连接酶的有效底物。
在一些进一步的实施方案中,人源tRNA为人源tRNATyr-GTA,5'端核酶剪接元件的人源tRNA截短外显子序列如下所示:
5'-AACCTT-3'(SEQ ID NO:43),和/或
3'端核酶剪接元件的人源tRNA截短外显子序列如下所示:
5'-TAGCTCAGCTGGTAGAGCGGAGGTCTGTAG-3'(SEQ ID NO:44)。
在一些进一步的实施方案中,人源tRNA为人源tRNATyr-GTA,5'端人源核酶剪接元件的tRNA内含子序列如下所示:
5'-AATGCGGA-3'(SEQ ID NO:45),和/或
3'端核酶剪接元件的人源tRNA内含子序列如下所示:
5'-AACGTTTTTGGAC-3'(SEQ ID NO:46)。
在一些进一步的实施方案中,人源tRNA为人源tRNATyr-ATA,5'端核酶剪接元件的人源tRNA全长外显子序列如下所示:
5'-GTCCTTAGGTTGCTGGTTCGATTCCAGCTTGAAGG-3'(SEQ ID NO:47),和/或
3'端核酶剪接元件的人源tRNA全长外显子序列如下所示:
5'-CCTTCAATAGTTCAGCTGGTAGAGCAGAGGACTATAG-3'(SEQ ID NO:48)。
在一些实施方案中,5'端核酶剪接元件的人源tRNA序列为SEQ ID NO:47序列的全部或其中的一部分。在一些实施方案中,3'端核酶剪接元件的人源tRNA序列为SEQ ID NO:48序列的全部或其中的一部分。在一些实施方案中,5'端核酶剪接元件的人源tRNA序列为SEQ ID NO:47序列的全部或其中的一部分,3'核酶剪接元件的人源tRNA序列为SEQ ID NO:48序列的全部或其中的一部分,5'人源tRNA序列与3'人源tRNA序列至少包含能够在核酶切割后部分互补并形成含内含子的人源tRNA剪接位点处特有的末端局部双链RNA(反密码子茎)序列,除此之外,5'端基于人源tRNA设计的核酶剪接元件的3’端,和/或3'端基于人源tRNA设计的核酶剪接元件的5’端,也可以含有(或不含)额外的所述人源tRNA的其他茎或环结构。所形成的tRNA剪接位点末端的反密码子茎或反密码子茎+其他茎+环的结构均是RtcB连接酶的有效底物。。
在一些进一步的实施方案中,人源tRNA为人源tRNAIle-TAT,5'端核酶剪接元件的人源全长tRNA全长外显子序列如下所示:
5'-AAGCCGAGGTTGTGAGTTCAAGCCTCACCTGGAGCA-3'(SEQ ID NO:49),和/或
3'端核酶剪接元件的人源tRNA全长外显子序列如下所示:
5'-GCTCCAGTGGCGCAATCGGTTAGCGCGCGGTTCTTATA-3'(SEQ ID NO:50)。
在一些实施方案中,5'端核酶剪接元件的人源tRNA序列为SEQ ID NO:49序列的全部或其中的一部分。在一些实施方案中,3'端核酶剪接元件的人源tRNA序列为SEQ ID NO:50序列的全部或其中的一部分。在一些实施方案中,5'端核酶剪接元件的人源tRNA序列为SEQ ID NO:49序列的全部或其中的一部分,3'端核酶剪接元件的人源tRNA序列为SEQ IDNO:50序列的全部或其中的一部分,5'端人源tRNA序列与3'端人源tRNA序列至少包含能够在核酶切割后部分互补,并形成含内含子的人源tRNA剪接位点处特有的末端局部双链RNA(反密码子茎)序列,除此之外,5'端基于人源tRNA设计的核酶剪接元件的3’端,和/或3'端基于人源tRNA设计的核酶剪接元件的5’端,也可以含有(或不含)额外的所述人源tRNA的其他茎或环结构。所形成的tRNA剪接位点末端的反密码子茎或反密码子茎+其他茎+环的结构均是RtcB连接酶的有效底物。
在一些进一步的实施方案中,人源tRNA为人源tRNApro-AGG,5'端核酶剪接元件的人源tRNA全长外显子序列如下所示:
5'-AAGGAGACCCAAGAGGTCCCGGGTTCAAATCCCGGACGAGCC-3'(SEQ ID NO:51),和/或
3'端核酶剪接元件的人源tRNA全长外显子序列如下所示:
5'-GGCTCGTTGGTCTAGGGGTGTGGTTCTCGTTTAGGG-3'(SEQ ID NO:52)。
在一些实施方案中,5'端核酶剪接元件的人源tRNA序列为SEQ ID NO:51序列的全部或其中的一部分。在一些实施方案中,3'端核酶剪接元件的人源tRNA剪序列为SEQ IDNO:52序列的全部或其中的一部分。在一些实施方案中,5'端核酶剪接元件的人源tRNA序列为SEQ ID NO:51序列的全部或其中的一部分,3'端核酶剪接元件的人源tRNA序列为SEQ IDNO:52序列的全部或其中的一部分,5'端人源tRNA序列与3'端人源tRNA序列至少包含能够在核酶切割后部分互补并形成含内含子的人源tRNA剪接位点处特有的末端局部双链RNA(反密码子茎)序列,除此之外,5'端基于人源tRNA设计的核酶剪接元件的3’端,和/或3'端基于人源tRNA设计的核酶剪接元件的5’端,也可以含有(或不含)额外的所述人源tRNA的其他茎或环结构。所形成的tRNA剪接位点末端的反密码子茎或反密码子茎+其他茎+环的结构均是RtcB连接酶的有效底物。
在一些进一步的实施方案中,人源tRNA为人源tRNAPhe-GAA,5'端核酶剪接元件的人源tRNA全长外显子序列如下所示:
5'-AACTGCAGGTCTCTGGTTCAATTCCGGGTTTCGAC-3'(SEQ ID NO:53),和/或
3'端核酶剪接元件的人源tRNA全长外显子的序列如下所示:
5'-GCCGAAATAGCTCAATTGGGAGAGTGTTAGTCTGAAG-3'(SEQ ID NO:54)。
在一些实施方案中,5'端核酶剪接元件的人源tRNA序列为SEQ ID NO:53序列的全部或其中的一部分。在一些实施方案中,3'端核酶剪接元件的人源tRNA序列为SEQ ID NO:54序列的全部或其中的一部分。在一些实施方案中,5'端核酶剪接元件的人源tRNA序列为SEQ ID NO:53序列的全部或其中的一部分,3'端核酶剪接元件的人源tRNA序列为SEQ IDNO:54序列的全部或其中的一部分,5'端核酶剪接元件的人源tRNA序列与3'核酶剪接元件的人源tRNA序列至少包含能够在核酶切割后部分互补并形成含内含子的人源tRNA剪接位点处特有的末端局部双链RNA(反密码子茎)序列,除此之外,5'端基于人源tRNA设计的核酶剪接元件的3’端,和/或3'端基于人源tRNA设计的核酶剪接元件的5’端,也可以含有(或不含)额外的所述人源tRNA的其他茎或环结构。所形成的tRNA剪接位点末端的反密码子茎或反密码子茎+其他茎+环的结构均是RtcB连接酶的有效底物。
在一些进一步的实施方案中,人源tRNA为人源tRNALeu-CAA,5'端核酶剪接元件的人源tRNA全长外显子序列如下所示:
5'-AACTGGTCTCCGTATGGAGGCGTGGGTTCGAATCCCACTTCTGACA-3'(SEQ ID NO:55),和/或
3'端核酶剪接元件的人源tRNA全长外显子序列如下所示:
5'-GTCAGGATGGCCGAGTGGTCTAAGGCGCCAGTCTCAAG-3'(SEQ ID NO:56)。
在一些实施方案中,5'端核酶剪接元件的人源tRNA序列为SEQ ID NO:55序列的全部或其中的一部分。在一些实施方案中,3'端核酶剪接元件的人源tRNA序列为SEQ ID NO:56序列的全部或其中的一部分。在一些实施方案中,5'端核酶剪接元件的人源tRNA序列为SEQ ID NO:55序列的全部或其中的一部分,3'端核酶剪接元件的人源tRNA序列为SEQ IDNO:56序列的全部或其中的一部分,5'人源tRNA序列与3'人源tRNA序列至少包含能够在核酶切割后部分互补并形成含内含子的人源tRNA剪接位点处特有的末端局部双链RNA(反密码子茎)序列,除此之外,5'端基于人源tRNA设计的核酶剪接元件的3’端,和/或3'端基于人源tRNA设计的核酶剪接元件的5’端,也可以含有(或不含)额外的所述人源tRNA的其他茎或环结构。所形成的tRNA剪接位点末端的反密码子茎或反密码子茎+其他茎+环的结构均是RtcB连接酶的有效底物。
在一些进一步的实施方案中,人源tRNA为人源tRNAArg-TCT,5'端核酶剪接元件的人源tRNA全长外显子序列如下所示:
5'-AATCAAAGGTTGTGGGTTCGAGTCCCACCAGAGTCG-3'(SEQ ID NO:57),和/或
3'端核酶剪接元件的人源tRNA全长外显子序列如下所示:
5'-GGCTCTGTGGCGCAATGGATAGCGCATTGGTCTTCTA-3'(SEQ ID NO:58)。
在一些实施方案中,5'端核酶剪接元件的人源tRNA序列为SEQ ID NO:57序列的全部或其中的一部分。在一些实施方案中,3'端核酶剪接元件的人源tRNA序列为SEQ ID NO:58序列的全部或其中的一部分。在一些实施方案中,5'端核酶剪接元件的人源tRNA序列为SEQ ID NO:57序列的全部或其中的一部分,3'端核酶剪接元件的人源tRNA序列为SEQ IDNO:58序列的全部或其中的一部分,5'人源tRNA序列与3'人源tRNA序列至少包含能够在核酶切割后部分互补并形成含内含子的人源tRNA剪接位点处特有的末端局部双链RNA(反密码子茎)序列,除此之外,5'端基于人源tRNA设计的核酶剪接元件的3’端,和/或3'端基于人源tRNA设计的核酶剪接元件的5’端,也可以含有(或不含)额外的所述人源tRNA的其他茎或环结构。所形成的tRNA剪接位点末端的反密码子茎或反密码子茎+其他茎+环的结构均是RtcB连接酶的有效底物。
本发明还提供一种用于产生前体RNA的核酸载体,所述载体包含上述任一所述的环状RNA前体的编码序列。
本发明还提供一种用于产生环状RNA的前体RNA的核酸载体,所述载体的序列按顺序包括以下元素的编码序列:
T7启动子-5'端基于人源tRNA设计的核酶剪接元件-内部核糖体进入位点(IRES)-蛋白编码区(CDS)-3'端基于人源tRNA设计的核酶剪接元件-线性化酶切位点序列。
在一些进一步的实施方案中,5'端基于人源tRNA设计的核酶剪接元件与3'端基于人源tRNA设计的核酶剪接元件均包括人源tRNA序列及核酶识别序列,5'端人源tRNA序列与3'人源tRNA序列均为同一人源tRNA的部分序列,且5'端人源tRNA序列与3'人源tRNA序列可部分互补并能够形成至少一个所述人源tRNA的茎环。
在一些进一步的实施方案中,人源tRNA为人源tRNATyr-GTA(SEQ ID NO:1~13)、tRNATyr-ATA(SEQ ID NO:14)、tRNAIle-TAT(SEQ ID NO:15~19)、tRNAArg-TCT(SEQ ID NO:20~23)、tRNALeu-CAA(SEQ ID NO:24~28)、tRNAPro-AGG(SEQ ID NO:29)或tRNAPhe-GAA(如SEQID NO:30)中的一或多种。
在一些进一步的实施方案中,核酶识别序列为编码自剪切核酶的序列。本文所述自剪切核酶为能自剪切并生成5'端羟基和3'端2',3'-环磷酸结构的核酶。在一些实施方案中,自剪切核酶可以包括RNA酶P、rRNA、引导酶(Leadzyme)、I组内含子核酶、II组内含子核酶、GIR1分支核酶、glmS核酶、发夹核酶(hairpin ribozyme)、锤头状核酶(Hammerheadribozyme)、HDV核酶、绕线核酶(Twister ribozyme)、绕线姐妹核酶(Twister sisterribozyme)、VS核酶、手枪核酶(Pistol ribozyme)、手斧核酶(Hatchet ribozyme)、类病毒中的一种或两种。
在一些实施方案中,核酶识别序列为与DNA核酶互补并可被DNA核酶靶向识别和定点切割的序列。本文所述DNA核酶为能识别特异RNA序列并切割RNA生成5'端羟基和3'端2',3'-环磷酸结构的DNA核酶。在一些实施方案中,DNA核酶为10-23DNA核酶、8-17DNA核酶、17EDNA核酶、AC07 DNA核酶、AC14 DNA核酶、AC17 DNA核酶中的一种或两种。
在一些进一步的实施方案中,DNA核酶为10-23DNA核酶。
另一方面,本发明还提供一种环状RNA,其中,环状RNA为上述任意一项所述自环化RNA在RNA连接酶的存在下自环化形成的环状RNA。
在一些进一步的实施方案中,环状RNA包含以下结构域:
a”:5'端人源tRNA序列;
b:内部核糖体进入位点(IRES);
c:蛋白编码区(CDS);和
d”:3'端人源tRNA序列;
其中,5'端人源tRNA序列与3'端人源tRNA序列共价连接。
在一些进一步的实施方案中,5'端人源tRNA序列与3'端人源tRNA序列均为同一人源tRNA的部分序列,且5'端人源tRNA序列与3'端人源tRNA序列包含或为可部分互补并能够形成至少一个人源tRNA的反密码子茎或内含子茎的核苷酸序列。
在一些进一步的实施方案中,人源tRNA的序列选自含有内含子的tRNATyr-GTA(SEQID NO:1~13)、tRNATyr-ATA(SEQ ID NO:14)、tRNAIle-TAT(SEQ ID NO:15~19)、tRNAArg-TCT(SEQ ID NO:20~23)、tRNALeu-CAA(SEQ ID NO:24~28)、tRNAPro-AGG(SEQ ID NO:29)或tRNAPhe-GAA(如SEQ ID NO:30)中的一或多种。
另一方面,本发明还提供一种环状RNA的制备方法,该方法包含:
(1)提供上述任一的核酸载体,经线性化后体外转录得到线性的前体RNA;
(2)体外转录过程中通过核酶自剪切或DNA核酶剪切作用,得到含有5'端羟基和3'端2',3'-环磷酸结构的所述自环化RNA;
(3)自环化RNA在RNA连接酶的作用下发生共价结合作用,形成环状RNA。
在一些实施方案中,核酶识别序列设置为自剪切核酶的序列,如Twisterribozyme,其在核酸载体转转录过程中发生自剪切,直接形成含有5'端羟基和3'端2',3'-环磷酸的前体RNA。在一些实施方案中,核酶识别序列设置为与DNA核酶互补的序列,体外转录成初始RNA后采用DNA核酶进行靶向切割,切割位点置于5'端人源tRNA剪接元件首端与3'端人源tRNA剪接元件的末端,得到含有5'端羟基和3'端2',3'-环磷酸的自环化RNA。
在一些实施方案中,提供一种连接酶,可以将5'端羟基和3'端2',3'-环磷酸结合起来,具体的,连接酶可以是RtcB。在一些实施方案中,将acRNA转染至细胞内,转染方法可以选择,例如脂质体转染、钙转、PEI转染或电转,本实施例中优选PEI转染,细胞内部存在天然的RNA连接酶,acRNA在细胞内部自动生成环状RNA。
另一方面,本发明还提供一种重组生产目标蛋白的方法,包括:
制备本发明所述的自环化RNA或环状RNA,其中自环化RNA或环状RNA中的蛋白编码区为编码所述目标蛋白的核酸序列;
将所述自环化RNA或环状RNA引入宿主细胞,例如通过转染,特别是通过使用PEI的转染方法,
在宿主细胞中表达所述感兴趣的蛋白;以及
任选地,分离和/或纯化所表达的感兴趣的蛋白。
在一些实施方案中,所述宿主细胞可以是人和非人哺乳动物(例如小鼠、大鼠、兔、羊、牛、马)的原代细胞或细胞系,例如包括但不限于CHO、Hela、293细胞。
在一些实施方案中,所述环状RNA如下制备:提供本发明所述的核酸载体,经线性化后,体外转录得到线性的前体RNA;体外转录过程中通过RNA核酶自剪切或体外转录后通过DNA核酶剪切作用,得到含有5'-羟基和2',3'-环磷酸的自环化RNA;以及所述自环化RNA在体外在RNA连接酶的作用下,两端发生共价结合作用,形成所述环状RNA,或者将所述自环化RNA引入(例如通过转染,特别是通过使用PEI的转染方法)宿主细胞,在宿主细胞内存在的天然的RNA连接酶作用下,在细胞内自动环化生成环状RNA。
另一方面,本发明还提供制备RNA疫苗的方法,包括:制备本发明所述的环状RNA,其中环状RNA中的蛋白编码区为编码目标免疫原的核酸序列。
在一些实施方案中,所述环状RNA如下制备:提供本发明所述的核酸载体,经线性化后,体外转录得到线性的前体RNA;体外转录过程中通过RNA核酶自剪切或体外转录后通过DNA核酶剪切作用,得到含有5'-羟基和2',3'-环磷酸的自环化RNA;以及所述自环化RNA在RNA连接酶的作用下,两端发生共价结合作用,形成所述环状RNA。
另一方面,本发明还提供本发明所述的环状RNA用于制备RNA疫苗的用途,其中环状RNA中的蛋白编码区为编码感兴趣的免疫原的核酸序列。
另一方面,本发明还提供一种在对象中治疗疾病或免疫接种的方法,包括:制备本发明所述的自环化RNA或环状RNA,其中自环化RNA或环状RNA中的蛋白编码区为编码目标治疗蛋白或免疫原的核酸序列,将所述自环化RNA或环状RNA给有需要的对象施用,从而在所述对象中表达所述治疗蛋白或免疫原。
在一些实施方案中,所述对象是人和非人哺乳动物,例如小鼠、大鼠、兔、羊、牛、马,优选人。
本发明通过人源tRNA的有效序列作为剪接元件的一部分,可进行细胞内的自环化,并构建了通用型自环化RNA(Automatic Circulating RNA,acRNA)的框架模板,可方便的用于制备不同大小的自环化RNA。本发明通过利用细胞内天然的tRNA剪接机制,不仅可以通过内源性RNA连接酶在细胞内进行RNA高效的自环化,无需进行体外环化和富集,极大的降低了现有PIE方法的高成本和纯化难度,还降低了潜在的安全性风险,还可携带长序列的目的基因片段,能够成功用于蛋白质稳定表达、基因编辑,RNA编辑等多种应用。
附图说明
为了更好地理解本发明并更清楚地展示出如何实现本发明,现通过示例的方式并参考附图阐述了根据本发明的实施方案的特征,其中:
图1A:成熟的tRNA四茎三环示意图;图1B:含内含子的tRNATyr-GTA示意图,其中右侧箭头以上部分为tRNATyr-GTA的外显子,左侧箭头以下部分为tRNATyr-GTA的内含子;图1C:tRNA剪接元件示意图。
图2:质粒DNA模板的核心元件模式图,主要包括T7启动子-5'端基于人源tRNA设计的核酶剪接元件-IRES-编码区(CDS)-3'端基于人源tRNA设计的核酶剪接元件-线性化酶切位点序列。
图3A:体外转录模式图。体外转录过程中发生核酶自剪切反应,获得两个小的核酶片段以及含编码片段的acRNA;图3B:毛细管电泳结果。
图4A:细胞中环状RNA形成示意图,acRNA在内源性RNA连接酶的作用下,5'端和3'端发生反应形成闭合的环;图4B:acRNA及阴性对照转染293T细胞48小时后的荧光表达检测,左为荧光视野图,右为对应的明场图,阴性对照为没有人源tRNA剪接元件的线性RNA;图4C:acRNA转染293T细胞24和48小时后的荧光素酶检测。
图5A:成环检测策略图。分别在acRNA的3'端和5'端设计上游引物和下游引物,由于acRNA的两端是开放的,无法扩增出特异性条带,而自环化形成环状RNA后可以扩增出特异性条带;图5B:cDNA进行PCR扩增的凝胶电泳图;图5C:PCR扩增产物的测序峰图。
图6:(A)acRNA转染CHO细胞48小时后的荧光表达检测,上为荧光视野图,下为对应的明场图;(B):acRNA转染Hela细胞48小时后的荧光表达检测,上为荧光视野图,下为对应的明场图。
图7;基于人源tRNATyr-GTA的全长外显子、截短外显子设计的环状RNA、对应的线性RNA(mRNA),转染体外成环RNA(PIE)以及未处理细胞(CK)对不同细胞因子的免疫原性检测实验。
图8A和图8B:核酶识别序列为DNA核酶靶向切割区域的acRNA转染293T细胞24小时(图8A)和48小时(图8B)后的荧光表达检测,左为荧光视野图,右为对应的明场图,阴性对照为没有人源tRNA剪接元件的线性RNA。
图9:含不同人源tRNA剪接元件的acRNA转染293T细胞48小时后的荧光素酶检测结果,acRNA阴性对照为没有人源tRNA剪接元件的线性RNA。
具体实施方式
定义
为了对本发明的说明书中所使用的术语提供清楚且一致的理解,在下文中提供一些定义。此外,除了特殊说明,本发明所用的全部技术和科学术语具有同本发明所属领域中普通技术人员通常所理解的相同的含义。
当在权利要求和/或说明书中与术语“包括”结合使用时,词语“一”的使用可以表示“一个”,但它也与“一个或多个”,“至少一个”和“一个或多于一个”的含义已知。类似地,词语“另一个”可以表示至少第二个或者很多个。
如在本说明书和权利要求中所使用的词语“包括”(以及包括的任何形式,诸如“包括”和“包含”),“具有”(以及任何形式的具有,“具有”、“包含”和“含有”)是包括性的和开放式的,并且不排除另外的未列出的要素或处理步骤。
“多核苷酸”、“核酸序列”、“核苷酸序列”或“核酸片段”可互换使用,指单链或双链的RNA或DNA聚合物,任选包含合成的、非天然的或改变的核苷酸碱基。核苷酸(通常以其5'-单磷酸形式存在)通过其单字母命名如下:“A”代表腺苷酸或脱氧腺苷酸(分别代表RNA或DNA),“C”代表胞苷酸或脱氧胞苷酸,“G”代表鸟苷酸或脱氧鸟苷酸,“U”代表尿苷酸,“T”代表脱氧胸苷酸,“R”代表嘌呤(A或G),“Y”代表嘧啶(C或T),“K”代表G或T,“H”代表A或C或T,“I”代表肌苷,“N”代表任何核苷酸。尽管本文的核苷酸序列可以表示为DNA序列(包含T(s)),但是当提到RNA时,本领域技术人员可以容易地确定相应的RNA序列(即,用U代替T)。在本文中,除非特别指明,提及核酸序列时,从左至右为5’至3’方向,以及提及氨基酸序列时,从左至右为氨基端(N)至羧基端(C)方向。
“前体RNA”或“环状RNA前体”在本文中是指未经过切割的首尾两端具有包含tRNA序列的线性RNA分子。环状RNA的前体RNA包含核酶识别序列,可以通过从包含环状RNA前体的编码序列的核酸载体转录而来,或者环状RNA前体也可以通过化学合成获得。由于“前体RNA”的自剪切核酶可以在转录过程中有效切割形成5'端羟基和3'端2,3-环磷酸,进而在连接酶的作用下自体成环,因此一些情况下本发明中涉及的自环化RNA(AutomaticCyclization RNA,acRNA)指代转录过程中直接切割成5'端羟基和3'端2,3-环磷酸的前体RNA,而自环化以后生成的RNA为环状RNA(Circular RNA,circRNA)。
“环状RNA前体”或“前体RNA”可以是(例如化学)未修饰的、部分修饰的或完全修饰的。在一些实施方案中,环状RNA前体包含至少一个核苷酸修饰。在一些实施方案中,高达100%的环状RNA前体的核苷酸被修饰。在一些实施方案中,至少一种核苷酸修饰是胞苷修饰、尿苷修饰或腺苷修饰。在一些实施方案中,至少一种核苷修饰选自由5-甲基胞嘧啶(m5C)、N6-甲基腺苷(m6A)、假尿苷(ψ)、N1-甲基假尿苷(m1ψ)和5-甲氧基尿苷(5moU)组成的组。在一些实例中,环状RNA前体包含少于100%、少于90%、少于80%、少于70%、少于60%、少于50%、少于40%、少于30%、少于20%、少于15%、少于10%、少于5%、少于1%的特定核苷酸修饰。如本文所用,特定核苷酸修饰的百分比是指序列中已经历该特定修饰的核苷酸与可经历该特定修饰的核苷酸的比率。
“降低的免疫原性”可指环状RNA在与细胞接触后引起降低的免疫反应,即低于对照环状RNA或对照线性RNA的水平的免疫反应。例如,免疫反应降低是指细胞因子表达降低。细胞因子包括但不限于CCL2、TNF、EIF2AK2和/或RIG-I。在一些实施方案中,环状RNA的免疫原性降低至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或更多。降低的免疫原性可以通过本领域公知的方法来确定。
如本文所用,术语“结构域”是指较大构建体的特定区域,使得所述结构域包含在较大构建体中或者是较大构建体的一部分。关于核酸,结构域可以指代在含有多个编码序列的较大构建体中发现的编码序列。
当应用于多核苷酸时,术语“编码”可以指代这样的多核苷酸,如果其处于天然状态或当通过本领域技术人员熟知的方法操作时,它可以被转录和/或翻译以产生多肽和/或其片段的mRNA,则其被称为“编码”所述多肽。反义链是此种核酸的互补序列,并且从反义链中可以推断出编码序列。
如本文所用,“表达”可以指代多核苷酸被转录成mRNA的过程和/或经转录的mRNA随后被翻译成肽、多肽或蛋白质的过程。如果多核苷酸来源于基因组DNA,则在真核细胞中表达可以包括mRNA的剪接。
“同源性”或“同一性”或“相似性”可以指代两个肽之间或两个核酸分子之间的序列相似性。可以通过比较每个序列中的位置来确定同源性,所述序列可以出于比较目的进行比对。例如,当所比较序列中的位置由相同的碱基或氨基酸占据时,则分子在该位置处是同源的。序列之间的同源性程度是序列具有的匹配或同源位置的数量的函数。“无关的”或“非同源的”序列与本公开文本的一个序列具有小于40%同一性或可替代地小于25%同一性。
同源性可以指代序列与参考序列的百分比(%)同一性。实际上,任何特定序列可以与本文所述的任何序列至少50%、60%、70%、80%、85%、90%、92%、95%、96%、97%、98%或99%相同,此种特定肽、多肽或核酸序列可以常规地使用已知的计算机程序如Bestfit程序(威斯康星序列分析包(Wisconsin Sequence Analysis Package),Unix第8版,Genetics Computer Group,University Research Park,575Science Drive,威斯康星州麦迪逊53711)来确定。当使用Bestfit或任何其他序列比对程序来确定特定序列是否与参考序列例如95%相同时,可以这样设置参数使得在参考序列的全长上计算同一性百分比并且允许同源性空位最多占总参考序列的5%。
如本文所用,“5'端基于人源tRNA设计的核酶剪接元件”意指在所述环状RNA前体或前体RNA的5’侧的核苷酸序列,其序列根据人源tRNA的序列而设计为包含核酶识别序列的序列节段。
如本文所用,“3'端基于人源tRNA设计的核酶剪接元件”意指在所述环状RNA前体或前体RNA的3’侧的核苷酸序列,其序列根据人源tRNA的序列而设计为包含核酶识别序列的序列节段。
如本文所用,“根据人源tRNA的序列而设计为包含核酶识别序列”是指在人源tRNA序列中的天然存在的一段序列、或在其一或多个核苷酸位置进行修饰(例如插入、缺失、取代或其组合等)和/或在所述人源tRNA末端添加合适的序列而产生的一段序列,从而能够被所需核酶识别并切割所述前体RNA而形成所述5'端羟基或3'端2,3-环磷酸。
如本文所用,核酶识别序列意指能够引起酶切作用的序列,包括例如自剪切核酶序列和可被DNA核酶靶向识别和定点切割的DNA核酶互补序列。
如本文所用,“人源tRNA的序列”意指核苷酸序列与人源tRNA序列相同的序列,其可以来自人源tRNA本身或者以其他手段获得例如人工合成或转录自重组载体。
如本文所用,“具有生物学活性的RNA序列”意指可以实现所需生物学作用的RNA序列,例如包括但不限于用于调控或其他目的的功能性RNA、用于表达蛋白的编码序列等。在一些实施方案中,所述具有生物学活性的RNA序列包括但不限于基因编辑中使用的引导RNAs(如gRNA、sgRNA、crRNA、omegaRNA和pegRNA等),RNA编辑中使用的自招募RNA(arRNA),反义RNA,干扰RNA,微小RNA(microRNA),长链非编码RNA(lncRNA)和自放大RNA(saRNA)等RNA序列中的一种或多种。
如本文所用,“包含形成人源tRNA的某一茎/环的核苷酸序列”意指所述5'/3'基于人源tRNA设计的核酶剪接元件中包含的该核苷酸序列与人源RNA中互补并形成该茎/环的核苷酸序列在序列上是相同的。
如本文所用,“间隔物”是指至少不会负面干扰与其连接的元件的功能的任何连续核苷酸序列。通常,如果希望避免两个靠近或相邻元件的相互作用,可以在两个元件之间插入间隔物。本文所述的间隔序列可发挥两种功能:(1)促进环化和(2)通过允许人源tRNA剪接元件和蛋白编码区核苷酸序列的正确折叠来促进功能。在一些实例中,间隔物的长度不超过150个、不超过100个、不超过50个、不超过30个、不超过10个、不超过5个或不超过3个核苷酸。在一些实例中,间隔物的长度为5个核苷酸。在一些实例中,间隔物的长度为4个核苷酸。在一些实例中,间隔物的长度为3个核苷酸。在一些实例中,只有一个间隔物。在一些实例中,存在两个间隔物。在一些实例中,可以不存在间隔物。
蛋白编码区(CDS)的蛋白质编码序列可以编码真核、原核或病毒来源的蛋白质。在某些实施方案中,蛋白质可以是用于治疗或诊断用途的任何蛋白质。例如,蛋白质编码区可以编码人类蛋白质、抗原、抗体、基因编辑酶如CRISPR核酸酶等。例如,所编码的蛋白质可以是嵌合抗原受体、免疫调节蛋白和/或转录因子等。一些具体实例包括但不限于EGF、FGF1、RBD、G6PC、PAH、HGF等。在一些实施方案中,利用蛋白编码区编码治疗疾病所需蛋白。
IRES序列可以选自但不限于以下IRES序列:桃拉综合征病毒、吸血虫病毒、泰勒脑脊髓炎病毒、猿猴病毒40、红火蚁病毒1、谷缩病毒、网状病毒、内皮增生病毒、Forman脊髓灰质炎病毒1型、大豆尺蠖病毒、克什米尔蜜蜂病毒、人类鼻病毒2型、玻璃叶蝉病毒1型、人类免疫缺陷病毒1型、玻璃叶蝉病毒1型、虱子P病毒、丙型肝炎病毒、甲型肝炎病毒、GB型肝炎病毒、口蹄疫病毒、人肠道病毒71、马鼻病毒、茶尺蠖样病毒、脑心肌炎病毒(EMCV)、果蝇C病毒、十字花科烟草病毒、蟋蟀麻痹病毒、牛病毒性腹泻病毒1、黑皇后细胞病毒、蚜虫致死性麻痹病毒、禽脑脊髓炎病毒、急性蜜蜂麻痹病毒、芙蓉黄环斑病毒、猪瘟病毒、人FGF2、人SFTPA1、人AML1/RUNX1、果蝇天线、人AQP4、人AT1R、人BAG-1、人BCL2、人类BiP、人类c-IAP1、人类c-myc、人类eIF4G、小鼠NDST4L、人类LEF1、小鼠HIF1α、人类Myc、小鼠Gtx、人p27kipl、人PDGF2/c-sis、人p53、人Pim-1、小鼠Rbm3、果蝇收割者、犬Scamper、果蝇Ubx、人UNR、小鼠UtrA、人VEGF-A、人XIAP、果蝇无毛、酿酒酵母TFIID、酿酒酵母YAP1、人c-src、人FGF-1、猿猴小核糖核酸病毒、芜菁皱纹病病毒、eIF4G适体、柯萨奇病毒B3(CVB3)或柯萨奇病毒A(CVA1/2)。野生型IRES序列也可以被修饰并用于本发明。优选地,IRES是CVB3、BRAV-1_L、PV1_L、CAV2_L、BRAV-1、PV1或CAV2。
如本文所用,术语“载体”可以指代设计用于在不同宿主之间转移的核酸构建体,包括但不限于质粒、病毒、粘粒、噬菌体、BAC、YAC等。在一些实施方案中,“病毒载体”被定义为重组产生的病毒或病毒颗粒,其包含待体内、离体或体外递送到宿主细胞中的多核苷酸。在一些实施方案中,质粒载体可以由可商购获得的载体制备。在其他实施方案中,根据本领域已知的技术,病毒载体可以由杆状病毒、逆转录病毒、腺病毒、AAV等产生。在一个实施方案中,病毒载体是慢病毒载体。病毒载体的例子包括逆转录病毒载体、腺病毒载体、腺相关病毒载体、甲病毒载体等。在基因转移由逆转录病毒载体介导的方面,载体构建体可以指代包含逆转录病毒基因组或其部分和目的基因的多核苷酸。
某些载体能够在它们所引入的宿主细胞中自主复制(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如,非附加型哺乳动物载体)在被引入宿主细胞中后整合到宿主细胞的基因组中,从而与宿主基因组一起复制。此外,某些载体能够指导与其可操作地连接的基因的表达。此类载体在本文中被称为“表达载体”。一般来说,用于重组DNA技术中的表达载体通常呈质粒形式。在本说明书中,“质粒”和“载体”可以互换地使用。然而,本公开文本旨在包括发挥同等功能的此类其他形式的表达载体,如病毒载体(例如,复制缺陷型逆转录病毒、腺病毒和腺相关病毒)。通常,载体或质粒含有指导一个或多个相关基因的转录和翻译的序列、选择性标记和允许自主复制或染色体整合的序列。合适的载体包含基因5'的具有转录起始控制的区域和DNA片段3'的控制转录终止的区域。两个控制区都可以来源于对于经转化的宿主细胞而言同源的基因,但应理解,此类控制区也可以来源于对于选择作为生产宿主的物种而言非天然的基因。
单链RNA在哺乳动物细胞中具有较短的半衰期,这可能是由于它们对可以从5'或3'末端降解单链RNA的核酸外切酶的敏感性。如本文所述,形成环状RNA可以是增强RNA稳定性的一种类型的修饰。环化可以防止RNA的暴露末端被降解,并且可以显著增加RNA的半衰期,如在体内或体外。在一些情况下,环状RNA可以防止一个或多个暴露末端被水解降解。在一些情况下,与非环状的RNA相比,环状RNA可以显著增加RNA的半衰期。在一些情况下,与非环状的RNA相比,形成环状RNA可以显著增加RNA在体内递送(如递送至受试者)时的半衰期。在一些情况下,与非环状的RNA相比,形成环状RNA可以显著减少向受试者给药的RNA的量(如治疗有效量)。在一些情况下,与非环状的RNA相比,形成环状RNA可以显著增强编辑效率,可以显著减少脱靶编辑,或其组合。
实施例
通过参考以下实施例将更容易理解本发明,所述实施例用于说明本发明,而不应被解释为以任何方式限制本发明的范围。
除非另有定义或上下文另有明确规定,本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。应当理解,与本文所述类似或等同的任何方法和材料可用于本发明的实践或测试。
尽管参照本发明的实施例详细描述了本发明,但提供这些实施例是为了说明而不是限制本发明。根据本发明原理能够得到的其它实施例均属于本发明权利要求所界定的范畴。
本发明中未作具体说明的实验方法,均根据《分子克隆实验指南》(第四版)J.萨姆布鲁克一书中具体方法进行,或者按照相关产品说明书进行。当在本文中使用时,除非另有说明,否则本发明中的所有术语均应按照它们在本领域中已知的普通含义来理解。本发明中所用生物试剂,无特殊说明,均可以从商业途径获得。
本发明中涉及的主要材料包括通用T7体外转录试剂盒(南京诺唯赞科技股份有限公司)、50X TAE缓冲液(生工生物工程公司)、Gel Green核酸染料(生工生物工程公司)、琼脂糖(生工生物工程公司)、RNA Ladder(NEB)、293T细胞、CHO细胞、Hela细胞、PEI等。除非另有定义或上下文另有明确规定,本发明使用的所有材料或仪器均来自商业购买。
本发明涉及基于人源tRNA剪接机制制备细胞内自环化RNA(auto-circle RNA,acRNA)的方法,并提供了包含人源tRNA剪接元件的RNA分子及其构造质粒。具体来说,含有人源tRNA剪接元件的构造质粒在体外转录过程中可自剪切或者转录后酶切获得含5'-羟基和2',3'-环磷酸的线性RNA,该线性RNA是基于人源tRNA的连接接头由内源性tRNA剪接系统中的RNA连接酶作用下进行自环化形成circRNA。
因此,本发明提供了一种含人源tRNA剪接元件的RNA分子及其构造质粒,可在细胞内快速稳定自环化获得circRNA,并表达蛋白质。与已报道的circRNA合成方法相比,所述方法更加简单,可大大降低生产周期和成本。更重要的是,其中人源化的tRNA序列使其在疾病治疗应用方面更具有安全性。
实施例1:基于人源tRNATyr-GTA剪接元件生成的acRNA及自环化
1)质粒DNA模板获得
设置人源tRNA外显子全长组a(全长外显子序列为SEQ ID NO:41/42)、人源tRNA外显子截短组b(截短外显子序列为SEQ ID NO:43/44)、人源tRNA内含子组c(内含子序列SEQID NO:45/46)以及相较于人源tRNA外显子全长组a没有核酶识别序列无法形成5'端羟基和3'端2',3'-环磷酸的阴性对照组d,全长组a、截短组b、内含子组c、阴性对照组d的模板质粒通过安徽通用生物公司进行基因合成和亚克隆获得,阳性组(全长组a、截短组b、内含子组c)质粒上从5'至3'顺序依次包含编码T7启动子-5'基于人源tRNA设计的核酶剪接元件-内部核糖体进入位点(IRES)-蛋白编码区(CDS)-3'基于人源tRNA剪接元件设计的核酶剪接元件-线性化限制性内切酶单酶切位点的核苷酸序列。模板质粒DNA图谱见图2。
全长组a的T7启动子序列见SEQ ID NO:59;5'基于人源tRNA剪接元件设计的核酶识别元件序列见SEQ ID NO:31(下划斜体序列表示人源tRNA序列部分);内部核糖体进入位点(IRES)序列见SEQ ID NO:60;蛋白编码区(CDS)核苷酸序列见SEQ ID NO:61(本实施例中选用的编码蛋白为NeonGreen-teLuc);全长组a的3'基于人源tRNA设计的核酶剪接元件序列见SEQ ID NO:32(下划斜体序列表示人源tRNA序列部分)。
截短组b的5'基于人源tRNA设计的核酶剪接元件中人源tRNA的部分序列见SEQ IDNO:43;截短组b的3'基于人源tRNA设计的核酶剪接元件中人源tRNA的部分序列见SEQ IDNO:44,其余与a组保持一致。
内含子组c的5'基于人源tRNA设计的核酶剪接元件中人源tRNA的部分序列见SEQID NO:45;内含子组c的3'人源tRNA设计的核酶剪接元件中人源tRNA的部分序列见SEQ IDNO:46,其余与a组保持一致。
阴性对照组d对应的质粒上从5'至3'顺序依次包含编码T7启动子-5'人源tRNA的部分序列-内部核糖体进入位点(IRES)-蛋白编码区(CDS)-3'人源tRNA的部分序列-线性化限制性内切酶单酶切位点的核苷酸序列。5'人源tRNA的部分序列见SEQ ID NO:41,3'人源tRNA的部分序列见SEQ ID NO:42,相较于a组不包含核酶识别序列,其余与a组保持一致。
2)体外转录获得含人源tRNA剪接元件的线性RNA
本发明使用限制性内切酶对步骤1)中获得的载体进行酶切,获得线性化质粒DNA模板,本实施例中优选XbaI限制性内切酶。使用T7高产率RNA合成试剂盒(南京诺唯赞科技股份有限公司)通过从线性质粒DNA模板进行体外转录来合成线性核酶未切割RNA(前体RNA)。本实施例中由于质粒DNA模板中含有Twister核酶序列,在体外转录过程中会发生自剪切作用,因此转录后会直接获得含5'-羟基和2',3'-环磷酸的含编码基因的线性切割后未成环RNA,即acRNA(图3A)。体外转录后,将反应产物用DNase I(南京诺唯赞科技股份有限公司)处理30分钟去除DNA模板。DNase I处理后,使用MicroElute Clean-up试剂盒(OMEGA)对acRNA进行柱纯化。本发明采用毛细管电泳对体外转录后的产物进行检测,结果见图3B。结果显示,体外转录后可获得两个小片段以及一个大片段,两个小片段大小与核酶自剪切后的理论片段一致,表明两端核酶均发挥了自剪切的作用。
3)acRNA导入细胞及编码蛋白表达
将获得的纯化后的含人源tRNA剪接元件的acRNA转染到293T细胞中,并在荧光显微镜下观察绿色荧光蛋白是否表达。acRNA进入细胞后,在内源性tRNA剪接加工系统中的RNA连接酶的作用下可将开放的5'端和3'端连接成闭合结构,形成环状circRNA(图4A)。没有成环的acRNA由于缺乏5'端帽子和3'端尾巴,稳定性低,在细胞内会很快被降解,不能表达绿色荧光蛋白。与acRNA相比,circRNA更加稳定,在细胞中可以编码蛋白,表达绿色荧光。因而,当观察到绿色荧光时,可认为acRNA在细胞内自环化形成了circRNA。具体实施过程为:
转染前一天将293T细胞进行传代接种,细胞培养及传代方法参照《细胞培养技术》兰容一书中具体方法进行,所涉及的试剂均来源于商业化产品,本实施例中优选细胞培养基为含10%胎牛血清的DMEM培养基。当细胞汇合度达到70至80%时,将步骤2)中获得的acRNA通过PEI转染导入细胞中。转染48小时后,可观察细胞中绿色荧光蛋白表达。
全长组a(TyrGTA-fullexon)、截短组b(TyrGTA-截短)、内含子组c(TyrGTA-intron)以及对照组d(阴性对照)的荧光结果见图4B,acRNA转染后,绿色荧光蛋白可正常表达,而阴性对照在细胞中不能表达绿色荧光蛋白。这一结果表明本发明中生产含人源tRNA剪接元件序列的RNA分子在293T细胞内可自环化形成circRNA并表达绿色荧光蛋白。
随后对细胞中荧光素酶的发光进行检测,即在转染后48小时收获细胞,用DPBS重悬细胞获得细胞悬液。将100μl的细胞悬液转移到平底白壁板(Corning)中,每组设置3个重复孔。将准备好的含有待测样品的平底白壁板放入到酶标仪中,设置程序,即每孔自动加样100μl的荧光素酶试剂后自动读数。
发光检测结果见图4C,与阴性对照组相比,含人源tRNA剪接元件的acRNA转染后的细胞中荧光素酶的荧光强度明显增加,且人源tRNA的外显子作为剪接元件的效果优于人源tRNA的内含子。这一结果表明本发明中生产的含人源tRNA剪接元件序列的acRNA分子在293T细胞内可自环化形成circRNA并表达荧光素酶。
本实施例中可从绿色荧光蛋白表达及荧光素酶的发光检测结果证明,本发明中生产的含人源tRNA剪接元件序列的acRNA分子可在细胞内自环化获得circRNA。
4)细胞内自环化鉴定
为进一步确定转染后的细胞中产生了circRNA,本发明从转染后的细胞中获得总RNA,并用特异性引物进行反转录获得含编码基因的cDNA。随后,分别在5'端和3'端设计引物,对cDNA进行扩增,进行自环化定性分析。如图5A所示,若线性RNA的5'端和3'端可以通过共价键连接成闭合端,在细胞内形成circRNA,PCR可扩增出特异性条带,而acRNA由于是开放的结构,无法扩增出特异性条带。具体实施过程为:
在转染48小时后用Trizol试剂裂解细胞,按照Trizol试剂操作说明从细胞中提取总RNA。随后根据南京诺唯赞科技股份有限公司的cDNA合成试剂盒说明将RNA反转录成cDNA,其中所用引物为目标RNA分子上的特异性引物,序列如SEQ ID NO:62所示。以获得的cDNA为模板进行PCR扩增,引物序列如SEQ ID NO:63和64所示。
扩增产物进行琼脂糖凝胶电泳,目的条带约1.2Kb,结果如图5B所示。按照天根生化科技(北京)有限公司的DNA纯化回收试剂盒操作说明纯化回收扩增产物。设计测序引物,引物序列如SEQ ID NO:65所示,将纯化的产物交由通用生物(安徽)股份有限公司进行测序。测序结果见图5C,测序正确,表明线性RNA的5'端和3'端可以通过共价键连接成闭合端,在细胞内形成了circRNA。
5)在不同细胞中形成circRNA并表达编码蛋白
本发明在不同细胞中进行了测试,进一步说明含人源tRNA剪接元件的acRNA在细胞中形成circRNA不受细胞种类限制。本实施例中选择的细胞为CHO细胞和Hela细胞,具体方法与步骤3)中的细胞转染方法一致。转染后48小时的细胞荧光图见图6的A和B,含人源tRNA剪接元件的acRNA转染后,绿色荧光蛋白可正常表达。这一结果表明本发明中生产的含人源tRNA剪接元件序列的acRNA分子在CHO细胞或Hela细胞中可形成circRNA并表达绿色荧光蛋白,即acRNA在不同细胞中均可形成circRNA。
6)免疫原性检测试验
细胞培养与处理:
将T75瓶293T细胞先吸弃培养基,加入4ml DPBS,吸弃悬浮死细胞后,加入1ml胰酶,在37℃培养箱孵育4分钟,充分消化细胞悬浮后,加入4ml培养基,全部转移至15ml离心管中,1000r离心3min,弃去上清液,根据细胞量,按12孔板一个孔5×105个细胞接种,使细胞充分分散后放入培养箱培养,等待后续试验。
本次测试细胞组别为:未处理细胞(CK),转染Tyr-GTA-全长细胞,转染Tyr-GTA-截短细胞,转染线性mRNA细胞,转染体外成环RNA(PIE)细胞,其中mRNA为包含目标蛋白序列的普通线性mRNA,体外成环RNA为通过PIE法得到的含有目标蛋白序列的环状RNA。
12孔板培养24小时后提取总RNA,每个处理3个重复。
总RNA提取:
使用诺唯赞RNA-easy Isolation Reagent试剂盒提取细胞总RNA,细胞为293T细胞,培养在12孔板中,按照每孔25万个细胞接种。于上午接种,下午处理,24小时后提取总RNA。
反转录:
使用诺唯赞反转录试剂盒进行反转录(HiScript II 1st Strand cDNASynthesis Kit)
RT-PCR体系见表6,反应条件见表7。
表6
表7
qPCR
使用诺唯赞AceQ qPCR SYBR Green Master Mix试剂进行qPCR试验,qPCR体系中cDNA量为100ng,浓度为50ng/μl,具体体系见表8,各细胞因子对应各引物序列见表9。
表8
组分 | 体积 |
2×AceQ qPCR SYBR Green Master Mix | 10μl |
上游引物(10μM) | 0.4μl |
下游引物(10μM) | 0.4μl |
H2O | 7.2μl |
cDNA(50ng/μl) | 2μl |
表9
图7展示了未处理细胞(CK),转染Tyr-GTA全长,转染Tyr-GTA截短,转染线性RNA,转染体外成环RNA(PIE)后的细胞内部分细胞因子的表达,由图7可知,本申请提供的环状RNA具有较好的免疫原性,安全性能好。
实施例2:DNA核酶剪切生成acRNA
本发明还提供另一种DNA载体质粒,该载体质粒的核酶识别序列为DNA核酶的靶向切割位点。由于核酶识别序列不再是自切割核酶,载体质粒在转录过程中需要先生成前体RNA,无法直接自剪切生成acRNA,因此该载体质粒需要增加一步前体RNA到acRNA的转化。DNA核酶的序列如SEQ ID NO:35/36所示,前体RNA两端含有能被DNA核酶识别切割并生成可供自环化连接的人源tRNA末端的剪切元件(SEQ ID NO:33/34),剪切元件内依次含有IRES(SEQ ID NO:60)和报告基因的编码序列(SEQ ID NO:61),总长度为2123nt,反应体系如下表10所示:
表10
片段摩尔量 | 30pmol |
片段质量 | 20.52μg |
片段浓度 | 876.775ng/μl |
片段体积 | 23.40μl |
核酶量 | 75pmol |
核酶浓度 | 20μM |
核酶体积 | 3.75×2μl |
10×反应缓冲液 | 4μl |
H2O | 5.1μl |
反应体系于85℃反应1min,37℃反应3h。之后70℃反应5min,4℃反应1min。其余步骤皆参考实施例1,所得acRNA转染293T细胞24h及48h后发光检测结果见图8。由图8可知,本发明提供的环状RNA的制备方法,其中核酸载体的核酶识别序列不仅可以通过设置自剪切核酶获得acRNA,还可以通过设置DNA核酶识别序列将初始的线性前体RNA转化为切割后的acRNA。
实施例3:基于人源tRNATyr-ATA剪接元件生成acRNA
含人源tRNATyr-ATA剪接元件的质粒DNA模板构建方法与实施例1相同(使用如下人源tRNA序列替换实施例1中相应的人源tRNA序列),本实施例中所用的tRNA为人源tRNATyr-ATA的全长外显子,5'端核酶剪接元件的人源tRNA序列见SEQ ID NO:47,3'端核酶剪接元件的人源tRNA序列见SEQ ID NO:48。
含人源tRNATyr-ATA剪接元件的RNA分子的获得方法与实施例1相同,质粒模板线性化所用的限制性内切酶为XbaI。将获得的含人源tRNATyr-ATA剪接元件的RNA通过转染导入细胞中,转染方法可以选择,例如脂质体转染、钙转、PEI转染或电转,本实施例中优选PEI转染,转染的细胞为293T细胞。
转染48小时后,细胞中荧光素强度如图9(图TyrATA)所示,含人源tRNATyr-ATA剪接元件的RNA转染后,荧光素酶的荧光强度明显提高,而阴性对照不能表达荧光素酶,所述阴性对照为缺乏人源tRNA及核酶序列的线性RNA。这一结果表明本发明中生产含人源tRNATyr-ATA剪接元件的RNA分子在293T细胞内可形成circRNA并表达荧光素酶。
实施例4:基于人源tRNAIle-TAT剪接元件生成acRNA
含人源tRNAIle-TAT剪接元件的质粒DNA模板构建方法与实施例1相同(使用如下人源tRNA序列替换实施例1中相应的人源tRNA序列),本实施例中所用的tRNA为人源tRNAIle-TAT的全长外显子,5'端核酶剪接元件的人源tRNA序列见SEQ ID NO:49,3'端核酶剪接元件的人源tRNA序列见SEQ ID NO:50。
含人源tRNAIle-TAT剪接元件的RNA分子的获得方法与实施例1相同,质粒模板线性化所用的限制性内切酶为XbaI。将获得的含人源tRNAIle-TAT剪接元件的RNA通过转染导入细胞中,转染方法可以选择,例如脂质体转染、钙转、PEI转染或电转,本实施例中优选PEI转染,转染的细胞为293T细胞。
转染48小时后,细胞中荧光素强度如图9(图IleTAT)所示,含人源tRNAIle-TAT剪接元件的RNA转染后,荧光素酶的荧光强度明显提高,而阴性对照不能表达荧光素酶,所述阴性对照为缺乏人源tRNA及核酶序列的线性RNA。这一结果表明本发明中生产含人源tRNAIle-TAT剪接元件的RNA分子在293T细胞内可形成circRNA并表达荧光素酶。
实施例5:基于人源tRNApro(AGG)剪接元件生成acRNA
含人源tRNApro-AGG剪接元件的质粒DNA模板构建方法与实施例1相同(使用如下人源tRNA序列替换实施例1中相应的人源tRNA序列),本实施例中所用的tRNA为人源tRNApro-AGG的全长外显子,5'端核酶剪接元件的人源tRNA序列见SEQ ID NO:51,3'端核酶剪接元件的人源tRNA序列见SEQ ID NO:52。
含人源tRNApro-AGG剪接元件的RNA分子的获得方法与实施例1相同,质粒模板线性化所用的限制性内切酶为XbaI。将获得的含人源tRNApro-AGG剪接元件的RNA通过转染导入细胞中,转染方法可以选择,例如脂质体转染、钙转、PEI转染或电转,本实施例中优选PEI转染,转染的细胞为293T细胞。
转染48小时后,细胞中荧光素强度如图9(图ProAGG)所示,含人源tRNApro-AGG剪接元件的RNA转染后,荧光素酶的荧光强度明显提高,而阴性对照不能表达荧光素酶,所述阴性对照为缺乏人源tRNA及核酶序列的线性RNA。这一结果表明本发明中生产含人源tRNApro-AGG剪接元件的RNA分子在293T细胞内可形成circRNA并表达荧光素酶。
实施例6:基于人源tRNAPhe-GAA剪接元件生成acRNA
含人源tRNAPhe-GAA剪接元件的质粒DNA模板构建方法与实施例1相同(使用如下人源tRNA序列替换实施例1中相应的人源tRNA序列),本实施例中所用的tRNA为人源tRNAPhe-GAA的全长外显子,5'端核酶剪接元件的人源tRNA序列见SEQ ID NO:53,3'端核酶剪接元件的人源tRNA序列见SEQ ID NO:54。
含人源tRNAPhe-GAA剪接元件的RNA分子的获得方法与实施例1相同,质粒模板线性化所用的限制性内切酶为XbaI。将获得的含人源tRNAPhe-GAA剪接元件的RNA通过转染导入细胞中,转染方法可以选择,例如脂质体转染、钙转、PEI转染或电转,本实施例中优选PEI转染,转染的细胞为293T细胞。
转染48小时后,细胞中荧光素强度如图9(图PheGAA)所示,含人源tRNAPhe-GAA剪接元件的RNA转染后,绿荧光素酶的荧光强度明显提高,而阴性对照不能表达绿色荧光蛋白及荧光素酶,所述阴性对照为缺乏人源tRNA及核酶序列的线性RNA。这一结果表明本发明中生产含人源tRNAPhe-GAA剪接元件的RNA分子在293T细胞内可形成circRNA并表达荧光素酶。
实施例7:基于人源tRNALeu-CAA剪接元件生成acRNA
含人源tRNALeu-CAA剪接元件的质粒DNA模板构建方法与实施例1相同(使用如下人源tRNA序列替换实施例1中相应的人源tRNA序列),本实施例中所用的tRNA为人源tRNALeu-CAA的全长外显子,5'端核酶剪接元件的人源tRNA序列见SEQ ID NO:55,3'端核酶剪接元件的人源tRNA序列见SEQ ID NO:56。
含人源tRNALeu-CAA剪接元件的RNA分子的获得方法与实施例1相同,质粒模板线性化所用的限制性内切酶为XbaI。将获得的含人源tRNALeu-CAA剪接元件的RNA通过转染导入细胞中,转染方法可以选择,例如脂质体转染、钙转、PEI转染或电转,本实施例中优选PEI转染,转染的细胞为293T细胞。
转染48小时后,细胞中荧光素强度如图9(图LeuCAA)所示,含人源tRNALeu-CAA剪接元件的RNA转染后,荧光素酶的荧光强度明显提高,而阴性对照不能表达荧光素酶,所述阴性对照为缺乏人源tRNA及核酶序列的线性RNA。这一结果表明本发明中生产含人源tRNALeu-CAA剪接元件的RNA分子在293T细胞内可形成circRNA并表达荧光素酶。
实施例8:基于人源tRNAArg-TCT剪接元件生成acRNA
含人源tRNAArg-TCT剪接元件的质粒DNA模板构建方法与实施例1相同(使用如下人源tRNA序列替换实施例1中相应的人源tRNA序列),本实施例中所用的人源tRNA为tRNAArg-TCT的全长外显子,5'端核酶剪接元件的人源tRNA序列见SEQ ID NO:57,3'端核酶剪接元件的人源tRNA序列见SEQ ID NO:58。
含人源tRNAArg-TCT剪接元件的RNA分子的获得方法与实施例1相同,质粒模板线性化所用的限制性内切酶为XbaI。将获得的含人源tRNAArg-TCT剪接元件的RNA通过转染导入细胞中,转染方法可以选择,例如脂质体转染、钙转、PEI转染或电转,本实施例中优选PEI转染,转染的细胞为293T细胞。
转染48小时后,细胞中荧光素强度如图9(图ArgTCT)所示,含人源tRNAArg-TCT剪接元件的RNA转染后,荧光素酶的荧光强度明显提高,而阴性对照不能表达荧光素酶,所述阴性对照为缺乏人源tRNA及核酶序列的线性RNA。这一结果表明本发明中生产含人源tRNAArg-TCT剪接元件的RNA分子在293T细胞内可形成acRNA并表达荧光素酶。
以上所述实施例仅表达了本发明的几种实施方案,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,本领域技术人员在不偏离本发明精神的范围内可以进行多种变化、改变和替代,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。
尽管参照本发明的实施例详细描述了本发明,但提供这些实施例是为了说明而不是限制本发明。根据本发明原理能够得到的其它实施例均属于本发明权利要求所界定的范畴。
序列:
Homo_sapiens tRNATyr-GTA-1-1基因组序列(SEQ ID NO:1),大写字母为外显子部分,小写字母为内含子部分:
5’-CCTTCGATAGCTCAGTTGGTAGAGCGGAGGACTGTAGttggctgtgtccttagacATCCTTAGGTCGCTGGTTCGAATCCGGCTCGAAGGA-3’
Homo_sapiens tRNATyr-GTA-2-1基因组序列(SEQ ID NO:2),大写字母为外显子部分,小写字母为内含子部分:
5’-CCTTCGATAGCTCAGTTGGTAGAGCGGAGGACTGTAGtggatagggcgtggcaATCCTTAGGTCGCTGGTTCGATTCCGGCTCGAAGGA-3'
Homo_sapiens tRNATyr-GTA-3-1基因组序列(SEQ ID NO:3),大写字母为外显子部分,小写字母为内含子部分:
5’-CCTTCGATAGCTCAGTTGGTAGAGCGGAGGACTGTAGgctcattaagcaaggtATCCTTAGGTCGCTGGTTCGAATCCGGCTCGGAGGA-3'
Homo_sapiens tRNATyr-GTA-4-1基因组序列(SEQ ID NO:4),大写字母为外显子部分,小写字母为内含子部分:
5’-CCTTCGATAGCTCAGCTGGTAGAGCGGAGGACTGTAGattgtatagacatttgcggacATCCTTAGGTCGCTGGTTCGATTCCAGCTCGAAGGA-3'
Homo_sapiens tRNATyr-GTA-5-1基因组序列(SEQ ID NO:5),大写字母为外显子部分,小写字母为内含子部分:
5’-CCTTCGATAGCTCAGCTGGTAGAGCGGAGGACTGTAGctacttcctcagcaggagacATCCTTAGGTCGCTGGTTCGATTCCGGCTCGAAGGA-3'
Homo_sapiens tRNATyr-GTA-5-2基因组序列(SEQ ID NO:6),大写字母为外显子部分,小写字母为内含子部分:
5’-CCTTCGATAGCTCAGCTGGTAGAGCGGAGGACTGTAGgcgcgcgcccgtggccATCCTTAGGTCGCTGGTTCGATTCCGGCTCGAAGGA-3'
Homo_sapiens tRNATyr-GTA-5-3基因组序列(SEQ ID NO:7),大写字母为外显子部分,小写字母为内含子部分:
5’-CCTTCGATAGCTCAGCTGGTAGAGCGGAGGACTGTAGcctgtagaaacatttgtggacATCCTTAGGTCGCTGGTTCGATTCCGGCTCGAAGGA-3'
Homo_sapiens tRNATyr-GTA-5-4基因组序列(SEQ ID NO:8),大写字母为外显子部分,小写字母为内含子部分:
5’-CCTTCGATAGCTCAGCTGGTAGAGCGGAGGACTGTAGattgtacagacatttgcggacATCCTTAGGTCGCTGGTTCGATTCCGGCTCGAAGGA-3'
Homo_sapiens tRNATyr-GTA-5-5基因组序列(SEQ ID NO:9),大写字母为外显子部分,小写字母为内含子部分:
5’-CCTTCGATAGCTCAGCTGGTAGAGCGGAGGACTGTAGtacttaatgtgtggtcATCCTTAGGTCGCTGGTTCGATTCCGGCTCGAAGGA-3'
Homo_sapiens tRNATyr-GTA-6-1基因组序列(SEQ ID NO:10),大写字母为外显子部分,小写字母为内含子部分:
5’-CCTTCGATAGCTCAGCTGGTAGAGCGGAGGACTGTAGgggtttgaatgtggtcATCCTTAGGTCGCTGGTTCGAATCCGGCTCGGAGGA-3'
Homo_sapiens tRNATyr-GTA-7-1基因组序列(SEQ ID NO:11),大写字母为外显子部分,小写字母为内含子部分:
5’-CCTTCGATAGCTCAGCTGGTAGAGCGGAGGACTGTAGactgcggaaacgtttgtggacATCCTTAGGTCGCTGGTTCAATTCCGGCTCGAAGGA-3'
Homo_sapiens tRNATyr-GTA-8-1基因组序列(SEQ ID NO:12),大写字母为外显子部分,小写字母为内含子部分:
5’-CTTTCGATAGCTCAGTTGGTAGAGCGGAGGACTGTAGgttcattaaactaaggcATCCTTAGGTCGCTGGTTCGAATCCGGCTCGAAGGA-3'
Homo_sapiens tRNATyr-GTA-9-1基因组序列(SEQ ID NO:13),大写字母为外显子部分,小写字母为内含子部分:
5’-TCTTCAATAGCTCAGCTGGTAGAGCGGAGGACTGTAGgtgcacgcccgtggccATTCTTAGGTGCTGGTTTGATTCCGACTTGGAGAG-3'
Homo_sapiens tRNATyr-ATA-1-1基因组序列(SEQ ID NO:14),大写字母为外显子部分,小写字母为内含子部分:
5’-CCTTCAATAGTTCAGCTGGTAGAGCAGAGGACTATAGctacttcctcagtaggagacGTCCTTAGGTTGCTGGTTCGATTCCAGCTTGAAGGA-3'
Homo_sapiens tRNA Ile-TAT-1-1基因组序列(SEQ ID NO:15),大写字母为外显子部分,小写字母为内含子部分:
5’-GCTCCAGTGGCGCAATCGGTTAGCGCGCGGTACTTATAtgacagtgcgagcggagcaATGCCGAGGTTGTGAGTTCGATCCTCACCTGGAGCA-3'
Homo_sapiens tRNAIle-TAT-2-1基因组序列(SEQ ID NO:16),大写字母为外显子部分,小写字母为内含子部分:
5’-GCTCCAGTGGCGCAATCGGTTAGCGCGCGGTACTTATAcagcagtacatgcagagcaATGCCGAGGTTGTGAGTTCGAGCCTCACCTGGAGCA-3'
Homo_sapiens tRNA Ile-TAT-2-2基因组序列(SEQ ID NO:17),大写字母为外显子部分,小写字母为内含子部分:
5’-GCTCCAGTGGCGCAATCGGTTAGCGCGCGGTACTTATAtggcagtatgtgtgcgagtgATGCCGAGGTTGTGAGTTCGAGCCTCACCTGGAGCA-3'
Homo_sapiens tRNAIle-TAT-2-3基因组序列(SEQ ID NO:18),大写字母为外显子部分,小写字母为内含子部分:
5’-GCTCCAGTGGCGCAATCGGTTAGCGCGCGGTACTTATAcaacagtatatgtgcgggtgATGCCGAGGTTGTGAGTTCGAGCCTCACCTGGAGCA-3'
Homo_sapiens tRNA Ile-TAT-3-1基因组序列(SEQ ID NO:19),大写字母为外显子部分,小写字母为内含子部分:
5’-GCTCCAGTGGCGCAATCGGTTAGCGCGCGGTACTTATAagacagtgcacctgtgagcaATGCCGAGGTTGTGAGTTCAAGCCTCACCTGGAGCA-3'
Homo_sapiens tRNAArg-TCT-1-1基因组序列(SEQ ID NO:20),大写字母为外显子部分,小写字母为内含子部分:
5’-GGCTCCGTGGCGCAATGGATAGCGCATTGGACTTCTAgaggctgaaggcATTCAAAGGTTCCGGGTTCGAGTCCCGGCGGAGTCG-3'
Homo_sapiens tRNAArg-TCT-2-1基因组序列(SEQ ID NO:21),大写字母为外显子部分,小写字母为内含子部分:
5’-GGCTCTGTGGCGCAATGGATAGCGCATTGGACTTCTAgtgacgaatagagcaATTCAAAGGTTGTGGGTTCGAATCCCACCAGAGTCG-3'
Homo_sapiens tRNAArg-TCT-3-1基因组序列(SEQ ID NO:22),大写字母为外显子部分,小写字母为内含子部分:
5’-GGCTCTGTGGCGCAATGGATAGCGCATTGGACTTCTAgctgagcctagtgtggtcATTCAAAGGTTGTGGGTTCGAGTCCCACCAGAGTCG-3'
Homo_sapiens tRNAArg-TCT-3-2基因组序列(SEQ ID NO:23),大写字母为外显子部分,小写字母为内含子部分:
5’-GGCTCTGTGGCGCAATGGATAGCGCATTGGACTTCTAgatagttagagaaATTCAAAGGTTGTGGGTTCGAGTCCCACCAGAGTCG-3'
Homo_sapiens tRNALeu-CAA-1-1基因组序列(SEQ ID NO:24),大写字母为外显子部分,小写字母为内含子部分:
5’-GTCAGGATGGCCGAGTGGTCTAAGGCGCCAGACTCAAGctaagcttcctccgcggtggggaTTCTGGTCTCCAATGGAGGCGTGGGTTCGAATCCCACTTCTGACA-3'
Homo_sapiens tRNALeu-CAA-1-2基因组序列(SEQ ID NO:25),大写字母为外显子部分,小写字母为内含子部分:
5’-GTCAGGATGGCCGAGTGGTCTAAGGCGCCAGACTCAAGcttggcttcctcgtgttgaggaTTCTGGTCTCCAATGGAGGCGTGGGTTCGAATCCCACTTCTGACA-3'
Homo_sapiens tRNALeu-CAA-2-1基因组序列(SEQ ID NO:26),大写字母为外显子部分,小写字母为内含子部分:
5’-GTCAGGATGGCCGAGTGGTCTAAGGCGCCAGACTCAAGcttactgcttcctgtgttcgggtcTTCTGGTCTCCGTATGGAGGCGTGGGTTCGAATCCCACTTCTGACA-3'
Homo_sapiens tRNALeu-CAA-3-1基因组序列(SEQ ID NO:27),大写字母为外显子部分,小写字母为内含子部分:
5’-GTCAGGATGGCCGAGTGGTCTAAGGCGCCAGACTCAAGttgctacttcccaggtttggggcTTCTGGTCTCCGCATGGAGGCGTGGGTTCGAATCCCACTTCTGACA-3'
Homo_sapiens tRNALeu-CAA-4-1基因组序列(SEQ ID NO:28),大写字母为外显子部分,小写字母为内含子部分:
5’-GTCAGGATGGCCGAGTGGTCTAAGGCGCCAGACTCAAGgtaagcaccttgcctgcgggctTTCTGGTCTCCGGATGGAGGCGTGGGTTCGAATCCCACTTCTGACA-3'
Homo_sapiens tRNAPro-AGG-3-1基因组序列(SEQ ID NO:29),大写字母为外显子部分,小写字母为内含子部分:
5’-GGCTCGTTGGTCTAGGGGTGTGGTTCTCGCTTAGGGaccacagggacaagccCGGGAGACCCAAGAGGTCCCGGGTTCAAATCCCGGACGAGCCC-3'
Homo_sapiens tRNAPhe-GAA-7-1基因组序列(SEQ ID NO:30),大写字母为外显子部分,小写字母为内含子部分:
5’-GCCGAAATAGCTCAATTGGGAGAGTGTTAGACTGAAGatcTTCTGCAGGTCTCTGGTTCAATTCCGGGTTTCGACA-3'
5'端基于人源tRNATyr-GTA外显子3’端序列(下划线斜体)设计的RNA核酶剪接元件的序列(SEQ ID NO:31)
3'端基于人源tRNATyr-GTA外显子5’端序列(下划线斜体)设计的RNA核酶剪接元件的序列(SEQ ID NO:32)
5'端基于人源tRNATyr-GTA外显子3’端序列(斜体,其中下划线部分是与DNA核酶互补的序列)设计的DNA核酶剪接元件的序列(SEQ ID NO:33)
3'端基于人源tRNATyr-GTA外显子5’端序列(斜体,其中下划线部分是与DNA核酶互补的序列)设计的DNA核酶剪接元件的序列(SEQ ID NO:34)
5'端基于人源tRNATyr-GTA外显子3’端序列(斜体下划线是和人源tRNA外显子3’端序列互补的序列)设计的5'端的DNA核酶序列(SEQ ID NO:35)
3'端基于人源tRNATyr-GTA外显子5’端序列(斜体下划线是和人源tRNA外显子5’端序列互补的序列)设计的3'端的DNA核酶序列(SEQ ID NO:36)
5'端基于人源tRNATyr-GTA外显子3’端序列设计的RNA核酶剪接元件被剪切后形成5'端羟基的人源tRNA序列(SEQ ID NO:37)
5'-OH-AACCTTAGGTCGCTGGTTCAATTCCGGCTCGAAGG……-3'
3'端基于人源tRNATyr-GTA外显子5’端序列设计的RNA核酶剪接元件被剪切后形成2',3'-环磷酸的人源tRNA序列(SEQ ID NO:38)
5'-……CCTTCGATAGCTCAGCTGGTAGAGCGGAGGTCTGTAG-2',3'-环磷酸
5'端基于人源tRNATyr-GTA截短外显子3’端序列设计的RNA核酶剪接元件被剪切后形成5'端羟基的人源tRNA序列(SEQ ID NO:39)
5'-OH-AACCTT……-3'
3'端基于人源tRNATyr-GTA截短外显子5’端序列设计的RNA核酶剪接元件被剪切后形成2',3'-环磷酸的人源tRNA序列(SEQ ID NO:40)
5'-……TAGCTCAGCTGGTAGAGCGGAGGTCTGTAG-2',3'-环磷酸
5'端核酶剪接元件的人源tRNATyr-GTA全长外显子的核苷酸序列(SEQ ID NO:41)
5'-AACCTTAGGTCGCTGGTTCAATTCCGGCTCGAAGG-3'
3'端核酶剪接元件的人源tRNATyr-GTA全长外显子的核苷酸序列(SEQ ID NO:42)
5'-CCTTCGATAGCTCAGCTGGTAGAGCGGAGGTCTGTAG-3'
5'端核酶剪接元件的人源tRNATyr-GTA截短外显子的核苷酸序列(SEQ ID NO:43)
5'-AACCTT-3'
3'端核酶剪接元件的人源tRNATyr-GTA截短外显子的核苷酸序列(SEQ ID NO:44)
5'-TAGCTCAGCTGGTAGAGCGGAGGTCTGTAG-3'
5'端核酶剪接元件的人源tRNATyr-GTA内含子的核苷酸序列(SEQ ID NO:45)
5'-AATGCGGA-3'
3'端核酶剪接元件的人源tRNATyr-GTA内含子的核苷酸序列(SEQ ID NO:46)
5'-AACGTTTTTGGAC-3'
5'端核酶剪接元件的人源tRNATyr-ATA全长外显子的核苷酸序列(SEQ ID NO:47)
5'-GTCCTTAGGTTGCTGGTTCGATTCCAGCTTGAAGG-3'
3'端核酶剪接元件的人源tRNATyr-ATA全长外显子的核苷酸序列(SEQ ID NO:48)
5'-CCTTCAATAGTTCAGCTGGTAGAGCAGAGGACTATAG-3'
5'端核酶剪接元件的人源tRNAIle-TAT全长外显子的核苷酸序列(SEQ ID NO:49)
5'-AAGCCGAGGTTGTGAGTTCAAGCCTCACCTGGAGCA-3'
3'端核酶剪接元件的人源tRNAIle-TAT全长外显子的核苷酸序列(SEQ ID NO:50)
5'-GCTCCAGTGGCGCAATCGGTTAGCGCGCGGTTCTTATA-3'
5'端核酶剪接元件的人源tRNApro-AGG全长外显子的核苷酸序列(SEQ ID NO:51)
5'-AAGGAGACCCAAGAGGTCCCGGGTTCAAATCCCGGACGAGCC-3'
3'端核酶剪接元件的人源tRNApro-AGG全长外显子的核苷酸序列(SEQ ID NO:52)
5'-GGCTCGTTGGTCTAGGGGTGTGGTTCTCGTTTAGGG-3'
5'端核酶剪接元件的人源tRNAPhe-GAA全长外显子的核苷酸序列(SEQ ID NO:53)
5'-AACTGCAGGTCTCTGGTTCAATTCCGGGTTTCGAC-3'
3'端核酶剪接元件的人源tRNAPhe-GAA全长外显子的核苷酸序列(SEQ ID NO:54)
5'-GCCGAAATAGCTCAATTGGGAGAGTGTTAGTCTGAAG-3'
5'端核酶剪接元件的人源tRNALeu-CAA全长外显子的核苷酸序列(SEQ ID NO:55)
5'-AACTGGTCTCCGTATGGAGGCGTGGGTTCGAATCCCACTTCTGACA-3'
3'端核酶剪接元件的人源tRNALeu-CAA全长外显子的核苷酸序列(SEQ ID NO:56)
5'-GTCAGGATGGCCGAGTGGTCTAAGGCGCCAGTCTCAAG-3'
5'端核酶剪接元件的人源tRNAArg-TCT全长外显子的核苷酸序列(SEQ ID NO:57)
5'-AATCAAAGGTTGTGGGTTCGAGTCCCACCAGAGTCG-3'
3'端核酶剪接元件的人源tRNAArg-TCT全长外显子的核苷酸序列(SEQ ID NO:58)
5'-GGCTCTGTGGCGCAATGGATAGCGCATTGGTCTTCTA-3'
T7启动子序列(SEQ ID NO:59)
5'-TTAATACGACTCACTATAGGGATAAT-3'
IRES序列(SEQ ID NO:60)
5'-TTAAAACAGCCTGTGGGTTGATCCCACCCACAGGCCCATTGGGCGCTAGCACTCTGGTATCACGGTACCTTTGTGCGCCTGTTTTATACCCCCTCCCCCAACTGTAACTTAGAAGTAACACACACCGATCAACAGTCAGCGTGGCACACCAGCCACGTTTTGATCAAGCACTTCTGTTACCCCGGACTGAGTATCAATAGACTGCTCACGCGGTTGAAGGAGAAAGCGTTCGTTATCCGGCCAACTACTTCGAAAAACCTAGTAACACCGTGGAAGTTGCAGAGTGTTTCGCTCAGCACTACCCCAGTGTAGATCAGGTCGATGAGTCACCGCATTCCCCACGGGCGACCGTGGCGGTGGCTGCGTTGGCGGCCTGCCCATGGGGAAACCCATGGGACGCTCTAATACAGACATGGTGCGAAGAGTCTATTGAGCTAGTTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCTAACTGCGGAGCACACACCCTCAAGCCAGAGGGCAGTGTGTCGTAACGGGCAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCATTTTATTCCTATACTGGCTGCTTATGGTGACAATTGAGAGATCGTTACCATATAGCTATTGGATTGGCCATCCGGTGACTAATAGAGCTATTATATATCCCTTTGTTGGGTTTATACCACTTAGCTTGAAAGAGGTTAAAACATTACAATTCATTGTTAAGTTGAATACAGCAAA-3'
报告基因的编码区(CDS)的核苷酸序列(SEQ ID NO:61)
5'-ATGGTGAGCAAGGGCGAGGAGGACAACATGGCCAGCCTGCCCGCCACCCACGAGCTGCACATCTTCGGCAGCATCAACGGCGTGGACTTCGACATGGTGGGCCAGGGCACCGGCAACCCCAACGACGGCTACGAGGAGCTGAACCTGAAGAGCACCAAGGGCGACCTGCAGTTCAGCCCCTGGATCCTGGTGCCCCACATCGGCTACGGCTTCCACCAGTACCTGCCCTACCCCGACGGCATGAGCCCCTTCCAGGCCGCCATGGTGGACGGCAGCGGCTACCAGGTGCACAGGACCATGCAGTTCGAGGACGGCGCCAGCCTGACCGTGAACTACAGGTACACCTACGAGGGCAGCCACATCAAGGGCGAGGCCCAGGTGAAGGGCACCGGCTTCCCCGCCGACGGCCCCGTGATGACCAACAGCCTGACCGCCGCCGACTGGTGCAGGAGCAAGAAGACCTACCCCAACGACAAGACCATCATCAGCACCTTCAAGTGGAGCTACACCACCGGCAACGGCAAGAGGTACAGGAGCACCGCCAGGACCACCTACACCTTCGCAAAGCCCATGGCCGCCAACTACCTGAAGAACCAGCCCATGTACGTGTTCAGGAAGACCGAGCTGAAGCACAGCAAGACCGAGCTGAACTTCAAGGAGTGGCAGAAGGCCTTCACCGGCTTCGAGGACTTCGTGGGCGACTGGAGGCAGACCGCCGGCTACAACCTGAGCCAGGTGCTGGAGCAGGGCGGCGTGAGCAGCCTGTTCCAGAACCTGGGCGTGAGCGTGACCCCCATCCAGAGGATCGTGCTGAGCGGCGAGAACGGCCTGAAGATCGACATCCACGTGATCATCCCCTACGAGGGCCTGAGCGGCGACCAGATGGGCCAGATCGAGAAGATCTTCAAGGTGGTGTACCCCGTGGACAACCACCACTTCAAGGTGATCCTGCACTACGGCACCCTGGTGATCGACGGCGTGACCCCCAACATGATCGACTACTTCGGCAGGCCCTACGAGGGCATCGCCGTGTTCGACGGCAAGAAGATCACCGTGACCGGCACCCTGTGGAACGGCAACAAGATCATCGACGAGAGGCTGATCAACCCCGACGGCAGCCTGCTGTTCAGGGTGACCATCAACGGCGTGACCGGCTGGAGGCTGCACGAGAGGATCCTGGCCTAA-3'
反转录引物序列(SEQ ID NO:62)
5'-CGGACACCCAAAGTAGTCGG-3'
cDNA扩增上游引物序列(SEQ ID NO:63)
5'-TGGAGGCAGACCGCCGGCTAC-3'
cDNA扩增下游引物序列(SEQ ID NO:64)
5'-AGGATTAGCCGCATTCAGGG-3'
测序引物序列(SEQ ID NO:65)
5'-TTCAGGGTGACCATCAACGG-3'
GAPDH上游引物序列(SEQ ID NO:66)
5'-TGGCACCGTCAAGGCTGAGAA-3'
GAPDH下游引物序列(SEQ ID NO:67)
5'-TGGTGAAGACGCCAGTGGACTC-3'
RIGI上游引物序列(SEQ ID NO:68)
5'-GCATGGTGTTCCAGATGCCAGA-3'
RIGI下游引物序列(SEQ ID NO:69)
5'-TGCTGCTCGGACATTGCTGAAG-3'
EIF2AK2上游引物序列(SEQ ID NO:70)
5'-GGCACCCAGATTTGACCTTCCT-3'
EIF2AK2下游引物序列(SEQ ID NO:71)
5'-TTACTTCACGCTCCGCCTTCTC-3'
CCL2上游引物序列(SEQ ID NO:72)
5'-CCTTCTGTGCCTGCTGCTCAT-3'
CCL2下游引物序列(SEQ ID NO:73)
5'-CTTTGGGACACTTGCTGCTGGT-3'
TNF上游引物序列(SEQ ID NO:74)
5'-TCCAGGCGGTGCTTGTTCCT-3'
TNF下游引物序列(SEQ ID NO:75)
5'-TGGGCTACAGGCTTGTCACTCG-3'。
Claims (33)
1.一种自环化RNA的前体RNA,其中,所述前体RNA从5'至3'方向按顺序包含以下结构域:
a:5'端基于人源tRNA设计的核酶剪接元件;
x:具有生物学活性的RNA序列;
d:3'端基于人源tRNA设计的核酶剪接元件,
其中,所述5'端基于人源tRNA设计的核酶剪接元件和/或所述3'端基于人源tRNA设计的核酶剪接元件均包含核酶识别序列和人源tRNA的序列,且所述5'端基于人源tRNA设计的核酶剪接元件可以在自剪切核酶或DNA核酶的作用下被切割并生成5'-羟基,以及所述3'端基于人源tRNA设计的核酶剪接元件可以在自剪切核酶或DNA核酶的作用下被切割并生成2',3'-环磷酸,所述5'端基于人源tRNA设计的核酶剪接元件和所述3'端基于人源tRNA设计的核酶剪接元件的所述人源tRNA的序列包含至少部分互补并能够至少形成人源tRNA的反密码子茎或内含子茎的至少一部分的核苷酸序列。
2.如权利要求1所述的前体RNA,其中,所述前体RNA从5'至3'方向按顺序包含以下结构域:
a:5'端基于人源tRNA设计的核酶剪接元件;
b:内部核糖体进入位点;
c:蛋白编码区;
d:3'端基于人源tRNA设计的核酶剪接元件。
3.如权利要求1或2所述的前体RNA,其中,所述5'端基于人源tRNA设计的核酶剪接元件和所述3'端基于人源tRNA设计的核酶剪接元件的所述人源tRNA的序列包含至少部分互补并能够至少形成人源tRNA的反密码子茎的至少一部分、优选全部的核苷酸序列。
4.如权利要求1或2所述的前体RNA,其中,所述5'端基于人源tRNA设计的核酶剪接元件和所述3'端基于人源tRNA设计的核酶剪接元件的所述人源tRNA的序列包含至少部分互补并能够形成人源tRNA的内含子茎的至少一部分、优选全部的核苷酸序列。
5.如权利要求1-4任一项所述的前体RNA,其中,所述核酶识别序列包含自剪切RNA核酶序列或与DNA核酶互补的序列。
6.如权利要求1-5任一项所述的前体RNA,其中,所述人源tRNA选自人源tRNATyr-GTA、tRNATyr-ATA、tRNAIle-TAT、tRNAArg-TCT、tRNALeu-CAA、tRNAPro-AGG或tRNAPhe-GAA中的一或多种。
7.如权利要求1-6任一项所述的前体RNA,其中:
所述人源tRNA为人源tRNATyr-GTA,
所述核酶识别序列包含所述自剪切RNA核酶序列,
所述5'端的核酶剪接元件包含SEQ ID NO:31所示的序列,和/或
所述3'端的核酶剪接元件包含SEQ ID NO:32所示的序列。
8.如权利要求1-6任一项所述的前体RNA,其中:
所述人源tRNA为人源tRNATyr-GTA,
所述核酶识别序列包含所述与DNA核酶互补的序列,
所述5'端的核酶剪接元件包含SEQ ID NO:33所示的序列,和/或
所述3’端的核酶剪接元件包含SEQ ID NO:34所示的序列。
9.如权利要求8所述的前体RNA,其中,对应所述5'端的DNA核酶包含SEQ ID NO:35所示的序列,和/或对应所述3'端的DNA核酶包含SEQ ID NO:36所示的序列。
10.一种自环化RNA,其中,所述自环化RNA为权利要求1至9任意一项所述的前体RNA经自剪切RNA核酶或DNA核酶剪切后形成的自环化RNA,所述自环化RNA的5'端剪切后形成羟基,3'端剪切后形成2',3'-环磷酸。
11.如权利要求10所述的自环化RNA,其中,所述自环化RNA从5'至3'方向按顺序包含以下结构域:
a':5'端形成羟基的人源tRNA的序列;
x:具有生物学活性的RNA序列,例如b:内部核糖体进入位点和c:蛋白编码区;和
d':3'端形成2',3'-环磷酸的人源tRNA的序列。
12.如权利要求11所述的自环化RNA,其中,所述自环化RNA为以下结构:
13.如权利要求10-12任一项所述的自环化RNA,其中,
所述人源tRNA为人源tRNATyr-GTA,
所述5'端形成羟基的人源tRNA序列如下所示:
5'-OH-AACCTTAGGTCGCTGGTTCAATTCCGGCTCGAAGG……-3'(SEQ ID NO:37),和/或,
所述3'端形成2',3'-环磷酸的人源tRNA序列如下所示:
5'-……CCTTCGATAGCTCAGCTGGTAGAGCGGAGGTCTGTAG-2',3'-环磷酸(SEQ ID NO:38)。
14.如权利要求10-13任一项所述的一种自环化RNA,其中,
所述人源tRNA为人源tRNATyr-GTA,
所述5'端形成羟基的人源tRNA序列如下所示:5'-OH-AACCTT……-3'(SEQ ID NO:
39);和/或,
所述3端形成2,3-环磷酸的人源tRNA序列如下所示:
5'-……TAGCTCAGCTGGTAGAGCGGAGGTCTGTAG-2',3'-环磷酸(SEQ ID NO:40)。
15.一种环状RNA,其中,所述环状RNA为权利要求10-14中任意一项所述自环化RNA在RNA连接酶的存在下自环化形成的环状RNA。
16.一种环状RNA,其中,所述环状RNA顺序包含以下结构域:
a”:5'端人源tRNA序列;
x:具有生物学活性的RNA序列,例如b:内部核糖体进入位点和c:蛋白编码区;和
d”:3'端人源tRNA序列;
所述5'端人源tRNA序列与所述3'端人源tRNA序列共价连接。
17.如权利要求16所述的环状RNA,其中,所述5'端人源tRNA序列与所述3'端人源tRNA序列均为同一人源tRNA的部分序列,且所述5'端人源tRNA序列与所述3'端人源tRNA序列包含部分互补并能够形成至少一个所述人源tRNA的反密码子茎或内含子茎的核苷酸序列。
18.如权利要求16或17所述的环状RNA,其中,所述人源tRNA选自人源tRNATyr-GTA、tRNATyr-ATA、tRNAIle-TAT、tRNAArg-TCT、tRNALeu-CAA、tRNAPro-AGG、tRNAPhe-GAA中的一或多种。
19.一种用于产生前体RNA的核酸载体,其中,所述核酸载体包含编码权利要求1-9中任意一项权利要求所述的前体RNA的序列。
20.一种用于产生前体RNA的核酸载体,其中,所述核酸载体按顺序包含以下元件的编码序列:
T7启动子;
5'端基于人源tRNA设计的核酶剪接元件;
具有生物学活性的RNA序列,优选包含内部核糖体进入位点和蛋白编码区;
3'端基于人源tRNA设计的核酶剪接元件;和,
线性化限制性内切酶单酶切位点;
其中,所述5'端基于人源tRNA设计的核酶剪接元件和所述3'端基于人源tRNA设计的核酶剪接元件如权利要求1-9中任一项所限定。
21.如权利要求20所述的核酸载体,其中,所述5'端基于人源tRNA设计的核酶剪接元件与所述3'端基于人源tRNA设计的核酶剪接元件均包含核酶识别序列和人源tRNA的部分序列,优选所述5'端和3'端的人源tRNA的部分序列至少包含能够部分互补并形成反密码子茎或内含子茎的序列。
22.如权利要求20或21所述的核酸载体,其中,所述人源tRNA为人源tRNATyr-GTA、tRNATyr-ATA、tRNAIle-TAT、tRNAArg-TCT、tRNALeu-CAA、tRNAPro-AGG、tRNAPhe-GAA中的一或多种。
23.如权利要求20-22任一项所述的核酸载体,其中,所述5'端基于人源tRNA设计的核酶剪接元件和所述3'端基于人源tRNA设计的核酶剪接元件包括自剪切核酶序列。
24.如权利要求23所述的核酸载体,其中,所述自剪切核酶选自RNA酶P、rRNA、引导酶、I组内含子核酶、II组内含子核酶、GIR1分支核酶、glmS核酶、发夹核酶、锤头状核酶、HDV核酶、绕线核酶、绕线姐妹核酶、VS核酶、手枪核酶、手斧核酶、类病毒中的一种或两种。
25.如权利要求20-22任一项所述的核酸载体,其中,所述5'端基于人源tRNA设计的核酶剪接元件和所述3'端基于人源tRNA设计的核酶剪接元件包括与DNA核酶互补的序列。
26.如权利要求25所述的核酸载体,其中,所述DNA核酶选自10-23DNA核酶、8-17DNA核酶、17E DNA核酶、AC07 DNA核酶、AC14 DNA核酶、AC17 DNA核酶中的一种或两种,所述DNA核酶为能识别特异RNA序列并切割RNA生成5'端羟基和3'端2',3'-环磷酸结构的DNA核酶。
27.一种环状RNA的制备方法,该方法包含:
(1)提供如权利要求19-26任意一项所述的核酸载体,经线性化后,体外转录得到线性的前体RNA;
(2)体外转录过程中通过RNA核酶自剪切或体外转录后通过DNA核酶剪切作用,得到含有5'-羟基和2',3'-环磷酸的自环化RNA;
(3)所述自环化RNA在RNA连接酶的作用下,两端发生共价结合作用,形成所述环状RNA。
28.如权利要求27所述的环状RNA的制备方法,其中,所述RNA连接酶为细胞内部存在的天然的RNA连接酶,所述自环化RNA在细胞内部自动环化生成所述环状RNA。
29.一种重组生产目标蛋白的方法,包括:
-制备权利要求10-14任一项的自环化RNA或权利要求15-18任一项所述的环状RNA,其中自环化RNA或环状RNA中的蛋白编码区为编码所述目标蛋白的核酸序列;
-将所述自环化RNA或环状RNA引入宿主细胞,例如通过转染,特别是通过使用PEI的转染或封装于纳米脂质体进行递送;
-在宿主细胞中表达所述目标蛋白;以及,
-任选地,分离和/或纯化所表达的感兴趣的蛋白。
30.如权利要求29的方法,其中所述环状RNA如下制备:
-提供如权利要求19-26任意一项所述的核酸载体,经线性化后,体外转录得到线性的前体RNA;
-体外转录过程中通过RNA核酶自剪切或体外转录后通过DNA核酶剪切作用,得到含有5'-羟基和2',3'-环磷酸的自环化RNA;以及
-所述自环化RNA在体外在RNA连接酶的作用下,两端发生共价结合作用,形成所述环状RNA,或者在将所述自环化RNA引入宿主细胞时,在宿主细胞内存在的天然的RNA连接酶作用下,在细胞内自动环化生成环状RNA。
31.一种制备RNA疫苗的方法,包括:
-制备权利要求15-18任一项所述的环状RNA,其中环状RNA中的蛋白编码区为编码感兴趣的免疫原的核酸序列。
32.如权利要求31的方法,其中所述环状RNA如下制备:
-提供如权利要求19-26任意一项所述的核酸载体,经线性化后,体外转录得到线性的前体RNA;
-体外转录过程中通过RNA核酶自剪切或体外转录后通过DNA核酶剪切作用,得到含有5'-羟基和2',3'-环磷酸的自环化RNA;以及
-所述自环化RNA在RNA连接酶的作用下,两端发生共价结合作用,形成所述环状RNA。
33.权利要求10-14任一项的自环化RNA或权利要求15-18任一项所述的环状RNA在制备用于在对象中治疗疾病或免疫接种的药物的用途,其中自环化RNA或环状RNA中的蛋白编码区为编码目标治疗蛋白或免疫原的核酸序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311532224.2A CN117568337A (zh) | 2023-11-16 | 2023-11-16 | 一种基于人源tRNA的自环化RNA |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311532224.2A CN117568337A (zh) | 2023-11-16 | 2023-11-16 | 一种基于人源tRNA的自环化RNA |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117568337A true CN117568337A (zh) | 2024-02-20 |
Family
ID=89892869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311532224.2A Pending CN117568337A (zh) | 2023-11-16 | 2023-11-16 | 一种基于人源tRNA的自环化RNA |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117568337A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112399860A (zh) * | 2018-06-06 | 2021-02-23 | 麻省理工学院 | 用于在真核细胞中翻译的环状rna |
US20210340542A1 (en) * | 2017-06-23 | 2021-11-04 | Cornell University | Rna molecules, methods of producing circular rna, and treatment methods |
-
2023
- 2023-11-16 CN CN202311532224.2A patent/CN117568337A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210340542A1 (en) * | 2017-06-23 | 2021-11-04 | Cornell University | Rna molecules, methods of producing circular rna, and treatment methods |
CN112399860A (zh) * | 2018-06-06 | 2021-02-23 | 麻省理工学院 | 用于在真核细胞中翻译的环状rna |
Non-Patent Citations (1)
Title |
---|
JACOB L LITKE AND SAMIE R JAFFREY: "Highly efficient expression of circular RNA aptamers in cells using autocatalytic transcripts", NAT BIOTECHNOL, vol. 37, no. 6, 8 April 2019 (2019-04-08), pages 667 - 675, XP036900696, DOI: 10.1038/s41587-019-0090-6 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP4008336A1 (en) | A recombinant nucleic acid molecule of transcriptional circular rna and its application in protein expression | |
US6566093B1 (en) | Alphavirus cDNA vectors | |
CN112399860A (zh) | 用于在真核细胞中翻译的环状rna | |
WO2023227124A1 (zh) | 一种构建mRNA体外转录模板的骨架 | |
CN114574483A (zh) | 基于翻译起始元件点突变的重组核酸分子及其在制备环状rna中的应用 | |
JP7440045B2 (ja) | 核酸封入aav中空粒子 | |
CN116004696B (zh) | 可与IRES组合的3ˊUTR加茎环结构基因及其应用、mRNA表达系统 | |
WO2023046153A1 (en) | Circular rna and preparation method thereof | |
CN112725329B (zh) | 一种功能元件的建库方法及其应用 | |
US20220243243A1 (en) | Expression of products from nucleic acid concatemers | |
CN116555342A (zh) | 一种经改造的pT7TS质粒及其应用 | |
CN117568337A (zh) | 一种基于人源tRNA的自环化RNA | |
CN116162609A (zh) | Cas13蛋白、CRISPR-Cas系统及其应用 | |
CN116410999A (zh) | 含有ires及新型启动子的核酸载体及其应用 | |
JP2023518734A (ja) | インビトロトランスクリプトmrna及びこれを含有する薬学組成物 | |
CN114616338A (zh) | 生成哑铃形dna载体的方法 | |
CN118086288B (zh) | 多顺反子的自放大rna及制备方法 | |
EP4219723A1 (en) | Circular rna platforms, uses thereof, and their manufacturing processes from engineered dna | |
WO2024179544A1 (zh) | 编码rna的工程化dna分子 | |
CN111909986B (zh) | 一种基因治疗安全评估与毒副作用预防的方法 | |
WO2024089629A1 (en) | Cas12 protein, crispr-cas system and uses thereof | |
CN118652889A (zh) | 一种环状核酶系统及其应用 | |
CN116949037A (zh) | 用于编辑目标核酸的组合物及编辑目标核酸的方法 | |
WO2024121790A2 (en) | Cas12 protein, crispr-cas system and uses thereof | |
WO2024145248A1 (en) | Compositions and methods for generating circular rna |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |