CN117529556A - 制备环状rna的方法 - Google Patents
制备环状rna的方法 Download PDFInfo
- Publication number
- CN117529556A CN117529556A CN202380012376.1A CN202380012376A CN117529556A CN 117529556 A CN117529556 A CN 117529556A CN 202380012376 A CN202380012376 A CN 202380012376A CN 117529556 A CN117529556 A CN 117529556A
- Authority
- CN
- China
- Prior art keywords
- rna
- virus
- rna transcript
- fragment
- dna construct
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108091028075 Circular RNA Proteins 0.000 title claims abstract description 170
- 238000000034 method Methods 0.000 title claims abstract description 74
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract description 290
- 239000012634 fragment Substances 0.000 claims description 277
- 238000000746 purification Methods 0.000 claims description 149
- 108020004414 DNA Proteins 0.000 claims description 140
- 241000700605 Viruses Species 0.000 claims description 104
- 125000006850 spacer group Chemical group 0.000 claims description 86
- 238000007363 ring formation reaction Methods 0.000 claims description 82
- 125000003729 nucleotide group Chemical group 0.000 claims description 78
- 239000002773 nucleotide Substances 0.000 claims description 76
- 239000003795 chemical substances by application Substances 0.000 claims description 63
- 108090000623 proteins and genes Proteins 0.000 claims description 53
- 150000007523 nucleic acids Chemical group 0.000 claims description 44
- 102000004169 proteins and genes Human genes 0.000 claims description 40
- 238000011144 upstream manufacturing Methods 0.000 claims description 35
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 claims description 34
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 claims description 34
- 239000000047 product Substances 0.000 claims description 31
- 238000000338 in vitro Methods 0.000 claims description 30
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 claims description 26
- 239000002243 precursor Substances 0.000 claims description 25
- 108091034057 RNA (poly(A)) Proteins 0.000 claims description 24
- 230000000295 complement effect Effects 0.000 claims description 23
- 238000013518 transcription Methods 0.000 claims description 23
- 230000035897 transcription Effects 0.000 claims description 23
- 238000010367 cloning Methods 0.000 claims description 22
- 108700026244 Open Reading Frames Proteins 0.000 claims description 20
- 239000000203 mixture Substances 0.000 claims description 19
- 108091034117 Oligonucleotide Proteins 0.000 claims description 15
- 108020005067 RNA Splice Sites Proteins 0.000 claims description 13
- 108090001052 hairpin ribozyme Proteins 0.000 claims description 11
- 108091023043 Alu Element Proteins 0.000 claims description 10
- 108091023037 Aptamer Proteins 0.000 claims description 10
- 108020005543 Satellite RNA Proteins 0.000 claims description 9
- 239000006227 byproduct Substances 0.000 claims description 9
- 239000003153 chemical reaction reagent Substances 0.000 claims description 9
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 8
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 8
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 claims description 8
- 238000003780 insertion Methods 0.000 claims description 8
- 230000037431 insertion Effects 0.000 claims description 8
- 241000723677 Tobacco ringspot virus Species 0.000 claims description 7
- 108020004566 Transfer RNA Proteins 0.000 claims description 7
- 230000001225 therapeutic effect Effects 0.000 claims description 7
- 101000857677 Homo sapiens Runt-related transcription factor 1 Proteins 0.000 claims description 6
- 108700011259 MicroRNAs Proteins 0.000 claims description 6
- -1 antibody Proteins 0.000 claims description 6
- 102000050291 human RUNX1 Human genes 0.000 claims description 6
- 239000002679 microRNA Substances 0.000 claims description 6
- 239000004055 small Interfering RNA Substances 0.000 claims description 6
- 108020005345 3' Untranslated Regions Proteins 0.000 claims description 5
- 241000710777 Classical swine fever virus Species 0.000 claims description 5
- 241000196324 Embryophyta Species 0.000 claims description 5
- 101710091919 Eukaryotic translation initiation factor 4G Proteins 0.000 claims description 5
- 241000712909 Reticuloendotheliosis virus Species 0.000 claims description 5
- 244000057717 Streptococcus lactis Species 0.000 claims description 5
- 241000723873 Tobacco mosaic virus Species 0.000 claims description 5
- 201000002491 encephalomyelitis Diseases 0.000 claims description 5
- 235000011293 Brassica napus Nutrition 0.000 claims description 4
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 claims description 4
- 244000298479 Cichorium intybus Species 0.000 claims description 4
- 235000007542 Cichorium intybus Nutrition 0.000 claims description 4
- 241001632249 Cosavirus Species 0.000 claims description 4
- 241000711549 Hepacivirus C Species 0.000 claims description 4
- 241000713772 Human immunodeficiency virus 1 Species 0.000 claims description 4
- 241000709664 Picornaviridae Species 0.000 claims description 4
- 108091027967 Small hairpin RNA Proteins 0.000 claims description 4
- 241000223892 Tetrahymena Species 0.000 claims description 4
- 108700040054 mouse Nkx6-2 Proteins 0.000 claims description 4
- 239000000758 substrate Substances 0.000 claims description 4
- 101150059573 AGTR1 gene Proteins 0.000 claims description 3
- 241000192542 Anabaena Species 0.000 claims description 3
- 241000282465 Canis Species 0.000 claims description 3
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 claims description 3
- 108090000695 Cytokines Proteins 0.000 claims description 3
- 102000004127 Cytokines Human genes 0.000 claims description 3
- 101100239628 Danio rerio myca gene Proteins 0.000 claims description 3
- 101000760853 Enterobacteria phage T4 Thymidylate synthase Proteins 0.000 claims description 3
- 241000709661 Enterovirus Species 0.000 claims description 3
- 241001529459 Enterovirus A71 Species 0.000 claims description 3
- 241000701533 Escherichia virus T4 Species 0.000 claims description 3
- 241000710198 Foot-and-mouth disease virus Species 0.000 claims description 3
- 108020005004 Guide RNA Proteins 0.000 claims description 3
- 241000709721 Hepatovirus A Species 0.000 claims description 3
- 101000971171 Homo sapiens Apoptosis regulator Bcl-2 Proteins 0.000 claims description 3
- 101000806663 Homo sapiens Aquaporin-4 Proteins 0.000 claims description 3
- 101000740062 Homo sapiens BAG family molecular chaperone regulator 1 Proteins 0.000 claims description 3
- 101100275820 Homo sapiens CSDE1 gene Proteins 0.000 claims description 3
- 101000944361 Homo sapiens Cyclin-dependent kinase inhibitor 1B Proteins 0.000 claims description 3
- 101000804865 Homo sapiens E3 ubiquitin-protein ligase XIAP Proteins 0.000 claims description 3
- 101000899240 Homo sapiens Endoplasmic reticulum chaperone BiP Proteins 0.000 claims description 3
- 101100281008 Homo sapiens FGF2 gene Proteins 0.000 claims description 3
- 101000972291 Homo sapiens Lymphoid enhancer-binding factor 1 Proteins 0.000 claims description 3
- 101100519221 Homo sapiens PDGFB gene Proteins 0.000 claims description 3
- 101000864780 Homo sapiens Pulmonary surfactant-associated protein A1 Proteins 0.000 claims description 3
- 101000808011 Homo sapiens Vascular endothelial growth factor A Proteins 0.000 claims description 3
- 241000710124 Human rhinovirus A2 Species 0.000 claims description 3
- 108091026898 Leader sequence (mRNA) Proteins 0.000 claims description 3
- 101150039798 MYC gene Proteins 0.000 claims description 3
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 claims description 3
- 101100140104 Mus musculus Rbm3 gene Proteins 0.000 claims description 3
- 101710163270 Nuclease Proteins 0.000 claims description 3
- 102100040990 Platelet-derived growth factor subunit B Human genes 0.000 claims description 3
- 241001084365 RNA satellites Species 0.000 claims description 3
- 102000018120 Recombinases Human genes 0.000 claims description 3
- 108010091086 Recombinases Proteins 0.000 claims description 3
- 108020004459 Small interfering RNA Proteins 0.000 claims description 3
- 235000014897 Streptococcus lactis Nutrition 0.000 claims description 3
- 102000006290 Transcription Factor TFIID Human genes 0.000 claims description 3
- 108010083268 Transcription Factor TFIID Proteins 0.000 claims description 3
- 108020000999 Viral RNA Proteins 0.000 claims description 3
- 101001001642 Xenopus laevis Serine/threonine-protein kinase pim-3 Proteins 0.000 claims description 3
- 101100459258 Xenopus laevis myc-a gene Proteins 0.000 claims description 3
- 230000001580 bacterial effect Effects 0.000 claims description 3
- 208000006454 hepatitis Diseases 0.000 claims description 3
- 231100000283 hepatitis Toxicity 0.000 claims description 3
- 102000057121 human AQP4 Human genes 0.000 claims description 3
- 102000051711 human BCL2 Human genes 0.000 claims description 3
- 102000057048 human CDKN1B Human genes 0.000 claims description 3
- 102000046317 human CSDE1 Human genes 0.000 claims description 3
- 102000048874 human LEF1 Human genes 0.000 claims description 3
- 102000054741 human SFTPA1 Human genes 0.000 claims description 3
- 102000058223 human VEGFA Human genes 0.000 claims description 3
- 102000052732 human XIAP Human genes 0.000 claims description 3
- 208000006278 hypochromic anemia Diseases 0.000 claims description 3
- 239000000813 peptide hormone Substances 0.000 claims description 3
- 230000000069 prophylactic effect Effects 0.000 claims description 3
- 229940023143 protein vaccine Drugs 0.000 claims description 3
- 108020003175 receptors Proteins 0.000 claims description 3
- 102000005962 receptors Human genes 0.000 claims description 3
- 239000007787 solid Substances 0.000 claims description 3
- 241000219195 Arabidopsis thaliana Species 0.000 claims description 2
- 241000709687 Coxsackievirus Species 0.000 claims description 2
- 241000709675 Coxsackievirus B3 Species 0.000 claims description 2
- 241000988559 Enterovirus A Species 0.000 claims description 2
- 235000005206 Hibiscus Nutrition 0.000 claims description 2
- 235000007185 Hibiscus lunariifolius Nutrition 0.000 claims description 2
- 101000846416 Homo sapiens Fibroblast growth factor 1 Proteins 0.000 claims description 2
- 101000775102 Homo sapiens Transcriptional coactivator YAP1 Proteins 0.000 claims description 2
- 241000709701 Human poliovirus 1 Species 0.000 claims description 2
- 101001046872 Mus musculus Hypoxia-inducible factor 1-alpha Proteins 0.000 claims description 2
- 241001674048 Phthiraptera Species 0.000 claims description 2
- 108060006706 SRC Proteins 0.000 claims description 2
- 102000001332 SRC Human genes 0.000 claims description 2
- 102100031873 Transcriptional coactivator YAP1 Human genes 0.000 claims description 2
- 208000011580 syndromic disease Diseases 0.000 claims description 2
- 230000003612 virological effect Effects 0.000 claims description 2
- 230000001769 paralizing effect Effects 0.000 claims 2
- 241001124076 Aphididae Species 0.000 claims 1
- 241000283690 Bos taurus Species 0.000 claims 1
- 240000002791 Brassica napus Species 0.000 claims 1
- 241000219193 Brassicaceae Species 0.000 claims 1
- 241000710127 Cricket paralysis virus Species 0.000 claims 1
- 241000710188 Encephalomyocarditis virus Species 0.000 claims 1
- 241000606807 Glaesserella parasuis Species 0.000 claims 1
- 244000284380 Hibiscus rosa sinensis Species 0.000 claims 1
- 101000896157 Homo sapiens Baculoviral IAP repeat-containing protein 2 Proteins 0.000 claims 1
- 101100462513 Homo sapiens TP53 gene Proteins 0.000 claims 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 claims 1
- 241001082241 Lythrum hyssopifolia Species 0.000 claims 1
- 241001223089 Tremovirus A Species 0.000 claims 1
- 230000001154 acute effect Effects 0.000 claims 1
- 239000007799 cork Substances 0.000 claims 1
- 231100000518 lethal Toxicity 0.000 claims 1
- 230000001665 lethal effect Effects 0.000 claims 1
- 108700026220 vif Genes Proteins 0.000 claims 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 23
- 108020005093 RNA Precursors Proteins 0.000 description 20
- 102000039446 nucleic acids Human genes 0.000 description 18
- 108020004707 nucleic acids Proteins 0.000 description 18
- 239000013612 plasmid Substances 0.000 description 18
- 238000004519 manufacturing process Methods 0.000 description 13
- 108091026890 Coding region Proteins 0.000 description 12
- 238000011160 research Methods 0.000 description 12
- 238000001727 in vivo Methods 0.000 description 11
- 108090000994 Catalytic RNA Proteins 0.000 description 10
- 102000053642 Catalytic RNA Human genes 0.000 description 10
- 108020004999 messenger RNA Proteins 0.000 description 10
- 108091092562 ribozyme Proteins 0.000 description 10
- 230000008436 biogenesis Effects 0.000 description 9
- 238000005251 capillar electrophoresis Methods 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 230000004048 modification Effects 0.000 description 9
- 108091092195 Intron Proteins 0.000 description 8
- 238000012512 characterization method Methods 0.000 description 8
- 238000003776 cleavage reaction Methods 0.000 description 8
- 201000010099 disease Diseases 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 210000004027 cell Anatomy 0.000 description 7
- 239000000543 intermediate Substances 0.000 description 7
- 108090000765 processed proteins & peptides Proteins 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- 108010090804 Streptavidin Proteins 0.000 description 6
- 239000011543 agarose gel Substances 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 238000005809 transesterification reaction Methods 0.000 description 6
- 150000001413 amino acids Chemical group 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 239000011324 bead Substances 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 150000004676 glycans Chemical class 0.000 description 5
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 5
- 102000040430 polynucleotide Human genes 0.000 description 5
- 108091033319 polynucleotide Proteins 0.000 description 5
- 229920001282 polysaccharide Polymers 0.000 description 5
- 239000005017 polysaccharide Substances 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 150000003384 small molecules Chemical class 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 241000991587 Enterovirus C Species 0.000 description 4
- 108091008103 RNA aptamers Proteins 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 238000010828 elution Methods 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 239000003446 ligand Substances 0.000 description 4
- 239000008194 pharmaceutical composition Substances 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 235000000346 sugar Nutrition 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- 108020003589 5' Untranslated Regions Proteins 0.000 description 3
- 240000008100 Brassica rapa Species 0.000 description 3
- 229920002101 Chitin Polymers 0.000 description 3
- 241000931705 Cicada Species 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 108010024636 Glutathione Proteins 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 102000004389 Ribonucleoproteins Human genes 0.000 description 3
- 108010081734 Ribonucleoproteins Proteins 0.000 description 3
- 241000710799 Rubella virus Species 0.000 description 3
- 241000723792 Tobacco etch virus Species 0.000 description 3
- 101710120037 Toxin CcdB Proteins 0.000 description 3
- 241000269370 Xenopus <genus> Species 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000003085 diluting agent Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 229960003180 glutathione Drugs 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000000546 pharmaceutical excipient Substances 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 229940124597 therapeutic agent Drugs 0.000 description 3
- 229940021747 therapeutic vaccine Drugs 0.000 description 3
- 241000701161 unidentified adenovirus Species 0.000 description 3
- WLCZTRVUXYALDD-IBGZPJMESA-N 7-[[(2s)-2,6-bis(2-methoxyethoxycarbonylamino)hexanoyl]amino]heptoxy-methylphosphinic acid Chemical compound COCCOC(=O)NCCCC[C@H](NC(=O)OCCOC)C(=O)NCCCCCCCOP(C)(O)=O WLCZTRVUXYALDD-IBGZPJMESA-N 0.000 description 2
- 101710191936 70 kDa protein Proteins 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 241000317943 Acute bee paralysis virus Species 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 241000192531 Anabaena sp. Species 0.000 description 2
- 108091007065 BIRCs Proteins 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 108020004638 Circular DNA Proteins 0.000 description 2
- 108091033380 Coding strand Proteins 0.000 description 2
- 241001464430 Cyanobacterium Species 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 241000725619 Dengue virus Species 0.000 description 2
- 241000283073 Equus caballus Species 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 241001251068 Formica fusca Species 0.000 description 2
- 241000150562 Hantaan orthohantavirus Species 0.000 description 2
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 2
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 2
- 108091005902 Hemoglobin subunit alpha Proteins 0.000 description 2
- 102100027685 Hemoglobin subunit alpha Human genes 0.000 description 2
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 2
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 2
- 241000724709 Hepatitis delta virus Species 0.000 description 2
- 241000519953 Hibiscus chlorotic ringspot virus Species 0.000 description 2
- 244000130592 Hibiscus syriacus Species 0.000 description 2
- 235000018081 Hibiscus syriacus Nutrition 0.000 description 2
- 101001009007 Homo sapiens Hemoglobin subunit alpha Proteins 0.000 description 2
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 description 2
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 description 2
- 102000003839 Human Proteins Human genes 0.000 description 2
- 108090000144 Human Proteins Proteins 0.000 description 2
- 102000055031 Inhibitor of Apoptosis Proteins Human genes 0.000 description 2
- 241000960414 Kashmir bee virus Species 0.000 description 2
- 108091092724 Noncoding DNA Proteins 0.000 description 2
- 241000991583 Parechovirus Species 0.000 description 2
- 229940022005 RNA vaccine Drugs 0.000 description 2
- 241000936948 Rhopalosiphum padi virus Species 0.000 description 2
- 108091081021 Sense strand Proteins 0.000 description 2
- 208000005718 Stomach Neoplasms Diseases 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 241001265687 Taura syndrome virus Species 0.000 description 2
- 241000710209 Theiler's encephalomyelitis virus Species 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 241001492404 Woodchuck hepatitis virus Species 0.000 description 2
- 241000269368 Xenopus laevis Species 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 125000000217 alkyl group Chemical group 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 108091008816 c-sis Proteins 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 206010017758 gastric cancer Diseases 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 102000053563 human MYC Human genes 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 206010039083 rhinitis Diseases 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 201000011549 stomach cancer Diseases 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- JNELGWHKGNBSMD-UHFFFAOYSA-N xanthone Chemical compound C1=CC=C2C(=O)C3=CC=CC=C3OC2=C1 JNELGWHKGNBSMD-UHFFFAOYSA-N 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- WKKCYLSCLQVWFD-UHFFFAOYSA-N 1,2-dihydropyrimidin-4-amine Chemical compound N=C1NCNC=C1 WKKCYLSCLQVWFD-UHFFFAOYSA-N 0.000 description 1
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 1
- UVBYMVOUBXYSFV-UHFFFAOYSA-N 1-methylpseudouridine Natural products O=C1NC(=O)N(C)C=C1C1C(O)C(O)C(CO)O1 UVBYMVOUBXYSFV-UHFFFAOYSA-N 0.000 description 1
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical group BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- ZXIATBNUWJBBGT-JXOAFFINSA-N 5-methoxyuridine Chemical compound O=C1NC(=O)C(OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZXIATBNUWJBBGT-JXOAFFINSA-N 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 241000209758 Aegilops Species 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 241000243818 Annelida Species 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 241000723635 Arabis mosaic virus Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241001645380 Bassia scoparia Species 0.000 description 1
- 208000014644 Brain disease Diseases 0.000 description 1
- 101100450705 Caenorhabditis elegans hif-1 gene Proteins 0.000 description 1
- 241001527050 Cynoglossus Species 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 241001046947 Ectropis obliqua Species 0.000 description 1
- 208000032274 Encephalopathy Diseases 0.000 description 1
- 102100023882 Endoribonuclease ZC3H12A Human genes 0.000 description 1
- 101710112715 Endoribonuclease ZC3H12A Proteins 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical class C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 1
- 208000037262 Hepatitis delta Diseases 0.000 description 1
- 241000218033 Hibiscus Species 0.000 description 1
- 241001622355 Himetobi P virus Species 0.000 description 1
- 241001129848 Homalodisca coagulata virus-1 Species 0.000 description 1
- 241001503238 Homalodisca vitripennis Species 0.000 description 1
- 101000920078 Homo sapiens Elongation factor 1-alpha 1 Proteins 0.000 description 1
- 101001066129 Homo sapiens Glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 101001057699 Homo sapiens Inorganic pyrophosphatase Proteins 0.000 description 1
- 101001055222 Homo sapiens Interleukin-8 Proteins 0.000 description 1
- 101000891579 Homo sapiens Microtubule-associated protein tau Proteins 0.000 description 1
- 101000979249 Homo sapiens Neuromodulin Proteins 0.000 description 1
- 101000687438 Homo sapiens Prolactin Proteins 0.000 description 1
- 101000611183 Homo sapiens Tumor necrosis factor Proteins 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 102100027050 Inorganic pyrophosphatase Human genes 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 241000222722 Leishmania <genus> Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 102000019010 Methylmalonyl-CoA Mutase Human genes 0.000 description 1
- 108010051862 Methylmalonyl-CoA mutase Proteins 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- 102100023206 Neuromodulin Human genes 0.000 description 1
- 241000208125 Nicotiana Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 1
- 241000713112 Orthobunyavirus Species 0.000 description 1
- 241000150452 Orthohantavirus Species 0.000 description 1
- 241001527110 Plautia Species 0.000 description 1
- 241000908128 Plautia stali intestine virus Species 0.000 description 1
- 108091036407 Polyadenylation Proteins 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 238000012181 QIAquick gel extraction kit Methods 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 241001352312 Salivirus Species 0.000 description 1
- 101000629318 Severe acute respiratory syndrome coronavirus 2 Spike glycoprotein Proteins 0.000 description 1
- 241000710960 Sindbis virus Species 0.000 description 1
- 241000736128 Solenopsis invicta Species 0.000 description 1
- 241001163129 Solenopsis invicta virus-1 Species 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 208000013868 Taylor syndrome Diseases 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 241001480150 Triatoma virus Species 0.000 description 1
- 241001282563 Triatovirus Species 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 241000714211 Turnip crinkle virus Species 0.000 description 1
- 241000710155 Turnip yellow mosaic virus Species 0.000 description 1
- 241000710959 Venezuelan equine encephalitis virus Species 0.000 description 1
- 241000726445 Viroids Species 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 125000003545 alkoxy group Chemical group 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000012504 chromatography matrix Substances 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 206010014599 encephalitis Diseases 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000002073 fluorescence micrograph Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 150000002367 halogens Chemical class 0.000 description 1
- 208000029570 hepatitis D virus infection Diseases 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 102000047486 human GAPDH Human genes 0.000 description 1
- 102000057063 human MAPT Human genes 0.000 description 1
- 102000057041 human TNF Human genes 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 229940092110 macugen Drugs 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical compound CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 239000000101 novel biomarker Substances 0.000 description 1
- 102000044158 nucleic acid binding protein Human genes 0.000 description 1
- 108700020942 nucleic acid binding protein Proteins 0.000 description 1
- 239000012038 nucleophile Substances 0.000 description 1
- 230000000269 nucleophilic effect Effects 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 229940005014 pegaptanib sodium Drugs 0.000 description 1
- QGVYYLZOAMMKAH-UHFFFAOYSA-N pegnivacogin Chemical compound COCCOC(=O)NCCCCC(NC(=O)OCCOC)C(=O)NCCCCCCOP(=O)(O)O QGVYYLZOAMMKAH-UHFFFAOYSA-N 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- QQXQGKSPIMGUIZ-AEZJAUAXSA-N queuosine Chemical compound C1=2C(=O)NC(N)=NC=2N([C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)C=C1CN[C@H]1C=C[C@H](O)[C@@H]1O QQXQGKSPIMGUIZ-AEZJAUAXSA-N 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 210000001324 spliceosome Anatomy 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000011285 therapeutic regimen Methods 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/64—General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/106—Plasmid DNA for vertebrates
- C12N2800/107—Plasmid DNA for vertebrates for mammalian
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/108—Plasmid DNA episomal vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/50—Vectors for producing vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2820/00—Vectors comprising a special origin of replication system
- C12N2820/60—Vectors comprising a special origin of replication system from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/60—Vector systems having a special element relevant for transcription from viruses
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Cell Biology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本公开总体上涉及用于制备环状RNA的新型DNA构建体或RNA转录物,以及生产环状RNA的新方法。
Description
发明领域
本公开总体上涉及用于制备环状RNA的新型DNA构建体或RNA转录物,以及生产环状RNA的新方法。
背景技术
自然界中发现的环状RNA(或circRNA)是长的非编码RNA分子,其形成共价闭合的连续环而没有5’至3’极性。环状RNA最初被报道为由共价闭合的环状RNA分子组成的类病毒,对特定的高等植物具有致病性(Liu L,Wang J,Khanabdali R等人(2017)《环状RNA:分离、表征及其在疾病中的潜在作用(Circular RNAs:isolation,characterization andtheir potential role in diseases)》《RNA生物学(RNA Biol)》14(12):1715-1721)。此后描述了许多物种中的其它类型的环状RNA,包括丁型肝炎病毒(HDV)的环状单链RNA基因组,或作为古细菌中tRNA和rRNA成熟的产物或中间体的环状RNA。环状RNA通常通过上游外显子的5’位点与该外显子或下游外显子的3’位点共价结合而形成。已经描述了两种不同的环状RNA生物发生模型,即套索(lariat)或外显子跳跃模型和直接反向剪接模型。在套索模型中,在反向剪接之前发生标准剪接,而在直接反向剪接模型中,首先生成环状RNA(Jeck WR,Sorrentino JA,Wang K等人(2013)《环状RNA丰富、保守且与ALU重复序列缔合(CircularRNAs are abundant,conserved,and associated with ALU repeats)》《RNA》19:141-157;Barrett SP,Wang PL,Salzman J(2015)《环状RNA生物发生可通过含外显子的套索前体进行(Circular RNA biogenesis can proceed through an exon-containing lariatprecursor)》《生命科学在线(Elife)》4:e07540)。
环状RNA通过调节微RNA来调控基因表达,并作为潜在的生物标志物发挥作用。环状RNA可以在体内翻译,将它们的表达与疾病联系起来(Li J,Yang J,Zhou P等人(2015a)《环状RNA在癌症中的作用:对起源、性质、功能和意义的新见解(Circular RNAs incancer:novel insights into origins,properties,functions and implications)》《美国癌症研究杂志(Am J Cancer Res)》5(2):472;Li P,Chen S,Chen H等人(2015b)《环状RNA作为一种新型生物标志物在胃癌筛查中的应用(Using circular RNA as a noveltype of biomarker in the screening of gastric cancer)》《临床化学学报(Clin ChimActa)》444:132-136;Greene J,Baird AM,Brady L等人(2017)《环状RNA:生物发生、功能和在人类疾病中的作用(Circular RNAs:biogenesis,function and role in humandiseases)》《分子生物科学前沿(Front Mol Biosci)》4:38)。环状RNA对RNA核酸外切酶具有抗性,并且可以转化为线性RNA(通过微RNA),然后作为内源性RNA的竞争者。环状RNA作为临床诊断标志物或治疗分子在疾病的预防和治疗方面具有良好的应用前景。迄今为止,由于表达水平低,很少有关于环状RNA的报道发表。最初这些分子被认为是选择性剪接的副产物,并被指定为遗传事故或实验错误(Liu L,Wang J,Khanabdali R等人(2017)《环状RNA:分离、表征及其在疾病中的潜在作用》《RNA生物学》14(12):1715-1721)。
环状RNA在体内的广泛存在以及对其结构和功能特性的研究已经引起了对允许在体外有效制备环状RNA的方法的需求。据报道,有几种方法可用于环状RNA的体外产生,包括化学和酶方法,以及使用具有置换内含子和外显子(PIE)策略的修饰的自剪接内含子(I型和II型)的方法。
这些工程化的环状RNA可以携带IRES(内部核糖体进入位点)以有效地指导任何下游编码序列在体内的表达,例如荧光素酶和SARS-CoV-2刺突蛋白的RBD的编码序列(R.A.Wesselhoeft,P.S.Kowalski,D.G.Anderson,(2018)《工程化环状RNA用于真核细胞中的有效和稳定翻译(Engineering circular RNA for potent and stable translationin eukaryotic cells)》《自然通讯(Nat Commun)》9,2629;和Qu L.等人(2022)《抗SARS-CoV-2和新出现变体的环状RNA疫苗(Circular RNA Vaccines against SARS-CoV-2andEmerging Variants)》《细胞(Cell)》185(10):1728-1744。)因此,环状RNA正成为mRNA作为治疗剂和疫苗的替代品。
环状RNA作为治疗剂或疫苗相比线性mRNA具备若干优势。它在体内更稳定,并且可以用较低的剂量达到所需的表达水平。它具有低免疫原性,并且在治疗中引起较少的毒性或较少的副作用。对于体外产生,环状RNA的生产不需要昂贵的加帽步骤或加尾步骤,而这些步骤在产生mRNA产物中通常是需要的。
仍然需要允许在体外高效和经济地制备环状RNA的方法,特别是在工业规模上,以促进在疾病诊断和治疗中的研究与应用。
发明内容
在整个本公开中,冠词“一个(a)”、“一种(an)”和“该(the)”在本文中用于指该冠词的语法对象中的一个或多于一个(即,至少一个)。例如,“一种方法”意指一种方法或多于一种方法。
本公开提供了体外产生环状RNA的新方法,以及允许通过所述方法产生环状RNA的新型DNA构建体或RNA转录物。本公开还提供了包含能够产生环状RNA的DNA构建体或RNA转录物,或通过所述方法产生的环状RNA的组合物和试剂盒。
在一个方面,本公开提供了一种用于制备环状RNA的DNA构建体,所述DNA构建体包含与编码能够产生环状RNA的RNA转录物的序列可操作地连接的RNA聚合酶启动子,所述RNA转录物包含彼此可操作地连接并按以下顺序排列的以下元件:
a)第一环化元件,
b)靶序列,和
c)第二环化元件,
其中所述RNA转录物能够形成包含所述靶序列的所述环状RNA;以及
其中所述RNA转录物进一步包含至少一个在所述环状RNA中不存在的纯化片段。
在某些实施方案中,RNA聚合酶启动子是衍生自T7病毒、T6病毒、SP6病毒、T3病毒或T4病毒的RNA聚合酶启动子。
在一个方面,本公开提供了一种体外转录的RNA转录物,所述RNA转录物包含彼此可操作地连接并按以下顺序排列的以下元件:
a)第一环化元件,
b)靶序列,和
c)第二环化元件,
其中所述RNA转录物能够形成包含所述靶序列的环状RNA;以及
其中所述RNA转录物进一步包含至少一个在所述环状RNA中不存在的纯化片段。
在某些实施方案中,至少一个纯化片段与第一环化元件缔合,或与第二环化元件缔合。
在某些实施方案中,RNA转录物具有分别与第一环化元件和第二环化元件缔合的两个纯化片段。
在某些实施方案中,至少一个纯化片段:a)位于第一环化元件的上游(即5’纯化片段),b)位于第二环化元件的下游(即3’纯化片段),c)或a)和b)的任何组合。
在某些实施方案中,至少一个纯化片段:a)附着于第一环化元件的5’端(即5’纯化片段),或b)附着于第二环化元件的3’端(即3’纯化片段),或a)和b)的任何组合。
在某些实施方案中,本文提供的RNA转录物具有5’纯化片段和3’纯化片段两者,并且其中所述5’纯化片段和所述3’纯化片段在核苷酸序列上相同或不同。
在某些实施方案中,至少一个纯化片段中的每一个在15至20个核苷酸的给定长度上与环状RNA具有不超过90%(或不超过80%、不超过70%、不超过60%、不超过50%)的序列同一性。
在某些实施方案中,纯化片段包含poly(A)短序列(tract)、poly(T)短序列、poly(U)短序列、poly(C)短序列、poly(G)短序列、poly(AC)短序列、poly(AG)短序列、poly(CT)短序列、poly(CU)短序列、poly(AT)短序列或poly(AU)短序列。在某些实施方案中,纯化片段包含poly(A)短序列、poly(U)短序列、poly(C)短序列、poly(G)短序列、poly(AC)短序列、poly(AG)短序列、poly(CU)短序列或poly(AU)短序列。
在某些实施方案中,纯化片段(例如poly(A)短序列)的长度范围为15至200个核苷酸,任选地15至150个核苷酸。
在某些实施方案中,第一环化元件和第二环化元件可以衍生自自剪接系统。
在某些实施方案中,第一环化元件包含自剪接元件的3’部分,所述自剪接元件的3’部分包含3’剪接位点,并且第二环化元件包含自剪接元件的5’部分,所述自剪接元件的5’部分包含5’剪接位点。
在某些实施方案中,自剪接元件是I型内含子、II型内含子或发夹核酶。
在某些实施方案中,I型内含子衍生自噬菌体T4胸苷酸合酶(td)基因、蓝细菌鱼腥藻(Cyanobacterium Anabaena sp.)pre-tRNA-Leu基因或四膜虫基因。
在某些实施方案中,II型内含子衍生自乳酸乳球菌(L.lactis)Ll.LtrB基因,或衍生自酵母。
在某些实施方案中,发夹核酶衍生自细菌、真核生物或植物病毒RNA卫星(例如烟草环斑病毒(tobacco ringspot virus,TRSV)卫星RNA、菊苣黄斑驳病毒(chicory yellowmottle virus,sCYMV)卫星RNA,或拟南芥花叶病毒(arabis mosaic virus,sARMV)卫星RNA)。
在某些实施方案中,靶序列包含靶蛋白编码区。
在某些实施方案中,靶蛋白是治疗性蛋白(例如抗体、细胞因子、肽激素等)、预防性蛋白(例如蛋白疫苗等)、核酸酶(例如Cas蛋白、重组酶等)或受体(例如嵌合抗原受体等)。
在某些实施方案中,靶序列进一步包含与靶蛋白编码区可操作地连接的内部核糖体进入位点(IRES)。在某些实施方案中,IRES可操作地连接在靶蛋白编码区的上游或下游。
在某些实施方案中,IRES选自桃拉综合征病毒(Taura syndrome virus)、吸血猎椿病毒(Triatoma virus)、泰勒氏脑脊髓炎病毒(Theiler‘s encephalomyelitis virus)、猿猴病毒(simian Virus)40、红火蚁病毒(Solenopsis invicta virus)1、禾谷缢管蚜病毒(Rhopalosiphum padi virus)、网状内皮增生症病毒(Reticuloendotheliosis virus)、人脊髓灰质炎病毒(human poliovirus)1、斯氏珀蝽肠病毒(Plautia staliintestinevirus)、克什米尔蜂病毒(Kashmir bee virus)、人鼻病毒2、琉璃叶蝉病毒(Homalodiscacoagulata virus)1、人类免疫缺陷病毒1型、琉璃叶蝉病毒1、虱P病毒(Himetobi Pvirus)、丙型肝炎病毒、甲型肝炎病毒、GB型肝炎病毒、口蹄疫病毒、人肠道病毒71、马鼻炎病毒(Equine rhinitis virus)、茶尺蠖样病毒(Ectropis obliqua picoma-like virus)、脑心肌炎病毒(EMCV)、果蝇C病毒(Drosophila C Virus)、十字花科烟草花叶病毒(Crucifer tobamo virus)、蟋蟀麻痹病毒(Cricket paralysis virus)、牛病毒性腹泻病毒(Bovine viral diarrhea virus)1、黑蜂王台病毒(Black Queen Cell Virus)、蚜虫致死性麻痹病毒(Aphid lethal paralysis virus)、禽脑脊髓炎病毒(Avianencephalomyelitis virus)、急性蜂麻痹病毒(Acute bee paralysis virus)、木槿褪绿环斑病毒(Hibiscus chlorotic ringspot virus)、经典猪瘟病毒(Classical swine fevervirus)、人FGF2、人SFTPA1、人AML1/RUNX1、果蝇触角足(Drosophila antennapedia)、人AQP4、人AT1R、人BAG-1、人BCL2、人BiP、人c-IAP1、人c-myc、人eIF4G、小鼠NDST4L、人LEF1、小鼠HIF1α、人n.myc、小鼠Gtx、人p27kip1、人PDGF2/c-sis、人p53、人Pim-1、小鼠Rbm3、果蝇reaper、犬科Scamper、果蝇Ubx、唾液病毒(Salivirus)、科萨病毒(Cosavirus)、双埃柯病毒(Parechovirus)、人UNR、小鼠UtrA、人VEGF-A、人XIAP、果蝇无毛(Drosophila hairless)、酿酒酵母(S.cerevisiae)TFIID、酿酒酵母YAP1、人c-src、人FGF-1、猿猴小核糖核酸病毒(Simian picomavirus)、芜菁皱缩病毒(Turnip crinkle virus)、eIF4G适体、柯萨奇病毒(Coxsackievirus)B3(CVB3)或柯萨奇病毒A(CVB1/2)的IRES序列。
在某些实施方案中,靶序列进一步包含与靶蛋白编码区可操作地连接的5’非翻译区(UTR)和/或3’UTR。
在某些实施方案中,靶序列包含生物活性RNA或生物活性RNA的前体。
在某些实施方案中,生物活性RNA包含短发夹RNA、转运RNA(tRNA)、短干扰RNA、微RNA(microRNA)或向导RNA。
在某些实施方案中,RNA转录物进一步包含至少一个同源臂。在某些实施方案中,同源臂位于第一环化元件的上游(即5’同源臂)和/或第二环化元件的下游(即3’同源臂)。在某些实施方案中,同源臂位于自剪接元件的3’部分的上游(即5’同源臂)和/或自剪接元件的5’部分的下游(即3’同源臂)。
在某些实施方案中,其中同源臂包含至少一个衍生自ALU重复序列的ALU元件。
在某些实施方案中,同源臂:a)插入5’纯化片段和第一环化元件之间和/或插入3’纯化片段和第二环化元件之间;或b)位于5’纯化片段的上游和/或3’纯化片段的下游。
在某些实施方案中,RNA转录物进一步包含至少一个间隔区,任选地该间隔区位于第一环化元件(例如自剪接元件的3’部分)和靶序列之间,和/或位于靶序列和第二环化元件(例如自剪接元件的5’部分)之间。
在某些实施方案中,RNA转录物进一步包含至少一个间隔区。在某些实施方案中,间隔区位于第一环化元件(例如自剪接元件的3’部分)和靶序列之间,和/或位于靶序列和第二环化元件(例如自剪接元件的5’部分)之间。在某些实施方案中,间隔区位于第一环化元件(例如自剪接元件的3’部分)和IRES序列之间,和/或位于靶序列和第二环化元件(例如自剪接元件的5’部分)之间。在某些实施方案中,间隔区位于第一环化元件(例如自剪接元件的3’部分)和靶蛋白编码区之间,和/或位于靶蛋白编码区和第二环化元件(例如自剪接元件的5’部分)之间。在某些实施方案中,靶序列包含位于靶序列侧翼的两个互补间隔区序列。
在一个方面,本公开提供了一种DNA构建体,其包含可操作地彼此连接并以5’至3’顺序排列的以下元件:
a)第一纯化片段,任选地第一poly(A)短序列,和
b)多克隆位点,其包含或基本上由一个或多个用于插入靶序列的克隆位点组成。
在某些实施方案中,DNA构建体进一步包含位于多克隆位点下游的第二纯化片段。
在某些实施方案中,DNA构建体进一步包含位于第一纯化片段和多克隆位点之间的第一环化元件,和/或位于多克隆位点下游的第二环化元件。在某些实施方案中,第二环化元件位于多克隆位点和第二纯化片段之间。
在某些实施方案中,DNA构建体进一步包含位于第一纯化片段上游的RNA聚合酶启动子。
在一个方面,本公开提供了一种DNA构建体,其包含可操作地彼此连接并按以下顺序排列的以下元件:
a)RNA聚合酶启动子,
b)第一环化元件,
c)多克隆位点,和
d)第二环化元件,
其中DNA构建体进一步包含至少一个位于所述RNA聚合酶启动子下游的纯化片段。
在某些实施方案中,多个纯化片段中的一个位于第一环化元件的上游和/或第二环化元件的下游。
在一个方面,本公开提供了一种产生本文提供的RNA转录物的方法,该方法包括从本文提供的DNA构建体转录,从而获得本文提供的RNA转录物。
在一个方面,本公开提供了一种产生本文提供的RNA转录物的方法,该方法包括:
a)提供前体RNA,其与本文提供的RNA转录物的不同之处在于缺少纯化片段,以及
b)将所述纯化片段添加到所述前体RNA中,从而获得本文提供的RNA转录物。
在某些实施方案中,前体RNA与本文提供的RNA转录物的不同之处仅在于缺少纯化片段。
在某些实施方案中,纯化片段被添加到:a)位于第一环化元件上游的位置,b)位于第二环化元件下游的位置,c)或a)和b)的任何组合。
在某些实施方案中,纯化片段:a)附着于第一环化元件的5’端,或b)附着于第二环化元件的3’端,c)或a)和b)的任何组合。
在一个方面,本公开提供了一种产生环状RNA的方法,该方法包括:
a)提供本文提供的RNA转录物,以及
b)使所述RNA转录物自环化以形成环状RNA。
在某些实施方案中,步骤a)中的RNA转录物已经使用捕获剂富集,所述捕获剂特异性结合存在于所述RNA转录物中的纯化片段。
在某些实施方案中,该方法进一步包括通过捕获剂从步骤b)获得的产物中纯化环状RNA,其中所述捕获剂特异性结合RNA转录物中的纯化片段,以及任选地副产物中的但不存在于环状RNA中的纯化片段。
在某些实施方案中,捕获剂包含能够在严格条件下与纯化片段杂交的核酸片段。在某些实施方案中,捕获剂包含与纯化片段的核苷酸序列至少80%、85%、90%、95%或100%互补的核酸片段。在某些实施方案中,捕获剂包含能够与本文提供的纯化片段结合的蛋白质、肽、多糖或小分子。
在某些实施方案中,捕获剂是固定的。
在某些实施方案中,步骤b)中的RNA转录物在溶液中经历自环化或在固定有捕获剂的固体基质上经历自环化。
在某些实施方案中,纯化片段包含poly(A)短序列,并且捕获剂包含脱氧胸苷寡核苷酸(oligo(dT))。
在某些实施方案中,步骤a)中的RNA转录物由本文提供的DNA构建体转录。
在某些实施方案中,该方法在步骤a)之前进一步包括由本文提供的DNA构建体转录以产生本文提供的RNA转录物。
在某些实施方案中,步骤a)中的RNA转录物通过本文提供的方法获得。
在一个方面,本公开提供了一种使用本文提供的方法产生的环状RNA的组合物。
在一个方面,本公开提供了一种包含本文提供的DNA构建体或本文提供的RNA转录物的组合物。
在一个方面,本公开提供了一种包含本文提供的DNA构建体的试剂盒。
在一个方面,本公开提供了一种用于产生本文提供的RNA转录物的试剂盒,其包含用于将纯化片段添加到RNA转录物的前体中的试剂。
在某些实施方案中,试剂盒进一步包含捕获剂,所述捕获剂特异性结合存在于RNA转录物中但不存在于环状RNA中的纯化片段。
在某些实施方案中,纯化片段包含poly(A)短序列。
在某些实施方案中,捕获剂包含oligo(dT)。
附图说明
图1示出了示例性DNA构建体的示意图和示出从示例性DNA构建体产生环状RNA的示例性方法。所示的DNA构建体是环状质粒DNA,其包含质粒骨架、环状RNA区域、RNA聚合酶启动子的位点(如所示的T7)、一个或两个纯化片段(PF)和限制性酶的切割位点(理想地,如图所示,接近或位于PF的3’端)。环状RNA产生的过程包括质粒DNA的线性化、体外转录以生成RNA前体、环化以形成环状RNA,以及通过亲和基质除去所有携带PF的RNA片段以进行纯化。
图2示出了基于不同元件排列和纯化片段位置的四类示例性RNA前体。本文所用的第一环化元件是自剪接元件的3’部分,命名为3’内含子,其包含常规PIE策略的3’内含子和外显子2的部分。第二环化元件是自剪接元件的5’部分,命名为5’内含子,其包含常规PIE策略的5’内含子和外显子1的部分。纯化片段被命名为PF。不含纯化片段的RNA转录物被命名为“Ctrl”。I类示出了包含两个环化元件和一个或两个纯化片段的RNA前体,所述一个或两个纯化片段位于第一环化元件的5’端(命名为I-5PF)、位于第二环化元件的3’端(命名为I-3PF)或位于两端(命名为I-5PF+3PF)。II类示出了包含两个环化元件、两个间隔区和一个或两个纯化片段的RNA前体,所述一个或两个纯化片段位于第一环化元件的5’端(命名为II-5PF)、位于第二环化元件的3’端(命名为II-3PF)或位于两端(命名为II-5PF+3PF)。III类示出了包含两个环化元件、两个间隔区、两个同源臂和一个或两个纯化片段的RNA前体,所述一个或两个纯化片段位于5’同源臂的5’端(命名为III-5PF)、3’同源臂的3’端(命名为III-3PF)或两端(命名为III-5PF+3PF)。IV类示出了包含两个环化元件、两个间隔区、两个同源臂和一个或两个纯化片段的RNA前体,所述一个或两个纯化片段位于5’同源臂和第一环化元件之间(命名为IV-5PF)、位于第二环化元件和3’同源臂之间(命名为IV-3PF)或位于两个位置(命名为IV-5PF+3PF)。
图3A示出了由本文提供的DNA构建体转录的线性RNA前体。在此,纯化片段是poly-A短序列,并且元件如图2中的III类排列。Ctrl:不包含任何纯化片段的RNA转录物,作为阴性对照。5A:在RNA转录物的5’端包含poly-A短序列的RNA转录物。3A:在RNA转录物的3’端包含poly-A短序列的RNA转录物。53A:包含两个poly-A短序列的RNA转录物,每个poly-A短序列位于RNA转录物的一端。所示的“3’内含子”表示第一环化元件,其包含常规PIE策略的3’内含子和外显子2的序列。所示的“5’内含子”表示第二环化元件,其包含常规PIE策略的5’内含子和外显子1的序列。
图3B示出了环状RNA的产生、纯化和表征的实验工作流程。
图4示出了在琼脂糖凝胶上对RNA产物的分析。制备如图3A中描述的四种构建体的质粒DNA并将其线性化。在体外转录和环化后,将RNA产物加载到Oligo-dT磁珠或含有Oligo-dT树脂的柱上。按顺序步骤收集级分,并在琼脂糖凝胶上和通过毛细管电泳进行分析(图5)。输入:体外转录和环化后的RNA产物,其含有环状RNA和含poly-A的线性RNA前体两者,以及所有副产物。FT:流过级分,其含有环状RNA。E:洗脱级分,其含有未加工的含poly-A的线性RNA前体和加工后的含poly-A的RNA片段。W:来自结合与洗脱之间的洗涤步骤的级分,该步骤用于洗掉非特异性结合的RNA产物。P:指示RNA前体在琼脂糖凝胶上迁移的位置。R:指示环状RNA产物在琼脂糖凝胶上迁移的位置。
图5A至5E示出了通过毛细管电泳对RNA产物的分析。还通过毛细管电泳(Agilent5200片段分析仪)分析了图4中描述的RNA产物:Ctrl(图5A)、5A(图5B)、3A(图5C)和53A(图5D)。“输入”代表体外转录和环化后的RNA产物,其被加载用于Oligo-dT纯化。“FT”(流过物)代表流过级分。计算circRNA的环化效率和纯度并总结在图5E中。
图6示出了纯化的GFP circRNA转染HEK 293T细胞的结果。对照样品和eGFPcircRNA样品分别用脂质体(lipofectamine)试剂转染。在明视野和GFP设置下在荧光显微镜上获取图像。
具体实施方式
本公开的以下描述仅旨在说明本公开的各种实施方案。因此,所讨论的具体修改不应被解释为对本公开范围的限制。对于本领域技术人员显而易见的是,在不脱离本公开的范围的情况下,可以进行各种等同物、改变和修饰,并且应当理解,这些等同实施方案包括在本文中。本文引用的所有参考文献,包括出版物、专利和专利申请,通过引用整体并入本文。
本公开提供了可用于制备环状RNA的新型组合物和方法。通常,环状RNA的体外产生经历两个步骤,一个是体外转录以产生线性RNA前体,另一个是从前体形成环状RNA的环化步骤。环化通常不是100%有效的,会留下一定量的前体RNA和中间体需要从环化产物中除去。由于前体和环状RNA在大小和物理性质上的接近,难以用常规的层析方法(如离子交换或疏水相互作用)实现二者的完全分离。本领域已知的目前用于环状RNA的纯化方法使用HPLC SEC柱,但该方法不能扩展到工业规模,而且价格高昂。本公开公开了一系列含有一个或多个纯化片段(PF)的设计的DNA构建体和RNA转录物。这些纯化片段在环化后不存在于环状RNA中,而且发现其在促进线性RNA转录物和环化中间体的去除方面出乎意料地有效,从而以方便和可规模化扩展的方式实现了环状RNA产物的纯化。纯化步骤可以在实验室和生产场所使用的普通色谱设备中进行。可以容易地达到所需的纯度(例如≥80%)。事实证明,这对于需要稳健和可规模化扩展的纯化过程的治疗剂和疫苗的制造是特别理想的。
用于环状RNA制备的DNA构建体和RNA转录物
本公开提供了一种用于制备环状RNA的DNA构建体,该DNA构建体包含与编码能够产生环状RNA的RNA转录物的序列可操作地连接的RNA聚合酶启动子,所述RNA转录物包含彼此可操作地连接并按以下顺序排列的以下元件:
a)第一环化元件,
b)靶序列,和
c)第二环化元件,
其中RNA转录物能够形成包含靶序列的环状RNA;并且其中RNA转录物进一步包含至少一个在环状RNA中不存在的纯化片段。
本公开还提供了一种体外转录的RNA转录物,所述RNA转录物包含彼此可操作地连接并按以下顺序排列的以下元件:
a)第一环化元件,
b)靶序列,和
c)第二环化元件,
其中RNA转录物能够形成包含靶序列的环状RNA;并且其中RNA转录物进一步包含至少一个在环状RNA中不存在的纯化片段。
如本文所用,术语“circRNA”或“环状RNA”可互换使用,是指通过共价键形成环状结构的多核糖核苷酸。
如本文所用,术语“DNA构建体”是指可插入或已经插入外源DNA片段的一段DNA。DNA构建体具有任何长度和任何序列,并且可以是线性的或环状的。DNA构建体可以合成(例如,使用PCR),或者可以衍生自病毒、质粒或高等生物的细胞。该术语包括线性DNA片段(例如,PCR产物、线性化质粒片段)、质粒载体、病毒载体、粘粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)等。DNA构建体可以包含例如复制起点、选择性标志物或报告基因(如抗生素抗性或GFP)、RNA聚合酶启动子和/或RNA聚合酶终止子。DNA构建体可以是PCR扩增的线性片段,其含有通过体外转录制备本文提供的RNA转录物的必需元件。
术语“核酸”或“核苷酸”包括能够以序列特异性方式与天然存在的核酸杂交的天然存在的物种以及其任何类似物、变体和任何模拟物,例如,能够与两个核酸杂交使得可以在两个杂交的核酸之间发生连接,或能够用作特定核苷酸序列复制的模板。天然存在的核苷酸的类似物、变体和任何模拟物可以在碱基、糖和/或磷酸盐的化学结构中具有修饰。碱基修饰的实例包括但不限于5’-位嘧啶修饰、8’-位嘌呤修饰、胞嘧啶环外胺修饰和5-溴-尿嘧啶取代。核苷酸类似物的实例包括5-甲氧基尿苷、假尿苷、1-甲基假尿苷和6-甲基腺苷。糖的修饰的实例包括但不限于糖修饰的核糖核苷酸,其中2’-OH被诸如H、烷氧基、烷基、卤素、SH、SR、NH2、NHR、NR2或CN的基团替代,其中R是烷基部分。磷酸二酯键的修饰的实例包括但不限于甲基膦酸酯、硫代磷酸酯和肽键。核苷酸还意在包括具有以下的核苷酸:诸如肌苷、辫苷(queuosine)、黄嘌呤(xanthine)等碱基;诸如2’-甲基核糖等糖。在某些实施方案中,核酸分子可以是DNA或RNA。
术语“RNA”或“核糖核酸”包括具有选自由腺嘌呤(A)、尿嘧啶(U)、胞嘧啶(C)或鸟嘌呤(G)组成的组的碱基的天然RNA种类,以及能够与天然RNA进行碱基配对的任何非天然RNA或其类似物、变体和任何模拟物。
术语“DNA”或“脱氧核糖核酸”包括具有选自由腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)或鸟嘌呤(G)组成的组的碱基的天然DNA种类,以及能够与天然DNA进行碱基配对的任何非天然DNA或其类似物、变体和任何模拟物。
关于核苷酸序列(或氨基酸序列)的“序列同一性百分比(%)”被定义为在比对序列并在必要时引入空位以实现最大对应之后,候选序列中与参考序列中的核苷酸(或氨基酸)残基相同的核苷酸(或氨基酸)残基的百分比。用于确定核苷酸(或氨基酸)序列同一性百分比的比对可以例如使用诸如BLASTN、BLASTP(可在美国国家生物技术信息中心(NCBI)的网站上获得,另见Altschul S.F.等人,《分子生物学杂志(J.Mol.Biol.)》,215:403-410(1990);Stephen F.等人,《核酸研究(Nucleic Acids Res.)》,25:3389-3402(1997))、ClustalW2(可在欧洲生物信息学研究所(European Bioinformatics Institute)的网站上获得,另见Higgins D.G.等人,《酶学方法(Methods in Enzymology)》,266:383-402(1996);Larkin M.A.等人,《生物资讯学(Bioinformatics)》(英国牛津),23(21):2947-8(2007))和ALIGN或MegAlign(DNASTAR)软件等公众可获得的工具实现。本领域技术人员可以使用由工具提供的默认参数,或者可以定制适合于比对的参数,例如通过选择合适的算法。
术语“互补的”或“互补性”是指核酸通过传统的沃森-克里克(Watson-Crick)或其它非传统类型与另一核酸序列形成氢键的能力。互补性百分比表示核酸分子中可与另一核酸序列形成氢键的残基的百分比(例如,5、6、7、8、9、10/10为50%、60%、70%、80%、90%和100%互补)。可以使用基本的局部比对搜索工具(BLAST程序)(Altschul(1990)《分子生物学杂志》215,403-410;Zhang和Madden(1997)《基因组研究(Genome Res.)》7,649-656)常规地确定互补性百分比。
术语“杂交(hybridizing)”或“杂交(hybridize)”是指两个不同分子内或两个片段内基本上互补或互补的核酸序列的配对。配对可以通过任何方法实现,其中核酸序列通过碱基配对与基本上或完全互补的序列结合以形成杂交复合物。
本文所用的“严格条件”是指核苷酸序列与其靶核苷酸序列杂交但不会与其它非互补序列杂交的条件。严格条件是序列依赖性的,并且在不同的情况下是不同的。例如,对于特异性杂交,较长的片段可能比较短的片段需要更高的杂交温度。由于其它可能影响杂交严格性的因素,包括互补链的碱基组成和长度、有机溶剂的存在和碱基错配的程度,参数的组合比任何一个参数单独的绝对量度更重要。通常,严格条件被选择为比特定序列在限定的离子强度和pH下的熔解温度(Tm)低约5℃。因此,选择与靶充分互补的寡核苷酸,即充分良好杂交并具有足够特异性的寡核苷酸,以产生所需的效果,同时努力避免显著的脱靶效应,即不直接与预期靶以外的靶结合。
如本文所用,关于核苷酸序列的术语“下游”意指朝向核苷酸序列的3’端。
如本文所用,关于核苷酸序列的术语“上游”意指朝向核苷酸序列的5’端。
如本文所用,术语“可操作地连接”是指元件的布置,其中如此描述的组件被配置以执行它们通常的功能。因此,例如,当给定的启动子与编码DNA序列可操作地连接时,该启动子能够在诸如RNA聚合酶等适当酶的存在下影响编码DNA序列的表达。表达意指包括环状RNA、编码环状RNA的重组核酸或来自DNA或RNA模板的mRNA的转录中的任一种或多种的转录,并且可进一步包括来自mRNA模板或包含IRES序列的环状RNA的蛋白质的翻译。启动子不需要与编码序列邻接,只要它能指导其表达。因此,例如,插入的未翻译但已转录的序列可存在于启动子序列和编码序列之间,并且启动子序列仍可被认为与编码序列“可操作地连接”。
如本文所用,术语“RNA聚合酶启动子”是指能够募集RNA聚合酶(例如RNA聚合酶II)并启动DNA转录成RNA的DNA调控区。RNA聚合酶启动子可以在其3’末端具有转录起始位点,其中转录从该位点开始。启动子序列包括具有在高于背景的可检测水平上启动转录所必需的元件的最小数目的碱基。通常,RNA聚合酶启动子序列具有负责RNA聚合酶结合的蛋白质结合区。在某些实施方案中,RNA聚合酶启动子可以选自但不限于衍生自T7病毒、T6病毒、SP6病毒、T3病毒或T4病毒的RNA聚合酶启动子。
在某些实施方案中,DNA构建体进一步包含RNA聚合酶终止子。如本文所用,“RNA聚合酶终止子”是指包含至少一个离散终止子序列的元件,其中RNA聚合酶的转录在此终止。终止子引起RNA的释放和转录复合物的解离。在某些实施方案中,RNA聚合酶终止子可以选自但不限于衍生自T7病毒、T6病毒、SP6病毒、T3病毒或T4病毒的RNA聚合酶终止子。
本文所用的“RNA转录物”是指从给定DNA构建体转录的线性核酸片段。在一个实施方案中,编码RNA转录物的序列包含在DNA构建体中并位于RNA聚合酶启动子的下游。例如,本文提供的RNA转录物可由本文提供的DNA构建体转录。在另一实施方案中,RNA转录物在体外提供或合成。
本文提供的RNA转录物能够产生环状RNA。本文提供的RNA转录物包含彼此可操作地连接并按以下顺序(例如5’至3’)排列的以下元件:a)第一环化元件,b)靶序列,和c)第二环化元件,并且进一步包含至少一个在环状RNA中不存在的纯化片段,并且其中RNA转录物能够形成包含靶序列的环状RNA。
1.环化元件
如本文所用,术语“环化元件”是指至少一个核酸片段,其以促进线性RNA自环化形成环状RNA的方式与线性RNA可操作地连接。由本文提供的RNA转录物产生的环状RNA包含靶序列。在某些实施方案中,RNA转录物中的环化元件包含或者是RNA片段。
在某些实施方案中,第一环化元件位于靶序列的上游,和/或第二环化元件位于靶序列的下游。在某些实施方案中,RNA转录物包含分别位于靶序列上游和下游的至少一对环化元件。
在某些实施方案中,环化元件衍生自自剪接系统。在某些实施方案中,环化元件可以衍生自I型内含子自剪接系统、II型内含子自剪接系统或发夹核酶。
I型内含子自剪接系统涉及主要位于真核微生物的基因组核糖体RNA区域内的I型内含子。I型内含子的特征在于保守序列和结构特征的线性阵列(linear array),并且通过两次连续的酯交换(transesterification)进行切除。I型内含子募集外部鸟苷作为亲核试剂来启动剪接。在该过程期间,鸟苷核苷酸的3’羟基在5’外显子-内含子接合处(5’剪接位点)参与酯交换反应,从而导致5’内含子部分的切除,留下在5’外显子的端部具有游离3’-羟基的中间体。游离的羟基在3’外显子-内含子接合处(3’剪接位点)参与第二次酯交换,从而导致插入区域的环化和3’内含子部分的切除。详见Wesselhoeft R.A等人,《工程化环状RNA用于真核细胞中的有效和稳定翻译》,《自然通讯(Nature Communications)》,(2018)9:2629。
II型内含子自剪接系统是可移动的遗传元件,其通过使用类似于经典剪接体剪接反应的酯交换反应自动催化从前体RNA的自身剪接。已经在细菌和真菌、植物、原生生物以及环节动物蠕虫的线粒体(mt)和叶绿体(cp)基因组中发现了II型内含子。II型内含子RNA的特征在于保守的二级结构,其跨度为400至800个nt并被组织成六个结构域,即DI-VI,从中心“轮”辐射。这些结构域相互作用形成保守的三级结构,将远处的序列聚集在一起形成活性位点。活性位点结合剪接位点和分支点核苷酸残基,并使用特异性结合的Mg++离子来活化适当的键进行催化。
II型内含子通过两次连续的酯交换反应催化它们自身的剪接,生成分叉的套索中间体和套索-内含子。具有互补序列的两个内含子部分可以杂交,从而把5’-内含子和3’-内含子-外显子接合处(3’-剪接位点)的分支点并置,用于亲核攻击和切割。在3’外显子释放后,3’剪接位点的末端2’-OH基团攻击5’-内含子-外显子接合处(5’剪接位点),连接两个外显子并释放具有2’至5’磷酸二酯键的内含子套索(环化的)RNA。详见Llorente-Cortés,V.等人,《实验医学和生物学进展(Advances in Experimental Medicine and Biology)》,第1087卷,《环状RNA:生物发生和功能(Circular RNAs:Biogenesis and Functions)》一章,施普林格(Springer)出版;Petkovic,S.等人,《体内和体外的RNA环化策略(RNAcircularization strategies in vivo and in vitro)》,《核酸研究(Nucleic AcidsResearch)》,2015,第43卷,第4期,2454-2465;Lambowitz,A.M.等人,《冷泉港生物学展望(Cold Spring Harb Perspect Biol.)》2011年8月;3(8):a003616。
发夹核酶(HPR)是另一种允许自剪接和生成环状RNA的系统。具有HPR的线性RNA可以折叠成两种切割活性构象,这两种构象都针对两个可能的切割位点中的一个。在任一构象中发生第一次切割后,RNA片段被切割,生成5’-OH和2’,3’-环状磷酸酯(2’,3’-cP)。然后将发夹核酶重折叠成另一种构象,从而发生第二次切割反应,生成另一段切割后的RNA片段以及5’-OH和2’,3’-cP。因此,切割后的中间体将含有5’-OH(在3’外显子处)和2’,3’-环状磷酸酯(在5’外显子处),它们可以连接以产生靶circRNA。详见Chen,XJ等人,《环状RNA:体外生物合成(Circular RNA:Biosynthesis in vitro)》,《生物工程与生物技术前沿(Front.Bioeng.Biotechnol.)》,2021年11月30日;Hieronymus,R.等人,《通过工程化发夹核酶变体进行RNA自剪接(RNA self-splicing by engineered hairpin ribozymevariants)》,《核酸研究》,第50卷,第1期,2022年1月11日,第368至377页,Diegelman,A.M.等人,《通过编码发夹核酶的环状DNA寡核苷酸的滚动转录生成环状RNA和反式切割催化RNA(Generation of circular RNAs and trans-cleaving catalytic RNAs by rollingtranscription of circular DNA oligonucleotides encoding hairpin ribozymes)》,《核酸研究》,1998,第26卷,第13期:3235-3241。发夹核酶是本领域熟知的,并且许多天然发夹核酶以及人工设计的发夹核酶也是已知的(Christina E Weinberg等人,《在不同的环状RNA中鉴定出比先前已知的多200倍以上的发夹核酶(Identification of over200-foldmore hairpin ribozymes than previously known in diverse circular RNAs)》,《核酸研究》2021年6月21日;49(11):6375-6388)。在某些实施方案中,发夹核酶衍生自细菌、真核生物或植物病毒RNA卫星(例如烟草环斑病毒(TRSV)卫星RNA、菊苣黄斑驳病毒(sCYMV)卫星RNA,或拟南芥花叶病毒(sARMV)卫星RNA)。
在某些实施方案中,第一环化元件包含自剪接元件的3’部分,所述自剪接元件的3’部分包含3’剪接位点,第二环化元件包含自剪接元件的5’部分,所述自剪接元件的5’部分包含5’剪接位点。
如本文所用,术语“剪接位点”是指部分或完全包括在自剪接元件中的二核苷酸,并且在RNA环化期间在该二核苷酸之间磷酸二酯键被切割。
如本文所用,“自剪接元件的3’部分”是与天然I型内含子、天然II型内含子或天然发夹核酶的3’近端片段(包括3’剪接位点二核苷酸)具有至少75%(例如,至少80%、至少85%、至少90%、至少95%、100%)序列同一性的连续序列,以及,任选地,长度为至少1个核苷酸(例如,长度为至少5个核苷酸、长度为至少10个核苷酸、长度为至少15个核苷酸、长度为至少20个核苷酸、长度为至少25个核苷酸、长度为至少50个核苷酸)的相邻外显子序列。
如本文所用,“自剪接元件的5’部分”是与天然I型内含子、天然II型内含子或天然发夹核酶的5’近端片段(包括5’剪接位点二核苷酸)具有至少75%(例如,至少80%、至少85%、至少90%、至少95%、100%)序列同一性的连续序列,以及,任选地,长度为至少1个核苷酸(例如,长度为至少5个核苷酸、长度为至少10个核苷酸、长度为至少15个核苷酸、长度为至少20个核苷酸、长度为至少25个核苷酸、长度为至少50个核苷酸)的相邻外显子序列。
在某些实施方案中,I型内含子衍生自噬菌体T4胸苷酸合酶(td)基因、蓝细菌鱼腥藻(Cyanobacterium Anabaena sp.)的pre-tRNA-Leu基因或四膜虫(Tetrahymena)基因。在某些实施方案中,II型内含子衍生自乳酸乳球菌(L.lactis)Ll.LtrB基因,或衍生自酵母。
在某些实施方案中,如本文提供的自剪接元件的3’部分由包含SEQ ID NO:7(AACAATAGATGACTTACAACTAATCGGAAGGTGCAGAGACTCGACGGGAGCTACCC TAACGTCAAGACGAGGGTAAAGAGAGAGTCCAATTCTCAAAGCCAATAGGCAGTAG CGAAAGCTGCAAGAGAATGAAAATCCGTTGACCTTAAACGGTCGTGTGGGTTCAAGT CCCTCCACCCCCA)的核酸序列编码。
在某些实施方案中,如本文提供的自剪接元件的5’部分由包含SEQ ID NO:12(AGACGCTACGGACTTAAATAATTGAGCCTTAAAGAAGAAATTCTTTAAGTGGATGCT CTCAAACTCAGGGAAACCTAAATCTAGTTATAGACAAGGCAATCCTGAGCCAAGCCGAAGTAGTAATTAGTAAG)的核酸序列编码。
2.靶序列
如本文所用,术语“靶序列”可以是可插入编码RNA转录物的序列中的且包含在由本文提供的RNA转录物转录的环状RNA中的任何感兴趣的序列。靶序列包含蛋白质编码或非编码区。在某些实施方案中,靶序列包含靶蛋白编码区。在某些实施方案中,靶序列包含生物活性RNA或生物活性RNA的前体。在某些实施方案中,靶序列包含或基本上由一个或多个克隆位点组成。
靶序列可以包含靶蛋白编码区。在某些实施方案中,蛋白质编码区编码真核或原核来源的蛋白质。在某些实施方案中,蛋白质编码区编码人蛋白质或非人蛋白质。在某些实施方案中,蛋白质可以是用于研究用途、治疗用途或诊断用途的任何蛋白质。在一些实施方案中,蛋白质可以是治疗性蛋白质,例如抗体、细胞因子、肽激素等。在某些实施方案中,蛋白质可以是预防性蛋白质,例如蛋白质疫苗等。在某些实施方案中,蛋白质可以是核酸酶,例如Cas蛋白质、重组酶等。在某些实施方案中,蛋白质可以是受体,例如嵌合抗原受体等。在一些实施方案中,蛋白质可以选自但不限于hFIX、SP-B、VEGF-A、人甲基丙二酰辅酶A变位酶(hMUT)、CFTR、癌症自身抗原和其它基因编辑酶,如Cpf1、锌指核酸酶(ZFN)和转录激活物样效应物核酸酶(TALEN)。
在某些实施方案中,靶序列进一步包含与靶蛋白编码区可操作地连接的5’非翻译区(UTR)和/或3’UTR。5’UTR可以选自但不限于人β珠蛋白、非洲爪蟾(Xenopus laevis)β珠蛋白、人α珠蛋白、非洲爪蟾α珠蛋白、风疹病毒(rubella virus)、烟草花叶病毒(tobaccomosaic virus)、小鼠Gtx、登革病毒(dengue virus)、热休克蛋白70kDa蛋白1A(heat shockprotein 70kDa protein 1A)、烟草醇脱氢酶、烟草蚀纹病毒(tobacco etch virus)、芜菁皱缩病毒(turnip crinkle virus)或腺病毒三联前导序列(adenovirus tripartiteleader)的5’UTR。3’UTR可以选自但不限于人β珠蛋白、人α珠蛋白、非洲爪蟾β珠蛋白、非洲爪蟾α珠蛋白、人催乳素、人GAP-43、人eEF1a1、人Tau、人TNFα、登革病毒、汉坦病毒小mRNA(hantavirus small mRNA)、布尼亚病毒小mRNA(bunyanavirus small mRNA)、芜菁黄花叶病毒(turnip yellow mosaic virus)、丙型肝炎病毒、风疹病毒(rubella virus)、烟草花叶病毒(tobacco mosaic virus)、人IL-8、人肌动蛋白、人GAPDH、人微管蛋白、木槿褪绿环斑病毒(hibiscus chlorotic rinsgpot virus)、土拨鼠肝炎病毒翻译后调控元件(woodchuck hepatitis virus post translationally regulated element)、辛德毕斯病毒(sindbis virus)、芜菁皱缩病毒、烟草蚀纹病毒或委内瑞拉马脑炎病毒(Venezuelanequine encephalitis virus)的3’UTR。野生型5’UTR和/或3’UTR序列也可以被修饰并且在本发明中是有效的。
在某些实施方案中,靶序列进一步包含与靶蛋白编码区可操作地连接的内部核糖体进入位点(IRES)。在某些实施方案中,IRES可操作地连接在靶蛋白编码区的上游或下游。IRES序列可以选自但不限于桃拉综合征病毒(Taura syndrome virus)、吸血猎椿病毒(Triatoma virus)、泰勒氏脑脊髓炎病毒(Theiler’s encephalomyelitis virus)、猿猴病毒40(Simian virus 40)、红火蚁病毒1(Solenopsis invicta virus 1)、禾谷缢管蚜病毒(Rhopalosiphum padi virus)、网状内皮增生症病毒(Reticuloendotheliosis virus)、人脊髓灰质炎病毒1、斯氏珀蝽肠病毒(Plautia stall intestine virus)、克什米尔蜂病毒(Kashmir bee virus)、人鼻病毒2(Human rhinovirus 2)、琉璃叶蝉病毒1(Homalodiscacoagulata virus-1)、人类免疫缺陷病毒1型、琉璃叶蝉病毒1、虱P病毒(Himetobi Pvirus)、丙型肝炎病毒、甲型肝炎病毒、GB型肝炎病毒、口蹄疫病毒(foot and mouthdisease virus)、人肠道病毒71(Human enterovirus 71)、马鼻炎病毒(Equine rhinitisvirus)、茶尺蠖样病毒(Ectropis obliqua picoma-like virus)、脑心肌炎病毒(Encephalomyocarditis virus(EMCV))、果蝇C病毒、十字花科烟草花叶病毒(Crucifertobaco virus)、蟋蟀麻痹病毒(Cricket paralysis virus,)、牛病毒性腹泻病毒1(Bovineviral diarrhea virus 1)、黑蜂王台病毒(Black queen cell virus)、蚜虫致死性麻痹病毒(Aphid lethal paralysis virus)、禽脑脊髓炎病毒(Avian encephalomyelitisvirus)、急性蜂麻痹病毒(Acute bee paralysis virus)、木槿褪绿环斑病毒、经典猪瘟病毒(Classical swine fever virus)、人FGF2、人SFTPA1、人AML1/RUNX1、果蝇触角足(Drosophila antennapedia)、人AQP4、人AT1R、人BAG-1、人BCL2、人BiP、人c-IAP1、人c-myc、人eIF4G、小鼠NDST4L、人LEF1、小鼠HIF1α、人n.myc、小鼠Gtx、人p27kip1、人PDGF2/c-sis、人p53、人Pim-1、小鼠Rbm3、果蝇reaper、犬科Scamper、果蝇Ubx、唾液病毒(Salivirus)、科萨病毒(Cosavirus)、双埃柯病毒(Parechovirus)、人UNR、小鼠UtrA、人VEGF-A、人XIAP、果蝇无毛(Drosophila hairless)、酿酒酵母TFIID、酿酒酵母YAP1(S.cerevisiae TFIID)、人c-src、人FGF-1、猿猴小核糖核酸病毒(Simian picomavirus)、芜菁皱缩病毒、eIF4G适体、柯萨奇病毒B3(Coxsackievirus B3(CVB3))或柯萨奇病毒A(Coxsackievirus A(CVB1/2))的IRES序列。野生型IRES序列也可以被修饰并在本发明中是有效的。在一些实施方案中,IRES序列的长度为约50个核苷酸。
在某些实施方案中,靶序列可以包含非编码RNA。在某些实施方案中,靶序列可以包含生物活性RNA或生物活性RNA的前体。在某些实施方案中,生物活性RNA包含短发夹RNA、转运RNA(tRNA)、短干扰RNA、微RNA(microRNA)或向导RNA。可以加工生物活性RNA的前体以产生生物活性RNA。例如,短发夹RNA可以加工成生物活性siRNA,其可以是siRNA的前体。
3.纯化片段
在某些实施方案中,RNA转录物具有至少一个纯化片段。
如本文所用,术语“纯化片段”是指存在于RNA转录物中但不存在于由RNA转录物产生的环状RNA中的核酸片段。至少一个纯化片段位于RNA转录物内,但不在靶序列内。由RNA转录物产生的环状RNA中不包括纯化片段,并且其存在不会显著减少环状RNA的产生。换言之,包含至少一个本文提供的纯化片段的RNA转录物仍可以被环化以产生环状RNA。在某些实施方案中,RNA转录物中的纯化片段包含或者是RNA片段。
纯化片段的核酸序列可充分区别于环状RNA的任何等长片段。设计可用作纯化片段的独特核苷酸序列以区别于给定的环状RNA序列的方法是本领域已知的。
在某些实施方案中,纯化片段可以是存在于RNA转录物中但不存在于由RNA转录物产生的环状RNA中的RNA序列。
在某些实施方案中,至少一个纯化片段中的每一个在15至20个核苷酸(nt),或15nt至25nt,或15nt至40nt,或15nt至50nt的给定长度上与环状RNA具有不超过90%(或不超过80%、不超过70%、不超过60%、不超过50%)的序列同一性。
例如,当纯化片段的长度短于或在15至20nt、15nt至25nt,或15nt至40nt,或15nt至50nt的范围内时,纯化片段可以在纯化片段的整个长度上与环状RNA具有不超过90%、不超过80%、不超过70%、不超过60%、不超过50%,或不超过40%的序列同一性。
再比如,当纯化片段的长度长于15至20nt、15nt至25nt,或15nt至40nt,或15nt至50nt的给定长度范围的上限时,则纯化片段的给定长度片段可以与环状RNA的等长片段具有不超过90%、不超过80%、不超过70%、不超过60%、不超过50%,或不超过40%的序列同一性。
在某些实施方案中,至少一个纯化片段与环状RNA的等长片段相差至少1、2、3、4、5、6、7、8、9、10个或甚至更多个核苷酸。
在某些实施方案中,至少一个纯化片段的长度在15至500个核苷酸、15至300个核苷酸、15至200个核苷酸、15至150个核苷酸、15至100个核苷酸、15至50个核苷酸、15至25个核苷酸、20至500个核苷酸、20至300个核苷酸、20至200个核苷酸、20至150个核苷酸、20至100个核苷酸、20至50个核苷酸或20至25个核苷酸的范围内。
在某些实施方案中,纯化片段不是环化元件的一部分。
在某些实施方案中,纯化片段包含或基本上由均多聚或均寡聚序列组成,仅举几个例子,诸如poly(A)、poly(U)、poly(T)、poly(C)、poly(G)、poly(AT)、poly(TC)、poly(AU)、poly(UC)、poly(AC)、poly(CA)、poly(AG)、poly(GA)。在某些实施方案中,纯化片段包含或基本上由均多聚或均寡聚RNA序列组成,仅举几个例子,诸如poly(A)、poly(U)、poly(C)、poly(G)、poly(AU)、poly(UC)、poly(AC)、poly(CA)、poly(AG)或poly(GA)。本文所用的关于纯化片段的术语“聚”意在指任何合适长度的核苷酸(即多于1个)。
在某些实施方案中,纯化片段包含或基本上由随机N-mer序列或随机N-mer序列的重复组成。在某些实施方案中,N可以是5和45之间的任何整数。这些N-mer序列的重复数目可以是1、2、3、4、5、6、7、8、9或10。
在某些实施方案中,纯化片段包含或基本上由靶结合寡核苷酸组成,靶结合寡核苷酸能够特异性结合非核苷酸的靶。在某些实施方案中,靶可以是蛋白质、肽、多糖或小分子。在某些实施方案中,纯化片段可以是形成与靶特异性结合的二级结构的适体。靶可以是用于蛋白质纯化的常见亲和配体之一,诸如生物素、链霉亲和素、谷胱甘肽、壳多糖、蛋白A和蛋白G。优化链霉亲和素结合RNA适体并将其用于核糖核蛋白的纯化(《用于纯化核糖核蛋白复合物的优化的链霉亲和素结合RNA适体鉴定新的ARE结合蛋白(An optimizedstreptavidin-binding RNA aptamer for purification of ribonucleoproteincomplexes identifies novel ARE-binding proteins)》,《核酸研究》2014年1月;42(2):e13)。适合作为本文提供的纯化片段的适体也可以是ARC1905、E10030、哌加他尼钠(Pegaptanib sodium)(Macugen)、EYE001、REG1、NOX-E36、NOX-A12、ARC1779等。可用的适体及其靶已描述于参考文献中(例如《治疗性基因组学和蛋白质组学递送中的挑战(Challenges in delivery of therapeutic genomics and proteomics[M])》爱思唯尔(Elsevier),2010.),其可以通过引用整体并入本文。
在某些实施方案中,纯化片段包含或基本上由poly(A)短序列组成。在某些实施方案中,poly(A)短序列具有15至200个核苷酸、15至150个核苷酸、15至100个核苷酸、15至50个核苷酸或15至25个核苷酸的长度范围。在某些实施方案中,poly(A)短序列具有15至150个核苷酸的长度范围。
纯化片段能够特异性地与RNA转录物外部的捕获剂相互作用或结合。捕获剂可以特异性地与纯化片段相互作用、结合或杂交,但不与环状RNA相互作用、结合或杂交,从而允许环状RNA从RNA转录物中分离。捕获剂可以是能够与纯化片段特异性相互作用或结合的任何分子实体。捕获剂的实例包括但不限于核酸序列,或核酸结合蛋白或肽,或化合物或聚合物或能够结合纯化片段的任何其它分子或材料。
在某些实施方案中,捕获剂包含核酸序列。在某些实施方案中,捕获剂可以包含天然存在的核酸和/或其类似物、变体和任何模拟物。捕获剂可以具有任何合适的核苷酸长度(例如15nt至25nt,或15nt至40nt,或15nt至50nt),只要它可以与纯化片段杂交。
在某些实施方案中,捕获剂包含能够在严格条件下与纯化片段杂交的核酸片段。在某些实施方案中,捕获剂包含或基本上由与纯化片段互补的DNA或RNA的均多聚或均寡聚序列组成,包括其类似物、变体和任何模拟物。在某些实施方案中,仅举几个例子,捕获剂包含以下或基本上由以下组成:脱氧胸苷寡核苷酸(oligo(dT))、脱氧腺嘌呤寡核苷酸(oligo(dA))、寡核苷酸(脱氧腺嘌呤:脱氧胸苷(oligo(dA:dT))、脱氧胞嘧啶寡核苷酸(oligo(dC))、脱氧鸟苷寡核苷酸(oligo(dG))、尿苷寡核苷酸(oligo(U))、脱氧尿苷寡核苷酸(oligo(dU))。
在某些实施方案中,捕获剂包含能够与本文提供的纯化片段结合的蛋白质、肽、多糖或小分子。在某些实施方案中,捕获剂包含能够与包含在纯化片段中的适体片段结合的蛋白质、肽、多糖或小分子。在某些实施方案中,捕获剂包含或者是常见的亲和配体,诸如生物素、链霉亲和素、谷胱甘肽、壳多糖、蛋白A和蛋白G。
在某些实施方案中,捕获剂包含与纯化片段的核苷酸序列至少80%、85%、90%、95%或100%互补的核酸片段。在某些实施方案中,纯化片段包含或基本上由poly(A)短序列组成,并且捕获剂包含oligo(U)、oligo(dU)、oligo(dT)或任何能够与poly(A)短序列杂交的寡核苷酸。oligo(dT)的一个实例是本领域中广泛用于纯化具有poly(A)尾的mRNA的试剂。
在某些实施方案中,捕获剂可以任选地固定在基底(诸如珠(例如磁珠))或色谱基质上。
本文提供的RNA转录物包含至少一个纯化片段,例如1或2个或甚至更多个纯化片段。
在某些实施方案中,至少一个纯化片段与第一环化元件缔合,或与第二环化元件缔合。在某些实施方案中,RNA转录物具有分别与第一环化元件和第二环化元件缔合的两个纯化片段。
在某些实施方案中,至少一个纯化片段:a)位于第一环化元件的上游,b)位于第二环化元件的下游,c)或a)和b)的任何组合。在某些实施方案中,至少一个纯化片段:a)附着于第一环化元件的5’端,或b)附着于第二环化元件的3’端,或a)和b)的任何组合。
在某些实施方案中,RNA转录物包含位于第一环化元件上游的一个纯化片段,其在本文中也称为5’纯化片段。在某些实施方案中,RNA转录物包含位于第二环化元件下游的一个纯化片段,其在本文中也称为3’纯化片段。在某些实施方案中,RNA转录物包含分别位于第一环化元件上游和第二环化元件下游的5’纯化片段和3’纯化片段两者。
在某些实施方案中,5’纯化片段和3’纯化片段可以具有相同的核苷酸序列,或者可以具有不同的核苷酸序列。
在某些实施方案中,5’纯化片段和3’纯化片段具有相同的序列,并且两者可以结合相同的捕获剂,这允许从环状RNA中分离RNA转录物。
在某些实施方案中,5’纯化片段和3’纯化片段具有不超过90%、不超过80%、不超过70%、不超过60%、不超过50%或不超过40%的序列同一性。在某些实施方案中,5’纯化片段和3’纯化片段具有不超过90%、不超过80%、不超过70%、不超过60%、不超过50%或不超过40%的序列互补性。在这样的实施方案中,可以使用两种捕获剂,每种捕获剂特异性结合5’纯化片段和3’纯化片段中的一者。可以连续或同时使用两种捕获剂从环状RNA中分离RNA转录物。
4.同源臂
在某些实施方案中,RNA转录物进一步包含至少一个同源臂。同源臂可以位于第一环化元件的上游(并且任选地与其相邻),这种同源臂可以被称为5’同源臂。同源臂也可以位于第二环化元件的下游(并且任选地与其相邻),这种同源臂可以被称为3’同源臂。在某些实施方案中,同源臂可以位于自剪接元件的3’部分的上游(即5’同源臂)和/或自剪接元件的5’部分的下游(即3’同源臂)。
在某些实施方案中,5’同源臂插入在5’纯化片段和第一环化元件之间。在某些实施方案中,3’同源臂插入在3’纯化片段和第二环化元件之间。在某些实施方案中,5’同源臂位于5’纯化片段的上游和/或3’同源臂位于3’纯化片段的下游。
在某些实施方案中,RNA转录物包含5’同源臂和3’同源臂两者。
如本文所用,“同源臂”是与同一多核苷酸分子中的另一序列(例如互补同源臂)具有至少约75%(例如,至少约80%、至少约85%、至少约90%、至少约95%、约100%)互补性的任何连续序列。可用于本公开的同源臂可以具有任何合适的长度,例如长度为至少1nt(例如10nt、20nt、30nt、40nt、50nt、60nt、70nt、80nt、90nt、100nt或更多),或长度高达250nt。在某些实施方案中,RNA转录物中的同源臂包含或者是RNA片段。
在某些实施方案中,RNA转录物具有5’同源臂和3’同源臂两者,其具有至少75%的互补性。在某些实施方案中,预计同源臂中的每一者与RNA转录物中的非预期序列(例如,非同源臂序列)的等长片段具有小于50%(例如,小于45%、小于40%、小于35%、小于30%、小于25%)的互补性。
在某些实施方案中,同源臂包含至少一个衍生自ALU重复序列的ALU元件。在某些实施方案中,ALU元件与自剪接元件的3’部分和/或自剪接元件的5’部分缔合(WilliamR.Jeck等人,《环状RNA丰富、保守且与ALU重复序列缔合》,《RNA》(2013),19:141-157)。
在某些实施方案中,如本文提供的5’同源臂由包含SEQ ID NO:6(GGGAAGACCCTCGACCGTCGATTGTCCACTGGTC)的核酸序列编码。
在某些实施方案中,如本文提供的3’同源臂由包含SEQ ID NO:13(ACCAGTGGACAATCGACGGATAACAGCATATCTAGG)的核酸序列编码。
5.间隔区
在某些实施方案中,RNA转录物进一步包含至少一个间隔区。在某些实施方案中,间隔区位于第一环化元件的下游(并且任选地与其相邻)和/或第二环化元件的上游(并且任选地与其相邻)。在某些实施方案中,间隔区位于自剪接元件的3’部分的下游(并且任选地与其相邻)和/或自剪接元件的5’部分的上游(并且任选地与其相邻)。
在某些实施方案中,间隔区位于第一环化元件(例如自剪接元件的3’部分)和靶序列之间,这种间隔区可以被称为5’间隔区。在某些实施方案中,间隔区位于靶序列和第二环化元件(例如自剪接元件的5’部分)之间,这种间隔区可以被称为3’间隔区。
如本文所用,“间隔区”是指介于两个其它核苷酸序列之间的一个或多个连续核苷酸的片段,以防止这两个其它核苷酸序列连接在一起或干扰彼此的预期生物活性。在某些实施方案中,RNA转录物中的间隔区包含或者是RNA片段。不希望受任何理论的束缚,据信在环化元件和靶序列之间包括间隔区对于保存环化元件(例如内含子序列)内存在的二级结构是有用的,这对于核酶活性可能是重要的,因此允许比没有间隔区的DNA构建体中更高的环化效率。例如,可以在例如IRES和环化元件之间,或者在环化元件和靶编码区或靶非编码区(例如UTR区)之间插入间隔区。在某些实施方案中,间隔区可以具有任何合适的长度,例如至少7个核苷酸长(并且任选地不长于100个核苷酸)。
在某些实施方案中,间隔区位于环化元件和IRES序列之间。在某些实施方案中,5’间隔区位于第一环化元件(例如自剪接元件的3’部分)和IRES序列之间。在某些实施方案中,3’间隔区位于IRES序列和第二环化元件(例如自剪接元件的5’部分)之间。在某些实施方案中,5’间隔区位于第一环化元件和靶蛋白编码区之间。在某些实施方案中,3’间隔区位于靶蛋白编码区和第二环化元件之间。在某些实施方案中,靶序列包含两个互补间隔区序列。在某些实施方案中,两个互补间隔区序列侧接本文提供的靶序列。
在某些实施方案中,间隔区含有以下中的一种或多种:a)至少5nt长的非结构化区域,b)预计与远端(即,非相邻)序列至少5nt长互补的区域,包括另一个间隔区,和/或c)至少1nt长的结构化区域,其范围限于间隔区的序列。
在某些实施方案中,间隔区不同于本文提供的纯化片段。在某些实施方案中,间隔区不是poly(A)、poly(U)、poly(C)或poly(AC)。
在某些实施方案中,间隔区与任何纯化片段不互补(或不杂交)。在某些实施方案中,间隔区与任何同源臂不互补(或不杂交)。
在某些实施方案中,如本文提供的5’间隔区由包含SEQ ID NO:8(TGATCTGAAACCAACTTTATTACTATATTCCCCACAACCCCC)的核酸序列编码。
在某些实施方案中,如本文提供的3’间隔区由包含SEQ ID NO:11(GGATCC)的核酸序列编码。
6.RNA转录物中包含的元件的示例性设计
本公开提供了包含在本文提供的RNA转录物中的元件的设计的示例性说明。图2示出了展示示例性设计的示意图。
在某些实施方案中,RNA转录物从5’至3’包含第一环化元件(例如自剪接元件的3’部分)、靶序列和第二环化元件(例如自剪接元件的5’部分)。这些没有纯化片段(PF)的DNA构建体或RNA转录物在图2中被命名为“Ctrl”。RNA转录物可以进一步具有一个纯化片段,其位于第一环化元件的5’端(在图2中命名为5PF)或第二环化元件的3’端(在图2中命名为3PF)。或者,RNA转录物可以具有两个纯化片段,分别位于第一环化元件的5’端和第二环化元件的3’端(在图2中命名为5PF+3PF)。在同一RNA转录物中提供的两个纯化片段可以具有或可以不具有相同的序列。特别地,本文提供的RNA转录物包含彼此可操作地连接并按以下顺序(从5’至3’)排列的以下元件:
I-Ctrl:a)自剪接元件的3’部分,b)靶序列,和c)自剪接元件的5’部分;
I-5PF:a)5’纯化片段;b)自剪接元件的3’部分,c)靶序列,和d)自剪接元件的5’部分;
I-3PF:a)自剪接元件的3’部分,b)靶序列,c)自剪接元件的5’部分,和d)3’纯化片段;或
I-5PF+3PF:a)5’纯化片段;b)自剪接元件的3’部分,c)靶序列,d)自剪接元件的5’部分,和e)3’纯化片段。
在某些实施方案中,RNA转录物在靶序列的上游从5’至3’包含第一环化元件(例如自剪接元件的3’部分)和5’间隔区。在某些实施方案中,RNA转录物在靶序列的下游从5’至3’包含3’间隔区和第二环化元件(例如自剪接元件的5’部分)。RNA转录物可以具有一个纯化片段,其位于第一环化元件的5’端或第二环化元件的3’端。或者,RNA转录物可以具有两个纯化片段,分别位于第一环化元件的5’端和第二环化元件的3’端。在同一RNA转录物中提供的两个纯化片段可以具有或可以不具有相同的序列。特别地,本文提供的RNA转录物包含彼此可操作地连接并按以下顺序(从5’至3’)排列的以下元件:
II-Ctrl:a)自剪接元件的3’部分,b)5’间隔区,c)靶序列,d)3’间隔区,和e)自剪接元件的5’部分;
II-5PF:a)5’纯化片段;b)自剪接元件的3’部分,c)5’间隔区,d)靶序列,e)3’间隔区,和f)自剪接元件的5’部分;
II-3PF:a)自剪接元件的3’部分,b)5’间隔区,c)靶序列,d)3’间隔区,e)自剪接元件的5’部分,和f)3’纯化片段;或
II-5PF+3PF:a)5’纯化片段;b)自剪接元件的3’部分,c)5’间隔区,d)靶序列,e)3’间隔区,f)自剪接元件的5’部分,和g)3’纯化片段。
在某些实施方案中,RNA转录物在靶序列的上游从5’至3’包含5’同源臂、第一环化元件(例如自剪接元件的3’部分)和5’间隔区。在某些实施方案中,RNA转录物在靶序列的下游从5’至3’包含3’间隔区、第二环化元件(例如自剪接元件的5’部分)和3’同源臂。RNA转录物可以具有一个纯化片段,其位于5’同源臂的5’端或3’同源臂的3’端。或者,RNA转录物可以具有两个纯化片段,分别位于5’同源臂的5’端和3’同源臂的3’端。在同一RNA转录物中提供的两个纯化片段可以具有或可以不具有相同的序列。特别地,本文提供的RNA转录物包含彼此可操作地连接并按以下顺序(从5’至3’)排列的以下元件:
III-Ctrl:a)5’同源臂,b)自剪接元件的3’部分,c)5’间隔区,d)靶序列,e)3’间隔区,f)自剪接元件的5’部分,和g)3’同源臂;
III-5PF:a)5’纯化片段,b)5’同源臂,c)自剪接元件的3’部分,d)5’间隔区,e)靶序列,f)3’间隔区,g)自剪接元件的5’部分,和h)3’同源臂;
III-3PF:a)5’同源臂,b)自剪接元件的3’部分,c)5’间隔区,d)靶序列,e)3’间隔区,f)自剪接元件的5’部分,g)3’同源臂,和h)3’纯化片段;或
III-5PF+3PF:a)5’纯化片段,b)5’同源臂,c)自剪接元件的3’部分,d)5’间隔区,e)靶序列,f)3’间隔区,g)自剪接元件的5’部分,h)3’同源臂,和i)3’纯化片段。
在某些实施方案中,RNA转录物在靶序列的上游从5’至3’包含5’同源臂、第一环化元件(例如自剪接元件的3’部分)和5’间隔区。在某些实施方案中,RNA转录物在靶序列的下游从5’至3’包含3’间隔区、第二环化元件(例如自剪接元件的5’部分)和3’同源臂。RNA转录物可以具有一个纯化片段,其位于5’同源臂和第一环化元件之间,或位于3’同源臂和第二环化元件之间。或者,RNA转录物可以具有两个纯化片段,分别位于5’同源臂和第一环化元件之间和3’同源臂和第二环化元件之间。在同一RNA转录物中提供的两个纯化片段可以具有或可以不具有相同的序列。特别地,本文提供的RNA转录物包含彼此可操作地连接并按以下顺序(从5’至3’)排列的以下元件:
IV-Ctrl:a)5’同源臂,b)自剪接元件的3’部分,c)5’间隔区,d)靶序列,e)3’间隔区,f)自剪接元件的5’部分,和g)3’同源臂(与III-Ctrl相同);
IV-5PF:a)5’同源臂,b)5’纯化片段,c)自剪接元件的3’部分,d)5’间隔区,e)靶序列,f)3’间隔区,g)自剪接元件的5’部分,和h)3’同源臂;
IV-3PF:a)5’同源臂,b)自剪接元件的3’部分,c)5’间隔区,d)靶序列,e)3’间隔区,f)自剪接元件的5’部分,g)3’纯化片段,和h)3’同源臂;或
IV-5PF+3PF:a)5’同源臂,b)5’纯化片段,c)自剪接元件的3’部分,d)5’间隔区,e)靶序列,f)3’间隔区,g)自剪接元件的5’部分,h)3’纯化片段,和i)3’同源臂。
7.环状RNA
在某些实施方案中,本文提供的RNA转录物可以环化形成包含靶序列的环状RNA。环化可以通过分子内形成3’,5’-磷酸二酯键来实现,这需要线性RNA转录物3’和5’末端的邻近。
在某些实施方案中,环化可以通过反向剪接反应或外显子跳跃来实现。在某些实施方案中,第一环化元件包含自剪接元件的3’部分,其包含内含子部分的3’近端片段和长度为至少1个核苷酸的相邻外显子部分。在某些实施方案中,第二环化元件包含自剪接元件的5’部分,其包含内含子的5’近端片段和长度为至少1个核苷酸的相邻外显子部分。该环化过程包括将下游外显子部分的3’-尾连接到通常位于上游的长度为至少1个核苷酸的外显子部分的5’-头。这通过添加促进RNA-RNA键形成的合适的酶或因子来促进。在某些实施方案中,所得环状RNA分子可以含有第一环化元件的外显子部分和第二环化元件的外显子部分,但分别不含第一环化元件和第二环化元件的内含子部分。提供环状RNA的其它剪接方法是本领域已知的,例如参见Junjie Xiao编辑的《环状RNA的生物发生和功能(circularRNAs Biogenesis and Functions)》。其它合适的方法可用于产生环状RNA,参见例如,Sonja Petkovic和Sabine Müller,《体内和体外的RNA环化策略》,《核酸研究》,2015,第43卷,第4期,2454-2465。
在某些实施方案中,所得环状RNA分子可进一步包含至少一个间隔区。在某些实施方案中,间隔区位于第一环化元件的外显子部分和靶序列之间,这种间隔区可以被称为5’间隔区。在某些实施方案中,间隔区位于靶序列和第二环化元件的外显子部分之间,这种间隔区可以被称为3’间隔区。
在某些实施方案中,所得环状RNA包含靶序列,该靶序列包含与靶蛋白编码区可操作连接的内部核糖体进入位点(IRES)。
DNA构建体作为进一步构建DNA构建体的载体
在另一方面,本公开提供了包含多克隆位点和编码至少一个纯化片段的DNA的DNA构建体。这种DNA构建体允许在多克隆位点插入本文提供的一个或多个靶序列,和/或第一环化元件和/或第二环化元件,使得插入的靶序列和/或环化元件可操作地连接到包含在DNA构建体中的纯化片段。应当理解,在DNA构建体的语境中,术语如“环化元件”、“靶序列”、“纯化片段”、“同源臂”和“间隔区”旨在表示编码如本文所述的RNA转录物的相应元件(即环化元件、靶序列、纯化片段、同源臂和间隔区)的DNA序列。例如,当在DNA构建体的语境中使用时,术语“环化元件”可以指编码RNA转录物中的环化元件的DNA,术语“靶序列”可以指编码RNA转录物中的靶序列的DNA,术语“纯化片段”可以指编码RNA转录物中的纯化片段的DNA,术语“同源臂”可以指编码RNA转录物中的同源臂的DNA,并且术语“间隔区”可以指编码RNA转录物中的间隔区的DNA。
如本文所用,术语“编码(code)”或“编码(encode)”是指多核苷酸(如DNA或RNA)中的特定核苷酸序列的固有性质,其用作在体内或体外生物过程中合成其它聚合物和大分子的模板,这些其它聚合物和大分子具有限定的核苷酸序列或限定的氨基酸序列以及由此产生的生物性质。例如,如果一种DNA在合适的体内或体外生物系统中转录产生一种RNA转录物,则该DNA编码该RNA转录物,如果一种RNA转录物在合适的体内或体外生物系统中翻译产生一种蛋白质,则该RNA转录物编码该蛋白质,以及如果一种DNA在合适的体内或体外生物系统中转录和翻译产生一种蛋白质,则该DNA编码该蛋白质。编码链(有义链)(其核酸序列与RNA转录物序列相同并通常在序列表中提供)和非编码链(无义链)(用作DNA转录模板)均可被称为编码所述DNA的蛋白质或其它产物。
这种DNA构建体可以用作构建本文提供的DNA构建体的载体或工具,即编码本文提供的RNA转录物的DNA构建体,其能够形成包含靶序列的环状RNA。
本公开还提供了一种DNA构建体,其包含彼此可操作地连接并以5’至3’顺序排列的以下元件:
a)第一纯化片段,任选地第一poly(A)短序列,和
b)多克隆位点,其包含或基本上由一个或多个用于插入靶序列的克隆位点组成。
在某些实施方案中,DNA构建体进一步包含位于多克隆位点下游的第二纯化片段。
在某些实施方案中,DNA构建体进一步包含位于第一纯化片段和多克隆位点之间的第一环化元件。在某些实施方案中,DNA构建体进一步包含位于多克隆位点下游或位于多克隆位点和第二纯化片段之间的第二环化元件。
在某些实施方案中,第二纯化片段包含第二poly(A)短序列。
在某些实施方案中,DNA构建体进一步包含位于第一纯化片段上游的RNA聚合酶启动子。
本公开进一步提供了一种DNA构建体,其包含彼此可操作地连接并按以下顺序排列的以下元件:
a)RNA聚合酶启动子,
b)第一环化元件,
c)多克隆位点,和
d)第二环化元件,
其中DNA构建体进一步包含至少一个位于RNA聚合酶启动子下游的纯化片段。
在某些实施方案中,多个纯化片段中的一个位于第一环化元件的上游和/或第二环化元件的下游。
如本文所用,术语“多克隆位点”或“MCS”是指含有多个(至多约20个)限制性位点的短DNA片段,是工程化质粒和其它载体的标准元件。MCS中的限制性位点通常是唯一的,其在载体中仅存在一次,因此可用于将感兴趣的序列插入载体中。此外,表达载体通常被设计成使得MCS可以通过选择正确的插入位点将蛋白质编码序列插入正确的阅读框中,和/或用户可以通过选择MCS来选择阅读框,这通常在所有三个框中都是可用的。
用于制备环状RNA的方法
本公开提供了一种产生如本文提供的RNA转录物的方法,该方法包括从本文提供的DNA构建体转录,从而获得本文提供的RNA转录物。
在另一方面,本文提供的RNA转录物可以通过在RNA水平上将纯化片段标记为前体来产生。本公开还提供了一种产生如本文提供的RNA转录物的方法,该方法包括:
a)提供前体RNA,其与本文提供的RNA转录物的不同之处在于缺少纯化片段,以及
b)将纯化片段添加到前体RNA中,从而获得所述RNA转录物。
在某些实施方案中,前体RNA与本文提供的RNA转录物的不同之处仅在于缺少纯化片段。
在某些实施方案中,纯化片段被添加到:a)位于第一环化元件上游的位置,b)位于第二环化元件下游的位置,c)或a)和b)的任何组合。
在某些实施方案中,纯化片段:a)附着于第一环化元件的5’端,或b)附着于第二环化元件的3’端,c)或a)和b)的任何组合。
本公开进一步提供了一种产生环状RNA的方法,该方法包括:
a)提供所述RNA转录物,以及
b)使RNA转录物自环化以形成环状RNA。
在某些实施方案中,步骤a)中的RNA转录物已使用本文公开的捕获剂富集。捕获剂可以特异性结合RNA转录物中存在的纯化片段。
在某些实施方案中,该方法进一步包括通过本文提供的捕获剂从步骤b)获得的产物中纯化环状RNA。在某些实施方案中,捕获剂特异性结合RNA转录物中的纯化片段和任选地副产物中的但不存在于环状RNA中的纯化片段。
本文所用的术语“副产物”是指在产生环状RNA的过程中出现的任何中间片段。副产物既不同于RNA转录物,也不同于环状RNA。副产物可以含有本文提供的RNA转录物的部分长度。副产物可以含有可以被捕获剂捕获的纯化片段的至少一部分。
在某些实施方案中,用于从环状RNA中分离RNA转录物的捕获剂包含能够在严格条件下与纯化片段杂交的核酸片段。在某些实施方案中,捕获剂包含与纯化片段的核苷酸序列至少80%、85%、90%、95%或100%互补的核酸片段。
在某些实施方案中,捕获剂是固定的。在某些实施方案中,步骤b)的RNA转录物在溶液中经历自环化或在固定有捕获剂的固体基质上经历自环化。在某些实施方案中,纯化片段包含poly(A)短序列,并且捕获剂包含oligo(dT)。其它寡核苷酸也可以用作捕获剂,只要它们与RNA转录物中的PF互补,例如使用Oligo-(AT)n作为PF为poly(AU)时的捕获剂,或使用Oligo-(CT)n作为PF为poly(AG)时的捕获剂。在某些实施方案中,纯化片段可以与捕获剂结合,该捕获剂包含蛋白质、肽、多糖或小分子。在某些实施方案中,捕获剂包含或者是常见的亲和配体,诸如生物素、链霉亲和素、谷胱甘肽、壳多糖、蛋白A和蛋白G,其结合的PF为具有独特配体结合结构的RNA适体。
在某些实施方案中,步骤a)中的RNA转录物由本文提供的DNA构建体转录。在某些实施方案中,该方法进一步包括在步骤a)之前由本文提供的DNA构建体转录以产生本文提供的RNA转录物。
组合物
本公开提供了一种使用本文提供的方法产生的环状RNA的组合物。本公开还提供了一种包含本文提供的DNA构建体或本文提供的RNA转录物的组合物。
在某些实施方案中,本公开提供了包含有效量的本文所述的环状RNA和药学上可接受的赋形剂的药物组合物。本公开的药物组合物可以包含如本文所述的环状RNA,其与一种或多种药学上或生理学上可接受的载体、赋形剂或稀释剂组合。在一些实施方案中,本公开的药物组合物可以包含如本文所述的环状RNA表达细胞(例如多个环状RNA表达细胞),其与一种或多种药学上或生理学上可接受的载体、赋形剂或稀释剂组合。
在一些实施方案中,药学上可接受的载体可以是药物组合物中除活性成分以外的成分,其对受试者无毒。
在一些实施方案中,如本文所述的环状RNA可以与其它已知药剂和疗法联合使用。在其它实施方案中,本文所述的组合物可以与手术、放射、化学疗法、抗体或其它药剂组合用于治疗方案中。
试剂盒
本公开提供了一种包含所述DNA构建体的试剂盒。本公开还提供了一种用于产生所述RNA转录物的试剂盒,其包含用于将纯化片段添加到RNA转录物的前体中的试剂。
在某些实施方案中,试剂盒进一步包含捕获剂,所述捕获剂特异性结合存在于RNA转录物中但不存在于环状RNA中的纯化片段。在某些实施方案中,用于从环状RNA中分离RNA转录物的捕获剂包含能够在严格条件下与纯化片段杂交的核酸片段。在某些实施方案中,捕获剂是固定的。在某些实施方案中,纯化片段包含poly(A)短序列,并且捕获剂包含oligo(dT)。
本文提供的试剂盒还可以包括一种或多种转染试剂以促进环状RNA(或编码它们的重组核酸)向细胞的递送。这种试剂盒也可以包括保存多核苷酸或防止其降解的组分。这种组分可以不含RNase或免受RNase的影响。
这种试剂盒通常以合适的方式包含用于每种单独试剂或溶液的不同容器。该试剂盒可以包括一个或多个装有环状RNA或编码它们的重组多核苷酸和其它药剂的容器。用于组合物的合适容器包括例如瓶、小瓶、注射器和试管。容器可以由各种材料制成,包括玻璃或塑料。容器可以具有无菌入口(例如,容器可以是具有可被皮下注射针刺穿的塞子的小瓶)。
试剂盒可以进一步包括容器,该容器包含药学上可接受的缓冲液,诸如磷酸盐缓冲盐水、林格氏溶液或葡萄糖溶液。它还可以含有对最终用户有用的其它材料,包括其它药学上可接受的配制溶液,诸如缓冲液、稀释剂,过滤器、针和注射器或其它递送装置。可以用组合物预先填充递送装置。
实施例
实施例1.DNA构建体(质粒)
通常,可以根据图1中箭头所示的方法制备图1所示的DNA构建体以生成环状RNA。每个构建体都具有质粒骨架(其可以包括Ori和抗生素抗性基因)、RNA聚合酶的启动子(例如T7启动子)和RNA前体的DNA序列。DNA构建体可以转录为如图2所示例的RNA前体(或RNA转录物),总共四类(I类、II类、III类和IV类),包括:I-Ctrl、I-5PF、I-3PF、I-5PF+3PF、II-Ctrl、II-5PF、II-3PF、II-5PF+3PF、III-Ctrl、III-5PF、III-3PF、III-5PF+3PF、IV-Ctrl、IV-5PF、IV-3PF和IV-5PF+3PF。
RNA转录物的细节示于图2中并总结如下。所有命名为“Ctrl”的RNA转录物用作阴性对照,因为它们不具有任何纯化片段。
/>
RNA前体含有待环化的靶序列(例如,编码GFP蛋白的基因)、环化元件(例如,I型内含子自剪接元件)和纯化片段(例如,如图3所示的poly-A短序列)。纯化片段位于或靠近转录RNA的一端或两端。在III类和IV类中,构建体进一步具有同源片段(即,同源臂,以使环化端紧密接近)。在这些构建体的一些中,纯化片段位于同源片段和环化元件的一个或多个接头处。纯化片段不是最终环状产物的一部分。选择长度在20至200个核苷酸内的纯化片段。在IV类中,纯化片段的位置在环化元件和同源臂之间,而在III类中,纯化片段位于同源臂的端部。在I类和II类中,纯化片段(例如,poly(A))的位置被设计在RNA前体的3’端、RNA前体的5’端或两端,如图1和图2所示。
编码每个元件,即靶序列、自剪接元件的3’部分(即,环化元件,在图2中命名为“3’内含子”)、自剪接元件的5’部分(即,环化元件,在图2中命名为“5’内含子”)、5’纯化片段、3’纯化片段、5’同源臂、3’同源臂和IRES的示例性DNA序列提供如下(从5’至3’)。
/>
为了举例说明DNA构建体,如图3A所示,用poly-A短序列作为PF进一步说明III类。编码III类RNA前体全长的DNA序列提供如下(从5’至3’)。
因此,构建携带这些序列(SEQ ID NO:1-4)的质粒并通过DNA测序分析进行验证。
/>
/>
/>
/>
实施例2.环状RNA的纯化和表征
将根据实施例1制备的DNA构建体线性化,并根据以下提供的实验工作流程进行体外转录、环化和纯化。对环化效率和纯化效率进行评估和比较,以证明PF的益处。
2.1实验工作流程
如图3B所示,根据以下步骤进行环状RNA的纯化和表征,包括DNA构建体的线性化、线性化DNA的纯化、体外转录、环化、使用Oligo-dT方法纯化环状RNA和纯化RNA的表征。
2.2实验程序和结果
质粒DNA的制备。
合成实施例1中构建的DNA构建体(质粒)(包括图3A,Ctrl、5A、3A和53A所示的那些构建体)并克隆到大肠杆菌(E.coli)菌株中用于质粒复制。提取质粒并纯化,然后通过酶消化进行线性化。
将质粒DNA在37℃条件下用限制性酶HindIII(NEB,R0104L)消化1至4小时。然后使用QIAquick凝胶提取试剂盒纯化线性化的质粒DNA。
通过使用T7 RNA聚合酶在NTP、鼠RNase抑制剂和焦磷酸酶(无机(Inorganic))的存在下在37℃下从线性化质粒DNA模板体外转录30至120分钟来合成线性RNA转录物。
为了产生环状RNA,将额外的含有50mM Tris-HCl(pH7.4)、10mM MgCl2和2mM GTP的环化反应缓冲液添加到体外转录的混合物中,并在55℃下进一步孵育15至30分钟。通过琼脂糖凝胶电泳检测环状RNA的产生。
然后通过将RNA混合物通过Oligo-dT试剂纯化得到的环状RNA。携带poly-A短序列的RNA片段将结合/保留在Oligo-dT试剂上,而circRNA产物将在流过物中并因此得到纯化。对于实验室规模的纯化,根据制造商的方案使用与oligo(dT)25(Ambion,目录编号:61002)缀合的磁珠。或者,由Oligo-dT树脂制成的柱也用于在AKTA设备(思拓凡(Cytiva))上纯化环状RNA。为了说明纯化方法,用这些步骤进行纯化:结合、洗涤和洗脱结合的RNA。
从以下纯化步骤收集级分:来自结合步骤的FT(流过物),来自洗涤步骤的W和来自洗脱步骤的E(洗脱物)。在琼脂糖凝胶上(图4)和通过毛细管电泳(CE)(图5A至5E)分析这些级分以及来自环化步骤的RNA混合物(在图4和5A至5E中表示为输入)。基于CE结果计算环化效率和circRNA纯度(图5E)。
图4和5A至5E示出了由III类构建体(即图3A所示的构建体,Ctrl、5A、3A和53A)制备环状RNA产物,纯化步骤之后的级分。输入(其表示来自环化步骤的RNA混合物)、FT(其表示来自结合步骤的流过物)和E级分(其表示来自洗脱步骤的洗脱物)泳道上的条带显示,含PF的RNA片段与捕获剂Oligo-dT磁珠有效结合,从circRNA产物中除去并用洗脱缓冲液洗脱(图4)。
从这些分析中可以清楚地看出,在RNA前体的任一端或在RNA前体的每一端添加poly-A短序列不会对环化效率产生负面影响。相反,与Ctrl相比,RNA前体的5’端存在PF令人惊讶地显著提高了环化效率,从Ctrl的33%分别提高到5A和53A产物的75%和85%(图5A至5E)。另外,如图5E所总结的,Ctrl产物在纯化前后表现出circRNA纯度从25%到28%的增加。相反,在纯化前后,5A产物表现出circRNA纯度从52%到82%的增长,3A产物表现出从22%到66%的增长,53A产物表现出从62%到86%的增长。相对于不存在如本文所公开的纯化片段的构建体,包含一个或两个poly-A短序列作为纯化片段的三个构建体在circRNA纯化中都表现出显著更高的有效性。按照本文公开的产生circRNA的方法,纯化的circRNA达到了高达几乎90%的纯度。
还使用类似的方法分析了由I类、II类和IV类构建体制备环状RNA产物在纯化步骤之后的级分。作为PF的poly-A短序列的存在显著地促进了所得circRNA的纯化,产生了如预期的高度纯化的circRNA。
为了测试circRNA产物的功能性,进行了转染实验。将纯化的GFP circRNA产物通过lipofectamine转染到HEK 293T细胞中。孵育两天后,在明视野和GFP设置下在显微镜上获取荧光图像(图6)。强荧光场清楚地显示GFP蛋白的表达,表明了合成的GFP circRNA的功能性。
实施例3.环状RNA的合成、纯化和表征
根据实施例1和2中描述的方法构建如图2所示的携带III类元件的质粒,其中适体作为纯化片段,并通过DNA测序分析进行验证。
将DNA构建体线性化,并根据实施例2中提供的实验工作流程进行体外转录、环化和纯化。[能够特异性结合适体的靶]用作捕获剂。对环化效率和纯化效率进行评估和比较,以证明PF的益处。
类似地,从以下纯化步骤收集级分:来自结合步骤的FT(流过物),来自洗涤步骤的W和来自洗脱步骤的E(洗脱物)。在琼脂糖凝胶上和通过毛细管电泳(CE)分析这些级分以及来自环化步骤(输入)的RNA混合物。基于CE结果计算环化效率和circRNA纯度。
实验数据显示,包含适体作为纯化片段实现了与包含poly-A短序列作为纯化片段相似的性能。适体作为PF的存在有利于纯化过程,产生高纯度的circRNA产物。纯化的circRNA产物也显示了其中所含靶序列的所需功能。
Claims (57)
1.一种用于制备环状RNA的DNA构建体,所述DNA构建体包含与编码能够产生环状RNA的RNA转录物的序列可操作地连接的RNA聚合酶启动子,所述RNA转录物包含彼此可操作地连接并按以下顺序排列的以下元件:
a)第一环化元件,
b)靶序列,和
c)第二环化元件,
其中所述RNA转录物能够形成包含所述靶序列的所述环状RNA;以及
其中所述RNA转录物进一步包含至少一个在所述环状RNA中不存在的纯化片段。
2.根据权利要求1所述的DNA构建体,其中所述RNA聚合酶启动子是衍生自T7病毒、T6病毒、SP6病毒、T3病毒或T4病毒的RNA聚合酶启动子。
3.一种体外转录的RNA转录物,所述RNA转录物包含彼此可操作地连接并按以下顺序排列的以下元件:
a)第一环化元件,
b)靶序列,和
c)第二环化元件,
其中所述RNA转录物能够形成包含所述靶序列的环状RNA;以及
其中所述RNA转录物进一步包含至少一个在所述环状RNA中不存在的纯化片段。
4.根据权利要求1或2所述的DNA构建体或根据权利要求3所述的RNA转录物,其中所述至少一个纯化片段与所述第一环化元件缔合,或与所述第二环化元件缔合。
5.根据权利要求1或2所述的DNA构建体或根据权利要求3所述的RNA转录物,其中所述RNA转录物具有分别与所述第一环化元件和所述第二环化元件缔合的两个纯化片段。
6.根据权利要求1至2和4至5中任一项所述的DNA构建体或根据权利要求3至5中任一项所述的RNA转录物,其中所述至少一个纯化片段:a)位于所述第一环化元件的上游(即5’纯化片段),b)位于所述第二环化元件的下游(即3’纯化片段),c)或a)和b)的任何组合。
7.根据权利要求1至2和4至6中任一项所述的DNA构建体或根据权利要求3至6中任一项所述的RNA转录物,其中所述至少一个纯化片段:a)附着于所述第一环化元件的5’端(即5’纯化片段),或b)附着于所述第二环化元件的3’端(即3’纯化片段),或a)和b)的任何组合。
8.根据权利要求6至7中任一项所述的DNA构建体或根据权利要求6至7中任一项所述的RNA转录物,其中所述RNA转录物具有所述5’纯化片段和所述3’纯化片段两者,并且其中所述5’纯化片段和所述3’纯化片段在核苷酸序列上相同或不同。
9.根据权利要求1至2和4至8中任一项所述的DNA构建体或根据权利要求3至7中任一项所述的RNA转录物,其中所述至少一个纯化片段中的每一个在15至20个核苷酸的给定长度上与所述环状RNA具有不超过90%(或不超过80%、不超过70%、不超过60%、不超过50%)的序列同一性。
10.根据权利要求1至2和4至9中任一项所述的DNA构建体或根据权利要求3至9中任一项所述的RNA转录物,其中所述纯化片段包含poly(A)短序列(tract)、poly(T)短序列、poly(U)短序列、poly(C)短序列、poly(G)短序列、poly(AC)短序列、poly(AG)短序列、poly(CT)短序列、poly(CU)短序列、poly(AT)短序列或poly(AU)短序列。
11.根据权利要求10所述的DNA构建体,或根据权利要求10所述的RNA转录物,其中所述纯化片段(例如poly(A)短序列)的长度范围为15至200个核苷酸,任选地15至150个核苷酸。
12.根据权利要求1至2和4至11中任一项所述的DNA构建体或根据权利要求3至11中任一项所述的RNA转录物,其中所述第一环化元件和所述第二环化元件可以衍生自自剪接系统。
13.根据权利要求12所述的DNA构建体或根据权利要求12所述的RNA转录物,其中所述第一环化元件包含自剪接元件的3’部分,所述自剪接元件的3’部分包含3’剪接位点,并且所述第二环化元件包含自剪接元件的5’部分,所述自剪接元件的5’部分包含5’剪接位点。
14.根据权利要求13所述的DNA构建体或根据权利要求13所述的RNA转录物,其中所述自剪接元件是I型内含子、II型内含子或发夹核酶。
15.根据权利要求14所述的DNA构建体或根据权利要求14所述的RNA转录物,其中所述I型内含子衍生自噬菌体T4胸苷酸合酶(td)基因、蓝细菌鱼腥藻pre-tRNA-Leu基因或四膜虫基因。
16.根据权利要求14所述的DNA构建体或根据权利要求14所述的RNA转录物,其中所述II型内含子衍生自乳酸乳球菌Ll.LtrB基因,或衍生自酵母。
17.根据权利要求14所述的DNA构建体或根据权利要求14所述的RNA转录物,其中所述发夹核酶衍生自细菌、真核生物或植物病毒RNA卫星(例如烟草环斑病毒(TRSV)卫星RNA、菊苣黄斑驳病毒(sCYMV)卫星RNA,或拟南芥花叶病毒(sARMV)卫星RNA)。
18.根据权利要求1至2和4至17中任一项所述的DNA构建体或根据权利要求3至17中任一项所述的RNA转录物,其中所述靶序列包含靶蛋白编码区。
19.根据权利要求18所述的DNA构建体或根据权利要求18所述的RNA转录物,其中所述靶蛋白是治疗性蛋白(例如抗体、细胞因子、肽激素等)、预防性蛋白(例如蛋白质疫苗等)、核酸酶(例如Cas蛋白、重组酶等)、受体(例如嵌合抗原受体等)。
20.根据权利要求18或19所述的DNA构建体或根据权利要求18或19所述的RNA转录物,其中所述靶序列进一步包含与所述靶蛋白编码区可操作地连接的内部核糖体进入位点(IRES),任选地所述IRES可操作地连接在所述靶蛋白编码区的上游和/或下游。
21.根据权利要求20所述的DNA构建体或根据权利要求20所述的RNA转录物,其中所述IRES选自桃拉综合征(Taura syndrome)病毒、吸血猎椿(Triatoma)病毒、泰勒氏(Theiler’s)脑脊髓炎病毒、猿猴病毒40、红火蚁病毒1、禾谷缢管蚜病毒、网状内皮增生症病毒、人脊髓灰质炎病毒1、斯氏珀蝽肠病毒(Plautia staliintestine virus)、克什米尔蜂病毒、人鼻病毒2、琉璃叶蝉病毒1、人类免疫缺陷病毒1型、琉璃叶蝉病毒1、虱P病毒、丙型肝炎病毒、甲型肝炎病毒、GB型肝炎病毒、口蹄疫病毒、人肠道病毒71、马鼻炎病毒、茶尺蠖样病毒、脑心肌炎病毒(EMCV)、果蝇C病毒、十字花科烟草花叶病毒、蟋蟀麻痹病毒、牛病毒性腹泻病毒1、黑蜂王台病毒、蚜虫致死性麻痹病毒、禽脑脊髓炎病毒、急性蜂麻痹病毒、木槿褪绿环斑病毒、经典猪瘟病毒、人FGF2、人SFTPA1、人AML1/RUNX1、果蝇触角足、人AQP4、人AT1R、人BAG-1、人BCL2、人BiP、人c-IAP1、人c-myc、人eIF4G、小鼠NDST4L、人LEF1、小鼠HIF1α、人n.myc、小鼠Gtx、人p27kip1、人PDGF2/c-sis、人p53、人Pim-1、小鼠Rbm3、果蝇reaper、犬科Scamper、果蝇Ubx、唾液病毒(Salivirus)、科萨病毒(Cosavirus)、双埃柯病毒、人UNR、小鼠UtrA、人VEGF-A、人XIAP、果蝇无毛(hairless)、酿酒酵母TFIID、酿酒酵母YAP1、人c-src、人FGF-1、猿猴小核糖核酸病毒、芜菁皱缩病毒、eIF4G适体、柯萨奇病毒B3(CVB3)或柯萨奇病毒A(CVB1/2)的IRES序列。
22.根据权利要求18至21中任一项所述的DNA构建体或根据权利要求18至21中任一项所述的RNA转录物,其中所述靶序列进一步包含与所述靶蛋白编码区可操作连接的5’非翻译区(UTR)和/或3’UTR。
23.根据权利要求1至2和4至17中任一项所述的DNA构建体或根据权利要求3至17中任一项所述的RNA转录物,其中所述靶序列包含生物活性RNA或所述生物活性RNA的前体。
24.根据权利要求23所述的DNA构建体或根据权利要求23所述的RNA转录物,其中所述生物活性RNA包含短发夹RNA、转运RNA(tRNA)、短干扰RNA、微RNA(microRNA)或向导RNA。
25.根据权利要求1至2和4至24中任一项所述的DNA构建体或根据权利要求3至23中任一项所述的RNA转录物,其中所述RNA转录物进一步包含至少一个同源臂,任选地所述同源臂位于所述第一环化元件的上游(即5’同源臂)和/或所述第二环化元件的下游(即3’同源臂)。
26.根据权利要求25所述的DNA构建体或根据权利要求25所述的RNA转录物,其中所述同源臂包含至少一个衍生自ALU重复序列的ALU元件。
27.根据权利要求24或25所述的DNA构建体或根据权利要求24或25所述的RNA转录物,其中所述同源臂:
a)插入所述5’纯化片段和所述第一环化元件之间和/或插入所述3’纯化片段和所述第二环化元件之间;或
b)位于所述5’纯化片段的上游和/或所述3’纯化片段的下游。
28.根据权利要求1至2和4至27中任一项所述的DNA构建体或根据权利要求3至27中任一项所述的RNA转录物,其中所述RNA转录物进一步包含至少一个间隔区,任选地所述间隔区位于所述第一环化元件(例如所述自剪接元件的3’部分)和所述靶序列之间,和/或位于所述靶序列和所述第二环化元件(例如所述自剪接元件的5’部分)之间。
29.根据权利要求28所述的DNA构建体或根据权利要求28所述的RNA转录物,其中所述间隔区:
a)位于所述第一环化元件(例如所述自剪接元件的3’部分)和所述IRES序列之间,和/或位于所述靶序列和所述第二环化元件(例如所述自剪接元件的5’部分)之间;
b)位于所述第一环化元件(例如所述自剪接元件的3’部分)和所述靶蛋白编码区之间,和/或位于所述靶蛋白编码区和所述第二环化元件(例如所述自剪接元件的5’部分)之间。
30.根据权利要求28或29所述的DNA构建体或根据权利要求28或29所述的RNA转录物,其中所述至少一个间隔区序列包含位于所述靶序列侧翼的两个互补间隔区序列。
31.一种DNA构建体,其包含彼此可操作地连接并以5’至3’顺序排列的以下元件:
a)第一纯化片段,任选地第一poly(A)短序列,和
b)多克隆位点,其包含或基本上由一个或多个用于插入靶序列的克隆位点组成。
32.根据权利要求31所述的DNA构建体,其进一步包含位于所述多克隆位点下游的第二纯化片段。
33.根据权利要求31或32所述的DNA构建体,其进一步包含位于所述第一纯化片段和所述多克隆位点之间的第一环化元件,和/或位于所述多克隆位点下游或位于所述多克隆位点和所述第二纯化片段之间的第二环化元件。
34.根据权利要求31至33中任一项所述的DNA构建体,其进一步包含位于所述第一纯化片段上游的RNA聚合酶启动子。
35.一种DNA构建体,其包含彼此可操作地连接并按以下顺序排列的以下元件:
a)RNA聚合酶启动子,
b)第一环化元件,
c)多克隆位点,和
d)第二环化元件,
其中所述DNA构建体进一步包含至少一个位于所述RNA聚合酶启动子下游的纯化片段。
36.根据权利要求35所述的DNA构建体,其中所述多个纯化片段中的一个位于所述第一环化元件的上游和/或所述第二环化元件的下游。
37.一种产生根据权利要求3至30中任一项所述的RNA转录物的方法,所述方法包括:从根据权利要求1至2和4至30中任一项所述的DNA构建体转录,从而获得根据权利要求3至30中任一项所述的RNA转录物。
38.一种产生根据权利要求3至30中任一项所述的RNA转录物的方法,所述方法包括:
a)提供前体RNA,其与所述RNA转录物的不同之处在于缺少所述纯化片段,任选地所述前体RNA与所述RNA转录物的不同之处仅在于缺少所述纯化片段,以及
b)将所述纯化片段添加到所述前体RNA中,从而获得根据权利要求3至30中任一项所述的RNA转录物。
39.根据权利要求38所述的方法,其中所述纯化片段被添加到:a)位于所述第一环化元件上游的位置,b)位于所述第二环化元件下游的位置,c)或a)和b)的任何组合。
40.根据权利要求38所述的方法,其中所述纯化片段:a)附着于所述第一环化元件的5’端,或b)附着于所述第二环化元件的3’端,c)或a)和b)的任何组合。
41.一种产生环状RNA的方法,所述方法包括:
a)提供根据权利要求3至30中任一项所述的RNA转录物,以及
b)使所述RNA转录物自环化以形成所述环状RNA。
42.根据权利要求41所述的方法,其中步骤a)中的所述RNA转录物已经使用捕获剂富集,所述捕获剂特异性结合存在于所述RNA转录物中的纯化片段。
43.根据权利要求41或42所述的方法,其中所述方法进一步包括通过捕获剂从步骤b)获得的产物中纯化所述环状RNA,其中所述捕获剂特异性结合所述RNA转录物中的所述纯化片段,以及任选地副产物中的但不存在于所述环状RNA中的所述纯化片段。
44.根据权利要求42或43所述的方法,其中所述捕获剂包含能够在严格条件下与所述纯化片段杂交的核酸片段,任选地所述捕获剂包含与所述纯化片段的核苷酸序列至少80%、85%、90%、95%或100%互补的核酸片段。
45.根据权利要求44所述的方法,其中所述捕获剂是固定的。
46.根据权利要求41至45中任一项所述的方法,其中步骤b)中的所述RNA转录物在溶液中经历自环化或在固定有所述捕获剂的固体基质上经历自环化。
47.根据权利要求41至46中任一项所述的方法,其中所述纯化片段包含poly(A)短序列,并且所述捕获剂包含脱氧胸苷寡核苷酸(oligo(dT))。
48.根据权利要求41至47中任一项所述的方法,其中步骤a)中的所述RNA转录物由根据权利要求1至2和4至30中任一项所述的DNA构建体转录。
49.根据权利要求41所述的方法,其中所述方法进一步包括在步骤a)之前由根据权利要求1至2和4至30中任一项所述的DNA构建体转录以产生根据权利要求3至30中任一项所述的RNA转录物。
50.根据权利要求41所述的方法,其中步骤a)中的所述RNA转录物通过根据权利要求38至40中任一项所述的方法获得。
51.一种使用根据权利要求41至50中任一项所述的方法产生的环状RNA的组合物。
52.一种组合物,其包含根据权利要求1至2和4至30中任一项所述的DNA构建体或根据权利要求3至30中任一项所述的RNA转录物。
53.一种包含根据权利要求1至2和4至36中任一项所述的DNA构建体的试剂盒。
54.一种用于产生根据权利要求3至30中任一项所述的RNA转录物的试剂盒,其包含用于将所述纯化片段添加到根据权利要求38中所述的RNA转录物的前体中的试剂。
55.根据权利要求53或54所述的试剂盒,其中所述试剂盒进一步包含捕获剂,所述捕获剂特异性结合存在于所述RNA转录物中但不存在于所述环状RNA中的所述纯化片段。
56.根据权利要求53或54所述的试剂盒,其中所述纯化片段包含poly(A)短序列。
57.根据权利要求53或54所述的试剂盒,其中所述捕获剂包含oligo(dT)。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNPCT/CN2022/094157 | 2022-05-20 | ||
CN2022094157 | 2022-05-20 | ||
PCT/CN2023/095294 WO2023222114A1 (en) | 2022-05-20 | 2023-05-19 | Methods of making circular rna |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117529556A true CN117529556A (zh) | 2024-02-06 |
Family
ID=88834705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202380012376.1A Pending CN117529556A (zh) | 2022-05-20 | 2023-05-19 | 制备环状rna的方法 |
Country Status (3)
Country | Link |
---|---|
CN (1) | CN117529556A (zh) |
TW (1) | TW202408542A (zh) |
WO (1) | WO2023222114A1 (zh) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108486107A (zh) * | 2018-03-01 | 2018-09-04 | 北京大学 | 基于双分子荧光互补的新型信使rna和环状rna标记方法 |
CN108546700A (zh) * | 2018-04-19 | 2018-09-18 | 广州密码子基因科技有限公司 | 一种FFPE样本circRNA高通量测序文库的构建方法 |
BR112020024292A2 (pt) * | 2018-06-06 | 2021-03-02 | Massachusetts Institute Of Technology | rna circular para translação em células eucarióticas |
CA3178111A1 (en) * | 2020-05-08 | 2021-11-11 | Brian Goodman | Circular rna compositions and methods |
CN116322788A (zh) * | 2020-05-19 | 2023-06-23 | 奥纳治疗公司 | 环状rna组合物和方法 |
CN114507691A (zh) * | 2022-03-02 | 2022-05-17 | 深圳市瑞吉生物科技有限公司 | 一种用于制备环状rna的载体及其应用 |
-
2023
- 2023-05-19 CN CN202380012376.1A patent/CN117529556A/zh active Pending
- 2023-05-19 TW TW112118805A patent/TW202408542A/zh unknown
- 2023-05-19 WO PCT/CN2023/095294 patent/WO2023222114A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
TW202408542A (zh) | 2024-03-01 |
WO2023222114A1 (en) | 2023-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20220004674A (ko) | Rna를 편집하기 위한 방법 및 조성물 | |
WO2018144778A1 (en) | Polynucleotide secondary structure | |
CN116218836A (zh) | 编辑rna的方法和组合物 | |
CN113661242A (zh) | 包含经修饰的环状多核糖核苷酸的组合物及其用途 | |
CN107208096A (zh) | 基于crispr的组合物和使用方法 | |
CN114574483A (zh) | 基于翻译起始元件点突变的重组核酸分子及其在制备环状rna中的应用 | |
AU2022273530A2 (en) | Modified mrna, modified non-coding rna, and uses thereof | |
JP2024504981A (ja) | 新規の操作されたヌクレアーゼおよびキメラヌクレアーゼ | |
CN109355290B (zh) | 一种植物环状rna表达框架及其应用 | |
CN116322791A (zh) | 经修饰的功能性核酸分子 | |
WO2023046153A1 (en) | Circular rna and preparation method thereof | |
CN113950530A (zh) | 核酸多联体产物的表达 | |
CN114990093B (zh) | 氨基酸序列小的蛋白序列mini rfx-cas13d | |
KR102151064B1 (ko) | 매칭된 5' 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법 | |
CN117529556A (zh) | 制备环状rna的方法 | |
US20240150754A1 (en) | Guide rna for editing polyadenylation signal sequence of target rna | |
CN114807154A (zh) | 一种修饰的核酸及其应用 | |
EP4219723A1 (en) | Circular rna platforms, uses thereof, and their manufacturing processes from engineered dna | |
CN106834293B (zh) | 一种带有分子标志物的环状rna及其制备方法和应用 | |
JP2021533826A (ja) | 正確に改変した秘匿メッセンジャーrna、及び、その他のポリヌクレオチド | |
EP3704245A1 (en) | Synthetic rnas and methods of use | |
EP2852666A1 (en) | Ribosomal polynucleotides and related expression systems | |
WO2024140987A1 (en) | Rna circularization | |
WO2024145248A1 (en) | Compositions and methods for generating circular rna | |
JP2024522171A (ja) | Dna改変のためのcrispr-トランスポゾンシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |