TW202408542A - 製備環狀rna的方法 - Google Patents
製備環狀rna的方法 Download PDFInfo
- Publication number
- TW202408542A TW202408542A TW112118805A TW112118805A TW202408542A TW 202408542 A TW202408542 A TW 202408542A TW 112118805 A TW112118805 A TW 112118805A TW 112118805 A TW112118805 A TW 112118805A TW 202408542 A TW202408542 A TW 202408542A
- Authority
- TW
- Taiwan
- Prior art keywords
- rna
- rna transcript
- virus
- dna construct
- sequence
- Prior art date
Links
- 108091028075 Circular RNA Proteins 0.000 title claims abstract description 136
- 238000000034 method Methods 0.000 title claims abstract description 69
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract description 67
- 239000012634 fragment Substances 0.000 claims description 292
- 108020004414 DNA Proteins 0.000 claims description 141
- 238000007363 ring formation reaction Methods 0.000 claims description 139
- 125000006850 spacer group Chemical group 0.000 claims description 113
- 125000003729 nucleotide group Chemical group 0.000 claims description 79
- 239000002773 nucleotide Substances 0.000 claims description 77
- 239000003795 chemical substances by application Substances 0.000 claims description 62
- 241000700605 Viruses Species 0.000 claims description 56
- 108090000623 proteins and genes Proteins 0.000 claims description 53
- 238000000746 purification Methods 0.000 claims description 52
- 150000007523 nucleic acids Chemical group 0.000 claims description 42
- 102000004169 proteins and genes Human genes 0.000 claims description 39
- 238000011144 upstream manufacturing Methods 0.000 claims description 35
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 claims description 34
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 claims description 34
- 241000282414 Homo sapiens Species 0.000 claims description 32
- 239000000047 product Substances 0.000 claims description 31
- 238000000338 in vitro Methods 0.000 claims description 28
- 230000000295 complement effect Effects 0.000 claims description 25
- 108091034057 RNA (poly(A)) Proteins 0.000 claims description 24
- 239000002243 precursor Substances 0.000 claims description 24
- 108700026244 Open Reading Frames Proteins 0.000 claims description 22
- 239000000203 mixture Substances 0.000 claims description 19
- 239000003153 chemical reaction reagent Substances 0.000 claims description 17
- 238000004519 manufacturing process Methods 0.000 claims description 15
- 108091034117 Oligonucleotide Proteins 0.000 claims description 14
- 108091023037 Aptamer Proteins 0.000 claims description 11
- 108091023043 Alu Element Proteins 0.000 claims description 10
- 108090001052 hairpin ribozyme Proteins 0.000 claims description 10
- 108020005543 Satellite RNA Proteins 0.000 claims description 9
- 239000006227 byproduct Substances 0.000 claims description 9
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 claims description 8
- 108700011259 MicroRNAs Proteins 0.000 claims description 7
- 108020004566 Transfer RNA Proteins 0.000 claims description 7
- 239000002679 microRNA Substances 0.000 claims description 7
- 239000004055 small Interfering RNA Substances 0.000 claims description 7
- 241000709675 Coxsackievirus B3 Species 0.000 claims description 6
- 241000710188 Encephalomyocarditis virus Species 0.000 claims description 6
- 101710091919 Eukaryotic translation initiation factor 4G Proteins 0.000 claims description 6
- 101000857677 Homo sapiens Runt-related transcription factor 1 Proteins 0.000 claims description 6
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 6
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 6
- 241000723677 Tobacco ringspot virus Species 0.000 claims description 6
- 102000050291 human RUNX1 Human genes 0.000 claims description 6
- 230000001225 therapeutic effect Effects 0.000 claims description 6
- 108020005345 3' Untranslated Regions Proteins 0.000 claims description 5
- 241000196324 Embryophyta Species 0.000 claims description 5
- 108091027874 Group I catalytic intron Proteins 0.000 claims description 5
- 108091029499 Group II intron Proteins 0.000 claims description 5
- 108020004459 Small interfering RNA Proteins 0.000 claims description 5
- 241001414720 Cicadellidae Species 0.000 claims description 4
- 241000711549 Hepacivirus C Species 0.000 claims description 4
- 241000519953 Hibiscus chlorotic ringspot virus Species 0.000 claims description 4
- 108091027967 Small hairpin RNA Proteins 0.000 claims description 4
- 108010083268 Transcription Factor TFIID Proteins 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 108700040054 mouse Nkx6-2 Proteins 0.000 claims description 4
- 101150059573 AGTR1 gene Proteins 0.000 claims description 3
- 241000317943 Acute bee paralysis virus Species 0.000 claims description 3
- 108091007065 BIRCs Proteins 0.000 claims description 3
- 241000710780 Bovine viral diarrhea virus 1 Species 0.000 claims description 3
- 241000282465 Canis Species 0.000 claims description 3
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 claims description 3
- 244000298479 Cichorium intybus Species 0.000 claims description 3
- 235000007542 Cichorium intybus Nutrition 0.000 claims description 3
- 241000710777 Classical swine fever virus Species 0.000 claims description 3
- 241001632249 Cosavirus Species 0.000 claims description 3
- 241000709677 Coxsackievirus B1 Species 0.000 claims description 3
- 241000710127 Cricket paralysis virus Species 0.000 claims description 3
- 241001464430 Cyanobacterium Species 0.000 claims description 3
- 108090000695 Cytokines Proteins 0.000 claims description 3
- 102000004127 Cytokines Human genes 0.000 claims description 3
- 101100239628 Danio rerio myca gene Proteins 0.000 claims description 3
- 241000907524 Drosophila C virus Species 0.000 claims description 3
- 108700007251 Drosophila H Proteins 0.000 claims description 3
- 108700024069 Drosophila Ubx Proteins 0.000 claims description 3
- 108700007861 Drosophila rpr Proteins 0.000 claims description 3
- 101000760853 Enterobacteria phage T4 Thymidylate synthase Proteins 0.000 claims description 3
- 241000988559 Enterovirus A Species 0.000 claims description 3
- 241000283073 Equus caballus Species 0.000 claims description 3
- 241000701533 Escherichia virus T4 Species 0.000 claims description 3
- 241000710198 Foot-and-mouth disease virus Species 0.000 claims description 3
- 108020005004 Guide RNA Proteins 0.000 claims description 3
- 241000709721 Hepatovirus A Species 0.000 claims description 3
- 101000971171 Homo sapiens Apoptosis regulator Bcl-2 Proteins 0.000 claims description 3
- 101000806663 Homo sapiens Aquaporin-4 Proteins 0.000 claims description 3
- 101100275820 Homo sapiens CSDE1 gene Proteins 0.000 claims description 3
- 101000944361 Homo sapiens Cyclin-dependent kinase inhibitor 1B Proteins 0.000 claims description 3
- 101000804865 Homo sapiens E3 ubiquitin-protein ligase XIAP Proteins 0.000 claims description 3
- 101000899240 Homo sapiens Endoplasmic reticulum chaperone BiP Proteins 0.000 claims description 3
- 101100281008 Homo sapiens FGF2 gene Proteins 0.000 claims description 3
- 101000846416 Homo sapiens Fibroblast growth factor 1 Proteins 0.000 claims description 3
- 101000972291 Homo sapiens Lymphoid enhancer-binding factor 1 Proteins 0.000 claims description 3
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 claims description 3
- 101100519221 Homo sapiens PDGFB gene Proteins 0.000 claims description 3
- 101000864780 Homo sapiens Pulmonary surfactant-associated protein A1 Proteins 0.000 claims description 3
- 101000775102 Homo sapiens Transcriptional coactivator YAP1 Proteins 0.000 claims description 3
- 101000808011 Homo sapiens Vascular endothelial growth factor A Proteins 0.000 claims description 3
- 241000713772 Human immunodeficiency virus 1 Species 0.000 claims description 3
- 241000709701 Human poliovirus 1 Species 0.000 claims description 3
- 241000710124 Human rhinovirus A2 Species 0.000 claims description 3
- 102000055031 Inhibitor of Apoptosis Proteins Human genes 0.000 claims description 3
- 241000960414 Kashmir bee virus Species 0.000 claims description 3
- 101150039798 MYC gene Proteins 0.000 claims description 3
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 claims description 3
- 101001046872 Mus musculus Hypoxia-inducible factor 1-alpha Proteins 0.000 claims description 3
- 101100140104 Mus musculus Rbm3 gene Proteins 0.000 claims description 3
- 101710163270 Nuclease Proteins 0.000 claims description 3
- 102100040990 Platelet-derived growth factor subunit B Human genes 0.000 claims description 3
- 241001084365 RNA satellites Species 0.000 claims description 3
- 102000018120 Recombinases Human genes 0.000 claims description 3
- 108010091086 Recombinases Proteins 0.000 claims description 3
- 241000712909 Reticuloendotheliosis virus Species 0.000 claims description 3
- 108060006706 SRC Proteins 0.000 claims description 3
- 102000001332 SRC Human genes 0.000 claims description 3
- 241001352312 Salivirus Species 0.000 claims description 3
- 244000057717 Streptococcus lactis Species 0.000 claims description 3
- 241001265687 Taura syndrome virus Species 0.000 claims description 3
- 241000223892 Tetrahymena Species 0.000 claims description 3
- 241000723873 Tobacco mosaic virus Species 0.000 claims description 3
- 102100031873 Transcriptional coactivator YAP1 Human genes 0.000 claims description 3
- 241001223089 Tremovirus A Species 0.000 claims description 3
- 241001480150 Triatoma virus Species 0.000 claims description 3
- 108020000999 Viral RNA Proteins 0.000 claims description 3
- 101001001642 Xenopus laevis Serine/threonine-protein kinase pim-3 Proteins 0.000 claims description 3
- 101100459258 Xenopus laevis myc-a gene Proteins 0.000 claims description 3
- 230000001580 bacterial effect Effects 0.000 claims description 3
- 208000006454 hepatitis Diseases 0.000 claims description 3
- 231100000283 hepatitis Toxicity 0.000 claims description 3
- 102000057121 human AQP4 Human genes 0.000 claims description 3
- 102000051711 human BCL2 Human genes 0.000 claims description 3
- 102000057048 human CDKN1B Human genes 0.000 claims description 3
- 102000046317 human CSDE1 Human genes 0.000 claims description 3
- 102000048874 human LEF1 Human genes 0.000 claims description 3
- 102000053563 human MYC Human genes 0.000 claims description 3
- 102000054741 human SFTPA1 Human genes 0.000 claims description 3
- 102000058223 human VEGFA Human genes 0.000 claims description 3
- 102000052732 human XIAP Human genes 0.000 claims description 3
- 238000003780 insertion Methods 0.000 claims description 3
- 230000037431 insertion Effects 0.000 claims description 3
- 239000000813 peptide hormone Substances 0.000 claims description 3
- 229940023143 protein vaccine Drugs 0.000 claims description 3
- 108020003175 receptors Proteins 0.000 claims description 3
- 102000005962 receptors Human genes 0.000 claims description 3
- 206010039083 rhinitis Diseases 0.000 claims description 3
- 239000007787 solid Substances 0.000 claims description 3
- 241000219194 Arabidopsis Species 0.000 claims description 2
- 235000011293 Brassica napus Nutrition 0.000 claims description 2
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 claims description 2
- 101000740062 Homo sapiens BAG family molecular chaperone regulator 1 Proteins 0.000 claims description 2
- 241000709664 Picornaviridae Species 0.000 claims description 2
- 241000908128 Plautia stali intestine virus Species 0.000 claims description 2
- 241000736128 Solenopsis invicta Species 0.000 claims description 2
- 108091008816 c-sis Proteins 0.000 claims description 2
- 230000003449 preventive effect Effects 0.000 claims description 2
- 230000037303 wrinkles Effects 0.000 claims description 2
- 241000192542 Anabaena Species 0.000 claims 1
- 241001124076 Aphididae Species 0.000 claims 1
- 240000002791 Brassica napus Species 0.000 claims 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 claims 1
- 241001466953 Echovirus Species 0.000 claims 1
- 206010033799 Paralysis Diseases 0.000 claims 1
- 241000180211 Sitobion miscanthi Species 0.000 claims 1
- 235000014897 Streptococcus lactis Nutrition 0.000 claims 1
- 102100040296 TATA-box-binding protein Human genes 0.000 claims 1
- 244000269722 Thea sinensis Species 0.000 claims 1
- 201000002491 encephalomyelitis Diseases 0.000 claims 1
- 230000000968 intestinal effect Effects 0.000 claims 1
- 231100000518 lethal Toxicity 0.000 claims 1
- 230000001665 lethal effect Effects 0.000 claims 1
- 210000003705 ribosome Anatomy 0.000 claims 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 24
- 108020005093 RNA Precursors Proteins 0.000 description 21
- 108091028043 Nucleic acid sequence Proteins 0.000 description 19
- 102000039446 nucleic acids Human genes 0.000 description 18
- 108020004707 nucleic acids Proteins 0.000 description 18
- 238000013518 transcription Methods 0.000 description 17
- 230000035897 transcription Effects 0.000 description 17
- 108091026890 Coding region Proteins 0.000 description 12
- 210000002706 plastid Anatomy 0.000 description 10
- 108020005067 RNA Splice Sites Proteins 0.000 description 9
- 238000005251 capillar electrophoresis Methods 0.000 description 9
- 238000001727 in vivo Methods 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 230000004048 modification Effects 0.000 description 9
- 210000004027 cell Anatomy 0.000 description 8
- 108020004999 messenger RNA Proteins 0.000 description 8
- 239000013612 plasmid Substances 0.000 description 8
- 108090000994 Catalytic RNA Proteins 0.000 description 7
- 102000053642 Catalytic RNA Human genes 0.000 description 7
- 230000008436 biogenesis Effects 0.000 description 7
- 238000012512 characterization method Methods 0.000 description 7
- 201000010099 disease Diseases 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 239000000543 intermediate Substances 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 108091092562 ribozyme Proteins 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- 108091092195 Intron Proteins 0.000 description 6
- 239000011543 agarose gel Substances 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- 238000010828 elution Methods 0.000 description 6
- -1 etc.) Proteins 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 108090000765 processed proteins & peptides Proteins 0.000 description 6
- 108010090804 Streptavidin Proteins 0.000 description 5
- 150000001413 amino acids Chemical group 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 239000011324 bead Substances 0.000 description 5
- 238000003776 cleavage reaction Methods 0.000 description 5
- 150000004676 glycans Chemical class 0.000 description 5
- 229920001282 polysaccharide Polymers 0.000 description 5
- 239000005017 polysaccharide Substances 0.000 description 5
- 150000003384 small molecules Chemical class 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 238000005809 transesterification reaction Methods 0.000 description 5
- 206010028980 Neoplasm Diseases 0.000 description 4
- 241000269368 Xenopus laevis Species 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 239000003446 ligand Substances 0.000 description 4
- 239000008194 pharmaceutical composition Substances 0.000 description 4
- 102000040430 polynucleotide Human genes 0.000 description 4
- 108091033319 polynucleotide Proteins 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- 108020003589 5' Untranslated Regions Proteins 0.000 description 3
- 229920002101 Chitin Polymers 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 108091008103 RNA aptamers Proteins 0.000 description 3
- 101710120037 Toxin CcdB Proteins 0.000 description 3
- 102000006290 Transcription Factor TFIID Human genes 0.000 description 3
- 108091023045 Untranslated Region Proteins 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 229940104302 cytosine Drugs 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000003085 diluting agent Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 229920001519 homopolymer Polymers 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000000546 pharmaceutical excipient Substances 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 229960005486 vaccine Drugs 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- WLCZTRVUXYALDD-IBGZPJMESA-N 7-[[(2s)-2,6-bis(2-methoxyethoxycarbonylamino)hexanoyl]amino]heptoxy-methylphosphinic acid Chemical compound COCCOC(=O)NCCCC[C@H](NC(=O)OCCOC)C(=O)NCCCCCCCOP(C)(O)=O WLCZTRVUXYALDD-IBGZPJMESA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 241000192531 Anabaena sp. Species 0.000 description 2
- 241001261139 Aphid lethal paralysis virus Species 0.000 description 2
- 241000723635 Arabis mosaic virus Species 0.000 description 2
- 241000318498 Black queen cell virus Species 0.000 description 2
- 108091033380 Coding strand Proteins 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 241000725619 Dengue virus Species 0.000 description 2
- 108700006830 Drosophila Antp Proteins 0.000 description 2
- 241001046947 Ectropis obliqua Species 0.000 description 2
- 241001529459 Enterovirus A71 Species 0.000 description 2
- 108010024636 Glutathione Proteins 0.000 description 2
- 108091005902 Hemoglobin subunit alpha Proteins 0.000 description 2
- 102100027685 Hemoglobin subunit alpha Human genes 0.000 description 2
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 2
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 2
- 208000037262 Hepatitis delta Diseases 0.000 description 2
- 241000724709 Hepatitis delta virus Species 0.000 description 2
- 241001622355 Himetobi P virus Species 0.000 description 2
- 241001129848 Homalodisca coagulata virus-1 Species 0.000 description 2
- 101001009007 Homo sapiens Hemoglobin subunit alpha Proteins 0.000 description 2
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 description 2
- 102000003839 Human Proteins Human genes 0.000 description 2
- 108090000144 Human Proteins Proteins 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 2
- 108091092724 Noncoding DNA Proteins 0.000 description 2
- 241000991583 Parechovirus Species 0.000 description 2
- 241000936948 Rhopalosiphum padi virus Species 0.000 description 2
- 102000004389 Ribonucleoproteins Human genes 0.000 description 2
- 108010081734 Ribonucleoproteins Proteins 0.000 description 2
- 241000710799 Rubella virus Species 0.000 description 2
- 108091081021 Sense strand Proteins 0.000 description 2
- 241001163129 Solenopsis invicta virus-1 Species 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 241000710209 Theiler's encephalomyelitis virus Species 0.000 description 2
- 241000714211 Turnip crinkle virus Species 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 125000000217 alkyl group Chemical group 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- RMRCNWBMXRMIRW-BYFNXCQMSA-M cyanocobalamin Chemical compound N#C[Co+]N([C@]1([H])[C@H](CC(N)=O)[C@]\2(CCC(=O)NC[C@H](C)OP(O)(=O)OC3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)C)C/2=C(C)\C([C@H](C/2(C)C)CCC(N)=O)=N\C\2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O RMRCNWBMXRMIRW-BYFNXCQMSA-M 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 229960003180 glutathione Drugs 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 108010087782 poly(glycyl-alanyl) Proteins 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 230000003389 potentiating effect Effects 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- WKKCYLSCLQVWFD-UHFFFAOYSA-N 1,2-dihydropyrimidin-4-amine Chemical compound N=C1NCNC=C1 WKKCYLSCLQVWFD-UHFFFAOYSA-N 0.000 description 1
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 1
- UVBYMVOUBXYSFV-UHFFFAOYSA-N 1-methylpseudouridine Natural products O=C1NC(=O)N(C)C=C1C1C(O)C(O)C(CO)O1 UVBYMVOUBXYSFV-UHFFFAOYSA-N 0.000 description 1
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- WVAKRQOMAINQPU-UHFFFAOYSA-N 2-[4-[2-[5-(2,2-dimethylbutyl)-1h-imidazol-2-yl]ethyl]phenyl]pyridine Chemical compound N1C(CC(C)(C)CC)=CN=C1CCC1=CC=C(C=2N=CC=CC=2)C=C1 WVAKRQOMAINQPU-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical group BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- ZXIATBNUWJBBGT-JXOAFFINSA-N 5-methoxyuridine Chemical compound O=C1NC(=O)C(OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZXIATBNUWJBBGT-JXOAFFINSA-N 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 241000243818 Annelida Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 101150033765 BAG1 gene Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 240000008100 Brassica rapa Species 0.000 description 1
- 241001678559 COVID-19 virus Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 241001311459 Crucifer tobamovirus Species 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 102100023882 Endoribonuclease ZC3H12A Human genes 0.000 description 1
- 101710112715 Endoribonuclease ZC3H12A Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 108010027992 HSP70 Heat-Shock Proteins Proteins 0.000 description 1
- 102000018932 HSP70 Heat-Shock Proteins Human genes 0.000 description 1
- 241000218033 Hibiscus Species 0.000 description 1
- 235000005206 Hibiscus Nutrition 0.000 description 1
- 235000007185 Hibiscus lunariifolius Nutrition 0.000 description 1
- 101000920078 Homo sapiens Elongation factor 1-alpha 1 Proteins 0.000 description 1
- 101001066129 Homo sapiens Glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 101001057699 Homo sapiens Inorganic pyrophosphatase Proteins 0.000 description 1
- 101001055222 Homo sapiens Interleukin-8 Proteins 0.000 description 1
- 101000891579 Homo sapiens Microtubule-associated protein tau Proteins 0.000 description 1
- 101000979249 Homo sapiens Neuromodulin Proteins 0.000 description 1
- 101000687438 Homo sapiens Prolactin Proteins 0.000 description 1
- 101000611183 Homo sapiens Tumor necrosis factor Proteins 0.000 description 1
- 102100027050 Inorganic pyrophosphatase Human genes 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 102000019010 Methylmalonyl-CoA Mutase Human genes 0.000 description 1
- 108010051862 Methylmalonyl-CoA mutase Proteins 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- 102100023206 Neuromodulin Human genes 0.000 description 1
- 241000208125 Nicotiana Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 1
- 241000150452 Orthohantavirus Species 0.000 description 1
- 241001527110 Plautia Species 0.000 description 1
- 108091036407 Polyadenylation Proteins 0.000 description 1
- 101800001072 Protein 1A Proteins 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 238000012181 QIAquick gel extraction kit Methods 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 229940022005 RNA vaccine Drugs 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 101000629318 Severe acute respiratory syndrome coronavirus 2 Spike glycoprotein Proteins 0.000 description 1
- 241000710960 Sindbis virus Species 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 241000723792 Tobacco etch virus Species 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 241000710155 Turnip yellow mosaic virus Species 0.000 description 1
- 102000009524 Vascular Endothelial Growth Factor A Human genes 0.000 description 1
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 1
- 241000710959 Venezuelan equine encephalitis virus Species 0.000 description 1
- 241000726445 Viroids Species 0.000 description 1
- 241001492404 Woodchuck hepatitis virus Species 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 125000003545 alkoxy group Chemical group 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 239000012504 chromatography matrix Substances 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 229960002104 cyanocobalamin Drugs 0.000 description 1
- 235000000639 cyanocobalamin Nutrition 0.000 description 1
- 239000011666 cyanocobalamin Substances 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 150000002367 halogens Chemical class 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 102000047486 human GAPDH Human genes 0.000 description 1
- 102000057063 human MAPT Human genes 0.000 description 1
- 102000057041 human TNF Human genes 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 229940092110 macugen Drugs 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical class CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 229960003512 nicotinic acid Drugs 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 239000012038 nucleophile Substances 0.000 description 1
- 230000000269 nucleophilic effect Effects 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 229940005014 pegaptanib sodium Drugs 0.000 description 1
- QGVYYLZOAMMKAH-UHFFFAOYSA-N pegnivacogin Chemical compound COCCOC(=O)NCCCCC(NC(=O)OCCOC)C(=O)NCCCCCCOP(=O)(O)O QGVYYLZOAMMKAH-UHFFFAOYSA-N 0.000 description 1
- 239000008177 pharmaceutical agent Substances 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- QQXQGKSPIMGUIZ-AEZJAUAXSA-N queuosine Chemical compound C1=2C(=O)NC(N)=NC=2N([C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)C=C1CN[C@H]1C=C[C@H](O)[C@@H]1O QQXQGKSPIMGUIZ-AEZJAUAXSA-N 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/64—General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/106—Plasmid DNA for vertebrates
- C12N2800/107—Plasmid DNA for vertebrates for mammalian
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/108—Plasmid DNA episomal vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/50—Vectors for producing vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2820/00—Vectors comprising a special origin of replication system
- C12N2820/60—Vectors comprising a special origin of replication system from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/60—Vector systems having a special element relevant for transcription from viruses
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Cell Biology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本揭露內容總體上關於用於製備環狀RNA的新型DNA建構體或RNA轉錄物,以及生產環狀RNA的新方法。
Description
本揭露內容總體上關於用於製備環狀RNA的新型DNA建構體或RNA轉錄物,以及生產環狀RNA的新方法。
自然界中發現的環狀RNA(或circRNA)是長的非編碼RNA分子,其形成共價閉合的連續環而沒有5’至3’極性。環狀RNA最初被報導為由共價閉合的環狀RNA分子組成的類病毒,對特定的高等植物具有致病性(Liu L,Wang J,Khanabdali R等人(2017)《環狀RNA:分離、表徵及其在疾病中的潛在作用(Circular RNAs: isolation, characterization and their potential role in diseases)》《
RNA 生物學(
RNA Biol)》14(12):1715-1721)。此後描述了許多物種中的其它類型的環狀RNA,包括D型肝炎病毒(HDV)的環狀單鏈RNA基因組,或作為古細菌中tRNA和rRNA成熟的產物或中間體的環狀RNA。環狀RNA通常透過上游外顯子的5’位點與該外顯子或下游外顯子的3’位點共價結合而形成。已經描述了兩種不同的環狀RNA生物發生模型,即套索(lariat)或外顯子跳躍模型和直接反向剪接模型。在套索模型中,在反向剪接之前發生標準剪接,而在直接反向剪接模型中,首先生成環狀RNA(Jeck WR,Sorrentino JA,Wang K等人(2013)《環狀RNA豐富、保守且與ALU重複序列連接(Circular RNAs are abundant, conserved, and associated with ALU repeats)》《
RNA》19:141-157;Barrett SP,Wang PL,Salzman J(2015)《環狀RNA生物發生可透過含外顯子的套索前體進行(Circular RNA biogenesis can proceed through an exon-containing lariat precursor)》《
生命科學在線(
Elife)》4:e07540)。
環狀RNA透過調節微RNA來調控基因表現,並作為潛在的生物標記發揮作用。環狀RNA可以在體內轉譯,將它們的表現與疾病聯繫起來(Li J,Yang J,Zhou P等人(2015a)《環狀RNA在癌症中的作用:對起源、性質、功能和意義的新見解(Circular RNAs in cancer: novel insights into origins, properties, functions and implications)》《
美國癌症研究雜誌(
Am J Cancer Res)》5(2):472;Li P,Chen S,Chen H等人(2015b)《環狀RNA作為一種新型生物標記在胃癌篩查中的應用(Using circular RNA as a novel type of biomarker in the screening of gastric cancer)》《
臨床化學學報(
Clin Chim Acta)》444:132-136;Greene J,Baird AM,Brady L等人(2017)《環狀RNA:生物發生、功能和在人類疾病中的作用(Circular RNAs: biogenesis, function and role in human diseases)》《
分子生物科學前沿(
Front Mol Biosci)》4:38)。環狀RNA對RNA核酸外切酶具有抗性,並且可以轉化為線性RNA(透過微RNA),然後作為內源性RNA的競爭者。環狀RNA作為臨床診斷標記或治療分子在疾病的預防和治療方面具有良好的應用前景。迄今為止,由於表現量低,很少有關於環狀RNA的報導發表。最初這些分子被認為是選擇性剪接的副產物,並被指定為遺傳事故或實驗錯誤(Liu L,Wang J,Khanabdali R等人(2017)《環狀RNA:分離、表徵及其在疾病中的潛在作用》《
RNA 生物學》14(12):1715-1721)。
環狀RNA在體內的廣泛存在以及對其結構和功能特性的研究已經引起了對允許在體外有效製備環狀RNA的方法的需求。據報導,有幾種方法可用於環狀RNA的體外產生,包括化學和酶方法,以及使用具有置換內含子和外顯子(PIE)策略的修飾的自剪接內含子(I型和II型)的方法。
這些工程化的環狀RNA可以攜帶IRES(內部核醣體進入位點)以有效地指導任何下游編碼序列在體內的表現,例如螢光素酶和SARS-CoV-2刺突蛋白的RBD的編碼序列(R. A. Wesselhoeft,P. S. Kowalski,D. G. Anderson,(2018)《工程化環狀RNA用於真核細胞中的有效和穩定轉譯(Engineering circular RNA for potent and stable translation in eukaryotic cells)》《
自然通訊(
Nat Commun)》9,2629;和Qu L.等人(2022)《抗SARS-CoV-2和新出現變體的環狀RNA疫苗(Circular RNA Vaccines against SARS-CoV-2 and Emerging Variants)》《
細胞(
Cell)》185(10):1728-1744。)因此,環狀RNA正成為mRNA作為治療劑和疫苗的替代品。
環狀RNA作為治療劑或疫苗相比線性mRNA具備若干優勢。它在體內更穩定,並且可以用較低的劑量達到所需的表現量。它具有低免疫原性,並且在治療中引起較少的毒性或較少的副作用。對於體外產生,環狀RNA的生產不需要昂貴的加帽(capping)步驟或加尾(tailing)步驟,而這些步驟在產生mRNA產物中通常是需要的。
仍然需要允許在體外高效和經濟地製備環狀RNA的方法,特別是在工業規模上,以促進在疾病診斷和治療中的研究與應用。
在整個揭露內容中,冠詞「一個(a)」、「一種(an)」和「該(the)」在本文中用於指該冠詞的語法對象中的一個或多於一個(即,至少一個)。例如,「一種方法」意指一種方法或多於一種方法。
本揭露內容提供了體外產生環狀RNA的新方法,以及允許透過所述方法產生環狀RNA的新型DNA建構體或RNA轉錄物。本揭露內容還提供了包含能夠產生環狀RNA的DNA建構體或RNA轉錄物,或透過所述方法產生的環狀RNA的組合物和試劑盒。
在一個方面,本揭露內容提供了一種用於製備環狀RNA的DNA建構體,所述DNA建構體包含與編碼能夠產生環狀RNA的RNA轉錄物的序列可操作地連接的RNA聚合酶啟動子,所述RNA轉錄物包含彼此可操作地連接並按以下順序排列的以下元件:
a)第一環化元件,
b)靶序列,和
c)第二環化元件,
其中所述RNA轉錄物能夠形成包含所述靶序列的所述環狀RNA;以及
其中所述RNA轉錄物進一步包含至少一個在所述環狀RNA中不存在的純化片段。
在某些實施方式中,RNA聚合酶啟動子是衍生自T7病毒、T6病毒、SP6病毒、T3病毒或T4病毒的RNA聚合酶啟動子。
在一個方面,本揭露內容提供了一種體外轉錄的RNA轉錄物,所述RNA轉錄物包含彼此可操作地連接並按以下順序排列的以下元件:
a)第一環化元件,
b)靶序列,和
c)第二環化元件,
其中所述RNA轉錄物能夠形成包含所述靶序列的環狀RNA;以及
其中所述RNA轉錄物進一步包含至少一個在所述環狀RNA中不存在的純化片段。
在某些實施方式中,至少一個純化片段與第一環化元件連接,或與第二環化元件連接。
在某些實施方式中,RNA轉錄物具有分別與第一環化元件和第二環化元件連接的兩個純化片段。
在某些實施方式中,至少一個純化片段:a)位於第一環化元件的上游(即5’純化片段),b)位於第二環化元件的下游(即3’純化片段),c)或a)和b)的任何組合。
在某些實施方式中,至少一個純化片段:a)附著於第一環化元件的5’端(即5’純化片段),或b)附著於第二環化元件的3’端(即3’純化片段),或a)和b)的任何組合。
在某些實施方式中,本文提供的RNA轉錄物具有5’純化片段和3’純化片段兩者,並且其中所述5’純化片段和所述3’純化片段在核苷酸序列上相同或不同。
在某些實施方式中,至少一個純化片段中的每一個在15至20個核苷酸的給定長度上與環狀RNA具有不超過90%(或不超過80%、不超過70%、不超過60%、不超過50%)的序列同一性。
在某些實施方式中,純化片段包含poly(A)短序列(tract)、poly(T)短序列、poly(U)短序列、poly(C)短序列、poly(G)短序列、poly(AC)短序列、poly(AG)短序列、poly(CT)短序列、poly(CU)短序列、poly(AT)短序列或poly(AU)短序列。在某些實施方式中,純化片段包含poly(A)短序列、poly(U)短序列、poly(C)短序列、poly(G)短序列、poly(AC)短序列、poly(AG)短序列、poly(CU)短序列或poly(AU)短序列。
在某些實施方式中,純化片段(例如poly(A)短序列)的長度範圍為15至200個核苷酸,任選地15至150個核苷酸。
在某些實施方式中,第一環化元件和第二環化元件可以衍生自自剪接系統。
在某些實施方式中,第一環化元件包含自剪接元件的3’部分,所述自剪接元件的3’部分包含3’剪接位點,並且第二環化元件包含自剪接元件的5’部分,所述自剪接元件的5’部分包含5’剪接位點。
在某些實施方式中,自剪接元件是I型內含子、II型內含子或髮夾核酶。
在某些實施方式中,I型內含子衍生自噬菌體T4胸苷酸合酶(td)基因、藍細菌魚腥藻(Cyanobacterium Anabaena sp.)pre-tRNA-Leu基因或四膜蟲基因。
在某些實施方式中,II型內含子衍生自乳酸乳球菌(L.lactis)Ll.LtrB基因,或衍生自酵母。
在某些實施方式中,髮夾核酶衍生自細菌、真核生物或植物病毒RNA衛星(例如菸草環斑病毒(tobacco ringspot virus,TRSV)衛星RNA、菊苣黃斑駁病毒(chicory yellow mottle virus,sCYMV)衛星RNA,或擬南芥花葉病毒(arabis mosaic virus,sARMV)衛星RNA)。
在某些實施方式中,靶序列包含靶蛋白編碼區。
在某些實施方式中,靶蛋白是治療性蛋白質(例如抗體、細胞激素、肽激素等)、預防性蛋白質(例如蛋白質疫苗等)、核酸酶(例如Cas蛋白、重組酶等)或受體(例如嵌合抗原受體等)。
在某些實施方式中,靶序列進一步包含與靶蛋白編碼區可操作地連接的內部核醣體進入位點(IRES)。在某些實施方式中,IRES可操作地連接在靶蛋白編碼區的上游或下游。
在某些實施方式中,IRES選自陶拉症候群病毒(Taura syndrome virus)、吸血獵椿病毒(Triatoma virus)、泰勒氏腦脊髓炎病毒(Theiler‘s encephalomyelitis virus)、猿猴病毒(simian Virus)40、紅火蟻病毒(Solenopsis invicta virus)1、禾谷縊管蚜病毒(Rhopalosiphum padi virus)、網狀內皮增生症病毒(Reticuloendotheliosis virus)、人脊髓灰質炎病毒(human poliovirus)1、斯氏珀蝽腸病毒(Plautia stali intestine virus)、克什米爾蜂病毒(Kashmir bee virus)、人鼻病毒2、琉璃葉蟬病毒(Homalodisca coagulata virus)1、人類免疫缺陷病毒1型、琉璃葉蟬病毒1、虱P病毒(Himetobi P virus)、C型肝炎病毒、A型肝炎病毒、GB型肝炎病毒、口蹄疫病毒、人腸病毒71型、馬鼻炎病毒(Equine rhinitis virus)、茶尺蠖樣病毒(Ectropis obliqua picoma-like virus)、腦心肌炎病毒(EMCV)、果蠅C病毒(Drosophila C Virus)、十字花科菸草花葉病毒(Crucifer tobamo virus)、蟋蟀麻痹病毒(Cricket paralysis virus)、牛病毒性腹瀉病毒(Bovine viral diarrhea virus)1、黑蜂王台病毒(Black Queen Cell Virus)、蚜蟲致死性麻痹病毒(Aphid lethal paralysis virus)、禽腦脊髓炎病毒(Avian encephalomyelitis virus)、急性蜂麻痹病毒(Acute bee paralysis virus)、木槿褪綠環斑病毒(Hibiscus chlorotic ringspot virus)、經典豬瘟病毒(Classical swine fever virus)、人FGF2、人SFTPA1、人AML1/RUNX1、果蠅觸角足(Drosophila antennapedia)、人AQP4、人AT1R、人BAG-1、人BCL2、人BiP、人c-IAP1、人c-myc、人eIF4G、小鼠NDST4L、人LEF1、小鼠HIF1 α、人n.myc、小鼠Gtx、人p27kip1、人PDGF2/c-sis、人p53、人Pim-1、小鼠Rbm3、果蠅reaper、犬科Scamper、果蠅Ubx、唾液病毒(Salivirus)、科薩病毒(Cosavirus)、雙埃柯病毒(Parechovirus)、人UNR、小鼠UtrA、人VEGF-A、人XIAP、果蠅無毛(Drosophila hairless)、釀酒酵母(S. cerevisiae)TFIID、釀酒酵母YAP1、人c-src、人FGF-1、猿猴小核醣核酸病毒(Simian picomavirus)、蕪菁皺縮病毒(Turnip crinkle virus)、eIF4G適體、克沙奇病毒(Coxsackievirus)B3(CVB3)或克沙奇病毒A(CVB1/2)的IRES序列。
在某些實施方式中,靶序列進一步包含與靶蛋白編碼區可操作地連接的5’非轉譯區(UTR)和/或3’UTR。
在某些實施方式中,靶序列包含生物活性RNA或生物活性RNA的前體。
在某些實施方式中,生物活性RNA包含短髮夾RNA、轉運RNA(tRNA)、短干擾RNA、微RNA(microRNA)或嚮導RNA。
在某些實施方式中,RNA轉錄物進一步包含至少一個同源臂。在某些實施方式中,同源臂位於第一環化元件的上游(即5’同源臂)和/或第二環化元件的下游(即3’同源臂)。在某些實施方式中,同源臂位於自剪接元件的3’部分的上游(即5’同源臂)和/或自剪接元件的5’部分的下游(即3’同源臂)。
在某些實施方式中,其中同源臂包含至少一個衍生自ALU重複序列的ALU元件。
在某些實施方式中,同源臂:a)插入5’純化片段和第一環化元件之間和/或插入3’純化片段和第二環化元件之間;或b)位於5’純化片段的上游和/或3’純化片段的下游。
在某些實施方式中,RNA轉錄物進一步包含至少一個間隔區,任選地該間隔區位於第一環化元件(例如自剪接元件的3’部分)和靶序列之間,和/或位於靶序列和第二環化元件(例如自剪接元件的5’部分)之間。
在某些實施方式中,RNA轉錄物進一步包含至少一個間隔區。在某些實施方式中,間隔區位於第一環化元件(例如自剪接元件的3’部分)和靶序列之間,和/或位於靶序列和第二環化元件(例如自剪接元件的5’部分)之間。在某些實施方式中,間隔區位於第一環化元件(例如自剪接元件的3’部分)和IRES序列之間,和/或位於靶序列和第二環化元件(例如自剪接元件的5’部分)之間。在某些實施方式中,間隔區位於第一環化元件(例如自剪接元件的3’部分)和靶蛋白編碼區之間,和/或位於靶蛋白編碼區和第二環化元件(例如自剪接元件的5’部分)之間。在某些實施方式中,靶序列包含位於靶序列側翼的兩個互補間隔區序列。
在一個方面,本揭露內容提供了一種DNA建構體,其包含可操作地彼此連接並以5’至3’順序排列的以下元件:
a)第一純化片段,任選地第一poly(A)短序列,和
b)多重選殖位,其包含或基本上由一個或多個用於插入靶序列的選殖位點組成。
在某些實施方式中,DNA建構體進一步包含位於多重選殖位下游的第二純化片段。
在某些實施方式中,DNA建構體進一步包含位於第一純化片段和多重選殖位之間的第一環化元件,和/或位於多重選殖位下游的第二環化元件。在某些實施方式中,第二環化元件位於多重選殖位和第二純化片段之間。
在某些實施方式中,DNA建構體進一步包含位於第一純化片段上游的RNA聚合酶啟動子。
在一個方面,本揭露內容提供了一種DNA建構體,其包含可操作地彼此連接並按以下順序排列的以下元件:
a)RNA聚合酶啟動子,
b)第一環化元件,
c)多重選殖位,和
d)第二環化元件,
其中DNA建構體進一步包含至少一個位於所述RNA聚合酶啟動子下游的純化片段。
在某些實施方式中,多個純化片段中的一個位於第一環化元件的上游和/或第二環化元件的下游。
在一個方面,本揭露內容提供了一種產生本文提供的RNA轉錄物的方法,該方法包括從本文提供的DNA建構體轉錄,從而獲得本文提供的RNA轉錄物。
在一個方面,本揭露內容提供了一種產生本文提供的RNA轉錄物的方法,該方法包括:
a)提供前體RNA,其與本文提供的RNA轉錄物的不同之處在於缺少純化片段,以及
b)將所述純化片段添加到所述前體RNA中,從而獲得本文提供的RNA轉錄物。
在某些實施方式中,前體RNA與本文提供的RNA轉錄物的不同之處僅在於缺少純化片段。
在某些實施方式中,純化片段被添加到:a)位於第一環化元件上游的位置,b)位於第二環化元件下游的位置,c)或a)和b)的任何組合。
在某些實施方式中,純化片段:a)附著於第一環化元件的5’端,或b)附著於第二環化元件的3’端,c)或a)和b)的任何組合。
在一個方面,本揭露內容提供了一種產生環狀RNA的方法,該方法包括:
a)提供本文提供的RNA轉錄物,以及
b)使所述RNA轉錄物自環化以形成環狀RNA。
在某些實施方式中,步驟a)中的RNA轉錄物已經使用捕獲劑富集,所述捕獲劑特異性結合存在於所述RNA轉錄物中的純化片段。
在某些實施方式中,該方法進一步包括透過捕獲劑從步驟b)獲得的產物中純化環狀RNA,其中所述捕獲劑特異性結合RNA轉錄物中的純化片段,以及任選地副產物中的但不存在於環狀RNA中的純化片段。
在某些實施方式中,捕獲劑包含能夠在嚴格條件下與純化片段雜交的核酸片段。在某些實施方式中,捕獲劑包含與純化片段的核苷酸序列至少80%、85%、90%、95%或100%互補的核酸片段。在某些實施方式中,捕獲劑包含能夠與本文提供的純化片段結合的蛋白質、肽、多醣或小分子。
在某些實施方式中,捕獲劑是固定的。
在某些實施方式中,步驟b)中的RNA轉錄物在溶液中經歷自環化或在固定有捕獲劑的固體基質上經歷自環化。
在某些實施方式中,純化片段包含poly(A)短序列,並且捕獲劑包含去氧胸苷寡核苷酸(oligo(dT))。
在某些實施方式中,步驟a)中的RNA轉錄物由本文提供的DNA建構體轉錄。
在某些實施方式中,該方法在步驟a)之前進一步包括由本文提供的DNA建構體轉錄以產生本文提供的RNA轉錄物。
在某些實施方式中,步驟a)中的RNA轉錄物透過本文提供的方法獲得。
在一個方面,本揭露內容提供了一種使用本文提供的方法產生的環狀RNA的組合物。
在一個方面,本揭露內容提供了一種包含本文提供的DNA建構體或本文提供的RNA轉錄物的組合物。
在一個方面,本揭露內容提供了一種包含本文提供的DNA建構體的試劑盒。
在一個方面,本揭露內容提供了一種用於產生本文提供的RNA轉錄物的試劑盒,其包含用於將純化片段添加到RNA轉錄物的前體中的試劑。
在某些實施方式中,試劑盒進一步包含捕獲劑,所述捕獲劑特異性結合存在於RNA轉錄物中但不存在於環狀RNA中的純化片段。
在某些實施方式中,純化片段包含poly(A)短序列。
在某些實施方式中,捕獲劑包含oligo(dT)。
本揭露內容的以下描述僅旨在說明本揭露內容的各種實施方式。因此,所討論的具體修改不應被解釋為對本揭露內容範圍的限制。對於所屬技術領域中具有通常知識者顯而易見的是,在不脫離本揭露內容的範圍的情況下,可以進行各種等同物、改變和修飾,並且應當理解,這些等同實施方式包括在本文中。本文引用的所有參考文獻,包括出版物、專利和專利申請,透過引用整體併入本文。
本揭露內容提供了可用於製備環狀RNA的新型組合物和方法。通常,環狀RNA的體外產生經歷兩個步驟,一個是體外轉錄以產生線性RNA前體,另一個是從前體形成環狀RNA的環化步驟。環化通常不是100%有效的,會留下一定量的前體RNA和中間體需要從環化產物中除去。由於前體和環狀RNA在大小和物理性質上的接近,難以用常規的層析方法(如離子交換或疏水相互作用)實現二者的完全分離。本領域已知的目前用於環狀RNA的純化方法使用HPLC SEC柱,但該方法不能擴展到工業規模,而且價格高昂。本揭露內容揭露了一系列含有一個或多個純化片段(PF)的設計的DNA建構體和RNA轉錄物。這些純化片段在環化後不存在於環狀RNA中,而且發現其在促進線性RNA轉錄物和環化中間體的去除方面出乎意料地有效,從而以方便和可規模化擴展的方式實現了環狀RNA產物的純化。純化步驟可以在實驗室和生產場所使用的普通層析設備中進行。可以容易地達到所需的純度(例如≥80%)。事實證明,這對於需要穩健和可規模化擴展的純化過程的治療劑和疫苗的製造是特別理想的。
用於環狀
RNA
製備的
DNA
建構體和
RNA
轉錄物
本揭露內容提供了一種用於製備環狀RNA的DNA建構體,該DNA建構體包含與編碼能夠產生環狀RNA的RNA轉錄物的序列可操作地連接的RNA聚合酶啟動子,所述RNA轉錄物包含彼此可操作地連接並按以下順序排列的以下元件:
a)第一環化元件,
b)靶序列,和
c)第二環化元件,
其中RNA轉錄物能夠形成包含靶序列的環狀RNA;並且其中RNA轉錄物進一步包含至少一個在環狀RNA中不存在的純化片段。
本揭露內容還提供了一種體外轉錄的RNA轉錄物,所述RNA轉錄物包含彼此可操作地連接並按以下順序排列的以下元件:
a)第一環化元件,
b)靶序列,和
c)第二環化元件,
其中RNA轉錄物能夠形成包含靶序列的環狀RNA;並且其中RNA轉錄物進一步包含至少一個在環狀RNA中不存在的純化片段。
如本文所用,術語「circRNA」或「環狀RNA」可互換使用,是指透過共價鍵形成環狀結構的多核醣核苷酸。
如本文所用,術語「DNA建構體」是指可插入或已經插入外源DNA片段的一段DNA。DNA建構體具有任何長度和任何序列,並且可以是線性的或環狀的。DNA建構體可以合成(例如,使用PCR),或者可以衍生自病毒、質體或高等生物的細胞。該術語包括線性DNA片段(例如,PCR產物、線性化質體片段)、質體載體、病毒載體、黏質體、細菌人工染色體(BAC)、酵母人工染色體(YAC)等。DNA建構體可以包含例如複製起點、選擇性標記或報告基因(如抗生素抗性或GFP)、RNA聚合酶啟動子和/或RNA聚合酶終止子。DNA建構體可以是PCR擴增的線性片段,其含有透過體外轉錄製備本文提供的RNA轉錄物的必需元件。
術語「核酸」或「核苷酸」包括能夠以序列特異性方式與天然存在的核酸雜交的天然存在的物種以及其任何類似物、變體和任何模擬物,例如,能夠與兩個核酸雜交使得可以在兩個雜交的核酸之間發生連接,或能夠用作特定核苷酸序列複製的模版。天然存在的核苷酸的類似物、變體和任何模擬物可以在鹼基、醣和/或磷酸鹽的化學結構中具有修飾。鹼基修飾的實例包括但不限於5’-位嘧啶修飾、8’-位嘌呤修飾、胞嘧啶環外胺修飾和5-溴-尿嘧啶取代。核苷酸類似物的實例包括5-甲氧基尿苷、假尿苷、1-甲基假尿苷和6-甲基腺苷。醣的修飾的實例包括但不限於醣修飾的核醣核苷酸,其中2’-OH被諸如H、烷氧基、烷基、鹵素、SH、SR、NH
2、NHR、NR
2或CN的基團替代,其中R是烷基部分。磷酸二酯鍵的修飾的實例包括但不限於甲基膦酸酯、硫代磷酸酯和肽鍵。核苷酸還意在包括具有以下的核苷酸:諸如肌苷、辮苷(queuosine)、黃嘌呤(xanthine)等鹼基;諸如2’-甲基核醣等醣。在某些實施方式中,核酸分子可以是DNA或RNA。
術語「RNA」或「核醣核酸」包括具有選自由腺嘌呤(A)、尿嘧啶(U)、胞嘧啶(C)或鳥嘌呤(G)組成的組的鹼基的天然RNA種類,以及能夠與天然RNA進行鹼基配對的任何非天然RNA或其類似物、變體和任何模擬物。
術語「DNA」或「去氧核醣核酸」包括具有選自由腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)或鳥嘌呤(G)組成的組的鹼基的天然DNA種類,以及能夠與天然DNA進行鹼基配對的任何非天然DNA或其類似物、變體和任何模擬物。
關於核苷酸序列(或胺基酸序列)的「序列同一性百分比(%)」被定義為在比對序列並在必要時引入空位以實現最大對應之後,候選序列中與參考序列中的核苷酸(或胺基酸)殘基相同的核苷酸(或胺基酸)殘基的百分比。用於確定核苷酸(或胺基酸)序列同一性百分比的比對可以例如使用諸如BLASTN、BLASTP(可在美國國家生物技術資訊中心(NCBI)的網站上獲得,另見Altschul S.F.等人,《分子生物學雜誌(J. Mol.Biol.)》,215:403-410(1990);Stephen F.等人,《核酸研究(Nucleic Acids Res.)》,25:3389-3402(1997))、ClustalW2(可在歐洲生物資訊學研究所(European Bioinformatics Institute)的網站上獲得,另見Higgins D.G.等人,《酶學方法(Methods in Enzymology)》,266:383-402(1996);Larkin M.A.等人,《生物資訊學(Bioinformatics)》(英國牛津),23(21): 2947-8(2007))和ALIGN或MegAlign(DNASTAR)軟體等公眾可獲得的工具實現。所屬技術領域中具有通常知識者可以使用由工具提供的預設參數,或者可以制定適合於比對的參數,例如透過選擇合適的演算法。
術語「互補的」或「互補性」是指核酸透過傳統的華生-克里克(Watson-Crick)或其它非傳統類型與另一核酸序列形成氫鍵的能力。互補性百分比表示核酸分子中可與另一核酸序列形成氫鍵的殘基的百分比(例如,5、6、7、8、9、10/10為50%、60%、70%、80%、90%和100%互補)。可以使用基本的局部比對搜索工具(BLAST程序)(Altschul(1990)《分子生物學雜誌》215,403-410;Zhang和Madden(1997)《基因組研究(Genome Res.)》7,649-656)常規地確定互補性百分比。
術語「雜交(hybridizing)」或「雜交(hybridize)」是指兩個不同分子內或兩個片段內基本上互補或互補的核酸序列的配對。配對可以透過任何方法實現,其中核酸序列透過鹼基配對與基本上或完全互補的序列結合以形成雜交複合物。
本文所用的「嚴格條件」是指核苷酸序列與其靶核苷酸序列雜交但不會與其它非互補序列雜交的條件。嚴格條件是序列依賴性的,並且在不同的情況下是不同的。例如,對於特異性雜交,較長的片段可能比較短的片段需要更高的雜交溫度。由於其它可能影響雜交嚴格性的因素,包括互補鏈的鹼基組成和長度、有機溶劑的存在和鹼基錯配的程度,參數的組合比任何一個參數單獨的絕對量度更重要。通常,嚴格條件被選擇為比特定序列在限定的離子強度和pH下的熔解溫度(Tm)低約5℃。因此,選擇與靶充分互補的寡核苷酸,即充分良好雜交並具有足夠特異性的寡核苷酸,以產生所需的效果,同時努力避免顯著的脫靶效應,即不直接與預期靶以外的靶結合。
如本文所用,關於核苷酸序列的術語「下游」意指朝向核苷酸序列的3’端。
如本文所用,關於核苷酸序列的術語「上游」意指朝向核苷酸序列的5’端。
如本文所用,術語「可操作地連接」是指元件的佈置,其中如此描述的組件被配置以執行它們通常的功能。因此,例如,當給定的啟動子與編碼DNA序列可操作地連接時,該啟動子能夠在諸如RNA聚合酶等適當酶的存在下影響編碼DNA序列的表現。表現意指包括環狀RNA、編碼環狀RNA的重組核酸或來自DNA或RNA模版的mRNA的轉錄中的任一種或多種的轉錄,並且可進一步包括來自mRNA模版或包含IRES序列的環狀RNA的蛋白質的轉譯。啟動子不需要與編碼序列鄰接,只要它能指導其表現。因此,例如,插入的未轉譯但已轉錄的序列可存在於啟動子序列和編碼序列之間,並且啟動子序列仍可被認為與編碼序列「可操作地連接」。
如本文所用,術語「RNA聚合酶啟動子」是指能夠募集RNA聚合酶(例如RNA聚合酶II)並啟動DNA轉錄成RNA的DNA調控區。RNA聚合酶啟動子可以在其3’末端具有轉錄起始位點,其中轉錄從該位點開始。啟動子序列包括具有在高於背景的可檢測量上啟動轉錄所必需的元件的最小數目的鹼基。通常,RNA聚合酶啟動子序列具有負責RNA聚合酶結合的蛋白質結合區。在某些實施方式中,RNA聚合酶啟動子可以選自但不限於衍生自T7病毒、T6病毒、SP6病毒、T3病毒或T4病毒的RNA聚合酶啟動子。
在某些實施方式中,DNA建構體進一步包含RNA聚合酶終止子。如本文所用,「RNA聚合酶終止子」是指包含至少一個離散終止子序列的元件,其中RNA聚合酶的轉錄在此終止。終止子引起RNA的釋放和轉錄複合物的解離。在某些實施方式中,RNA聚合酶終止子可以選自但不限於衍生自T7病毒、T6病毒、SP6病毒、T3病毒或T4病毒的RNA聚合酶終止子。
本文所用的「RNA轉錄物」是指從給定DNA建構體轉錄的線性核酸片段。在一個實施方式中,編碼RNA轉錄物的序列包含在DNA建構體中並位於RNA聚合酶啟動子的下游。例如,本文提供的RNA轉錄物可由本文提供的DNA建構體轉錄。在另一實施方式中,RNA轉錄物在體外提供或合成。
本文提供的RNA轉錄物能夠產生環狀RNA。本文提供的RNA轉錄物包含彼此可操作地連接並按以下順序(例如5’至3’)排列的以下元件:a)第一環化元件,b)靶序列,和c)第二環化元件,並且進一步包含至少一個在環狀RNA中不存在的純化片段,並且其中RNA轉錄物能夠形成包含靶序列的環狀RNA。
1.
環化元件
如本文所用,術語「環化元件」是指至少一個核酸片段,其以促進線性RNA自環化形成環狀RNA的方式與線性RNA可操作地連接。由本文提供的RNA轉錄物產生的環狀RNA包含靶序列。在某些實施方式中,RNA轉錄物中的環化元件包含或者是RNA片段。
在某些實施方式中,第一環化元件位於靶序列的上游,和/或第二環化元件位於靶序列的下游。在某些實施方式中,RNA轉錄物包含分別位於靶序列上游和下游的至少一對環化元件。
在某些實施方式中,環化元件衍生自自剪接系統。在某些實施方式中,環化元件可以衍生自I型內含子自剪接系統、II型內含子自剪接系統或髮夾核酶。
I型內含子自剪接系統關於主要位於真核微生物的基因組核醣體RNA區域內的I型內含子。I型內含子的特徵在於保守序列和結構特徵的線性陣列(linear array),並且透過兩次連續的酯交換(transesterification)進行切除。I型內含子募集外部鳥苷作為親核試劑來啟動剪接。在該過程期間,鳥苷核苷酸的3’羥基在5’外顯子-內含子接合處(5’剪接位點)參與酯交換反應,從而導致5’內含子部分的切除,留下在5’外顯子的端部具有游離3’-羥基的中間體。游離的羥基在3’外顯子-內含子接合處(3’剪接位點)參與第二次酯交換,從而導致插入區域的環化和3’內含子部分的切除。詳見Wesselhoeft R. A等人,《工程化環狀RNA用於真核細胞中的有效和穩定轉譯》,《
自然通訊(
Nature Communications)》,(2018)9:2629。
II型內含子自剪接系統是可移動的遺傳元件,其透過使用類似於經典剪接體剪接反應的酯交換反應自動催化從前體RNA的自身剪接。已經在細菌和真菌、植物、原生生物以及環節動物蠕蟲的粒線體(mt)和葉綠體(cp)基因組中發現了II型內含子。II型內含子RNA的特徵在於保守的二級結構,其跨度為400至800個nt並被組織成六個結構域,即DI-VI,從中心「輪」輻射。這些結構域相互作用形成保守的三級結構,將遠處的序列聚集在一起形成活性位點。活性位點結合剪接位點和分支點核苷酸殘基,並使用特異性結合的Mg++離子來活化適當的鍵進行催化。
II型內含子透過兩次連續的酯交換反應催化它們自身的剪接,生成分叉的套索中間體和套索-內含子。具有互補序列的兩個內含子部分可以雜交,從而把5’-內含子和3’-內含子-外顯子接合處(3’-剪接位點)的分支點並置,用於親核攻擊和切割。在3’外顯子釋放後,3’剪接位點的末端2’-OH基團攻擊5’-內含子-外顯子接合處(5’剪接位點),連接兩個外顯子並釋放具有2’至5’磷酸二酯鍵的內含子套索(環化的)RNA。詳見Llorente-Cortés, V.等人,《實驗醫學和生物學進展(Advances in Experimental Medicine and Biology)》,第1087卷,《環狀RNA:生物發生和功能(Circular RNAs: Biogenesis and Functions)》一章,施普林格(Springer)出版;Petkovic, S.等人,《體內和體外的RNA環化策略(RNA circularization strategies
in vivoand
in vitro)》,《
核酸研究(
Nucleic Acids Research)》,2015,第43卷,第4期,2454-2465;Lambowitz, A. M.等人,《
冷泉港生物學展望(
Cold Spring Harb Perspect Biol.)》2011年8月;3(8): a003616。
髮夾核酶(HPR)是另一種允許自剪接和生成環狀RNA的系統。具有HPR的線性RNA可以折疊成兩種切割活性構象,這兩種構象都針對兩個可能的切割位點中的一個。在任一構象中發生第一次切割後,RNA片段被切割,生成5’-OH和2’,3’-環狀磷酸酯(2’,3’-cP)。然後將髮夾核酶重折疊成另一種構象,從而發生第二次切割反應,生成另一段切割後的RNA片段以及5’-OH和2’,3’-cP。因此,切割後的中間體將含有5’-OH(在3’外顯子處)和2’,3’-環狀磷酸酯(在5’外顯子處),它們可以連接以產生靶circRNA。詳見Chen, XJ等人,《環狀RNA:體外生物合成(Circular RNA: Biosynthesis
in vitro)》,《
生物工程與生物技術前沿(
Front. Bioeng. Biotechnol.)》,2021年11月30日;Hieronymus, R.等人,《透過工程化髮夾核酶變體進行RNA自剪接(RNA self-splicing by engineered hairpin ribozyme variants)》,《
核酸研究》,第50卷,第1期,2022年1月11日,第368至377頁,Diegelman, A. M.等人,《透過編碼髮夾核酶的環狀DNA寡核苷酸的滾動轉錄生成環狀RNA和反式切割催化RNA(Generation of circular RNAs and trans-cleaving catalytic RNAs by rolling transcription of circular DNA oligonucleotides encoding hairpin ribozymes)》,《
核酸研究》,1998,第26卷,第13期:3235-3241。髮夾核酶是本技術領域習知的,並且許多天然髮夾核酶以及人工設計的髮夾核酶也是已知的(Christina E Weinberg等人,《在不同的環狀RNA中鑑定出比先前已知的多200倍以上的髮夾核酶(Identification of over 200-fold more hairpin ribozymes than previously known in diverse circular RNAs)》,《
核酸研究》2021年6月21日;49(11):6375-6388)。在某些實施方式中,髮夾核酶衍生自細菌、真核生物或植物病毒RNA衛星(例如菸草環斑病毒(TRSV)衛星RNA、菊苣黃斑駁病毒(sCYMV)衛星RNA,或擬南芥花葉病毒(sARMV)衛星RNA)。
在某些實施方式中,第一環化元件包含自剪接元件的3’部分,所述自剪接元件的3’部分包含3’剪接位點,第二環化元件包含自剪接元件的5’部分,所述自剪接元件的5’部分包含5’剪接位點。
如本文所用,術語「剪接位點」是指部分或完全包括在自剪接元件中的二核苷酸,並且在RNA環化期間在該二核苷酸之間磷酸二酯鍵被切割。
如本文所用,「自剪接元件的3’部分」是與天然I型內含子、天然II型內含子或天然髮夾核酶的3’近端片段(包括3’剪接位點二核苷酸)具有至少75%(例如,至少80%、至少85%、至少90%、至少95%、100%)序列同一性的連續序列,以及,任選地,長度為至少1個核苷酸(例如,長度為至少5個核苷酸、長度為至少10個核苷酸、長度為至少15個核苷酸、長度為至少20個核苷酸、長度為至少25個核苷酸、長度為至少50個核苷酸)的相鄰外顯子序列。
如本文所用,「自剪接元件的5’部分」是與天然I型內含子、天然II型內含子或天然髮夾核酶的5’近端片段(包括5’剪接位點二核苷酸)具有至少75%(例如,至少80%、至少85%、至少90%、至少95%、100%)序列同一性的連續序列,以及,任選地,長度為至少1個核苷酸(例如,長度為至少5個核苷酸、長度為至少10個核苷酸、長度為至少15個核苷酸、長度為至少20個核苷酸、長度為至少25個核苷酸、長度為至少50個核苷酸)的相鄰外顯子序列。
在某些實施方式中,I型內含子衍生自噬菌體T4胸苷酸合酶(td)基因、藍細菌魚腥藻(Cyanobacterium Anabaena sp.)的pre-tRNA-Leu基因或四膜蟲(Tetrahymena)基因。在某些實施方式中,II型內含子衍生自乳酸乳球菌(
L. lactis)Ll.LtrB基因,或衍生自酵母。
在某些實施方式中,如本文提供的自剪接元件的3’部分由包含SEQ ID NO: 7
(AACAATAGATGACTTACAACTAATCGGAAGGTGCAGAGACTCGACGGGAGCTACCCTAACGTCAAGACGAGGGTAAAGAGAGAGTCCAATTCTCAAAGCCAATAGGCAGTAGCGAAAGCTGCAAGAGAATGAAAATCCGTTGACCTTAAACGGTCGTGTGGGTTCAAGTCCCTCCACCCCCA)的核酸序列編碼。
在某些實施方式中,如本文提供的自剪接元件的5’部分由包含SEQ ID NO: 12
(AGACGCTACGGACTTAAATAATTGAGCCTTAAAGAAGAAATTCTTTAAGTGGATGCTCTCAAACTCAGGGAAACCTAAATCTAGTTATAGACAAGGCAATCCTGAGCCAAGCCGAAGTAGTAATTAGTAAG)的核酸序列編碼。
2.
靶序列
如本文所用,術語「靶序列」可以是可插入編碼RNA轉錄物的序列中的且包含在由本文提供的RNA轉錄物轉錄的環狀RNA中的任何感興趣的序列。靶序列包含蛋白質編碼或非編碼區。在某些實施方式中,靶序列包含靶蛋白編碼區。在某些實施方式中,靶序列包含生物活性RNA或生物活性RNA的前體。在某些實施方式中,靶序列包含或基本上由一個或多個選殖位點組成。
靶序列可以包含靶蛋白編碼區。在某些實施方式中,蛋白質編碼區編碼真核或原核來源的蛋白質。在某些實施方式中,蛋白質編碼區編碼人蛋白質或非人蛋白質。在某些實施方式中,蛋白質可以是用於研究用途、治療用途或診斷用途的任何蛋白質。在一些實施方式中,蛋白質可以是治療性蛋白質,例如抗體、細胞激素、肽激素等。在某些實施方式中,蛋白質可以是預防性蛋白質,例如蛋白質疫苗等。在某些實施方式中,蛋白質可以是核酸酶,例如Cas蛋白質、重組酶等。在某些實施方式中,蛋白質可以是受體,例如嵌合抗原受體等。在一些實施方式中,蛋白質可以選自但不限於hFIX、SP-B、VEGF-A、人甲基丙二醯輔酶A變位酶(hMUT)、CFTR、癌症自身抗原和其它基因編輯酶,如Cpf1、鋅指核酸酶(ZFN)和轉錄活化物樣效應物核酸酶(TALEN)。
在某些實施方式中,靶序列進一步包含與靶蛋白編碼區可操作地連接的5’非轉譯區(UTR)和/或3’UTR。5’UTR可以選自但不限於人β珠蛋白、非洲爪蟾(Xenopus laevis)β珠蛋白、人α珠蛋白、非洲爪蟾α珠蛋白、風疹病毒(rubella virus)、菸草花葉病毒(tobacco mosaic virus)、小鼠Gtx、登革病毒(dengue virus)、熱休克蛋白70 kDa蛋白1A(heat shock protein 70 kDa protein 1A)、菸草醇脫氫酶、菸草蝕紋病毒(tobacco etch virus)、蕪菁皺縮病毒(turnip crinkle virus)或腺病毒三聯前導序列(adenovirus tripartite leader)的5’UTR。3’UTR可以選自但不限於人β珠蛋白、人α珠蛋白、非洲爪蟾β珠蛋白、非洲爪蟾α珠蛋白、人催乳素、人GAP-43、人eEF1a1、人Tau、人TNF α、登革病毒、漢坦病毒小mRNA(hantavirus small mRNA)、布尼亞病毒小mRNA(bunyanavirus small mRNA)、蕪菁黃花葉病毒(turnip yellow mosaic virus)、C型肝炎病毒、風疹病毒(rubella virus)、菸草花葉病毒(tobacco mosaic virus)、人IL-8、人肌動蛋白、人GAPDH、人微管蛋白、木槿褪綠環斑病毒(hibiscus chlorotic rinsgpot virus)、土撥鼠肝炎病毒轉譯後調控元件(woodchuck hepatitis virus post translationally regulated element)、辛德畢斯病毒(sindbis virus)、蕪菁皺縮病毒、菸草蝕紋病毒或委內瑞拉馬腦炎病毒(Venezuelan equine encephalitis virus)的3’UTR。野生型5’UTR和/或3’UTR序列也可以被修飾並且在本發明中是有效的。
在某些實施方式中,靶序列進一步包含與靶蛋白編碼區可操作地連接的內部核醣體進入位點(IRES)。在某些實施方式中,IRES可操作地連接在靶蛋白編碼區的上游或下游。IRES序列可以選自但不限於陶拉症候群病毒(Taura syndrome virus)、吸血獵椿病毒(Triatoma virus)、泰勒氏腦脊髓炎病毒(Theiler’s encephalomyelitis virus)、猿猴病毒40(Simian virus 40)、紅火蟻病毒1(Solenopsis invicta virus 1)、禾谷縊管蚜病毒(Rhopalosiphum padi virus)、網狀內皮增生症病毒(Reticuloendotheliosis virus)、人脊髓灰質炎病毒1、斯氏珀蝽腸病毒(Plautia stall intestine virus)、克什米爾蜂病毒(Kashmir bee virus)、人鼻病毒2(Human rhinovirus 2)、琉璃葉蟬病毒1(Homalodisca coagulata virus-1)、人類免疫缺陷病毒1型、琉璃葉蟬病毒1、虱P病毒(Himetobi P virus)、C型肝炎病毒、A型肝炎病毒、GB型肝炎病毒、口蹄疫病毒(foot and mouth disease virus)、人腸病毒71型(Human enterovirus 71)、馬鼻炎病毒(Equine rhinitis virus)、茶尺蠖樣病毒(Ectropis obliqua picoma-like virus)、腦心肌炎病毒(Encephalomyocarditis virus(EMCV))、果蠅C病毒、十字花科菸草花葉病毒(Crucifer tobaco virus)、蟋蟀麻痹病毒(Cricket paralysis virus,)、牛病毒性腹瀉病毒1(Bovine viral diarrhea virus 1)、黑蜂王台病毒(Black queen cell virus)、蚜蟲致死性麻痹病毒(Aphid lethal paralysis virus)、禽腦脊髓炎病毒(Avian encephalomyelitis virus)、急性蜂麻痹病毒(Acute bee paralysis virus)、木槿褪綠環斑病毒、經典豬瘟病毒(Classical swine fever virus)、人FGF2、人SFTPA1、人AML1/RUNX1、果蠅觸角足(Drosophila antennapedia)、人AQP4、人AT1R、人BAG-1、人BCL2、人BiP、人c-IAP1、人c-myc、人eIF4G、小鼠NDST4L、人LEF1、小鼠HIF1 α、人n.myc、小鼠Gtx、人p27kip1、人PDGF2/c-sis、人p53、人Pim-1、小鼠Rbm3、果蠅reaper、犬科Scamper、果蠅Ubx、唾液病毒(Salivirus)、科薩病毒(Cosavirus)、雙埃柯病毒(Parechovirus)、人UNR、小鼠UtrA、人VEGF-A、人XIAP、果蠅無毛(Drosophila hairless)、釀酒酵母TFIID、釀酒酵母YAP1(S. cerevisiae TFIID)、人c-src、人FGF-1、猿猴小核醣核酸病毒(Simian picomavirus)、蕪菁皺縮病毒、eIF4G適體、克沙奇病毒B3(Coxsackievirus B3(CVB3))或克沙奇病毒A(Coxsackievirus A(CVB1/2))的IRES序列。野生型IRES序列也可以被修飾並在本發明中是有效的。在一些實施方式中,IRES序列的長度為約50個核苷酸。
在某些實施方式中,靶序列可以包含非編碼RNA。在某些實施方式中,靶序列可以包含生物活性RNA或生物活性RNA的前體。在某些實施方式中,生物活性RNA包含短髮夾RNA、轉運RNA(tRNA)、短干擾RNA、微RNA(microRNA)或嚮導RNA。可以加工生物活性RNA的前體以產生生物活性RNA。例如,短髮夾RNA可以加工成生物活性siRNA,其可以是siRNA的前體。
3.
純化片段
在某些實施方式中,RNA轉錄物具有至少一個純化片段。
如本文所用,術語「純化片段」是指存在於RNA轉錄物中但不存在於由RNA轉錄物產生的環狀RNA中的核酸片段。至少一個純化片段位於RNA轉錄物內,但不在靶序列內。由RNA轉錄物產生的環狀RNA中不包括純化片段,並且其存在不會顯著減少環狀RNA的產生。換言之,包含至少一個本文提供的純化片段的RNA轉錄物仍可以被環化以產生環狀RNA。在某些實施方式中,RNA轉錄物中的純化片段包含或者是RNA片段。
純化片段的核酸序列可充分區別於環狀RNA的任何等長片段。設計可用作純化片段的獨特核苷酸序列以區別於給定的環狀RNA序列的方法是本領域已知的。
在某些實施方式中,純化片段可以是存在於RNA轉錄物中但不存在於由RNA轉錄物產生的環狀RNA中的RNA序列。
在某些實施方式中,至少一個純化片段中的每一個在15至20個核苷酸(nt),或15nt至25nt,或15nt至40nt,或15nt至50nt的給定長度上與環狀RNA具有不超過90%(或不超過80%、不超過70%、不超過60%、不超過50%)的序列同一性。
例如,當純化片段的長度短於或在15至20nt、15nt至25nt,或15nt至40nt,或15nt至50nt的範圍內時,純化片段可以在純化片段的整個長度上與環狀RNA具有不超過90%、不超過80%、不超過70%、不超過60%、不超過50%,或不超過40%的序列同一性。
再比如,當純化片段的長度長於15至20nt、15nt至25nt,或15nt至40nt,或15nt至50nt的給定長度範圍的上限時,則純化片段的給定長度片段可以與環狀RNA的等長片段具有不超過90%、不超過80%、不超過70%、不超過60%、不超過50%,或不超過40%的序列同一性。
在某些實施方式中,至少一個純化片段與環狀RNA的等長片段相差至少1、2、3、4、5、6、7、8、9、10個或甚至更多個核苷酸。
在某些實施方式中,至少一個純化片段的長度在15至500個核苷酸、15至300個核苷酸、15至200個核苷酸、15至150個核苷酸、15至100個核苷酸、15至50個核苷酸、15至25個核苷酸、20至500個核苷酸、20至300個核苷酸、20至200個核苷酸、20至150個核苷酸、20至100個核苷酸、20至50個核苷酸或20至25個核苷酸的範圍內。
在某些實施方式中,純化片段不是環化元件的一部分。
在某些實施方式中,純化片段包含或基本上由均多聚或均寡聚序列組成,僅舉幾個例子,諸如poly(A)、poly(U)、poly(T)、poly(C)、poly(G)、poly(AT)、poly(TC)、poly(AU)、poly(UC)、poly(AC)、poly(CA)、poly(AG)、poly(GA)。在某些實施方式中,純化片段包含或基本上由均多聚或均寡聚RNA序列組成,僅舉幾個例子,諸如poly(A)、poly(U)、poly(C)、poly(G)、poly(AU)、poly(UC)、poly(AC)、poly(CA)、poly(AG)或poly(GA)。本文所用的關於純化片段的術語「聚(poly)」意在指任何合適長度的核苷酸(即多於1個)。
在某些實施方式中,純化片段包含或基本上由隨機N-mer序列或隨機N-mer序列的重複組成。在某些實施方式中,N可以是5和45之間的任何整數。這些N-mer序列的重複數目可以是1、2、3、4、5、6、7、8、9或10。
在某些實施方式中,純化片段包含或基本上由靶結合寡核苷酸組成,靶結合寡核苷酸能夠特異性結合非核苷酸的靶。在某些實施方式中,靶可以是蛋白質、肽、多醣或小分子。在某些實施方式中,純化片段可以是形成與靶特異性結合的二級結構的適體。靶可以是用於蛋白質純化的常見親和配體之一,諸如生物素、鏈黴親和素、榖胱甘肽、幾丁質、蛋白A和蛋白G。優化鏈黴親和素結合RNA適體並將其用於核醣核蛋白的純化(《用於純化核醣核蛋白複合物的優化的鏈黴親和素結合RNA適體鑒定新的ARE結合蛋白(An optimized streptavidin-binding RNA aptamer for purification of ribonucleoprotein complexes identifies novel ARE-binding proteins)》,《
核酸研究》2014年1月;42(2):e13)。適合作為本文提供的純化片段的適體也可以是ARC1905、E10030、呱加他尼鈉(Pegaptanib sodium)(Macugen)、EYE001、REG1、NOX-E36、NOX-A12、ARC1779等。可用的適體及其標靶已描述於參考文獻中(例如《治療性基因組學和蛋白質組學遞送中的挑戰(Challenges in delivery of therapeutic genomics and proteomics[M])》愛思唯爾(Elsevier),2010.),其可以透過引用整體併入本文。
在某些實施方式中,純化片段包含或基本上由poly(A)短序列組成。在某些實施方式中,poly(A)短序列具有15至200個核苷酸、15至150個核苷酸、15至100個核苷酸、15至50個核苷酸或15至25個核苷酸的長度範圍。在某些實施方式中,poly(A)短序列具有15至150個核苷酸的長度範圍。
純化片段能夠特異性地與RNA轉錄物外部的捕獲劑相互作用或結合。捕獲劑可以特異性地與純化片段相互作用、結合或雜交,但不與環狀RNA相互作用、結合或雜交,從而允許環狀RNA從RNA轉錄物中分離。捕獲劑可以是能夠與純化片段特異性相互作用或結合的任何分子實體。捕獲劑的實例包括但不限於核酸序列,或核酸結合蛋白或肽,或化合物或聚合物或能夠結合純化片段的任何其它分子或材料。
在某些實施方式中,捕獲劑包含核酸序列。在某些實施方式中,捕獲劑可以包含天然存在的核酸和/或其類似物、變體和任何模擬物。捕獲劑可以具有任何合適的核苷酸長度(例如15nt至25nt,或15nt至40nt,或15nt至50nt),只要它可以與純化片段雜交。
在某些實施方式中,捕獲劑包含能夠在嚴格條件下與純化片段雜交的核酸片段。在某些實施方式中,捕獲劑包含或基本上由與純化片段互補的DNA或RNA的均多聚或均寡聚序列組成,包括其類似物、變體和任何模擬物。在某些實施方式中,僅舉幾個例子,捕獲劑包含以下或基本上由以下組成:去氧胸苷寡核苷酸(oligo(dT))、去氧腺嘌呤寡核苷酸(oligo(dA))、寡核苷酸(去氧腺嘌呤:去氧胸苷(oligo(dA:dT))、去氧胞嘧啶寡核苷酸(oligo(dC))、去氧鳥苷寡核苷酸(oligo(dG))、尿苷寡核苷酸(oligo(U))、去氧尿苷寡核苷酸(oligo(dU))。
在某些實施方式中,捕獲劑包含能夠與本文提供的純化片段結合的蛋白質、肽、多醣或小分子。在某些實施方式中,捕獲劑包含能夠與包含在純化片段中的適體片段結合的蛋白質、肽、多醣或小分子。在某些實施方式中,捕獲劑包含或者是常見的親和配體,諸如生物素、鏈黴親和素、榖胱甘肽、幾丁質、蛋白A和蛋白G。
在某些實施方式中,捕獲劑包含與純化片段的核苷酸序列至少80%、85%、90%、95%或100%互補的核酸片段。在某些實施方式中,純化片段包含或基本上由poly(A)短序列組成,並且捕獲劑包含oligo(U)、oligo(dU)、oligo(dT)或任何能夠與poly(A)短序列雜交的寡核苷酸。oligo(dT)的一個實例是本領域中廣泛用於純化具有poly(A)尾的mRNA的試劑。
在某些實施方式中,捕獲劑可以任選地固定在基底(諸如珠(例如磁珠))或層析基質上。
本文提供的RNA轉錄物包含至少一個純化片段,例如1或2個或甚至更多個純化片段。
在某些實施方式中,至少一個純化片段與第一環化元件連接,或與第二環化元件連接。在某些實施方式中,RNA轉錄物具有分別與第一環化元件和第二環化元件連接的兩個純化片段。
在某些實施方式中,至少一個純化片段:a)位於第一環化元件的上游,b)位於第二環化元件的下游,c)或a)和b)的任何組合。在某些實施方式中,至少一個純化片段:a)附著於第一環化元件的5’端,或b)附著於第二環化元件的3’端,或a)和b)的任何組合。
在某些實施方式中,RNA轉錄物包含位於第一環化元件上游的一個純化片段,其在本文中也稱為5’純化片段。在某些實施方式中,RNA轉錄物包含位於第二環化元件下游的一個純化片段,其在本文中也稱為3’純化片段。在某些實施方式中,RNA轉錄物包含分別位於第一環化元件上游和第二環化元件下游的5’純化片段和3’純化片段兩者。
在某些實施方式中,5’純化片段和3’純化片段可以具有相同的核苷酸序列,或者可以具有不同的核苷酸序列。
在某些實施方式中,5’純化片段和3’純化片段具有相同的序列,並且兩者可以結合相同的捕獲劑,這允許從環狀RNA中分離RNA轉錄物。
在某些實施方式中,5’純化片段和3’純化片段具有不超過90%、不超過80%、不超過70%、不超過60%、不超過50%或不超過40%的序列同一性。在某些實施方式中,5’純化片段和3’純化片段具有不超過90%、不超過80%、不超過70%、不超過60%、不超過50%或不超過40%的序列互補性。在這樣的實施方式中,可以使用兩種捕獲劑,每種捕獲劑特異性結合5’純化片段和3’純化片段中的一者。可以連續或同時使用兩種捕獲劑從環狀RNA中分離RNA轉錄物。
4.
同源臂
在某些實施方式中,RNA轉錄物進一步包含至少一個同源臂。同源臂可以位於第一環化元件的上游(並且任選地與其相鄰),這種同源臂可以被稱為5’同源臂。同源臂也可以位於第二環化元件的下游(並且任選地與其相鄰),這種同源臂可以被稱為3’同源臂。在某些實施方式中,同源臂可以位於自剪接元件的3’部分的上游(即5’同源臂)和/或自剪接元件的5’部分的下游(即3’同源臂)。
在某些實施方式中,5’同源臂插入在5’純化片段和第一環化元件之間。在某些實施方式中,3’同源臂插入在3’純化片段和第二環化元件之間。在某些實施方式中,5’同源臂位於5’純化片段的上游和/或3’同源臂位於3’純化片段的下游。
在某些實施方式中,RNA轉錄物包含5’同源臂和3’同源臂兩者。
如本文所用,「同源臂」是與同一多核苷酸分子中的另一序列(例如互補同源臂)具有至少約75%(例如,至少約80%、至少約85%、至少約90%、至少約95%、約100%)互補性的任何連續序列。可用於本揭露內容的同源臂可以具有任何合適的長度,例如長度為至少1 nt(例如10nt、20nt、30nt、40nt、50nt、60nt、70nt、80nt、90nt、100nt或更多),或長度高達250 nt。在某些實施方式中,RNA轉錄物中的同源臂包含或者是RNA片段。
在某些實施方式中,RNA轉錄物具有5’同源臂和3’同源臂兩者,其具有至少75%的互補性。在某些實施方式中,預計同源臂中的每一者與RNA轉錄物中的非預期序列(例如,非同源臂序列)的等長片段具有小於50%(例如,小於45%、小於40%、小於35%、小於30%、小於25%)的互補性。
在某些實施方式中,同源臂包含至少一個衍生自ALU重複序列的ALU元件。在某些實施方式中,ALU元件與自剪接元件的3’部分和/或自剪接元件的5’部分連接(William R. Jeck等人,《環狀RNA豐富、保守且與ALU重複序列連接》,《
RNA》(2013),19:141-157)。
在某些實施方式中,如本文提供的5’同源臂由包含SEQ ID NO: 6(GGGAAGACCCTCGACCGTCGATTGTCCACTGGTC)的核酸序列編碼。
在某些實施方式中,如本文提供的3’同源臂由包含SEQ ID NO: 13(ACCAGTGGACAATCGACGGATAACAGCATATCTAGG)的核酸序列編碼。
5.
間隔區
在某些實施方式中,RNA轉錄物進一步包含至少一個間隔區。在某些實施方式中,間隔區位於第一環化元件的下游(並且任選地與其相鄰)和/或第二環化元件的上游(並且任選地與其相鄰)。在某些實施方式中,間隔區位於自剪接元件的3’部分的下游(並且任選地與其相鄰)和/或自剪接元件的5’部分的上游(並且任選地與其相鄰)。
在某些實施方式中,間隔區位於第一環化元件(例如自剪接元件的3’部分)和靶序列之間,這種間隔區可以被稱為5’間隔區。在某些實施方式中,間隔區位於靶序列和第二環化元件(例如自剪接元件的5’部分)之間,這種間隔區可以被稱為3’間隔區。
如本文所用,「間隔區」是指介於兩個其它核苷酸序列之間的一個或多個連續核苷酸的片段,以防止這兩個其它核苷酸序列連接在一起或干擾彼此的預期生物活性。在某些實施方式中,RNA轉錄物中的間隔區包含或者是RNA片段。不希望受任何理論的束縛,據信在環化元件和靶序列之間包括間隔區對於保存環化元件(例如內含子序列)內存在的二級結構是有用的,這對於核酶活性可能是重要的,因此允許比沒有間隔區的DNA建構體中更高的環化效率。例如,可以在例如IRES和環化元件之間,或者在環化元件和靶編碼區或靶非編碼區(例如UTR區)之間插入間隔區。在某些實施方式中,間隔區可以具有任何合適的長度,例如至少7個核苷酸長(並且任選地不長於100個核苷酸)。
在某些實施方式中,間隔區位於環化元件和IRES序列之間。在某些實施方式中,5’間隔區位於第一環化元件(例如自剪接元件的3’部分)和IRES序列之間。在某些實施方式中,3’間隔區位於IRES序列和第二環化元件(例如自剪接元件的5’部分)之間。在某些實施方式中,5’間隔區位於第一環化元件和靶蛋白編碼區之間。在某些實施方式中,3’間隔區位於靶蛋白編碼區和第二環化元件之間。在某些實施方式中,靶序列包含兩個互補間隔區序列。在某些實施方式中,兩個互補間隔區序列側接本文提供的靶序列。
在某些實施方式中,間隔區含有以下中的一種或多種:a)至少5 nt長的非結構化區域,b)預計與遠端(即,非相鄰)序列至少5 nt長互補的區域,包括另一個間隔區,和/或c)至少1 nt長的結構化區域,其範圍限於間隔區的序列。
在某些實施方式中,間隔區不同於本文提供的純化片段。在某些實施方式中,間隔區不是poly(A)、poly(U)、poly(C)或poly(AC)。
在某些實施方式中,間隔區與任何純化片段不互補(或不雜交)。在某些實施方式中,間隔區與任何同源臂不互補(或不雜交)。
在某些實施方式中,如本文提供的5’間隔區由包含SEQ ID NO: 8(TGATCTGAAACCAACTTTATTACTATATTCCCCACAACCCCC)的核酸序列編碼。
在某些實施方式中,如本文提供的3’間隔區由包含SEQ ID NO: 11(GGATCC)的核酸序列編碼。
6. RNA
轉錄物中包含的元件的示例性設計
本揭露內容提供了包含在本文提供的RNA轉錄物中的元件的設計的示例性說明。圖2示出了展示示例性設計的示意圖。
在某些實施方式中,RNA轉錄物從5’至3’包含第一環化元件(例如自剪接元件的3’部分)、靶序列和第二環化元件(例如自剪接元件的5’部分)。這些沒有純化片段(PF)的DNA建構體或RNA轉錄物在圖2中被命名為「Ctrl」。RNA轉錄物可以進一步具有一個純化片段,其位於第一環化元件的5’端(在圖2中命名為5PF)或第二環化元件的3’端(在圖2中命名為3PF)。或者,RNA轉錄物可以具有兩個純化片段,分別位於第一環化元件的5’端和第二環化元件的3’端(在圖2中命名為5PF+3PF)。在同一RNA轉錄物中提供的兩個純化片段可以具有或可以不具有相同的序列。特別地,本文提供的RNA轉錄物包含彼此可操作地連接並按以下順序(從5’至3’)排列的以下元件:
I-Ctrl:a)自剪接元件的3’部分,b)靶序列,和c)自剪接元件的5’部分;
I-5PF:a)5’
純化片段;b)自剪接元件的3’部分,c)靶序列,和d)自剪接元件的5’部分;
I-3PF:a)自剪接元件的3’部分,b)靶序列,c)自剪接元件的5’部分,和d)3’
純化片段;或
I-5PF+3PF:a)5’
純化片段;b)自剪接元件的3’部分,c)靶序列,d)自剪接元件的5’部分,和e)3’
純化片段。
在某些實施方式中,RNA轉錄物在靶序列的上游從5’至3’包含第一環化元件(例如自剪接元件的3’部分)和5’間隔區。在某些實施方式中,RNA轉錄物在靶序列的下游從5’至3’包含3’間隔區和第二環化元件(例如自剪接元件的5’部分)。RNA轉錄物可以具有一個純化片段,其位於第一環化元件的5’端或第二環化元件的3’端。或者,RNA轉錄物可以具有兩個純化片段,分別位於第一環化元件的5’端和第二環化元件的3’端。在同一RNA轉錄物中提供的兩個純化片段可以具有或可以不具有相同的序列。特別地,本文提供的RNA轉錄物包含彼此可操作地連接並按以下順序(從5’至3’)排列的以下元件:
II-Ctrl:a)自剪接元件的3’部分,b)5’間隔區,c)靶序列,d)3’間隔區,和e)自剪接元件的5’部分;
II-5PF:a)5’
純化片段;b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,和f)自剪接元件的5’部分;
II-3PF:a)自剪接元件的3’部分,b)5’間隔區,c)靶序列,d)3’間隔區,e)自剪接元件的5’部分,和f)3’
純化片段;或
II-5PF+3PF:a)5’
純化片段;b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,和g)3’
純化片段。
在某些實施方式中,RNA轉錄物在靶序列的上游從5’至3’包含5’同源臂、第一環化元件(例如自剪接元件的3’部分)和5’間隔區。在某些實施方式中,RNA轉錄物在靶序列的下游從5’至3’包含3’間隔區、第二環化元件(例如自剪接元件的5’部分)和3’同源臂。RNA轉錄物可以具有一個純化片段,其位於5’同源臂的5’端或3’同源臂的3’端。或者,RNA轉錄物可以具有兩個純化片段,分別位於5’同源臂的5’端和3’同源臂的3’端。在同一RNA轉錄物中提供的兩個純化片段可以具有或可以不具有相同的序列。特別地,本文提供的RNA轉錄物包含彼此可操作地連接並按以下順序(從5’至3’)排列的以下元件:
III-Ctrl:a)5’同源臂,b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,和g)3’同源臂;
III-5PF:a)5’
純化片段,b)5’同源臂,c)自剪接元件的3’部分,d)5’間隔區,e)靶序列,f)3’間隔區,g)自剪接元件的5’部分,和h)3’同源臂;
III-3PF:a)5’同源臂,b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,g)3’同源臂,和h)3’
純化片段;或
III-5PF+3PF:a)5’
純化片段,b)5’同源臂,c)自剪接元件的3’部分,d)5’間隔區,e)靶序列,f)3’間隔區,g)自剪接元件的5’部分,h)3’同源臂,和i)3’
純化片段。
在某些實施方式中,RNA轉錄物在靶序列的上游從5’至3’包含5’同源臂、第一環化元件(例如自剪接元件的3’部分)和5’間隔區。在某些實施方式中,RNA轉錄物在靶序列的下游從5’至3’包含3’間隔區、第二環化元件(例如自剪接元件的5’部分)和3’同源臂。RNA轉錄物可以具有一個純化片段,其位於5’同源臂和第一環化元件之間,或位於3’同源臂和第二環化元件之間。或者,RNA轉錄物可以具有兩個純化片段,分別位於5’同源臂和第一環化元件之間和3’同源臂和第二環化元件之間。在同一RNA轉錄物中提供的兩個純化片段可以具有或可以不具有相同的序列。特別地,本文提供的RNA轉錄物包含彼此可操作地連接並按以下順序(從5’至3’)排列的以下元件:
IV-Ctrl:a)5’同源臂,b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,和g)3’同源臂(與III-Ctrl相同);
IV-5PF:a)5’同源臂,b)5’
純化片段,c)自剪接元件的3’部分,d)5’間隔區,e)靶序列,f)3’間隔區,g)自剪接元件的5’部分,和h)3’同源臂;
IV-3PF:a)5’同源臂,b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,g)3’
純化片段,和h)3’同源臂;或
IV-5PF+3PF:a)5’同源臂,b)5’
純化片段,c)自剪接元件的3’部分,d)5’間隔區,e)靶序列,f)3’間隔區,g)自剪接元件的5’部分,h)3’
純化片段,和i)3’同源臂。
7.
環狀
RNA
在某些實施方式中,本文提供的RNA轉錄物可以環化形成包含靶序列的環狀RNA。環化可以透過分子內形成3’,5’-磷酸二酯鍵來實現,這需要線性RNA轉錄物3’和5’末端的鄰近。
在某些實施方式中,環化可以透過反向剪接反應或外顯子跳躍來實現。在某些實施方式中,第一環化元件包含自剪接元件的3’部分,其包含內含子部分的3’近端片段和長度為至少1個核苷酸的相鄰外顯子部分。在某些實施方式中,第二環化元件包含自剪接元件的5’部分,其包含內含子的5’近端片段和長度為至少1個核苷酸的相鄰外顯子部分。該環化過程包括將下游外顯子部分的3’-尾連接到通常位於上游的長度為至少1個核苷酸的外顯子部分的5’-頭。這透過添加促進RNA-RNA鍵形成的合適的酶或因子來促進。在某些實施方式中,所得環狀RNA分子可以含有第一環化元件的外顯子部分和第二環化元件的外顯子部分,但分別不含第一環化元件和第二環化元件的內含子部分。提供環狀RNA的其它剪接方法是本領域已知的,例如參見Junjie Xiao編輯的《環狀RNA的生物發生和功能(circular RNAs Biogenesis and Functions)》。其它合適的方法可用於產生環狀RNA,參見例如,Sonja Petkovic和Sabine Müller,《體內和體外的RNA環化策略》,《
核酸研究》,2015,第43卷,第4期,2454-2465。
在某些實施方式中,所得環狀RNA分子可進一步包含至少一個間隔區。在某些實施方式中,間隔區位於第一環化元件的外顯子部分和靶序列之間,這種間隔區可以被稱為5’間隔區。在某些實施方式中,間隔區位於靶序列和第二環化元件的外顯子部分之間,這種間隔區可以被稱為3’間隔區。
在某些實施方式中,所得環狀RNA包含靶序列,該靶序列包含與靶蛋白編碼區可操作連接的內部核醣體進入位點(IRES)。
DNA
建構體作為進一步建構
DNA
建構體的載體
在另一方面,本揭露內容提供了包含多重選殖位和編碼至少一個純化片段的DNA的DNA建構體。這種DNA建構體允許在多重選殖位插入本文提供的一個或多個靶序列,和/或第一環化元件和/或第二環化元件,使得插入的靶序列和/或環化元件可操作地連接到包含在DNA建構體中的純化片段。應當理解,在DNA建構體的語境中,術語如「環化元件」、「靶序列」、「純化片段」、「同源臂」和「間隔區」旨在表示編碼如本文所述的RNA轉錄物的相應元件(即環化元件、靶序列、純化片段、同源臂和間隔區)的DNA序列。例如,當在DNA建構體的語境中使用時,術語「環化元件」可以指編碼RNA轉錄物中的環化元件的DNA,術語「靶序列」可以指編碼RNA轉錄物中的靶序列的DNA,術語「純化片段」可以指編碼RNA轉錄物中的純化片段的DNA,術語「同源臂」可以指編碼RNA轉錄物中的同源臂的DNA,並且術語「間隔區」可以指編碼RNA轉錄物中的間隔區的DNA。
如本文所用,術語「編碼(code)」或「編碼(encode)」是指多核苷酸(如DNA或RNA)中的特定核苷酸序列的固有性質,其用作在體內或體外生物過程中合成其它聚合物和大分子的模版,這些其它聚合物和大分子具有限定的核苷酸序列或限定的胺基酸序列以及由此產生的生物性質。例如,如果一種DNA在合適的體內或體外生物系統中轉錄產生一種RNA轉錄物,則該DNA編碼該RNA轉錄物,如果一種RNA轉錄物在合適的體內或體外生物系統中轉譯產生一種蛋白質,則該RNA轉錄物編碼該蛋白質,以及如果一種DNA在合適的體內或體外生物系統中轉錄和轉譯產生一種蛋白質,則該DNA編碼該蛋白質。編碼鏈(有義鏈)(其核酸序列與RNA轉錄物序列相同並通常在序列表中提供)和非編碼鏈(無義鏈)(用作DNA轉錄模版)均可被稱為編碼所述DNA的蛋白質或其它產物。
這種DNA建構體可以用作建構本文提供的DNA建構體的載體或工具,即編碼本文提供的RNA轉錄物的DNA建構體,其能夠形成包含靶序列的環狀RNA。
本揭露內容還提供了一種DNA建構體,其包含彼此可操作地連接並以5’至3’順序排列的以下元件:
a)第一純化片段,任選地第一poly(A)短序列,和
b)多重選殖位,其包含或基本上由一個或多個用於插入靶序列的選殖位點組成。
在某些實施方式中,DNA建構體進一步包含位於多重選殖位下游的第二純化片段。
在某些實施方式中,DNA建構體進一步包含位於第一純化片段和多重選殖位之間的第一環化元件。在某些實施方式中,DNA建構體進一步包含位於多重選殖位下游或位於多重選殖位和第二純化片段之間的第二環化元件。
在某些實施方式中,第二純化片段包含第二poly(A)短序列。
在某些實施方式中,DNA建構體進一步包含位於第一純化片段上游的RNA聚合酶啟動子。
本揭露內容進一步提供了一種DNA建構體,其包含彼此可操作地連接並按以下順序排列的以下元件:
a)RNA聚合酶啟動子,
b)第一環化元件,
c)多重選殖位,和
d)第二環化元件,
其中DNA建構體進一步包含至少一個位於RNA聚合酶啟動子下游的純化片段。
在某些實施方式中,多個純化片段中的一個位於第一環化元件的上游和/或第二環化元件的下游。
如本文所用,術語「多重選殖位」或「MCS」是指含有多個(至多約20個)限制性位點的短DNA片段,是工程化質體和其它載體的標準元件。MCS中的限制性位點通常是唯一的,其在載體中僅存在一次,因此可用於將感興趣的序列插入載體中。此外,表現載體通常被設計成使得MCS可以透過選擇正確的插入位點將蛋白質編碼序列插入正確的閱讀框中,和/或用戶可以透過選擇MCS來選擇閱讀框,這通常在所有三個框中都是可用的。
用於製備環狀
RNA
的方法
本揭露內容提供了一種產生如本文提供的RNA轉錄物的方法,該方法包括從本文提供的DNA建構體轉錄,從而獲得本文提供的RNA轉錄物。
在另一方面,本文提供的RNA轉錄物可以透過在RNA水平上將純化片段標記為前體來產生。本揭露內容還提供了一種產生如本文提供的RNA轉錄物的方法,該方法包括:
a)提供前體RNA,其與本文提供的RNA轉錄物的不同之處在於缺少純化片段,以及
b)將純化片段添加到前體RNA中,從而獲得所述RNA轉錄物。
在某些實施方式中,前體RNA與本文提供的RNA轉錄物的不同之處僅在於缺少純化片段。
在某些實施方式中,純化片段被添加到:a)位於第一環化元件上游的位置,b)位於第二環化元件下游的位置,c)或a)和b)的任何組合。
在某些實施方式中,純化片段:a)附著於第一環化元件的5’端,或b)附著於第二環化元件的3’端,c)或a)和b)的任何組合。
本揭露內容進一步提供了一種產生環狀RNA的方法,該方法包括:
a)提供所述RNA轉錄物,以及
b)使RNA轉錄物自環化以形成環狀RNA。
在某些實施方式中,步驟a)中的RNA轉錄物已使用本文揭露的捕獲劑富集。捕獲劑可以特異性結合RNA轉錄物中存在的純化片段。
在某些實施方式中,該方法進一步包括透過本文提供的捕獲劑從步驟b)獲得的產物中純化環狀RNA。在某些實施方式中,捕獲劑特異性結合RNA轉錄物中的純化片段和任選地副產物中的但不存在於環狀RNA中的純化片段。
本文所用的術語「副產物」是指在產生環狀RNA的過程中出現的任何中間片段。副產物既不同於RNA轉錄物,也不同於環狀RNA。副產物可以含有本文提供的RNA轉錄物的部分長度。副產物可以含有可以被捕獲劑捕獲的純化片段的至少一部分。
在某些實施方式中,用於從環狀RNA中分離RNA轉錄物的捕獲劑包含能夠在嚴格條件下與純化片段雜交的核酸片段。在某些實施方式中,捕獲劑包含與純化片段的核苷酸序列至少80%、85%、90%、95%或100%互補的核酸片段。
在某些實施方式中,捕獲劑是固定的。在某些實施方式中,步驟b)的RNA轉錄物在溶液中經歷自環化或在固定有捕獲劑的固體基質上經歷自環化。在某些實施方式中,純化片段包含poly(A)短序列,並且捕獲劑包含oligo(dT)。其它寡核苷酸也可以用作捕獲劑,只要它們與RNA轉錄物中的PF互補,例如使用Oligo-(AT)n作為PF為poly(AU)時的捕獲劑,或使用Oligo-(CT)n作為PF為poly(AG)時的捕獲劑。在某些實施方式中,純化片段可以與捕獲劑結合,該捕獲劑包含蛋白質、肽、多醣或小分子。在某些實施方式中,捕獲劑包含或者是常見的親和配體,諸如生物素、鏈黴親和素、榖胱甘肽、幾丁質、蛋白A和蛋白G,其結合的PF為具有獨特配體結合結構的RNA適體。
在某些實施方式中,步驟a)中的RNA轉錄物由本文提供的DNA建構體轉錄。在某些實施方式中,該方法進一步包括在步驟a)之前由本文提供的DNA建構體轉錄以產生本文提供的RNA轉錄物。
組合物
本揭露內容提供了一種使用本文提供的方法產生的環狀RNA的組合物。本揭露內容還提供了一種包含本文提供的DNA建構體或本文提供的RNA轉錄物的組合物。
在某些實施方式中,本揭露內容提供了包含有效量的本文所述的環狀RNA和藥學上可接受的賦形劑的藥物組合物。本揭露內容的藥物組合物可以包含如本文所述的環狀RNA,其與一種或多種藥學上或生理學上可接受的載體、賦形劑或稀釋劑組合。在一些實施方式中,本揭露內容的藥物組合物可以包含如本文所述的環狀RNA表現細胞(例如多個環狀RNA表現細胞),其與一種或多種藥學上或生理學上可接受的載體、賦形劑或稀釋劑組合。
在一些實施方式中,藥學上可接受的載體可以是藥物組合物中除活性成分以外的成分,其對受試者無毒。
在一些實施方式中,如本文所述的環狀RNA可以與其它已知藥劑和療法聯合使用。在其它實施方式中,本文所述的組合物可以與手術、放射、化學療法、抗體或其它藥劑組合用於治療方案中。
試劑盒
本揭露內容提供了一種包含所述DNA建構體的試劑盒。本揭露內容還提供了一種用於產生所述RNA轉錄物的試劑盒,其包含用於將純化片段添加到RNA轉錄物的前體中的試劑。
在某些實施方式中,試劑盒進一步包含捕獲劑,所述捕獲劑特異性結合存在於RNA轉錄物中但不存在於環狀RNA中的純化片段。在某些實施方式中,用於從環狀RNA中分離RNA轉錄物的捕獲劑包含能夠在嚴格條件下與純化片段雜交的核酸片段。在某些實施方式中,捕獲劑是固定的。在某些實施方式中,純化片段包含poly(A)短序列,並且捕獲劑包含oligo(dT)。
本文提供的試劑盒還可以包括一種或多種轉染試劑以促進環狀RNA(或編碼它們的重組核酸)向細胞的遞送。這種試劑盒也可以包括保存多核苷酸或防止其降解的組分。這種組分可以不含RNase或免受RNase的影響。
這種試劑盒通常以合適的方式包含用於每種單獨試劑或溶液的不同容器。該試劑盒可以包括一個或多個裝有環狀RNA或編碼它們的重組多核苷酸和其它藥劑的容器。用於組合物的合適容器包括例如瓶、小瓶、注射器和試管。容器可以由各種材料製成,包括玻璃或塑膠。容器可以具有無菌入口(例如,容器可以是具有可被皮下注射針刺穿的塞子的小瓶)。
試劑盒可以進一步包括容器,該容器包含藥學上可接受的緩衝液,諸如磷酸鹽緩衝鹽水、林格氏溶液或葡萄糖溶液。它還可以含有對最終用戶有用的其它材料,包括其它藥學上可接受的配製溶液,諸如緩衝液、稀釋劑,過濾器、針和注射器或其它遞送裝置。可以用組合物預先填充遞送裝置。
實施例
實施例
1. DNA
建構體(質體)
通常,可以根據圖1中箭頭所示的方法製備圖1所示的DNA建構體以生成環狀RNA。每個建構體都具有質體骨架(其可以包括Ori和抗生素抗性基因)、RNA聚合酶的啟動子(例如T7啟動子)和RNA前體的DNA序列。DNA建構體可以轉錄為如圖2所示例的RNA前體(或RNA轉錄物),總共四類(I類、II類、III類和IV類),包括:I-Ctrl、I-5PF、I-3PF、I-5PF+3PF、II-Ctrl、II-5PF、II-3PF、II-5PF+3PF、III-Ctrl、III-5PF、III-3PF、III-5PF+3PF、IV-Ctrl、IV-5PF、IV-3PF和IV-5PF+3PF。
RNA轉錄物的細節示於圖2中並總結如下。所有命名為「Ctrl」的RNA轉錄物用作陰性對照,因為它們不具有任何純化片段。
RNA轉錄物 | 元件(從5’至3’) |
I-Ctrl | a)自剪接元件的3’部分,b)靶序列,和c)自剪接元件的5’部分 |
I-5PF | a)5’ 純化片段;b)自剪接元件的3’部分,c)靶序列,和d)自剪接元件的5’部分 |
I-3PF | a)自剪接元件的3’部分,b)靶序列,c)自剪接元件的5’部分,和d)3’ 純化片段 |
I-5PF+3PF | a)5’ 純化片段;b)自剪接元件的3’部分,c)靶序列,d)自剪接元件的5’部分,和e)3’ 純化片段 |
II-Ctrl | a)自剪接元件的3’部分,b)5’間隔區,c)靶序列,d)3’間隔區,和e)自剪接元件的5’部分 |
II-5PF | a)5’ 純化片段;b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,和f)自剪接元件的5’部分 |
II-3PF | a)自剪接元件的3’部分,b)5’間隔區,c)靶序列,d)3’間隔區,e)自剪接元件的5’部分,和f)3’ 純化片段 |
II-5PF+3PF | a)5’ 純化片段;b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,和g)3’ 純化片段 |
III-Ctrl | a)5’同源臂,b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,和g)3’同源臂; |
III-5PF | a)5’ 純化片段,b)5’同源臂,c)自剪接元件的3’部分,d)5’間隔區,e)靶序列,f)3’間隔區,g)自剪接元件的5’部分,和h)3’同源臂; |
III-3PF | a)5’同源臂,b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,g)3’同源臂,和h)3’ 純化片段 |
III-5PF+3PF | a)5’ 純化片段,b)5’同源臂,c)自剪接元件的3’部分,d)5’間隔區,e)靶序列,f)3’間隔區,g)自剪接元件的5’部分,h)3’同源臂,和i)3’ 純化片段 |
IV-Ctrl | a)5’同源臂,b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,和g)3’同源臂(與III-Ctrl相同) |
IV-5PF | a)5’同源臂,b) 5’ 純化片段,c)自剪接元件的3’部分,d)5’間隔區,e)靶序列,f)3’間隔區,g)自剪接元件的5’部分,和h)3’同源臂 |
IV-3PF | a)5’同源臂,b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,g)3’ 純化片段,和h)3’同源臂 |
IV-5PF+3PF | a)5’同源臂,b)5’ 純化片段,c)自剪接元件的3’部分,d)5’間隔區,e)靶序列,f)3’間隔區,g)自剪接元件的5’部分,h)3’ 純化片段,和i)3’同源臂 |
RNA前體含有待環化的靶序列(例如,編碼GFP蛋白的基因)、環化元件(例如,I型內含子自剪接元件)和純化片段(例如,如圖3所示的poly-A短序列)。純化片段位於或靠近轉錄RNA的一端或兩端。在III類和IV類中,建構體進一步具有同源片段(即,同源臂,以使環化端緊密接近)。在這些建構體的一些中,純化片段位於同源片段和環化元件的一個或多個接頭處。純化片段不是最終環狀產物的一部分。選擇長度在20至200個核苷酸內的純化片段。在IV類中,純化片段的位置在環化元件和同源臂之間,而在III類中,純化片段位於同源臂的端部。在I類和II類中,純化片段(例如,poly(A))的位置被設計在RNA前體的3’端、RNA前體的5’端或兩端,如圖1和圖2所示。
編碼每個元件,即靶序列、自剪接元件的3’部分(即,環化元件,在圖2中命名為「3’內含子」)、自剪接元件的5’部分(即,環化元件,在圖2中命名為「5’內含子」)、5’純化片段、3’純化片段、5’同源臂、3’同源臂和IRES的示例性DNA序列提供如下(從5’至3’)。
元件 | DNA編碼序列 |
5’純化片段 | SEQ ID NO: 5: AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA |
5’同源臂 | SEQ ID NO: 6: GGGAAGACCCTCGACCGTCGATTGTCCACTGGTC |
自剪接元件的3’部分(在圖2中命名為「3’內含子」) | SEQ ID NO: 7: AACAATAGATGACTTACAACTAATCGGAAGGTGCAGAGACTCGACGGGAGCTACCCTAACGTCAAGACGAGGGTAAAGAGAGAGTCCAATTCTCAAAGCCAATAGGCAGTAGCGAAAGCTGCAAGAGAATGAAAATCCGTTGACCTTAAACGGTCGTGTGGGTTCAAGTCCCTCCACCCCCA |
5’間隔區 | SEQ ID NO: 8: TGATCTGAAACCAACTTTATTACTATATTCCCCACAACCCCC |
IRES | SEQ ID NO: 9: TTAAAACAGCCTGTGGGTTGATCCCACCCACAGGCCCATTGGGCGCTAGCACTCTGGTATCACGGTACCTTTGTGCGCCTGTTTTATACCCCCTCCCCCAACTGTAACTTAGAAGTAACACACACCGATCAACAGTCAGCGTGGCACACCAGCCACGTTTTGATCAAGCACTTCTGTTACCCCGGACTGAGTATCAATAGACTGCTCACGCGGTTGAAGGAGAAAGCGTTCGTTATCCGGCCAACTACTTCGAAAAACCTAGTAACACCGTGGAAGTTGCAGAGTGTTTCGCTCAGCACTACCCCAGTGTAGATCAGGTCGATGAGTCACCGCATTCCCCACGGGCGACCGTGGCGGTGGCTGCGTTGGCGGCCTGCCCATGGGGAAACCCATGGGACGCTCTAATACAGACATGGTGCGAAGAGTCTATTGAGCTAGTTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCTAACTGCGGAGCACACACCCTCAAGCCAGAGGGCAGTGTGTCGTAACGGGCAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCATTTTATTCCTATACTGGCTGCTTATGGTGACAATTGAGAGATCGTTACCATATAGCTATTGGATTGGCCATCCGGTGACTAATAGAGCTATTATATATCCCTTTGTTGGGTT |
eGFP編碼序列 | SEQ ID NO: 10: ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAG |
3’間隔區 | SEQ ID NO: 11: GGATCC |
自剪接元件的5’部分(在圖2中命名為「5’內含子」) | SEQ ID NO: 12: AGACGCTACGGACTTAAATAATTGAGCCTTAAAGAAGAAATTCTTTAAGTGGATGCTCTCAAACTCAGGGAAACCTAAATCTAGTTATAGACAAGGCAATCCTGAGCCAAGCCGAAGTAGTAATTAGTAAG |
3’同源臂 | SEQ ID NO: 13: ACCAGTGGACAATCGACGGATAACAGCATATCTAGG |
3’純化片段 | SEQ ID NO: 14: AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA |
為了舉例說明DNA建構體,如圖3A所示,用poly-A短序列作為PF進一步說明III類。編碼III類RNA前體全長的DNA序列提供如下(從5’至3’)。
因此,建構攜帶這些序列(SEQ ID NO: 1-4)的質體並透過DNA定序分析進行驗證。
RNA前體 | DNA編碼序列 |
III-Ctrl-eGFP | SEQ ID NO: 1: TAATACGACTCACTATAGGGTCGACGTCGACGGGAAGACCCTCGACCGTCGATTGTCCACTGGTCAACAATAGATGACTTACAACTAATCGGAAGGTGCAGAGACTCGACGGGAGCTACCCTAACGTCAAGACGAGGGTAAAGAGAGAGTCCAATTCTCAAAGCCAATAGGCAGTAGCGAAAGCTGCAAGAGAATGAAAATCCGTTGACCTTAAACGGTCGTGTGGGTTCAAGTCCCTCCACCCCCATGATCTGAAACCAACTTTATTACTATATTCCCCACAACCCCCAGTACTTTAAAACAGCCTGTGGGTTGATCCCACCCACAGGCCCATTGGGCGCTAGCACTCTGGTATCACGGTACCTTTGTGCGCCTGTTTTATACCCCCTCCCCCAACTGTAACTTAGAAGTAACACACACCGATCAACAGTCAGCGTGGCACACCAGCCACGTTTTGATCAAGCACTTCTGTTACCCCGGACTGAGTATCAATAGACTGCTCACGCGGTTGAAGGAGAAAGCGTTCGTTATCCGGCCAACTACTTCGAAAAACCTAGTAACACCGTGGAAGTTGCAGAGTGTTTCGCTCAGCACTACCCCAGTGTAGATCAGGTCGATGAGTCACCGCATTCCCCACGGGCGACCGTGGCGGTGGCTGCGTTGGCGGCCTGCCCATGGGGAAACCCATGGGACGCTCTAATACAGACATGGTGCGAAGAGTCTATTGAGCTAGTTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCTAACTGCGGAGCACACACCCTCAAGCCAGAGGGCAGTGTGTCGTAACGGGCAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCATTTTATTCCTATACTGGCTGCTTATGGTGACAATTGAGAGATCGTTACCATATAGCTATTGGATTGGCCATCCGGTGACTAATAGAGCTATTATATATCCCTTTGTTGGGTTACTAGTGATAATAGTGCCACCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAGGGATCCAGACGCTACGGACTTAAATAATTGAGCCTTAAAGAAGAAATTCTTTAAGTGGATGCTCTCAAACTCAGGGAAACCTAAATCTAGTTATAGACAAGGCAATCCTGAGCCAAGCCGAAGTAGTAATTAGTAAGACCAGTGGACAATCGACGGATAACAGCATATCTAGGGAATTC |
III-5A-eGFP | SEQ ID NO: 2: TAATACGACTCACTATAGGGTCGACAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAGTCGACGGGAAGACCCTCGACCGTCGATTGTCCACTGGTCAACAATAGATGACTTACAACTAATCGGAAGGTGCAGAGACTCGACGGGAGCTACCCTAACGTCAAGACGAGGGTAAAGAGAGAGTCCAATTCTCAAAGCCAATAGGCAGTAGCGAAAGCTGCAAGAGAATGAAAATCCGTTGACCTTAAACGGTCGTGTGGGTTCAAGTCCCTCCACCCCCATGATCTGAAACCAACTTTATTACTATATTCCCCACAACCCCCAGTACTTTAAAACAGCCTGTGGGTTGATCCCACCCACAGGCCCATTGGGCGCTAGCACTCTGGTATCACGGTACCTTTGTGCGCCTGTTTTATACCCCCTCCCCCAACTGTAACTTAGAAGTAACACACACCGATCAACAGTCAGCGTGGCACACCAGCCACGTTTTGATCAAGCACTTCTGTTACCCCGGACTGAGTATCAATAGACTGCTCACGCGGTTGAAGGAGAAAGCGTTCGTTATCCGGCCAACTACTTCGAAAAACCTAGTAACACCGTGGAAGTTGCAGAGTGTTTCGCTCAGCACTACCCCAGTGTAGATCAGGTCGATGAGTCACCGCATTCCCCACGGGCGACCGTGGCGGTGGCTGCGTTGGCGGCCTGCCCATGGGGAAACCCATGGGACGCTCTAATACAGACATGGTGCGAAGAGTCTATTGAGCTAGTTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCTAACTGCGGAGCACACACCCTCAAGCCAGAGGGCAGTGTGTCGTAACGGGCAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCATTTTATTCCTATACTGGCTGCTTATGGTGACAATTGAGAGATCGTTACCATATAGCTATTGGATTGGCCATCCGGTGACTAATAGAGCTATTATATATCCCTTTGTTGGGTTACTAGTGATAATAGTGCCACCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAGGGATCCAGACGCTACGGACTTAAATAATTGAGCCTTAAAGAAGAAATTCTTTAAGTGGATGCTCTCAAACTCAGGGAAACCTAAATCTAGTTATAGACAAGGCAATCCTGAGCCAAGCCGAAGTAGTAATTAGTAAGACCAGTGGACAATCGACGGATAACAGCATATCTAGGGAATTC |
III-3A-eGFP | SEQ ID NO: 3: TAATACGACTCACTATAGGGTCGACGTCGACGGGAAGACCCTCGACCGTCGATTGTCCACTGGTCAACAATAGATGACTTACAACTAATCGGAAGGTGCAGAGACTCGACGGGAGCTACCCTAACGTCAAGACGAGGGTAAAGAGAGAGTCCAATTCTCAAAGCCAATAGGCAGTAGCGAAAGCTGCAAGAGAATGAAAATCCGTTGACCTTAAACGGTCGTGTGGGTTCAAGTCCCTCCACCCCCATGATCTGAAACCAACTTTATTACTATATTCCCCACAACCCCCAGTACTTTAAAACAGCCTGTGGGTTGATCCCACCCACAGGCCCATTGGGCGCTAGCACTCTGGTATCACGGTACCTTTGTGCGCCTGTTTTATACCCCCTCCCCCAACTGTAACTTAGAAGTAACACACACCGATCAACAGTCAGCGTGGCACACCAGCCACGTTTTGATCAAGCACTTCTGTTACCCCGGACTGAGTATCAATAGACTGCTCACGCGGTTGAAGGAGAAAGCGTTCGTTATCCGGCCAACTACTTCGAAAAACCTAGTAACACCGTGGAAGTTGCAGAGTGTTTCGCTCAGCACTACCCCAGTGTAGATCAGGTCGATGAGTCACCGCATTCCCCACGGGCGACCGTGGCGGTGGCTGCGTTGGCGGCCTGCCCATGGGGAAACCCATGGGACGCTCTAATACAGACATGGTGCGAAGAGTCTATTGAGCTAGTTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCTAACTGCGGAGCACACACCCTCAAGCCAGAGGGCAGTGTGTCGTAACGGGCAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCATTTTATTCCTATACTGGCTGCTTATGGTGACAATTGAGAGATCGTTACCATATAGCTATTGGATTGGCCATCCGGTGACTAATAGAGCTATTATATATCCCTTTGTTGGGTTACTAGTGATAATAGTGCCACCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAGGGATCCAGACGCTACGGACTTAAATAATTGAGCCTTAAAGAAGAAATTCTTTAAGTGGATGCTCTCAAACTCAGGGAAACCTAAATCTAGTTATAGACAAGGCAATCCTGAGCCAAGCCGAAGTAGTAATTAGTAAGACCAGTGGACAATCGACGGATAACAGCATATCTAGGGAATTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA |
III-35A-eGFP | SEQ ID NO: 4: TAATACGACTCACTATAGGGTCGACAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAGTCGACGGGAAGACCCTCGACCGTCGATTGTCCACTGGTCAACAATAGATGACTTACAACTAATCGGAAGGTGCAGAGACTCGACGGGAGCTACCCTAACGTCAAGACGAGGGTAAAGAGAGAGTCCAATTCTCAAAGCCAATAGGCAGTAGCGAAAGCTGCAAGAGAATGAAAATCCGTTGACCTTAAACGGTCGTGTGGGTTCAAGTCCCTCCACCCCCATGATCTGAAACCAACTTTATTACTATATTCCCCACAACCCCCAGTACTTTAAAACAGCCTGTGGGTTGATCCCACCCACAGGCCCATTGGGCGCTAGCACTCTGGTATCACGGTACCTTTGTGCGCCTGTTTTATACCCCCTCCCCCAACTGTAACTTAGAAGTAACACACACCGATCAACAGTCAGCGTGGCACACCAGCCACGTTTTGATCAAGCACTTCTGTTACCCCGGACTGAGTATCAATAGACTGCTCACGCGGTTGAAGGAGAAAGCGTTCGTTATCCGGCCAACTACTTCGAAAAACCTAGTAACACCGTGGAAGTTGCAGAGTGTTTCGCTCAGCACTACCCCAGTGTAGATCAGGTCGATGAGTCACCGCATTCCCCACGGGCGACCGTGGCGGTGGCTGCGTTGGCGGCCTGCCCATGGGGAAACCCATGGGACGCTCTAATACAGACATGGTGCGAAGAGTCTATTGAGCTAGTTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCTAACTGCGGAGCACACACCCTCAAGCCAGAGGGCAGTGTGTCGTAACGGGCAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCATTTTATTCCTATACTGGCTGCTTATGGTGACAATTGAGAGATCGTTACCATATAGCTATTGGATTGGCCATCCGGTGACTAATAGAGCTATTATATATCCCTTTGTTGGGTTACTAGTGATAATAGTGCCACCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAGGGATCCAGACGCTACGGACTTAAATAATTGAGCCTTAAAGAAGAAATTCTTTAAGTGGATGCTCTCAAACTCAGGGAAACCTAAATCTAGTTATAGACAAGGCAATCCTGAGCCAAGCCGAAGTAGTAATTAGTAAGACCAGTGGACAATCGACGGATAACAGCATATCTAGGGAATTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA |
實施例
2.
環狀
RNA
的純化和表徵
將根據實施例1製備的DNA建構體線性化,並根據以下提供的實驗流程進行體外轉錄、環化和純化。對環化效率和純化效率進行評估和比較,以證明PF的益處。
2.1
實驗工作流程
如圖3B所示,根據以下步驟進行環狀RNA的純化和表徵,包括DNA建構體的線性化、線性化DNA的純化、體外轉錄、環化、使用Oligo-dT方法純化環狀RNA和純化RNA的表徵。
2.2
實驗程序和結果
質體DNA的製備。
合成實施例1中建構的DNA建構體(質體)(包括圖3A,Ctrl、5A、3A和53A所示的那些建構體)並轉殖到大腸桿菌(
E. coli)菌株中用於質體複製。提取質體並純化,然後透過酶消化進行線性化。
將質體DNA在37℃條件下用限制性酶HindIII(NEB,R0104L)消化1至4小時。然後使用QIAquick凝膠提取試劑盒純化線性化的質體DNA。
透過使用T7 RNA聚合酶在NTP、鼠RNase抑制劑和焦磷酸酶(無機(Inorganic))的存在下在37℃下從線性化質體DNA模版體外轉錄30至120分鐘來合成線性RNA轉錄物。
為了產生環狀RNA,將額外的含有50 mM Tris-HCl(pH7.4)、10 mM MgCl2和2 mM GTP的環化反應緩衝液添加到體外轉錄的混合物中,並在55℃下進一步孵育15至30分鐘。透過瓊脂糖凝膠電泳檢測環狀RNA的產生。
然後透過將RNA混合物透過Oligo-dT試劑純化得到的環狀RNA。攜帶poly-A短序列的RNA片段將結合/保留在Oligo-dT試劑上,而circRNA產物將在流過物中並因此得到純化。對於實驗室規模的純化,根據製造商的方案使用與oligo(dT)
25(Ambion,目錄編號:61002)綴合的磁珠。或者,由Oligo-dT樹脂製成的柱也用於在AKTA設備(思拓凡(Cytiva))上純化環狀RNA。為了說明純化方法,用這些步驟進行純化:結合、洗滌和洗脫結合的RNA。
從以下純化步驟收集級分:來自結合步驟的FT(流過物),來自洗滌步驟的W和來自洗脫步驟的E(洗脫物)。在瓊脂糖凝膠上(圖4)和透過毛細管電泳(CE)(圖5A至5E)分析這些級分以及來自環化步驟的RNA混合物(在圖4和5A至5E中表示為輸入)。基於CE結果計算環化效率和circRNA純度(圖5E)。
圖4和5A至5E示出了由III類建構體(即圖3A所示的建構體,Ctrl、5A、3A和53A)製備環狀RNA產物,純化步驟之後的級分。輸入(其表示來自環化步驟的RNA混合物)、FT(其表示來自結合步驟的流過物)和E級分(其表示來自洗脫步驟的洗脫物)泳道上的條帶顯示,含PF的RNA片段與捕獲劑Oligo-dT磁珠有效結合,從circRNA產物中除去並用洗脫緩衝液洗脫(圖4)。
從這些分析中可以清楚地看出,在RNA前體的任一端或在RNA前體的每一端添加poly-A短序列不會對環化效率產生負面影響。相反,與Ctrl相比,RNA前體的5’端存在PF令人驚訝地顯著提高了環化效率,從Ctrl的33%分別提高到5A和53A產物的75%和85%(圖5A至5E)。另外,如圖5E所總結的,Ctrl產物在純化前後表現出circRNA純度從25%到28%的增加。相反,在純化前後,5A產物表現出circRNA純度從52%到82%的增長,3A產物表現出從22%到66%的增長,53A產物表現出從62%到86%的增長。相對於不存在如本文所揭露的純化片段的建構體,包含一個或兩個poly-A短序列作為純化片段的三個建構體在circRNA純化中都表現出顯著更高的有效性。按照本文揭露的產生circRNA的方法,純化的circRNA達到了高達幾乎90%的純度。
還使用類似的方法分析了由I類、II類和IV類建構體製備環狀RNA產物在純化步驟之後的級分。作為PF的poly-A短序列的存在顯著地促進了所得circRNA的純化,產生了如預期的高度純化的circRNA。
為了測試circRNA產物的功能性,進行了轉染實驗。將純化的GFP circRNA產物透過lipofectamine轉染到HEK 293T細胞中。孵育兩天後,在明視野和GFP設置下在顯微鏡上獲取螢光圖像(圖6)。強螢光場清楚地顯示GFP蛋白的表現,表明了合成的GFP circRNA的功能性。
實施例
3.
環狀
RNA
的合成、純化和表徵
根據實施例1和2中描述的方法建構如圖2所示的攜帶III類元件的質體,其中適體作為純化片段,並透過DNA定序分析進行驗證。
將DNA建構體線性化,並根據實施例2中提供的實驗工作流程進行體外轉錄、環化和純化。(能夠特異性結合適體的靶)用作捕獲劑。對環化效率和純化效率進行評估和比較,以證明PF的益處。
類似地,從以下純化步驟收集級分:來自結合步驟的FT(流過物),來自洗滌步驟的W和來自洗脫步驟的E(洗脫物)。在瓊脂糖凝膠上和透過毛細管電泳(CE)分析這些級分以及來自環化步驟(輸入)的RNA混合物。基於CE結果計算環化效率和circRNA純度。
實驗數據顯示,包含適體作為純化片段實現了與包含poly-A短序列作為純化片段相似的性能。適體作為PF的存在有利於純化過程,產生高純度的circRNA產物。純化的circRNA產物也顯示了其中所含靶序列的所需功能。
無
圖 1示出了示例性DNA建構體的示意圖和示出從示例性DNA建構體產生環狀RNA的示例性方法。所示的DNA建構體是環狀質體DNA,其包含質體骨架、環狀RNA區域、RNA聚合酶啟動子的位點(如所示的T7)、一個或兩個純化片段(PF)和限制性酶的切割位點(理想地,如圖所示,接近或位於PF的3’端)。環狀RNA產生的過程包括質體DNA的線性化、體外轉錄以生成RNA前體、環化以形成環狀RNA,以及透過親和基質除去所有攜帶PF的RNA片段以進行純化。
圖 2示出了基於不同元件排列和純化片段位置的四類示例性RNA前體。本文所用的第一環化元件是自剪接元件的3’部分,命名為
3 ’內含子,其包含常規PIE策略的3’內含子和外顯子2的部分。第二環化元件是自剪接元件的5’部分,命名為
5 ’內含子,其包含常規PIE策略的5’內含子和外顯子1的部分。純化片段被命名為
PF。不含純化片段的RNA轉錄物被命名為「
Ctrl」。I類示出了包含兩個環化元件和一個或兩個純化片段的RNA前體,所述一個或兩個純化片段位於第一環化元件的5’端(命名為I-5PF)、位於第二環化元件的3’端(命名為I-3PF)或位於兩端(命名為I-5PF+3PF)。II類示出了包含兩個環化元件、兩個間隔區和一個或兩個純化片段的RNA前體,所述一個或兩個純化片段位於第一環化元件的5’端(命名為II-5PF)、位於第二環化元件的3’端(命名為II-3PF)或位於兩端(命名為II-5PF+3PF)。III類示出了包含兩個環化元件、兩個間隔區、兩個同源臂和一個或兩個純化片段的RNA前體,所述一個或兩個純化片段位於5’同源臂的5’端(命名為III-5PF)、3’同源臂的3’端(命名為III-3PF)或兩端(命名為III-5PF+3PF)。IV類示出了包含兩個環化元件、兩個間隔區、兩個同源臂和一個或兩個純化片段的RNA前體,所述一個或兩個純化片段位於5’同源臂和第一環化元件之間(命名為IV-5PF)、位於第二環化元件和3’同源臂之間(命名為IV-3PF)或位於兩個位置(命名為IV-5PF+3PF)。
圖 3A示出了由本文提供的DNA建構體轉錄的線性RNA前體。在此,純化片段是poly-A短序列,並且元件如
圖 2中的III類排列。
Ctrl:不包含任何純化片段的RNA轉錄物,作為陰性對照。
5A:在RNA轉錄物的5’端包含poly-A短序列的RNA轉錄物。
3A:在RNA轉錄物的3’端包含poly-A短序列的RNA轉錄物。
53A:包含兩個poly-A短序列的RNA轉錄物,每個poly-A短序列位於RNA轉錄物的一端。所示的「3’內含子」表示第一環化元件,其包含常規PIE策略的3’內含子和外顯子2的序列。所示的「5’內含子」表示第二環化元件,其包含常規PIE策略的5’內含子和外顯子1的序列。
圖 3B示出了環狀RNA的產生、純化和表徵的實驗工作流程。
圖 4示出了在瓊脂糖凝膠上對RNA產物的分析。製備如
圖 3A中描述的四種建構體的質體DNA並將其線性化。在體外轉錄和環化後,將RNA產物加載到Oligo-dT磁珠或含有Oligo-dT樹脂的柱上。按順序步驟收集級分,並在瓊脂糖凝膠上和透過毛細管電泳進行分析(
圖 5)。
輸入:體外轉錄和環化後的RNA產物,其含有環狀RNA和含poly-A的線性RNA前體兩者,以及所有副產物。
FT:流過級分,其含有環狀RNA。
E:洗脫級分,其含有未加工的含poly-A的線性RNA前體和加工後的含poly-A的RNA片段。
W:來自結合與洗脫之間的洗滌步驟的級分,該步驟用於洗掉非特異性結合的RNA產物。
P:指示RNA前體在瓊脂糖凝膠上遷移的位置。
R:指示環狀RNA產物在瓊脂糖凝膠上遷移的位置。
圖 5A至
5E示出了透過毛細管電泳對RNA產物的分析。還透過毛細管電泳(Agilent 5200片段分析儀)分析了
圖 4中描述的RNA產物:Ctrl(圖5A)、5A(圖5B)、3A(圖5C)和53A(圖5D)。「輸入」代表體外轉錄和環化後的RNA產物,其被加載用於Oligo-dT純化。「FT」(流過物)代表流過級分。計算circRNA的環化效率和純度並總結在圖5E中。
圖 6示出了純化的GFP circRNA轉染HEK 293T細胞的結果。對照樣品和eGFP circRNA樣品分別用脂質體(lipofectamine)試劑轉染。在明視野和GFP設置下在螢光顯微鏡上獲取圖像。
TW202408542A_112118805_SEQL.xml
Claims (57)
- 一種用於製備環狀RNA的DNA建構體,所述DNA建構體包含與編碼能夠產生環狀RNA的RNA轉錄物的序列可操作地連接的RNA聚合酶啟動子,所述RNA轉錄物包含彼此可操作地連接並按以下順序排列的以下元件: a)第一環化元件, b)靶序列,和 c)第二環化元件, 其中所述RNA轉錄物能夠形成包含所述靶序列的所述環狀RNA;以及 其中所述RNA轉錄物進一步包含至少一個在所述環狀RNA中不存在的純化片段。
- 如請求項1所述的DNA建構體,其中所述RNA聚合酶啟動子是衍生自T7病毒、T6病毒、SP6病毒、T3病毒或T4病毒的RNA聚合酶啟動子。
- 一種體外轉錄的RNA轉錄物,所述RNA轉錄物包含彼此可操作地連接並按以下順序排列的以下元件: a)第一環化元件, b)靶序列,和 c)第二環化元件, 其中所述RNA轉錄物能夠形成包含所述靶序列的環狀RNA;以及 其中所述RNA轉錄物進一步包含至少一個在所述環狀RNA中不存在的純化片段。
- 如請求項1或2所述的DNA建構體或如請求項3所述的RNA轉錄物,其中所述至少一個純化片段與所述第一環化元件連接,或與所述第二環化元件連接。
- 如請求項1或2所述的DNA建構體或如請求項3所述的RNA轉錄物,其中所述RNA轉錄物具有分別與所述第一環化元件和所述第二環化元件連接的兩個純化片段。
- 如請求項1至2和4至5中任一項所述的DNA建構體或如請求項3至5中任一項所述的RNA轉錄物,其中所述至少一個純化片段:a)位於所述第一環化元件的上游(即5’純化片段),b)位於所述第二環化元件的下游(即3’純化片段),c)或a)和b)的任何組合。
- 如請求項1至2和4至6中任一項所述的DNA建構體或如請求項3至6中任一項所述的RNA轉錄物,其中所述至少一個純化片段:a)附著於所述第一環化元件的5’端(即5’純化片段),或b)附著於所述第二環化元件的3’端(即3’純化片段),或a)和b)的任何組合。
- 如請求項6至7中任一項所述的DNA建構體或如請求項6至7中任一項所述的RNA轉錄物,其中所述RNA轉錄物具有所述5’純化片段和所述3’純化片段兩者,並且其中所述5’純化片段和所述3’純化片段在核苷酸序列上相同或不同。
- 如請求項1至2和4至8中任一項所述的DNA建構體或如請求項3至7中任一項所述的RNA轉錄物,其中所述至少一個純化片段中的每一個在15至20個核苷酸的給定長度上與所述環狀RNA具有不超過90%(或不超過80%、不超過70%、不超過60%、不超過50%)的序列同一性。
- 如請求項1至2和4至9中任一項所述的DNA建構體或如請求項3至9中任一項所述的RNA轉錄物,其中所述純化片段包含poly(A)短序列(tract)、poly(T)短序列、poly(U)短序列、poly(C)短序列、poly(G)短序列、poly(AC)短序列、poly(AG)短序列、poly(CT)短序列、poly(CU)短序列、poly(AT)短序列或poly(AU)短序列。
- 如請求項10所述的DNA建構體,或如請求項10所述的RNA轉錄物,其中所述純化片段(例如poly(A)短序列)的長度範圍為15至200個核苷酸,任選地15至150個核苷酸。
- 如請求項1至2和4至11中任一項所述的DNA建構體或如請求項3至11中任一項所述的RNA轉錄物,其中所述第一環化元件和所述第二環化元件可以衍生自自剪接系統。
- 13. 如請求項12所述的DNA建構體或如請求項12所述的RNA轉錄物,其中所述第一環化元件包含自剪接元件的3’部分,所述自剪接元件的3’部分包含3’剪接位點,並且所述第二環化元件包含自剪接元件的5’部分,所述自剪接元件的5’部分包含5’剪接位點。
- 如請求項13所述的DNA建構體或如請求項13所述的RNA轉錄物,其中所述自剪接元件是I型內含子、II型內含子或髮夾核酶。
- 如請求項14所述的DNA建構體或如請求項14所述的RNA轉錄物,其中所述I型內含子衍生自噬菌體T4胸苷酸合酶(td)基因、藍細菌魚腥藻pre-tRNA-Leu基因或四膜蟲基因。
- 如請求項14所述的DNA建構體或如請求項14所述的RNA轉錄物,其中所述II型內含子衍生自乳酸乳球菌Ll.LtrB基因,或衍生自酵母。
- 如請求項14所述的DNA建構體或如請求項14所述的RNA轉錄物,其中所述髮夾核酶衍生自細菌、真核生物或植物病毒RNA衛星(例如菸草環斑病毒(TRSV)衛星RNA、菊苣黃斑駁病毒(sCYMV)衛星RNA,或擬南芥花葉病毒(sARMV)衛星RNA)。
- 如請求項1至2和4至17中任一項所述的DNA建構體或如請求項3至17中任一項所述的RNA轉錄物,其中所述靶序列包含靶蛋白編碼區。
- 如請求項18所述的DNA建構體或如請求項18所述的RNA轉錄物,其中所述靶蛋白是治療性蛋白質(例如抗體、細胞激素、肽激素等)、預防性蛋白質(例如蛋白質疫苗等)、核酸酶(例如Cas蛋白、重組酶等)、受體(例如嵌合抗原受體等)。
- 如請求項18或19所述的DNA建構體或如請求項18或19所述的RNA轉錄物,其中所述靶序列進一步包含與所述靶蛋白編碼區可操作地連接的內部核醣體進入位點(IRES),任選地所述IRES可操作地連接在所述靶蛋白編碼區的上游和/或下游。
- 如請求項20所述的DNA建構體或如請求項20所述的RNA轉錄物,其中所述IRES選自陶拉症候群(Taura syndrome)病毒、吸血獵椿(Triatoma)病毒、泰勒氏(Theiler’s)腦脊髓炎病毒、猿猴病毒40、紅火蟻病毒1、禾谷縊管蚜病毒、網狀內皮增生症病毒、人脊髓灰質炎病毒1、斯氏珀蝽腸病毒(Plautia stali intestine virus)、克什米爾蜂病毒、人鼻病毒2、琉璃葉蟬病毒1、人類免疫缺陷病毒1型、琉璃葉蟬病毒1、虱P病毒、C型肝炎病毒、A型肝炎病毒、GB型肝炎病毒、口蹄疫病毒、人腸病毒71型、馬鼻炎病毒、茶尺蠖樣病毒、腦心肌炎病毒(EMCV)、果蠅C病毒、十字花科菸草花葉病毒、蟋蟀麻痹病毒、牛病毒性腹瀉病毒1、黑蜂王台病毒、蚜蟲致死性麻痹病毒、禽腦脊髓炎病毒、急性蜂麻痹病毒、木槿褪綠環斑病毒、經典豬瘟病毒、人FGF2、人SFTPA1、人AML1/RUNX1、果蠅觸角足、人AQP4、人AT1R、人BAG-1、人BCL2、人BiP、人c-IAP1、人c-myc、人eIF4G、小鼠NDST4L、人LEF1、小鼠HIF1 α、人n.myc、小鼠Gtx、人p27kip1、人PDGF2/c-sis、人p53、人Pim-1、小鼠Rbm3、果蠅reaper、犬科Scamper、果蠅Ubx、唾液病毒(Salivirus)、科薩病毒(Cosavirus)、雙埃柯病毒、人UNR、小鼠UtrA、人VEGF-A、人XIAP、果蠅無毛(hairless)、釀酒酵母TFIID、釀酒酵母YAP1、人c-src、人FGF-1、猿猴小核醣核酸病毒、蕪菁皺縮病毒、eIF4G適體、克沙奇病毒B3(CVB3)或克沙奇病毒A(CVB1/2)的IRES序列。
- 如請求項18至21中任一項所述的DNA建構體或如請求項18至21中任一項所述的RNA轉錄物,其中所述靶序列進一步包含與所述靶蛋白編碼區可操作連接的5’非轉譯區(UTR)和/或3’UTR。
- 如請求項1至2和4至17中任一項所述的DNA建構體或如請求項3至17中任一項所述的RNA轉錄物,其中所述靶序列包含生物活性RNA或所述生物活性RNA的前體。
- 如請求項23所述的DNA建構體或如請求項23所述的RNA轉錄物,其中所述生物活性RNA包含短髮夾RNA、轉運RNA(tRNA)、短干擾RNA、微RNA(microRNA)或嚮導RNA。
- 如請求項1至2和4至24中任一項所述的DNA建構體或如請求項3至23中任一項所述的RNA轉錄物,其中所述RNA轉錄物進一步包含至少一個同源臂,任選地所述同源臂位於所述第一環化元件的上游(即5’同源臂)和/或所述第二環化元件的下游(即3’同源臂)。
- 如請求項25所述的DNA建構體或如請求項25所述的RNA轉錄物,其中所述同源臂包含至少一個衍生自ALU重複序列的ALU元件。
- 如請求項24或25所述的DNA建構體或如請求項24或25所述的RNA轉錄物,其中所述同源臂: a)插入所述5’純化片段和所述第一環化元件之間和/或插入所述3’純化片段和所述第二環化元件之間;或 b)位於所述5’純化片段的上游和/或所述3’純化片段的下游。
- 如請求項1至2和4至27中任一項所述的DNA建構體或如請求項3至27中任一項所述的RNA轉錄物,其中所述RNA轉錄物進一步包含至少一個間隔區,任選地所述間隔區位於所述第一環化元件(例如所述自剪接元件的3’部分)和所述靶序列之間,和/或位於所述靶序列和所述第二環化元件(例如所述自剪接元件的5’部分)之間。
- 如請求項28所述的DNA建構體或如請求項28所述的RNA轉錄物,其中所述間隔區: a)位於所述第一環化元件(例如所述自剪接元件的3’部分)和所述IRES序列之間,和/或位於所述靶序列和所述第二環化元件(例如所述自剪接元件的5’部分)之間; b)位於所述第一環化元件(例如所述自剪接元件的3’部分)和所述靶蛋白編碼區之間,和/或位於所述靶蛋白編碼區和所述第二環化元件(例如所述自剪接元件的5’部分)之間。
- 如請求項28或29所述的DNA建構體或如請求項28或29所述的RNA轉錄物,其中所述至少一個間隔區序列包含位於所述靶序列側翼的兩個互補間隔區序列。
- 一種DNA建構體,其包含彼此可操作地連接並以5’至3’順序排列的以下元件: a)第一純化片段,任選地第一poly(A)短序列,和 b)多重選殖位,其包含或基本上由一個或多個用於插入靶序列的選殖位點組成。
- 如請求項31所述的DNA建構體,其進一步包含位於所述多重選殖位下游的第二純化片段。
- 如請求項31或32所述的DNA建構體,其進一步包含位於所述第一純化片段和所述多重選殖位之間的第一環化元件,和/或位於所述多重選殖位下游或位於所述多重選殖位和所述第二純化片段之間的第二環化元件。
- 如請求項31至33中任一項所述的DNA建構體,其進一步包含位於所述第一純化片段上游的RNA聚合酶啟動子。
- 一種DNA建構體,其包含彼此可操作地連接並按以下順序排列的以下元件: a)RNA聚合酶啟動子, b)第一環化元件, c)多重選殖位,和 d)第二環化元件, 其中所述DNA建構體進一步包含至少一個位於所述RNA聚合酶啟動子下游的純化片段。
- 如請求項35所述的DNA建構體,其中所述多個純化片段中的一個位於所述第一環化元件的上游和/或所述第二環化元件的下游。
- 一種產生如請求項3至30中任一項所述的RNA轉錄物的方法,所述方法包括:從如請求項1至2和4至30中任一項所述的DNA建構體轉錄,從而獲得如請求項3至30中任一項所述的RNA轉錄物。
- 一種產生如請求項3至30中任一項所述的RNA轉錄物的方法,所述方法包括: a)提供前體RNA,其與所述RNA轉錄物的不同之處在於缺少所述純化片段,任選地所述前體RNA與所述RNA轉錄物的不同之處僅在於缺少所述純化片段,以及 b)將所述純化片段添加到所述前體RNA中,從而獲得如請求項3至30中任一項所述的RNA轉錄物。
- 如請求項38所述的方法,其中所述純化片段被添加到:a)位於所述第一環化元件上游的位置,b)位於所述第二環化元件下游的位置,c)或a)和b)的任何組合。
- 如請求項38所述的方法,其中所述純化片段:a)附著於所述第一環化元件的5’端,或b)附著於所述第二環化元件的3’端,c)或a)和b)的任何組合。
- 一種產生環狀RNA的方法,所述方法包括: a)提供如請求項3至30中任一項所述的RNA轉錄物,以及 b)使所述RNA轉錄物自環化以形成所述環狀RNA。
- 如請求項41所述的方法,其中步驟a)中的所述RNA轉錄物已經使用捕獲劑富集,所述捕獲劑特異性結合存在於所述RNA轉錄物中的純化片段。
- 如請求項41或42所述的方法,其中所述方法進一步包括透過捕獲劑從步驟b)獲得的產物中純化所述環狀RNA,其中所述捕獲劑特異性結合所述RNA轉錄物中的所述純化片段,以及任選地副產物中的但不存在於所述環狀RNA中的所述純化片段。
- 如請求項42或43所述的方法,其中所述捕獲劑包含能夠在嚴格條件下與所述純化片段雜交的核酸片段,任選地所述捕獲劑包含與所述純化片段的核苷酸序列至少80%、85%、90%、95%或100%互補的核酸片段。
- 如請求項44所述的方法,其中所述捕獲劑是固定的。
- 如請求項41至45中任一項所述的方法,其中步驟b)中的所述RNA轉錄物在溶液中經歷自環化或在固定有所述捕獲劑的固體基質上經歷自環化。
- 如請求項41至46中任一項所述的方法,其中所述純化片段包含poly(A)短序列,並且所述捕獲劑包含去氧胸苷寡核苷酸(oligo(dT))。
- 如請求項41至47中任一項所述的方法,其中步驟a)中的所述RNA轉錄物由如請求項1至2和4至30中任一項所述的DNA建構體轉錄。
- 如請求項41所述的方法,其中所述方法進一步包括在步驟a)之前由如請求項1至2和4至30中任一項所述的DNA建構體轉錄以產生如請求項3至30中任一項所述的RNA轉錄物。
- 如請求項41所述的方法,其中步驟a)中的所述RNA轉錄物透過如請求項38至40中任一項所述的方法獲得。
- 一種使用如請求項41至50中任一項所述的方法產生的環狀RNA的組合物。
- 一種組合物,其包含如請求項1至2和4至30中任一項所述的DNA建構體或如請求項3至30中任一項所述的RNA轉錄物。
- 一種包含如請求項1至2和4至36中任一項所述的DNA建構體的試劑盒。
- 一種用於產生如請求項3至30中任一項所述的RNA轉錄物的試劑盒,其包含用於將所述純化片段添加到如請求項38所述的RNA轉錄物的前體中的試劑。
- 如請求項53或54所述的試劑盒,其中所述試劑盒進一步包含捕獲劑,所述捕獲劑特異性結合存在於所述RNA轉錄物中但不存在於所述環狀RNA中的所述純化片段。
- 如請求項53或54所述的試劑盒,其中所述純化片段包含poly(A)短序列。
- 如請求項53或54所述的試劑盒,其中所述捕獲劑包含oligo(dT)。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2022094157 | 2022-05-20 | ||
WOPCT/CN2022/094157 | 2022-05-20 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202408542A true TW202408542A (zh) | 2024-03-01 |
Family
ID=88834705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW112118805A TW202408542A (zh) | 2022-05-20 | 2023-05-19 | 製備環狀rna的方法 |
Country Status (3)
Country | Link |
---|---|
CN (1) | CN117529556A (zh) |
TW (1) | TW202408542A (zh) |
WO (1) | WO2023222114A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118028340A (zh) * | 2024-01-31 | 2024-05-14 | 北京悦康科创医药科技股份有限公司 | 一种用于环状rna表达的核酸构建体及其在蛋白表达中的应用 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108486107A (zh) * | 2018-03-01 | 2018-09-04 | 北京大学 | 基于双分子荧光互补的新型信使rna和环状rna标记方法 |
CN108546700A (zh) * | 2018-04-19 | 2018-09-18 | 广州密码子基因科技有限公司 | 一种FFPE样本circRNA高通量测序文库的构建方法 |
AU2019280583B2 (en) * | 2018-06-06 | 2022-12-15 | Massachusetts Institute Of Technology | Circular RNA for translation in eukaryotic cells |
JP2023525270A (ja) * | 2020-05-08 | 2023-06-15 | オルナ セラピューティクス インコーポレイテッド | 環状rna組成物及び方法 |
JP2023527309A (ja) * | 2020-05-19 | 2023-06-28 | オルナ セラピューティクス インコーポレイテッド | 環状rna組成物及び方法 |
CN114507691A (zh) * | 2022-03-02 | 2022-05-17 | 深圳市瑞吉生物科技有限公司 | 一种用于制备环状rna的载体及其应用 |
-
2023
- 2023-05-19 WO PCT/CN2023/095294 patent/WO2023222114A1/en active Application Filing
- 2023-05-19 CN CN202380012376.1A patent/CN117529556A/zh active Pending
- 2023-05-19 TW TW112118805A patent/TW202408542A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
CN117529556A (zh) | 2024-02-06 |
WO2023222114A1 (en) | 2023-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11352641B2 (en) | Circular RNA for translation in eukaryotic cells | |
US20230250439A1 (en) | Polynucleotide secondary structure | |
EP3946466A2 (en) | Compositions comprising modified circular polyribonucleotides and uses thereof | |
EP4239072A1 (en) | Recombinant nucleic acid molecule based on point mutation of translation initiation element and use thereof in preparation of circular rna | |
US20240277872A1 (en) | Modified mrna, modified non-coding rna, and uses thereof | |
JP2024528469A (ja) | 組換え環状rnaからの改良されたタンパク質翻訳のための組成物及び方法 | |
TW202408542A (zh) | 製備環狀rna的方法 | |
WO2023046153A1 (en) | Circular rna and preparation method thereof | |
CN116322791A (zh) | 经修饰的功能性核酸分子 | |
EP4269585A1 (en) | Guide rna for editing polyadenylation signal sequence of target rna | |
EP4219723A1 (en) | Circular rna platforms, uses thereof, and their manufacturing processes from engineered dna | |
Kundu | Directed Evolution of a Novel Heterochiral Ribonuclease Ribozyme and Kinetic Characterization of Heterochiral DNA Strand Displacement Reactions | |
WO2024145248A1 (en) | Compositions and methods for generating circular rna |