TW202408542A - 製備環狀rna的方法 - Google Patents

製備環狀rna的方法 Download PDF

Info

Publication number
TW202408542A
TW202408542A TW112118805A TW112118805A TW202408542A TW 202408542 A TW202408542 A TW 202408542A TW 112118805 A TW112118805 A TW 112118805A TW 112118805 A TW112118805 A TW 112118805A TW 202408542 A TW202408542 A TW 202408542A
Authority
TW
Taiwan
Prior art keywords
rna
rna transcript
virus
dna construct
sequence
Prior art date
Application number
TW112118805A
Other languages
English (en)
Inventor
王珊珊
王國安
Original Assignee
大陸商浙江健新原力製藥有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 大陸商浙江健新原力製藥有限公司 filed Critical 大陸商浙江健新原力製藥有限公司
Publication of TW202408542A publication Critical patent/TW202408542A/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/108Plasmid DNA episomal vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/50Vectors for producing vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2820/00Vectors comprising a special origin of replication system
    • C12N2820/60Vectors comprising a special origin of replication system from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/60Vector systems having a special element relevant for transcription from viruses

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本揭露內容總體上關於用於製備環狀RNA的新型DNA建構體或RNA轉錄物,以及生產環狀RNA的新方法。

Description

製備環狀RNA的方法
本揭露內容總體上關於用於製備環狀RNA的新型DNA建構體或RNA轉錄物,以及生產環狀RNA的新方法。
自然界中發現的環狀RNA(或circRNA)是長的非編碼RNA分子,其形成共價閉合的連續環而沒有5’至3’極性。環狀RNA最初被報導為由共價閉合的環狀RNA分子組成的類病毒,對特定的高等植物具有致病性(Liu L,Wang J,Khanabdali R等人(2017)《環狀RNA:分離、表徵及其在疾病中的潛在作用(Circular RNAs: isolation, characterization and their potential role in diseases)》《 RNA 生物學RNA Biol)》14(12):1715-1721)。此後描述了許多物種中的其它類型的環狀RNA,包括D型肝炎病毒(HDV)的環狀單鏈RNA基因組,或作為古細菌中tRNA和rRNA成熟的產物或中間體的環狀RNA。環狀RNA通常透過上游外顯子的5’位點與該外顯子或下游外顯子的3’位點共價結合而形成。已經描述了兩種不同的環狀RNA生物發生模型,即套索(lariat)或外顯子跳躍模型和直接反向剪接模型。在套索模型中,在反向剪接之前發生標準剪接,而在直接反向剪接模型中,首先生成環狀RNA(Jeck WR,Sorrentino JA,Wang K等人(2013)《環狀RNA豐富、保守且與ALU重複序列連接(Circular RNAs are abundant, conserved, and associated with ALU repeats)》《 RNA》19:141-157;Barrett SP,Wang PL,Salzman J(2015)《環狀RNA生物發生可透過含外顯子的套索前體進行(Circular RNA biogenesis can proceed through an exon-containing lariat precursor)》《 生命科學在線Elife)》4:e07540)。
環狀RNA透過調節微RNA來調控基因表現,並作為潛在的生物標記發揮作用。環狀RNA可以在體內轉譯,將它們的表現與疾病聯繫起來(Li J,Yang J,Zhou P等人(2015a)《環狀RNA在癌症中的作用:對起源、性質、功能和意義的新見解(Circular RNAs in cancer: novel insights into origins, properties, functions and implications)》《 美國癌症研究雜誌Am J Cancer Res)》5(2):472;Li P,Chen S,Chen H等人(2015b)《環狀RNA作為一種新型生物標記在胃癌篩查中的應用(Using circular RNA as a novel type of biomarker in the screening of gastric cancer)》《 臨床化學學報Clin Chim Acta)》444:132-136;Greene J,Baird AM,Brady L等人(2017)《環狀RNA:生物發生、功能和在人類疾病中的作用(Circular RNAs: biogenesis, function and role in human diseases)》《 分子生物科學前沿Front Mol Biosci)》4:38)。環狀RNA對RNA核酸外切酶具有抗性,並且可以轉化為線性RNA(透過微RNA),然後作為內源性RNA的競爭者。環狀RNA作為臨床診斷標記或治療分子在疾病的預防和治療方面具有良好的應用前景。迄今為止,由於表現量低,很少有關於環狀RNA的報導發表。最初這些分子被認為是選擇性剪接的副產物,並被指定為遺傳事故或實驗錯誤(Liu L,Wang J,Khanabdali R等人(2017)《環狀RNA:分離、表徵及其在疾病中的潛在作用》《 RNA 生物學》14(12):1715-1721)。
環狀RNA在體內的廣泛存在以及對其結構和功能特性的研究已經引起了對允許在體外有效製備環狀RNA的方法的需求。據報導,有幾種方法可用於環狀RNA的體外產生,包括化學和酶方法,以及使用具有置換內含子和外顯子(PIE)策略的修飾的自剪接內含子(I型和II型)的方法。
這些工程化的環狀RNA可以攜帶IRES(內部核醣體進入位點)以有效地指導任何下游編碼序列在體內的表現,例如螢光素酶和SARS-CoV-2刺突蛋白的RBD的編碼序列(R. A. Wesselhoeft,P. S. Kowalski,D. G. Anderson,(2018)《工程化環狀RNA用於真核細胞中的有效和穩定轉譯(Engineering circular RNA for potent and stable translation in eukaryotic cells)》《 自然通訊Nat Commun)》9,2629;和Qu L.等人(2022)《抗SARS-CoV-2和新出現變體的環狀RNA疫苗(Circular RNA Vaccines against SARS-CoV-2 and Emerging Variants)》《 細胞Cell)》185(10):1728-1744。)因此,環狀RNA正成為mRNA作為治療劑和疫苗的替代品。
環狀RNA作為治療劑或疫苗相比線性mRNA具備若干優勢。它在體內更穩定,並且可以用較低的劑量達到所需的表現量。它具有低免疫原性,並且在治療中引起較少的毒性或較少的副作用。對於體外產生,環狀RNA的生產不需要昂貴的加帽(capping)步驟或加尾(tailing)步驟,而這些步驟在產生mRNA產物中通常是需要的。
仍然需要允許在體外高效和經濟地製備環狀RNA的方法,特別是在工業規模上,以促進在疾病診斷和治療中的研究與應用。
在整個揭露內容中,冠詞「一個(a)」、「一種(an)」和「該(the)」在本文中用於指該冠詞的語法對象中的一個或多於一個(即,至少一個)。例如,「一種方法」意指一種方法或多於一種方法。
本揭露內容提供了體外產生環狀RNA的新方法,以及允許透過所述方法產生環狀RNA的新型DNA建構體或RNA轉錄物。本揭露內容還提供了包含能夠產生環狀RNA的DNA建構體或RNA轉錄物,或透過所述方法產生的環狀RNA的組合物和試劑盒。
在一個方面,本揭露內容提供了一種用於製備環狀RNA的DNA建構體,所述DNA建構體包含與編碼能夠產生環狀RNA的RNA轉錄物的序列可操作地連接的RNA聚合酶啟動子,所述RNA轉錄物包含彼此可操作地連接並按以下順序排列的以下元件: a)第一環化元件, b)靶序列,和 c)第二環化元件, 其中所述RNA轉錄物能夠形成包含所述靶序列的所述環狀RNA;以及 其中所述RNA轉錄物進一步包含至少一個在所述環狀RNA中不存在的純化片段。
在某些實施方式中,RNA聚合酶啟動子是衍生自T7病毒、T6病毒、SP6病毒、T3病毒或T4病毒的RNA聚合酶啟動子。
在一個方面,本揭露內容提供了一種體外轉錄的RNA轉錄物,所述RNA轉錄物包含彼此可操作地連接並按以下順序排列的以下元件: a)第一環化元件, b)靶序列,和 c)第二環化元件, 其中所述RNA轉錄物能夠形成包含所述靶序列的環狀RNA;以及 其中所述RNA轉錄物進一步包含至少一個在所述環狀RNA中不存在的純化片段。
在某些實施方式中,至少一個純化片段與第一環化元件連接,或與第二環化元件連接。
在某些實施方式中,RNA轉錄物具有分別與第一環化元件和第二環化元件連接的兩個純化片段。
在某些實施方式中,至少一個純化片段:a)位於第一環化元件的上游(即5’純化片段),b)位於第二環化元件的下游(即3’純化片段),c)或a)和b)的任何組合。
在某些實施方式中,至少一個純化片段:a)附著於第一環化元件的5’端(即5’純化片段),或b)附著於第二環化元件的3’端(即3’純化片段),或a)和b)的任何組合。
在某些實施方式中,本文提供的RNA轉錄物具有5’純化片段和3’純化片段兩者,並且其中所述5’純化片段和所述3’純化片段在核苷酸序列上相同或不同。
在某些實施方式中,至少一個純化片段中的每一個在15至20個核苷酸的給定長度上與環狀RNA具有不超過90%(或不超過80%、不超過70%、不超過60%、不超過50%)的序列同一性。
在某些實施方式中,純化片段包含poly(A)短序列(tract)、poly(T)短序列、poly(U)短序列、poly(C)短序列、poly(G)短序列、poly(AC)短序列、poly(AG)短序列、poly(CT)短序列、poly(CU)短序列、poly(AT)短序列或poly(AU)短序列。在某些實施方式中,純化片段包含poly(A)短序列、poly(U)短序列、poly(C)短序列、poly(G)短序列、poly(AC)短序列、poly(AG)短序列、poly(CU)短序列或poly(AU)短序列。
在某些實施方式中,純化片段(例如poly(A)短序列)的長度範圍為15至200個核苷酸,任選地15至150個核苷酸。
在某些實施方式中,第一環化元件和第二環化元件可以衍生自自剪接系統。
在某些實施方式中,第一環化元件包含自剪接元件的3’部分,所述自剪接元件的3’部分包含3’剪接位點,並且第二環化元件包含自剪接元件的5’部分,所述自剪接元件的5’部分包含5’剪接位點。
在某些實施方式中,自剪接元件是I型內含子、II型內含子或髮夾核酶。
在某些實施方式中,I型內含子衍生自噬菌體T4胸苷酸合酶(td)基因、藍細菌魚腥藻(Cyanobacterium Anabaena sp.)pre-tRNA-Leu基因或四膜蟲基因。
在某些實施方式中,II型內含子衍生自乳酸乳球菌(L.lactis)Ll.LtrB基因,或衍生自酵母。
在某些實施方式中,髮夾核酶衍生自細菌、真核生物或植物病毒RNA衛星(例如菸草環斑病毒(tobacco ringspot virus,TRSV)衛星RNA、菊苣黃斑駁病毒(chicory yellow mottle virus,sCYMV)衛星RNA,或擬南芥花葉病毒(arabis mosaic virus,sARMV)衛星RNA)。
在某些實施方式中,靶序列包含靶蛋白編碼區。
在某些實施方式中,靶蛋白是治療性蛋白質(例如抗體、細胞激素、肽激素等)、預防性蛋白質(例如蛋白質疫苗等)、核酸酶(例如Cas蛋白、重組酶等)或受體(例如嵌合抗原受體等)。
在某些實施方式中,靶序列進一步包含與靶蛋白編碼區可操作地連接的內部核醣體進入位點(IRES)。在某些實施方式中,IRES可操作地連接在靶蛋白編碼區的上游或下游。
在某些實施方式中,IRES選自陶拉症候群病毒(Taura syndrome virus)、吸血獵椿病毒(Triatoma virus)、泰勒氏腦脊髓炎病毒(Theiler‘s encephalomyelitis virus)、猿猴病毒(simian Virus)40、紅火蟻病毒(Solenopsis invicta virus)1、禾谷縊管蚜病毒(Rhopalosiphum padi virus)、網狀內皮增生症病毒(Reticuloendotheliosis virus)、人脊髓灰質炎病毒(human poliovirus)1、斯氏珀蝽腸病毒(Plautia stali intestine virus)、克什米爾蜂病毒(Kashmir bee virus)、人鼻病毒2、琉璃葉蟬病毒(Homalodisca coagulata virus)1、人類免疫缺陷病毒1型、琉璃葉蟬病毒1、虱P病毒(Himetobi P virus)、C型肝炎病毒、A型肝炎病毒、GB型肝炎病毒、口蹄疫病毒、人腸病毒71型、馬鼻炎病毒(Equine rhinitis virus)、茶尺蠖樣病毒(Ectropis obliqua picoma-like virus)、腦心肌炎病毒(EMCV)、果蠅C病毒(Drosophila C Virus)、十字花科菸草花葉病毒(Crucifer tobamo virus)、蟋蟀麻痹病毒(Cricket paralysis virus)、牛病毒性腹瀉病毒(Bovine viral diarrhea virus)1、黑蜂王台病毒(Black Queen Cell Virus)、蚜蟲致死性麻痹病毒(Aphid lethal paralysis virus)、禽腦脊髓炎病毒(Avian encephalomyelitis virus)、急性蜂麻痹病毒(Acute bee paralysis virus)、木槿褪綠環斑病毒(Hibiscus chlorotic ringspot virus)、經典豬瘟病毒(Classical swine fever virus)、人FGF2、人SFTPA1、人AML1/RUNX1、果蠅觸角足(Drosophila antennapedia)、人AQP4、人AT1R、人BAG-1、人BCL2、人BiP、人c-IAP1、人c-myc、人eIF4G、小鼠NDST4L、人LEF1、小鼠HIF1 α、人n.myc、小鼠Gtx、人p27kip1、人PDGF2/c-sis、人p53、人Pim-1、小鼠Rbm3、果蠅reaper、犬科Scamper、果蠅Ubx、唾液病毒(Salivirus)、科薩病毒(Cosavirus)、雙埃柯病毒(Parechovirus)、人UNR、小鼠UtrA、人VEGF-A、人XIAP、果蠅無毛(Drosophila hairless)、釀酒酵母(S. cerevisiae)TFIID、釀酒酵母YAP1、人c-src、人FGF-1、猿猴小核醣核酸病毒(Simian picomavirus)、蕪菁皺縮病毒(Turnip crinkle virus)、eIF4G適體、克沙奇病毒(Coxsackievirus)B3(CVB3)或克沙奇病毒A(CVB1/2)的IRES序列。
在某些實施方式中,靶序列進一步包含與靶蛋白編碼區可操作地連接的5’非轉譯區(UTR)和/或3’UTR。
在某些實施方式中,靶序列包含生物活性RNA或生物活性RNA的前體。
在某些實施方式中,生物活性RNA包含短髮夾RNA、轉運RNA(tRNA)、短干擾RNA、微RNA(microRNA)或嚮導RNA。
在某些實施方式中,RNA轉錄物進一步包含至少一個同源臂。在某些實施方式中,同源臂位於第一環化元件的上游(即5’同源臂)和/或第二環化元件的下游(即3’同源臂)。在某些實施方式中,同源臂位於自剪接元件的3’部分的上游(即5’同源臂)和/或自剪接元件的5’部分的下游(即3’同源臂)。
在某些實施方式中,其中同源臂包含至少一個衍生自ALU重複序列的ALU元件。
在某些實施方式中,同源臂:a)插入5’純化片段和第一環化元件之間和/或插入3’純化片段和第二環化元件之間;或b)位於5’純化片段的上游和/或3’純化片段的下游。
在某些實施方式中,RNA轉錄物進一步包含至少一個間隔區,任選地該間隔區位於第一環化元件(例如自剪接元件的3’部分)和靶序列之間,和/或位於靶序列和第二環化元件(例如自剪接元件的5’部分)之間。
在某些實施方式中,RNA轉錄物進一步包含至少一個間隔區。在某些實施方式中,間隔區位於第一環化元件(例如自剪接元件的3’部分)和靶序列之間,和/或位於靶序列和第二環化元件(例如自剪接元件的5’部分)之間。在某些實施方式中,間隔區位於第一環化元件(例如自剪接元件的3’部分)和IRES序列之間,和/或位於靶序列和第二環化元件(例如自剪接元件的5’部分)之間。在某些實施方式中,間隔區位於第一環化元件(例如自剪接元件的3’部分)和靶蛋白編碼區之間,和/或位於靶蛋白編碼區和第二環化元件(例如自剪接元件的5’部分)之間。在某些實施方式中,靶序列包含位於靶序列側翼的兩個互補間隔區序列。 在一個方面,本揭露內容提供了一種DNA建構體,其包含可操作地彼此連接並以5’至3’順序排列的以下元件: a)第一純化片段,任選地第一poly(A)短序列,和 b)多重選殖位,其包含或基本上由一個或多個用於插入靶序列的選殖位點組成。
在某些實施方式中,DNA建構體進一步包含位於多重選殖位下游的第二純化片段。
在某些實施方式中,DNA建構體進一步包含位於第一純化片段和多重選殖位之間的第一環化元件,和/或位於多重選殖位下游的第二環化元件。在某些實施方式中,第二環化元件位於多重選殖位和第二純化片段之間。
在某些實施方式中,DNA建構體進一步包含位於第一純化片段上游的RNA聚合酶啟動子。
在一個方面,本揭露內容提供了一種DNA建構體,其包含可操作地彼此連接並按以下順序排列的以下元件: a)RNA聚合酶啟動子, b)第一環化元件, c)多重選殖位,和 d)第二環化元件, 其中DNA建構體進一步包含至少一個位於所述RNA聚合酶啟動子下游的純化片段。
在某些實施方式中,多個純化片段中的一個位於第一環化元件的上游和/或第二環化元件的下游。
在一個方面,本揭露內容提供了一種產生本文提供的RNA轉錄物的方法,該方法包括從本文提供的DNA建構體轉錄,從而獲得本文提供的RNA轉錄物。
在一個方面,本揭露內容提供了一種產生本文提供的RNA轉錄物的方法,該方法包括: a)提供前體RNA,其與本文提供的RNA轉錄物的不同之處在於缺少純化片段,以及 b)將所述純化片段添加到所述前體RNA中,從而獲得本文提供的RNA轉錄物。
在某些實施方式中,前體RNA與本文提供的RNA轉錄物的不同之處僅在於缺少純化片段。
在某些實施方式中,純化片段被添加到:a)位於第一環化元件上游的位置,b)位於第二環化元件下游的位置,c)或a)和b)的任何組合。
在某些實施方式中,純化片段:a)附著於第一環化元件的5’端,或b)附著於第二環化元件的3’端,c)或a)和b)的任何組合。
在一個方面,本揭露內容提供了一種產生環狀RNA的方法,該方法包括: a)提供本文提供的RNA轉錄物,以及 b)使所述RNA轉錄物自環化以形成環狀RNA。
在某些實施方式中,步驟a)中的RNA轉錄物已經使用捕獲劑富集,所述捕獲劑特異性結合存在於所述RNA轉錄物中的純化片段。
在某些實施方式中,該方法進一步包括透過捕獲劑從步驟b)獲得的產物中純化環狀RNA,其中所述捕獲劑特異性結合RNA轉錄物中的純化片段,以及任選地副產物中的但不存在於環狀RNA中的純化片段。
在某些實施方式中,捕獲劑包含能夠在嚴格條件下與純化片段雜交的核酸片段。在某些實施方式中,捕獲劑包含與純化片段的核苷酸序列至少80%、85%、90%、95%或100%互補的核酸片段。在某些實施方式中,捕獲劑包含能夠與本文提供的純化片段結合的蛋白質、肽、多醣或小分子。
在某些實施方式中,捕獲劑是固定的。
在某些實施方式中,步驟b)中的RNA轉錄物在溶液中經歷自環化或在固定有捕獲劑的固體基質上經歷自環化。
在某些實施方式中,純化片段包含poly(A)短序列,並且捕獲劑包含去氧胸苷寡核苷酸(oligo(dT))。
在某些實施方式中,步驟a)中的RNA轉錄物由本文提供的DNA建構體轉錄。
在某些實施方式中,該方法在步驟a)之前進一步包括由本文提供的DNA建構體轉錄以產生本文提供的RNA轉錄物。
在某些實施方式中,步驟a)中的RNA轉錄物透過本文提供的方法獲得。
在一個方面,本揭露內容提供了一種使用本文提供的方法產生的環狀RNA的組合物。
在一個方面,本揭露內容提供了一種包含本文提供的DNA建構體或本文提供的RNA轉錄物的組合物。
在一個方面,本揭露內容提供了一種包含本文提供的DNA建構體的試劑盒。
在一個方面,本揭露內容提供了一種用於產生本文提供的RNA轉錄物的試劑盒,其包含用於將純化片段添加到RNA轉錄物的前體中的試劑。
在某些實施方式中,試劑盒進一步包含捕獲劑,所述捕獲劑特異性結合存在於RNA轉錄物中但不存在於環狀RNA中的純化片段。
在某些實施方式中,純化片段包含poly(A)短序列。
在某些實施方式中,捕獲劑包含oligo(dT)。
本揭露內容的以下描述僅旨在說明本揭露內容的各種實施方式。因此,所討論的具體修改不應被解釋為對本揭露內容範圍的限制。對於所屬技術領域中具有通常知識者顯而易見的是,在不脫離本揭露內容的範圍的情況下,可以進行各種等同物、改變和修飾,並且應當理解,這些等同實施方式包括在本文中。本文引用的所有參考文獻,包括出版物、專利和專利申請,透過引用整體併入本文。
本揭露內容提供了可用於製備環狀RNA的新型組合物和方法。通常,環狀RNA的體外產生經歷兩個步驟,一個是體外轉錄以產生線性RNA前體,另一個是從前體形成環狀RNA的環化步驟。環化通常不是100%有效的,會留下一定量的前體RNA和中間體需要從環化產物中除去。由於前體和環狀RNA在大小和物理性質上的接近,難以用常規的層析方法(如離子交換或疏水相互作用)實現二者的完全分離。本領域已知的目前用於環狀RNA的純化方法使用HPLC SEC柱,但該方法不能擴展到工業規模,而且價格高昂。本揭露內容揭露了一系列含有一個或多個純化片段(PF)的設計的DNA建構體和RNA轉錄物。這些純化片段在環化後不存在於環狀RNA中,而且發現其在促進線性RNA轉錄物和環化中間體的去除方面出乎意料地有效,從而以方便和可規模化擴展的方式實現了環狀RNA產物的純化。純化步驟可以在實驗室和生產場所使用的普通層析設備中進行。可以容易地達到所需的純度(例如≥80%)。事實證明,這對於需要穩健和可規模化擴展的純化過程的治療劑和疫苗的製造是特別理想的。
用於環狀 RNA 製備的 DNA 建構體和 RNA 轉錄物
本揭露內容提供了一種用於製備環狀RNA的DNA建構體,該DNA建構體包含與編碼能夠產生環狀RNA的RNA轉錄物的序列可操作地連接的RNA聚合酶啟動子,所述RNA轉錄物包含彼此可操作地連接並按以下順序排列的以下元件: a)第一環化元件, b)靶序列,和 c)第二環化元件, 其中RNA轉錄物能夠形成包含靶序列的環狀RNA;並且其中RNA轉錄物進一步包含至少一個在環狀RNA中不存在的純化片段。
本揭露內容還提供了一種體外轉錄的RNA轉錄物,所述RNA轉錄物包含彼此可操作地連接並按以下順序排列的以下元件: a)第一環化元件, b)靶序列,和 c)第二環化元件, 其中RNA轉錄物能夠形成包含靶序列的環狀RNA;並且其中RNA轉錄物進一步包含至少一個在環狀RNA中不存在的純化片段。
如本文所用,術語「circRNA」或「環狀RNA」可互換使用,是指透過共價鍵形成環狀結構的多核醣核苷酸。
如本文所用,術語「DNA建構體」是指可插入或已經插入外源DNA片段的一段DNA。DNA建構體具有任何長度和任何序列,並且可以是線性的或環狀的。DNA建構體可以合成(例如,使用PCR),或者可以衍生自病毒、質體或高等生物的細胞。該術語包括線性DNA片段(例如,PCR產物、線性化質體片段)、質體載體、病毒載體、黏質體、細菌人工染色體(BAC)、酵母人工染色體(YAC)等。DNA建構體可以包含例如複製起點、選擇性標記或報告基因(如抗生素抗性或GFP)、RNA聚合酶啟動子和/或RNA聚合酶終止子。DNA建構體可以是PCR擴增的線性片段,其含有透過體外轉錄製備本文提供的RNA轉錄物的必需元件。
術語「核酸」或「核苷酸」包括能夠以序列特異性方式與天然存在的核酸雜交的天然存在的物種以及其任何類似物、變體和任何模擬物,例如,能夠與兩個核酸雜交使得可以在兩個雜交的核酸之間發生連接,或能夠用作特定核苷酸序列複製的模版。天然存在的核苷酸的類似物、變體和任何模擬物可以在鹼基、醣和/或磷酸鹽的化學結構中具有修飾。鹼基修飾的實例包括但不限於5’-位嘧啶修飾、8’-位嘌呤修飾、胞嘧啶環外胺修飾和5-溴-尿嘧啶取代。核苷酸類似物的實例包括5-甲氧基尿苷、假尿苷、1-甲基假尿苷和6-甲基腺苷。醣的修飾的實例包括但不限於醣修飾的核醣核苷酸,其中2’-OH被諸如H、烷氧基、烷基、鹵素、SH、SR、NH 2、NHR、NR 2或CN的基團替代,其中R是烷基部分。磷酸二酯鍵的修飾的實例包括但不限於甲基膦酸酯、硫代磷酸酯和肽鍵。核苷酸還意在包括具有以下的核苷酸:諸如肌苷、辮苷(queuosine)、黃嘌呤(xanthine)等鹼基;諸如2’-甲基核醣等醣。在某些實施方式中,核酸分子可以是DNA或RNA。
術語「RNA」或「核醣核酸」包括具有選自由腺嘌呤(A)、尿嘧啶(U)、胞嘧啶(C)或鳥嘌呤(G)組成的組的鹼基的天然RNA種類,以及能夠與天然RNA進行鹼基配對的任何非天然RNA或其類似物、變體和任何模擬物。
術語「DNA」或「去氧核醣核酸」包括具有選自由腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)或鳥嘌呤(G)組成的組的鹼基的天然DNA種類,以及能夠與天然DNA進行鹼基配對的任何非天然DNA或其類似物、變體和任何模擬物。
關於核苷酸序列(或胺基酸序列)的「序列同一性百分比(%)」被定義為在比對序列並在必要時引入空位以實現最大對應之後,候選序列中與參考序列中的核苷酸(或胺基酸)殘基相同的核苷酸(或胺基酸)殘基的百分比。用於確定核苷酸(或胺基酸)序列同一性百分比的比對可以例如使用諸如BLASTN、BLASTP(可在美國國家生物技術資訊中心(NCBI)的網站上獲得,另見Altschul S.F.等人,《分子生物學雜誌(J. Mol.Biol.)》,215:403-410(1990);Stephen F.等人,《核酸研究(Nucleic Acids Res.)》,25:3389-3402(1997))、ClustalW2(可在歐洲生物資訊學研究所(European Bioinformatics Institute)的網站上獲得,另見Higgins D.G.等人,《酶學方法(Methods in Enzymology)》,266:383-402(1996);Larkin M.A.等人,《生物資訊學(Bioinformatics)》(英國牛津),23(21): 2947-8(2007))和ALIGN或MegAlign(DNASTAR)軟體等公眾可獲得的工具實現。所屬技術領域中具有通常知識者可以使用由工具提供的預設參數,或者可以制定適合於比對的參數,例如透過選擇合適的演算法。
術語「互補的」或「互補性」是指核酸透過傳統的華生-克里克(Watson-Crick)或其它非傳統類型與另一核酸序列形成氫鍵的能力。互補性百分比表示核酸分子中可與另一核酸序列形成氫鍵的殘基的百分比(例如,5、6、7、8、9、10/10為50%、60%、70%、80%、90%和100%互補)。可以使用基本的局部比對搜索工具(BLAST程序)(Altschul(1990)《分子生物學雜誌》215,403-410;Zhang和Madden(1997)《基因組研究(Genome Res.)》7,649-656)常規地確定互補性百分比。
術語「雜交(hybridizing)」或「雜交(hybridize)」是指兩個不同分子內或兩個片段內基本上互補或互補的核酸序列的配對。配對可以透過任何方法實現,其中核酸序列透過鹼基配對與基本上或完全互補的序列結合以形成雜交複合物。
本文所用的「嚴格條件」是指核苷酸序列與其靶核苷酸序列雜交但不會與其它非互補序列雜交的條件。嚴格條件是序列依賴性的,並且在不同的情況下是不同的。例如,對於特異性雜交,較長的片段可能比較短的片段需要更高的雜交溫度。由於其它可能影響雜交嚴格性的因素,包括互補鏈的鹼基組成和長度、有機溶劑的存在和鹼基錯配的程度,參數的組合比任何一個參數單獨的絕對量度更重要。通常,嚴格條件被選擇為比特定序列在限定的離子強度和pH下的熔解溫度(Tm)低約5℃。因此,選擇與靶充分互補的寡核苷酸,即充分良好雜交並具有足夠特異性的寡核苷酸,以產生所需的效果,同時努力避免顯著的脫靶效應,即不直接與預期靶以外的靶結合。
如本文所用,關於核苷酸序列的術語「下游」意指朝向核苷酸序列的3’端。
如本文所用,關於核苷酸序列的術語「上游」意指朝向核苷酸序列的5’端。
如本文所用,術語「可操作地連接」是指元件的佈置,其中如此描述的組件被配置以執行它們通常的功能。因此,例如,當給定的啟動子與編碼DNA序列可操作地連接時,該啟動子能夠在諸如RNA聚合酶等適當酶的存在下影響編碼DNA序列的表現。表現意指包括環狀RNA、編碼環狀RNA的重組核酸或來自DNA或RNA模版的mRNA的轉錄中的任一種或多種的轉錄,並且可進一步包括來自mRNA模版或包含IRES序列的環狀RNA的蛋白質的轉譯。啟動子不需要與編碼序列鄰接,只要它能指導其表現。因此,例如,插入的未轉譯但已轉錄的序列可存在於啟動子序列和編碼序列之間,並且啟動子序列仍可被認為與編碼序列「可操作地連接」。
如本文所用,術語「RNA聚合酶啟動子」是指能夠募集RNA聚合酶(例如RNA聚合酶II)並啟動DNA轉錄成RNA的DNA調控區。RNA聚合酶啟動子可以在其3’末端具有轉錄起始位點,其中轉錄從該位點開始。啟動子序列包括具有在高於背景的可檢測量上啟動轉錄所必需的元件的最小數目的鹼基。通常,RNA聚合酶啟動子序列具有負責RNA聚合酶結合的蛋白質結合區。在某些實施方式中,RNA聚合酶啟動子可以選自但不限於衍生自T7病毒、T6病毒、SP6病毒、T3病毒或T4病毒的RNA聚合酶啟動子。
在某些實施方式中,DNA建構體進一步包含RNA聚合酶終止子。如本文所用,「RNA聚合酶終止子」是指包含至少一個離散終止子序列的元件,其中RNA聚合酶的轉錄在此終止。終止子引起RNA的釋放和轉錄複合物的解離。在某些實施方式中,RNA聚合酶終止子可以選自但不限於衍生自T7病毒、T6病毒、SP6病毒、T3病毒或T4病毒的RNA聚合酶終止子。
本文所用的「RNA轉錄物」是指從給定DNA建構體轉錄的線性核酸片段。在一個實施方式中,編碼RNA轉錄物的序列包含在DNA建構體中並位於RNA聚合酶啟動子的下游。例如,本文提供的RNA轉錄物可由本文提供的DNA建構體轉錄。在另一實施方式中,RNA轉錄物在體外提供或合成。
本文提供的RNA轉錄物能夠產生環狀RNA。本文提供的RNA轉錄物包含彼此可操作地連接並按以下順序(例如5’至3’)排列的以下元件:a)第一環化元件,b)靶序列,和c)第二環化元件,並且進一步包含至少一個在環狀RNA中不存在的純化片段,並且其中RNA轉錄物能夠形成包含靶序列的環狀RNA。
1. 環化元件
如本文所用,術語「環化元件」是指至少一個核酸片段,其以促進線性RNA自環化形成環狀RNA的方式與線性RNA可操作地連接。由本文提供的RNA轉錄物產生的環狀RNA包含靶序列。在某些實施方式中,RNA轉錄物中的環化元件包含或者是RNA片段。
在某些實施方式中,第一環化元件位於靶序列的上游,和/或第二環化元件位於靶序列的下游。在某些實施方式中,RNA轉錄物包含分別位於靶序列上游和下游的至少一對環化元件。
在某些實施方式中,環化元件衍生自自剪接系統。在某些實施方式中,環化元件可以衍生自I型內含子自剪接系統、II型內含子自剪接系統或髮夾核酶。
I型內含子自剪接系統關於主要位於真核微生物的基因組核醣體RNA區域內的I型內含子。I型內含子的特徵在於保守序列和結構特徵的線性陣列(linear array),並且透過兩次連續的酯交換(transesterification)進行切除。I型內含子募集外部鳥苷作為親核試劑來啟動剪接。在該過程期間,鳥苷核苷酸的3’羥基在5’外顯子-內含子接合處(5’剪接位點)參與酯交換反應,從而導致5’內含子部分的切除,留下在5’外顯子的端部具有游離3’-羥基的中間體。游離的羥基在3’外顯子-內含子接合處(3’剪接位點)參與第二次酯交換,從而導致插入區域的環化和3’內含子部分的切除。詳見Wesselhoeft R. A等人,《工程化環狀RNA用於真核細胞中的有效和穩定轉譯》,《 自然通訊Nature Communications)》,(2018)9:2629。
II型內含子自剪接系統是可移動的遺傳元件,其透過使用類似於經典剪接體剪接反應的酯交換反應自動催化從前體RNA的自身剪接。已經在細菌和真菌、植物、原生生物以及環節動物蠕蟲的粒線體(mt)和葉綠體(cp)基因組中發現了II型內含子。II型內含子RNA的特徵在於保守的二級結構,其跨度為400至800個nt並被組織成六個結構域,即DI-VI,從中心「輪」輻射。這些結構域相互作用形成保守的三級結構,將遠處的序列聚集在一起形成活性位點。活性位點結合剪接位點和分支點核苷酸殘基,並使用特異性結合的Mg++離子來活化適當的鍵進行催化。
II型內含子透過兩次連續的酯交換反應催化它們自身的剪接,生成分叉的套索中間體和套索-內含子。具有互補序列的兩個內含子部分可以雜交,從而把5’-內含子和3’-內含子-外顯子接合處(3’-剪接位點)的分支點並置,用於親核攻擊和切割。在3’外顯子釋放後,3’剪接位點的末端2’-OH基團攻擊5’-內含子-外顯子接合處(5’剪接位點),連接兩個外顯子並釋放具有2’至5’磷酸二酯鍵的內含子套索(環化的)RNA。詳見Llorente-Cortés, V.等人,《實驗醫學和生物學進展(Advances in Experimental Medicine and Biology)》,第1087卷,《環狀RNA:生物發生和功能(Circular RNAs: Biogenesis and Functions)》一章,施普林格(Springer)出版;Petkovic, S.等人,《體內和體外的RNA環化策略(RNA circularization strategies in vivoand in vitro)》,《 核酸研究Nucleic Acids Research)》,2015,第43卷,第4期,2454-2465;Lambowitz, A. M.等人,《 冷泉港生物學展望Cold Spring Harb Perspect Biol.)》2011年8月;3(8): a003616。
髮夾核酶(HPR)是另一種允許自剪接和生成環狀RNA的系統。具有HPR的線性RNA可以折疊成兩種切割活性構象,這兩種構象都針對兩個可能的切割位點中的一個。在任一構象中發生第一次切割後,RNA片段被切割,生成5’-OH和2’,3’-環狀磷酸酯(2’,3’-cP)。然後將髮夾核酶重折疊成另一種構象,從而發生第二次切割反應,生成另一段切割後的RNA片段以及5’-OH和2’,3’-cP。因此,切割後的中間體將含有5’-OH(在3’外顯子處)和2’,3’-環狀磷酸酯(在5’外顯子處),它們可以連接以產生靶circRNA。詳見Chen, XJ等人,《環狀RNA:體外生物合成(Circular RNA:  Biosynthesis in vitro)》,《 生物工程與生物技術前沿Front. Bioeng. Biotechnol.)》,2021年11月30日;Hieronymus, R.等人,《透過工程化髮夾核酶變體進行RNA自剪接(RNA self-splicing by engineered hairpin ribozyme variants)》,《 核酸研究》,第50卷,第1期,2022年1月11日,第368至377頁,Diegelman, A. M.等人,《透過編碼髮夾核酶的環狀DNA寡核苷酸的滾動轉錄生成環狀RNA和反式切割催化RNA(Generation of circular RNAs and trans-cleaving catalytic RNAs by rolling transcription of circular DNA oligonucleotides encoding hairpin ribozymes)》,《 核酸研究》,1998,第26卷,第13期:3235-3241。髮夾核酶是本技術領域習知的,並且許多天然髮夾核酶以及人工設計的髮夾核酶也是已知的(Christina E Weinberg等人,《在不同的環狀RNA中鑑定出比先前已知的多200倍以上的髮夾核酶(Identification of over 200-fold more hairpin ribozymes than previously known in diverse circular RNAs)》,《 核酸研究》2021年6月21日;49(11):6375-6388)。在某些實施方式中,髮夾核酶衍生自細菌、真核生物或植物病毒RNA衛星(例如菸草環斑病毒(TRSV)衛星RNA、菊苣黃斑駁病毒(sCYMV)衛星RNA,或擬南芥花葉病毒(sARMV)衛星RNA)。
在某些實施方式中,第一環化元件包含自剪接元件的3’部分,所述自剪接元件的3’部分包含3’剪接位點,第二環化元件包含自剪接元件的5’部分,所述自剪接元件的5’部分包含5’剪接位點。
如本文所用,術語「剪接位點」是指部分或完全包括在自剪接元件中的二核苷酸,並且在RNA環化期間在該二核苷酸之間磷酸二酯鍵被切割。
如本文所用,「自剪接元件的3’部分」是與天然I型內含子、天然II型內含子或天然髮夾核酶的3’近端片段(包括3’剪接位點二核苷酸)具有至少75%(例如,至少80%、至少85%、至少90%、至少95%、100%)序列同一性的連續序列,以及,任選地,長度為至少1個核苷酸(例如,長度為至少5個核苷酸、長度為至少10個核苷酸、長度為至少15個核苷酸、長度為至少20個核苷酸、長度為至少25個核苷酸、長度為至少50個核苷酸)的相鄰外顯子序列。
如本文所用,「自剪接元件的5’部分」是與天然I型內含子、天然II型內含子或天然髮夾核酶的5’近端片段(包括5’剪接位點二核苷酸)具有至少75%(例如,至少80%、至少85%、至少90%、至少95%、100%)序列同一性的連續序列,以及,任選地,長度為至少1個核苷酸(例如,長度為至少5個核苷酸、長度為至少10個核苷酸、長度為至少15個核苷酸、長度為至少20個核苷酸、長度為至少25個核苷酸、長度為至少50個核苷酸)的相鄰外顯子序列。
在某些實施方式中,I型內含子衍生自噬菌體T4胸苷酸合酶(td)基因、藍細菌魚腥藻(Cyanobacterium Anabaena sp.)的pre-tRNA-Leu基因或四膜蟲(Tetrahymena)基因。在某些實施方式中,II型內含子衍生自乳酸乳球菌( L. lactis)Ll.LtrB基因,或衍生自酵母。
在某些實施方式中,如本文提供的自剪接元件的3’部分由包含SEQ ID NO: 7 (AACAATAGATGACTTACAACTAATCGGAAGGTGCAGAGACTCGACGGGAGCTACCCTAACGTCAAGACGAGGGTAAAGAGAGAGTCCAATTCTCAAAGCCAATAGGCAGTAGCGAAAGCTGCAAGAGAATGAAAATCCGTTGACCTTAAACGGTCGTGTGGGTTCAAGTCCCTCCACCCCCA)的核酸序列編碼。
在某些實施方式中,如本文提供的自剪接元件的5’部分由包含SEQ ID NO: 12 (AGACGCTACGGACTTAAATAATTGAGCCTTAAAGAAGAAATTCTTTAAGTGGATGCTCTCAAACTCAGGGAAACCTAAATCTAGTTATAGACAAGGCAATCCTGAGCCAAGCCGAAGTAGTAATTAGTAAG)的核酸序列編碼。
2. 靶序列
如本文所用,術語「靶序列」可以是可插入編碼RNA轉錄物的序列中的且包含在由本文提供的RNA轉錄物轉錄的環狀RNA中的任何感興趣的序列。靶序列包含蛋白質編碼或非編碼區。在某些實施方式中,靶序列包含靶蛋白編碼區。在某些實施方式中,靶序列包含生物活性RNA或生物活性RNA的前體。在某些實施方式中,靶序列包含或基本上由一個或多個選殖位點組成。
靶序列可以包含靶蛋白編碼區。在某些實施方式中,蛋白質編碼區編碼真核或原核來源的蛋白質。在某些實施方式中,蛋白質編碼區編碼人蛋白質或非人蛋白質。在某些實施方式中,蛋白質可以是用於研究用途、治療用途或診斷用途的任何蛋白質。在一些實施方式中,蛋白質可以是治療性蛋白質,例如抗體、細胞激素、肽激素等。在某些實施方式中,蛋白質可以是預防性蛋白質,例如蛋白質疫苗等。在某些實施方式中,蛋白質可以是核酸酶,例如Cas蛋白質、重組酶等。在某些實施方式中,蛋白質可以是受體,例如嵌合抗原受體等。在一些實施方式中,蛋白質可以選自但不限於hFIX、SP-B、VEGF-A、人甲基丙二醯輔酶A變位酶(hMUT)、CFTR、癌症自身抗原和其它基因編輯酶,如Cpf1、鋅指核酸酶(ZFN)和轉錄活化物樣效應物核酸酶(TALEN)。
在某些實施方式中,靶序列進一步包含與靶蛋白編碼區可操作地連接的5’非轉譯區(UTR)和/或3’UTR。5’UTR可以選自但不限於人β珠蛋白、非洲爪蟾(Xenopus laevis)β珠蛋白、人α珠蛋白、非洲爪蟾α珠蛋白、風疹病毒(rubella virus)、菸草花葉病毒(tobacco mosaic virus)、小鼠Gtx、登革病毒(dengue virus)、熱休克蛋白70 kDa蛋白1A(heat shock protein 70 kDa protein 1A)、菸草醇脫氫酶、菸草蝕紋病毒(tobacco etch virus)、蕪菁皺縮病毒(turnip crinkle virus)或腺病毒三聯前導序列(adenovirus tripartite leader)的5’UTR。3’UTR可以選自但不限於人β珠蛋白、人α珠蛋白、非洲爪蟾β珠蛋白、非洲爪蟾α珠蛋白、人催乳素、人GAP-43、人eEF1a1、人Tau、人TNF α、登革病毒、漢坦病毒小mRNA(hantavirus small mRNA)、布尼亞病毒小mRNA(bunyanavirus small mRNA)、蕪菁黃花葉病毒(turnip yellow mosaic virus)、C型肝炎病毒、風疹病毒(rubella virus)、菸草花葉病毒(tobacco mosaic virus)、人IL-8、人肌動蛋白、人GAPDH、人微管蛋白、木槿褪綠環斑病毒(hibiscus chlorotic rinsgpot virus)、土撥鼠肝炎病毒轉譯後調控元件(woodchuck hepatitis virus post translationally regulated element)、辛德畢斯病毒(sindbis virus)、蕪菁皺縮病毒、菸草蝕紋病毒或委內瑞拉馬腦炎病毒(Venezuelan equine encephalitis virus)的3’UTR。野生型5’UTR和/或3’UTR序列也可以被修飾並且在本發明中是有效的。
在某些實施方式中,靶序列進一步包含與靶蛋白編碼區可操作地連接的內部核醣體進入位點(IRES)。在某些實施方式中,IRES可操作地連接在靶蛋白編碼區的上游或下游。IRES序列可以選自但不限於陶拉症候群病毒(Taura syndrome virus)、吸血獵椿病毒(Triatoma virus)、泰勒氏腦脊髓炎病毒(Theiler’s encephalomyelitis virus)、猿猴病毒40(Simian virus 40)、紅火蟻病毒1(Solenopsis invicta virus 1)、禾谷縊管蚜病毒(Rhopalosiphum padi virus)、網狀內皮增生症病毒(Reticuloendotheliosis virus)、人脊髓灰質炎病毒1、斯氏珀蝽腸病毒(Plautia stall intestine virus)、克什米爾蜂病毒(Kashmir bee virus)、人鼻病毒2(Human rhinovirus 2)、琉璃葉蟬病毒1(Homalodisca coagulata virus-1)、人類免疫缺陷病毒1型、琉璃葉蟬病毒1、虱P病毒(Himetobi P virus)、C型肝炎病毒、A型肝炎病毒、GB型肝炎病毒、口蹄疫病毒(foot and mouth disease virus)、人腸病毒71型(Human enterovirus 71)、馬鼻炎病毒(Equine rhinitis virus)、茶尺蠖樣病毒(Ectropis obliqua picoma-like virus)、腦心肌炎病毒(Encephalomyocarditis virus(EMCV))、果蠅C病毒、十字花科菸草花葉病毒(Crucifer tobaco virus)、蟋蟀麻痹病毒(Cricket paralysis virus,)、牛病毒性腹瀉病毒1(Bovine viral diarrhea virus 1)、黑蜂王台病毒(Black queen cell virus)、蚜蟲致死性麻痹病毒(Aphid lethal paralysis virus)、禽腦脊髓炎病毒(Avian encephalomyelitis virus)、急性蜂麻痹病毒(Acute bee paralysis virus)、木槿褪綠環斑病毒、經典豬瘟病毒(Classical swine fever virus)、人FGF2、人SFTPA1、人AML1/RUNX1、果蠅觸角足(Drosophila antennapedia)、人AQP4、人AT1R、人BAG-1、人BCL2、人BiP、人c-IAP1、人c-myc、人eIF4G、小鼠NDST4L、人LEF1、小鼠HIF1 α、人n.myc、小鼠Gtx、人p27kip1、人PDGF2/c-sis、人p53、人Pim-1、小鼠Rbm3、果蠅reaper、犬科Scamper、果蠅Ubx、唾液病毒(Salivirus)、科薩病毒(Cosavirus)、雙埃柯病毒(Parechovirus)、人UNR、小鼠UtrA、人VEGF-A、人XIAP、果蠅無毛(Drosophila hairless)、釀酒酵母TFIID、釀酒酵母YAP1(S. cerevisiae TFIID)、人c-src、人FGF-1、猿猴小核醣核酸病毒(Simian picomavirus)、蕪菁皺縮病毒、eIF4G適體、克沙奇病毒B3(Coxsackievirus B3(CVB3))或克沙奇病毒A(Coxsackievirus A(CVB1/2))的IRES序列。野生型IRES序列也可以被修飾並在本發明中是有效的。在一些實施方式中,IRES序列的長度為約50個核苷酸。
在某些實施方式中,靶序列可以包含非編碼RNA。在某些實施方式中,靶序列可以包含生物活性RNA或生物活性RNA的前體。在某些實施方式中,生物活性RNA包含短髮夾RNA、轉運RNA(tRNA)、短干擾RNA、微RNA(microRNA)或嚮導RNA。可以加工生物活性RNA的前體以產生生物活性RNA。例如,短髮夾RNA可以加工成生物活性siRNA,其可以是siRNA的前體。
3. 純化片段
在某些實施方式中,RNA轉錄物具有至少一個純化片段。
如本文所用,術語「純化片段」是指存在於RNA轉錄物中但不存在於由RNA轉錄物產生的環狀RNA中的核酸片段。至少一個純化片段位於RNA轉錄物內,但不在靶序列內。由RNA轉錄物產生的環狀RNA中不包括純化片段,並且其存在不會顯著減少環狀RNA的產生。換言之,包含至少一個本文提供的純化片段的RNA轉錄物仍可以被環化以產生環狀RNA。在某些實施方式中,RNA轉錄物中的純化片段包含或者是RNA片段。
純化片段的核酸序列可充分區別於環狀RNA的任何等長片段。設計可用作純化片段的獨特核苷酸序列以區別於給定的環狀RNA序列的方法是本領域已知的。
在某些實施方式中,純化片段可以是存在於RNA轉錄物中但不存在於由RNA轉錄物產生的環狀RNA中的RNA序列。
在某些實施方式中,至少一個純化片段中的每一個在15至20個核苷酸(nt),或15nt至25nt,或15nt至40nt,或15nt至50nt的給定長度上與環狀RNA具有不超過90%(或不超過80%、不超過70%、不超過60%、不超過50%)的序列同一性。
例如,當純化片段的長度短於或在15至20nt、15nt至25nt,或15nt至40nt,或15nt至50nt的範圍內時,純化片段可以在純化片段的整個長度上與環狀RNA具有不超過90%、不超過80%、不超過70%、不超過60%、不超過50%,或不超過40%的序列同一性。
再比如,當純化片段的長度長於15至20nt、15nt至25nt,或15nt至40nt,或15nt至50nt的給定長度範圍的上限時,則純化片段的給定長度片段可以與環狀RNA的等長片段具有不超過90%、不超過80%、不超過70%、不超過60%、不超過50%,或不超過40%的序列同一性。
在某些實施方式中,至少一個純化片段與環狀RNA的等長片段相差至少1、2、3、4、5、6、7、8、9、10個或甚至更多個核苷酸。
在某些實施方式中,至少一個純化片段的長度在15至500個核苷酸、15至300個核苷酸、15至200個核苷酸、15至150個核苷酸、15至100個核苷酸、15至50個核苷酸、15至25個核苷酸、20至500個核苷酸、20至300個核苷酸、20至200個核苷酸、20至150個核苷酸、20至100個核苷酸、20至50個核苷酸或20至25個核苷酸的範圍內。
在某些實施方式中,純化片段不是環化元件的一部分。
在某些實施方式中,純化片段包含或基本上由均多聚或均寡聚序列組成,僅舉幾個例子,諸如poly(A)、poly(U)、poly(T)、poly(C)、poly(G)、poly(AT)、poly(TC)、poly(AU)、poly(UC)、poly(AC)、poly(CA)、poly(AG)、poly(GA)。在某些實施方式中,純化片段包含或基本上由均多聚或均寡聚RNA序列組成,僅舉幾個例子,諸如poly(A)、poly(U)、poly(C)、poly(G)、poly(AU)、poly(UC)、poly(AC)、poly(CA)、poly(AG)或poly(GA)。本文所用的關於純化片段的術語「聚(poly)」意在指任何合適長度的核苷酸(即多於1個)。
在某些實施方式中,純化片段包含或基本上由隨機N-mer序列或隨機N-mer序列的重複組成。在某些實施方式中,N可以是5和45之間的任何整數。這些N-mer序列的重複數目可以是1、2、3、4、5、6、7、8、9或10。
在某些實施方式中,純化片段包含或基本上由靶結合寡核苷酸組成,靶結合寡核苷酸能夠特異性結合非核苷酸的靶。在某些實施方式中,靶可以是蛋白質、肽、多醣或小分子。在某些實施方式中,純化片段可以是形成與靶特異性結合的二級結構的適體。靶可以是用於蛋白質純化的常見親和配體之一,諸如生物素、鏈黴親和素、榖胱甘肽、幾丁質、蛋白A和蛋白G。優化鏈黴親和素結合RNA適體並將其用於核醣核蛋白的純化(《用於純化核醣核蛋白複合物的優化的鏈黴親和素結合RNA適體鑒定新的ARE結合蛋白(An optimized streptavidin-binding RNA aptamer for purification of ribonucleoprotein complexes identifies novel ARE-binding proteins)》,《 核酸研究》2014年1月;42(2):e13)。適合作為本文提供的純化片段的適體也可以是ARC1905、E10030、呱加他尼鈉(Pegaptanib sodium)(Macugen)、EYE001、REG1、NOX-E36、NOX-A12、ARC1779等。可用的適體及其標靶已描述於參考文獻中(例如《治療性基因組學和蛋白質組學遞送中的挑戰(Challenges in delivery of therapeutic genomics and proteomics[M])》愛思唯爾(Elsevier),2010.),其可以透過引用整體併入本文。
在某些實施方式中,純化片段包含或基本上由poly(A)短序列組成。在某些實施方式中,poly(A)短序列具有15至200個核苷酸、15至150個核苷酸、15至100個核苷酸、15至50個核苷酸或15至25個核苷酸的長度範圍。在某些實施方式中,poly(A)短序列具有15至150個核苷酸的長度範圍。
純化片段能夠特異性地與RNA轉錄物外部的捕獲劑相互作用或結合。捕獲劑可以特異性地與純化片段相互作用、結合或雜交,但不與環狀RNA相互作用、結合或雜交,從而允許環狀RNA從RNA轉錄物中分離。捕獲劑可以是能夠與純化片段特異性相互作用或結合的任何分子實體。捕獲劑的實例包括但不限於核酸序列,或核酸結合蛋白或肽,或化合物或聚合物或能夠結合純化片段的任何其它分子或材料。
在某些實施方式中,捕獲劑包含核酸序列。在某些實施方式中,捕獲劑可以包含天然存在的核酸和/或其類似物、變體和任何模擬物。捕獲劑可以具有任何合適的核苷酸長度(例如15nt至25nt,或15nt至40nt,或15nt至50nt),只要它可以與純化片段雜交。
在某些實施方式中,捕獲劑包含能夠在嚴格條件下與純化片段雜交的核酸片段。在某些實施方式中,捕獲劑包含或基本上由與純化片段互補的DNA或RNA的均多聚或均寡聚序列組成,包括其類似物、變體和任何模擬物。在某些實施方式中,僅舉幾個例子,捕獲劑包含以下或基本上由以下組成:去氧胸苷寡核苷酸(oligo(dT))、去氧腺嘌呤寡核苷酸(oligo(dA))、寡核苷酸(去氧腺嘌呤:去氧胸苷(oligo(dA:dT))、去氧胞嘧啶寡核苷酸(oligo(dC))、去氧鳥苷寡核苷酸(oligo(dG))、尿苷寡核苷酸(oligo(U))、去氧尿苷寡核苷酸(oligo(dU))。
在某些實施方式中,捕獲劑包含能夠與本文提供的純化片段結合的蛋白質、肽、多醣或小分子。在某些實施方式中,捕獲劑包含能夠與包含在純化片段中的適體片段結合的蛋白質、肽、多醣或小分子。在某些實施方式中,捕獲劑包含或者是常見的親和配體,諸如生物素、鏈黴親和素、榖胱甘肽、幾丁質、蛋白A和蛋白G。
在某些實施方式中,捕獲劑包含與純化片段的核苷酸序列至少80%、85%、90%、95%或100%互補的核酸片段。在某些實施方式中,純化片段包含或基本上由poly(A)短序列組成,並且捕獲劑包含oligo(U)、oligo(dU)、oligo(dT)或任何能夠與poly(A)短序列雜交的寡核苷酸。oligo(dT)的一個實例是本領域中廣泛用於純化具有poly(A)尾的mRNA的試劑。
在某些實施方式中,捕獲劑可以任選地固定在基底(諸如珠(例如磁珠))或層析基質上。
本文提供的RNA轉錄物包含至少一個純化片段,例如1或2個或甚至更多個純化片段。
在某些實施方式中,至少一個純化片段與第一環化元件連接,或與第二環化元件連接。在某些實施方式中,RNA轉錄物具有分別與第一環化元件和第二環化元件連接的兩個純化片段。
在某些實施方式中,至少一個純化片段:a)位於第一環化元件的上游,b)位於第二環化元件的下游,c)或a)和b)的任何組合。在某些實施方式中,至少一個純化片段:a)附著於第一環化元件的5’端,或b)附著於第二環化元件的3’端,或a)和b)的任何組合。
在某些實施方式中,RNA轉錄物包含位於第一環化元件上游的一個純化片段,其在本文中也稱為5’純化片段。在某些實施方式中,RNA轉錄物包含位於第二環化元件下游的一個純化片段,其在本文中也稱為3’純化片段。在某些實施方式中,RNA轉錄物包含分別位於第一環化元件上游和第二環化元件下游的5’純化片段和3’純化片段兩者。
在某些實施方式中,5’純化片段和3’純化片段可以具有相同的核苷酸序列,或者可以具有不同的核苷酸序列。
在某些實施方式中,5’純化片段和3’純化片段具有相同的序列,並且兩者可以結合相同的捕獲劑,這允許從環狀RNA中分離RNA轉錄物。
在某些實施方式中,5’純化片段和3’純化片段具有不超過90%、不超過80%、不超過70%、不超過60%、不超過50%或不超過40%的序列同一性。在某些實施方式中,5’純化片段和3’純化片段具有不超過90%、不超過80%、不超過70%、不超過60%、不超過50%或不超過40%的序列互補性。在這樣的實施方式中,可以使用兩種捕獲劑,每種捕獲劑特異性結合5’純化片段和3’純化片段中的一者。可以連續或同時使用兩種捕獲劑從環狀RNA中分離RNA轉錄物。
4. 同源臂
在某些實施方式中,RNA轉錄物進一步包含至少一個同源臂。同源臂可以位於第一環化元件的上游(並且任選地與其相鄰),這種同源臂可以被稱為5’同源臂。同源臂也可以位於第二環化元件的下游(並且任選地與其相鄰),這種同源臂可以被稱為3’同源臂。在某些實施方式中,同源臂可以位於自剪接元件的3’部分的上游(即5’同源臂)和/或自剪接元件的5’部分的下游(即3’同源臂)。
在某些實施方式中,5’同源臂插入在5’純化片段和第一環化元件之間。在某些實施方式中,3’同源臂插入在3’純化片段和第二環化元件之間。在某些實施方式中,5’同源臂位於5’純化片段的上游和/或3’同源臂位於3’純化片段的下游。
在某些實施方式中,RNA轉錄物包含5’同源臂和3’同源臂兩者。
如本文所用,「同源臂」是與同一多核苷酸分子中的另一序列(例如互補同源臂)具有至少約75%(例如,至少約80%、至少約85%、至少約90%、至少約95%、約100%)互補性的任何連續序列。可用於本揭露內容的同源臂可以具有任何合適的長度,例如長度為至少1 nt(例如10nt、20nt、30nt、40nt、50nt、60nt、70nt、80nt、90nt、100nt或更多),或長度高達250 nt。在某些實施方式中,RNA轉錄物中的同源臂包含或者是RNA片段。
在某些實施方式中,RNA轉錄物具有5’同源臂和3’同源臂兩者,其具有至少75%的互補性。在某些實施方式中,預計同源臂中的每一者與RNA轉錄物中的非預期序列(例如,非同源臂序列)的等長片段具有小於50%(例如,小於45%、小於40%、小於35%、小於30%、小於25%)的互補性。
在某些實施方式中,同源臂包含至少一個衍生自ALU重複序列的ALU元件。在某些實施方式中,ALU元件與自剪接元件的3’部分和/或自剪接元件的5’部分連接(William R. Jeck等人,《環狀RNA豐富、保守且與ALU重複序列連接》,《 RNA》(2013),19:141-157)。
在某些實施方式中,如本文提供的5’同源臂由包含SEQ ID NO: 6(GGGAAGACCCTCGACCGTCGATTGTCCACTGGTC)的核酸序列編碼。
在某些實施方式中,如本文提供的3’同源臂由包含SEQ ID NO: 13(ACCAGTGGACAATCGACGGATAACAGCATATCTAGG)的核酸序列編碼。
5. 間隔區
在某些實施方式中,RNA轉錄物進一步包含至少一個間隔區。在某些實施方式中,間隔區位於第一環化元件的下游(並且任選地與其相鄰)和/或第二環化元件的上游(並且任選地與其相鄰)。在某些實施方式中,間隔區位於自剪接元件的3’部分的下游(並且任選地與其相鄰)和/或自剪接元件的5’部分的上游(並且任選地與其相鄰)。
在某些實施方式中,間隔區位於第一環化元件(例如自剪接元件的3’部分)和靶序列之間,這種間隔區可以被稱為5’間隔區。在某些實施方式中,間隔區位於靶序列和第二環化元件(例如自剪接元件的5’部分)之間,這種間隔區可以被稱為3’間隔區。
如本文所用,「間隔區」是指介於兩個其它核苷酸序列之間的一個或多個連續核苷酸的片段,以防止這兩個其它核苷酸序列連接在一起或干擾彼此的預期生物活性。在某些實施方式中,RNA轉錄物中的間隔區包含或者是RNA片段。不希望受任何理論的束縛,據信在環化元件和靶序列之間包括間隔區對於保存環化元件(例如內含子序列)內存在的二級結構是有用的,這對於核酶活性可能是重要的,因此允許比沒有間隔區的DNA建構體中更高的環化效率。例如,可以在例如IRES和環化元件之間,或者在環化元件和靶編碼區或靶非編碼區(例如UTR區)之間插入間隔區。在某些實施方式中,間隔區可以具有任何合適的長度,例如至少7個核苷酸長(並且任選地不長於100個核苷酸)。
在某些實施方式中,間隔區位於環化元件和IRES序列之間。在某些實施方式中,5’間隔區位於第一環化元件(例如自剪接元件的3’部分)和IRES序列之間。在某些實施方式中,3’間隔區位於IRES序列和第二環化元件(例如自剪接元件的5’部分)之間。在某些實施方式中,5’間隔區位於第一環化元件和靶蛋白編碼區之間。在某些實施方式中,3’間隔區位於靶蛋白編碼區和第二環化元件之間。在某些實施方式中,靶序列包含兩個互補間隔區序列。在某些實施方式中,兩個互補間隔區序列側接本文提供的靶序列。
在某些實施方式中,間隔區含有以下中的一種或多種:a)至少5 nt長的非結構化區域,b)預計與遠端(即,非相鄰)序列至少5 nt長互補的區域,包括另一個間隔區,和/或c)至少1 nt長的結構化區域,其範圍限於間隔區的序列。
在某些實施方式中,間隔區不同於本文提供的純化片段。在某些實施方式中,間隔區不是poly(A)、poly(U)、poly(C)或poly(AC)。
在某些實施方式中,間隔區與任何純化片段不互補(或不雜交)。在某些實施方式中,間隔區與任何同源臂不互補(或不雜交)。
在某些實施方式中,如本文提供的5’間隔區由包含SEQ ID NO: 8(TGATCTGAAACCAACTTTATTACTATATTCCCCACAACCCCC)的核酸序列編碼。
在某些實施方式中,如本文提供的3’間隔區由包含SEQ ID NO: 11(GGATCC)的核酸序列編碼。
6. RNA 轉錄物中包含的元件的示例性設計
本揭露內容提供了包含在本文提供的RNA轉錄物中的元件的設計的示例性說明。圖2示出了展示示例性設計的示意圖。
在某些實施方式中,RNA轉錄物從5’至3’包含第一環化元件(例如自剪接元件的3’部分)、靶序列和第二環化元件(例如自剪接元件的5’部分)。這些沒有純化片段(PF)的DNA建構體或RNA轉錄物在圖2中被命名為「Ctrl」。RNA轉錄物可以進一步具有一個純化片段,其位於第一環化元件的5’端(在圖2中命名為5PF)或第二環化元件的3’端(在圖2中命名為3PF)。或者,RNA轉錄物可以具有兩個純化片段,分別位於第一環化元件的5’端和第二環化元件的3’端(在圖2中命名為5PF+3PF)。在同一RNA轉錄物中提供的兩個純化片段可以具有或可以不具有相同的序列。特別地,本文提供的RNA轉錄物包含彼此可操作地連接並按以下順序(從5’至3’)排列的以下元件:
I-Ctrl:a)自剪接元件的3’部分,b)靶序列,和c)自剪接元件的5’部分;
I-5PF:a)5’ 純化片段;b)自剪接元件的3’部分,c)靶序列,和d)自剪接元件的5’部分;
I-3PF:a)自剪接元件的3’部分,b)靶序列,c)自剪接元件的5’部分,和d)3’ 純化片段;或
I-5PF+3PF:a)5’ 純化片段;b)自剪接元件的3’部分,c)靶序列,d)自剪接元件的5’部分,和e)3’ 純化片段
在某些實施方式中,RNA轉錄物在靶序列的上游從5’至3’包含第一環化元件(例如自剪接元件的3’部分)和5’間隔區。在某些實施方式中,RNA轉錄物在靶序列的下游從5’至3’包含3’間隔區和第二環化元件(例如自剪接元件的5’部分)。RNA轉錄物可以具有一個純化片段,其位於第一環化元件的5’端或第二環化元件的3’端。或者,RNA轉錄物可以具有兩個純化片段,分別位於第一環化元件的5’端和第二環化元件的3’端。在同一RNA轉錄物中提供的兩個純化片段可以具有或可以不具有相同的序列。特別地,本文提供的RNA轉錄物包含彼此可操作地連接並按以下順序(從5’至3’)排列的以下元件:
II-Ctrl:a)自剪接元件的3’部分,b)5’間隔區,c)靶序列,d)3’間隔區,和e)自剪接元件的5’部分;
II-5PF:a)5’ 純化片段;b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,和f)自剪接元件的5’部分;
II-3PF:a)自剪接元件的3’部分,b)5’間隔區,c)靶序列,d)3’間隔區,e)自剪接元件的5’部分,和f)3’ 純化片段;或
II-5PF+3PF:a)5’ 純化片段;b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,和g)3’ 純化片段
在某些實施方式中,RNA轉錄物在靶序列的上游從5’至3’包含5’同源臂、第一環化元件(例如自剪接元件的3’部分)和5’間隔區。在某些實施方式中,RNA轉錄物在靶序列的下游從5’至3’包含3’間隔區、第二環化元件(例如自剪接元件的5’部分)和3’同源臂。RNA轉錄物可以具有一個純化片段,其位於5’同源臂的5’端或3’同源臂的3’端。或者,RNA轉錄物可以具有兩個純化片段,分別位於5’同源臂的5’端和3’同源臂的3’端。在同一RNA轉錄物中提供的兩個純化片段可以具有或可以不具有相同的序列。特別地,本文提供的RNA轉錄物包含彼此可操作地連接並按以下順序(從5’至3’)排列的以下元件:
III-Ctrl:a)5’同源臂,b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,和g)3’同源臂;
III-5PF:a)5’ 純化片段,b)5’同源臂,c)自剪接元件的3’部分,d)5’間隔區,e)靶序列,f)3’間隔區,g)自剪接元件的5’部分,和h)3’同源臂;
III-3PF:a)5’同源臂,b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,g)3’同源臂,和h)3’ 純化片段;或
III-5PF+3PF:a)5’ 純化片段,b)5’同源臂,c)自剪接元件的3’部分,d)5’間隔區,e)靶序列,f)3’間隔區,g)自剪接元件的5’部分,h)3’同源臂,和i)3’ 純化片段
在某些實施方式中,RNA轉錄物在靶序列的上游從5’至3’包含5’同源臂、第一環化元件(例如自剪接元件的3’部分)和5’間隔區。在某些實施方式中,RNA轉錄物在靶序列的下游從5’至3’包含3’間隔區、第二環化元件(例如自剪接元件的5’部分)和3’同源臂。RNA轉錄物可以具有一個純化片段,其位於5’同源臂和第一環化元件之間,或位於3’同源臂和第二環化元件之間。或者,RNA轉錄物可以具有兩個純化片段,分別位於5’同源臂和第一環化元件之間和3’同源臂和第二環化元件之間。在同一RNA轉錄物中提供的兩個純化片段可以具有或可以不具有相同的序列。特別地,本文提供的RNA轉錄物包含彼此可操作地連接並按以下順序(從5’至3’)排列的以下元件:
IV-Ctrl:a)5’同源臂,b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,和g)3’同源臂(與III-Ctrl相同);
IV-5PF:a)5’同源臂,b)5’ 純化片段,c)自剪接元件的3’部分,d)5’間隔區,e)靶序列,f)3’間隔區,g)自剪接元件的5’部分,和h)3’同源臂;
IV-3PF:a)5’同源臂,b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,g)3’ 純化片段,和h)3’同源臂;或
IV-5PF+3PF:a)5’同源臂,b)5’ 純化片段,c)自剪接元件的3’部分,d)5’間隔區,e)靶序列,f)3’間隔區,g)自剪接元件的5’部分,h)3’ 純化片段,和i)3’同源臂。
7. 環狀 RNA
在某些實施方式中,本文提供的RNA轉錄物可以環化形成包含靶序列的環狀RNA。環化可以透過分子內形成3’,5’-磷酸二酯鍵來實現,這需要線性RNA轉錄物3’和5’末端的鄰近。
在某些實施方式中,環化可以透過反向剪接反應或外顯子跳躍來實現。在某些實施方式中,第一環化元件包含自剪接元件的3’部分,其包含內含子部分的3’近端片段和長度為至少1個核苷酸的相鄰外顯子部分。在某些實施方式中,第二環化元件包含自剪接元件的5’部分,其包含內含子的5’近端片段和長度為至少1個核苷酸的相鄰外顯子部分。該環化過程包括將下游外顯子部分的3’-尾連接到通常位於上游的長度為至少1個核苷酸的外顯子部分的5’-頭。這透過添加促進RNA-RNA鍵形成的合適的酶或因子來促進。在某些實施方式中,所得環狀RNA分子可以含有第一環化元件的外顯子部分和第二環化元件的外顯子部分,但分別不含第一環化元件和第二環化元件的內含子部分。提供環狀RNA的其它剪接方法是本領域已知的,例如參見Junjie Xiao編輯的《環狀RNA的生物發生和功能(circular RNAs Biogenesis and Functions)》。其它合適的方法可用於產生環狀RNA,參見例如,Sonja Petkovic和Sabine Müller,《體內和體外的RNA環化策略》,《 核酸研究》,2015,第43卷,第4期,2454-2465。
在某些實施方式中,所得環狀RNA分子可進一步包含至少一個間隔區。在某些實施方式中,間隔區位於第一環化元件的外顯子部分和靶序列之間,這種間隔區可以被稱為5’間隔區。在某些實施方式中,間隔區位於靶序列和第二環化元件的外顯子部分之間,這種間隔區可以被稱為3’間隔區。
在某些實施方式中,所得環狀RNA包含靶序列,該靶序列包含與靶蛋白編碼區可操作連接的內部核醣體進入位點(IRES)。
DNA 建構體作為進一步建構 DNA 建構體的載體
在另一方面,本揭露內容提供了包含多重選殖位和編碼至少一個純化片段的DNA的DNA建構體。這種DNA建構體允許在多重選殖位插入本文提供的一個或多個靶序列,和/或第一環化元件和/或第二環化元件,使得插入的靶序列和/或環化元件可操作地連接到包含在DNA建構體中的純化片段。應當理解,在DNA建構體的語境中,術語如「環化元件」、「靶序列」、「純化片段」、「同源臂」和「間隔區」旨在表示編碼如本文所述的RNA轉錄物的相應元件(即環化元件、靶序列、純化片段、同源臂和間隔區)的DNA序列。例如,當在DNA建構體的語境中使用時,術語「環化元件」可以指編碼RNA轉錄物中的環化元件的DNA,術語「靶序列」可以指編碼RNA轉錄物中的靶序列的DNA,術語「純化片段」可以指編碼RNA轉錄物中的純化片段的DNA,術語「同源臂」可以指編碼RNA轉錄物中的同源臂的DNA,並且術語「間隔區」可以指編碼RNA轉錄物中的間隔區的DNA。
如本文所用,術語「編碼(code)」或「編碼(encode)」是指多核苷酸(如DNA或RNA)中的特定核苷酸序列的固有性質,其用作在體內或體外生物過程中合成其它聚合物和大分子的模版,這些其它聚合物和大分子具有限定的核苷酸序列或限定的胺基酸序列以及由此產生的生物性質。例如,如果一種DNA在合適的體內或體外生物系統中轉錄產生一種RNA轉錄物,則該DNA編碼該RNA轉錄物,如果一種RNA轉錄物在合適的體內或體外生物系統中轉譯產生一種蛋白質,則該RNA轉錄物編碼該蛋白質,以及如果一種DNA在合適的體內或體外生物系統中轉錄和轉譯產生一種蛋白質,則該DNA編碼該蛋白質。編碼鏈(有義鏈)(其核酸序列與RNA轉錄物序列相同並通常在序列表中提供)和非編碼鏈(無義鏈)(用作DNA轉錄模版)均可被稱為編碼所述DNA的蛋白質或其它產物。
這種DNA建構體可以用作建構本文提供的DNA建構體的載體或工具,即編碼本文提供的RNA轉錄物的DNA建構體,其能夠形成包含靶序列的環狀RNA。
本揭露內容還提供了一種DNA建構體,其包含彼此可操作地連接並以5’至3’順序排列的以下元件: a)第一純化片段,任選地第一poly(A)短序列,和 b)多重選殖位,其包含或基本上由一個或多個用於插入靶序列的選殖位點組成。
在某些實施方式中,DNA建構體進一步包含位於多重選殖位下游的第二純化片段。
在某些實施方式中,DNA建構體進一步包含位於第一純化片段和多重選殖位之間的第一環化元件。在某些實施方式中,DNA建構體進一步包含位於多重選殖位下游或位於多重選殖位和第二純化片段之間的第二環化元件。
在某些實施方式中,第二純化片段包含第二poly(A)短序列。
在某些實施方式中,DNA建構體進一步包含位於第一純化片段上游的RNA聚合酶啟動子。
本揭露內容進一步提供了一種DNA建構體,其包含彼此可操作地連接並按以下順序排列的以下元件: a)RNA聚合酶啟動子, b)第一環化元件, c)多重選殖位,和 d)第二環化元件, 其中DNA建構體進一步包含至少一個位於RNA聚合酶啟動子下游的純化片段。
在某些實施方式中,多個純化片段中的一個位於第一環化元件的上游和/或第二環化元件的下游。
如本文所用,術語「多重選殖位」或「MCS」是指含有多個(至多約20個)限制性位點的短DNA片段,是工程化質體和其它載體的標準元件。MCS中的限制性位點通常是唯一的,其在載體中僅存在一次,因此可用於將感興趣的序列插入載體中。此外,表現載體通常被設計成使得MCS可以透過選擇正確的插入位點將蛋白質編碼序列插入正確的閱讀框中,和/或用戶可以透過選擇MCS來選擇閱讀框,這通常在所有三個框中都是可用的。
用於製備環狀 RNA 的方法
本揭露內容提供了一種產生如本文提供的RNA轉錄物的方法,該方法包括從本文提供的DNA建構體轉錄,從而獲得本文提供的RNA轉錄物。
在另一方面,本文提供的RNA轉錄物可以透過在RNA水平上將純化片段標記為前體來產生。本揭露內容還提供了一種產生如本文提供的RNA轉錄物的方法,該方法包括: a)提供前體RNA,其與本文提供的RNA轉錄物的不同之處在於缺少純化片段,以及 b)將純化片段添加到前體RNA中,從而獲得所述RNA轉錄物。
在某些實施方式中,前體RNA與本文提供的RNA轉錄物的不同之處僅在於缺少純化片段。
在某些實施方式中,純化片段被添加到:a)位於第一環化元件上游的位置,b)位於第二環化元件下游的位置,c)或a)和b)的任何組合。
在某些實施方式中,純化片段:a)附著於第一環化元件的5’端,或b)附著於第二環化元件的3’端,c)或a)和b)的任何組合。
本揭露內容進一步提供了一種產生環狀RNA的方法,該方法包括: a)提供所述RNA轉錄物,以及 b)使RNA轉錄物自環化以形成環狀RNA。
在某些實施方式中,步驟a)中的RNA轉錄物已使用本文揭露的捕獲劑富集。捕獲劑可以特異性結合RNA轉錄物中存在的純化片段。
在某些實施方式中,該方法進一步包括透過本文提供的捕獲劑從步驟b)獲得的產物中純化環狀RNA。在某些實施方式中,捕獲劑特異性結合RNA轉錄物中的純化片段和任選地副產物中的但不存在於環狀RNA中的純化片段。
本文所用的術語「副產物」是指在產生環狀RNA的過程中出現的任何中間片段。副產物既不同於RNA轉錄物,也不同於環狀RNA。副產物可以含有本文提供的RNA轉錄物的部分長度。副產物可以含有可以被捕獲劑捕獲的純化片段的至少一部分。
在某些實施方式中,用於從環狀RNA中分離RNA轉錄物的捕獲劑包含能夠在嚴格條件下與純化片段雜交的核酸片段。在某些實施方式中,捕獲劑包含與純化片段的核苷酸序列至少80%、85%、90%、95%或100%互補的核酸片段。
在某些實施方式中,捕獲劑是固定的。在某些實施方式中,步驟b)的RNA轉錄物在溶液中經歷自環化或在固定有捕獲劑的固體基質上經歷自環化。在某些實施方式中,純化片段包含poly(A)短序列,並且捕獲劑包含oligo(dT)。其它寡核苷酸也可以用作捕獲劑,只要它們與RNA轉錄物中的PF互補,例如使用Oligo-(AT)n作為PF為poly(AU)時的捕獲劑,或使用Oligo-(CT)n作為PF為poly(AG)時的捕獲劑。在某些實施方式中,純化片段可以與捕獲劑結合,該捕獲劑包含蛋白質、肽、多醣或小分子。在某些實施方式中,捕獲劑包含或者是常見的親和配體,諸如生物素、鏈黴親和素、榖胱甘肽、幾丁質、蛋白A和蛋白G,其結合的PF為具有獨特配體結合結構的RNA適體。
在某些實施方式中,步驟a)中的RNA轉錄物由本文提供的DNA建構體轉錄。在某些實施方式中,該方法進一步包括在步驟a)之前由本文提供的DNA建構體轉錄以產生本文提供的RNA轉錄物。
組合物
本揭露內容提供了一種使用本文提供的方法產生的環狀RNA的組合物。本揭露內容還提供了一種包含本文提供的DNA建構體或本文提供的RNA轉錄物的組合物。
在某些實施方式中,本揭露內容提供了包含有效量的本文所述的環狀RNA和藥學上可接受的賦形劑的藥物組合物。本揭露內容的藥物組合物可以包含如本文所述的環狀RNA,其與一種或多種藥學上或生理學上可接受的載體、賦形劑或稀釋劑組合。在一些實施方式中,本揭露內容的藥物組合物可以包含如本文所述的環狀RNA表現細胞(例如多個環狀RNA表現細胞),其與一種或多種藥學上或生理學上可接受的載體、賦形劑或稀釋劑組合。
在一些實施方式中,藥學上可接受的載體可以是藥物組合物中除活性成分以外的成分,其對受試者無毒。
在一些實施方式中,如本文所述的環狀RNA可以與其它已知藥劑和療法聯合使用。在其它實施方式中,本文所述的組合物可以與手術、放射、化學療法、抗體或其它藥劑組合用於治療方案中。
試劑盒
本揭露內容提供了一種包含所述DNA建構體的試劑盒。本揭露內容還提供了一種用於產生所述RNA轉錄物的試劑盒,其包含用於將純化片段添加到RNA轉錄物的前體中的試劑。
在某些實施方式中,試劑盒進一步包含捕獲劑,所述捕獲劑特異性結合存在於RNA轉錄物中但不存在於環狀RNA中的純化片段。在某些實施方式中,用於從環狀RNA中分離RNA轉錄物的捕獲劑包含能夠在嚴格條件下與純化片段雜交的核酸片段。在某些實施方式中,捕獲劑是固定的。在某些實施方式中,純化片段包含poly(A)短序列,並且捕獲劑包含oligo(dT)。
本文提供的試劑盒還可以包括一種或多種轉染試劑以促進環狀RNA(或編碼它們的重組核酸)向細胞的遞送。這種試劑盒也可以包括保存多核苷酸或防止其降解的組分。這種組分可以不含RNase或免受RNase的影響。
這種試劑盒通常以合適的方式包含用於每種單獨試劑或溶液的不同容器。該試劑盒可以包括一個或多個裝有環狀RNA或編碼它們的重組多核苷酸和其它藥劑的容器。用於組合物的合適容器包括例如瓶、小瓶、注射器和試管。容器可以由各種材料製成,包括玻璃或塑膠。容器可以具有無菌入口(例如,容器可以是具有可被皮下注射針刺穿的塞子的小瓶)。
試劑盒可以進一步包括容器,該容器包含藥學上可接受的緩衝液,諸如磷酸鹽緩衝鹽水、林格氏溶液或葡萄糖溶液。它還可以含有對最終用戶有用的其它材料,包括其它藥學上可接受的配製溶液,諸如緩衝液、稀釋劑,過濾器、針和注射器或其它遞送裝置。可以用組合物預先填充遞送裝置。
實施例
實施例 1. DNA 建構體(質體)
通常,可以根據圖1中箭頭所示的方法製備圖1所示的DNA建構體以生成環狀RNA。每個建構體都具有質體骨架(其可以包括Ori和抗生素抗性基因)、RNA聚合酶的啟動子(例如T7啟動子)和RNA前體的DNA序列。DNA建構體可以轉錄為如圖2所示例的RNA前體(或RNA轉錄物),總共四類(I類、II類、III類和IV類),包括:I-Ctrl、I-5PF、I-3PF、I-5PF+3PF、II-Ctrl、II-5PF、II-3PF、II-5PF+3PF、III-Ctrl、III-5PF、III-3PF、III-5PF+3PF、IV-Ctrl、IV-5PF、IV-3PF和IV-5PF+3PF。
RNA轉錄物的細節示於圖2中並總結如下。所有命名為「Ctrl」的RNA轉錄物用作陰性對照,因為它們不具有任何純化片段。
RNA轉錄物 元件(從5’至3’)
I-Ctrl a)自剪接元件的3’部分,b)靶序列,和c)自剪接元件的5’部分
I-5PF a)5’ 純化片段;b)自剪接元件的3’部分,c)靶序列,和d)自剪接元件的5’部分
I-3PF a)自剪接元件的3’部分,b)靶序列,c)自剪接元件的5’部分,和d)3’ 純化片段
I-5PF+3PF a)5’ 純化片段;b)自剪接元件的3’部分,c)靶序列,d)自剪接元件的5’部分,和e)3’ 純化片段
II-Ctrl a)自剪接元件的3’部分,b)5’間隔區,c)靶序列,d)3’間隔區,和e)自剪接元件的5’部分
II-5PF a)5’ 純化片段;b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,和f)自剪接元件的5’部分
II-3PF a)自剪接元件的3’部分,b)5’間隔區,c)靶序列,d)3’間隔區,e)自剪接元件的5’部分,和f)3’ 純化片段
II-5PF+3PF a)5’ 純化片段;b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,和g)3’ 純化片段
III-Ctrl a)5’同源臂,b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,和g)3’同源臂;
III-5PF a)5’ 純化片段,b)5’同源臂,c)自剪接元件的3’部分,d)5’間隔區,e)靶序列,f)3’間隔區,g)自剪接元件的5’部分,和h)3’同源臂;
III-3PF a)5’同源臂,b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,g)3’同源臂,和h)3’ 純化片段
III-5PF+3PF a)5’ 純化片段,b)5’同源臂,c)自剪接元件的3’部分,d)5’間隔區,e)靶序列,f)3’間隔區,g)自剪接元件的5’部分,h)3’同源臂,和i)3’ 純化片段
IV-Ctrl a)5’同源臂,b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,和g)3’同源臂(與III-Ctrl相同)
IV-5PF a)5’同源臂,b) 5’ 純化片段,c)自剪接元件的3’部分,d)5’間隔區,e)靶序列,f)3’間隔區,g)自剪接元件的5’部分,和h)3’同源臂
IV-3PF a)5’同源臂,b)自剪接元件的3’部分,c)5’間隔區,d)靶序列,e)3’間隔區,f)自剪接元件的5’部分,g)3’ 純化片段,和h)3’同源臂
IV-5PF+3PF a)5’同源臂,b)5’ 純化片段,c)自剪接元件的3’部分,d)5’間隔區,e)靶序列,f)3’間隔區,g)自剪接元件的5’部分,h)3’ 純化片段,和i)3’同源臂
RNA前體含有待環化的靶序列(例如,編碼GFP蛋白的基因)、環化元件(例如,I型內含子自剪接元件)和純化片段(例如,如圖3所示的poly-A短序列)。純化片段位於或靠近轉錄RNA的一端或兩端。在III類和IV類中,建構體進一步具有同源片段(即,同源臂,以使環化端緊密接近)。在這些建構體的一些中,純化片段位於同源片段和環化元件的一個或多個接頭處。純化片段不是最終環狀產物的一部分。選擇長度在20至200個核苷酸內的純化片段。在IV類中,純化片段的位置在環化元件和同源臂之間,而在III類中,純化片段位於同源臂的端部。在I類和II類中,純化片段(例如,poly(A))的位置被設計在RNA前體的3’端、RNA前體的5’端或兩端,如圖1和圖2所示。
編碼每個元件,即靶序列、自剪接元件的3’部分(即,環化元件,在圖2中命名為「3’內含子」)、自剪接元件的5’部分(即,環化元件,在圖2中命名為「5’內含子」)、5’純化片段、3’純化片段、5’同源臂、3’同源臂和IRES的示例性DNA序列提供如下(從5’至3’)。
元件 DNA編碼序列
5’純化片段 SEQ ID NO: 5: AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
5’同源臂 SEQ ID NO: 6: GGGAAGACCCTCGACCGTCGATTGTCCACTGGTC
自剪接元件的3’部分(在圖2中命名為「3’內含子」) SEQ ID NO: 7: AACAATAGATGACTTACAACTAATCGGAAGGTGCAGAGACTCGACGGGAGCTACCCTAACGTCAAGACGAGGGTAAAGAGAGAGTCCAATTCTCAAAGCCAATAGGCAGTAGCGAAAGCTGCAAGAGAATGAAAATCCGTTGACCTTAAACGGTCGTGTGGGTTCAAGTCCCTCCACCCCCA
5’間隔區 SEQ ID NO: 8: TGATCTGAAACCAACTTTATTACTATATTCCCCACAACCCCC
IRES SEQ ID NO: 9: TTAAAACAGCCTGTGGGTTGATCCCACCCACAGGCCCATTGGGCGCTAGCACTCTGGTATCACGGTACCTTTGTGCGCCTGTTTTATACCCCCTCCCCCAACTGTAACTTAGAAGTAACACACACCGATCAACAGTCAGCGTGGCACACCAGCCACGTTTTGATCAAGCACTTCTGTTACCCCGGACTGAGTATCAATAGACTGCTCACGCGGTTGAAGGAGAAAGCGTTCGTTATCCGGCCAACTACTTCGAAAAACCTAGTAACACCGTGGAAGTTGCAGAGTGTTTCGCTCAGCACTACCCCAGTGTAGATCAGGTCGATGAGTCACCGCATTCCCCACGGGCGACCGTGGCGGTGGCTGCGTTGGCGGCCTGCCCATGGGGAAACCCATGGGACGCTCTAATACAGACATGGTGCGAAGAGTCTATTGAGCTAGTTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCTAACTGCGGAGCACACACCCTCAAGCCAGAGGGCAGTGTGTCGTAACGGGCAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCATTTTATTCCTATACTGGCTGCTTATGGTGACAATTGAGAGATCGTTACCATATAGCTATTGGATTGGCCATCCGGTGACTAATAGAGCTATTATATATCCCTTTGTTGGGTT
eGFP編碼序列 SEQ ID NO: 10: ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAG
3’間隔區 SEQ ID NO: 11: GGATCC
自剪接元件的5’部分(在圖2中命名為「5’內含子」) SEQ ID NO: 12: AGACGCTACGGACTTAAATAATTGAGCCTTAAAGAAGAAATTCTTTAAGTGGATGCTCTCAAACTCAGGGAAACCTAAATCTAGTTATAGACAAGGCAATCCTGAGCCAAGCCGAAGTAGTAATTAGTAAG
3’同源臂 SEQ ID NO: 13: ACCAGTGGACAATCGACGGATAACAGCATATCTAGG
3’純化片段 SEQ ID NO: 14: AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
為了舉例說明DNA建構體,如圖3A所示,用poly-A短序列作為PF進一步說明III類。編碼III類RNA前體全長的DNA序列提供如下(從5’至3’)。
因此,建構攜帶這些序列(SEQ ID NO: 1-4)的質體並透過DNA定序分析進行驗證。
RNA前體 DNA編碼序列
III-Ctrl-eGFP SEQ ID NO: 1: TAATACGACTCACTATAGGGTCGACGTCGACGGGAAGACCCTCGACCGTCGATTGTCCACTGGTCAACAATAGATGACTTACAACTAATCGGAAGGTGCAGAGACTCGACGGGAGCTACCCTAACGTCAAGACGAGGGTAAAGAGAGAGTCCAATTCTCAAAGCCAATAGGCAGTAGCGAAAGCTGCAAGAGAATGAAAATCCGTTGACCTTAAACGGTCGTGTGGGTTCAAGTCCCTCCACCCCCATGATCTGAAACCAACTTTATTACTATATTCCCCACAACCCCCAGTACTTTAAAACAGCCTGTGGGTTGATCCCACCCACAGGCCCATTGGGCGCTAGCACTCTGGTATCACGGTACCTTTGTGCGCCTGTTTTATACCCCCTCCCCCAACTGTAACTTAGAAGTAACACACACCGATCAACAGTCAGCGTGGCACACCAGCCACGTTTTGATCAAGCACTTCTGTTACCCCGGACTGAGTATCAATAGACTGCTCACGCGGTTGAAGGAGAAAGCGTTCGTTATCCGGCCAACTACTTCGAAAAACCTAGTAACACCGTGGAAGTTGCAGAGTGTTTCGCTCAGCACTACCCCAGTGTAGATCAGGTCGATGAGTCACCGCATTCCCCACGGGCGACCGTGGCGGTGGCTGCGTTGGCGGCCTGCCCATGGGGAAACCCATGGGACGCTCTAATACAGACATGGTGCGAAGAGTCTATTGAGCTAGTTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCTAACTGCGGAGCACACACCCTCAAGCCAGAGGGCAGTGTGTCGTAACGGGCAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCATTTTATTCCTATACTGGCTGCTTATGGTGACAATTGAGAGATCGTTACCATATAGCTATTGGATTGGCCATCCGGTGACTAATAGAGCTATTATATATCCCTTTGTTGGGTTACTAGTGATAATAGTGCCACCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAGGGATCCAGACGCTACGGACTTAAATAATTGAGCCTTAAAGAAGAAATTCTTTAAGTGGATGCTCTCAAACTCAGGGAAACCTAAATCTAGTTATAGACAAGGCAATCCTGAGCCAAGCCGAAGTAGTAATTAGTAAGACCAGTGGACAATCGACGGATAACAGCATATCTAGGGAATTC
III-5A-eGFP SEQ ID NO: 2: TAATACGACTCACTATAGGGTCGACAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAGTCGACGGGAAGACCCTCGACCGTCGATTGTCCACTGGTCAACAATAGATGACTTACAACTAATCGGAAGGTGCAGAGACTCGACGGGAGCTACCCTAACGTCAAGACGAGGGTAAAGAGAGAGTCCAATTCTCAAAGCCAATAGGCAGTAGCGAAAGCTGCAAGAGAATGAAAATCCGTTGACCTTAAACGGTCGTGTGGGTTCAAGTCCCTCCACCCCCATGATCTGAAACCAACTTTATTACTATATTCCCCACAACCCCCAGTACTTTAAAACAGCCTGTGGGTTGATCCCACCCACAGGCCCATTGGGCGCTAGCACTCTGGTATCACGGTACCTTTGTGCGCCTGTTTTATACCCCCTCCCCCAACTGTAACTTAGAAGTAACACACACCGATCAACAGTCAGCGTGGCACACCAGCCACGTTTTGATCAAGCACTTCTGTTACCCCGGACTGAGTATCAATAGACTGCTCACGCGGTTGAAGGAGAAAGCGTTCGTTATCCGGCCAACTACTTCGAAAAACCTAGTAACACCGTGGAAGTTGCAGAGTGTTTCGCTCAGCACTACCCCAGTGTAGATCAGGTCGATGAGTCACCGCATTCCCCACGGGCGACCGTGGCGGTGGCTGCGTTGGCGGCCTGCCCATGGGGAAACCCATGGGACGCTCTAATACAGACATGGTGCGAAGAGTCTATTGAGCTAGTTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCTAACTGCGGAGCACACACCCTCAAGCCAGAGGGCAGTGTGTCGTAACGGGCAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCATTTTATTCCTATACTGGCTGCTTATGGTGACAATTGAGAGATCGTTACCATATAGCTATTGGATTGGCCATCCGGTGACTAATAGAGCTATTATATATCCCTTTGTTGGGTTACTAGTGATAATAGTGCCACCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAGGGATCCAGACGCTACGGACTTAAATAATTGAGCCTTAAAGAAGAAATTCTTTAAGTGGATGCTCTCAAACTCAGGGAAACCTAAATCTAGTTATAGACAAGGCAATCCTGAGCCAAGCCGAAGTAGTAATTAGTAAGACCAGTGGACAATCGACGGATAACAGCATATCTAGGGAATTC
III-3A-eGFP SEQ ID NO: 3: TAATACGACTCACTATAGGGTCGACGTCGACGGGAAGACCCTCGACCGTCGATTGTCCACTGGTCAACAATAGATGACTTACAACTAATCGGAAGGTGCAGAGACTCGACGGGAGCTACCCTAACGTCAAGACGAGGGTAAAGAGAGAGTCCAATTCTCAAAGCCAATAGGCAGTAGCGAAAGCTGCAAGAGAATGAAAATCCGTTGACCTTAAACGGTCGTGTGGGTTCAAGTCCCTCCACCCCCATGATCTGAAACCAACTTTATTACTATATTCCCCACAACCCCCAGTACTTTAAAACAGCCTGTGGGTTGATCCCACCCACAGGCCCATTGGGCGCTAGCACTCTGGTATCACGGTACCTTTGTGCGCCTGTTTTATACCCCCTCCCCCAACTGTAACTTAGAAGTAACACACACCGATCAACAGTCAGCGTGGCACACCAGCCACGTTTTGATCAAGCACTTCTGTTACCCCGGACTGAGTATCAATAGACTGCTCACGCGGTTGAAGGAGAAAGCGTTCGTTATCCGGCCAACTACTTCGAAAAACCTAGTAACACCGTGGAAGTTGCAGAGTGTTTCGCTCAGCACTACCCCAGTGTAGATCAGGTCGATGAGTCACCGCATTCCCCACGGGCGACCGTGGCGGTGGCTGCGTTGGCGGCCTGCCCATGGGGAAACCCATGGGACGCTCTAATACAGACATGGTGCGAAGAGTCTATTGAGCTAGTTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCTAACTGCGGAGCACACACCCTCAAGCCAGAGGGCAGTGTGTCGTAACGGGCAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCATTTTATTCCTATACTGGCTGCTTATGGTGACAATTGAGAGATCGTTACCATATAGCTATTGGATTGGCCATCCGGTGACTAATAGAGCTATTATATATCCCTTTGTTGGGTTACTAGTGATAATAGTGCCACCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAGGGATCCAGACGCTACGGACTTAAATAATTGAGCCTTAAAGAAGAAATTCTTTAAGTGGATGCTCTCAAACTCAGGGAAACCTAAATCTAGTTATAGACAAGGCAATCCTGAGCCAAGCCGAAGTAGTAATTAGTAAGACCAGTGGACAATCGACGGATAACAGCATATCTAGGGAATTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
III-35A-eGFP SEQ ID NO: 4: TAATACGACTCACTATAGGGTCGACAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAGTCGACGGGAAGACCCTCGACCGTCGATTGTCCACTGGTCAACAATAGATGACTTACAACTAATCGGAAGGTGCAGAGACTCGACGGGAGCTACCCTAACGTCAAGACGAGGGTAAAGAGAGAGTCCAATTCTCAAAGCCAATAGGCAGTAGCGAAAGCTGCAAGAGAATGAAAATCCGTTGACCTTAAACGGTCGTGTGGGTTCAAGTCCCTCCACCCCCATGATCTGAAACCAACTTTATTACTATATTCCCCACAACCCCCAGTACTTTAAAACAGCCTGTGGGTTGATCCCACCCACAGGCCCATTGGGCGCTAGCACTCTGGTATCACGGTACCTTTGTGCGCCTGTTTTATACCCCCTCCCCCAACTGTAACTTAGAAGTAACACACACCGATCAACAGTCAGCGTGGCACACCAGCCACGTTTTGATCAAGCACTTCTGTTACCCCGGACTGAGTATCAATAGACTGCTCACGCGGTTGAAGGAGAAAGCGTTCGTTATCCGGCCAACTACTTCGAAAAACCTAGTAACACCGTGGAAGTTGCAGAGTGTTTCGCTCAGCACTACCCCAGTGTAGATCAGGTCGATGAGTCACCGCATTCCCCACGGGCGACCGTGGCGGTGGCTGCGTTGGCGGCCTGCCCATGGGGAAACCCATGGGACGCTCTAATACAGACATGGTGCGAAGAGTCTATTGAGCTAGTTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCTAACTGCGGAGCACACACCCTCAAGCCAGAGGGCAGTGTGTCGTAACGGGCAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCATTTTATTCCTATACTGGCTGCTTATGGTGACAATTGAGAGATCGTTACCATATAGCTATTGGATTGGCCATCCGGTGACTAATAGAGCTATTATATATCCCTTTGTTGGGTTACTAGTGATAATAGTGCCACCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAGGGATCCAGACGCTACGGACTTAAATAATTGAGCCTTAAAGAAGAAATTCTTTAAGTGGATGCTCTCAAACTCAGGGAAACCTAAATCTAGTTATAGACAAGGCAATCCTGAGCCAAGCCGAAGTAGTAATTAGTAAGACCAGTGGACAATCGACGGATAACAGCATATCTAGGGAATTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
實施例 2. 環狀 RNA 的純化和表徵
將根據實施例1製備的DNA建構體線性化,並根據以下提供的實驗流程進行體外轉錄、環化和純化。對環化效率和純化效率進行評估和比較,以證明PF的益處。
2.1 實驗工作流程
如圖3B所示,根據以下步驟進行環狀RNA的純化和表徵,包括DNA建構體的線性化、線性化DNA的純化、體外轉錄、環化、使用Oligo-dT方法純化環狀RNA和純化RNA的表徵。
2.2 實驗程序和結果
質體DNA的製備。
合成實施例1中建構的DNA建構體(質體)(包括圖3A,Ctrl、5A、3A和53A所示的那些建構體)並轉殖到大腸桿菌( E. coli)菌株中用於質體複製。提取質體並純化,然後透過酶消化進行線性化。
將質體DNA在37℃條件下用限制性酶HindIII(NEB,R0104L)消化1至4小時。然後使用QIAquick凝膠提取試劑盒純化線性化的質體DNA。
透過使用T7 RNA聚合酶在NTP、鼠RNase抑制劑和焦磷酸酶(無機(Inorganic))的存在下在37℃下從線性化質體DNA模版體外轉錄30至120分鐘來合成線性RNA轉錄物。
為了產生環狀RNA,將額外的含有50 mM Tris-HCl(pH7.4)、10 mM MgCl2和2 mM GTP的環化反應緩衝液添加到體外轉錄的混合物中,並在55℃下進一步孵育15至30分鐘。透過瓊脂糖凝膠電泳檢測環狀RNA的產生。
然後透過將RNA混合物透過Oligo-dT試劑純化得到的環狀RNA。攜帶poly-A短序列的RNA片段將結合/保留在Oligo-dT試劑上,而circRNA產物將在流過物中並因此得到純化。對於實驗室規模的純化,根據製造商的方案使用與oligo(dT) 25(Ambion,目錄編號:61002)綴合的磁珠。或者,由Oligo-dT樹脂製成的柱也用於在AKTA設備(思拓凡(Cytiva))上純化環狀RNA。為了說明純化方法,用這些步驟進行純化:結合、洗滌和洗脫結合的RNA。
從以下純化步驟收集級分:來自結合步驟的FT(流過物),來自洗滌步驟的W和來自洗脫步驟的E(洗脫物)。在瓊脂糖凝膠上(圖4)和透過毛細管電泳(CE)(圖5A至5E)分析這些級分以及來自環化步驟的RNA混合物(在圖4和5A至5E中表示為輸入)。基於CE結果計算環化效率和circRNA純度(圖5E)。
圖4和5A至5E示出了由III類建構體(即圖3A所示的建構體,Ctrl、5A、3A和53A)製備環狀RNA產物,純化步驟之後的級分。輸入(其表示來自環化步驟的RNA混合物)、FT(其表示來自結合步驟的流過物)和E級分(其表示來自洗脫步驟的洗脫物)泳道上的條帶顯示,含PF的RNA片段與捕獲劑Oligo-dT磁珠有效結合,從circRNA產物中除去並用洗脫緩衝液洗脫(圖4)。
從這些分析中可以清楚地看出,在RNA前體的任一端或在RNA前體的每一端添加poly-A短序列不會對環化效率產生負面影響。相反,與Ctrl相比,RNA前體的5’端存在PF令人驚訝地顯著提高了環化效率,從Ctrl的33%分別提高到5A和53A產物的75%和85%(圖5A至5E)。另外,如圖5E所總結的,Ctrl產物在純化前後表現出circRNA純度從25%到28%的增加。相反,在純化前後,5A產物表現出circRNA純度從52%到82%的增長,3A產物表現出從22%到66%的增長,53A產物表現出從62%到86%的增長。相對於不存在如本文所揭露的純化片段的建構體,包含一個或兩個poly-A短序列作為純化片段的三個建構體在circRNA純化中都表現出顯著更高的有效性。按照本文揭露的產生circRNA的方法,純化的circRNA達到了高達幾乎90%的純度。
還使用類似的方法分析了由I類、II類和IV類建構體製備環狀RNA產物在純化步驟之後的級分。作為PF的poly-A短序列的存在顯著地促進了所得circRNA的純化,產生了如預期的高度純化的circRNA。
為了測試circRNA產物的功能性,進行了轉染實驗。將純化的GFP circRNA產物透過lipofectamine轉染到HEK 293T細胞中。孵育兩天後,在明視野和GFP設置下在顯微鏡上獲取螢光圖像(圖6)。強螢光場清楚地顯示GFP蛋白的表現,表明了合成的GFP circRNA的功能性。
實施例 3. 環狀 RNA 的合成、純化和表徵
根據實施例1和2中描述的方法建構如圖2所示的攜帶III類元件的質體,其中適體作為純化片段,並透過DNA定序分析進行驗證。
將DNA建構體線性化,並根據實施例2中提供的實驗工作流程進行體外轉錄、環化和純化。(能夠特異性結合適體的靶)用作捕獲劑。對環化效率和純化效率進行評估和比較,以證明PF的益處。
類似地,從以下純化步驟收集級分:來自結合步驟的FT(流過物),來自洗滌步驟的W和來自洗脫步驟的E(洗脫物)。在瓊脂糖凝膠上和透過毛細管電泳(CE)分析這些級分以及來自環化步驟(輸入)的RNA混合物。基於CE結果計算環化效率和circRNA純度。
實驗數據顯示,包含適體作為純化片段實現了與包含poly-A短序列作為純化片段相似的性能。適體作為PF的存在有利於純化過程,產生高純度的circRNA產物。純化的circRNA產物也顯示了其中所含靶序列的所需功能。
1示出了示例性DNA建構體的示意圖和示出從示例性DNA建構體產生環狀RNA的示例性方法。所示的DNA建構體是環狀質體DNA,其包含質體骨架、環狀RNA區域、RNA聚合酶啟動子的位點(如所示的T7)、一個或兩個純化片段(PF)和限制性酶的切割位點(理想地,如圖所示,接近或位於PF的3’端)。環狀RNA產生的過程包括質體DNA的線性化、體外轉錄以生成RNA前體、環化以形成環狀RNA,以及透過親和基質除去所有攜帶PF的RNA片段以進行純化。
2示出了基於不同元件排列和純化片段位置的四類示例性RNA前體。本文所用的第一環化元件是自剪接元件的3’部分,命名為 3 ’內含子,其包含常規PIE策略的3’內含子和外顯子2的部分。第二環化元件是自剪接元件的5’部分,命名為 5 ’內含子,其包含常規PIE策略的5’內含子和外顯子1的部分。純化片段被命名為 PF。不含純化片段的RNA轉錄物被命名為「 Ctrl」。I類示出了包含兩個環化元件和一個或兩個純化片段的RNA前體,所述一個或兩個純化片段位於第一環化元件的5’端(命名為I-5PF)、位於第二環化元件的3’端(命名為I-3PF)或位於兩端(命名為I-5PF+3PF)。II類示出了包含兩個環化元件、兩個間隔區和一個或兩個純化片段的RNA前體,所述一個或兩個純化片段位於第一環化元件的5’端(命名為II-5PF)、位於第二環化元件的3’端(命名為II-3PF)或位於兩端(命名為II-5PF+3PF)。III類示出了包含兩個環化元件、兩個間隔區、兩個同源臂和一個或兩個純化片段的RNA前體,所述一個或兩個純化片段位於5’同源臂的5’端(命名為III-5PF)、3’同源臂的3’端(命名為III-3PF)或兩端(命名為III-5PF+3PF)。IV類示出了包含兩個環化元件、兩個間隔區、兩個同源臂和一個或兩個純化片段的RNA前體,所述一個或兩個純化片段位於5’同源臂和第一環化元件之間(命名為IV-5PF)、位於第二環化元件和3’同源臂之間(命名為IV-3PF)或位於兩個位置(命名為IV-5PF+3PF)。
3A示出了由本文提供的DNA建構體轉錄的線性RNA前體。在此,純化片段是poly-A短序列,並且元件如 2中的III類排列。 Ctrl:不包含任何純化片段的RNA轉錄物,作為陰性對照。 5A:在RNA轉錄物的5’端包含poly-A短序列的RNA轉錄物。 3A:在RNA轉錄物的3’端包含poly-A短序列的RNA轉錄物。 53A:包含兩個poly-A短序列的RNA轉錄物,每個poly-A短序列位於RNA轉錄物的一端。所示的「3’內含子」表示第一環化元件,其包含常規PIE策略的3’內含子和外顯子2的序列。所示的「5’內含子」表示第二環化元件,其包含常規PIE策略的5’內含子和外顯子1的序列。
3B示出了環狀RNA的產生、純化和表徵的實驗工作流程。
4示出了在瓊脂糖凝膠上對RNA產物的分析。製備如 3A中描述的四種建構體的質體DNA並將其線性化。在體外轉錄和環化後,將RNA產物加載到Oligo-dT磁珠或含有Oligo-dT樹脂的柱上。按順序步驟收集級分,並在瓊脂糖凝膠上和透過毛細管電泳進行分析( 5)。 輸入:體外轉錄和環化後的RNA產物,其含有環狀RNA和含poly-A的線性RNA前體兩者,以及所有副產物。 FT:流過級分,其含有環狀RNA。 E:洗脫級分,其含有未加工的含poly-A的線性RNA前體和加工後的含poly-A的RNA片段。 W:來自結合與洗脫之間的洗滌步驟的級分,該步驟用於洗掉非特異性結合的RNA產物。 P:指示RNA前體在瓊脂糖凝膠上遷移的位置。 R:指示環狀RNA產物在瓊脂糖凝膠上遷移的位置。
5A5E示出了透過毛細管電泳對RNA產物的分析。還透過毛細管電泳(Agilent 5200片段分析儀)分析了 4中描述的RNA產物:Ctrl(圖5A)、5A(圖5B)、3A(圖5C)和53A(圖5D)。「輸入」代表體外轉錄和環化後的RNA產物,其被加載用於Oligo-dT純化。「FT」(流過物)代表流過級分。計算circRNA的環化效率和純度並總結在圖5E中。
6示出了純化的GFP circRNA轉染HEK 293T細胞的結果。對照樣品和eGFP circRNA樣品分別用脂質體(lipofectamine)試劑轉染。在明視野和GFP設置下在螢光顯微鏡上獲取圖像。
TW202408542A_112118805_SEQL.xml

Claims (57)

  1. 一種用於製備環狀RNA的DNA建構體,所述DNA建構體包含與編碼能夠產生環狀RNA的RNA轉錄物的序列可操作地連接的RNA聚合酶啟動子,所述RNA轉錄物包含彼此可操作地連接並按以下順序排列的以下元件: a)第一環化元件, b)靶序列,和 c)第二環化元件, 其中所述RNA轉錄物能夠形成包含所述靶序列的所述環狀RNA;以及 其中所述RNA轉錄物進一步包含至少一個在所述環狀RNA中不存在的純化片段。
  2. 如請求項1所述的DNA建構體,其中所述RNA聚合酶啟動子是衍生自T7病毒、T6病毒、SP6病毒、T3病毒或T4病毒的RNA聚合酶啟動子。
  3. 一種體外轉錄的RNA轉錄物,所述RNA轉錄物包含彼此可操作地連接並按以下順序排列的以下元件: a)第一環化元件, b)靶序列,和 c)第二環化元件, 其中所述RNA轉錄物能夠形成包含所述靶序列的環狀RNA;以及 其中所述RNA轉錄物進一步包含至少一個在所述環狀RNA中不存在的純化片段。
  4. 如請求項1或2所述的DNA建構體或如請求項3所述的RNA轉錄物,其中所述至少一個純化片段與所述第一環化元件連接,或與所述第二環化元件連接。
  5. 如請求項1或2所述的DNA建構體或如請求項3所述的RNA轉錄物,其中所述RNA轉錄物具有分別與所述第一環化元件和所述第二環化元件連接的兩個純化片段。
  6. 如請求項1至2和4至5中任一項所述的DNA建構體或如請求項3至5中任一項所述的RNA轉錄物,其中所述至少一個純化片段:a)位於所述第一環化元件的上游(即5’純化片段),b)位於所述第二環化元件的下游(即3’純化片段),c)或a)和b)的任何組合。
  7. 如請求項1至2和4至6中任一項所述的DNA建構體或如請求項3至6中任一項所述的RNA轉錄物,其中所述至少一個純化片段:a)附著於所述第一環化元件的5’端(即5’純化片段),或b)附著於所述第二環化元件的3’端(即3’純化片段),或a)和b)的任何組合。
  8. 如請求項6至7中任一項所述的DNA建構體或如請求項6至7中任一項所述的RNA轉錄物,其中所述RNA轉錄物具有所述5’純化片段和所述3’純化片段兩者,並且其中所述5’純化片段和所述3’純化片段在核苷酸序列上相同或不同。
  9. 如請求項1至2和4至8中任一項所述的DNA建構體或如請求項3至7中任一項所述的RNA轉錄物,其中所述至少一個純化片段中的每一個在15至20個核苷酸的給定長度上與所述環狀RNA具有不超過90%(或不超過80%、不超過70%、不超過60%、不超過50%)的序列同一性。
  10. 如請求項1至2和4至9中任一項所述的DNA建構體或如請求項3至9中任一項所述的RNA轉錄物,其中所述純化片段包含poly(A)短序列(tract)、poly(T)短序列、poly(U)短序列、poly(C)短序列、poly(G)短序列、poly(AC)短序列、poly(AG)短序列、poly(CT)短序列、poly(CU)短序列、poly(AT)短序列或poly(AU)短序列。
  11. 如請求項10所述的DNA建構體,或如請求項10所述的RNA轉錄物,其中所述純化片段(例如poly(A)短序列)的長度範圍為15至200個核苷酸,任選地15至150個核苷酸。
  12. 如請求項1至2和4至11中任一項所述的DNA建構體或如請求項3至11中任一項所述的RNA轉錄物,其中所述第一環化元件和所述第二環化元件可以衍生自自剪接系統。
  13. 13.    如請求項12所述的DNA建構體或如請求項12所述的RNA轉錄物,其中所述第一環化元件包含自剪接元件的3’部分,所述自剪接元件的3’部分包含3’剪接位點,並且所述第二環化元件包含自剪接元件的5’部分,所述自剪接元件的5’部分包含5’剪接位點。
  14. 如請求項13所述的DNA建構體或如請求項13所述的RNA轉錄物,其中所述自剪接元件是I型內含子、II型內含子或髮夾核酶。
  15. 如請求項14所述的DNA建構體或如請求項14所述的RNA轉錄物,其中所述I型內含子衍生自噬菌體T4胸苷酸合酶(td)基因、藍細菌魚腥藻pre-tRNA-Leu基因或四膜蟲基因。
  16. 如請求項14所述的DNA建構體或如請求項14所述的RNA轉錄物,其中所述II型內含子衍生自乳酸乳球菌Ll.LtrB基因,或衍生自酵母。
  17. 如請求項14所述的DNA建構體或如請求項14所述的RNA轉錄物,其中所述髮夾核酶衍生自細菌、真核生物或植物病毒RNA衛星(例如菸草環斑病毒(TRSV)衛星RNA、菊苣黃斑駁病毒(sCYMV)衛星RNA,或擬南芥花葉病毒(sARMV)衛星RNA)。
  18. 如請求項1至2和4至17中任一項所述的DNA建構體或如請求項3至17中任一項所述的RNA轉錄物,其中所述靶序列包含靶蛋白編碼區。
  19. 如請求項18所述的DNA建構體或如請求項18所述的RNA轉錄物,其中所述靶蛋白是治療性蛋白質(例如抗體、細胞激素、肽激素等)、預防性蛋白質(例如蛋白質疫苗等)、核酸酶(例如Cas蛋白、重組酶等)、受體(例如嵌合抗原受體等)。
  20. 如請求項18或19所述的DNA建構體或如請求項18或19所述的RNA轉錄物,其中所述靶序列進一步包含與所述靶蛋白編碼區可操作地連接的內部核醣體進入位點(IRES),任選地所述IRES可操作地連接在所述靶蛋白編碼區的上游和/或下游。
  21. 如請求項20所述的DNA建構體或如請求項20所述的RNA轉錄物,其中所述IRES選自陶拉症候群(Taura syndrome)病毒、吸血獵椿(Triatoma)病毒、泰勒氏(Theiler’s)腦脊髓炎病毒、猿猴病毒40、紅火蟻病毒1、禾谷縊管蚜病毒、網狀內皮增生症病毒、人脊髓灰質炎病毒1、斯氏珀蝽腸病毒(Plautia stali intestine virus)、克什米爾蜂病毒、人鼻病毒2、琉璃葉蟬病毒1、人類免疫缺陷病毒1型、琉璃葉蟬病毒1、虱P病毒、C型肝炎病毒、A型肝炎病毒、GB型肝炎病毒、口蹄疫病毒、人腸病毒71型、馬鼻炎病毒、茶尺蠖樣病毒、腦心肌炎病毒(EMCV)、果蠅C病毒、十字花科菸草花葉病毒、蟋蟀麻痹病毒、牛病毒性腹瀉病毒1、黑蜂王台病毒、蚜蟲致死性麻痹病毒、禽腦脊髓炎病毒、急性蜂麻痹病毒、木槿褪綠環斑病毒、經典豬瘟病毒、人FGF2、人SFTPA1、人AML1/RUNX1、果蠅觸角足、人AQP4、人AT1R、人BAG-1、人BCL2、人BiP、人c-IAP1、人c-myc、人eIF4G、小鼠NDST4L、人LEF1、小鼠HIF1 α、人n.myc、小鼠Gtx、人p27kip1、人PDGF2/c-sis、人p53、人Pim-1、小鼠Rbm3、果蠅reaper、犬科Scamper、果蠅Ubx、唾液病毒(Salivirus)、科薩病毒(Cosavirus)、雙埃柯病毒、人UNR、小鼠UtrA、人VEGF-A、人XIAP、果蠅無毛(hairless)、釀酒酵母TFIID、釀酒酵母YAP1、人c-src、人FGF-1、猿猴小核醣核酸病毒、蕪菁皺縮病毒、eIF4G適體、克沙奇病毒B3(CVB3)或克沙奇病毒A(CVB1/2)的IRES序列。
  22. 如請求項18至21中任一項所述的DNA建構體或如請求項18至21中任一項所述的RNA轉錄物,其中所述靶序列進一步包含與所述靶蛋白編碼區可操作連接的5’非轉譯區(UTR)和/或3’UTR。
  23. 如請求項1至2和4至17中任一項所述的DNA建構體或如請求項3至17中任一項所述的RNA轉錄物,其中所述靶序列包含生物活性RNA或所述生物活性RNA的前體。
  24. 如請求項23所述的DNA建構體或如請求項23所述的RNA轉錄物,其中所述生物活性RNA包含短髮夾RNA、轉運RNA(tRNA)、短干擾RNA、微RNA(microRNA)或嚮導RNA。
  25. 如請求項1至2和4至24中任一項所述的DNA建構體或如請求項3至23中任一項所述的RNA轉錄物,其中所述RNA轉錄物進一步包含至少一個同源臂,任選地所述同源臂位於所述第一環化元件的上游(即5’同源臂)和/或所述第二環化元件的下游(即3’同源臂)。
  26. 如請求項25所述的DNA建構體或如請求項25所述的RNA轉錄物,其中所述同源臂包含至少一個衍生自ALU重複序列的ALU元件。
  27. 如請求項24或25所述的DNA建構體或如請求項24或25所述的RNA轉錄物,其中所述同源臂: a)插入所述5’純化片段和所述第一環化元件之間和/或插入所述3’純化片段和所述第二環化元件之間;或 b)位於所述5’純化片段的上游和/或所述3’純化片段的下游。
  28. 如請求項1至2和4至27中任一項所述的DNA建構體或如請求項3至27中任一項所述的RNA轉錄物,其中所述RNA轉錄物進一步包含至少一個間隔區,任選地所述間隔區位於所述第一環化元件(例如所述自剪接元件的3’部分)和所述靶序列之間,和/或位於所述靶序列和所述第二環化元件(例如所述自剪接元件的5’部分)之間。
  29. 如請求項28所述的DNA建構體或如請求項28所述的RNA轉錄物,其中所述間隔區: a)位於所述第一環化元件(例如所述自剪接元件的3’部分)和所述IRES序列之間,和/或位於所述靶序列和所述第二環化元件(例如所述自剪接元件的5’部分)之間; b)位於所述第一環化元件(例如所述自剪接元件的3’部分)和所述靶蛋白編碼區之間,和/或位於所述靶蛋白編碼區和所述第二環化元件(例如所述自剪接元件的5’部分)之間。
  30. 如請求項28或29所述的DNA建構體或如請求項28或29所述的RNA轉錄物,其中所述至少一個間隔區序列包含位於所述靶序列側翼的兩個互補間隔區序列。
  31. 一種DNA建構體,其包含彼此可操作地連接並以5’至3’順序排列的以下元件: a)第一純化片段,任選地第一poly(A)短序列,和 b)多重選殖位,其包含或基本上由一個或多個用於插入靶序列的選殖位點組成。
  32. 如請求項31所述的DNA建構體,其進一步包含位於所述多重選殖位下游的第二純化片段。
  33. 如請求項31或32所述的DNA建構體,其進一步包含位於所述第一純化片段和所述多重選殖位之間的第一環化元件,和/或位於所述多重選殖位下游或位於所述多重選殖位和所述第二純化片段之間的第二環化元件。
  34. 如請求項31至33中任一項所述的DNA建構體,其進一步包含位於所述第一純化片段上游的RNA聚合酶啟動子。
  35. 一種DNA建構體,其包含彼此可操作地連接並按以下順序排列的以下元件: a)RNA聚合酶啟動子, b)第一環化元件, c)多重選殖位,和 d)第二環化元件, 其中所述DNA建構體進一步包含至少一個位於所述RNA聚合酶啟動子下游的純化片段。
  36. 如請求項35所述的DNA建構體,其中所述多個純化片段中的一個位於所述第一環化元件的上游和/或所述第二環化元件的下游。
  37. 一種產生如請求項3至30中任一項所述的RNA轉錄物的方法,所述方法包括:從如請求項1至2和4至30中任一項所述的DNA建構體轉錄,從而獲得如請求項3至30中任一項所述的RNA轉錄物。
  38. 一種產生如請求項3至30中任一項所述的RNA轉錄物的方法,所述方法包括: a)提供前體RNA,其與所述RNA轉錄物的不同之處在於缺少所述純化片段,任選地所述前體RNA與所述RNA轉錄物的不同之處僅在於缺少所述純化片段,以及 b)將所述純化片段添加到所述前體RNA中,從而獲得如請求項3至30中任一項所述的RNA轉錄物。
  39. 如請求項38所述的方法,其中所述純化片段被添加到:a)位於所述第一環化元件上游的位置,b)位於所述第二環化元件下游的位置,c)或a)和b)的任何組合。
  40. 如請求項38所述的方法,其中所述純化片段:a)附著於所述第一環化元件的5’端,或b)附著於所述第二環化元件的3’端,c)或a)和b)的任何組合。
  41. 一種產生環狀RNA的方法,所述方法包括: a)提供如請求項3至30中任一項所述的RNA轉錄物,以及 b)使所述RNA轉錄物自環化以形成所述環狀RNA。
  42. 如請求項41所述的方法,其中步驟a)中的所述RNA轉錄物已經使用捕獲劑富集,所述捕獲劑特異性結合存在於所述RNA轉錄物中的純化片段。
  43. 如請求項41或42所述的方法,其中所述方法進一步包括透過捕獲劑從步驟b)獲得的產物中純化所述環狀RNA,其中所述捕獲劑特異性結合所述RNA轉錄物中的所述純化片段,以及任選地副產物中的但不存在於所述環狀RNA中的所述純化片段。
  44. 如請求項42或43所述的方法,其中所述捕獲劑包含能夠在嚴格條件下與所述純化片段雜交的核酸片段,任選地所述捕獲劑包含與所述純化片段的核苷酸序列至少80%、85%、90%、95%或100%互補的核酸片段。
  45. 如請求項44所述的方法,其中所述捕獲劑是固定的。
  46. 如請求項41至45中任一項所述的方法,其中步驟b)中的所述RNA轉錄物在溶液中經歷自環化或在固定有所述捕獲劑的固體基質上經歷自環化。
  47. 如請求項41至46中任一項所述的方法,其中所述純化片段包含poly(A)短序列,並且所述捕獲劑包含去氧胸苷寡核苷酸(oligo(dT))。
  48. 如請求項41至47中任一項所述的方法,其中步驟a)中的所述RNA轉錄物由如請求項1至2和4至30中任一項所述的DNA建構體轉錄。
  49. 如請求項41所述的方法,其中所述方法進一步包括在步驟a)之前由如請求項1至2和4至30中任一項所述的DNA建構體轉錄以產生如請求項3至30中任一項所述的RNA轉錄物。
  50. 如請求項41所述的方法,其中步驟a)中的所述RNA轉錄物透過如請求項38至40中任一項所述的方法獲得。
  51. 一種使用如請求項41至50中任一項所述的方法產生的環狀RNA的組合物。
  52. 一種組合物,其包含如請求項1至2和4至30中任一項所述的DNA建構體或如請求項3至30中任一項所述的RNA轉錄物。
  53. 一種包含如請求項1至2和4至36中任一項所述的DNA建構體的試劑盒。
  54. 一種用於產生如請求項3至30中任一項所述的RNA轉錄物的試劑盒,其包含用於將所述純化片段添加到如請求項38所述的RNA轉錄物的前體中的試劑。
  55. 如請求項53或54所述的試劑盒,其中所述試劑盒進一步包含捕獲劑,所述捕獲劑特異性結合存在於所述RNA轉錄物中但不存在於所述環狀RNA中的所述純化片段。
  56. 如請求項53或54所述的試劑盒,其中所述純化片段包含poly(A)短序列。
  57. 如請求項53或54所述的試劑盒,其中所述捕獲劑包含oligo(dT)。
TW112118805A 2022-05-20 2023-05-19 製備環狀rna的方法 TW202408542A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2022094157 2022-05-20
WOPCT/CN2022/094157 2022-05-20

Publications (1)

Publication Number Publication Date
TW202408542A true TW202408542A (zh) 2024-03-01

Family

ID=88834705

Family Applications (1)

Application Number Title Priority Date Filing Date
TW112118805A TW202408542A (zh) 2022-05-20 2023-05-19 製備環狀rna的方法

Country Status (3)

Country Link
CN (1) CN117529556A (zh)
TW (1) TW202408542A (zh)
WO (1) WO2023222114A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118028340A (zh) * 2024-01-31 2024-05-14 北京悦康科创医药科技股份有限公司 一种用于环状rna表达的核酸构建体及其在蛋白表达中的应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108486107A (zh) * 2018-03-01 2018-09-04 北京大学 基于双分子荧光互补的新型信使rna和环状rna标记方法
CN108546700A (zh) * 2018-04-19 2018-09-18 广州密码子基因科技有限公司 一种FFPE样本circRNA高通量测序文库的构建方法
AU2019280583B2 (en) * 2018-06-06 2022-12-15 Massachusetts Institute Of Technology Circular RNA for translation in eukaryotic cells
JP2023525270A (ja) * 2020-05-08 2023-06-15 オルナ セラピューティクス インコーポレイテッド 環状rna組成物及び方法
JP2023527309A (ja) * 2020-05-19 2023-06-28 オルナ セラピューティクス インコーポレイテッド 環状rna組成物及び方法
CN114507691A (zh) * 2022-03-02 2022-05-17 深圳市瑞吉生物科技有限公司 一种用于制备环状rna的载体及其应用

Also Published As

Publication number Publication date
CN117529556A (zh) 2024-02-06
WO2023222114A1 (en) 2023-11-23

Similar Documents

Publication Publication Date Title
US11352641B2 (en) Circular RNA for translation in eukaryotic cells
US20230250439A1 (en) Polynucleotide secondary structure
EP3946466A2 (en) Compositions comprising modified circular polyribonucleotides and uses thereof
EP4239072A1 (en) Recombinant nucleic acid molecule based on point mutation of translation initiation element and use thereof in preparation of circular rna
US20240277872A1 (en) Modified mrna, modified non-coding rna, and uses thereof
JP2024528469A (ja) 組換え環状rnaからの改良されたタンパク質翻訳のための組成物及び方法
TW202408542A (zh) 製備環狀rna的方法
WO2023046153A1 (en) Circular rna and preparation method thereof
CN116322791A (zh) 经修饰的功能性核酸分子
EP4269585A1 (en) Guide rna for editing polyadenylation signal sequence of target rna
EP4219723A1 (en) Circular rna platforms, uses thereof, and their manufacturing processes from engineered dna
Kundu Directed Evolution of a Novel Heterochiral Ribonuclease Ribozyme and Kinetic Characterization of Heterochiral DNA Strand Displacement Reactions
WO2024145248A1 (en) Compositions and methods for generating circular rna