CN117980482A - Rbm20突变的基因组编辑 - Google Patents

Rbm20突变的基因组编辑 Download PDF

Info

Publication number
CN117980482A
CN117980482A CN202280057063.3A CN202280057063A CN117980482A CN 117980482 A CN117980482 A CN 117980482A CN 202280057063 A CN202280057063 A CN 202280057063A CN 117980482 A CN117980482 A CN 117980482A
Authority
CN
China
Prior art keywords
vector
aav
sequence
nucleic acid
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280057063.3A
Other languages
English (en)
Inventor
埃里克·N·奥尔松
罗达·巴塞尔-达比
西山孝彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Texas System
Original Assignee
University of Texas System
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Texas System filed Critical University of Texas System
Priority claimed from PCT/US2022/035666 external-priority patent/WO2023278660A2/en
Publication of CN117980482A publication Critical patent/CN117980482A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本文中的公开内容涉及包含被设计用于CRISPR/Cas9系统的单指导RNA(sgRNA)的组合物以及使用其用于预防、改善或治疗一种或更多种心肌病的方法。例如,本文中提供了通过对人细胞和小鼠中的RBM20突变进行精确基因组编辑来校正扩张型心肌病的组合物和方法。

Description

RBM20突变的基因组编辑
相关申请的引用
本申请要求2022年4月27日提交的美国临时申请号63/335,647和2021年7月2日提交的美国临时申请号63/218,221的优先权权益,其各自的全部内容均通过引用并入本文。
背景
1.技术领域
本发明总体上涉及分子生物学、医学和遗传学领域。更特别地,本发明涉及使用核苷酸编辑方法进行基因组编辑以在体内校正突变的组合物及其用途。
2.背景技术
心肌病是导致心肌变大、变厚和/或僵硬的心肌疾病。随着心肌病的进展,心脏变得更弱,并且可导致心力衰竭或心律不齐(即心律失常)。扩张型心肌病(dilatedcardiomyopathy,DCM)是严重的心肌疾病,以左心室或双心室扩大和收缩功能障碍为特征,代表心力衰竭的主要风险因素(1)。RNA结合基序蛋白20(RNA binding motif protein 20,RBM20)的突变是心肌病的常见原因,并且是2至5%家族性DCM患者的原因(2,3)。许多RBM20突变聚集在介导核定位的富含精氨酸/丝氨酸(arginine/serine rich,富含RS)的结构域内(4-7)。具有这些RBM20突变的患者经历高频率的心律失常事件和心源性猝死(8-10)。
RBM20调节许多编码肌节和钙调节蛋白的重要心脏基因的选择性剪接(7,11)。据推测,RBM20相关心肌病的主要原因是缺少心脏基因(例如肌联蛋白(titin,TTN))的选择性剪接(12)。然而,最近的报道表明,富含RS的区域中的RBM20R636S突变诱导了胞质中相分离核糖核蛋白(ribonucleoprotein,RNP)颗粒的形成和RBM2错误定位(13),意味着心肌细胞(cardiomyocyte,CM)中的异常RNP颗粒是DCM的潜在原因(13-16)。由于大多数治疗解决症状或针对继发作用,而疾病潜在的遗传突变却保持不变,因此针对DCM尚无有效的治疗。
发明内容
精确的CRISPR-Cas9基因编辑技术,例如碱基编辑(base editing,BE)和先导编辑(prime editing,PE),提供了永久校正致病突变的潜力,并提供了治疗心肌病的新的治疗方法(17,18)。为此,本发明人设计了sgRNA以通过CRISPR-Cas9腺嘌呤碱基编辑(adeninebase editing,ABE)在人诱导多能干细胞来源的心肌细胞中校正RBM20(R634Q)突变,并观察到了功能性心肌细胞的恢复。另外,本发明人创建了Rbm20(R636Q)小鼠模型,该模型表现出严重的心脏功能障碍和猝死,再现了在DCM患者中观察到的表型。使用腺相关病毒(adeno-associated virus,AAV)递送系统将ABE基因编辑组分递送至小鼠以在体内挽救RBM20心肌病。本发明人还设计了用于先导编辑(PE)的pegRNA,以校正不能被ABE校正的其他RBM20突变。这些发现为永久校正RBM20突变和DCM潜在的其他遗传突变提供了有前景的治疗方法。
本公开内容至少部分地基于这样的发现:将指导RNA(guide RNA,gRNA)与成簇规律间隔短回文重复(clustered regularly interspaced short palindromic repeat,CRISPR)/CRISPR相关蛋白9(Cas9)系统一起使用,通过碱基对编辑校正遗传突变,成功逆转了与家族性心肌病(例如DCM)相关的表型。换言之,本公开内容涉及包含被设计用于CRISPR/Cas9系统的单指导RNA(single guide RNA,sgRNA)的组合物以及使用其用于预防、改善或治疗一种或更多种心肌病的方法。
本公开内容的一些方面提供了被设计用于CRISPR/CAS9系统以用于预防、改善或治疗一种或更多种心肌病的gRNA。在一些实施方案中,本文中的gRNA可预防、改善或治疗一种或更多种心肌病,包括扩张型心肌病(DCM)。
在一些实施方案中,本文中的gRNA可包含与SEQ ID NO:1至4中任一个的核苷酸序列具有至少85%、至少90%或至少95%序列同一性的多核苷酸序列。在一些实施方案中,本文中的gRNA还可包含原间隔区相邻基序(protospacer adjacent motif,PAM)。
在一个实施方案中,本文中提供了包含选自SEQ ID NO:1至4中任一个的靶向核酸序列的指导RNA(gRNA)。靶向核酸序列可具有与SEQID NO:1至4中任一个至少85%相同、90%相同或95%相同的序列。gRNA可以是单分子指导RNA(sgRNA)。gRNA可用于修饰人RBM20基因中的序列。
在一些实施方案中,本文中的gRNA可以校正至少一种基因中的至少一种突变,其中所述至少一种基因包含RBM20。在一些实施方案中,本文中的gRNA可以校正RBM20基因中的R634Q突变或其哺乳动物等同物。
本公开内容的另一些方面提供了CRISPR/CAS9系统。在一些实施方案中,本文中的CRISPR/CAS9系统可包含至少一种载体,所述载体包含编码Cas9核酸酶的多核苷酸分子和至少一种如本文中公开的gRNA。在一些实施方案中,本文中的CRISPR/Cas9系统可包含由链球菌属(Streptococcus)、葡萄球菌属(Staphylococcus)和/或其变体构成的Cas9核酸酶。
在一个实施方案中,本文中提供了包含碱基编辑器和靶向人RBM20中的突变的gRNA的组合物。gRNA可包含选自SEQ ID NO:1至4中任一个的靶向核酸序列。靶向核酸序列可具有与SEQ ID NO:1至4中任一个至少85%相同、90%相同或95%相同的序列。gRNA可以是单分子指导RNA(sgRNA)。
碱基编辑器可以是腺嘌呤碱基编辑器(adenine base editor,ABE)。碱基编辑器可包含与腺苷脱氨酶连接的CRISPR/Cas核酸酶。CRISPR/Cas核酸酶可以是催化受损的。CRISPR/Cas核酸酶可以是可分离自或来源于酿脓链球菌(Streptococcus pyogenes)的Cas9核酸酶(例如,spCas9)。
在一个实施方案中,本文中提供了核酸,其包含:编码靶向人RBM20中的突变的第一gRNA的序列;编码碱基编辑器的序列;编码第一启动子的序列,其中第一启动子驱动编码第一gRNA的序列的表达;和编码第二启动子的序列,其中第二启动子驱动编码碱基编辑器的序列的表达。
gRNA可包含选自SEQ ID NO:1至4中任一个的靶向核酸序列。靶向核酸序列可具有与SEQ ID NO:1至4中任一个至少85%相同、90%相同或95%相同的序列。gRNA可以是单分子指导RNA(sgRNA)。碱基编辑器可以是腺嘌呤碱基编辑器(ABE)。碱基编辑器可包含与腺苷脱氨酶连接的CRISPR/Cas核酸酶。CRISPR/Cas核酸酶可以是催化受损的。CRISPR/Cas核酸酶可以是Cas9核酸酶,所述Cas9核酸酶可分离自或来源于酿脓链球菌(例如,spCas9)、金黄色葡萄球菌(Staphylococcus aureus)(例如,SaCas9)、耳葡萄球菌(Staphylococcusauricularis)(例如,SauCas9)或路邓葡萄球菌(Staphylococcus lugdunensis)(例如,SlugCas9)。
第一启动子和/或第二启动子可以是细胞类型特异性启动子。细胞类型特异性启动子可以是心肌细胞特异性启动子,例如如心肌肌钙蛋白T(cardiac troponin T,cTnT)启动子。第一启动子可以是U6启动子、H1启动子或7SK启动子。
核酸可以是DNA或RNA。核酸可包含聚腺苷(polyA)序列,所述聚腺苷(polyA)序列可以是微型polyA序列。核酸可包含在组合物中,所述组合物可包含在细胞中。核酸可包含在细胞中,所述细胞可包含在组合物中。
核酸可包含在载体中。载体可包含编码转座元件(例如如转座子(例如Tn7转座子))的反向末端重复(inverted terminal repeat,ITR)的序列。载体可包含编码T7转座子的5’ITR的序列和编码T7转座子的3’ITR的序列。载体可以是非病毒载体,例如如质粒。载体可以是病毒载体,例如如腺相关病毒(AAV)载体或腺病毒载体。AAV载体可以是复制缺陷型或条件性复制缺陷型的。AAV载体可以是重组AAV载体。AAV载体可包含分离自或来源于以下血清型的AAV载体的序列:
血清型1(AAV1),2(AAV2),3(AAV3),4(AAV4),5(AAV5),6(AAV6),7(AAV7),8(AAV8),9(AAV9),10(AAV10),11(AAV11),AAV9-rh74-HB-P1,AAV9-AAA-P1-SG,AAVrh10,AAVrh74,AAV9P,MyoAAV1A,MyoAAV2A,MyoAAV3A,MyoAAV4A,MyoAAV4C,或MyoAAV4E,或其任意组合,其中AAV之后的数字表示AAV血清型。参见例如WO2019193119;WO2022053630;Weinmann et al,2020,Nature Communications,11:5432和Tabebordbar et al,2021,Cell,184:1-20,其各自均通过引用整体并入本文。
可针对在哺乳动物细胞(例如如人细胞)中的表达对载体进行优化。
载体可包含在组合物中,所述组合物还可包含可药用载体。载体可包含在细胞,例如人细胞、心肌细胞或诱导多能干(induced pluripotent stem,iPS)细胞中。细胞可包含在组合物中。
在一个实施方案中,本文中提供了用于校正人RBM20中的突变的方法,所述方法包括使细胞与本发明实施方案中任一个所述的核酸或载体组合物在适于表达第一gRNA和腺嘌呤碱基编辑器的条件下接触,其中第一gRNA与腺嘌呤碱基编辑器形成复合物,其中该复合物修饰肌养蛋白剪接位点,从而对RBM20的编码序列进行恢复性校正。还提供了通过这样的方法产生的细胞。
本公开内容的另一些方面提供了修饰细胞中的至少一种心肌病相关基因的方法。在一些实施方案中,修饰细胞中的至少一种心肌病相关基因的方法可包括使细胞与编码本文中的CRISPR/CAS9系统的至少一种类型的载体接触,其中所述CRISPR/CAS9系统可针对心肌病相关基因的突变体等位基因和/或所述至少一种类型的载体可包含编码Cas9核酸酶的多核苷酸分子和一种或更多种如本文中公开的gRNA。
本公开内容的另一些方面提供了在对象中预防、改善或治疗一种或更多种心肌病的方法。在一些实施方案中,在对象中预防、改善或治疗一种或更多种心肌病的方法可包括向对象施用一种或更多种腺相关病毒(AAV)颗粒,其中所述AAV颗粒可包含一种或更多种编码如本文中公开的Cas9核酸酶的多核苷酸和一种或更多种如本文中公开的gRNA。
在一个实施方案中,本文中提供了包含5’-GATATGGCCCAGAAAGGCCG-3’(SEQ IDNO:5)的靶向核酸序列的指导RNA(gRNA)。靶向核酸序列可具有与SEQ ID NO:5至少85%相同、90%相同或95%相同的序列。gRNA可以是先导编辑(pe)gRNA(pegRNA)。gRNA可被用于修饰人RBM20基因以校正C1906A突变。
gRNA还可包含引物结合位点,该引物结合位点包含5’-CCTTTCTGGGC-3’(SEQ IDNO:6)的核酸序列。引物结合位点序列可具有与SEQ ID NO:6至少85%相同、90%相同或95%相同的序列。gRNA还可包含逆转录酶模板,该逆转录酶模板包含5’-GGACTACGAGAGCGCGG-3’(SEQ ID NO:7)的核酸序列。逆转录酶模板序列可具有与SEQ IDNO:7至少85%相同、90%相同或95%相同的序列。
在一个实施方案中,本文中提供了包含先导编辑器和校正人RBM20基因的C1906A突变的gRNA的组合物。gRNA可以修饰人RBM20基因以恢复RBM20的编码序列。gRNA可包含5’-GATATGGCCCAGAAAGGCCG-3’(SEQ ID NO:5)的靶向核酸序列。靶向核酸序列可具有与SEQ IDNO:5至少85%相同、90%相同或95%相同的序列。gRNA可以是先导编辑(pe)gRNA(pegRNA)。
先导编辑器可包含与逆转录酶连接的CRISPR/Cas核酸酶。CRISPR/Cas核酸酶可以是催化受损的。CRISPR/Cas核酸酶可以是可分离自或来源于酿脓链球菌的Cas9核酸酶(例如,spCas9)。组合物还可包含第二链切口sgRNA。
在一个实施方案中,本文中提供了核酸,其包含:编码靶向人RBM20基因的第一gRNA的序列;编码先导编辑器的序列;编码第一启动子的序列,其中第一启动子驱动编码第一gRNA的序列的表达;和编码第二启动子的序列,其中第二启动子驱动编码先导编辑器的序列的表达。
先导编辑器可包含与逆转录酶连接的CRISPR/Cas核酸酶。CRISPR/Cas核酸酶可以是催化受损的。CRISPR/Cas核酸酶可以是可分离自或来源于酿脓链球菌的Cas9核酸酶(例如,spCas9)。组合物还可包含第二链切口sgRNA。
第一启动子和/或第二启动子可以是细胞类型特异性启动子。细胞类型特异性启动子可以是心肌细胞特异性启动子,例如如心肌肌钙蛋白T(cTnT)启动子。第一启动子可以是U6启动子、H1启动子或7SK启动子。
核酸可以是DNA或RNA。核酸可包含聚腺苷(polyA)序列,所述聚腺苷(polyA)序列可以是微型polyA序列。核酸可包含在组合物中,所述组合物可包含在细胞中。核酸可包含在细胞中,所述细胞可包含在组合物中。
核酸可包含在载体中。载体可包含编码转座元件(例如如转座子(例如Tn7转座子))的反向末端重复(ITR)的序列。载体可包含编码T7转座子的5’ITR的序列和编码T7转座子的3’ITR的序列。载体可以是非病毒载体,例如如质粒。载体可以是病毒载体,例如如腺相关病毒(AAV)载体或腺病毒载体。AAV载体可以是复制缺陷型或条件性复制缺陷型的。AAV载体可以是重组AAV载体。AAV载体可包含分离自或来源于以下血清型的AAV载体的序列:血清型1(AAV1)、2(AAV2)、3(AAV3)、4(AAV4)、5(AAV5)、6(AAV6)、7(AAV7)、8(AAV8)、9(AAV9)、10(AAV10)、11(AAV11),或其任意组合。可针对在哺乳动物细胞(例如如人细胞)中的表达对载体进行优化。
载体可包含在组合物中,所述组合物还可包含可药用载体。载体可包含在细胞,例如人细胞、心肌细胞或诱导多能干(iPS)细胞中。细胞可包含在组合物中。
在一个实施方案中,本文中提供了用于校正人RBM20中的突变的方法,所述方法包括使细胞与本发明实施方案中任一个所述的核酸或载体组合物在适于表达第一gRNA和先导编辑器的条件下接触,其中第一gRNA与先导编辑器形成复合物,其中该复合物修饰突变,从而对RBM20的编码序列进行恢复性校正。还提供了通过这样的方法产生的细胞。
在一个实施方案中,本文中提供了在有此需要的对象中治疗扩张型心肌病的方法,所述方法包括向对象施用治疗有效量的本发明实施方案中任一个所述的药物组合物。还提供了治疗有效量的本发明实施方案中任一个所述的药物组合物用于在有此需要的对象中治疗扩张型心肌病的用途。
组合物可经局部施用。组合物可直接施用于心脏组织。组合物可通过肌内输注或注射施用。组合物可经全身施用。组合物可通过静脉内输注或注射施用。
在施用组合物之后,对象可表现出正常的肌节结构架构、RBM20的核定位、不存在RNP颗粒形成,或其组合。在施用组合物之后,对象可表现出改善的LV功能。
对象可以是新生儿、婴儿、儿童、年轻成人或成人。对象可以是男性或女性。
本公开内容的另一些方面提供了药盒,其用于实践本文中公开的方法和/或产生本文中公开的任何构建体。在一些实施方案中,本文中的药盒可包含(a)至少一种载体,所述载体包含编码至少一种如本文中公开的Cas9核酸酶的多核苷酸分子和一种或更多种如本文中公开的gRNA;以及至少(b)容器。
本公开内容的另一些方面提供了用于在本文中使用的药物组合物。在一些实施方案中,组合物、载体、AAV颗粒、CRISPR/CAS9系统、和/或gRNA中的任一者均可被配制成如本文中公开的药物组合物。在一些实施方案中,本文中的药物组合物可包含至少一种载体,所述载体包含编码本文中的Cas9核酸酶的多核苷酸分子和一种或更多种如本文中公开的gRNA;以及至少一种可药用载体、稀释剂和/或赋形剂。在一些实施方案中,本文中的药物组合物可包含至少一种腺相关病毒(AAV)载体。在一些实施方案中,本文中的药物组合物可包含至少一种包装到病毒颗粒中的AAV载体。在一些实施方案中,本文中的药物组合物可包含AAV颗粒。
在一个实施方案中,本文中提供了经遗传修饰的小鼠,其基因组包含至少一个编码R636Q突变的Rbm20基因的等位基因。小鼠可具有C57/BL6遗传背景。对于编码R636Q突变的Rbm20的等位基因,基因组可以是纯合的。小鼠可患有心脏功能障碍。例如,舒张末期(LVIDd)和收缩末期(LVIDs)期间的左心室内部尺寸可增大。心脏功能障碍可以是心房和心室扩张。心脏功能障碍可以是缩短分数(fractional shortening)降低。还提供了从这样的小鼠分离的细胞。所述细胞可以是心肌细胞。
在一个实施方案中,本文中提供了用于在根据本发明实施方案中任一个所述的小鼠中筛选至少一种候选药剂的方法,所述方法包括向小鼠施用一种或更多种候选药剂。可以针对至少一种候选药剂改善左心室功能的能力来筛选至少一种候选药剂。可以针对至少一种候选药剂挽救心脏腔室尺寸的能力来筛选至少一种候选药剂。可以针对至少一种候选药剂延长寿命的能力来筛选至少一种候选药剂。候选药剂可包含本发明实施方案中任一个所述的gRNA。
从以下详细描述中,本发明的其他目的、特征和优点将变得明显。然而,应理解的是,虽然详细描述和具体实例表明了本发明的一些优选实施方案,但其仅以举例说明的方式给出,因为从该详细描述中,本发明的精神和范围内的多种变化和修改对于本领域技术人员将变得明显。
附图说明
以下附图构成本说明书的一部分,并且被包括在内以进一步说明本发明的某些方面。通过结合本文中给出的一些具体实施方案的详细描述来参考这些附图中的一个或更多个,可以更好地理解本发明。
图1A至1E.通过iPSC中的腺嘌呤碱基编辑精确校正RBM20R634Q突变。(图1A)人RBM20基因的外显子8至10突出显示了编码富含精氨酸/丝氨酸(富含RS)区域的外显子9中的热点突变(hotspot mutation)。所示的核苷酸序列是SEQ ID NO:8。所示的氨基酸序列是SEQ IDNO:9。(图1B)描绘了使用sgRNA1和ABEmax-VRQR-SpCas9对R634Q突变进行腺嘌呤碱基编辑(ABE)校正的图示。靶上位点(on-target site)位于A6处,并且可能的旁观者位点位于A14处。示出了PAM。R634Q核苷酸序列以SEQ ID NO:10示出。所示的R634Q氨基酸序列是SEQ IDNO:11。校正之后的核苷酸序列如SEQ ID NO:12中所示。经校正的氨基酸序列以SEQ ID NO:13示出。(图1C)在ABE校正之后纯合R634Q/R634Q iPSC中的腺嘌呤(A)至鸟嘌呤(G)的编辑效率。数据表示为平均值±SEM(n=3)。(图1D)在ABE校正之前和之后杂合(R634Q/+)iPSC中正常等位基因的百分比。数据表示为平均值±SEM(n=3)。进行了未配对学生t检验。p值****P<0.0001。(图1E)正常(WT)、R634Q/+、R634Q/R634Q和经ABE校正的R634Q/R634QiPSC来源的心肌细胞的免疫细胞化学。α-辅肌动蛋白、RBM20和DAPI。比例尺,10μm。
图2A至2F.通过腺嘌呤碱基编辑校正iPSC来源的RBM20R634Q心肌细胞的病理表型。(图2A)正常(WT)、杂合(R634Q/+)、纯合(R634Q/R634Q)和经校正的R634Q/R634Q iPSC来源的心肌细胞中的选择性剪接模式的热图。(图2B)示出了TTN基因、TTN-N2BA和TTN-N2B的选择性剪接同种型的图示。(图2C)通过qRT-PCR定量的TTN-N2B同种型的相对表达。数据表示为平均值±SEM(n=3)。进行了单因素ANOVA。p值****P<0.0001。(图2D)在AAV6介导的ABE校正之后,经校正的R634Q/R634Q iPSC来源的心肌细胞中的腺嘌呤(A)至鸟嘌呤(G)编辑的百分比。A6是靶上位点。A14是旁观者位点。(图2E)在AAV6介导的ABE校正之前和之后,R634Q/R634Q iPSC来源的心肌细胞中的RBM20亚细胞定位的定量(每组中n=100至150个总细胞;在三个独立的分化物(differentiation)中进行定量)。在每对柱中,左柱是“R634Q/R634Q”,并且右柱是“经校正的”。数据表示为平均值±SEM。进行了双因素ANOVA和Bonferroni多重比较检验。p值****P<0.0001。(图2F)正常(WT)、R634Q/R634Q和经AAV6-ABE校正的R634Q/R634Q iPSC来源的心肌细胞的免疫细胞化学。α-辅肌动蛋白、RBM20和DAPI。比例尺,10μm。
图3A至3C.Rbm20R636Q小鼠中的心脏功能障碍。(图3A)来自4周龄野生型(wildtype,WT)、杂合(R636Q/+)和纯合(R636Q/R636Q)小鼠的代表性M模式超声心动图示踪。(图3B)通过超声心动图测量的缩短分数(FS)、左心室收缩末期(LVIDs)和舒张末期(LVIDd)直径。数据表示为平均值±SEM(每个基因型n=6)。进行了单因素ANOVA。p值*P<0.05和****P<0.0001。(图3C)来自指定基因型的12周龄小鼠的代表性心脏。比例尺,1mm。
图4A至4E.全身递送具有AAV9的腺嘌呤碱基编辑组分恢复了心脏功能。(图4A)来自在ABE校正之后第6周时的纯合(R636Q/R636Q)突变体小鼠心脏的cDNA中的腺嘌呤(A)至鸟嘌呤(G)编辑的百分比。A6是靶上位点。A14是旁观者位点。A4和A13是沉默突变(褐色)。数据表示为平均值±SEM(n=4)。(图4B)在野生型(WT)、纯合(R636Q/R636Q)和经ABE校正的R636Q/R636Q(经校正的)小鼠中,在ABE校正之后的第4周和8周时通过超声心动图测量的缩短分数(FS)、左心室收缩末期(LVIDs)和舒张末期(LVIDd)直径。数据表示为平均值±SEM(每组n=6)。进行了双因素ANOVA和turkey多重比较检验。在每个三联柱中,左柱是“WT”,中间柱是“R636Q/R636Q”,并且右柱是“经校正的”。P值*P<0.05,**P<0.01和****P<0.0001。(图4C)来自在ABE校正之后的第12周时的WT、R636Q/R636Q和经ABE校正的R636/R636Q小鼠的四腔室组织学切片的H&E染色。比例尺,1mm。(图4D)WT(n=15)、R636Q/R636Q(n=16)和经ABE校正的R636Q/R636Q小鼠(n=15)的Kaplan-Meier存活曲线。进行了对数秩(Mantel-Cox)检验。对于WT或经ABE校正的R636Q/R636Q与R636Q/R636Q比较,p值****p<0.0001。(图4E)示出了在ABE校正之后的第12周时WT、R636Q/R636Q和经ABE校正的R636Q/R636Q小鼠的心肌细胞中的RBM20易位的免疫组织化学。心肌肌钙蛋白T、RBM20和DAPI。比例尺,10μm。
图5A至5B.产生RBM20R634Q同基因iPSC系。(图5A)靶向人RBM20基因的外显子9的sgRNA的序列。PAM(CGG)被突出显示。核酸的序列以SEQ ID NO:14示出。(图5B)正常(WT;SEQID NO:15)、杂合(R634Q/+;SEQ ID NO:16)和纯合(R634Q/R634Q;SEQ ID NO:17)iPSC系中跨越RBM20R634Q突变(带下划线)的基因组区域的Sanger序列。
图6A至C.使用ABE8e-SpCas9变体和ABE8e-SaCas9进行腺嘌呤碱基编辑。(图6A)在使用sgRNA1和ABE8e-NG-SpCas9或ABE8e-VRQR-SpCas9进行ABE校正之后,R634Q/R634QiPSC中腺嘌呤(A)至鸟嘌呤(G)编辑的百分比。A6位是靶上位点。A14是旁观者位点。数据表示为平均值±SEM(n=3)。(图6B)示出了RBM20R634Q突变区域中sgRNA2、3和4的结合位置的图示。示出了靶上位点和旁观者位点。所示的核酸序列是SEQ ID NO:10。所示的氨基酸序列是SEQ ID NO:11。(图6C)在使用与每个ABE8e碱基编辑器偶联的sgRNA2、3和4进行ABE校正之后,R634Q/R634Q iPSC中的腺嘌呤(A)至鸟嘌呤(G)编辑的百分比。靶上位点。旁观者位点。数据表示为平均值±SEM(n=3)。
图7.iPSC来源的心肌细胞中TTN选择性剪接的恢复。通过剪接百分比(percentspliced in,PSI)测量的TTN基因的剪接模式表示外显子包涵率。经ABE校正的R634Q/R634QiPSC来源的心肌细胞示出了TTN剪接的恢复。
图8A至8C.腺嘌呤碱基编辑恢复了iPSC来源的心肌细胞中的基因表达。(图8A)示出了正常(WT)、R634Q/+、R634Q/R634Q和经ABE校正的R634Q/R634Q iPSC来源的心肌细胞的差异调节基因表达的热图。(图8B和8C)与正常iPSC来源的心肌细胞相比,R634Q/R634QiPSC来源的心肌细胞中与上调和下调基因相关的基因本体术语(gene ontology term)。在分化之后第40天时对3个独立分化的iPSC来源的心肌细胞进行了RNA测序。
图9A至9B.腺嘌呤碱基编辑恢复了iPSC来源的心肌细胞中的钙处理异常。(图9A)通过到达峰值的时间对钙释放阶段进行的定量和(图9B)通过tau对钙再摄取阶段进行的定量(每组中n=50个细胞;在三个独立的分化物中进行定量)。数据显示为平均值±SEM。进行了单因素ANOVA。P值****P<0.0001。
图10A至10B.iPSC中腺嘌呤碱基编辑的脱靶分析。(图10A)与ABEmax-VRQR-SpCas9偶联的sgRNA1的前八个预测的脱靶位点。表中的序列从上到下分别为SEQ ID NO:18至26。(图10B)通过对前八个预测的脱靶位点进行Sanger测序确定的腺嘌呤(A)至鸟嘌呤(G)编辑的百分比。数据表示为平均值±SEM(n=3)。进行了单因素ANOVA。p值****P<0.0001。
图11A至11D.AAV6介导的腺嘌呤碱基编辑恢复了分化的iPSC来源的心肌细胞中RBM20的核定位。(图11A)用于将ABE组分递送至iPSC来源的心肌细胞的双AAV载体的图示。ABEmax、VRQR-SpCas9和内含肽(intein,Int)由心肌肌钙蛋白T启动子驱动。sgRNA表达盒由U6RNA聚合酶III启动子驱动。AAV血清型6用于分化的iPSC来源的心肌细胞。(图11B)示出了通过AAV6将ABE递送至分化的iPSC来源的心肌细胞中的实验设计的示意图。(图11C)正常(WT;SEQ ID NO:27)、未校正的(R634Q/R634Q;SEQ ID NO:28)和经ABE校正的纯合(经校正的;SEQ ID NO:27)iPSC来源的心肌细胞中RBM20R634Q突变(带下划线)的基因组区域的代表性Sanger序列。(图11D)正常(WT)、R634Q/R634Q和经ABE校正的R634Q/R634Q iPSC来源的心肌细胞的免疫细胞化学。α-辅肌动蛋白、RBM20和DAPI。比例尺,20μm。
图12A至12C.产生携带Rbm20R636Q突变的敲入小鼠模型。(图12A)靶向Rbm20基因的外显子9的sgRNA的序列。PAM被突出显示。所示的核酸是SEQ ID NO:29。(图12B)示出了Rbm20R636Q突变的基因组区域周围的核苷酸和氨基酸序列的图示。敲入Rbm20R636Q突变替代了所示的核苷酸。所示的核苷酸序列是SEQ ID NO:30。所示的氨基酸序列是SEQ ID NO:31。(图12C)野生型(WT;SEQ ID NO:32)、杂合(R636Q/+;SEQ ID NO:33)和纯合(R636Q/R636Q;SEQ ID NO:34)小鼠中Rbm20R636Q突变的基因组区域的Sanger序列。
图13A至13B.用于在纯合R636Q/R636Q小鼠中进行腺嘌呤碱基编辑的策略。(图13A)描绘了使用sgRNA和ABEmax-VRQR-SpCas9对R636Q突变(测序核酸为SEQ ID NO:30;氨基酸序列为SEQ ID NO:31)进行腺嘌呤碱基编辑(ABE)校正的图示。靶上位点位于A6处。旁观者突变位于A14和A20处。沉默突变位于A4、A13和A19处。示出了PAM。经校正的核酸序列是SEQ ID NO:35。经校正的氨基酸序列是SEQ ID NO:36。(图13B)用于全身递送AAV9介导的ABE校正的策略。R636Q/R636Q小鼠在出生之后第5天时经腹膜内注射2.5×1014vg/kg的总AAV9组分。
图14A至14C.通过AAV9介导的腺嘌呤碱基编辑体内校正Rbm20R636Q突变。来自在AAV9介导的ABE校正之后的第6周时的经ABE校正的R636Q/R636Q(经校正的)小鼠的完整心脏的(图14A)DNA和(图14B)cDNA中的腺嘌呤(A)至鸟嘌呤(G)编辑的百分比。数据表示为平均值±SEM(n=4)。进行了未配对学生t检验。p值****P<0.0001。(图14C)示出了WT(SEQ IDNO:37)、R636Q/R636Q(SEQ ID NO:38)和经ABE校正的R636Q/R636Q(SEQ ID NO:39)小鼠中cDNA的Rbm20R636Q突变区域的Sanger测序。
图15.ABE组分的全身递送挽救了纯合R636Q/R636Q小鼠的心脏功能。在AAV9介导的ABE校正之后的第8周时野生型(WT)、纯合(R636Q/R636Q)和经ABE校正的R636Q/R636Q(经校正的)小鼠的M模式超声心动图示踪。
图16A至16B.纯合R636Q/R636Q小鼠心脏的组织学分析。在AAV9施用之后的第12周时正常(WT)、R636Q/R636Q和经ABE校正的R636Q/R636Q(经校正的)小鼠的左心室的(图16A)H&E染色和(图16B)Masson三色染色。比例尺,50μm。
图17A至17B.腺嘌呤碱基编辑部分恢复了肌联蛋白(Ttn)基因的选择性剪接。通过qRT-PCR定量的在AAV9介导的ABE校正之后的第6周时,WT、R636Q/R636Q和经ABE校正的R636Q/R636Q小鼠中的肌联蛋白(Ttn)基因的N2B同种型和(图17B)N2BA同种型的相对表达。数据表示为平均值±SEM(n=4)。进行了单因素ANOVA。P值***P<0.001和****P<0.0001。
图18A至18C.腺嘌呤碱基编辑恢复了心脏中的转录表达。(图18A)示出了AAV9介导的ABE校正之后的第6周时,WT、R636Q/R636Q和经ABE校正的R636/R636Q小鼠中差异调节基因的表达的热图(n=4)。(图18B和18C)与WT小鼠相比,R636Q/R636Q小鼠中与上调和下调基因相关的基因本体术语。
图19A至19D.iPSC中RBM20R636S突变的先导编辑。(图19A)用于校正RBM20R636S突变(所示序列是SEQ ID NO:40)的先导编辑(PE)策略的图示。先导编辑指导RNA(primeediting guide RNA,pegRNA)包含间隔区(SEQ ID NO:5)、引物结合位点((primer bindingsite,PBS),11nt长度;SEQ ID NO:6)和逆转录酶模板((transcriptase template,RT),17nt长度;SEQ ID NO:7)。RBM20R636S突变和预期编辑的核苷酸以红色着色。用于破坏PAM的沉默突变以蓝色着色。pegRNA的切口位点用绿色箭头指示。sgRNA的第二个切口位点用箭头指示。(图19B)正常(WT;SEQ ID NO:41)、未校正(R636S/R636S;SEQ ID NO:42)和经PE校正的(SEQ ID NO:43)iPSC系中的RBM20R636S突变(带下划线)的基因组区域的Sanger序列。(图19C)在PE3b校正和PE3bmax与经改造的pegRNA(engineered pegRNA,epegRNA)偶联校正之后,R636S/R636S iPSC中的腺嘌呤(A)至胞嘧啶(C)编辑的百分比。数据表示为平均值±SEM(n=3)。进行了未配对学生t检验。p值***P<0.001。(图19D)正常(WT)、R636S/R636S和经PE校正的R636S/R636S iPSC来源的心肌细胞的免疫细胞化学。α-辅肌动蛋白、RBM20和DAPI。比例尺,10μm。
图20描绘了示出根据本公开内容的多个方面的创建在患者来源的诱导多能干细胞(induced pluripotent stem cell,iPSC)中含有RBM20R634Q突变的人细胞系模型的代表性示意图。所示的人核苷酸序列是SEQ ID NO:44。所示的氨基酸序列是SEQ ID NO:45。WT序列是SEQ ID NO:15。R634Q序列是SEQ ID NO:17。
图21A和21B描绘了示出根据本公开内容的多个方面的与野生型细胞(图21A)相比,分化成心肌细胞(iPSC-CM)(图21B)的含有RBM20R634Q突变的患者来源的诱导多能干细胞(iPSC)的免疫荧光染色的代表性图像。
图22描绘了示出根据本公开内容的多个方面的用于校正人细胞中的RBM20基因的R634Q突变的示例性CRISPR/CAS9系统的代表性示意图。所示的人核苷酸序列是SEQ ID NO:44。所示的氨基酸序列是SEQ ID NO:45。WT序列是SEQ ID NO:46。R634Q序列是SEQ ID NO:47。
图23描绘了示出根据本公开内容的多个方面的通过靶向小鼠序列中的相应区域(R636Q)而产生以模拟RBM20基因的人R634Q突变的经遗传修饰小鼠系的代表性示意图。所示的人核苷酸序列是SEQ ID NO:48。所示的氨基酸序列是SEQ ID NO:49。色谱图中的序列是SEQ ID NO:50。
具体实施方式
RNA结合基序蛋白20(RBM20)中的突变是人扩张型心肌病(DCM)的常见原因。本文中提供了用于校正RBM20的致病性R634Q突变的CRISPR-Cas9腺嘌呤碱基编辑(ABE)系统。将该系统用于人诱导多能干细胞来源的心肌细胞以恢复心肌细胞功能性。
本公开内容至少部分地基于这样的发现:将指导RNA(gRNA)与成簇规律间隔短回文重复(CRISPR)-CRISPR相关蛋白9(Cas9)系统一起使用,通过碱基对编辑校正遗传突变,成功逆转了与家族性心肌病(例如DCM)相关的表型。因此,本文中提供了包含被设计用于CRISPR/CAS9系统的单指导RNA(sgRNA)的组合物以及使用其用于预防、改善或治疗一种或更多种心肌病的方法。
在一个示例性方法中,CRISPR/CAS9用于校正人细胞中的RBM20突变。简而言之,分离患者来源的诱导多能干细胞(iPSC),并将其用于产生用于这些示例性研究的含有RBM20(R634Q)突变(Mut)的iPSC。RBM20是编码调节肌联蛋白选择性剪接的RNA结合蛋白的基因。由RBM20编码的蛋白质的富含RS的结构域中的错义突变是约6%的诊断出患有DCM的患者中家族性扩张型心肌病(DCM)的根本原因。如图20中所示,对应于“CGG”(编码野生型氨基酸残基第634位的“R”)的核苷酸突变为“CAG”,其编码模拟人序列第634位的氨基酸残基的RBM20突变至“Q”(R634Q)的突变。接下来,将含有RBM20R634Q突变的患者来源的诱导多能干细胞(iPSC)分化成心肌细胞(iPSC-CM)(图21A至21B)。对野生型iPSC-CM和突变(R634Q)细胞的所得心肌细胞进行肌动蛋白和肌节蛋白标志物染色。图21A至21B示出了R634Q iPSC-CM中的肌节破坏。
图22示出了具有原间隔区相邻基序(PAM)的gRNA。在对编码具有原间隔区相邻基序(PAM)的gRNA的质粒和编码ABEmax-SpCas9-NG的质粒进行核转染之后,评估了突变体腺嘌呤核苷酸回复到野生型鸟嘌呤核苷酸的稳健编辑的编辑效率,并表明CRISPR/Cas9系统以高效率校正了R634Q突变。接下来,分离含有R634Q突变的患者来源的诱导多能干细胞(iPSC)(Mut)或使用上述CRISPR/CAS9方法校正的iPSC(Cor),并使其分化成心肌细胞(iPSC-CM)。如实施例2中所述,评估了Mut iPSC-CM和Cor iPSC-CM的力产生分析和对细胞表型的作用。
另外,产生了带有相应RBM20突变的人源化小鼠模型,其表现出严重的心脏功能障碍和猝死,再现了人DCM表型。特别地,产生了经遗传修饰的小鼠系来模拟人RBM20R634Q突变(图23)。具体地,该小鼠系在RBM20基因内在R636Q处包含与人RBM20R634Q突变相对应的相同人致病突变。监测在一个等位基因上携带错义突变的小鼠和在两个等位基因上携带错义突变的小鼠的心脏表型和心脏纤维化以与野生型小鼠比较。为了校正人RBM20R634Q突变的小鼠模型中的RBM20R636Q突变,设计了用于在小鼠系中进行基于腺相关病毒(AAV)的校正的sgRNA。使用AAV递送和/或A碱基编辑器确定小鼠中的靶上和脱靶编辑效率。在通过AAV将sgRNA施用到人RBM20R634Q突变的小鼠模型中之后,评估了心脏功能并与施用sgRNA之前的心脏功能进行比较以测量小鼠中的表型挽救(图15)。在腺相关病毒递送下,全身递送ABE组分体内挽救了RBM20心肌病。
此外,提供了先导编辑(PE)系统来校正不能被ABE校正的另一些报道的RBM20突变。这些发现为永久校正RBM20突变和DCM潜在的其他遗传突变提供了有前景的治疗策略。
尽管目前的医学取得了进展,但家族性心肌病的有效治疗仍然具有挑战性。精确的基因编辑技术(例如BE和PE)为校正心血管疾病中的致病突变提供了创新机会。然而,大尺寸的BE和PE系统对通过AAV有效递送这些基因编辑组分提出了挑战。其他递送方法(例如纳米粒)可解决这样的瓶颈。然而,本发明研究提供了精确且永久地校正RBM20的致病遗传突变的概念验证策略,并且代表了CRISPR-Cas9基因编辑在DCM的治疗性转化方面的进展。
I.扩张型心肌病
扩张型心肌病(DCM)的特征为左心室扩张和收缩功能障碍,约每2500人中有一人受其影响。这种病症在遗传上是高度异质性的,有40种不同基因(包括许多编码肌节蛋白和其他结构蛋白)的突变。在一些情况下,该病症是由位于人第10号染色体上的基因(参见GenBank登录号NM_001134363.3,其通过引用并入本文)RNA结合基序蛋白20(RBM20)中的突变引起的,该基因编码蛋白质RBM20(GenBank登录号NP_001127835.2),蛋白质RBM20的序列复制如下:
鼠Rbm20蛋白由GenBank登录号NM_001170847.1(其通过引用并入本文)编码,并具有以下氨基酸序列(GenBank登录号NP_001164318.1):
扩张型心肌病(DCM)是心力衰竭最常见的原因之一,是一种特征为心脏功能受损以及高发病率和死亡率的日益大规模流行的病症。扩张型心肌病通过以下确定:存在左心室(left ventricular,LV)扩大和收缩功能障碍以及间质纤维化积累。扩张型心肌病患者也处于心室性心律失常和猝死的高风险中。随着心力衰竭的进展,一些治疗方案(包括循证多药物治疗和心脏再同步治疗)可能变得不起作用,使得心脏移植成为仅极少数人可用的最后手段。心力衰竭初次诊断之后五年死亡率仍为约50%。多于50个基因的遗传变异被认为是扩张型心肌病的病因。约25%至35%的受影响个体患有该疾病的家族形式,其中大多数突变影响编码细胞骨架蛋白的基因,而一些突变影响参与收缩的另一些蛋白。
扩张型心肌病是一种异质性疾病。特别地,已知存在扩张型心肌病的缺血性形式以及非缺血性形式,其变体是与动脉粥样硬化相关的非缺血性心肌病。在缺血性扩张型心肌病中,认为冠状动脉疾病是根本原因。在非缺血性扩张型心肌病中,认为冠状动脉疾病不是心肌病的主要根本原因,而是遗传、代谢和炎症状态。瓣膜疾病肥大或动脉肥大之后的病理状态也可部分地导致非缺血性扩张型心肌病。与动脉粥样硬化相关的非缺血性心肌病特别难以诊断,因为动脉粥样硬化并不是所观察到的心肌病的根本原因。
使用超声心动图可以容易地诊断扩张型心肌病。然而,超声心动图没有给出心肌病根本原因的信息。这在当考虑两种或更多种原因(例如在糖尿病中)时的情况下尤其如此。此外,目前的方法大多是侵入性方法,不能描述导致疾病进展的机制。
II.CRISPR系统
本公开内容提供了用于预防、改善或治疗一种或更多种心肌病的组合物。在一些实施方案中,本文中的组合物可包含指导RNA(gRNA)。在一些实施方案中,本文中的组合物可包含成簇规律间隔短回文重复(CRISPR)/CRISPR相关蛋白9(Cas9)系统。在一些实施方案中,本文中的组合物可包含用于递送本文中公开的gRNA和/或CRISPR/Cas 9系统的AAV载体、AAV病毒颗粒,或其组合。在一些实施方案中,本文中的组合物可被配制以形成一种或更多种药物组合物。
基因编辑是一种允许在活细胞内修饰靶基因的技术。最近,利用CRISPR的细菌免疫系统根据需求进行基因编辑,彻底改变了科学家进行基因组编辑的方式。CRISPR系统的Cas9蛋白是一种RNA指导的DNA核酸内切酶,可通过改变其指导RNA序列而相对容易地被改造为靶向新的位点。该发现使得序列特异性基因编辑在功能上有效。
一般而言,“CRISPR系统”总体上是指涉及CRISPR相关(“Cas”)基因的表达或对其活性进行指导的转录物和其他元件,包括编码Cas基因的序列、tracr(反式激活CRISPR)序列(例如,tracrRNA或活性部分tracrRNA)、tracr伴侣(tracr-mate)序列(包括“同向重复(direct repeat)”,以及在内源性CRISPR系统背景下经tracrRNA加工的部分同向重复)、指导序列(在内源性CRISPR系统的背景下也称为“间隔区”)和/或来自CRISPR基因座的其他序列和转录物。
CRISPR/CAS9系统可以是原核生物中天然存在的防御机制,已被重新用作用于基因编辑的RNA指导的DNA靶向平台。CRISPR/CAS9系统依赖于DNA核酸酶Cas9和两种非编码RNA:crisprRNA(crRNA)和反式激活RNA(tracrRNA)(即gRNA)来靶向DNA的切割。CRISPR是成簇规律间隔短回文重复的缩写,是在细菌和古细菌基因组中发现的DNA序列家族,其包含与先前暴露于细胞(例如通过感染或攻击原核生物的病毒)的外来DNA相似的DNA片段(间隔区DNA)。原核生物利用这些DNA片段检测并破坏重新引入的相似外来DNA,所述外来DNA例如在后续攻击期间来自相似病毒的DNA。CRISPR基因座的转录导致形成包含间隔区序列的RNA分子,其与能够识别和切割外来的外源DNA的Cas(CRISPR相关)蛋白结合并靶向其。已经描述了许多类型和类别的CRISPR/Cas系统(参见,例如,Koonin et al.,(2017)Curr OpinMicrobiol37:67-78)。
crRNA通常通过与靶DNA中的20个核苷酸(nucleotide,nt)序列进行沃森-克里克(Watson-Crick)碱基配对来驱动CRISPR/CAS9复合物的序列识别和特异性。改变crRNA中5’20nt的序列允许将CRISPR/CAS9复合物靶向特定位点。如果靶序列之后是被称为原间隔区相邻基序(PAM)的特定短DNA基序(具有序列NGG),则CRISPR/CAS9复合物仅结合含有与crRNA的前20nt匹配的序列的DNA序列。TracrRNA与crRNA的3’末端杂交以形成RNA双链体结构,该结构被Cas9核酸内切酶结合以形成具有催化活性的CRISPR/CAS9复合物,该复合物然后可以切割靶DNA。一旦CRISPR/CAS9复合物在靶位点与DNA结合,CAS9酶内的两个独立的核酸酶结构域各自切割PAM位点上游的DNA链之一,产生双链断裂(double-strand break,DSB),在此DNA的两条链均以碱基对终止(平末端)。在CRISPR/CAS9复合物在特定靶位点与DNA结合并形成位点特异性DSB之后,下一个关键的步骤是修复DSB。细胞使用两种主要的DNA修复途径来修复DSB:非同源末端连接(non-homologous end joining,NHEJ)和同源定向修复(homology-directed repair,HDR)。
NHEJ是在大多数细胞类型(包括非分裂细胞)中表现出高度活性的稳健修复机制。NHEJ是易错的,并且通常可导致在DSB位点处去除或添加1至数百个核苷酸,尽管这样的修饰通常<20nt。由此产生的插入和缺失(缺失)可破坏基因的编码或非编码区。或者,HDR使用内源性或外源性提供的长区段的同源供体DNA来以高保真度修复DSB。HDR仅在分裂细胞中活跃,并且在大多数细胞类型中以相对较低的频率发生。在本公开内容的许多实施方案中,NHEJ被用作修复操作物。
CRISPR/Cas核酸酶或CRISPR/Cas核酸酶系统可包含非编码RNA分子(指导)RNA,其与DNA序列特异性地结合;以及Cas蛋白(例如,Cas9),其具有核酸酶功能性(例如,两个核酸酶结构域)。CRISPR系统的一个或更多个元件可来源于I型、II型或III型CRISPR系统,例如来源于包含内源性CRISPR系统的特定生物体,例如酿脓链球菌。
在一些实施方案中,Cas9(CRISPR相关蛋白9)核酸内切酶可用于本文中的CRISPR方法中,用于预防、改善或治疗本文中所述的一种或更多种心肌病。本文中使用的“Cas9分子”是指可与gRNA分子相互作用并与gRNA分子协同定位(例如,靶向或对准(home))至包含靶序列和PAM序列的位点的分子。已知Cas9蛋白存在于许多CRISPR系统中,包括但不限于:海沼甲烷球菌(Methanococcus maripaludis)、白喉棒杆菌(Corynebacteriumdiphtheriae)、有效棒杆菌(Corynebacterium efficiens)、谷氨酸棒杆菌(Corynebacterium glutamicum)、克氏棒杆菌(Corynebacterium kroppenstedtii)、脓肿分枝杆菌(Mycobacterium abscessus)、皮疽诺卡菌(Nocardia farcinica)、红串红球菌(Rhodococcus erythropolis)、约氏红球菌(Rhodococcus jostii)、浑浊红球菌(Rhodococcus opacus)、解纤维热酸菌(Acidothermus cellulolyticus)、氯酚节杆菌(Arthrobacter chlorophenolicus)、苍黄色克里布所菌(Kribbella flavida)、弯曲高温单孢菌(Thermomonospora curvata)、齿双歧杆菌(Bifidobacterium dentium)、长双歧杆菌(Bifidobacterium longum)、还原天芥末碱斯奈克氏菌(Slackiaheliotrinireducens)、Persephonella marina、脆弱拟杆菌(Bacteroides fragilis)、黄褐二氧化碳嗜纤维菌(Capnocytophaga ochracea)、嗜冷黄杆菌(Flavobacteriumpsychrophilum)、嗜黏蛋白阿克曼氏菌(Akkermansia muciniphila)、光合玫瑰菌(Roseiflexus castenholzii)、玫瑰弯菌属(Roseiflexus)、集胞藻属(Synechocystis)、Elusimicrobium minutum、产琥珀酸丝状杆菌(Fibrobacter succinogenes)、蜡样芽胞杆菌(Bacillus cereus)、无害李斯特氏菌(Listeria innocua)、干酪乳杆菌(Lactobacilluscasei)、鼠李糖乳杆菌(Lactobacillus rhamnosus)、唾液乳杆菌(Lactobacillussalivarius)、无乳链球菌(Streptococcus agalactiae)、似马停乳链球菌(Streptococcusdysgalactiae equisimilis)、马链球菌兽瘟亚种(Streptococcus equi zooepidemicus)、解没食子酸链球菌(Streptococcus gallolyticus)、戈氏链球菌(Streptococcusgordonii)、变形异链球菌(Streptococcus mutans)、酿脓链球菌、酿脓链球菌M1GAS、酿脓链球菌MGAS5005、酿脓链球菌MGAS2096、酿脓链球菌MGAS9429、酿脓链球菌MGAS10270、酿脓链球菌MGAS6180、酿脓链球菌MGAS315、酿脓链球菌SSI-1、酿脓链球菌MGAS10750、酿脓链球菌NZ131、嗜热链球菌(Streptococcus thermophiles)CNRZ1066、嗜热链球菌LMD-9、嗜热链球菌LMG 18311、肉毒梭菌(Clostridium botulinum)A3Loch Maree、肉毒梭菌B Eklund17B、肉毒梭菌Ba4 657、肉毒梭菌F Langeland、解纤维梭菌(Clostridiumcellulolyticum)H10、大芬戈尔德菌(Finegoldia magna)ATCC 29328、直肠真杆菌(Eubacterium rectale)ATCC 33656、鸡败血支原体(Mycoplasma gallisepticum)、运动支原体(Mycoplasma mobile)163K、穿透支原体(Mycoplasma penetrans)、滑液囊支原体(Mycoplasma synoviae)53、念珠状链杆菌(Streptobacillus moniliformis)DSM 12112、慢生根瘤菌(Bradyrhizobium)BTAi1、汉氏硝化杆菌(Nitrobacter hamburgensis)X14、沼泽红假单胞菌(Rhodopseudomonas palustris)BisB18、沼泽红假单胞菌BisB5、食清洁剂细小棒菌(Parvibaculum lavamentivorans)DS-1、恒雄芝氏沟鞭藻玫瑰杆菌(Dinoroseobacter shibae)DFL 12、重氮营养葡糖酸醋杆菌(Gluconacetobacterdiazotrophicus)Pal 5FAPERJ、重氮营养葡糖酸醋杆菌Pal 5JGI、固氮螺菌(Azospirillum)B510uid46085、深红红螺菌(Rhodospirillum rubrum)ATCC 11170、Diaphorobacter TPSY uid29975、艾森氏蠕形杆菌(Verminephrobacter eiseniae)EF01-2、脑膜炎奈瑟菌(Neisseria meningitides)053442、脑膜炎奈瑟菌α14、脑膜炎奈瑟菌Z2491、需盐脱硫弧菌(Desulfovibrio salexigens)DSM 2638、德莱空肠弯曲杆菌(Campylobacter jejuni doylei)269 97、空肠弯曲杆菌81116、空肠弯曲杆菌、红嘴鸥弯曲杆菌(Campylobacter lari)RM2100、肝螺杆菌(Helicobacter hepaticus)、产琥珀酸沃廉菌(Wolinella succinogenes)、奥湖甲苯单胞菌(Tolumonas auensis)DSM 9187、大西洋假交替单胞菌(Pseudoalteromonas atlantica)T6c、乌贼希瓦氏菌(Shewanella pealeana)ATCC 700345、巴黎嗜肺军团菌(Legionella pneumophila Paris)、产琥珀酸放线杆菌(Actinobacillus succinogenes)130Z、多杀巴斯德菌(Pasteurella multocida)、土拉热弗朗西丝菌新凶手菌(Francisella tularensis novicida)U112、土拉热弗朗西丝菌全北美区菌(Francisella tularensis holarctica)、土拉热弗朗西丝菌FSC 198、土拉热弗朗西丝菌、土拉热弗朗西丝菌WY96-3418和齿垢密螺旋体(Treponema denticola)ATCC 35405等。
在一些实施方案中,本文中的Cas9酶可来自链球菌、葡萄球菌,或其变体。应当理解,可使用野生型Cas9或者可使用Cas9的经修饰形式(例如,Cas9的进化形式,或Cas9直系同源物或变体),如本文中提供的。在一些方面中,本文中的Cas9酶可以是酿脓链球菌Cas9(Streptococcus pyogenes Cas9,SpCas9)变体。在一些方面中,本文中的Cas9酶可以是与NGG PAM相容的酿脓链球菌Cas9(SpCas9)变体。规范的PAM是序列5’-NGG-3’,其中“N”是其后跟着两个鸟嘌呤(“G”)核碱基的任何核碱基。在一些方面中,本文中的Cas9酶可以是与非NGG PAM相容的酿脓链球菌Cas9(SpCas9)变体。在一些方面中,本文中的Cas9酶可以是与非NGG PAM相容的酿脓链球菌Cas9(SpCas9)变体。在一些方面中,本文中的Cas9酶可以是腺嘌呤碱基编辑器(ABE)的变体ABEmax,其使用与非NGG PAM相容的酿脓链球菌Cas9(SpCas9)变体。在一些实例中,本文中的Cas9酶可以是ABEmax-SpCas9-NG。
在一些实施方案中,活性Cas9分子与靶核酸相互作用并切割靶核酸的能力是PAM序列依赖性的。PAM序列是靶核酸中的序列。在一些实施方案中,本文中的PAM可具有与TGA、CGG或TGG的核苷酸序列具有至少85%(例如,约85%、90%、95%、99%、100%)序列同一性的多核苷酸序列。在一些实施方案中,本文中的PAM可具有TGA、CGG或TGG的核苷酸序列。在一些实施方案中,靶核酸的切割发生在PAM序列的上游。来自不同细菌物种的活性Cas9分子可识别不同的序列基序(例如PAM序列)。在一些实施方案中,酿脓链球菌(S.pyogenes)的活性Cas9分子可识别序列基序“NGG”并指导来自该序列上游1至10个,例如3至5个碱基对的靶核酸序列的切割。在一些实施方案中,酿脓链球菌的活性Cas9分子可识别非NGG序列基序并指导来自该序列上游1至10个,例如3至5个碱基对的靶核酸序列的切割。
在一些实施方案中,本文中的经改造CRISPR基因编辑系统(例如,用于哺乳动物细胞中的基因编辑)可包含:(1)如本文中公开的指导RNA分子(gRNA),其包含靶向结构域(其能够与基因组DNA靶序列杂交),和能够与Cas(例如,Cas9)酶结合的序列;以及(2)Cas(例如,Cas9)蛋白。该第二结构域可包含称为tracr结构域的结构域。所述靶向结构域和能够与Cas(例如Cas9)酶结合的序列可被布置在相同的(有时称为单gRNA、嵌合gRNA或sgRNA)或不同的分子(有时称为双gRNA或dgRNA)上。如果布置在不同的分子上,则各自包含允许分子缔合(例如通过杂交)的杂交结构域。
在某些实施方案中,为了在靶序列中产生双链断裂,本文中的CRISPR/Cas9系统可与由指导核酸(gRNA)确定的靶序列结合,并且核酸酶识别与靶序列相邻的原间隔区相邻基序(PAM)序列,以切割靶序列。在一些实施方案中,本文中的CRISPR/cas9系统可包含与核酸指导的核酸酶相容的支架序列。在另一些实施方案中,指导序列可被改造成与任何期望的靶序列互补以用于靶序列的有效编辑。在另一些实施方案中,指导序列可被改造成与任何期望的靶序列杂交。在一些实施方案中,靶核酸序列的长度为20个核苷酸。在一些实施方案中,靶核酸的长度为小于20个核苷酸。在一些实施方案中,靶核酸的长度为大于20个核苷酸。在一些实施方案中,靶核酸的长度为至少:5、10、15、16、17、18、19、20、21、22、23、24、25、30或更多个核苷酸。在一些实施方案中,靶核酸的长度为至多:5、10、15、16、17、18、19、20、21、22、23、24、25、30或更多个核苷酸。
在一些实施方案中,本文中的CRISPR/cas9系统的靶序列可以是原核或真核细胞内源或外源的任何多核苷酸,或者在体外系统中用于验证或其他目的。在另一些实施方案中,靶序列可以是驻留在真核细胞的核中的多核苷酸。靶序列可以是编码基因产物(例如蛋白质)的序列或非编码序列(例如调节性多核苷酸或无用DNA(junk DNA))。本文中预期了靶序列应与PAM(即由本文中的CRISPR/cas9系统识别的短序列)缔合。在一些实施方案中,PAM的序列和长度要求根据所选择的核酸指导的核酸酶而不同。在某些实施方案中,PAM序列可以是与靶序列相邻的约2至5个碱基对序列或者更长,这取决于所期望的PAM。PAM序列的一些实例在下面的实施例部分中给出,并且技术人员将能够确定与给定的核酸指导的核酸酶一起使用的另一些PAM序列,因为这些PAM序列并不旨在限制本发明构思的这个方面。此外,对PAM相互作用(PI)结构域的改造可允许PAM特异性的编程,提高靶位点识别保真度,并提高核酸指导的核酸酶基因组改造平台的多功能性。
CRISPR系统可在靶位点处诱导双链断裂(double stranded break,DSB),随后如本文中所述进行破坏。在另一些实施方案中,被认为是“切口酶”的Cas9变体用于在靶位点处使单链产生切口。可使用成对的切口酶,例如以提高特异性,每种酶均由不同的gRNA靶向序列对来指导,以使得在同时引入切口时,引入5’突出端。在另一些实施方案中,将无催化活性的Cas9与异源效应物结构域例如碱基编辑酶或逆转录酶融合。
碱基编辑和先导编辑的经改造CRISPR技术扩展了基因编辑策略的工具箱,通过实现单个核苷酸的精确编辑来潜在地校正遗传突变(Chemelloet al.,2020)。在碱基编辑中,Cas9切口酶(Cas9nickase,nCas9)或失活的Cas9(deactivated Cas9,dCas9)与脱氨酶蛋白融合,允许在没有DSB的情况下,在与sgRNA的原间隔区相邻基序(PAM)位点相关的定义编辑窗内进行精确的单碱基对转换(Rees et al.,2018)。有两大类DNA碱基编辑器:胞嘧啶碱基编辑器(cytosine base editor,CBE),其将C:G碱基对转换为T:A碱基对;和腺嘌呤碱基编辑器(ABE),其将A:T碱基对转换为G:C碱基对。因此,碱基编辑器允许在DNA中有效设置(installation)单碱基替换。例如,腺苷脱氨酶在单链DNA中诱导腺苷(A)至肌苷(I)的编辑,进而导致在DNA修复或复制之后的A至G的转换。腺嘌呤碱基编辑器(ABE)是与经改造腺苷脱氨酶连接的可编程DNA结合域(例如,催化受损的RNA指导的CRISPR/Cas核酸酶)的融合体。在其中可编程DNA结合结构域是CRISPR/Cas核酸酶的情况下,靶向腺嘌呤位于由CRISPR-Cas RNA-蛋白质复合物诱导的单链(single-stranded,ss)DNA泡(R-环)中的“编辑窗”内。最常用的ABE包含腺苷脱氨酶异二聚体以及切口酶Cas9和核定位序列(nuclearlocalization sequence,NLS),所述腺苷脱氨酶异二聚体由与经改造大肠杆菌(E.coli)TadA变体(例如ABEmax)或单一经改造大肠杆菌TadA变体(例如ABE8e、ABE8eV106W或ABE8.20-m)融合的大肠杆菌TadA(野生型)组成。ABE已成功用于在多种细胞类型和生物体中设置A至G替换,并且可潜在地逆转大量已知与人疾病相关的突变。ABE的一些实例包括在美国专利公开US20200308571、PCT公开WO2020214842和PCT公开WO2021025750中描述的那些,其各自均通过引用整体并入本文。参考了于2018年8月2日公开的国际公开No.WO 2018/027078;于2019年4月25日公开的国际公开No.WO 2019/079347;于2019年11月28日公开的国际公开No.WO2019/226593;于2018年3月15日公开的美国专利公开No.2018/0073012,其于2018年10月30日授权为美国专利No.10,113,163;以及于2017年5月4日公开的美国专利公开No.2017/0121693,其于2019年1月1日授权为美国专利No.10,167,457。
先导编辑是一种多功能且精确的基因组编辑方法,其使用与聚合酶联合起作用的CRISPR系统(即,以融合蛋白的形式或以其他方式与CRISPR系统反式提供)将新的遗传信息直接写入特定的DNA位点中,其中先导编辑系统使用先导编辑(pe)指导RNA(“pegRNA”)进行编程,该先导编辑(pe)指导RNA(“pegRNA”)既指定靶位点,又通过改造到指导RNA(例如,在指导RNA的5’或3’末端,或在内部部分)上的延伸(DNA或RNA)的方式以替代DNA链的形式模板化期望编辑的合成。先导编辑系统由先导编辑指导RNA(pegRNA)和与经改造逆转录酶融合的nCas9构成。pegRNA由(从5’到3’)退火至靶位点的sgRNA、针对nCas9的支架、包含期望的编辑的逆转录模板(RT模板)以及与非靶标链结合的引物结合位点(PBS)组成。RT模板可被编程以引入任何类型的编辑,包括所有可能的碱基转换和颠换,以及任何长度的核苷酸的插入和缺失。因此,先导编辑器允许在pegRNA(或“延伸指导RNA”)存在的情况下对靶核苷酸序列进行先导编辑。术语“先导编辑器”是指包含Cas9切口酶和逆转录酶的融合构建体。先导编辑系统通过包含另外的切口sgRNA被进一步增强,所述另外的切口sgRNA通过促进DNA修复以替代非编辑链来提高编辑效率。因此,术语“先导编辑器”可以是指融合蛋白或与pegRNA复合的融合蛋白,和/或进一步与第二链切口sgRNA复合的融合蛋白。在一些实施方案中,先导编辑器还可以是指包含融合蛋白(与Cas9融合的逆转录酶)、pegRNA和能够指导非编辑链的第二位点切口步骤的常规指导RNA的复合物,如本文中所述。在另一些实施方案中,“先导编辑器”的逆转录酶组分可反式提供。先导编辑器及其使用的另一些实例提供于PCT公开WO2020191249中,其通过引用整体并入本文。
在一些方面中,将Cas核酸酶和sgRNA(包括对靶序列具有特异性的crRNA与固定的tracrRNA的融合体)引入到细胞中。一般而言,使用互补碱基配对,gRNA的5’末端处的靶位点将Cas核酸酶靶向至靶位点,例如基因。靶位点的长度可以是21、20、19、18、17、16、15、14、13、12、11或10个核苷酸。靶位点可基于其紧邻原间隔区相邻基序(PAM)序列(例如通常为NGG、NG、NAG、NNNRRT或NNGG)5’的位置来选择。一般而言,CRISPR系统的特征为促进靶序列位点处CRISPR复合物形成的元件。通常来说,“靶序列”通常是指指导序列被设计为具有互补性的序列,其中靶序列与指导序列之间的杂交促进CRISPR复合物的形成。如果存在足够的互补性以引起杂交并促进CRISPR复合物的形成,则并非必须需要完全互补性。
靶序列可包含任何多核苷酸,例如DNA或RNA多核苷酸。靶序列可位于细胞的核或胞质中,例如在细胞的细胞器内。一般而言,可用于重组为包含靶序列的靶基因座的序列或模板被称为“编辑模板”或“编辑多核苷酸”或“编辑序列”。在一些方面中,外源模板多核苷酸可被称为编辑模板。在一些方面中,重组是同源重组。
通常来说,在内源性CRISPR系统的背景下,CRISPR复合物(包含与靶序列杂交并与一种或更多种Cas蛋白复合的指导序列)的形成导致靶序列中或其附近(例如,距靶序列1、2、3、4、5、6、7、8、9、10、20、50或更多个碱基对内)的一条或两条链的切割。可包含野生型tracr序列的全部或一部分(例如,野生型tracr序列的约或多于约20、26、32、45、48、54、63、67、85或更多个核苷酸)或者由其组成的tracr序列也可形成CRISPR复合物的一部分,例如通过沿tracr序列的至少一部分与可操作地连接至指导序列的tracr伴侣序列的全部或一部分进行杂交。tracr序列与tracr伴侣序列具有足够的互补性以进行杂交并参与CRISPR复合物的形成,例如当进行最佳比对时,沿tracr伴侣序列的长度至少50%、60%、70%、80%、90%、95%或99%的序列互补性。
可将驱动CRISPR系统的一个或更多个元件表达的一个或更多个载体引入到细胞中,以使得CRISPR系统的元件表达指导一个或更多个靶位点处CRISPR复合物的形成。组分也可作为蛋白质和/或RNA递送至细胞。例如,Cas酶、与tracr伴侣序列连接的指导序列以及tracr序列可各自可操作地连接至单独载体上的单独调节元件。gRNA可处于组成型启动子的控制之下。
或者,可将由相同或不同调节元件表达的两个或更多个元件组合在单一载体中,同时一个或更多个另外的载体提供不包含在第一载体中的CRISPR系统的任何组分。载体可包含一个或更多个插入位点,例如限制性核酸内切酶识别序列(也称为“克隆位点”)。在一些实施方案中,一个或更多个插入位点位于一个或更多个载体的一个或更多个序列元件的上游和/或下游。当使用多个不同的指导序列时,可使用单一表达构建体以将CRISPR活性靶向到细胞内的多个不同的相应靶序列。
载体可包含与编码CRISPR酶(例如Cas蛋白)的酶编码序列可操作地连接的调节元件。Cas蛋白的一些非限制性实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csfl、Csf2、Csf3、Csf4,其同源物或其经修饰形式。这些酶是已知的;例如,酿脓链球菌Cas9蛋白的氨基酸序列可见于SwissProt数据库于登录号Q99ZW2下。
CRISPR酶可以是Cas9(例如,来自酿脓链球菌或肺炎链球菌(S.pneumonia)或金黄色葡萄球菌(S.aureus)或耳葡萄球菌(S.auricularis)或路邓葡萄球菌(S.lugdunensis))。CRISPR酶可指导在靶序列的位置处,例如在靶序列内和/或在靶序列的互补序列内的一条或两条链的切割。载体可编码相对于相应的野生型酶突变的CRISPR酶,以使得突变的CRISPR酶缺少切割包含靶序列的靶多核苷酸的一条或两条链的能力。例如,来自酿脓链球菌的Cas9的RuvC I催化结构域中的天冬氨酸至丙氨酸的替换(D10A)将Cas9从切割两条链的核酸酶转换为切口酶(切割单链)。在一些实施方案中,Cas9切口酶可与指导序列(例如两个指导序列)组合使用,所述指导序列分别靶向DNA靶标的有义和反义链。该组合允许两条链产生切口并用于诱导NHEJ或HDR。
在一些实施方案中,Cas9多肽可以是失活的(例如,突变的dCAs9)Cas9多肽,其中失活的Cas9不包含HNH和/或RuvC切口酶活性。已在嗜热链球菌(S.thermophilus)中对HNH和RuvC基序进行了表征(参见,例如,Sapranauskas et al.Nucleic Acids Res.39:9275-9282(2011)),并且技术人员将能够鉴定和突变来自其他生物体的Cas9多肽中的这些基序。例如,突变D10A和H840A使酿脓链球菌Cas9的核酸酶活性完全失活。值得注意的是,其中HNH基序和/或RuvC基序被特异性突变使得切口酶活性降低、失活和/或不存在的Cas9多肽可保留一种或更多种其他已知的Cas9功能,包括DNA、RNA和PAM识别与结合活性,并因此在这些活性方面保持功能,而在一种或两种切口酶活性方面不具有功能。
在一个替代实施方案中,CRIPSR酶是Cas蛋白,优选Cas9(具有Genbank登录号NC_002737.2的核苷酸序列和Genbank登录号NP_269215.1的蛋白质序列)。同样,Cas9蛋白也可被修饰以提高活性。例如,Cas9蛋白可包含D10A氨基酸替换,该切口酶仅切割与crRNA互补并被crRNA识别的DNA链。在一个替代实施方案中,Cas9蛋白可替代地或另外地包含H840A氨基酸替换,该切口酶仅切割不与sRNA相互作用的DNA链。在该实施方案中,Cas9可以与一对(即两个)sgRNA分子(或表达这样的对的构建体)一起使用,并且因此可切割相对DNA链上的靶区域,有可能将特异性提高至100至1500倍。在另一个实施方案中,Cas9蛋白可包含D1135E替换。Cas 9蛋白也可以是VQR或VRQR变体。或者,Cas9蛋白可以是xCas9(酿脓链球菌变体,其可识别广泛范围的PAM序列,包括NG、GAA和GAT)。在另一些替代方案中,Cas9变体是SpCas9-NG(对PAM基序的第三个核苷酸具有宽松的偏好,使得该变体可识别其中PAM基序是NGN而不是NGG的序列)、SaCas9(来自金黄色葡萄球菌,可识别NNGRR(T)PAM序列;参见Ran,F.A.et al.In vivo genome editing using Staphylococcus aureus Cas9.Nature 520,186-191,doi:10.1038/nature14299(2015))、SaCas9-KKH(来自金黄色葡萄球菌的变体,可识别NNNRRT PAM序列)、SauCas9(来自耳葡萄球菌,可识别NNGG PAM序列;Genbank登录号WP_107392933.1)或SlugCas9(来自路邓葡萄球菌M23590,可识别NNGG PAM序列;Genbank登录号WP_002460848.1)。
在一些实施方案中,对编码CRISPR酶的酶编码序列进行密码子优化以在特定细胞,例如真核细胞中表达。真核细胞可以是特定生物体的那些或者来源于特定生物体,所述特定生物体例如哺乳动物,包括但不限于人、小鼠、大鼠、兔、狗或非人灵长类。一般而言,密码子优化是指在维持天然氨基酸序列的同时,通过用目的宿主细胞的基因中更频繁或最频繁使用的密码子替代天然序列的至少一个密码子来修饰核酸序列以在该目的宿主细胞中增强表达的过程。多种物种对特定氨基酸的某些密码子表现出特定的偏好。密码子偏倚(生物体之间密码子使用的差异)通常与信使RNA(messenger RNA,mRNA)的翻译效率相关,而信使RNA(mRNA)的翻译效率又被认为取决于被翻译的密码子的性质和特定转移RNA(transferRNA,tRNA)分子的可用性等。细胞中所选tRNA的优势通常反映了肽合成中最频繁使用的密码子。因此,可基于密码子优化来定制基因以在给定生物体中进行最佳基因表达。
一般而言,指导序列是与靶多核苷酸序列具有足够互补性以与靶序列杂交并且引导CRISPR复合物与靶序列的序列特异性结合的任何多核苷酸序列。在一些实施方案中,当使用合适的比对算法进行最佳比对时,指导序列与其对应靶序列之间的互补性程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更高。
表2的每个指导序列还可包含另外的核苷酸以形成或编码crRNA,例如使用适合于所使用的Cas9的任何已知序列。在一些实施方案中,crRNA包含(5’至3’)至少间隔区序列和第一互补结构域。第一互补结构域与第二互补结构域充分互补,以形成双链体,第二互补结构域在sgRNA的情况下可以是相同分子的一部分,或者在双或模块化gRNA的情况下其可在tracrRNA中。有关crRNA和gRNA结构域(包括第一和第二互补结构域)的详细讨论参见例如US2017/0007679。
一般而言,指导多核苷酸可与相容的核酸指导的核酸酶复合,并且可与靶序列杂交,从而将核酸酶引导至靶序列。能够与指导多核苷酸复合的主题核酸指导的核酸酶可被称为与指导多核苷酸相容的核酸指导的核酸酶。另外,能够与核酸指导的核酸酶复合的指导多核苷酸可被称为与核酸指导的核酸酶相容的指导多核苷酸或指导核酸。
单分子指导RNA(sgRNA)可在5’至3’方向上包含任选的间隔区延伸序列、间隔区序列、最小CRISPR重复序列、单分子指导接头、最小tracrRNA序列、3’tracrRNA序列和/或任选的tracrRNA延伸序列。任选的tracrRNA延伸可包含为指导RNA贡献另外的功能性(例如,稳定性)的元件。单分子指导接头可连接最小CRISPR重复和最小tracrRNA序列以形成发夹结构。任选的tracrRNA延伸可包含一个或更多个发夹。在一些具体实施方案中,本公开内容提供了包含间隔区序列和tracrRNA序列的sgRNA。
认为指导RNA可包含核酸内切酶结合所需的支架序列和结合基因组靶序列所需的间隔区序列。
适合与SaCas9一起使用以在指导序列的3’末端跟随指导序列的一个示例性支架序列是:在5’至3’方向上
在一些实施方案中,与SaCas9一起使用以跟随指导序列的3’末端的示例性支架序列是与SEQ ID NO:54至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的序列,或者与SEQ ID NO:54相差不超过1、2、3、4、5、10、15、20或25个核苷酸的序列。
最佳比对可使用用于比对序列的任何合适的算法来确定,所述算法的一些非限制性实例包括史密斯-沃特曼算法(Smith-Waterman algorithm);内德勒曼-温施算法(Needleman-Wunsch algorithm);基于伯劳斯-惠勒变换(Burrows-Wheeler Transform)的算法(例如,伯劳斯-惠勒比对器(Burrows Wheeler Aligner));Clustal W;Clustal X;BLAT;Novoalign(Novocraft Technologies,ELAND(Illumina,San Diego,Calif.));SOAP(可在soap.genomics.org.cn上获得)以及Maq(可在maq.sourceforge.net上获得)。
CRISPR酶可以是包含一个或更多个异源蛋白质结构域的融合蛋白的一部分。CRISPR酶融合蛋白可包含任何另外的蛋白质序列,以及任选地在任何两个结构域之间的接头序列。可与CRISPR酶融合的蛋白质结构域的一些实例包括但不限于表位标签、报道基因序列和具有一种或更多种以下活性的蛋白质结构域:甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、核酸结合活性、碱基编辑活性或逆转录活性。表位标签的一些非限制性实例包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(influenza hemagglutinin,HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(thioredoxin,Trx)标签。报道基因的一些实例包括但不限于谷胱甘肽-5-转移酶(glutathione-5-transferase,GST)、辣根过氧化物酶(horseradish peroxidase,HRP)、氯霉素乙酰转移酶(chloramphenicol acetyltransferase,CAT)β半乳糖苷酶、β-葡糖醛酸糖苷酶、萤光素酶、绿色荧光蛋白(green fluorescent protein,GFP)、HcRed、DsRed、青色荧光蛋白(cyan fluorescent protein,CFP)、黄色荧光蛋白(yellow fluorescentprotein,YFP)以及自发荧光蛋白,包括蓝色荧光蛋白(blue fluorescent protein,BFP)。CRISPR酶可与编码结合DNA分子或结合其他细胞分子的蛋白质或蛋白质片段的基因序列融合,所述蛋白质或蛋白质片段包括但不限于麦芽糖结合蛋白(maltose binding protein,MBP)、S标签、Lex A DNA结合结构域(DNA binding domain,DBD)融合体、GAL4A DNA结合结构域融合体以及单纯疱疹病毒(herpes simplex virus,HSV)BP16蛋白质融合体。可形成包含CRISPR酶的融合蛋白的一部分的另外结构域描述于US 20110059502中,其通过引用并入本文。
作为RNA指导的蛋白,Cas9需要短RNA以指导DNA靶标的识别。尽管Cas9优先询问含有PAM序列(例如NGG或NG或NNNRRT或NNGG)的DNA序列,但其可在没有前间隔区靶标的情况下在此结合。然而,Cas9-gRNA复合物需要与gRNA紧密匹配以产生双链断裂。细菌中的CRISPR序列在多个RNA中表达,并随后被加工以产生RNA的指导链。因为真核系统缺少处理CRISPR RNA所需的一些蛋白质,所以创建合成构建体gRNA以将用于Cas9靶向的RNA的必需片段组合到用RNA聚合酶III型启动子U6表达的单个RNA中。在RNA Pol III控制下的另一些启动子包括以下的那些:核糖体5S rRNA、tRNA和少数其他小RNA,RNA酶P和RNA酶MRP RNA、7SL RNA(信号识别颗粒的RNA组分)、Vault RNA、Y RNA、SINE(短散在重复元件)、7SK RNA、两种微RNA、数种小核仁RNA和数(几)种调节性反义RNA。合成gRNA的最小长度略超过100bp,并且包含靶向紧邻PAM序列之前的20或21个前间隔区核苷酸的部分。sgRNA的长度也可在5’处相对于其规范长度缩短以满足特定标准,例如去除可抑制III型聚合酶转录活性的胸腺嘧啶区段。gRNA不包含PAM序列。
在一些实施方案中,本文中的指导多核苷酸(例如,gRNA)可包含指导序列。指导序列是与靶多核苷酸序列具有足够互补性以与靶序列杂交并指导复合的核酸指导的核酸酶与靶序列的序列特异性结合的多核苷酸序列。当使用合适的比对算法进行最佳比对时,指导序列与其对应的靶序列之间的互补性程度可以是约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更高。最佳比对可使用用于比对序列的任何合适的算法来确定。在一些实施方案中,本文中的指导序列的长度可以是约或大于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75或更多个核苷酸。在另一些实施方案中,本文中的指导序列的长度可以是小于约75、50、45、40、35、30、25、20个核苷酸。优选地,指导序列为10至30个核苷酸长。在一些方面中,本文中的指导序列的长度可以是15至20个核苷酸。
在一些实施方案中,本文中的指导多核苷酸(例如,gRNA)可包含支架序列。一般而言,“支架序列”可包含具有足够序列以促进可靶向核酸酶复合物(例如,CRISPR/Cas9系统)形成的任何序列,其中可靶向核酸酶复合物包括但不限于核酸指导的核酸酶,并且指导多核苷酸可包含支架序列和指导序列。支架序列内促进可靶向核酸酶复合物形成的足够序列可包括沿支架序列内两个序列区域的长度的一定程度的互补性,所述序列区域例如参与形成二级结构的一个或两个序列区域。在一些方面中,一个或两个序列区域可包含在同一多核苷酸上或者在同一多核苷酸上编码。在一些方面中,一个或两个序列区域可包含在分开的多核苷酸上或者在分开的多核苷酸上编码。最佳比对可通过任何合适的比对算法来确定,并且还可考虑二级结构,例如一个或两个序列区域内的自身互补性。在一些实施方案中,当进行最佳比对时,沿两个序列区域中较短序列区域长度的一个或两个序列区域之间的互补性程度可以是约或大于约25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%或更高。在一些实施方案中,两个序列区域中的至少一者的长度可以是约或大于约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50或更多个核苷酸。
在一些实施方案中,本文中的主题指导多核苷酸的支架序列可包含二级结构。在一些实施方案中,二级结构可包含假结区域(pseudoknot region)。在一些实施方案中,本文中的指导多核苷酸与核酸指导的核酸酶的结合动力学部分地由支架序列内的二级结构决定。在一些实施方案中,本文中的指导多核苷酸与核酸指导的核酸酶的结合动力学部分地由具有支架序列的核酸序列决定。
在某些实施方案中,可将间隔区突变引入质粒以测试何时产生替换gRNA序列或者产生缺失或插入突变体。这些质粒构建体中的每一个都可用于测试基因组编辑的准确性和效率,例如,具有缺失、替换或插入。或者,在一些实施方案中,可通过观察预定时间段内的编辑效率来测试通过本文中公开的组合物和方法产生的gRNA构建体在选定靶标上的最佳基因组编辑时间。根据这些实施方案,可测试通过本文中公开的组合物和方法产生的gRNA构建体的最佳基因组编辑窗,以优化编辑效率和准确性。
用于本文中公开的经改造gRNA的靶多核苷酸的一些实例可包括与信号传导生物化学途径相关的序列/基因或基因区段,例如信号传导生物化学途径相关的基因或多核苷酸。本文中预期的另一些实施方案涉及用于本文中公开的经改造gRNA的靶多核苷酸的一些实例,其可包括与疾病相关基因或多核苷酸相关的那些。
“疾病相关”或“病症相关”基因或多核苷酸可以是指导致与对照相比转录或翻译产物处于异常水平,或者导致与非疾病对照的组织或细胞相比来源于患病组织的细胞的异常形式的任何基因或多核苷酸。其可以是以异常高水平表达的基因;其可以是以异常低水平表达的基因,或者其中该基因含有一个或更多个突变,并且其中该突变基因的表达或改变的表达与健康状况或病症的发生和/或进展直接相关。疾病或病症相关基因可以是指具有突变或遗传变异的基因,所述突变或遗传变异与导致疾病或病症的原因或进展的基因直接相关或连锁不平衡。转录或翻译产物可以是已知的或未知的,并且可处于正常或异常水平。
在一些实施方案中,本文中公开的gRNA可靶向与心肌病相关基因或多核苷酸相关的多核苷酸。在一些方面中,心肌病相关基因或多核苷酸可以是DCM相关基因或多核苷酸。在一些实施方案中,本文中公开的gRNA可靶向与心肌病相关基因(例如但不限于RBM20)相关的多核苷酸。
在一些实施方案中,本文中公开的gRNA可靶向具有一个或更多个突变的与心肌病相关基因或多核苷酸相关的多核苷酸。在一些实施方案中,本文中公开的gRNA可靶向与具有一个或更多个突变的心肌病相关基因相关的多核苷酸,其中所述心肌病相关基因可以是RBM20。在一些另外的实例中,本文中公开的gRNA可靶向与RBM20基因中的R634Q突变或其哺乳动物等同物相关的多核苷酸。
在一些实施方案中,gRNA靶向野生型RBM20基因内的位点。在一些实施例中,gRNA靶向突变体RBM20基因内的位点。在一些实施方案中,gRNA靶向肌养蛋白外显子。在一些实施方案中,gRNA靶向RBM20外显子中的位点,所述外显子以一种或更多种RBM20同种型表达并存在。
在一些实施方案中,本公开内容的gRNA包含与编码序列或对应于RBM20基因的非编码序列内的靶序列互补的序列,并因此与靶序列杂交。
在一些实施方案中,本文中公开的经改造多核苷酸(gRNA)可分裂成包含合成tracrRNA和crRNA的片段。在一些方面中,本文中的gRNA可与SEQ ID NO:1至5中任一个的核苷酸序列具有至少85%序列同一性(例如,约85%、90%、95%、99%、100%)。在一些方面中,本文中的gRNA可具有SEQ ID NO:1至5中任一个的核苷酸序列。
在一些实施方案中,核酸可包含一个或更多个编码gRNA的序列。在一些实施方案中,核酸可包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或21个编码gRNA的序列。在一些实施方案中,所有序列编码相同的gRNA。在一些实施方案中,所有序列编码不同的gRNA。在一些实施方案中,至少2个序列编码相同的gRNA,例如至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或21个序列编码相同的gRNA。
在一些实施方案中,本文中的指导多核苷酸(例如,gRNA)可以是DNA。在一些实施方案中,本文中的指导多核苷酸(例如,gRNA)可以是RNA。在一些实施方案中,本文中的指导多核苷酸(例如,gRNA)可以是RNA和DNA二者。在一些实施方案中,本文中的指导多核苷酸(例如,gRNA)可包含经修饰的或非天然存在的核苷酸。在其中本文中的指导多核苷酸包含RNA的一些实施方案中,RNA指导多核苷酸可由多核苷酸分子(例如如本文中公开的质粒、线性构建体或编辑盒)上的DNA序列编码。
在一些实施方案中,核苷酸基因编辑可在体外或离体进行。在一些实施方案中,细胞在体外或离体与核苷酸编辑Cas9和靶向肌养蛋白位点的gRNA接触。在一些实施方案中,细胞与编码Cas9和指导RNA的一种或更多种核酸接触。在一些实施方案中,使用例如脂质体转染或电穿孔将一种或更多种核酸引入细胞。核苷酸基因编辑也可在合子(zygote)中进行。在一些实施方案中,可用编码Cas9和靶向肌养蛋白位点的gRNA的一种或更多种核酸注射合子。随后可将合子注射到宿主中。
在一些实施方案中,在载体上提供Cas9。在一些实施方案中,载体含有来源于酿脓链球菌的Cas9(SpCas9)。在一些实施方案中,载体含有来源于金黄色葡萄球菌的Cas9(SaCas9)。在一些实施方案中,载体含有来源于耳葡萄球菌的Cas9(SauCas9)。在一些实施方案中,载体含有来源于路邓葡萄球菌的Cas9(SlugCas9)。在一些实施方案中,Cas9序列被密码子优化成在人细胞或小鼠细胞中表达。在一些实施方案中,载体还含有编码荧光蛋白(例如GFP)的序列,其允许使用荧光激活细胞分选(fluorescence activated cellsorting,FACS)来分选表达Cas9的细胞。在一些实施方案中,载体是病毒载体,例如腺相关病毒载体。
在一些实施方案中,gRNA在载体上提供。在一些实施方案中,载体是病毒载体,例如腺相关病毒载体。在一些实施方案中,Cas9和指导RNA在相同的载体上提供。在一些实施方案中,Cas9和指导RNA在不同的载体上提供。
可使用任何类型的载体,例如本文中所述的那些中的任一者。在一些实施方案中,载体是脂质纳米粒。在一些实施方案中,载体是病毒载体。在一些实施方案中,病毒载体是非整合病毒载体(即,不将来自载体的序列插入到宿主染色体中)。在一些实施方案中,病毒载体是腺相关病毒载体(AAV)、慢病毒载体、整合酶缺陷型慢病毒载体、腺病毒载体、痘苗病毒(vaccinia virus)载体、甲病毒载体或单纯疱疹病毒载体。在一些实施方案中,载体包含心肌细胞特异性启动子。在一些实施方案中,心肌细胞特异性启动子是心肌肌钙蛋白T(cTnT)启动子。在任何前述实施方案中,载体可以是腺相关病毒载体(AAV)。
当使用载体时,其可以是病毒载体,例如非整合病毒载体。在一些实施方案中,病毒载体是腺相关病毒载体、慢病毒载体、整合酶缺陷型慢病毒载体、腺病毒载体、痘苗病毒载体、甲病毒载体或单纯疱疹病毒载体。在一些实施方案中,病毒载体是腺相关病毒(AAV)载体。在一些实施方案中,AAV载体是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh10(参见例如美国专利9,790,472的SEQ ID NO:81,该专利通过引用整体并入本文)、AAVrh74(参见例如美国专利公开No.2015/0111955的SEQ ID NO:1,该专利通过引用整体并入本文)、AAV9载体、AAV9P载体(也称为AAVMYO,参见Weinmann et al.,2020,NatureCommunications,11:5432)、Tabebordbar et al.,2021,Cell,184:1-20中描述的Myo-AAV载体(例如,MyoAAV 1A、2A、3A、4A、4C或4E)以及WO2022053630中描述的AAV9-rh74-HB-P1、AAV9-AAA-P1-SG载体。其中AAV后面的数字表示AAV血清型。在一些实施方案中,AAV载体是单链AAV(single-stranded AAV,ssAAV)。在一些实施方案中,AAV载体是双链AAV(double-stranded AAV,dsAAV)。AAV载体或其血清型的任何变体,例如自身互补AAV(self-complementary AAV,scAAV)载体涵盖在通用术语AAV载体、AAV1载体等内。关于多种AAV载体的详细讨论参见例如,McCarty et al.,Gene Ther.2001;8:1248-54,Naso et al.,BioDrugs 2017;31:317-334,以及其中引用的参考文献。在一些实施方案中,载体是AAV9载体。
可使用本领域技术人员已知的技术(例如T7E1测定或进行测序)来评估体外或离体核苷酸编辑Cas9的效率。可使用本领域技术人员已知的技术(例如RT-PCR、Western印迹和免疫细胞化学)来确认RBM20功能的恢复。
在一些实施方案中,体外或离体基因编辑在心脏细胞中进行。在一些实施方案中,基因编辑在iPSC或iCM细胞中进行。在一些实施方案中,iPSC细胞在基因编辑之后分化。例如,iPSC细胞可在编辑之后分化成心脏细胞。在一些实施方案中,iPSC细胞分化成心脏肌细胞。在一些实施方案中,iPSC细胞分化成心肌细胞。可根据本领域技术人员已知的方法诱导iPSC细胞分化。
在一些实施方案中,使细胞与核苷酸编辑Cas9和gRNA接触恢复了RBM20功能。在一些实施方案中,已经在体外或离体编辑的细胞或由其来源的细胞显示出与野生型细胞相当的RBM20功能水平。在一些实施方案中,经编辑的细胞或由其来源的细胞显示的RBM20功能水平为野生型RMB20功能水平的至少20%、30%、40%、50%、60%、70%、80%、90%、95%或其间的任何百分比。
III.核酸递送
在一些实施方案中,表达盒用于表达蛋白质产物,用于随后纯化和递送至细胞/对象,或者直接用于基于遗传的递送方法。本文中提供了表达载体,其包含编码核苷酸编辑Cas9和至少一种靶向RBM20突变位点的RBM20指导RNA的一种或更多种核酸。在一些实施方案中,在同一载体上提供编码核苷酸编辑Cas9的核酸和编码至少一种指导RNA的核酸。在另一些实施方案中,在分开的载体上提供编码核苷酸编辑Cas9的核酸和编码至少一种指导RNA的核酸。
编码本文中的CRISPR/cas9系统的组分的多核苷酸序列可包含一种或更多种载体。本文中使用的术语“载体”可以是指能够转运已经与其连接的另一核酸的核酸分子。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或更多个游离末端、无游离末端(例如环状)的核酸分子;包含DNA、RNA或二者的核酸分子;以及本领域已知的多核苷酸的另一些变体。一种类型的载体是“质粒”,其是指例如通过标准分子克隆技术可在其中插入另外的DNA区段的环状双链DNA环。另一种类型的载体是病毒载体,其中病毒来源的DNA或RNA序列存在于载体中用于包装成病毒(例如逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒)。另一些载体(例如,非附加型哺乳动物载体)可在引入宿主细胞之后整合到宿主细胞的基因组中。重组表达载体可包含形式为适合于在宿主细胞中表达核酸的本发明构思的核酸,这可意指重组表达载体包含一个或更多个与待表达的核酸序列有效连接的调节元件,所述调节元件可基于用于表达的宿主细胞来选择。
表达需要在载体中提供适当的信号,并且包括多种来自病毒和哺乳动物来源二者的驱动目的基因在细胞中表达的调节元件(例如增强子/启动子)。还定义了被设计用于优化宿主细胞中信使RNA稳定性和可翻译性的元件。还提供了使用多种显性药物选择标志物以建立表达产物的永久稳定细胞克隆的条件,以及将药物选择标志物的表达与多肽的表达联系起来的元件。
在一些实施方案中,载体可包含与编码本文中的Cas9核酸酶的多核苷酸序列可操作地连接的调节元件。编码本文中的Cas9核酸酶的多核苷酸序列可被密码子优化成在特定细胞(例如原核或真核细胞)中表达。真核细胞可以是酵母、真菌、藻类、植物、动物或人细胞。真核细胞可以是来源于特定生物体的那些,所述生物体例如哺乳动物,包括但不限于人、小鼠、大鼠、兔、狗或非人哺乳动物,包括非人灵长类。植物细胞可包括但不限于来自种子、悬浮培养物、胚、分生组织区、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子的细胞。
本文中使用的“密码子优化”可以是指在维持天然氨基酸序列的同时,通过用目的宿主细胞的基因中更频繁或最频繁使用的密码子替代天然序列的至少一个或更多个密码子来修饰核酸序列以在该目的宿主细胞中增强表达的过程。多种物种对特定氨基酸的某些密码子表现出特定的偏倚。如本文中预期的,可基于密码子优化来定制基因以在给定生物体中实现最佳基因表达。密码子使用表是容易获得的,例如在“密码子使用数据库(CodonUsage Database)”中。
在一些实施方案中,本文中的Cas9核酸酶和一种或更多种指导核酸(例如,gRNA)可作为DNA或RNA递送。本文中的Cas9核酸酶和指导核酸二者均作为RNA(未经修饰的或含有碱基或主链修饰的)分子的递送可用于降低核酸指导的核酸酶在细胞中持续的时间量(例如降低的半衰期)。这可降低靶细胞中脱靶切割活性的水平。由于Cas9核酸酶作为mRNA的递送需要时间来翻译成蛋白质,因此本文中的一个方面可包括在递送Cas9mRNA之后数小时递送指导核酸,以使可用于与核酸指导的核酸酶蛋白质相互作用的指导核酸的水平最大化。在另一些情况下,Cas9mRNA和指导核酸可同时递送。在另一些实例中,指导核酸可例如在Cas9mRNA之后0.5、1、2、3、4或更多个小时顺序递送。
在一些实施方案中,可将RNA形式或在DNA表达盒上编码的指导核酸(例如,gRNA)引入到包含在载体或染色体上编码的核酸指导的核酸酶的宿主细胞中。指导核酸可在具有一个或更多个多核苷酸的盒中提供,所述指导核酸在盒中可以是连续的或不连续的。在一些实施方案中,指导核酸可作为单个连续多核苷酸在盒中提供。在另一些实施方案中,可将追踪剂添加至指导核酸以追踪分布和活性。
在另一些实施方案中,可使用多种递送系统以将gRNA和/或Cas9核酸酶引入宿主细胞中。根据这些实施方案,用于本文中公开的一些实施方案的系统可包括但不限于酵母系统、脂质体转染系统、显微注射系统、生物弹射击系统(biolistic system)、病毒微体(virosome)、脂质体、免疫脂质体、聚阳离子、脂质:核酸缀合物、病毒体、人工病毒体、病毒载体、电穿孔、细胞穿透肽、纳米粒、纳米线、外排体。
在一些实施方案中,提供了用于将一种或更多种多核苷酸,例如本文中所述的一种或更多种载体或线性多核苷酸、其一种或更多种转录物、和/或由其转录的一种或更多种蛋白质递送至宿主细胞的方法。在一些方面中,本发明构思还提供了通过这样的方法产生的细胞,并且生物体可包括这样的细胞或由这样的细胞产生。在一些实施方案中,将与指导核酸组合(并且任选地与其复合)的经改造核酸酶递送至细胞。
在某些实施方案中,可使用常规的基于病毒和非病毒的基因转移方法将核酸引入细胞,例如原核细胞、真核细胞、植物细胞、哺乳动物细胞或靶组织中。这样的方法可被用于将编码CRISPR/Cas9系统的组分的核酸施用于培养物中或宿主生物体中的细胞。非病毒载体递送系统包括DNA质粒、RNA(例如,本文中所述载体的转录物)、裸核酸以及与递送载剂(例如脂质体)复合的核酸。病毒载体递送系统包括DNA和RNA病毒,其在递送至细胞之后具有附加型基因组或整合基因组。本文中预期使用本领域已知的任何基因治疗方法。本文中预期了包含核酸的非病毒递送方法。腺相关病毒(“AAV”)载体还可用于与靶核酸一起转导细胞,例如在核酸和肽的体外产生中,并用于体内和离体基因治疗操作。
在一些实施方案中,可使用腺相关病毒(AAV)将编码本文中任何构建体(例如,gRNA、Cas9)的核酸递送至细胞。AAV是位点特异性地整合到宿主基因组中并因此可递送转基因的小病毒。反向末端重复(ITR)存在于AAV基因组和/或目的转基因的侧翼,并用作复制起点。AAV基因组中还存在rep和cap蛋白,所述rep和cap蛋白在转录时形成包封AAV基因组以用于递送到靶细胞中的衣壳。这些衣壳上的表面受体赋予AAV血清型,该血清型决定了衣壳将主要结合哪些靶器官,并因此决定了AAV将最有效地感染哪些细胞。目前已知有12种人AAV血清型。在一些实施方案中,本文中可使用任何哺乳动物AAV血清型以用于递送本文中所述的编码核酸。出于数种原因,腺相关病毒是基因治疗中最频繁使用的病毒之一。首先,在施用于哺乳动物(包括人)之后,AAV不引起免疫应答。其次,AAV被有效地递送至靶细胞,特别是在考虑选择适当的AAV血清型时。最后,由于基因组可在宿主细胞中持续存在而不整合,因此AAV具有感染分裂细胞和非分裂细胞二者的能力。这一特性使得它们成为用于基因治疗的理想候选物。
在一些实施方案中,可使用至少一种AAV载体将本文中公开的多核苷酸(例如,gRNA、Cas9)递送至细胞。AAV载体通常包含基于蛋白质的衣壳和由衣壳包裹的核酸。核酸可以是例如包含侧翼为反向末端重复的转基因的载体基因组。AAV“衣壳”是一种近球形的蛋白质壳,包含单个“衣壳蛋白”或“亚基”。AAV衣壳通常包含约60个衣壳蛋白亚基,其以T=1的二十面体对称性相关联并排列。当AAV载体在本文中被描述为包含AAV衣壳蛋白时,将理解,AAV载体包含衣壳,其中衣壳包含一种或更多种AAV衣壳蛋白(即,亚基)。本文中还描述了“病毒(viral)样颗粒”或“病毒(virus)样颗粒”,其是指不包含任何载体基因组或含有转基因的核酸的衣壳。本公开内容的病毒载体还可以是如国际专利公开WO00/28004和Chaoet al.,(2000)Molecular Therapy 2:619中所述的“靶向”病毒载体(例如,具有定向向性)和/或“杂交”细小病毒(即,其中病毒TR和病毒衣壳来自不同的细小病毒)。本公开内容的病毒载体还可以是如国际专利公开WO 01/92551(其公开内容通过引用整体并入本文)中所述的双链细小病毒颗粒。因此,在一些实施方案中,可将双链(双链体)基因组包装到本发明构思的病毒衣壳中。此外,病毒衣壳或基因组元件可含有其他修饰,包括插入、缺失和/或替换。
在一些实施方案中,可将本文中公开的AAV载体包装到病毒颗粒中,所述病毒颗粒可用于递送基因组以在靶细胞中进行转基因表达。在一些实施方案中,本文中公开的AAV载体可通过以下包装到颗粒中:瞬时转染、使用生产细胞系、将病毒特征组合到Ad-AAV杂交体中、使用疱疹病毒系统、或使用杆状病毒在昆虫细胞中产生。
在一些实施方案中,产生本文中的包装细胞的方法涉及创建稳定表达用于AAV颗粒产生的所有必需组分的细胞系。例如,将包含缺少AAV rep和cap基因的rAAV基因组、与rAAV基因组分离的AAV rep和cap基因以及可选择标志物(例如新霉素抗性基因)的质粒(或多个质粒)整合到细胞基因组中。AAV基因组已通过以下操作引入到细菌质粒中:例如GC加尾(Samulski et al.,1982,Proc.Natl.Acad.S6.USA,79:2077-2081)、添加含有限制性核酸内切酶切割位点的合成接头(Laughlin et al.,1983,Gene,23:65-73)或通过直接的平末端连接(Senapathy&Carter,1984,J.Biol.Chem.,259:4661-4666)。然后用辅助病毒(例如腺病毒)感染包装细胞系。该方法的优点在于细胞是可选择的并且适合于大规模生产rAAV。合适方法的另一些实例使用腺病毒或杆状病毒而不是质粒,以将rAAV基因组和/或rep和cap基因引入到包装细胞中。
在一些实施方案中,用如本文中所述的一种或更多种载体、线性多核苷酸、多肽、核酸-蛋白质复合物,或其任意组合瞬时或非瞬时转染宿主细胞。在一些实施方案中,细胞可以在体外、在培养物中或离体转染。在一些实施方案中,细胞可如其在对象中天然存在那样转染。在一些实施方案中,被转染的细胞可取自对象。在一些实施方案中,细胞来源于取自对象的细胞,例如细胞系。
在一些实施方案中,用如本文中所述的一种或更多种载体、线性多核苷酸、多肽、核酸-蛋白质复合物,或其任意组合转染的细胞可用于建立新的细胞系,该细胞系可包含一种或更多种转染来源的序列。在一些实施方案中,用如本文中所述的经改造核酸指导的核酸酶系统的组分瞬时转染(例如通过瞬时转染一种或更多种载体,或用RNA转染),并通过经改造核酸酶复合物的活性进行修饰的细胞可用于建立新的细胞系,该细胞系可包含含有修饰但缺少任何其他外源序列的细胞。
在一些实施方案中,本文中所述的一种或更多种载体可用于产生非人转基因细胞、生物体、动物或植物。在一些实施方案中,转基因动物可以是哺乳动物,例如小鼠、大鼠或兔。用于产生转基因细胞、生物体、植物和动物的方法是本领域已知的,并且通常以细胞转化或转染的方法开始,所述细胞转化或转染的方法例如本文中所述的。
本文中公开的一些实施方案涉及本文中公开的CRISPR/Cas9系统的使用;例如从而靶向并敲除基因、扩增基因和/或修复与DNA重复不稳定性和医学病症相关的特定突变。在一些实施方案中,本文中的CRISPR/Cas9系统可用于控制并校正这些基因组不稳定性缺陷。在另一些实施方案中,本文中公开的CRISPR/Cas9系统可用于校正与心肌病相关的基因中的缺陷。
A.调节元件
在一些实施方案中,调节元件可与本文中的可靶向CRISPR/cas9系统的一个或更多个元件可操作地连接,以便驱动该可靶向CRISPR/cas9系统的一个或更多个组分的表达。
在本申请通篇,术语“表达盒”意在包括含有编码基因产物的核酸的任何类型的遗传构建体,其中部分或全部核酸编码序列能够被转录和翻译,即,在启动子的控制下。“启动子”是指由起始基因的特异性转录所需的细胞的合成机器或引入的合成机器识别的DNA序列。短语“在转录控制下”意指启动子相对于核酸处于正确的位置和方向中以控制RNA聚合酶起始和基因的表达。“表达载体”意在包括包含在遗传构建体中能够复制的表达盒,并因此包括一个或更多个复制起点、转录终止信号、poly-A区、可选择标志物和多用途克隆位点。
在此,术语启动子用于是指在RNA聚合酶II的起始位点周围聚集的一组转录控制模块。关于如何组织启动子的大多数想法来源于数种病毒启动子的分析,包括针对HSV胸苷激酶(tk)和SV40早期转录单位的那些。通过更新的工作加强的这些研究已经表明启动子由离散的功能模块构成,各自由约7至20bp的DNA组成,并含有一个或更多个转录激活蛋白或阻遏蛋白的识别位点。
每个启动子中的至少一个模块用于定位RNA合成的起始位点。其最著名的实例是TATA盒(TATA box),但是在缺少TATA盒的一些启动子(例如哺乳动物末端脱氧核苷酸转移酶基因的启动子和SV40晚期基因的启动子)中,覆盖起始位点的离散元件本身有助于确定起始位置。
在一些实施方案中,本公开内容的核苷酸编辑Cas9构建体由肌细胞特异性启动子表达。该肌细胞特异性启动子可以是组成型活性的或者可以是诱导型启动子。
另外的启动子元件调节转录起始的频率。通常来说,这些位于起始位点上游30至110bp的区域中,但是最近已经表明许多启动子在起始位点下游也包含功能元件。启动子元件之间的间隔通常是柔性的,以使得当该元件相对于彼此倒置或移动时保持启动子功能。在tk启动子中,启动子元件之间的间隔在活性开始下降之前可提高至相距50bp。根据启动子,显示出单个元件可以协同地或独立地起作用以激活转录。
在某些实施方案中,病毒促进例如人巨细胞病毒(cytomegalovirus,CMV)立即早期基因启动子、SV40早期启动子、劳斯肉瘤病毒长末端重复(Rous sarcoma virus longterminal repeat)、大鼠胰岛素启动子,并且甘油醛-3-磷酸脱氢酶可用于获得目的编码序列的高水平表达。还预期使用本领域公知的另一些病毒或哺乳动物细胞或细菌噬菌体启动子来实现目的编码序列的表达,前提是表达水平对于给定目的足够。通过使用具有公知性质的启动子,可优化转染或转化后目的蛋白质的表达水平和模式。此外,选择响应于特定生理信号而被调节的启动子可允许基因产物的诱导型表达。
增强子是提高来自位于相同DNA分子上的远端位置之启动子的转录的遗传元件。增强子的组织很像启动子。也就是说,它们由许多单独的元件构成,其各自与一个或更多个转录蛋白结合。增强子与启动子之间的基本区别是可操作性。增强子区域作为整体必须能够在一定距离处刺激转录;对于启动子区或其组成元件不需要这样。另一方面,启动子必须具有在特定位点和特定方向上指导RNA合成起始的一种或更多种元件,而增强子缺乏这些特异性。启动子和增强子通常是重叠和连续的,通常看起来具有非常相似的模块化组织。
下面是可与表达构建体中编码目的基因的核酸组合使用的启动子/增强子和诱导型启动子/增强子的列表。另外地,任何启动子/增强子组合(根据真核启动子数据库EPDB)也可用于驱动基因的表达。如果提供合适的细菌聚合酶作为递送复合物的一部分或作为另外的遗传表达构建体,则真核细胞可支持来自某些细菌启动子的胞质转录。
启动子和/或增强子可以是例如:免疫球蛋白轻链、免疫球蛋白重链、T细胞受体、HLA DQ a和/或DQβ、β-干扰素、白介素-2、白介素-2受体、MHC II类5、MHC II类HLA-Dra、β-肌动蛋白、肌肉肌酸激酶(muscle creatine kinase,MCK)、前清蛋白(甲状腺素视黄质运载蛋白(transthyretin))、弹性蛋白酶I、金属硫蛋白(MTII)、胶原蛋白酶、白蛋白、甲胎蛋白、t-珠蛋白、β-球蛋白、c-fos、c-HA-ras、胰岛素、神经细胞黏附分子(neural cell adhesionmolecule,NCAM)、α1-胰蛋白酶抑制剂(α1-antitrypain)、H2B(TH2B)组蛋白、小鼠和/或I型胶原蛋白、葡萄糖调节蛋白(GRP94和GRP78)、大鼠生长激素、人血清淀粉样蛋白A(serumamyloid A,SAA)、肌钙蛋白I(TN I)、血小板源性生长因子(platelet-derived growthfactor,PDGF)、迪谢内肌营养不良(Duchenne muscular dystrohpy)、SV40、多瘤(polyoma)、逆转录病毒、乳头状瘤病毒、乙型肝炎病毒、人免疫缺陷病毒、巨细胞病毒(CMV)和长臂猿白血病病毒(gibbon ape leukemia virus)。
在一些实施方案中,可使用诱导型元件。在一些实施方案中,诱导型元件是例如:MTII、MMTV(小鼠乳腺肿瘤病毒)、β-干扰素、腺病毒5E2、胶原蛋白酶、溶基质蛋白酶、SV40、鼠MX基因、GRP78基因、α-2-巨球蛋白、波形蛋白、MHC I类基因H-2κb、HSP70、增殖蛋白(proliferin)、肿瘤坏死因子和/或促甲状腺激素α基因。在一些实施方案中,诱导物是佛波酯(TFA)、重金属、糖皮质激素、聚(rI)x、聚(rc)、E1A、佛波酯(TPA)、干扰素、新城疫病毒(Newcastle Disease Virus)、A23187、IL-6、血清、干扰素、SV40大T抗原、PMA和/或甲状腺激素。本文中所述的任何诱导型元件可与本文中所述的任何诱导物一起使用。
特别感兴趣的是心肌细胞特异性启动子。在一些实施方案中,心肌细胞特异性启动子是心肌肌钙蛋白T(cTnT)启动子。
在使用cDNA插入物的情况下,通常期望包含多腺苷酸化信号以实现基因转录物的适当多腺苷酸化。可使用任何多腺苷酸化序列,例如人生长激素和SV40多腺苷酸化信号。还考虑作为表达盒元件的是终止子。这些元件可用于增强信息水平并使从盒到其他序列中的通读最小化。
B.2A肽
在一些实施方案中,使用来自昆虫病毒明脉扁刺蛾β四体病毒(Thosea asigna)的2A样自切割结构域(TaV 2A肽)(EGRGSLLTCGDVEENPGP(SEQ ID NO:55)。已经显示这些2A样结构域在整个真核生物中起作用并导致氨基酸的切割在2A样肽结构域内共翻译地发生。因此,包含TaV 2A肽允许从单个mRNA转录物表达多种蛋白质。重要的是,当在真核系统中测试时,TaV的结构域表现出大于99%的切割活性。另一些可接受的2A样肽包括但不限于:马鼻炎A病毒(equine rhinitis A virus,ERAV)2A肽(QCTNYALLKLAGDVESNPGP(SEQ ID NO:56))、猪捷申病毒1(porcine teschovirus-1,PTV1)2A肽(ATNFSLLKQAGDVEENPGP(SEQ IDNO:57))和口蹄疫病毒(foot and mouth disease virus,FMDV)2A肽(PVKQLLNFDLLKLAGDVESNPGP(SEQ ID NO:58))或其经修饰形式。
在一些实施方案中,2A肽用于同时表达报道分子和核苷酸编辑Cas9。报道分子可以是例如GFP或mCherry。
可使用的其他自切割肽包括但不限于:核内含物蛋白a(nuclear inclusionprotein a,Nia)蛋白酶、P1蛋白酶、3C蛋白酶、L蛋白酶、3C样蛋白酶或其经修饰形式。
C.反式剪接内含肽
在一些实施方案中,反式剪接内含肽用于允许分裂核苷酸编辑Cas9的共价剪接。由于递送尺寸的限制,核苷酸编辑Cas9可被分裂成N端肽和C端肽。当与反式剪接内含肽连接时,分裂核苷酸编辑Cas9的每一半在翻译成功能性核苷酸编辑Cas9之后重新组装,与其非分裂全长等同物相比,保持相似的编辑效率。
在一些实施方案中,核苷酸编辑Cas9的N端和C端肽被融合以将来自N.puntiforme(Npu)的DnaE内含肽分成两半。
可使用的另一些反式剪接内含肽包括但不限于Sce VMA、Mtu RecA、Ssp DnaE。
D.表达载体的递送
存在许多可将表达载体引入到细胞中的方式。在某些实施方案中,表达构建体包含病毒或来源于病毒基因组的经改造构建体。某些病毒通过受体介导的胞吞作用进入细胞以整合到宿主细胞基因组中并稳定且高效地表达病毒基因的能力使得其成为用于将外来基因转移到哺乳动物细胞中的有吸引力的候选物。这些对外来DNA序列具有相对低的容纳力,并且具有受限的宿主谱。此外,它们在允许细胞中的致癌潜力和细胞病变效应引起了安全性问题。它们仅可容纳多至8kB的外来遗传物质,但可容易地引入多种细胞系和实验动物中。
用于体内递送的一种方法涉及使用腺病毒表达载体。“腺病毒表达载体”意在包括含有足以(a)支持构建体包装和(b)表达其中已克隆的反义多核苷酸的腺病毒序列的那些构建体。在本发明上下文中,表达不需要合成基因产物。
表达载体包含经遗传改造形式的腺病毒。对腺病毒(36kB的线性双链DNA病毒)的遗传组织的了解允许用多至7kB的外来序列替换大片段的腺病毒DNA。与逆转录病毒相反,宿主细胞的腺病毒感染不导致染色体整合,原因是腺病毒DNA可以以附加体方式复制而没有潜在的遗传毒性。此外,腺病毒在结构上是稳定的,并且在大量扩增之后没有检测到基因组重排。腺病毒可感染几乎所有上皮细胞,而不论其细胞周期阶段如何。迄今为止,显示出腺病毒感染仅与轻度疾病(例如人的急性呼吸系统疾病)相关。
腺病毒特别适合用作基因转移载体,原因是其具有中等尺寸的基因组、易于操作、高滴度、宽靶细胞范围和高感染性。病毒基因组的两端均含有100至200个碱基对的反向重复(ITR),其是病毒DNA复制和包装所必需的顺式元件。基因组的早期(E)和晚期(L)区域包含不同的转录单位,其被病毒DNA复制的起始分开。E1区(E1A和E1B)编码负责调节病毒基因组和少数细胞基因的转录的蛋白质。E2区(E2A和E2B)的表达导致用于病毒DNA复制的蛋白质的合成。这些蛋白质参与DNA复制、晚期基因表达和宿主细胞关闭。晚期基因的产物(包括大多数病毒衣壳蛋白)仅在由主要晚期启动子(major late promoter,MLP)产生的单一初级转录物的显著加工之后表达。MLP(位于16.8m.u.)在感染的晚期期间特别高效,并且从该启动子产生的所有mRNA具有5’-三联前导(tripartite leader,TPL)序列,使其成为用于翻译的优选mRNA。在一个系统中,重组腺病毒由穿梭载体与原病毒载体之间的同源重组产生。由于两种原病毒载体之间可能的重组,因此可从该过程产生野生型腺病毒。因此,从单个噬斑(plaque)分离单个病毒克隆并检查其基因组结构是至关重要的。
产生和扩增复制缺陷型的现有腺病毒载体依赖于独特辅助细胞系(称为293),其通过Ad5DNA片段从人胚肾细胞转化并组成型地表达E1蛋白质。由于E3区是腺病毒基因组非必要的(dispensable),因此现有腺病毒载体在293细胞的帮助下在E1、D3或这两个区域中携带外来DNA。在自然界中,腺病毒可包装约105%的野生型基因组,提供额外约2kb DNA的容量。与在E1和E3区中可替代的约5.5kb的DNA组合,现有腺病毒载体的最大容量为7.5kb或载体总长度的约15%。载体主链中保留超过80%的腺病毒病毒基因组并且是载体携带的细胞毒性的来源。此外,E1缺失的病毒的复制缺陷是不完全的。
辅助细胞系可来源于人细胞,例如人胚胎肾细胞、肌细胞、造血细胞或者其他人胚胎间充质或上皮细胞。或者,辅助细胞可来源于允许人腺病毒的其他哺乳动物物种的细胞。这样的细胞包括例如Vero细胞或其他猴胚胎间充质或上皮细胞。如上所述,优选的辅助细胞系是293。
本公开内容的腺病毒是复制缺陷型或至少是条件性复制缺陷型的。腺病毒可以是已知的42种不同血清型或A-F亚组中的任一种。将亚组C的5型腺病毒作为优选的起始物质以获得用于本公开内容的条件性复制缺陷型腺病毒载体。
逆转录病毒是一组单链RNA病毒,其特征在于通过逆转录过程将其RNA转化为感染细胞中双链DNA的能力。随后所得DNA稳定整合到细胞染色体中作为原病毒(provirus)并指导病毒蛋白的合成。整合导致在接受体细胞及其后代中保留病毒基因序列。逆转录病毒基因组包含分别编码衣壳蛋白、聚合酶和包膜组分的三个基因gag、pol和env。在gag基因上游发现的序列包含用于将基因组包装到病毒体中的信号。病毒基因组的5’和3’端处有两个长末端重复(long terminal repeat,LTR)序列。这些包含强启动子和增强子序列,并且也是整合到宿主细胞基因组中所必需的。
为了构建逆转录病毒载体,将编码目的基因的核酸插入病毒基因组某些病毒序列位置处以产生复制缺陷型病毒。为了产生病毒体,构建了包含gag、pol和env基因但无LTR的包装细胞系和包装组分。当将包含cDNA的重组质粒与逆转录病毒LTR和包装序列一起引入(例如通过磷酸钙沉淀)该细胞系中时,包装序列使重组质粒的RNA转录物包装成病毒颗粒,随后其分泌到培养基中。随后收集包含重组逆转录病毒的培养基,任选地进行浓缩,并用于基因转移。逆转录病毒载体能够感染广泛多种细胞类型。然而,整合和稳定表达需要宿主细胞的分裂。
在本公开内容的所有方面中使用逆转录病毒载体存在某些限制。例如,逆转录病毒载体通常整合到细胞基因组中的随机位点中。这可通过中断宿主基因或通过插入可干扰侧翼基因功能的病毒调节序列而导致插入诱变(insertional mutagenesis)。使用缺陷型逆转录病毒载体的另一个问题是在包装细胞中潜在出现有复制能力的野生型病毒。这可能由其中来自重组病毒的完整序列插入整合在宿主细胞基因组中的gag、pol、env序列的上游的重组事件引起。然而,现在可用的新的包装细胞系可大大降低重组的可能性。
另一些病毒载体可用作本公开内容中的表达构建体。可使用来源于病毒,例如痘苗病毒、腺相关病毒(AAV)和疱疹病毒的载体。它们为多种哺乳动物细胞提供了数个有吸引力的特征。
在一些实施方案、一些具体实施方案中,载体是AAV载体。AAV是感染人和一些其他灵长类物种的小病毒。目前不知道AAV导致疾病。该病毒导致非常温和的免疫应答,使得进一步支持其明显缺乏致病性。在许多情况下,将AAV载体整合到宿主细胞基因组中,这对于某些应用可能是重要的,但也可具有不期望的结果。使用AAV的基因治疗载体可感染分裂细胞和静止细胞二者,并保持染色体外状态而不整合到宿主细胞的基因组中,但是在天然病毒中确实存在病毒携带的基因进入到宿主基因组的一些整合。这些特征使AAV成为用于创建用于基因治疗的病毒载体和用于创建等基因人疾病模型的非常有吸引力的候选物。最近在视网膜中使用AAV用于基因治疗的人临床试验显示出了前景。AAV属于Dependoparvovirus属,其继而属于细小病毒(Parvoviridae)科。该病毒是小的(20nm)复制缺陷的、无包膜的病毒。
野生型AAV由于许多特征吸引了来自基因治疗研究者的相当大的兴趣。在这些中主要的是病毒明显缺乏致病性。其还可感染非分裂细胞,并且具有在人染色体19的特定位点(命名为AAVS1)处稳定整合到宿主细胞基因组中的能力。该特征使其比存在随机插入和诱变(有时随后是癌症的发生)威胁的逆转录病毒稍微更可预测。AAV基因组最频繁地整合到所述位点中,而随机并入到基因组中以可忽略不计的频率发生。然而,AAV作为基因治疗载体的发展通过从载体的DNA中去除rep和cap而消除了这种整合能力。将所期望的基因与驱动基因转录的启动子一起插入反向末端重复(ITR)之间,这有助于在通过宿主细胞DNA聚合酶复合物将单链载体DNA转化成双链DNA之后核内多联体(concatemer)形成。基于AAV的基因治疗载体在宿主细胞核中形成附加体多联体。在非分裂细胞中,这些多联体在宿主细胞的生命内保持完整。在分裂细胞中,AAV DNA通过细胞分裂而丢失,因为附加体DNA不与宿主细胞DNA一起复制。AAV DNA随机整合到宿主基因组中是可检测到的,但以非常低的频率发生。AAV还表现出非常低的免疫原性,显示限于产生中和抗体,而它们不诱导明确限定的细胞毒性响应。该特征与感染静止细胞的能力一起表现出其作为用于人基因治疗的载体优于腺病毒的优势。
AAV的使用确实存在一些缺点。载体的克隆容量相对有限,并且大多数治疗性基因需要完全替换病毒的4.8千碱基基因组。因此,大基因不适合用于标准AAV载体中。目前正在探索克服有限编码容量的方案。两个基因组的AAV ITR可退火形成头对尾多联体,使载体的容量几乎加倍。剪接位点的插入允许从转录物中去除ITR。
由于AAV的特定基因治疗优势,研究者已经创建了被称为自我互补腺相关病毒(self-complementary adeno-associated virus,scAAV)的改变形式的AAV。AAV包装DNA的单链并且必须等待其第二条链的合成,而scAAV包装两条更短的彼此互补的链。通过避免第二链合成,scAAV可更快地表达,但作为注意事项,scAAV仅可编码AAV已经有限的容量的一半。最近的报道表明,scAAV载体比单链腺病毒载体更具免疫原性,诱导更强的细胞毒性T淋巴细胞的活化。
由野生型感染引发的体液免疫被认为是非常常见的事件。相关的中和活性限制了最常使用的血清型AAV2在某些应用中的效用。因此,目前正在进行的大多数临床试验均涉及将AAV2递送到脑(具有相对免疫特权的器官)中。在脑中,AAV2具有强的神经元特异性。
AAV基因组是由约4.7千碱基长的正义或反义单链脱氧核糖核酸(single-stranded deoxyribonucleic acid,ssDNA)构建的。基因组包含在DNA链两端的反向末端重复(ITR)、以及两个开放阅读框(open reading frame,ORF):rep和cap。前者由编码AAV生命周期所需的Rep蛋白的四个重叠基因构成,并且后者包含衣壳蛋白VP1、VP2和VP3的重叠核苷酸序列,所述衣壳蛋白一起相互作用以形成二十面体对称的衣壳。
反向末端重复(ITR)序列各自包含145个碱基。它们被如此命名是因为它们的对称性,其显示是AAV基因组有效繁殖所需的。赋予它们该特性的这些序列的特征是它们形成发夹的能力,其有助于允许第二DNA链的不依赖引发酶的合成的所谓的自引发。ITR也显示出是将AAV DNA整合到宿主细胞基因组(人的第19条染色体)中和从其中挽救这两种情况所需的,并且是使AAV DNA有效衣壳化以及产生完全组装的脱氧核糖核酸酶抗性AAV颗粒所需的。
关于基因治疗,ITR看起来是紧挨着以下治疗性基因的唯一所需的顺式序列:可以以反式被递送的结构(cap)和包装(rep)蛋白。在该假设下,建立了用于有效产生包含报道子或治疗性基因的重组AAV(recombinant AAV,rAAV)载体的许多方法。然而,还公开了ITR不是对于有效复制和衣壳化所需的唯一顺式元件。一些研究组已经在rep基因的编码序列内鉴定了被命名为顺式作用Rep依赖性元件(cis-acting Rep-dependent element,CARE)的序列。CARE显示出当以顺式存在时增强了复制和衣壳化。
在基因组的“左侧”有两个启动子,称为p5和p19,从中可产生两个不同长度的重叠信使核糖核酸(messenger ribonucleic acid,mRNA)。这些中的每一个均包含可被剪接掉或不剪接掉的内含子。考虑到这些可能性,可合成四种不同的mRNA,并因此合成四种不同的具有重叠序列的Rep蛋白。它们的名称示出了它们以千道尔顿(kilodalton,kDa)计的大小:Rep78、Rep68、Rep52和Rep40。Rep78和Rep68可以以自引发作用特异性地结合由ITR形成的发夹,并且在发夹内的特定区域(指定的末端分解位点)处切割。它们还显示出是AAV基因组的AAVS1特异性整合所必需的。所有四种Rep蛋白均示出结合ATP并具有解旋酶活性。还示出它们上调来自p40启动子(下文所述)的转录,但下调p5和p19启动子二者。
正义AAV基因组的右侧编码三种衣壳蛋白VP1、VP2和VP3的重叠序列,它们起始于一个命名为p40的启动子。这些蛋白质的分子量分别为87、72和62千道尔顿。AAV衣壳由比率为1:1:10的VP1、VP2和VP3的混合物构成,总共为60个单体,以二十面体对称排列,估计尺寸为3.9兆道尔顿。
cap基因产生另外的称为组装活化蛋白(assembly-activating protein,AAP)的非结构蛋白。这种蛋白质由ORF2产生并且对于衣壳组装过程至关重要。这种蛋白质在组装过程中的确切功能及其结构至今尚未解决。
所有三种VP均由一种mRNA翻译而来。在合成该mRNA之后,其可以以两种不同的方式被剪接:可切除较长或较短的内含子,导致形成两种mRNA合并物(pool):2.3kb和2.6kb长的mRNA合并物。通常,特别是在存在腺病毒的情况下,优选较长的内含子,因此2.3kb长的mRNA代表了所谓的“主要剪接”。在这种形式中,从其开始VP1蛋白合成的第一AUG密码子被切除,导致VP1蛋白合成的总体水平降低。在主要剪接中保留的第一AUG密码子是VP3蛋白的起始密码子。然而,在同一开放阅读框中该密码子的上游是被最佳Kozak环境(context)包围的ACG序列(编码苏氨酸)。这有助于VP2蛋白的低水平合成,VP2蛋白实际上是具有另外的N端残基的VP3蛋白,VP1也是如此。
由于优选剪接掉较大的内含子,并且由于在主要剪接中ACG密码子是弱得多的翻译起始信号,因此体内合成AAV结构蛋白的比率为约1:1:20,这与成熟病毒颗粒中的相同。VP1蛋白N端的独特片段被证明具有磷脂酶A2(phospholipase A2,PLA2)活性,这可能是从晚期内体释放AAV颗粒所需的。Muralidhar et al.报道了VP2和VP3对于正确的病毒体组装是至关重要的。然而,最近Warrington et al.证明VP2对于完整的病毒颗粒形成和高效感染性不是必要的,并且还提出VP2可耐受在其N端的大插入,而VP1则不能,可能是因为存在PLA2结构域。
AAV载体可以是复制缺陷型的或条件性复制缺陷型的。在一些实施方案中,AAV载体是重组AAV载体。在一些实施方案中,AAV载体包含分离自或来源于以下血清型的AAV载体的序列:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11,或其任意组合。
在一些实施方案中,使用单一病毒载体将编码核苷酸编辑Cas9和至少一种gRNA的核酸递送至细胞。在一些实施方案中,使用第一病毒载体向细胞提供核苷酸编辑Cas9,并使用第二病毒载体向细胞提供至少一种gRNA。在一些实施方案中,核苷酸编辑Cas9可使用通过蛋白质反式剪接重建全长核苷酸编辑器的分裂内含肽双AAV系统。在这些系统中,Cas9蛋白或碱基编辑器被分成两个部分,每一部分与内含肽系统的一个部分(例如,分别由dnaEn和dnaEc编码的内含肽-N和内含肽-C)融合。在共表达之后,Cas9蛋白或核碱基编辑器的两个部分通过内含肽介导的蛋白剪接连接在一起。参见,美国专利公开US20180127780,其通过引用整体并入本文。
在一些实施方案中,使用单一病毒载体将编码核苷酸编辑Cas9和至少一种gRNA的核酸递送至细胞。在一些实施方案中,使用第一病毒载体向细胞提供核苷酸编辑Cas9,并使用第二病毒载体向细胞提供至少一种gRNA。在一些实施方案中,核苷酸编辑Cas9可使用通过蛋白质反式剪接重建全长核苷酸编辑器的分裂内含肽双AAV系统。为了实现有义或反义基因构建体的表达,必须将表达构建体递送到细胞中。细胞可以是肌细胞、卫星细胞、成血管细胞(mesoangioblast)、骨髓来源的细胞、基质细胞或间充质干细胞。在一些实施方案中,细胞是心肌细胞、骨骼肌细胞或平滑肌细胞。在一些实施方案中,细胞是胫骨前肌、四头肌、比目鱼肌、三头肌、趾长伸肌、膈肌或心脏中的细胞。在一些实施方案中,细胞是诱导多能干细胞(iPSC)或内细胞团细胞(inner cell mass cell,iCM)。在另一些实施方案中,细胞是人iPSC或人iCM。在一些实施方案中,本公开内容的人iPSC或人iCM可来源于培养的干细胞系、成体干细胞、胎盘干细胞,或来自成体干细胞或胚胎干细胞的另一来源,其不需要破坏人胚胎。递送至细胞可以在体外实现,如在用于转化细胞系的实验室操作中,或者在体内或离体实现,如在某些疾病状态的治疗中。一种递送机制是通过病毒感染,其中表达构建体被包封在感染性病毒颗粒中。
本公开内容也预期了用于将表达构建体转移到培养的哺乳动物细胞中的数种非病毒方法。这些包括磷酸钙沉淀、DEAE-葡聚糖、电穿孔、直接显微注射、负载DNA的脂质体和lipofectamine-DNA复合物、细胞超声、使用高速微粒的基因轰击和受体介导的转染。这些技术中的一些可成功地适于体内或离体使用。
一旦表达构建体已被递送到细胞中,编码目的基因的核酸可在不同位点定位和表达。在某些实施方案中,编码基因的核酸可稳定整合到细胞的基因组中。这种整合可通过同源重组(基因置换)处于同源的位置和方向,或者其可整合到随机的非特异性位置中(基因增强)。在另一些实施方案中,核酸可作为单独的DNA的附加体区段稳定地保持在细胞中。这样的核酸区段或“附加体”编码这样的序列,所述序列足以允许独立于宿主细胞周期或与宿主细胞周期同步地维持和复制。如何将表达构建体递送至细胞以及在细胞中核酸保留在何处取决于所使用的表达构建体的类型。
在另一个实施方案中,表达构建体可简单地由裸重组DNA或质粒组成。构建体的转移可通过上述的物理或化学渗透细胞膜的任何方法进行。这尤其适用于体外转移,但也可应用于体内使用。编码目的基因的DNA也可以以类似的方式在体内转移并表达基因产物。
在用于将裸DNA表达构建体转移到细胞中的另一个实施方案中,可涉及粒子轰击。这种方法取决于将DNA包被的微粒加速到高速以使其穿刺细胞膜并进入细胞而不杀伤它们的能力。已经开发了用于加速小颗粒的数种装置。一种这样的装置依赖于高电压放电以产生电流,其进而提供动力。所用的微粒由生物惰性物质(例如钨或金珠)组成。
在一些实施方案中,表达构建体直接递送至对象的肝、皮肤和/或肌肉组织。这可能需要组织或细胞的手术暴露以消除枪和靶器官之间的任何中介组织,即离体处理。同样,编码特定基因的DNA可通过该方法递送,并且仍通过本公开内容并入。
在另一个实施方案中,表达构建体可以包载(entrap)在脂质体中。脂质体是以磷脂双层膜和内部水性介质为特征的囊状结构。多层脂质体具有通过水性介质分开的多个脂质层。当磷脂悬浮在过量的水溶液中时,它们自发形成。脂质组分在形成闭合结构之前经历自身重排,并且在脂质双层之间包载水和溶解的溶质。还考虑了lipofectamine-DNA复合物。
脂质体介导的体外核酸递送和外来DNA的表达已经非常成功。称为Lipofectamine2000TM的试剂被广泛使用并可商购获得。
在某些实施方案中,脂质体可与血凝病毒(hemagglutinating virus,HVJ)复合以促进与细胞膜的融合和促进脂质体包封的DNA的细胞进入。在另一些实施方案中,脂质体可与核的非组蛋白染色体蛋白(HMG-1)复合或联合使用。在另一些实施方案中,脂质体可与HVJ和HMG-1二者复合或联合使用。由于这样的表达构建体已经成功地用于体外和体内核酸的转移和表达,因此它们适用于本公开内容。当在DNA构建体中使用细菌启动子时,也期望在脂质体内包含适当的细菌聚合酶。
可用于将编码特定基因的核酸递送到细胞中的另一些表达构建体是受体介导的递送载剂。其利用在几乎所有真核细胞中通过受体介导的胞吞作用选择性摄取大分子。由于多种受体的细胞类型特异性分布,因此递送可以是高度特异性的。
受体介导的基因靶向载剂通常由两种组分组成:细胞受体特异性配体和DNA结合剂。数种配体已经用于受体介导的基因转移。最广泛表征的配体是无唾液酸血清类黏蛋白(asialoorosomucoid,ASOR)和运铁蛋白(transferrin)。与ASOR识别相同的受体的合成拟糖蛋白(neoglycoprotein)已经用作基因递送载剂,而表皮生长因子(epidermal growthfactor,EGF)也已经用于将基因递送至鳞状癌细胞。
E.AAV-Cas9载体
在一些实施方案中,Cas9碱基编辑器或先导编辑器可被包装到AAV载体中。在一些实施方案中,AAV载体是野生型AAV载体。在一些实施方案中,AAV载体含有一个或更多个突变。在一些实施方案中,AAV载体分离自或来源于以下血清型的AAV载体:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11,或其任意组合。
示例性AAV-Cas9载体含有两个ITR(反向末端重复)序列,其位于包含Cas9序列的中心序列区域的侧翼。在一些实施方案中,ITR分离自或来源于以下血清型的AAV载体:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11,或其任意组合。在一些实施方案中,ITR包含AAV血清型的全长和/或野生型序列或者由其组成。在一些实施方案中,ITR包含AAV血清型的截短序列或者由其组成。在一些实施方案中,ITR包含AAV血清型的延长序列或者由其组成。在一些实施方案中,ITR包含与相同AAV血清型的野生型序列相比含有序列变异的序列或者由其组成。在一些实施方案中,序列变异包含替换、缺失、插入、倒位或转座中的一种或更多种。在一些实施方案中,ITR包含至少100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149或150个碱基对或者由其组成。在一些实施方案中,ITR包含100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149或150个碱基对或者由其组成。在一些实施方案中,ITR的长度为110±10个碱基对。在一些实施方案中,ITR的长度为120±10个碱基对。在一些实施方案中,ITR的长度为130±10个碱基对。在一些实施方案中,ITR的长度为140±10个碱基对。在一些实施方案中,ITR的长度为150±10个碱基对。在一些实施方案中,ITR的长度为115、145或141个碱基对。
在一些实施方案中,AAV-Cas9载体可包含一个或更多个核定位信号(nuclearlocalization signal,NLS)。在一些实施方案中,AAV-Cas9载体包含1、2、3、4或5个核定位信号。示例性NLS包括c-myc NLS、SV40NLS、hnRNPAI M9NLS、核质蛋白NLS、来自输入蛋白-α的IBB结构域的序列RMRKFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:59)、肌瘤(myoma)T蛋白的序列VSRKRPRP(SEQ ID NO:60)和PPKKARED(SEQ ID NO:61)、人p53的序列PQPKKKPL(SEQ ID NO:62)、小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:63)、流感病毒NS1的序列DRLRR(SEQ ID NO:64)和PKQKKRK(SEQ ID NO:65)、肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:66)和小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:67)。另一些可接受的核定位信号包括二部分核定位序列,例如人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:68)或类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:69)。
在一些实施方案中,AAV-Cas9载体可包含另外的元件以促进载体的包装和Cas9的表达。在一些实施方案中,AAV-Cas9载体可包含polyA序列。在一些实施方案中,polyA序列可以是微型polyA序列。在一些实施方案中,AAV-CAs9载体可包含转座元件。在一些实施方案中,AAV-Cas9载体可包含调节元件。在一些实施方案中,调节元件是活化剂或阻遏物。
在一些实施方案中,AAV-Cas9可包含一个或更多个启动子。在一些实施方案中,一个或更多个启动子驱动Cas9的表达。在一些实施方案中,一个或更多个是心肌细胞特异性启动子。示例性心脏特异性启动子包括心肌肌钙蛋白T启动子和α-肌球蛋白重链启动子。
在一些实施方案中,可针对在酵母、细菌、昆虫细胞或哺乳动物细胞中的产生对AAV-Cas9载体进行优化。在一些实施方案中,可针对在人细胞中的表达对AAV-Cas9载体进行优化。在一些实施方案中,可针对在杆状病毒表达系统中的表达对AAV-Cas9载体进行优化。
在本公开内容的基因编辑构建体的一些实施方案中,构建体包含启动子和核酸酶或者由其组成。在一些实施方案中,构建体包含cTnT启动子和Cas9核酸酶或者由其组成。在一些实施方案中,构建体包含cTnT启动子和分离自或来源于酿脓葡萄球菌(Staphylococcus pyogenes)的Cas9核酸酶(“SpCas9”)或者由其组成。在一些实施方案中,SpCas9核酸酶包含与以下至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同的核苷酸序列或者由其组成:
在一些实施方案中,包含启动子和核酸酶的构建体还包含至少两个反向末端重复(ITR)序列。在一些实施方案中,包含启动子和核酸酶的构建体还包含至少两个分离自或来源于血清型2的AAV(AAV2)的ITR序列。在一些实施方案中,包含启动子和核酸酶的构建体还包含至少两个ITR序列,所述ITR序列各自包含以下的核苷酸序列或者由其组成:
在一些实施方案中,包含启动子和核酸酶的构建体还包含至少两个ITR序列,其中第一ITR序列包含以下的核苷酸序列或者由其组成:
并且第二ITR序列包含以下的核苷酸序列或者由其组成:
在一些实施方案中,构建体从5’至3’包含第一ITR、编码启动子的序列、编码核酸酶的序列和第二ITR,或者由其组成。在一些实施方案中,构建体从5’至3’包含第一AAV2ITR、编码cTnT启动子的序列、编码SpCas9核酸酶的序列和第二AAV2ITR,或者由其组成。在一些实施方案中,从5’至3’包含第一ITR、编码启动子的序列、编码核酸酶的序列和第二ITR或者由其组成的构建体还包含poly A序列。在一些实施方案中,polyA序列包含微型polyA序列或者由其组成。本公开内容的一些示例性微型polyA序列包含以下的核苷酸序列或者由其组成:
在一些实施方案中,构建体从5’至3’包含第一ITR、编码启动子的序列、编码核酸酶的序列、poly A序列和第二ITR,或者由其组成。在一些实施方案中,构建体从5’至3’包含第一ITR、编码启动子的序列、编码核酸酶的序列、微型poly A序列和第二ITR,或者由其组成。在一些实施方案中,构建体从5’至3’包含第一AAV2ITR、编码cTnT启动子的序列、编码SpCas9核酸酶的序列、微型poly A序列和第二AAV2ITR,或者由其组成。在一些实施方案中,从5’至3’包含第一ITR、编码启动子的序列、编码核酸酶的序列、poly A序列和第二ITR的构建体还包含至少一个核定位信号。在一些实施方案中,从5’至3’包含第一ITR、编码启动子的序列、编码核酸酶的序列、poly A序列和第二ITR的构建体还包含至少两个核定位信号。本公开内容的一些示例性核定位信号包含
的核苷酸序列或
的核苷酸序列,或者由其组成。在一些实施方案中,构建体从5’至3’包含第一ITR、编码启动子的序列、编码第一核定位信号的序列、编码核酸酶的序列、poly A序列和第二ITR,或者由其组成。在一些实施方案中,构建体从5’至3’包含第一ITR、编码启动子的序列、编码第一核定位信号的序列、编码核酸酶的序列、编码第二核定位信号的序列、poly A序列和第二ITR,或者由其组成。在一些实施方案中,从5’至3’包含第一ITR、编码启动子的序列、编码第一核定位信号的序列、编码核酸酶的序列、编码第二核定位信号的序列、polyA序列和第二ITR或者由其组成的构建体还包含终止密码子。终止密码子可具有TAG、TAA或TGA的序列。在一些实施方案中,构建体从5’至3’包含第一ITR、编码启动子的序列、编码第一核定位信号的序列、编码核酸酶的序列、编码第二核定位信号的序列、终止密码子、polyA序列和第二ITR,或者由其组成。在一些实施方案中,从5’至3’包含第一ITR、编码启动子的序列、编码第一核定位信号的序列、编码核酸酶的序列、编码第二核定位信号的序列、终止密码子、poly A序列和第二ITR或者由其组成的构建体还包含转座元件反向重复。本公开内容的一些示例性转座元件反向重复包含
的核苷酸序列和/或
的核苷酸序列,或者由其组成。在一些实施方案中,构建体从5’至3’包含第一转座元件反向重复、第一ITR、编码启动子的序列、编码第一核定位信号的序列、编码核酸酶的序列、编码第二核定位信号的序列、终止密码子、poly A序列、第二ITR和第二转座元件反向重复,或者由其组成。在一些实施方案中,从5’至3’包含第一转座元件反向重复、第一ITR、编码启动子的序列、编码第一核定位信号的序列、编码核酸酶的序列、编码第二核定位信号的序列、终止密码子、poly A序列、第二ITR和第二转座元件反向重复或者由其组成的构建体还包含调节序列。本公开内容的一些示例性调节序列包含以下的核苷酸序列或者由其组成:
在一些实施方案中,构建体从5’至3’包含第一转座元件反向重复、第一ITR、编码启动子的序列、编码第一核定位信号的序列、编码核酸酶的序列、编码第二核定位信号的序列、终止密码子、poly A序列、第二ITR、调节序列和第二转座元件反向重复,或者由其组成。在一些实施方案中,构建体还可包含一个或更多个间隔区序列。本公开内容的一些示例性间隔区序列的长度为1至1500个核苷酸(包括其间的所有范围)。在一些实施方案中,间隔区序列可位于ITR、启动子、核定位序列、核酸酶、终止密码子、polyA序列、转座元件反向重复和/或调节元件的5’或3’。
F.AAV-sgRNA载体
在一些实施方案中,至少编码gRNA的第一序列和编码gRNA的第二序列可被包装到AAV载体中。在一些实施方案中,至少编码gRNA的第一序列、编码gRNA的第二序列和编码gRNA的第三序列可被包装到AAV载体中。在一些实施方案中,至少编码gRNA的第一序列、编码gRNA的第二序列、编码gRNA的第三序列和编码gRNA的第四序列可被包装到AAV载体中。在一些实施方案中,至少编码gRNA的第一序列、编码gRNA的第二序列、编码gRNA的第三序列、编码gRNA的第四序列和编码gRNA的第五序列可被包装到AAV载体中。在一些实施方案中,将编码gRNA的多个序列包装到AAV载体中。例如,可将编码gRNA的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个序列包装到AAV载体中。在一些实施方案中,编码gRNA的每个序列是不同的。在一些实施方案中,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个编码gRNA的序列相同。在一些实施方案中,所有编码gRNA的序列都相同。
在一些实施方案中,AAV载体是野生型AAV载体。在一些实施方案中,AAV载体包含一个或更多个突变。在一些实施方案中,AAV载体分离自或来源于血清型AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11,或其任意组合的AAV载体。
一些示例性AAV-sgRNA载体包含两个ITR(反向末端重复)序列,其位于包含sgRNA序列的中心序列区的侧翼。在一些实施方案中,ITR分离自或来源于血清型AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11,或其任意组合的AAV载体。在一些实施方案中,ITR分离自或来源于第一血清型的AAV载体,并且编码AAV-sgRNA载体的衣壳蛋白的序列分离自或来源于第二血清型的AAV载体。在一些实施方案中,第一血清型和第二血清型相同。在一些实施方案中,第一血清型和第二血清型不相同。在一些实施方案中,第一血清型是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10或AAV11。在一些实施方案中,第二血清型是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10或AAV11。在一些实施方案中,第一血清型是AAV2,并且第二血清型是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10或AAV11。在一些实施方案中,第一血清型是AAV2并且第二血清型是AAV9。
一些示例性AAV-sgRNA载体包含两个ITR(反向末端重复)序列,其位于包含gRNA序列的中心序列区域的侧翼。在一些实施方案中,ITR分离自或来源于血清型AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11,或其任意组合的AAV载体。在一些实施方案中,第一ITR分离自或来源于第一血清型的AAV载体,第二ITR分离自或来源于第二血清型的AAV载体,并且编码AAV-sgRNA载体的衣壳蛋白的序列分离自或来源于第三血清型的AAV载体。在一些实施方案中,第一血清型和第二血清型相同。在一些实施方案中,第一血清型和第二血清型不相同。在一些实施方案中,第一血清型、第二血清型和第三血清型相同。在一些实施方案中,第一血清型、第二血清型和第三血清型不相同。在一些实施方案中,第一血清型是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10或AAV11。在一些实施方案中,第二血清型是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10或AAV11。在一些实施方案中,第三血清型是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10或AAV11。在一些实施方案中,第一血清型是AAV2,第二血清型是AAV4并且第三血清型是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10或AAV11。在一些实施方案中,第一血清型是AAV2,第二血清型是AAV4并且第三血清型是AAV9。一些示例性AAV-sgRNA载体包含两个ITR(反向末端重复)序列,其位于包含sgRNA序列的中心序列区的侧翼。在一些实施方案中,ITR分离自或来源于血清型AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11,或其任意组合的AAV载体。在一些实施方案中,ITR包含AAV血清型的全长和/或野生型序列或者由其组成。在一些实施方案中,ITR包含AAV血清型的截短序列或者由其组成。在一些实施方案中,ITR包含AAV血清型的延长序列或者由其组成。在一些实施方案中,ITR包含与相同AAV血清型的野生型序列相比含有序列变异的序列或者由其组成。在一些实施方案中,序列变异包含替换、缺失、插入、倒位或转座中的一种或更多种。在一些实施方案中,ITR包含至少100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149或150个碱基对,或者由其组成。在一些实施方案中,ITR包含100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149或150个碱基对,或者由其组成。在一些实施方案中,ITR的长度为110±10个碱基对。在一些实施方案中,ITR的长度为120±10个碱基对。在一些实施方案中,ITR的长度为130±10个碱基对。在一些实施方案中,ITR的长度为140±10个碱基对。在一些实施方案中,ITR的长度为150±10个碱基对。在一些实施方案中,ITR的长度为115、145或141个碱基对。
在一些实施方案中,AAV-sgRNA载体可包含另外的元件以促进载体的包装和sgRNA的表达。在一些实施方案中,AAV-sgRNA载体可包含转座元件。在一些实施方案中,AAV-sgRNA载体可包含调节元件。在一些实施方案中,调节元件包含活化剂或阻遏物。在一些实施方案中,AAV-sgRNA序列可包含非功能或“填充”序列。本公开内容的一些示例性填充序列可与哺乳动物(包括人)的基因组序列具有一些(非零百分比的)同一性或同源性。或者,本公开内容的一些示例性填充序列可不与哺乳动物(包括人)的基因组序列具有同一性或同源性。本公开内容的一些示例性填充序列可包含天然存在的非编码序列或在将AAV载体施用于对象之后既不转录也不翻译的序列,或者由其组成。
在一些实施方案中,可针对在酵母、细菌、昆虫细胞或哺乳动物细胞中的产生对AAV-sgRNA载体进行优化。在一些实施方案中,可针对在人细胞中的表达对AAV-sgRNA载体进行优化。在一些实施方案中,可针对在杆状病毒表达系统中的表达对AAV-Cas9载体进行优化。
在一些实施方案中,AAV-sgRNA载体包含至少一个启动子。在一些实施方案中,AAV-sgRNA载体包含至少两个启动子。在一些实施方案中,AAV-sgRNA载体包含至少三个启动子。在一些实施方案中,AAV-sgRNA载体包含至少四个启动子。在一些实施方案中,AAV-sgRNA载体包含至少五个启动子。一些示例性启动子包括例如,免疫球蛋白轻链、免疫球蛋白重链、T细胞受体、HLA DQ a和/或DQβ、β-干扰素、白介素-2、白介素-2受体、MHC II类5、MHC II类HLA-Dra、β-肌动蛋白、肌肉肌酸激酶(MCK)、前清蛋白(运甲状腺素蛋白)、弹性蛋白酶I、金属硫蛋白(MTII)、胶原蛋白酶、白蛋白、甲胎蛋白、t-球蛋白、β-球蛋白、c-fos、c-HA-ras、胰岛素、神经细胞黏附分子(NCAM)、α1-抗胰蛋白酶、H2B(TH2B)组蛋白、小鼠和/或I型胶原蛋白、葡萄糖调节蛋白(GRP94和GRP78)、大鼠生长激素、人血清淀粉样蛋白A(SAA)、肌钙蛋白I(TN I)、血小板源性生长因子(PDGF)、迪谢内肌营养不良、SV40、多瘤、逆转录病毒、乳头瘤病毒、乙型肝炎病毒、人免疫缺陷病毒、巨细胞病毒(CMV)和长臂猿白血病病毒。另一些示例性启动子包括U6启动子、H1启动子和7SK启动子。
在一些实施方案中,AAV载体包含编码gRNA的第一序列和编码gRNA的第二序列,第一启动子驱动编码gRNA的第一序列的表达,并且第二启动子驱动编码gRNA的第二序列的表达。在一些实施方案中,第一启动子和第二启动子相同。在一些实施方案中,第一启动子和第二启动子不相同。在一些实施方案中,第一启动子和第二启动子选自H1启动子、U6启动子和7SK启动子。在一些实施方案中,编码gRNA的第一序列和编码gRNA的第二序列相同。在一些实施方案中,编码gRNA的第一序列和编码gRNA的第二序列不相同。
在一些实施方案中,AAV载体包含编码gRNA的第一序列、编码gRNA的第二序列和编码gRNA的第三序列,第一启动子驱动编码gRNA的第一序列的表达,第二启动子驱动编码gRNA的第二序列的表达,并且第三启动子驱动编码gRNA的第三序列的表达。在一些实施方案中,第一启动子、第二启动子和第三启动子中的至少两个相同。在一些实施方案中,第一启动子、第二启动子和第三启动子中的每一个均不相同。在一些实施方案中,第一启动子、第二启动子和第三启动子选自H1启动子、U6启动子和7SK启动子。在一些实施方案中,第一启动子是U6启动子。在一些实施方案中,第二启动子是H1启动子。在一些实施方案中,第三启动子是7SK启动子。在一些实施方案中,第一启动子是U6启动子、第二启动子是H1启动子,并且第三启动子是7SK启动子。在一些实施方案中,编码gRNA的第一序列、编码gRNA的第二序列和编码gRNA的第三序列相同。在一些实施方案中,编码gRNA的第一序列、编码gRNA的第二序列和编码gRNA的第三序列不相同。
在一些实施方案中,AAV载体包含编码gRNA的第一序列、编码gRNA的第二序列、编码gRNA的第三序列和编码gRNA的第四序列,第一启动子驱动编码gRNA的第一序列的表达,第二启动子驱动编码gRNA的第二序列的表达,第三启动子驱动编码gRNA的第三序列的表达,并且第四启动子驱动编码gRNA的第四序列的表达。在一些实施方案中,第一启动子、第二启动子、第三启动子和第四启动子中的至少两个相同。在一些实施方案中,第一启动子、第二启动子、第三启动子和第四启动子中的每一个均不相同。在一些实施方案中,第一启动子、第二启动子、第三启动子和第四启动子中的每一个选自H1启动子、U6启动子和7SK启动子。在一些实施方案中,编码gRNA的第一序列、编码gRNA的第二序列、编码gRNA的第三序列和编码gRNA的第四序列相同。在一些实施方案中,编码gRNA的第一序列、编码gRNA的第二序列、编码gRNA的第三序列和编码gRNA的第四序列不相同。
在一些实施方案中,AAV载体包含编码gRNA的第一序列、编码gRNA的第二序列、编码gRNA的第三序列、编码gRNA的第四序列和编码gRNA的第五序列,第一启动子驱动编码gRNA的第一序列的表达,第二启动子驱动编码gRNA的第二序列的表达,第三启动子驱动编码gRNA的第三序列的表达,第四启动子驱动编码gRNA的第四序列的表达,并且第五启动子驱动编码gRNA的第五序列的表达。在一些实施方案中,第一启动子、第二启动子、第三启动子、第四启动子和第五启动子中的至少两个相同。在一些实施方案中,第一启动子、第二启动子、第三启动子、第四启动子和第五启动子中的每一个均不相同。在一些实施方案中,第一启动子、第二启动子、第三启动子和第四启动子中的每一个均不相同。在一些实施方案中,第一启动子、第二启动子、第三启动子、第四启动子和第五启动子中的每一个选自H1启动子、U6启动子和7SK启动子。在一些实施方案中,编码gRNA的第一序列、编码gRNA的第二序列、编码gRNA的第三序列、编码gRNA的第四序列和编码gRNA的第五序列相同。在一些实施方案中,编码gRNA的第一序列、编码gRNA的第二序列、编码gRNA的第三序列、编码gRNA的第四序列和编码gRNA的第五序列不相同。
IV.药物组合物和递送方法
本文中公开的任何AAV病毒颗粒、AAV载体、多核苷酸或编码多核苷酸的载体均可被配制成药物组合物。在一些实施方案中,药物组合物还可包含一种或更多种可药用载体、稀释剂或赋形剂。在本发明方法中使用的任何药物组合物可包含作为冻干制剂或水溶液形式的可药用载体、赋形剂或稳定剂。
药物组合物中的载体必须是在以下意义上的“可接受的”:其与组合物的活性成分相容,并且优选能够稳定活性成分并且对待治疗的对象无害。例如,“可药用”可以是指组合物包含的这样的分子实体和其他成分:当将其施用于哺乳动物(例如,人)时在生理上是可耐受的并且通常不产生不良反应。在一些实例中,本文中公开的在药物组合物中使用的“可药用”载体可以是由联邦或州政府监管机构批准或者在美国药典或其他公认的药典中列出用于哺乳动物,并且更特别是用于人的那些。
可药用载体(包括缓冲剂)在本领域中是公知的,并且可包含磷酸盐、柠檬酸盐和其他有机酸;抗氧化剂,包括抗坏血酸和甲硫氨酸;防腐剂;低分子量多肽;蛋白质,例如血清白蛋白、明胶或免疫球蛋白;氨基酸;疏水性聚合物;单糖;二糖;以及其他碳水化合物;金属络合物;和/或非离子表面活性剂。参见例如Remington:The Science and Practice ofPharmacy 20th Ed.(2000)Lippincott Williams and Wilkins,Ed.K.E.Hoover.
在一些实施方案中,药物组合物或制剂可通过皮下、肌内、静脉内、腹膜内、心内、关节内或海绵体内注射进行施用。在一些实施方案中,药物组合物或制剂用于肠胃外施用,例如静脉内、脑室内注射、小脑延髓池内注射、实质内注射、腹膜内、心内、关节内或海绵体内注射,或其组合。这样的可药用载体可以是无菌液体,例如水和油,包括石油、动物、植物或合成来源的那些,例如花生油、大豆油、矿物油等。盐水溶液和右旋糖水溶液、聚乙二醇(polyethylene glycol,PEG)和甘油溶液也可用作液体载体,特别是对于可注射溶液。本文中公开的药物组合物还可包含另外的成分,例如防腐剂、缓冲剂、张力剂、抗氧化剂和稳定剂、非离子润湿剂或澄清剂、增黏剂等。本文中所述的药物组合物可以以单个单位剂量或多剂量的形式进行包装。
适合于肠胃外施用的制剂包括可包含抗氧化剂、缓冲剂、抑菌剂和使制剂与预期接受者的血液等张的溶质的水性和非水性无菌注射溶液剂;以及可包含助悬剂和增稠剂的水性和非水性无菌混悬剂。可对水溶液进行适当的缓冲(优选pH为3至9)。无菌条件下合适的肠胃外制剂的制备可通过本领域技术人员公知的标准制药技术容易地实现。
用于体内施用的药物组合物应该是无菌的。这通过例如经由无菌过滤膜过滤来容易地实现。通常通过将所需量的AAV颗粒和以上列举的多种其他成分(根据需要)并入到适当的溶剂中,随后过滤灭菌来制备无菌可注射溶液剂。一般而言,通过将灭菌活性成分并入到无菌载剂中来制备分散体,所述无菌载剂包含基础分散介质和所需要的来自以上列举的那些的其他成分。在用于制备无菌可注射溶液的无菌粉末的情况下,优选的制备方法是真空干燥和冷冻干燥技术,其产生活性成分加上来自其之前无菌过滤溶液的任何另外的期望成分的粉末。
本文中公开的药物组合物还可包含其他成分,例如稀释剂和辅料。可接受的载体、稀释剂和辅料对接受者是无毒的,并且优选在所使用的剂量和浓度下是惰性的,并且包括缓冲剂,例如磷酸盐、柠檬酸盐或其他有机酸;抗氧化剂,例如抗坏血酸;低分子量多肽;蛋白质,例如血清白蛋白、明胶或免疫球蛋白;亲水性聚合物,例如聚乙烯吡咯烷酮;氨基酸,例如甘氨酸、谷氨酰胺、天冬酰胺、精氨酸或赖氨酸;单糖、二糖和其他碳水化合物,包括葡萄糖、甘露糖或葡聚糖;螯合剂,例如EDTA;糖醇例如甘露糖醇或山梨糖醇;成盐的反离子,例如钠;和/或非离子表面活性剂例如吐温(Tween)、普朗尼克(pluronic)或聚乙二醇。
对于临床应用,药物组合物以适于预期应用的形式制备。一般而言,这需要制备基本上不含热原以及可能对人或动物有害的其他杂质的组合物。
使用合适的盐和缓冲液以使药物、蛋白质或递送载体稳定并允许被靶细胞摄取。本公开内容的水性组合物包含溶解或分散在可药用载体或水性介质中的有效量的药物、载体或蛋白质。短语“可药用的或药理学上可接受的”是指当向动物或人施用时不产生不利的、变应性的或其他不良反应的分子实体和组合物。本文中使用的“可药用载体”包括用于配制药物(例如适合向人施用的药物)的可接受的溶剂、缓冲剂、溶液、分散介质、包衣剂、抗细菌剂和抗真菌剂、等张剂和吸收延迟剂等。这样的介质和物质用于药物活性物质的用途是本领域公知的。可使用与本公开内容的活性成分不相容的任何常规介质或物质在治疗性组合物中的用途。补充的活性成分也可并入组合物中,前提是它们不使组合物的载体或细胞失活。
在一些实施方案中,本公开内容的活性组合物可包含经典的药物制剂。根据本公开内容的这些组合物的施用可通过任何常见途径进行,只要可通过该途径达到靶组织即可,但通常包括全身施用。这包括经口、经鼻或经颊。或者,施用可通过皮内、皮下、肌内、腹膜内或静脉内注射,或通过直接注射到肌组织中进行。如上所述,这样的组合物通常将作为可药用组合物施用。
活性化合物也可经肠胃外或腹膜内施用。例如,作为游离碱或药理学上可接受的盐的活性化合物的溶液可在水中与表面活性剂(例如羟丙基纤维素)适当地混合来制备。分散体也可在甘油、液体聚乙二醇、及其混合物中以及在油中制备。在普通的储存和使用条件下,这些制备物通常包含防腐剂以防止微生物的生长。
适于可注射使用的药物形式包括例如无菌水溶液或分散体和用于临时制备无菌可注射溶液或分散体的无菌粉末。一般而言,这些制备物是无菌的和流动的,达到容易注射的程度。制备物在制造和储存条件下应当是稳定的,并且应当防止微生物(例如细菌和真菌)的污染作用。合适的溶剂或分散介质可包含例如水、乙醇、多元醇(例如甘油、丙二醇和液体聚乙二醇等),其合适的混合物和植物油。可通过例如使用包衣剂(例如卵磷脂),通过在分散体的情况下维持所需的粒径并通过使用表面活性剂来保持适当的流动性。防止微生物作用可通过多种抗细菌和抗真菌剂,例如对羟基苯甲酸酯、氯丁醇、苯酚、山梨酸、硫柳汞等来实现。在许多情况下,优选包含等张剂,例如糖或氯化钠。可注射组合物的延长吸收可通过在组合物中使用延迟吸收的物质(例如单硬脂酸铝和明胶)来实现。
可通过将适量的活性化合物以及所期望的任何其他成分(例如如上所列举的)一起并入溶剂中,随后过滤灭菌来制备无菌可注射溶液。一般而言,通过将多种灭菌的活性成分并入无菌载剂来中制备分散体,所述无菌载剂包含基础分散介质和期望的其他成分(例如如上所列举的)。在用于制备无菌可注射溶液的无菌粉末的情况下,优选的制备方法包括真空干燥和冷冻干燥技术,其产生活性成分加上来自其之前无菌过滤溶液的任何另外的期望成分的粉末。
在一些实施方案中,本公开内容的组合物被配制成中性或盐形式。可药用盐包括例如来源于无机酸(例如,盐酸或磷酸),或来源于有机酸(例如,乙酸、草酸、酒石酸、苦杏仁酸等)的(与蛋白质的游离氨基形成的)酸加成盐。与蛋白质的游离羧基形成的盐也可来源于无机碱(例如,氢氧化钠、氢氧化钾、氢氧化铵、氢氧化钙或氢氧化铁)或来源于有机碱(例如,异丙胺、三甲胺、组氨酸、普鲁卡因)等。
在配制时,优选以与剂量制剂相容的方式和以作为治疗有效量的这样的量施用溶液。制剂可易于以多种剂型例如可注射溶液剂、药物释放胶囊剂等施用。例如,对于水溶液中的肠胃外施用,通常对溶液进行适当地缓冲,并且首先例如用足够的盐水或葡萄糖使液体稀释剂等张。这样的水溶液可用于例如静脉内、肌内、皮下和腹膜内施用。优选地,特别是根据本公开内容,使用本领域技术人员已知的无菌水性介质。例如,可将单剂量溶解在1ml的等张NaCl溶液中,并且添加至1000ml的皮下输液流体(hypodermoclysis fluid)或在所推荐的输注部位注射(参见例如“Remington’s Pharmaceutical Sciences”第15版,第1035至1038页和第1570至1580页)。根据被治疗的对象的病症,剂量将必然发生一些变化。在任何情况下,负责施用的人将确定个体对象的适当剂量。此外,对于人施用,制备物应满足FDA生物制品标准办公室(FDA Office ofBiologics standards)要求的无菌性、热原性、整体安全性和纯度标准。
在一些实施方案中,可使用过继细胞转移(adoptive cell transfer,ACT)将本文中所述的核苷酸编辑Cas9和gRNA递送至患者。在过继细胞转移中,一种或更多种表达构建体离体提供给源自患者(自体)或源自除患者之外的一个或更多个个体(同种异体)的细胞。随后将细胞引入或重新引入患者中。因此,在一些实施方案中,在将细胞引入或重新引入患者中之前,将一种或更多种编码核苷酸编辑Cas9和靶向肌养蛋白剪接位点的指导RNA的核酸离体提供给细胞。
在多个实施方案中,本文中公开的组合物在施用于有需要的对象之后可有效治疗心脏病。在另一些实施方案中,本文中公开的组合物在施用于有需要的对象之后可有效治疗一种或更多种心肌病。在另一些实施方案中,本文中公开的组合物在施用于有需要的对象之后可有效治疗DCM。在另一些实施方案中,本文中公开的组合物在施用于有需要的对象之后可有效改善DCM的至少一种症状。
本文中的合适对象包括人、家畜动物、伴侣动物、实验室动物或动物园动物。在一些实施方案中,对象可以是啮齿动物,例如小鼠、大鼠、豚鼠等。在一些实施方案中,对象可以是家畜动物。合适的家畜动物的一些非限制性实例可包括猪、牛、马、山羊、绵羊、美洲驼和羊驼。在一些实施方案中,对象可以是伴侣动物。伴侣动物的一些非限制性实例可包括宠物,例如狗、猫、兔和鸟。在另一个实施方案中,对象可以是动物园动物。本文中使用的“动物学动物”是指可见于动物园中的动物。这样的动物可包括非人灵长类、大型猫科动物、狼和熊。在一个具体实施方案中,动物是实验室动物。实验室动物的一些非限制性实例可包括啮齿动物、犬科动物、猫科动物和非人灵长类。在某些实施方案中,动物是啮齿动物。啮齿动物的一些非限制性实例可包括小鼠、大鼠、豚鼠等。在一些优选实施方案中,对象是人。
在多个实施方案中,有需要的对象可能已被诊断出患有至少一种心脏病。在一些方面中,对象可能患有一种或更多种心肌病。在一些实施方案中,对象可能患有DCM。在一些实施方案中,对象可能具有DCM的至少一种症状。在一些方面中,DCM的症状可以是疲劳。在一些实施方案中,DCM的症状可以是呼吸困难。在一些实施方案中,DCM的症状可以是水肿。在一些实施方案中,DCM的症状可以是腹水。在一些实施方案中,DCM的症状可以是胸痛。在另一些方面中,DCM的症状可以是心脏杂音。
在一些实施方案中,与具有相同疾病状况和预测结局的未经治疗对象中的心肌病诱导的心脏纤维化相比,施用本文中公开的组合物的方法可降低和/或逆转心肌病诱导的心脏纤维化。在一些实施方案中,与具有相同疾病状况和预测结局的未径治疗对象中的心肌病诱导的左心室扩张相比,施用本文中公开的组合物的方法可降低和/或逆转心肌病诱导的左心室扩张。
本公开内容的另一些实施方案是将本文中公开的组合物施用于有需要的对象的方法,其中施用治疗心肌病(例如,DCM)。本公开内容的另一些实施方案是将本文中公开的组合物施用于有需要的对象的方法,其中心肌病(例如,DCM)的至少一种症状在施用之后一个月内改善至少25%。
在多个实施方案中,本文中公开的组合物可通过肠胃外施用来施用。本文中使用的“通过肠胃外施用”是指通过经由消化道以外的途径施用本文中公开的组合物。在一些实施方案中,本文中公开的组合物可通过肠胃外注射施用。在一些方面中,通过肠胃外注射施用公开的组合物可以是通过皮下、肌内、静脉内、腹膜内、心内、关节内或海绵体内注射。在一些实施方案中,通过肠胃外注射施用公开的组合物可通过本领域已知的缓慢或推注方法。在一些实施方案中,通过肠胃外注射的施用途径可由靶位置确定。在一些实施方案中,本文中公开的组合物可被配制成用于通过心内注射进行肠胃外施用。在一些实施方案中,本文中公开的组合物可被配制成用于通过基于导管的冠状动脉内输注进行肠胃外施用。在一些实施方案中,本文中公开的组合物可被配制成用于通过心包注射进行肠胃外施用。
在多个实施方案中,待施用的本文中公开的组合物的剂量没有特别限制,并且可根据情况例如预防性和/或治疗性治疗的目的、疾病类型、对象的体重或年龄、疾病的严重程度等适当地选择。在一些实施方案中,本文中公开的组合物的剂量的施用可包括治疗有效量的本文中公开的组合物。本文中使用的术语“治疗有效”是指治疗心脏病、降低与心脏病相关的至少一种症状的表现、逆转/预防心脏纤维化、逆转/预防至少一个心室的扩张、降低心脏总重量、改善心脏功能、提高存活能力,或其组合而施用的组合物的量。
在一些实施方案中,可将本文中公开的组合物施用于有此需要的对象一次。在一些实施方案中,可将本文中公开的组合物施用于有此需要的对象多于一次。在一些实施方案中,本文中公开的组合物的第一次施用之后可进行本文中公开的组合物的第二次施用。在一些实施方案中,本文中公开的组合物的第一次施用之后可进行本文中公开的组合物的第二次和第三次施用。在一些实施方案中,本文中公开的组合物的第一次施用之后可进行本文中公开的组合物的第二次、第三次和第四次施用。在一些实施方案中,本文中公开的组合物的第一次施用之后可进行本文中公开的组合物的第二次、第三次、第四次和第五次施用。
可向有此需要的对象施用组合物的次数可取决于医学专业人员的判断、心脏病的严重程度以及对象对制剂的响应。在一些实施方案中,本文中公开的组合物可连续施用;或者,可暂时降低所施用药物的剂量或暂时暂停一定长度的时间(即“药物假期(drugholiday)”)。在一些方面中,药物假期的长度可在2天至1年之间变化,仅作为示例,包括2天、1周、1个月、6个月和1年。在另一个方面中,在药物假期期间剂量降低可以是10%至100%,仅作为示例,包括10%、25%、50%、75%和100%。
在多个实施方案中,本文中公开的组合物的期望日剂量可以以单剂量或者作为同时(或在短时间段内)或以适当的间隔施用的分开剂量的形式呈现。在另一些实施方案中,本文中公开的组合物的施用可以以约每天一次、约每天两次、约每天三次施用于对象。在另一些实施方案中,本文中公开的组合物的施用可以以每天至少一次、每天至少一次持续约2天、每天至少一次持续约3天、每天至少一次持续约4天、每天至少一次持续约5天、每天至少一次持续约6天、每天至少一次持续约1周、每天至少一次持续约2周、每天至少一次持续约3周、每天至少一次持续约4周、每天至少一次持续约8周、每天至少一次持续约12周、每天至少一次持续约16周、每天至少一次持续约24周、每天至少一次持续约52周及其后施用于对象。在一个优选实施方案中,本文中公开的组合物的施用可以以约4周一次施用于对象。
在一些实施方案中,可首先施用公开的组合物,随后进行一种或更多种不同的组合物或治疗方案的后续施用。在另一些实施方案中,公开的组合物可在施用一种或更多种不同的组合物或治疗方案之后施用。
V.药盒
本公开内容的一些实施方案包括用于包装和运输本文中公开的CRISPR/Cas9系统和/或新的gRNA或本文中公开的已知gRNA并且还包含至少一个容器的药盒。
在一些实施方案中,药盒可另外地包含在本文中所述的任何方法中使用CRISPR/Cas9系统、gRNA和或AAV颗粒的说明书。所包含的说明书可包含向对象施用如本文中公开的药物组合物以在对象中实现预期活性的描述。该药盒还可包含基于鉴定对象是否需要治疗来选择适合治疗对象的描述。在一些实施方案中,说明书可包含向患有或怀疑患有心肌病的对象施用本文中公开的药物组合物的描述。
VI.定义
术语“核苷酸编辑Cas9”是指与碱基编辑器或先导编辑器融合的Cas9蛋白。Cas9的一些非限制性实例包括SpCas9、SpCas9-NG、SaCas9、SaCas9-KKH、SauCas9和SlugCas9。碱基编辑器的一些非限制性实例包括ABEmax、ABE8e、ABE8eV106W、ABE8.20-m。
术语“核酸”或“多核苷酸”是指单链或双链形式的脱氧核糖核酸(deoxyribonucleic acid,DNA)或核糖核酸(ribonucleic acid,RNA)及其聚合物。除非特别限定,否则该术语涵盖含有天然核苷酸的已知类似物的核酸,其具有与参考核酸相似的结合特性并且以与天然存在的核苷酸相似的方式代谢。除非另有说明,否则特定的核酸序列还隐含地涵盖其经保守修饰的变体(例如,简并密码子替换)、等位基因、直系同源物、SNP和互补序列以及明确指出的序列。具体地,简并密码子替换可通过产生其中一个或更多个选定(或全部)密码子的第三位被混合碱基和/或脱氧肌苷残基替换的序列来实现(Batzeret al.,Nucleic Acid Res.19:5081(1991);Ohtsuka et al.,J.Biol.Chem.260:2605-2608(1985);和Rossolini et al.,Mol.Cell.Probes 8:91-98(1994))。
术语“多核苷酸”、“核酸”和“转基因”在本文中也可互换使用,以指所有形式的核酸、寡核苷酸,包括脱氧核糖核酸(DNA)和核糖核酸(RNA)及其聚合物。多核苷酸包括基因组DNA、cDNA和反义DNA,以及剪接或未剪接的mRNA、rRNA、tRNA和抑制性DNA或RNA(RNAi,例如小或短发夹(sh)RNA、微RNA(miRNA)、小或短干扰(si)RNA、反式剪接RNA或反义RNA)。多核苷酸可包括天然存在的、合成的和经有意修饰或改变的多核苷酸(例如,变体核酸)。多核苷酸可以是单链、双链或三链、线性或环状的,并且可具有任何合适的长度。在讨论多核苷酸时,可根据在5’至3’方向上提供序列的惯例在本文中描述特定多核苷酸的序列或结构。核酸“主链”可由多种键联组成,键联包括糖-磷酸二酯键联、肽-核酸键(“肽核酸”或PNA;PCTNo.WO 95/32305)、硫代磷酸酯键联、甲基膦酸酯键联,或其组合中的一个或更多个。核酸的糖部分可以是核糖、脱氧核糖或具有取代例如2’甲氧基或2’卤化物取代的类似化合物。含氮碱基可以是常规碱基(A、G、C、T、U)、其类似物(例如经修饰的尿苷,例如5-甲氧基尿苷、假尿苷或N1-甲基假尿苷,或其他);肌苷;嘌呤或嘧啶的衍生物(例如,N4-甲基脱氧鸟苷、脱氮或氮杂嘌呤、脱氮或氮杂嘧啶、在第5或6位具有取代基的嘧啶碱基(例如,5-甲基胞嘧啶)、在第2、6或8位具有取代基的嘌呤碱基、2-氨基-6-甲基氨基嘌呤、O6-甲基鸟嘌呤、4-硫代-嘧啶、4-氨基-嘧啶、4-二甲基肼-嘧啶和O4-烷基-嘧啶;美国专利5,378,825和PCT No.WO93/13121)。关于一般性讨论参见The Biochemistry of the Nucleic Acids 5-36,Adamset al.,ed.,11th ed.,1992)。核酸可包含一个或更多个“无碱基”残基,其中主链不包含聚合物位置的含氮碱基(美国专利5,585,481)。核酸可仅包含常规RNA或DNA糖、碱基和键联,或者可包含常规组分和取代物(例如,具有2’甲氧基键联的常规碱基,或者含有常规碱基和一个或更多个碱基类似物二者的聚合物)二者。核酸包括“锁核酸”(“locked nucleicacid,LNA),一种含有具有锁定在模拟糖构象的RNA中的双环呋喃糖单元的一个或更多个LNA核苷酸单体的类似物,其增强对互补RNA和DNA序列的杂交亲和力(Vester and Wengel,2004,Biochemistry 43(42):13233-41)。RNA和DNA具有不同的糖部分,并且可因RNA中尿嘧啶或其类似物以及DNA中胸腺嘧啶或其类似物的存在而不同。
编码多肽的核酸通常包含编码该多肽的开放阅读框。除非另有说明,否则特定的核酸序列还包括简并密码子替换。
核酸可包含与开放阅读框可操作地连接的一个或更多个表达控制或调节元件,其中一个或更多个调节元件被配置为指导哺乳动物细胞中由开放阅读框编码的多肽的转录和翻译。表达控制/调节元件的一些非限制性实例包括转录起始序列(例如,启动子、增强子、TATA盒等)、翻译起始序列、mRNA稳定性序列、poly A序列、分泌序列等。表达控制/调节元件可从任何合适的生物体的基因组获得。
本文中使用的“AAV”是指腺相关病毒载体。本文中使用的“AAV”是指任何AAV血清型和变体,其包括但不限于AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh10(参见,例如US 9,790,472的SEQ ID NO:81,该专利通过引用整体并入本文)、AAVrh74(参见,例如US2015/0111955的SEQ ID NO:1,该专利通过引用整体并入本文)、AAV9载体、AAV9P载体(也称为AAVMYO,参见Weinmann et al.,2020,Nature Communications,11:5432),以及Tabebordbar et al.,2021,Cell,184:1-20中描述的Myo-AAV载体(例如,MyoAAV 1A、2A、3A、4A、4C或4E),其中AAV后面的数字表示AAV血清型。术语“AAV”还可以是指任何已知的AAV(载体)系统。在一些实施方案中,AAV载体是单链AAV(ssAAV)。在一些实施方案中,AAV载体是双链AAV(dsAAV)。AAV载体或其血清型的任何变体,例如自身互补AAV(scAAV)载体涵盖在通用术语AAV载体、AAV1载体等内。关于多种AAV载体的详细讨论参见例如,McCarty etal.,Gene Ther.2001;8:1248-54,Naso et al.,BioDrugs 2017;31:317-334,以及其中引用的参考文献。在结构上,AAV是具有二十面体衣壳的小的(25nm)单DNA链无包膜病毒。在其衣壳蛋白的组成和结构上不同的天然存在或经改造AAV血清型和变体具有不同的趋向性,即转导不同细胞类型的能力。当与活性启动子组合时,这种趋向性限定了基因表达的位点。
“指导RNA”和简称“指导”在本文中可互换使用,以指crRNA(也称为CRISPR RNA),或crRNA和trRNA的组合(也称为tracrRNA)。crRNA和trRNA可作为单RNA分子(单指导RNA,sgRNA)或在两个单独的RNA分子(双指导RNA,dgRNA)中相关联。“指导RNA”是指每一种类型。trRNA可以是天然存在的序列,或者是与天然存在的序列相比具有修饰或变化的trRNA序列。为了清楚起见,并且除非另有明确说明,否则本文中使用的术语“指导RNA”或“指导”可以是指(包含A、C、G和U核苷酸)的RNA分子或编码这样的(包含A、C、G和T核苷酸)的RNA分子或其互补序列的DNA分子。一般而言,在编码指导RNA的DNA核酸构建体的情况下,本文中所述的任何RNA序列中的U残基可被T残基替代,并且在由本文中所述的任何DNA序列编码的指导RNA构建体的情况下,T残基可被U残基替代。
Cas9的靶序列包括基因组DNA的正链和负链二者(即给定序列和序列的反向互补),因为Cas9的核酸底物是双链核酸。因此,当指导序列被称为“与靶序列互补”时,应当理解指导序列可引导指导RNA与靶序列的反向互补结合。因此,在一些实施方案中,当指导序列结合靶序列的反向互补时,除了指导序列中T被U替换之外,指导序列与靶序列的某些核苷酸相同(例如,不包含PAM的靶序列)。
“启动子”是指通常位于编码序列的上游(5’)通过提供对RNA聚合酶和正确转录所需的其他因子的识别来指导和/或控制编码序列的表达的核苷酸序列。“启动子”包含最小启动子,其是包含TATA盒和任选地用于指定转录起始位点的其他序列的短DNA序列,向其添加调节元件以控制表达。
“增强子”是可刺激转录活性的DNA序列并且可以是启动子的固有元件或增强表达水平或组织特异性的异源元件。其能够以任一方向(5’->3’或3’->5’)运行,并且即使位于启动子的上游或下游也能够发挥作用。
启动子和/或增强子可完全来源于天然基因,或者由来源于自然界中存在的不同元件的不同元件构成,或者甚至包含合成DNA区段。启动子或增强子可包含参与蛋白质因子结合的DNA序列,所述蛋白质因子调节/控制响应于刺激、生理或发育条件的转录起始的有效性。
一些非限制性实例包括SV40早期启动子、小鼠乳腺肿瘤病毒LTR启动子;腺病毒主要晚期启动子(adenovirus major late promoter,Ad MLP);单纯疱疹病毒(HSV)启动子、巨细胞病毒(CMV)启动子例如CMV立即早期启动子区(CMVIE)、劳斯肉瘤病毒(rous sarcomavirus,RSV)启动子、pol II启动子、pol III启动子、合成启动子、杂合启动子等。另外,发现来源于非病毒基因例如鼠金属硫蛋白基因的序列也将用于本文。一些示例性组成型启动子包括针对编码某些组成型或“管家”功能的以下基因的启动子:次黄嘌呤磷酸核糖基转移酶(hypoxanthine phosphoribosyl transferase,HPRT)、二氢叶酸还原酶(dihydrofolatereductase,DHFR)、腺苷脱氨酶、磷酸甘油激酶(phosphoglycerol kinase,PGK)、丙酮酸激酶、磷酸甘油变位酶、肌动蛋白启动子,以及本领域技术人员已知的另一些组成型启动子。另外,许多病毒启动子在真核细胞中组成型地发挥作用。这些包括:SV40的早期和晚期启动子;Moloney白血病病毒和其他逆转录病毒的长末端重复(LTR);以及单纯疱疹病毒的胸苷激酶启动子等。因此,任何上文提及的组成型启动子均可用于控制异源基因插入物的转录。
本文中使用的“转基因”方便地是指旨在或已经引入到细胞或生物体中的核酸序列/多核苷酸。转基因包括任何核酸,例如编码抑制性RNA或多肽或蛋白质的基因,并且相对于天然存在的AAV基因组序列通常是异源的。
术语“转导”是指通过载体(例如,病毒颗粒)的方式将核酸序列引入到细胞或宿主生物体中。因此,通过病毒颗粒将转基因引入到细胞中可被称为细胞的“转导”。转基因可被或可不被整合到经转导细胞的基因组核酸中。如果引入的转基因整合到接受体细胞或生物体的核酸(基因组DNA)中,则其可稳定地维持在该细胞或生物体中,并进一步传递至接受体细胞或生物体的子代细胞或生物体或者由其遗传。最后,引入的转基因可存在于接受体细胞或宿主生物体的染色体外,或仅短暂存在。因此,“经转导的细胞”是通过转导的方式将转基因引入其中的细胞。因此,“经转导的”细胞是其中已引入转基因的细胞或其后代。经转导的细胞可以增殖、转录转基因并表达所编码的抑制性RNA或蛋白质。对于基因治疗用途和方法,经转导的细胞可以在哺乳动物中。
当核酸/转基因被置于与另一核酸序列的功能关系中时,该核酸/转基因是“可操作连接的”。编码RNAi或多肽的核酸/转基因或者指导多肽表达的核酸可包含诱导型启动子或用于控制所编码多肽的转录的组织特异性启动子。与表达控制元件可操作地连接的核酸也可被称为表达盒。
本文中使用的术语“修饰”或“变体”及其语法变化形式意指核酸、多肽或其子序列偏离参考序列。因此,经修饰序列和变体序列可具有与参考序列基本相同、比参考序列更高或更低的表达、活性或功能,但至少保留参考序列的部分活性或功能。变体的特定类型是突变体蛋白,其是指由具有突变例如错义或无义突变的基因编码的蛋白质。
一般而言,“CRISPR系统”总体上是指涉及CRISPR相关(“Cas”)基因的表达或对其活性进行指导的转录物和其他元件,包括编码Cas基因的序列、tracr(反式激活CRISPR)序列(例如,tracrRNA或活性部分tracrRNA)、tracr伴侣序列(包括“同向重复(directrepeat)”,以及在内源性CRISPR系统背景下经tracrRNA加工的部分同向重复)、指导序列(在内源性CRISPR系统的背景下也称为“间隔区”)和/或来自CRISPR基因座的其他序列和转录物。
本文中使用的“间隔区序列”有时在本文中和文献中也称为“间隔区”、“原间隔区”、“指导序列”或“靶向序列”,是指指导RNA内与靶序列互补并且发挥功能以将指导RNA引导至靶序列以被Cas9切割的序列。为了清楚起见,并且除非另外具体说明,否则本文中使用的术语“间隔区序列”、“间隔区”、“原间隔区”、“指导序列”或“靶向序列”可以是指(包含A、C、G和U核苷酸)的RNA分子或编码这样的(包含A、C、G和T核苷酸)的RNA分子或其互补序列的DNA分子。
“核酸”或“多核苷酸”变体是指与野生型相比已被遗传改变的经修饰序列。可对序列进行遗传修饰而不改变所编码的蛋白质序列。或者,可对序列进行遗传修饰以编码变体蛋白质。核酸或多核苷酸变体还可以指组合序列,其已被密码子修饰以编码仍保留与参考序列(例如野生型蛋白质序列)至少部分序列同一性的蛋白质,并且还已被密码子修饰以编码变体蛋白质。例如,将改变这样的核酸变体的一些密码子而不改变由其编码的蛋白质的氨基酸,并且该核酸变体的一些密码子将被改变,这反过来又改变了由其编码的蛋白质的氨基酸。
术语“肽”、“多肽”和“蛋白质”可互换使用,并且是指由通过肽键共价连接的氨基酸残基构成的化合物。蛋白质或肽必须包含至少两个氨基酸,并且对可包含蛋白质序列或肽序列的氨基酸最大数目没有限制。多肽包括包含通过肽键彼此连接的两个或更多个氨基酸的任何肽或蛋白质。本文中使用的该术语是指短链(例如其在本领域中通常也被称为肽、寡肽和寡聚体)和更长的链(其在本领域中通常被称为蛋白质,其中有很多类型)二者。“多肽”包括例如生物活性片段、基本上同源的多肽、寡肽、同二聚体、异二聚体、多肽的变体、经修饰的多肽、衍生物、类似物、融合蛋白等。多肽包括天然肽、重组肽,或其组合。本文中公开的由“核酸”或“多核苷酸”或“转基因”编码的“多肽”包括部分或全长天然序列,如天然存在的野生型和功能性多态性蛋白质、其功能性子序列(片段),及其序列变体,只要多肽保留一定程度的功能或活性即可。因此,在本公开内容的方法和用途中,由核酸序列编码的这样的多肽不需要与所治疗哺乳动物中有缺陷的或者其活性、功能或表达不足、缺失或不存在的内源性蛋白相同。
氨基酸修饰的一个实例是保守氨基酸替换或缺失。在一些具体实施方案中,经修饰序列或变体序列保留了未经修饰序列(例如,野生型序列)的至少部分功能或活性。
氨基酸修饰的另一个实例是将靶向肽引入到病毒颗粒的衣壳蛋白中。已确定了将重组病毒载体或纳米粒靶向多种器官和组织的肽。
分子的“变体”是与天然分子的序列基本上相似的序列。对于核苷酸序列,变体包括由于遗传密码的简并性而编码与天然蛋白质相同的氨基酸序列的那些序列。例如这些天然存在的等位基因变体可使用分子生物学技术(如例如使用聚合酶链式反应(polymerasechain reaction,PCR)和杂交技术)确定。变体核苷酸序列还包括合成来源的核苷酸序列,例如如通过使用定点突变产生的那些(其编码天然蛋白质),以及编码具有氨基酸替换的多肽的那些。一般而言,本公开内容的核苷酸序列变体将与天然(内源性)核苷酸序列具有至少40%、50%、60%至70%,例如71%、72%、73%、74%、75%、76%、77%、78%至79%,通常至少80%,例如81%至84%,至少85%,例如86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%至98%的序列同一性。在某些实施方案中,变体是生物功能性的(即,保留野生型5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%的活性或功能)。
特定核酸序列的“保守变异”是指编码相同或基本上相同的氨基酸序列的那些核酸序列。由于遗传密码的简并性,大量的功能相同的核酸编码任何给定的多肽。例如,密码子CGT、CGC、CGA、CGG、AGA和AGG均编码氨基酸精氨酸。因此,在其中精氨酸由密码子指定的每个位置处,该密码子可被改变为在不改变所编码蛋白质的情况下所描述的任何相应密码子。这样的核酸变异是“沉默变异”,其是一种“保守修饰变异”。除非另有说明,否则本文中所述的编码多肽的每个核酸序列还描述了每个可能的沉默变异。本领域技术人员将认识到,核酸中的每个密码子(除了ATG,其通常是甲硫氨酸的唯一密码子)可通过标准技术进行修饰以产生功能相同的分子。因此,编码多肽的核酸的每个“沉默变异”隐含在每个描述的序列中。
术语多核苷酸序列的“显著同一性”意指多核苷酸包含与使用标准参数,使用所述比对程序之一的参考序列相比具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%或79%,或至少80%、81%、82%、83%、84%、85%、86%、87%、88%或89%,或至少90%、91%、92%、93%或94%,或甚至至少95%、96%、97%、98%或99%序列同一性的序列。本领域技术人员将认识到,通过考虑密码子简并性、氨基酸相似性、阅读框定位等,可适当调整这些值以确定由两个核苷酸序列编码的蛋白质的相应同一性。出于这些目的的氨基酸序列的显著同一性通常意指至少70%、至少80%、90%或甚至至少95%的序列同一性。
在多肽的情况下,术语“显著同一性”表示在指定的比较窗内,多肽包含与参考序列具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、或79%、或80%、81%、82%、83%、84%、85%、86%、87%、88%或89%、或至少90%、91%、92%、93%或94%,或甚至95%、96%、97%、98%或99%序列同一性的序列。两个多肽序列相同的标示是一个多肽与针对第二多肽产生的抗体具有免疫反应性。因此,例如,在两个肽的不同之处仅在于保守替换的情况下,多肽与第二多肽相同。
除非另有说明,否则本文中使用的术语“治疗”及其变化形式等可以是指逆转、减轻、抑制这样的术语所适用的疾病、障碍或病症的过程,或预防这样的术语所适用的疾病、障碍或病症,或这样的疾病、障碍或病症的一种或更多种症状,并且包括施用本文中所述的任何组合物、药物组合物或剂型以预防症状或并发症的发作,或减轻症状或并发症,或消除病症或障碍。术语“治疗”及其变化形式也指治疗性治疗和预防性或防范性措施二者,其中目的是预防、抑制、减轻或降低不期望的生理变化或障碍,例如障碍的发生、进展或恶化。出于本公开内容的目的,有益或期望的临床结果包括但不限于症状的减轻、疾病程度的减小、疾病的症状或不良作用的稳定(即,不恶化或进展)、疾病进展的延迟或减慢、疾病状态的改善或减轻、以及缓解(无论是部分的还是全部的),无论是可检出或不可检出的。“治疗”还意指与未接受治疗的预期存活相比延长存活。需要治疗的那些包括已经患有该病症或障碍的那些以及易患病的(例如,通过基因测定确定的)那些。
如本文中在说明书中使用的没有数量词修饰的名词可意指一个/种或更多个/种。如本文中在权利要求书中使用的,当与词语“包含/包括”联合使用时,没有数量词修饰的名词可意指一个/种或多于一个/种。
本文中使用的措辞和术语是出于描述的目的并且不应被认为是限制性的。例如,单数术语(例如“一个/种”)的使用并不旨在限制项目的数目。此外,在具体参照附图的描述中,为了清楚起见,使用了关系术语,例如但不限于“顶部”、“底部”、“左”、“右”、“上面”、“下面”、“下”、“上”和“侧”,并且不旨在限制本发明构思或所附权利要求书的范围。
除非明确地指出仅指替代方案或者替代方案相互排斥,否则权利要求书中术语“或/或者”的使用用于意指“和/或”,但是本公开内容支持指仅替代方案和“和/或”的定义。此外,本文中使用的术语“或/或者”和“和/或”被解释为包含性的或意指任何一项或任何组合。因此,“A、B或C”或“A、B和/或C”意指以下中的任何一项:“A”、“B”或“C”;“A和B”;“A和C”;“B和C”;“A、B和C”。仅当元件、功能、步骤或动作的组合在某种程度上固有地相互排斥时,将会出现该定义的例外。本文中使用的“另一”可意指至少第二个或更多个。
在本申请通篇,术语“约”用于表示值包括用于确定所述值的装置的固有误差变化、用于确定所述值的方法的固有误差变化、研究对象之间存在的变化、或所述值的10%以内的值。例如,术语“约”可意指相对于所记载的值,例如量、剂量、温度、时间、百分比等±10%、±9%、±8%、±7%、±6%、±5%、±4%、±3%、±2%或±1%。
术语“包含”、“包括”、“涵盖”和“具有”在本公开内容中可互换使用。术语“包含”、“包括”、“涵盖”和“具有”意指包括但不必限于如此描述的事物。
本文中使用的就指定组分而言“基本上不含”在本文中用于意指指定组分均未被有目的地配制到组合物中和/或仅作为污染物或以痕量存在。因此,由组合物的任何意外污染引起的指定组分的总量远低于0.05%,优选低于0.01%。最优选的是其中用标准分析方法不能检测到指定组分之量的组合物。
还应理解,除非明确指出相反,否则在本文中要求保护的包括多于一个步骤或动作的任何方法中,方法的步骤或动作的顺序不必限于所记载的方法的步骤或动作的顺序。
由于本发明构思容易受到许多不同形式的实施方案的影响,因此旨在将本公开内容视为是本发明构思原理的实例,并且不旨在将本发明构思限于所示和所述的一些具体实施方案。本发明构思的任一个特征可以单独使用或者与任何其他特征组合使用。本说明书中对术语“实施方案”、“一些实施方案”等的提及意指所提及的特征/一些特征被包括在说明书的至少一个方面中。除非如此说明和/或除非根据本说明书将对本领域技术人员变明显,否则本说明书中对术语“实施方案”、“一些实施方案”等的单独提及不一定是指相同的实施方案,并且也不是相互排斥的。例如,在一个实施方案中描述的特征、结构、过程、步骤、动作等也可包括在另一些实施方案中,但不是必须包括。因此,本发明构思可包括本文中所述实施方案的多种组合和/或集成。另外,如本文中所述的本公开内容的所有方面对于其实践并不是必需的。同样,在研究附图和本说明书之后,本发明构思的另一些系统、方法、特征和优点对于本领域技术人员而言将是明显的或变得明显。旨在使所有这样的另外的系统、方法、特征和优点包括在本说明书内、包括在本发明构思的范围内、并且由权利要求书涵盖。
VII.实施例
包括以下实施例以说明本发明的一些优选实施方案。本领域技术人员应理解,以下实施例中公开的技术代表本发明人发现的在本发明的实践中良好地起作用的技术,并因此可认为构成用于其实践的优选模式。然而,根据本公开内容,本领域技术人员应理解,可在不脱离本发明的精神和范围的情况下对所公开的一些具体实施方案进行许多改变并仍然获得相同或相似的结果。
实施例1-材料和方法
研究设计。本研究旨在测试碱基编辑(BE)和先导编辑(PE)对扩张型心肌病(DCM)的小鼠模型和人细胞中RNA结合基序蛋白20基因(RBM20)突变的治疗潜力。所有实验均使用雄性小鼠。所有超声心动图实验均由单个不知情的操作员进行和分析。每个实验均重复进行,如图例中的n值所示。
研究批准。本研究中涉及动物的所有实验操作均由德克萨斯大学西南医学中心(University of Texas Southwestern Medical Center)的机构动物护理和使用委员会(Institutional Animal Care and Use Committee)审查和批准。诱导多能干细胞系的使用由德克萨斯大学西南医学中心的干细胞研究监督委员会(Stem Cell ResearchOversight Committee)审查和批准。
一体化(All-In-One)SpCas9-ABE变体和SaCas9-ABE载体。SpCas9和SaCas9的所有变体均由g-Block(Integrated DNA Technologies)合成,并使用In-Fusion连接(TakaraBio)根据制造商的方案将其亚克隆到来自Feng Zhang的实验室(Broad Institute)的经AgeI/FseI消化的pSpCas9(BB)-2A-GFP(px458)(Addgene质粒#48138)(25)中。这些载体被AgeI和ApaI消化。插入物是从来自David Liu的实验室(Broad Institute)的NG-ABEmax(Addgene质粒#124163)(26)和NG-ABE8e(Addgene质粒#138491)(20)转录的。使用In-Fusion克隆试剂盒(TakaraBio)根据制造商的方案将这些插入物亚克隆到预消化的pSpCas9-NG-2A-GFP、pSpCas9-VRQR-2A-GFP和pSaCas9-2A-GFP中。使用BbsI和T4连接将用于RBM20R634Q突变的腺嘌呤碱基编辑(ABE)的sgRNA亚克隆到经改造载体中。引物列于表1中。
人iPSC培养和等基因系的产生。如前所述进行人iPSC培养(27)。简而言之,将iPSC保持在mTeSR plus培养基(STEMCELL Technologies)中,并每四天使用Versene(ThermoFisher)和10μM Rock抑制剂Y-27632(Selleckchem)进行传代。将8×105个iPSC的单细胞悬液与单链寡脱氧核苷酸(single-stranded oligodeoxynucleotide,ssODN)模板和5μgpSpCas9(BB)-2A-GFP(px458)质粒(含有针对RBM20的外显子9的sgRNA)混合。将混合物通过Primary Cell 4D-Nucleofector X试剂盒(Lonza)根据制造商的方案进行转染。在核转染之后,将iPSC保持在具有Rock抑制剂和Primocin(Invivogen)的mTeSR plus培养基中。在核转染之后48小时通过FACS对GFP+细胞进行分选并扩增。挑选GFP+单个iPSC并进行基因组测序。
iPSC中的BE和PE。对于ABE,通过核转染将5μg包含sgRNA的经改造的一体化载体转染到杂合(R634Q/+)或纯合(R634Q/R634Q)iPSC中。在48小时之后,通过FACS对GFP+细胞进行分选并扩增。对于PE,将pegRNA和epegRNA亚克隆到来自David Liu的实验室的pU6-pegRNA-GG-接受体质粒(Addgene质粒#132777)(22)中。将切口sgRNA亚克隆到来自ErvinWelker的实验室(Hungarian Academy of Sciences)的pmCherry_gRNA质粒(Addgene质粒#80457)中。对于PE3b系统,通过核转染将来自David Liu的实验室的pCMV-PE2-P2A-GFP(Addgene质粒#132776)(22)、pegRNA和切口sgRNA质粒(分别为4.5μg、1.5μg和0.75μg)转染到8×105个纯合(R636S/R636S)iPSC中。对于与epegRNA偶联的PE3bmax,通过核转染对来自David Liu的实验室的pCMV-PEmax(Addgene质粒#174820)(24)、epegRNA和切口sgRNA质粒(分别为4.5μg、1.5μg和0.75μg)进行转染。在48小时之后,通过FACS分选经PE3b处理的iPSC中的GFP+和mCherry+细胞以及经PE3bmax处理的iPSC中的mCherry+细胞并对其进行扩增。在提取DNA之后,通过PCR扩增RBM20中的外显子9区域,并根据制造商的方案对PCR产物进行ExoSAP-IT(Thermo Fisher)并测序。
人iPSC心肌细胞分化。使用先前所述的方法诱导iPSC分化成心肌细胞(CM)(28)。将iPSC用在补充有CDM3的RPMI 1640(Thermo Fisher Scientific)中的CHIR 99021(Selleckchem)处理2天(第1至2天)。将培养基更换成补充有WNT-C59(Selleckchem)的RPMI,持续2天(第3至4天)。将iPSC来源的CM(iPSC-CM)保持在补充有B27补充物(ThermoFisher Scientific)的RPMI 1640中。在补充有5mM DL-乳酸钠和CDM3补充物的不含葡萄糖(Thermo Fisher Scientific)的RPMI 1640中,通过代谢选择纯化iPSC-CM,持续6天(第10至16天)。在代谢选择之后,使用Tryple Express(Thermo Fisher Scientific)将iPSC-CM重新平板接种到6孔板中。在分化之后第35至40天将CM用于实验。对于经ABE校正和经PE校正的iPSC-CM,分离单克隆并使其分化成iPSC-CM以用于测定。
iPSC来源的CM的免疫细胞化学。如前所述进行iPSC-CM的免疫细胞化学(29)。简而言之,将iPSC-CM放回到涂覆有聚-D-赖氨酸的12mm盖片上。在用4%PFA固定(15分钟)并用0.3%Triton-X透化(15分钟)之后,将盖片用5%山羊血清/磷酸缓冲盐水封闭1小时。施加在5%山羊血清/磷酸缓冲盐水中的兔抗RBM20抗体(Novus Biologicals,NBP2-34038,1:250)和小鼠抗α-辅肌动蛋白(Sigma-Aldrich,A7811,1:800)并在4℃下孵育过夜。然后,将盖片与荧光素缀合的山羊抗兔Alexa Fluor 488和抗小鼠IgG Alexa Fluor 555(Invitrogen)一起孵育。使用20x物镜通过Zeiss LSM-800显微镜和使用100x油物镜通过N-SIM S超分辨率显微镜(Nikon)拍摄图像。
免疫组织化学。将心脏分离并将其在磷酸缓冲盐水中的4%多聚甲醛中固定48小时。在固定之后,通过Zeiss AxioZoom.V16系统拍摄大体心脏图像。将心脏包埋在石蜡中并切片。进行苏木精和伊红(H&E)以及Masson三色染色。在4x和40x物镜放大率下通过数码显微镜(Keyence)拍摄图像。对于免疫组织化学,对切片进行脱蜡并使用表位修复溶液(IHCWORLD)根据制造商的方案进行抗原修复。用心肌肌钙蛋白T(Thermo Scientific,1:200)和RBM20(由Guo Wei博士惠赠,1:400)的一抗对心肌细胞进行染色。将切片与DAPI、荧光素缀合的山羊抗兔Alexa Fluor 488和抗小鼠IgG Alexa Fluor 555(Invitrogen)一起孵育。使用100x油物镜通过N-SIM S超分辨率显微镜(Nikon)拍摄图像。
人iPSC来源的CM的钙成像。如前所述进行钙成像(29)。简而言之,将CM解离并接种在35mm玻璃底培养皿(Thermo Fisher Scientific)上。在平板接种之后第3天评价钙成像。在Tyrode溶液(Sigma-Aldrich,T2397)中向CM加载5μM的荧光钙指示剂Fluo-4-AM(ThermoFisher Scientific,F14201)持续20分钟。在37℃下使用Nikon A1R+共聚焦显微镜测量自发搏动iPSC-CM的钙瞬变。通过Fiji软件处理数据并使用Microsoft Excel进行分析。
向分化的iPSC来源的CM的AAV递送。从来自William Pu的实验室(哈佛大学)的pAAV:cTNT::萤光素酶(Addgene质粒#69915)(30)提取心肌肌钙蛋白T(cTnT)启动子。分别从来自David Liu的实验室的CMV_Npu-ABEmax N端(Addgene质粒#137173)(31)和hu6HGPSsgRNA表达和ABE7.10max VRQR C端AAV载体(Addgene质粒#154430)(21)提取ABEmax-VRQR-SpCas9的N端和C端区。使用In-Fusion克隆将这些插入物亚克隆到pSSV9单链AAV质粒中。使用SmaI和AhdI消化AAV载体以确定完整的反向末端重复(ITR)完整性。在波士顿儿童医院病毒中心(Boston Children’s Hospital Viral Core)中使用血清型6(AAV6)衣壳和血清型9(AAV9)衣壳产生AAV病毒。在分化之后第40天,将AAV6病毒以4×105vg/细胞感染到纯合(R634Q/R634Q)iPSC-CM中。在感染之后二十天,提取DNA。
产生Rbm20R636Q敲入小鼠。如前所述使用CRISPR-Cas9技术和ssODN模板产生Rbm20R636Q敲入小鼠(32)。将Rbm20的外显子9的sgRNA克隆到pSpCas9(BB)-2A-GFP(px458)中。使用MEGA shortscript T7转录试剂盒转录sgRNA,并通过MEGA Clear试剂盒(LifeTechnologies)纯化。将含有Rbm20R636Q突变的ssODN、Rbm20sgRNA和Cas9mRNA注射到小鼠原核和胞质中。将小鼠胚胎转移至代孕母鼠进行妊娠。对F0代幼鼠进行测序,并使阳性建立者与野生型C57/BL6小鼠交配。通过测序确定F1代Rbm20R636Q敲入小鼠。提取尾部基因组DNA并用于基因分型。
体内全身AAV9递送。使用超细BD胰岛素注射器(Becton Dickinson)向P5纯合(R636Q/R636Q)小鼠腹膜内注射100μl含有N端和C端ABEmax-VRQR-SpCas9-sgRNA的AAV9(总计2.5×1014vg/kg)。
经胸超声心动图。使用VisualSonics Vevo2100成像系统通过二维经胸超声心动图评估心脏功能。使用M模式追踪测量缩短分数、舒张末期(LVIDd)和收缩末期(LVIDs)时的左心室内径。所有测量均由对本研究不知情的操作员进行。
基因组DNA的提取。使用DirectPCR裂解试剂(VIAGEN)根据制造商的方案提取iPSC、iPSC-CM和小鼠心脏的基因组DNA。使用PrimeSTAR GXL DNA聚合酶(TAKARA Bio)根据制造商的方案扩增提取的基因组DNA。对PCR产物进行测序并通过EditR分析基因编辑效率。PCR引物列于表1中。
RNA分离、RT-PCR和qRT-PCR。使用miRNeasy(Qiagen)从分化之后第40天的iPSC-CM和注射之后6周的小鼠心脏提取总RNA,并使用iScript逆转录Supermix(Bio RadLaboratories)根据制造商的方案逆转录cDNA。对于RT-PCR,使用PrimeSTAR GXL DNA聚合酶(TAKARA Bio)扩增cDNA。对于qRT-PCR,使用KAPA SYBR FAST Master mix(KAPA)测量基因表达,并通过Ct方法进行定量。对于qRT-PCR的归一化,使用18s。RT-PCR和qRT-PCR引物列于表1中。
RNA-seq分析。使用KAPA mRNA Hyper prep试剂盒(Roche,KK8581)根据制造商的方案从总RNA进行文库制备。使用用于双端测序的75bp高输出测序试剂盒在IlluminaNextseq 500系统上进行测序。Trim Galore(可获自万维网biointormatics.babraham.ac.uk/projects/trim_galore/)用于质量和适配器微调。使用Bowtie(v2.3.4.3)(33)通过将读数映射到人转录物和核糖体RNA序列(Ensembl版本89)上来评估RNA测序文库的质量。使用STAR(v2.7.2b)(34)将读出与人基因组(hg38)进行比对。使用SAMtools(v1.9)(35)对比对进行排序,并使用HTSeq Python包(36)对每个基因的读数进行计数。edgeR R Bioconductor包(37-39)用于对读数计数进行归一化并鉴定差异表达(DE)基因。在使用iPSC-CM或小鼠心脏的实验中分析DE基因(纯合子与正常相比倍数变化>2,调整的p值<0.05)。使用Metascape(40)进行基因本体(gene ontology,GO)分析,并示出选择性GO术语。SpliceFisher(可获自github.com/jiwoongbio/SpliceFisher)用于鉴定差异选择性剪接事件并计算PSI(剪接百分比)值。
表1.本研究中使用的引物列表。
实施例2-结果
富含RS的区域中的RBm20R636Q突变(c.1901G>A)是由鸟嘌呤向腺嘌呤的转变引起的,这适合于腺嘌呤碱基编辑(ABE)(19,20)(图1A和1B)。为了测试是否可调节ABE以精确校正这种突变,使用CRISPR-Cas9基因编辑从健康对照iPSC产生具有杂合(R634Q/+)和纯合(R634Q/R634Q)突变的人同基因诱导多能干细胞(iPSC)系(图5A和5B)。为了评价ABE的效率,设计了四种单指导RNA(sgRNA)(表2),并将每种sgRNA(sgRNA 1至4)亚克隆到表达不同SpCas9变体或SaCas9的一体化ABE8e载体中。最初,用不同的ABE8e变体测试每种sgRNA,但除了靶上编辑之外还观察到潜在有害的旁观者突变(图6A至6C)。因此,将碱基编辑器切换为具有更窄的编辑窗的ABEmax。在A6位置处具有靶上位点(图1B)的一体化ABEmax-VRQR-SpCas9与sgRNA1的组合显示出高效的A至G编辑(89%)而不诱导显著的旁观者突变(<1%)(图1C)。另外,iPSC中的R634Q/+突变的ABEmax-VRQR-SpCas9编辑将正常RBM20等位基因的百分比从50%提高至91%(图1D)。因此选择ABEmax-VRQR-SpCas9(以下简称为ABE)进行进一步研究。
表2.RBM20R634Q突变的碱基编辑的单指导RNA。
在来源于iPSC的健康人CM(iPSC-CM)中,RBM20主要定位于细胞核(图1E)。相反,在R634Q/R634Q iPSC-CM中,RBM20定位于胞质RNP颗粒,而R634Q/+iPSC-CM显示出RBM20分布在细胞核和胞质二者中(图1E)。为了校正RBM20R634Q突变,使用ABE和sgRNA1,并观察到RBM20的核定位、不存在RNP颗粒形成、以及以α-辅肌动蛋白为标志的正常的肌节结构架构(图1E)。
除了RNP颗粒形成之外,RBM20的突变还导致RNA剪接缺陷。为了分析由RBM20调节的基因的选择性剪接,对正常、未校正和经ABE校正的R634Q/R634Q iPSC-CM进行RNA-seq分析。如热图(图2A)中所示,15个基因在未校正的CM中显示出异常的剪接模式,所述基因包括编码心脏肌节和钙信号传导蛋白的基因,例如TTN、肌球蛋白重链6(myosin heavy chain6,MYH6)、肌钙蛋白T2(Troponin T2,TNNT2)和钙/钙调蛋白依赖性蛋白激酶IIδ(calcium/calmodulin-dependent protein kinase IIδ,CAMK2D)。由于TTN错误剪接代表RBM20相关DCM的主要指标,因此通过剪接百分比(PSI)测量外显子包涵率以评估TTN基因的剪接模式(图7)。TTN的正常剪接产生刚性同种型,称为N2B,其缺乏外显子51至外显子218(图2B)。在未校正的R634Q/R634Q iPSC-CM中,外显子51至218未被正确剪接,产生N2BA同种型(图7)。这种错误剪接的同种型降低了心脏硬度,从而导致DCM。类似地,与正常iPSC-CM相比,R634Q/+iPSC-CM也显示出异常的选择性剪接模式(图7)。相反,经ABE校正的iPSC-CM显示出与健康iPSC-CM一样的正常TTN剪接模式(图7)。经ABE校正的iPSC-CM中的N2B同种型的表达也通过qRT-PCR分析进行了验证(图2C)。因此,RBM20R634Q突变的ABE校正在恢复正确的RNA剪接方面是有效的。
基因表达和钙处理的失调是具有RBM20突变的CM中常见的致病表型。为了评估RBM20R634Q突变的转录结果和ABE基因编辑的作用,对正常、未校正和经ABE校正的R634Q/R634Q iPSC-CM进行了RNA-seq和基因本体(GO)分析(图8A至8C)。R634Q/R634Q iPSC-CM中下调的基因包括与心肌病和横纹肌收缩相关的类别,与DCM的表型一致。在R634Q/R634QiPSC-CM中看到的异常转录组在iPSC-CM的ABE编辑之后恢复。在R634Q/+和R634Q/R634QiPSC-CM二者中,钙瞬变动力学包括到达峰值的时间和衰减率(tau)异常升高(图9A和9B)。在ABE介导的校正之后,R634Q/R634Q iPSC-CM表现出像健康对照iPSC-CM的那些的正常的钙瞬变动力学(图9A和9B),表明钙释放和再摄取的恢复。为了评估可能的脱靶编辑,对前八个预测脱靶位点的基因组DNA进行了测序,并且在任何潜在脱靶位点处均未发现可检出的基因组改变(图10A和10B)。
恢复RBM20核定位和消除RNP颗粒是正常心脏功能所需的。然而,尚不清楚从分化的CM中根除积累的RNP颗粒是否有效。为了确定分化的iPSC-CM中RNP颗粒的消除,使用腺相关病毒血清型6(AAV6)和反式剪接内含肽系统(21)将由心脏肌钙蛋白T启动子(cTnT)驱动的ABE组分递送到分化的R634Q/R634Q CM中(图11A和11B)。在ABE校正之后,经校正的iPSC-CM在基因组水平上显示出63%的编辑效率(图2D和11C)。免疫细胞化学表明RBM20在细胞核中的定位和胞质中RNP颗粒的消除(图2E、2F和11D)。这些发现表明ABE通过逆转RNP颗粒的形成挽救了正常心脏表型。
为了评估ABE用于体内DCM治疗的潜力,产生了类似于人RBM20R634Q突变的Rbm20R636Q突变体小鼠模型(图12A至12C)。通过超声心动图测量4周龄突变体小鼠的心脏功能。纯合(R636Q/R636Q)小鼠表现出显著降低的缩短分数(%FS)(图3A和3B)。与野生型(WT)小鼠相比,R636Q/R636Q小鼠在舒张末期(LVIDd)和收缩末期(LVIDs)期间的左心室内部尺寸显著增大。杂合(R636Q/+)小鼠表现出轻度心脏功能障碍(图3A和3B)。12周龄的R636Q/R636Q小鼠的心脏显示出与DCM一致的形态学特征,包括心房和心室扩张(图3C)。因此,R636Q/R636Q小鼠再现了携带RBM20R634Q突变的DCM患者的表型。
R636Q/R636Q突变体小鼠模型使得能够评估通过ABE对RBM20R634Q突变的体内校正。对于小鼠中的ABE校正,靶向腺嘌呤位于sgRNA中的A6位置处,且在A14和A20处发现了可能的旁观者突变,以及在A4、A13和A19处发现了沉默突变(图13A)。通过向出生之后第5天的小鼠以每种AAV 1.25×1014vg/kg(总共2.5×1014vg/kg)的剂量腹膜内注射AAV9来施用ABE组分(图13B)。为了确定ABE介导的校正在体内是否有效,在心脏中评估了DNA编辑效率。在通过AAV施用ABE组分之后六周,15%的靶向腺嘌呤经历了DNA编辑(图14A)。基因组INDEL分析低估了ABE编辑效率,原因是其他细胞类型(例如内皮细胞和心脏成纤维细胞(其占心脏细胞的三分之二))不被ABE组分编辑,而ABE组分在心脏特异性TnT启动子的控制下表达。因此,在cDNA水平上进一步评估ABE基因编辑,并且发现71%的RBM20cDNA转录物已被准确地校正(图4A、14B和14C)。
为了评估ABE校正之后的心脏功能,在全身递送ABE基因编辑组分之后4周和8周时,在R636Q/R636Q小鼠中进行超声心动图。未校正的R636Q/R636Q小鼠表现出严重的心力衰竭并在2至3月龄时过早死亡。相反,接受全身ABE组分的R636Q/R636Q小鼠显示出LV功能的显著改善,如通过缩短分数测量的(图4B和15)。另外,也部分挽救了心脏腔室尺寸(图4B)。在AAV9施用之后第12周时的经ABE校正的R636Q/R636Q心脏的组织学分析显示出心脏扩张恢复,而未经处理的心脏显示心房和心室扩大(图4C)。组织学评估表明,经处理的R636Q/R636Q小鼠的左心室心肌没有显著的纤维化(图16A和16B)。重要的是,ABE编辑组分的全身递送还显著延长了经校正的R636Q/R636Q小鼠的寿命(图4D)。
为了确定心脏功能的恢复是否归因于RBM20的功能恢复,在体内评估了RBM20的定位。在WT小鼠中,RBM20定位于细胞核,没有形成RNP颗粒(图4E)。相反,R636Q/R636Q小鼠的CM在核周区域中显示出RNP颗粒,与R634Q/R634Q iPSC-CM相似。如通过免疫组织化学评估的,R636Q/R636Q小鼠的ABE介导的校正恢复了RBM20定位于细胞核并消除了RNP颗粒(图4E)。接下来,在全身ABE基因编辑之后,在R636Q/R636Q小鼠中评价了Ttn的剪接模式。qRT-PCR分析表明,在R636Q/R636Q小鼠中刚性N2B同种型降低并且顺应性N2BA同种型提高(图17A和17B)。相反,经ABE校正的R636Q/R636Q心脏显示出N2B同种型的部分恢复(68%)和N2BA同种型的降低(63%)(图17A和17B)。
为了确定ABE基因编辑是否使R636Q/R636Q小鼠中的基因表达正常化,进行了RNA-seq分析。ABE基因编辑挽救了经校正的R636Q/R636Q小鼠的转录谱,而R636Q/R636Q小鼠显示出改变的基因表达和GO术语,包括心脏收缩和胞外基质(图18A至18C)。这些发现表明,ABE基因编辑保护心脏而不会诱导不良事件,例如炎症和细胞损伤。
尽管RBM20R634Q突变的ABE基因编辑具有高效率,但由于有限的编辑窗、不想要的旁观者编辑和一些靶核苷酸附近缺乏合适的PAM序列,BE不能校正所有的RBM20突变。为了克服这些限制,针对p.R636S(c.1906C>A)突变开发了先导编辑(PE)策略。PE系统包括与逆转录酶融合的Cas9切口酶和先导编辑指导RNA(pegRNA),所述pegRNA包含引物结合位点(PBS)和逆转录(RT)模板以使得能够在基因组中的靶位点并入目的序列(22)。最近的研究报道了具有另外的RNA基序以保护3’延伸免遭降解的经改造的pegRNA(epegRNA)与先导编辑器的新的变体(PEmax)偶联提高了PE效率(23,24)。pegRNA被设计为具有长度为11nt的PBS和长度为17nt的RT模板(图19A)。为了优化编辑效率,选择切口sgRNA用于PE3b系统,并通过插入结构化的RNA基序产生了epegRNA。为了评估PE的效率,产生了具有纯合RBM20R636S(R636S/R636S)突变的同基因iPSC系。PE3bmax与epegRNA偶联导致A至C的编辑效率为40%,而没有非预期的基因组编辑(图19B和19C)。尽管在未校正的R636S/R636S iPSC-CM的胞质中检测到了RNP颗粒,但在经PE校正的iPSC-CM中观察到了核定位的正常模式(图19D)。
***
根据本公开内容,本文中公开和要求保护的所有方法无需过度实验即可进行和实施。尽管已根据一些优选实施方案描述了本发明的组合物和方法,但对于本领域技术人员而言明显的是,可对本文中所述方法以及所述方法的步骤或步骤顺序进行改变而不脱离本发明的概念、精神和范围。更特别地,将明显的是可用某些在化学和生理学两个方面均相关的试剂代替本文中所述的试剂,同时实现相同或类似的结果。所有这样的对本领域技术人员而言明显的类似替代和修改都被认为在所附权利要求书所限定的本发明的精神、范围和概念之内。
参考文献
以下参考文献就其提供补充本文中阐述的那些的示例性操作或其他细节而言特别地通过引用并入本文。
1.E.M.McNally,L.Mestroni,Dilated Cardiomyopathy:Genetic Determinantsand Mechanisms.Circ Res 121,731-748(2017).
2.E.Jordan,L.Peterson,T.Ai,B.Asatryan,L.Bronicki,E.Brown,R.Celeghin,M.Edwards,J.Fan,J.Ingles,C.A.James,O.Jarinova,R.Johnson,D.P.Judge,N.Lahrouchi,R.H.Lekanne Deprez,R.T.Lumbers,F.Mazzarotto,A.Medeiros Domingo,R.L.Miller,A.Morales,B.Murray,S.Peters,K.Pilichou,A.Protonotarios,C.Semsarian,P.Shah,P.Syrris,C.Thaxton,J.P.van Tintelen,R.Walsh,J.Wang,J.Ware,R.E.Hershberger,Evidence-Based Assessment of Genes in DilatedCardiomyopathy.Circulation 144,7-19(2021).
3.A.N.Rosenbaum,K.E.Agre,N.L.Pereira,Genetics of dilatedcardiomyopathy:practical implications for heart failure management.Nat RevCardiol 17,286-297(2020).
4.K.M.Brauch,M.L.Karst,K.J.Herron,M.de Andrade,P.A.Pellikka,R.J.Rodeheffer,V.V.Michels,T.M.Olson,Mutations in ribonucleic acid bindingprotein gene cause familial dilated cardiomyopathy.J Am Coll Cardiol 54,930-941(2009).
5.H.C.Zahr,D.E.Jaalouk,Exploring the Crosstalk Between LMNA andSplicing Machinery Gene Mutations in Dilated Cardiomyopathy.Front Genet 9,231(2018).
6.T.M.Hey,T.B.Rasmussen,T.Madsen,M.M.Aagaard,M.Harbo,H.Molgaard,J.E.Moller,H.Eiskjaer,J.Mogensen,Pathogenic RBM20-Variants Are AssociatedWith a Severe Disease Expression in Male Patients With DilatedCardiomyopathy.Circ Heart Fail 12,e005700(2019).
7.D.Lennermann,J.Backs,M.M.G.van den Hoogenhof,New Insights in RBM20Cardiomyopathy.Curr Heart Fail Rep 17,234-246(2020).
8.D.Li,A.Morales,J.Gonzalez-Quintana,N.Norton,J.D.Siegfried,M.Hofmeyer,R.E.Hershberger,Identification of novel mutations in RBM20 inpatients with dilated cardiomyopathy.Clin Transl Sci 3,90-97(2010).
9.A.M.Gacita,E.M.McNally,Genetic Spectrum of ArrhythmogenicCardiomyopathy.Circ Heart Fail 12,e005850(2019).
10.V.N.Parikh,C.Caleshu,C.Reuter,L.C.Lazzeroni,J.Ingles,J.Garcia,K.McCaleb,T.Adesiyun,F.Sedaghat-Hamedani,S.Kumar,S.Graw,M.Gigli,D.Stolfo,M.Dal Ferro,A.Y.Ing,R.Nussbaum,B.Funke,M.T.Wheeler,R.E.Hershberger,S.Cook,L.M.Steinmetz,N.K.Lakdawala,M.R.G.Taylor,L.Mestroni,M.Merlo,G.Sinagra,C.Semsarian,B.Meder,D.P.Judge,E.Ashley,Regional Variation in RBM20 Causes aHighly Penetrant Arrhythmogenic Cardiomyopathy.Circ Heart Fail 12,e005371(2019).
11.T.Watanabe,A.Kimura,H.Kuroyanagi,Alternative Splicing RegulatorRBM20 and Cardiomyopathy.Front Mol Biosci 5,105(2018).
12.W.Guo,S.Schafer,M.L.Greaser,M.H.Radke,M.Liss,T.Govindarajan,H.Maatz,H.Schulz,S.Li,A.M.Parrish,V.Dauksaite,P.Vakeel,S.Klaassen,B.Gemll,L.Thierfelder,V.Regitz-Zagrosek,T.A.Hacker,K.W.Saupe,G.W.Dec,P.T.Ellinor,C.A.MacRae,B.Spallek,R.Fischer,A.Perrot,C.Ozcelik,K.Saar,N.Hubner,M.Gotthardt,RBM20,a gene for hereditary cardiomyopathy,regulates titinsplicing.Nat Med 18,766-773(2012).
13.J.W.Schneider,S.Oommen,M.Y.Qureshi,S.C.Goetsch,D.R.Pease,R.S.Sundsbak,W.Guo,M.Sun,H.Sun,H.Kuroyanagi,D.A.Webster,A.W.Coutts,K.A.Holst,B.S.Edwards,N.Newville,M.A.Hathcock,T.Melkamu,F.Briganti,W.Wei,M.G.Romanelli,S.C.Fahrenkrug,D.E.Frantz,T.M.Olson,L.M.Steinmetz,D.F.Carlson,T.J.Nelson,P.Wanek,Dysregulated ribonucleoprotein granules promote cardiomyopathy inRBM20 gene-edited pigs.Nat Med 26,1788-1800(2020).
14.K.Ihara,T.Sasano,Y.Hiraoka,M.Togo-Ohno,Y.Soejima,M.Sawabe,M.Tsuchiya,H.Ogawa,T.Furukawa,H.Kuroyanagi,A missense mutation in the RSRSPstretch of Rbm20 causes dilated cardiomyopathy and atrial fibrillation inmice.Sci Rep 10,17894(2020).
15.A.M.Fenix,Y.Miyaoka,A.Bertero,S.M.Blue,M.J.Spindler,K.K.B.Tan,J.A.Perez-Bermejo,A.H.Chan,S.J.Mayerl,T.D.Nguyen,C.R.Russell,P.P.Lizarraga,A.Truong,P.L.So,A.Kulkarni,K.Chetal,S.Sathe,N.J.Sniadecki,G.W.Yeo,C.E.Murry,B.R.Conklin,N.Salomonis,Gain-of-function cardiomyopathic mutations in RBM20rewire splicing regulation and re-distribute ribonucleoprotein granuleswithin processing bodies.Nat Commun 12,6324(2021).
16.C.Wang,Y.Zhang,M.Methawasin,C.U.Braz,J.Gao-Hu,B.Yang,J.Strom,J.Gohlke,T.Hacker,H.Khatib,H.Granzier,W.Guo,RBM20(S639G)mutation is a highgenetic risk factor for premature death through RNA-protein condensates.J MolCell Cardiol 165,115-129(2022).
17.A.V.Anzalone,L.W.Koblan,D.R.Liu,Genome editing with CRISPR-Casnucleases,base editors,transposases and prime editors.Nat Biotechnol 38,824-844(2020).
18.T.Nishiyama,R.Bassel-Duby,E.N.Olson,Toward CRISPR Therapies forCardiomyopathies.Circulation 144,1525-1527(2021).
19.N.M.Gaudelli,A.C.Komor,H.A.Rees,M.S.Packer,A.H.Badran,D.I.Bryson,D.R.Liu,Programmable base editing of A*T to G*C in genomic DNA without DNAcleavage.Nature 551,464-471(2017).
20.M.F.Richter,K.T.Zhao,E.Eton,A.Lapinaite,G.A.Newby,B.W.Thuronyi,C.Wilson,L.W.Koblan,J.Zeng,D.E.Bauer,J.A.Doudna,D.R.Liu,Phage-assistedevolution of an adenine base editor with improved Cas domain compatibilityand activity.Nat Biotechnol 38,883-891(2020).
21.L.W.Koblan,M.R.Erdos,C.Wilson,W.A.Cabral,J.M.Levy,Z.M.Xiong,U.L.Tavarez,L.M.Davison,Y.G.Gete,X.Mao,G.A.Newby,S.P.Doherty,N.Narisu,Q.Sheng,C.Krilow,C.Y.Lin,L.B.Gordon,K.Cao,F.S.Collins,J.D.Brown,D.R.Liu,Invivo base editing rescues Hutchinson-Gilford progeria syndrome in mice.Nature589,608-614(2021).
22.A.V.Anzalone,P.B.Randolph,J.R.Davis,A.A.Sousa,L.W.Koblan,J.M.Levy,P.J.Chen,C.Wilson,G.A.Newby,A.Raguram,D.R.Liu,Search-and-replace genomeediting without double-strand breaks or donor DNA.Nature 576,149-157(2019).
23.J.W.Nelson,P.B.Randolph,S.P.Shen,K.A.Everette,P.J.Chen,A.V.Anzalone,M.An,G.A.Newby,J.C.Chen,A.Hsu,D.R.Liu,Engineered pegRNAs improveprime editing efficiency.Nat Biotechnol,(2021).
24.P.J.Chen,J.A.Hussmann,J.Yan,F.Knipping,P.Ravisankar,P.F.Chen,C.Chen,J.W.Nelson,G.A.Newby,M.Sahin,M.J.Osborn,J.S.Weissman,B.Adamson,D.R.Liu,Enhanced prime editing systems by manipulating cellular determinantsof editing outcomes.Cell 184,5635-5652 e5629(2021).
25.F.A.Ran,P.D.Hsu,J.Wright,V.Agarwala,D.A.Scott,F.Zhang,Genomeengineering using the CRISPR-Cas9 system.Nat Protoc 8,2281-2308(2013).
26.T.P.Huang,K.T.Zhao,S.M.Miller,N.M.Gaudelli,B.L.Oakes,C.Fellmann,D.F.Savage,D.R.Liu,Circularly permuted and PAM-modified Cas9 variants broadenthe targeting scope of base editors.Nat Biotechnol 37,626-631(2019).
27.Y.Zhang,C.Long,H.Li,J.R.McAnally,K.K.Baskin,J.M.Shelton,R.Bassel-Duby,E.N.Olson,CRISPR-Cpfl correction of muscular dystrophy mutations inhuman cardiomyocytes and mice.Sci Adv 3,e1602814(2017).
28.Y.L.Min,H.Li,C.Rodriguez-Caycedo,A.A.Mireault,J.Huang,J.M.Shelton,J.R.McAnally,L.Amoasii,P.P.A.Mammen,R.Bassel-Duby,E.N.Olson,CRISPR-Cas9corrects Duchenne muscular dystrophy exon 44 deletion mutations in mice andhuman cells.Sci Adv 5,eaav4324(2019).
29.F.Chemello,A.C.Chai,H.Li,C.Rodriguez-Caycedo,E.Sanchez-Ortiz,A.Atmanli,A.A.Mireault,N.Liu,R.Bassel-Duby,E.N.Olson,Precise correction ofDuchenne muscular dystrophy exon deletion mutations by base and primeediting.Sci Adv 7,(2021).
30.Z.Lin,A.von Gise,P.Zhou,F.Gu,Q.Ma,J.Jiang,A.L.Yau,J.N.Buck,K.A.Gouin,P.R.van Gorp,B.Zhou,J.Chen,J.G.Seidman,D.Z.Wang,W.T.Pu,Cardiac-specific YAP activation improves cardiacfunction and survival in anexperimental murine MI model.Circ Res 115,354-363(2014).
31.J.M.Levy,W.H.Yeh,N.Pendse,J.R.Davis,E.Hennessey,R.Butcher,L.W.Koblan,J.Comander,Q.Liu,D.R.Liu,Cytosine and adenine base editing of thebrain,liver,retina,heart and skeletal muscle offmice via adeno-associatedviruses.Nat Biomed Eng 4,97-110(2020).
32.B.R.Nelson,C.A.Makarewich,D.M.Anderson,B.R.Winders,C.D.Troupes,F.Wu,A.L.Reese,J.R.McAnally,X.Chen,E.T.Kavalali,S.C.Cannon,S.R.Houser,R.Bassel-Duby,E.N.Olson,A peptide encoded by a transcript annotated as longnoncoding RNA enhances SERCA activity in muscle.Science 351,271-275(2016).
33.B.Langmead,S.L.Salzberg,Fast gapped-read alignment with Bowtie2.Nat Methods 9,357-359(2012).
34.A.Dobin,C.A.Davis,F.Schlesinger,J.Drenkow,C.Zaleski,S.Jha,P.Batut,M.Chaisson,T.R.Gingeras,STAR:ultrafast universal RNA-seqaligner.Bioinformatics 29,15-21(2013).
35.H.Li,B.Handsaker,A.Wysoker,T.Fennell,J.Ruan,N.Homer,G.Marth,G.Abecasis,R.Durbin,S.Genome Project Data Processing,The Sequence Alignment/Map format and SAMtools.Bioinformatics 25,2078-2079(2009).
36.S.Anders,P.T.Pyl,W.Huber,HTSeq--a Python framework to work withhigh-throughput sequencing data.Bioinformatics 31,166-169(2015).
37.R.C.Gentleman,V.J.Carey,D.M.Bates,B.Bolstad,M.Dettling,S.Dudoit,B.Ellis,L.Gautier,Y.Ge,J.Gentry,K.Hornik,T.Hothorn,W.Huber,S.Iacus,R.Irizarry,F.Leisch,C.Li,M.Maechler,A.J.Rossini,G.Sawitzki,C.Smith,G.Smyth,L.Tierney,J.Y.Yang,J.Zhang,Bioconductor:open software development forcomputational biology and bioinformatics.Genome Biol 5,R80(2004).
38.M.D.Robinson,D.J.McCarthy,G.K.Smyth,edgeR:a Bioconductor packagefor differential expression analysis of digital gene expressiondata.Bioinformatics 26,139-140(2010).
39.D.J.McCarthy,Y.Chen,G.K.Smyth,Differential expression analysis ofmultifactor RNA-Seq experiments with respect to biological variation.NucleicAcids Res 40,4288-4297(2012).
40.Y.Zhou,B.Zhou,L.Pache,M.Chang,A.H.Khodabakhshi,O.Tanaseichuk,C.Benner,S.K.Chanda,Metascape provides a biologist-oriented resource for theanalysis of systems-level datasets.Nat Commun 10,1523(2019).

Claims (150)

1.指导RNA(gRNA),其包含选自SEQ ID NO:1至4中任一个的靶向核酸序列。
2.权利要求1所述的gRNA,其中所述gRNA是单分子指导RNA(sgRNA)。
3.权利要求1或2所述的gRNA,其中所述gRNA用于修饰人RBM20基因中的序列。
4.组合物,其包含碱基编辑器和靶向人RBM20中的突变的gRNA。
5.权利要求4所述的组合物,其中所述碱基编辑器是腺嘌呤碱基编辑器(ABE)。
6.权利要求4所述的组合物,其中所述gRNA是权利要求1至3中任一项所述的gRNA。
7.权利要求6所述的组合物,其中所述碱基编辑器是腺嘌呤碱基编辑器(ABE)。
8.权利要求4至7中任一项所述的组合物,其中所述碱基编辑器包含与腺苷脱氨酶连接的CRISPR/Cas核酸酶。
9.权利要求8所述的组合物,其中所述CRISPR/Cas核酸酶是催化受损的。
10.权利要求8或9所述的组合物,其中所述CRISPR/Cas核酸酶是Cas9核酸酶。
11.权利要求10所述的组合物,其中所述Cas9核酸酶分离自或来源于酿脓链球菌(Streptococcus pyogenes)(spCas9)。
12.核酸,其包含:
编码第一gRNA的序列,所述gRNA是权利要求1至3中任一项所述的gRNA,
编码碱基编辑器的序列,
编码第一启动子的序列,其中所述第一启动子驱动编码所述第一gRNA的序列的表达,和
编码第二启动子的序列,其中所述第二启动子驱动编码所述碱基编辑器的序列的表达。
13.权利要求12所述的核酸,其中所述碱基编辑器是腺嘌呤碱基编辑器(ABE)。
14.权利要求12或13所述的核酸,其中所述碱基编辑器包含与腺苷脱氨酶连接的CRISPR/Cas核酸酶。
15.权利要求14所述的核酸,其中所述CRISPR/Cas核酸酶是催化受损的。
16.权利要求14或15所述的核酸,其中所述CRISPR/Cas核酸酶是Cas9核酸酶。
17.权利要求16所述的核酸,其中所述Cas9核酸酶分离自或来源于酿脓链球菌(spCas9)、金黄色葡萄球菌(Staphylococcus aureus)(SaCas9)、耳葡萄球菌(Staphylococcus auricularis)(SauCas9)或路邓葡萄球菌(Staphylococcuslugdunensis)(SlugCas9)。
18.权利要求12至17中任一项所述的核酸,其中所述编码第一启动子的序列和所述编码第二启动子的序列中的至少一个包含细胞类型特异性启动子。
19.权利要求18所述的核酸,其中所述细胞类型特异性启动子是心肌细胞特异性启动子。
20.权利要求19所述的核酸,其中肌肉特异性启动子是心肌肌钙蛋白T(cTnT)启动子。
21.权利要求12至20中任一项所述的核酸,其中所述编码第一启动子的序列包含编码U6启动子、H1启动子或7SK启动子的序列。
22.权利要求12至21中任一项所述的核酸,其中所述核酸包含DNA序列。
23.权利要求12至22中任一项所述的核酸,其中所述核酸包含RNA序列。
24.权利要求12至23中任一项所述的核酸,其中所述核酸还包含聚腺苷(polyA)序列。
25.权利要求24所述的核酸,其中所述polyA序列是微型polyA序列。
26.细胞,其包含权利要求12至25中任一项所述的核酸。
27.组合物,其包含权利要求12至25中任一项所述的核酸。
28.细胞,其包含权利要求27所述的组合物。
29.组合物,其包含权利要求28所述的细胞。
30.载体,其包含权利要求12至25中任一项所述的核酸。
31.权利要求30所述的载体,其中所述载体还包含编码转座元件的反向末端重复(ITR)的序列。
32.权利要求31所述的载体,其中所述转座元件是转座子。
33.权利要求32所述的载体,其中所述转座子是Tn7转座子。
34.权利要求33所述的载体,其中所述载体还包含编码T7转座子的5’ITR的序列和编码T7转座子的3’ITR的序列。
35.权利要求30至34中任一项所述的载体,其中所述载体是非病毒载体。
36.权利要求35所述的载体,其中所述非病毒载体是质粒。
37.权利要求30至34中任一项所述的载体,其中所述载体是病毒载体。
38.权利要求37所述的载体,其中所述病毒载体是腺相关病毒(AAV)载体或腺病毒载体。
39.权利要求38所述的载体,其中所述AAV载体是复制缺陷型或条件性复制缺陷型的。
40.权利要求38或39所述的载体,其中所述AAV载体是重组AAV载体。
41.权利要求38至40中任一项所述的载体,其中所述AAV载体包含分离自或来源于以下血清型的AAV载体的序列:血清型1(AAV1)、2(AAV2)、3(AAV3)、4(AAV4)、5(AAV5)、6(AAV6)、7(AAV7)、8(AAV8)、9(AAV9)、10(AAV10)、11(AAV11),或其任意组合。
42.权利要求38至41中任一项所述的载体,其中所述AAV载体包含分离自或来源于血清型9的AAV载体(AAV9)的序列。
43.权利要求38至42中任一项所述的载体,其中所述AAV载体包含分离自或来源于血清型2的AAV载体(AAV2)的序列。
44.权利要求38至43中任一项所述的载体,其中所述AAV载体包含分离自或来源于AAV2的序列和分离自或来源于AAV9的序列。
45.权利要求30至44中任一项所述的载体,其中所述载体针对在哺乳动物细胞中的表达进行了优化。
46.权利要求30至45中任一项所述的载体,其中所述载体针对在人细胞中的表达进行了优化。
47.组合物,其包含权利要求30至46中任一项所述的载体。
48.权利要求47所述的组合物,其还包含可药用载体。
49.细胞,其包含45或46所述的组合物。
50.权利要求49所述的细胞,其中所述细胞是人细胞。
51.权利要求49或50所述的细胞,其中所述细胞是心肌细胞。
52.权利要求49或50所述的细胞,其中所述细胞是诱导多能干(iPS)细胞。
53.组合物,其包含权利要求49至52中任一项所述的细胞。
54.用于校正人RBM20中的突变的方法,所述方法包括使细胞与权利要求47或48中任一项所述的组合物在适于表达所述第一gRNA和所述腺嘌呤碱基编辑器的条件下接触,其中所述第一gRNA与所述腺嘌呤碱基编辑器形成复合物,其中所述复合物修饰突变,从而对RBM20的编码序列进行恢复性校正。
55.细胞,其通过权利要求54所述的方法产生。
56.在有此需要的对象中治疗扩张型心肌病的方法,所述方法包括向所述对象施用治疗有效量的权利要求47或48中任一项所述的组合物。
57.权利要求56所述的方法,其中所述组合物经局部施用。
58.权利要求56或57所述的方法,其中将所述组合物直接施用于心脏组织。
59.权利要求56至58中任一项所述的方法,其中所述组合物通过输注或注射施用。
60.权利要求56所述的方法,其中所述组合物经全身施用。
61.权利要求60所述的方法,其中所述组合物通过静脉内输注或注射施用。
62.权利要求56至61中任一项所述的方法,其中在施用所述组合物之后,所述对象表现出正常的肌节结构架构、RBM20的核定位、不存在RNP颗粒形成,或其组合。
63.权利要求56至62中任一项所述的方法,其中在施用所述组合物之后,所述对象表现出改善的LV功能。
64.权利要求56至63中任一项所述的方法,其中所述对象是新生儿、婴儿、儿童、年轻成人或成人。
65.权利要求56至64中任一项所述的方法,其中所述对象是男性。
66.权利要求56至64中任一项所述的方法,其中所述对象是女性。
67.治疗有效量的权利要求47或48中任一项所述的组合物用于在有此需要的对象中治疗扩张型心肌病的用途。
68.指导RNA(gRNA),其包含5’-GATATGGCCCAGAAAGGCCG-3’(SEQ ID NO:5)的靶向核酸序列。
69.权利要求68所述的gRNA,其中所述gRNA是先导编辑(pe)gRNA(pegRNA)。
70.权利要求68或69所述的gRNA,其中所述gRNA用于修饰人RBM20基因以校正C1906A突变。
71.权利要求68所述的gRNA,其中所述gRNA还包含引物结合位点,所述引物结合位点包含5’-CCTTTCTGGGC-3’(SEQ ID NO:6)的核酸序列。
72.权利要求71所述的gRNA,其中所述gRNA还包含逆转录酶模板,所述逆转录酶模板包含5’-GGACTACGAGAGCGCGG-3’(SEQ ID NO:7)的核酸序列。
73.组合物,其包含先导编辑器和靶向人RBM20中的突变的gRNA。
74.权利要求73所述的组合物,其中所述先导编辑器包含与逆转录酶连接的CRISPR/Cas核酸酶。
75.权利要求73所述的组合物,其中所述gRNA是权利要求89至94中任一项所述的gRNA。
76.权利要求75所述的组合物,其中所述先导编辑器包含与逆转录酶连接的CRISPR/Cas核酸酶。
77.权利要求76所述的组合物,其中所述CRISPR/Cas核酸酶是催化受损的。
78.权利要求76或77所述的组合物,其中所述CRISPR/Cas核酸酶是Cas9核酸酶。
79.权利要求78所述的组合物,其中所述Cas9核酸酶分离自或来源于酿脓链球菌(spCas9)。
80.权利要求73至79中任一项所述的组合物,其还包含第二链切口sgRNA。
81.核酸,其包含:
编码第一gRNA的序列,所述gRNA是权利要求68至72中任一项所述的gRNA,
编码先导编辑器的序列,
编码第一启动子的序列,其中所述第一启动子驱动编码所述第一gRNA的序列的表达,和
编码第二启动子的序列,其中所述第二启动子驱动编码所述先导编辑器的序列的表达。
82.权利要求81所述的核酸,其中所述先导编辑器包含与逆转录酶连接的CRISPR/Cas核酸酶。
83.权利要求82所述的核酸,其中所述CRISPR/Cas核酸酶是催化受损的。
84.权利要求82或83所述的核酸,其中所述CRISPR/Cas核酸酶是Cas9核酸酶。
85.权利要求84所述的核酸,其中所述Cas9核酸酶分离自或来源于酿脓链球菌(spCas9)。
86.权利要求81至85中任一项所述的核酸,其还包含编码第二链切口sgRNA的序列。
87.权利要求81至86中任一项所述的核酸,其中所述编码第一启动子的序列和所述编码第二启动子的序列中的至少一个包含细胞类型特异性启动子。
88.权利要求87所述的核酸,其中所述细胞类型特异性启动子是心肌细胞特异性启动子。
89.权利要求88所述的核酸,其中肌肉特异性启动子是心肌肌钙蛋白T(cTnT)启动子。
90.权利要求81至89中任一项所述的核酸,其中所述编码第一启动子的序列包含编码U6启动子、H1启动子或7SK启动子的序列。
91.权利要求81至90中任一项所述的核酸,其中所述核酸包含DNA序列。
92.权利要求81至91中任一项所述的核酸,其中所述核酸包含RNA序列。
93.权利要求81至92中任一项所述的核酸,其中所述核酸还包含聚腺苷(polyA)序列。
94.权利要求93所述的核酸,其中所述polyA序列是微型polyA序列。
95.细胞,其包含权利要求81至94中任一项所述的核酸。
96.组合物,其包含权利要求81至94中任一项所述的核酸。
97.细胞,其包含权利要求96所述的组合物。
98.组合物,其包含权利要求97所述的细胞。
99.载体,其包含权利要求81至94中任一项所述的核酸。
100.权利要求99所述的载体,其中所述载体还包含编码转座元件的反向末端重复(ITR)的序列。
101.权利要求100所述的载体,其中所述转座元件是转座子。
102.权利要求101所述的载体,其中所述转座子是Tn7转座子。
103.权利要求102所述的载体,其中所述载体还包含编码T7转座子的5’ITR的序列和编码T7转座子的3’ITR的序列。
104.权利要求99至103中任一项所述的载体,其中所述载体是非病毒载体。
105.权利要求127所述的载体,其中所述非病毒载体是质粒。
106.权利要求99至103中任一项所述的载体,其中所述载体是病毒载体。
107.权利要求129所述的载体,其中所述病毒载体是腺相关病毒(AAV)载体。
108.权利要求107所述的载体,其中所述AAV载体是复制缺陷型或条件性复制缺陷型的。
109.权利要求107或108所述的载体,其中所述AAV载体是重组AAV载体。
110.权利要求107至109中任一项所述的载体,其中所述AAV载体包含分离自或来源于以下血清型的AAV载体的序列:血清型1(AAV1)、2(AAV2)、3(AAV3)、4(AAV4)、5(AAV5)、6(AAV6)、7(AAV7)、8(AAV8)、9(AAV9)、10(AAV10)、11(AAV11),或其任意组合。
111.权利要求107至110中任一项所述的载体,其中所述AAV载体包含分离自或来源于血清型9的AAV载体(AAV9)的序列。
112.权利要求107至111中任一项所述的载体,其中所述AAV载体包含分离自或来源于血清型2的AAV载体(AAV2)的序列。
113.权利要求107至112中任一项所述的载体,其中所述AAV载体包含分离自或来源于AAV2的序列和分离自或来源于AAV9的序列。
114.权利要求99至113中任一项所述的载体,其中所述载体针对在哺乳动物细胞中的表达进行了优化。
115.权利要求99至114中任一项所述的载体,其中所述载体针对在人细胞中的表达进行了优化。
116.组合物,其包含权利要求99至115中任一项所述的载体。
117.权利要求116所述的组合物,其还包含可药用载体。
118.细胞,其包含116或117所述的组合物。
119.权利要求118所述的细胞,其中所述细胞是人细胞。
120.权利要求18或119所述的细胞,其中所述细胞是心肌细胞。
121.权利要求118或119所述的细胞,其中所述细胞是诱导多能干(iPS)细胞。
122.组合物,其包含权利要求118至121中任一项所述的细胞。
123.用于校正人RBM20中的突变的方法,所述方法包括使细胞与权利要求116或117中任一项所述的组合物在适于表达所述第一gRNA和所述先导编辑器的条件下接触,其中所述第一gRNA与所述先导编辑器形成复合物,其中所述复合物修饰突变,从而对RBM20的编码序列进行恢复性校正。
124.细胞,其通过权利要求123所述的方法产生。
125.在有此需要的对象中治疗扩张型心肌病的方法,所述方法包括向所述对象施用治疗有效量的权利要求116或117中任一项所述的组合物。
126.权利要求125所述的方法,其中所述组合物经局部施用。
127.权利要求125或126所述的方法,其中将所述组合物直接施用于心脏组织。
128.权利要求125至127中任一项所述的方法,其中所述组合物通过输注或注射施用。
129.权利要求125所述的方法,其中所述组合物经全身施用。
130.权利要求129所述的方法,其中所述组合物通过静脉内输注或注射施用。
131.权利要求125至130中任一项所述的方法,其中在施用所述组合物之后,所述对象表现出正常的肌节结构架构、RBM20的核定位、不存在RNP颗粒形成,或其组合。
132.权利要求125至131中任一项所述的方法,其中在施用所述组合物之后,所述对象表现出改善的LV功能。
133.权利要求125至132中任一项所述的方法,其中所述对象是新生儿、婴儿、儿童、年轻成人或成人。
134.权利要求125至133中任一项所述的方法,其中所述对象是男性。
135.权利要求125至133中任一项所述的方法,其中所述对象是女性。
136.治疗有效量的权利要求116或117中任一项所述的组合物用于在有此需要的对象中治疗肌营养不良的用途。
137.小鼠,其基因组包含至少一个编码R636Q突变的Rbm20的等位基因。
138.权利要求137所述的小鼠,其中所述小鼠具有C57/BL6遗传背景。
139.权利要求137所述的小鼠,其中所述基因组对于编码R636Q突变的Rbm20的等位基因是纯合的。
140.权利要求137所述的小鼠,其中所述小鼠患有心脏功能障碍。
141.权利要求140所述的小鼠,其中舒张末期(LVIDd)和收缩末期(LVIDs)期间的左心室内部尺寸增大。
142.权利要求140所述的小鼠,其中所述心脏功能障碍是心房和心室扩张。
143.权利要求140所述的小鼠,其中所述心脏功能障碍是缩短分数降低。
144.细胞,其分离自权利要求137至143中任一项所述的小鼠。
145.权利要求144所述的细胞,其中所述细胞是心肌细胞。
146.用于在根据权利要求137至143中任一项所述的小鼠中筛选至少一种候选药剂的方法,其包括向所述小鼠施用一种或更多种候选药剂。
147.权利要求146所述的方法,其中针对改善左心室功能的能力来筛选所述至少一种候选药剂。
148.权利要求146所述的方法,其中针对挽救心脏腔室尺寸的能力来筛选所述至少一种候选药剂。
149.权利要求146至148中任一项所述的方法,其中针对延长寿命的能力来筛选所述至少一种候选药剂。
150.权利要求146至148中任一项所述的方法,其中所述候选药剂包含权利要求12至25中任一项所述的核酸。
CN202280057063.3A 2021-07-02 2022-06-30 Rbm20突变的基因组编辑 Pending CN117980482A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US63/218,221 2021-07-02
US202263335647P 2022-04-27 2022-04-27
US63/335,647 2022-04-27
PCT/US2022/035666 WO2023278660A2 (en) 2021-07-02 2022-06-30 Genomic editing of rbm20 mutations

Publications (1)

Publication Number Publication Date
CN117980482A true CN117980482A (zh) 2024-05-03

Family

ID=90853955

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280057063.3A Pending CN117980482A (zh) 2021-07-02 2022-06-30 Rbm20突变的基因组编辑

Country Status (1)

Country Link
CN (1) CN117980482A (zh)

Similar Documents

Publication Publication Date Title
US20230340456A1 (en) Use of exonucleases to improve crispr/cas-mediated genome editing
US12091659B2 (en) High efficiency library-identified AAV vectors
US20240197837A1 (en) Gene editing of deep intronic mutations
US11066679B2 (en) Closed-ended linear duplex DNA for non-viral gene transfer
US20210017509A1 (en) Gene Editing for Autosomal Dominant Diseases
WO2016049163A2 (en) Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder
AU2019226527A1 (en) Closed-ended DNA (ceDNA) vectors for insertion of transgenes at genomic safe harbors (GSH) in humans and murine genomes
CN113272428A (zh) 核酸构建体和使用方法
CN113631710A (zh) 用于治疗rho相关的常染色体显性视网膜色素变性(adrp)的crispr/rna指导的核酸酶相关方法和组合物
JP2024109708A (ja) 非症候性感音性聴力喪失の治療方法
WO2019010091A1 (en) METHODS AND COMPOSITIONS FOR FACILITATING HOMOLOGOUS RECOMBINATION
CN114746125A (zh) 用于x连锁青少年型视网膜劈裂症疗法的crispr和aav策略
US20230272428A1 (en) Methods and compositions for correction of dmd mutations
CN117980482A (zh) Rbm20突变的基因组编辑
KR20240027748A (ko) Rbm20 돌연변이의 게놈 편집
US20220177878A1 (en) Crispr/cas9 gene editing of atxn2 for the treatment of spinocerebellar ataxia type 2
JP2024529294A (ja) ミオシン重鎖塩基編集のための組成物および方法
WO2023147558A2 (en) Crispr methods for correcting bag3 gene mutations in vivo
CN116323941A (zh) 通过诱导抗肌萎缩蛋白相关蛋白调节元件内的突变增强细胞中抗肌萎缩蛋白相关蛋白表达及其治疗用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication