CN117813382A - 包括靶向stathmin 2(stmn2)的rna向导的基因编辑系统和其用途 - Google Patents

包括靶向stathmin 2(stmn2)的rna向导的基因编辑系统和其用途 Download PDF

Info

Publication number
CN117813382A
CN117813382A CN202280056404.5A CN202280056404A CN117813382A CN 117813382 A CN117813382 A CN 117813382A CN 202280056404 A CN202280056404 A CN 202280056404A CN 117813382 A CN117813382 A CN 117813382A
Authority
CN
China
Prior art keywords
sequence
nucleotide
seq
nucleotides
nos
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280056404.5A
Other languages
English (en)
Inventor
T·M·迪托马索
A·J·加里蒂
N·M·贾基莫
Q·N·韦塞尔斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Abbott Biotechnology
Original Assignee
Abbott Biotechnology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Abbott Biotechnology filed Critical Abbott Biotechnology
Priority claimed from PCT/US2022/040042 external-priority patent/WO2023018858A1/en
Publication of CN117813382A publication Critical patent/CN117813382A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

一种用于对stathmin 2(STMN2)基因进行基因编辑的系统,所述系统包括:(i)Cas12i2多肽或编码所述Cas12i2多肽的第一核酸;以及(ii)RNA向导或编码所述RNA向导的第二核酸,其中所述RNA向导包括对STMN2基因内的靶序列具有特异性的间隔子序列。本文还提供了用于使用本文所公开的基因编辑系统编辑STMN2基因和/或用于治疗与所述STMN2基因相关的疾病的方法。

Description

包括靶向STATHMIN 2(STMN2)的RNA向导的基因编辑系统和其 用途
相关申请的交叉引用
本申请根据35U.S.C.§119(e)要求于2021年8月11日提交的美国临时申请第63/231,784号和于2022年3月21日提交的美国临时申请第63/322,002号的权益,所述美国临时申请中的每一个的内容通过引用以其整体并入本文。
背景技术
成簇的规律间隔的短回文重复序列(CRISPR)和CRISPR相关(Cas)基因统称为CRISPR-Cas或CRISPR/Cas系统,是保护特定物种免受外来遗传要素影响的古生菌(archaea)和细菌中的适应性免疫系统。
发明内容
本公开至少部分基于对stathmin 2(STMN2)基因进行基因编辑系统的开发。所述系统涉及Cas12i多肽,如Cas12i2多肽和介导CRISPR核酸酶多肽在STMN2基因内的基因位点处切割的RNA向导。如本文所报道的,本文所公开的基因编辑系统已经以高编辑效率和准确性成功地编辑了STMN2基因。
不受理论的束缚,本文所公开的基因编辑系统可以表现出以下有利特征中的一个或多个以下有利特征。与SpCas9和Cas12a相比,与其短成熟crRNA(40-43nt)相结合的Cas12i效应子更小(1033至1093aa),这在递送和合成成本方面是优选的。与Cas9切割诱导的小缺失和+1插入相比,Cas12i切割导致更大的缺失。Cas12i PAM序列也不同于Cas9中的那些序列。因此,与Cas9相比,用Cas12i多肽和RNA向导可以破坏所关注的基因位点的更大和不同的部分。使用基于标签化(tagmentation)的标签整合位点测序(TTISS)的无偏方法,与Cas12i2相比,SpCas9鉴定出更多具有更高数量的独特整合事件的潜在脱靶位点。参见WO/2021/202800。因此,Cas12i如Cas12i2可能比Cas9更具特异性。
因此,本文提供了用于编辑STMN2基因的基因编辑系统、包括此类基因编辑系统的药物组合物或试剂盒、使用基因编辑系统产生经基因修饰的细胞的方法以及由此产生的所得细胞。本文还提供了本文所公开的基因编辑系统、包括此类基因编辑系统的药物组合物和试剂盒和/或因此产生的经基因修饰的细胞用于治疗受试者的神经退行性疾病(例如,肌萎缩性侧索硬化症(ALS)或额颞叶痴呆(FTD))的用途。
在一些方面,本公开的特征在于用于对stathmin 2(STMN2)基因进行基因编辑的系统,所述系统包括:(i)Cas12i多肽或编码所述Cas12i多肽的第一核酸;以及(ii)RNA向导或编码所述RNA向导的第二核酸。所述RNA向导包括对STMN2基因内的靶序列具有特异性的间隔子序列,所述靶序列与包括5'-TTN-3'的基序的位于所述靶序列的5'的原间隔子相邻基序(PAM)相邻。
在一些实施例中,所述Cas12i是Cas12i2多肽。在其它实施例中,所述Cas12i是Cas12i4多肽。
在一些实施例中,所述Cas12i多肽是Cas12i2多肽,所述Cas12i2多肽包括与SEQID NO:448至少95%相同的氨基酸序列。在一些情况下,所述Cas12i2多肽可以包括相对于SEQ ID NO:448的一个或多个突变。在一些实例中,所述Cas12i2多肽中的所述一个或多个突变位于SEQ ID NO:448的位置D581、G624、F626、P868、I926、V1030、E1035和/或S1046处。在一些实例中,所述一个或多个突变是氨基酸取代,所述氨基酸取代任选地是D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G或其组合。
在一个实例中,所述Cas12i2多肽包括位于位置D581、D911、I926和V1030处的突变(例如,D581R、D911R、I926R和V1030G的氨基酸取代)。在另一个实例中,所述Cas12i2多肽包括位于位置D581、I926和V1030处的突变(例如,D581R、I926R和V1030G的氨基酸取代)。在又另一个实例中,所述Cas12i2多肽包括位于位置D581、I926、V1030和S1046处的突变(例如,D581R、I926R、V1030G和S1046G的氨基酸取代)。在仍另一个实例中,所述Cas12i2多肽包括位于位置D581、G624、F626、I926、V1030、E1035和S1046处的突变(例如,D581R、G624R、F626R、I926R、V1030G、E1035R和S1046G的氨基酸取代)。在另一个实例中,所述Cas12i2多肽包括位于位置D581、G624、F626、P868、I926、V1030、E1035和S1046处的突变(例如,D581R、G624R、F626R、P868T、I926R、V1030G、E1035R和S1046G的氨基酸取代)。
用于本文所公开的任何基因编辑系统的示例性Cas12i2多肽可以包括SEQ ID NO:449-453中的任一者的氨基酸序列。在一个实例中,用于本文所公开的任何基因编辑系统的示例性Cas12i2多肽包括SEQ ID NO:450的氨基酸序列。在另一个实例中,用于本文所公开的任何基因编辑系统的示例性Cas12i2多肽包括SEQ ID NO:453的氨基酸序列。
在一些实施例中,所述基因编辑系统可以包括编码所述Cas12i多肽(例如,所述Cas12i2多肽)的所述第一核酸。在一些情况下,所述第一核酸位于第一载体(例如,病毒载体,如腺相关病毒载体或AAV载体)中。在一些情况下,所述第一核酸是信使RNA(mRNA)。在一些情况下,所述Cas12i多肽的编码序列是密码子优化的。
在一些实施例中,所述靶序列可以在所述STMN2基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或内含子内。
在一些实施例中,所述RNA向导包括SEQ ID NO:4508、4512、4559和4561中的任一者的序列,或者所述第二核酸编码包括SEQ ID NO:4508、4512、4559和4561中的任一者的RNA向导。
在一些实施例中,所述RNA向导包括SEQ ID NO:4505、4506、4507、4508、4509、4510、4511、4512、4513、4514、4515、4554、4555、4556、4557、4558、4559、4560、4561和4562中的任一者的序列,或者所述第二核酸编码包括SEQ ID NO:4505、4506、4507、4508、4509、4510、4511、4512、4513、4514、4515、4554、4555、4556、4557、4558、4559、4560、4561和4562中的任一者的RNA向导。
在一些实施例中,所述间隔子序列的长度可以为20-30个核苷酸。在一些实例中,所述间隔子序列的长度为20个核苷酸。
在一些实施例中,所述RNA向导包括间隔子和直接重复序列。在一些实例中,所述直接重复序列的长度为23-36个核苷酸。在一个实例中,所述直接重复序列与SEQ ID NO:1-10中的任一者或其长度为至少23个核苷酸的片段至少90%相同。在一些具体实例中,所述直接重复序列是SEQ ID NO:1-10中的任一者或其长度为至少23个核苷酸的片段。作为非限制性实例,所述直接重复序列是5'-AGAAAUCCGUCUUUCAUUGACGG-3'(SEQ ID NO:10)。
在一些实施例中,所述系统可以包括编码所述RNA向导的第二核酸。在一些实例中,编码所述RNA向导的所述核酸可以位于病毒载体中。在一些实例中,所述病毒载体包括编码所述Cas12i多肽(例如,所述Cas12i2多肽)的所述第一核酸和编码所述RNA向导的所述第二核酸两者。
在一些实施例中,本文所描述的任何系统可以包括位于第一载体中的编码所述Cas12i多肽(例如,所述Cas12i2多肽)的所述第一核酸,以及位于第二载体中的编码所述RNA向导的所述第二核酸。在一些实例中,所述第一载体和/或所述第二载体是病毒载体。在一些具体实例中,所述第一载体和所述第二载体是相同的载体。
在一些实施例中,本文所描述的任何系统可以包括一个或多个脂质纳米颗粒(LNP),所述LNP涵盖所述Cas12i多肽(例如,所述Cas12i2多肽)或编码所述Cas12i多肽的所述第一核酸、所述RNA向导或编码所述RNA向导的所述第二核酸或两者。
在一些实施例中,本文所描述的系统可以包括LNP,所述LNP涵盖所述Cas12i多肽(例如,所述Cas12i2多肽)或编码所述Cas12i多肽的所述第一核酸,以及包括编码所述RNA向导的所述第二核酸的病毒载体。在一些实例中,所述病毒载体是AAV载体。在其它实施例中,本文所描述的系统可以包括LNP,所述LNP涵盖所述RNA向导或编码所述RNA向导的所述第二核酸,以及包括编码所述Cas12i多肽的所述第一核酸的病毒载体。在一些实例中,所述病毒载体是AAV载体。
在一些方面,本公开还提供了一种药物组合物,所述药物组合物包括本文所公开的任何基因编辑系统,以及一种试剂盒,所述试剂盒包括所述基因编辑系统的组分。
在其它方面,本公开的特征还在于一种用于编辑细胞中的stathmin 2(STMN2)基因的方法,所述方法包括使宿主细胞与本文所公开的任何系统接触,以对所述宿主细胞中的所述STMN2基因进行基因编辑。在一些实例中,所述宿主细胞在体外培养。在其它实例中,接触步骤是通过向包括所述宿主细胞的受试者施用所述用于编辑所述STMN2基因的系统来进行的。
本公开的范围内还存在一种细胞,所述细胞破坏的stathmin 2(STMN2)基因,所述基因可以通过使宿主细胞与本文所公开的系统接触来产生,以对所述宿主细胞中的所述STMN2基因进行基因编辑。
仍在其它方面,本公开提供了一种用于治疗受试者的神经退行性疾病(例如,肌萎缩性侧索硬化症(ALS)或额颞叶痴呆(FTD)的方法。所述方法可以包括向有需要的受试者施用用于编辑stathmin 2(STMN2)基因的任何系统或本文所公开的任何细胞。
本文还提供了一种RNA向导,所述RNA向导包括:(i)如本文所公开的间隔子序列,所述间隔子序列对stathmin 2(STMN2)基因中的靶序列具有特异性,其中所述靶序列与包括5'-TTN-3'的基序的位于所述靶序列的5'的原间隔子相邻基序(PAM)相邻;以及(ii)直接重复序列。
在一些实施例中,所述间隔子的长度可以为20-30个核苷酸。在一些实例中,所述间隔子的长度为20个核苷酸。
在一些实施例中,所述直接重复序列的长度可以为23-36个核苷酸。在一些实例中,所述直接重复序列的长度为23个核苷酸。
在一些实施例中,所述靶序列在所述STMN2基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或内含子内。
在一些实施例中,所述RNA向导包括SEQ ID NO:4508、4512、4559和4561中的任一者的序列,或者所述第二核酸编码包括SEQ ID NO:4508、4512、4559和4561中的任一者的RNA向导。
在一些实施例中,所述RNA向导包括SEQ ID NO:4505、4506、4507、4508、4509、4510、4511、4512、4513、4514、4515、4554、4555、4556、4557、4558、4559、4560、4561和4562中的任一者的序列,或者所述第二核酸编码包括SEQ ID NO:4505、4506、4507、4508、4509、4510、4511、4512、4513、4514、4515、4554、4555、4556、4557、4558、4559、4560、4561和4562中的任一者的RNA向导。
在一些实施例中,所述直接重复序列与SEQ ID NO:1-10中的任一者或其长度为至少23个核苷酸的片段至少90%相同。在一些实例中,所述直接重复序列是SEQ ID NO:1-10中的任一者或其长度为至少23个核苷酸的片段。作为非限制性实例,所述直接重复序列是5'-AGAAAUCCGUCUUUCAUUGACGG-3'(SEQ ID NO:10)。
本文还提供了本文所公开的任何基因编辑系统、包括此类基因编辑系统的药物组合物或试剂盒、或由所述基因编辑系统产生的用于治疗受试者的神经退行性疾病(例如,肌萎缩性侧索硬化症(ALS)或额颞叶痴呆(FTD))的经基因修饰的细胞、以及本文所公开的基因编辑系统、包含此类基因编辑系统的药物组合物或试剂盒、或由所述基因编辑系统产生的用于制造治疗受试者的神经退行性疾病(例如,肌萎缩性侧索硬化症(ALS)或额颞叶痴呆(FTD))的药物的经基因修饰的细胞的用途。
在下文的描述中阐述了本发明的一个或多个实施例的细节。本发明的其它特征或优点从以下附图和若干实施例的详细说明以及还从所附权利要求中将变得显而易见。
附图说明
以下附图形成本说明书的一部分,并且被包含在内以进一步说明本公开的某些方面,通过参考附图与本文呈现的具体实施例的详细说明的组合可以更好地理解所述方面。
图1示出了如实例1中所描述的STMN2内含子靶序列通过所指示的向导的编辑百分比。
图2A示出了向导4、8、55和57对STMN2内含子1中的隐蔽剪接位点的破坏>15%。
图2B示出了向导12、46、47、48和49对STMN2内含子1中的3个TDP-43结合基序中的至少一个的破坏>15%。
图2C示出了向导17和18对STMN2内含子1中的过早聚腺苷酸化信号的破坏>15%。
图3是示出了每个所指示的RNA向导相对于隐蔽剪接位点、TDP-43结合基序和过早聚腺苷酸化信号的位置与STMN2的内含子1结合的位置的示意图。
图4示出了SH-SY5Y细胞中的测试的RNA向导的插入缺失活性。
图5A是比较了分别在来自实例1和实例2的HEK293T细胞和SH-SY5Y细胞中证明的插入缺失活性(插入缺失%)的图。图5B是比较了分别在来自实例1和实例2的HEK293T细胞和SH-SY5Y细胞中证明的剪接位点基序破坏的图。
具体实施方式
本公开涉及一种用于对stathmin 2(STMN2)基因进行基因编辑的系统,所述系统包括:(i)Cas12i多肽或编码所述Cas12i2多肽的第一核酸;以及(ii)RNA向导或编码所述RNA向导的第二核酸,其中所述RNA向导包括对STMN2基因内的靶序列具有特异性的间隔子序列,所述靶序列与包括5'-TTN-3'的基序的位于所述靶序列的5'的原间隔子相邻基序(PAM)相邻。本公开还提供了包括此类系统的药物组合物或试剂盒以及其用途。本文还公开了一种用于编辑细胞中的STMN2基因的方法、如此产生的包括破坏的STMN2基因的细胞、治疗受试者的神经退行性疾病的方法、以及RNA向导,所述RNA向导包括:(i)间隔子序列,所述间隔子序列对STMN2基因中的靶序列具有特异性,其中所述靶序列与包括5'-TTN-3'的基序的位于所述靶序列的5'的原间隔子相邻基序(PAM)相邻;以及(ii)直接重复序列,以及其用途。
用于本文所公开的基因编辑系统中的所述Cas12i多肽可以是Cas12i2多肽,例如,本文所公开的野生型Cas12i多肽或其变体。在一些实例中,所述Cas12i2多肽包括与SEQ IDNO:448至少95%相同的氨基酸序列,并且包括相对于SEQ ID NO:448的一个或多个突变。在其它实例中,所述Cas12i多肽可以是Cas12i4多肽,其也在本文中公开。
定义
本公开将相对于具体实施例并参考某些图来描述,但本公开并不受限于此而只受权利要求限制。除非另有说明,否则下文中所示的术语通常被理解为其常识。
如本文所使用的,术语“活性”是指生物活性。在一些实施例中,活性包含酶促活性,例如,Cas12i多肽的催化能力。例如,活性可以包含核酸酶活性。
如本文所使用的术语“STMN2”是指“stathmin-2”。STMN2是stathmin蛋白家族的神经元特异性成员并在调节微管稳定性和信号转导中发挥作用。本文所示的SEQ ID NO:454提供了STMN2基因序列的实例。对于该序列还参考了基因ID:11075(www.ncbi.nlm.nih.gov/gene/11075)。
如本文所使用的,术语“Cas12i多肽”(本文也称为Cas12i)是指与RNA向导所指定的靶核酸上的靶序列结合的多肽,其中所述多肽与野生型Cas12i多肽具有至少一些氨基酸序列同源性。在一些实施例中,Cas12i多肽包括与美国专利第10,808,245号的SEQ ID NO:1-5和11-18中的任一者的至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性,所述文献通过引用并入以用于本文所引用的主题和目的。在一些实施例中,Cas12i多肽包括与本申请的SEQ ID NO:4503、448、4504和482中的任一者的至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施例中,本公开的Cas12i多肽是如WO/2021/202800中所描述的Cas12i2多肽,所述文献的相关公开内容通过引用并入以用于本文所引用的主题和目的。在一些实施例中,Cas12i多肽切割靶核酸(例如,作为缺口或双链断裂)。
如本文所使用的,术语“相邻”是指与另一个核苷酸或氨基酸序列非常接近的核苷酸或氨基酸序列。在一些实施例中,如果没有核苷酸将两个序列分离,则核苷酸序列与另一个核苷酸序列相邻(即,紧邻)。在一些实施例中,如果少量核苷酸将两个序列分离(例如,约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个核苷酸),则核苷酸序列与另一个核苷酸序列相邻。在一些实施例中,如果两个序列相隔约5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个核苷酸,则第一序列与第二序列相邻。在一些实施例中,如果两个序列相隔至多2个核苷酸、至多5个核苷酸、至多8个核苷酸、至多10个核苷酸、至多12个核苷酸或至多15个核苷酸,则第一序列与第二序列相邻。在一些实施例中,如果两个序列相隔2-5个核苷酸、4-6个核苷酸、4-8个核苷酸、4-10个核苷酸、6-8个核苷酸、6-10个核苷酸、6-12个核苷酸、8-10个核苷酸、8-12个核苷酸、10-12个核苷酸、10-15个核苷酸或12-15个核苷酸,则第一序列与第二序列相邻。
如本文所使用的,术语“复合物”是指两个或更多个分子的组合。在一些实施例中,复合物包括彼此相互作用(例如,结合、接触、粘附)的多肽和核酸分子。例如,术语“复合物”可以指RNA向导和多肽(例如,Cas12i多肽)的组合。可替代地,术语“复合物”可以指RNA向导、多肽和靶序列的互补区的组合。如本文所使用的,术语“复合物”可以指靶向STMN2的RNA向导和Cas12i多肽的组合。
如本文所使用的,术语“原间隔子相邻基序”或“PAM”是指与靶序列(例如,STMN2靶序列)相邻的DNA序列。在双链DNA分子中,含有PAM基序的链被称为“PAM链”,并且互补链被称为“非PAM链”。RNA向导与和本文所公开的靶序列互补的非PAM链中的位点结合。
在一些实施例中,PAM链是编码(例如,有义)链。在其它实施例中,PAM链是非编码链(例如,反义链)。由于RNA向导通过碱基配对与非PAM链结合,非PAM链也被称为靶链,而PAM链也被称为非靶链。
如本文所使用的,术语“靶序列”是指与PAM基序(在PAM链上)相邻的DNA片段。靶序列的互补区在非PAM链上。靶序列可以紧邻PAM基序。可替代地,靶序列和PAM可以通过小的序列区段(例如,至多5个核苷酸,例如,至多4个、3个、2个或1个核苷酸)分离。根据本领域已知的识别PAM基序的CRISPR核酸酶,靶序列可以位于PAM基序的3'端处或PAM基序的5'端处。例如,靶序列位于Cas12i多肽(例如,Cas12i2多肽,如本文所公开的那些)的PAM基序的3'端处。在一些实施例中,靶序列是STMN2基因序列内的序列,包含但不限于SEQ ID NO:454中所示的序列。
如本文所使用的,术语“间隔子”或“间隔子序列”是为靶序列(DNA序列)的RNA等效物的RNA向导中的一部分。间隔子含有能够通过与靶序列(在PAM链中)互补的位点处的碱基配对与非PAM链结合的序列。此类间隔子也被称为对靶序列具有特异性。在一些情况下,除了RNA-DNA序列差异之外,间隔子可以与靶序列至少75%(例如,至少80%、至少85%、至少90%、至少95%、至少98%或至少99%)相同。在一些情况下,除了RNA-DNA序列差异之外,间隔子可以与靶序列100%相同。
如本文所使用的,术语“RNA向导”或“RNA向导序列”是指促进本文所描述的多肽(例如,Cas12i多肽)靶向靶序列(例如,STMN2基因的序列)的任何RNA分子或经修饰的RNA分子。例如,RNA向导可以是被设计成与特定核酸序列(靶序列,如STMN2基因内的靶序列)互补的分子。RNA向导可以包括间隔子序列和直接重复(DR)序列。在一些情况下,RNA向导可以是包括一个或多个脱氧核糖核苷酸的经修饰的RNA分子,例如,包含在RNA向导中的DNA结合序列中,其结合与靶序列互补的序列。在一些实例中,DNA结合序列可以含有DNA序列或DNA/RNA杂交序列。术语CRISPR RNA(crRNA)、前crRNA和成熟crRNA在本文中也用于指RNA向导。
如本文所使用的,术语“互补”是指与第二多核苷酸(例如,靶序列的互补序列)具有一定程度的互补性的第一多核苷酸(例如,RNA向导的间隔子序列),使得第一多核苷酸和第二多核苷酸可以通过碱基配对形成双链复合物,以允许与第一多核苷酸复合的效应多肽作用于(例如,切割)第二多核苷酸。在一些实施例中,第一多核苷酸可以与第二多核苷酸基本上互补,即,与第二多核苷酸具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%互补性。在一些实施例中,第一多核苷酸与第二多核苷酸完全互补,即,与第二多核苷酸具有100%互补性。
两个核酸或两个氨基酸序列的“同一性百分比”(亦称序列同一性)是使用Karlin和Altschul《美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)》87:2264-68,1990的算法确定的,所述算法如Karlin和Altschul《美国国家科学院院刊)》90:5873-77,1993中那样进行修改。此类算法并入Altschul等人《分子生物学杂志(J.Mol.Biol.)》215:403-10,1990的NBLAST和XBLAST程序(2.0版)中。可以用NBLAST程序,评分=100,字长-12进行BLAST核苷酸检索,以获得与本公开的核酸分子同源的核苷酸序列。可以用XBLAST程序,评分=50,字长=3进行BLAST蛋白检索,以获得与本公开的蛋白质分子同源的氨基酸序列。当两个序列之间存在空位时,可以利用如Altschul等人,《核酸研究(Nucleic Acids Res.)》25(17):3389-3402,1997中描述的带空位的BLAST(Gapped BLAST)。当利用BLAST程序和带空位的BLAST程序时,可以使用相应程序(例如,XBLAST和NBLAST)的默认参数。
如本文所使用的,术语“编辑”是指引入到靶核酸中,例如,在STMN2基因内的一个或多个修饰。编辑可以是一个或多个取代、一个或多个插入、一个或多个缺失或其组合。如本文所使用的,术语“取代”是指相对于参考序列,用不同的一个或多个核苷酸置换一个或多个核苷酸。如本文所使用的,术语“插入”是指核酸序列中一个或多个核苷酸相对于参考序列的增益。如本文所使用的,术语“缺失”指相对于参考序列,核酸序列中一个或多个核苷酸的丧失。
在如何制备包括缺失的序列中,没有暗示特定的过程。例如,包括缺失的序列可以直接由单独的核苷酸合成。在其它实施例中,缺失是通过提供并且然后改变参考序列来进行的。核酸序列可以在生物体的基因组中。核酸序列可以在细胞中。核酸序列可以是DNA序列。缺失可以是移码突变或非移码突变。本文所描述的缺失是指至多几千个碱基的缺失。
如本文所使用的,术语“上游”和“下游”是指核酸分子中单个核酸(例如,DNA)序列内的相对位置。“上游”和“下游”分别涉及其中RNA转录发生的5'至3'方向。当第一序列的3'端出现在第二序列的5'端之前时,第一序列位于第二序列的上游。当第一序列的5'端出现在第二序列的3'端之后时,第一序列位于第二序列的下游。在一些实施例中,5'-NTTN-3'或5'-TTN-3'序列位于本文所描述的插入缺失的上游,并且Cas12i诱导的插入缺失位于5'-NTTN-3'或5'-TTN-3'序列的下游。
I.基因编辑系统
在一些方面,本公开提供了包括靶向STMN2基因的RNA向导的基因编辑系统。此类基因编辑系统可以用于编辑STMN2靶基因,例如,破坏STMN2基因。
如本文所使用的术语“STMN2”是指“stathmin-2”。STMN2是stathmin蛋白家族的神经元特异性成员并在调节微管稳定性和信号转导中发挥作用。本文所示的SEQ ID NO:454提供了STMN2基因序列的实例。对于该序列还参考了基因ID:11075(www.ncbi.nlm.nih.gov/gene/11075)。
在一些实施例中,RNA向导由直接重复序列组分和间隔子序列构成。在一些实施例中,RNA向导与Cas12i多肽结合。在一些实施例中,间隔子序列对STMN2靶序列具有特异性,其中所述STMN2靶序列与如本文所描述的5'-NTTN-3'或5'-TTN-3'PAM序列相邻。在双链靶标的情况下,RNA向导与靶标的第一链(即,非PAM链)结合,并且如本文所描述的PAM序列存在于第二互补链(即,PAM链)中。
在一些实施例中,本公开提供了包括复合物的组合物,其中所述复合物包括靶向STMN2的RNA向导。在一些实施例中,本公开包括包含RNA向导和Cas12i多肽的复合物。在一些实施例中,RNA向导和Cas12i多肽以约1:1的摩尔比彼此结合。在一些实施例中,包括RNA向导和Cas12i多肽的复合物与STMN2基因内靶序列的互补区结合。在一些实施例中,包括靶向STMN2的RNA向导和Cas12i多肽的复合物以约1:1的摩尔比与STMN2基因内的靶序列的互补区结合。在一些实施例中,复合物包括可以切割STMN2靶序列和/或互补序列的酶促活性,如核酸酶活性。RNA向导、Cas12i多肽和STMN2靶序列的互补区,无论是单独还是一起的,都不是天然存在的。在一些实施例中,复合物中的RNA向导包括本文所描述的直接重复序列和/或间隔子序列。
在一些实施例中,本公开包括包含如本文所描述的RNA向导和/或编码如本文所描述的Cas12i多肽的RNA的组合物。在一些实施例中,RNA向导和编码Cas12i多肽的RNA一起包括在同一组合物内。在一些实施例中,RNA向导和编码Cas12i多肽的RNA包括在单独的组合物内。在一些实施例中,RNA向导包括本文所描述的直接重复序列和/或间隔子序列。
使用本文所公开的基因编辑系统比其它已知的核酸酶系统具有优势。Cas12i多肽比其它核酸酶小。例如,Cas12i2的长度为1,054个氨基酸,而化脓性链球菌(S.pyogenes)Cas9(SpCas9)的长度为1,368个氨基酸,嗜热链球菌(S.thermophilus)Cas9(StCas9)的长度为1,128个氨基酸,FnCpf1的长度为1,300个氨基酸,AsCpf1的长度为1,307个氨基酸,并且LbCpf1的长度为1,246个氨基酸。不需要反式激活CRISPR RNA(tracrRNA)的Cas12i RNA向导也比Cas9 RNA向导小。较小的Cas12i多肽和RNA向导大小有利于递送。与包括SpCas9多肽的组合物相比,包括Cas12i多肽的组合物也表现出降低的脱靶活性。参见WO/2021/202800,其相关公开内容出于本文所引用的主题和目的通过引用并入。此外,由包括Cas12i多肽的组合物诱导的插入缺失不同于由包括SpCas9多肽的组合物诱导的插入缺失。例如,SpCas9多肽主要诱导长度为1个核苷酸的插入和缺失。然而,Cas12i多肽诱导更大的缺失,这有利于破坏基因,如STMN2的更大部分。
本文还提供了一种用于对STMN2基因进行基因编辑的系统,所述系统包括:(i)Cas12i多肽(例如,Cas12i2多肽)或编码所述Cas12i多肽(例如,Cas12i2多肽包括与SEQ IDNO:448至少95%相同的氨基酸序列,所述Cas12i2多肽可以并且包括相对于SEQ ID NO:448的一个或多个突变)的第一核酸;以及(ii)RNA向导或编码所述RNA向导的第二核酸,其中所述RNA向导包括对STMN2基因内(例如,STMN2基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或内含子内)的靶序列具有特异性的间隔子序列,所述靶序列与包括5'-TTN-3'(5'-NTTN-3')的基序的位于所述靶序列的5'的原间隔子相邻基序(PAM)相邻。
A.RNA向导
在一些实施例中,本文所描述的基因编辑系统包括靶向STMN2基因,例如靶向STMN2基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或内含子的RNA向导。在一些实施例中,本文所描述的基因编辑系统可以包括两个或更多个(例如,2个、3个、4个、5个、6个、7个、8个、9个或更多个)靶向STMN2的RNA向导。
RNA向导可以将如本文所描述的基因编辑系统中包含的Cas12i多肽引导至STMN2靶序列。两个或更多个RNA向导可以将如本文所描述的两个或更多个单独的Cas12i多肽(例如,具有相同或不同序列的Cas12i多肽)引导至两个或更多个(例如,2个、3个、4个、5个、6个、7个、8个、9个或更多个)STMN2靶序列。阅读以下特定种类的RNA向导的实例的本领域技术人员将理解,在一些实施例中,RNA向导是STMN2靶标特异性的。也就是说,在一些实施例中,RNA向导与一个或多个STMN2靶序列(例如,在细胞内)特异性地结合,而不与非靶向序列(例如,同一细胞内的非特异性DNA或随机序列)结合。
在一些实施例中,RNA向导包括间隔子序列,随后是直接重复序列,所述直接重复序列是指在5'至3'方向上的序列。在一些实施例中,RNA向导包括第一直接重复序列,随后是间隔子序列,并且第二直接重复序列是指在5'至3'方向上的序列。在一些实施例中,此类RNA向导的第一直接重复序列和第二直接重复序列是相同的。在一些实施例中,此类RNA向导的第一直接重复序列和第二直接重复序列是不同的。
在一些实施例中,RNA向导的间隔子序列和直接重复序列存在于同一RNA分子内。在一些实施例中,间隔子和直接重复序列彼此直接连接。在一些实施例中,短连接子存在于间隔子与直接重复序列之间,例如长度为1个、2个或3个核苷酸的RNA连接子。在一些实施例中,RNA向导的间隔子序列和直接重复序列存在于单独的分子中,所述单独的分子通过碱基配对相互作用彼此连接。
关于RNA向导的示例性直接重复序列和间隔子组分的另外的信息提供如下。
(i).直接重复序列
在一些实施例中,RNA向导包括直接重复序列。在一些实施例中,RNA向导的直接重复序列具有介于12-100个、13-75个、14-50个或15-40个核苷酸之间(例如,15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个或40个核苷酸)的长度。
在一些实施例中,直接重复序列是表1的序列或表1的序列的一部分。直接重复序列可以包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的核苷酸1至核苷酸36。直接重复序列可以包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的核苷酸2至核苷酸36。直接重复序列可以包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的核苷酸3至核苷酸36。直接重复序列可以包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的核苷酸4至核苷酸36。直接重复序列可以包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的核苷酸5至核苷酸36。直接重复序列可以包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的核苷酸6至核苷酸36。直接重复序列可以包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的核苷酸7至核苷酸36。直接重复序列可以包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的核苷酸8至核苷酸36。直接重复序列可以包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的核苷酸9至核苷酸36。直接重复序列可以包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的核苷酸10至核苷酸36。直接重复序列可以包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的核苷酸11至核苷酸36。直接重复序列可以包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的核苷酸12至核苷酸36。直接重复序列可以包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的核苷酸13至核苷酸36。直接重复序列可以包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的核苷酸14至核苷酸36。直接重复序列可以包括SEQ ID NO:9的核苷酸1至核苷酸34。直接重复序列可以包括SEQ ID NO:9的核苷酸2至核苷酸34。直接重复序列可以包括SEQ ID NO:9的核苷酸3至核苷酸34。直接重复序列可以包括SEQ ID NO:9的核苷酸4至核苷酸34。直接重复序列可以包括SEQ ID NO:9的核苷酸5至核苷酸34。直接重复序列可以包括SEQ ID NO:9的核苷酸6至核苷酸34。直接重复序列可以包括SEQ ID NO:9的核苷酸7至核苷酸34。直接重复序列可以包括SEQ ID NO:9的核苷酸8至核苷酸34。直接重复序列可以包括SEQ ID NO:9的核苷酸9至核苷酸34。直接重复序列可以包括SEQ ID NO:9的核苷酸10至核苷酸34。直接重复序列可以包括SEQ ID NO:9的核苷酸11至核苷酸34。直接重复序列可以包括SEQ ID NO:9的核苷酸12至核苷酸34。在一些实施例中,直接重复序列在SEQ ID NO:10中所示。在一些实施例中,直接重复序列包括SEQ IDNO:10中所示的序列的一部分。
在一些实施例中,直接重复序列与表1的序列或表1的序列的一部分具有至少90%同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性)。直接重复序列可以与包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的核苷酸1至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的2至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的3至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的4至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的5至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的6至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的7至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的8至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的9至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的10至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ IDNO:1、2、3、4、5、6、7或8中的任一者的11至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的12至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的13至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:1、2、3、4、5、6、7或8中的任一者的14至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:9的1至核苷酸34的序列具有至少90%同一性。直接重复序列可以与包括SEQ IDNO:9的2至核苷酸34的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:9的3至核苷酸34的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:9的4至核苷酸34的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:9的5至核苷酸34的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:9的6至核苷酸34的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:9的7至核苷酸34的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:9的8至核苷酸34的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:9的9至核苷酸34的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:9的10至核苷酸34的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:9的11至核苷酸34的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:9的12至核苷酸34的序列具有至少90%同一性。在一些实施例中,直接重复序列与SEQ ID NO:10具有至少90%同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性)。在一些实施例中,直接重复序列与SEQID NO:10中所示的序列的一部分具有至少90%同一性。
在一些实施例中,包括Cas12i2多肽和包括SEQ ID NO:10的直接重复序列和长度为20个核苷酸的间隔子的RNA向导的组合物能够将插入缺失引入到STMN2靶序列中。
在一些实施例中,直接重复序列与SEQ ID NO:1-10中的任一者的反向补体至少90%相同(参见表1)。在一些实施例中,直接重复序列是SEQ ID NO:1-10中的任一者的反向补体。
表1:CAS12I2直接重复序列
在一些实施例中,直接重复序列是表2的序列或表2的序列的一部分。直接重复序列可以包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的核苷酸1至核苷酸36。直接重复序列可以包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的核苷酸2至核苷酸36。直接重复序列可以包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的核苷酸3至核苷酸36。直接重复序列可以包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的核苷酸4至核苷酸36。直接重复序列可以包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的核苷酸5至核苷酸36。直接重复序列可以包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的核苷酸6至核苷酸36。直接重复序列可以包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的核苷酸7至核苷酸36。直接重复序列可以包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的核苷酸8至核苷酸36。直接重复序列可以包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的核苷酸9至核苷酸36。直接重复序列可以包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的核苷酸10至核苷酸36。直接重复序列可以包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的核苷酸11至核苷酸36。直接重复序列可以包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的核苷酸12至核苷酸36。直接重复序列可以包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的核苷酸13至核苷酸36。直接重复序列可以包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的核苷酸14至核苷酸36。
在一些实施例中,直接重复序列与表2的序列或表2的序列的一部分具有至少95%同一性(例如,至少95%、96%、97%、98%或99%同一性)。直接重复序列可以与包括SEQ IDNO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的核苷酸1至核苷酸36的序列具有至少95%同一性。直接重复序列可以与包括SEQID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的2至核苷酸36的序列具有至少95%同一性。直接重复序列可以与包括SEQID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的3至核苷酸36的序列具有至少95%同一性。直接重复序列可以与包括SEQID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的4至核苷酸36的序列具有至少95%同一性。直接重复序列可以与包括SEQID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的5至核苷酸36的序列具有至少95%同一性。直接重复序列可以与包括SEQID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的6至核苷酸36的序列具有至少95%同一性。直接重复序列可以与包括SEQID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的7至核苷酸36的序列具有至少95%同一性。直接重复序列可以与包括SEQID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的8至核苷酸36的序列具有至少95%同一性。直接重复序列可以与包括SEQID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的9至核苷酸36的序列具有至少95%同一性。直接重复序列可以与包括SEQID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的10至核苷酸36的序列具有至少95%同一性。直接重复序列可以与包括SEQID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的11至核苷酸36的序列具有至少95%同一性。直接重复序列可以与包括SEQID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的12至核苷酸36的序列具有至少95%同一性。直接重复序列可以与包括SEQID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的13至核苷酸36的序列具有至少95%同一性。
在一些实施例中,直接重复序列与表2的序列或表2的序列的一部分具有至少90%同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性)。直接重复序列可以与包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的核苷酸1至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的2至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的3至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的4至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的5至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的6至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的7至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的8至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的9至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的10至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的11至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的12至核苷酸36的序列具有至少90%同一性。直接重复序列可以与包括SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的13至核苷酸36的序列具有至少90%同一性。
在一些实施例中,直接重复序列与SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的反向补体至少90%相同。在一些实施例中,直接重复序列与SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的反向补体至少95%相同。在一些实施例中,直接重复序列是SEQ ID NO:462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478或479中的任一者的反向补体。
在一些实施例中,直接重复序列与SEQ ID NO:480或SEQ ID NO:480的一部分至少90%相同。在一些实施例中,直接重复序列与SEQ ID NO:480或SEQ ID NO:480的一部分至少95%相同。在一些实施例中,直接重复序列与SEQ ID NO:480或SEQ ID NO:480的一部分100%相同。
表2:CAS12I4直接重复序列
在一些实施例中,直接重复序列是表3的序列或表3的序列的一部分。在一些实施例中,直接重复序列与表3的序列或表3的序列的一部分具有至少95%同一性(例如,至少95%、96%、97%、98%或99%同一性)。在一些实施例中,直接重复序列与表3的序列或表3的序列的一部分具有至少90%同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性)。在一些实施例中,直接重复序列与SEQ ID NO:485-487中的任一者的反向补体至少90%相同。在一些实施例中,直接重复序列与SEQ ID NO:485-487中的任一者的反向补体至少95%相同。在一些实施例中,直接重复序列是SEQ ID NO:485-487中的任一者的反向补体。
表3:CAS12I1直接重复序列
序列标识符 直接重复序列
SEQ ID NO:485 GUUGGAAUGACUAAUUUUUGUGCCCACCGUUGGCAC
SEQ ID NO:486 AAUUUUUGUGCCCAUCGUUGGCAC
SEQ ID NO:487 AUUUUUGUGCCCAUCGUUGGCAC
在一些实施例中,直接重复序列是表4的序列或表4的序列的一部分。在一些实施例中,直接重复序列与表4的序列或表4的序列的一部分具有至少95%同一性(例如,至少95%、96%、97%、98%或99%同一性)。在一些实施例中,直接重复序列与表4的序列或表4的序列的一部分具有至少90%同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性)。在一些实施例中,直接重复序列与SEQ ID NO:488-490中的任一者的反向补体至少90%相同。在一些实施例中,直接重复序列与SEQ ID NO:488-490中的任一者的反向补体至少95%相同。在一些实施例中,直接重复序列是SEQ ID NO:488-490中的任一者的反向补体。
表4:CAS12I3直接重复序列。
序列标识符 直接重复序列
SEQ ID NO:488 CUAGCAAUGACCUAAUAGUGUGUCCUUAGUUGACAU
SEQ ID NO:489 CCUACAAUACCUAAGAAAUCCGUCCUAAGUUGACGG
SEQ ID NO:490 AUAGUGUGUCCUUAGUUGACAU
在一些实施例中,本文所描述的直接重复序列包括尿嘧啶(U)。在一些实施例中,本文所描述的直接重复序列包括胸腺嘧啶(T)。在一些实施例中,根据表1-4的直接重复序列包括包含在表1-4中指示为尿嘧啶的一个或多个位置中的胸腺嘧啶的序列。
(ii).间隔子序列
在一些实施例中,RNA向导包括DNA靶向序列或间隔子序列。在一些实施例中,RNA向导的间隔子序列的长度介于12-100、13-75、14-50或15-30个核苷酸之间(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸),并且与非PAM链序列互补。在一些实施例中,间隔子序列被设计成与例如基因组基因座的特定DNA链互补。
在一些实施例中,RNA向导的间隔子序列与靶序列的互补链基本相同。在一些实施例中,RNA向导包括与参考核酸序列例如靶序列的互补链具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%序列同一性的序列。两个此类核酸之间的同一性百分比可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数来手动确定。
在一些实施例中,RNA向导包括长度介于12-100、13-75、14-50或15-30个核苷酸之间(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸)并且与非PAM链上的与靶序列互补的区域至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的间隔子序列。在一些实施例中,RNA向导包括与靶DNA序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA向导包括与靶基因组序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA向导包括长度至多为50并且与非PAM链上的与靶序列互补的区域至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列,例如,RNA序列。在一些实施例中,RNA向导包括与靶DNA序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA向导包括与靶基因组序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。
在一些实施例中,间隔子序列是表5A或5B的序列或表5A或5B的序列的一部分。应当理解,对SEQ ID NO:229-446或2497-4502的指示应被视为等同于SEQ ID NO:229-446或2497-4502的列表,其中每个中间编号都出现在列表中,即,229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445和446,或2497、2498、2499、2500、2501、2502、2503、2504、2505、2506、2507、2508、2509、2510、2511、2512、2513、2514、2515、2516、2517、2518、2519、2520、2521、2522、2523、2524、2525、2526、2527、2528、2529、2530、2531、2532、2533、2534、2535、2536、2537、2538、2539、2540、2541、2542、2543、2544、2545、2546、2547、2548、2549、2550、2551、2552、2553、2554、2555、2556、2557、2558、2559、2560、2561、2562、2563、2564、2565、2566、2567、2568、2569、2570、2571、2572、2573、2574、2575、2576、2577、2578、2579、2580、2581、2582、2583、2584、2585、2586、2587、2588、2589、2590、2591、2592、2593、2594、2595、2596、2597、2598、2599、2600、2601、2602、2603、2604、2605、2606、2607、2608、2609、2610、2611、2612、2613、2614、2615、2616、2617、2618、2619、2620、2621、2622、2623、2624、2625、2626、2627、2628、2629、2630、2631、2632、2633、2634、2635、2636、2637、2638、2639、2640、2641、2642、2643、2644、2645、2646、2647、2648、2649、2650、2651、2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、2669、2670、2671、2672、2673、2674、2675、2676、2677、2678、2679、2680、2681、2682、2683、2684、2685、2686、2687、2688、2689、2690、2691、2692、2693、2694、2695、2696、2697、2698、2699、2700、2701、2702、2703、2704、2705、2706、2707、2708、2709、2710、2711、2712、2713、2714、2715、2716、2717、2718、2719、2720、2721、2722、2723、2724、2725、2726、2727、2728、2729、2730、2731、2732、2733、2734、2735、2736、2737、2738、2739、2740、2741、2742、2743、2744、2745、2746、2747、2748、2749、2750、2751、2752、2753、2754、2755、2756、2757、2758、2759、2760、2761、2762、2763、2764、2765、2766、2767、2768、2769、2770、2771、2772、2773、2774、2775、2776、2777、2778、2779、2780、2781、2782、2783、2784、2785、2786、2787、2788、2789、2790、2791、2792、2793、2794、2795、2796、2797、2798、2799、2800、2801、2802、2803、2804、2805、2806、2807、2808、2809、2810、2811、2812、2813、2814、2815、2816、2817、2818、2819、2820、2821、2822、2823、2824、2825、2826、2827、2828、2829、2830、2831、2832、2833、2834、2835、2836、2837、2838、2839、2840、2841、2842、2843、2844、2845、2846、2847、2848、2849、2850、2851、2852、2853、2854、2855、2856、2857、2858、2859、2860、2861、2862、2863、2864、2865、2866、2867、2868、2869、2870、2871、2872、2873、2874、2875、2876、2877、2878、2879、2880、2881、2882、2883、2884、2885、2886、2887、2888、2889、2890、2891、2892、2893、2894、2895、2896、2897、2898、2899、2900、2901、2902、2903、2904、2905、2906、2907、2908、2909、2910、2911、2912、2913、2914、2915、2916、2917、2918、2919、2920、2921、2922、2923、2924、2925、2926、2927、2928、2929、2930、2931、2932、2933、2934、2935、2936、2937、2938、2939、2940、2941、2942、2943、2944、2945、2946、2947、2948、2949、2950、2951、2952、2953、2954、2955、2956、2957、2958、2959、2960、2961、2962、2963、2964、2965、2966、2967、2968、2969、2970、2971、2972、2973、2974、2975、2976、2977、2978、2979、2980、2981、2982、2983、2984、2985、2986、2987、2988、2989、2990、2991、2992、2993、2994、2995、2996、2997、2998、2999、3000、3001、3002、3003、3004、3005、3006、3007、3008、3009、3010、3011、3012、3013、3014、3015、3016、3017、3018、3019、3020、3021、3022、3023、3024、3025、3026、3027、3028、3029、3030、3031、3032、3033、3034、3035、3036、3037、3038、3039、3040、3041、3042、3043、3044、3045、3046、3047、3048、3049、3050、3051、3052、3053、3054、3055、3056、3057、3058、3059、3060、3061、3062、3063、3064、3065、3066、3067、3068、3069、3070、3071、3072、3073、3074、3075、3076、3077、3078、3079、3080、3081、3082、3083、3084、3085、3086、3087、3088、3089、3090、3091、3092、3093、3094、3095、3096、3097、3098、3099、3100、3101、3102、3103、3104、3105、3106、3107、3108、3109、3110、3111、3112、3113、3114、3115、3116、3117、3118、3119、3120、3121、3122、3123、3124、3125、3126、3127、3128、3129、3130、3131、3132、3133、3134、3135、3136、3137、3138、3139、3140、3141、3142、3143、3144、3145、3146、3147、3148、3149、3150、3151、3152、3153、3154、3155、3156、3157、3158、3159、3160、3161、3162、3163、3164、3165、3166、3167、3168、3169、3170、3171、3172、3173、3174、3175、3176、3177、3178、3179、3180、3181、3182、3183、3184、3185、3186、3187、3188、3189、3190、3191、3192、3193、3194、3195、3196、3197、3198、3199、3200、3201、3202、3203、3204、3205、3206、3207、3208、3209、3210、3211、3212、3213、3214、3215、3216、3217、3218、3219、3220、3221、3222、3223、3224、3225、3226、3227、3228、3229、3230、3231、3232、3233、3234、3235、3236、3237、3238、3239、3240、3241、3242、3243、3244、3245、3246、3247、3248、3249、3250、3251、3252、3253、3254、3255、3256、3257、3258、3259、3260、3261、3262、3263、3264、3265、3266、3267、3268、3269、3270、3271、3272、3273、3274、3275、3276、3277、3278、3279、3280、3281、3282、3283、3284、3285、3286、3287、3288、3289、3290、3291、3292、3293、3294、3295、3296、3297、3298、3299、3300、3301、3302、3303、3304、3305、3306、3307、3308、3309、3310、3311、3312、3313、3314、3315、3316、3317、3318、3319、3320、3321、3322、3323、3324、3325、3326、3327、3328、3329、3330、3331、3332、3333、3334、3335、3336、3337、3338、3339、3340、3341、3342、3343、3344、3345、3346、3347、3348、3349、3350、3351、3352、3353、3354、3355、3356、3357、3358、3359、3360、3361、3362、3363、3364、3365、3366、3367、3368、3369、3370、3371、3372、3373、3374、3375、3376、3377、3378、3379、3380、3381、3382、3383、3384、3385、3386、3387、3388、3389、3390、3391、3392、3393、3394、3395、3396、3397、3398、3399、3400、3401、3402、3403、3404、3405、3406、3407、3408、3409、3410、3411、3412、3413、3414、3415、3416、3417、3418、3419、3420、3421、3422、3423、3424、3425、3426、3427、3428、3429、3430、3431、3432、3433、3434、3435、3436、3437、3438、3439、3440、3441、3442、3443、3444、3445、3446、3447、3448、3449、3450、3451、3452、3453、3454、3455、3456、3457、3458、3459、3460、3461、3462、3463、3464、3465、3466、3467、3468、3469、3470、3471、3472、3473、3474、3475、3476、3477、3478、3479、3480、3481、3482、3483、3484、3485、3486、3487、3488、3489、3490、3491、3492、3493、3494、3495、3496、3497、3498、3499、3500、3501、3502、3503、3504、3505、3506、3507、3508、3509、3510、3511、3512、3513、3514、3515、3516、3517、3518、3519、3520、3521、3522、3523、3524、3525、3526、3527、3528、3529、3530、3531、3532、3533、3534、3535、3536、3537、3538、3539、3540、3541、3542、3543、3544、3545、3546、3547、3548、3549、3550、3551、3552、3553、3554、3555、3556、3557、3558、3559、3560、3561、3562、3563、3564、3565、3566、3567、3568、3569、3570、3571、3572、3573、3574、3575、3576、3577、3578、3579、3580、3581、3582、3583、3584、3585、3586、3587、3588、3589、3590、3591、3592、3593、3594、3595、3596、3597、3598、3599、3600、3601、3602、3603、3604、3605、3606、3607、3608、3609、3610、3611、3612、3613、3614、3615、3616、3617、3618、3619、3620、3621、3622、3623、3624、3625、3626、3627、3628、3629、3630、3631、3632、3633、3634、3635、3636、3637、3638、3639、3640、3641、3642、3643、3644、3645、3646、3647、3648、3649、3650、3651、3652、3653、3654、3655、3656、3657、3658、3659、3660、3661、3662、3663、3664、3665、3666、3667、3668、3669、3670、3671、3672、3673、3674、3675、3676、3677、3678、3679、3680、3681、3682、3683、3684、3685、3686、3687、3688、3689、3690、3691、3692、3693、3694、3695、3696、3697、3698、3699、3700、3701、3702、3703、3704、3705、3706、3707、3708、3709、3710、3711、3712、3713、3714、3715、3716、3717、3718、3719、3720、3721、3722、3723、3724、3725、3726、3727、3728、3729、3730、3731、3732、3733、3734、3735、3736、3737、3738、3739、3740、3741、3742、3743、3744、3745、3746、3747、3748、3749、3750、3751、3752、3753、3754、3755、3756、3757、3758、3759、3760、3761、3762、3763、3764、3765、3766、3767、3768、3769、3770、3771、3772、3773、3774、3775、3776、3777、3778、3779、3780、3781、3782、3783、3784、3785、3786、3787、3788、3789、3790、3791、3792、3793、3794、3795、3796、3797、3798、3799、3800、3801、3802、3803、3804、3805、3806、3807、3808、3809、3810、3811、3812、3813、3814、3815、3816、3817、3818、3819、3820、3821、3822、3823、3824、3825、3826、3827、3828、3829、3830、3831、3832、3833、3834、3835、3836、3837、3838、3839、3840、3841、3842、3843、3844、3845、3846、3847、3848、3849、3850、3851、3852、3853、3854、3855、3856、3857、3858、3859、3860、3861、3862、3863、3864、3865、3866、3867、3868、3869、3870、3871、3872、3873、3874、3875、3876、3877、3878、3879、3880、3881、3882、3883、3884、3885、3886、3887、3888、3889、3890、3891、3892、3893、3894、3895、3896、3897、3898、3899、3900、3901、3902、3903、3904、3905、3906、3907、3908、3909、3910、3911、3912、3913、3914、3915、3916、3917、3918、3919、3920、3921、3922、3923、3924、3925、3926、3927、3928、3929、3930、3931、3932、3933、3934、3935、3936、3937、3938、3939、3940、3941、3942、3943、3944、3945、3946、3947、3948、3949、3950、3951、3952、3953、3954、3955、3956、3957、3958、3959、3960、3961、3962、3963、3964、3965、3966、3967、3968、3969、3970、3971、3972、3973、3974、3975、3976、3977、3978、3979、3980、3981、3982、3983、3984、3985、3986、3987、3988、3989、3990、3991、3992、3993、3994、3995、3996、3997、3998、3999、4000、4001、4002、4003、4004、4005、4006、4007、4008、4009、4010、4011、4012、4013、4014、4015、4016、4017、4018、4019、4020、4021、4022、4023、4024、4025、4026、4027、4028、4029、4030、4031、4032、4033、4034、4035、4036、4037、4038、4039、4040、4041、4042、4043、4044、4045、4046、4047、4048、4049、4050、4051、4052、4053、4054、4055、4056、4057、4058、4059、4060、4061、4062、4063、4064、4065、4066、4067、4068、4069、4070、4071、4072、4073、4074、4075、4076、4077、4078、4079、4080、4081、4082、4083、4084、4085、4086、4087、4088、4089、4090、4091、4092、4093、4094、4095、4096、4097、4098、4099、4100、4101、4102、4103、4104、4105、4106、4107、4108、4109、4110、4111、4112、4113、4114、4115、4116、4117、4118、4119、4120、4121、4122、4123、4124、4125、4126、4127、4128、4129、4130、4131、4132、4133、4134、4135、4136、4137、4138、4139、4140、4141、4142、4143、4144、4145、4146、4147、4148、4149、4150、4151、4152、4153、4154、4155、4156、4157、4158、4159、4160、4161、4162、4163、4164、4165、4166、4167、4168、4169、4170、4171、4172、4173、4174、4175、4176、4177、4178、4179、4180、4181、4182、4183、4184、4185、4186、4187、4188、4189、4190、4191、4192、4193、4194、4195、4196、4197、4198、4199、4200、4201、4202、4203、4204、4205、4206、4207、4208、4209、4210、4211、4212、4213、4214、4215、4216、4217、4218、4219、4220、4221、4222、4223、4224、4225、4226、4227、4228、4229、4230、4231、4232、4233、4234、4235、4236、4237、4238、4239、4240、4241、4242、4243、4244、4245、4246、4247、4248、4249、4250、4251、4252、4253、4254、4255、4256、4257、4258、4259、4260、4261、4262、4263、4264、4265、4266、4267、4268、4269、4270、4271、4272、4273、4274、4275、4276、4277、4278、4279、4280、4281、4282、4283、4284、4285、4286、4287、4288、4289、4290、4291、4292、4293、4294、4295、4296、4297、4298、4299、4300、4301、4302、4303、4304、4305、4306、4307、4308、4309、4310、4311、4312、4313、4314、4315、4316、4317、4318、4319、4320、4321、4322、4323、4324、4325、4326、4327、4328、4329、4330、4331、4332、4333、4334、4335、4336、4337、4338、4339、4340、4341、4342、4343、4344、4345、4346、4347、4348、4349、4350、4351、4352、4353、4354、4355、4356、4357、4358、4359、4360、4361、4362、4363、4364、4365、4366、4367、4368、4369、4370、4371、4372、4373、4374、4375、4376、4377、4378、4379、4380、4381、4382、4383、4384、4385、4386、4387、4388、4389、4390、4391、4392、4393、4394、4395、4396、4397、4398、4399、4400、4401、4402、4403、4404、4405、4406、4407、4408、4409、4410、4411、4412、4413、4414、4415、4416、4417、4418、4419、4420、4421、4422、4423、4424、4425、4426、4427、4428、4429、4430、4431、4432、4433、4434、4435、4436、4437、4438、4439、4440、4441、4442、4443、4444、4445、4446、4447、4448、4449、4450、4451、4452、4453、4454、4455、4456、4457、4458、4459、4460、4461、4462、4463、4464、4465、4466、4467、4468、4469、4470、4471、4472、4473、4474、4475、4476、4477、4478、4479、4480、4481、4482、4483、4484、4485、4486、4487、4488、4489、4490、4491、4492、4493、4494、4495、4496、4497、4498、4499、4500、4501或4502。
间隔子序列可以包括SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸16。间隔子序列可以包括SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸17。间隔子序列可以包括SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸18。间隔子序列可以包括SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸19。间隔子序列可以包括SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸20。间隔子序列可以包括SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸21。间隔子序列可以包括SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸22。间隔子序列可以包括SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸23。间隔子序列可以包括SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸24。间隔子序列可以包括SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸25。间隔子序列可以包括SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸26。间隔子序列可以包括SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸27。间隔子序列可以包括SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸28。间隔子序列可以包括SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸29。间隔子序列可以包括SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸30。
在一些实施例中,间隔子序列与表5A或5B的序列或表5A或5B的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性)。间隔子序列可以与包括SEQ ID NO:229-446或2497-4502中任一者的核苷酸1至核苷酸16的序列具有至少90%的同一性。间隔子序列可以与包括SEQ ID NO:229-446或2497-4502中任一者的核苷酸1至核苷酸17的序列具有至少90%的同一性。间隔子序列可以与包括SEQ ID NO:229-446或2497-4502中任一者的核苷酸1至核苷酸18的序列具有至少90%的同一性。间隔子序列可以与包括SEQ ID NO:229-446或2497-4502中任一者的核苷酸1至核苷酸19的序列具有至少90%的同一性。间隔子序列可以与包括SEQ ID NO:229-446或2497-4502中任一者的核苷酸1至核苷酸20的序列具有至少90%的同一性。间隔子序列可以与包括SEQ ID NO:229-446或2497-4502中任一者的核苷酸1至核苷酸21的序列具有至少90%的同一性。间隔子序列可以与包括SEQ ID NO:229-446或2497-4502中任一者的核苷酸1至核苷酸22的序列具有至少90%的同一性。间隔子序列可以与包括SEQ ID NO:229-446或2497-4502中任一者的核苷酸1至核苷酸23的序列具有至少90%的同一性。间隔子序列可以与包括SEQ ID NO:229-446或2497-4502中任一者的核苷酸1至核苷酸24的序列具有至少90%的同一性。间隔子序列可以与包括SEQ ID NO:229-446或2497-4502中任一者的核苷酸1至核苷酸25的序列具有至少90%的同一性。间隔子序列可以与包括SEQ ID NO:229-446或2497-4502中任一者的核苷酸1至核苷酸26的序列具有至少90%的同一性。间隔子序列可以与包括SEQ ID NO:229-446或2497-4502中任一者的核苷酸1至核苷酸27的序列具有至少90%的同一性。间隔子序列可以与包括SEQ ID NO:229-446或2497-4502中任一者的核苷酸1至核苷酸28的序列具有至少90%的同一性。间隔子序列可以与包括SEQ ID NO:229-446或2497-4502中任一者的核苷酸1至核苷酸29的序列具有至少90%的同一性。间隔子序列可以与包括SEQ ID NO:229-446或2497-4502中任一者的核苷酸1至核苷酸30的序列具有至少90%的同一性。
表5A:靶序列和间隔子序列——外显子
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
表5B:靶序列和间隔子序列——内含子
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
*三个3'核苷酸表示5'-TTN-3'基序。
本公开包含以上列出的与本文的公开一致的直接重复序列和间隔子序列的所有组合。
在一些实施例中,本文所述的间隔子序列包括尿嘧啶(U)。在一些实施例中,本文所述的间隔子序列包含胸腺嘧啶(T)。在一些实施例中,根据表5A或5B的间隔子序列包括在表5A或5B中指示为尿嘧啶的一个或多个(例如,所有)位置包括胸腺嘧啶的序列。
本公开包含RNA向导,其包括本文所述的直接重复和间隔子的任何和所有组合(例如,如上表5A或5B所示)。
在一些实施例中,RNA向导与SEQ ID NO:4505-4562中的任一者具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性)。在一些实施例中,RNA向导与SEQ ID NO:4505-4562中的任一者具有至少95%的同一性(例如,至少95%、96%、97%、98%或99%的同一性)。在一些实施例中,RNA向导具有SEQ ID NO:4505-4562中的任一者所示的序列。
在一些实施例中,所述RNA向导包括SEQ ID NO:4508、4512、4559和4561中的任一者的序列,或者所述第二核酸编码包括SEQ ID NO:4508、4512、4559和4561中的任一者的RNA向导。
在一些实施例中,所述RNA向导包括SEQ ID NO:4505、4506、4507、4508、4509、4510、4511、4512、4513、4514、4515、4554、4555、4556、4557、4558、4559、4560、4561和4562中的任一者的序列,或者所述第二核酸编码包括SEQ ID NO:4505、4506、4507、4508、4509、4510、4511、4512、4513、4514、4515、4554、4555、4556、4557、4558、4559、4560、4561和4562中的任一者的RNA向导。
B.核酸修饰
RNA向导可以包含相对于参考序列的一个或多个共价修饰,特别是亲本多核糖核苷酸,其包含在本公开的范围内。
示例性修饰可以包含对糖、核碱基、核苷间键(例如,连接磷酸酯/磷酸二酯键/磷酸二酯主链)及其任何组合的任何修饰。下文详细描述本文提供的一些示例性修改。
RNA向导可以包含任何有用的修饰,如对糖、核碱基或核苷间键(例如,连接磷酸酯/磷酸二酯键/磷酸二酯主链)的修饰。嘧啶核碱基的一个或多个原子可以被任选地经取代的氨基、任选地经取代的硫醇、任选地经取代的烷基(例如,甲基或乙基)或卤素(例如,氯或氟)替代或取代。在某些实施例中,糖和核苷间键中的每一者中都存在修饰(例如,一种或多种修饰)。修饰可以是将核糖核酸(RNA)修饰成脱氧核糖核酸(DNA)、苏糖核酸(TNA)、乙二醇核酸(GNA)、肽核酸(PNA)、锁核酸(LNA)或其杂交体。本文描述了另外的修改。
在一些实施例中,修饰可以包含化学或细胞诱导的修饰。例如,Lewis和Pan在《自然评论:分子细胞生物学(Nat Reviews Mol Cell Biol)》2017,18:202-210的“RNA修饰和结构协同引导RNA-蛋白质相互作用(RNA modifications and structures cooperate toguide RNA-protein interactions)”中描述了细胞内RNA修饰的一些非限制性实例。
不同的糖修饰、核苷酸修饰和/或核苷间键(例如,主链结构)可以存在于序列的不同位置处。本领域的普通技术人员将认识到,核苷酸类似物或其它修饰可以位于序列的任何位置处,使得序列的功能基本上不会降低。所述序列可以包含约1%至约100%的经修饰核苷酸(相对于总核苷酸含量,或相对于一种或多种类型的核苷酸,即A、G、U或C中的任何一种或多种)或任何介于其间的百分比(例如,1%至20%>、1%至25%、1%至50%、1%至60%、1%至70%、1%至80%、1%至90%、1%至95%、10%至20%、10%至25%、10%至50%、10%至60%、10%至70%、10%至80%、10%至90%、10%至95%、10%至100%、20%至25%、20%至50%、20%至60%、20%至70%、20%至80%、20%至90%、20%至95%、20%至100%、50%至60%、50%至70%、50%至80%、50%至90%、50%至95%、50%至100%、70%至80%、70%至90%、70%至95%、70%至100%、80%至90%、80%至95%、80%至100%、90%至95%、90%至100%以及95%至100%)。
在一些实施例中,糖修饰(例如,在2'位置或4'位置处)或序列的一个或多个核糖核苷酸处的糖替代以及主链修饰可以包含磷酸二酯键的修饰或替代。序列的具体实例包含但不限于包含经修饰主链或没有天然核苷间键的序列,如核苷间修饰,包含磷酸二酯键的修饰或替代。具有经修饰主链的序列包含主链中没有磷原子的序列。出于本申请的目的,并且如本领域有时提及的,核苷间主链中没有磷原子的经修饰RNA也可以被认为是寡核苷酸。在特定的实施例中,序列将包含在其核苷间主链中具有磷原子的核糖核苷酸。
经修饰的序列主链可以包含例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其它烷基膦酸酯如3'-亚烷基膦酸酯和手性膦酸酯、次膦酸酯、氨基磷酸酯如3'-氨基磷酰胺和氨基烷基磷酰胺、硫代磷酰胺酯、硫代烷基膦酸酯、硫代烷基磷酸酯、硫代烷基磷酸三酯和具有正常3'-5'键的硼磷酸酯、这些物质的2'-5'连接类似物以及具有相反极性的那些物质,其中相邻的核苷单元对连接3'-5'至5'-3'或2'-5'至5'-2'。各种盐、混合盐和游离酸形式也包含在内。在一些实施例中,所述序列可以带负电荷或正电荷。
可以掺入序列中的经修饰核苷酸可以在核苷间键(例如,磷酸酯主链)上进行修饰。在本文中,在多核苷酸主链的上下文中,短语“磷酸酯”和“磷酸二酯”可以互换使用。主链磷酸基团可以通过用不同的取代基替代一个或多个氧原子来进行修饰。进一步地,经修饰的核苷和核苷酸可以包含用如本文所述的另一个核苷间键大规模替代未经修饰的磷酸部分。经修饰的磷酸基团的实例包含但不限于硫代磷酸酯、亚磷酸酯、硼磷酸酯(boranophosphate)、硼磷酸酯(boranophosphate ester)、磷酸氢酯、氨基磷酸酯、二氨基磷酸酯、烷基或芳基膦酸酯和磷酸三酯。二硫代磷酸酯的两个非连接氧都被硫替代。磷酸酯连接子也可以通过用氮(桥连的氨基磷酸酯)、硫(桥连的硫代磷酸酯)和碳(桥连的亚甲基膦酸酯)替代连接氧来进行修饰。
经α-硫代取代的磷酸酯部分通过非天然的硫代磷酸酯主链键赋予RNA和DNA聚合物稳定性。硫代磷酸酯DNA和RNA具有增加的核酸酶抗性,并且因此在细胞环境中具有更长的半衰期。
在具体实施例中,经修饰的核苷包含α-硫代-核苷(例如,5'-O-(1-硫代磷酸酯)-腺苷、5'-O-(1-硫代磷酸酯)-胞苷(α-硫代-胞苷)、5'-O-(1-硫代磷酸酯)-鸟苷、5'-O-(1-硫代磷酸酯)-尿苷或5'-O-(1-硫代磷酸酯)-假尿苷)。
本文描述了根据本公开可以采用的其它核苷间键,包含不含磷原子的核苷间键。
在一些实施例中,所述序列可以包含一种或多种细胞毒性核苷。例如,细胞毒性核苷可以被掺入到序列中,如双功能修饰。细胞毒性核苷可以包含但不限于:阿糖腺苷、5-氮杂胞苷、4'-硫代-阿糖胞苷、环戊烯基胞嘧啶、克拉屈滨(cladribine)、氯法拉滨(clofarabine)、阿糖胞苷、胞嘧啶阿糖胞苷、1-(2-C-氰基-2-脱氧-β-D-阿拉伯糖-戊呋喃糖基)-胞嘧啶、地西他滨(decitabine)、5-氟尿嘧啶、氟达拉滨(fludarabine)、氟尿苷、吉西他滨(gemcitabine)、替加氟(tegafur)和尿嘧啶的组合、替加氟((RS)-5-氟代-1-(四氢呋喃-2-基)嘧啶-2,4(1H,3H)-二酮)、曲沙他滨(troxacitabine)、替扎他滨(tezacitabine)、2'-脱氧-2'-亚甲基胞苷(DMDC)和6-巯基嘌呤。另外的实例包含磷酸氟达拉滨(fludarabine phosphate)、N4-山己酰基-1-β-D-阿拉伯呋喃糖基胞嘧啶、N4-十八烷基-1-β-D-阿拉伯呋喃糖基胞嘧啶、N4-棕榈酰基-1-(2-C-氰基-2-脱氧-β-D-阿拉伯糖-戊呋喃糖基)胞嘧啶和P-4055(阿糖胞苷5'-反式酸酯)。
在一些实施例中,所述序列包含一种或多种转录后修饰(例如,加帽、切割、聚腺苷酸化、剪接、聚-A序列、甲基化、酰化、磷酸化、赖氨酸和精氨酸残基的甲基化、乙酰化以及硫醇基团和酪氨酸残基的亚硝基化等)。所述一种或多种转录后修饰可以是任何转录后修饰,如在RNA中已鉴定的一百多种不同核苷修饰中的任一种(Rozenski,J、Crain,P和McCloskey,J.(1999).RNA修饰数据库:1999更新,《核酸研究(Nucl Acids Res)》27:196-197)。在一些实施例中,第一分离核酸包括信使RNA(mRNA)。在一些实施例中,mRNA包括选自由以下组成的组的至少一种核苷:吡啶-4-酮核糖核苷、5-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫代尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基尿苷、3-甲基尿苷、5-羧甲基-尿苷、1-羧基甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酰甲基尿苷、1-牛磺酰甲基-假尿苷、5-牛磺酰甲基-2-硫代-尿苷、1-牛磺酰甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-脱氮-假尿苷、2-硫代-1-甲基-1-脱氮-假尿苷、二氢尿苷、二氢假尿苷、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷以及4-甲氧基-2-硫代-假尿苷。在一些实施例中,mRNA包括选自由以下组成的组的至少一种核苷:5-氮杂-胞苷、假异胞苷、3-甲基-胞苷、N4-乙酰基胞苷、5-甲酰基胞苷、N4-甲基胞苷、5-羟甲基胞苷、1-甲基-假异胞苷、吡咯并胞苷、吡咯并假异胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-脱氮-假异胞苷、1-甲基-1-脱氮-假异胞苷、泽布拉林、5-氮杂-泽布拉林、5-甲基-泽布拉林、5-氮杂-2-硫代-泽布拉林、2-硫代-泽布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷以及4-甲氧基-1-甲基-假异胞苷。在一些实施例中,mRNA包括选自由以下组成的组的至少一种核苷:2-氨基嘌呤、2,6-二氨基嘌呤、7-脱氮-腺嘌呤、7-脱氮-8-氮杂-腺嘌呤、7-脱氮-2-氨基嘌呤、7-脱氮-8-氮杂-2-氨基嘌呤、7-脱氮-2,6-二氨基嘌呤、7-脱氮-8-氮杂-2,6-二氨基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-异戊烯基腺苷、N6-(顺式-羟基异戊烯基)腺苷、2-甲硫基-N6-(顺式-羟基异戊烯基)腺苷、N6-甘氨酰氨基甲酰基腺苷、N6-苏氨酰氨基甲酰基腺苷、2-甲硫基-N6-苏氨酰氨基甲酰基腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲硫基-腺嘌呤以及2-甲氧基-腺嘌呤。在一些实施例中,mRNA包括选自由以下组成的组的至少一种核苷:肌苷、1-甲基-肌苷、怀俄苷、怀丁苷、7-脱氮-鸟苷、7-脱氮-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-脱氮-鸟苷、6-硫代-7-脱氮-8-氮杂-鸟苷、7-甲基-鸟苷、6-硫代-7-甲基-鸟苷、7-甲基肌苷、6-甲氧基-鸟苷、1-甲基鸟苷、N2-甲基鸟苷、N2,N2-二甲基鸟苷、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、N2-甲基-6-硫代-鸟苷以及N2,N2-二甲基-6-硫代-鸟苷。
序列可以或可以不沿分子的整个长度进行一致修饰。例如,一种或多种或所有类型的核苷酸(例如,天然存在的核苷酸、嘌呤或嘧啶,或A、G、U、C、I、pU中的任一个或多个或所有)可以或可以不在序列中或在其给定的预定序列区域中进行一致修饰。在一些实施例中,序列包含假尿苷。在一些实施例中,序列包含肌苷,所述肌苷可以有助于免疫系统将所述序列表征为内源性RNA与病毒RNA。肌苷的掺入还可以提高RNA稳定性/减少降解。参见例如,Yu,Z.等人(2015)ADAR1对RNA的编辑将dsRNA标记为“自身”(RNA editing by ADAR1marks dsRNA as“self”)《细胞研究(Cell Res.)》25,1283-1284,所述文献通过引用以其整体并入本文。
在一些实施例中,RNA向导的一个或多个核苷酸包括2'-O-甲基硫代磷酸酯修饰。在一些实施例中,RNA向导的前三个核苷酸中的每个核苷酸均包括2'-O-甲基硫代磷酸酯修饰。在一些实施例中,RNA向导的最后四个核苷酸中的每个核苷酸均包括2'-O-甲基硫代磷酸酯修饰。在一些实施例中,RNA向导的第一核苷酸至最后核苷酸、第二核苷酸至最后核苷酸和第三核苷酸至最后核苷酸中的每个核苷酸均包括2'-O-甲基硫代磷酸酯修饰,并且其中RNA向导的最后核苷酸未被修饰。在一些实施例中,RNA向导的前三个核苷酸中的每个核苷酸均包括2'-O-甲基硫代磷酸酯修饰,并且RNA向导的第一核苷酸至最后核苷酸、第二核苷酸至最后核苷酸和第三核苷酸至最后核苷酸中的每个核苷酸均包括2'-O-甲基硫代磷酸酯修饰。
当本文所公开的基因编辑系统包括编码本文所公开的Cas12i多肽的核酸(例如,mRNA分子)时,在适用的情况下,此类核酸分子可以含有本文所公开的任何修饰。
C.Cas12i多肽
在一些实施例中,本公开的组合物或系统包含如WO/2019/178427中所描述的Cas12i多肽,所述文献的相关公开内容通过引用并入以用于本文所引用的主题和目的。
在一些实施例中,本公开的基因编辑系统包括本文所述的Cas12i2多肽(例如,包括SEQ ID NO:448和/或由SEQ ID NO:447(或其中T被U替代的版本)编码的多肽)。在一些实施例中,Cas12i2多肽包括至少一个RuvC结构域。在一些实施例中,本公开的基因编辑系统包括编码Cas12i多肽的核酸分子(例如,DNA分子或多核糖核苷酸分子)。
编码本文所述的Cas12i2多肽的核酸序列可以与参考核酸序列,例如,SEQ ID NO:447(或其中T被U替代的版本)基本相同。在一些实施例中,Cas12i2多肽由核酸编码,所述核酸包括与参考核酸序列,例如,SEQ ID NO:447(或其中T被U替代的版本)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%序列同一性的序列。两个此类核酸之间的同一性百分比可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数来手动确定。两个核酸序列基本相同的一个标志是核酸分子在温度和离子强度的严格条件下(例如,在中等至高度严格的范围内)与另一个核酸分子的互补序列杂交。参见例如,Tijssen,“与核酸探针杂交,第I部分,理论和核酸制备(Hybridizationwith Nucleic Acid Probes.Part I.Theory and Nucleic Acid Preparation)”(生物化学和分子生物学实验室技术,第24卷)。
在一些实施例中,Cas12i2多肽由核酸序列编码,所述核酸序列与参考核酸序列,例如,SEQ ID NO:447(或其中T被U替代的版本)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更多的序列同一性,但不是100%的序列同一性。
在一些实施例中,本公开的Cas12i2多肽包括与SEQ ID NO:448具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
在一些实施例中,本公开描述了与一种或多种参考多肽具有特定程度的氨基酸序列同一性的Cas12i2多肽,例如与SEQ ID NO:448的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的BLAST、ALIGN或CLUSTAL等程序通过氨基酸序列比对来确定。
还提供了本公开的Cas12i2多肽,其具有酶活性,例如,核酸酶活性或核酸内切酶活性,并且包括在使用前述比对方法中的任何方法进行比对时与SEQ ID NO:448的氨基酸序列相差50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0个氨基酸残基的氨基酸序列。
在一些实施例中,Cas12i2多肽可以例如在位置D581、G624、F626、P868、I926、V1030、E1035、S1046或其任何组合处含有相对于SEQ ID NO:448的一个或多个突变。在一些情况下,所述一个或多个突变是氨基酸取代,例如,D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G或其组合。
在一些实施例中,Cas12i2多肽包括序列为SEQ ID NO:449、SEQ ID NO:450、SEQID NO:451、SEQ ID NO:452或SEQ ID NO:453的多肽。在一些实例中,Cas12i2多肽含有位于位置D581、D911、I926和V1030处的突变。此类Cas12i2多肽可以含有D581R、D911R、I926R和V1030G的氨基酸取代(例如,SEQ ID NO:449)。在一些实例中,Cas12i2多肽含有位于位置D581、I926和V1030处的突变。此类Cas12i2多肽可以含有D581R、I926R和V1030G的氨基酸取代(例如,SEQ ID NO:450)。在一些实例中,Cas12i2多肽可以含有位于位置D581、I926、V1030和S1046处的突变。此类Cas12i2多肽可以含有D581R、I926R、V1030G和S1046G的氨基酸取代(例如,SEQ ID NO:451)。在一些实例中,Cas12i2多肽可以含有位于位置D581、G624、F626、I926、V1030、E1035和S1046处的突变。此类Cas12i2多肽可以含有D581R、G624R、F626R、I926R、V1030G、E1035R和S1046G的氨基酸取代(例如,SEQ ID NO:452)。在一些实例中,Cas12i2多肽可以含有位于位置D581、G624、F626、P868、I926、V1030、E1035和S1046处的突变。此类Cas12i2多肽可以含有D581R、G624R、F626R、P868T、I926R、V1030G、E1035R和S1046G的氨基酸取代(例如,SEQ ID NO:453)。
在一些实施例中,本公开的Cas12i2多肽包括与SEQ ID NO:449、SEQ ID NO:450、SEQ ID NO:451、SEQ ID NO:452或SEQ ID NO:453具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些实施例中,与SEQ ID NO:449、SEQ ID NO:450、SEQ ID NO:451、SEQ ID NO:452或SEQ ID NO:453具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的Cas12i2多肽维持将多肽与其相应的亲本/参考序列区分开的氨基酸变化(或这些变化中的至少1种、2种、3种等)。
在一些实施例中,本公开描述了与一种或多种参考多肽具有特定程度的氨基酸序列同一性的Cas12i2多肽,例如与SEQ ID NO:449、SEQ ID NO:450、SEQ ID NO:451、SEQ IDNO:452或SEQ ID NO:453的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的BLAST、ALIGN或CLUSTAL等程序通过氨基酸序列比对来确定。
还提供了本公开的Cas12i2多肽,其具有酶活性,例如,核酸酶活性或核酸内切酶活性,并且包括在使用前述比对方法中的任何方法进行比对时与SEQ ID NO:449、SEQ IDNO:450、SEQ ID NO:451、SEQ ID NO:452或SEQ ID NO:453的氨基酸序列相差50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0个氨基酸残基的氨基酸序列。
在一些实施例中,本公开的组合物包含本文所述的Cas12i4多肽(例如,包括SEQID NO:482和/或由SEQ ID NO:481(或其中T被U替代的版本)编码的多肽)。在一些实施例中,Cas12i4多肽包括至少一个RuvC结构域。
编码本文所述的Cas12i4多肽的核酸序列可以与参考核酸序列,例如,SEQ ID NO:481(或其中T被U替代的版本)基本相同。在一些实施例中,Cas12i4多肽由核酸编码,所述核酸包括与参考核酸序列,例如,SEQ ID NO:481(或其中T被U替代的版本)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%序列同一性的序列。两个此类核酸之间的同一性百分比可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数来手动确定。两个核酸序列基本相同的一个标志是核酸分子在温度和离子强度的严格条件下(例如,在中等至高度严格的范围内)与另一个核酸分子的互补序列杂交。
在一些实施例中,Cas12i4多肽由核酸序列编码,所述核酸序列与参考核酸序列,例如,SEQ ID NO:481(或其中T被U替代的版本)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更多的序列同一性,但不是100%的序列同一性。
在一些实施例中,本公开的Cas12i4多肽包括与SEQ ID NO:482具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
在一些实施例中,本公开描述了与一种或多种参考多肽具有特定程度的氨基酸序列同一性的Cas12i4多肽,例如与SEQ ID NO:482的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的BLAST、ALIGN或CLUSTAL等程序通过氨基酸序列比对来确定。
还提供了本公开的Cas12i4多肽,其具有酶活性,例如,核酸酶活性或核酸内切酶活性,并且包括在使用前述比对方法中的任何方法进行比对时与SEQ ID NO:482的氨基酸序列相差50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0个氨基酸残基的氨基酸序列。
在一些实施例中,Cas12i4多肽包括序列为SEQ ID NO:483或SEQ ID NO:484的多肽。
在一些实施例中,本公开的Cas12i4多肽包括与SEQ ID NO:483或SEQ ID NO:484具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些实施例中,与SEQ ID NO:483或SEQ ID NO:484具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的Cas12i4多肽维持将所述多肽与其相应的亲本/参考序列区分开的氨基酸变化(或这些变化中的至少1种、2种、3种等)。
在一些实施例中,本公开描述了与一种或多种参考多肽具有特定程度的氨基酸序列同一性的Cas12i4多肽,例如与SEQ ID NO:483或SEQ ID NO:484的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的BLAST、ALIGN或CLUSTAL等程序通过氨基酸序列比对来确定。
还提供了本公开的Cas12i4多肽,其具有酶活性,例如,核酸酶活性或核酸内切酶活性,并且包括在使用前述比对方法中的任何方法进行比对时与SEQ ID NO:483或SEQ IDNO:484的氨基酸序列相差50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0个氨基酸残基的氨基酸序列。
在一些实施例中,本公开的组合物包含本文所述的Cas12i1多肽(例如,包括SEQID NO:4503的多肽)。在一些实施例中,Cas12i1多肽包括至少一个RuvC结构域。
在一些实施例中,本公开的Cas12i1多肽包括与SEQ ID NO:4503具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
在一些实施例中,本公开描述了与一种或多种参考多肽具有特定程度的氨基酸序列同一性的Cas12i1多肽,例如与SEQ ID NO:4503的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的BLAST、ALIGN或CLUSTAL等程序通过氨基酸序列比对来确定。
还提供了本公开的Cas12i1多肽,其具有酶活性,例如,核酸酶活性或核酸内切酶活性,并且包括在使用前述比对方法中的任何方法进行比对时与SEQ ID NO:4503的氨基酸序列相差50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0个氨基酸残基的氨基酸序列。
在一些实施例中,本公开的组合物包含本文所述的Cas12i3多肽(例如,包括SEQID NO:4504的多肽)。在一些实施例中,Cas12i3多肽包括至少一个RuvC结构域。
在一些实施例中,本公开的Cas12i3多肽包括与SEQ ID NO:4504具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
在一些实施例中,本公开描述了与一种或多种参考多肽具有特定程度的氨基酸序列同一性的Cas12i3多肽,例如与SEQ ID NO:4504的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的BLAST、ALIGN或CLUSTAL等程序通过氨基酸序列比对来确定。
还提供了本公开的Cas12i3多肽,其具有酶活性,例如,核酸酶活性或核酸内切酶活性,并且包括在使用前述比对方法中的任何方法进行比对时与SEQ ID NO:4504的氨基酸序列相差50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0个氨基酸残基的氨基酸序列。
尽管本文所述的变化可以是一种或多种氨基酸变化,但Cas12i多肽的变化也可以是实质性的,如作为氨基和/或羧基末端延伸的多肽融合。例如,Cas12i多肽可以含有另外的肽,例如,一种或多种肽。另外的肽的实例可以包含用于标记,如聚组氨酸标签(His标签)、Myc和FLAG的表位肽。在一些实施例中,本文所述的Cas12i多肽可以融合到可检测部分,如荧光蛋白(例如,绿色荧光蛋白(GFP)或黄色荧光蛋白(YFP))。
在一些实施例中,Cas12i多肽包括至少一个(例如,两个、三个、四个、五个、六个或更多个)核定位信号(NLS)。在一些实施例中,Cas12i多肽包括至少一个(例如,两个、三个、四个、五个、六个或更多个)核输出信号(NES)。在一些实施例中,Cas12i多肽包括至少一个(例如,两个、三个、四个、五个、六个或更多个)NLS和至少一个(例如,两个、三个、四个、五个、六个或更多个)NES。
在一些实施例中,本文所述的Cas12i多肽可以是自失活的。参见Epstein等人,“为AAV载体设计自失活CRISPR系统(Engineering a Self-Inactivating CRISPR System forAAV Vectors)”《分子疗法(Mol.Ther.)》,24(2016):S50,所述文献通过引用以其整体并入本文。
在一些实施例中,编码本文所述的Cas12i多肽的核苷酸序列可以进行密码子优化以用于特定宿主细胞或生物体。例如,可以针对任何非人真核生物,包含小鼠、大鼠、兔、狗、家畜或非人灵长类动物对核酸进行密码子优化。密码子使用表例如在“密码子使用数据库”中很容易获得,其万维网网址为kazusa.orjp/codon/,并且这些表可以通过多种方式进行调整。参见Nakamura等人《核酸研究》28:292(2000),所述文献通过引用以其整体并入本文。用于对特定序列进行密码子优化以在特定宿主细胞中表达的计算机算法也是可获得的,如基因制造(Gene Forge)(宾夕法尼亚州雅各布斯的Aptagen公司(Aptagen;Jacobus,PA))也是可获得的。在一些实例中,编码Cas12i多肽如本文所公开的Cas12i2多肽的核酸可以是mRNA分子,其可以是经密码子优化的。
示例性Cas12i多肽序列和对应的核苷酸序列在表7中列出。
表7:CAS12I和STMN2序列
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
在一些实施例中,本文所公开的基因编辑系统可以包括如本文所公开的Cas12i多肽。在其它实施例中,基因编辑系统可以包括编码Cas12i多肽的核酸。例如,基因编辑系统可以包括编码Cas12i多肽的载体(例如,病毒载体,如AAV载体,如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11和AAV12)。可替代地,基因编辑系统可以包括编码Cas12i多肽的mRNA分子。在一些情况下,mRNA分子可以是经密码子优化的。
II.基因编辑系统组分的准备
本公开提供了用于产生本文所公开的基因编辑系统的组分(例如,RNA向导)的方法、用于产生Cas12i多肽的方法以及用于复合RNA向导和Cas12i多肽的方法。
A.RNA向导
在一些实施例中,RNA向导通过DNA分子的体外转录来制做。因此,例如,在一些实施例中,通过使用上游启动子序列(例如,T7聚合酶启动子序列)体外转录编码RNA向导的DNA分子来产生RNA向导。
在一些实施例中,DNA分子编码多个RNA向导,或者体外转录反应包含多个不同的DNA分子,每个分子编码不同的RNA向导。在一些实施例中,使用化学合成方法来制做RNA向导。在一些实施例中,通过在用质粒转染的细胞中表达RNA向导序列来制做RNA向导,所述质粒包含编码RNA向导的序列。在一些实施例中,质粒编码多个不同的RNA向导。在一些实施例中,将多个不同的质粒转染到细胞中,每个质粒编码不同的RNA向导。在一些实施例中,RNA向导由编码RNA向导并且还编码Cas12i多肽的质粒表达。在一些实施例中,RNA向导由表达RNA向导但不表达Cas12i多肽的质粒表达。在一些实施例中,RNA向导购自商业供应商。在一些实施例中,使用一个或多个经修饰的核苷酸合成RNA向导,例如,如上所述。
B.Cas12i多肽
在一些实施例中,本公开的Cas12i多肽可以通过以下方式制备:(a)培养产生本公开的Cas12i多肽的细菌,分离Cas12i多肽,任选地纯化Cas12i多肽,并将Cas12i多肽与RNA向导复合。Cas12i多肽也可以通过以下方式制备:(b)已知的基因工程技术,具体地说,通过从细菌中分离编码本公开的Cas12i多肽的基因,构建重组表达载体,然后将载体转移到表达RNA向导的合适宿主细胞中,以用于在宿主细胞中表达与RNA向导复合的重组蛋白。可替代地,Cas12i多肽可以通过以下方式制备:(c)体外偶联转录-翻译系统,然后与RNA向导复合。
在一些实施例中,宿主细胞用于表达Cas12i多肽。宿主细胞没有特别限制,可以优选地使用各种已知细胞。宿主细胞的具体实例包含细菌,如大肠杆菌、酵母(芽殖酵母、酿酒酵母和裂殖酵母、粟酒裂殖酵母)、线虫(秀丽隐杆线虫)、非洲爪蟾卵母细胞和动物细胞(例如,CHO细胞、COS细胞和HEK293细胞)。用于将上述表达载体转移到宿主细胞中的方法(即转化方法)没有特别限制,并且可以使用已知的方法,如电穿孔法、磷酸钙法、脂质体法和DEAE葡聚糖法。
在用表达载体转化宿主后,可以培养、培育或繁殖宿主细胞,以生产Cas12i多肽。在表达Cas12i多肽后,可以收集宿主细胞,并根据常规方法(例如,过滤、离心、细胞破碎、凝胶过滤层析、离子交换层析等)从培养物等中纯化Cas12i多肽。
在一些实施例中,用于Cas12i多肽表达的方法包括翻译Cas12i多肽的至少5个氨基酸、至少10个氨基酸、至少15个氨基酸、至少20个氨基酸、至少50个氨基酸、至少100个氨基酸、至少150个氨基酸、至少200个氨基酸、至少250个氨基酸、至少300个氨基酸、至少400个氨基酸、至少500个氨基酸、至少600个氨基酸、至少700个氨基酸、至少800个氨基酸、至少900个氨基酸或至少1000个氨基酸。在一些实施例中,用于蛋白质表达的方法包括翻译Cas12i多肽的约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约50个氨基酸、约100个氨基酸、约150个氨基酸、约200个氨基酸、约250个氨基酸、约300个氨基酸、约400个氨基酸、约500个氨基酸、约600个氨基酸、约700个氨基酸、约800个氨基酸、约900个氨基酸、约1000个氨基酸或更多氨基酸。
可以使用多种方法来确定宿主细胞中Cas12i多肽的产生水平。此类方法包含但不限于,例如,利用特定于Cas12i多肽的多克隆或单克隆抗体或如本文其他地方所述的标记标签的方法。示例性方法包含但不限于酶联免疫吸附测定法(ELISA)、放射免疫测定法(MA)、荧光免疫测定法(FIA)和荧光激活细胞分选法(FACS)。这些和其它测定是本领域众所周知的(参见例如,Maddox等人,《实验医学杂志(J.Exp.Med.)》158:1211[1983])。
本公开提供了Cas12i多肽在细胞中的体内表达的方法,包括向宿主细胞提供编码Cas12i多肽的多核糖核苷酸,其中所述多核糖核苷酸编码Cas12i多肽,在细胞中表达Cas12i多肽,并从细胞中获得Cas12i多肽。
本公开进一步提供了Cas12i多肽在细胞中的体内表达的方法,包括向宿主细胞提供编码Cas12i多肽的多核糖核苷酸,其中所述多核糖核苷酸编码Cas12i多肽并在细胞中表达Cas12i多肽。在一些实施例中,编码Cas12i多肽的多核糖核苷酸通过RNA向导递送至细胞,并且一旦在细胞中表达,Cas12i多肽和RNA向导就会形成复合物。在一些实施例中,编码Cas12i多肽的多核糖核苷酸和RNA向导在单个组合物内被递送至细胞。在一些实施例中,编码Cas12i多肽的多核糖核苷酸和RNA向导包括在单独的组合物中。在一些实施例中,宿主细胞存在于受试者,例如人类患者体内。
C.复合物
在一些实施例中,靶向STMN2的RNA向导与Cas12i多肽复合以形成核糖核蛋白(RNP)。在一些实施例中,RNA向导和Cas12i多肽的复合在低于以下温度中的任一者的温度下发生:约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃或55℃。在一些实施例中,RNA向导在37℃下在以下中的任一者的温育期内不与Cas12i多肽解离:至少约10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间。
在一些实施例中,RNA向导和Cas12i多肽在复合缓冲液中复合。在一些实施例中,Cas12i多肽储存在缓冲液中,所述缓冲液被复合缓冲液替代以与RNA向导形成复合物。在一些实施例中,Cas12i多肽储存在复合缓冲液中。
在一些实施例中,复合缓冲液的pH值在约7.3至8.6的范围内。在一个实施例中,复合缓冲液的pH为约7.3。在一个实施例中,复合缓冲液的pH为约7.4。在一个实施例中,复合缓冲液的pH为约7.5。在一个实施例中,复合缓冲液的pH为约7.6。在一个实施例中,复合缓冲液的pH为约7.7。在一个实施例中,复合缓冲液的pH为约7.8。在一个实施例中,复合缓冲液的pH为约7.9。在一个实施例中,复合缓冲液的pH为约8.0。在一个实施例中,复合缓冲液的pH为约8.1。在一个实施例中,复合缓冲液的pH为约8.2。在一个实施例中,复合缓冲液的pH为约8.3。在一个实施例中,复合缓冲液的pH为约8.4。在一个实施例中,复合缓冲液的pH为约8.5。在一个实施例中,复合缓冲液的pH为约8.6。
在一些实施例中,在如本文所述的纯化之前,Cas12i多肽可以在宿主细胞中过表达并与RNA向导复合。在一些实施例中,编码Cas12i多肽的mRNA或DNA被引入到细胞中,使得Cas12i多肽在细胞中表达。在一些实施例中,RNA向导还从单个mRNA或DNA构建体中同时地、单独地或顺序地引入到细胞中,使得在细胞中形成RNP复合物。
III.进行基因编辑的方法
本公开还提供了修饰STMN2基因内的靶位点的方法。在一些实施例中,所述方法包括将靶向STMN2的RNA向导和Cas12i多肽引入到细胞中。可以将靶向STMN2的RNA向导和Cas12i多肽作为核糖核蛋白复合物引入到细胞中。可以将靶向STMN2的RNA向导和Cas12i多肽引入到核酸载体上。可以将Cas12i多肽作为mRNA引入。可以将RNA向导和模板DNA直接引入到细胞中。在一些实施例中,将本文所描述的组合物递送到细胞/组织/人,以减少细胞/组织/人中的STMN2。在一些实施例中,将本文所描述的组合物递送到细胞/组织/人,以减少细胞/组织/人中的STMN2产生。在一些实施例中,将本文所描述的组合物递送到细胞/组织/人,以治疗细胞/组织/人的神经退行性疾病(例如,肌萎缩性侧索硬化症(ALS)或额颞叶痴呆(FTD))。在一些实施例中,将本文所描述的组合物递送到患有神经退行性疾病(例如,肌萎缩性侧索硬化症(ALS)或额颞叶痴呆(FTD))的人。
本文所公开的任何基因编辑系统可以用于对STMN2基因进行基因工程化。基因编辑系统可以包括向导RNA、Cas12i2多肽和模板DNA。向导RNA包括对STMN2基因中的靶序列具有特异性,例如对STMN2基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或内含子中的区具有特异性的间隔子序列。
A.靶序列
在一些实施例中,本文所公开的RNA向导被设计成与和5'-TTN-3'PAM序列或5'-NTTN-3'PAM序列相邻的靶序列互补。
在一些实施例中,靶序列在STMN2基因或STMN2基因的基因座(例如,外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或内含子)内,RNA向导可以通过碱基配对与所述靶序列结合。在一些实施例中,细胞仅具有一个靶序列的拷贝。在一些实施例中,细胞具有多于一个拷贝,如靶序列的2个、3个、4个、5个、10个、100个或更多个拷贝中的至少约任一个拷贝。
在一些实施例中,STMN2基因是哺乳动物基因。在一些实施例中,STMN2基因是人基因。例如,在一些实施例中,靶序列在SEQ ID NO:454的序列或其反向补体内。在一些实施例中,靶序列在SEQ ID NO:454中所示的STMN2基因的外显子或其反向补体内,例如在SEQ IDNO:455-461中的任一者的序列(或其任何反向补体)内。SEQ ID NO:454的STMN2基因的外显子区内的靶序列如表6所示。外显子序列如表7所示。在一些实施例中,靶序列在SEQ ID NO:454中所示的STMN2基因的内含子或其反向补体内。在一些实施例中,靶序列在SEQ ID NO:454中所示的STMN2基因序列的变体(例如,多态性变体)或其反向补体内。在一些实施例中,STMN2基因序列是SEQ ID NO:454中所示的序列的同源物或其反向补体。在一些实施例中,STMN2基因序列是非人STMN2序列。
在一些实施例中,靶序列与或5'-NTTN-3'PAM序列相邻,其中N是任何核苷酸。5'-NTTN-3'序列可以紧邻靶序列,或者例如在靶序列的少量(例如1个、2个、3个、4个或5个)核苷酸内。在一些实施例中,5'-NTTN-3'序列是5'-NTTY-3'、5'-NTTC-3'、5'-NTTT-3'、5'-NTTA-3'、5'-NTTB-3'、5'-NTTG-3'、5'-CTTY-3'、5'-DTTR'3'、5'-CTTR-3'、5'-DTTT-3'、5'-ATTN-3'或5'-GTTN-3',其中Y是C或T,B是除A之外的任何核苷酸,D是除C之外的任何核苷酸,并且R是A或G。在一些实施例中,5'-NTTN-3'序列是5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'。PAM序列可以是靶序列的5'。
在一些实施例中,靶序列是单链的(例如,单链DNA)。在一些实施例中,靶序列是双链的(例如,双链DNA)。在一些实施例中,靶序列包括单链区和双链区两者。在一些实施例中,靶序列是直链的。在一些实施例中,靶序列是环状的。在一些实施例中,靶序列包括一个或多个经修饰的核苷酸,如甲基化的核苷酸、受损的核苷酸或核苷酸类似物。在一些实施例中,靶序列未经修饰。在一些实施例中,RNA向导与双链靶序列的第一链(例如,靶链或间隔子互补链)结合,并且5'-NTTN-3'PAM序列存在于第二互补链(例如,非靶链或非间隔子互补链)中。在一些实施例中,RNA向导与靶链(例如,间隔子互补链)上的5'-NAAN-3'序列结合。
5'-NTTN-3'序列可以紧邻靶序列,或者例如在靶序列的少量(例如1个、2个、3个、4个或5个)核苷酸内。在一些实施例中,5'-NTTN-3'序列是5'-NTTY-3'、5'-NTTC-3'、5'-NTTT-3'、5'-NTTA-3'、5'-NTTB-3'、5'-NTTG-3'、5'-CTTY-3'、5'-DTTR-3'、5'-CTTR-3'、5'-DTTT-3'、5'-ATTN-3'或5'-GTTN-3',其中Y是C或T,B是除A之外的任何核苷酸,D是除C之外的任何核苷酸,并且R是A或G。在一些实施例中,5'-NTTN-3'序列是5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'。在一些实施例中,RNA向导被设计成与双链靶核酸的第一链(即,非PAM链)结合,并且5'-NTTN-3'PAM序列存在于第二互补链(即,PAM链)中。在一些实施例中,RNA向导与非PAM链上的区结合,所述非PAM链与和5'-NAAN-3'序列相邻的PAM链上的靶序列互补。
在一些实施例中,靶序列存在于细胞中。在一些实施例中,靶序列存在于细胞核中。在一些实施例中,靶序列对于细胞是内源性的。在一些实施例中,靶序列是基因组DNA。在一些实施例中,靶序列是染色体DNA。在一些实施例中,靶序列是蛋白质编码基因或其功能区,如编码区,或调控元件,如启动子、增强子、5'或3'非翻译区等。
在一些实施例中,靶序列存在于靶序列的易接近区。在一些实施例中,靶序列位于靶基因的外显子中。在一些实施例中,靶序列跨靶基因的外显子-内含子连接。在一些实施例中,靶序列存在于非编码区,如基因的调控区。
B.基因编辑
在一些实施例中,Cas12i多肽具有酶促活性(例如,核酸酶活性)。在一些实施例中,Cas12i多肽在细胞中诱导一个或多个DNA双链断裂。在一些实施例中,Cas12i多肽在细胞中诱导一个或多个DNA单链断裂。在一些实施例中,Cas12i多肽在细胞中诱导一个或多个DNA缺口。在一些实施例中,DNA断裂和/或缺口导致一个或多个插入缺失(例如,一个或多个缺失)的形成。
在一些实施例中,本文所公开的RNA向导与Cas12i多肽形成复合物,并将Cas12i多肽导引导至与5'-NTTN-3'序列相邻的靶序列。在一些实施例中,复合物诱导于5'-NTTN-3'序列相邻的缺失(例如,核苷酸缺失或DNA缺失)。在一些实施例中,复合物诱导与5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列相邻的缺失。在一些实施例中,复合物诱导与富含T/C的序列相邻的缺失。
在一些实施例中,缺失位于5'-NTTN-3'序列的下游。在一些实施例中,缺失位于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列的下游。在一些实施例中,缺失位于富含T/C的序列的下游。
在一些实施例中,缺失改变了STMN2基因的表达。在一些实施例中,缺失改变了STMN2基因的功能。在一些实施例中,缺失使STMN2基因失活。在一些实施例中,缺失是移码缺失。在一些实施例中,缺失是非移码缺失。在一些实施例中,缺失导致细胞毒性或细胞死亡(例如,细胞凋亡)。
在一些实施例中,缺失开始于5'-NTTN-3'序列的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列下游的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列下游的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列下游的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列下游的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列下游的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列下游的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内。
在一些实施例中,缺失终止于5'-NTTN-3'序列的约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失终止于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列的约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失终止于富含T/C的序列的约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。
在一些实施例中,缺失终止于5'-NTTN-3'序列下游的约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失终止于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失终止于富含T/C的序列下游的约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。
在一些实施例中,缺失终止于5'-NTTN-3'序列的约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。在一些实施例中,缺失终止于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列的约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。在一些实施例中,缺失终止于富含T/C的序列的约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。
在一些实施例中,缺失终止于5'-NTTN-3'序列下游的约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。在一些实施例中,缺失终止于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。在一些实施例中,缺失终止于富含T/C的序列下游的约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。
在一些实施例中,缺失终止于5'-NTTN-3'序列的约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失终止于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列的约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失终止于富含T/C的序列的约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。
在一些实施例中,缺失终止于5'-NTTN-3'序列下游的约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失终止于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失终止于富含T/C的序列下游的约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列下游的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于5'-NTTN-3'序列下游的约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列下游的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于富含T/C的序列下游的约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列下游的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于5'-NTTN-3'序列下游的约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列下游的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于富含T/C的序列下游的约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列下游的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于5'-NTTN-3'序列下游的约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列下游的约5个至约15个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于富含T/C的序列下游的约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内,并且终止于约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内,并且终止于约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内,并且终止于约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列下游的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内,并且终止于5'-NTTN-3'序列下游的约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内,并且终止于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列下游的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内,并且终止于富含T/C的序列下游的约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内,并且终止于约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内,并且终止于约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列的约5个至约10个核苷酸内,并且终止于约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列下游的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内,并且终止于5'-NTTN-3'序列下游的约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内,并且终止于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列下游的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内,并且终止于富含T/C的序列下游的约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内,并且终止于约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内,并且终止于约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列下游的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内,并且终止于5'-NTTN-3'序列下游的约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内,并且终止于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列下游的约5个至约10个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个或12个核苷酸)内,并且终止于富含T/C的序列下游的约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列下游的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于5'-NTTN-3'序列下游的约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列下游的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于富含T/C的序列下游的约20个至约30个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列下游的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于5'-NTTN-3'序列下游的约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列下游的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于富含T/C的序列下游的约20个至约25个核苷酸(例如,约17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。
在一些实施例中,缺失开始于5'-NTTN-3'序列下游的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于5'-NTTN-3'序列下游的约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列下游的约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。在一些实施例中,缺失开始于富含T/C的序列下游的约10个至约15个核苷酸(例如,约8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)内,并且终止于富含T/C的序列下游的约25个至约30个核苷酸(例如,约22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个或33个核苷酸)内。
在一些实施例中,缺失的长度为至多约50个核苷酸(例如,约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个或55个核苷酸)。在一些实施例中,缺失的长度为至多约40个核苷酸(例如,约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个或45个核苷酸)。在一些实施例中,缺失的长度介于约4个核苷酸与约40个核苷酸之间(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个或45个核苷酸)。在一些实施例中,缺失的长度介于约4个核苷酸与约25个核苷酸之间(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)。在一些实施例中,缺失的长度介于约10个核苷酸与约25个核苷酸之间(例如,约7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸)。在一些实施例中,缺失的长度介于约10个核苷酸与约15个核苷酸之间(例如,约7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个核苷酸)。
在一些实施例中,本文所描述的两个或更多个RNA向导用于引入长度大于40个核苷酸的缺失。在一些实施例中,本文所描述的两个或更多个RNA向导用于引入至少约41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、110个、120个、130个、140个、150个、16个、170个、180个、190个、200个、210个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个或400个核苷酸的缺失。在一些实施例中,本文所描述的两个或更多个RNA向导用于删除STMN2基因或SEQ ID NO:454的全部或一部分。
在一些实施例中,本文所描述的方法用于对在STMN2基因中包括如本文所描述的缺失的细胞进行工程化。在一些实施例中,使用包括如本文所描述的Cas12i酶的复合物和包括如本文所描述的直接重复序列和间隔子序列的RNA向导来实施所述方法。
在一些实施例中,靶向STMN2的RNA向导在质粒中编码。在一些实施例中,靶向STMN2的RNA向导是合成的或经纯化的RNA。在一些实施例中,Cas12i多肽在质粒中编码。在一些实施例中,Cas12i多肽由合成的或经纯化的RNA编码。
C.递送
本文所公开的任何基因编辑系统的组分可以被调配,例如,包含载剂,如载剂和/或聚合物载剂,例如脂质体,并且通过已知方法递送到细胞(例如,原核、真核、植物、哺乳动物等)。这些方法包含但不限于转染(例如,脂质介导的阳离子聚合物、磷酸钙、树状物);电穿孔或其它膜破坏方法(例如,核转染)、病毒递送(例如,慢病毒、逆转录病毒、腺病毒、腺相关病毒(AAV))、显微注射、微粒轰击(“基因枪”)、fugene、直接声波加载、细胞挤压、光学转染、原生质体融合、刺穿转染(impalefection)、磁转染、外来体介导的转移、脂质纳米颗粒介导的转移和其任何组合。
在一些实施例中,所述方法包括将一种或多种核酸(例如,编码Cas12i多肽的核酸、RNA向导、供体DNA等),其一种或多种转录物,和/或预先形成的RNA向导/Cas12i多肽复合物递送到细胞,在所述细胞中形成三元复合物。在一些实施例中,将RNA向导和编码Cas12i多肽的RNA在单一组合物中一起递送。在一些实施例中,将RNA向导和编码Cas12i多肽的RNA在单独的组合物中递送。在一些实施例中,将在单独的组合物中递送的RNA向导和编码Cas12i多肽的RNA使用相同的递送技术递送。在一些实施例中,将在单独的组合物中递送的RNA向导和编码Cas12i多肽的RNA使用不同的递送技术递送。
在一些实施例中,将Cas12i组分和RNA向导组分一起递送。例如,将Cas12i组分和RNA向导组分一起包装在单AAV颗粒中。在另一个实例中,将Cas12i组分和RNA向导组分通过脂质纳米颗粒(LNP)一起递送。在一些实施例中,将Cas12i组分和RNA向导组分分开递送。例如,将Cas12i组分和RNA向导包装到单独的AAV颗粒中。在另一个实例中,将Cas12i组分通过第一递送机制递送,并且将RNA向导通过第二递送机制递送。
示例性细胞内递送方法包含但不限于病毒,如AAV,或病毒样药剂;基于化学的转染方法,如使用磷酸钙、树状物、脂质体或阳离子聚合物(例如,DEAE-葡聚糖或聚乙烯亚胺)的那些方法;非化学方法,如显微注射、电穿孔、细胞挤压、声致穿孔、光学转染、刺穿转染、原生质体融合、细菌接合、质粒或转座子的递送;基于颗粒的方法,如使用基因枪、磁转染或磁辅助转染、颗粒轰击;和杂交方法,如核转染。在一些实施例中,脂质纳米颗粒包括编码Cas12i多肽的mRNA、RNA向导或编码Cas12i多肽和RNA向导的mRNA。在一些实施例中,编码Cas12i多肽的mRNA是SEQ ID NO:447或SEQ ID NO:481中所示的核苷酸序列或其变体的转录物。在一些实施例中,本申请进一步提供了通过此类方法产生的细胞,以及包括此类细胞或由此类细胞产生的生物体(如动物、植物或真菌)。
D.经基因修饰的细胞
可以将本文所公开的任何基因编辑系统递送到多种细胞。在一些实施例中,细胞是分离的细胞。在一些实施例中,细胞处于细胞培养物或两种或多种细胞类型的共培养物中。在一些实施例中,细胞是离体的。在一些实施例中,细胞从活生物体获得并保持在细胞培养物中。在一些实施例中,细胞是单细胞生物体。
在一些实施例中,细胞是原核细胞。在一些实施例中,细胞是细菌细胞或源自细菌细胞。在一些实施例中,细胞是古菌细胞或源自古菌细胞。
在一些实施例中,细胞是真核细胞。在一些实施例中,细胞是植物细胞或源自植物细胞。在一些实施例中,细胞是真菌细胞或源自真菌细胞。在一些实施例中,细胞是动物细胞或源自动物细胞。在一些实施例中,细胞是无脊椎动物细胞或源自无脊椎动物细胞。在一些实施例中,细胞是脊椎动物细胞或源自脊椎动物细胞。在一些实施例中,细胞是哺乳动物细胞或源自哺乳动物细胞。在一些实施例中,细胞是人细胞。在一些实施例中,细胞是斑马鱼细胞。在一些实施例中,细胞是啮齿动物细胞。在一些实施例中,细胞是合成的,有时称为人工细胞。
在一些实施例中,细胞源自细胞系。本领域已知多种用于组织培养的细胞系。细胞系的实例包含但不限于293T、MF7、K562、HeLa、CHO和其转基因变种。细胞系可从本领域技术人员已知的各种来源获得(参见例如,美国典型培养物保藏中心(ATCC)(弗吉尼亚州马纳萨斯(Manassas,Va.)))。在一些实施例中,细胞是永生细胞或无限增殖化细胞。
在一些实施例中,细胞是原代细胞。在一些实施例中,细胞是干细胞,如全能干细胞(例如,全能的)、多能干细胞、专能干细胞、寡能干细胞或单能干细胞。在一些实施例中,细胞是诱导多能干细胞(iPSC)或源自iPSC。在一些实施例中,细胞是分化细胞。例如,在一些实施例中,分化细胞是神经细胞(例如,神经胶质细胞,如星形胶质细胞、少突胶质细胞、小胶质细胞或室管膜细胞或神经元)、肌肉细胞(例如,肌细胞)、脂细胞(例如,脂肪细胞)、骨细胞(例如,成骨细胞、骨细胞、破骨细胞)、血细胞(例如,单核细胞、淋巴细胞、嗜中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、巨噬细胞、红细胞或血小板)、上皮细胞、免疫细胞(例如,淋巴细胞、嗜中性粒细胞、单核细胞或巨噬细胞)、肝脏细胞(例如,肝细胞)、成纤维细胞或性细胞。在一些实施例中,细胞是终末分化细胞。例如,在一些实施例中,终末分化细胞是神经元细胞、脂肪细胞、心肌细胞、骨骼肌细胞、表皮细胞或肠细胞。在一些实施例中,细胞是免疫细胞。在一些实施例中,免疫细胞是T细胞。在一些实施例中,免疫细胞是B细胞。在一些实施例中,免疫细胞是自然杀伤(NK)细胞。在一些实施例中,免疫细胞是肿瘤浸润淋巴细胞(TIL)。在一些实施例中,细胞是癌细胞(例如,结肠直肠癌细胞、肾细胞癌细胞、乳腺癌细胞或胶质瘤细胞)。在一些实施例中,细胞是哺乳动物细胞,例如,人细胞或鼠细胞。在一些实施例中,鼠细胞源自野生型小鼠、免疫抑制小鼠或疾病特异性小鼠模型。在一些实施例中,细胞是活组织、器官或生物体内的细胞。
使用本文所公开的任何基因编辑系统产生的任何经基因修饰的细胞也在本公开的范围内。此类经修饰的细胞可以包括破坏的STMN2基因。
本文所公开的任何基因编辑系统、包括此类系统的组合物、载体、核酸、RNA向导和细胞可以用于疗法中。本文所公开的基因编辑系统、组合物、载体、核酸、RNA向导和细胞可以用于治疗受试者的疾病或病状的方法中。本领域已知的任何合适的递送或施用方法可以用于递送本文所公开的组合物、载体、核酸、RNA向导和细胞。此类方法可以涉及使靶序列与本文所公开的组合物、载体、核酸或RNA向导接触。此类方法可以涉及如本文所公开的编辑STMN2序列的方法。在一些实施例中,使用本文所公开的RNA向导工程化的细胞用于离体基因疗法。
IV.治疗应用
任何基因编辑系统或使用如本文所公开的此类基因编辑系统产生的经修饰的细胞可以用于治疗与STMN2基因相关的疾病,例如,神经退行性疾病(例如,肌萎缩性侧索硬化症(ALS)或额颞叶痴呆(FTD))。本领域已知的任何合适的递送或施用方法可以用于递送本文所公开的组合物、载体、核酸、RNA向导和细胞。此类方法可以涉及使靶序列与本文所公开的组合物、载体、核酸或RNA向导接触。此类方法可以涉及如本文所公开的编辑STMN2序列的方法。在一些实施例中,使用本文所公开的RNA向导工程化的细胞用于离体基因疗法。在一些实施例中,本文提供了一种用于治疗本文所公开的靶疾病(例如,神经退行性疾病)的方法,所述方法包括向需要治疗的受试者(例如,人类患者)施用本文所公开的任何基因编辑系统。可以将基因编辑系统递送到需要基因编辑的特定组织或特定类型的细胞。基因编辑系统可以包括涵盖组分中的一种或多种组分的LNP、编码组分中的一种或多种组分的一种或多种载体(例如,病毒载体)或其组合。可以调配基因编辑系统的组分以形成药物组合物,所述药物组合物可以进一步包括一种或多种药学上可接受的载剂。
在一些实施例中,可以向需要治疗的受试者(例如,人类患者)施用使用本文所公开的任何基因编辑系统产生的经修饰的细胞。经修饰的细胞可以包括本文所描述的取代、插入和/或缺失。在一些实例中,经修饰的细胞可以包含由CRISPR核酸酶、逆转录酶多肽和编辑模板RNA(例如,RNA向导和RT供体RNA)修饰的细胞系。在一些情况下,经修饰的细胞可以是包括具有不同类型的基因编辑的细胞的异源群体。可替代地,经修饰的细胞可以包括包含STMN2基因中的一个特定基因编辑的基本上同源的细胞群体(例如,整个群体中至少80%的细胞)。在一些实例中,细胞可以悬浮在合适的培养基中。
在一些实施例中,本文提供了包括基因编辑系统或其组分的组合物。此类组合物可以是药物组合物。有用的药物组合物可以以适用于口服、直肠、阴道、肠胃外、局部、肺部、鼻内、病灶内、口腔、眼部、静脉内、器官内或另一种施用途径的调配物制备、包装或销售。本公开的药物组合物可以以单个单位剂量或多个单个单位剂量的形式大量制备、包装或销售。如本文所使用的,“单位剂量”是药物组合物(例如,基因编辑系统或其组分)的离散量,所述离散量将是向受试者施用的量或此类剂量的方便分数,例如,此类剂量的一半或三分之一。
适用于胃肠外施用的药物组合物的调配物可以包括与药学上可接受的载剂,如无菌水或无菌等渗盐水组合的活性剂(例如,基因编辑系统或其组分或经修饰的细胞)。此类调配物可以以适用于团注施用或连续施用的形式制备、包装或销售。一些可注射调配物可以以单位剂型,如以安瓿或含有防腐剂的多剂量容器形式制备、包装或销售。用于肠胃外施用的一些调配物包含但不限于悬浮液、溶液、油性或水性媒剂中的乳液、糊剂以及可植入的持续释放的或生物可降解的调配物。一些调配物可以进一步包括一种或多种另外的成分,包含但不限于悬浮剂、稳定剂或分散剂。
药物组合物可以呈无菌可注射水性或油性悬浮液或溶液的形式。这种悬浮液或溶液可以根据已知技术来调配,并且除了细胞之外还可以包括另外的成分,如本文所描述的分散剂、润湿剂或悬浮剂。此类无菌可注射调配物可以使用无毒肠胃外可接受的稀释剂或溶剂,如水或盐水制备。其它可接受的稀释剂和溶剂包含但不限于林格氏溶液(Ringer'ssolution)、等渗氯化钠溶液和固定油,如合成甘油单酯或甘油二酯。可用的其它可肠胃外施用的调配物包含可以包括呈包装形式、呈脂质体制剂形式或作为可生物降解的聚合物系统的组分的细胞的那些。用于持续释放或植入的一些组合物可以包括药学上可接受的聚合物或疏水材料,如乳液、离子交换树脂、微溶聚合物或微溶盐。
V.试剂盒和其用途
本公开还提供了可以用于例如实施本文所描述的对STMN2基因进行基因修饰的方法的试剂盒。在一些实施例中,试剂盒包含RNA向导和Cas12i多肽。在一些实施例中,试剂盒包含RNA向导、模板DNA和Cas12i多肽。在一些实施例中,试剂盒包含编码此类Cas12i多肽的多核苷酸,并且任选地多核苷酸包括在例如,如本文所描述的载体内。在一些实施例中,试剂盒包含编码本文所公开的RNA向导的多核苷酸。Cas12i多肽(或编码Cas12i多肽的多核苷酸)和RNA向导(例如,作为核糖核蛋白)可以包装在试剂盒内的同一器皿或其它器皿内,或者可以包装在单独的小瓶或其它器皿中,其内容物可以在使用之前混合。
Cas12i多肽、RNA向导和模板DNA可以包装在试剂盒内的同一器皿或其它器皿内,或者可以包装在单独的小瓶或其它器皿中,其内容物可以在使用之前混合。试剂盒可以另外地包含任选地缓冲液和/或RNA向导、模板DNA和Cas12i多肽的使用说明。
本文所引用的所有参考文献和出版物特此通过引用并入。
另外的实施例
下文提供了另外的实施例,其也在本公开的范围内。
实施例1:一种组合物,其包括RNA向导,其中所述RNA向导包括:(i)间隔子序列,所述间隔子序列与STMN2基因内的非PAM链(靶序列的互补序列)上的区基本上互补或完全互补;以及(ii)直接重复序列;其中所述靶序列与包括序列5'-NTTN-3'的原间隔子相邻基序(PAM)相邻。
在实施例1中,所述靶序列可以在所述STMN2基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或内含子内。在一些实例中,所述STMN2基因包括SEQ IDNO:454的序列、SEQ ID NO:454的反向补体、SEQ ID NO:454的变体或SEQ ID NO:454的变体的反向补体。
在实施例1中,所述间隔子序列可以包括:(a)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸16;(b)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸17;(c)与SEQ IDNO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸18;(d)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸19;I与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸20;(f)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸21;(g)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸22;(h)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸23;(i)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸24;(j)与SEQ IDNO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸25;(k)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸26;(l)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸27;(m)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸28;(n)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸29;或(o)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸30。
在根据实施例1所述的组合物中的任何组合物中,所述间隔子序列可以包括:(a)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸16;(b)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸17;(c)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸18;(d)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸19;(e)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸20;(f)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸21;(g)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸22;(h)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸23;(i)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸24;(j)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸25;(k)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸26;(l)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸27;(m)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸28;(n)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸29;或(o)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸30。
在根据实施例1所述的组合物中的任何组合物中,所述直接重复序列可以包括:(a)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸36;(b)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸2至核苷酸36;(c)与SEQID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸3至核苷酸36;(d)与SEQ IDNO:1-8中的任一者的序列至少90%相同的序列的核苷酸4至核苷酸36;(e)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸5至核苷酸36;(f)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸6至核苷酸36;(g)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸7至核苷酸36;(h)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸8至核苷酸36;(i)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸9至核苷酸36;(j)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸10至核苷酸36;(k)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸11至核苷酸36;(l)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸12至核苷酸36;(m)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸13至核苷酸36;(n)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸14至核苷酸36;(o)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸1至核苷酸34;(p)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸2至核苷酸34;(q)与SEQ IDNO:9的序列至少90%相同的序列的核苷酸3至核苷酸34;(r)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸4至核苷酸34;(s)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸5至核苷酸34;(t)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸6至核苷酸34;(u)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸7至核苷酸34;(v)与SEQ IDNO:9的序列至少90%相同的序列的核苷酸8至核苷酸34;(w)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸9至核苷酸34;(x)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸10至核苷酸34;(y)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸11至核苷酸34;(z)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸12至核苷酸34;或(aa)与SEQID NO:10的序列至少90%相同的序列或其部分。
在一些实例中,所述直接重复序列包括:(a)SEQ ID NO:1-8中的任一者的核苷酸1至核苷酸36;(b)SEQ ID NO:1-8中的任一者的核苷酸2至核苷酸36;(c)SEQ ID NO:1-8中的任一者的核苷酸3至核苷酸36;(d)SEQ ID NO:1-8中的任一者的核苷酸4至核苷酸36;(e)SEQ ID NO:1-8中的任一者的核苷酸5至核苷酸36;(f)SEQ ID NO:1-8中的任一者的核苷酸6至核苷酸36;(g)SEQ ID NO:1-8中的任一者的核苷酸7至核苷酸36;(h)SEQ ID NO:1-8中的任一者的核苷酸8至核苷酸36;(i)SEQ ID NO:1-8中的任一者的核苷酸9至核苷酸36;(j)SEQ ID NO:1-8中的任一者的核苷酸10至核苷酸36;(k)SEQ ID NO:1-8中的任一者的核苷酸11至核苷酸36;(l)SEQ ID NO:1-8中的任一者的核苷酸12至核苷酸36;(m)SEQ ID NO:1-8中的任一者的核苷酸13至核苷酸36;(n)SEQ ID NO:1-8中的任一者的核苷酸14至核苷酸36;(o)SEQ ID NO:9的核苷酸1至核苷酸34;(p)SEQ ID NO:9的核苷酸2至核苷酸34;(q)SEQID NO:9的核苷酸3至核苷酸34;(r)SEQ ID NO:9的核苷酸4至核苷酸34;(s)SEQ ID NO:9的核苷酸5至核苷酸34;(t)SEQ ID NO:9的核苷酸6至核苷酸34;(u)SEQ ID NO:9的核苷酸7至核苷酸34;(v)SEQ ID NO:9的核苷酸8至核苷酸34;(w)SEQ ID NO:9的核苷酸9至核苷酸34;(x)SEQ ID NO:9的核苷酸10至核苷酸34;(y)SEQ ID NO:9的核苷酸11至核苷酸34;(z)SEQID NO:9的核苷酸12至核苷酸34;或(aa)SEQ ID NO:10或其部分。
在一些实例中,所述直接重复序列包括:(a)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸36;(b)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸2至核苷酸36;(c)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸3至核苷酸36;(d)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸4至核苷酸36;(e)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸5至核苷酸36;(f)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸6至核苷酸36;(g)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸7至核苷酸36;(h)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸8至核苷酸36;(i)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸9至核苷酸36;(j)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸10至核苷酸36;(k)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸11至核苷酸36;(l)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸12至核苷酸36;(m)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸13至核苷酸36;(n)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸14至核苷酸36;或(o)与SEQ ID NO:480的序列至少90%相同的序列或其部分。
在一些实例中,所述直接重复序列包括:(a)SEQ ID NO:462-479中的任一者的核苷酸1至核苷酸36;(b)SEQ ID NO:462-479中的任一者的核苷酸2至核苷酸36;(c)SEQ IDNO:462-479中的任一者的核苷酸3至核苷酸36;(d)SEQ ID NO:462-479中的任一者的核苷酸4至核苷酸36;(e)SEQ ID NO:462-479中的任一者的核苷酸5至核苷酸36;(f)SEQ ID NO:462-479中的任一者的核苷酸6至核苷酸36;(g)SEQ ID NO:462-479中的任一者的核苷酸7至核苷酸36;(h)SEQ ID NO:462-479中的任一者的核苷酸8至核苷酸36;(i)SEQ ID NO:462-479中的任一者的核苷酸9至核苷酸36;(j)SEQ ID NO:462-479中的任一者的核苷酸10至核苷酸36;(k)SEQ ID NO:462-479中的任一者的核苷酸11至核苷酸36;(l)SEQ ID NO:462-479中的任一者的核苷酸12至核苷酸36;(m)SEQ ID NO:462-479中的任一者的核苷酸13至核苷酸36;(n)SEQ ID NO:462-479中的任一者的核苷酸14至核苷酸36;或(o)SEQ IDNO:480或其部分。
在一些实例中,所述直接重复序列包括:(a)与SEQ ID NO:485至少90%相同的序列的核苷酸1至核苷酸36;(b)与SEQ ID NO:485至少90%相同的序列的核苷酸2至核苷酸36;(c)与SEQ ID NO:485至少90%相同的序列的核苷酸3至核苷酸36;(d)与SEQ ID NO:485至少90%相同的序列的核苷酸4至核苷酸36;(e)与SEQ ID NO:485至少90%相同的序列的核苷酸5至核苷酸36;(f)与SEQ ID NO:485至少90%相同的序列的核苷酸6至核苷酸36;(g)与SEQ ID NO:485至少90%相同的序列的核苷酸7至核苷酸36;(h)与SEQ ID NO:485至少90%相同的序列的核苷酸8至核苷酸36;(i)与SEQ ID NO:485至少90%相同的序列的核苷酸9至核苷酸36;(j)与SEQ ID NO:485至少90%相同的序列的核苷酸10至核苷酸36;(k)与SEQ ID NO:485至少90%相同的序列的核苷酸11至核苷酸36;(l)与SEQ ID NO:485至少90%相同的序列的核苷酸12至核苷酸36;(m)与SEQ ID NO:485至少90%相同的序列的核苷酸13至核苷酸36;(n)与SEQ ID NO:485至少90%相同的序列的核苷酸14至核苷酸36;或(o)与SEQ ID NO:486或SEQ ID NO:487的序列至少90%相同的序列或其部分。
在一些实例中,所述直接重复序列包括:(a)SEQ ID NO:485的核苷酸1至核苷酸36;(b)SEQ ID NO:485的核苷酸2至核苷酸36;(c)SEQ ID NO:485的核苷酸3至核苷酸36;(d)SEQ ID NO:485的核苷酸4至核苷酸36;(e)SEQ ID NO:485的核苷酸5至核苷酸36;(f)SEQ ID NO:485的核苷酸6至核苷酸36;(g)SEQ ID NO:485的核苷酸7至核苷酸36;(h)SEQID NO:485的核苷酸8至核苷酸36;(i)SEQ ID NO:485的核苷酸9至核苷酸36;(j)SEQ IDNO:485的核苷酸10至核苷酸36;(k)SEQ ID NO:485的核苷酸11至核苷酸36;(l)SEQ ID NO:485的核苷酸12至核苷酸36;(m)SEQ ID NO:485的核苷酸13至核苷酸36;(n)SEQ ID NO:485的核苷酸14至核苷酸36;或(o)SEQ ID NO:486或SEQ ID NO:487或其部分。
在一些实例中,所述直接重复序列包括:(a)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸1至核苷酸36;(b)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸2至核苷酸36;(c)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸3至核苷酸36;(d)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸4至核苷酸36;(e)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸5至核苷酸36;(f)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸6至核苷酸36;(g)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸7至核苷酸36;(h)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸8至核苷酸36;(i)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸9至核苷酸36;(j)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸10至核苷酸36;(k)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸11至核苷酸36;(l)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸12至核苷酸36;(m)与SEQ ID NO:488或SEQ IDNO:489的序列至少90%相同的序列的核苷酸13至核苷酸36;(n)与SEQ ID NO:488或SEQ IDNO:489的序列至少90%相同的序列的核苷酸14至核苷酸36;(o)与SEQ ID NO:488或SEQ IDNO:489的序列至少90%相同的序列的核苷酸15至核苷酸36;或(p)与SEQ ID NO:490的序列至少90%相同的序列或其部分。
在一些实例中,所述直接重复序列包括:(a)SEQ ID NO:488或SEQ ID NO:489的核苷酸1至核苷酸36;(b)SEQ ID NO:488或SEQ ID NO:489的核苷酸2至核苷酸36;(c)SEQ IDNO:488或SEQ ID NO:489的核苷酸3至核苷酸36;(d)SEQ ID NO:488或SEQ ID NO:489的核苷酸4至核苷酸36;(e)SEQ ID NO:488或SEQ ID NO:489的核苷酸5至核苷酸36;(f)SEQ IDNO:488或SEQ ID NO:489的核苷酸6至核苷酸36;(g)SEQ ID NO:488或SEQ ID NO:489的核苷酸7至核苷酸36;(h)SEQ ID NO:488或SEQ ID NO:489的核苷酸8至核苷酸36;(i)SEQ IDNO:488或SEQ ID NO:489的核苷酸9至核苷酸36;(j)SEQ ID NO:488或SEQ ID NO:489的核苷酸10至核苷酸36;(k)SEQ ID NO:488或SEQ ID NO:489的核苷酸11至核苷酸36;(l)SEQID NO:488或SEQ ID NO:489的核苷酸12至核苷酸36;(m)SEQ ID NO:488或SEQ ID NO:489的核苷酸13至核苷酸36;(n)SEQ ID NO:488或SEQ ID NO:489的核苷酸14至核苷酸36;(o)SEQ ID NO:488或SEQ ID NO:489的核苷酸15至核苷酸36;或(p)SEQ ID NO:490或其部分。
在一些实例中,所述间隔子序列与SEQ ID NO:11-228或491-2496中的任一者的序列的补体基本上互补。
在根据实施例1所述的组合物中的任何组合物中,所述PAM可以包括序列5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'。
在一些实例中,所述靶序列紧邻所述PAM序列。
在一些实例中,所述RNA向导具有与SEQ ID NO:4505-4562中的任一者的序列至少90%相同的序列。
在一些实例中,所述RNA向导具有SEQ ID NO:4505-4562中的任一者的序列。
实施例2:根据实施例1所述的组合物,其可以进一步包括Cas12i多肽或编码Cas12i多肽的多核糖核苷酸,其可以是以下中的一者:(a)Cas12i2多肽,所述Cas12i2多肽包括与SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:450、SEQ ID NO:451、SEQ ID NO:452或SEQ ID NO:453的序列至少90%相同的序列;(b)Cas12i4多肽,所述Cas12i4多肽包括与SEQID NO:482、SEQ ID NO:483或SEQ ID NO:484的序列至少90%相同的序列;(c)Cas12i1多肽,所述Cas12i1多肽包括与SEQ ID NO:4503的序列至少90%相同的序列;或(d)Cas12i3多肽,所述Cas12i3多肽包括与SEQ ID NO:4504的序列至少90%相同的序列。
在具体实例中,所述Cas12i多肽是:(a)Cas12i2多肽,所述Cas12i2多肽包括SEQID NO:448、SEQ ID NO:449、SEQ ID NO:450、SEQ ID NO:451、SEQ ID NO:452或SEQ ID NO:453的序列;(b)Cas12i4多肽,所述Cas12i4多肽包括SEQ ID NO:482、SEQ ID NO:483或SEQID NO:484的序列;(c)Cas12i1多肽,所述Cas12i1多肽包括SEQ ID NO:4503的序列;或(d)Cas12i3多肽,所述Cas12i3多肽包括SEQ ID NO:4504的序列。
在根据实施例2所述的组合物中的任何组合物中,所述RNA向导和所述Cas12i多肽可以形成核糖核蛋白复合物。在一些实例中,所述核糖核蛋白复合物与靶核酸结合。在一些实例中,所述组合物存在于细胞内。
在根据实施例2所述的组合物中的任何组合物中,所述RNA向导和所述Cas12i多肽可以在载体,例如表达载体中编码。在一些实例中,所述RNA向导和所述Cas12i多肽在单个载体中编码。在其它实例中,所述RNA向导在第一载体中编码,并且所述Cas12i多肽在第二载体中编码。
实施例3:一种载体系统,其包括一种或多种载体,所述一种或多种载体编码本文所公开的RNA向导和Cas12i多肽。在一些实例中,所述载体系统包括编码本文所公开的RNA向导的第一载体和编码Cas12i多肽的第二载体。所述载体可以是表达载体。
实施例4:一种组合物,其包括RNA向导和Cas12i多肽,其中所述RNA向导包括:(i)间隔子序列,所述间隔子序列与STMN2基因内的非PAM链(靶序列的互补序列)上的区基本上互补或完全互补;以及(ii)直接重复序列。
在一些实例中,所述靶序列在所述STMN2基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或内含子内,所述STMN2基因可以包括SEQ ID NO:454的序列、SEQ ID NO:454的反向补体、SEQ ID NO:454的序列的变体或SEQ ID NO:454的变体的反向补体。
在一些实例中,所述间隔子序列包括:(a)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸16;(b)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸17;(c)与SEQ IDNO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸18;(d)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸19;(e)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸20;(f)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸21;(g)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸22;(h)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸23;(i)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸24;(j)与SEQ IDNO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸25;(k)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸26;(l)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸27;(m)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸28;(n)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸29;或(o)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸30。
在一些实例中,所述间隔子序列包括:(a)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸16;(b)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸17;(c)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸18;(d)SEQID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸19;(e)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸20;(f)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸21;(g)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸22;(h)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸23;(i)SEQID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸24;(j)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸25;(k)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸26;(l)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸27;(m)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸28;(n)SEQID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸29;或(o)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸30。
在一些实例中,所述直接重复序列包括:(a)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸36;(b)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸2至核苷酸36;(c)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸3至核苷酸36;(d)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸4至核苷酸36;(e)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸5至核苷酸36;(f)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸6至核苷酸36;(g)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸7至核苷酸36;(h)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸8至核苷酸36;(i)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸9至核苷酸36;(j)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸10至核苷酸36;(k)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸11至核苷酸36;(l)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸12至核苷酸36;(m)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸13至核苷酸36;(n)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸14至核苷酸36;(o)与SEQID NO:9的序列至少90%相同的序列的核苷酸1至核苷酸34;(p)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸2至核苷酸34;(q)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸3至核苷酸34;(r)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸4至核苷酸34;(s)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸5至核苷酸34;(t)与SEQ IDNO:9的序列至少90%相同的序列的核苷酸6至核苷酸34;(u)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸7至核苷酸34;(v)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸8至核苷酸34;(w)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸9至核苷酸34;(x)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸10至核苷酸34;(y)与SEQ IDNO:9的序列至少90%相同的序列的核苷酸11至核苷酸34;(z)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸12至核苷酸34;或(aa)与SEQ ID NO:10的序列至少90%相同的序列或其部分。
在一些实例中,所述直接重复序列包括:(a)SEQ ID NO:1-8中的任一者的核苷酸1至核苷酸36;(b)SEQ ID NO:1-8中的任一者的核苷酸2至核苷酸36;(c)SEQ ID NO:1-8中的任一者的核苷酸3至核苷酸36;(d)SEQ ID NO:1-8中的任一者的核苷酸4至核苷酸36;(e)SEQ ID NO:1-8中的任一者的核苷酸5至核苷酸36;(f)SEQ ID NO:1-8中的任一者的核苷酸6至核苷酸36;(g)SEQ ID NO:1-8中的任一者的核苷酸7至核苷酸36;(h)SEQ ID NO:1-8中的任一者的核苷酸8至核苷酸36;(i)SEQ ID NO:1-8中的任一者的核苷酸9至核苷酸36;(j)SEQ ID NO:1-8中的任一者的核苷酸10至核苷酸36;(k)SEQ ID NO:1-8中的任一者的核苷酸11至核苷酸36;(l)SEQ ID NO:1-8中的任一者的核苷酸12至核苷酸36;(m)SEQ ID NO:1-8中的任一者的核苷酸13至核苷酸36;(n)SEQ ID NO:1-8中的任一者的核苷酸14至核苷酸36;(o)SEQ ID NO:9的核苷酸1至核苷酸34;(p)SEQ ID NO:9的核苷酸2至核苷酸34;(q)SEQID NO:9的核苷酸3至核苷酸34;(r)SEQ ID NO:9的核苷酸4至核苷酸34;(s)SEQ ID NO:9的核苷酸5至核苷酸34;(t)SEQ ID NO:9的核苷酸6至核苷酸34;(u)SEQ ID NO:9的核苷酸7至核苷酸34;(v)SEQ ID NO:9的核苷酸8至核苷酸34;(w)SEQ ID NO:9的核苷酸9至核苷酸34;(x)SEQ ID NO:9的核苷酸10至核苷酸34;(y)SEQ ID NO:9的核苷酸11至核苷酸34;(z)SEQID NO:9的核苷酸12至核苷酸34;或(aa)SEQ ID NO:10或其部分。
在一些实例中,所述直接重复序列包括:(a)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸36;(b)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸2至核苷酸36;(c)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸3至核苷酸36;(d)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸4至核苷酸36;(e)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸5至核苷酸36;(f)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸6至核苷酸36;(g)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸7至核苷酸36;(h)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸8至核苷酸36;(i)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸9至核苷酸36;(j)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸10至核苷酸36;(k)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸11至核苷酸36;(l)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸12至核苷酸36;(m)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸13至核苷酸36;(n)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸14至核苷酸36;或(o)与SEQ ID NO:480的序列至少90%相同的序列或其部分。
在一些实例中,所述直接重复序列包括:(a)SEQ ID NO:462-479中的任一者的核苷酸1至核苷酸36;(b)SEQ ID NO:462-479中的任一者的核苷酸2至核苷酸36;(c)SEQ IDNO:462-479中的任一者的核苷酸3至核苷酸36;(d)SEQ ID NO:462-479中的任一者的核苷酸4至核苷酸36;(e)SEQ ID NO:462-479中的任一者的核苷酸5至核苷酸36;(f)SEQ ID NO:462-479中的任一者的核苷酸6至核苷酸36;(g)SEQ ID NO:462-479中的任一者的核苷酸7至核苷酸36;(h)SEQ ID NO:462-479中的任一者的核苷酸8至核苷酸36;(i)SEQ ID NO:462-479中的任一者的核苷酸9至核苷酸36;(j)SEQ ID NO:462-479中的任一者的核苷酸10至核苷酸36;(k)SEQ ID NO:462-479中的任一者的核苷酸11至核苷酸36;(l)SEQ ID NO:462-479中的任一者的核苷酸12至核苷酸36;(m)SEQ ID NO:462-479中的任一者的核苷酸13至核苷酸36;(n)SEQ ID NO:462-479中的任一者的核苷酸14至核苷酸36;或(o)SEQ IDNO:480或其部分。
在一些实例中,所述直接重复序列包括:(a)与SEQ ID NO:485至少90%相同的序列的核苷酸1至核苷酸36;(b)与SEQ ID NO:485至少90%相同的序列的核苷酸2至核苷酸36;(c)与SEQ ID NO:485至少90%相同的序列的核苷酸3至核苷酸36;(d)与SEQ ID NO:485至少90%相同的序列的核苷酸4至核苷酸36;(e)与SEQ ID NO:485至少90%相同的序列的核苷酸5至核苷酸36;(f)与SEQ ID NO:485至少90%相同的序列的核苷酸6至核苷酸36;(g)与SEQ ID NO:485至少90%相同的序列的核苷酸7至核苷酸36;(h)与SEQ ID NO:485至少90%相同的序列的核苷酸8至核苷酸36;(i)与SEQ ID NO:485至少90%相同的序列的核苷酸9至核苷酸36;(j)与SEQ ID NO:485至少90%相同的序列的核苷酸10至核苷酸36;(k)与SEQ ID NO:485至少90%相同的序列的核苷酸11至核苷酸36;(l)与SEQ ID NO:485至少90%相同的序列的核苷酸12至核苷酸36;(m)与SEQ ID NO:485至少90%相同的序列的核苷酸13至核苷酸36;(n)与SEQ ID NO:485至少90%相同的序列的核苷酸14至核苷酸36;或(o)与SEQ ID NO:486或SEQ ID NO:487的序列至少90%相同的序列或其部分。
在一些实例中,所述直接重复序列包括:(a)SEQ ID NO:485的核苷酸1至核苷酸36;(b)SEQ ID NO:485的核苷酸2至核苷酸36;(c)SEQ ID NO:485的核苷酸3至核苷酸36;(d)SEQ ID NO:485的核苷酸4至核苷酸36;(e)SEQ ID NO:485的核苷酸5至核苷酸36;(f)SEQ ID NO:485的核苷酸6至核苷酸36;(g)SEQ ID NO:485的核苷酸7至核苷酸36;(h)SEQID NO:485的核苷酸8至核苷酸36;(i)SEQ ID NO:485的核苷酸9至核苷酸36;(j)SEQ IDNO:485的核苷酸10至核苷酸36;(k)SEQ ID NO:485的核苷酸11至核苷酸36;(l)SEQ ID NO:485的核苷酸12至核苷酸36;(m)SEQ ID NO:485的核苷酸13至核苷酸36;(n)SEQ ID NO:485的核苷酸14至核苷酸36;或(o)SEQ ID NO:486或SEQ ID NO:487或其部分。
在一些实例中,所述直接重复序列包括:(a)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸1至核苷酸36;(b)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸2至核苷酸36;(c)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸3至核苷酸36;(d)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸4至核苷酸36;(e)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸5至核苷酸36;(f)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸6至核苷酸36;(g)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸7至核苷酸36;(h)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸8至核苷酸36;(i)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸9至核苷酸36;(j)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸10至核苷酸36;(k)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸11至核苷酸36;(l)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸12至核苷酸36;(m)与SEQ ID NO:488或SEQ IDNO:489的序列至少90%相同的序列的核苷酸13至核苷酸36;(n)与SEQ ID NO:488或SEQ IDNO:489的序列至少90%相同的序列的核苷酸14至核苷酸36;(o)与SEQ ID NO:488或SEQ IDNO:489的序列至少90%相同的序列的核苷酸15至核苷酸36;或(p)与SEQ ID NO:490的序列至少90%相同的序列或其部分。
在一些实例中,所述直接重复序列包括:(a)SEQ ID NO:488或SEQ ID NO:489的核苷酸1至核苷酸36;(b)SEQ ID NO:488或SEQ ID NO:489的核苷酸2至核苷酸36;(c)SEQ IDNO:488或SEQ ID NO:489的核苷酸3至核苷酸36;(d)SEQ ID NO:488或SEQ ID NO:489的核苷酸4至核苷酸36;(e)SEQ ID NO:488或SEQ ID NO:489的核苷酸5至核苷酸36;(f)SEQ IDNO:488或SEQ ID NO:489的核苷酸6至核苷酸36;(g)SEQ ID NO:488或SEQ ID NO:489的核苷酸7至核苷酸36;(h)SEQ ID NO:488或SEQ ID NO:489的核苷酸8至核苷酸36;(i)SEQ IDNO:488或SEQ ID NO:489的核苷酸9至核苷酸36;(j)SEQ ID NO:488或SEQ ID NO:489的核苷酸10至核苷酸36;(k)SEQ ID NO:488或SEQ ID NO:489的核苷酸11至核苷酸36;(l)SEQID NO:488或SEQ ID NO:489的核苷酸12至核苷酸36;(m)SEQ ID NO:488或SEQ ID NO:489的核苷酸13至核苷酸36;(n)SEQ ID NO:488或SEQ ID NO:489的核苷酸14至核苷酸36;(o)SEQ ID NO:488或SEQ ID NO:489的核苷酸15至核苷酸36;或(p)SEQ ID NO:490或其部分。
在根据实施例4所述的组合物中的任何组合物中,所述间隔子序列可以与SEQ IDNO:11-228或491-2496中的任一者的序列的补体基本上互补。
在一些实例中,所述靶序列与包括序列5'-NTTN-3'的原间隔子相邻基序(PAM)相邻。在一些实例中,所述PAM包括序列5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'。
在一些实例中,所述靶序列紧邻所述PAM序列。在一些实例中,所述靶序列在所述PAM序列的1个、2个、3个、4个或5个核苷酸内。
在根据实施例4所述的组合物中的任何组合物中,所述Cas12i多肽是:(a)Cas12i2多肽,所述Cas12i2多肽包括与SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:450、SEQ IDNO:451、SEQ ID NO:452或SEQ ID NO:453的序列至少90%相同的序列;(b)Cas12i4多肽,所述Cas12i4多肽包括与SEQ ID NO:482、SEQ ID NO:483或SEQ ID NO:484的序列至少90%相同的序列;(c)Cas12i1多肽,所述Cas12i1多肽包括与SEQ ID NO:4503的序列至少90%相同的序列;或(d)Cas12i3多肽,所述Cas12i3多肽包括与SEQ ID NO:4504的序列至少90%相同的序列。
在一些实例中,所述Cas12i多肽是:(a)Cas12i2多肽,所述Cas12i2多肽包括SEQID NO:448、SEQ ID NO:449、SEQ ID NO:450、SEQ ID NO:451、SEQ ID NO:452或SEQ ID NO:453的序列;(b)Cas12i4多肽,所述Cas12i4多肽包括SEQ ID NO:482、SEQ ID NO:483或SEQID NO:484的序列;(c)Cas12i1多肽,所述Cas12i1多肽包括SEQ ID NO:4503的序列;或(d)Cas12i3多肽,所述Cas12i3多肽包括SEQ ID NO:4504的序列。
在根据实施例4所述的组合物中的任何组合物中,所述RNA向导和所述Cas12i多肽可以形成核糖核蛋白复合物。在一些实例中,所述核糖核蛋白复合物与靶核酸结合。
在根据实施例4所述的组合物中的任何组合物中,所述组合物可以存在于细胞内。
在根据实施例4所述的组合物中的任何组合物中,所述RNA向导和所述Cas12i多肽可以在载体,例如表达载体中编码。在一些实例中,所述RNA向导和所述Cas12i多肽在单个载体中编码。在其它实例中,所述RNA向导在第一载体中编码,并且所述Cas12i多肽在第二载体中编码。
实施例5:一种载体系统,其包括一种或多种载体,所述一种或多种载体编码本文所公开的RNA向导和Cas12i多肽。在一些实例中,所述载体系统包括编码本文所公开的RNA向导的第一载体和编码Cas12i多肽的第二载体。在一些实施例中,所述载体是表达载体。
实施例6:一种RNA向导,其包括:(i)间隔子序列,所述间隔子序列与STMN2基因内的非PAM链(靶序列的互补序列)上的区基本上互补或完全互补;以及(ii)直接重复序列。
在一些实例中,所述靶序列在所述STMN2基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或内含子内,所述STMN2基因可以包括SEQ ID NO:454的序列、SEQ ID NO:454的反向补体、SEQ ID NO:454的序列的变体或SEQ ID NO:454的变体的反向补体。
在一些实例中,所述间隔子序列包括:(a)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸16;(b)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸17;(c)与SEQ IDNO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸18;(d)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸19;(e)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸20;(f)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸21;(g)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸22;(h)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸23;(i)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸24;(j)与SEQ IDNO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸25;(k)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸26;(l)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸27;(m)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸28;(n)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸29;或(o)与SEQ ID NO:229-446或2497-4502中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸30。
在一些实例中,所述间隔子序列包括:(a)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸16;(b)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸17;(c)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸18;(d)SEQID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸19;(e)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸20;(f)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸21;(g)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸22;(h)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸23;(i)SEQID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸24;(j)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸25;(k)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸26;(l)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸27;(m)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸28;(n)SEQID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸29;或(o)SEQ ID NO:229-446或2497-4502中的任一者的核苷酸1至核苷酸30。
在一些实例中,所述直接重复序列包括:(a)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸36;(b)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸2至核苷酸36;(c)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸3至核苷酸36;(d)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸4至核苷酸36;(e)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸5至核苷酸36;(f)与IEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸6至核苷酸36;(g)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸7至核苷酸36;(h)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸8至核苷酸36;(i)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸9至核苷酸36;(j)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸10至核苷酸36;(k)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸11至核苷酸36;(l)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸12至核苷酸36;(m)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸13至核苷酸36;(n)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸14至核苷酸36;(o)与SEQID NO:9的序列至少90%相同的序列的核苷酸1至核苷酸34;(p)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸2至核苷酸34;(q)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸3至核苷酸34;(r)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸4至核苷酸34;(s)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸5至核苷酸34;(t)与SEQ IDNO:9的序列至少90%相同的序列的核苷酸6至核苷酸34;(u)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸7至核苷酸34;(v)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸8至核苷酸34;(w)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸9至核苷酸34;(x)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸10至核苷酸34;(y)与SEQ IDNO:9的序列至少90%相同的序列的核苷酸11至核苷酸34;(z)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸12至核苷酸34;或(aa)与SEQ ID NO:10的序列至少90%相同的序列或其部分。
在一些实例中,所述直接重复序列包括:(a)SEQ ID NO:1-8中的任一者的核苷酸1至核苷酸36;(b)SEQ ID NO:1-8中的任一者的核苷酸2至核苷酸36;(c)SEQ ID NO:1-8中的任一者的核苷酸3至核苷酸36;(d)SEQ ID NO:1-8中的任一者的核苷酸4至核苷酸36;(e)SEQ ID NO:1-8中的任一者的核苷酸5至核苷酸36;(f)SEQ ID NO:1-8中的任一者的核苷酸6至核苷酸36;(g)SEQ ID NO:1-8中的任一者的核苷酸7至核苷酸36;(h)SEQ ID NO:1-8中的任一者的核苷酸8至核苷酸36;(i)SEQ ID NO:1-8中的任一者的核苷酸9至核苷酸36;(j)SEQ ID NO:1-8中的任一者的核苷酸10至核苷酸36;(k)SEQ ID NO:1-8中的任一者的核苷酸11至核苷酸36;(l)SEQ ID NO:1-8中的任一者的核苷酸12至核苷酸36;(m)SEQ ID NO:1-8中的任一者的核苷酸13至核苷酸36;(n)SEQ ID NO:1-8中的任一者的核苷酸14至核苷酸36;(o)SEQ ID NO:9的核苷酸1至核苷酸34;(p)SEQ ID NO:9的核苷酸2至核苷酸34;(q)SEQID NO:9的核苷酸3至核苷酸34;(r)SEQ ID NO:9的核苷酸4至核苷酸34;(s)SEQ ID NO:9的核苷酸5至核苷酸34;(t)SEQ ID NO:9的核苷酸6至核苷酸34;(u)SEQ ID NO:9的核苷酸7至核苷酸34;(v)SEQ ID NO:9的核苷酸8至核苷酸34;(w)SEQ ID NO:9的核苷酸9至核苷酸34;(x)SEQ ID NO:9的核苷酸10至核苷酸34;(y)SEQ ID NO:9的核苷酸11至核苷酸34;(z)SEQID NO:9的核苷酸12至核苷酸34;或(aa)SEQ ID NO:10或其部分。
在一些实例中,所述直接重复序列包括:(a)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸36;(b)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸2至核苷酸36;(c)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸3至核苷酸36;(d)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸4至核苷酸36;(e)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸5至核苷酸36;(f)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸6至核苷酸36;(g)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸7至核苷酸36;(h)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸8至核苷酸36;(i)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸9至核苷酸36;(j)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸10至核苷酸36;(k)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸11至核苷酸36;(l)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸12至核苷酸36;(m)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸13至核苷酸36;(n)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸14至核苷酸36;或(o)与SEQ ID NO:480的序列至少90%相同的序列或其部分。
在一些实例中,所述直接重复序列包括:(a)SEQ ID NO:462-479中的任一者的核苷酸1至核苷酸36;(b)SEQ ID NO:462-479中的任一者的核苷酸2至核苷酸36;(c)SEQ IDNO:462-479中的任一者的核苷酸3至核苷酸36;(d)SEQ ID NO:462-479中的任一者的核苷酸4至核苷酸36;(e)SEQ ID NO:462-479中的任一者的核苷酸5至核苷酸36;(f)SEQ ID NO:462-479中的任一者的核苷酸6至核苷酸36;(g)SEQ ID NO:462-479中的任一者的核苷酸7至核苷酸36;(h)SEQ ID NO:462-479中的任一者的核苷酸8至核苷酸36;(i)SEQ ID NO:462-479中的任一者的核苷酸9至核苷酸36;(j)SEQ ID NO:462-479中的任一者的核苷酸10至核苷酸36;(k)SEQ ID NO:462-479中的任一者的核苷酸11至核苷酸36;(l)SEQ ID NO:462-479中的任一者的核苷酸12至核苷酸36;(m)SEQ ID NO:462-479中的任一者的核苷酸13至核苷酸36;(n)SEQ ID NO:462-479中的任一者的核苷酸14至核苷酸36;或(o)SEQ IDNO:480或其部分。
在一些实例中,所述直接重复序列包括:(a)与SEQ ID NO:485至少90%相同的序列的核苷酸1至核苷酸36;(b)与SEQ ID NO:485至少90%相同的序列的核苷酸2至核苷酸36;(c)与SEQ ID NO:485至少90%相同的序列的核苷酸3至核苷酸36;(d)与SEQ ID NO:485至少90%相同的序列的核苷酸4至核苷酸36;(e)与SEQ ID NO:485至少90%相同的序列的核苷酸5至核苷酸36;(f)与SEQ ID NO:485至少90%相同的序列的核苷酸6至核苷酸36;(g)与SEQ ID NO:485至少90%相同的序列的核苷酸7至核苷酸36;(h)与SEQ ID NO:485至少90%相同的序列的核苷酸8至核苷酸36;(i)与SEQ ID NO:485至少90%相同的序列的核苷酸9至核苷酸36;(j)与SEQ ID NO:485至少90%相同的序列的核苷酸10至核苷酸36;(k)与SEQ ID NO:485至少90%相同的序列的核苷酸11至核苷酸36;(l)与SEQ ID NO:485至少90%相同的序列的核苷酸12至核苷酸36;(m)与SEQ ID NO:485至少90%相同的序列的核苷酸13至核苷酸36;(n)与SEQ ID NO:485至少90%相同的序列的核苷酸14至核苷酸36;或(o)与SEQ IDNO:486或SEQ ID NO:487的序列至少90%相同的序列或其部分。
在一些实例中,所述直接重复序列包括:(a)SEQ ID NO:485的核苷酸1至核苷酸36;(b)SEQ ID NO:485的核苷酸2至核苷酸36;(c)SEQ ID NO:485的核苷酸3至核苷酸36;(d)SEQ ID NO:485的核苷酸4至核苷酸36;(e)SEQ ID NO:485的核苷酸5至核苷酸36;(f)SEQ ID NO:485的核苷酸6至核苷酸36;(g)SEQ ID NO:485的核苷酸7至核苷酸36;(h)SEQID NO:485的核苷酸8至核苷酸36;(i)SEQ ID NO:485的核苷酸9至核苷酸36;(j)SEQ IDNO:485的核苷酸10至核苷酸36;(k)SEQ ID NO:485的核苷酸11至核苷酸36;(l)SEQ ID NO:485的核苷酸12至核苷酸36;(m)SEQ ID NO:485的核苷酸13至核苷酸36;(n)SEQ ID NO:485的核苷酸14至核苷酸36;或(o)SEQ ID NO:486或SEQ ID NO:487或其部分。
在一些实例中,所述直接重复序列包括:(a)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸1至核苷酸36;(b)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸2至核苷酸36;(c)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸3至核苷酸36;(d)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸4至核苷酸36;(e)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸5至核苷酸36;(f)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸6至核苷酸36;(g)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸7至核苷酸36;(h)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸8至核苷酸36;(i)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸9至核苷酸36;(j)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸10至核苷酸36;(k)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸11至核苷酸36;(l)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸12至核苷酸36;(m)与SEQ ID NO:488或SEQ IDNO:489的序列至少90%相同的序列的核苷酸13至核苷酸36;(n)与SEQ ID NO:488或SEQ IDNO:489的序列至少90%相同的序列的核苷酸14至核苷酸36;(o)与SEQ ID NO:488或SEQ IDNO:489的序列至少90%相同的序列的核苷酸15至核苷酸36;或(p)与SEQ ID NO:490的序列至少90%相同的序列或其部分。
在一些实例中,所述直接重复序列包括:(a)SEQ ID NO:488或SEQ ID NO:489的核苷酸1至核苷酸36;(b)SEQ ID NO:488或SEQ ID NO:489的核苷酸2至核苷酸36;(c)SEQ IDNO:488或SEQ ID NO:489的核苷酸3至核苷酸36;(d)SEQ ID NO:488或SEQ ID NO:489的核苷酸4至核苷酸36;(e)SEQ ID NO:488或SEQ ID NO:489的核苷酸5至核苷酸36;(f)SEQ IDNO:488或SEQ ID NO:489的核苷酸6至核苷酸36;(g)SEQ ID NO:488或SEQ ID NO:489的核苷酸7至核苷酸36;(h)SEQ ID NO:488或SEQ ID NO:489的核苷酸8至核苷酸36;(i)SEQ IDNO:488或SEQ ID NO:489的核苷酸9至核苷酸36;(j)SEQ ID NO:488或SEQ ID NO:489的核苷酸10至核苷酸36;(k)SEQ ID NO:488或SEQ ID NO:489的核苷酸11至核苷酸36;(l)SEQID NO:488或SEQ ID NO:489的核苷酸12至核苷酸36;(m)SEQ ID NO:488或SEQ ID NO:489的核苷酸13至核苷酸36;(n)SEQ ID NO:488或SEQ ID NO:489的核苷酸14至核苷酸36;(o)SEQ ID NO:488或SEQ ID NO:489的核苷酸15至核苷酸36;或(p)SEQ ID NO:490或其部分。
在根据实施例6所述的RNA向导中的任何RNA向导中,所述间隔子序列可以与SEQID NO:11-228或491-2496中的任一者的序列的补体基本上互补。
在根据实施例6所述的RNA向导中的任何RNA向导中,所述靶序列可以与包括序列5'-NTTN-3'的原间隔子相邻基序(PAM)相邻,其中N是任何核苷酸。在一些实例中,所述PAM包括序列5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'。
在一些实例中,所述靶序列紧邻所述PAM序列。在其它实例中,所述靶序列在所述PAM序列的1个、2个、3个、4个或5个核苷酸内。
在一些实例中,所述RNA向导具有与SEQ ID NO:4505-4562中的任一者的序列至少90%相同的序列。在具体实例中,所述RNA向导具有SEQ ID NO:4505-4562中的任一者的序列。
实施例7:一种核酸,其编码如本文所描述的RNA向导。
实施例8:一种载体,其包括如本文所描述的此类RNA向导。
实施例9:一种细胞,其包括如本文所描述的组合物、RNA向导、核酸或载体。在一些实例中,所述细胞是真核细胞、动物细胞、哺乳动物细胞、人细胞、原代细胞、细胞系、干细胞、神经元或T细胞。
实施例10:一种试剂盒,其包括如本文所描述的组合物、RNA向导、核酸或载体。
实施例11:一种编辑STMN2序列的方法,所述方法包括使STMN2序列与如本文所描述的组合物或RNA向导接触。在一些实例中,所述方法在体外实施。在其它实例中,所述方法离体实施。
在一些实例中,所述STMN2序列在细胞中。
在一些实例中,所述组合物或所述RNA向导诱导所述STMN2序列中的缺失。在一些实例中,所述缺失与5'-NTTN-3'序列相邻,其中N是任何核苷酸。在一些具体实例中,所述缺失在5'-NTTN-3'序列的下游。在一些具体实例中,所述缺失的长度为至多约40个核苷酸。在一些情况下,所述缺失的长度为约4个核苷酸至40个核苷酸、约4个核苷酸至25个核苷酸、约10个核苷酸至25个核苷酸,或约10个核苷酸至15个核苷酸。
在一些实例中,所述缺失开始于5'-NTTN-3'序列的约5个核苷酸至约15个核苷酸、约5个核苷酸至约10个核苷酸或约10个核苷酸至约15个核苷酸内。
在一些实例中,所述缺失开始于5'-NTTN-3'序列下游的约5个核苷酸至约15个核苷酸、约5个核苷酸至约10个核苷酸或约10个核苷酸至约15个核苷酸内。
在一些实例中,所述缺失终止于5'-NTTN-3'序列的约20个核苷酸至约30个核苷酸、约20个核苷酸至约25个核苷酸或约25个核苷酸至约30个核苷酸内。
在一些实例中,所述缺失终止于5'-NTTN-3'序列下游的约20个核苷酸至约30个核苷酸、约20个核苷酸至约25个核苷酸、约25个核苷酸至约30个核苷酸内。
在一些实例中,所述缺失开始于5'-NTTN-3'序列下游的约5个核苷酸至约15个核苷酸内,并且终止于5'-NTTN-3'序列下游的约20个核苷酸至约30个核苷酸内。
在一些实例中,所述缺失开始于5'-NTTN-3'序列下游的约5个核苷酸至约15个核苷酸内,并且终止于5'-NTTN-3'序列下游的约20个核苷酸至约25个核苷酸内。
在一些实例中,所述缺失开始于5'-NTTN-3'序列下游的约5个核苷酸至约15个核苷酸内,并且终止于5'-NTTN-3'序列下游的约25个核苷酸至约30个核苷酸内。
在一些实例中,所述缺失开始于5'-NTTN-3'序列下游的约5个核苷酸至约10个核苷酸内,并且终止于5'-NTTN-3'序列下游的约20个核苷酸至约30个核苷酸内。
在一些实例中,所述缺失开始于5'-NTTN-3'序列下游的约5个核苷酸至约10个核苷酸内,并且终止于5'-NTTN-3'序列下游的约20个核苷酸至约25个核苷酸内。
在一些实例中,所述缺失开始于5'-NTTN-3'序列下游的约5个核苷酸至约10个核苷酸内,并且终止于5'-NTTN-3'序列下游的约25个核苷酸至约30个核苷酸内。
在一些实例中,所述缺失开始于5'-NTTN-3'序列下游的约10个核苷酸至约15个核苷酸内,并且终止于5'-NTTN-3'序列下游的约20个核苷酸至约30个核苷酸内。
在一些实例中,所述缺失开始于5'-NTTN-3'序列下游的约10个核苷酸至约15个核苷酸内,并且终止于5'-NTTN-3'序列下游的约20个核苷酸至约25个核苷酸内。
在一些实例中,所述缺失开始于5'-NTTN-3'序列下游的约10个核苷酸至约15个核苷酸内,并且终止于5'-NTTN-3'序列下游的约25个核苷酸至约30个核苷酸内。
在一些实例中,5'-NTTN-3'序列是5'-CTTT-3'、5'-CTTC-3'、5'-GTTT-3'、5'-GTTC-3'、5'-TTTC-3'、5'-GTTA-3'或5'-GTTG-3'。
在一些实例中,所述缺失与所述STMN2序列中的突变重叠。在一些情况下,所述缺失与所述STMN2序列中的插入重叠。在一些情况下,所述缺失去除了所述STMN2序列或其一部分的重复序列扩展。在一些情况下,所述缺失破坏了所述STMN2序列的一个或两个等位基因。
在根据本文所描述的实施例1至11中所述的组合物、RNA向导、核酸、载体、细胞、试剂盒或方法中的任何组合物、RNA向导、核酸、载体、细胞、试剂盒或方法中,所述RNA向导可以包括SEQ ID NO:4505-4562中的任一者的序列。
实施例12:一种治疗受试者的神经退行性疾病(例如,肌萎缩性侧索硬化症(ALS)或额颞叶痴呆(FTD))的方法,所述方法包括向所述受试者施用本文所描述的组合物、RNA向导或细胞。
在本文所描述的组合物、RNA向导、细胞、试剂盒或方法中的任何组合物、RNA向导、细胞、试剂盒或方法中,所述RNA向导和/或编码所述Cas12i多肽的所述多核糖核苷酸包括在脂质纳米颗粒内。在一些实例中,所述RNA向导和编码所述Cas12i多肽的所述多核糖核苷酸包括在同一脂质纳米颗粒内。在其它实例中,所述RNA向导和编码所述Cas12i多肽的所述多核糖核苷酸包括在单独的脂质纳米颗粒内。
实施例13:一种RNA向导,其包括:(i)间隔子序列,所述间隔子序列与STMN2基因内的靶位点(所述靶位点在非PAM链上并且与靶序列互补)互补;以及(ii)直接重复序列。
在一些实例中,所述直接重复序列包括:(a)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸36;(b)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸2至核苷酸36;(c)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸3至核苷酸36;(d)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸4至核苷酸36;(e)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸5至核苷酸36;(f)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸6至核苷酸36;(g)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸7至核苷酸36;(h)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸8至核苷酸36;(i)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸9至核苷酸36;(j)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸10至核苷酸36;(k)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸11至核苷酸36;(l)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸12至核苷酸36;(m)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸13至核苷酸36;(n)与SEQ ID NO:1-8中的任一者的序列至少90%相同的序列的核苷酸14至核苷酸36;(o)与SEQID NO:9的序列至少90%相同的序列的核苷酸1至核苷酸34;(p)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸2至核苷酸34;(q)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸3至核苷酸34;(r)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸4至核苷酸34;(s)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸5至核苷酸34;(t)与SEQ IDNO:9的序列至少90%相同的序列的核苷酸6至核苷酸34;(u)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸7至核苷酸34;(v)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸8至核苷酸34;(w)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸9至核苷酸34;(x)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸10至核苷酸34;(y)与SEQ IDNO:9的序列至少90%相同的序列的核苷酸11至核苷酸34;(z)与SEQ ID NO:9的序列至少90%相同的序列的核苷酸12至核苷酸34;或(aa)与SEQ ID NO:10的序列至少90%相同的序列或其部分。
在一些实例中,所述直接重复序列包括:(a)SEQ ID NO:1-8中的任一者的核苷酸1至核苷酸36;(b)SEQ ID NO:1-8中的任一者的核苷酸2至核苷酸36;(c)SEQ ID NO:1-8中的任一者的核苷酸3至核苷酸36;(d)SEQ ID NO:1-8中的任一者的核苷酸4至核苷酸36;(e)SEQ ID NO:1-8中的任一者的核苷酸5至核苷酸36;(f)SEQ ID NO:1-8中的任一者的核苷酸6至核苷酸36;(g)SEQ ID NO:1-8中的任一者的核苷酸7至核苷酸36;(h)SEQ ID NO:1-8中的任一者的核苷酸8至核苷酸36;(i)SEQ ID NO:1-8中的任一者的核苷酸9至核苷酸36;(j)SEQ ID NO:1-8中的任一者的核苷酸10至核苷酸36;(k)SEQ ID NO:1-8中的任一者的核苷酸11至核苷酸36;(l)SEQ ID NO:1-8中的任一者的核苷酸12至核苷酸36;(m)SEQ ID NO:1-8中的任一者的核苷酸13至核苷酸36;(n)SEQ ID NO:1-8中的任一者的核苷酸14至核苷酸36;(o)SEQ ID NO:9的核苷酸1至核苷酸34;(p)SEQ ID NO:9的核苷酸2至核苷酸34;(q)SEQID NO:9的核苷酸3至核苷酸34;(r)SEQ ID NO:9的核苷酸4至核苷酸34;(s)SEQ ID NO:9的核苷酸5至核苷酸34;(t)SEQ ID NO:9的核苷酸6至核苷酸34;(u)SEQ ID NO:9的核苷酸7至核苷酸34;(v)SEQ ID NO:9的核苷酸8至核苷酸34;(w)SEQ ID NO:9的核苷酸9至核苷酸34;(x)SEQ ID NO:9的核苷酸10至核苷酸34;(y)SEQ ID NO:9的核苷酸11至核苷酸34;(z)SEQID NO:9的核苷酸12至核苷酸34;或(aa)SEQ ID NO:10或其部分。
在一些实例中,所述直接重复序列包括:(a)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸1至核苷酸36;(b)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸2至核苷酸36;(c)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸3至核苷酸36;(d)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸4至核苷酸36;(e)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸5至核苷酸36;(f)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸6至核苷酸36;(g)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸7至核苷酸36;(h)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸8至核苷酸36;(i)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸9至核苷酸36;(j)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸10至核苷酸36;(k)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸11至核苷酸36;(l)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸12至核苷酸36;(m)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸13至核苷酸36;(n)与SEQ ID NO:462-479中的任一者的序列至少90%相同的序列的核苷酸14至核苷酸36;或(o)与SEQ ID NO:480的序列至少90%相同的序列或其部分。
在一些实例中,所述直接重复序列包括:(a)SEQ ID NO:462-479中的任一者的核苷酸1至核苷酸36;(b)SEQ ID NO:462-479中的任一者的核苷酸2至核苷酸36;(c)SEQ IDNO:462-479中的任一者的核苷酸3至核苷酸36;(d)SEQ ID NO:462-479中的任一者的核苷酸4至核苷酸36;(e)SEQ ID NO:462-479中的任一者的核苷酸5至核苷酸36;(f)SEQ ID NO:462-479中的任一者的核苷酸6至核苷酸36;(g)SEQ ID NO:462-479中的任一者的核苷酸7至核苷酸36;(h)SEQ ID NO:462-479中的任一者的核苷酸8至核苷酸36;(i)SEQ ID NO:462-479中的任一者的核苷酸9至核苷酸36;(j)SEQ ID NO:462-479中的任一者的核苷酸10至核苷酸36;(k)SEQ ID NO:462-479中的任一者的核苷酸11至核苷酸36;(l)SEQ ID NO:462-479中的任一者的核苷酸12至核苷酸36;(m)SEQ ID NO:462-479中的任一者的核苷酸13至核苷酸36;(n)SEQ ID NO:462-479中的任一者的核苷酸14至核苷酸36;或(o)SEQ IDNO:480或其部分。
在一些实例中,所述直接重复序列包括:(a)与SEQ ID NO:485至少90%相同的序列的核苷酸1至核苷酸36;(b)与SEQ ID NO:485至少90%相同的序列的核苷酸2至核苷酸36;(c)与SEQ ID NO:485至少90%相同的序列的核苷酸3至核苷酸36;(d)与SEQ ID NO:485至少90%相同的序列的核苷酸4至核苷酸36;(e)与SEQ ID NO:485至少90%相同的序列的核苷酸5至核苷酸36;(f)与SEQ ID NO:485至少90%相同的序列的核苷酸6至核苷酸36;(g)与SEQ ID NO:485至少90%相同的序列的核苷酸7至核苷酸36;(h)与SEQ ID NO:485至少90%相同的序列的核苷酸8至核苷酸36;(i)与SEQ ID NO:485至少90%相同的序列的核苷酸9至核苷酸36;(j)与SEQ ID NO:485至少90%相同的序列的核苷酸10至核苷酸36;(k)与SEQ ID NO:485至少90%相同的序列的核苷酸11至核苷酸36;(l)与SEQ ID NO:485至少90%相同的序列的核苷酸12至核苷酸36;(m)与SEQ ID NO:485至少90%相同的序列的核苷酸13至核苷酸36;(n)与SEQ ID NO:485至少90%相同的序列的核苷酸14至核苷酸36;或(o)与SEQ ID NO:486或SEQ ID NO:487的序列至少90%相同的序列或其部分。
在一些实例中,所述直接重复序列包括:(a)SEQ ID NO:485的核苷酸1至核苷酸36;(b)SEQ ID NO:485的核苷酸2至核苷酸36;(c)SEQ ID NO:485的核苷酸3至核苷酸36;(d)SEQ ID NO:485的核苷酸4至核苷酸36;(e)SEQ ID NO:485的核苷酸5至核苷酸36;(f)SEQ ID NO:485的核苷酸6至核苷酸36;(g)SEQ ID NO:485的核苷酸7至核苷酸36;(h)SEQID NO:485的核苷酸8至核苷酸36;(i)SEQ ID NO:485的核苷酸9至核苷酸36;(j)SEQ IDNO:485的核苷酸10至核苷酸36;(k)SEQ ID NO:485的核苷酸11至核苷酸36;(l)SEQ ID NO:485的核苷酸12至核苷酸36;(m)SEQ ID NO:485的核苷酸13至核苷酸36;(n)SEQ ID NO:485的核苷酸14至核苷酸36;或(o)SEQ ID NO:486或SEQ ID NO:487或其部分。
在一些实例中,所述直接重复序列包括:(a)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸1至核苷酸36;(b)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸2至核苷酸36;(c)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸3至核苷酸36;(d)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸4至核苷酸36;(e)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸5至核苷酸36;(f)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸6至核苷酸36;(g)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸7至核苷酸36;(h)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸8至核苷酸36;(i)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸9至核苷酸36;(j)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸10至核苷酸36;(k)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸11至核苷酸36;(l)与SEQ ID NO:488或SEQ ID NO:489的序列至少90%相同的序列的核苷酸12至核苷酸36;(m)与SEQ ID NO:488或SEQ IDNO:489的序列至少90%相同的序列的核苷酸13至核苷酸36;(n)与SEQ ID NO:488或SEQ IDNO:489的序列至少90%相同的序列的核苷酸14至核苷酸36;(o)与SEQ ID NO:488或SEQ IDNO:489的序列至少90%相同的序列的核苷酸15至核苷酸36;或(p)与SEQ ID NO:490的序列至少90%相同的序列或其部分。
在一些实例中,所述直接重复序列包括:(a)SEQ ID NO:488或SEQ ID NO:489的核苷酸1至核苷酸36;(b)SEQ ID NO:488或SEQ ID NO:489的核苷酸2至核苷酸36;(c)SEQ IDNO:488或SEQ ID NO:489的核苷酸3至核苷酸36;(d)SEQ ID NO:488或SEQ ID NO:489的核苷酸4至核苷酸36;(e)SEQ ID NO:488或SEQ ID NO:489的核苷酸5至核苷酸36;(f)SEQ IDNO:488或SEQ ID NO:489的核苷酸6至核苷酸36;(g)SEQ ID NO:488或SEQ ID NO:489的核苷酸7至核苷酸36;(h)SEQ ID NO:488或SEQ ID NO:489的核苷酸8至核苷酸36;(i)SEQ IDNO:488或SEQ ID NO:489的核苷酸9至核苷酸36;(j)SEQ ID NO:488或SEQ ID NO:489的核苷酸10至核苷酸36;(k)SEQ ID NO:488或SEQ ID NO:489的核苷酸11至核苷酸36;(l)SEQID NO:488或SEQ ID NO:489的核苷酸12至核苷酸36;(m)SEQ ID NO:488或SEQ ID NO:489的核苷酸13至核苷酸36;(n)SEQ ID NO:488或SEQ ID NO:489的核苷酸14至核苷酸36;(o)SEQ ID NO:488或SEQ ID NO:489的核苷酸15至核苷酸36;或(p)SEQ ID NO:490或其部分。
在一些实例中,所述RNA向导的前三个核苷酸中的每个核苷酸均包括2'-O-甲基硫代磷酸酯修饰。
在一些实例中,所述RNA向导的最后四个核苷酸中的每个核苷酸均包括2'-O-甲基硫代磷酸酯修饰。
在一些实例中,所述RNA向导的第一核苷酸至最后核苷酸、第二核苷酸至最后核苷酸和第三核苷酸至最后核苷酸中的每个核苷酸均包括2'-O-甲基硫代磷酸酯修饰,并且其中RNA向导的最后核苷酸未被修饰。
实施例14:一种核酸,其编码如本文所描述的RNA向导。
实施例15:一种载体,其包括如本文所描述的核酸。
实施例16:一种载体系统,其包括一种或多种载体,所述一种或多种载体编码:(i)如本文所描述的根据实施例13所述的RNA向导;以及(ii)Cas12i多肽。在一些实例中,所述载体系统包括编码所述RNA向导的第一载体和编码所述Cas12i多肽的第二载体。
实施例17:一种细胞,其包括如本文所描述的根据实施例13至16所述的RNA向导、核酸、载体或载体系统。在一些实例中,所述细胞是真核细胞、动物细胞、哺乳动物细胞、人细胞、原代细胞、细胞系、干细胞、神经元或T细胞。
实施例18:一种试剂盒,其包括如本文所描述的根据实施例13至16所述的RNA向导、核酸、载体或载体系统。
实施例19:一种编辑STMN2序列的方法,所述方法包括使STMN2序列与如本文所描述的根据实施例13所述的RNA向导接触。在一些实例中,所述STMN2序列在细胞中。
在一些实例中,所述RNA向导在所述STMN2序列中诱导插入缺失(例如,插入或缺失)。
实施例20:一种治疗受试者的神经退行性疾病(例如,肌萎缩性侧索硬化症(ALS)或额颞叶痴呆(FTD))的方法,所述方法包括向所述受试者施用如本文所描述的根据实施例13所述的RNA向导。
一般技术
除非另有指示,否则本公开的实践将采用在本领域技术范围内的常规分子生物学(包含重组技术)、微生物学、细胞生物学、生物化学和免疫学技术。此类技术在如以下等文献中进行了充分解释:《分子克隆:实验室手册(Molecular Cloning:A LaboratoryManual)》,第二版(Sambrook等人,1989)冷泉港出版社(Cold Spring Harbor Press);《寡核苷酸合成(Oligonucleotide Synthesis)》(M.J.Gait编辑1984);《分子生物学方法(Methods in Molecular Biology)》,胡马纳出版社(Humana Press);《细胞生物学:实验室手册(Cell Biology:A Laboratory Notebook)》(J.E.Cellis编辑,1989)学术出版社(Academic Press);《动物细胞培养(Animal Cell Culture)》(R.I.Freshney编辑,1987);《细胞和组织培养导论(Introduction to Cell and Tissue Culture)》(J.P.Mather和P.E.Roberts,1998),普莱南出版社(Plenum Press);《细胞和组织培养:实验室程序(Celland Tissue Culture:Laboratory Procedures)》(A.Doyle、J.B.Griffiths和D.G.Newell编辑1993-8)约翰·威利父子出版公司(J.Wiley and Sons);《酶学方法(Methods inEnzymology)》(学术出版社公司(Academic Press,Inc.));《实验免疫学手册(Handbook ofExperimental Immunology)》(D.M.Weir和C.C.Blackwell编辑);《哺乳动物细胞基因转移载体(Gene Transfer Vectors for Mammalian Cells)》(J.M.Miller和M.P.Calos编辑,1987);《当代分子生物学实验指南(Current Protocols in Molecular Biology)》(F.M.Ausubel等人编辑1987);《PCR:聚合酶链式反应(PCR:The Polymerase ChainReaction)》(Mullis等人编辑1994);《当代免疫学指南(Current Protocols inImmunology)》(J.E.Coligan等人编辑,1991);《精编分子生物学实验指南(ShortProtocols in Molecular Biology)》(约翰威利父子出版公司,1999);《免疫生物学(Immunobiology)》(C.A.Janeway和P.Travers,1997);《抗体(Antibodies)》(P.Finch,1997);《抗体:实用方法(Antibodies:a practical approach)》(D.Catty.编辑,IRL出版社(IRL Press),1988-1989);《单克隆抗体:实用方法(Monoclonal antibodies:a practicalapproach)》(P.Shepherd和C.Dean编辑,牛津大学出版社(Oxford University Press),2000);《使用抗体:实验室手册(Using antibodies:a laboratory manual)》(E.Harlow和D.Lane(冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),1999));《抗体(The Antibodies)》(M.Zanetti和J.D.Capra编辑哈伍德学术出版社(Harwood AcademicPublishers),1995);《DNA克隆:实用方法(DNA Cloning:A practical Approach)》,第I卷和第II卷(D.N.Glover编辑1985);《核酸杂交(Nucleic Acid Hybridization)》(B.D.Hames和S.J.Higgins编辑(1985));《转录和翻译(Transcription and Translation)》(B.D.Hames和S.J.Higgins编辑(1984));《动物细胞培养》(R.I.Freshney编辑,(1986));《固定化细胞和酶(Immobilized Cells and Enzymes)》(IRL出版社,(1986));以及B.Perbal,《分子克隆实用指南(Apractical Guide To Molecular Cloning)》(1984);F.M.Ausubel等人(编辑)。
无需进一步阐述,据信,基于以上描述,本领域技术人员可以最大程度地利用本公开。因此,以下具体实施例应被解释为仅是说明性的,并且不以任何方式限制本公开的其余部分。本文所引用的所有公开出于本文参考的目的或主题通过引用并入。
实例
提供以下实例以进一步展示本公开的一些实施例,但不旨在限制本公开的范围;通过其示例性性质将会理解,可以可替代地使用本领域技术人员已知的其它程序、方法或技术。
实例1-变体Cas12i2靶向STMN2内含子1
该实例描述了在用编码变体Cas12i2(SEQ ID NO:450)的质粒和RNA向导转染之后,对细胞中的STMN2基因的多个靶标的插入缺失评估。
将变体Cas12i2多肽克隆到包括CMV启动子的质粒中。将编码靶向STMN2内含子1基因的RNA向导的片段克隆到pUC19主链中(新英格兰生物实验室(New England Biolabs))。然后最大化制备并稀释质粒。表6中列出了crRNA序列、靶序列和PAM序列。
表6:哺乳动物靶标和对应的crRNA。
/>
/>
/>
/>
/>
转染前大约16小时,将DMEM/10%FBS+Pen/Strep(D10培养基)中的25,000个HEK293T细胞平板接种到96孔板中的每个孔中。在转染当天,细胞70-90%汇合。对于每个要转染的孔,制备2000转染试剂(赛默飞世尔公司(ThermoFisher))和还原血清培养基(赛默飞世尔公司)的混合物,并且在室温下温育5分钟(溶液1)。在温育之后,将/>2000:/>(转染试剂(赛默飞世尔公司):还原血清培养基(赛默飞世尔公司))混合物添加到含有核酸酶质粒、RNA向导质粒和还原血清培养基(赛默飞世尔公司)的单独混合物中(溶液2)。在阴性对照的情况下,RNA向导质粒不包含在溶液2中。将溶液1和2用移液管混合8次,然后在室温下温育25分钟。在温育之后,将溶液1和2混合物逐滴添加到含有细胞的96孔板的每个孔中。转染后72小时,通过向每个孔的中心添加TRYPLETM(重组细胞解离酶;赛默飞世尔公司)来对细胞进行胰蛋白酶化,并在37℃下温育大约5分钟。然后向每个孔中添加D10培养基并混合以重新悬浮细胞。将重新悬浮的细胞以500x g离心10分钟以获得沉淀,并将上清液丢弃。将QUICKEXTRACTTM(DNA提取溶液;Lucigen公司(Lucigen))提取试剂添加到每个孔中以裂解沉淀的细胞。将细胞在65℃下温育15分钟,在68℃下温育15分钟,并且在98℃下温育10分钟。
通过两轮PCR制备用于NGS的样品。第一轮(PCR1)用于根据靶标扩增特异性基因组区。进行第2轮PCR(PCR2)以添加因美纳公司(Illumina)衔接子和索引。然后将反应汇集并通过柱纯化进行纯化。使用300次循环NEXTSEQTM(因美纳公司)500/550高输出v2.5试剂盒进行测序运行。
如图1所示,RNA向导1、3、4、5、6、8、9、10、11、12、13、14、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57和58都产生了可测量的插入缺失活性,其定义为比无RNA向导对照的背景率高>1%和>0.2%。
RNA向导4、8、55和57导致内含子1中的隐蔽剪接位点的破坏>15%(图2A),其中破坏被定义为隐蔽剪接位点的一个或多个碱基处的插入或缺失。由RNA向导4产生的97%的插入缺失导致内含子1中的隐蔽剪接位点的破坏,其中破坏被定义为隐蔽剪接位点的一个或多个碱基处的插入或缺失。
RNA向导12、46、47、48和49导致内含子1中的3个TDP-43结合基序中的至少一个的破坏>15%(图2B),其中破坏定义为TDP-43结合基序的一个或多个碱基处的插入或缺失。由RNA向导12产生的97%的插入缺失导致内含子1中的3个TDP-43结合基序中的至少一个的破坏,其中破坏被定义为TDP-43结合基序的一个或多个碱基处的插入或缺失。
RNA向导17和18导致内含子1中的过早聚腺苷酸化信号的破坏>15%(图2C),其中破坏被定义为聚腺苷酸化信号的一个或多个碱基处的插入或缺失。由RNA向导17产生的88%的插入缺失导致内含子1中的过早聚腺苷酸化信号的破坏,其中破坏被定义为过早聚腺苷酸化信号的一个或多个碱基处的插入或缺失。由RNA向导18产生的93%的插入缺失导致内含子1中的过早聚腺苷酸化信号的破坏,其中破坏被定义为过早聚腺苷酸化信号的一个或多个碱基处的插入或缺失。
图3描绘了每个RNA向导相对于隐蔽剪接位点、TDP-43结合基序和过早聚腺苷酸化信号的位置与STMN2的内含子1结合的位置。深灰色反映RNA向导在超过30%的NGS读数中展示出插入缺失,并且浅灰色反映RNA向导在少于30%的NGS读数中展示出插入缺失。因此,该实例表明,Cas12i2引导STMN2的编辑内含子1,并能够破坏隐蔽剪接位点、TDP-43结合基序和过早聚腺苷酸化信号。
实例2-变体Cas12i2在SH-SY%Y细胞中靶向STMN2内含子1
该实例描述了在用编码变体Cas12i2(SEQ ID NO:450)的质粒和靶向内含子1的隐蔽剪接位点的RNA向导转染之后,对神经母细胞瘤细胞系中的STMN2基因的多个靶标的插入缺失评估。
克隆、纯化和稀释表6的变体Cas12i2多肽和RNA向导4、5、8、9、55、56、57和58,如实例1中所描述的。在转染之前大约16小时,将EMEM:F12/10%FBS+Pen/Strep(EF12-10培养基)中的25,000个SH-SY5Y细胞平板接种到96孔板中的每个孔中。在转染当天,细胞70-90%汇合。对于每个要转染的孔,制备2000转染试剂(赛默飞世尔公司)和还原血清培养基(赛默飞世尔公司)的混合物,并且在室温下温育5分钟(溶液1)。在温育之后,将/>2000:/>(转染试剂(赛默飞世尔公司):还原血清培养基(赛默飞世尔公司))混合物添加到含有核酸酶质粒、RNA向导质粒和还原血清培养基(赛默飞世尔公司)的单独混合物中(溶液2)。在阴性对照的情况下,RNA向导质粒不包含在溶液2中。将溶液1和2用移液管混合8次,然后在室温下温育25分钟。在温育之后,将溶液1和2混合物逐滴添加到含有细胞的96孔板的每个孔中。转染后72小时,通过向每个孔的中心添加TRYPLETM(重组细胞解离酶;赛默飞世尔公司)来对细胞进行胰蛋白酶化,并在37℃下温育大约5分钟。然后向每个孔中添加EF12-10培养基并混合以重新悬浮细胞。将重新悬浮的细胞以500x g离心10分钟以获得沉淀,并将上清液丢弃。将QUICKEXTRACTTM(DNA提取溶液;Lucigen公司)提取试剂添加到每个孔中以裂解沉淀的细胞。将细胞在65℃下温育15分钟,在68℃下温育15分钟,并且在98℃下温育10分钟。
通过两轮PCR制备用于NGS的样品。第一轮(PCR1)用于根据靶标扩增特异性基因组区。进行第2轮PCR(PCR2)以添加因美纳公司衔接子和索引。然后将反应汇集并通过柱纯化进行纯化。使用300次循环NEXTSEQTM(因美纳公司)500/550高输出v2.5试剂盒进行测序运行。
图4示出了SH-SY5Y细胞中的测试的RNA向导的插入缺失活性。向导4示出了0.56%剪接位点基序破坏和2.0%整体编辑;超过25%的总编辑破坏了剪接位点。向导5示出了0.12%剪接位点基序破坏和1.5%整体编辑;少于10%的总编辑破坏了剪接位点。向导8示出了0.62%剪接位点基序破坏和2.4%整体编辑;超过25%的总编辑破坏了剪接位点。向导9示出了0.34%剪接位点基序破坏和3.8%整体编辑;少于10%的总编辑破坏了剪接位点。向导55示出了2.2%剪接位点基序破坏和4.9%整体编辑;超过40%的总编辑破坏了剪接位点。向导56示出了2.3%剪接位点基序破坏和4.9%整体编辑;超过45%的总编辑破坏了剪接位点。向导57示出了0%剪接位点基序破坏和1.6%整体编辑。向导58示出了0.49%剪接位点基序破坏和3.3%整体编辑;超过10%的总编辑破坏了剪接位点。
图5A是比较了分别在来自实例1和实例2的HEK293T细胞和SH-SY5Y细胞中证明的插入缺失活性(插入缺失%)的图。图5B是比较了分别在来自实例1和实例2的HEK293T细胞和SH-SY5Y细胞中证明的剪接位点基序破坏的图。如图5A所示,向导55和向导9展示了两种细胞类型中的最高插入缺失%。向导56示出了SH-SY5Y细胞中的最高插入缺失%,而HEK293T细胞中的低插入缺失%。向导55也导致两种细胞类型中的最高剪接位点基序破坏(图5B)。
因此,该实例示出了STMN2的内含子1的隐蔽剪接位点能够由多种细胞类型中的Cas12i2和多种RNA向导靶向。
其它实施例
本说明书中所公开的特征中的所有特征可以以任何组合来组合。本说明书中所公开的每个特征可以被用于相同、等效或类似目的的替代性特征替换。因此,除非另有明确说明,否则所公开的每个特征仅是通用系列的等效或类似特征的实例。
从以上描述中,本领域技术人员可以容易地确定本公开的基本特征,并且在不脱离其精神和范围的情况下,可以对本公开进行各种改变和修改以使其适应各种用途和条件。因此,其它实施例也在权利要求范围内。
等效方案
尽管本文已经描述和展示了若干个本发明实施例,但本领域的普通技术人员将容易想到用于执行本文所描述的功能和/或获得这些结果和/或这些优点中的一个或多个优点的各种其它装置和/或结构,并且此类变型和/或修改中的每个变型和/或修改被视为处于本文所描述的本发明实施例的范围内。更一般地,本领域的技术人员将容易地理解,本文所述的所有参数、尺寸、材料和构型意味着示例性的,并且实际参数、尺寸、材料和/或构型将取决于使用本发明教导所使用的一种或多种具体应用。仅使用常规实验,本领域的技术人员将认识到或能够确定本文所描述的具体本发明实施例的许多等效物。因此,应理解,前述实施例仅通过实例的方式呈现,并且在所附权利要求以及其等效物的范围内,可以以不同于具体描述的和要求保护的方式来实践本发明实施例。本公开的本发明实施例涉及本文所描述的每个单独的特征、系统、制品、材料、试剂盒和/或方法。另外,如果此类特征、系统、制品、材料、试剂盒和/或方法并不相互矛盾,则两个或更多个此类特征、系统、制品、材料、试剂盒和/或方法的任何组合包含在本公开的本发明范围内。
如本文中定义和使用的所有定义都应当理解为对字典定义的控制、通过引用并入的文件中的定义和/或定义术语的普通含义。
本文所公开的所有参考文献、专利和专利申请均通过引用关于各自所引用的主题而并入本文,在某些情况下可以涵盖整个文件。
除非明确相反地指出,否则如本文在说明书和权利要求中所使用的,不定冠词“一个(a/an)”和“一种(a/an)”应当理解为意指“至少一个(种)”。
如本文在说明书中使用的,短语“和/或”应当理解为是指这样联合的要素中的“任一个或两个”,即,要素在一些情况下共同存在而在其它情况下分开存在。用“和/或”列出的多个要素应以相同的方式解释,即“一个或多个”如此结合的要素。除了用“和/或”短语具体标识的要素,其它要素可以任选地存在,无论是与具体标识的那些要素相关还是不相关。因此,作为非限制性实例,当与如“包括(comprising)”等开放式语言结合使用时,对“A和/或B”的引用在一个实施例中可以仅指A(任选地包含除了B之外的要素);在另一个实施例中,仅指B(任选地包含除了A之外的要素);在又另一个实施例中,指A和B两者(任选地包含其它要素);等。
如本文在说明书和权利要求中所使用的,“或”应被理解为具有与如上文所定义的“和/或”相同的含义。例如,当将列表中的项目分开时,“或”或“和/或”应被解释为包容性的,即包括多个要素或要素清单中的至少一个要素、而且还包括多于一个要素,以及任选地其它未列出的项。仅相反地清楚指示的术语,如“…中的仅一个”或“…中的恰好一个”或者当在权利要求中使用时“由…组成”将指包含多个要素或要素列表中的恰好一个要素。一般而言,当之前有排他性术语,如“任一个”、“…之一”、“…中的仅一个”、或“…中的恰好一个”时,本文中使用的术语“或”应当仅被解释为指示排他性替代品(即,“一个或另一个、而不是两个”)。当在权利要求书中使用时,“主要由…组成”应当具有如在专利法领域中使用的普通含义。
如本文在说明书和权利要求中所使用的,关于一个或多个要素的列表的短语“至少一个”应被理解为意指选自要素列表中的任一个或多个要素中的至少一个要素、但不一定包含要素列表内具体列出的每一个要素中的至少一个要素,并且不排除要素列表中的要素的任何组合。此定义还允许可以任选地存在除了在短语“至少一个”所指的要素列表内具体标识的要素之外的要素,而无论与具体标识的那些要素相关还是不相关。因此,作为非限制性实例,在一个实施例中,“A和B中的至少一个”(或等效地,“A或B中的至少一个”,或等效地“A和/或B中的至少一个”)可以指任选地包含多于一个A,不存在B(并且任选地包含除了B之外的要素)的至少一个;在另一个实施例中,可以指任选地包含多于一个B,不存在A(并且任选地包含除了A之外的要素)的至少一个;在又另一个实施例中,可以指任选地包含多于一个A的至少一个,以及任选地包含多于一个B(以及任选地包含其它要素)的至少一个;等。
还应当理解,除非明确指出相反,否则在本文所要求保护的包含多于一个步骤或动作的任何方法中,所述方法的步骤或动作的顺序不一定限于叙述的方法的步骤或动作的顺序。

Claims (62)

1.一种用于对stathmin 2(STMN2)基因进行基因编辑的基因编辑系统,所述基因编辑系统包括
(i)Cas12i2多肽或编码所述Cas12i2多肽的第一核酸,其中所述Cas12i2多肽包括与SEQ ID NO:448至少95%相同的氨基酸序列,并且包括相对于SEQ ID NO:448的一个或多个突变;以及
(ii)RNA向导或编码所述RNA向导的第二核酸,其中所述RNA向导包括对STMN2基因内的靶序列具有特异性的间隔子序列,所述靶序列与包括5'-TTN-3'的基序的位于所述靶序列的5'的原间隔子相邻基序(PAM)相邻。
2.根据权利要求1所述的基因编辑系统,其中所述Cas12i2多肽中的所述一个或多个突变位于SEQ ID NO:448的位置D581、G624、F626、P868、I926、V1030、E1035和/或S1046处。
3.根据权利要求1或权利要求2所述的基因编辑系统,其中所述一个或多个突变是氨基酸取代,所述氨基酸取代任选地是D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G或其组合。
4.根据权利要求3所述的基因编辑系统,其中所述Cas12i2多肽包括:
(i)位于位置D581、D911、I926和V1030处的突变,所述突变任选地是D581R、D911R、I926R和V1030G的氨基酸取代;
(ii)位于位置D581、I926和V1030处的突变,所述突变任选地是D581R、I926R和V1030G的氨基酸取代;
(iii)位于位置D581、I926、V1030和S1046处的突变,所述突变任选地是D581R、I926R、V1030G和S1046G的氨基酸取代;
(iv)位于位置D581、G624、F626、I926、V1030、E1035和S1046处的突变,所述突变任选地是D581R、G624R、F626R、I926R、V1030G、E1035R和S1046G的氨基酸取代;或
(v)位于位置D581、G624、F626、P868、I926、V1030、E1035和S1046处的突变,所述突变任选地是D581R、G624R、F626R、P868T、I926R、V1030G、E1035R和S1046G的氨基酸取代。
5.根据权利要求1所述的基因编辑系统,其中所述Cas12i2多肽包括SEQ ID NO:449、450、451、452或453的氨基酸序列,任选地其中所述Cas12i2多肽包括SEQ ID NO:450或453的氨基酸序列。
6.根据权利要求1至5中任一项所述的基因编辑系统,其包括编码所述Cas12i2多肽的所述第一核酸。
7.根据权利要求6所述的基因编辑系统,其中所述第一核酸是信使RNA(mRNA)。
8.根据权利要求6所述的基因编辑系统,其中所述第一核酸包含在病毒载体中,所述病毒载体任选地是腺相关病毒(AAV)载体。
9.根据权利要求1至8中任一项所述的基因编辑系统,其中所述靶序列在所述STMN2基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或内含子内。
10.根据权利要求1至9中任一项所述的基因编辑系统,其中所述RNA向导包括SEQ IDNO:4508、4512、4559和4561中的任一者的序列,或者所述第二核酸编码包括SEQ ID NO:4508、4512、4559和4561中的任一者的RNA向导。
11.根据权利要求1至9中任一项所述的基因编辑系统,其中所述RNA向导包括SEQ IDNO:4505、4506、4507、4508、4509、4510、4511、4512、4513、4514、4515、4554、4555、4556、4557、4558、4559、4560、4561和4562中的任一者的序列,或者所述第二核酸编码包括SEQ IDNO:4505、4506、4507、4508、4509、4510、4511、4512、4513、4514、4515、4554、4555、4556、4557、4558、4559、4560、4561和4562中的任一者的RNA向导。
12.根据权利要求1至11中任一项所述的基因编辑系统,其中所述间隔子序列的长度为20-30个核苷酸,任选地其中所述间隔子序列的长度为20个核苷酸。
13.根据权利要求1至12中任一项所述的基因编辑系统,其中所述RNA向导包括所述间隔子序列和直接重复序列。
14.根据权利要求13所述的基因编辑系统,其中所述直接重复序列的长度为23-36个核苷酸。
15.根据权利要求14所述的基因编辑系统,其中所述直接重复序列与SEQ ID NO:1-10中的任一者或其长度为至少23个核苷酸的片段至少90%相同。
16.根据权利要求15所述的基因编辑系统,其中所述直接重复序列是SEQ ID NO:1-10中的任一者或其长度为至少23个核苷酸的片段。
17.根据权利要求16所述的基因编辑系统,其中所述直接重复序列是5'-AGAAAUCCGUCUUUCAUUGACGG-3'(SEQ ID NO:10)。
18.根据权利要求1至17中任一项所述的基因编辑系统,其中所述系统包括编码所述RNA向导的所述第二核酸。
19.根据权利要求18所述的基因编辑系统,其中编码所述RNA向导的所述第二核酸位于病毒载体中。
20.根据权利要求8至19中任一项所述的基因编辑系统,其中所述病毒载体包括编码所述Cas12i2多肽的所述第一核酸和编码所述RNA向导的所述第二核酸两者。
21.根据权利要求1至19中任一项所述的基因编辑系统,其中所述系统包括位于第一载体上的编码所述Cas12i2多肽的所述第一核酸,并且其中所述系统包括位于第二载体上的编码所述RNA向导的所述第二核酸。
22.根据权利要求21所述的基因编辑系统,其中所述第一载体和所述第二载体是相同的载体。
23.根据权利要求1至22中任一项所述的基因编辑系统,其中所述系统包括涵盖(i)、(ii)或两者的一个或多个脂质纳米颗粒(LNP)。
24.根据权利要求23所述的基因编辑系统,其中所述系统包括涵盖(i)的所述LNP,并且其中所述系统包括包含编码所述RNA向导的所述第二核酸的病毒载体;任选地其中所述病毒载体是AAV载体。
25.根据权利要求23所述的基因编辑系统,其中所述系统包括涵盖(ii)的所述LNP,并且其中所述系统包括包含编码Cas12i2多肽的所述第一核酸的病毒载体;任选地其中所述病毒载体是AAV载体。
26.一种用于对stathmin 2(STMN2)基因进行基因编辑的基因编辑系统,所述基因编辑系统包括
(i)Cas12i多肽或编码所述Cas12i多肽的第一核酸,任选地其中所述Cas12i多肽是Cas12i2多肽;以及
(ii)RNA向导或编码所述RNA向导的第二核酸,其中所述RNA向导包括对STMN2基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或内含子内的靶序列具有特异性的间隔子序列,所述靶序列与包括5'-TTN-3'的基序的位于所述靶序列的5'的原间隔子相邻基序(PAM)相邻。
27.根据26所述的基因编辑系统,其中所述RNA向导包括SEQ ID NO:4508、4512、4559和4561中的任一者的序列,或者所述第二核酸编码包括SEQ ID NO:4508、4512、4559和4561中的任一者的RNA向导。
28.根据权利要求26所述的基因编辑系统,其中所述RNA向导包括SEQ ID NO:4505、4506、4507、4508、4509、4510、4511、4512、4513、4514、4515、4554、4555、4556、4557、4558、4559、4560、4561和4562中的任一者的序列,或者所述第二核酸编码包括SEQ ID NO:4505、4506、4507、4508、4509、4510、4511、4512、4513、4514、4515、4554、4555、4556、4557、4558、4559、4560、4561和4562中的任一者的RNA向导。
29.根据权利要求26至28中任一项所述的基因编辑系统,其包括编码所述Cas12i多肽的所述第一核酸。
30.根据权利要求29所述的基因编辑系统,其中所述第一核酸是信使RNA(mRNA)。
31.根据权利要求29所述的基因编辑系统,其中所述第一核酸包含在病毒载体中,所述病毒载体任选地是腺相关病毒(AAV)载体。
32.根据权利要求26至31中任一项所述的基因编辑系统,其中所述间隔子序列的长度为20-30个核苷酸,任选地其中所述间隔子序列的长度为20个核苷酸。
33.根据权利要求26至32中任一项所述的基因编辑系统,其中所述RNA向导包括所述间隔子序列和直接重复序列。
34.根据权利要求33所述的基因编辑系统,其中所述直接重复序列的长度为23-36个核苷酸。
35.根据权利要求34所述的基因编辑系统,其中所述直接重复序列与SEQ ID NO:1-10中的任一者或其长度为至少23个核苷酸的片段至少90%相同。
36.根据权利要求35所述的基因编辑系统,其中所述直接重复序列是SEQ ID NO:1-10中的任一者或其长度为至少23个核苷酸的片段。
37.根据权利要求36所述的基因编辑系统,其中所述直接重复序列是5'-AGAAAUCCGUCUUUCAUUGACGG-3'(SEQ ID NO:10)。
38.根据权利要求26至37中任一项所述的基因编辑系统,其中所述系统包括编码所述RNA向导的所述第二核酸。
39.根据权利要求38所述的基因编辑系统,其中编码所述RNA向导的所述第二核酸位于病毒载体中。
40.根据权利要求31至39中任一项所述的基因编辑系统,其中所述病毒载体包括编码所述Cas12i多肽的所述第一核酸和编码所述RNA向导的所述第二核酸两者。
41.根据权利要求26至40中任一项所述的基因编辑系统,其中所述系统包括位于第一载体上的编码所述Cas12i多肽的所述第一核酸,并且其中所述系统包括位于第二载体上的编码所述RNA向导的所述第二核酸。
42.根据权利要求26至41中任一项所述的基因编辑系统,其中所述系统包括涵盖(i)、(ii)或两者的一个或多个脂质纳米颗粒(LNP)。
43.根据权利要求42所述的基因编辑系统,其中所述系统包括涵盖(i)的所述LNP,并且其中所述系统包括包含编码所述RNA向导的所述第二核酸的病毒载体;任选地其中所述病毒载体是AAV载体。
44.根据权利要求42所述的基因编辑系统,其中所述系统包括涵盖(ii)的所述LNP,并且其中所述系统包括包含编码Cas12i多肽的所述第一核酸的病毒载体;任选地其中所述病毒载体是AAV载体。
45.一种药物组合物,其包括根据权利要求1至44中任一项所述的基因编辑系统。
46.一种试剂盒,其包括根据权利要求1至44中任一项所述的基因编辑系统的要素(i)和(ii)。
47.一种用于编辑细胞中的stathmin 2(STMN2)基因的方法,所述方法包括使宿主细胞与根据权利要求1至44中任一项所述的用于编辑所述STMN2基因的基因编辑系统接触,以对所述宿主细胞中的所述STMN2基因进行基因编辑。
48.根据权利要求47所述的方法,其中所述宿主细胞在体外培养。
49.根据权利要求47所述的方法,其中接触步骤是通过向包括所述宿主细胞的受试者施用所述用于编辑所述STMN2基因的基因编辑系统来进行的。
50.一种细胞,其包括破坏的stathmin 2(STMN2)基因,其中所述细胞任选地通过使宿主细胞与根据权利要求1至44中任一项所述的基因编辑系统接触以对所述宿主细胞中的所述STMN2基因进行基因编辑,由此破坏所述STMN2基因来产生。
51.一种用于治疗受试者的神经退行性疾病的方法,所述方法包括向有需要的受试者施用根据权利要求1至44中任一项所述的用于编辑stathmin 2(STMN2)基因的基因编辑系统或根据权利要求50所述的细胞。
52.根据权利要求51所述的方法,其中所述受试者是患有所述神经退行性疾病的人类患者,所述神经退行性疾病任选地是肌萎缩性侧索硬化症(ALS)。
53.根据权利要求51所述的方法,其中所述受试者是患有所述神经退行性疾病的人类患者,所述神经退行性疾病任选地是额颞叶痴呆(FTD)。
54.一种RNA向导,其包括:(i)对stathmin 2(STMN2)基因中的靶序列具有特异性的间隔子序列,其中所述靶序列与包括5'-TTN-3'的基序的位于所述靶序列的5'的原间隔子相邻基序(PAM)相邻;以及(ii)直接重复序列。
55.根据权利要求54所述的RNA向导,其中所述间隔子序列的长度为20-30个核苷酸,任选地长度为20个核苷酸。
56.根据权利要求54或权利要求55所述的RNA向导,其中所述直接重复序列的长度为23-36个核苷酸,任选地长度为23个核苷酸。
57.根据权利要求54至56中任一项所述的RNA向导,其中所述靶序列在所述STMN2基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或内含子内。
58.根据权利要求54至57中任一项所述的RNA向导,其中所述RNA向导包括SEQ ID NO:4508、4512、4559和4561中的任一者的序列。
59.根据权利要求54至57中任一项所述的RNA向导,其中所述RNA向导包括SEQ ID NO:4505、4506、4507、4508、4509、4510、4511、4512、4513、4514、4515、4554、4555、4556、4557、4558、4559、4560、4561和4562中的任一者的序列。
60.根据权利要求54至59中任一项所述的RNA向导,其中所述直接重复序列与SEQ IDNO:1-10中的任一者或其长度为至少23个核苷酸的片段至少90%相同。
61.根据权利要求60所述的RNA向导,其中所述直接重复序列是SEQ ID NO:1-10中的任一者或其长度为至少23个核苷酸的片段。
62.根据权利要求61所述的RNA向导,其中所述直接重复序列是5'-AGAAAUCCGUCUUUCAUUGACGG-3'(SEQ ID NO:10)。
CN202280056404.5A 2021-08-11 2022-08-11 包括靶向stathmin 2(stmn2)的rna向导的基因编辑系统和其用途 Pending CN117813382A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US63/231,784 2021-08-11
US202263322002P 2022-03-21 2022-03-21
US63/322,002 2022-03-21
PCT/US2022/040042 WO2023018858A1 (en) 2021-08-11 2022-08-11 Gene editing systems comprising an rna guide targeting stathmin 2 (stmn2) and uses thereof

Publications (1)

Publication Number Publication Date
CN117813382A true CN117813382A (zh) 2024-04-02

Family

ID=90423819

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280056404.5A Pending CN117813382A (zh) 2021-08-11 2022-08-11 包括靶向stathmin 2(stmn2)的rna向导的基因编辑系统和其用途

Country Status (1)

Country Link
CN (1) CN117813382A (zh)

Similar Documents

Publication Publication Date Title
US20220396782A1 (en) Gene editing systems comprising an rna guide targeting transthyretin (ttr) and uses thereof
US20230203539A1 (en) Gene editing systems comprising an rna guide targeting stathmin 2 (stmn2) and uses thereof
US20230407343A1 (en) Compositions comprising an rna guide targeting pdcd1 and uses thereof
CN117813382A (zh) 包括靶向stathmin 2(stmn2)的rna向导的基因编辑系统和其用途
US11821012B2 (en) Gene editing systems comprising an RNA guide targeting hydroxyacid oxidase 1 (HAO1) and uses thereof
US11939607B2 (en) Gene editing systems comprising an RNA guide targeting lactate dehydrogenase a (LDHA) and uses thereof
US20230399639A1 (en) Compositions comprising an rna guide targeting b2m and uses thereof
WO2023018856A1 (en) Gene editing systems comprising an rna guide targeting polypyrimidine tract binding protein 1 (ptbp1) and uses thereof
WO2023081377A2 (en) Compositions comprising an rna guide targeting ciita and uses thereof
WO2023137451A1 (en) Compositions comprising an rna guide targeting cd38 and uses thereof
CN117897485A (zh) 包括靶向羟基酸氧化酶1(hao1)的rna向导的基因编辑系统和其用途
AU2021368740A1 (en) Compositions comprising an rna guide targeting trac and uses thereof
WO2022140340A1 (en) Compositions comprising an rna guide targeting dmd and uses thereof
JP2023549080A (ja) Bcl11aを標的とするrnaガイドを含む組成物及びその使用
WO2022140343A1 (en) Compositions comprising an rna guide targeting dmpk and uses thereof
WO2023122433A1 (en) Gene editing systems targeting hydroxyacid oxidase 1 (hao1) and lactate dehydrogenase a (ldha)
CN116648505A (zh) 包含靶向b2m的rna指导物的组合物及其用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication