CN118043465A

CN118043465A - 用于使用具有化学修饰的指导rna的方法

Info

Publication number: CN118043465A
Application number: CN202280062377.2A
Authority: CN
Inventors: D·E·赖安; D·J·戴林格; R·凯撒
Original assignee: Agilent Technologies Inc
Current assignee: Agilent Technologies Inc
Priority date: 2021-09-14
Filing date: 2022-09-14
Publication date: 2024-05-14

Abstract

本文提供了用于使用掺入一个或多个经化学修饰的核苷酸的经修饰的指导RNA(gRNA)在体外或在细胞中诱导靶核酸(例如，靶DNA或靶RNA)的基于CRISPR/Cas的编辑或靶核酸表达的调节的组合物和方法。在一些方面，这些经修饰的gRNA在挑战性条件下提供优异性能。

Description

用于使用具有化学修饰的指导RNA的方法

相关申请的交叉引用

本申请要求2021年9月14日提交的美国临时申请号63/243,985和2022年5月9日提交的63/339,737的优先权权益，将其各自的全部内容通过引用以其整体并入本文。

技术领域

本公开文本涉及分子生物学的技术领域。特别地，本公开文本涉及规律间隔成簇短回文重复序列(CRISPR)技术。

背景技术

天然原核CRISPR-Cas系统包含具有恒定长度的间插可变序列的短重复序列阵列(即，规律间隔成簇短回文重复序列或“CRISPR”)和CRISPR相关(“Cas”)蛋白。经转录的CRISPR阵列的RNA被Cas蛋白的子集加工成小指导RNA，其通常具有如下所述的两个组分。至少有六种不同的系统：I型、II型、III型、IV型、V型和VI型。在这六种系统中，参与将RNA加工成成熟crRNA的酶是不同的。在天然原核II型系统中，指导RNA(“gRNA”)包含两个短的非编码RNA区段，称为CRISPR RNA(“crRNA”)和反式作用RNA(“tracrRNA”)。在天然V型系统中，指导RNA包含足以与Cas12(例如，Cas12a也称为Cpf1)蛋白形成活性复合物的crRNA，而不具有tracrRNA区段。gRNA与Cas蛋白形成复合物(核糖核蛋白“RNP”复合物)。gRNA:Cas蛋白复合物结合具有原型间隔子邻近基序(“PAM”)和包含与gRNA的一部分互补的序列的原型间隔子的靶多核苷酸序列。gRNA:Cas蛋白复合物对靶多核苷酸的识别和结合诱导靶多核苷酸的切割。天然CRISPR-Cas系统在原核生物中起免疫系统的作用，其中gRNA:Cas蛋白复合物以类似于真核生物中的RNAi的方式识别外源遗传元件并使其沉默，从而赋予对外源遗传元件(如质粒和噬菌体)的抗性。

已经开发并且将继续开发CRISPR技术的许多增强和改进版本。早期方法包括使用CRISPR-Cas系统切割靶DNA的两条链，并且通过由于双链断裂而发生的同源重组或非同源末端连接进行编辑。较新的技术包括调节基因表达和其他基因编辑方法。例如，先导编辑是一种用于编辑DNA中的靶向序列的基于CRISPR的技术，并且它允许各种形式的碱基取代(如颠换和转换突变)。它还允许精确的插入和缺失(包括长达约700bp的大缺失)。值得注意的是，先导编辑不需要外源DNA修复模板。而是在指导RNA中包括含有所需编辑的聚合模板，所述指导RNA与和聚合酶(如逆转录酶)融合的Cas蛋白复合。在结合靶位点后，Cas蛋白使靶位点产生切口，并且聚合酶可以使用聚合模板合成新的DNA链。碱基编辑是另一种基因编辑技术，其中碱基编辑器酶(如胞苷脱氨酶)与Cas蛋白和指导RNA一起递送。碱基编辑器酶通过gRNA:Cas蛋白复合物被引导至靶位点，并催化靶位点处的胞苷残基的脱氨并因此催化突变。可以例如通过将转录激活物或抑制剂与Cas蛋白融合来实现基因表达的调节，所述Cas蛋白不具有切割活性但可以与gRNA复合以结合靶位点。因此，转录激活物或抑制剂可以调节靶位点处的基因表达。因此，所述技术分别称为CRISPRa和CRISPRi，其中“a”代表激活，并且“i”代表抑制。

尽管有这些进展，但本领域仍需要进一步改进CRISPR技术，特别是改进基于CRISPR的系统的效率和稳定性，例如以支持采用基于CRISPR的基因编辑或调节。

附图说明

图1是显示逐步调整(titration)研究的结果的图，其中将渐增量的gRNA与固定量的Cas9蛋白混合以转染到20万个HepG2细胞中，在这些细胞中靶向HBB基因以在靶位点产生插入缺失(indel)。这些结果说明了用于编辑的转染组分的饱和量的概念，其中渐增量达到编辑活性的平台期，并且量的进一步增加不会增加恒定数量的细胞中的编辑产率。

图2是显示在用PBS缓冲液洗涤细胞以去除残留血清后用亚饱和量的Cas mRNA和gRNA(对于20万个细胞，0.0625pmol Cas9 mRNA和10pmol gRNA)转染的HepG2细胞中HBB的中靶和脱靶编辑的图。

图3是显示在用PBS缓冲液洗涤细胞以去除残留血清后用亚饱和量的Cas mRNA和gRNA(对于20万个细胞，0.0625pmol Cas9 mRNA和10pmol gRNA)转染的HepG2细胞中HBB的中靶和脱靶编辑的图。

图4是显示当在转染前不用缓冲液洗涤细胞以去除残留血清时用亚饱和量的CasmRNA和gRNA(对于20万个细胞，0.5pmol Cas9 mRNA和30pmol gRNA)转染的HepG2细胞中HBB的中靶和脱靶编辑的图。

图5是显示当在转染前不用缓冲液洗涤细胞以去除血清时用亚饱和量的Cas蛋白和gRNA(对于20万个细胞，12.5pmol Cas9蛋白和30pmol sgRNA)转染的HepG2细胞中HBB的中靶和脱靶编辑的图。

图6展示了两个示例性的gRNA，其在5'和3'端处掺入3xMS(上)，或在5'端处掺入3xMS并且在3'端处掺入3xMP(下)。

图7是显示评价K562细胞中经化学修饰的gRNA随时间的相对水平的实验的结果的图。在用PBS缓冲液洗涤细胞以去除残留血清后，在不存在Cas蛋白的情况下用gRNA转染细胞。

图8是显示在用PBS缓冲液洗涤细胞以去除残留血清后用亚饱和量的Cas9 mRNA和gRNA(对于20万个细胞，0.0625pmol Cas9 mRNA和5pmol sgRNA)转染的原代人T细胞中HBB的中靶和脱靶编辑的图。

图9是显示相对于使用未修饰的gRNA的对照使用在3'端具有MS或MP的经化学修饰的gRNA在K562细胞中HBB的胞苷碱基编辑的结果的图。用gRNA和编码与胞苷脱氨酶融合的Cas9切口酶的mRNA共转染细胞。

图10是描绘使用示例性CRISPR-Cas系统进行先导编辑的示意图。

图11是显示使用初始的一组经化学修饰的pegRNA对K562细胞中的EMX1进行先导编辑的有效性的图。用pegRNA和编码与逆转录酶融合的Cas9切口酶的mRNA共转染细胞。

图12是显示使用初始的一组经化学修饰的pegRNA对Jurkat细胞中的EMX1进行先导编辑的有效性的图。用pegRNA和编码与逆转录酶融合的Cas9切口酶的mRNA共转染细胞。

图13是显示使用第二组经化学修饰的pegRNA对K562细胞中的EMX1进行先导编辑的有效性的图。用pegRNA和编码与逆转录酶融合的Cas9切口酶的mRNA共转染细胞。

图14是显示使用第二组经化学修饰的pegRNA对Jurkat细胞中的EMX1进行先导编辑的有效性的图。用pegRNA和编码与逆转录酶融合的Cas9切口酶的mRNA共转染细胞。

图15是显示使用初始的一组经化学修饰的pegRNA对K562细胞中的RUNX1进行先导编辑的有效性的图。用pegRNA和编码与逆转录酶融合的Cas9切口酶的mRNA共转染细胞。

图16是显示使用初始的一组经化学修饰的pegRNA对Jurkat细胞中的RUNX1进行先导编辑的有效性的图。用pegRNA和编码与逆转录酶融合的Cas9切口酶的mRNA共转染细胞。

图17展示了可以掺入本文公开的pegRNA中的经化学修饰的核苷酸的两个例子：2'-O-甲基-3'-硫代磷酸酯(MS)和2'-O-甲基-3'-膦酰基乙酸酯(MP)的化学结构。

图18展示了使用示例性靶序列对EMX1和RUNX1进行的先导编辑。

图19是显示如下实验的结果的图，所述实验评估在K562细胞中EMX1的先导编辑。在这种情况下，先导编辑用于在EMX1中敲除PAM。用pegRNA和编码与逆转录酶融合的Cas9切口酶的mRNA共转染细胞。

图20是显示如下实验的结果的图，所述实验评估在Jurkat细胞中EMX1的先导编辑。在这种情况下，先导编辑用于在EMX1中敲除PAM。用pegRNA和编码与逆转录酶融合的Cas9切口酶的mRNA共转染细胞。

图21是显示如下实验的结果的图，所述实验评估在K562细胞中RUNX1的先导编辑。在这种情况下，先导编辑用于在RUNX1中引入三碱基的插入。用pegRNA和编码与逆转录酶融合的Cas9切口酶的mRNA共转染细胞。

图22是显示如下实验的结果的图，所述实验评估在Jurkat细胞中RUNX1的先导编辑。在这种情况下，先导编辑用于在RUNX1中引入三碱基的插入。用pegRNA和编码与逆转录酶融合的Cas9切口酶的mRNA共转染细胞。

图23是显示如下实验的结果的图，所述实验评估在用sgRNA和编码Cas9蛋白的mRNA共转染的未冲洗的HepG2细胞中HBB镰状细胞等位基因(和已知的基因间脱靶基因座)的编辑。

图24是显示如下实验的结果的图，所述实验评估在用由与Cas9蛋白预复合的经化学修饰的sgRNA形成的核糖核蛋白(RNP)复合物转染的未冲洗的HepG2细胞中HBB镰状细胞等位基因(和已知的基因间脱靶基因座)的编辑。

图25是显示如下实验的结果的图，所述实验评估在用由与Cas9蛋白预复合的经化学修饰的163聚体sgRNA形成的核糖核蛋白(RNP)复合物转染的未冲洗的HepG2细胞中HBB镰状细胞等位基因(和已知的基因间脱靶基因座)的编辑。163聚体sgRNA被设计用于CRISPRaSAM系统，但与SpCas9蛋白一起使用以产生插入缺失，而不是将它们用于通过CRISPRa的基因激活。

具体实施方式

本文提供了用于在细胞(例如，用于在离体疗法中使用的原代细胞)或体内细胞(例如，受试者如人的器官或组织中的细胞)中的基于CRISPR/Cas的基因组编辑和/或基因表达的调节的方法。特别地，本文提供的方法利用经化学修饰的指导RNA(gRNA)，所述经化学修饰的指导RNA(gRNA)与对应的未修饰的gRNA相比在基因编辑或调节中具有增强的活性或产率。在一些方面，本公开文本提供了用于通过引入与靶核酸杂交的经化学修饰的gRNA连同Cas蛋白、编码Cas蛋白的mRNA、或包含编码Cas蛋白的核苷酸序列的重组表达载体在细胞中编辑靶核酸的序列或调节靶核酸的表达的方法。在一些方面，Cas蛋白可以是缺乏核酸酶活性(例如，dCas9)或具有切口酶活性的变体。在一些方面，Cas蛋白是包含Cas多肽和逆转录酶多肽的融合蛋白。在一些方面，本公开文本提供了用于通过施用足够量的经化学修饰的gRNA以校正与遗传疾病相关的遗传突变(例如，通过编辑患者的基因组DNA或通过调节与所述疾病相关的基因的表达)来预防或治疗受试者的所述疾病的方法。

本公开文本的方面采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术，这些常规技术在本领域的技术范围内。参见Sambrook、Fritsch和Maniatis,Molecular Cloning:A Laboratory Manual,第2版(1989),CurrentProtocols in Molecular Biology(F.M.Ausubel等人编辑,(1987))，系列出版物Methodsin Enzymology(Academic Press,Inc.):PCR 2:A Practical Approach(M.J.MacPherson、B.D.Hames和G.R.Taylor编辑(1995))，Harlow和Lane编辑(1988)Antibodies,ALaboratory Manual,and Animal Cell Culture(R.I.Freshney编辑(1987))。

不可商购的寡核苷酸可以化学合成，例如根据Beaucage和Caruthers,Tetrahedron Lett.22:1859-1862(1981)首先描述的固相亚磷酰胺三酯方法，如VanDevanter等人,Nucleic Acids Res.12:6159-6168(1984)中所述使用自动化合成仪来合成。使用任何本领域认可的策略进行寡核苷酸的纯化，所述策略例如，如Pearson和Reanier,J.Chrom.255:137-149(1983)中所述的天然丙烯酰胺凝胶电泳或阴离子交换高效液相色谱法(HPLC)。

定义和缩写

除非另外明确指示，否则本文所使用的所有技术和科学术语均具有如本领域普通技术人员通常所理解的相同含义。此外，与本文所述的方法或材料类似或等效的任何方法或材料可以用于实施本文所述的方法和制备本文所述的组合物。出于本公开文本的目的，定义以下术语。

如本文所用，术语“一个/一种(a)”、“一个/一种(an)”或“所述”不仅包括具有一个成员的方面，而且包括具有多于一个成员的方面。例如，除非上下文另外明确指出，否则单数形式“一个/一种(a)”、“一个/一种(an)”和“所述”包括复数指示物。因此，例如，对“一个/一种细胞”的提及包括多个/多种此类细胞，并且对“所述药剂”的提及包括对一个/一种或多个/多种本领域技术人员已知的药剂的提及，等等。

术语“CRISPR相关蛋白”或“Cas蛋白”或“Cas多肽”是指野生型Cas蛋白、其片段或其突变体或变体。术语“Cas突变体”或“Cas变体”是指野生型Cas蛋白的蛋白质或多肽衍生物，例如具有一个或多个点突变、插入、缺失、截短的蛋白质、融合蛋白或其组合。在某些实施方案中，“Cas突变体”或“Cas变体”基本上保留Cas蛋白的核酸酶活性。在某些实施方案中，“Cas突变体”或“Cas变体”突变，使得一个或两个核酸酶结构域无活性(此蛋白可分别称为Cas切口酶或死Cas蛋白)。在某些实施方案中，“Cas突变体”或“Cas变体”具有核酸酶活性。在某些实施方案中，“Cas突变体”或“Cas变体”缺乏其野生型对应物的一些或全部核酸酶活性。术语“CRISPR相关蛋白”或“Cas蛋白”还包括各种原核生物物种的野生型Cpf1蛋白(也称为Cas12a)(并且以来自普雷沃氏菌属和弗朗西斯氏菌属的规律间隔成簇短回文重复序列1核糖核蛋白或CRISPR/Cpf1核糖核蛋白命名)、其片段、或其突变体或变体。Cas蛋白包括任何CRISPR相关蛋白，包括但不限于六种不同CRISPR系统中的任何一种：I型、II型、III型、IV型、V型和VI型。

术语Cas蛋白的“核酸酶结构域”是指蛋白质内的具有用于DNA切割的催化活性的多肽序列或结构域。Cas9通常催化PAM序列上游的双链断裂。核酸酶结构域可以包含在单个多肽链中，或者切割活性可以由两个(或更多个)多肽的缔合产生。单个核酸酶结构域可以由给定多肽内的多于一个分离的氨基酸段组成。这些结构域的例子包括RuvC样基序(SEQID NO:1中的氨基酸7-22、759-766和982-989)和HNH基序(氨基酸837-863)；参见Gasiunas等人(2012)Proc.Natl.Acad.Sci.USA 109:39,E2579-E2586和WO/2013176772。

具有“gRNA功能性(functionality)”的合成指导RNA(“gRNA”)是具有天然存在的指导RNA的一种或多种功能的RNA，所述功能例如与Cas蛋白缔合以形成核糖核蛋白(RNP)复合物或由与Cas蛋白缔合的指导RNA执行的功能(即，RNP复合物的功能)。在某些实施方案中，功能性包括结合靶多核苷酸。在某些实施方案中，功能性包括将Cas蛋白或gRNA:Cas蛋白复合物靶向靶多核苷酸。在某些实施方案中，功能性包括使靶多核苷酸产生切口。在某些实施方案中，功能性包括切割靶多核苷酸。在某些实施方案中，功能性包括与Cas蛋白缔合或结合。例如，可以将Cas蛋白工程化为与一种或多种蛋白质或其部分(如转录因子增强子或阻遏物、脱氨酶蛋白、逆转录酶、聚合酶等)融合的“死”Cas蛋白(dCas)，使得一种或多种融合蛋白或其一个或多个部分可以在靶位点发挥其功能。在某些实施方案中，功能性包括碱基编辑功能性。在其他实施方案中，功能性包括先导编辑功能性。在某些实施方案中，功能性包括基因表达的激活、阻遏或干扰。在其他实施方案中，功能性包括表观遗传修饰。在某些实施方案中，功能性是具有Cas蛋白的CRISPR-Cas系统(包括具有工程化Cas蛋白的人工CRISPR-Cas系统)中指导RNA的任何其他已知功能。在某些实施方案中，功能性是天然指导RNA的任何其他功能。合成指导RNA可以具有比天然存在的指导RNA更大或更小程度的gRNA功能性。在某些实施方案中，与相似的天然存在的指导RNA相比，合成指导RNA可以具有关于一种功能的更大活性和关于另一种功能的更小活性。

具有单链“切口”活性的Cas蛋白是指与野生型Cas蛋白相比具有降低的切割dsDNA的两条链之一的能力的Cas蛋白(包括Cas突变体或Cas变体)。例如，在某些实施方案中，具有单链切口活性的Cas蛋白具有降低RuvC结构域(或HNH结构域)的功能并因此降低切割靶DNA的一条链的能力的突变(例如，氨基酸取代)。此类变体的例子包括酿脓链球菌(S.pyogenes)Cas9中的D10A、H839A/H840A和/或N863A取代，并且还包括在其他物种的Cas9酶中的等效位点处的相同或相似取代。

具有“结合”活性或“结合”靶多核苷酸的Cas蛋白是指与指导RNA形成复合物的Cas蛋白，并且当在这种复合物中时，指导RNA与另一个多核苷酸(如靶多核苷酸序列)经由指导RNA与另一个多核苷酸的碱基之间的氢键合形成碱基对来杂交。氢键合可以通过沃森-克里克碱基配对或以任何其他序列特异性方式形成。杂交体可以包含形成双链体的两条链、形成多链三链体的三条或更多条链、或这些的任何组合。

“CRISPR系统”是利用至少一种Cas蛋白和至少一种gRNA来提供功能或效应的系统，所述功能或效应包括但不限于基因编辑、DNA切割、DNA切口、DNA结合、基因表达调节、CRISPR激活(CRISPRa)、CRISPR干扰(CRISPRi)、以及可以通过将Cas蛋白与另一效应物连接从而在由Cas蛋白识别的靶序列上实现效应子功能而实现的任何其他功能。例如，可以将无核酸酶的Cas蛋白与转录因子、脱氨酶、甲基化酶、逆转录酶等融合。在针对靶标的指导RNA的存在下，可以将所得的融合蛋白用于编辑靶标、调节靶标的转录、使靶标脱氨或甲基化。作为另一个例子，在先导编辑中，将Cas蛋白与逆转录酶或其他聚合酶一起使用(任选地作为融合蛋白)，以在pegRNA的存在下编辑靶核酸。

“融合蛋白”是包含彼此共价连接的至少两个肽序列(即，氨基酸序列)的蛋白质，其中两个肽序列在自然界中不是共价连接的。两个肽序列可以直接(其间具有键)或间接(其间具有接头，其中接头可以包含任何化学结构，包括但不限于第三肽序列)连接。

“先导编辑器”是具有Cas蛋白活性和逆转录酶活性二者的分子或多个分子的集合。在一些实施方案中，Cas蛋白是切口酶。在一些实施方案中，先导编辑器是包含Cas蛋白和逆转录酶二者的融合蛋白。如本公开文本中其他地方所指示的，其他聚合酶可以代替逆转录酶用于先导编辑，因此先导编辑器可以包含不是逆转录酶的聚合酶来替代RT。已经开发了不同形式的先导编辑器，并且它们被称为PE1、PE2、PE3等。例如，“PE2”是指包含融合蛋白(PE2蛋白)和所需的pegRNA的PE复合物，所述融合蛋白包含Cas9(H840A)切口酶和具有以下结构的MMLV RT的变体：

[NLS]-[Cas9(H840A)]-[接头]-[MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)]。

“PE3”是指PE2加第二链切口指导RNA，其与PE2蛋白复合并在未编辑的DNA链中引入切口，以刺激细胞修复靶区域，这有助于将编辑掺入基因组(参见Anzalone等人2019；参见Liu WO 2020191153)。先导编辑器使用专门的gRNA(称为先导编辑gRNA或“pegRNA”)，如本公开文本中其他地方所详细描述的。

“碱基编辑器”或“BE”是具有Cas蛋白(或突变蛋白)活性和脱氨酶或转糖基化活性二者的分子或多个分子的集合。碱基编辑器(BE)通常是Cas结构域和核苷酸修饰结构域(例如，天然或进化的脱氨酶，如胞苷脱氨酶，例如APOBEC1(“载脂蛋白B mRNA编辑酶，催化多肽1”)、CDA(“胞苷脱氨酶”)和AID(“激活诱导的胞苷脱氨酶”)，或腺苷脱氨酶，例如TadA(细菌tRNA特异性腺苷脱氨酶))的融合物。迄今为止，一般描述了两类脱氨酶碱基编辑器：将靶C:G碱基对转化为T:A碱基对的胞嘧啶碱基编辑器(“CBE”)，以及将A:T碱基对转化为G:C碱基对的腺苷碱基编辑器(“ABE”)。总的来说，这两类碱基编辑器能够实现靶向安装所有可能的转换突变(C至T、G至A、A至G、T至C、C至U和A至U)，参见Gaudelli,N.M.等人,Programmablebase editing of A:T to G:C in genomic DNA without DNA cleavage.Nature 551,464-471(2017)，将其通过引用并入本文。在碱基编辑中使用的另一个核苷酸修饰结构域是转糖基化酶结构域，如野生型tRNA鸟嘌呤转糖基化酶(TGT)或其变体，例如在核糖-核碱基糖苷键处将第一核碱基(即，胸腺嘧啶)取代为第二核碱基的TGT。转糖基化酶编辑器提供胸腺嘧啶至鸟嘌呤或“TGBE”(或腺嘌呤至胞嘧啶或“ACBE”)颠换碱基编辑器。在一些情况下，碱基编辑器还可以包含改变细胞DNA修复过程以增加所得单核苷酸变化的效率和/或稳定性的蛋白质或结构域。在一些实施方案中，碱基编辑器包含一个或多个NLS(核定位序列)，并且可以进一步包含一个或多个尿嘧啶-DNA糖基化酶抑制剂(UGI)结构域，其能够抑制尿嘧啶-DNA糖基化酶，从而改进C至T碱基编辑器蛋白的碱基编辑效率。在一些实施方案中，Cas结构域是切口酶(例如，nCas9)。在一些实施方案中，Cas蛋白是完全核酸酶失活的蛋白质或死Cas9“dCas9”。在一些实施方案中，碱基编辑器是包含Cas蛋白(或其部分)和脱氨酶(或其部分)二者的融合蛋白。在一些实施方案中，碱基编辑器是包含Cas蛋白(或其部分)和转糖基化酶(或其部分)二者的融合蛋白。已经开发了代表相对于先前系统有所改进的不同形式的碱基编辑器，如具有不同或扩展的PAM兼容性的碱基编辑器(参见：Kim,Y.B.等人Increasing the genome-targeting scope and precision of base editing withengineered Cas9-cytidine deaminase fusions.Nature biotechnology 35,371-376(2017)；Hu,J.H.等人Evolved Cas9 variants with broad PAM compatibility and highDNA specificity.Nature 556,57-63(2018)；Li,X.等人Base editing with a Cpf1-cytidine deaminase fusion.Nature biotechnology 36,324-327(2018))、具有降低的脱靶活性的高保真碱基编辑器(参见：Hu,J.H.等人Evolved Cas9 variants with broad PAMcompatibility and high DNA specificity.Nature 556,57-63(2018)；Rees,H.A.等人Improving the DNA specificity and applicability of base editing throughprotein engineering and protein delivery.Nat Commun 8,15790(2017)；Kleinstiver,B.P.,Pattanayak,V.,Prew,M.S.和Nature,T.-S.Q.High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects.Nature(2016)；Chen,J.S.等人Enhanced proofreading governs CRISPR-Cas9 targetingaccuracy.Nature 550,407-410(2017)；Slaymaker,I.M.等人Rationally engineeredCas9 nucleases with improved specificity.Science 351,84-88(2016))、具有更窄编辑窗口(正常情况下约5个核苷酸宽)的碱基编辑器(参见：Kim,Y.B.等人Increasing thegenome-targeting scope and precision of base editing with engineered Cas9-cytidine deaminase fusions.Nature biotechnology 35,371-376(2017))、以及具有减少的副产物的胞苷碱基编辑器(BE4)(参见：Komor,A.C.等人Improved base excisionrepair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A baseeditors with higher efficiency and product purity.Sci Adv 3,eaao4774(2017))。不同形式的碱基编辑器被称为BE1、BE2、BE3、BE4等。与先导编辑器不同，碱基编辑器与“常规”gRNA(例如，Cas9样式或Cpf1样式)共同起作用，所述gRNA对碱基编辑器的Cas效应子部分进行编程以在所需序列位置处靶向核酸。

“指导RNA”(或“gRNA”)通常是指可以结合Cas蛋白并有助于将Cas蛋白靶向至靶多核苷酸(例如，DNA)内的特定位置的RNA分子(或共同地指一组RNA分子)。因此，指导RNA包含可以与靶序列杂交的指导序列，并且指导RNA的另一部分(“支架”)用于结合Cas蛋白以形成指导RNA和Cas蛋白的核糖核蛋白(RNP)复合物。存在各种样式的指导RNA，包括但不限于Cas9样式和Cpf1样式的指导RNA。“Cas9样式”的指导RNA包含crRNA区段和tracrRNA区段。如本文所用，术语“crRNA”或“crRNA区段”是指包含以下项的RNA分子或其部分：靶向多核苷酸的指导序列；有助于与Cas蛋白相互作用的支架序列；和任选地5'-突出端序列。如本文所用，术语“tracrRNA”或“tracrRNA区段”是指包含能够与CRISPR相关蛋白(如Cas9)相互作用的蛋白质结合区段的RNA分子或其部分。除了Cas9，还存在采用Cas9样式的指导RNA的其他Cas蛋白，并且在术语“Cas9样式”中使用词语“Cas9”仅用于指定采用此样式的各种Cas蛋白的代表性成员。“Cpf1样式”是单分子指导RNA，其包含位于指导序列5'的支架。在文献中，Cpf1指导RNA通常被描述为仅具有crRNA而不具有tracrRNA。应当注意，不管术语如何，所有指导RNA都具有结合靶标的指导序列和可以与Cas蛋白相互作用的支架区域。与使用专门的gRNA(pegRNA)的先导编辑不同，碱基编辑使用常规gRNA(即Cas9样式和Cpf1样式)。

术语“指导RNA”涵盖在一个分子中含有所有功能部分的单指导RNA(“sgRNA”)。例如，在Cas9样式的sgRNA中，crRNA区段和tracrRNA区段位于同一RNA分子中。作为另一个例子，Cpf1指导RNA天然地是单指导RNA分子。术语“指导RNA”还共同地涵盖一组两个或更多个RNA分子；例如，crRNA区段和tracrRNA区段可以位于单独的RNA分子中。此外，如本文所用，术语“gRNA”涵盖用于先导编辑(pegRNA)、碱基编辑和基因表达调节以及采用gRNA的任何其他CRISPR技术中的指导RNA。

任选地，“指导RNA”可以包含一个或多个另外的区段，所述一个或多个另外的区段在被同源多肽或酶识别和结合后发挥一种或多种辅助功能，所述同源多肽或酶除了与gRNA缔合的Cas蛋白的功能还执行分子功能。例如，用于先导编辑的gRNA(其通常被称为“pegRNA”)可以包含引物结合位点和逆转录酶模板。在另一个例子中，gRNA可以包含形成一个或多个适配体(例如，MS2适配体)的一个或多个多核苷酸区段，所述一个或多个适配体(例如，MS2适配体)识别并结合适配体结合多肽(任选地与其他多肽融合(例如，MS2-p65-HSF1)，其与Cas蛋白或Cas融合蛋白(例如，dCas9-VP64)一起发挥辅助功能(如转录激活)，这些系统被称为协同激活介质“SAM”系统；参见S.Konermann等人,Genome-scaletranscriptional activation by an engineered CRISPR-Cas9complex.Nature.517,583-588(2015).，参见M.A.Horlbeck等人,Compact and highly active next-generationlibraries for CRISPR-mediated gene repression and activation.eLife.5,e19760(2016))。

任选地，“指导RNA”可以包含另外的多核苷酸区段(如3'(或5')-末端多尿苷尾、发夹、茎环、趾环(toeloop)等)，所述另外的多核苷酸区段可以通过阻止gRNA的降解(如可通过核酸酶如核酸内切酶和/或核酸外切酶发生的降解)来增加gRNA的稳定性。

术语“指导序列”是指gRNA(或pegRNA)中的核苷酸的连续序列，其与靶多核苷酸中的靶序列具有部分或完全互补性，并且可以通过由Cas蛋白促进的碱基配对与靶序列杂交。在一些情况下，靶序列与PAM位点(PAM序列)相邻。在一些情况下，靶序列可以紧邻PAM序列的上游。与指导序列杂交的靶序列可以紧邻PAM序列的互补体的下游。在其他例子(如Cpf1)中，与指导序列杂交的靶序列的位置可以在PAM序列的互补体的上游。

指导序列可以短至约14个核苷酸，并且长至约30个核苷酸。典型的指导序列的长度为15、16、17、18、19、20、21、22、23和24个核苷酸。指导序列的长度在上述两类和六种类型的CRISPR-Cas系统中变化。Cas9的合成指导序列的长度通常为20个核苷酸，但可以更长或更短。当指导序列短于20个核苷酸时，与20个核苷酸的指导序列相比，它通常是从5'端的缺失。举例来说，指导序列可以由与靶序列互补的20个核苷酸组成。换句话说，除了DNA与RNA之间的A/U差异，指导序列与PAM序列上游的20个核苷酸相同。如果此指导序列被从5'端截短3个核苷酸，则20个核苷酸的指导序列的核苷酸4现在变成17聚体中的核苷酸1，20个核苷酸的指导序列的核苷酸5现在变成17聚体中的核苷酸2，等等。17聚体指导序列的新位置是原始位置减3。

如本文所用，术语“先导编辑指导RNA”(或“pegRNA”)是指这样的指导RNA(gRNA)，其包含编码对核酸的靶序列的一个或多个编辑的逆转录酶模板序列以及可以结合靶区域中的序列的引物结合位点(也称为靶位点)。例如，pegRNA可以包含逆转录酶模板序列，所述逆转录酶模板序列包含对靶区域中的序列的一个或多个核苷酸取代、插入或缺失。pegRNA具有与Cas蛋白复合并与靶区域中(通常在细胞的基因组中)的靶序列杂交以导致靶区域中序列的编辑的功能。在一些实施方案中，在不受理论限制的情况下，pegRNA与Cas蛋白形成RNP复合物并结合靶区域中的靶序列，Cas蛋白在靶区域的一条链上形成切口以产生瓣，pegRNA的引物结合位点与瓣杂交，逆转录酶将瓣用作在pegRNA的杂交逆转录酶模板上的引物，pegRNA的杂交逆转录酶模板用作模板以在瓣的切口末端合成新的DNA序列，所述新的DNA序列然后包含所需的编辑，最终，这种新的DNA序列替代靶区域中的原始序列，从而导致靶标的编辑。

“pegRNA”可以在其5'端或3'端附近包含逆转录酶模板和引物结合位点。“先导编辑端”是pegRNA的一端(5'或3')，其更接近逆转录酶模板和引物结合位点而不是指导序列。pegRNA的另一端是“远端”，其更接近指导序列而不是逆转录酶模板或引物结合位点。因此，这些组分在5'或3'方向上的顺序是：

先导编辑端-(引物结合位点和逆转录酶模板)-(指导序列和支架)-远端其中括号指示根据pegRNA的样式(例如，Cas9样式或Cpf1样式)以及先导编辑端(即，5'端或3'端)的位置，其中提到的两个区段可以相对于彼此互换顺序。应当注意，如果pegRNA不是单指导RNA，而是包含多于一个RNA分子，则先导编辑端是指含有这些组分的RNA分子中更靠近引物结合位点和逆转录酶模板的一端，而此RNA分子的另一端是远端。指导序列可以在pegRNA的不同RNA分子中，所述RNA分子不同于带有先导编辑端和远端的RNA分子。

“切口指导RNA”或“切口gRNA”是这样的指导RNA(不是pegRNA)，其可以任选地在先导编辑中添加，以在靶区域中或附近引起未被编辑的链的切口。这种切口有助于刺激发生先导编辑的细胞以修复相关区域(即靶区域)。

“延伸尾”是1、2、3、4、5、6、7、8、9或10个核苷酸的一段核苷酸，其可以添加到指导RNA(如pegRNA)的5'端或3'端。“多(N)尾”是均聚物延伸尾，其含有具有相同核碱基(例如A、U、C或T)的1-10个核苷酸。“多尿苷尾”或“多U尾”是含有1-10个尿苷的多(N)尾。类似地，“多A尾”含有1-10个腺苷。

术语“核酸”、“核苷酸”或“多核苷酸”是指单链、双链或多链形式的脱氧核糖核酸(DNA)、核糖核酸(RNA)及其聚合物。所述术语包括但不限于单链、双链或多链DNA或RNA；基因组DNA；cDNA；DNA-RNA杂交体；或者包含嘌呤和/或嘧啶碱基或其他天然的核苷酸碱基、经化学修饰的核苷酸碱基、经生物化学修饰的核苷酸碱基、非天然的核苷酸碱基、合成或经衍生化的核苷酸碱基的聚合物。在一些实施方案中，核酸可以包含DNA、RNA及其类似物的混合物。除非特别限定，否则所述术语涵盖含有天然核苷酸的已知类似物且具有与参考核酸相似的结合特性的核酸。除非另有指示，否则特定核酸序列还暗示涵盖其保守修饰的变体(例如，简并密码子取代)、等位基因、直系同源物、单核苷酸多态性(SNP)和互补序列以及明确指出的序列。具体地，简并密码子取代可以通过产生如下序列来实现，在所述序列中一个或多个选定(或所有)密码子的第三位置被混合碱基和/或脱氧肌苷残基取代(Batzer等人,Nucleic Acid Res.19:5081(1991)；Ohtsuka等人,J.Biol.Chem.260:2605-2608(1985)；和Rossolini等人,Mol.Cell.Probes 8:91-98(1994))。术语核酸与基因、cDNA和由基因编码的mRNA互换使用。

术语“核苷酸类似物”或“经修饰的核苷酸”是指在核苷的含氮碱基(例如，胞嘧啶(C)、胸腺嘧啶(T)或尿嘧啶(U)、腺嘌呤(A)或鸟嘌呤(G))中或其上、在核苷的糖部分(例如，核糖、脱氧核糖、经修饰的核糖、经修饰的脱氧核糖、六元糖类似物或开链糖类似物)或磷酸酯中或其上含有一个或多个化学修饰(例如，取代)的核苷酸。

术语“基因”或“编码多肽的核苷酸序列”意指参与产生多肽链的DNA区段。DNA区段可以包括参与基因产物的转录/翻译和转录/翻译的调节的编码区之前和之后的区域(前导和尾)以及各个编码区段(外显子)之间的间插序列(内含子)。

术语“多肽”、“肽”和“蛋白质”在本文中可互换使用以指氨基酸残基的聚合物。所述术语适用于其中一个或多个氨基酸残基是对应天然存在的氨基酸的人工化学模拟物的氨基酸聚合物，以及天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。如本文所用，所述术语涵盖任何长度的氨基酸链(包括全长蛋白质)，其中氨基酸残基通过共价肽键连接。

术语“核酸”、“多核苷酸”或“寡核苷酸”是指DNA分子、RNA分子或其类似物。如本文所用，术语“核酸”、“多核苷酸”和“寡核苷酸”包括但不限于DNA分子，诸如cDNA、基因组DNA或合成DNA；和RNA分子，诸如引导RNA、信使RNA或合成RNA。此外，如本文所用，所述术语包括单链和双链形式。

术语“杂交”(“hybridization”)或“杂交”(“hybridizing”)是指这样的过程，其中完全或部分互补的多核苷酸链在合适的杂交条件下聚集在一起以形成双链结构或区域，其中两个组成链通过氢键连接。如本文所用，术语“部分杂交”包括双链结构或区域含有一个或多个凸起或错配的情况。尽管典型地在腺嘌呤与胸腺嘧啶或腺嘌呤与尿嘧啶(分别为A与T或A与U)或胞嘧啶与鸟嘌呤(C与G)之间形成氢键，但也可以形成其他非规范碱基对(参见例如，Adams等人，“The Biochemistry of the Nucleic Acids,”第11版，1992)。考虑了经修饰的核苷酸可以形成允许或促进以非规范方式杂交的氢键。

术语“互补性”是指核酸通过传统的沃森-克里克或其他非传统类型与另一核酸序列形成一个或多个氢键的能力。互补性百分比指示核酸分子中可与第二核酸序列形成氢键(例如，沃森-克里克碱基配对)的残基的百分比(例如，10个中的5、6、7、8、9、10个是50％、60％、70％、80％、90％和100％互补)。“完全互补”意指核酸序列的所有连续残基将与第二核酸序列中相同数量的连续残基形成氢键。如本文所用，“基本上互补”是指在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上的至少60％、65％、70％、75％、80％、85％、90％、95％、97％、98％、99％或100％的互补程度，或是指在严格条件下杂交的两个核酸。

如本文所用，序列的术语“部分”、“区段”、“元件”或“片段”是指所述序列的小于完整序列的任何部分(例如，核苷酸子序列或氨基酸子序列)。多核苷酸的部分、区段、元件或片段可以具有大于1个的任何长度，例如，长度为至少5、10、15、20、25、30、40、50、75、100、150、200、300或500个或更多个核苷酸。

如本文所用的术语“寡核苷酸”表示核苷酸的多聚体。例如，寡核苷酸可以具有长度为约2至约200个核苷酸、至多约50个核苷酸、至多约100个核苷酸、至多约500个核苷酸、或核苷酸数量在2与500之间的任何整数值。在一些实施方案中，寡核苷酸的长度可以在30至300个核苷酸或30至400个核苷酸的范围内。寡核苷酸可以含有核糖核苷酸单体(即，可以是寡核糖核苷酸)和/或脱氧核糖核苷酸单体。寡核苷酸的长度可以是例如10至20、21至30、31至40、41至50、51至60、61至70、71至80、80至100、100至150、150至200、200至250、250至300、300至350、或350至400个核苷酸，以及这些范围之间的任何整数值。

“重组表达载体”是具有一系列允许特定多核苷酸序列在宿主细胞中转录的指定核酸元件的重组或合成产生的核酸构建体。表达载体可以是质粒、病毒基因组或核酸片段的一部分。典型地，表达载体包含与启动子可操作地连接的待转录的多核苷酸。在此上下文中，“可操作地连接”意指以如下相对位置放置的两个或更多个遗传元件(如多核苷酸编码序列和启动子)，所述相对位置允许元件(如指导编码序列转录的启动子)的适当生物学功能。术语“启动子”在本文中用于指指导核酸转录的核酸控制序列的阵列。如本文所用，启动子包括转录起始位点附近的必需核酸序列，如在聚合酶II型启动子的情况下，TATA元件。启动子还任选地包括远端增强子或阻遏物元件，其可以位于距转录起始位点多达几千个碱基对的位置。可以存在于表达载体中的其他元件包括增强转录(例如，增强子)和终止转录(例如，终止子)的那些元件，以及赋予由表达载体产生的重组蛋白一定的结合亲和力或抗原性的那些元件。

“重组”是指遗传修饰的多核苷酸、多肽、细胞、组织或生物体。例如，重组多核苷酸(或重组多核苷酸的拷贝或互补体)是已经使用熟知的方法操作的多核苷酸。包含可操作地连接至第二多核苷酸(例如，编码序列)的启动子的重组表达盒可以包含由于人操作(例如，通过Sambrook等人,Molecular Cloning—A Laboratory Manual,Cold Spring HarborLaboratory,Cold Spring Harbor,New York,(1989)或Current Protocols in MolecularBiology第1-3卷,John Wiley&Sons,Inc.(1994-1998)中描述的方法)而与第二多核苷酸异源的启动子。重组表达盒(或表达载体)通常包含在自然界中未发现的多核苷酸组合。例如，人操作的限制性位点或质粒载体序列可以侧接启动子或将启动子与其他序列分开。重组蛋白是从重组多核苷酸表达的蛋白质，并且重组细胞、组织和生物体是包含重组序列(多核苷酸和/或多肽)的那些。

“编辑”核酸靶标意指引起靶标的核苷酸序列的变化。变化可以是插入、缺失或取代，其中每一个是单个核苷酸或多个核苷酸。在多个核苷酸被插入、缺失或取代的情况下，核苷酸可以是连续的或不连续的。变化可以是上述任何的组合。“编辑”包括“碱基编辑”和“先导编辑”技术。

“编辑效率”是在一个或多个细胞中实现的Cas诱导的编辑的量度。可以使用本领域已知的标准方法(例如，基因组DNA测序、RNA测序或靶位点和任何关注的脱靶位点的PCR扩增子的深度测序)测量在靶位点和潜在脱靶位点处的基因组编辑的结果。此外，可以通过使用突变检测试剂盒(Integrated DNA Technologies，爱荷华州科拉尔维尔)或Guide-it^TM插入缺失鉴定试剂盒(Clontech，加利福尼亚州山景城)来鉴定基因组DNA中的插入缺失突变。此外，可以将测量蛋白质的存在或不存在的技术(例如，凝胶或毛细管电泳、蛋白质印迹、流式细胞术或质谱技术)用于定量旨在引入或敲除蛋白质编码基因的编辑的效率。可以将这些技术应用于批量制备的细胞群或在单细胞水平下应用。在一些实施方案中，使用以批量测量的细胞群中或在单细胞水平下的正确编辑的数量来测量效率。在一些实施方案中，效率被测量为正确编辑的靶标的百分比，或显示经校正的基因型或表型的细胞的数量或百分比。

“调节基因的表达”意指改变(降低或激活)特定基因产物的表达。CRISPR激活或“CRISPRa”是指基因的激活，而CRISPR干扰或“CRISPRi”是指基因表达的干扰。两种系统都使用与一种或多种转录效应物(激活物或阻遏物)融合或相互作用的核酸酶缺陷型Cas蛋白(dCas9)。可以在如前所述的SAM系统(dCas9-VP64)中进行CRISPRa。当与基因特异性CRISPRa一起使用时，包含MS2适配体的gRNA将MS2-p65-HSF1融合物募集到靶向基因的转录起始位点(TSS)以启动激活。可以以多路复用方式(例如，多个基因的靶向)进行和组合CRISPRa和CRISPRi。CRISPRoff是一种由死Cas9融合蛋白组成的可编程的表观遗传记忆编写器，所述死Cas9融合蛋白建立可遗传地改变基因表达的DNA甲基化和抑制性组蛋白修饰(Nunez等人,Genome-wide programmable transcriptional memory by CRISPR-basedepigenome editing,Cell.(2021)184(9):2503-2519)。

可以例如通过测量不同RNA的相对或绝对水平的技术(例如，qRT-PCR或RNA测序)或通过测量蛋白质的相对或绝对水平的各种方法(例如，凝胶或毛细管电泳、蛋白质印迹、流式细胞术或质谱技术)来测量“基因表达调节效率”。可以将这些技术应用于批量制备的细胞群或在单细胞水平下应用。在一些实施方案中，使用以批量测量的细胞群中或在单细胞水平下从靶基因表达的蛋白质或RNA的量来测量效率。

术语“单核苷酸多态性”或“SNP”是指多核苷酸中(包括在等位基因内)单核苷酸的变化。这可以包括一个核苷酸被另一个核苷酸替代，以及单个核苷酸的缺失或插入。最典型地，SNP是双等位基因标记，但是三等位基因和四等位基因标记也可以存在。作为非限制性例子，包含SNP A\C的核酸分子可以在多态性位置处包括C或A。

如本文所用，“核酸酶”意指能够切割核酸的核苷酸之间的磷酸二酯键的酶。核酸酶可以不同地实现DNA和/或RNA分子的单链和/或双链切割二者。在活生物体中，它们是用于许多DNA修复方面的重要机制。如本文所用，核酸酶是指核酸外切酶和核酸内切酶二者，并且涵盖核糖核酸酶以及脱氧核糖核酸酶。

术语“原代细胞”是指直接从多细胞生物体分离的细胞。原代细胞通常经历非常少的群体倍增，因此与连续(肿瘤或人工永生化)细胞系相比，更能代表它们所来源的组织的主要功能组分。在一些情况下，原代细胞是已经分离然后立即使用的细胞。在其他情况下，原代细胞不能无限分裂，因此不能在体外长时间培养。

术语“含有核酸酶的流体”在本文中用于指其中存在核酸酶的任何培养基。例如，培养基可以是细胞培养基或源自细胞培养基的培养基，这意味着细胞在洗涤或不洗涤细胞但不去除原始培养基中包含的所有组分的情况下从细胞培养基转移到新培养基中，因此可能仍然含有核酸酶。例如，可以将细胞从细胞培养基转移到反应培养基，而不洗涤细胞或不去除细胞培养基的基本上所有组分，因此，核酸酶可以在细胞与gRNA和Cas蛋白(RNP)或者gRNA和编码编辑Cas效应物的mRNA或DNA载体接触时存在。流体可以是血清、人血清、动物血清、牛血清(BSA)、胎儿血清、脑脊液(CSF)或另一种体液。

术语“培养(culture)”、“培养(culturing)”、“生长(grow)”、“生长(growing)”、“维持(maintain)”、“维持(maintaining)”、“扩增(expand)”、“扩增(expanding)”等，当涉及细胞培养本身或培养过程时，可以互换使用以意指在受控条件下(例如，在适于存活的条件下)在细胞的正常环境之外维持细胞(例如，原代细胞)。允许经培养的细胞存活，并且培养可以导致细胞生长、停滞、分化或分裂。所述术语不暗示培养物中的所有细胞都存活、生长或分裂，因为一些细胞可能自然死亡或衰老。通常在培养基中培养细胞，可以在培养过程中更换培养基。

术语“受试者”、“患者”和“个体”在本文中可互换使用以包括人或动物。例如，动物受试者可以是哺乳动物、灵长类动物(例如，猴)、家畜动物(例如，马、牛、绵羊、猪或山羊)、伴生动物(例如，狗、猫)、实验室测试动物(例如，小鼠、大鼠、豚鼠、鸟)、具有兽医意义的动物或具有经济意义的动物。

如本文所用，术语“施用”包括向受试者口服施用、外用接触、作为栓剂施用、静脉内、腹膜内、肌内、病灶内、鞘内、鼻内或皮下施用。施用通过任何途径进行，包括肠胃外和经粘膜(例如，经颊、舌下、经腭、经牙龈、经鼻、经阴道、经直肠或透皮)。肠胃外施用包括例如静脉内、肌内、微动脉内、真皮内、皮下、腹膜内、心室内和颅内。其他递送方式包括但不限于使用脂质体配制品、静脉内输注、透皮贴剂等。

术语“治疗”是指用于获得有益或期望结果的方法，所述结果包括但不限于治疗益处和/或预防益处。治疗益处意指对治疗中的一种或多种疾病、病症或症状的任何治疗相关的改善或作用。为了预防益处，可以将组合物施用至有风险患上特定疾病、病症或症状的受试者，或者施用至报告疾病的一种或多种生理学症状的受试者，即使疾病、病症或症状可能尚未显现。

术语“有效量”或“足够量”是指足以实现有益或期望结果的药剂(例如，Cas蛋白、经修饰的gRNA/pegRNA等)的量。治疗有效量可以根据以下中的一种或多种而变化：所治疗的受试者和疾病状况、受试者的体重和年龄、疾病状况的严重程度、施用方式等，这些可以由本领域普通技术人员容易地确定。具体的量可以根据以下中的一种或多种而变化：所选择的特定药剂、靶细胞类型、靶细胞在受试者中的位置、要遵循的给药方案、是否与其他药剂组合施用、施用时间、以及携带它的物理递送系统。

如本文所公开的，提供了多个数值范围。应理解，还具体考虑的在该范围的上限与下限之间的每个中间值。还具体考虑了由所陈述的范围涵盖的每个较小范围或中间值。术语“约”通常是指所指示数字的正或负10％。例如，“约10％”可以指示9％至11％的范围，并且“约20”可以意指18-22。从上下文中，“约”的其他含义可很清楚，如四舍五入，因此，例如“约1”也可以意指0.5至1.4。

本文描述了几种经化学修饰的核苷酸。注意，MS、MP和MSP中的每一个可以意指对应的修饰或包含对应的修饰的核苷酸。应在相关上下文中使用以下缩写：

“PACE”：膦酰基乙酸酯

“MS”：2'-O-甲基-3'-硫代磷酸酯

“MP”：2'-O-甲基-3'-膦酰基乙酸酯

“MSP”：2'-O-甲基-3'-硫代膦酰基乙酸酯

“2'-MOE”：2'-O-甲氧基乙基

在整个说明书中可以出现术语的其他定义。

本发明证明，指导RNA在特定位置的某些修饰使得指导RNA对核酸酶的降解具有另外的抗性。这对于用于CRISPR介导的基因编辑或基因表达调节的指导RNA的体内递送特别重要，因为核酸酶活性在体内是高的。例如，诸如血清和脑脊液(CSF)的体液含有相对丰富的核酸酶。在这种具有挑战性的环境中，指导RNA倾向于降解，因此其浓度达不到可以实现更高性能的水平(即，亚饱和)。因此，指导RNA浓度的任何增加，以及由此基因编辑和基因表达调节的机会的任何增加，在此行业中将是显著的。本发明提供了出人意料的发现，即与未修饰或含有其他修饰(例如，硫代磷酸酯替代膦酰基羧酸酯或硫代膦酰基羧酸酯，但在其他方面相同)的对应物相比，某些指导RNA(例如，在5'端具有硫代磷酸酯修饰以及在3'端具有膦酰基羧酸酯或硫代膦酰基羧酸酯修饰的那些指导RNA)即使在存在血清的情况下也导致更高的CRISPR活性。

类似地，待经受CRISPR介导的编辑/调节以用于离体疗法的细胞通常在环境中在含有血清或(如果从受试者新鲜收获)含有体液的细胞培养基中。因此，存在于血清或体液中的核酸酶将降解递送至细胞的指导RNA并降低CRISPR介导的编辑/调节的效率。尽管可以在CRISPR处理之前洗涤细胞以降低血清或体液的量，但大量洗涤可能对细胞不健康。此外，CRISPR介导的编辑/调节不会在指导RNA和其他CRISPR效应物被添加到细胞后立即发生，并且细胞需要培养一段时间。在不存在血清的情况下培养通常对细胞有害，并且是离体疗法的风险因素，因为细胞将在之后被递送给患者。对核酸酶降解更具抗性的本发明的经修饰的指导RNA是解决这些问题的显著改进。

当被以“裸”方式引入细胞中并直接暴露于核酸酶(例如，共转染或以其他方式与编码Cas蛋白的DNA或mRNA一起递送)时，本发明的经修饰的指导RNA是有用的。然而，即使当指导RNA不是裸露的时，例如存在于具有Cas蛋白的核糖核蛋白(RNP)中，或存在于具有或不具有Cas蛋白的纳米颗粒中，本文所述的修饰也是有利的。

在本公开文本的一个方面，提供了用于在细胞的核酸中编辑靶区域或调节靶区域中的靶基因的表达的方法。所述方法包括向细胞提供a)CRISPR相关(“Cas”)蛋白，和b)经修饰的指导RNA，其包含5'端和3'端、能够与靶区域中的靶序列杂交的指导序列、以及与Cas蛋白相互作用的支架区域。经修饰的指导RNA还包含5'端的5个核苷酸内的一个或多个硫代磷酸酯修饰，和3'端的5个核苷酸内的至少两个连续的膦酰基羧酸酯或硫代膦酰基羧酸酯修饰。细胞在含有核酸酶的流体的存在下离体存在，或存在于体内。在本发明方法中，向细胞提供Cas蛋白和经修饰的指导RNA导致靶区域的编辑或靶基因表达的调节。

在一些实施方案中，经修饰的指导RNA在3'端的5个核苷酸内包含2、3、4或5个膦酰基羧酸酯或硫代膦酰基羧酸酯修饰。在gRNA的3'端的5个核苷酸内的至少两个连续的膦酰基羧酸酯或硫代膦酰基羧酸酯修饰可以包含至少2、3、4或5个可以以任何顺序排列的MP核苷酸，包括两个连续的经修饰的核苷酸和一个或两个非连续的经修饰的核苷酸、三个连续的经修饰的核苷酸和一个非连续的经修饰的核苷酸、两对两个连续的经修饰的核苷酸、或五两个连续的经修饰的核苷酸。在一些实施方案中，经修饰的指导RNA在3'端的5个核苷酸内包含至少两个、至少三个、至少四个或五个连续的MP核苷酸。在一些实施方案中，经修饰的指导RNA在5'端的5个核苷酸内包含1、2、3、4或5个硫代磷酸酯修饰。在gRNA的5'端的5个核苷酸内的一个或多个硫代磷酸酯修饰可以包含至少1个、至少2个、至少3个、至少4个或5个可以以任何顺序(包括连续或不连续)排列的MS核苷酸。在本发明方法的一些实施方案中，经修饰的指导RNA在5'端的5个核苷酸内包含至少两个、至少三个、至少四个或五个连续的MS核苷酸。可以独立地选择gRNA的3'或5'端的5个核苷酸内的一个或多个经修饰的核苷酸(例如，经修饰的核苷酸的数量和/或顺序可以在gRNA的5'和3'端上不同)。

在一些实施方案中，经修饰的指导RNA进一步包含位于5'端和3'端内的5个核苷酸之外的一个或多个经修饰的核苷酸。经修饰的指导RNA可以在指导序列中包含增强靶标特异性的一个或多个修饰(如例如美国专利号10,767,175中所述)。例如，经修饰的指导RNA可以在经修饰的指导序列的位置5或位置11处包含经修饰的核苷酸。

在一些实施方案中，经修饰的指导RNA是单指导RNA。在一些实施方案中，指导RNA是包含以下的单指导RNA：精确的或至少40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、或200个核苷酸，和/或多达180、179、178、177、176、175、174、173、172、171、170、169、168、167、166、165、164、163、162、161、159、158、157、156、155、154、153、152、151、150、149、148、147、146、145、144、143、142、141、140、139、138、137、136、135、134、133、132、131、130、129、128、127、126、125、124、123、122、121、或120个核苷酸。明确地预期，任何前述最小值和最大值可以组合以形成范围，只要最小值小于最大值。

在一些实施方案中，将Cas蛋白作为编码Cas蛋白或其变体或融合蛋白的mRNA提供给细胞。在一些实施方案中，将Cas蛋白作为包含编码Cas蛋白或其变体或融合蛋白的核苷酸序列的重组表达载体提供给细胞。可以用编码Cas蛋白的mRNA或表达载体单独或与经修饰的指导RNA一起转染细胞。在一些实施方案中，用经修饰的指导RNA和编码Cas蛋白的mRNA或表达载体共转染细胞。当共转染时，可以将经修饰的指导RNA和编码Cas蛋白的mRNA或表达载体在分开的递送系统中或在单一递送系统中提供给细胞。可替代地，可以在用编码Cas蛋白的mRNA或表达载体转染之前或之后用经修饰的指导RNA转染细胞。可以通过电穿孔、显微注射、脂质体转染或暴露于纳米颗粒或其他递送系统(如下文更详细描述的)来转染细胞。在一些实施方案中，在纳米颗粒(例如，脂质纳米颗粒)中提供编码Cas蛋白的mRNA或表达载体和/或经修饰的指导RNA。

在一些实施方案中，将Cas蛋白和经修饰的指导RNA作为核糖核蛋白复合物(RNP)提供。经修饰的指导RNA可以与Cas蛋白或其变体或融合蛋白复合以形成用于引入细胞中的RNP。可以将RNP在递送系统中提供给细胞，所述递送系统如通过电穿孔、显微注射、病毒样颗粒、脂质体转染或暴露于纳米颗粒或其他递送系统(如下文更详细描述的)。在一些实施方案中，在纳米颗粒(例如，脂质纳米颗粒)中提供Cas蛋白和/或经修饰的指导RNA。

在一些实施方案中，待编辑或调节的细胞是离体的。在其他实施方案中，待编辑或调节的细胞是在体内的。本发明方法可以用于在先前在包含血清的培养基中培养的离体细胞的核酸中编辑靶区域或调节靶区域中靶基因的表达，其中细胞与血清或一种或多种血清组分不完全分离。例如，所述方法可以包括将细胞从细胞培养基转移至反应培养基，而不洗涤细胞或不大量洗涤细胞。在一些实施方案中，将经修饰的指导RNA和Cas蛋白在血清或一种或多种血清组分的存在下提供给细胞，如血液、血浆或血清中的体内细胞。

在一些实施方案中，细胞是细胞群，每个细胞包含靶区域。例如，细胞群可以是细胞培养物或来源于细胞培养物。在向细胞提供经修饰的指导RNA和Cas蛋白之前，细胞或细胞群可以在细胞培养基或含有核酸酶的流体中，并且在一些实施方案中，将细胞洗涤但不完全脱离细胞培养基或细胞培养基的一种或多种组分，使得核酸酶在引入编辑组分之前仍然存在。例如，可以将细胞从细胞培养基转移到反应培养基，而不洗涤细胞或不去除细胞培养基的基本上所有组分。可替代地，在提供经修饰的指导RNA和Cas蛋白时，细胞或细胞群可以存在于细胞培养基中。在此类实施方案中，细胞培养基可以充当用于编辑或调节细胞中的靶序列的反应培养基。在一些实施方案中，细胞在包含血清或一种或多种其他培养基组分(如人或动物来源的一种或多种天然蛋白质)的细胞培养基中或转移自所述细胞培养基。在一些实施方案中，细胞在包含牛血清白蛋白、马血清或胎牛血清的细胞培养基中或转移自所述细胞培养基。

在一些实施方案中，由向细胞提供经修饰的指导RNA导致的编辑或表达调节比由与经修饰的指导RNA在其他方面相同的未修饰的指导RNA引起的编辑或调节至少10％、至少20％、至少25％或至少50％更有效。例如，本发明方法的平均插入缺失产率或平均编辑产率比采用与经修饰的指导RNA在其他方面相同的未修饰的指导RNA的对应方法中获得的产率高至少10％、至少20％、至少25％或至少50％。在一些实施方案中，由向细胞提供经修饰的指导RNA导致的编辑或调节比由与经修饰的指导RNA在其他方面相同的未修饰的指导RNA引起的编辑或调节至少2倍、至少3倍或至少5倍更有效。例如，本发明方法的平均插入缺失产率或平均编辑产率是采用与经修饰的指导RNA在其他方面相同的未修饰的指导RNA的对应方法的至少2倍、至少3倍或至少5倍。

在本发明中通过使用针对多个靶区域的多个经修饰的gRNA考虑了多路复用。在一些实施方案中，将本申请的两个经修饰的指导RNA用于优选地同时编辑(或调节)同一细胞中的两个不同的靶区域。在一些实施方案中，以多路复用方式，将经修饰的指导RNA用于编辑第一靶区域，并且将第二经修饰的指导RNA用于调节靶区域(其可以与第一靶区域相同或不同)的表达。

近年来，基于CRISPR的技术已经成为一种潜在的革命性疗法(例如，用于校正遗传缺陷)。然而，由于实际问题，CRISPR系统的使用受到限制。特别地，需要使用于CRISPR-Cas组分的体内递送的指导RNA(gRNA)稳定化的方法。先前的研究已经研究了具有经化学修饰的核苷酸的gRNA的用途。如本文所解释的，本公开文本部分基于以下出人意料的发现：在gRNA的3'端掺入特定的经修饰的核苷酸可以改进Cas介导的靶核酸编辑或调节的产率，其中在挑战性条件下将gRNA和编码Cas蛋白的mRNA或DNA引入(例如，共转染)细胞中的情况下具有显著的改进。

在一些方面，本文公开的指导RNA在其中指导RNA在诸如以下的一种或多种挑战性条件下被引入细胞中的应用中可以是特别有利的：

i.细胞在包含血清(例如，胎牛血清)的培养基中；

ii.预先在包含血清的培养基中培养细胞，并且当引入指导RNA时血清仍然存在；

iii.预先在包含一种或多种核酸酶的培养基中培养细胞，并且当引入指导RNA时核酸酶仍然存在；

iv.细胞具有相对较高水平的核酸酶活性，如一种或多种核酸酶的相对较高表达；

v.细胞具有相对较低水平的核酸酶抑制剂活性，如核酸酶抑制剂的相对较低表达；

vi.经修饰的指导RNA在递送到细胞中之前不与Cas蛋白复合；

vii.细胞存在于体内；以及

viii.在适用的情况下其组合。

饱和的概念是本领域熟知的。当物质处于其“饱和水平”时，物质的量的任何进一步增加都不会导致更高的活性。“亚饱和水平”低于饱和水平，并且添加更多所讨论的物质可以导致更高的活性。可以使用常规测定凭经验确定饱和的阈值。例如，图1示出了评价在用渐增量的合成gRNA和恒定量的Cas蛋白共转染后的Cas编辑活性的测定的结果。如此图所示，当gRNA的水平达到转染20万个细胞的饱和点时，Cas介导的编辑活性在25-31.25pmol的gRNA处趋于稳定。

在许多情况下，希望使用化学反应所需的饱和水平的组分。然而，此类条件并不总是可行的，特别是在治疗剂的情况下，其中用饱和水平的一种或多种化合物治疗人或动物可能不是合理或安全的。在基于CRISPR的疗法的情况下，转染效率通常是限制疗法有效性的瓶颈。例如，当前基于CRISR的疗法通常需要用gRNA和编码Cas蛋白的mRNA共转染患者的一个或多个细胞。如果转染效率低，则可以以低于治疗效果所需的有效量的水平递送一种或两种组分。本文公开的经修饰的指导RNA构建体解决了本领域的这种需要，因为它们通常显示高水平的Cas编辑活性，即使当以亚饱和水平转染时也是如此。实际上，在合成gRNA的3'端掺入一个或多个膦酰基羧酸酯修饰对于涉及Cas mRNA与合成gRNA的共转染的基于CRISPR的方法是特别有利的。

如上所指出，本公开文本还提供了经修饰的pegRNA构建体和方法，所述经修饰的pegRNA构建体和方法在挑战性条件下(如当以亚饱和量转染时)保留高水平的先导编辑活性。此结果是特别出人意料的，因为传统的指导RNA(gRNA)的结构与先导编辑gRNA(pegRNA)的结构非常不同，并且在本公开文本之前，不清楚pegRNA的化学修饰将如何影响其活性。特别地，与典型的gRNA相比，pegRNA在其3'部分含有另外的序列(即，逆转录酶模板和引物结合位点序列)并且pegRNA的3'端在先导编辑中执行与其他CRISPR-Cas系统中典型gRNA的3'端不同的功能。因此，在pegRNA的3'末端的磷酸核糖(或其他化学)修饰有可能干扰引物结合位点序列的作用，所述引物结合位点序列与DNA靶位点的切口链的3'端杂交，使得逆转录酶将所得的RNA:DNA双链体识别为切口3'端的引物延伸的可接受底物，以实现先导编辑。

基于这种理解，可以预期RNA:DNA双链体的RNA区段中的一些磷酸核糖修饰(如MS和MP)可能干扰或降低逆转录酶对此双链体的亲和力，从而降低先导编辑活性。此外，预期磷酸核糖被修饰(如通过MS或MP修饰)的位置和/或位置的组合会干扰先导编辑中的逆转录酶功能，从而降低先导编辑活性。RNA:DNA双链体与来自异向性鼠白血病病毒相关病毒(莫洛尼氏鼠白血病病毒(MMLV)(其逆转录酶通常用于先导编辑)的近亲)的逆转录酶的双链体复合多肽片段的一部分之间的复合物的已公布的共晶结构缺乏与RNA:DNA双链体中RNA链的3'末端相互作用的逆转录酶的部分(Nowak等人,Nucl.Acids Res.2013,3874-3887)，使本领域缺乏关于在先导编辑中pegRNA的3'末端处可能很重要的RNA-蛋白质接触的信息。

本公开文本部分基于以下出人意料的发现：在3'端包含一个或多个MP修饰、任选地在5'端具有一个或多个修饰的经修饰的gRNA或pegRNA可以增强Cas介导的编辑活性，特别是在经修饰的指导RNA以亚饱和水平转染到细胞中的情况下。如下面所进一步详细讨论的，将化学合成的单指导RNA(其可以是约100nt长)和pegRNA(通常更长)的各种设计在培养的人细胞中与Cas蛋白或编码Cas蛋白的mRNA一起共转染，并且当将MS或MP修饰添加到在gRNA/pegRNA的3'端处的磷酸核糖时，观察到活性增强。

为了评价各种3'和/或5'端修饰的影响，通过在如表1所列的gRNA的3'端处系统地掺入MS或MP磷酸核糖修饰来产生一系列靶向HBB基因的合成gRNA。5'和3'端修饰在每个合成gRNA的名称中指示；例如，HBB-101-3xMS,3xMP意指针对HBB基因的指导RNA，其中在gRNA的5'端有三个MS修饰并且在3'端有三个MP修饰。修饰的确切位置在图1所示的序列中用下划线表示。名称还指示RNA长度；例如，HBB-101-etc.意指由101个核苷酸构成的靶向HBB基因的sgRNA链。同样地，HBB-99-etc.意指sgRNA链由99个核苷酸构成。这些长度与相似长度之间的序列长度差异在于sgRNA的3'末端处的短多尿苷(多U)尾中的尿苷的不同数量，如表1中定义的序列所指出的。在表1列出的例子中，3'多U尾由3、4、5、6或7个连续的尿苷构成(作为参考，天然tracrRNA上的3'多U尾通常由7个连续的尿苷构成)。此外，在靶基因的名称和RNA长度之后指示指导序列中的任何修饰。例如，HBB-102-11MP-3xMS,3xMP意指由102个核苷酸构成的针对HBB基因的指导RNA，其中在5'端具有三个MS修饰，并且在3'端具有三个MP修饰，并且在指导序列中的位置11包含MP修饰。修饰的确切位置在表1(以及表2至表4)所示序列中用下划线表示，其中指导序列中的MP修饰以下划线粗体表示。

表1.靶向HBB基因的示例性合成gRNA

/>

在gRNA的3'端处的化学修饰的数量和类型可以在亚饱和量的gRNA被递送到细胞中(例如，通过核转染)的条件下显著改进它们对DNA编辑的功效。这种益处在使用与编码Cas蛋白的mRNA共转染的gRNA的方法中尤其显著，这与在与Cas蛋白复合作为核糖核蛋白(RNP)复合物共转染的情况相反。掺入gRNA中的化学修饰的数量和类型也可以改进Cas RNP复合物的编辑效率，这由本文提供的关于悬浮在包含血清(已知其含有核酸酶)的生长培养基中的细胞的转染的数据证明。参见例如，图4和图5。本文所述的实验数据还显示，经转染的gRNA序列中的某些化学修饰和某些序列位置可以尤其有利于增强编辑产率，如通过在gRNA的3'端上的连续3'末端磷酸核糖处掺入一个或多个MP修饰。

本文所述的任何5'和3'端修饰可以任选地与gRNA的指导序列中的增强靶标特异性的修饰组合(如例如美国专利号10,767,175中所述)。例如，在3'端的MP修饰(如从3'端的第二个核苷酸处的MP，这意指从3'端的第一个核苷酸间连接包含膦酰基乙酸酯)可以与gRNA或pegRNA的指导序列部分中的位置5或11(从20个核苷酸的指导序列的5'端计数)处的MP或其他修饰组合，如表1所示并且如图2-图5所测试。

可以在gRNA的化学合成期间通过在选择的亚酰胺偶联循环处使用经化学修饰的亚磷酰胺来掺入化学修饰，以产生期望的序列。合成后，将经化学修饰的gRNA以与未修饰的gRNA相同的方式用于基因编辑或调节。优选的实施方案是将经化学修饰的合成gRNA与编码Cas蛋白的mRNA或DNA共转染。化学修饰增强经转染的细胞中gRNA的活性，包括当通过电穿孔、脂质体转染或将活细胞或组织暴露于装载有gRNA和/或编码Cas蛋白的mRNA的纳米颗粒来递送时。

示例性的合成pegRNA示于下表2和表3中。通过在3'端系统地掺入MS或MP磷酸核糖修饰来修饰这些pegRNA。5'和3'端修饰在每个合成pegRNA的名称中指示，所述名称也指示靶基因。例如，“EMX1-peg-3xMS,3xMP”是指针对EMX1基因的pegRNA，其中在pegRNA的5'端具有三个MS修饰，并且在3'端具有三个MP修饰。修饰的确切位置在表2所示的序列中用下划线表示。一些pegRNA设计在3'末端添加一个短的多尿苷段(即，聚U尾)，如pegRNA名称中的“+3'UU”、“+3'UUU”或“+3'UUUU”所示。

表2.靶向EMX1基因的示例性合成pegRNA

/>

表3.靶向EMX1基因的示例性合成pegRNA。

表4.靶向IL2RG基因的示例性合成gRNA

如下面描述的例子所证明的，在pegRNA的3'端使用化学修饰显著改进合成pegRNA与先导编辑器的功效(相对于在3'端未修饰的pegRNA)。当旨在限制编辑活性的持续时间时，可以优选使用合成pegRNA进行先导编辑，这与当pegRNA和先导编辑器在用DNA载体转染的细胞中组成型表达时的持续编辑活性(如文献中最初报道的(参见Anzalone等人2019))形成对照。本公开文本进一步证明，数据pegRNA序列中的某些化学修饰和某些序列位置可以是尤其有利的，在一些方面，如在pegRNA链上连续的3'末端磷酸核糖处掺入两个MP修饰，所述链以在3'末端的引物结合区段终止(在3'末端未添加下游多U尾)。

A.示例性CRISPR/Cas系统

基因组修饰的CRISPR/Cas系统包括Cas蛋白(例如，Cas9核酸酶)以及含有将Cas蛋白靶向至靶DNA的指导序列和与Cas蛋白相互作用的支架区域(例如，tracrRNA)的DNA靶向RNA(例如，经修饰的gRNA)。在一些情形下，可以使用Cas蛋白的变体，如含有以下突变中的一个或多个的Cas9突变体：D10A、H840A、D839A和H863A。在其他情况下，可以使用具有所需特性(例如，能够产生单链或双链断裂和/或调节基因表达)的Cas蛋白或其变体的片段。可以将供体修复模板用于一些CRISPR应用中，这些应用例如可以包括编码报告多肽(如荧光蛋白或抗生素抗性标记物)的核苷酸序列，和与靶DNA同源并位于基因修饰位点侧翼的同源臂。可替代地，供体修复模板可以是单链寡脱氧核苷酸(ssODN)。在一些方面，CRISPR/CAS系统可以包括能够充当先导编辑器的Cas蛋白(例如，包含与逆转录酶蛋白或其结构域融合的显示切口酶活性的Cas蛋白的融合蛋白)。先导编辑器可以与pegRNA一起使用，其将含有一个或多个编辑的逆转录酶模板掺入靶核酸的序列中，以便通过称为先导编辑的过程修饰靶核酸的序列。

1.Cas蛋白及其变体

CRISPR(规律间隔成簇短回文重复序列)/Cas(CRISPR相关蛋白)核酸酶系统在细菌中被发现，但已在真核细胞(例如，哺乳动物)中用于基因组编辑/基因表达的调节。它基于许多细菌和古生菌的适应性免疫应答的一部分。当病毒或质粒侵入这种微生物时，入侵者DNA的区段被掺入微生物基因组中的CRISPR基因座(或“CRISPR阵列”)中。CRISPR基因座的表达产生非编码CRISPR RNA(crRNA)。在II型CRISPR系统中，crRNA然后通过部分互补区域与另一类型的称为tracrRNA的RNA缔合，以将Cas(例如，Cas9)蛋白引导至靶DNA中的与crRNA同源的区域(称为“原型间隔子”)。Cas(例如，Cas9)蛋白切割DNA以在由crRNA转录物内包含的20个核苷酸的指导序列指定的位点处的双链断裂处产生平端。Cas(例如，Cas9)蛋白需要crRNA和tracrRNA二者用于位点特异性DNA识别和切割。此系统已被工程化，使得crRNA和tracrRNA可以组合成一个分子(单指导RNA或“sgRNA”)(参见例如，Jinek等人(2012)Science,337:816-821；Jinek等人(2013)eLife,2:e00471；Segal(2013)eLife,2:e00563)。因此，CRISPR/Cas系统可以被工程化以在细胞基因组中的期望靶标处产生双链断裂，并利用细胞的内源机制通过同源定向修复(HDR)或非同源末端连接(NHEJ)来修复诱导的断裂。

在一些实施方案中，Cas蛋白具有DNA切割活性。Cas蛋白可以在靶DNA序列中的位置处指导一条或两条链的切割。例如，Cas蛋白可以是具有一个或多个失活的催化结构域的切口酶，其切割靶DNA序列的单链(例如，如在先导编辑器Cas蛋白的情况下)。

Cas蛋白的非限制性例子包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Cas11、Cas12、Cas13、Cas14、CasΦ、CasX、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Cpf1、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同源物、其变体、其片段、其突变体及其衍生物。存在至少六种类型的Cas蛋白(I型至VI型)和至少33种亚型(参见例如，Makarova等人,Nat.Rev.Microbiol.,2020,18:2,67-83)。II型Cas蛋白包括Cas1、Cas2、Csn2和Cas9。Cas蛋白是本领域技术人员已知的。例如，酿脓链球菌(Streptococcus pyogenes)野生型Cas9多肽的氨基酸序列在例如NBCI参考序列号NP_269215中列出，并且嗜热链球菌(Streptococcus thermophilus)野生型Cas9多肽的氨基酸序列在例如NBCI参考序列号WP_011681470中列出。可用于本公开文本的方面的CRISPR相关核酸内切酶公开于例如美国专利号9,267,135；9,745,610；和10,266,850中。

Cas蛋白(例如，Cas9多肽)可以源自多种细菌物种，包括但不限于非典型韦荣氏球菌(Veillonella atypical)、具核梭杆菌(Fusobacterium nucleatum)、龈沟产线菌(Filifactor alocis)、莫雷梭菌(Solobacterium moorei)、猫粪球菌(Coprococcuscatus)、齿垢密螺旋体(Treponema denticola)、杜德尼嗜胨菌(Peptoniphilusduerdenii)、光冈氏链型杆菌(Catenibacterium mitsuokai)、变形链球菌(Streptococcusmutans)、英诺克李斯特菌(Listeria innocua)、伪中间型葡萄球菌(Staphylococcuspseudintermedius)、肠氨基酸球菌(Acidaminococcus intestine)、齿龈欧陆森氏菌(Olsenella uli)、北原酒球菌(Oenococcus kitaharae)、两歧双歧杆菌(Bifidobacteriumbifidum)、鼠李糖乳杆菌(Lactobacillus rhamnosus)、加氏乳杆菌(Lactobacillusgasseri)、大芬戈尔德菌(Finegoldia magna)、运动型支原体(Mycoplasma mobile)、鸡毒支原体(Mycoplasma gallisepticum)、肺炎支原体(Mycoplasma ovipneumoniae)、犬支原体(Mycoplasma canis)、鸡滑液囊支原体(Mycoplasma synoviae)、直肠真杆菌(Eubacterium rectale)、嗜热链球菌(Streptococcus thermophilus)、细长真杆菌(Eubacterium dolichum)、棒状乳杆菌扭曲亚种(Lactobacillus coryniformissubsp.Torquens)、多营养泥杆菌(Ilyobacter polytropus)、白色瘤胃球菌(Ruminococcusalbus)、嗜粘蛋白阿克曼菌(Akkermansia muciniphila)、解纤维素热酸菌(Acidothermuscellulolyticus)、长双歧杆菌(Bifidobacterium longum)、齿双歧杆菌(Bifidobacteriumdentium)、白喉棒状杆菌(Corynebacterium diphtheria)、微小迷踪菌(Elusimicrobiumminutum)、卤水硝酸盐裂解菌(Nitratifractor salsuginis)、螺旋体球菌(Sphaerochaetaglobus)、产琥珀酸丝状杆菌亚种(Fibrobacter succinogenes subsp.Succinogenes)、拟杆菌黄褐二氧化碳嗜纤维菌(Bacteroides Capnocytophaga ochracea)、沼泽红假单胞菌(Rhodopseudomonas palustris)、彩虹普雷沃氏菌(Prevotella micans)、栖瘤胃普雷沃氏菌(Prevotella ruminicola)、柱状黄杆菌(Flavobacterium columnare)、少食氨基单胞菌(Aminomonas paucivorans)、深红红螺菌(Rhodospirillum rubrum)、候选菌种海水螺菌(Candidatus Puniceispirillum marinum)、蚯蚓芽肾杆菌(Verminephrobactereiseniae)、蒲桃罗尔斯顿菌(Ralstonia syzygii)、芝氏沟鞭藻玫瑰杆菌(Dinoroseobacter shibae)、固氮螺菌(Azospirillum)、汉氏硝化细菌(Nitrobacterhamburgensis)、慢生根瘤菌(Bradyrhizobium)、产琥珀酸沃廉菌(Wolinellasuccinogenes)、空肠弯曲杆菌亚种(Campylobacter jejuni subsp.Jejuni)、鼬鼠螺杆菌(Helicobacter mustelae)、蜡样芽孢杆菌(Bacillus cereus)、污泥食酸菌(Acidovoraxebreus)、产气荚膜梭菌(Clostridium perfringens)、食清洁剂细小棒菌(Parvibaculumlavamentivorans)、肠罗斯氏菌(Roseburia intestinalis)、脑膜炎奈瑟氏菌(Neisseriameningitidis)、多杀巴斯德杆菌亚种(Pasteurella multocida subsp.Multocida)、华德萨特菌(Sutterella wadsworthensis)、变形菌(proteobacterium)、嗜肺军团菌(Legionella pneumophila)、毛螺旋菌(Parasutterella excrementihominis)、产琥珀酸沃廉菌(Wolinella succinogenes)和新凶手弗朗西斯氏菌(Francisella novicida)。

“Cas9”是指RNA指导的双链DNA结合核酸酶蛋白或切口酶蛋白。野生型Cas9核酸酶具有切割不同DNA链的两个功能结构域(例如，RuvC和HNH)。当两个功能结构域都有活性时，Cas9可以诱导基因组DNA(靶DNA)中的双链断裂。Cas9酶可以包含源自属于以下组的细菌的Cas9蛋白的一个或多个催化结构域，所述组由以下组成：棒状杆菌属(Corynebacter)、萨特氏菌属(Sutterella)、军团菌属(Legionella)、密螺旋体属(Treponema)、产线菌属(Filifactor)、真杆菌属(Eubacterium)、链球菌属(Streptococcus)、乳杆菌属(Lactobacillus)、支原体属(Mycoplasma)、拟杆菌属(Bacteroides)、黄沃拉菌属(Flaviivola)、黄杆菌属(Flavobacterium)、梭杆菌属(Sphaerochaeta)、固氮螺菌属(Azospirillum)、葡糖醋杆菌属(Gluconacetobacter)、奈瑟氏菌属(Neisseria)、罗斯氏菌属(Roseburia)、细小棒菌属(Parvibaculum)、葡萄球菌属(Staphylococcus)、硝酸盐裂解菌属(Nitratifractor)和弯曲杆菌属(Campylobacter)。在一些实施方案中，两个催化结构域源自不同的细菌种类。

“Cas12”(包含变体Cas12a(也称为Cpf1)、Cas12b、c2c1、c2c3、CasX和CasY)是指RNA指导的双链DNA结合核酸酶蛋白，其含有混合的α/β结构域、RuvC-I然后是螺旋区域、RuvC-II和锌指样结构域或切口酶蛋白。野生型Cas12核酸酶在dsDNA靶序列上产生交错的5'突出端，并且不需要tracrRNA。Cas12及其变体识别靶dsDNA上的富含5'AT的PAM序列。已证明Cas12a蛋白的插入结构域(称为Nuc)负责靶链切割。Cas12酶可以包含源自属于由弗朗西斯氏菌属和普雷沃氏菌属组成的组的细菌的Cas12蛋白的一个或多个催化结构域。

Cas9蛋白的有用变体可以包含单个无活性的催化结构域，如RuvC^-或HNH^-酶，二者都是切口酶。此类Cas蛋白是有用的，例如，在先导编辑的背景下。Cas9切口酶仅具有一个活性功能结构域，并且仅可以切割靶DNA的一条链，从而产生单链断裂或切口。在一些实施方案中，Cas蛋白是具有至少D10A突变的突变体Cas9核酸酶，并且是Cas9切口酶。在其他实施方案中，Cas蛋白是具有至少H840A突变的突变体Cas9核酸酶，并且是Cas9切口酶。Cas9切口酶中存在的突变的其他例子包括而不限于N854A和N863A。如果使用靶向相反DNA链的至少两个DNA靶向RNA，则可以使用Cas9切口酶引入双链断裂。可以通过NHEJ或HDR修复交错的双切口诱导的双链断裂(Ran等人,2013,Cell,154:1380-1389；Anzalone等人Nature 576:7785,2019,149-15)。这种基因编辑策略有利于HDR，并降低作为副产物的插入缺失突变的频率。Cas9核酸酶或切口酶的非限制性例子描述于例如美国专利号8,895,308；8,889,418；8,865,406；9,267,135；和9,738,908；以及美国专利申请公开号2014/0186919中。可以将Cas9核酸酶或切口酶针对靶细胞或靶生物体进行密码子优化。

在一些实施方案中，Cas蛋白可以是含有RuvC1和HNH核酸酶结构域的两个沉默突变(D10A和H840A)的Cas9多肽，其被称为dCas9(Jinek等人,Science,2012,337:816-821；Qi等人,Cell,152(5):1173-1183)。在一个实施方案中，来自酿脓链球菌的dCas9多肽在位置D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、A987或其任何组合处包含至少一个突变。此类dCas9多肽及其变体的描述提供于例如国际专利公开号WO 2013/176772中。dCas9酶可以含有在D10、E762、H983或D986处的突变，以及在H840或N863处的突变。在一些情形下，dCas9酶含有D10A或D10N突变。此外，dCas9酶可以包含H840A、H840Y或H840N。在一些实施方案中，在本公开文本的方面中使用的dCas9酶包含D10A和H840A；D10A和H840Y；D10A和H840N；D10N和H840A；D10N和H840Y；或D10N和H840N取代。取代可以是保守或非保守取代，以使Cas9多肽催化失活并能够结合靶DNA。

dCas9多肽是催化失活的并且缺乏核酸酶活性。在一些情形下，dCas9酶或其变体或片段可以阻断靶序列的转录，并且在一些情况下，阻断RNA聚合酶。在其他情况下，dCas9酶或其变体或片段可以激活靶序列的转录，例如，当与转录激活物多肽融合时。在一些实施方案中，Cas蛋白或蛋白变体包含一个或多个NLS序列。

在一些实施方案中，Cas蛋白可以是融合蛋白，其包含用任选的插入接头与第二蛋白的一个或多个异源功能结构域融合的一个或多个Cas核酸酶结构域，其中接头不干扰融合蛋白的活性。在这种情况下，异源意指功能结构域来自Cas蛋白以外的蛋白。在一些实施方案中，异源功能结构域包含酶结构域和/或结合结构域。在一些实施方案中，异源酶结构域是核酸酶、切口酶、重组酶、脱氨酶、甲基转移酶、聚合酶、逆转录酶、甲基化酶、乙酰化酶、乙酰转移酶、转录激活物或转录阻遏物结构域。在一些实施方案中，异源酶结构域包含碱基编辑活性、核苷酸脱氨酶活性、甲基化酶活性、去甲基化酶活性、翻译激活活性、翻译抑制活性、转录激活活性、转录抑制活性、转录释放因子活性、染色质修饰或重塑活性、组蛋白修饰活性、核酸酶活性、单链RNA切割活性、双链RNA切割活性、单链DNA切割活性、双链DNA切割活性、核酸结合活性、可检测活性或其任何组合。

在一些实施方案中，Cas蛋白包含作为碱基编辑器的异源功能结构域，如胞苷脱氨酶结构域，例如来自脱氨酶的载脂蛋白B mRNA编辑酶、催化多肽样(APOBEC)家族，包括APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D/E、APOBEC3F、APOBEC3G、APOBEC3H或APOBEC4；激活诱导的胞苷脱氨酶(AID)，例如激活诱导的胞苷脱氨酶(AICDA)；胞嘧啶脱氨酶1(CDA1)或CDA2；或作用于tRNA的胞嘧啶脱氨酶(CDAT)。在一些实施方案中，异源功能结构域是修饰腺苷DNA碱基的脱氨酶，例如，脱氨酶是腺苷脱氨酶1(ADA1)、ADA2；作用于RNA的腺苷脱氨酶1(ADAR1)、ADAR2、ADAR3；作用于tRNA的腺苷脱氨酶1(ADAT1)、ADAT2、ADAT3；和天然存在或工程化的tRNA特异性腺苷脱氨酶(TadA)。在一些实施方案中，异源功能结构域是生物系链。在一些实施方案中，生物系链是MS2、Csy4或λN蛋白。在一些实施方案中，异源功能结构域是FokI。

在一些实施方案中，Cas蛋白包含异源功能结构域，其为抑制或增强内源DNA修复或碱基切除修复(BER)途径的酶、结构域或肽，例如抑制尿嘧啶DNA糖基化酶(UDG，也称为尿嘧啶N-糖基化酶，或UNG)介导的尿嘧啶切除以启动BER的尿嘧啶DNA糖基化酶抑制剂(UGI)；或来自噬菌体μ的DNA末端结合蛋白(如Gam)。

在一些实施方案中，Cas蛋白包含作为转录激活结构域的异源功能结构域，例如VP64结构域、p65结构域、MyoD1结构域或HSF1结构域。在一些实施方案中，Cas蛋白包含作为转录抑制结构域的异源功能结构域，例如Krueppel相关盒(KRAB)结构域、ERF阻遏物结构域(ERD)、mSin3A相互作用结构域(SID)结构域、SID4X结构域、NuE结构域、或NcoR结构域。在一些实施方案中，Cas蛋白包含作为核酸酶结构域的异源功能结构域，例如Fok1结构域。在一些实施方案中，在一些实施方案中，Cas蛋白包含转录沉默子结构域，例如异染色质蛋白1(HP1)，例如HP1a或HP1D。在一些实施方案中，Cas蛋白的异源功能结构域是修饰DNA的甲基化状态的酶。在一些实施方案中，修饰DNA的甲基化状态的酶是DNA甲基转移酶(DNMT)或TET蛋白。在一些实施方案中，TET蛋白是TET1。在一些实施方案中，Cas蛋白的异源功能结构域是修饰组蛋白亚基的酶。在一些实施方案中，修饰组蛋白亚基的酶是组蛋白乙酰转移酶(HAT)、组蛋白脱乙酰酶(HDAC)、组蛋白甲基转移酶(HMT)或组蛋白去甲基化酶。

对于基因调节(例如，调节靶DNA的转录)，核酸酶缺陷Cas蛋白(如但不限于dCas9)可用于转录激活或转录抑制。使用核酸酶无效的Cas蛋白使基因表达失活的方法描述于例如Larson等人,Nat.Protoc.,2013,8(11):2180-2196中。

在一些实施方案中，Cas蛋白包含一个或多个核定位信号(NLS)结构域。所述一个或多个NLS结构域可以位于效应蛋白(例如，C2c2)的末端处或附近，并且如果是两个或更多个NLS，两者中的每一个可以位于效应蛋白(例如，C2c2)的末端处或附近。

在一些实施方案中，编码Cas蛋白的核苷酸序列存在于重组表达载体中。在某些情况下，重组表达载体是病毒构建体，例如重组腺相关病毒构建体、重组腺病毒构建体、重组慢病毒构建体等。例如，病毒载体可以基于痘苗病毒、脊髓灰质炎病毒、腺病毒、腺相关病毒、SV40、单纯疱疹病毒、人类免疫缺陷病毒等。逆转录病毒载体可以基于鼠白血病病毒、脾坏死病毒和源自逆转录病毒的载体，所述逆转录病毒如劳斯肉瘤病毒、哈维肉瘤病毒、禽白血病病毒、慢病毒、人类免疫缺陷病毒、骨髓增生性肉瘤病毒、乳腺瘤病毒等。有用的表达载体是本领域技术人员已知的，并且许多是可商购的。通过例子提供以下载体用于真核宿主细胞：pXT1、pSG5、pSVK3、pBPV、pMSG和pSVLSV40。然而，如果与宿主细胞相容，也可以使用任何其他载体。

根据所使用的靶细胞/表达系统，可以在表达载体中使用许多转录和翻译控制元件中的任何一种，包括启动子、转录增强子、转录终止子等。有用的启动子可以源自病毒或任何生物体，例如原核或真核生物体。合适的启动子包括但不限于SV40早期启动子、小鼠乳腺瘤病毒长末端重复序列(LTR)启动子；腺病毒主要晚期启动子(Ad MLP)；单纯疱疹病毒(HSV)启动子；巨细胞病毒(CMV)启动子如CMV即时早期启动子区(CMVIE)、劳斯肉瘤病毒(RSV)启动子、人U6小核启动子(U6)、增强的U6启动子、人H1启动子(H1)等。

可以将Cas蛋白作为Cas多肽、编码Cas多肽的mRNA或包含编码Cas多肽的核苷酸序列的重组表达载体引入细胞(例如，用于离体疗法的诸如原代细胞的细胞，或诸如在患者中的体内细胞)中。

2.经化学修饰的指导RNA(gRNA)

用于在基因组修饰的CRISPR/Cas系统中使用的经修饰的gRNA通常包含与靶核酸序列互补的指导序列和与Cas蛋白相互作用的支架区域。

经修饰的指导RNA的指导序列可以是与靶多核苷酸序列(例如，靶DNA序列)具有足够的互补性以与靶序列杂交并指导CRISPR复合物与靶序列的序列特异性结合的任何多核苷酸序列。在一些实施方案中，当使用合适的比对算法进行最佳比对时，在经修饰的指导RNA的指导序列与其对应的靶序列之间的互补程度是约或多于约50％、60％、75％、80％、85％、90％、95％、97.5％、99％或更多。最佳比对可以使用用于比对序列的任何合适的算法来确定，所述算法的非限制性例子包括Smith-Waterman算法、Needleman-Wunsch算法、基于Burrows-Wheeler变换的算法(例如Burrows Wheeler Aligner)、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies)、ELAND(Illumina,San Diego,Calif.)、SOAP(可获自soap.genomics.org.cn)和Maq(可获自maq.sourceforge.net)。在一些实施方案中，指导序列的长度是约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个、或更多个核苷酸。在一些情形下，指导序列的长度是约20个核苷酸。在其他情况下，指导序列的长度是约15个核苷酸。在其他情况下，指导序列的长度是约25个核苷酸。可以通过任何合适的测定来评估指导序列指导CRISPR复合物与靶序列的序列特异性结合的能力。可以通过使用例如编辑或切割作为代替来直接或间接评估结合。例如，可以例如通过用编码CRISPR序列的组分的载体转染将足以形成CRISPR复合物CRISPR系统组分(包括待测试的指导序列)提供给具有对应靶序列的宿主细胞，随后评估在靶序列内的编辑或切割。类似地，可以通过提供靶序列、CRISPR复合物的组分(包括待测试的指导序列和与测试指导序列不同的对照指导序列)，并比较在测试和对照指导序列反应之间在靶序列处的结合或切割速率，在试管中评价靶多核苷酸序列的切割。

可以使用上述任何基于网络的软件来选择指导RNA的核苷酸序列。选择DNA靶向RNA的考虑因素包括待使用的Cas蛋白(例如，Cas9多肽)的PAM序列，以及用于使脱靶修饰最小化的策略。工具(如CRISPR设计工具)可以提供用于制备经修饰的gRNA、用于评估靶标修饰效率和/或评估在脱靶位点处的切割的序列。用于选择经修饰的指导RNA的序列的另一个考虑因素包括降低指导序列内二级结构的程度。可以通过任何合适的多核苷酸折叠算法来确定二级结构。一些程序基于计算最小吉布斯自由能。合适算法的例子包括mFold(Zuker和Stiegler,Nucleic Acids Res,9(1981),133-148)、UNAFold包(Markham等人,Methods MolBiol,2008,453:3-31)和RNAfold形式的ViennaRNA包。

经修饰的指导RNA的指导序列的一个或多个核苷酸和/或支架区域的一个或多个核苷酸可以是经修饰的核苷酸。例如，长度为约20个核苷酸的指导序列可以具有1个或更多个，例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个经修饰的核苷酸。在一些情况下，指导序列包括至少2、3、4、5、6、7、8、9、10个或更多个经修饰的核苷酸。在其他情况下，指导序列包括至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、19、20个或更多个经修饰的核苷酸。经修饰的核苷酸可以位于指导序列的任何核酸位置。换句话说，经修饰的核苷酸可以在指导序列的第一个和/或最后一个核苷酸处或附近，和/或在其间的任何位置处。例如，对于长度为20个核苷酸的指导序列，一个或多个经修饰的核苷酸可以位于指导序列的核酸位置1、位置2、位置3、位置4、位置5、位置6、位置7、位置8、位置9、位置10、位置11、位置12、位置13、位置14、位置15、位置16、位置17、位置18、位置19和/或位置20。在某些情况下，指导序列的约10％至约30％，例如约10％至约25％、约10％至约20％、约10％至约15％、约15％至约30％、约20％至约30％或约25％至约30％可以包含经修饰的核苷酸。在其他情况下，指导序列的约10％至约30％，例如约10％、约11％、约12％、约13％、约14％、约15％、约16％、约17％、约18％、约19％、约20％、约21％、约22％、约23％、约24％、约25％、约26％、约27％、约28％、约29％或约30％可以包含经修饰的核苷酸。

在一些实施方案中，经修饰的指导RNA的支架区域含有一个或多个经修饰的核苷酸。例如，长度为约80个核苷酸的支架区域可以具有1个或更多个，例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、76、77、78、79、80个或更多个经修饰的核苷酸。在一些情形下，支架区域包含至少2、3、4、5、6、7、8、9、10个或更多个经修饰的核苷酸。在其他情况下，支架区域包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、19、20个或更多个经修饰的核苷酸。经修饰的核苷酸可以位于支架区域的任何核酸位置。例如，经修饰的核苷酸可以在支架区域的第一个和/或最后一个核苷酸处或附近，和/或在其间的任何位置处。例如，对于长度为约80个核苷酸的支架区域，一个或多个经修饰的核苷酸可以位于序列的核酸位置1、位置2、位置3、位置4、位置5、位置6、位置7、位置8、位置9、位置10、位置11、位置12、位置13、位置14、位置15、位置16、位置17、位置18、位置19、位置20、位置21、位置22、位置23、位置24、位置25、位置26、位置27、位置28、位置29、位置30、位置31、位置32、位置33、位置34、位置35、位置36、位置37、位置38、位置39、位置40、位置41、位置42、位置43、位置44、位置45、位置46、位置47、位置48、位置49、位置50、位置51、位置52、位置53、位置54、位置55、位置56、位置57、位置58、位置59、位置60、位置61、位置62、位置63、位置64、位置65、位置66、位置67、位置68、位置69、位置70、位置71、位置72、位置73、位置74、位置75、位置76、位置77、位置78、位置79、和/或位置80。在一些情形下，支架区域的约1％至约10％，例如约1％至约8％、约1％至约5％、约5％至约10％或约3％至约7％可以包含经修饰的核苷酸。在其他情况下，支架区域的约1％至约10％，例如约1％、约2％、约3％、约4％、约5％、约6％、约7％、约8％、约9％或约10％可以包含经修饰的核苷酸。

指导RNA的经修饰的核苷酸可以包括核糖(例如，糖)基团、磷酸基团、核碱基或其任何组合中的修饰。在一些实施方案中，核糖基团中的修饰包括在核糖的2'位置处的修饰。

在一些实施方案中，经修饰的核苷酸包括2'氟-阿拉伯糖核酸、三环-DNA(tc-DNA)、肽核酸、环己烯核酸(CeNA)、锁核酸(LNA)、乙烯桥接核酸(ENA)、异种核酸(XNA)、磷酰二胺吗啉代、或其组合。

经修饰的核苷酸或核苷酸类似物可以包括糖和/或骨架修饰的核糖核苷酸(即，包括对磷酸酯-糖骨架的修饰)。例如，天然或自然RNA的磷酸二酯键可以被修饰以包括氮或硫杂原子中的至少一个。在一些骨架修饰的核糖核苷酸中，与相邻核糖核苷酸连接的磷酸酯基团可以被经修饰的基团(例如，硫代磷酸酯基团)替代。在优选的糖修饰的核糖核苷酸中，2'部分是选自H、OR、R、卤基、SH、SR、NH₂、NHR、NR₂或ON的基团，其中R是C₁-C₆烷基、烯基或炔基，并且卤基是F、Cl、Br或I。

在一些实施方案中，经修饰的核苷酸含有糖修饰。糖修饰的非限制性例子包括2'-脱氧-2'-氟-寡核糖核苷酸(2'-氟-2'-脱氧胞苷-5'-三磷酸酯、2'-氟-2'-脱氧尿苷-5'-三磷酸酯)、2'-脱氧-2'-脱氨寡核糖核苷酸(2'-氨基-2'-脱氧胞苷-5'-三磷酸酯、2'-氨基-2'-脱氧尿苷-5'-三磷酸酯)、2'-O-烷基寡核糖核苷酸、2'-脱氧-2'-C-烷基寡核糖核苷酸(2'-O-甲基胞苷-5'-三磷酸酯、2'-甲基尿苷-5'-三磷酸酯)、2'-C-烷基寡核糖核苷酸和其异构体(2'-阿糖胞苷-5'-三磷酸酯、2'-阿糖尿苷-5'-三磷酸酯)、叠氮基三磷酸酯(2'-叠氮基-2'-脱氧胞苷-5'-三磷酸酯、2'-叠氮基-2'-脱氧尿苷-5'-三磷酸酯)以及它们的组合。

在一些实施方案中，经修饰的指导RNA含有一个或多个2'-氟、2'-氨基和/或2'-硫代修饰。在一些情形下，修饰是2'-氟-胞苷、2'-氟-尿苷、2'-氟-腺苷、2'-氟-鸟苷、2'-氨基-胞苷、2'-氨基-尿苷、2'-氨基-腺苷、2'-氨基-鸟苷、2,6-二氨基嘌呤、4-硫代-尿苷、5-氨基-烯丙基-尿苷、5-溴-尿苷、5-碘-尿苷、5-甲基-胞苷、核糖-胸苷、2-氨基嘌呤、2'-氨基-丁酰基-芘-尿苷、5-氟-胞苷、和/或5-氟-尿苷。

在哺乳动物RNA上发现了多于96种天然存在的核苷修饰。参见例如Limbach等人,Nucleic Acids Research,22(12):2183-2196(1994)。核苷酸和经修饰的核苷酸和核苷的制备是本领域熟知的，并且描述于例如美国专利号4,373,071、4,458,066、4,500,707、4,668,777、4,973,679、5,047,524、5,132,418、5,153,319、5,262,530、和5,700,642中。适合如本文所述使用的许多经修饰的核苷和经修饰的核苷酸是可商购的。核苷可以是天然存在的核苷的类似物。在一些情况下，类似物是二氢尿苷、甲基腺苷、甲基胞苷、甲基尿苷、甲基假尿苷、硫尿苷、脱氧胞苷和脱氧尿苷。

在一些情况下，本文所述的经修饰的指导RNA包含核碱基修饰的核糖核苷酸，即含有至少一个非天然存在的核碱基而不是天然存在的核碱基的核糖核苷酸。可掺入经修饰的核苷和经修饰的核苷酸中的经修饰的核碱基的非限制性例子包括m5C(5-甲基胞苷)、m5U(5-甲基尿苷)、m6A(N6-甲基腺苷)、s2U(2-硫尿苷)、Um(2'-O-甲基尿苷)、m1A(1-甲基腺苷)、m2A(2-甲基腺苷)、Am(2-1-O-甲基腺苷)、ms2m6A(2-甲硫基-N6-甲基腺苷)、i6A(N6-异戊烯基腺苷)、ms2i6A(2-甲硫基-N6-异戊烯基腺苷)、io6A(N6-(顺式-羟基异戊烯基)腺苷)、ms2io6A(2-甲硫基-N6-(顺式-羟基异戊烯基)腺苷)、g6A(N6-甘氨酰氨基甲酰基腺苷)、t6A(N6-苏氨酰氨基甲酰基腺苷)、ms2t6A(2-甲硫基-N6-苏氨酰氨基甲酰基腺苷)、m6t6A(N6-甲基-N6-苏氨酰氨基甲酰基腺苷)、hn6A(N6-羟基正缬氨酰氨基甲酰基腺苷)、ms2hn6A(2-甲硫基-N6-羟基正缬氨酰氨基甲酰基腺苷)、Ar(p)(2-O-核糖基腺苷(磷酸酯))、I(肌苷)、m11(1-甲基肌苷)、m'Im(1,2'-O-二甲基肌苷)、m3C(3-甲基胞苷)、Cm(2T-O-甲基胞苷)、s2C(2-硫胞苷)、ac4C(N4-乙酰胞苷)、f5C(5-甲酰胞苷)、m5Cm(5,2-0-二甲基胞苷)、ac4Cm(N4乙酰基2TO甲基胞苷)、k2C(赖胞苷)、m1G(1-甲基鸟苷)、m2G(N2-甲基鸟苷)、m7G(7-甲基鸟苷)、Gm(2'-O-甲基鸟苷)、m22G(N2,N2-二甲基鸟苷)、m2Gm(N2,2'-O-二甲基鸟苷)、m22Gm(N2,N2,2'-O-三甲基鸟苷)、Gr(p)(2'-O-核糖基鸟苷(磷酸酯))、yW(怀丁苷)、o2yW(过氧怀丁苷)、OHyW(羟基怀丁苷)、OHyW*(未修饰的羟基怀丁苷)、imG(怀俄苷)、mimG(甲基鸟苷)、Q(辫苷)、oQ(环氧辫苷)、galQ(半乳糖基-辫苷)、manQ(甘露糖基-辫苷)、preQo(7-氰基-7-去氮杂鸟苷)、preQi(7-氨基甲基-7-去氮杂鸟苷)、G(古嘌苷)、D(二氢尿苷)、m5Um(5,2'-O-二甲基尿苷)、s4U(4-硫尿苷)、m5s2U(5-甲基-2-硫尿苷)、s2Um(2-硫代-2'-O-甲基尿苷)、acp3U(3-(3-氨基-3-羧丙基)尿苷)、ho5U(5-羟基尿苷)、mo5U(5-甲氧基尿苷)、cmo5U(尿苷5-氧基乙酸)、mcmo5U(尿苷5-氧基乙酸甲酯)、chm5U(5-(羧基羟基甲基)尿苷)、mchm5U(5-(羧基羟基甲基)尿苷甲酯)、mcm5U(5-甲氧基羰基甲基尿苷)、mcm5Um(S-甲氧基羰基甲基-2-O-甲基尿苷)、mcm5s2U(5-甲氧基羰基甲基-2-硫尿苷)、nm5 s2U(5-氨基甲基-2-硫尿苷)、mnm5U(5-甲基氨基甲基尿苷)、mnm5s2U(5-甲基氨基甲基-2-硫尿苷)、mnm5se2U(5-甲基氨基甲基-2-硒尿苷)、ncm5U(5-氨基甲酰基甲基尿苷)、ncm5Um(5-氨基甲酰基甲基-2'-O-甲基尿苷)、cmnm5U(5-羧基甲基氨基甲基尿苷)、cnmm5Um(5-羧基甲基氨基甲基-2-L-O-甲基尿苷)、cmnm5s2U(5-羧甲基氨基甲基-2-硫尿苷)、m62A(N6,N6-二甲基腺苷)、Tm(2'-O-甲基肌苷)、m4C(N4-甲基胞苷)、m4Cm(N4,2-O-二甲基胞苷)、hm5C(5-羟甲基胞苷)、m3U(3-甲基尿苷)、cm5U(5-羧甲基尿苷)、m6Am(N6,T-O-二甲基腺苷)、m62Am(N6,N6,O-2-三甲基腺苷)、m2'7G(N2,7-二甲基鸟苷)、m2'2'7G(N2,N2,7-三甲基鸟苷)、m3Um(3,2T-O-二甲基尿苷)、m5D(5-甲基二氢尿苷)、f5Cm(5-甲酰基-2'-O-甲基胞苷)、m1Gm(1,2'-O-二甲基鸟苷)、m'Am(1,2-O-二甲基腺苷)丙因甲基尿苷)(1,2-O-dimethyl adenosine)irinomethyluridine)、tm5s2U(S-牛磺酸甲基-2-硫尿苷)、imG-14(4-去甲基鸟苷)、imG2(异鸟苷)、或ac6A(N6-乙酰基腺苷)、次黄嘌呤、肌苷、8-氧代-腺嘌呤、其7-经取代的衍生物、二氢尿嘧啶、假尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-氨基尿嘧啶、5-(C₁-C₆)-烷基尿嘧啶、5-甲基尿嘧啶、5-(C₂-C₆)-烯基尿嘧啶、5-(C₂-C₆)-炔基尿嘧啶、5-(羟甲基)尿嘧啶、5-氯尿嘧啶、5-氟尿嘧啶、5-溴尿嘧啶、5-羟基胞嘧啶、5-(C₁-C₆)-烷基胞嘧啶、5-甲基胞嘧啶、5-(C₂-C₆)-烯基胞嘧啶、5-(C₂-C₆)-炔基胞嘧啶、5-氯胞嘧啶、5-氟胞嘧啶、5-溴胞嘧啶、N²-二甲基鸟嘌呤、7-去氮杂鸟嘌呤、8-氮杂鸟嘌呤、7-去氮杂-7-经取代的鸟嘌呤、7-去氮杂-7-(C2-C6)炔基鸟嘌呤、7-去氮杂-8-经取代的鸟嘌呤、8-羟基鸟嘌呤、6-硫鸟嘌呤、8-氧代鸟嘌呤、2-氨基嘌呤、2-氨基-6-氯嘌呤、2,4-二氨基嘌呤、2,6-二氨基嘌呤、8-氮杂嘌呤、经取代的7-去氮杂嘌呤、7-去氮杂-7-经取代的嘌呤、7-去氮杂-8-经取代的嘌呤及它们的组合。

在一些实施方案中，指导RNA的磷酸骨架被改变。经修饰的gRNA可以包含一种或多种硫代磷酸酯、氨基磷酸酯(例如，N3'-P5'-氨基磷酸酯(NP))、2'-O-甲氧基-乙基(2'MOE)、2'-O-甲基-乙基(2'ME)、和/或甲基膦酸酯键。

在特定实施方案中，指导RNA的指导序列的一个或多个经修饰的核苷酸和/或支架区域的一个或多个经修饰的核苷酸包括2'-O-甲基(M)核苷酸、2'-O-甲基3'-硫代磷酸酯(MS)核苷酸、2'-O-甲基-3'-膦酰基乙酸酯(MP)核苷酸、2'-O-甲基3'硫代PACE(MSP)核苷酸或其组合。在一些情形下，指导RNA包含一个或多个MS核苷酸。在其他情形下，指导RNA包含一个或多个MP/MSP核苷酸。在又其他情形下，指导RNA包含一个或多个MS核苷酸和一个或多个MP/MSP核苷酸。在另外的情形下，指导RNA不包含M核苷酸。在某些情形下，指导RNA包含一个或多个MS核苷酸和/或一个或多个MP/MSP核苷酸，并且进一步包含一个或多个M核苷酸。在某些其他情形下，MS核苷酸和/或MP/MSP核苷酸是存在于指导RNA中的仅有的经修饰的核苷酸。

在一些方面，本文所述的经修饰的指导RNA和Cas蛋白(或编码其的mRNA)可以以特定量、比率或范围存在于组合物(例如，CRISPR/Cas反应混合物)中。例如，反应混合物可以包含：a)1至200pmol的指导RNA；b)1至100pmol的Cas蛋白，或0.01至3.0pmol的编码Cas蛋白的DNA或mRNA；c)摩尔比为0.1:1至3:1的指导RNA和Cas蛋白；和/或d)摩尔比为1:1至200:1的指导RNA和编码Cas蛋白的DNA或mRNA。例如，在一些方面，反应混合物包含多个细胞；和i)1至100pmol的指导RNA(或pegRNA)/100,000个细胞，和/或ii)1至50pmol的Cas蛋白或0.01至3.0pmol的编码Cas蛋白的DNA或mRNA/100,000个细胞。类似地，在一些方面，反应混合物可以每1pmol编码Cas蛋白的DNA或mRNA包含至少、约或至多10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、或200pmol指导RNA、或在由前述值的任何组合界定的范围内的量。在一些方面，指导RNA与编码Cas蛋白的DNA或mRNA的摩尔比为至少、约或至多200:1、190:1、180:1、170:1、160:1、150:1、140:1、130:1、120:1、110:1、100:1、90:1、80:1、70:1、60:1、50:1、40:1、30:1、20:1或10:1、或在由前述比率的任何组合限定的范围内的比率。在一些方面，根据本公开文本的反应混合物可以每1pmol Cas蛋白包含至少、约或至多1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9或3.0pmol的指导RNA、或在由前述值的任何组合界定的范围内的量。

应当注意，可以将本文所述的任何修饰组合并掺入经修饰的gRNA的指导序列和/或支架区域中。

在一些情况下，指导RNA还包含结构修饰，如茎环，例如MS2茎环或四环。

可以通过本领域普通技术人员已知的任何方法合成指导RNA。可以使用2'-O-硫代氨基甲酸酯保护的核苷亚磷酰胺合成经修饰的gRNA。方法描述于例如Dellinger等人,J.American Chemical Society 133,11540-11556(2011)；Threlfall等人,Organic&Biomolecular Chemistry 10,746-754(2012)；和Dellinger等人,J.American ChemicalSociety125,940-950(2003)中。

可以将经化学修饰的gRNA或pegRNA与任何CRISPR相关技术例如和RNA指导的技术一起使用。如本文所述，指导RNA可以充当任何Cas蛋白或其变体或片段(包括任何工程化或人造Cas9多肽)的指导物。经修饰的gRNA或pegRNA可以靶向所分离的原代细胞中的DNA和/或RNA分子，以用于离体疗法或体内(例如，在动物中)疗法。本文公开的方法可以应用于基因组编辑、基因调节、成像和任何其他基于CRISPR的应用。

3.供体修复模板

在一些实施方案中，本公开文本提供了重组供体修复模板，其包含与Cas蛋白(例如，Cas9核酸酶)切割位点任一侧的靶DNA序列(例如，靶基因或基因座)的部分同源的两个同源臂。在某些情形下，重组供体修复模板包含报告盒，所述报告盒包含编码报告多肽(例如，可检测多肽、荧光多肽或选择性标记物)的核苷酸序列；和两个同源臂，所述两个同源臂位于报告盒的侧翼并且与Cas蛋白切割位点任一侧的靶DNA的部分同源。报告盒可以进一步包含编码自切割肽的序列、一个或多个核定位信号和/或荧光多肽(例如，超折叠GFP(sfGFP))。

在一些实施方案中，同源臂具有相同的长度。在其他实施方案中，同源臂具有不同的长度。同源臂可以是至少约10个碱基对(bp)，例如至少约10bp、15bp、20bp、25bp、30bp、35bp、45bp、55bp、65bp、75bp、85bp、95bp、100bp、150bp、200bp、250bp、300bp、350bp、400bp、450bp、500bp、550bp、600bp、650bp、700bp、750bp、800bp、850bp、900bp、950bp、1000bp、1.1千碱基(kb)、1.2kb、1.3kb、1.4kb、1.5kb、1.6kb、1.7kb、1.8kb、1.9kb、2.0kb、2.1kb、2.2kb、2.3kb、2.4kb、2.5kb、2.6kb、2.7kb、2.8kb、2.9kb、3.0kb、3.1kb、3.2kb、3.3kb、3.4kb、3.5kb、3.6kb、3.7kb、3.8kb、3.9kb、4.0kb、或更长。同源臂可以是约10bp至约4kb，例如约10bp至约20bp、约10bp至约50bp、约10bp至约100bp、约10bp至约200bp、约10bp至约500bp、约10bp至约1kb、约10bp至约2kb、约10bp至约4kb、约100bp至约200bp、约100bp至约500bp、约100bp至约1kb、约100bp至约2kb、约100bp至约4kb、约500bp至约1kb、约500bp至约2kb、约500bp至约4kb、约1kb至约2kb、约1kb至约2kb、约1kb至约4kb、或约2kb至约4kb。

可以将供体修复模板克隆到表达载体中。可以使用本领域普通技术人员已知的常规的基于病毒和非病毒的表达载体。

替代重组供体修复模板，可以将单链寡脱氧核苷酸(ssODN)供体模板用于同源重组介导的修复。ssODN可用于在靶DNA内引入短修饰。例如，ssODN适用于精确校正遗传突变(如SNP)。ssODN可以在Cas蛋白切割的靶位点的每一侧含有两个侧翼同源序列，并且可以相对于靶DNA以有义或反义方向取向。每个侧翼序列可以是至少约10个碱基对(bp)，例如至少约10bp、15bp、20bp、25bp、30bp、35bp、40bp、45bp、50bp、55bp、60bp、65bp、70bp、75bp、80bp、85bp、90bp、95bp、100bp、150bp、200bp、250bp、300bp、350bp、400bp、450bp、500bp、550bp、600bp、650bp、700bp、750bp、800bp、850bp、900bp、950bp、1kb、2kb、4kb、或更长。在一些实施方案中，每个同源臂为约10bp至约4kb，例如约10bp至约20bp、约10bp至约50bp、约10bp至约100bp、约10bp至约200bp、约10bp至约500bp、约10bp至约1kb、约10bp至约2kb、约10bp至约4kb、约100bp至约200bp、约100bp至约500bp、约100bp至约1kb、约100bp至约2kb、约100bp至约4kb、约500bp至约1kb、约500bp至约2kb、约500bp至约4kb、约1kb至约2kb、约1kb至约2kb、约1kb至约4kb、或约2kb至约4kb。ssODN的长度可以是至少约25个核苷酸(nt)，例如至少约25nt、30nt、35nt、40nt、45nt、50nt、55nt、60nt、65nt、70nt、75nt、80nt、85nt、90nt、95nt、100nt、150nt、200nt、250nt、300nt、或更长。在一些实施方案中，ssODN的长度为约25至约50；约50至约100；约100至约150；约150至约200；约200至约250；约250至约300；或约25nt至约300nt。

在一些实施方案中，ssODN模板包含至少一个，例如1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500个、或更多个本文所述的经修饰的核苷酸。在一些情形下，ssODN的序列的至少1％、5％、10％、20％、30％、40％、50％、60％、70％、80％、90％或99％包括经修饰的核苷酸。在一些实施方案中，经修饰的核苷酸位于ssODN的一个或两个末端。经修饰的核苷酸可以在第一、第二、第三、第四、第五、第六、第七、第八、第九或第十末端核苷酸或其任何组合处。例如，经修饰的核苷酸可以在ssODN模板两端的三个末端核苷酸处。另外，经修饰的核苷酸可以位于末端的内部。

在一些方面，例如先导编辑，不需要外源DNA修复模板。例如，本文所述的经修饰的pegRNA包含含有对靶核酸的一个或多个编辑的逆转录酶序列(例如，在接近引物结合位点序列的3'端)，当进行靶核酸的先导编辑时，其被先导编辑器Cas蛋白用作模板。

4.靶DNA

在CRISPR/Cas系统中，靶DNA序列之后可以紧接着是原型间隔子邻近基序(PAM)序列。靶DNA位点可以紧接着位于对所用Cas蛋白的细菌种类具有特异性的PAM序列的5'。例如，源自酿脓链球菌的Cas9的PAM序列是NGG；源自脑膜炎奈瑟氏菌的Cas9的PAM序列是NNNNGATT；源自嗜热链球菌的Cas9的PAM序列是NNAGAA；并且源自齿垢密螺旋体的Cas9的PAM序列是NAAAAC。在一些实施方案中，PAM序列可以是5'-NGG，其中N是任何核苷酸；5'-NRG，其中N是任何核苷酸并且R是嘌呤；或5'-NNGRR，其中N是任何核苷酸并且R是嘌呤。对于酿脓链球菌系统，选定的靶DNA序列应紧接在(例如，位于5')5'NGG PAM之前，其中N是任何核苷酸，使得DNA靶向RNA的指导序列(例如，经修饰的gRNA)与相反链形成碱基对以介导在PAM序列上游约3个碱基对处的切割。

在一些实施方案中，当使用合适的比对算法进行最佳比对时，在DNA靶向RNA(例如，指导RNA)的指导序列与其对应的靶DNA序列之间的互补程度是约或多于约50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多。最佳比对可以使用用于比对序列的任何合适的算法来确定，所述算法的非限制性例子包括Smith-Waterman算法、Needleman-Wunsch算法、基于Burrows-Wheeler变换的算法(例如Burrows Wheeler Aligner)、ClustalW、Clustal X、BLAT、Novoalign(NovocraftTechnologies，马来西亚雪兰莪州)和ELAND(Illumina，加利福尼亚州圣地亚哥)。

可以使用基于网络的软件(如ZiFiT Targeter软件(Sander等人,2007,NucleicAcids Res,35:599-605；Sander等人,2010,Nucleic Acids Res,38:462-468)、E-CRISP(Heigwer等人,2014,Nat Methods,11:122-123)、RGEN工具(Bae等人,2014,Bioinformatics,30(10):1473-1475)、CasFinder(Aach等人,2014,bioRxiv)、DNA2.0 gNRA设计工具(DNA2.0，加利福尼亚州门洛帕克)和CRISPick设计工具(马萨诸塞州剑桥市布罗德研究所))在预定义的基因组序列(基因)中选择靶DNA位点。此类工具分析基因组序列(例如，相关基因或基因座)并鉴定用于基因编辑的合适靶位点。为了评估每个DNA靶向RNA(例如，经修饰的gRNA)的脱靶基因修饰，基于碱基配对错配同一性、位置和分布的定量特异性分析进行脱靶位点的计算预测。

5.调节基因表达

可以将CRISPR/Cas系统用于调节基因表达，如抑制基因表达或激活基因表达。作为非限制性例子，包含Cas9变体或片段和可结合靶DNA序列的gRNA的复合物可以阻断或阻碍RNA聚合酶的转录启动和/或延伸。这进而可以抑制或阻遏靶DNA的基因表达。可替代地，包含不同Cas9变体或片段和可结合靶DNA序列的gRNA的复合物可诱导或激活靶DNA的基因表达。

用于进行CRISPR干扰(CRISPRi)以灭活或减少基因表达的方法的详细描述可以见于例如Larson等人,Nature Protocols,2013,8(11):2180-2196、和Qi等人,Cell,152,2013,1173-1183。在CRISPRi中，gRNA-Cas9变体复合物可以结合蛋白质编码区域的非模板链并阻断转录延伸。在一些情况下，当gRNA-Cas9变体复合物结合基因的启动子区域时，复合物阻止或阻碍转录启动。

用于进行CRISPR激活以增加基因表达的方法的详细描述可见于例如Cheng等人,Cell Research,2013,23:1163-1171、Konerman等人,Nature,2015,517:583-588、和美国专利号8,697,359。

对于基于CRISPR的基因表达控制，可以使用缺乏核酸内切酶活性的Cas蛋白(例如，Cas9多肽)的催化失活变体。在一些实施方案中，Cas蛋白是在RuvC样和HNH核酸酶结构域中含有至少两个点突变的Cas9变体。在一些实施方案中，Cas9变体具有D10A和H840A氨基酸取代，其被称为dCas9(Jinek等人,Science,2012,337:816-821；Qi等人,Cell,152(5):1173-1183)。在一些情况下，来自酿脓链球菌的dCas9多肽在位置D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、A987或其任何组合处包含至少一个突变。此类dCas9多肽及其变体的描述提供于例如国际专利申请公开号WO 2013/176772中。dCas9酶可以含有在D10、E762、H983或D986处的突变，以及在H840或N863处的突变。在一些情况下，dCas9酶含有D10A或D10N突变。此外，dCas9酶可以包含H840A、H840Y或H840N。在一些情况下，dCas9酶包含D10A和H840A；D10A和H840Y；D10A和H840N；D10N和H840A；D10N和H840Y；或D10N和H840N取代。取代可以是保守或非保守取代，以使Cas9多肽催化失活并能够结合靶DNA。

在某些实施方案中，dCas9多肽是催化失活的，如核酸酶活性有缺陷。在一些情形下，dCas9酶或其变体或片段可以阻断靶序列的转录，并且在一些情况下，阻断RNA聚合酶。在其他情形下，dCas9酶或其变体或片段可以激活靶序列的转录。

在某些实施方案中，缺乏核酸内切活性的Cas9变体(例如，dCas9)可以与转录抑制结构域(例如，Kruppel相关盒(KRAB)结构域)或转录激活结构域(例如，VP16反式激活结构域)融合。在一些实施方案中，Cas9变体是包含dCas9和转录因子(例如，RNA聚合酶ω因子、热休克因子1或其片段)的融合多肽。在其他实施方案中，Cas9变体是包含dCas9和DNA甲基化酶、组蛋白乙酰化酶或其片段的融合多肽。

对于由RNA结合和/或RNA切割介导的基因表达的基于CRISPR的控制，可以使用合适的具有核糖核酸内切酶活性的Cas蛋白(例如，Cas9多肽)变体，如例如O'Connell等人,Nature,2014,516:263-266中所述。其他有用的Cas蛋白(例如，Cas9)变体描述于例如美国专利号9,745,610中。可以切割RNA的其他CRISPR相关酶包括Csy4核糖核酸内切酶、CRISPR相关Cas6酶、Cas5家族成员酶、Cas6家族成员酶、I型CRISPR系统核糖核酸内切酶、II型CRISPR系统核糖核酸内切酶、III型CRISPR系统核糖核酸内切酶及其变体。

在基于CRISPR的RNA切割的一些实施方案中，将含有PAM序列(例如，PAMmer)的DNA寡核苷酸与本文所述的经修饰的gRNA和Cas蛋白(例如，Cas9)变体一起使用以结合并切割单链RNA转录物。合适的PAMmer序列的详细描述见于例如O'Connell等人,Nature,2014,516:263-266。

在一些实施方案中，将多种经修饰的gRNA和/或pegRNA用于靶向靶基因的不同区域以调节该靶基因的基因表达。与单独的每种经修饰的gRNA相比，多种经修饰的gRNA和/或pegRNA可以提供单个靶基因的基因表达的协同调节(例如，抑制或激活)。在其他实施方案中，将多种经修饰的gRNA/pegRNA用于调节至少两种不同靶基因的基因表达。

B.离体细胞

在本方法的一些方面，靶序列在细胞中。本方法可用于编辑、调节、切割、切口或结合任何相关细胞中的核酸中的靶序列，该相关细胞包括原代细胞、永生化细胞、来自细胞系的细胞、来自细胞培养物的细胞等。在一些实施方案中，细胞是具有一种或挑战性条件的细胞类型。例如，具有高核酸酶(例如，核糖核酸酶、核酸外切酶、核糖核酸外切酶)表达、浓度和/或活性的细胞，例如，高特定核酸酶的细胞类型。

本文公开的组合物和方法可用于编辑或调节相关原代细胞中靶核酸的表达。原代细胞可以是从任何多细胞生物体分离的细胞，例如，植物细胞(例如，水稻细胞、小麦细胞、番茄细胞、拟南芥(Arabidopsis thaliana)细胞、玉米(Zea mays)细胞等)、来自多细胞原生生物的细胞、来自多细胞真菌的细胞、动物细胞(如来自无脊椎动物(例如，果蝇、刺胞动物、棘皮动物、线虫等)的细胞或来自脊椎动物(例如，鱼、两栖动物、爬行动物、鸟、哺乳动物等)的细胞)、来自人的细胞、来自健康人的细胞、来自人患者的细胞、来自癌症患者的细胞等。在一些情况下，可以将具有基因组编辑或诱导的基因调节的原代细胞移植至受试者(例如，患者)。例如，原代细胞可以源自待治疗的受试者(例如，患者)。

可能关注任何类型的原代细胞，如干细胞，例如胚胎干细胞、诱导多能干细胞、成体干细胞(例如，间充质干细胞、神经干细胞、造血干细胞、器官干细胞)、祖细胞、体细胞(例如，成纤维细胞、肝细胞、心脏细胞、肝细胞、胰腺细胞、肌肉细胞、皮肤细胞、血细胞、神经细胞、免疫细胞)和身体(例如，人体)的任何其他细胞。原代细胞通常源自受试者，例如动物受试者或人受试者，并允许其在体外生长有限的传代次数。在一些实施方案中，细胞是疾病细胞或源自患有疾病的受试者。例如，细胞可以是癌细胞或肿瘤细胞。

可以通过任何标准方法从受试者收获原代细胞。例如，可以通过组织活检或细针抽吸来收获来自组织(如皮肤、肌肉、骨髓、脾、肝、肾、胰腺、肺、肠、胃等)的细胞。可以从全血、血浆或血清中分离血细胞和/或免疫细胞。在一些情况下，合适的原代细胞包括外周血单个核细胞(PBMC)、外周血淋巴细胞(PBL)和其他血细胞亚群，所述血细胞亚群如但不限于T细胞、自然杀伤细胞、单核细胞、自然杀伤T细胞、单核细胞前体细胞、造血干细胞和祖细胞(HSPC)(如CD34+HSPC)、或非多能干细胞。在一些情况下，细胞可以是任何免疫细胞，包括但不限于任何T细胞，如肿瘤浸润细胞(TIL)、CD3+T细胞、CD4+T细胞、CD8+T细胞或任何其他类型的T细胞。T细胞还可以包括记忆T细胞、记忆干细胞T细胞或效应T细胞。T细胞还可以偏向特定群体和表型。例如，T细胞可以偏斜以在表型上包含CD45RO(-)、CCR7(+)、CD45RA(+)、CD62L(+)、CD27(+)、CD28(+)和/或IL-7Ra(+)。可以选择合适的细胞，其包含选自包含CD45RO(-)、CCR7(+)、CD45RA(+)、CD62L(+)、CD27(+)、CD28(+)和/或IL-7Ra(+)的列表的一种或多种标记物。可以根据例如美国专利号7,682,828、8,058,065、8,530,238、8,871,504、8,900,871和8,791,248中所述的标准方案从经分化的细胞产生诱导多能干细胞。

C.离体疗法

本文所述的方法可用于离体疗法。离体疗法可以包括向受试者(例如，患者)施用在生物体外产生或修饰的组合物(例如，细胞)。在一些实施方案中，可以通过本文公开的方法产生或修饰组合物(例如，包含细胞)。例如，离体疗法可以包括向受试者(例如，患者)施用在生物体外产生或修饰的原代细胞，其中原代细胞已经被根据本公开文本的方法在体外培养和编辑/调节，所述方法包括使原代细胞中的靶核酸与本文所述的一种或多种经修饰的gRNA和Cas蛋白(例如，Cas9多肽)或其变体或片段、编码Cas蛋白(例如，Cas9多肽)或其变体或片段的mRNA、或包含编码Cas蛋白(例如，Cas9多肽)或其变体或片段的核苷酸序列的重组表达载体接触。

在一些实施方案中，组合物(例如，细胞)可以源自待通过离体疗法治疗的受试者(例如，患者)。在一些实施方案中，离体疗法可以包括基于细胞的疗法，如过继免疫疗法。

在一些实施方案中，用于离体疗法的组合物可以是细胞。细胞可以是原代细胞，包括但不限于外周血单个核细胞(PBMC)、外周血淋巴细胞(PBL)和其他血细胞亚群。原代细胞可以是免疫细胞。原代细胞可以是T细胞(例如，CD3+T细胞、CD4+T细胞和/或CD8+T细胞)、自然杀伤细胞、单核细胞、自然杀伤T细胞、单核细胞前体细胞、造血干细胞或非多能干细胞、干细胞或祖细胞。原代细胞可以是造血干细胞或祖细胞(HSPC)，如CD34+HSPC。原代细胞可以是人细胞。可以分离、选择和/或培养原代细胞。可以离体扩增原代细胞。可以在体内扩增原代细胞。原代细胞可以是CD45RO(-)、CCR7(+)、CD45RA(+)、CD62L(+)、CD27(+)、CD28(+)和/或IL-7Rα(+)。原代细胞对于接受细胞的受试者可以是自体的。或者原代细胞对于受试者可以是非自体的。原代细胞可以是良好操作规范(GMP)相容的药剂。原代细胞可以是治疗患有或有风险患上此类疾病的受试者的疾病的组合疗法的一部分，这些疾病包括癌症、感染、自身免疫性障碍或移植物抗宿主病(GVHD)。

作为离体疗法的非限制性例子，原代细胞可以分离自多细胞生物体(例如，植物、多细胞原生生物、多细胞真菌、无脊椎动物、脊椎动物如人等)，然后使原代细胞内的靶核酸与Cas蛋白和经修饰的gRNA接触。在使靶核酸与Cas蛋白和指导RNA接触后，可以将原代细胞或其后代(例如，源自原代细胞的细胞)返回多细胞生物体。

在一些实施方案中，将Cas蛋白和指导RNA引入到活生物体中，如通过引入到活生物体中或来自活生物体的含血清流体(例如，全血、血浆或血清)中。

D.用于将核酸和/或多肽引入靶细胞中的方法

用于将多肽和核酸引入靶细胞(宿主细胞)的方法是本领域已知的，并且可以用于本方法中，以将核酸(例如，编码Cas蛋白的核苷酸序列、经修饰的指导RNA、用于同源定向修复(HDR)的供体修复模板等)、多肽(如Cas蛋白、聚合酶、脱氨酶等)或RNP(例如，gRNA/Cas蛋白复合物)引入细胞(例如，原代细胞，如干细胞、祖细胞或经分化的细胞)中。合适方法的非限制性例子包括电穿孔、病毒或噬菌体感染、转染、显微注射、缀合、原生质体融合、脂质体转染、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE-右旋糖酐介导的转染、脂质体介导的转染、粒子枪技术、磷酸钙沉淀、直接显微注射、纳米颗粒介导的递送(例如，脂质纳米颗粒介导的递送、聚合物纳米颗粒介导的递送、杂合脂质-聚合物纳米颗粒介导的递送)等。

在一些实施方案中，可以使用递送系统将CRISPR系统的组分引入细胞中。在某些情形下，递送系统包括纳米颗粒、微粒(例如，聚合物微聚合物)、脂质体、胶束、病毒体、病毒颗粒、病毒样颗粒(VLP)、核酸复合物、转染剂、电穿孔剂(例如，使用NEON转染系统)、核转染剂、脂质体转染剂和/或包括待递送的一种或多种组分的缓冲系统。例如，可以将组分与脂质体转染剂混合，使得它们被包封或包装到阳离子亚微米水包油乳剂中。可替代地，可以在没有递送系统的情况下例如作为水溶液递送组分。

制备脂质体和将多肽和核酸包封在脂质体中的方法描述于例如Methods andProtocols,第1卷:Pharmaceutical Nanocarriers:Methods and Protocols.(Weissig编辑).Humana Press,2009和Heyes等人(2005)J Controlled Release 107:276-87中。制备微粒和包封多肽和核酸的方法描述于例如Functional Polymer Colloids andMicroparticles第4卷(Microspheres,microcapsules&liposomes).(Arshady和Guyot编辑).Citus Books,2002和Microparticulate Systems for the Delivery of Proteinsand Vaccines.(Cohen和Bernstein编辑).CRC Press,1996中。有关纳米颗粒(如脂质、聚合物或杂合脂质-聚合物纳米颗粒)的制备的综述，参见Advanced Drug Delivery Reviews2021,第168卷。

E.用于评估基因组编辑效率的方法

为了在功能上测试正确的基因组编辑修饰的存在，可以通过本领域技术人员已知的标准方法分析靶DNA。例如，可以通过使用突变检测试剂盒(IntegratedDNA Technologies，爱荷华州科拉尔维尔)或Guide-it^TM插入缺失鉴定试剂盒(Clontech，加利福尼亚州山景城)测序来鉴定插入缺失突变。可以通过基于PCR的方法，并结合测序或RFLP分析来检测同源定向修复(HDR)、碱基编辑或先导编辑介导的编辑。基于PCR的试剂盒的非限制性例子包括Guide-it突变检测试剂盒(Clontech)和/>基因组切割检测试剂盒(Life Technologies，加利福尼亚州卡尔斯巴德)。也可以使用深度测序，特别是对于大量样品或潜在的靶/脱靶位点。

在某些实施方案中，基因组编辑的效率(例如，特异性)对应于相对于所有基因组编辑事件(包括中靶和脱靶事件)的数量或百分比的中靶基因组编辑事件的数量或百分比。在一些实施方案中，在单细胞或细胞群的水平上，靶区域的编辑效率对应于该靶区域的预期编辑数量。

在一些实施方案中，相对于对应的未修饰的gRNA，本文所述的经修饰的gRNA能够增强细胞(如原代细胞)中靶DNA序列的基因组编辑。基因组编辑可以包括同源定向修复(HDR)(例如，插入、缺失或点突变)、先导编辑、碱基编辑或非同源末端连接(NHEJ)。

在某些实施方案中，与对应的未修饰的gRNA序列相比，在本文所述的指导RNA存在下，细胞中靶DNA序列的核酸酶介导的基因组编辑效率增强至少约5％、10％、15％、20％、25％、30％、35％、40％、45％、0.5倍、0.6倍、0.7倍、0.8倍、0.9倍、1倍、1.1倍、1.2倍、1.3倍、1.4倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍、5.5倍、6倍、6.5倍、7倍、7.5倍、8倍、8.5倍、9倍、9.5倍、10倍、15倍、20倍、25倍、30倍、35倍、40倍、45倍、50倍或更多。在一些其他实施方案中，将效率与具有不同修饰的对应gRNA比较，并实现上述增强水平。例如，可以将在5'端具有1x、2x或3x MS以及在3'端具有2x、3x或4x MP或MSP的gRNA与具有相同数量的MS而不是MP/MSP(即在5'端1x、2x、或3x MS，以及在3'端2x、3x或4x MS)的gRNA进行比较。

F.用于预防或治疗受试者的遗传疾病的方法

可以将经修饰的gRNA应用于遗传疾病的基于靶向核酸酶的疗法。用于精确地校正原代患者细胞的基因组中的基因突变的当前方法可能是非常低效的(有时可以精确地编辑少于1％的细胞)。本文所述的经修饰的gRNA可以增强基因组编辑的活性并增加基于基因组编辑的疗法的功效。在特定实施方案中，可将经修饰的gRNA用于患有遗传疾病的受试者中的基因的体内基因编辑。可以将经修饰的gRNA经由任何合适的施用途径并且以足以增强基于核酸酶的疗法的效果(例如，改进基因组编辑效率)的剂量或量施用于受试者。

本文提供了用于通过校正与疾病相关的遗传突变来预防或治疗有需要的受试者的遗传疾病的方法。所述方法包括以足以校正突变的量向受试者施用本文所述的经修饰的指导RNA。本文还提供了本文所述的经修饰的指导RNA在制备用于通过校正与疾病相关的遗传突变来预防或治疗有需要的受试者的遗传疾病的药剂中的用途。可以将经修饰的指导RNA包含在组合物中，所述组合物还包含Cas蛋白(例如，Cas9多肽)、编码Cas蛋白的mRNA或包含编码Cas蛋白的核苷酸序列的重组表达载体。在一些情形下，将经修饰的指导RNA包含在上述递送系统中。

可以通过所述方法纠正的遗传疾病包括但不限于X连锁重症联合免疫缺陷、镰状细胞贫血、地中海贫血、血友病、瘤形成、癌症、年龄相关性黄斑变性、精神分裂症、三核苷酸重复障碍、脆性X综合征、朊病毒相关障碍、肌萎缩侧索硬化、药物成瘾、自闭症、阿尔茨海默病、帕金森病、囊性纤维化、血液和凝血疾病或障碍、炎症、免疫相关疾病或障碍、代谢疾病、肝脏疾病和障碍、肾脏疾病和障碍、肌肉/骨骼疾病和障碍(例如，肌营养不良、迪谢内肌营养不良)、神经系统和神经元疾病和障碍、心血管疾病和障碍、肺部疾病和障碍、眼部疾病和障碍、病毒感染(例如，HIV感染)等。

实施例

根据以下实施例可以进一步理解本发明传授内容的方面，这些实施例不应被解释为以任何方式限制本发明传授内容的范围。

在随后的实施例中使用各种通用方法和试剂，并且在下面描述以促进对实施例的理解，但是应当理解，根据本文的传授内容，可以采用制备、测试和其他细节的变化和可替代方案。

制备gRNA和mRNA。根据先前描述的程序，在可控孔度玻璃(LGC)上使用2'-O-硫代氨基甲酸酯保护的核苷亚磷酰胺(Sigma-Aldrich和Hongene)在Dr.Oligo 48和96合成仪(Biolytic Lab Performance Inc.)上合成RNA寡聚物。用于合成MP修饰的RNA的2'-O-甲基-3'-O-(二异丙基氨基)-膦基乙酸-1,1-二甲基氰基乙酯-5'-O-二甲氧基三苯甲基核苷购自Glen Research和Hongene。对于含有硫代磷酸酯的寡聚物，偶联反应后的碘氧化步骤被使用3-((N,N-二甲基氨基亚甲基)氨基)-3H-1,2,4-二噻唑-5-硫酮在吡啶-乙腈(3:2)混合物中的0.05M溶液持续6min的硫化步骤替代。除非另有说明，否则用于固相RNA合成的试剂购自Glen Research和Honeywell。通过使用以上可商购的受保护的核苷亚膦酰胺单体，使用改编自先前出版物(参见例如Dellinger等人,2003和Threlfall等人,2012，同上)的方案来合成掺入MP修饰的gRNA中的膦酰基乙酸酯修饰。使用反相高效液相色谱法(RP-HPLC)纯化所有寡核苷酸，并使用与Agilent 6545Q-TOF(飞行时间)质谱仪偶联的Agilent1290Infinity系列LC系统通过液相色谱-质谱法(LC-MS)进行分析。在所有情况下，通过对经纯化的gRNA的质谱中包含多个电荷状态的一系列峰进行解卷积确定的质量与校准仪器的误差内的预期质量相匹配(此测定中使用的质量保证规范是观察到的经纯化的gRNA的质量在计算质量的0.01％内)，从而确认每种合成gRNA的组成。

用5-甲氧基尿苷完全取代的CleanCap Cas9 mRNA购自TriLink(L-7206)。分别编码BE4-Gam蛋白和PE2蛋白的BE4-Gam mRNA和PE2 mRNA作为定制订单通过提供编码序列(其中TriLink添加了自己的专有5'和3'UTR)购自TriLink。定制的mRNA被5-甲基胞苷和假尿苷完全取代，用CleanCap AG加帽并添加多A尾。

细胞培养和核转染。人K562细胞获自ATCC并在补充有10％胎牛血清(gibco)的RPMI 1640+GlutaMax培养基(gibco)中培养。根据制造商的说明使用Lonza4D-Nucleofector(96孔穿梭装置，程序FF-120)，利用Lonza SF细胞系试剂盒(V4SC-2960)核转染K562细胞(传代次数在4至14内)，其中每次转染将在20μL的SF缓冲液中的20万个细胞与6μL的在PBS缓冲液中的125pmol gRNA和1.87pmol BE4-Gam mRNA组合以用于胞苷碱基编辑，或与8μL的在PBS缓冲液中的125pmol pegRNA以及100pmol切口gRNA和1.35pmol PE2 mRNA组合以用于先导编辑。将细胞在37℃下在环境氧气和5％二氧化碳中培养，并在转染后48h收获。

人Jurkat Clone E6-1细胞获自ATCC并在补充有10％胎牛血清的RPMI 1640+GlutaMax培养基中培养。使用Lonza SE细胞系试剂盒(V4SC-1960)核转染(程序CL-120)Jurkat细胞(传代次数在7至20内)，其中将在20μL的SE缓冲液中的20万个细胞与8μL的在PBS缓冲液中的125pmol pegRNA、100pmol切口gRNA和1.35pmol PE2 mRNA组合。在转染后72h收获经培养的细胞。

人HepG2细胞获自ATCC，并在补充有10％胎牛血清的杜氏改良型Eagle培养基(DMEM)+L-谷氨酰胺+4.5g/L D-葡萄糖培养基(gibco)中培养。将HepG2细胞(传代次数在4至13内)从培养基中旋转沉降，并用PBS冲洗或不冲洗，并再次旋转沉降。使用Lonza SF细胞系试剂盒(V4SC-2960)核转染(程序EH-100)细胞，其中将在20μL的SF缓冲液中的20万个细胞与3μL的在PBS缓冲液中的10pmol gRNA和0.0625pmol Cas9mRNA组合，或在残留血清的存在下通过将20μL的SF缓冲液中的20万个细胞与5μL的在PBS缓冲液中的30pmol gRNA和0.5pmol Cas9 mRNA或12.5pmol酿脓链球菌Cas9(SpCas9)蛋白(Aldeveron)组合核转染细胞。对于163聚体gRNA，在残留血清和SF缓冲液的存在下，通过将这些与5μL的在PBS缓冲液中的125pmol 163聚体gRNA和50pmol SpCas9蛋白组合，以同样方式核转染20万个细胞。对于所有RNP转染，通过在室温下组合并孵育约20min，将gRNA与SpCas9蛋白(Aldevron)在PBS缓冲液中预复合，然后与在SF缓冲液中的细胞组合以用于核转染。对于mRNA转染，将gRNA以同样方式与Cas9mRNA(TriLink)在PBS缓冲液中组合，并在冰上保持约20min，直到与在SF缓冲液中的细胞组合以用于核转染。在转染后约72h收获经培养的HepG2细胞。

人原代T细胞(LP、CR、CD3+、NS)获自AllCells(加利福尼亚州阿拉米达)，并在补充有10％胎牛血清、5ng/mL的人IL-7和5ng/mL的人IL-15(gibco)的RPMI 1640+GlutaMax培养基中培养。将原代T细胞用抗人CD3/CD28磁性Dynabeads(Thermo Fisher)以3:1的珠-细胞浓度激活48h。使用Lonza P3原代细胞试剂盒(V4SP-3960)核转染(程序EO-115)去珠的原代T细胞，其中将在20μL的P3缓冲液中的20万个细胞与2.7μL的在PBS缓冲液中的5pmol gRNA和0.0625pmol Cas9 mRNA组合。在转染后7天收获经培养的细胞。在整个培养期间，将T细胞维持在大约1M细胞/mL培养基的密度下。在电穿孔后，每2天添加另外的培养基。

qRT-PCR测定。如上所述培养人K562细胞，并且如所述每个重复实验用125pmolgRNA(不含Cas9 mRNA或蛋白质)核转染20万个细胞。对于每个时间点，将细胞收集在1.7mLEppendorf管中，用PBS冲洗，然后重悬于750μL的Qiazol中，并在室温下保持5min，然后转移到-20℃冰箱中。使用QiaCube HT上的miRNeasy试剂盒(Qiagen)从Qiazol加氯仿提取物中分离PBS中的总RNA，然后立即使用Protoscript II第一链cDNA合成试剂盒(NEB)进行逆转录。使用TaqPath ProAmp预混液和两个TaqMan MGB探针在Applied BiosystemsQuantStudio 6Flex仪器上进行qRT-PCR，其中一个探针用于用FAM标记的gRNA，并且另一个探针用于用VIC(Thermo Fisher)标记的U6 snRNA，以相对于经分离的总RNA的量归一化，计算为ΔCt。将一式三份样品的ΔCt值取平均值并相对于最低观察到的平均ΔCt值归一化以计算ΔΔCt值。相对gRNA水平计算为2^–ΔΔCt。

PCR靶向深度测序和定量靶向基因组修饰。如前所述进行基因组DNA纯化和PCR靶向深度测序文库的构建。使用Qubit dsDNA BR测定试剂盒(Thermo Fisher)测定文库浓度。在MiSeq(Illumina)上在0.8ng/μL的PCR扩增的文库连同20.5％ PhiX下对配对端2x220-bp读段进行测序。

使用FLASH版本1.2.11软件合并配对端读段，然后使用设置为默认参数的BWA-MEM软件(bwa-0.7.10)映射到人基因组。根据在Cas9切割位点的10bp内是否发现插入或缺失，将读段评分为具有插入缺失或不具有插入缺失。对于先导编辑分析，如果在读段中鉴定出所需的编辑，则将读段评分为具有编辑。对于胞苷碱基编辑分析，如果在PAM位点上游10-20bp的窗口内编辑胞苷，则将读段评分为经碱基编辑的。对于每个实验中的每个重复，根据映射的扩增子基因座分离映射的读段，并通过插入缺失或编辑的存在或不存在进行分箱(bin)。将每个分箱(bin)的读段的得分用于计算在每个基因座产生的插入缺失％或编辑％。通过插入缺失％或编辑％的logit变换计算各图的插入缺失或编辑产率和标准差，将其变换为ln(r/(1-r))，其中r是每个特定基因座的插入缺失％或编辑％，以接近正态分布。一式三份模拟物转染提供平均模拟物对照(或阴性对照)，并且显示比对应的阴性对照显著更高(t检验p<0.05)的平均插入缺失产率或平均编辑产率的一式三份样品被认为高于背景。

实施例1

本实施例评价在其3'端具有2'-O-甲基-3'-膦酰基乙酸酯(MP)和2'-O-甲基-3'-硫代磷酸酯(MS)修饰的指导RNA的稳定性。为了评价在3'端具有MS或MP修饰的单指导RNA在转染细胞中的相对寿命，合成这样的指导RNA，其中在5'端的前三个核苷酸间连接处具有MS修饰和在3'端的最后三个核苷酸间连接处具有MS修饰(表示为3xMS,3xMS)或在3'端的末端核苷酸间连接处具有2、3或4个连续MP修饰(分别表示为3xMS,2xMP；3xMS,3xMP；和3xMS,4xMP)。在不存在Cas9的情况下将每种经修饰的gRNA单独转染到人K562细胞中，并且使用qRT-PCR测量在转染后1至96小时的一系列时间点收集的细胞中剩余的sgRNA的相对量。

如图7所示，与在3'端用MP(两个、三个或四个连续MP)修饰的任何gRNA的相对水平相比，观察到转染后1、6和24h检测到的3xMS,3xMS gRNA的相对水平的更陡峭的下降。具体来说，在转染后1h，经转染的gRNA的相对量仅相差2.6倍，其中在3'端保护的所有四个变型中，误差条大部分重叠，而在转染后6h观察到大得多的差异，此时3xMS,3xMS保护的gRNA的剩余量已降至3xMS,3xMP和3xMS,4xMP保护的gRNA的剩余量(0.341-0.351)的约1/10(0.039)的相对水平。在24h的时间点，差异变得更大，在此时它们根据在3'端处从具有3xMS至2xMP至3xMP至4xMP的逻辑进展中3'端保护的水平而变化，导致剩余的gRNA水平跨越约250倍，这与3'端保护水平一致。因此，发现在未复合的gRNA的3'端掺入MP修饰可以相对于MS修饰显著增强其在转染细胞中的稳定性，具体地对于与仅MS修饰的gRNA平行测试的三种不同的MP修饰的gRNA，增强1-2个数量级。在3'端具有三个或四个连续MP的设计可以延长游离gRNA的寿命，跨越更长时间点(转染后72和96h)。

实施例2

膦酸酯修饰可以被稳定地掺入DNA和RNA寡核苷酸中，并且已经证明相对于硫代磷酸酯增加它们对核酸酶的抗性。在探索通过将MP掺入20-nt指导序列部分中使用MP来增强gRNA的特异性的先前报道中，发现在特定序列位置如位置5或11(从20个核苷酸的5'端计数)的MP可以显著减少脱靶编辑，同时保持高中靶编辑，如例如Ryan等人,Nucleic AcidsResearch 46,792-803(2018)中所述。然而，也有报道称，在一些指导序列中，在gRNA的5'端的前一个、两个或三个核苷酸内掺入MP修饰可能降低它们的中靶切割活性和/或增加它们的脱靶活性，从而降低特异性(参见例如，Ryan等人,2018)。

为了进一步探索膦酸酯修饰在指导RNA中的潜在效用，将在3'端含有不同数量的连续2'-O-甲基-3'-膦酰基乙酸酯(2'-O-甲基-3'-PACE，或“MP”)修饰的gRNA的性能与在该端具有2'-O-甲基-3'-硫代磷酸酯(或“MS”)修饰的指导RNA的性能相比进行评价。这项研究的结果进一步描述于Ryan等人“Phosphonoacetate Modifications Enhance theStability and Editing Yields of Guide RNAs for Cas9 Editors.”Biochemistry(2022)doi.org/10.1021/acs.biochem.1c00768中。

此实验被设计用于使用HBB作为靶基因，用相对较低(亚饱和)量的经化学修饰的指导RNA和编码Cas蛋白的mRNA共转染HepG2细胞后评价Cas活性。此类亚饱和量构成编辑细胞的靶区域的挑战性条件。

对于三组样品，将编码Cas9的mRNA与靶向HBB的经修饰的gRNA共转染到人肝细胞(HepG2细胞)中。(参见上表1)。对于第四组HepG2细胞，将靶向HBB中相同位点的经修饰的gRNA与经纯化的重组Cas9蛋白预复合以形成RNP，然后将其转染到细胞中。在分开培养的细胞的一式三份样品中进行每次转染。收获基因组DNA，分别使用对HBB基因和基因间脱靶位点具有特异性的引物扩增HBB靶标和脱靶序列，以产生扩增子，对所述扩增子进行测序，并且从测序结果确定在靶位点和脱靶位点的编辑程度(“插入缺失％”)。ON和OFF分别指示中靶序列和脱靶序列。监测基因间脱靶基因座，因为已知其在靶向HBB基因中的所选靶序列时遭受高附带活性。表1中描述的经修饰的gRNA的编辑产率在图2-图5中绘制为条形图。

如图2-图5所示，用亚饱和水平的靶向HBB的经修饰的指导RNA和编码Cas蛋白的mRNA(或经修饰的指导RNA的RNP复合物)共转染相对于用等量的未修饰的gRNA共转染的样品导致更高水平的编辑产率。此外，在经修饰的gRNA的3'端添加2、3或4个MP修饰导致编辑产率逐渐增加，以及相对于在经修饰的gRNA的3'端包含3个MS修饰的经修饰的gRNA，编辑产率显著增加。参见例如图2和图4。如图3和图5所示，在位置5或11(从gRNA中的20-nt指导序列的5'端计数)处包含MP修饰也降低脱靶活性。特别是，在gRNA中的位置5处包含MP对编辑产率具有最小的影响，同时显著降低脱靶活性。

进一步观察到3'端的MP修饰显著增加HepG2细胞中的编辑产率(图3)。例如，在3'端具有2、3或4个连续MP修饰的设计比在3'端具有3xMS的可比较的设计给出至少2倍多的Cas9介导的插入缺失(对于2xMP、3xMP和4xMP修饰，在中靶位点为81％-83％；相比之下，对于在3'端具有3xMS，为38％)。对于转染到原代人T细胞中的相同gRNA，观察到类似的趋势，但是增加更适度，因为2xMP、3xMP和4xMP修饰比在3'端使用3xMS时给出1.3倍更高水平的中靶插入缺失(图8)。在gRNA的20-nt指导序列部分的位置5掺入另外的MP显著降低两种细胞类型中OFF1位点处的编辑，同时保持高中靶编辑效率，如先前所报道为用于增强特异性的手段(参见例如，Ryan等人,2018)。实际上，通过在位置5处掺入MP，在HepG2细胞中OFF1位点处的插入缺失减少7-10倍，并且在原代T细胞中类似地减少6-7倍。

如图9所示，还评价经化学修饰的gRNA与碱基编辑器的组合使用。碱基编辑器是围绕与各种脱氨酶之一融合的Cas9切口酶(nCas9)或死Cas9(dCas9)构建的一类可替代基因组编辑系统，其能够在细胞中编辑基因组DNA而不产生双链断裂。已经报道了胞苷碱基编辑器(CBE)和腺苷碱基编辑器(ABE)，并且这些已经启发了用于碱基编辑的许多变化。在CBE(即BE4-Gam mRNA)的背景下测试与在此类gRNA的3'端处使用MP修饰相比于MS修饰的潜在益处。与在3'端使用MS的可替代设计相比，通过在3'端用MP修饰的gRNA共转染的K562细胞中使用CBE mRNA观察到1.4倍更高水平的胞苷编辑。

实施例3

本实施例评价2'-O-甲基-3'-膦酰基乙酸酯(MP)和2'-O-甲基-3'-硫代磷酸酯(MS)修饰在化学合成的pegRNA的3'端的用途。进行实验以探索从文献中采用的两种用于先导编辑的方法，其在EMX1中敲除PAM或在RUNX1中引入3个碱基的插入，这两种方法都利用具有包含15个核苷酸的引物结合序列的pegRNA。在此实验中评价的特定序列编辑示于图18中。将编码先导编辑器(在这种情况下，是包含Cas9切口酶和MMLV来源的逆转录酶的融合蛋白)的mRNA与靶向EMX1基因的pegRNA一起引入K562或Jurkat细胞中。在分开培养的细胞的一式三份样品中进行每次转染。收获基因组DNA，使用对EMX1具有特异性的引物扩增EMX1靶序列以产生扩增子，对所述扩增子进行测序，并从测序结果确定先导编辑的程度(“编辑％”)。从测序结果还确定在EMX1靶序列中的切口酶位点处不期望的插入缺失形成的程度(“插入缺失％”)。此类插入缺失是先导编辑的已知副产物，并且通常被认为是不希望的(参见Anzalone等人2019)。将每个pegRNA的先导编辑产率和插入缺失副产物产率在图11-图16中绘制为条形图。此测定中使用的序列选自表2中所示的序列。使用第一批合成的靶向EMX1的pegRNA获得图11-图12中的数据，并使用第二批合成的靶向EMX1的pegRNA获得图13-图14中的数据。注意，在第二批合成中一些相同的序列被再次合成。相反，使用靶向RUNX1的pegRNA(即，使用表3中描述的序列)获得图15-图16中的数据。

如图11-图16所示的结果所示，在pegRNA的5'端和3'端分别包含MS和MP核苷酸作为化学修饰增加了先导编辑活性。鉴于pegRNA的3'端含有另外的功能位点(例如，引物结合位点和逆转录酶模板序列)，在pegRNA的3'端具有经修饰的核苷酸的构建体的增强的活性是特别出人意料的。如上所指出，在本公开文本之前，已预期在此位点包含经化学修饰的核苷酸(例如，MS和/或MP)会干扰由pegRNA的这些其他3'端组分提供的功能性。

实施例4

本实施例评价在化学合成的pegRNA的3'端掺入MP或MS修饰。此实验中使用的方法与上述方法一致。简而言之，采用先导编辑方法在EMX1中敲除PAM或在RUNX1中引入3个碱基的插入。用先导编辑器(在这种情况下，是包含Cas9切口酶和MMLV来源的逆转录酶的融合蛋白)mRNA和在5'端通过3xMS修饰并且在3'端通过各种修饰方案(如所示)修饰的合成pegRNA共转染K562细胞，以编辑EMX1或RUNX1。使用相同的pegRNA以同样方式转染Jurkat细胞以编辑EMX1或RUNX1。通过靶基因座的PCR扩增子的深度测序来测量所需编辑(编辑％)和任何污染性插入缺失副产物(插入缺失副产物％)的编辑产率。相关图中的条表示具有标准差的平均值。(n＝3)。

如图19-图22所示，此实验将针对两个靶标的在3'端具有3xMS的pegRNA与在3'端具有一个、两个或三个连续MP的可替代设计比较，它们各自与PE2 mRNA在K562或Jurkat细胞中共转染。结果表明，在3'端具有MP修饰的pegRNA表现良好，并且可以实现与3xMS可比较的编辑产率或在某些情况下更高的编辑产率。对于此处测试的两个pegRNA序列，在3'端具有2xMP和/或3xMP的设计一致地比在3'端具有1xMP的设计表现更好(具体地，前者1.2-1.4倍好于后者)。

实施例5

本实施例证明，在血清的存在下，在化学合成的gRNA的3'端使用MP修饰有助于最大化编辑产率。为了模拟CRISPR-Cas组分在体内递送(如通过纳米载体或其他细胞穿透配制品)时可能遇到的更苛刻的细胞环境，进行了实验，其中将Cas9 mRNA与gRNA共转染到从培养基分离但未用PBS缓冲液冲洗以去除已知含有核酸酶的残留血清的细胞中。

此实验中使用的方法与上述方法一致。然而，应注意，与产生图3所示数据的实验(其中在引入CRISPR-Cas组分之前每次转染用缓冲液洗涤相同数量的细胞)相比，在此实验的条件下，需要更高量的gRNA和Cas9 mRNA来实现显著水平的编辑，具体地，每次转染将3倍的gRNA和8倍的Cas9 mRNA用于实验，所述实验产生图23中所示的数据。

基于此研究的结果，显现出未从细胞冲洗的血清中的细胞外核酸酶降解经转染的RNA。我们发现，当与Cas9 mRNA共转染到未冲洗的HepG2细胞中时，与在3'端具有MS修饰的gRNA相比，在3'端具有MP修饰的gRNA给出显著更高的编辑产率(高一个数量级或更多)(图23)。具体而言，观察到在3'端具有一个或多个MP的gRNA的15％-44％编辑产率，相比之下，在3'端具有3xMS的gRNA的编辑产率少于2％。

在平行实验中，通过在PBS缓冲液中与Cas9蛋白预复合来制备每种gRNA的RNP形式，并将其转染到未冲洗的HepG2细胞的等分试样中。如所预期的，未修饰的和3xMS修饰的gRNA作为RNP配制品比当这些与Cas9 mRNA共转染时给出更高的插入缺失产率，因为在RNP中gRNA与Cas9蛋白的预复合有助于保护gRNA免受核分解降解(比较图24与图23中所示的结果)。尽管掺入在3'端具有MP修饰相比于MS修饰的gRNA的RNP的编辑效率的改进并不像在使用这些修饰与Cas9 mRNA共转染时那样显著，但在3'端具有MP的设计比在3'端具有3xMS的可比较设计给出显著更高的Cas9介导的插入缺失(对于在3'端具有2xMP、3xMP和4xMP修饰，在中靶位点为70％-73％插入缺失；相比之下，对于在3'端具有3xMS，为52％，约1.3倍的差异)(参见图24)。对于不同的一组合成163聚体gRNA观察到类似的结果，所述合成163聚体gRNA被设计用于CRISPRa SAM系统但在RNP配制品中与SpCas9蛋白一起使用以产生插入缺失而不是将它们用于通过CRISPRa的基因激活(图25)。

示例性实施方案

章节A

实施方案A1.一种在一种或多种挑战性条件下编辑核酸中的靶区域的方法，所述方法包括：

向细胞提供

a)CRISPR相关(“Cas”)蛋白，和

b)经修饰的指导RNA，其包含能够与所述靶区域杂交的指导序列和与所述Cas蛋白相互作用的支架，其中所述经修饰的指导RNA包含5'端和3'端，并且所述经修饰的指导RNA进一步包含所述3'端的5个核苷酸内的一个或多个经修饰的核苷酸，其中所述一个或多个经修饰的核苷酸包含至少一个具有2'修饰和核苷酸间连接修饰的核苷酸，其中所述2'修饰选自2'-O-甲基、2'-氟、2'-O-甲氧基乙基(2'-MOE)和2'-脱氧，并且所述核苷酸间连接修饰是膦酰基羧酸酯或硫代膦酰基羧酸酯；

其中所述一个或多个挑战性条件选自：

i.所述靶区域或包含所述靶区域的细胞在包含血清(例如，胎牛血清)的培养基中；

ii.预先在包含血清的培养基中培养包含所述靶区域的细胞，并且所述细胞与所述血清不完全分离；

iii.预先在包含一种或多种核糖核酸外切酶的培养基中培养包含靶区域的细胞，并且细胞与所述一种或多种核糖核酸外切酶不完全分离；

iv.包含所述靶区域的细胞具有相对较高水平的核糖核酸外切酶活性，如一种或多种核糖核酸外切酶的相对较高表达；

v.包含所述靶区域的细胞具有相对较低水平的核糖核酸酶抑制剂活性，如核糖核酸酶抑制剂的相对较低表达；

vi.所述经修饰的指导RNA在递送到包含所述靶区域的细胞中之前不与Cas蛋白复合；以及

vii.其适用的组合；

其中所述Cas蛋白和所述经修饰的指导RNA形成导致编辑所述靶区域的复合物。

实施方案A2.根据实施方案A1所述的方法，其中所述核苷酸间连接修饰是膦酰基羧酸酯。

实施方案A3.根据实施方案A2所述的方法，其中所述膦酰基羧酸酯是膦酰基乙酸酯。

实施方案A4.根据实施方案A1所述的方法，其中所述硫代膦酰基羧酸酯是硫代膦酰基乙酸酯。

实施方案A5.根据实施方案A1至A4中任一项所述的方法，其中将所述Cas蛋白作为编码所述Cas蛋白的mRNA引入。

实施方案A6.根据实施方案A1至A4中任一项所述的方法，其中将所述Cas蛋白作为编码所述Cas蛋白的表达载体引入。

实施方案A7.根据实施方案A5或A6所述的方法，其中当引入所述靶区域中时，编码所述Cas蛋白的mRNA或表达载体包含在纳米颗粒中。

实施方案A8.根据实施方案A1至A4中任一项所述的方法，其中将所述Cas蛋白和所述指导RNA作为核糖核蛋白(RNP)复合物引入。

实施方案A9.根据前述实施方案中任一项所述的方法，其中所述2'修饰是2'-O-甲基。

实施方案A10.根据实施方案A1-A8中任一项所述的方法，其中所述2'修饰是2'-氟。

实施方案A11.根据实施方案A1-A8中任一项所述的方法，其中所述2'修饰是2'-MOE。

实施方案A12.根据实施方案A1-A8中任一项所述的方法，其中所述2'修饰是2'-脱氧。

实施方案A13.根据前述实施方案中任一项所述的方法，其中所述一个或多个编辑包括一个或多个单核苷酸变化、一个或多个核苷酸的插入和/或一个或多个核苷酸的缺失。

实施方案A14.根据前述实施方案中任一项所述的方法，其中所述靶区域存在于无细胞测定中。

实施方案A15.根据实施方案A14所述的方法，其中所述方法进一步包括从细胞提取核酸，如通过裂解所述细胞，形成包含经提取的核酸和一种或多种其他细胞组分如核糖核酸外切酶或其他酶的测定混合物，以及将所述指导RNA引入所述测定混合物中。

实施方案A16.根据前述实施方案中任一项所述的方法，其中所述靶区域在具有高核糖核酸酶表达、浓度和/或活性的细胞中，例如在高特定核酸酶的细胞类型中。

实施方案A17.根据实施方案A16所述的方法，其中细胞包括原代细胞。

实施方案A18.根据实施方案A17所述的方法，其中所述细胞离体存在，并且所述方法进一步包括一个或多个从活生物体分离所述细胞的步骤。可以将所述细胞分离至反应混合物中，或者可以将分离的细胞转移到反应混合物中。

实施方案A19.根据实施方案A16-A18中任一项所述的方法，其中从多细胞生物体分离所述细胞，然后将所述经修饰的指导RNA和所述Cas蛋白引入所述细胞的靶区域中。

实施方案A20.根据实施方案A19所述的方法，其中在将所述经修饰的指导RNA和所述Cas蛋白引入所述细胞的靶区域中后，将所述细胞或其后代返回至所述多细胞生物体。

实施方案A21.根据实施方案A16-A20中任一项所述的方法，其中所述细胞是原代细胞。

实施方案A22.根据实施方案A21所述的方法，其中所述原代细胞是干细胞或免疫细胞。

实施方案A23.根据实施方案A22所述的方法，其中所述干细胞是造血干细胞和祖细胞(HSPC)、间充质干细胞、神经干细胞或器官干细胞。

实施方案A24.根据实施方案A22所述的方法，其中所述免疫细胞是T细胞、自然杀伤细胞、单核细胞、外周血单个核细胞(PBMC)或外周血淋巴细胞(PBL)。

实施方案A25.根据实施方案A24所述的方法，其中所述细胞是T细胞。

实施方案A26.根据实施方案A16-A20中任一项所述的方法，其中所述细胞是肝细胞。

实施方案A27.根据实施方案A16-A26中任一项所述的方法，其中所述细胞是细胞群，每个细胞包含所述靶区域。

实施方案A28.根据实施方案A16-A27中任一项所述的方法，其中所述细胞在细胞培养物中，其中所述细胞在包含血清或一种或多种其他培养基组分的细胞培养基中。

实施方案A29.根据实施方案A28所述的方法，其中在引入所述Cas蛋白和所述经修饰的指导RNA之前不将所述细胞从所述细胞培养基分离。

实施方案A30.根据实施方案A1-A13和A16-A29中任一项所述的方法，其中将所述Cas蛋白和所述经修饰的指导RNA引入活生物体中。

实施方案A31.根据实施方案A30所述的方法，其中将所述Cas蛋白和所述经修饰的指导RNA引入在所述活生物体中或来自所述活生物体的含血清的流体中。

实施方案A32.根据前述实施方案中任一项所述的方法，其中所述编辑是先导编辑，并且所述经修饰的指导RNA进一步包含含有一种或多种所需编辑的区域。

实施方案A33.根据前述实施方案中任一项所述的方法，其中所述编辑包括同源定向修复(HDR)、非同源末端连接(NHEJ)、先导编辑或碱基编辑。

实施方案A34.根据前述实施方案中任一项所述的方法，其中所述Cas蛋白是Cas9或Cas12蛋白。

实施方案A35.根据前述实施方案中任一项所述的方法，其中所述Cas蛋白是能够使DNA的单链产生切口的Cas切口酶。

实施方案A36.根据前述实施方案中任一项所述的方法，其中所述Cas蛋白是包含Cas结构域和异源功能结构域的融合蛋白，其中所述异源功能结构域包含碱基编辑活性、核苷酸脱氨酶活性、转糖基化酶活性、甲基化酶活性、去甲基化酶活性、逆转录酶活性、聚合酶活性、翻译激活活性、翻译抑制活性、转录激活活性、转录抑制活性、转录释放因子活性、染色质修饰或重塑活性、组蛋白修饰活性、核酸酶活性、单链RNA切割活性、双链RNA切割活性、单链DNA切割活性、双链DNA切割活性、核酸结合活性、可检测活性或其任何组合。

实施方案A37.根据实施方案A36所述的方法，其中所述融合蛋白包含Cas切口酶结构域和核苷酸脱氨酶。

实施方案A38.根据实施方案A36所述的方法，其中所述核苷酸脱氨酶是腺苷脱氨酶或胞苷脱氨酶。

实施方案A39.根据实施方案A36所述的方法，其中所述融合蛋白包含一个或多个核酸修饰结构域。

实施方案A40.根据实施方案A36所述的方法，其中所述核酸修饰结构域是DNA聚合酶结构域、重组酶结构域、核糖核苷酸还原酶结构域、甲基转移酶结构域、二腺苷四磷酸水解酶结构域、DNA解旋酶结构域或RNA解旋酶结构域。

实施方案A41.根据实施方案A36所述的方法，其中所述融合蛋白包含Cas切口酶结构域和逆转录酶结构域。

实施方案A42.根据前述实施方案中任一项所述的方法，其中所述指导RNA是单指导RNA。

实施方案A43.根据实施方案A42所述的方法，其中所述经修饰的指导RNA是包含以下的单指导RNA：至少40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、或139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、或200个核苷酸，和/或

最多180、179、178、177、176、175、174、173、172、171、170、169、168、167、166、165、164、163、162、161、159、158、157、156、155、154、153、152、151、150、149、148、147、146、145、144、143、142、141、140、139、138、137、136、135、134、133、132、131、130、129、128、127、126、125、124、123、122、121、或120个核苷酸。

实施方案A44.根据前述实施方案中任一项所述的方法，其中所述指导RNA进一步包含所述5'端的5个核苷酸内或者所述5'端的3个核苷酸内的一个或多个经修饰的核苷酸。

实施方案A45.根据实施方案A44所述的方法，其中所述5'端的所述一个或多个经修饰的核苷酸包含至少一个具有2'修饰和核苷酸间连接修饰的核苷酸，其中所述2'修饰选自2'-O-甲基、2'-氟、2'-O-甲氧基乙基(2'-MOE)和2'-脱氧，并且所述核苷酸间连接修饰选自膦酰基羧酸酯、硫代膦酰基羧酸酯和硫代磷酸酯。

实施方案A46.根据前述实施方案中任一项所述的方法，其中所述指导RNA进一步包含在除了距离所述指导RNA的5'端和3'端二者至少5个核苷酸之外的一个或多个位置处的一个或多个经修饰的核苷酸。

实施方案A47.一种在一种或多种挑战性条件下在细胞的核酸中调节靶区域中靶基因的表达的方法，所述方法包括：

向所述细胞提供

a)CRISPR相关(“Cas”)蛋白或编码所述Cas蛋白的DNA或mRNA，和

b)经修饰的指导RNA，其包含能够与所述靶区域杂交的指导序列和与所述Cas蛋白相互作用的区域，其中所述经修饰的指导RNA包含5'端和3'端，并且所述经修饰的指导RNA进一步包含所述3'端的5个核苷酸内的一个或多个经修饰的核苷酸，其中所述一个或多个经修饰的核苷酸包含至少一个具有2'修饰和核苷酸间连接修饰的核苷酸，其中所述2'修饰选自2'-O-甲基、2'-氟、2'-O-甲氧基乙基(2'-MOE)和2'-脱氧，并且所述核苷酸间连接修饰是膦酰基羧酸酯或硫代膦酰基羧酸酯；并且

其中所述Cas蛋白和所述经修饰的指导RNA形成导致调节所述靶区域的表达的复合物。

实施方案A48.根据实施方案A47所述的方法，其中所述Cas蛋白或所述经修饰的指导RNA进一步包含表观遗传修饰物、或转录或翻译激活或抑制信号。

实施方案A49.根据实施方案A47所述的方法，其中所述Cas蛋白是包含失活的Cas核酸酶结构域和选自转录激活结构域和转录抑制结构域的异源功能结构域的融合蛋白。

实施方案A50.根据实施方案A49所述的方法，其中所述异源功能结构域是转录激活结构域。

实施方案A51.根据实施方案A50所述的方法，其中所述转录激活结构域是VP64结构域、p65结构域、MyoD1结构域或HSF1结构域。

实施方案A52.根据实施方案A49所述的方法，其中所述异源功能结构域是转录抑制结构域。

实施方案A53.根据实施方案A52所述的方法，其中所述转录抑制结构域是KRAB结构域、SID结构域、SID4X结构域、NuE结构域或NcoR结构域。

实施方案A54.一种在一种或多种挑战性条件下先导编辑核酸中的靶区域的方法，所述方法包括：

a)向所述细胞提供

能够使所述核酸的单链产生切口的Cas蛋白；

逆转录酶；和

包含以下的经修饰的先导编辑指导RNA(“pegRNA”)：

i)能够与所述靶区域杂交的指导序列，

ii)与所述Cas蛋白相互作用的区域，

iii)包含对所述核酸的序列的一个或多个编辑的逆转录酶模板序列，和

iv)可以结合所述靶区域的互补体的引物结合位点序列；

其中所述经修饰的pegRNA包含5'端和3'端，并且所述经修饰的pegRNA进一步包含所述3'端的5个核苷酸内的一个或多个经修饰的核苷酸，其中所述一个或多个经修饰的核苷酸包含至少一个具有2'修饰和核苷酸间连接修饰的核苷酸，其中所述2'修饰选自2'-O-甲基、2'-氟、2'-O-甲氧基乙基(2'-MOE)和2'-脱氧，并且所述核苷酸间连接修饰是膦酰基羧酸酯或硫代膦酰基羧酸酯；并且

实施方案A55.根据实施方案A54所述的方法，其中所述Cas蛋白和所述逆转录酶通过接头连接以形成融合蛋白。

实施方案A56.根据前述实施方案中任一项所述的方法，其中所述指导RNA包含在所述5'端的5个核苷酸内的至少一个硫代磷酸酯核苷酸间连接和在所述3'端的5个核苷酸内的至少两个连续的膦酰基羧酸酯或硫代膦酰基羧酸酯核苷酸间连接。

实施方案A57.根据前述实施方案中任一项所述的方法，其中所述指导RNA包含在所述5'端的5个核苷酸内的至少一个硫代磷酸酯核苷酸间连接和在所述3'端的5个核苷酸内的至少两个连续的膦酰基乙酸酯或硫代膦酰基乙酸酯核苷酸间连接。

实施方案A58.根据前述实施方案中任一项所述的方法，其中所述指导RNA包含在所述5'端的5个核苷酸内的至少一个MS和在所述3'端的5个核苷酸内的至少两个连续的MP或MSP。

实施方案A59.根据前述实施方案中任一项所述的方法，其中所述指导RNA包含在所述5'端的5个核苷酸内的三个MS和在所述3'端的5个核苷酸内的三个MP或MSP。

实施方案A60.根据前述实施方案中任一项所述的方法，其中以多路复用方式(即在至少两个靶基因或至少两个靶区域上)进行靶基因的所述编辑和/或靶基因表达的所述调节。

章节B

实施方案B1.一种编辑细胞的核酸中的靶区域的方法，所述方法包括向所述细胞提供：

a)CRISPR相关(“Cas”)蛋白，和

b)经修饰的指导RNA，其包含5'端和3'端以及：

能够与所述靶区域中的靶序列杂交的指导序列、

与所述Cas蛋白相互作用的支架区域、和

所述5'端的5个核苷酸内的一个或多个硫代磷酸酯修饰、和所述3'端的5个核苷酸内的至少两个连续的膦酰基羧酸酯或硫代膦酰基羧酸酯修饰；

其中所述细胞在含有核酸酶的流体的存在下离体存在，或在体内存在，并且

所述提供导致所述靶区域的编辑。

实施方案B1.1.一种编辑细胞的核酸中的靶区域的方法，所述方法包括向所述细胞提供：

a)CRISPR相关(“Cas”)蛋白，和

b)经修饰的指导RNA，其为包含5'端和3'端的先导编辑指导RNA(pegRNA)，其中一端是先导编辑端，并且另一端是远端，所述经修饰的指导RNA进一步包含：

能够与所述靶区域中的靶序列杂交的指导序列、

与所述Cas蛋白相互作用的支架区域、和

所述远端的5个核苷酸内的一个或多个硫代磷酸酯修饰、和所述先导编辑端的5个核苷酸内的至少两个连续的膦酰基羧酸酯或硫代膦酰基羧酸酯修饰；

所述提供导致所述靶区域的编辑。

实施方案B2.根据实施方案B1或B1.1所述的方法，其中所述编辑以比通过未修饰的gRNA进行的编辑更高的效率发生，所述未修饰的gRNA与所述经修饰的指导RNA在其他方面相同。

实施方案B3.一种在细胞的核酸中调节靶区域中靶基因表达的方法，所述方法包括向所述细胞提供：

a)CRISPR相关(“Cas”)蛋白，和

b)经修饰的指导RNA，其包含5'端和3'端以及：

能够与所述靶区域中的靶序列杂交的指导序列、

与所述Cas蛋白相互作用的支架区域、和

所述提供导致所述靶基因的表达的调节。

实施方案B4.根据实施方案B3所述的方法，其中所述调节以比通过未修饰的gRNA进行的调节更高的效率发生，所述未修饰的gRNA与所述经修饰的指导RNA在其他方面相同。

实施方案B5.根据前述B实施方案中任一项所述的方法，其中所述细胞存在于体内。

实施方案B6.根据前述B实施方案中任一项所述的方法，其中所述细胞在含有核酸酶的流体的存在下离体存在。

实施方案B7.根据前述B实施方案中任一项所述的方法，其中所述经修饰的指导RNA包含所述5'端(例外；当此实施方案从属于实施方案B1.1时，用“所述远端”替代“所述5'端”)的5个核苷酸内的至少两个连续的2'-O-甲基-3'-硫代磷酸酯(MS)。

实施方案B8.根据前述B实施方案中任一项所述的方法，其中所述膦酰基羧酸酯是膦酰基乙酸酯，并且所述硫代膦酰基羧酸酯是硫代膦酰基乙酸酯。

实施方案B9.根据前述B实施方案中任一项所述的方法，其中所述经修饰的指导RNA包含所述3'端(例外：当此实施方案从属于实施方案B1.1时，用“所述先导编辑端”替代“所述5'端”)的5个核苷酸内的至少两个连续的2'-O-甲基-3'-膦酰基乙酸酯(MP)或2'-O-甲基-3'-硫代膦酰基乙酸酯(MSP)。

实施方案B10.根据前述B实施方案中任一项所述的方法，其中所述经修饰的指导RNA进一步包含位于所述5'端和所述3'端内的5个核苷酸之外的一个或多个经修饰的核苷酸。

实施方案B11.根据前述B实施方案中任一项所述的方法，其中所述经修饰的指导RNA是单指导RNA。

实施方案B12.根据前述B实施方案中任一项所述的方法，其中将所述Cas蛋白作为编码所述Cas蛋白的mRNA提供。

实施方案B13.根据实施方案B1-B11中任一项所述的方法，其中将所述Cas蛋白作为编码所述Cas蛋白的DNA提供。

实施方案B14.根据实施方案B13所述的方法，其中所述DNA是病毒表达载体。

实施方案B15.根据实施方案B1-B11中任一项所述的方法，其中将所述Cas蛋白和所述经修饰的指导RNA作为核糖核蛋白复合物(RNP)提供。

实施方案B16.根据实施方案B1-B11中任一项所述的方法，其中将所述Cas蛋白和/或所述经修饰的指导RNA在一种或多种纳米颗粒中提供。

实施方案B17.根据前述B实施方案中任一项所述的方法，其中所述效率高至少5％。

实施方案B18.根据前述B实施方案中任一项所述的方法，其中所述效率高至少10％。

实施方案B19.根据前述B实施方案中任一项所述的方法，其中所述效率高至少15％。

实施方案B20.根据前述B实施方案中任一项所述的方法，其中所述效率高至少20％。

实施方案B21.根据前述B实施方案中任一项所述的方法，其中所述效率高至少25％。

实施方案B22.根据前述B实施方案中任一项所述的方法，其中所述效率高至少30％。

实施方案B23.根据前述B实施方案中任一项所述的方法，其中所述效率高至少35％。

实施方案B24.根据前述B实施方案中任一项所述的方法，其中所述效率高至少40％。

实施方案B25.根据前述B实施方案中任一项所述的方法，其中所述效率高至少45％。

实施方案B26.根据前述B实施方案中任一项所述的方法，其中所述效率高至少50％。

实施方案B27.根据前述B实施方案中任一项所述的方法，其中所述Cas蛋白能够切割DNA的两条链。

实施方案B28.根据实施方案B1-B26中任一项所述的方法，其中所述Cas蛋白是切口酶。

实施方案B29.根据实施方案B1-B26中任一项所述的方法，其中所述Cas蛋白不具有核酸酶活性。

实施方案B30.根据前述B实施方案中任一项所述的方法，其中所述Cas蛋白是进一步包含异源蛋白的融合蛋白的一部分。

实施方案B31.根据前述B实施方案中任一项所述的方法，其中所述Cas蛋白是II型Cas蛋白。

实施方案B32.根据前述B实施方案中任一项所述的方法，其中所述Cas蛋白是Cas9蛋白或其变体或片段。

实施方案B33.根据实施方案B32所述的方法，其中所述Cas9蛋白来自酿脓链球菌。

实施方案B34.根据实施方案B1-B32中任一项所述的方法，其中所述Cas蛋白是Cpf1蛋白或其变体或片段。

实施方案B35.根据前述B实施方案中任一项所述的方法，其中所述Cas蛋白是具有来自至少两种不同野生型Cas蛋白的序列的杂合蛋白。

实施方案B36.根据前述B实施方案中任一项所述的方法，其中所述经修饰的指导RNA的长度为40-70个核苷酸。

实施方案B37.根据前述B实施方案中任一项所述的方法，其中所述经修饰的指导RNA的长度为40-100个核苷酸。

实施方案B38.根据实施方案B1-B35中任一项所述的方法，其中所述经修饰的指导RNA的长度为90-110个核苷酸。

实施方案B39.根据实施方案B1-B35中任一项所述的方法，其中所述经修饰的指导RNA的长度为90-130个核苷酸。

实施方案B40.根据实施方案B1-B35中任一项所述的方法，其中所述经修饰的指导RNA的长度为130-160个核苷酸。

实施方案B41.根据实施方案B1-B35中任一项所述的方法，其中所述经修饰的指导RNA的长度为160-200个核苷酸。

实施方案B42.根据前述B实施方案中任一项所述的方法，其中所述经修饰的指导RNA是pegRNA。

实施方案B43.根据前述B实施方案中任一项所述的方法，其中所述硫代磷酸酯、膦酰基羧酸酯或硫代膦酰基羧酸酯修饰各自存在于还包含2'-O-甲基修饰的核苷酸中。

实施方案B44.根据前述B实施方案中任一项所述的方法，所述方法进一步包括使用包含以下项的第二经修饰的指导RNA编辑所述细胞中的第二靶区域：

5'端和3'端，

能够与所述第二靶区域中的第二靶序列杂交的指导序列，和

所述5'端(例外情况是如果此实施方案从属于B1.1，则这将是所述远端)的5个核苷酸内的一个或多个硫代磷酸酯修饰，以及所述3'端(例外情况是如果此实施方案从属于B1.1，则这将是所述先导编辑端)的5个核苷酸内的至少两个连续的膦酰基羧酸酯或硫代膦酰基羧酸酯修饰。

实施方案B45.根据前述B实施方案中任一项所述的方法，所述方法进一步包括使用包含以下项的第三经修饰的指导RNA调节所述细胞的第三靶区域中第三靶基因的表达：

5'端和3'端，

能够与所述第三靶区域中的第三靶序列杂交的指导序列，和

所述5'端的5个核苷酸内的一个或多个硫代磷酸酯修饰、和所述3'端的5个核苷酸内的至少两个连续的膦酰基羧酸酯或硫代膦酰基羧酸酯修饰。

实施方案B46.根据前述B实施方案中任一项所述的方法，其中所述核酸酶是核酸外切酶。

实施方案B47.根据前述B实施方案中任一项所述的方法，其中所述核酸酶是核糖核酸酶。

章节C

实施方案C1.一种在细胞中编辑包含第一靶区域和第二靶区域的两个或更多个核酸靶区域的方法，所述方法包括向所述细胞提供：

a)CRISPR相关(“Cas”)蛋白；

b)第一经修饰的指导RNA，其包含5'端和3'端以及：

能够与所述第一靶区域中的第一靶序列杂交的第一指导序列、

与所述Cas蛋白相互作用的支架区域、和

c)第二经修饰的指导RNA，其包含5'端和3'端以及：

能够与所述第二靶区域中的第二靶序列杂交的第二指导序列、

与所述Cas蛋白相互作用的支架区域、和

所述提供导致所述第一靶区域和所述第二靶区域的编辑。

实施方案C2.一种在细胞中调节至少第一靶区域中的第一靶基因和第二靶区域中的第二靶基因的表达的方法，所述方法包括向所述细胞提供：

a)CRISPR相关(“Cas”)蛋白；

b)第一经修饰的指导RNA，其包含5'端和3'端以及：

与所述Cas蛋白相互作用的支架区域、和

c)第二经修饰的指导RNA，其包含5'端和3'端以及：

与所述Cas蛋白相互作用的支架区域、和

所述提供导致所述第一靶基因和所述第二靶基因的表达的调节。

实施方案C3.根据实施方案C1或C2所述的方法，其中所述第一靶区域的编辑或所述第一靶基因的调节的第一效率比未修饰的指导RNA的效率高，所述未修饰的指导RNA与所述第一经修饰的指导RNA在其他方面相同。

实施方案C4.根据实施方案C3所述的方法，其中所述第二靶区域的编辑或所述第二靶基因的调节的第二效率比未修饰的指导RNA的效率高，所述未修饰的指导RNA与所述第二经修饰的指导RNA在其他方面相同。

实施方案C5.根据前述C实施方案中任一项所述的方法，其中所述细胞存在于体内。

实施方案C6.根据实施方案C1-C4中任一项所述的方法，其中所述细胞在含有核酸酶的流体的存在下离体存在。

实施方案C7.根据前述C实施方案中任一项所述的方法，所述方法进一步包括来自A实施方案或B实施方案中的每一个的适用的一个或多个另外的限制。

对示例性或优选实施方案的前述描述应当被视为是说明性的而不是限制性的，本公开文本应当被视为如权利要求所限定。如将容易理解的，在不脱离如权利要求中所阐述的本公开文本的情况下，可以利用以上阐述的特征的许多变型和组合。这种变型不被视为脱离本公开文本的范围，并且所有这种变型都旨在包括在以下权利要求的范围内。将本文引用的所有参考文献都通过引用以其整体并入。

本说明书中提到的所有出版物、专利和专利申请都通过引用并入本文，并入程度就像每个单独的出版物、专利或专利申请被具体地且单独地指出以通过引用并入一样。

Sequence Listing

/>

Claims

1.一种在细胞的核酸中编辑靶区域或调节靶区域中靶基因表达的方法，所述方法包括向所述细胞提供：

a)CRISPR相关(“Cas”)蛋白；和

b)经修饰的指导RNA，其包含5'端和3'端以及：

能够与所述靶区域中的靶序列杂交的指导序列、

与所述Cas蛋白相互作用的支架区域、和

其中所述细胞在含有核酸酶的流体的存在下离体存在，或在体内存在，并且所述提供导致所述靶区域的编辑或所述靶基因的表达的调节。

2.根据权利要求1所述的方法，其中所述硫代磷酸酯、膦酰基羧酸酯和硫代膦酰基羧酸酯修饰各自存在于还包含2'-O-甲基的核苷酸中。

3.根据权利要求1或2所述的方法，其中所述经修饰的指导RNA包含所述5'端的5个核苷酸内的至少两个连续的2'-O-甲基-3'-硫代磷酸酯(MS)。

4.根据前述权利要求中任一项所述的方法，其中所述膦酰基羧酸酯是膦酰基乙酸酯，并且所述硫代膦酰基羧酸酯是硫代膦酰基乙酸酯。

5.根据权利要求3所述的方法，其中所述经修饰的指导RNA包含在所述3'端的5个核苷酸内的至少两个连续的2'-O-甲基-3'-膦酰基乙酸酯(MP)或2'-O-甲基-3'-硫代膦酰基乙酸酯(MSP)。

6.根据前述权利要求中任一项所述的方法，其中所述经修饰的指导RNA进一步包含位于所述5'端和所述3'端内的5个核苷酸之外的一个或多个经修饰的核苷酸。

7.根据前述权利要求中任一项所述的方法，其中所述经修饰的指导RNA是单指导RNA。

8.根据前述权利要求中任一项所述的方法，其中将所述Cas蛋白作为编码所述Cas蛋白的mRNA提供。

9.根据前述权利要求中任一项所述的方法，其中将所述Cas蛋白和所述经修饰的指导RNA作为核糖核蛋白复合物(RNP)提供。

10.根据前述权利要求中任一项所述的方法，其中在纳米颗粒中提供所述Cas蛋白和/或经修饰的指导RNA。

11.根据前述权利要求中任一项所述的方法，其中所述编辑或调节以比通过未修饰的gRNA进行的编辑或调节更高的效率发生，所述未修饰的gRNA在其他方面与所述经修饰的指导RNA相同。

12.根据权利要求11所述的方法，其中所述效率高至少10％。

13.根据前述权利要求中任一项所述的方法，其中所述含有核酸酶的流体是血清。

14.根据前述权利要求中任一项所述的方法，其中所述含有核酸酶的流体是脑脊液(CSF)。

15.根据前述权利要求中任一项所述的方法，其中所述含有核酸酶的流体是细胞培养基。

16.根据前述权利要求中任一项所述的方法，其中所述含有核酸酶的流体是体液。

17.根据前述权利要求中任一项所述的方法，其中所述细胞存在于体内。

18.根据前述权利要求中任一项所述的方法，其中所述细胞在含有核酸酶的流体的存在下离体存在。