CN110891965A

CN110891965A - 植物中使用的抗crispr蛋白的方法和组合物

Info

Publication number: CN110891965A
Application number: CN201880042315.9A
Authority: CN
Inventors: C.弗雷莫; P.霍瓦特; D.A.罗梅罗; A.海因斯; S.穆瓦诺; G.罗素; J.扬; M-L.李梅
Original assignee: Laval University Canada; DuPont Nutrition Biosciences ApS
Current assignee: Laval University Canada; DuPont Nutrition Biosciences ApS
Priority date: 2017-04-24
Filing date: 2018-04-24
Publication date: 2020-03-17
Also published as: WO2018197520A1; US11732251B2; BR112019022201A2; EP3615552A1; US20200190492A1

Abstract

提供了在植物中使用的抗CRISPR(ACR)蛋白的方法和组合物，包括调节Cas核酸内切酶活性、改善同源重组频率、在各细胞周期期间控制Cas核酸内切酶活性、对植物中Cas核酸内切酶活性进行空间和/或时间调节、在基因激活或阻抑中使用以及减少脱靶多核苷酸切割。

Description

植物中使用的抗CRISPR蛋白的方法和组合物

本申请要求2017年4月24日提交的美国临时申请号62/488,981和2017年5月25日提交的美国临时申请号62/510,914以及2018年4月24日提交的PCT申请号PCT/EP2018/060481的权益，该PCT申请要求2017年4月24日提交的美国临时专利申请号62/488,969和2017年5月25日提交的美国临时申请号62/510,896的权益，所有这些均通过引用以其整体并入本文。

以电子方式提交的序列表的引用

该序列表的官方副本经由EFS-Web作为ASCII格式的序列表以电子方式提交，文件名为NB41268WOPCT_SequenceListing_ST25.TXT，创建于2018年4月24日且具有525,189字节大小，并与本说明书同时提交。包括在该ASCII格式的文件中的序列表是本说明书的一部分并且以其全文通过引用并入本文。

技术领域

本公开涉及分子生物学领域，特别地涉及与用于植物的抗CRISPR(ACR)蛋白组合物和方法有关的组合物和方法。

背景技术

重组DNA技术使修饰(编辑)特定的内源染色体序列和/或在靶基因组位置插入DNA序列成为可能，从而改变了生物体的表型。已经使用了采用位点特异性重组系统的位点特异性整合技术以及其他类型的重组技术来在各种生物体中产生目的基因的靶向插入。基因组编辑技术如设计师的锌指核酸酶(ZFN)或转录激活子样效应子核酸酶(TALEN)或归巢大范围核酸酶可以用于产生靶向基因组干扰，但这些系统倾向于具有低特异性并且使用需要对每个靶位点进行重新设计的经设计的核酸酶，这使得它们的制备成本高昂且耗时。最近，已经从细菌和古细菌CRISPR系统中开发了基因组编辑工具，这些工具提供了改善的可编程性，以处理更广泛的靶序列，并且在一些应用中还具有改善的特异性和效率。

尽管CRISPR衍生系统相比以前的基因编辑工具提供许多益处，但仍需要可进一步改善这些益处的组合物和方法。

发明内容

如本文所述，提供了用于鉴定、表征和利用植物中的抗CRISPR(ACR)蛋白，包括Cas核酸内切酶活性的调节、同源重组频率的改善、各细胞周期中Cas核酸内切酶活性的控制、植物中Cas核酸内切酶活性的空间和/或时间调节、在基因激活或阻抑中的使用以及脱靶多核苷酸切割的减少的方法和组合物。

在一个方面，提供了一种在植物细胞中调节Cas核酸内切酶对靶多核苷酸的活性的方法，所述方法包括向所述细胞提供Cas核酸内切酶、能够与该植物细胞中的靶多核苷酸结合的指导RNA，以及能够降低所述植物细胞中所述Cas核酸内切酶活性的抗CRISPR多肽。

在一个方面，提供了一种调节植物细胞中Cas核酸内切酶对靶多核苷酸的活性的方法，所述方法包括向所述细胞提供Cas核酸内切酶、能够与该植物细胞中的靶多核苷酸结合的指导RNA、以及能够降低所述植物细胞中所述Cas核酸内切酶活性的抗CRISPR多肽，其中该活性选自下组，所述组由以下组成：靶多核苷酸结合、靶多核苷酸切口、靶多核苷酸双链断裂产生和靶多核苷酸修饰。

在一个方面，提供了一种调节植物细胞中Cas核酸内切酶对靶多核苷酸的活性的方法，所述方法包括向所述细胞提供Cas核酸内切酶、能够与该植物细胞中的靶多核苷酸结合的指导RNA、以及能够降低所述植物细胞中所述Cas核酸内切酶活性的抗CRISPR多肽，其中该活性选自下组，所述组由以下组成：靶多核苷酸结合、靶多核苷酸切口、靶多核苷酸双链断裂产生和靶多核苷酸修饰，其中所述靶多核苷酸修饰选自下组，所述组由以下组成：至少一个核苷酸的插入、至少一个核苷酸的缺失、至少一个核苷酸的取代、以及至少一个核苷酸的化学改变。

在一个方面，提供了一种调节植物细胞中Cas核酸内切酶对靶多核苷酸的活性的方法，所述方法包括向所述细胞提供Cas核酸内切酶、能够与该植物细胞中的靶多核苷酸结合的指导RNA、以及能够降低所述植物细胞中所述Cas核酸内切酶活性的抗CRISPR多肽，其中该Cas核酸内切酶缺少切口或切割靶多核苷酸的能力。

在一个方面，提供了一种调节植物细胞中Cas核酸内切酶对靶多核苷酸的活性的方法，所述方法包括向所述细胞提供Cas核酸内切酶、能够与该植物细胞中的靶多核苷酸结合的指导RNA、以及能够降低所述植物细胞中所述Cas核酸内切酶活性的抗CRISPR多肽，其中所述活性与包含所述Cas核酸内切酶和指导RNA但不包含所述抗CRISPR多肽的同系植物细胞相比有所降低。

在一个方面，提供了一种调节植物细胞中Cas核酸内切酶对靶多核苷酸的活性的方法，所述方法包括向所述细胞提供Cas核酸内切酶、能够与该植物细胞中的靶多核苷酸结合的指导RNA、以及能够降低所述植物细胞中所述Cas核酸内切酶活性的抗CRISPR多肽，其中在至少一个时间点、在至少一种组织或细胞类型中，或在细胞或植物生命周期的至少一个期所述植物细胞中所述Cas核酸内切酶的活性消失。

在一个方面，提供了一种调节植物细胞中Cas核酸内切酶对靶多核苷酸的活性的方法，所述方法包括向所述细胞提供Cas核酸内切酶、能够与该植物细胞中的靶多核苷酸结合的指导RNA、以及能够降低所述植物细胞中所述Cas核酸内切酶活性的抗CRISPR多肽，其中该Cas核酸内切酶是II-A型Cas核酸内切酶。

在一个方面，提供了一种调节植物细胞中Cas核酸内切酶对靶多核苷酸的活性的方法，所述方法包括向所述细胞提供Cas核酸内切酶、能够与该植物细胞中的靶多核苷酸结合的指导RNA、以及能够降低所述植物细胞中所述Cas核酸内切酶活性的抗CRISPR多肽，其中该Cas核酸内切酶是Cas9。

在一个方面，提供了一种调节植物细胞中Cas核酸内切酶对靶多核苷酸的活性的方法，所述方法包括向所述细胞提供Cas核酸内切酶、能够与该植物细胞中的靶多核苷酸结合的指导RNA、以及能够降低所述植物细胞中所述Cas核酸内切酶活性的抗CRISPR多肽，其中该Cas核酸内切酶是Cpf1。

在一个方面，提供了一种调节植物细胞中Cas核酸内切酶对靶多核苷酸的活性的方法，所述方法包括向所述细胞提供Cas核酸内切酶、能够与该植物细胞中的靶多核苷酸结合的指导RNA、以及能够降低所述植物细胞中所述Cas核酸内切酶活性的抗CRISPR(ACR)多肽，其中所述ACR具有与选自下组的至少50个、50至100个、至少100个、100至125个、至少125个、125至150个、至少150个、150至175个、至少175个、175至200个或至少200个连续氨基酸的序列具有至少50％、50％至55％、至少55％、55％至60％、至少60％、60％至65％、至少65％、65％至70％、至少70％、70％至75％、至少75％、75％至80％、至少80％、80％85％和99％-374％、至少85％、85％至90％、至少90％、90％至95％、至少95％、95％至96％、至少96％、96％至97％、至少97％、97％至98％、至少98％、98％至99％、至少99％、99％至100％或100％的序列同一性的氨基酸序列，所述组由以下组成：SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86和375-650。

在一个方面，提供了一种调节植物细胞中Cas核酸内切酶对靶多核苷酸的活性的方法，所述方法包括向所述细胞提供Cas核酸内切酶、能够与该植物细胞中的靶多核苷酸结合的指导RNA、以及能够降低所述植物细胞中所述Cas核酸内切酶活性的抗CRISPR(ACR)多核苷酸，其中所述ACR具有与选自下组的至少250个、250至500个、至少500个、500至600个或至少600个连续核苷酸的序列有至少50％、50％至55％、至少55％、55％至60％、至少60％、60％至65％、至少65％、65％至70％、至少70％、70％至75％、至少75％、75％至80％、至少80％、80％85％和99％-374％、至少85％、85％至90％、至少90％、90％至95％、至少95％、95％至96％、至少96％、96％至97％、至少97％、97％至98％、至少98％、98％至99％、至少99％、99％至100％或100％的序列同一性的多核苷酸序列，所述组由以下组成：SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85和99-374。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入。

在一个方面，提供了一种用于增加植物细胞中Cas核酸内切酶和指导多核苷酸复合物的中靶多核苷酸切割活性与脱靶多核苷酸切割活性的比例的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中与缺少所述ACR多肽的样品中的Cas核酸内切酶的切割率相比特异性增加至少5％、至少6％、至少7％、至少8％、至少9％、至少10％或甚至大于10％、大于15％、大于20％或大于25％。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述方法在特定细胞周期期间进行。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述方法在减数分裂期间进行。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述方法在有丝分裂期间进行。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述方法在植物发育的特定阶段期间进行。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述方法在植物发育的特定阶段期间进行，其中所述阶段选自下组，所述组由以下组成：生长、生殖、营养和衰老。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述方法在特定时间点期间进行。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述方法在植物的特定组织或细胞类型中进行，在一些实施例中该特定组织或细胞类型选自下组，所述组由以下组成：整株植物、幼苗、分生组织、基本组织、维管组织、皮膜组织、种子、叶、根、芽、茎、花、果实、匍匐茎、鳞茎、块茎、球茎、无性末梢枝(keiki)、芽、幼芽(bud)、肿瘤组织、单细胞、原生质体、胚胎和愈伤组织。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该Cas核酸内切酶和指导RNA均作为多核苷酸提供。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述指导RNA不仅仅包括核糖核酸。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该Cas核酸内切酶作为蛋白质提供，该指导多核苷酸作为RNA分子提供。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR作为编码多肽的多核苷酸提供。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR作为多肽提供。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR同时作为Cas核酸内切酶和指导多核苷酸提供。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR在引入该Cas核酸内切酶或指导多核苷酸之前提供。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR在引入该Cas核酸内切酶或指导多核苷酸之后提供。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中编码该ACR的多肽预先整合入该细胞或生物体的基因组中。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中编码该Cas核酸内切酶的多肽预先整合入该细胞或生物体的基因组中。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR的表达或活性是可诱导的。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR的表达或活性是可诱导的，其中诱导是对选自下组的条件的响应，所述组由以下组成：温度、存在或不存在外源施加分子、内源基因的激活或抑制、光照、细胞周期、生物体期(organism phase)、组织或细胞类型、以及环境压力。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR蛋白包含卷曲螺旋基序。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR蛋白包含“hxxhcxc”模式的氨基酸七肽重复模式，其中h＝疏水性氨基酸，c＝带电荷的氨基酸，并且x＝任何氨基酸。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述ACR具有与选自下组的至少50个、50至100个、至少100个、100至125个、至少125个、125至150个、至少150个、150至175个、至少175个、175至200个或至少200个连续氨基酸的序列具有至少50％、50％至55％、至少55％、55％至60％、至少60％、60％至65％、至少65％、65％至70％、至少70％、70％至75％、至少75％、75％至80％、至少80％、80％85％和99％-374％、至少85％、85％至90％、至少90％、90％至95％、至少95％、95％至96％、至少96％、96％至97％、至少97％、97％至98％、至少98％、98％至99％、至少99％、99％至100％或100％的序列同一性的氨基酸序列，所述组由以下组成：SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86和375-650。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多核苷酸一起引入，其中所述ACR具有与选自下组的至少250个、250至500个、至少500个、500至600个或至少600个连续核苷酸的序列具有至少50％、50％至55％、至少55％、55％至60％、至少60％、60％至65％、至少65％、65％至70％、至少70％、70％至75％、至少75％、75％至80％、至少80％、80％85％和99％-374％、至少85％、85％至90％、至少90％、90％至95％、至少95％、95％至96％、至少96％、96％至97％、至少97％、97％至98％、至少98％、98％至99％、至少99％、99％至100％或100％的序列同一性的多核苷酸序列，所述组由以下组成：SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85和99-374。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该Cas核酸内切酶为II-A型Cas核酸内切酶。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该Cas核酸内切酶为Cas9。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该Cas核酸内切酶为Cpfl。

在一个方面，提供了一种用于增加植物细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该Cas核酸内切酶缺少切口或切割靶多核苷酸的能力。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽引入到该靶多核苷酸中。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中与缺少所述ACR多肽的样品中的Cas核酸内切酶的切割率相比特异性增加至少5％、至少6％、至少7％、至少8％、至少9％、至少10％或甚至大于10％、大于15％、大于20％或大于25％。

在一个方面，提供了一种增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述方法在特定细胞周期期间进行。

在一个方面，提供了一种增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述方法在减数分裂期间进行。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述方法在有丝分裂期间进行。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述方法在植物发育的特定阶段期间进行。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述方法在植物发育的特定阶段期间进行，其中所述阶段选自下组，所述组由以下组成：生长、生殖、营养和衰老。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述方法在特定时间点期间进行。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述方法在植物的特定组织或细胞类型中进行，在一些实施例中该特定组织或细胞类型选自下组，所述组由以下组成：整株植物、幼苗、分生组织、基本组织、维管组织、皮膜组织、种子、叶、根、芽、茎、花、果实、匍匐茎、鳞茎、块茎、球茎、无性末梢枝(keiki)、芽、幼芽、肿瘤组织、单细胞、原生质体、胚胎和愈伤组织。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该Cas核酸内切酶和指导RNA均作为多核苷酸提供。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述指导RNA不仅仅包括核糖核酸。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该Cas核酸内切酶作为蛋白质提供，该指导多核苷酸作为RNA分子提供。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR作为编码多肽的多核苷酸提供。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR作为多肽提供。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR同时作为Cas核酸内切酶和指导多核苷酸提供。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR在引入该Cas核酸内切酶或指导多核苷酸之前提供。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR在引入该Cas核酸内切酶或指导多核苷酸之后提供。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中编码该ACR的多肽预先整合入该细胞或生物体的基因组中。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中编码Cas核酸内切酶的多肽预先整合入该细胞或生物体的基因组中。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR的表达或活性是可诱导的。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR的表达或活性是可诱导的，其中诱导是对选自下组的条件的响应，所述组由以下组成：温度、存在或不存在外源施加分子、内源基因的激活或抑制、光照、细胞周期、生物体期、组织或细胞类型、以及环境压力。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR蛋白包含卷曲螺旋基序。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该ACR蛋白包含“hxxhcxc”模式的氨基酸七肽重复模式，其中h＝疏水性氨基酸，c＝带电荷的氨基酸，并且x＝任何氨基酸。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中所述ACR具有与选自下组的至少50个、50至100个、至少100个、100至125个、至少125个、125至150个、至少150个、150至175个、至少175个、175至200个或至少200个连续氨基酸的序列具有至少50％、50％至55％、至少55％、55％至60％、至少60％、60％至65％、至少65％、65％至70％、至少70％、70％至75％、至少75％、75％至80％、至少80％、80％85％和99％-374％、至少85％、85％至90％、至少90％、90％至95％、至少95％、95％至96％、至少96％、96％至97％、至少97％、97％至98％、至少98％、98％至99％、至少99％、99％至100％或100％的序列同一性的氨基酸序列，所述组由以下组成：SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86和375-650。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多核苷酸一起引入，其中所述ACR具有与选自下组的至少250个、250至500个、至少500个、500至600个或至少600个连续核苷酸的序列具有至少50％、50％至55％、至少55％、55％至60％、至少60％、60％至65％、至少65％、65％至70％、至少70％、70％至75％、至少75％、75％至80％、至少80％、80％85％和99％-374％、至少85％、85％至90％、至少90％、90％至95％、至少95％、95％至96％、至少96％、96％至97％、至少97％、97％至98％、至少98％、98％至99％、至少99％、99％至100％或100％的序列同一性的多核苷酸序列，所述组由以下组成：SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85和99-374。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该Cas核酸内切酶为II-A型Cas核酸内切酶。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该Cas核酸内切酶为Cpf1。

在一个方面，提供了一种用于增加植物细胞中靶多核苷酸的同源重组效率的方法，所述方法包括将Cas核酸内切酶、指导多核苷酸和抗CRISPR(ACR)多肽一起引入，其中该Cas核酸内切酶缺少切口或切割靶多核苷酸的能力。

在一个方面，提供了包含Cas核酸内切酶和ACR分子的植物细胞。

在一个方面，提供了包含Cas核酸内切酶和ACR分子的植物细胞，其中所述ACR分子由噬菌体或病毒作为多核苷酸提供。

在一个方面，提供了包含Cas核酸内切酶、指导RNA和ACR分子的植物细胞。

在一个方面，提供了包含异源Cas核酸内切酶、指导RNA和ACR蛋白的植物细胞，其中所述指导RNA能够与植物基因组中的靶多核苷酸结合。

在一个方面，提供了包含Cas核酸内切酶和ACR分子的植物细胞，其中所述植物细胞获得自或衍生自选自下组的植物，所述组由以下组成：玉蜀黍、稻、高粱、黑麦、大麦、小麦、粟、燕麦、甘蔗、草坪草、柳枝稷、大豆、卡诺拉油菜、苜蓿、向日葵、棉花、烟草、花生、马铃薯、拟南芥属植物(Arabidopsis)、蔬菜和红花。

在一个方面，提供了包含Cas核酸内切酶和ACR分子的植物细胞，其中该ACR具有与选自下组的至少50个、50至100个、至少100个、100至125个、至少125个、125至150个、至少150个、150至175个、至少175个、175至200个或至少200个连续氨基酸的序列具有至少50％、50％至55％、至少55％、55％至60％、至少60％、60％至65％、至少65％、65％至70％、至少70％、70％至75％、至少75％、75％至80％、至少80％、80％85％和99％-374％、至少85％、85％至90％、至少90％、90％至95％、至少95％、95％至96％、至少96％、96％至97％、至少97％、97％至98％、至少98％、98％至99％、至少99％、99％至100％或100％的序列同一性的氨基酸序列，所述组由以下组成：SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86和375-650。

在一个方面，提供了包含Cas核酸内切酶和ACR分子的植物细胞，其中该ACR具有与选自下组的至少250个、250至500个、至少500个、500至600个或至少600个连续核苷酸的序列具有至少50％、50％至55％、至少55％、55％至60％、至少60％、60％至65％、至少65％、65％至70％、至少70％、70％至75％、至少75％、75％至80％、至少80％、80％85％和99％-374％、至少85％、85％至90％、至少90％、90％至95％、至少95％、95％至96％、至少96％、96％至97％、至少97％、97％至98％、至少98％、98％至99％、至少99％、99％至100％或100％的序列同一性的多核苷酸序列，所述组由以下组成：SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85和99-374。

在一个方面，提供了包含重组构建体的植物细胞，该重组构建体包含与异源调节表达元件可操作地连接的编码ACR蛋白的多核苷酸序列。

在一个方面，提供了包含重组构建体的植物细胞，该重组构建体包含与异源调节表达元件可操作地连接的编码ACR蛋白的多核苷酸序列，其中所述植物细胞选自下组，所述组由以下组成：玉蜀黍、稻、高粱、黑麦、大麦、小麦、粟、燕麦、甘蔗、草坪草、柳枝稷、大豆、卡诺拉油菜、苜蓿、向日葵、棉花、烟草、花生、马铃薯、拟南芥属植物、蔬菜和红花

在一个方面，提供了包含重组构建体的植物细胞，该重组构建体包含与异源调节表达元件可操作地连接的编码ACR蛋白的多核苷酸序列，其中该异源调节表达元件可响应于选自下组的条件而可诱导，所述组由以下组成：温度、存在或不存在外源施加分子、内源基因的激活或抑制、光照、细胞周期、生物体期、组织或细胞类型、以及环境压力。

在一个方面，提供了包含重组构建体的植物细胞，该重组构建体包含与异源调节表达元件可操作地连接的编码ACR蛋白的多核苷酸序列，其中该ACR蛋白包含卷曲螺旋基序。

在一个方面，提供了包含重组构建体的植物细胞，该重组构建体包含与异源调节表达元件可操作地连接的编码ACR蛋白的多核苷酸序列，其中该ACR蛋白包含“hxxhcxc”模式的氨基酸七肽重复模式，其中h＝疏水性氨基酸，c＝带电荷的氨基酸，并且x＝任何氨基酸。

在一个方面，提供了包含重组构建体的植物细胞，该重组构建体包含与异源调节表达元件可操作地连接的编码ACR蛋白的多核苷酸序列，其中该ACR包含与选自下组的至少50个、50至100个、至少100个、100至125个、至少125个、125至150个、至少150个、150至175个、至少175个、175至200个或至少200个连续氨基酸的序列具有至少50％、50％至55％、至少55％、55％至60％、至少60％、60％至65％、至少65％、65％至70％、至少70％、70％至75％、至少75％、75％至80％、至少80％、80％85％和99％-374％、至少85％、85％至90％、至少90％、90％至95％、至少95％、95％至96％、至少96％、96％至97％、至少97％、97％至98％、至少98％、98％至99％、至少99％、99％至100％或100％的序列同一性的氨基酸序列，所述组由以下组成：SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86和375-650。

在一个方面，提供了包含重组构建体的植物细胞，该重组构建体包含与异源调节表达元件可操作地连接的编码ACR蛋白的多核苷酸序列，其中该编码ACR蛋白的多核苷酸序列与选自下组的至少250个、250至500个、至少500个、500至600个或至少600个连续核苷酸的序列共享至少50％、50％至55％、至少55％、55％至60％、至少60％、60％至65％、至少65％、65％至70％、至少70％、70％至75％、至少75％、75％至80％、至少80％、80％85％和99％-374％、至少85％、85％至90％、至少90％、90％至95％、至少95％、95％至96％、至少96％、96％至97％、至少97％、97％至98％、至少98％、98％至99％、至少99％、99％至100％或100％的序列同一性，所述组由以下组成：SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85和99-374。

在一个方面，提供了一种用于表征抗CRISPR蛋白活性的方法，所述方法包括：(a)获得包含重组构建体的细菌宿主细胞，所述重组构建体具有CRISPR系统，该CRISPR系统具有能够靶向烈性噬菌体的基因组靶序列的靶向序列；(b)引入包含在细菌宿主细胞中起作用的启动子的构建体，所述启动子与编码待进行抗CRISPR活性测定的多肽的多核苷酸可操作地连接；(c)用烈性噬菌体激发细菌宿主；以及(d)鉴定一种或多种具有与用该烈性噬菌体激发的缺乏编码CRISPR系统的重组构建体的细菌细胞实质上相似的噬菌体滴度的细菌菌落，所述CRISPR系统具有能够靶向烈性噬菌体的基因组靶序列的靶向序列。

在一个方面，提供了一种用于鉴定抗CRISPR蛋白的方法，所述方法包括：(a)获得包含重组构建体的第一细菌宿主细胞，所述重组构建体具有II-A型CRISPR系统，所述II-A型CRISPR系统具有能够靶向第一烈性噬菌体的基因组靶序列的靶向序列；(b)用烈性噬菌体激发第一细菌宿主；(c)获得包含重组构建体的第二细菌宿主细胞，所述重组构建体具有II-A型CRISPR系统，所述II-A型CRISPR系统具有能够靶向第二烈性噬菌体的基因组靶序列的靶向序列；(d)用第二烈性噬菌体激发第二细菌宿主；(e)鉴定一种或多种具有与用第一烈性噬菌体激发的缺乏编码CRISPR系统的重组构建体的细菌细胞实质上相似的噬菌体滴度的第一细菌宿主细胞的细菌菌落，所述CRISPR系统具有能够靶向第一烈性噬菌体的基因组靶序列的靶向序列；(f)鉴定一种或多种具有与用第二烈性噬菌体激发的缺乏编码CRISPR系统的重组构建体的细菌细胞实质上不同的噬菌体滴度的第二细菌宿主细胞的细菌菌落，所述CRISPR系统具有能够靶向第二烈性噬菌体的基因组靶序列的靶向序列；(g)对第一和第二烈性噬菌体的基因组进行测序；(h)鉴定第一烈性噬菌体中存在但第二烈性噬菌体中不存在的一个或多个基因；(i)获得包含重组构建体的第三细菌宿主细胞，所述重组构建体具有CRISPR系统，所述CRISPR系统具有能够靶向第一烈性噬菌体的基因组靶序列的靶向序列；(j)引入包含在第三细菌宿主细胞中起作用的启动子的构建体，该启动子可操作地连接至与(h)的基因相同的多核苷酸；(k)用第一烈性噬菌体激发细菌宿主；以及(1)鉴定一种或多种具有与用第一烈性噬菌体激发的缺乏编码CRISPR系统的重组构建体的细菌细胞实质上相似的噬菌体滴度的第三细菌宿主细胞的细菌菌落，所述CRISPR系统具有能够靶向第一烈性噬菌体的基因组靶序列的靶向序列。

在一个方面，提供了一种用于鉴定抗CRISPR蛋白的方法，所述方法包括：(a)获得对包含CRISPR的细菌显示出毒性的噬菌体；(b)对该噬菌体的基因组进行测序；以及(c)鉴定至少一个具有至少100个碱基的连续多核苷酸，所述连续多核苷酸与选自下组的序列共享至少50％、50％至55％、至少55％、55％至60％、至少60％、60％至65％、至少65％、65％至70％、至少70％、70％至75％、至少75％、75％至80％、至少80％、80％85％和99％-374％、至少85％、85％至90％、至少90％、90％至95％、至少95％、95％至96％、至少96％、96％至97％、至少97％、97％至98％、至少98％、98％至99％、至少99％、99％至100％或100％的序列同一性，所述组由以下组成：SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85和99-374。

在一个方面，提供了一种调节细胞中Cas核酸内切酶对靶多核苷酸的活性的方法，所述方法包括向细胞提供抗CRISPR多肽，其中该抗CRISPR多肽调节细胞中Cas核酸内切酶的活性，其中Cas核酸内切酶与抗CRISPR多肽的浓度比为1∶1000至1∶100、1∶100至1∶10、1∶10至1∶1、1∶1至10∶1、10∶1至100∶1、100∶1至1000∶1，或1∶1000至1000∶1的任何浓度比。

在一个方面，提供了一种用于增加细胞中的Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将抗CRISPR(ACR)多肽引入细胞中，其中该ACR多肽与Cas核酸内切酶相互作用，其中该抗CRISPR多肽调节细胞中Cas核酸内切酶的活性，其中该Cas核酸内切酶与抗CRISPR多肽的浓度比为1∶1000至1∶100、1∶100至1∶10、1∶10至1∶1、1∶1至10∶1、10∶1至100∶1、100∶1至1000∶1，或1∶1000至1000∶1的任何浓度比。

在一个方面，提供了一种用于增加细胞中供体多核苷酸的位点特异性同源重组频率的方法，所述方法包括将抗CRISPR(ACR)多肽引入细胞中以通过多核苷酸指导的Cas核酸内切酶增加供体多核苷酸的同源重组，其中该抗CRISPR多肽调节细胞中Cas核酸内切酶的活性，其中该Cas核酸内切酶与抗CRISPR多肽的浓度比为1∶1000至1∶100、1∶100至1∶10、1∶10至1∶1、1∶1至10∶1、10∶1至100∶1、100∶1至1000∶1，或1∶1000至1000∶1的任何浓度比。

在一个方面，提供了一种细胞，其中该细胞包含Cas核酸内切酶和ACR蛋白，其中Cas核酸内切酶与抗CRISPR多肽的浓度比为1∶1000至1∶100、1∶100至1∶10、1∶10至1∶1、1∶1至10∶1、10∶1至100∶1、100∶1至1000∶1，或1∶1000至1000∶1的任何浓度比；其中该细胞任选地进一步包含异源多核苷酸。

在本文描述的任何方法或组合物中，该Cas核酸内切酶对于该细胞可以是异源的。在本文描述的任何方法或组合物中，该ACR对于该细胞可以是异源的。在本文描述的任何方法或组合物中，该Cas核酸内切酶和ACR对于该细胞和/或彼此之间可以是异源的。

在任何方面，由ACR调节的Cas核酸内切酶的特异性可以选自下组，所述组由以下组成：切割特异性、切口特异性、结合特异性或靶标识别特异性。

本文中的任何方法和组合物均可包含PCT申请号PCT/EP2018/060481中描述的ACR的任何序列、基序或其他特征，该申请通过引用以其整体并入本文。

附图和序列表的说明

根据下列的详细描述和附图以及序列表，可以更全面地理解本公开，所述详细描述和附图以及序列表形成本申请的一部分。这些序列描述以及所附序列表遵守如37C.F.R.§§1.821和1.825所列出的管理专利申请中核苷酸和氨基酸序列公开内容的规则。序列表中的这些序列描述包含如在37C.F.R.§§1.821和1.825中所定义的用于氨基酸的三字母代码，将其通过引用并入本文。

图1提供了阻碍基于CRISPR的免疫力的烈性噬菌体的发现的示意图的一个实施例。(顶图)当使用烈性噬菌体激发细菌时，可以分离出抗噬菌体的幸存者。感染嗜热链球菌(Streptococcus thermophilus)DGCC7854的六种烈性噬菌体产生了不同频率的CRISPR免疫幸存者。(底图)当比较铺板于噬菌体敏感性野生型菌株DGCC7854上的相同噬菌体和靶向所有六种噬菌体中保守序列的CRISPR免疫突变体时，预期噬菌体滴度会大大降低。与其他四个相关噬菌体相比，噬菌体D4276和D1811的滴度降低幅度要小得多。噬菌体名称和相关数据根据CRISPR相互作用表型进行划分；许可性(白色，D5842和D5843)、适应受阻(分形图案，D1024和D5891)和限制性(黑色，D4276)。

图2A-2D提供了嗜热链球菌中StAcrIIA的代表性抗CRISPR活性。图2A：从CRISPR限制性(黑色衣壳)噬菌体D4276中克隆的基因在DGCC7854衍生的免疫菌株中表达，并测定所得的转化体对许可性(白色衣壳)噬菌体D5842的敏感性是否增加。图2B：限制性(黑色)cos型噬菌体D4276和许可性(白色)cos型噬菌体D5842在携带空载体pNZ123或表达StAcrIIA的载体(pNZAcr)的天然DGCC7854或其CR1免疫衍生物上的滴度。每列描绘了三个生物学重复的平均值，每个生物学重复有三个技术性重复。图2C：许可性(白色)pac型噬菌体2972的、携带空载体pNZ123或表达StAcrIIA的载体(pNZAcr)的天然DGCC7710、CR1免疫突变体或CR3免疫突变体的滴度。每列描绘了三个生物学重复的平均值，每个生物学重复有三个技术性重复。在图2B和图2C中，误差条代表标准偏差，星号代表与所有其他数据的差异(p＜0.001)，而单因素差分析和Tukey HSD检验确定的其他应变与其他任何数据均无差异(p＞0.5)。图2D：携带空载体pNZ123或表达StAcrIIA的载体(pNZAcr)的DGCC7710的噬菌体2972激发后存活者的数量和表征。在ACR的存在下检测到的单CR1采集靶向质粒而不是噬菌体。正如预期的一样，CR3采集靶向噬菌体。所有细胞维持完整的stAcrIIA。

图3A-3B提供了抗CRISPR基因和蛋白质的一个实施例。图3A：在所有噬菌体同源物中以及最接近的非噬菌体同源物中编码ACR的基因的基因组背景(使用blastP)。ACR同源物居中(用点填充，并分别标记为ACR D4276_028；Sfi21_p24；V442_gp51；HMPREF 2991_02915；和01205p56)，并由基因座标签鉴定。对已知的基因功能添加了注释。如果ORF的预测蛋白质产物与由全噬菌体基因组组成的数据集中的另一个共享50％的氨基酸同一性，则其为黑色；否则，则为白色。实线将这些相似的蛋白质产物连接起来，并在穿过不符合相似性标准的蛋白质的地方变为虚线。HTH注释和可能性是从螺旋-转角-螺旋基序预测中获得的，只有在可能性为至少50％时才显示。图3B：所有噬菌体ACR同源物以及最接近的非噬菌体同源物的蛋白质比对(使用blastP)，仅突出差异。破折号(-)指示蛋白质中不存在该残基。粗体残基(KQRREYAQEMDRLEKAFENLD和ENKLDKIIEKIDKL)是根据共识预测的卷曲螺旋基序(pCoils，＞90％置信度)，而该残基上方的“E”(扩展)和“H”(螺旋)标志是根据jnet、jhmm和jpssm得到的共识预测。

图4A-4B提供了针对SpCas9的抗CRISPR活性的一个实例的示意图。图4A：产生免疫乳酸乳球菌(Lactococcus lactis)MG1363菌株。pL2Cas9含有来自pTRKL2载体主链上的pCas9的SpCas9模块。克隆了靶向乳酸乳球菌烈性噬菌体p2的orf44的间隔区，以产生靶向噬菌体的SpCas9。图4B：烈性噬菌体p2在其携带pL2Cas9或靶向噬菌体的pL2Cas9(pL2Cas9-44)和携带空载体pNZ123或表达StAcrIIA的载体(pNZAcr)的宿主乳酸乳球菌MG1363上的的滴度。通过点滴试验测定滴度，并且每个条代表三个生物学重复的平均值，每个生物学重复有三个技术性重复。只对具有典型形态的噬菌斑进行了计数，尽管当用pNZ123铺板于pL2Cas9-44上时，偶尔会出现微小噬菌斑的次级形态。尽管这些噬菌斑不能可靠地计数，但其显现的最大阈值由带图案的框描绘。误差条代表标准偏差，星号代表与所有其他数据的差异(p＜0.001)，而单因素方差分析和Tukey HSD检验确定的其他应变与其他任何数据均无差异(p＞0.5)。

图5A-5B提供了“小噬菌斑”表型的表征。当将噬菌体p2铺板在其携带pL2Cas9-44的宿主上时，其滴度会大大降低，并且会出现微小的噬菌斑表型(见图1)。图5A：通过ECOI测定(也由跟随图5B中每个向下的箭头描绘)，其中噬菌体在携带pL2Cas9-44的限制性宿主上传代，然后铺板于许可性宿主上，我们确定仍然有1/30的噬菌体颗粒能够感染限制性宿主并释放野生型(橙色)后代。这样确定pL2Cas9-44系统是“泄漏的(leaky)”。图5B：(顶部2行)将噬菌体群体混合，其中包含orf44中一些能够绕过CRISPR-Cas系统的先已存在的突变体(左侧所描绘的顶部噬菌体)。我们将图1中的所有大噬菌斑(占群体的0.01％)归因于能够在限制性宿主上有效复制的先已存在的突变体。测序时，所有这些噬菌斑均含有在pL2Cas9-44靶向的区域中突变的纯群体。(底部2行)相反，绝大多数的噬菌体是野生型，偶尔会通过限制性菌株的‘泄漏’而复制；约100个噬菌体的典型的释放会导致仅3个生产性感染。由于系统泄露，这种噬菌体的复制不会导致可见的噬菌斑，因为有效的释放量(释放量*ECOI)太低。但是，如果将其铺板于指示菌株上，则很明显存在野生型噬菌体(如左侧所描绘的底部噬菌体)噬菌斑，它们仅仅在限制性宿主上不可见。(中间行)在图1中观察到的小噬菌斑被发现在orf44区域也发生了突变(测试的14/15已明显突变，尽管测试的所有15个噬菌斑均产生与包含野生型噬菌体的混合群体一致的信号)，并且那些突变与大型噬菌斑中观察到的无法区分。实际上，当微小噬菌斑再次在限制性菌株上传代时，会导致含有突变型噬菌体纯群体的大噬菌斑。我们将微小噬菌斑的表型归因于通过泄漏的pL2Cas9-44系统进行了几轮复制后‘不可见的’野生噬菌斑中出现的突变。突变体出现后，它可以有效复制并开始形成可见的噬菌斑——但是产生该突变体的延迟会限制噬菌斑的大小。这与在序列数据中观察到的混合群体一致。

图6提供了在粪肠球菌(Enterococcus faecalis)、盲肠肠球菌(Enterococcuscecorum)、塞里乳酸杆菌(Lactobacillus saerimneri)和颗粒链菌属物种(Granulicatella sp.)的基因组中鉴定的另外的、更远的ACR直系同源物的树状图。

图7A和7B提供了嗜热链球菌中Acr2蛋白(SEQ ID NO：28)的代表性抗CRISPR活性。图7A限制性(黑色)cos型噬菌体D1811和许可性(白色)cos型噬菌体D5842的、携带空载体pNZ123或表达acr2基因(SEQ ID NO：27)的载体(pNZAcr)的天然DGCC7854或其CR1免疫衍生物的滴度。每列描绘了三个生物学重复的平均值，每个生物学重复有三个技术性重复。图7B：许可性(白色)pac型噬菌体2972的、携带空载体pNZ123或表达acr2基因的载体(pNZAcr)的天然DGCC7710、CRISPR1免疫突变体或CRISPR3免疫突变体的滴度。每列描绘了三个生物学重复的平均值，每个生物学重复有三个技术性重复。在(A)和(B)中，误差条代表标准偏差，星号代表与所有其他数据的差异(p＜0.001)，而单因素方差分析和Tukey HSD检验确定的其他应变与其他任何数据均无差异(p＞0.5)。

图8描绘了用于使用Cas核酸内切酶来恢复或消除ACR基因中的功能的一种非限制性描绘。在一个实施例中，将ACR重组基因表达盒设计为非功能性的，然后在Cas核酸内切酶表达和RNA指导的切割之后或经过足够的时间进行位点特异性切割后，转化为功能性表达盒。

图9提供了使用Cas核酸内切酶与ACR蛋白和另一编码区的非限制性描述。在一个实施例中，编码框外ACR蛋白的基因可以与由编码‘自切割’2A肽的序列分开的多顺反子中的其他基因(如但不限于选择性标记)组合。然后，在恢复ACR ORF之后，多顺反子表达盒中的其他基因也可以转化为功能性状态。

图10提供了在特定细胞周期期间调节细胞中Cas核酸内切酶活性的一个非限制性描述。在一个实施例中，当HR修复处于不活性状态时在G1期间失活Cas9，以及当HR修复机制被表达并且处于活性状态时在S和G2期间允许Cas9重新活化，可以增加细胞中同源重组的频率。

以下抗CRISPR基因序列和抗CRISPR蛋白序列作为代表性但非限制性实例在本申请中公开：

SEQID NO：1/从噬菌体O1205分离的抗CRISPR基因

SEQID NO：2/由SEQ ID NO：1编码的抗CRISPR蛋白

SEQID NO：3/从噬菌体Sfi21分离的抗CRISPR基因

SEQID NO：4/由SEQ ID NO：3编码的抗CRISPR蛋白

SEQID NO：5/从噬菌体TP-778L分离的抗CRISPR基因

SEQID NO：6/由SEQ ID NO：5编码的抗CRISPR蛋白

SEQID NO：7/从链球菌属物种(Streptococcus sp.)HMSC072D07的基因组分离的抗CRISPR基因

SEQID NO：8/由SEQ ID NO：7编码的抗CRISPR蛋白

SEQID NO：9/从噬菌体D4276分离的抗CRISPR基因

SEQID NO：10/由SEQ ID NO：9编码的抗CRISPR蛋白

SEQID NO：11/从噬菌体D1126分离的抗CRISPR基因

SEQID NO：12/由SEQ ID NO：11编码的抗CRISPR蛋白

SEQID NO：13/从噬菌体D4250分离的抗CRISPR基因

SEQID NO：14/由SEQ ID NO：13编码的抗CRISPR蛋白

SEQID NO：15/从噬菌体D4252分离的抗CRISPR基因

SEQID NO：16/由SEQ ID NO：15编码的抗CRISPR蛋白

SEQID NO：17/从噬菌体D4598分离的抗CRISPR基因

SEQID NO：18/由SEQ ID NO：17编码的抗CRISPR蛋白

SEQID NO：19/从变异链球菌(Streptococcus mutans)菌株的基因组分离的抗CRISPR基因

SEQID NO：20/由SEQ ID NO：19编码的抗CRISPR蛋白

SEQID NO：21/从变异链球菌(Streptococcus mutans)菌株的基因组分离的抗CRISPR基因

SEQID NO：22/由SEQ ID NO：21编码的抗CRISPR蛋白

SEQID NO：23/从变异链球菌(Streptococcus mutans)菌株的基因组分离的抗CRISPR基因

SEQID NO：24/由SEQ ID NO：23编码的抗CRISPR蛋白

SEQID NO：25/从变异链球菌(Streptococcus mutans)菌株的基因组分离的抗CRISPR基因

SEQID NO：26/由SEQ ID NO：25编码的抗CRISPR蛋白

SEQID NO：27/从噬菌体D1811分离的抗CRISPR基因

SEQID NO：28/由SEQ ID NO：27编码的抗CRISPR蛋白

SEQID NO：29/从噬菌体D1024分离的抗CRISPR基因

SEQID NO：30/由SEQ ID NO：29编码的抗CRISPR蛋白

SEQID NO：31/从噬菌体D4530分离的抗CRISPR基因

SEQID NO：32/由SEQ ID NO：31编码的抗CRISPR蛋白

SEQID NO：33/从噬菌体D2759分离的抗CRISPR基因

SEQID NO：34/由SEQ ID NO：33编码的抗CRISPR蛋白

SEQID NO：35/从噬菌体D1297分离的抗CRISPR基因

SEQID NO：36/由SEQ ID NO：35编码的抗CRISPR蛋白

SEQID NO：37/从噬菌体M5728分离的抗CRISPR基因

SEQID NO：38/由SEQ ID NO：37编码的抗CRISPR蛋白

SEQID NO：39/从噬菌体D4419分离的抗CRISPR基因

SEQID NO：40/由SEQ ID NO：39编码的抗CRISPR蛋白

SEQID NO：41/从噬菌体D5891分离的抗CRISPR基因

SEQID NO：42/由SEQ ID NO：41编码的抗CRISPR蛋白

SEQID NO：43/从噬菌体ALQ13.2分离的抗CRISPR基因

SEQID NO：44/由SEQ ID NO：43编码的抗CRISPR蛋白

SEQID NO：45/从噬菌体D802分离的抗CRISPR基因

SEQID NO：46/由SEQ ID NO：45编码的抗CRISPR蛋白

SEQID NO：47/从噬菌体73分离的抗CRISPR基因

SEQID NO：48/由SEQ ID NO：47编码的抗CRISPR蛋白

SEQID NO：49/从噬菌体DT1分离的抗CRISPR基因

SEQID NO：50/由SEQ ID NO：49编码的抗CRISPR蛋白

SEQID NO：51/从噬菌体D1427分离的抗CRISPR基因

SEQID NO：52/由SEQ ID NO：51编码的抗CRISPR蛋白

SEQID NO：53/从噬菌体N1162分离的抗CRISPR基因

SEQID NO：54/由SEQ ID NO：53编码的抗CRISPR蛋白

SEQID NO：55/从噬菌体D1018分离的抗CRISPR基因

SEQID NO：56/由SEQ ID NO：55编码的抗CRISPR蛋白

SEQID NO：57/从噬菌体D3577分离的抗CRISPR基因

SEQID NO：58/由SEQ ID NO：57编码的抗CRISPR蛋白

SEQID NO：59/从噬菌体CHPC577分离的抗CRISPR基因

SEQID NO：60/由SEQ ID NO：59编码的抗CRISPR蛋白

SEQID NO：61/从噬菌体D4237分离的抗CRISPR基因

SEQID NO：62/由SEQ ID NO：61编码的抗CRISPR蛋白

SEQID NO：63/从噬菌体9874分离的抗CRISPR基因

SEQID NO：64/由SEQ ID NO：63编码的抗CRISPR蛋白

SEQID NO：65/从噬菌体5093分离的抗CRISPR基因

SEQID NO：66/由SEQ ID NO：65编码的抗CRISPR蛋白

SEQID NO：67/从噬菌体D4154分离的抗CRISPR基因

SEQID NO：68/由SEQ ID NO：67编码的抗CRISPR蛋白

SEQID NO：69/从嗜热链球菌DGCC11758的基因组分离的抗CRISPR基因

SEQID NO：70/由SEQ ID NO：69编码的抗CRISPR蛋白

SEQID NO：71/从嗜热链球菌DSM 20617的基因组分离的抗CRISPR基因

SEQID NO：72/由SEQ ID NO：71编码的抗CRISPR蛋白

SEQID NO：73/从噬菌体Sfi19分离的抗CRISPR基因

SEQID NO：74/由SEQ ID NO：73编码的抗CRISPR蛋白

SEQID NO：75/从噬菌体Sfi11分离的抗CRISPR基因

SEQID NO：76/由SEQ ID NO：75编码的抗CRISPR蛋白

SEQID NO：77/从嗜热链球菌M17PTZA496的基因组分离的抗CRISPR基因

SEQID NO：78/由SEQ ID NO：77编码的抗CRISPR蛋白

SEQID NO：79/从噬菌体D4769分离的抗CRISPR基因

SEQID NO：80/由SEQ ID NO：79编码的抗CRISPR蛋白

SEQID NO：81/从噬菌体D5691分离的抗CRISPR基因

SEQID NO：82/由SEQ ID NO：81编码的抗CRISPR蛋白

SEQID NO：83/从链球菌属物种HMSC10E12的基因组分离的抗CRISPR基因

SEQID NO：84/由SEQ ID NO：83编码的抗CRISPR蛋白

SEQID NO：85/从链球菌属物种HSISS2的基因组分离的抗CRISPR基因

SEQID NO：86/由SEQ ID NO：85编码的抗CRISPR蛋白

具体实施方式

提供了用于新型抗CRISPR(“ACR”)多核苷酸和多肽的组合物和方法，以及使用此类多核苷酸和多肽的方法。如本文所用，缩写“ACR”可以用作“ACR多肽”、“ACR蛋白”或“ACR多核苷酸”的替代符号，与上下文一致。所公开的方法包括用于通过修饰靶DNA分子来抑制CRISPR-Cas复合物的活性的方法。因此，所公开的组合物和方法在基因组编辑应用(特别是在植物)中具有广泛的用途。

该CRISPR-Cas系统将其作为基因组编辑工具的实用性建立在其原核生物中作为免疫系统的天然功能上。它对细菌病毒(噬菌体)活性的最先证明也是噬菌体逃避这种免疫力的第一个记录。这种逃避可能是由于点突变、DNA修饰或干扰CRISPR-Cas系统的特定的噬菌体编码蛋白(称为抗CRISPR(ACR))。后一类具有相当大的生物技术意义，因为这些ACR可以充当基于CRISPR的基因组编辑的关闭开关。迄今为止表征的每个ACR都源自温和噬菌体、基因组岛或噬菌体，并且它们都是由于与发现的第一个ACR共享的特性(如与螺旋-转角-螺旋基序的关联)而被鉴定出来。本文中，通过以噬菌体为导向的方法，我们提供了嗜热链球菌的烈性噬菌体中全新的ACR。在激发对一组相关烈性噬菌体CRISPR免疫的嗜热链球菌菌株时，我们发现一种噬菌体，该噬菌体逃避CRISPR-Cas系统的速率是其他噬菌体的40000倍。然后，我们鉴定了一种ACR，该ACR是免疫力消失的唯一原因。我们通过证明另一个嗜热链球菌菌株对不相关噬菌体的抗CRISPR活性以及使用基因组编辑中常用的异源性酿脓链球菌(Streptococcus pyogenes)Cas9(SpCas9)系统免疫的另一种细菌属的抗CRISPR活性来扩展我们的发现。迄今为止，该ACR被证明对SpCas9活性的影响最大。我们以噬菌体为导向的方法可能会有助于发现更多的ACR。我们还鉴定了对嗜热链球菌菌株也具有抗CRISPR活性的第二种ACR。

本文公开了鉴定ACR的方法，使用ACR调节Cas核酸内切酶(特别是在细胞中，特别是在植物细胞中)的活性的方法，以及示例性但非限制性的ACR多肽组合物，以及编码ACR多肽的多核苷酸。

定义

除非另有指定，否则权利要求书和说明书中使用的术语如下文阐述定义。必须注意，除非上下文另外清楚地指明，否则如本说明书及所附权利要求书中所用，单数形式“一个/一种(a/an)”和“该(the)”包括复数指示物。

如本文所用，“核酸”意指多核苷酸，并且包括脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。核酸还可以包括片段和修饰的核苷酸。因此，术语“多核苷酸”、“核酸序列”、“核苷酸序列”和“核酸片段”可互换使用以表示单链或双链的RNA和/或DNA和/或RNA-DNA的聚合物，任选地包含合成的、非天然存在的或改变的核苷酸碱基。核苷酸(通常以其5′-单磷酸酯形式发现)以其单字母名称表示如下：“A”表示腺苷或脱氧腺苷(分别用于RNA或DNA)，“C”表示胞苷或脱氧胞苷，“G”表示鸟苷或脱氧鸟苷，“U”表示尿苷，“T”表示脱氧胸苷，“R”表示嘌呤(A或G)，“Y”表示嘧啶(C或T)，“K”表示G或T，“H”表示A或C或T，“I”表示肌苷，并且“N”表示任何核苷酸。

术语“基因组”当应用于原核或真核细胞或生物体细胞时不仅涵盖在细胞核内发现的染色体DNA，还涵盖在细胞的亚细胞组分(例如线粒体、或质体)内发现的细胞器DNA。

“可读框”缩写为ORF。

术语“选择性地杂交”或“选择性杂交”包括参考在严格的杂交条件下将核酸序列杂交到特定的核酸靶序列上，相比其杂交到非靶核酸序列和基本上排除非靶核酸，该杂交达到可检测地更大程度(例如，至少为背景值的2倍)。选择性杂交序列典型地彼此具有约至少80％序列同一性、或90％序列同一性、高达并且包括100％序列同一性(即，完全互补)。

术语“严格条件”或“严格杂交条件”包括提及在体外杂交测定中多核苷酸/探针将与其靶序列选择性杂交的条件。严格条件是序列依赖性的，并且在不同情况下将有所不同。通过控制杂交条件和/或洗涤条件的严格性，可以鉴定与多核苷酸/探针100％互补的靶序列(同源探测)。可替代地，可以调节严格条件以允许序列中的某些错配，以便检测到更低程度的相似性(异源探测)。通常，多核苷酸/探针的长度为少于约1000个核苷酸、少于500个核苷酸、少于100个核苷酸、少于90个核苷酸、少于80个核苷酸、少于70个核苷酸、少于60个核苷酸、少于50个核苷酸、少于40个核苷酸、少于30个核苷酸、少于20个核苷酸、10个核苷酸或甚至少于10个核苷酸。典型地，严格条件将是以下条件：在pH 7.0至8.3下盐浓度为小于约1.5M Na离子、典型地约0.01至1.0M Na离子浓度(或其他一种或多种盐)，并且对于短多核苷酸/探针(例如，10至50个核苷酸)为至少30℃，并且对于长多核苷酸/探针(例如，大于50个核苷酸)为至少60℃。添加去稳定剂如甲酰胺也可以实现严格条件。示例性低严格条件包括在37℃下与30％至35％甲酰胺、1M NaCl、1％SDS(十二烷基硫酸钠)的缓冲溶液杂交，并且在50℃至55℃下在1X至2X SSC(20X SSC＝3.0M NaCI/0.3M柠檬酸三钠)中洗涤。示例性中严格条件包括在37℃下在40％至45％甲酰胺、1M NaCl、1％SDS中杂交，并且在55℃至60℃下在0.5X至1X SSC中洗涤。示例性高严格条件包括在37℃下在50％甲酰胺、1M NaCl、1％SDS中杂交，并且在60℃至65℃下在0.1X SSC中洗涤。

“同源”意指DNA序列是相似的。例如，在供体DNA上发现的“与基因组区域同源的区域”是与细胞或生物体基因组中给定的“基因组序列”具有类似序列的DNA的区域。同源的区域可以具有足以促进在切割的靶位点处的同源重组的任何长度。例如，同源的区域的长度可以包括至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-2800、5-2900、5-3000、5-3100或更多个碱基，这样使得同源的区域具有充足同源性，从而经历与相应的基因组区域的同源重组。“足够的相似性”指示两个多核苷酸序列具有足够的结构等同性以充当同源重组反应的底物。结构等同性包括每个多核苷酸片段的总长度以及多核苷酸的序列相似性。序列相似性可以通过在序列的整个长度上的百分比序列同一性和/或通过包含局部相似性(如具有100％序列同一性的连续核苷酸)的保守区域以及在序列长度的一部分上的百分比序列同一性来描述。

如本文所用，“基因组区域”是存在于靶位点任一侧上的细胞的基因组中的染色体的区段，或者可替代地，还包含靶位点的一部分。基因组区域可以包含至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-2800、5-2900、5-3000、5-3100或更多个碱基，使得基因组区域具有足够的相似性以与相应的同源的区域进行同源重组。

如本文所用，“同源重组(HR)”包括在同源的位点处的两个DNA分子之间的DNA片段的交换。同源重组的频率受多个因素影响。不同的生物体相对于同源重组的量和同源与非同源重组的相对比例而变化。通常，同源区域的长度会影响同源重组事件的频率：同源区域越长，频率越高。为观察同源重组而需要的同源区域的长度也是随物种而异的。在许多情况下，已经利用了至少5kb的同源性，但已经观察到具有仅25-50bp的同源性的同源重组。参见，例如，Singer等人，(1982)Cell[细胞]31：25-33；Shen和Huang，(1986)Genetics[遗传学]112：441-57；Watt等人，(1985)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]82：4768-72，Sugawara和Haber，(1992)Mol Cell Biol[分子细胞生物学]12：563-75，Rubnitz和Subramani，(1984)Mol Cell Biol[分子细胞生物学]4：2253-8；Ayares等人，(1986)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]83：5199-203；Liskay等人，(1987)Genetics[遗传学]115：161-7。

在核酸的或多肽的序列的上下文中，“序列同一性”或“同一性”是指在两个序列中的核酸碱基或氨基酸残基当在指定的比较窗口上比对最大对应度时是相同的。

术语“序列同一性的百分比”是指通过在比较窗口上比较两个最佳比对的序列所确定的值，其中与参考序列(其不包含添加或缺失)比较两个序列的最佳比对时，该多核苷酸或多肽序列在比较窗口中的部分可以包含添加或缺失(即空位)。通过以下方式计算该百分比：确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目，将匹配位置的数目除以比较窗口中的位置的总数目，然后将该结果乘以100以产生序列同一性的百分比。百分比序列同一性的有用实例包括但不限于50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％、100％或从50％至100％的任何增量或分数百分比。可以使用本文描述的任何程序确定这些同一性。

序列比对和百分比同一性或相似性计算可以使用设计用于检测同源序列的多种比较方法来确定，这些方法包括但不限于LASERGENE生物信息计算包(DNASTAR公司(DNASTAR Inc.)，麦迪逊(Madison)，威斯康星州)的MegAlign^TM程序。在此申请的上下文中，应当理解的是，在使用序列分析软件来分析的情况下，分析的结果将基于参考的程序的“默认值”，除非另有说明。如本文所用，“默认值”将意指当第一次初始化时，最初加载该软件的任何一组值或参数。

“Clustal V比对方法”对应于标记为Clustal V的比对方法(由Higgins和Sharp，(1989)CABIOS5：151-153；Higgins等人，(1992)Comput Appl Biosci[生物学中的计算机应用]8：189-191描述)，并见于LASERGENE生物信息学计算套件的MegAlign^TM程序(DNASTAR公司，威斯康辛州麦迪逊)。对于多重比对，默认值对应于空位罚分(GAP PENALTY)＝10和空位长度罚分(GAP LENGTH PENALTY)＝10。使用Clustal方法进行逐对比对和蛋白质序列的百分比同一性计算的默认参数为KTUPLE＝1、空位罚分＝3、窗口(WINDOW)＝5、以及存储的对角线(DIAGONALS SAVED)＝5。对于核酸，这些参数是KTUPLE＝2、空位罚分＝5、窗口＝4、并且存储的对角线＝4。使用C1ustal V程序比对序列后，可能通过查看同一程序中的“序列距离”表来获得“百分比同一性”。“Clustal W比对方法”对应于标记为Clustal W的比对方法(由Higgins和Sharp，(1989)CABIOS 5：151-153；Higgins等人，(1992)ComputAppl Biosci[生物学中的计算机应用]8：189-191描述)，并见于LASERGENE生物信息学计算套件的MegAlign^TM v6.1程序(DNASTAR公司，威斯康辛州麦迪逊)。用于多重比对的默认参数(空位罚分＝10、空位长度罚分＝0.2、延迟发散序列(Delay Divergen Seqs，％)＝30、DNA转换权重＝0.5、蛋白质权重矩阵＝Gonnet系列、DNA权重矩阵＝IUB)。使用Clustal W程序比对序列后，可能通过查看同一程序中的“序列距离”表来获得“百分比同一性”。除非另有说明，本文中提供的序列同一性/相似性值是指使用GAP版本10(GCG，Accelrys公司，圣迭戈，加利福尼亚州)使用以下参数获得的值：核苷酸序列的％同一性和％相似性采用50的空位产生罚分权重和3的空位长度延伸罚分权重以及nwsgapdna.cmp评分矩阵；氨基酸序列的％同一性和％相似性采用8的空位产生罚分权重和2的空位长度延伸罚分权重以及BLOSUM62评分矩阵(Henikoff和Henikoff，(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报]89：10915)。GAP使用Needleman和Wunsch(1970)JMol Biol[分子生物学杂志]48：443-53的算法来找到使匹配数目最大化并且使空位数目最小化的两个完整序列的比对。GAP考虑所有可能的比对和空位位置，并且使用匹配碱基的单位中的空位产生罚分和空位延伸罚分，产生具有最大数目的匹配碱基和最少的空位的比对。“BLAST”是美国国家生物技术信息中心(NationalCenter for Biotechnology Information，NCBI)提供的用于寻找生物序列之间的相似性的区域的搜索算法。该程序将核苷酸或者蛋白质序列与序列数据库比较，并计算匹配的统计显著性以鉴定出与查询序列具有足够的相似性的序列，这样使得相似性不会被预测为已经随机发生。BLAST报告鉴定的序列和它们与查询序列的局部比对。本领域技术人员很清楚地理解，许多水平的序列同一性在鉴定来自其他物种的多肽或修饰的天然的或合成的多肽中是有用的，其中这样的多肽具有相同或相似的功能或活性。百分比同一性的有用实例包括但不限于50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％、100％或从50％至100％的任何增量或分数百分比。实际上，在描述本公开中，从50％至100％的任何氨基酸同一性会是有用的，如51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％。

多核苷酸和多肽序列、其变体、以及这些序列的结构关系，可用术语“同源性”、“同源的”、“基本上相同的”、“基本上类似的”、以及“基本上相应”来描述，这些术语在本文中可互换使用。这些是指多肽或核酸序列，其中在一个或多个氨基酸或核苷酸碱基上的变化不影响分子的功能，如介导基因表达或产生某种表型的能力。这些术语还指相对于初始未修饰的核酸，基本上不改变所得核酸的功能特性的核酸序列的一个或多个修饰。这些修饰包括核酸片段中一个或多个核苷酸的缺失、取代和/或插入，原子或分子与多核苷酸中现有核苷酸的缔合(例如但不限于：一个甲基的共价添加，或与金属离子的离子相互作用)，至少一个核苷酸的化学改变或前述的任何组合。所涵盖的实质上类似的核酸序列可以通过这些核酸序列与本文所示例的序列杂交，或与本文所公开的并且与任何本文所公开的核酸序列在功能上等价的核苷酸序列的任何部分杂交(在中严格条件下，例如0.5X SSC，0.1％SDS，60℃)的能力来定义。可以调整严格条件以筛选适度类似的片段(如来自远缘生物体的同源序列)，至高度类似的片段(如复制来自近缘生物体的功能性酶的基因)。杂交后的洗涤决定了严格条件。

“厘摩”(cM)或“图距单位”是两个多核苷酸序列、连锁的基因、标记、靶位点、基因座或它们的任何配对之间的距离，其中1％的减数分裂的产物是重组的。因此，一厘摩与等于两个连锁的基因、标记、靶位点、基因座或它们的任何配对之间的1％平均重组频率的距离相当。

“分离的”或“纯化的”核酸分子、多核苷酸、多肽或蛋白质或其生物活性部分是基本上或本质上不含与如在其天然存在的环境中发现的多核苷酸或蛋白质正常相伴或相互作用的组分。因此，分离的或纯化的多核苷酸或多肽或蛋白质当通过重组技术产生时基本上不含其他细胞物质或培养基，或者当化学合成时基本上不含化学前体或其他化学品。最佳地，“分离的”多核苷酸不含在从其衍生出该多核苷酸的生物体的基因组DNA中天然地在该多核苷酸侧翼的序列(即，位于该多核苷酸的5′和3′末端的序列)(最佳地是蛋白质编码序列)。例如，在不同实施例中，该分离的多核苷酸可以包含小于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸序列，在该多核苷酸从其衍生出的细胞的基因组DNA中，该核苷酸序列天然地位于该多核苷酸的侧翼。分离的多核苷酸可从它们天然存在于其中的细胞纯化。技术人员已知的常规核酸纯化方法可用于获得分离的多核苷酸。该术语也涵盖重组多核苷酸和化学合成的多核苷酸。

术语“片段”是指一组连续的多核苷酸或多肽。在一个实施例中，片段是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或大于20个连续的多核苷酸。在一个实施例中，片段是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或大于20个连续的多肽。片段可能表现出或可能不会表现出在所述片段的长度上共享一定百分比同一性的序列的功能。

术语“在功能上等价的片段”和“功能等价片段”在本文中可互换使用。这些术语是指分离的核酸片段或多肽的显示出与其衍生自的较长序列相同的活性或功能的一部分或子序列。在一个实例中，无论片段是否编码活性蛋白，该片段都保留改变基因表达或产生某种表型的能力。例如，片段可用于设计基因以在修饰的植物中产生所希望的表型。可以将基因设计为用于在抑制中使用，无论该基因是否编码活性酶，通过以相对于启动子序列的有义或反义取向连接其核酸片段。

“变体”意指实质上相似的序列。对于多核苷酸，变体包含在天然多核苷酸中的一个或多个位点处的一个或多个核苷酸的缺失和/或添加，和/或在天然多核苷酸中的一个或多个位点处的一个或多个核苷酸的取代。如本文所用，“天然”或“野生型”多核苷酸或多肽分别包含天然存在的核苷酸序列或氨基酸序列。对于多核苷酸，保守变体包括如下那些序列，由于遗传密码的简并性而编码本文所公开的多肽的氨基酸序列。可以使用熟知的分子生物学技术来鉴定天然存在的等位基因变体如，例如使用下文概述的聚合酶链反应(PCR)和杂交技术鉴定。变体多核苷酸还包括通过合成衍生的多核苷酸，例如通过使用定点诱变产生并且可能编码多肽的那些。通常，如通过本文其他地方描述的或本领域已知的序列比对程序和参数确定的，本文公开的特定多核苷酸的变体将与特定多核苷酸(例如，与SEQ IDNO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85和99-374的ACR序列)具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性。

“变体”蛋白质意指通过在天然蛋白中的一个或多个位点处的一个或多个氨基酸的缺失或添加，和/或在天然蛋白质中的一个或多个位点处的一个或多个氨基酸的取代衍生自天然蛋白质的蛋白质。在一些实施例中，本文公开的变体蛋白质包括具有生物活性的蛋白质，即它们继续具有天然蛋白质的生物活性。此类变体在本文中可互换地称为“功能性变体”、“生物活性变体”或“活性变体”，并且可以由，例如，遗传多态性或人为操纵产生。

“基因”包括表达功能性分子(诸如但不限于，特定蛋白质)的核酸片段，包括在编码序列之前(5′非编码序列)和之后(3′非编码序列)的调节序列。“天然基因”是指在其天然内源性位置中发现的具有其自身调节序列的基因。

术语“内源性”是指天然存在于细胞或生物体中的序列或其他分子。在一个方面，内源多核苷酸通常存在于其所来源的细胞的基因组中；也就是说，不是异源性的。

“等位基因”是占据染色体上给定基因座的基因的若干种替代形式中的一种。当染色体上在给定基因座处存在的所有等位基因都相同时，该植物在该基因座处是纯合的。如果染色体上在给定基因座处存在的等位基因不同，则该植物在该基因座处是杂合的。

“编码序列”是指可被转录成RNA分子并任选地进一步翻译成多肽的多核苷酸序列。“调节序列”是指位于编码序列的上游(5′非编码序列)、内部或下游(3′非编码序列)的核苷酸序列，并且其影响相关的编码序列的转录、RNA加工或稳定性、或翻译。调节序列包括但不限于：启动子、翻译前导序列、5′非翻译序列、3′非翻译序列、内含子、聚腺苷酸化靶序列、RNA加工位点、效应子结合位点、和茎环结构。

“突变基因”是通过人为干预已经改变的基因。这样的“突变基因”具有通过至少一个核苷酸添加、缺失或取代而与相应的非突变基因的序列不同的序列。在本公开的某些实施例中，该突变的基因包含由如本文公开的指导多核苷酸/Cas核酸内切酶系统引起的改变。突变的植物是包含突变基因的植物。

如本文所用，术语“靶向突变”是通过使用本领域技术人员已知的任何方法(包括涉及如本文公开的指导的Cas核酸内切酶系统的方法)改变靶基因内的靶序列而产生的基因(称为靶基因)包括天然基因中的突变。

术语“敲除”、“基因敲除”和“遗传敲除”在本文中可互换使用。敲除表示已经通过用Cas蛋白进行靶向使得细胞的DNA序列部分或完全无效；例如，这样的DNA序列在敲除之前可能已编码氨基酸序列，或可能已具有调节功能(例如，启动子)。

术语“敲入”、“基因敲入”、“基因插入”和“遗传敲入”在本文中可互换使用。敲入代表通过用Cas蛋白(例如通过同源重组(HR)，其中还使用适合的供体DNA多核苷酸)靶向在细胞中的特异性DNA序列处进行的DNA序列的替换或插入。敲入的实例是异源氨基酸编码序列在基因的编码区中的特异性插入，或转录调节元件在遗传基因座中的特异性插入。

“结构域”意指核苷酸(可以为RNA、DNA和/或RNA-DNA组合序列)或氨基酸的连续延伸。

术语“保守结构域”或“基序”是指沿进化相关蛋白的比对序列在特定位置处保守的一组多核苷酸或氨基酸。虽然同源蛋白质之间在其他位置处的氨基酸可以发生变化，但在特定位置处高度保守的氨基酸指示对蛋白质的结构、稳定性或活性来说是必需的氨基酸。因为它们通过蛋白质同系物家族的比对序列中的高度保守性而被鉴定，所以它们可以用作标识符或“特征”，以确定具有新确定的序列的蛋白质是否属于先前鉴定的蛋白质家族。

“密码子修饰的基因”或“密码子偏好的基因”或“密码子优化的基因”是其密码子使用的频率被设计为模拟宿主细胞的偏好的密码子使用的频率的基因。

“优化的”多核苷酸是已经过优化以改善特定异源宿主细胞中的表达或功能的序列。

“植物优化的核苷酸序列”是为在植物中表达或功能(特别是为了在植物中增加的表达)而优化的核苷酸序列。植物优化的核苷酸序列包括密码子优化的基因。可以使用一个或多个植物偏好的密码子来改善表达，通过修饰编码蛋白质(诸如像本文公开的Cas核酸内切酶)的核苷酸序列，来合成植物偏好的核苷酸序列。参见，例如，Campbell和Gowri(1990)Plant Physiol.[植物生理学]92：1-11对宿主偏好的密码子使用的讨论。

启动子是参与RNA聚合酶和其他蛋白质的识别和结合以起始转录的DNA区域。启动子序列由近端元件和较远端上游元件组成，后一元件通常称为增强子。“增强子”是可以刺激启动子活性的DNA序列，并且可以是该启动子的固有元件或被插入以增强启动子的水平或组织特异性的异源元件。启动子可以全部来源于天然基因，或者由来源于在自然界存在的不同启动子的不同元件构成，和/或包含合成的DNA区段。本领域技术人员应当理解，不同的启动子可能引导基因在不同组织或细胞类型中、或在不同发育阶段、或者响应于不同环境条件的表达。进一步认识到，由于在大多数情况下调节序列的确切边界尚未完全限定，一些变异的DNA片段可能具有相同的启动子活性。

在多数情况下引起基因在大多数细胞型中表达的启动子通常称为“组成型启动子”。术语“诱导型启动子”是指对内源或外源刺激的存在，例如通过化学化合物(化学诱导剂)响应，或对环境、激素、化学品、和/或发育信号响应，选择性表达编码序列或功能RNA的启动子。诱导型或调节型启动子包括例如通过光、热、胁迫、水淹或干旱、盐胁迫、渗透胁迫、植物激素、伤口或化学品(如乙醇、脱落酸(ABA)、茉莉酮酸酯、水杨酸或安全剂)诱导或调节的启动子。

“翻译前导序列”是指位于基因的启动子序列和编码序列之间的多核苷酸序列。翻译前导序列存在于翻译起始序列的mRNA上游。翻译前导序列可以影响初级转录物对mRNA的加工、mRNA稳定性、或翻译效率。已经描述了翻译前导序列的实例(例如，Turner和Foster，(1995)Mol Biotechnol[分子生物技术]3：225-236)。

“3′非编码序列”、“转录终止子”、或“终止序列”是指位于编码序列的下游的DNA序列，并且包括聚腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调节信号的其他序列。聚腺苷酸化信号通常特征在于影响聚腺苷酸片添加到mRNA前体的3′端。由Ingelbrecht等人，(1989)Plant Cell[植物细胞]1：671-680示例了不同的3′非编码序列的用途。

“RNA转录物”是指由DNA序列的RNA聚合酶催化的转录产生的产物。当RNA转录物是DNA序列的完全互补拷贝时，该RNA转录物被称为初级转录物或前mRNA。当RNA转录物是源自初级转录物前mRNA的转录后加工的RNA序列时，RNA转录物被称为成熟RNA或mRNA。“信使RNA”或“mRNA”是指不含内含子并且可以被细胞翻译成蛋白质的RNA。“cDNA”是指与mRNA模板互补并且使用逆转录酶从mRNA模板合成的DNA。cDNA可以是单链的或者可以使用DNA聚合酶I的Klenow片段转化成双链形式。“正义”RNA是指包含mRNA并且可以在细胞内或体外翻译成蛋白质的RNA转录物。“反义RNA”是指与靶初级转录物或mRNA的全部或部分互补、并且阻断靶基因的表达的RNA转录物(参见，例如美国专利号5,107,065)。反义RNA可与特定基因转录物的任何部分，即5′非编码序列、3′非编码序列、内含子或编码序列互补。“功能性RNA”是指反义RNA、核糖酶RNA、或可以不进行翻译而仍对细胞过程具有作用的其他RNA。术语“互补序列”和“反向互补序列”在本文中关于mRNA转录物可互换使用，并且意在限定信使的反义RNA。

术语“基因组”指存在于生物体或病毒或细胞器的每个细胞中的遗传物质的全部互补序列(基因和非编码序列)；和/或从一个亲本遗传为(单倍体)单元的完整染色体组。

术语可操作地连接是指单个核酸片段上的核酸序列的关联，这样使得其中一个核酸序列的功能被另一个核酸序列调节。例如，当启动子能够调节编码序列的表达(即，该编码序列在启动子的转录控制下)时，启动子与该编码序列可操作地连接。编码序列可以在正义或反义取向上可操作地连接到调节序列。在另一个实例中，互补的RNA区域可以直接或间接与靶mRNA的5′、或靶mRNA的3′可操作地连接、或在靶mRNA内、或第一个互补区是5′且其互补序列是靶mRNA的3′。

“引入”旨在意指以这样一种方式将多核苷酸或多肽或多核苷酸-蛋白复合物(例如，工程化的CRISPR-Cas复合物)提供于生物体，如细胞或生物体中，以致于这一种或多种组分得以进入该生物体的细胞的内部或进入细胞自身。这些方法不取决于用于将序列引入生物体或细胞中的具体方法，只要多核苷酸或多肽进入生物体的至少一个细胞的内部即可。引入包括提到将核酸合并到真核细胞或原核细胞中，其中核酸可以被并入细胞的基因组中，并且包括提到多核苷酸或多肽被瞬时(直接)提供至细胞中。

通常，“宿主”是指已引入异源组分(多核苷酸、多肽、其他分子、细胞)的生物体或细胞。如本文所用，“宿主细胞”是指体内或体外的真核细胞、原核细胞(例如，细菌或古细菌细胞)，或来自作为单细胞实体培养的多细胞生物体的细胞(例如，细胞系)，其中已引入异源多核苷酸或多肽。在一些实施例中，所述细胞选自下组，所述组由以下组成：原始细胞、细菌细胞、真核细胞、真核单细胞生物体、体细胞、生殖细胞、干细胞、植物细胞、藻类细胞、动物细胞、无脊椎动物细胞、脊椎动物细胞、鱼类细胞、青蛙细胞、鸟类细胞、昆虫细胞、哺乳动物细胞、猪细胞、牛细胞、山羊细胞、绵羊细胞、啮齿动物细胞、大鼠细胞、小鼠细胞、非人类的灵长类动物细胞和人类细胞。在一些情况下，该细胞是体外细胞。在一些情况下，该细胞是体内细胞。

术语“重组”是指例如通过化学合成或者通过基因工程技术操纵分离的核酸区段来将两个原本分开的序列区段进行人工组合。

术语“质粒”、“载体”和“盒”是指线性或环状染色体外元件，其通常携带非细胞中心代谢的一部分的基因，并且通常呈双链DNA的形式。这样的元件可以是衍生自任何来源的、单链或双链DNA或RNA的、处于直链或环状形式的自主复制序列、基因组整合序列、噬菌体、或核苷酸序列，其中许多核苷酸序列已经被连接或重组成能够将目的多核苷酸引入细胞中的独特构造。“转化盒”是指包含基因并具有促进特定宿主细胞转化的基因之外的元件的特定载体。“表达盒”是指包含基因并具有允许在宿主中表达该基因的基因之外的元件的特定载体。

术语“重组DNA分子”、“重组DNA构建体”、“表达构建体”、“构建体”、和“重组构建体”在本文中可互换使用。重组DNA构建体包含核酸序列，例如在自然界中未全部一起发现的调节序列和编码序列的人工组合。例如，重组DNA构建体可以包含衍生自不同来源的调节序列和编码序列，或者包含衍生自相同来源但以不同于天然发生的方式排列的调节序列和编码序列。这样一个构建体可以单独使用或可以与载体结合使用。如果使用载体，则载体的选择取决于如本领域技术人员熟知的将用于将载体引入宿主细胞的方法。例如，可以使用质粒载体。技术人员充分了解必须存在于载体上以便成功转化、选择和繁殖宿主细胞的遗传元件。本领域技术人员还将认识到，不同的独立转化事件可能导致不同的表达水平和模式(Jones等人，(1985)EMBO J[欧洲分子生物学组织杂志]4：2411-2418；De Almeida等人，(1989)Mol Gen Genetics[分子遗传学和普通遗传学]218：78-86)，因此典型地筛选多个事件，以获得显示所希望的表达水平和模式的品系。此类筛选可以是完成的标准分子生物学测定、生物化学测定以及其他测定，这些测定包括DNA的印迹分析、mRNA表达的Northern分析、PCR、实时定量PCR(qPCR)、逆转录PCR(RT-PCR)、蛋白表达的免疫印迹分析、酶测定或活性测定、和/或表型分析。

术语“异源性”是指特定多核苷酸或多肽序列的原始环境、位置或组成与其当前环境、位置或组成之间的差异。非限制性实例包括分类学衍生的差异(例如，如果从玉蜀黍(Zea mays)获得的多核苷酸序列插入到水稻(Oryza sativa)植物的基因组或玉蜀黍的不同变种或栽培品种的基因组中，则该多核苷酸序列是异源的；或从细菌获得的多核苷酸被引入植物的细胞中，则该多核苷酸序列是异源的)或序列的差异(例如从玉蜀黍获得的多核苷酸序列被分离、修饰并重新引入玉蜀黍植物中)。如本文所用，关于序列的“异源性”可以指该序列源于不同物种、变种、外来物种，或者，如果源于相同物种的话，则是通过蓄意人为干预从其在组合物和/或基因组基因座中的天然形式进行实质性修饰得到的序列。例如，可操作地连接至异源多核苷酸的启动子来自与从其衍生该多核苷酸的物种不同的物种，或者，如果来自相同/类似的物种，那么一方或双方基本上由它们的原来形式和/或基因组基因座修饰得到，或者该启动子不是被可操作地连接的多核苷酸的天然启动子。可替代地，本文提供的一个或多个调节区域和/或多核苷酸可以是整体地合成的。

如本文所用，术语“表达”是指处于前体抑或成熟形式的功能性终产物(例如，mRNA、指导RNA或蛋白质)的产生。

“成熟”蛋白质是指翻译后加工的多肽(即，从其中已经去除存在于初级翻译产物中的任何前肽(pre-peptide)或原肽(propeptide)的一种多肽)。

“前体”蛋白质是指mRNA的翻译的初级产物(即，仍存在前肽或原肽)。前肽或原肽可以是但不限于细胞内定位信号。

CRISPR(成簇的规律间隔的短回文重复序列)基因座是指DNA切割系统的某些遗传基因座编码组分，例如，被细菌和古细菌细胞用来破坏外源DNA的那些(Horvath和Barrangou，2010，Science[科学]327：167-170；2007年3月1日公开的WO 2007025097)。CRISPR基因座可以由CRISPR阵列组成，包含由短的可变DNA序列(称为‘间隔区’)分开的短的正向重复序列(CRISPR重复序列)，其可以是侧翼不同Cas(CRISPR相关的)基因。

如本文所用，“效应子”或“效应蛋白”是具有包括识别、结合和/或切割或切口多核苷酸靶标的活性的蛋白质。CRISPR系统的“效应子复合物”包括参与crRNA及靶标识别和结合的Cas蛋白。一些组分Cas蛋白可以另外包含参与靶多核苷酸切割的结构域。

术语“Cas蛋白”是指由Cas(CRISPR-相关的)基因编码的多肽。Cas蛋白包括但不限于：本文公开的新型Cas9直系同源物、Cas9蛋白、Cpf1(Cas12)蛋白、C2c1蛋白、C2c2蛋白、C2c3蛋白、Cas3、Cas3-HD、Cas5、Cas7、Cas8、Cas10或这些的组合或复合物。当与适合的多核苷酸组分复合时，Cas蛋白可以是能够识别、结合特定DNA靶序列的全部或部分、并任选地使特定DNA靶序列的全部或部分产生切口或切割特定DNA靶序列的全部或部分的Cas核酸内切酶。本文描述的Cas核酸内切酶包含一个或多个核酸酶结构域。Cas蛋白被进一步定义为天然Cas蛋白的功能性片段或功能性变体，或与至少50个、50至100个、至少100个、100至150个、至少150个、150至200个、至少200个、200至250个、至少250个、250至300个、至少300个、300至350个、至少350个、350至400个、至少400个、400至450个、至少500个或大于500个连续氨基酸的天然Cas蛋白共享至少50％、50％至55％、至少55％、55％至60％、至少60％、60％至65％、至少65％、65％至70％、至少70％、70％至75％、至少75％、75％至80％、至少80％、80％85％和99％-374％、至少85％、85％至90％、至少90％、90％至95％、至少95％、95％至96％、至少96％、96％至97％、至少97％、97％至98％、至少98％、98％至99％、至少99％、99％至100％或100％的序列同一性并且保留至少部分活性的蛋白质。

Cas核酸内切酶的“功能性片段”、“功能上等效的片段”和“功能等效片段”在本文中可互换地使用，并且指本公开的Cas核酸内切酶的一部分或子序列，其中保留识别、结合靶位点并任选地使靶位点产生切口或切割(引入单链或双链断裂)靶位点的能力。该Cas核酸内切酶的部分或子序列可以包含具有其任何一个结构域的完整或部分(功能性)肽，诸如但不限于HD结构域的完整或功能性部分、解旋酶结构域的完整或功能性部分、核酸内切酶结构域的完整或功能性部分、与PAM相互作用的结构域的完整或功能性部分、楔入结构域的完整或功能性部分、RuvC结构域的完整或功能部分、锌指结构域的完整或功能性部分或Cas蛋白的完整或功能部分(如但不限于Cas9、Cpf1、Cas5、Cas5d、Cas7、Cas8b1、Cas1、Cas2、Cas4或Cas9直系同源物)。

术语Cas核酸内切酶的“功能性变体”、“功能上等同的变体”和“功能等同变体”或Cas核酸内切酶，包括本文所述的Cas9直系同源物，在本文中可互换使用，并且是指本文所公开的Cas核酸内切酶的变体，其中保留了识别、结合以及任选地解旋、切口或切割全部或部分的靶序列的能力。

在一些方面，功能性片段或功能性变体保留与其所衍生自的亲本分子大约相同的水平和类型(例如靶多核苷酸识别、结合和切割)的活性。在一些方面，功能性片段或功能想变体显示出与其所衍生自的亲本分子相同类型的活性(例如，增加的靶多核苷酸识别特异性)。在一些方面，功能性片段或功能性变体显示出与其所衍生自的亲本分子相同类型的活性降低(例如，较低的靶多核苷酸结合亲和力)。在一些方面，功能性片段或功能性变体显示出作为其所衍生自的亲本分子的部分活性(例如，多核苷酸识别和结合，但非切割)。在一些方面，功能性片段或功能性变体显示出与其所衍生自的亲本分子不同的活性类型(例如，在靶多核苷酸上产生单链切口相比于双链断裂)。根据从业者的需要，可以选择活性类型或水平的任何相似性或差异作为所希望的结果。

Cas核酸内切酶还可包括多功能Cas内切核酸酶。术语“多功能Cas核酸内切酶”和“多功能Cas核酸内切酶多肽”在本文中可互换使用，并且包括提及具有Cas核酸内切酶功能(包含至少一个可用作Cas核酸内切酶的蛋白质结构域)和至少另一种功能的单个多肽，该至少另一种功能诸如但不限于，形成级联的功能(至少包括可与其他蛋白质形成级联的第二蛋白质结构域)。在一个方面，该多功能Cas核酸内切酶包含相对于Cas核酸内切酶的那些典型结构域的至少一个另外的蛋白结构域(在内部上游(5′)或下游(3′)，或在内部5′和3′两处，或其任何组合)。

如本文所用，术语“指导多核苷酸”涉及可以与Cas核酸内切酶(包括本文所述的Cas核酸内切酶)形成复合物，并且使得该Cas核酸内切酶能够识别、任选地结合并任选地切割DNA靶位点的多核苷酸序列。指导多核苷酸序列可以是RNA序列、DNA序列或其组合(RNA-DNA组合序列)。

术语指导RNA、crRNA或tracrRNA的“功能片段”、“功能上等效的片段”和“功能等效片段”在本文中可互换地使用，并且分别指本公开的指导RNA、crRNA或tracrRNA的一部分或子序列，其中分别保留用作指导RNA、crRNA或tracrRNA的能力。

术语指导RNA、crRNA或tracrRNA(分别地)的“功能性变体”、“功能上等效的变体”和“功能等效变体”在本文中可互换地使用，并且分别指本公开的指导RNA、crRNA或tracrRNA的变体，其中分别保留用作指导RNA、crRNA或tracrRNA的能力。

术语“单指导RNA”和“sgRNA”在本文中可互换使用，并涉及两个RNA分子的合成融合，其中包含可变靶向结构域(与tracrRNA杂交的tracr配对序列连接)的crRNA(CRISPRRNA)与tracrRNA(反式激活CRISPR RNA)融合。单指导RNA可以包含可与II型Cas核酸内切酶形成复合物的II型CRISPR/Cas系统的crRNA或crRNA片段和tracrRNA或tracrRNA片段，其中所述指导RNA/Cas核酸内切酶复合物可以将Cas核酸内切酶引导至DNA靶位点，使得Cas核酸内切酶能够识别、任选地结合DNA靶位点、并任选地使DNA靶位点产生切口或切割(引入单链或双链断裂)DNA靶位点。

术语“可变靶向结构域”或“VT结构域”在本文中可互换使用，并且包括可以与双链DNA靶位点的一条链(核苷酸序列)杂交(互补)的核苷酸序列。第一个核苷酸序列结构域(VT结构域)与靶序列之间的互补百分比可以为至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、63％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％。可变靶向结构域可以是至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸长度。在一些实施例中，可变靶向结构域包含12至30个核苷酸的连续延伸。可变靶向域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列或其任何组合构成。

术语(指导多核苷酸的)“Cas核酸内切酶识别结构域”或“CER结构域”在本文中可互换地使用，并且包括与Cas核酸内切酶多肽相互作用的核苷酸序列。CER结构域包含(反式作用)tracr核苷酸伴侣序列，随后是tracr核苷酸序列。CER结构域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列(参见，例如，2015年2月26日公开的US 20150059010A1)或其任何组合构成。

如本文所用，术语“指导多核苷酸/Cas内切核酸酶复合物”、“指导多核苷酸/Cas内切核酸酶系统”、“指导多核苷酸/Cas复合物”、“指导多核苷酸/Cas系统”和“指导Cas系统”、“多核苷酸指导的内切核酸酶”、“PGEN”在本文中可互换使用，并且是指能够形成复合物的至少一种指导多核苷酸和至少一种Cas内切核酸酶，其中所述指导多核苷酸/Cas内切核酸酶复合物可以将Cas内切核酸酶引导至DNA靶位点，使Cas内切核酸酶能够对DNA靶位点进行识别、结合、并且任选地产生切口或进行切割(引入单链或双链断裂)。本文中的指导多核苷酸/Cas核酸内切酶复合物可包含一种或多种Cas蛋白和任何已知的CRISPR系统的一个或多个合适的多核苷酸组分(Horvath和Barrangou，2010，Science[科学]327：167-170；Makarova等人，2015，Nature Reviews Microbiology[自然微生物学综述]卷13：1-15；Zetsche等人，2015，Cell[细胞]163，1-13；Shmakov等人，2015，Molecular Cell[分子细胞]60，1-13)。

术语“指导RNA/Cas核酸内切酶复合物”、“指导RNA/Cas核酸内切酶系统”、“指导RNA/Cas复合物”、“指导RNA/Cas系统”、“gRNA/Cas复合物”、“gRNA/Cas系统”、“RNA指导的核酸内切酶”，“RGEN”在本文中可互换地使用并且指至少一种RNA组分和至少一种能够形成复合物的Cas核酸内切酶，其中所述指导RNA/Cas核酸内切酶复合物可以将Cas核酸内切酶引导至DNA靶位点，使Cas核酸内切酶能够识别、结合DNA靶位点并任选地使DNA靶位点产生切口或切割(引入单链或双链断裂)DNA靶位点。在一些方面，提供这些组分作为Cas核酸内切酶蛋白和指导RNA的核糖核蛋白复合物(“RNP”)。

术语“靶位点”、“靶序列”、“靶多核苷酸”、“靶位点序列”、“靶DNA”、“靶基因座”、“基因组靶位点”、“基因组靶序列”、“基因组靶基因座”和“前间区序列”在本文中可互换地使用，并且是指多核苷酸序列，诸如但不限于，在细胞的染色体、附加体、基因座或基因组中的任何其他DNA分子(包括染色体DNA、叶绿体DNA、线粒体DNA、质粒DNA)上的核苷酸序列，在这些序列处指导多核苷酸/Cas核酸内切酶复合物可以进行识别、结合并任选地产生切口或进行切割。靶位点可以是细胞的基因组中的内源性位点，或者可替代地，靶位点对于该细胞可以是异源的并且从而不是天然存在于细胞的基因组中，或者与在自然界发生的位置相比，可以在异质基因组位置中找到靶位点。如本文所用，术语“内源性靶序列”和“天然靶序列”在本文中可互换使用，是指对细胞基因组来说是内源的或天然的、并且位于细胞的基因组中该靶序列的内源或天然位置处的靶序列。“人工靶位点”或“人工靶序列”在本文中可互换使用，并且是指已经引入细胞的基因组中的靶序列。这样的人工靶序列可以在序列上与细胞的基因组中的内源性或天然靶序列相同，但是位于细胞的基因组中的不同位置(即，非内源性的或非天然的位置)处。

本文中的“前间区序列邻近基序”(PAM)指与由本文所述的指导多核苷酸/Cas核酸内切酶系统识别的(靶向的)靶序列(前间区序列)邻近的短核苷酸序列。在一些方面，如果靶DNA序列与PAM序列不相邻或不邻近，则Cas核酸内切酶可能无法成功识别该靶DNA序列。在一些方面，该PAM在靶序列(例如，Cas12a)之前。在一些方面，该PAM在靶序列(例如，酿脓链球菌Cas9)之后。本文中的PAM的序列和长度可以取决于所使用的Cas蛋白或Cas蛋白复合物而不同。该PAM序列可以是任何长度，但典型地是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸长度。

“改变的靶位点”、“改变的靶序列”、“修饰的靶位点”、“修饰的靶序列”在本文中可互换使用，并且是指如本文公开的靶序列，当与非改变的靶序列相比时，该靶序列包括至少一个改变。此类“改变”包括，例如：修饰包括核酸片段中一个或多个核苷酸的缺失、取代和/或插入，原子或分子与多核苷酸中现有核苷酸的缔合(例如但不限于：一个甲基的共价添加，或与金属离子的离子相互作用)，至少一个核苷酸的化学改变或前述的任何组合。

“修饰的核苷酸”或“编辑的核苷酸”是指当与其非修饰的核苷酸序列相比时，包含至少一个改变的目的核苷酸序列。此类“改变”包括，例如：修饰包括核酸片段中一个或多个核苷酸的缺失、取代和/或插入，原子或分子与多核苷酸中现有核苷酸的缔合(例如但不限于：一个甲基的共价添加，或与金属离子的离子相互作用)，至少一个核苷酸的化学改变或前述的任何组合。

用于“修饰靶位点”和“改变靶位点”的方法在本文中可互换使用，并且是指用于产生改变的靶位点的方法。

如本文所用，“供体DNA”是DNA构建体，其包括待插入到Cas内切核酸酶的靶位点的目的多核苷酸。

术语“多核苷酸修饰模板”包括，当与待编辑的核苷酸序列相比时，包含至少一个核苷酸修饰的多核苷酸。核苷酸修饰可以是至少一个核苷酸取代、添加或缺失。任选地，多核苷酸修饰模板可以进一步包含位于至少一个核苷酸修饰侧翼的同源核苷酸序列，其中侧翼同源核苷酸序列为待编辑的希望的核苷酸序列提供了充足同源性。

如本文所用，术语“真核细胞”或“真核细胞的”是指属于系统发育结构域真核生物域(Eukalya)的生物体或细胞或从中衍生的组织，如动物(例如，哺乳动物、昆虫、爬行动物和鸟类)、纤毛虫、植物(例如，单子叶植物、双子叶植物和藻类)、真菌、酵母、鞭毛虫、微孢子虫和原生生物。

真核细胞包括但不限于人类、非人类、动物、哺乳动物、细菌、真菌、昆虫、酵母和植物细胞，以及通过本文所述的方法产生的植物和种子。

本文的术语“植物优化的Cas核酸内切酶”是指由已经针对在植物细胞或植物中表达进行优化的核苷酸序列编码的Cas蛋白，包括多功能Cas蛋白。

“编码Cas核酸内切酶的植物优化的核苷酸序列”、“编码Cas核酸内切酶的植物优化的构建体”和“编码Cas核酸内切酶的植物优化的多核苷酸”在本文中可互换使用，并且是指编码Cas蛋白、或其变体或功能片段的核苷酸序列，已经针对在植物细胞或植物中表达对其进行优化。包含植物优化的Cas核酸内切酶的植物包括：包含编码Cas序列的核苷酸序列的植物，和/或包含Cas核酸内切酶蛋白的植物。在一个方面，植物优化的Cas核酸内切酶核苷酸序列是玉蜀黍优化、稻优化、小麦优化、大豆优化、棉花优化或卡诺拉油菜优化的Cas核酸内切酶。

术语“植物”一般包括整株植物、植物器官、植物组织、种子、植物细胞、种子和植物的子代。植物细胞包括但不限于得自下列物质的细胞：种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。“植物元件”意在指整个植物或植物组分，可以包括分化和/或未分化的组织，例如但不限于植物组织、部分和细胞类型。在一个实施例中，植物元件是以下之一：整株植物、幼苗、分生组织、基本组织、维管组织、皮膜组织、种子、叶、根、芽、茎、花、果实、匍匐茎、鳞茎、块茎、球茎、无性末梢枝、芽、幼芽、肿瘤组织，以及细胞和培养物的各种形式(例如，单细胞、原生质体、胚胎和愈伤组织)。术语“植物器官”是指植物组织或构成植物的形态上和功能上不同部分的一组组织。如本文所用，“植物元件”是植物的“部分”的同义词，是指植物的任何部分，并且可以包括不同的组织和/或器官，并且可以在全文中与术语“组织”互换使用。类似地，“植物繁殖元件”意在一般性地指能够通过该植物的有性或无性繁殖而创造其他植物的任何植物部分，例如但不限于：种子、幼苗、根、芽、切条、接穗、嫁接苗、匍匐茎、鳞茎、块茎、球茎、无性末梢枝或幼芽。植物元件可以存在于植物中或植物器官、组织培养物或细胞培养物中。

“子代”包括植物的任何后续世代。

如本文所用，术语“植物部分”是指植物细胞、植物原生质体、可再生植物的植物细胞组织培养物、植物愈伤组织、植物块和在植物或植物部分(如胚、花粉、胚珠、种子、叶、花、枝、果、核、穗、穗轴、壳、茎、根、根尖、花药等)中完好的植物细胞，连同这些部分自身。籽粒意指由商业种植者出于栽培或繁殖物种之外的目的所生产的成熟种子。这些再生植物的后代、变体和突变体也包括在本发明的范围内，条件是这些部分包含经引入的多核苷酸。

术语“单子叶植物的”或“单子叶植物”是指被子植物的亚类，也称为“单子叶植物纲”，其种子典型地仅包含一个胚叶或子叶。该术语包括对整个植物、植物元件、植物器官(例如，叶、茎、根等)、种子、植物细胞及其后代的指代。

术语“双子叶植物的”或“双子叶植物”是指被子植物的亚类，也称为“双子叶植物纲”，其种子典型地包含两个胚叶或子叶。该术语包括对整个植物、植物元件、植物器官(例如，叶、茎、根等)、种子、植物细胞及其后代的指代。

术语“同系”是一个比较术语，指遗传上相同但处理方法不同的生物体。在一个实例中，可以将两个遗传上相同的玉蜀黍植物胚胎分成两个不同的组，一个组接受处理(如引入CRISPR-Cas效应子核酸内切酶)，而一个组作为对照不接受这种处理。在一些方面，“同系”是指除了存在作为实验的一部分而引入的异源多核苷酸或多肽外，遗传上相同的两种细胞或生物体。因此，两组之间的任何表型差异都可能仅归因于该处理或异源分子的存在，而不是归因于该生物体的内源基因组成的任何固有特性。

“引入”旨在意指以这样一种方式将多核苷酸或多肽或多核苷酸-蛋白复合物提供于靶标，如细胞或生物体中，以致于这一种或多种组分得以进入该生物体的细胞的内部或进入细胞自身。

目的多核苷酸包括编码改善作物的合意性的蛋白或多肽的任何核苷酸序列。目的多核苷酸：包括但不限于，编码对农艺学、除草剂-抗性、杀昆虫抗性、疾病抗性、线虫抗性、除草剂抗性、微生物抗性、真菌抗性、病毒抗性、能育性或不育性、谷粒特征、商业产品、表型标记而言重要的或任何其他具有重要农艺学或商业意义的性状的多核苷酸。目的多核苷酸可以另外以有义或反义取向加以利用。此外，可以一起或“堆叠”利用多于一个目的多核苷酸以提供额外的益处。

“分离的”或“纯化的”核酸分子、多核苷酸、多肽或蛋白质或其生物活性部分是基本上或本质上不含与如在其天然存在的环境中发现的多核苷酸或蛋白质正常相伴或相互作用的组分。因此，分离的或纯化的多核苷酸或多肽或蛋白质当通过重组技术产生时基本上不含其他细胞物质或培养基，或者当化学合成时基本上不含化学前体或其他化学品。最佳地，“分离的”多核苷酸不含在从其衍生出该多核苷酸的生物体的基因组DNA中天然地在该多核苷酸侧翼的序列(即，位于该多核苷酸的5′和3′末端的序列)(最佳地是蛋白质编码序列)。例如，在不同实施例中，该分离的多核苷酸可以包含小于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸序列，在该多核苷酸从其衍生出的细胞的基因组DNA中，该核苷酸序列天然地位于该多核苷酸的侧翼。分离的多核苷酸可从它们天然存在于其中的宿主细胞纯化。技术人员已知的常规核酸纯化方法可用于获得分离的多核苷酸。该术语也涵盖重组多核苷酸和化学合成的多核苷酸。

基本上不含细胞物质的蛋白质包括具有小于约30％、20％、10％、5％、或1％(以干重计)的污染蛋白质的蛋白质制剂。当重组产生本文所公开的多肽或其生物活性部分时，最佳地，培养基表示少于约30％、20％、10％、5％或1％(以干重计)的化学前体或非目的蛋白质化学品。

本文的组合物和方法可以为植物提供改善的“农艺性状”或“具有农艺学重要性的性状”或“具有农艺学意义的性状”，这些性状可以包括但不限于以下：与不包含衍生自本文方法和组合物的修饰的同系植物相比的抗病性、耐旱性、耐热性、耐寒性、耐盐性、金属耐性、除草剂耐性、改善的水分利用效率、改善的氮利用率、改善的固氮作用、有害生物抗性、食草动物抗性、病原抗性、产量改善、健康增强、活力改善、生长改善、光合能力改善、营养增强、改变的蛋白质含量、改变的油含量、生物量增加、芽长度增加、根长度增加、根结构改善、代谢产物的调节、蛋白质组的调节、种子重量的增加、改变的种子碳水化合物组成、改变的种子油组成、改变的种子蛋白质组成、改变的种子营养成分。

“农艺性状潜力”意在指植物元件在其生命周期中的某个时刻表现出一种表型(优选地为一种改善的农艺性状)的能力，或将所述表型传递至在同一种植物中与其关联的另一种植物元件的能力。

如本文所用，术语“减少”、“较少”、“较慢”和“增加”、“较快”、“增强”、“更大”是指与未修饰的植物元件或产生的植物相比，经修饰的植物元件或产生的植物的特征降低或增加。例如，特征的降低可以是低于未处理的对照至少1％、至少2％、至少3％、至少4％、至少5％、5％至10％、至少10％、10％至20％、至少15％、至少20％、20％至30％、至少25％、至少30％、30％至40％、至少35％、至少40％、40％至50％、至少45％、至少50％、50％至60％、至少60％、60％至70％、70％至80％、至少75％、至少80％、80％至90％、至少90％、90％至100％、至少100％、100％和200％、至少200％、至少300％、至少400％或更多，增加可以是高于未处理的对照至少1％、至少2％、至少3％、至少4％、至少5％、5％至10％、至少10％、10％至20％、至少15％、至少20％、20％至30％、至少25％、至少30％、30％至40％、至少35％、至少40％、40％至50％、至少45％、至少50％、50％至60％、至少60％、60％至70％、70％至80％、至少75％、至少80％、80％至90％、至少90％、90％至100％、至少100％、100％和200％、至少200％、至少300％、至少400％或更多。

如本文所用，当提到序列位置时，术语“之前”是指一个序列在另一序列上游或5′处出现。

缩写的含义如下：“sec”意指秒、“min”意指分钟、“h”意指小时、“d”意指天、“uL”或“uL”或“ul”意指微升、“mL”意指毫升、“L”意指升、“uM”意指微摩尔、“mM”意指毫摩尔、“M”意指摩尔、“mmol”意指毫摩尔、“μmole”或“umole”微摩尔、“g”意指克、“μg”或“ug”意指微克、“ng”意指纳克、“U”意指单位、“bp”意指碱基对、以及“kb”意指千碱基。

CRISPR-Cas系统

通常，CRISPR系统的特征在于促进在靶序列的位点(在内源性CRISPR系统的上下文中也称为前间区序列)处CRISPR复合物(包含Cas蛋白(例如，Cas9蛋白)、tracr和crRNA(具有重复序列和间隔区，或指导序列)的形成的元件。在工程化的CRISPR-Cas9复合物中，天然间隔区序列已被替换为设计为与靶序列(例如，真核细胞中的靶序列)互补的序列。在CRISPR复合物形成的上下文中，“靶序列”是指指导序列被设计成与其具有互补性的序列。靶序列可以是任何多核苷酸，如DNA或RNA多核苷酸。在一些实施例中，靶序列位于细胞的细胞核或细胞质中。

CRISPR-Cas系统已根据组分的序列和结构分析进行了分类。已经描述了多种CRISPR/Cas系统，包括具有多亚基效应子复合物的1类系统(包括I型、III型和IV型)，以及具有单蛋白质效应子的2类系统(包括II型、V型和VI型)(Makarova等人，2015，NatureReviews Microbiology[自然微生物学综述]卷13：1-15；Zetsche等人，2015，Cell[细胞]163，1-13；Shmakov等人，2015，Molecular Cell[分子细胞学]60，1-13；Haft等人，2005，Computational Biology，PLoS Comput Biol[美国科学公共图书馆计算生物学]1(6)：e60；以及Koonin等人，2017，Curr Opinion Microbiology[微生物学新见]37：67-78)。

CRISPR-Cas系统至少包含一种CRISPR RNA(crRNA)分子和至少一种与CRISPR相关的(Cas)蛋白，以形成crRNA核糖核蛋白(crRNP)效应复合物。CRISPR-Cas基因座包含一系列相同的重复序列，这些重复序列散布有编码crRNA组分的DNA靶向间隔区以及编码Cas蛋白组分的cas基因的操纵子样单元。产生的核糖核蛋白复合物称为级联，它以序列特异性方式识别多核苷酸(Jore等人，Nature Structural&Molecular Biology[自然结构与分子生物学]18，529-536(2011))。该crRNA通过与互补DNA链形成碱基对，同时置换非互补链形成所谓的R环，从而充当效应子(蛋白质或复合物)与双链DNA序列进行序列特异性结合的指导RNA。(Jore等人，2011.Nature Structural&Molecular Biology[自然结构与分子生物学]18，529-536)。

Cas核酸内切酶由单个CRISPR RNA(crRNA)指导，通过直接RNA-DNA碱基配对来识别紧邻前间区序列邻近基序(PAM)的DNA靶位点(Jore，M.M.等人，2011，Nat.Struct.Mol.Biol.[自然结构分子生物学]18：529-536，Westra，E.R.等人，2012，Molecular Cell[分子细胞学]46：595-605，以及Sinkunas，T.等人，2013，EMBO J.[欧洲分子生物学学会杂志]32：385-394)。1类CRISPR-Cas系统包括I型、III型和IV型。I类系统的特征是存在效应核酸内切酶复合物而不是单个蛋白质。2类CRISPR-Cas系统包括II型、V型和VI型。2类系统的特征是存在单个Cas蛋白，而不是效应子模块核酸内切酶复合物。II型和V型Cas蛋白包含采用RNA酶H折叠的RuvC样核酸内切酶结构域。

2类II型CRISPR/Cas系统采用crRNA和tracrRNA(反式激活CRISPR RNA)将Cas核酸内切酶指导到其DNA靶标上。该crRNA包含与双链DNA靶标的一条链互补的间隔区区域和与tracrRNA(反式激活CRISPR RNA)碱基配对的区域，该tracrRNA形成引导Cas内切核酸酶切割DNA靶标的RNA双链体。对于酿脓链球菌Cas9核酸内切酶，该切割留下平末端。II型CRISR-Cas基因座可以编码tracrRNA，该tracrRNA与重复序列在对应的CRISPR阵列内部分互补，并且可以包含其他蛋白质。

Cas核酸内切酶可以用于靶向的基因组编辑(经由单个和多个双链断裂和缺口)和靶向的基因组调节(经由将表观遗传效应子结构域系链到Cas蛋白或gRNA)。Cas核酸内切酶还可以被工程化作为RNA指导的重组酶起作用，并且经由RNA系链可以充当用于组装多蛋白和核酸复合物的支架(Mali等人，2013 Nature Methods[自然方法]第10卷：957-963)。

CRISPR-Cas系统组合物

提供了利用CRISPR相关(Cas)核酸内切酶进行基因组编辑的方法和组合物。I类Cas核酸内切酶包含多亚基效应子复合物(I型、III型和IV型)，而2类系统包含单蛋白效应子(II型、V型和VI型)(Makarova等人，2015，NatureReviews Microbiology[自然微生物学综述]卷13：1-15；Zetsche等人，2015，Cell[细胞]163，1-13；Shmakov等人，2015，MolecularCell[分子细胞学]60，1-13；Haft等人，2005，Computational Biology，PLoS Comput Biol[美国科学公共图书馆计算生物学]1(6)：e60；以及Koonin等人2017，Curr OpinionMicrobiology[微生物学新见]37：67-78)。在2类II型系统中，该Cas核酸内切酶与指导RNA(gRNA)复合起作用，该指导RNA引导Cas核酸内切酶切割DNA靶标，以使靶标能够被Cas核酸内切酶识别、结合和切割。该gRNA包括与Cas核酸内切酶相互作用的Cas核酸内切酶识别(CER)结构域，以及与靶DNA中的核苷酸序列杂交的可变靶向(VT)结构域。在一些方面，该gRNA包含CRISPR RNA(crRNA)和反式激活CRISPR RNA(tracrRNA)，以将Cas核酸内切酶指导到其DNA靶标上。该crRNA包含与双链DNA靶标的一条链互补的间隔区和与tracrRNA碱基配对形成RNA双链体的区域。在一些方面，该gRNA是包含crRNA和tracrRNA的合成融合体的“单指导RNA”(sgRNA)。在许多系统中，该Cas核酸内切酶指导的多核苷酸复合物识别与靶序列(前间区序列)相邻的短核苷酸序列，称为“前间区序列邻近基序”(PAM)。

Cas核酸内切酶的实例包括但不限于Cas9和Cpfl。Cas9(以前称为Cas5、Csnl或Csx12)是2类II型Cas核酸内切酶(Makarova等人，2015，Nature Reviews Microbiology[自然微生物学综述]卷13：1-15)。Cas9-gRNA复合物可识别靶位点的3′PAM序列(酿脓链球菌Cas9为NGG)，从而使指导RNA的间隔区能够侵入双链DNA靶标，并且如果间隔区与前间区序列之间存在足够的同源性，则产生双链断裂切割。Cas9核酸内切酶包含一起产生双链断裂的RuvC结构域和HNH结构域，并且二者可分别产生单链断裂。对于酿脓链球菌Cas9核酸内切酶，该双链断裂留下平末端。Cpfl是2类V型Cas核酸内切酶，并且包含核酸酶RuvC结构域，但缺少HNH结构域(Yamane等人，2016，Cell[细胞]165：949-962)。Cpf1核酸内切酶产生“粘性”突出端。

大量的Cas9直系同源物及其相关的tracrRNA和crRNA组分是本领域已知的(参见，例如，″Supplementary Table S2.List of bacterial strains with identifiedCas9orthologs″[“补充表S2.具有已鉴定的Cas9直系同源物的细菌菌株列表”]，Fonfara，Ines等人，″Phylogeny of Cas9 Determines Functional Exchangeability of Dual-RNAand Cas9 among Orthologous Type II CRISPR/Cas Systems”[Cas9的系统发育性决定直系同源II型CRISPR/Cas系统之间双RNA和Cas9的功能可交换性]，Nucleic Acids Research[核酸研究]42.4(2014)：2577-2590，包括所有补充数据；Chylinski K.等人，″Classification and evolution of type II CRISPR-Cas systems″[“II型CRISPR-Cas系统的分类和进化”]，Nucleic Acids Research，[核酸研究]2014；42(10)：6091-6105，包括所有补充数据；Kevin M Esvelt，K.M.等人，(2013)″Orthogonal Cas9 proteinsfor RNA-guided gene regulation and editing″[“用于RNA指导的基因调节和编辑的正交Cas9蛋白”]，Nature Methods[自然方法]10，1116-1121，鉴定的一系列直系同源Cas9蛋白包括来自脑膜炎奈瑟氏菌(Neisseria meningitidis)的Cas9蛋白)。可与本文公开的组合物和方法一起使用的II型CRISPR系统的代表性列表包括以下中描述的那些：Makarova等人，2015，Nature Reviews Microbiology[自然微生物学综述]|AOP，2015年9月28日在线发表；doi：10.1038/nrmicro3569；以及Burstein，D.等人，New CRISPR-Cas systems fromuncultivated microbes[来自非培养微生物的新型CRISPR-Cas系统]Nature[自然]http：//dx.doi.org/10.1038/nature21059(2016)以及WO 2017 062 855。在一些实施例中，从II-A型CRISPR复合物(如衍生自嗜热链球菌或酿脓链球菌的II-A型CRISPR复合物)中鉴定出了Cas核酸内切酶。

在一些方面，提供了“多核苷酸修饰模板”，与要编辑的核苷酸序列相比，该模板包含至少一个核苷酸修饰。核苷酸修饰可以是至少一个核苷酸取代、添加、缺失或化学改造。任选地，多核苷酸修饰模板可以进一步包含位于至少一个核苷酸修饰侧翼的同源核苷酸序列，其中侧翼同源核苷酸序列为待编辑的希望的核苷酸序列提供了充足同源性。

在一些方面，将目的多核苷酸插入靶位点并作为“供体DNA”分子的一部分提供。如本文所用，“供体DNA”是DNA构建体，其包括待插入到Cas内切核酸酶的靶位点的目的多核苷酸。供体DNA构建体进一步包含位于目的多核苷酸侧翼的同源的第一区域和第二区域。供体DNA的同源的第一区域和第二区域分别与存在于细胞或生物体基因组的靶位点中或位于该靶位点侧翼的第一和第二基因组区域共享同源性。该供体DNA可以与指导多核苷酸进行系链。系链的供体DNA可以允许共定位靶标和供体DNA，可用于基因组编辑、基因插入和靶向的基因组调节，并且还可以用于靶向有丝分裂后期细胞，在这些细胞中内源性HR机制的功能预计会大大降低(Mali等人，2013Nature Methods[自然方法]第10卷：957-963)。靶标和供体多核苷酸共享的同源性或序列同一性的量可以变化并且包括总长度和/或区域。

为了促进真核细胞的最佳表达和核定位，可以如2016年11月24日公开的WO2016186953中所述对包含Cas核酸内切酶的基因进行优化，然后通过本领域已知的方法将其作为DNA表达盒递送至细胞中。

在一些方面，该Cas核酸内切酶作为多肽提供。在一些方面，该Cas核酸内切酶作为编码多肽的多核苷酸提供。在一些方面，该指导RNA作为编码一种或多种RNA分子的DNA分子提供。在一些方面，该指导RNA作为RNA或经化学修饰的RNA提供。在一些方面，该Cas核酸内切酶蛋白和指导RNA作为核糖核蛋白复合物(RNP)提供。

对脱靶序列具有降低的活性的Cas核酸内切酶变体也可以与本文提供的ACR组合物和方法一起使用。此类Cas核酸内切酶变体包括例如在WO2016 205 613中公开的那些。此类组合可以提供甚至更大的脱靶活性降低。

CRISPR-Cas介导的基因组编辑

如本文所用，CRISPR-Cas介导的基因组编辑组合物(或工程化的CRISPR-Cas复合物)是指在宿主细胞(如真核细胞)中进行CRISPR-Cas介导的基因组编辑所需的CRISPR系统的元件。工程化的CRISPR-Cas复合物组合物典型地包括一种或多种核酸，所述核酸包含crRNA、tracrRNA(或其嵌合体，也称为指导RNA或单指导RNA)和Cas酶(例如，Cas9)。工程化Cas复合物组合物的crRNA和tracrRNA也可以通过编码crRNA、tracrRNA和/或指导RNA的核酸间接提供给系统。CRISPR/Cas介导的基因组编辑组合物可任选地包括供体多核苷酸，所述供体多核苷酸可在靶位点(例如，由Cas9诱导的单链或双链断裂的位点)处或附近重组到靶细胞的基因组中。工程化的CRISPR-Cas复合物的实例包括在美国公开号2015/0045546和国际申请公开号WO2013/176772中公开的那些。

基因组靶位点上Cas9-gRNA系统的一些用途包括但不限于在靶位点上一个或多个核苷酸的插入、缺失、取代或修饰；修饰或替换目的核苷酸序列(如调节元件)；目的多核苷酸的插入；基因敲除；基因敲入；修饰剪接位点和/或引入替换的剪接位点；编码目的蛋白质的核苷酸序列的修饰；氨基酸和/或蛋白质融合；以及通过将反向重复序列表达为目的基因来进行基因沉默。

使用修饰模板编辑Cas9-gRNA双链断裂位点的基因组序列的过程通常包括：为宿主细胞提供Cas9-gRNA复合物，该复合物识别宿主细胞基因组中的靶序列并能够诱导基因组序列中的双链断裂，并且提供包含与要编辑的核苷酸序列相比至少一个核苷酸改变的至少一种多核苷酸修饰模板。该多核苷酸修饰模板还可以包含侧翼于该至少一个核苷酸改变的核苷酸序列，其中侧翼序列与侧翼于双链断裂的染色体区域基本同源。已经在例如以下中描述了使用双链断裂诱导剂(如Cas9-gRNA复合物)的基因组编辑：2015年3月19日公开的US20150082478，2015年2月26日公开的WO 2015026886，2016年1月14日公开的WO2016007347，以及于2016年2月18日公开的WO 2016025131。

为了促进真核细胞的最佳表达和核定位，可以如2016年11月24日公开的WO2016186953中所述对包含Cas核酸内切酶的基因进行优化，然后通过本领域已知的方法将其作为DNA表达盒递送至细胞中。在一些方面，该Cas核酸内切酶作为多肽提供。在一些方面，该Cas核酸内切酶作为编码多肽的多核苷酸提供。在一些方面，该指导RNA作为编码一种或多种RNA分子的DNA分子提供。在一些方面，该指导RNA作为RNA或经化学修饰的RNA提供。在一些方面，该Cas核酸内切酶蛋白和指导RNA作为核糖核蛋白复合物(RNP)提供。

抗CRISPR(ACR)蛋白

本文公开的组合物包括分离的多核苷酸和编码抗CRISPR(“ACR”)蛋白的多肽。在一些实施例中，所公开的ACR多肽能够降低或抑制Cas核酸内切酶(例如但不限于Cas9蛋白)识别、结合以及任选地修饰、切口或切割靶多核苷酸的能力。

在一个实施例中，提供了多核苷酸和编码降低和/或抑制针对靶DNA分子的Cas9活性的多肽的多核苷酸。在某些实施例中，提供了降低和/或抑制II-A型Cas9蛋白活性的多肽。

从噬菌体或细菌分离或鉴定

在一个实施例中，提供了分离的或重组多核苷酸，这些多核苷酸包含SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85和99-374中阐述的核苷酸序列，或其功能性片段或变体。还提供了重组多核苷酸，这些多核苷酸编码具有SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86和375-650中阐述的序列，或其功能性片段或变体的多肽。进一步提供了分离的或重组多肽，这些多肽包含SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86和375-650中阐述的氨基酸序列，或其功能性片段或变体。

本文公开的ACR多核苷酸和多肽包括天然存在的序列以及核酸变体。同样，这些多肽和蛋白质既包括天然存在的多肽也包括其变体和修饰形式。此类多核苷酸和多肽变体可以继续具有所希望的活性，在这种情况下，将在编码该变体的DNA中进行的突变不会将序列置于阅读框之外。

本文公开的蛋白质的功能性变体将与天然蛋白质(例如，SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86和375-650中提供的多肽)的氨基酸序列具有至少约40％、45％、50％、55％、60％、65％、70％、75％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性。本文公开的蛋白质的功能性变体也可能与天然蛋白质(例如，SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24和26中提供的多肽)的氨基酸序列具有至少约40％、45％、50％、55％、60％、65％、70％、75％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性并且具有卷曲螺旋基序。本文公开的蛋白质的功能性变体与该蛋白质可能相差仅仅1-15个氨基酸残基，仅仅1-10个，如6-10个，仅仅5个，仅仅4、3、2个，或甚至1个氨基酸残基。

在一些实施例中，这些ACR多肽包括含有卷曲螺旋基序的那些ACR多肽。在一些实施例中，这些ACR蛋白的卷曲螺旋基序包括那些含有疏水氨基酸(h)和带电荷的氨基酸(c)的氨基酸重复模式hxxhcxc的多肽序列，有时也称为七肽重复。在一些实施例中，这些卷曲螺旋基序包括多肽序列KQRREYAQEMDRLEKAFENLD和/或ENKLDKIIEKIDKL以及与SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24和26具有70％、75％、80％、85％、90％、90％、95％、96％、97％、98％和99％的序列同一性的多肽序列，并且保留了卷曲螺旋结构。

可以按不同方式改变本文公开的这些蛋白质，这些方式包括氨基酸取代、缺失、截短、和插入。这种操作的方法在本领域中是普遍已知的。例如，可以通过DNA中的突变来制备多肽的氨基酸序列变体和片段。用于诱变和多核苷酸改变的方法是本领域熟知的。参见，例如，Kunkel(1985)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]82：488-492；Kunkel等人，(1987)Methodain Enzymol.[酶学方法]154：367-382；美国专利号4,873,192；Walker和Gaastra编(1983)Techniques in Molecular Biology[分子生物学技术](麦克米伦出版公司，纽约)以及其中引用的参考文献。关于不影响目的蛋白的生物活性的适当的氨基酸取代的指导可以发现于Dayhoff等人，(1978)Atlas of Protein Sequence and Structure[蛋白序列和结构图谱](Natl.Biomed.Res.Found.[国家生物医学研究基金会]，Washington，D.C.[华盛顿特区])的模型中。保守取代，如将一个氨基酸与具有相似特性的另一个氨基酸交换，会是最佳的。

“活性”多肽或其片段保留了该活性多肽的天然或天然存在的对应物的生物学活性。生物学活性是指由活性多肽的天然或天然存在的对应物介导的功能。例如，结合或蛋白质-蛋白质相互作用构成生物学活性。

在一些实施例中，本文涵盖的蛋白质序列的某些缺失、插入、和取代预期不会产生蛋白质特征的根本性变化。然而，当难以事先预测取代、缺失或插入的确切影响时，本领域技术人员应当理解，该影响可通过筛选测定(如本文所描述的那些测定)来评价。

变体功能性多核苷酸和蛋白质还涵盖衍生自诱变和引起重组的程序如DNA改组的序列和蛋白质。使用这样的程序，可以操作一个或多个不同序列以创造出拥有所希望的性质的新的多肽。以此方式，由一群相关的序列多核苷酸产生重组多核苷酸文库，这些相关的序列多核苷酸包含具有实质序列同一性并且能够在体外或体内同源重组的序列区域。例如，使用这种方法，编码目的结构域的序列基序可以在本文公开的多核苷酸和其他已知多核苷酸之间进行改组，以获得编码具有改善的目的性质(如对于酶而言增加的K_m)的蛋白质的新基因。这种DNA改组的策略在本领域中是已知的。参见例如，Stemmer(1994)Proc.Natl.Acad.Sci.USA[美国科学院院报]91：10747-10751；Stemmer(1994)Nature[自然]370：389-391；Crameri等人(1997)Nature Biotech.[自然生物技术]15：436-438；Moore等人(1997)J.Mol.Biol.[分子生物学杂志]272：336-347；Zhang等人(1997)Proc.Natl.Acad.Sci.USA[美国科学院院报]94：4504-4509；Crameri等人(1998)，Nature[自然]，391：288-291；以及美国专利号5,605,793和5,837,458。

还提供了所公开的多核苷酸和由其编码的蛋白质的片段和变体。“片段”意在是多核苷酸的一部分或者氨基酸序列和因此由其编码的蛋白质的一部分。多核苷酸的片段可编码保留天然蛋白质生物学活性的蛋白片段，或者多核苷酸的片段可保留全尺寸多核苷酸生物学活性；这些片段在本文中称为“功能性片段”。术语“功能性片段”、“活性片段”、“功能上等效的片段”和“功能等效片段”在本文中可互换使用。

编码ACR多肽生物活性部分的多核苷酸功能性片段将编码至少15、25、30、50、100或125个连续氨基酸，或最多存在于全长ACR多肽中的氨基酸总数(例如，SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86和375-650中提供的多肽)。SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24和26的此类功能片段可任选地包括卷曲螺旋基序。

本公开的ACR蛋白的功能性片段包括包含ACR蛋白的50-130、60-120、70-110、80-100个氨基酸并且保留活性的片段。本公开的ACR蛋白的功能性片段还可包括包含ACR蛋白的50-130、60-120、70-110、80-100个氨基酸并且具有卷曲螺旋基序的片段。

多肽的生物学活性部分可以按如下制备：分离本文公开的多核苷酸之一的一部分，表达蛋白质的编码部分(例如，通过体外重组表达)，并评估该多肽的编码部分的活性。作为编码ACR蛋白的多核苷酸的功能性片段的多核苷酸包含至少50、75、100、150、200、250、300、350或400个核苷酸，或不超过本文公开的全长多核苷酸中存在的核苷酸数量。

重组构建体

本文提供的ACR组合物以及任何CRISPR-Cas组合物可以作为重组构建体的一部分提供。重组构建体可以是用于用所述组合物转化异源宿主细胞的表达盒的一部分。本文使用的标准重组DNA和分子克隆技术是在本领域熟知的，并且更全面地描述于Sambrook等人，Molecular Cloning：A Laboratory Manual[分子克隆：实验室手册]；Cold SpriingHarbor Laboratory：Cold Spring Harbor，NY[冷泉港实验室：冷泉港，纽约州](1989)中。

重组DNA构建体可以包含衍生自不同来源的调节序列和编码序列。这样一个构建体可以单独使用或可以与载体结合使用。如果使用载体，则载体的选择取决于如本领域技术人员熟知的将用于将载体引入宿主细胞的方法。例如，可以使用质粒载体。技术人员充分了解必须存在于载体上以便成功转化、选择和繁殖宿主细胞的遗传元件。本领域技术人员还将认识到，不同的独立转化事件可能导致不同的表达水平和模式(Jones等人，(1985)EMBO J[欧洲分子生物学组织杂志]4：2411-2418；De Almeida等人，(1989)Mol GenGenetics[分子遗传学和普通遗传学]218：78-86)，因此典型地筛选多个事件，以获得显示所希望的表达水平和模式的品系。此类筛选可以是完成的标准分子生物学测定、生物化学测定以及其他测定，这些测定包括DNA的印迹分析、mRNA表达的Northern分析、PCR、实时定量PCR(qPCR)、逆转录PCR(RT-PCR)、蛋白表达的免疫印迹分析、酶测定或活性测定、和/或表型分析。

在一个方面，该重组DNA构建体包含与本文公开的ACR多核苷酸可操作地连接的异源5′和3′调节序列。这些调节序列包括但不限于在宿主细胞(如真核细胞)中起作用的转录和翻译起始区(即启动子)、核定位信号以及转录和翻译终止区(即终止区)。

在一个方面，该重组DNA构建体包含编码本文所述的ACR蛋白的DNA，其中该ACR蛋白可操作地连接至或包含异源调节元件，如核定位序列(NLS)。

在一些实施例中，这些ACR载体可以与表达盒组合以表达工程化的CRISPR-Cas复合物的一种或多种组分。在一个实例中，提供了一种或多种构建体，所述构建体包含具有在真核细胞中起作用并可操作地连接至编码本文所公开的ACR蛋白的多核苷酸的启动子的表达盒，具有在真核细胞中起作用并可操作地连接至单指导序列的启动子的第二表达盒，以及在真核细胞中起作用并可操作地连接至Cas9蛋白的启动子的第三表达盒，其中该指导和该Cas9能够形成可以修饰靶DNA分子的复合物。这些盒可以在单个重组构建体上或在多个重组构建体上提供，这些构建体可以用于同时或顺序引入宿主细胞。

表达盒

可以在用于在宿主细胞中表达ACR多肽的表达盒中提供本文公开的ACR多核苷酸(也称为DNA构建体)。该盒可以包括可操作地连接至本文公开的多核苷酸的5′和3′调节序列。“可操作地连接”旨在表示两个或更多个元件之间的功能性连接。例如，目的多核苷酸和调节序列(例如，启动子)之间的有效的连接是允许目的多核苷酸表达的功能性连接。可操作地连接的元件可以是连续的或非连续的。当用于指两个蛋白质编码区域的连接时，可操作地连接意在是这些编码区域处于相同的阅读框中。

适当时，可以优化ACR多核苷酸以增加在转化的或靶向的宿主细胞中的表达。例如，可以合成或改变多核苷酸以使用哺乳动物偏好的或植物偏好的密码子来实现改善的表达。参见，例如，Campbell和Gowri(1990)Plant Physiol.[植物生理学]92：1-11对宿主偏好的密码子使用的讨论。本领域中可获得用于合成植物偏好的基因的方法。参见，例如，美国专利号5,380,831和5,436,391，以及Murray等人(1989)Nucleic Acids Res.[核酸研究]17：477-498。

本文公开的表达盒可以5′-3′转录的方向包含转录和翻译起始区域(即启动子)、ACR多核苷酸、和在宿主细胞(例如，真核细胞)中起作用的转录和翻译终止区域(即终止区域)。还提供可以具有多个限制性位点和/或重组位点的表达盒，用于将多核苷酸插入到本文其他地方所述的调节区的转录调节之下。这些调节区(即启动子、转录调节区和翻译终止区)和/或目的多核苷酸对于宿主细胞或彼此之间可以是天然的/类似的。可替代地，这些调节区和/或目的多核苷酸对于宿主细胞或彼此之间可以是异源的。如本文所用，关于序列的“异源性”是指该序列源于外来物种，或者，如果源于相同物种的话，则是通过蓄意人为干预从其在组合物和/或基因组基因座中的天然形式进行实质性修饰得到的多核苷酸或多肽序列。例如，可操作地连接至异源多核苷酸的启动子来自与从其衍生该多核苷酸的物种不同的物种，或者，如果来自相同/类似的物种，那么一方或双方基本上由它们的原来形式和/或基因组基因座修饰得到，或者该启动子不是被可操作地连接的多核苷酸的天然启动子。如本文所用，除非另有指定外，嵌合多核苷酸包含与转录起始区可操作地连接的编码序列，该转录起始区对于该编码序列是异源的。

在一些实施例中，编码ACR蛋白的核苷酸序列可操作地连接至控制元件，例如，转录控制元件，如启动子。转录控制元件可在真核细胞(例如，植物或哺乳动物细胞)或原核细胞(例如，细菌或古细菌细胞)中起作用。在一些实施例中，编码ACR蛋白的ACR核苷酸序列可操作地连接至多个控制元件，所述多个控制元件允许在原核和真核细胞中表达编码ACR蛋白的核苷酸序列。

表达元件

重组构建体或表达盒可以进一步包含用于在异源细胞(特别是植物细胞)中表达ACR和/或CRISPR组分的非编码调节元件。

在一个实施例中，提供了表达盒，该表达盒包含在真核细胞中起作用的启动子，所述启动子可操作地连接至编码本文所公开的编码ACR蛋白、其变体或片段的多核苷酸。

这些表达盒可以包含与ACR多核苷酸可操作地连接的启动子，以及相应的终止区。该终止区对于转录起始区可以是天然的，对于可操作连接的目的多核苷酸或对于启动子序列可以是天然的，对于宿主细胞可以是天然的，或者可以衍生自另一种来源(即外源或异源)。方便的终止区可获自根癌农杆菌(A.tumefaciens)的Ti质粒，如章鱼碱合酶和胭脂碱合酶终止区。参见Guerineau等人(1991)Mol.Gen.Genet.[现代遗传学]262：141-144；Proudfoot(1991)Cell[细胞]64：671-674；Sanfacon等人，(1991)Genes Dev.[基因与发育]5：141-149；Mogen等人(1990)Plant Cell[植物细胞]2：1261-1272；Munroe等人，(1990)Gene[基因]，91：151-158；Ballas等人(1989)Nucleic Acids Res.[核酸研究]17：7891-7903；以及Joshi等人(1987)Nucleic Acid Res.[核酸研究]15：9627-9639。

合适的真核启动子(在真核细胞中起作用的启动子)的非限制性实例包括来自巨细胞病毒(CMV)即刻早期、单纯疱疹病毒(HSV)胸苷激酶、SV40早期和晚期、来自逆转录病毒的长末端重复序列(LTR)以及小鼠金属硫蛋白-I的启动子。该表达载体还可包含用于翻译起始的核糖体结合位点和转录终止子。该表达载体还可包含一个或多个核定位序列(NLS序列)，以将ACR蛋白引导至真核细胞的核。该表达载体还可以包括用于扩增表达的合适序列。该表达载体还可以包括编码与ACR蛋白融合的蛋白质标签(例如6x His标签、血凝素标签、绿色荧光蛋白等)，从而产生嵌合多肽的核苷酸序列。

在采用植物细胞的多个实施例中，植物启动子可用于构建体中。已经显示某些启动子能够以比其他启动子更高的速率引导RNA合成。这些被称为“强启动子”。已经显示某些其他启动子仅在特定类型的细胞或组织中以较高水平引导RNA合成，并且通常被称为“组织特异性启动子”或“组织优选启动子”。

植物启动子包括能够在植物细胞中起始转录的启动子。关于植物启动子的综述，参见Potenza等人，2004In Vitro Cell Dev Biol[体外细胞与发育生物学]40：1-22；Porto等人，2014，Molecular Biotechnology[分子生物技术](2014)，56(1)，38-49。

组成型启动子包括，例如，核心CaMV 35S启动子(Odell等人，(1985)Nature[自然]313：810-2)；稻肌动蛋白(McElroy等人，(1990)Plant Cell[植物细胞]2：163-71)；泛素(Christensen等人，(1989)Plant Mol Biol[植物分子生物学]12：619-32；ALS启动子(美国专利号5,659,026)等。

组织偏好性启动子可以用于靶向特定植物组织内的增强的表达。组织偏好性启动子包括，例如，2013年7月11日公开的WO2013/103367，Kawamata等人，(1997)Plant CellPhysiol[植物细胞生理学]38：792-803；Hansen等人，(1997)Mol Gen Genet[分子和普通遗传学]254：337-43；Russell等人，(1997)Transgenic Res[转基因研究]6：157-68；Rinehart等人，(1996)Plant Physiol[植物生理学]112：1331-41；Van Camp等人，(1996)PlantPhysiol.[植物生理学]112：525-35；Canevascini等人，(1996)Plant Physiol.[植物生理学]112：513-524；Lam，(1994)Results Probl Cell Differ[细胞分化中的结果与问题]20：181-96；以及Guevara-Garcia等人，(1993)Plant J.[植物杂志]4：495-505。叶偏好性启动子包括，例如，Yamamoto等人，(1997)Plant J[植物杂志]12：255-65；Kwon等人，(1994)Plant Physiol[植物生理学]105：357-67；Yamamoto等人，(1994)Plant Cell Physiol[植物细胞生理学]35：773-8；Gotor等人，(1993)Plant J[植物杂志]3：509-18；Orozco等人，(1993)Plant Mol Biol[植物分子生物学]23：1129-38；Matsuoka等人，(1993)Proc.Natl.Acad.Sci.USA[美国科学院院报]90：9586-90；Simpson等人，(1958)EMBO J[欧洲分子生物学学会杂志]4：2723-9；Timko等人，(1988)Nature[自然]318：57-8。根偏好性启动子包括，例如，Hire等人，(1992)Plant MolBiol[植物分子生物学]20：207-18(大豆根特异性谷氨酰胺合酶基因)；Miao等人，(1991)Plant Cell[植物细胞]3：11-22(胞质谷氨酰胺合酶(GS))；Keller和Baumgartner，(1991)Plant Cell[植物细胞]3：1051-61(法国菜豆的GRP 1.8基因中的根特异性控制元件)；Sanger等人，(1990)Plant Mol Biol[植物分子生物学]14：433-43(根癌农杆菌(A.tumefaciens)的甘露氨酸合酶(MAS)的根特异性启动子)；Bogusz等人，(1990)Plant Cell[植物细胞]2：633-41(从榆科糙叶山黄麻(Parasponiaandersonii)和山黄麻(Trema tomentosa)分离的根特异性启动子)；Leach和Aoyagi，(1991)Plant Sci[植物科学]79：69-76(发根农杆菌(A.rhizogenes)rolC和rolD根诱导型基因)；Teeri等人，(1989)EMBO J[欧洲分子生物学学会杂志]8：343-50(农杆菌伤口诱导的TR1′和TR2′基因)；VfENOD-GRP3基因启动子(Kuster等人，(1995)Plant MolBiol[植物分子生物学]29：759-72)；以及rolB启动子(Capana等人，(1994)PlantMol Biol[植物分子生物学]25：681-91)；菜豆球蛋白基因(Murai等人，(1983)Science[科学]23：476-82；Sengopta-Gopalen等人，(1988)Proc.Natl.Acad.Sci.USA[美国科学院院报]82：3320-4)。还参见美国专利号5,837,876；5,750,386；5,633,363；5,459,252；5,401,836；5,110,732和5,023,179。

种子偏好性启动子包括在种子发育期间有活性的种子特异性启动子以及在种子发芽期间有活性的种子发芽性启动子两者。参见Thompson等人，(1989)BioEssays[生物学分析]10：108。种子偏好性启动子包括但不限于Cim1(细胞分裂素诱导的信息)；cZ19B1(玉蜀黍19kDa玉米醇溶蛋白)；和milps(肌醇-1-磷酸盐合酶)；(WO 00/11177；和美国专利6,225,529)。对于双子叶植物，种子偏好性启动子包括但不限于：菜豆β-菜豆素、油菜籽蛋白、β-伴大豆球蛋白、大豆凝集素、十字花科蛋白等。对于单子叶植物，种子偏好性启动子包括但不限于玉蜀黍15kDa玉蜀黍蛋白、22kDa玉蜀黍蛋白、27kDaγ玉蜀黍蛋白、蜡质、收缩素1、收缩素2、球蛋白1、油质蛋白和nucl。还参见WO 00/12733，其中公开了来自END1和END2基因的种子偏好性启动子。

术语“诱导型启动子”是指对内源或外源刺激的存在，例如通过化学化合物(化学诱导剂)响应，或对环境、激素、化学品、和/或发育信号响应，选择性表达编码序列或功能RNA的启动子。诱导型或调节型启动子包括例如通过光、热、胁迫、水淹或干旱、盐胁迫、渗透胁迫、植物激素、伤口或化学品(如乙醇、脱落酸(ABA)、茉莉酮酸酯、水杨酸或安全剂)诱导或调节的启动子。

可以使用化学诱导型(调节型)启动子以通过应用外源化学调节剂来调节原核和真核细胞或生物体中的基因表达。在应用化学品诱导基因表达的情况下启动子可以是化学品诱导型启动子，或者在应用化学品阻抑基因表达的情况下启动子可以是化学品阻抑型启动子。化学品诱导型启动子包括但不限于：由苯磺酰胺除草剂安全剂激活的玉蜀黍ln2-2启动子(De Veylder等人，(1997)Plant Cell Physiol[植物细胞生理学]38：568-77)、由用作出苗前除草剂的疏水性亲电子化合物激活的玉蜀黍GST启动子(GST-II-27，WO 93/01294)、以及由水杨酸激活的烟草PR-1a启动子(Ono等人，(2004)Biosci Biotechnol Biochem[生物科学生物技术生物化学]68：803-7)。其他化学品调节型启动子包括类固醇反应启动子(参见，例如，糖皮质激素诱导型启动子(Schena等人，(1991)Proc.Natl.Acad.Sci.USA[美国科学院院报]88：10421-5；McNellis等人，(1998)Plant J[植物杂志]14：247-257)；四环素诱导型启动子和四环素阻抑型启动子(Gatz等人，(1991)Mol Gen Genet[分子和普通遗传学]227：229-37；美国专利号5,814,618和5,789,156)。

在被病原体感染后诱导的病原体诱导型启动子包括但不限于调节PR蛋白、SAR蛋白、β-1，3-葡聚糖酶、几丁质酶等的表达的启动子。

胁迫诱导型启动子包括RD29A启动子(Kasuga等人(1999)NatureBiotechnol[自然生物技术].17：287-91)。本领域技术人员熟悉模拟胁迫条件(如干旱、渗透胁迫、盐胁迫、和温度胁迫)并评价植物的胁迫耐受性的规程，所述植物已经遭受了模拟的或天然存在的胁迫条件。

在植物细胞中有用的诱导型启动子的另一个实例为ZmCAS1启动子，在于2013年11月21日公开的美国专利申请US 2013-0312137 A1中进行了描述，将该申请通过引用并入本文。

不断发现在植物细胞中有用的不同类型的新启动子：许多实例可以在Okamuro和Goldberg，(1989)The Biochemistry of Plants[植物生物化学]，第115卷，Stumpf和Conn编辑(纽约，纽约州：学术出版社)1-82页的汇编中发现。

表达盒可以另外包含5′前导序列。这些前导序列可以起到增强翻译的作用。翻译前导序列在本领域是已知的，并且包括：微小核糖核酸病毒前导区，例如EMCV前导区(脑心肌炎5′非编码区)(埃尔罗伊-斯秦因(Elroy-Stein等人，(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报]86：6126-6130)；马铃薯Y病毒(potyvirus)前导区，例如，TEV前导区(烟草蚀刻病毒)(Gallie等人(1995)Gene[基因]165(2)：233-238)，MDMV前导区(玉蜀黍矮花叶病毒)(Johnson等人(1986)Virology[病毒学]154：9-20)，和人免疫球蛋白重-链结合蛋白(BiP)(Macejak等人((1991)Nature[自然]353：90-94)；来自苜蓿花叶病毒的外壳蛋白mRNA的非翻译前导区(AMV RNA 4)(Jobling等人(1987)Nature[自然]325：622-625)；烟草花叶病毒前导区(TMV)(Gallie等人(1989)MolecularBiology of RNA，[RNA的分子生物学]，Cech编(Liss[丽丝公司]，纽约)，第237-256页)；以及玉蜀黍褪绿斑驳病毒前导区(MCMV)(Lommel等人(1991)Virology[病毒学]81：382-385)。还参见Della-Cioppa等人(1987)Plant Physiol.[植物生理学]84：965-968。还可以利用已知增强翻译的其他方法，例如内含子等。

优化和修饰的序列

已知有另外的序列修饰能增强细胞宿主中的基因表达。这些包括消除以下序列：编码假聚腺苷酸化信号、外显子-内含子剪接位点信号、转座子样重复的序列、及可能不利于基因表达的其他经充分表征的序列。可将序列的G-C含量调整至通过参照宿主细胞中表达的已知基因而计算出的给定细胞宿主的平均水平。当可能时，修饰序列以避免出现可预见的发夹二级mRNA结构。

在制备表达盒时，可以操作各种DNA片段，以提供处于适当取向以及合适时，处于适当阅读框中的DNA序列。为此，可采用衔接子(adapter)或接头以连接DNA片段，或可以涉及其他操作以提供方便的限制位点、移除多余的DNA、移除限制位点等。出于这个目的，可以涉及体外诱变、引物修复、限制性酶切(restriction)、退火、再取代(例如转换和颠换)。

细胞

可使用任何可用方法将本文公开的多核苷酸、多肽或表达盒引入宿主细胞中。

用于将多核苷酸或多肽引入细胞或生物体的方法包括但不限于显微注射、电穿孔、稳定转化方法、瞬时转化方法、弹道粒子加速(粒子轰击)、晶须介导的转化、农杆菌介导的转化、直接基因转移、病毒介导的引入、转染、转导、细胞穿透肽、介孔二氧化硅纳米粒子(MSN)-介导的直接蛋白质递送、局部应用、有性杂交、有性育种、及其任何组合。稳定转化意在指经引入宿主细胞中的核苷酸构建体合并到该生物体的基因组中，并且能够被其子代遗传。瞬时转化意在指将多核苷酸引入该细胞中并且不合并到该生物体的基因组中，或者将多肽引入生物体中。瞬时转化指示所引入的组合物仅在生物体中暂时表达或存在。

可通过直接引入ACR蛋白本身或编码ACR蛋白的mRNA将ACR蛋白引入细胞中。也可以通过引入编码ACR蛋白的重组DNA分子将ACR蛋白间接引入细胞中。可以将ACR蛋白瞬时引入细胞中，也可以将其掺入宿主细胞的基因组中。可以用细胞渗透肽(CPP)促进ACR蛋白吸收入细胞中。可以使用能够在细胞中表达ACR蛋白的任何启动子，并且这些启动子包括可操作地连接到编码ACR蛋白的核苷酸序列的热休克/热诱导型启动子。

这些ACR多核苷酸或多肽或CRISPR-Cas组合物成分中的任一个的直接递送可以伴随着可以促进接收这些组分的细胞的富集和/或可视化的其他mRNA的直接递送(共递送)。例如，采用编码表型标记的mRNA(比如但不限于转录激活子，如CRC)进行的ACR组合物或CRISPR-Cas复合物组分的直接共递送(Bruce等人2000 The Plant Cell[植物细胞]12：65-79)可以通过将恢复非功能性基因产物的功能在不使用外源选择性标记的情况下实现细胞的选择和富集，如2016年10月17日提交的PCT/US 16/57272和2016年10月17日提交的PCT/US 16/57279中所述。

可替代地，可以通过使细胞或生物体与病毒或病毒核酸接触来将多核苷酸引入细胞中。通常，此类方法涉及将多核苷酸掺入病毒DNA或RNA分子内。在一些实例中，可以最初将目的多肽作为病毒多聚蛋白的一部分合成，然后将合成的多肽在体内或在体外通过蛋白水解加工从而产生所希望的重组蛋白。用于将多核苷酸引入植物，并且表达在其中编码的蛋白质(涉及病毒DNA或RNA分子)的方法是已知的，参见例如，美国专利号5,889,191、5,889,190、5,866,785、5,589,367、以及5,316,931。

可以使用多种瞬时转化方法，将多核苷酸或重组DNA构建体提供至或引入原核和真核细胞或生物体中。这种瞬时转化法包括但不限于将多核苷酸构建体直接引入植物中。

可以通过任何方法将核酸和蛋白质提供给细胞，所述方法包括使用分子来促进任何或所有组分(如细胞穿透肽和纳米载体)的吸收的方法。还参见US20110035836Nanocarrier-based plant transfection and transduction[基于纳米载体的植物转染和转导]和EP 2821486 A1 Method of introducing nucleic acid intoplant cells[将核酸引入植物细胞中的方法]。

可以使用将多核苷酸引入原核和真核细胞或生物体或动物或植物部分的其他方法，包括转化方法，以及用于将多核苷酸引入组织(例如来自植物幼苗或成熟种子的组织)中的方法。

动物

可以将本文公开的多核苷酸和多肽引入细胞中，比如原核和真核细胞，如动物细胞，特别是哺乳动物细胞。

许多哺乳动物细胞系已被用于表达基因产物，包括HEK293(人胚肾)和CHO(中国仓鼠卵巢)。可以通过标准方法(例如，使用磷酸钙或聚乙烯亚胺(PEI)，或电穿孔)转染这些细胞系。其他典型的哺乳动物细胞系包括但不限于：HeLa、U2OS、549、HT1080、CAD、P19、NIH3T3、L929、N2a、人胚肾293细胞、MCF-7、Y79、SO-Rb50、Hep G2、DUKX-X11、J558L和幼仓鼠肾(BHK)细胞。

术语“治疗组合物”、“药物组合物”、“治疗制剂”和“药物制剂”在本文可互换使用，并且涵盖适用于向受试者(典型的情况为人)应用或施用的本发明的组合物。通常，此类组合物是安全、无菌的，并且优选地不含能够在受试者中引起不希望的响应的污染物(即，包含该组合物的一种或多种复合物是药学上可接受的)。可以将组合物配制为通过多种不同的施用途径应用或施用于有需要的受试者，所述途径包括口服(即，通过口腔或消化道施用)或肠胃外(例如，颊、直肠、经皮、透粘膜、皮下、静脉内、腹膜内、真皮内、气管内、鞘内、肺等)。

如本文所用，术语“受试者”是指脊索动物亚门的任何成员，包括但不限于人类和其他灵长类，包括非人类灵长类动物，如猕猴、黑猩猩和其他猿类和猴类；家畜，如牛、绵羊、猪、山羊和马；家养哺乳动物，如狗和猫；实验动物，包括啮齿类动物，如小鼠、大鼠和豚鼠；鸟类，包括家养鸟类、野生鸟类和猎鸟，如鸡、火鸡和其他鹑鸡类鸟、鸭、鹅；等等。该术语不表示特定年龄。因此，成人、年轻和新生个体都应包括在内。

植物

可以将本文公开的多核苷酸和多肽引入细胞中，比如原核细胞和真核细胞。

许多植物细胞也可用于本文提供的组合物和方法。还提供了包含表达盒的植物，该表达盒包含可操作地连接至在植物中有活性的启动子的本文公开的多核苷酸。

如本文所用，术语植物包括植物细胞、植物原生质体、可再生植物的植物细胞组织培养物、植物愈伤组织、植物块和在植物或植物部分(如胚、花粉、胚珠、种子、叶、花、枝、果、核、穗、穗轴、壳、茎、根、根尖、花药、籽粒等)中的完整植物细胞。如本文所用，籽粒意指由商业种植者出于栽培或繁殖物种之外的目的所生产的成熟种子。再生植物的后代、变体和突变体也包括在本公开的范围内，条件是这些部分包括再生植物的基因组修饰，如由转化或基因组编辑产生的那些修饰。

可以使用任何植物或植物部分，包括单子叶植物和双子叶植物或植物部分。

可以使用的单子叶植物的实例包括但不限于，玉蜀黍(玉蜀黍(Zea mays))、稻(水稻(Oryza sativa))、黑麦(黑麦(Secale cereale))、高粱(双色高粱(Sorghum bicolor)、高粱(Sorghum vulgare))、粟(例如，珍珠粟、御谷(Pennisetum glaucum))、黍稷(粟米(Panicum miliaceum))、谷子(谷子(Setaria italica))、穇子(龙爪稷(Eleusinecoracana))、小麦(小麦属物种、小麦(Triticum aestivum)、一粒小麦(Triticummonococcum))、甘蔗(甘蔗属物种(Saccharum spp.))、燕麦(燕麦属(Avena))、大麦(大麦属(Hordeum))、柳枝稷(柳枝黍(Panicum virgatum))、菠萝(菠萝(Ananas comosus))、香蕉(香蕉属物种(Musa spp.))、棕榈、观赏植物、草坪草、以及其他草。

术语“双子叶的”或“双子叶植物”是指被子植物的亚类，也被称为“双子叶植物类”，并且包括提及整株植物、植物器官(例如叶、茎、根、等)、种子、植物细胞、及其子代。可以使用的双子叶植物的实例包括但不限于大豆(大豆(Glycine max))、芸苔属物种(卡诺拉油菜)(欧洲油菜(Brassica napus)和白菜型油菜(B.campestris)、芜菁(Brassica rapa)、芥菜(Brassica.juncea))、苜蓿(紫花苜蓿(Medicago sativa))、烟草(烟草(Nicotianatabacum))、拟南芥属植物(Arabidopsis)(拟南芥(A.thaliana))、向日葵(向日葵(Helianthus annuus))、棉花(木本棉(Gossypium arboreum)、海岛棉(Gossypiumbarbadense))、和花生(花生(Arachis hypogaea))、番茄(番茄(Solanum lycopersicum))、马铃薯(马铃薯(Solanum tuberosum))等。

可以使用的植物包括红花(safflower、Carthamus tinctorius)、甘薯(番薯(Ipomoea batatas))，木薯(cassava，Manihot esculenta)，咖啡(咖啡属(Coffea)物种)，椰子(coconut，Cocos nucifera)，柑橘树(柑橘属(Citrus)物种)，可可(cocoa，Theobromacacao)，茶树(tea，Camellia sinensis)，香蕉(芭蕉属(Musa)物种)，鳄梨(avocado，Perseaamericana)，无花果(fig或(Ficus casica))，番石榴(guava，Psidium guajava)，芒果(mango，Mangifera indica)，橄榄(olive，Olea europaea)，木瓜(番木瓜(Caricapapaya))，腰果(cashew，Anacardium occidentale)，澳洲坚果(macadamia，Macadamiaintegrifolia)，巴旦杏(almond，Prunus amygdalus)，甜菜(sugar beets，Betavulgaris)，蔬菜，观赏植物和针叶树。

蔬菜包括番茄(上ycopersicon esculentum)、莴苣(例如，莴苣(Lactucasativa))、青豆(菜豆(Phaseolus vulgaris))、利马豆(lima bean，Phaseolus limensis)、豌豆(香豌豆属(Lathyrus spp.))和黄瓜属的成员诸如黄瓜(cucumber，C.sativus)、香瓜(cantaloupe，C.cantalupensis)和甜瓜(musk melon，C.melo)。观赏植物包括杜鹃(杜鹃花属(Rhododendron)物种)、八仙花(Macrophylla hydrangea)、朱槿(Hibiscusrosasanensis)、玫瑰(蔷薇属(Rosa)物种)、郁金香(郁金香属(Tulipa)物种)、水仙(水仙属(Narcissus)物种)、矮牵牛(Petunia hybrida)、康乃馨(Dianthus caryophyllus)、一品红(Euphorbia pulcherrima)和菊花。

针叶树包括例如松树，如火炬松(loblolly pine，Pinus laeda)、湿地松(slashpine，Pinus elliotii)、西黄松(ponderosa pine，Pinus ponderosa)、黑松(lodgepolepine，Pinus contorta)和辐射松(Monterey pine，Pinus radiata)；花旗松(Pseudotsugamenziesii)；西部铁杉(Tsuga canadensis)；北美云杉(Sitka spruce，Picea glauca)；红杉(redwood，Sequoia sempervirens)；枞树(true firs)，如银杉(胶冷杉(Abiesamabilis))和胶枞(香脂冷杉(Abies balsamea))；以及雪松，如西方红雪松(Thujaplicata)和阿拉斯加黄雪松(Chamaecyparis nootkatensis)。

术语“植物”包括整株植物、植物器官、植物组织、种子、植物细胞、种子和植物的子代。植物细胞包括但不限于得自下列物质的细胞：种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。植物部分包括分化和未分化的组织，包括但不限于根、茎、芽、叶、花粉、种子、肿瘤组织和各种形式的细胞和培养物(例如单细胞、原生质体、胚和愈伤组织)。植物组织可以是在植物中或在植物器官、组织或细胞培养物中的。术语“植物器官”是指植物组织或构成植物的形态上和功能上不同部分的一组组织。术语“基因组”指存在于生物体或病毒或细胞器的每个细胞中的遗传物质的全部互补序列(基因和非编码序列)；和/或从一个亲本遗传为(单倍体)单元的完整染色体组。“子代”包括植物的任何后续世代。

转基因植物包括例如在其基因组中包含通过转化步骤引入的异源多核苷酸的植物。异源多核苷酸可以稳定地整合到基因组内，这样使得多核苷酸被传递给连续世代。异源多核苷酸可以单独地或作为重组DNA构建体的部分整合进基因组中。转基因植物还可以在其基因组内包含多于一个异源多核苷酸。各异源多核苷酸均可对所述转基因植物产生不同的性状。转基因可以包括其基因型已经通过异源核酸的存在改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物，这些异源核酸包括最初如此改变的那些转基因以及通过有性杂交或无性繁殖从初始转基因产生的那些。通过常规植物育种方法，通过本文所述的不导致外源多核苷酸的插入的基因组编辑程序，或通过天然存在的事件如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变的基因组(染色体或染色体外)的改变并不旨在被视为转基因。

在本公开的某些实施例中，可育植物是产生活雄配子和雌配子并且是自身可育的植物。

ACR蛋白活性

可以通过任何方法，包括本文公开的那些方法，来表达和/或纯化本文所述的ACR多肽、变体和片段，并确认它们的生物学活性。例如，可以通过在含有并表达嗜热链球菌或酿脓链球菌CRISPR系统的CRISPR-Cas9的细菌细胞中共表达表达ACR多肽、其变体或片段的ACR多核苷酸(其中CRISPR-Cas9靶向烈性噬菌体菌株的靶序列)，并测定表达ACR多肽、变体或片段的细菌与缺少该ACR多肽、变体或片段的细菌相比病毒滴度的降低，从而测定ACR多肽、其变体及其片段的生物学活性。

ACR蛋白的Cas抑制活性分析

在一个方面，本公开的ACR蛋白(包括由本公开的多核苷酸编码的多肽)及其功能性片段和变体的生物学活性是抑制Cas蛋白(例如，II型Cas9蛋白)的切割活性的能力。本文公开了确定ACR蛋白的抑制活性的方法。

因此，本公开提供了鉴定抗CRISPR蛋白的方法，其中该方法包括获得包含重组构建体的细菌宿主细胞，所述重组构建体能够表达II-A型CRISPR系统，所述II-A型CRISPR系统具有能够靶向烈性噬菌体的基因组靶序列的靶向序列(也称为间隔区序列)；然后引入包含启动子的构建体(该启动子在细菌宿主细胞中起作用并与编码待测定抗CRISPR活性的多肽的多核苷酸可操作地连接)，用烈性噬菌体激发细菌宿主，并鉴定一个或多个噬菌体滴度与用烈性噬菌体激发的缺少编码II-A型CRISPR系统的重组构建体的细菌细胞实质上相似的细菌菌落，所述II-A型CRISPR系统具有能够靶向烈性噬菌体中的基因组靶序列的靶向序列。

在一些实施例中，测定的抗CRISPR活性是多肽在被烈性噬菌体激发的具有IIA型CRISPR系统的细菌培养物中实质上恢复噬菌体滴度水平的能力。在一些实施例中，测定的抗CRISPR活性导致具有给定II型CRISPR系统的细菌培养物在存在ACR蛋白的情况下对给定噬菌体的敏感性与被同一噬菌体激发的缺乏II型CRISPR系统的相同细菌菌株的敏感性相似。

还可以如Rauch等人，2017，cell[细胞]168：150-158中描述的那样测量CRISPR系统活性的修饰和/或CRISPR系统的基因组修饰活性，诸如但不限于II-A型CRISPR-Cas9复合物。

ACR蛋白的使用方法

本文提供的组合物和方法可用于很多种宿主细胞，例如但不限于本文描述的那些实施例。如本文所用，“宿主细胞”是指体内或体外的真核细胞、原核细胞(例如细菌或古细菌细胞)，或来自作为单细胞实体培养的多细胞生物体(例如细胞系)的细胞，所述真核或原核细胞可以或已经用作核酸的受体，并且包括已被核酸转化的原始细胞的后代。“重组宿主细胞”(也称为“基因修饰的宿主细胞”)是已引入异源核酸(例如，表达载体)的宿主细胞。例如，主题细菌宿主细胞是通过将外源核酸(例如，质粒或重组表达载体)引入合适的细菌宿主细胞中进行基因修饰的细菌宿主细胞，而本发明的真核宿主细胞是通过将外源核酸引入合适的真核宿主细胞中而进行基因修饰的真核宿主细胞(例如，哺乳动物生殖细胞或植物细胞)。

在一些实施例中，所述细胞选自下组，所述组由以下组成：原始细胞、细菌细胞、真核细胞、真核单细胞生物体、体细胞、生殖细胞、干细胞、植物细胞、藻类细胞、动物细胞、无脊椎动物细胞、脊椎动物细胞、鱼类细胞、青蛙细胞、鸟类细胞、昆虫细胞、酵母细胞、哺乳动物细胞、猪细胞、牛细胞、山羊细胞、绵羊细胞、啮齿动物细胞、大鼠细胞、小鼠细胞、非人类的灵长类动物细胞和人类细胞。在一些情况下，该细胞是体外细胞。在一些情况下，该细胞是体内细胞。例如，当该细胞是人类细胞时，该人类细胞可以位于组织培养物中或体内。

本文提供的方法可以与任何CRISPR-Cas系统一起使用。在一个实施例中，本文提供的方法和组合物可以与属于II型CRISPR-Cas系统的CRISPR-Cas系统(例如衍生自细菌CRISPR系统的工程化CRISPR-Cas复合物)结合使用。此类系统包括工程化的II-A型CRISPR-Cas9复合物。

在一个实施例中，提供了用于使真核细胞对CRISPR-Cas9介导的DNA修饰免疫的方法，例如，以减少或防止Cas9蛋白复合物切割真核细胞中的DNA。此类方法包括将ACR多肽(或编码ACR多肽的多核苷酸)引入含有能够引导细胞中靶DNA的切割的CRISPR-Cas9复合物的细胞。此类方法可用于原核细胞中。可以将ACR多肽与工程化的CRISPR-Cas9复合物或CRISPR-Cas9复合物的组分同时引入，或顺序引入到CRISPR-Cas9复合物或其组分中。在顺序引入的情况下，可以在CRISPR-Cas9复合物之前或在CRISPR-Cas9复合物之后引入ACR多肽。在其他实施例中，可以通过表达盒引入该ACR多肽，该表达盒提供了ACR的可诱导表达或ACR多肽的时间表达。

在工程化的CRISPR-Cas复合物的活性降低的情况下，可以将该活性的降低与在不存在抗CRISPR蛋白的情况下的工程化CRISPR-Cas复合物的活性进行比较。活性的降低可以是与不存在ACR蛋白的情况下的工程化CRISPR-Cas复合物的活性相比任何可测量的降低量，包括约5％、10％、15％、20％、25％、30％、40％、50％、60％、65％、70％、75％、80％、85％、90％、95％或更高的活性降低。可以如本文所述在细菌宿主中使用病毒滴度测定法来测定所测量的活性，或者可以将其作为工程化的CRISPR-Cas复合物本身的切割活性进行测量。

在一些实施例中，这些方法包括用于降低宿主细胞中CRISPR-Cas复合物的活性的方法。在一些实施例中，此类方法包括将重组构建体引入宿主细胞中，所述重组构建体包含与编码ACR蛋白、其变体或片段的多核苷酸可操作地连接的启动子，其中该宿主细胞还包含能够修饰靶DNA分子的CRISPR-Cas复合物。

还提供了用于提供细胞中ACR多肽的可诱导表达的方法。此类方法包括在诱导型启动子的可操作连接下将包含编码ACR多肽的ACR多核苷酸的表达盒引入细胞中。用于需要ACR多肽的可诱导表达的方法的诱导型启动子的实例包括但不限于T7 RNA聚合酶启动子、T3 RNA聚合酶启动子、异丙基-β-D-硫代半乳糖苷(IPTG)调节启动子、乳糖诱导启动子、热休克启动子、四环素调节启动子(例如，Tet-ON、Tet-OFF等)、类固醇调节启动子、金属调节启动子、雌激素受体调节启动子等。因此，诱导型启动子可由分子调节，包括但不限于：强力霉素；RNA聚合酶，例如，T7 RNA聚合酶；雌激素受体；雌激素受体融合；等等。

还提供了通过真核细胞中II型CRISPR复合物控制靶DNA的切割(例如，单链或双链切割)的方法。此类方法涉及将本文公开的ACR多肽或表达或引入含有或表达能够切割靶DNA分子的II型CRISPR复合物的细胞中。在一些实施例中，这些方法涉及本文公开的ACR多肽的可诱导表达，以允许控制ACR多肽表达的时间。

还提供了用于减少真核细胞中II型CRISPR复合物的脱靶DNA切割的方法。此类方法涉及将本文公开的ACR多肽或表达或引入含有或表达能够切割靶DNA分子的II型CRISPR复合物的细胞中。

此类脱靶DNA切割与在不存在ACR多肽的情况下细胞中II型CRISPR复合物的切割相比可减少5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、60％、65％、70％、75％、80％、85％、90％或更高。

还提供了使细胞群免疫的方法，其中希望通过CRISPR-Cas9复合物进行基因组编辑，但不希望完全渗透。这些方法通常包括将本文公开的ACR多肽表达或引入包含能够切割靶DNA分子的CRISPR-Cas9复合物的细胞群中。此类方法还可进一步包括鉴定或选择具有靶DNA分子修饰的细胞。

还提供了保护细胞(例如真核细胞)不受工程化CRISPR-Cas9复合物活性造成的DNA损伤的方法。此类方法包括将用于表达如本文所提供的ACR多肽的重组构建体引入细胞中。

还提供了通过在一个或多个的细胞周期期间控制Cas核酸内切酶或ACR蛋白的表达或活性使用ACR来调节Cas核酸内切酶活性的方法。在一些方面，该细胞周期选自减数分裂期。在一些方面，该细胞周期选自有丝分裂期。

还提供了用于在基因组编辑期间增加同源重组的频率和/或降低基因组编辑期间非同源末端连接的频率的方法。

本文公开的ACR多核苷酸、多肽和方法可与多种CRISPR复合物结合使用，例如，用于抑制CRISPR复合物对靶DNA分子的活性。特别引起关注的CRISPR复合物包括来自II型CRISPR系统的那些CRISPR复合物，包括源自II-A型CRISPR系统的CRISPR复合物。在一些实施例中，这些II-A型CRISPR复合物是源自嗜热链球菌，酿脓链球菌和金黄色葡萄球菌(S.aureus.)的CRISPR复合物。在其他实施例中，这些II-A型CRISPR复合物是源自嗜热链球菌的CRISPR复合物。在其他实施例中，这些II-A型CRISPR复合物是源自嗜热链球菌，CRISPR1基因座的CRISPR复合物。

在嗜热链球菌中，尽管CRISPR1和CRISPR3属于2类II-A型系统，但它们在包括Cas9序列在内的序列方面有所不同。为了区分CRISPR1和CRISPR3，本文参考Chylinski等人2014年的出版物，其中CRISPR1-Cas系统由LMD-9116628213的Cas9序列代表，而CRISPR3-Cas系统由LMD-9 116627542的Cas9序列代表。

在一些实施例中，工程化的CRISPR-Cas核酸内切酶(例如工程化的II-A型CRISPR-Cas9)可以(或能够)识别、结合DNA靶序列并引入单链(缺口)或双链断裂。一旦在DNA中诱导单链断裂或双链断裂，则细胞的DNA修复机制被激活来修复断裂。易错DNA修复机制可以在双链断裂位点处产生突变。来将断裂的末端结合在一起的最常见的修复机制是非同源末端连接(NHEJ)途径(Bleuyard等人，(2006)DNA Repair[DNA修复]5：1-12)。染色体的结构完整性典型地通过修复来保存，但是缺失、插入或其他重排(如染色体易位)是可能的(Siebert和Puchta，2002 Plant Cell[植物细胞]14：1121-31；Pacher等人，2007Genetics[遗传学]175：21-9)。

尽管已经参照优选实施例和各种替代实施例明确展示和描述了本发明，但是本领域技术人员应理解，在不脱离本发明的精神和范围的情况下，可以对其在形式和细节上进行各种改变。例如，尽管下面的特定实例可以阐述本文中使用特定植物来描述的方法和实施例，但是这些实例中的原理可以应用于任何植物。因此，应当理解，本发明的范围被本文和说明书中记载的本发明的实施例所涵盖，而不是由以下示例的具体实例所涵盖。出于所有目的，在本申请中提到的所有引用的专利和出版物通过引用以其整体并入本文，其程度如同它们各自单独和特别地通过引用并入。

实例

以下是本发明一些方面的具体实施例的实例。提供这些实例仅出于说明目的，而无意以任何方式限制本发明的范围。就使用的数字(例如量、温度等)而言，已努力确保其准确性，但仍应允许有一些实验误差和偏差。

缩写的含义如下：“sec”意指秒、“min”意指分钟、“h”意指小时、“d”意指天、“μL”或“uL”或“ul”意指微升、“mL”意指毫升、“L”意指升、“μM”意指微摩尔、“mM”意指毫摩尔、“M”意指摩尔、“mmol”意指毫摩尔、“μmole”或“umole”微摩尔、“g”意指克、“μg”或“ug”意指微克、“ng”意指纳克、“U”意指单位、“bp”意指碱基对、以及“kb”意指千碱基。

可以根据多种技术来鉴定、表征和利用抗CRISPR(ACR)蛋白，其中的一些在本文中描述。

实例1

获得噬菌体的基因组序列，所述噬菌体显示出对包含CRISPR-Cas系统的细菌的病毒性，其中该CRISPR-Cas系统包含与该噬菌体基因组中的序列大体上互补的靶向序列。对这些序列进行分析，并将其与至少一种已知的抗CRISPR蛋白的多核苷酸序列进行比较。在一些方面，该噬菌体基因组的至少一个多核苷酸与选自下组的至少100个碱基的序列共享至少70％的序列同一性，所述组由以下组成：SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85和99-374。

实例2

获得包含重组构建体的第一细菌宿主细胞，所述重组构建体具有II-A型CRISPR系统，所述II-A型CRISPR系统具有能够靶向第一烈性噬菌体的基因组靶序列的靶向序列。用烈性噬菌体激发第一细菌宿主。获得第二细菌宿主细胞，该宿主细胞优选具有与第一细菌宿主细胞相同的菌株和遗传组成(同系)，包含具有II-A型CRISPR系统的重组构建体，该II-A型CRISPR系统具有能够靶向第二烈性噬菌体中基因组靶序列的靶向序列。用第二烈性噬菌体激发第一细菌宿主。鉴定一种或多种具有与用第一烈性噬菌体激发的缺乏编码CRISPR系统的重组构建体的其他同系细菌细胞实质上相似的噬菌体滴度的第一细菌宿主细胞的细菌菌落，所述CRISPR系统具有能够靶向第一烈性噬菌体的基因组靶序列的靶向序列。鉴定一种或多种具有与用第二烈性噬菌体激发的缺乏编码CRISPR系统的重组构建体的细菌细胞实质上不同的噬菌体滴度的第二细菌宿主细胞的细菌菌落，所述CRISPR系统具有能够靶向第二烈性噬菌体的基因组靶序列的靶向序列。对第一和第二烈性噬菌体的基因组进行测序。一个或多个基因在第一烈性噬菌体中存在但在第二烈性噬菌体中不存在。获得第三细菌宿主细胞，该宿主细胞优选具有与第一细菌宿主细胞相同的菌株和遗传组成(同系)，包含具有CRISPR系统的重组构建体，该CRISPR系统具有能够靶向第一烈性噬菌体中基因组靶序列的靶向序列。将构建体引入第三细菌宿主细胞，其中该构建体包含在第三细菌宿主细胞中起作用的启动子，该启动子可操作地连接至与鉴定为存在于第一烈性噬菌体但不存在于第二烈性噬菌体中的基因相同的多核苷酸。用第一烈性噬菌体激发第三细菌宿主。鉴定一种或多种具有与用第一烈性噬菌体激发的缺乏编码CRISPR系统的重组构建体的细菌细胞实质上相似的噬菌体滴度的第三细菌宿主细胞的细菌菌落，所述CRISPR系统具有能够靶向第一烈性噬菌体的基因组靶序列的靶向序列。

实例3

获得包含重组构建体的细菌宿主细胞，所述重组构建体具有CRISPR系统，所述CRISPR系统具有能够靶向烈性噬菌体的基因组靶序列的靶向序列。将包含在细菌宿主细胞中起作用的启动子的构建体引入细菌宿主细胞中，所述启动子与编码待进行抗CRISPR活性测定的多肽的多核苷酸可操作地连接。用烈性噬菌体激发该细菌宿主。鉴定一种或多种显示与用该烈性噬菌体激发的缺乏编码CRISPR系统的重组构建体的细菌细胞实质上相似的噬菌体滴度的细菌菌落，所述CRISPR系统具有能够靶向烈性噬菌体的基因组靶序列的靶向序列。

实例4

由于嗜热链球菌是研究CRISPR适应性的模型，本文使用的许多方法的详细分步方案可在其他地方获得。

菌株培养

使嗜热链球菌培养物在补充有0.5％w/v乳糖(LM17)的M17培养基(奥克艺德公司(Oxoid)，加拿大安大略省)中生长。必要时，添加5ug/ml浓度的氯霉素。当用于产生隔夜培养物以供第二天使用时，培养物在37℃下生长，无需摇动。在所有其他情况下，它们均在42℃下生长，无需摇动。如果要添加噬菌体，则向培养基中进一步补充10mM CaCl₂。

将乳酸乳球菌培养物在补充有0.5％w/v一水葡萄糖(GM17)的M17培养基(奥克艺德公司，加拿大安大略省)中生长。必要时，添加5ug/ml浓度的氯霉素或红霉素。将培养物在30℃下生长，无需摇动，在测定含SpCas9的构建体的活性时除外(在这种情况下，在33℃下孵育)。如果要添加噬菌体，则向培养基中进一步补充10mM CaCl₂。

将大肠杆菌培养物在LB培养基中生长。必要时，提供20ug/ml浓度的氯霉素。培养物在37℃下摇动生长。

噬菌体扩增

在补充有10mM CaCl₂的培养基中，将保存在-80℃的含有15％甘油的噬菌体裂解物的碎片与其宿主菌株共同接种，并使其生长直至观察到完全溶解。然后通过0.45um PES过滤器过滤该第一扩增裂解物，并在补充有10mM CaCl₂的培养基中将100ul用于接种生长至0.1的OD₆₀₀的其宿主菌株。将该第二扩增裂解物也通过0.45um PES过滤器过滤，然后在4℃下储存。

噬菌体滴定

如图1所示，将噬菌体在噬菌体缓冲液(50mM Tris-HCl，pH 7.5，100mMNaCl，8mMMgSO₄)中连续稀释。将3ml在55℃下熔融的0.75％琼脂培养基(补充了10mM CaCl₂)用300ul宿主菌株的过夜培养物接种，然后迅速倒入含有1％琼脂的相同培养基的预设平板上。放置并干燥平板。将每份3ul的噬菌体稀释液点到干燥的覆盖层上，并让其干燥20分钟。然后将这些平板孵育过夜，并以噬菌斑可见的最低稀释度对其计数。

如图2所示，将噬菌体在噬菌体缓冲液中连续稀释。将3ml在55℃下熔融的0.75％琼脂培养基(补充了10mM CaCl₂)与300ul宿主菌株的OD₆₀₀0.6培养物以及100ul的稀释噬菌体共同接种。然后将这些平板孵育过夜，并从具有30-300个噬菌斑的平板上对噬菌斑计数。

BIM(噬菌体不敏感性突变体)的免疫测定

将噬菌体在噬菌体缓冲液中稀释，以使最终的感染复数(MOI)为每个菌落形成单位0.1个噬菌斑形成单位(pfu/cfu)。将3ml在55℃下熔融的0.75％琼脂培养基(补充了10mMCaCl₂)与300ul宿主菌株的OD₆₀₀为0.6(约1.2x10⁸ cfu/ml)的培养物以及100ul的适当噬菌体稀释液共同接种。然后将平板孵育过夜，并对存活的菌落计数。

存活菌落的表征

通过PCR筛选随机存活的细菌菌落，以在CRISPR1和CRISPR3基因座(嗜热链球菌菌株DGCC7710)或CRISPR1基因座(嗜热链球菌菌株DGCC7854)获得新的间隔区。相对于野生型，PCR产物的大小增加指示存在CRISPR免疫。对所得的PCR产物进行测序以确认新获得的间隔区的同一性。对于图2中的测定，通过在已获得间隔区的细胞中测序来确认pNZAcr中插入片段的存在。

质粒编程

质粒被设计为含有靶向在激发中使用的五种噬菌体的前间区序列(可获得CRISPR的序列)。将由编码卷尺蛋白质的基因中的保守前间区序列组成的两种寡核苷酸以及适合于克隆的突出端通过等分混合、加热至98℃，然后缓慢冷却至50℃退火在一起。然后将此退火的构建体直接连接到EcoRI/XhoI双重消化的pNZ123中，转化为商用NEB5α，并用氯霉素进行选择。然后根据制造商的建议，使用Qiaprep Spin Miniprep试剂盒(凯杰公司(Qiagen)，加拿大安大略省)分离构建的质粒。用该质粒pNZ5噬菌体转化嗜热链球菌DGCC7854，然后在不进行选择的情况下生长7代，并用烈性噬菌体D5842进行免疫测定(参见上文)。存活的菌落从质粒中自然获得了所希望的间隔区，使它们对这些噬菌体免疫。如上文“存活菌落的表征”所述确认间隔区序列。

噬菌体基因组测序与注释

使用PureLink病毒RNA/DNA试剂盒(英杰公司(Invitrogen)，美国马萨诸塞州)纯化来自噬菌体D4276的DNA。使用Nextera XT DNA库制备试剂盒(亿明达公司(Illumina)，加拿大不列颠哥伦比亚省)进行制备后，使用MiSeq试剂盒v2在MiSeq系统上对纯化的DNA进行测序。所得的读数使用Ray版本2.2.0(32)进行汇总。使用NCBI ORF finder和GeneMark.hmmprokaryotic对基因组进行注释，然后根据与相关噬菌体的比较手动挑选这些注释。

噬菌体基因克隆和pNZAcr构建

引物被设计用于将所有噬菌体D4276系统性地克隆到定向的pNZ123中，以驱动从氯霉素抗性基因cat上游启动子的转录。最初，插入片段被设计为包含多个基因，但如果克隆失败，则将插入片段重新设计为更小的单基因构建体。最引人关注的基因D4276_028就是这种克隆技术的例证。引物被设计用于扩增基因，并附加与pNZ123 MCS重叠的30nt延伸(SEQ ID NO：87和SEQ ID NO：88)。然后通过Gibson反应将扩增的基因克隆到XhoI消化的pNZ123中。将得到的质粒pNZAcr转化到商用NEB5a中，使用Qiaprep Spin Miniprep试剂盒进行分离，然后转化为相关的嗜热链球菌和乳酸乳杆菌菌株。通过使用引物(SEQ ID NO：89和SEQ ID NO：90)进行测序来确认该插入片段的序列。

质粒损失测定

携带pNZAcr的培养物在不进行选择的情况下连续生长，用100ul生长至饱和的培养物接种新鲜的10ml LM17肉汤培养基。重复该过程5次。将所得培养物的稀释液铺展在平板上以获得分离的菌落，然后将120个这样的菌落斑块铺板在含有和不含氯霉素的LM17上。通过PCR筛选在LM17(全部120个)上生长但不能在LM17 Cm(2个)上生长的菌落，以使用pNZinsF和pNZinsR确认质粒损失，并扩增其CRISPR1基因座，以确认免疫间隔区的存在。然后将菌落用于滴定噬菌体D4276和D5842，并确认它们已经通过损失质粒从而重新获得了对这些噬菌体的抗性。

pL2Cas9-44的构建

pL2Cas9(Lemay等人，2017)是具有pCas9的SpCas9模块(Jiang等人，2013)的乳酸菌载体pTRKL2(O′Sullivan等人，1993)的衍生物。设计了一对包含靶向噬菌体p2的orf44的间隔区序列和用于连接至pL2cas9的突出端的寡核苷酸(SEQ ID NO：90和SEQ ID NO：91)。将它们通过等分混合、加热到98℃，然后缓慢冷却到50℃使其退火在一起。然后将该退火的构建体直接连接到消化的pL2Cas9中，并直接转化为乳酸乳球菌。使用引物(SEQ ID NO：93和SEQ ID NO：94)，通过PCR扩增和测序筛选所得转化体，以确认所希望的间隔区的存在。

感染中心的效率(ECOI)

将图3B中描述的所有四个菌株的培养物在33℃的条件下培养至OD₆₀₀为0.8(约1.9*10⁸ cfu/ml)，2ml离心，将其1ml重悬在含有10mM CaCl₂的新鲜GM17培养基中。然后，将噬菌体p2加入至0.2的MOI中，通过倒置混合，并在33℃下给出5min以使其吸附至细胞。然后将噬菌体-细胞混合物离心并重悬在新鲜培养基中三次，以洗去未结合的噬菌体，然后连续稀释。然后将100ul得到的稀释液添加到300ul指示菌株(MG1363 pNZ123 pL2Cas9)中，包埋在柔软的琼脂覆盖物中(参见噬菌体滴定)，并在33℃孵育过夜。

结果

嗜热链球菌已成为获取新的CRISPR免疫力的模型，与SpCas9的来源共享其菌属，其活性CRISPR-Cas系统也属于II-A型。感染嗜热链球菌菌株DGCC7854的一组5种烈性噬菌体非常适合鉴定不太可能导致获得新间隔区的噬菌体(CRISPR阵列中的噬菌体衍生序列，赋予免疫力)；其中两种噬菌体很容易产生CRISPR免疫菌落，而另外三种则不是(图1，上图)。未从这三种噬菌体获得间隔区并不一定证实抗CRISPR的存在。这些噬菌体可能对非CRISPR形式的耐药性更敏感，可以更快地接管宿主细胞，或产生更少的免疫原性缺陷颗粒。有必要确定CRISPR-Cas系统是在适应过程(新靶标的‘记忆’)还是在干扰(该靶标的切割)过程中受到阻碍。使用质粒编程，产生了靶向在所有五种噬菌体基因组中保守的前间区序列的菌株。然后，在该菌株上使每种噬菌体形成噬菌斑时，观察到五种噬菌体中有四种噬菌体的滴度急剧降低(约6个对数)，与CRISPR干扰一致，但一种噬菌体D4276却没有(图1，底图)。对这些噬菌体根据这些与CRISPR相互作用的表型分类；许可性(白色)噬菌体D5842和D5843，适应受阻(分形模式)噬菌体D1024和D5891，以及限制性(黑色)噬菌体D4276-包含抗CRISPR的候选者。

来自限制性噬菌体D4276的基因被克隆到载体中，这样这些基因可以在免疫的菌株中表达(图2A)。编码抗CRISPR蛋白的噬菌体基因应使先前存在的免疫活性丧失，从而恢复铺板在菌株上的敏感性(许可性)噬菌体的滴度。获得了新的抗CRISPR基因(acr基因，本文描述为编码SEQ ID NO：10所述的抗CRISPR蛋白的SEQ ID NO：9)，该基因完全恢复了免疫菌株对许可性噬菌体D5842的敏感性(约6个对数增加)，并且将对限制性噬菌体D4276的敏感性提升到野生型水平(图2B)。我们将甚至含抗CRISPR的噬菌体D4276的滴度的这种增加归因于噬菌体暴露之前的高抗CRISPR产量，在其他情况下这将是一个对时间敏感的过程，因而生产速度必须超过CRISPR活性。为了确保敏感性获得表型仅归因于这种抗CRISPR，我们允许携带抗CRISPR的质粒的损失并确认了抗性返回表型(数据未显示)。

由于感染嗜热链球菌DGCC7854的所有五个噬菌体都是相关的cos型噬菌体，因此我们不能排除抗CRISPR可能依赖于与这些噬菌体中存在的伴侣蛋白的相互作用。此外，菌株DGCC7854仅包含单一的活性CRISPR-Cas系统(CRISPR1)，相反，嗜热链球菌菌株中通常具有两个系统(CRISPR1和CRISPR3)。我们将抗CRISPR载体转向特征明确的模型菌株嗜热链球菌DGCC7710上，该菌株对无关的病毒性pac型噬菌体2972-敏感并且，为此我们已经在CRISPR1或CRISPR3基因座使菌株产生免疫(图2C)。在该系统中，维持了抗CRISPR活性，完全恢复了对CRISPR1免疫菌株的噬菌体敏感性，并部分恢复了对CRISPR3免疫菌株的敏感性。当我们尝试在携带acr基因的DGCC7710上进行免疫测定时，存活的菌落数量急剧下降(图2D)。此外，这些存活菌落的性质发生了巨大变化。CRISPR3免疫菌落数量下降，观察到许多以前无法检测到的非CRISPR突变体，并且尽管CRISPR1免疫通常占存活菌落的90％以上，但仅回收了存在CRISPR1间隔区获取的单个菌落(图2D)。值得注意的是，所讨论的CRISPR1间隔区靶向质粒(仍然存在并携带完整的acr基因)，而不是噬菌体基因组。这指示该ACR蛋白可能会阻止Cas9介导的切割，但不会阻止Cas9在间隔区获取中的作用。

该ACR蛋白(SEQ ID NO：10)长140个氨基酸，预计将包含独特的卷曲螺旋基序，该基序可能起核酸结合作用，类似于与其他抗CRISPR蛋白相关的HTH和AP2基序。我们在两个噬菌体基因组(分别编码如SEQ ID NO：2、4、6、12、14、16和18中定义的抗CRISPR蛋白的SEQID NO：1、3、5、11、13、15和17)以及链球菌菌株的基因组(分别编码如SEQ ID NO：6、8、20、22、24和26中定义的抗CRISPR蛋白的SEQ ID NO：5、7、19、21、23和25)中都发现了几个新的抗CRISPR基因。

最后，尽管基因组编辑工具SpCas9(来自酿脓链球菌的Cas9)与嗜热链球菌CRISPR3系统的Cas9更加密切地相关，但我们还是渴望确定该ACR蛋白是否对SpCas9有任何效力。我们最初尝试在大肠杆菌(Escherichia coli)中测定ACR(pNZAcr)对SpCas9(pCas9)的效力，但是尽管能够分别克隆每个系统，但两个系统无法共存。ACR-Cas9相互作用的一些方面可能对大肠杆菌有害。作为替代，我们使用经调整用于乳酸乳球菌的pCas9衍生物，证明在烈性噬菌体的基因组编辑中具有功效(图3A)。靶向烈性噬菌体p2的orf44的pL2Cas9-44构建体，导致可测量的噬菌体滴度降低了4个对数(图3B)，而acr基因的存在将其完全恢复。这是迄今为止报道的针对SpCas9的最强抗CRISPR活性。

与pL2Cas9-44相关的4个对数的降低还伴有‘微小噬菌斑’表型，该表型难以量化，因为它们只能在一些技术性复制上观察到。观察到的微小噬菌斑的最大数量以淡橙色显示(图3B)。我们对这些较小噬菌斑的表型和基因型进行了表征，确定它们是从CRISPR绕过的突变体，与较大噬菌斑中的那些在基因上无法区分，但仅在‘泄漏’的靶菌株上经过数轮复制后才出现。然而，值得注意的是，该ACR的表达完全拯救了滴度和微小噬菌斑表型。

该ACR蛋白(SEQ ID NO：10)是第一种被证明具有来自烈性噬菌体的活性的抗CRISPR蛋白，在结构上与先前表征的抗CRISPR截然不同，并且显示出迄今为止对SpCas9的最强的体内活性。

实例5

以与实例1相同的方式进行菌株培养、噬菌体扩增、噬菌体滴定、免疫测定、存活菌落的表征和转化。

噬菌体基因组测序和注释

使用PureLink病毒RNA/DNA试剂盒(英杰公司，美国马萨诸塞州)纯化来自噬菌体D1811的DNA。使用Nextera XT DNA库制备试剂盒(亿明达公司，加拿大不列颠哥伦比亚省)进行制备后，使用MiSeq试剂盒v2在MiSeq系统上对纯化的DNA进行测序。所得的读数使用Ray版本2.2.0(32)进行汇总。使用NCBI ORF finder和GeneMark.hmm prokaryotic对基因组进行注释，然后根据与相关噬菌体的比较手动挑选这些注释。

噬菌体基因克隆和pNZAcr构建

引物被设计用于扩增目的基因D1811_026，并附加与pNZ123 MCS重叠的30nt延伸(SEQ ID NO：95和SEQ ID NO：96)。然后通过Gibson反应将扩增的基因克隆到XhoI消化的pNZ123中。将得到的质粒pNZAcr-1811转化到商用NEB5a中，使用Qiaprep Spin Miniprep试剂盒进行分离，然后转化为相关的嗜热链球菌。通过使用引物(SEQ ID NO：97和SEQ ID NO：98)进行测序来确认该插入片段的序列。

质粒损失测定

携带pNZAcr的培养物在不进行选择的情况下连续生长，用100ul生长至饱和的培养物接种新鲜的10ml LM17肉汤培养基。重复该过程14次。将所得培养物的稀释液铺展在平板上以获得分离的菌落，然后将160个这样的菌落斑块铺板在含有和不含氯霉素的LM17上。通过PCR筛选在LM17(全部120个)上生长但不能在LM17 Cm(2个)上生长的菌落，以使用pNZinsF和pNZinsR确认质粒损失，并扩增其CRISPR1基因座，以确认免疫间隔区的存在。然后将菌落用于滴定噬菌体D1811和D5842，并确认它们已经通过损失质粒从而重新获得了对这些噬菌体的抗性。

结果

在DGCC7854菌株上使另一个噬菌体(D1811)形成噬菌斑时，观察到该噬菌体的滴度下降幅度要比其他4个相关噬菌体小得多(图1，底图)。该噬菌体被分类为限制性(黑色)噬菌体。

我们发现了第二种新的抗CRISPR基因(acr2基因，本文定义为编码SEQ ID NO：28所定义的抗CRISPR蛋白的SEQ ID NO：27)，该基因完全恢复了免疫菌株对许可性噬菌体D5842的敏感性(约5个对数增加)，并且将对限制性噬菌体D1811的敏感性提升到野生型水平(图4A)。我们将甚至含抗CRISPR的噬菌体D1811的滴度的这种增加归因于噬菌体暴露之前的高抗CRISPR产量，否则这将是一个对时间敏感的过程，因此生产速度必须超过CRISPR活性。为了确保敏感性获得表型仅归因于这种抗CRISPR，我们允许携带抗CRISPR的质粒的损失并确认了抗性返回表型(数据未显示)。

由于D1811与实例1中公开的其他五种噬菌体有关，我们不能排除抗CRISPR可能依赖于与这些噬菌体中存在的伴侣蛋白的相互作用。我们将抗CRISPR载体转向特征明确的模型菌株嗜热链球菌DGCC7710上，该菌株对无关的病毒性pac型噬菌体2972敏感-并且，为此我们已经在CRISPR1或CRISPR3基因座使菌株产生免疫(图4B)。在该系统中，维持了抗CRISPR活性，完全恢复了对CRISPR1免疫菌株的噬菌体敏感性。

Acr2蛋白(SEQ ID NO：28)长183个氨基酸。我们在噬菌体基因组(分别编码SEQ IDNO：30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、80和82中定义的抗CRISPR蛋白的SEQ ID NO：29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79和81)以及链球菌菌株的基因组(分别编码SEQ ID NO：84、86和375-650中定义的抗CRISPR蛋白的SEQ ID NO：83、85和99-374)中都发现了几个新的抗CRISPR基因。

实例6

在该实例中，描述了通过RNA指导的核酸内切酶减少“脱靶”染色体DNA切割的方法。在一些方面，任何Cas核酸内切酶均可用于产生双链断裂。在一些方面，II型Cas核酸内切酶可用于产生双链断裂。在一些方面，来自任何生物体的Cas9核酸内切酶均可用于产生双链断裂。在一些方面，所述Cas9核酸内切酶来自酿脓链球菌或嗜热链球菌。

在一个实例中，Cas核酸内切酶，例如但不限于酿脓链球菌Cas9(SpCas9)，可以由指导RNA(gRNA)引导以切割DNA靶标并在多种生物体(包括植物)中以高效率引入双链断裂(DSB)(Hsu，P.D.等人(2014)Cell.[细胞]157：1262-1278)。然后将DSB的细胞修复用于引入基因修饰。这可能包括较小的插入或缺失(indel)突变、较大的缺失(如果靶向多于一个DNA位点)、有目的的编辑(例如，基因中密码子的改变)以及在DNA靶序列内或附近插入DNA。根据使用的实验系统的性质，SpCas9可能会在基因组中除预期的位置之外的其他位置产生DSB和染色体改变(Fu，Y.等人(2013)Nat.Biotechnol.[自然生物技术]31：822-826)。为了减少这些潜在的“脱靶”效应，可以利用抗CRISPR(ACR)。所述方法依赖于抑制SpCas9或其他Cas9或任何其他Cas核酸内切酶结合、切口或切割DNA的ACR的重组表达。在这种情况下，ACR表达的时间有重大关系。如果ACR在Cas核酸内切酶切割预期的中靶序列之前表达，那么预期的靶位点可能没有DSB活性或具有降低的DSB活性。可替代地，如果ACR表达太迟，则Cas核酸内切酶蛋白的持续活性可能不会受到ACR表达的影响，从而导致更低的比活性。为了确保适当的时间设定，可以将ACR重组基因表达盒设计为非功能性的，然后在Cas核酸内切酶表达和RNA指导的切割之后或经过足够的时间进行位点特异性切割后，转化为功能性表达盒。为了通过切割恢复功能性，可以利用诸如PCT申请公开号WO 2017070032中描述的方法。在一个实施例中，可以将目的ACR蛋白的翻译开放阅读框(ORF)设计为破框(例如但不限于单个碱基的缺失)(图9)，其中所述ORF导致包含提前终止密码子或编码无义蛋白的RNA转录物。然后，可以通过靶向破框(位于)序列将所得到的非功能性ORF转化为功能性ORF以进行Cas核酸内切酶切割和细胞DSB修复(图9)。另外，可以在多顺反子(由编码‘自我切割’2A肽的序列分开(Szymczak，A.L.等人(2004)Nature Biotech.[自然生物技术]22：589-594)中将编码该破框ACR蛋白的基因与其他基因(例如但不限于选择剂和标记基因)组合(Miki，B.(2004)J Biotechnol.[生物技术杂志]107：193-232)(图10)。然后，在恢复ACR ORF之后，多顺反子表达盒中的其他基因也可以转化为功能性状态(图10)。从而允许同时正向选择功能性ACR表达和Cas9基因组编辑。总的来说，这种方法会导致自动调节反馈环(ARFL)，该环通过Cas核酸内切酶活性导致由ACR使Cas核酸内切酶快速失活，从而降低了脱靶切割的可能性。

实例7

在该实例中，描述了使用抗CRISPR蛋白通过同源重组(HR)DNA修复途径来增强Cas产生的双链断裂(DSB)的染色体DNA修复的方法。在一些方面，任何Cas核酸内切酶均可用于产生双链断裂。在一些方面，II型Cas核酸内切酶可用于产生双链断裂。在一些方面，来自任何生物体的Cas9核酸内切酶均可用于产生双链断裂。在一些方面，所述Cas9核酸内切酶来自酿脓链球菌或嗜热链球菌。

Cas核酸内切酶诱导的DSB的细胞修复利用非同源末端连接(NHEJ)和HR DNA修复途径(Hsu，P.D.等人(2014)Cell.[细胞]157：1262-1278)。NHEJ修复可能会导致在染色体DNA靶位点上DNA碱基对(bp)的不精确插入或缺失(indel)，并且可用于破坏(敲除)基因表达。相反，HR介导的修复提供了一种高度精确的方法，以使用外源提供的DNA修复模板将所希望的改变引入DNA中(Capecchi，M.R.(1989)Science.[科学]244：1288-1292)。NHEJ途径典型是最普遍的DSB修复结果，使HR介导的改变很少恢复(Capecchi，M.R.(1989)Science.[科学]244：1288-1292)。为了增加HR修复的频率，可以使用抗CRISPR(ACR)使Cas核酸内切酶在发生HR修复的细胞周期的一部分(S期(合成期)和G2期(第2间期))具有切割活性(Heyer，W.D.等人(2010)Annu.Rev.Genet.[遗传学年鉴]44：113-139)。为实现这一目的，可以充分利用泛素介导的蛋白水解途径。通过融合部分或全部的Cdt，一种由S和G2细胞期的SCF^Skp2泛素化复合物靶向降解为ACR的蛋白质(Nishitani，H.等人(2000)Nature.[自然]404：625-628)，可以将其表达可以限制在G1期(第1间期)。因此，当HR修复无活性时，在G1期Cas核酸内切酶失活，当HR修复机制表达并有活性时，在S和G2期间允许Cas核酸内切酶重新活化(图11)。总的来说，ACR可用作以细胞周期依赖性的方式调节Cas核酸内切酶活性的工具，从而导致增强的HR修复。在一些方面，ACR可用于在减数分裂期间调节Cas核酸内切酶活性。在一些方面，ACR可用于在有丝分裂期间调节Cas核酸内切酶活性。在一些方面，ACR可用于在S期或G2期期间调节Cas核酸内切酶活性。

实例8

考虑了通过ACR的空间调节表达、时间调节表达或可诱导表达控制植物中Cas核酸内切酶表达的方法。在一些方面，将ACR、Cas核酸内切酶或两者预先整合到植物中至少一个植物细胞的基因组中。在一些方面，将ACR、Cas核酸内切酶或两者作为多核苷酸引入植物的至少一个细胞中，或引入可以衍生整个植物或植物组织的细胞中。在一些方面，将ACR、Cas核酸内切酶或两者作为多肽引入植物的至少一个细胞中，或引入可以衍生整个植物或植物组织的细胞中。

在该实例中，描述了使用抗CRISPR蛋白以组织特异性方式调节RNA指导的CRISPR核酸内切酶的结合、切口和切割活性的方法。在一些方面，可以使用任何Cas核酸内切酶。在一些方面，可以使用任何II型Cas核酸内切酶。在一些方面，可以使用来自任何生物体的Cas9核酸内切酶。

微小RNA(miRNA)是小的非编码RNA，这些RNA可提供多效性细胞机制来调节基因表达和细胞分化的关键决定因素(Baskerville，S.等人(2005)RNA.[RNA]11：241-247，Lagos-Quintana，M.等人(2002)Curr.Biol.[当代生物学]12：735-739，Chen，C.Z.等人(2004)Science.[科学]303：83-86以及Lu，J.等人(2005)Nature.[自然]435：834-838)。它们通过靶向转录的RNA进行降解来调节转录后的基因表达(Lagos-Quintana，M.等人(2001)Science.[科学]294：853-858)。另外，通过将其结合位点放置在外源基因的3个主要非翻译区(UTR)中，它们已被重新用于以组织特异性方式调节转基因表达(Brown，B.等人(2006)Nat.Med.[自然医学]12：585-591)。为了以组织特异性方式调节Cas9蛋白的结合、切口和切割活性，可以将重组抗CRISPR(ACR)编码基因变为用于细胞miRNA调节的底物。通过在ACR基因的3′UTR中放置一个或多个miRNA结合位点，可以根据组织类型、发育阶段或生长条件来调节其表达和作为结果的Cas9的活性。Cas9在存在miRNA翻译阻抑的情况下将是有活性的，而在不存在miRNA翻译阻抑的情况下将是无活性的。作为替代，也可以将miRNA结合位点置于Cas9基因的3′UTR中，以组织特异性方式直接调节其表达。此外，具有不同组织特异性的miRNA可以并入重组ACR和Cas9表达构建体的3′UTR中，以提供额外的调节层。

Claims

1.一种调节细胞中Cas核酸内切酶对靶多核苷酸的活性的方法，所述方法包括向所述细胞提供抗CRISPR(ACR)多肽，其中所述抗CRISPR多肽调节所述细胞中Cas核酸内切酶的活性。

2.如权利要求1所述的方法，其中Cas核酸内切酶活性选自下组，该组由以下组成：靶多核苷酸结合、靶多核苷酸切口、靶多核苷酸双链断裂产生和靶多核苷酸修饰。

3.如权利要求2所述的方法，其中所述靶多核苷酸修饰选自下组，所述组由以下组成：至少一个核苷酸的插入、至少一个核苷酸的缺失、至少一个核苷酸的取代、以及至少一个核苷酸的化学改变。

4.如权利要求1所述的方法，其中所述Cas核酸内切酶缺乏切口或切割多核苷酸的能力。

5.如权利要求4所述的方法，其中所述Cas核酸内切酶可操作地连接至脱氨酶。

6.如权利要求5所述的方法，所述方法进一步包括：编辑所述靶多核苷酸的至少一个碱基。

7.如权利要求1所述的方法，其中与包含所述Cas核酸内切酶和指导RNA、但不包含所述抗CRISPR多肽的对照细胞相比，所述活性降低。

8.如权利要求1所述的方法，其中所述细胞选自下组，所述组由以下组成：植物细胞、动物细胞、哺乳动物细胞、微生物细胞、真菌细胞。

9.如权利要求1所述的方法，其中所述Cas核酸内切酶是II-A型Cas核酸内切酶。

10.如权利要求1所述的方法，其中所述Cas核酸内切酶是Cas9或Cpfl。

11.一种增加细胞中Cas核酸内切酶和指导多核苷酸复合物的特异性的方法，所述方法包括将抗CRISPR(ACR)多肽引入细胞，其中所述ACR多肽与所述Cas核酸内切酶相互作用。

12.如权利要求11所述的方法，其中与缺乏所述ACR多肽的对照细胞相比，所述Cas核酸内切酶的特异性改善了至少5％。

13.如权利要求11所述的方法，其中在特定的细胞周期阶段期间，所述ACR多肽与所述Cas核酸内切酶相互作用。

14.如权利要求9所述的方法，其中所述细胞选自下组，所述组由以下组成：植物细胞、动物细胞、哺乳动物细胞、微生物细胞、真菌细胞。

15.如权利要求13所述的方法，其中所述细胞周期阶段为减数分裂期间。

16.如权利要求13所述的方法，其中所述细胞周期阶段为有丝分裂期间。

17.如权利要求11所述的方法，其中所述ACR多肽在生物体发育的特定阶段期间调节所述Cas核酸内切酶的活性。

18.如权利要求17所述的方法，其中所述阶段选自下组，所述组由以下组成：生长、生殖、营养和衰老。

19.如权利要求11所述的方法，其中所述Cas核酸内切酶和指导多核苷酸作为多核苷酸提供。

20.如权利要求11所述的方法，其中所述Cas核酸内切酶作为多肽提供，并且所述指导多核苷酸作为RNA分子提供。

21.如权利要求11所述的方法，其中所述ACR作为编码多肽的多核苷酸提供。

22.如权利要求11所述的方法，其中所述ACR作为多肽提供。

23.如权利要求11所述的方法，其中所述ACR与所述Cas核酸内切酶或所述指导多核苷酸同时提供。

24.如权利要求11所述的方法，其中所述ACR相对于所述Cas核酸内切酶或所述指导多核苷酸的引入按顺序提供。

25.如权利要求11所述的方法，其中将编码所述ACR的多核苷酸和/或编码所述Cas核酸内切酶的多核苷酸预先整合到所述细胞或生物体的基因组中。

26.如权利要求11所述的方法，其中Cas核酸内切酶与ACR的相对浓度比为100∶1至1∶100。

27.如权利要求11所述的方法，其中所述ACR的表达或活性是可诱导的。

28.如权利要求27所述的方法，其中诱导是对选自下组的条件的响应，所述组由以下组成：温度、存在或不存在外源施加分子、内源基因的激活或抑制、光照、黑暗、细胞周期、生物体期、组织或细胞类型、以及环境压力。

29.如权利要求11所述的方法，其中所述ACR蛋白包含卷曲螺旋基序。

30.如权利要求11所述的方法，其中所述ACR蛋白包含“hxxhcxc”的模式的氨基酸的七肽重复模式，其中h＝疏水性氨基酸，c＝带电荷的氨基酸，并且x＝任何氨基酸。

31.如权利要求11所述的方法，其中所述ACR具有与选自下组的序列至少70％相同的氨基酸序列，所述组由以下组成：SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86和375-650。

32.如权利要求11所述的方法，其中所述Cas核酸内切酶是II-A型Cas核酸内切酶。

33.如权利要求11所述的方法，其中所述Cas核酸内切酶是Cas9或Cpf1。

34.一种增加细胞中供体多核苷酸的位点特异性同源重组频率的方法，所述方法包括向所述细胞中引入抗CRISPR(ACR)多肽以通过多核苷酸指导的Cas核酸内切酶来增加所述供体多核苷酸的同源重组。

35.如权利要求34所述的方法，其中所述细胞选自下组，所述组由以下组成：植物细胞、动物细胞、哺乳动物细胞、昆虫细胞、人类细胞、微生物细胞、真菌细胞。

36.如权利要求34所述的方法，其中在特定的细胞周期阶段期间，所述ACR多肽与所述Cas核酸内切酶相互作用。

37.如权利要求36所述的方法，其中所述细胞周期为减数分裂期间。

38.如权利要求36所述的方法，其中所述细胞周期为有丝分裂期间。

39.如权利要求34所述的方法，其中所述方法是在生物体发育的特定阶段期间进行的。

40.如权利要求39所述的方法，其中所述阶段选自下组，所述组由以下组成：生长、生殖、营养和衰老。

41.如权利要求34所述的方法，其中所述Cas核酸内切酶和所述指导RNA作为多核苷酸提供。

42.如权利要求34所述的方法，其中所述Cas核酸内切酶作为蛋白质提供，并且所述指导多核苷酸作为RNA分子提供。

43.如权利要求34所述的方法，其中所述ACR作为编码多肽的多核苷酸提供。

44.如权利要求34所述的方法，其中所述ACR作为多肽提供。

45.如权利要求34所述的方法，其中所述ACR与所述Cas核酸内切酶或所述指导多核苷酸同时提供。

46.如权利要求34所述的方法，其中所述ACR相对于所述Cas核酸内切酶或所述指导多核苷酸的引入按顺序提供。

47.如权利要求34所述的方法，其中将编码所述ACR的多核苷酸和/或编码所述Cas核酸内切酶的多核苷酸预先整合到所述细胞或生物体的基因组中。

48.如权利要求34所述的方法，其中所述ACR的表达或活性是可诱导的。

49.如权利要求48所述的方法，其中诱导是对选自下组的条件的响应，所述组由以下组成：温度、存在或不存在外源施加分子、内源基因的激活或抑制、光照、黑暗、细胞周期、生物体期、组织或细胞类型、以及环境压力。

50.如权利要求34所述的方法，其中所述ACR蛋白包含卷曲螺旋基序。

51.如权利要求34所述的方法，其中所述ACR蛋白包含“hxxhcxc”的模式的氨基酸的七肽重复模式，其中h＝疏水性氨基酸，c＝带电荷的氨基酸，并且x＝任何氨基酸。

52.如权利要求34所述的方法，其中所述Cas核酸内切酶是II-A型Cas核酸内切酶。

53.如权利要求34所述的方法，其中所述Cas核酸内切酶是Cas9。

54.一种包含Cas核酸内切酶和抗CRISPR(ACR)蛋白的细胞。

55.如权利要求54所述的细胞，其中所述ACR蛋白由噬菌体、病毒或重组构建体提供。

56.如权利要求54所述的细胞，所述细胞进一步包含指导多核苷酸。

57.如权利要求54所述的细胞，所述细胞进一步包含异源多核苷酸。

58.如权利要求54所述的细胞，其中所述细胞选自下组，所述组由以下组成：植物细胞、动物细胞、哺乳动物细胞、昆虫细胞、人类细胞、微生物细胞、真菌细胞。

59.如权利要求58所述的植物细胞，所述植物细胞选自下组，所述组由以下组成：玉蜀黍、稻、高粱、黑麦、大麦、小麦、粟、燕麦、甘蔗、草坪草、柳枝稷、大豆、卡诺拉油菜、苜蓿、向日葵、棉花、烟草、花生、马铃薯、烟草、拟南芥属植物(Arabidopsis)、蔬菜和红花。

60.一种包含重组构建体的细胞，所述重组构建体包含与异源调节表达元件可操作地连接的编码抗CRISPR(ACR)蛋白的多核苷酸序列。

61.如权利要求60所述的细胞，其中所述异源调节表达元件可响应于选自下组的条件而被诱导，所述组由以下组成：温度、存在或不存在外源施加分子、内源基因的激活或抑制、光照、细胞周期、生物体期、组织或细胞类型、以及环境压力。

62.如权利要求60所述的细胞，其中所述ACR蛋白包含卷曲螺旋基序。

63.如权利要求60所述的细胞，其中所述ACR蛋白包含“hxxhcxc”的模式的氨基酸的七肽重复模式，其中h＝疏水性氨基酸，c＝带电荷的氨基酸，并且x＝任何氨基酸。

64.如权利要求60所述的方法，其中所述细胞选自下组，所述组由以下组成：植物细胞、动物细胞、哺乳动物细胞、昆虫细胞、人类细胞、微生物细胞、真菌细胞。

65.如权利要求63所述的植物细胞，所述植物细胞选自下组，所述组由以下组成：玉蜀黍、稻、高粱、黑麦、大麦、小麦、粟、燕麦、甘蔗、草坪草、柳枝稷、大豆、卡诺拉油菜、苜蓿、向日葵、棉花、烟草、花生、马铃薯、烟草、拟南芥属植物、蔬菜和红花。

66.一种用于细胞中的基因激活或基因阻抑的方法，所述方法包括将抗CRISPR(ACR)多肽和Cas核酸内切酶引入包含要激活或阻抑的基因的细胞中。