CN117286165A

CN117286165A - 新型CRISPR-Cas9抑制蛋白AcrIIA24应用于基因编辑的方法

Info

Publication number: CN117286165A
Application number: CN202311022823.XA
Authority: CN
Inventors: 宋国旭; 田勇; 张飞; 田春红; 高星
Original assignee: Institute of Biophysics of CAS
Current assignee: Institute of Biophysics of CAS
Priority date: 2022-02-11
Filing date: 2022-02-11
Publication date: 2023-12-26
Also published as: CN114525293A; CN117487831A; CN117264987A; CN114525293B; CN117264988A

Abstract

本发明公开了新型CRISPR‑Cas9抑制蛋白AcrIIA24及其应用于基因编辑的方法。发明人从Streptococcus的移动元件中发现了新型II‑A型Acr(AcrIIA24‑32)蛋白家族，这些Acr蛋白可以在细菌和真核细胞中有效抑制II‑A型Cas9直系同源蛋白。基于此，发明人开发了新型的化学诱导型iAcr系统，建立了有效的化学可控的基因编辑的方法。本发明具有重要的应用价值。

Description

新型CRISPR-Cas9抑制蛋白AcrIIA24应用于基因编辑的方法

本发明为申请日为2022年02月11日、申请号为CN 202210127749.7、发明名称为新型CRISPR-Cas9抑制蛋白及其改造应用于化学可控的基因编辑的方法的中国发明专利申请的分案申请。

技术领域

本发明属于生物技术领域，具体涉及新型CRISPR-Cas9抑制蛋白及其改造应用于化学可控的基因编辑的方法。

背景技术

成簇的规律间隔的短回文重复序列(Clustered regularly interspaced shortpalindromic repeats，CRISPR)及其CRISPR相关蛋白(CRISPR-associated，Cas)构成了原核生物适应性免疫防御系统，以防御包括噬菌体和质粒在内的侵入性遗传元件。CRISPR-Cas介导的防御过程可分为三个阶段：(1)适应阶段：当噬菌体入侵时，噬菌体的一部分序列信息作为新的间隔子插入到细菌的CRISPR基因座，形成免疫记忆；(2)表达阶段：系统表达Cas基因以及加工形成成熟的CRISPR RNA(crRNA)；(3)干扰阶段：Cas蛋白在crRNA的引导下识别并破坏靶向核酸，形成免疫防御。目前基于系统发生树以及作用机制，CRISPR-Cas系统分为2大类(Class 1和Class 2)，6种类型。Class 1系统(包括I、III和IV型)使用多亚基Cas蛋白复合物靶向外源核酸；而Class 2系统(包括II、V和VI型)则依靠单一效应蛋白(如Cas9)来实现干扰，因而应用广泛。截止目前，Class 2CRISPR-Cas系统的多种亚型被鉴定并开发为多种强有力的基因编辑工具，主要包括CRISPR-Cas9、Cas12a(Cpf1)、Cas13a(C2c2)等。它们在科学研究、农业、畜牧业以及临床检测治疗等领域发挥着日益重要的作用。其中来自化脓链球菌(Streptococcus pyogenes)的Cas9(SpyCas9)是应用最为广泛的Cas效应物，并且已被发展成为一系列强有力的基因编辑工具。

然而，尽管近些年CRISPR基因编辑技术得到了长足发展，它仍面临着尚未解决的脱靶问题，使CRISPR基因编辑技术的应用受到了阻碍。为了解决这一问题，有些研究通过改造Cas蛋白或者向导RNA以提升靶向识别的特异性，或者通过可控的Cas蛋白或者导向RNA丰度与时间的表达来进一步降低脱靶效应。近年来，在原噬菌体或噬菌体中发现了一系列被称为anti-CRISPR(Acr)的蛋白，它们可以抑制多种CRISPR-Cas系统的活性，并且一些Acr蛋白(如AcrIIA4)被证明在细胞中可以通过抑制Cas9活性来降低脱靶效应。这些特性使得Acr可作为潜在的“开关”工具用于调控基于CRISPR的应用，因此Acr的探索及其分子机制研究对于基因编辑领域有着十分重要的意义。

Acr蛋白是噬菌体为了对抗原核生物CRISPR-Cas系统进化出来的一种策略，即通过编码蛋白质(即Acr蛋白)来失活原核生物的CRISPR-Cas系统。研究发现Acr蛋白广泛分布于噬菌体、原噬菌体以及侵入性遗传元件中，它们的分子量一般较小，约50-200氨基酸，并且展现出高度的序列多样性。迄今为止，88种不同类型的Acr蛋白家族已被鉴定出来，能够广泛抑制I、II、III、V和VI型CRISPR-Cas系统。由于Acr蛋白种类繁多，并展现出高度的序列多样性，因此很难通过常规的序列同源性比对方法来进行寻找。科学家已经利用多种生物信息以及生物化学等方法来寻找并确认Acr蛋白，包括基于Guilt-by-association、Self-targeting、Machine-learning的生物信息学方法，以及通过Phage-first和High-throughput的生物化学方法。值得注意的是，已经通过多种方法发现了23种AcrIIA家族。目前，只有一小部分AcrIIA蛋白的分子机制被详细地阐明。研究显示这些AcrIIA蛋白主要抑制CRISPR-Cas9免疫的第三个阶段——干扰阶段，并可粗略地分为三种策略：(1)干扰Cas与crRNA的装载，如AcrIIA15；(2)阻止Cas效应复合物与靶向核酸的结合，如AcrIIA4；(3)阻止Cas对靶向核酸的切割，如AcrIIA14。鉴于Acr蛋白能够通过不同的策略抑制CRISPR-Cas9系统，并以此开发相应的基因编辑调控工具，Acr分子机制的研究已成为基因编辑领域的研究热点。

目前这些CRISPR-Cas系统的部分Acr蛋白被鉴定出来，科学家们认为仍有广泛的Acr蛋白应存在并且未被发现。这不仅阻碍我们理解噬菌体与宿主之间的进化竞争方式，也妨碍发展新型的基于Acr的基因编辑方法。特别是考虑到Cas9的脱靶效应，发展Acr蛋白作为有效的基因编辑工具来调控Cas9的活性以解决Cas9应用的安全性问题将特别吸引人。然而在基因编辑领域，可用的Acr蛋白和利用Acr来调控Cas9活性的策略仍然有限。因此发现新型的CRISPR-Cas9抑制蛋白并改造Acr蛋白应用于可控的基因编辑的方法对于基因编辑领域有着重要的意义。

发明内容

本发明的目的在于发现新的CRISPR-Cas9抑制蛋白，并据此建立可控的基因编辑的方法。

本发明首先保护AcrIIA蛋白在细菌、细胞或真核生物中抑制Cas9基因编辑、调控和/或成像中的应用；

所述AcrIIA蛋白可为AcrIIA24蛋白、AcrIIA25蛋白、AcrIIA25.1蛋白、AcrIIA26蛋白、AcrIIA27蛋白、AcrIIA28蛋白、AcrIIA29蛋白、AcrIIA30蛋白、AcrIIA31蛋白、AcrIIA31.1蛋白、AcrIIA32蛋白或AcrIIA32.1；

所述AcrIIA24蛋白可为如下a1)或a2)或a3)或a4)：

a1)氨基酸序列是SEQ ID NO:1所示的蛋白质；

a2)在SEQ ID NO:1所示的蛋白质的N端或/和C端连接标签得到的融合蛋白质；

a3)将a1)或a2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的且具有抑制Cas9蛋白活性功能的蛋白质；

a4)与SEQ ID NO:1限定的氨基酸序列具有60％或60％以上同源性，且具有抑制Cas9蛋白活性功能的蛋白质；

所述AcrIIA25蛋白可为如下b1)或b2)或b3)或b4)：

b1)氨基酸序列是SEQ ID NO:2所示的蛋白质；

b2)在SEQ ID NO:2所示的蛋白质的N端或/和C端连接标签得到的融合蛋白质；

b3)将b1)或b2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的且具有抑制Cas9蛋白活性功能的蛋白质；

b4)与SEQ ID NO:2限定的氨基酸序列具有60％或60％以上同源性，且具有抑制Cas9蛋白活性功能的蛋白质；

所述AcrIIA25.1蛋白可为如下c1)或c2)或c3)或c4)：

c1)氨基酸序列是SEQ ID NO:3所示的蛋白质；

c2)在SEQ ID NO:3所示的蛋白质的N端或/和C端连接标签得到的融合蛋白质；

c3)将c1)或c2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的且具有抑制Cas9蛋白活性功能的蛋白质；

c4)与SEQ ID NO:3限定的氨基酸序列具有60％或60％以上同源性，且具有抑制Cas9蛋白活性功能的蛋白质；

所述AcrIIA26蛋白可为如下d1)或d2)或d3)或d4)：

d1)氨基酸序列是SEQ ID NO:4所示的蛋白质；

d2)在SEQ ID NO:4所示的蛋白质的N端或/和C端连接标签得到的融合蛋白质；

d3)将d1)或d2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的且具有抑制Cas9蛋白活性功能的蛋白质；

d4)与SEQ ID NO:4限定的氨基酸序列具有60％或60％以上同源性，且具有抑制Cas9蛋白活性功能的蛋白质；

所述AcrIIA27蛋白可为如下e1)或e2)或e3)或e4)：

e1)氨基酸序列是SEQ ID NO:5所示的蛋白质；

e2)在SEQ ID NO:5所示的蛋白质的N端或/和C端连接标签得到的融合蛋白质；

e3)将e1)或e2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的且具有抑制Cas9蛋白活性功能的蛋白质；

e4)与SEQ ID NO:5限定的氨基酸序列具有60％或60％以上同源性，且具有抑制Cas9蛋白活性功能的蛋白质；

所述AcrIIA28蛋白可为如下f1)或f2)或f3)或f4)：

f1)氨基酸序列是SEQ ID NO:6所示的蛋白质；

f2)在SEQ ID NO:6所示的蛋白质的N端或/和C端连接标签得到的融合蛋白质；

f3)将f1)或f2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的且具有抑制Cas9蛋白活性功能的蛋白质；

f4)与SEQ ID NO:6限定的氨基酸序列具有60％或60％以上同源性，且具有抑制Cas9蛋白活性功能的蛋白质；

所述AcrIIA29蛋白可为如下g1)或g2)或g3)或g4)：

g1)氨基酸序列是SEQ ID NO:7所示的蛋白质；

g2)在SEQ ID NO:7所示的蛋白质的N端或/和C端连接标签得到的融合蛋白质；

g3)将g1)或g2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的且具有抑制Cas9蛋白活性功能的蛋白质；

g4)与SEQ ID NO:7限定的氨基酸序列具有60％或60％以上同源性，且具有抑制Cas9蛋白活性功能的蛋白质；

所述AcrIIA30蛋白可为如下h1)或h2)或h3)或h4)：

h1)氨基酸序列是SEQ ID NO:8所示的蛋白质；

h2)在SEQ ID NO:8所示的蛋白质的N端或/和C端连接标签得到的融合蛋白质；

h3)将h1)或h2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的且具有抑制Cas9蛋白活性功能的蛋白质；

h4)与SEQ ID NO:8限定的氨基酸序列具有60％或60％以上同源性，且具有抑制Cas9蛋白活性功能的蛋白质；

所述AcrIIA31蛋白可为如下i1)或i2)或i3)或i4)：

i1)氨基酸序列是SEQ ID NO:9所示的蛋白质；

i2)在SEQ ID NO:9所示的蛋白质的N端或/和C端连接标签得到的融合蛋白质；

i3)将i1)或i2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的且具有抑制Cas9蛋白活性功能的蛋白质；

i4)与SEQ ID NO:9限定的氨基酸序列具有60％或60％以上同源性，且具有抑制Cas9蛋白活性功能的蛋白质；

所述AcrIIA31.1蛋白可为如下j1)或j2)或j3)或j4)：

j1)氨基酸序列是SEQ ID NO:10所示的蛋白质；

j2)在SEQ ID NO:10所示的蛋白质的N端或/和C端连接标签得到的融合蛋白质；

j3)将j1)或j2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的且具有抑制Cas9蛋白活性功能的蛋白质；

j4)与SEQ ID NO:10限定的氨基酸序列具有60％或60％以上同源性，且具有抑制Cas9蛋白活性功能的蛋白质；

所述AcrIIA32蛋白可为如下k1)或k2)或k3)或k4)：

k1)氨基酸序列是SEQ ID NO:11所示的蛋白质；

k2)在SEQ ID NO:11所示的蛋白质的N端或/和C端连接标签得到的融合蛋白质；

k3)将k1)或k2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的且具有抑制Cas9蛋白活性功能的蛋白质；

k4)与SEQ ID NO:11限定的氨基酸序列具有60％或60％以上同源性，且具有抑制Cas9蛋白活性功能的蛋白质；

所述AcrIIA32.1蛋白可为如下l1)或l2)或l3)或l4)：

l1)氨基酸序列是SEQ ID NO:12所示的蛋白质；

l2)在SEQ ID NO:12所示的蛋白质的N端或/和C端连接标签得到的融合蛋白质；

l3)将l1)或l2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的且具有抑制Cas9蛋白活性功能的蛋白质；

l4)与SEQ ID NO:12限定的氨基酸序列具有60％或60％以上同源性，且具有抑制Cas9蛋白活性功能的蛋白质。

其中，SEQ ID NO:1由104个氨基酸残基组成。SEQ ID NO:2由96个氨基酸残基组成。SEQ ID NO:3由101个氨基酸残基组成。SEQ ID NO:4由183个氨基酸残基组成。SEQ IDNO:5由79个氨基酸残基组成。SEQ ID NO:6由88个氨基酸残基组成。SEQ ID NO:7由241个氨基酸残基组成。SEQ ID NO:8由73个氨基酸残基组成。SEQ ID NO:9由69个氨基酸残基组成。SEQ ID NO:10由125个氨基酸残基组成。SEQ ID NO:11由141个氨基酸残基组成。SEQ IDNO:12由95个氨基酸残基组成。

为了使a1)、b1)、c1)、d1)、e1)、f1)、g1)、h1)、i1)、j 1)、k1)或l1)中的蛋白质便于纯化，可分别在SEQ ID NO:1-SEQ ID NO:12所示的蛋白质的氨基末端或羧基末端连接上如表1所示的标签。

表1.标签的序列

标签	残基	序列
			Poly-Arg	5-6(通常为5个)	RRRRR
FLAG	8	DYKDDDDK
			Strep-tag II	8	WSHPQFEK
c-myc	10	EQKLISEEDL

上述a3)、b3)、c3)、d3)、e3)、f3)、g3)、h3)、i3)、j3)、k3)或l3)中的蛋白质，所述一个或几个氨基酸残基的取代和/或缺失和/或添加为不超过10个氨基酸残基的取代和/或缺失和/或添加。

上述a3)、b3)、c3)、d3)、e3)、f3)、g3)、h3)、i3)、j3)、k3)或l3)中的蛋白质可人工合成，也可先合成其编码基因，再进行生物表达得到。

上述a3)、b3)、c3)、d3)、e3)、f3)、g3)、h3)、i3)、j3)、k3)或l3)中的蛋白质的编码基因可通过将编码蛋白质的DNA序列中缺失一个或几个氨基酸残基的密码子，和/或进行一个或几个碱基对的错义突变，和/或在其5′端和/或3′端连上表1所示的标签的编码序列得到。

这里使用的术语“同源性”指与天然氨基酸序列的序列相似性。“同源性”包括与本发明的SEQ ID NO:1—SEQ ID NO:12所示的氨基酸序列具有60％或更高，或65％或更高，或70％或更高，或75％或更高，或80％或更高，或85％或更高，或90％或更高，或95％或更高同源性的氨基酸序列。同源性可以用计算机软件(序列比对软件如BLAST)进行评价。使用计算机软件，两个或多个序列之间的同一性可以用百分比(％)表示，其可以用来评价相关序列之间的同一性。

上述任一所述AcrIIA蛋白在抑制Cas9蛋白活性中的应用也属于本发明的保护范围。

上述应用中，所述抑制Cas9蛋白活性可表现为抑制Cas9蛋白与DNA结合和/或抑制Cas9蛋白对底物DNA的切割活性。

本发明还保护一种化学诱导型iAcr的系统；该系统采用所述AcrIIA25.1和/或所述AcrIIA32.1作为化学诱导型anti-CRISPR的蛋白。

上述系统中，采用所述AcrIIA25.1作为化学诱导型anti-CRISPR的蛋白具体可采用表4中的iA25.1(Intein-AcrIIA25.1(S76))进行。

上述系统中，采用所述AcrIIA32.1作为化学诱导型anti-CRISPR的蛋白具体可采用表4中的iA32.1(Intein-AcrIIA32.1(T40))进行。

上述任一所述系统均依赖4-羟基三苯氧胺调节。

上述任一所述系统在实现化学可控的的基因编辑中的应用也属于本发明的保护范围。

本发明还保护一种化学可控的基因编辑的方法；所述方法采用上述任一所述化学诱导型iAcr的系统进行基因编辑。

所述方法可依赖4-羟基三苯氧胺调节。

上述任一所述AcrIIA蛋白在制备化学诱导型iAcr的系统中的应用也属于本发明的保护范围。

上述任一所述AcrIIA蛋白在进行化学可控的基因编辑中的应用也属于本发明的保护范围。

上述任一所述应用中，所述AcrIIA蛋白具体可为所述AcrIIA25.1、所述AcrIIA32.1、表4中的iA25.1(Intein-AcrIIA25.1(S76))或iA32.1(Intein-AcrIIA32.1(T40))。

本申请的发明人通过guilt-by-association方法，以广泛分布的AcrIIA6作为起始标志物，在Streptococcus(链球菌)移动原件中发现了广泛分布的九种新型的II-A型Acr蛋白(AcrIIA24-32)和三个Aca(Acr-associated)(Aca11-13)蛋白家族。研究发现AcrIIA24-32是链球菌CRISPR-Cas9系统的特异性抑制剂，可在细菌和人类细胞中有效抑制II-A型Cas9蛋白，包括SpyCas9、Streptococcus thermophilus(嗜热链球菌)Cas9(CR1/St1Cas9 and CR3/St3Cas9)。在这些Acrs中，AcrIIA26、AcrIIA27、AcrIIA30和AcrIIA31强烈阻断Cas9与DNA的结合，而AcrIIA24阻止Cas9的DNA切割活性。值得注意的是，AcrIIA25.1和AcrIIA32.1可抑制SpyCas9的DNA结合和DNA裂解活性，显示出新颖而独特的抑制机制。本申请的发明人还开发了基于AcrIIA25.1和AcrIIA32.1的多种化学诱导型iAcr(inducibleanti-CRISPR)系统，是由Acr蛋白和4-羟基三苯氧胺(4-HT，4-hydroxytamoxifen)反应性内含肽(intein)组成的融合体。iAcr系统能够在人类细胞中有效的“翻译后”控制CRISPR-Cas9介导的基因编辑活性，显示出了强大的应用前景。本申请扩展了II-A型Acr蛋白，Acr抑制机制的多样性，以及基于Acr的化学可控基因编辑方法。本发明具有重要的应用价值。

附图说明

图1为九种新型AcrIIA蛋白家族(AcrIIA24-32)的鉴定。(A)链球菌噬菌体和原噬菌体基因组中候选acr、aca和相邻基因示意图。Acr基因以数字显示在深色阅读框中。箭头表示acr基因座之间蛋白序列同源性关系(以百分比所示)。Aca基因显示在白色阅读框内。其他相邻基因以灰色显示，一些已知基因结构信息(如AP2 DNA结合结构域)根据NCBI网站进行注释。星号(***)表示在大肠杆菌质粒干涉实验中检测的基因。(B)用于大肠杆菌中Acr活性分析设计的质粒和大肠杆菌质粒干涉实验示意图。Cas9，Acr以及pT质粒携带可兼容的复制子和抗性基因。AmpR，氨苄青霉素抗性；KanR，卡那霉素抗性；ChlR，氯霉素抗性。(C)柱状图显示Acr抑制Cas9直系同源蛋白(SpyCas9、St1Cas9和St3Cas9)的效率。#表示低于检测标准。n＝3。值显示为平均值±SEM。

图2为AcrIIA24-32同源蛋白的分布。AcrIIA24-32同源蛋白(A-I)的最小进化系统发育树，蛋白质序列通过BLASTp搜索确定。本研究中所分析的Acr蛋白标记在物种的后面。

图3为AcrIIA24-32是链球菌CRISPR-Cas9系统特异性的抑制蛋白。A为噬菌斑测定实验示意图。调查AcrIIA24-32是否对多种II-A、II-B、II-C型Cas9同源蛋白具有广谱的抑制活性。大肠杆菌携带质粒表达Cas9、sgRNA和Acr，随后使用T4噬菌体进行侵染。T4噬菌体基因23设计被多种Cas9同源蛋白靶向(由菌株名称缩写)。B为噬菌斑测定实验使用10倍连续稀释的T4噬菌体(黑色圆圈)来评估不同Acr蛋白对不同类型Cas9直系同源蛋白的抑制作用，包括II-A型(SpyCas9，St1Cas9，St3Cas9和SaCas9)，II-B型(FnCas9)和II-C型(NmeCas9)CRISPR-Cas9系统。

图4为AcrIIA24-32可在体外抑制II-A型Cas9同源蛋白。A为DNA切割实验示意图。在存在或者不存在Acr的情况下，Cas9 RNP复合物靶向DNA底物。B-D为在存在或者不存在Acr的情况下，使用SpyCas9(B)、St3Cas9(C)和St1Cas9(D)RNP复合物靶向线性化的质粒DNA。空心箭头表示未切割的线性化质粒DNA。实心箭头表示切割产物。凝胶图像代表三次独立的重复。

图5为AcrIIA24-32可以在人类细胞中抑制Cas9介导的基因编辑。A为T7E1实验示意图，用于检验Acr在HEK293T细胞中对Cas9蛋白的抑制活性。将编码Cas9、sgRNA和Acr的质粒共转染进人类细胞，随后通过T7E1实验进行分析。(B-G)为T7E1实验代表性凝胶图像，以显示Acrs对SpyCas9(B)、St3Cas9(D)和St1Cas9(F)的抑制活性。人类基因AAVS1(SpyCas9靶向)和DYRK1A(St1Cas9和St3Cas9靶向)的靶位点显示在每个凝胶图像的顶部，PAM以下划线突出显示。Acr的亚型和序号显示在胶图上方；A,AcrIIA；C,AcrIIC。空心箭头表示T7E1未消化条带(未编辑)。实心箭头表示T7E1消化的条带(已编辑)。编辑效率以“indel(％)”显示在每个泳道的底部。在不同Acrs存在下，定量SpyCas9(C)、St3Cas9(E)和St1Cas9(G)介导的基因编辑效率。n＝3，值显示平均值±SEM。

图6为Acrs在人类细胞中采用多种策略失活Cas9。A为设计用于人类端粒定位荧光成像的质粒示意图，以研究Acrs对II-A型Cas9直系同源蛋白的抑制策略。将编码Cas9荧光蛋白的质粒、它们各自靶向端粒的sgRNA质粒和Acr蛋白的质粒(用蓝色荧光蛋白TagBFP标记)共转染进U20S细胞系。S**_(d)Cas9-(mCherry)₃代表本实验中使用的三种质粒，包括Spy_dCas9-(mCherry)₃、St1_dCas9-(mCherry)₃和St3_dCas9-(mCherry)₃。B为U2OS细胞中Cas9同源蛋白(Nme、Spy、St1和St3)靶向人类端粒的序列。C为Nme_dCas9-(sfGFP)₃、Spy_dCas9-(mCherry)₃和Acr质粒共转染的U2OS细胞的代表性图像。荧光通道显示在图的顶部，不同的Acr蛋白显示在每行的右侧。比例尺代表10μm。D为在存在不同Acr蛋白的情况下，对Spy_dCas9-(mCherry)₃形成的端粒点的细胞进行定量。方法是通过具有Nme_dCas9-(sfGFP)₃和Spy_dCas9-(mCherry)₃共定位端粒成像细胞的百分比来计算。n＝在每种条件下评分的细胞数。E-H为转染St3_dCas9-(mCherry)₃(E)或St1_dCas9-(mCherry)₃(G)以及Nme_dCas9-(sfGFP)₃和不同的Acr质粒后U2OS细胞的代表性图像。比例尺代表10μm。使用与D中相同的方法在每种条件下定量St3_dCas9-(mCherry)₃(F)和St1_dCas9-(mCherry)₃(H)形成端粒点的细胞比例。

图7为Acrs对Cas9-sgRNA RNP复合物的形成没有影响。A和B为EMSA实验以检测AcrIIA25.1、AcrIIA26、AcrIIA27、AcrIIA28和AcrIIA32.1对SpyCas9-sgRNA RNP复合物形成的影响。该测定在非变性聚丙烯酰胺凝胶上进行分析，sgRNA由SYBR gold染色。不同反应成分(Acrs、SpyCas9和sgRNA)添加的顺序显示在虚线框上方。C为在加入sgRNA之前或之后加入AcrIIA24时，进行EMSA测定以分析AcrIIA24蛋白对St3Cas9与sgRNA结合的影响。D为在存在或不存在AcrIIA30或AcrIIA31的情况下，利用EMSA实验检测St1Cas9与sgRNA的结合情况。

图8为在体外Acrs表现出多种作用机制来抑制Cas9。A-F为在添加目标DNA之前或之后添加Acrs至反应体系进行EMSA实验，以分析不同Acr蛋白对Cas9 RNP与DNA结合的影响，包括AcrIIA25.1(A)、AcrIIA26(B)、AcrIIA27(C)、AcrIIA32.1(D)、AcrIIA24(E)、AcrIIA30、AcrIIA31(F)、Cas9 RNP(256nM)和Acr梯度(0.125、0.25、0.5、0.1、0.2、0.4、0.8和1.6μM)。实验在非变性凝胶上进行，并且靶向DNA被Cy5所标记。实验进行了三次独立的重复，并选择代表性的图片展示。G为通过在EMSA中添加额外的Mg²⁺来恢复Cas9对DNA的切割活性来进行DNA切割实验。RT，室温。H和I为进行DNA切割实验以分析Acrs在G所示的不同条件下对Cas9切割DNA活性的影响。SpyCas9 RNP(500nM)、St1Cas9 RNP(500nM)、Acrs(10μM)和底物DNA(50nM)(非目标链由Cy3标记)。实验重复3次，并显示了代表性凝胶图。J为总结本研究中鉴定的anti-CRISPR蛋白的不同抑制机制。AcrIIA26、AcrIIA27、AcrIIA30和AcrIIA31阻断Cas9与DNA的结合，而AcrIIA24抑制Cas9的DNA切割活性。值得注意的是，AcrIIA25.1和AcrIIA32.1可以同时抑制Cas9的DNA结合和DNA切割活性。

图9为Acrs抑制St3Cas9的多种机制。进行DNA切割测定以分析AcrIIA24、AcrIIA25和AcrIIA32.1在不同条件下对St3Cas9切割DNA活性的影响，如图8中G所示。St3Cas9 RNP(500nM)、Acrs(10μM)和底物DNA(50nM)(目标链由Cy5标记)。实验重复3次，并显示了代表性凝胶图。

图10为化学诱导型iAcr(inducible anti-CRISPR)系统的建立以实现化学可控的基因编辑。A为iAcr系统示意图。将配体依赖性内含肽插入Acr蛋白会使Acr失活。4-HT的结合可触发内含肽蛋白自剪接并恢复Acr活性以抑制Cas9。B为BFP-to-GFP报告系统的示意图，使用引导编辑以检查人类细胞中内含肽-Acr杂交体对Cas9的抑制活性。在存在或不存在4-HT(1μM)的情况下，将具有染色体整合BFP的HEK293T细胞(HEK293T-BFP细胞)用编码引导编辑器、靶向BFP的pegRNA和内含肽-Acr杂交体的质粒转染。在转染72小时后通过流式细胞术计算GFP阳性细胞的百分比。PE可以通过将CC替换为GT导致单个H66Y氨基酸替换，从而将BFP转换为GFP。目标序列和PAM序列分别以阴影和下划线显示。C为不同条件下BFP转换为GFP效率的比较。内含肽-Acr变体通过被intein替换的残基来识别。野生型Acrs包括C1(AcrIIC1)、A4(AcrIIA4)、A5(AcrIIA5)、A25.1(AcrIIA25.1)和A32.1(AcrIIA32.1)用作对照。n＝3，值显示平均值±SEM。。D为T7E1测定的代表性凝胶图像，以显示Acr和iAcr蛋白在存在或不存在4-HT的情况下对SpyCas9的抑制活性。HEK293T细胞用Cas9(1μg)、sgRNA(0.5μg)和Acr(0.5或0.25μg)质粒转染。靶向序列显示在每个凝胶图像的顶部，PAM以下划线突出显示。编辑效率以“indel(％)”显示在每个泳道的底部。E和F为T7E1测定的代表性凝胶图像，用于研究Acr和iAcr蛋白在存在或不存在4-HT的情况下对SpyCas9(E)或St3Cas9(F)的抑制活性。HEK293T细胞用Cas9(1μg)、sgRNA(0.5μg)和Acr(0.25μg)质粒转染。人类EMX1(由SpyCas9靶向)和DYRK1A(由St3Cas9靶向)的靶向序列显示在每个凝胶的顶部，PAM以下划线突出显示。编辑效率以“indel(％)”显示在每个泳道的底部。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述，给出的实施例仅为了阐明本发明，而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南，并不以任何方式构成对本发明的限制。

下述实施例中的实验方法，如无特殊说明，均为常规方法，按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

下述实施例中Acr蛋白和Aca蛋白的名称、NCBI登录号以及氨基酸序列见表2。

表2

实施例

一、材料与方法

1、微生物

大肠杆菌菌株(TOP10或Mach1-T1，Biomed)用于质粒扩增和质粒干涉实验。大肠杆菌菌株(T7 Express，Biomed)用于蛋白质表达和噬菌斑测定分析。大肠杆菌通常(除非另有说明)在溶原性肉汤(LB)培养基中于37℃培养，含有适当的抗生素(需要时)：氨苄青霉素(50μg/ml)、卡那霉素(50μg/ml)或氯霉素(25μg/ml)。

2、细胞系

HEK293T和HEK293T-BFP细胞在含10％(vol/vol)胎牛血清(FBS，Gibco)的DMEM培养基(Gibco)中置于37℃、5％CO₂培养箱中培养。

U2OS细胞在含10％FBS的McCoy's 5A(改良)培养基(Gibco)中置于37℃、5％CO₂培养箱中培养。

3、生物信息学分析

BLASTp程序用于在非冗余蛋白质数据库中搜索AcrIIA6(登录号：AVO22749.1)同源蛋白，以手动检查来自相邻候选基因是否是可能的acr基因和aca基因。MPI生物信息学工具包的HHpred用于从相邻基因中识别DNA结合域，其中筛选了aca候选者。使用aca基因进行BLASTp搜索以筛选acr候选基因，并通过生化分析进一步验证。

对于Acr蛋白质的同源蛋白分布以及系统发育分析，使用非冗余蛋白质数据库通过BLASTp程序获得Acrs的同源蛋白质序列。确定具有高同源性的序列(E值<0.001，查询覆盖率>70％)，使用快速最小进化树方法、0.85最大序列差异和Grishin(蛋白质)距离模型生成距离树。

4、大肠杆菌中的质粒干涉实验

编码Acr蛋白的DNA序列由博迈德合成并连接到pBAD24载体中。使用CaCl₂热休克程序将质粒转化到大肠杆菌中。简而言之，携带Acr质粒的大肠杆菌TOP10或Mach1-T1菌株在含有0.2％阿拉伯糖的LB培养基中培养过夜，然后作为感受态细胞。随后用25ng pT和25ng Cas9质粒(具有匹配的间隔区或错配的间隔区)进行转化。在含有0.2％阿拉伯糖的LB培养基中恢复2小时后，将细胞接种在含50μg/ml氨苄青霉素、50μg/ml卡那霉素、25μg/ml氯霉素、1mM IPTG和0.2％阿拉伯糖的LB琼脂板，37℃孵育24-32小时。使用凝胶扫描仪(Tanon3500)拍摄克隆并通过ImageJ软件计数。每个Acr的抑制活性通过靶向pT和非靶向pT的Cas9质粒之间的转化比率来计算。

5、噬菌斑测定实验

大肠杆菌(T7 Express，Biomed)细胞与表达靶向噬菌体T4的Cas9-sgRNA的质粒和编码Acr蛋白的兼容质粒共转化。用于非靶向噬菌体T4的Cas9质粒和空pBAD24质粒(无Acr)均用作对照。将含有Acr和Cas9质粒的大肠杆菌在含50μg/ml氨苄青霉素和25μg/ml氯霉素的LB培养基中培养，并在37℃下生长过夜。第二天早上，将过夜培养物接种在含有抗生素的新鲜LB培养基中，并在37℃下生长两小时。随后，加入1mM IPTG以诱导Cas9蛋白的表达。两小时后，加入0.2％阿拉伯糖诱导Acr蛋白表达。再过两小时后，将200μl培养物与4ml融化的LB-琼脂(0.7％，补充10mM MgSO₄)混合，倒在含有10mM MgSO₄和0.2％阿拉伯糖的固体LB-琼脂(1.5％，包含1mM IPTG、50μg/ml氨苄青霉素和25μg/ml氯霉素)平板上。接下来，将噬菌体T4的10倍稀释液点在培养皿的表面。将培养板在37℃孵育过夜并使用凝胶扫描仪(Tanon3500)拍照。

6、蛋白质表达和纯化

将编码St1Cas9、St3Cas9或Acr蛋白的DNA序列整合到pET28a载体中，用于在大肠杆菌中表达蛋白(T7 Express，Biomed)。在含1mM IPTG和50μg/ml卡那霉素的LB培养基中常规诱导大肠杆菌细胞表达蛋白质，18℃下培养16小时。收获细胞并重悬于含1mM PMSF和溶菌酶的裂解缓冲液(50mM Tris-HCl，pH 8.0、10mM咪唑、0.5mM TCEP-NaOH和500mM NaCl)中。超声和离心后，细胞上清液与Ni-NTA琼脂糖(QIAGEN)结合，结合的蛋白质用500mM咪唑洗脱。Amicon Ultra离心过滤器(Millipore)用于浓缩蛋白质并将缓冲液交换到储存缓冲液(20mM HEPES-NaOH，pH 7.5、5％(v/v)甘油、300mM NaCl和1mM DTT)。对于Acr蛋白，在4℃下与烟草蚀刻病毒(TEV)蛋白酶孵育过夜后，进行第二轮Ni-NTA纯化以分离未标记的Acr蛋白。

7、体外DNA切割实验

底物DNA的名称和核苷酸序列见表3。

表3

注：*表示荧光素。

根据制造商的手册，使用体外T7转录试剂盒(Invitrogen)制备测定中的所有sgRNA，并使用线性化sgRNA质粒生成转录模板。SpyCas9蛋白购自Invitrogen。对于图4，构建了质粒pC002，并通过限制性内切核酸酶NotI(NEB)进一步线性化。使用NEBuffer3.1以及Cas9蛋白(500nM)、sgRNA(500nM)、靶DNA底物(30ng/μl)和过量的Acr蛋白(10μM)以10μl的总体积进行切割反应。Cas9蛋白在37℃下与sgRNA复合10分钟。然后加入Acr蛋白并在室温下再孵育20分钟。加入目标DNA并在37℃下孵育10分钟。加入1μl蛋白酶K(PK)终止反应。在1％琼脂糖/1×TAE(Tris-醋酸盐-EDTA)凝胶上分析产物。

对于图8和图9，荧光标记的底物DNA用于切割测定，是通过将用Cy5或Cy3标记的目标链和非目标链的合成寡核苷酸退火制备的。裂解测定的过程如图9中G所示。简而言之，将Cas9蛋白(500nM)、和sgRNA(500nM)于37℃混合10分钟以形成Cas9 RNP复合物，反应体系使用1×结合缓冲液(150mM KCl、5mM EDTA、5mM MgCl₂、1mM DTT、5％(v/v)甘油、50μg/ml肝素、0.01％Tween 20和100μg/ml BSA、pH 7.6的20mM Tris-HCl)以消除Cas9的裂解活性。然后，以不同的顺序加入Acr蛋白(10μM)和底物DNA(50nM)，并分别在室温下孵育20分钟。随后，加入MgCl₂(10mM)以恢复Cas9的DNA切割活性，然后在室温下再孵育20分钟。通过添加Gel Loading Buffer II(Invitrogen)停止反应并在85℃下孵育6分钟。在12％变性PAGE凝胶上分析产物并通过Typhoon 7000(GE)进行观察。

8、内含肽-Acr(Intein-Acr)质粒的构建

将编码Acr蛋白(AcrIIA4、AcrIIA5、AcrIIA25.1或AcrIIA32.1)的DNA序列克隆至pCDNA3.1载体中以在人类细胞中表达。

合成内含肽37R3-2序列并将其插入Acr蛋白的所述位置，构建内含肽-Acr质粒。

内含肽-Acr质粒表达intein-Acr变体。intein-Acr变体的名称和氨基酸序列见表4。

表4

/>

注：单下划线为内含肽37R3-2，双下划线为Acr。

9、T7核酸内切酶I(T7E1)检测

AAVS1、EMX1和DYRK1A基因座中的靶序列和PCR扩增的引物序列见表5。对于图5，根据制造商的方案，使用Lipofectamine LTX试剂(Invitrogen)转染24孔板中培养的HEK293T细胞，每孔用1μg Cas9质粒、0.5μg sgRNA质粒和0.5μg Acr质粒。对于图10，HEK293T细胞用1μg Cas9质粒、0.5μg sgRNA质粒、0.5或0.25μg Acr(iAcr)质粒在24孔板中转染，存在或不存在4-HT(1μM，Selleck S7827)处理。转染72小时后，使用DNeasy Blood and Tissue kit(QIAGEN)提取细胞的基因组DNA，并使用Q5 High-Fidelity 2X Master Mix(NEB)进行PCR扩增。在加入T7核酸内切酶I(NEB)之前，将与NEBuffer 2混合的PCR产物进行变性和退火，并在37℃下孵育。在3％琼脂糖/1×TAE凝胶中分离样品。使用ImageJ软件量化条带。

哺乳动物细胞基因组编辑效率的计算公式如下：

表5.T7E1检测中使用的引物和目标序列

10、人类细胞端粒荧光成像

对于成像，U2OS细胞在24孔板中的15mm玻璃底(Electron Microscopy Sciences)上培养。使用Lipofectamine LTX试剂(Invitrogen)根据制造商手册进行细胞转染，使用60ng每种dCas9质粒、300ng每种sgRNA质粒和300ng Acr质粒。转染24小时后，用4％多聚甲醛(Beyotime)固定细胞，并使用尼康A1R+共聚焦显微镜和60×油性物镜观察并成像。

细胞定量由一名实验者通过标记数字对来自每个条件的细胞进行编码。而另一位不知道这些条件的实验者在显微镜下观察并评分细胞。对于定量，只有同时表达TagBFP和mCherry荧光以及Nme_dCas9-(sfGFP)₃形成绿色端粒点的细胞中评估是否存在或不存在共定位S**_(d)Cas9-(mCherry)₃红色端粒点的情况。

11、凝胶迁移实验(electrophoretic mobility shift assays，EMSA)

RNA EMSA通过在存在或不存在Acrs(5μM)的情况下以图例中所示的顺序孵育Cas9蛋白(256nM)和sgRNA(256nM)来进行。反应在1×结合缓冲液(150mM KCl、5mM EDTA、5mMMgCl₂、1mM DTT、5％(v/v)甘油、50μg/ml肝素、0.01％Tween 20、100μg/ml BSA和pH7.6的20mM Tris-HCl)中进行。sgRNAs和Acr蛋白以不同的顺序加入，并分别在37℃下孵育10分钟。在6％Tris-borate-EDTA(TBE)聚丙烯酰胺凝胶上分析样品，并使用Typhoon 7000(GE)SYBRGold(Invitrogen)染色进行可视化。

发明人进行了DNA EMSA，简而言之，将Cas9-sgRNA复合物在1×结合缓冲液中37℃孵育10分钟，浓度如图中图例所示。随后，加入不同浓度的Acr蛋白并在室温下孵育20分钟，然后将20nM荧光标记的底物DNA(Cy5标记的目标链)加入混合物中，然后在37℃下孵育10分钟。在平行实验中，加入荧光标记的底物DNA并在37℃下孵育10分钟，然后加入不同浓度的Acr蛋白并在室温下孵育20分钟。样品通过双相聚丙烯酰胺(凝胶上半部为6％，凝胶下半部为12％)/0.5×TBE凝胶电泳分析。凝胶由Typhoon 7000(GE)可视化。所有测定均一式三份进行。

12、HEK293T-BFP细胞中PE介导的BFP-to-GFP基因编辑

首先，发明人在HEK293T细胞中的AAVS1基因座整合了BFP表达基因，构建了HEK293T-BFP细胞系。简而言之，HEK293T细胞用Cas9、AAVS1靶向的sgRNA质粒和供体载体转染，该载体包含同源序列和带有BFP和嘌呤霉素抗性基因。HEK293T-BFP细胞通过嘌呤霉素(2μg/ml)处理和流式细胞术(FACSAriaIII，BD)选择。

为了检查人类细胞中内含肽-Acr杂交体对Cas9的抑制活性，在HEK293T-BFP细胞中进行了PE介导的BFP-to-GFP基因编辑。编码prime editor-PE2的质粒购自Addgene(#132775)。BFP-targeting pegRNA质粒是通过合成含有靶标、sgRNA支架、PBS和RT模板的DNA序列构建的，并整合到U6-sgRNA载体中。HEK293T-BFP细胞在24孔板中培养，然后使用Lipofectamine LTX试剂(Invitrogen)每孔转染PE2(1μg)、BFP靶向的pegRNA(0.5μg)和Acr(0.25μg)质粒，存在或者不存在4-HT(1μM，Selleck S7827)。

二、实验结果

1、九种新型II-A型Acr(AcrIIA24-32)蛋白家族的发现

通过guilt-by-association原理，即Acr基因附近往往存在一个关联基因(Acr-associated gene，Aca)，其编码的蛋白具备helix-turn-helix(HTH)保守结构域用以调节Acr的活性。利用BLAST程序对AcrIIA6(accession:AVO22749.1)进行信息检索(见图1中A)。结合Acr蛋白氨基酸序列大小(一般50-200个氨基酸)，是否存在于噬菌体/原噬菌体区域等其他特点，建立了Acr候选基因。另外，利用大肠杆菌质粒干涉实验，设计了针对SpyCas9、St1Cas9和St3Cas9系统的Acr蛋白的筛选体系(见图1中B)，快速准确鉴定候选的Acr蛋白。实验方法是将编码Cas9蛋白的基因克隆到具有gRNA的细菌表达质粒中，用作大肠杆菌中的外源CRISPR-Cas9系统。另将编码候选Acr蛋白的基因克隆到兼容的细菌表达质粒中，作为以供检测的外源anti-CRISPR系统。还构建了一个靶向质粒(命名为pT)，该质粒可被外源CRISPR-Cas9系统识别并靶向。通过计算pT质粒在拥有外源Cas9以及候选Acr质粒的大肠杆菌的转化效率来鉴定Acr能否抑制Cas9蛋白。

通过大肠杆菌质粒干涉实验进行筛选，从Streptococcus(链球菌)的移动元件中发现了九种新型的II-A型Acr(AcrIIA24-32)蛋白家族和三个aca蛋白(见图1中A和B)。在检验的11个Acr蛋白(增加了两个Acr同源蛋白：AcrIIA25.1和AcrIIA32.1)中，5个Acr蛋白(AcrIIA25、AcrIIA27、AcrIIA28、AcrIIA32和AcrIIA32.1)对SpyCas9和St3Cas9展现了强健的抑制活性。另外，AcrIIA25.1和AcrIIA26能够显著抑制SpyCas9，然而AcrIIA24和AcrIIA29以不同的程度来失活St3Cas9。同时，发现AcrIIA30和AcrIIA31能够强烈抑制St1Cas9的活性(见图1中C)。然而，在实验中，来自相邻基因的其他Acr候选蛋白对SpyCas9、St1Cas9和St3Cas9没有抑制活性(数据未显示)。这些数据表明，九种新型II-A型Acr(AcrIIA24-32)蛋白家族的发现，以及通过质粒干涉实验确证这其中大多数Acr蛋白能够在大肠杆菌中强健地抑制Streptococcus(链球菌)来源的II-A型Cas9蛋白。

为了进一步确定AcrIIA24-32同源蛋白的分布，基于BLAST结果进行了全面的系统发育分析(见图2)。数据显示AcrIIA28、AcrIIA30和AcrIIA32的同源蛋白很少，仅分布在几个链球菌基因组或噬菌体中(见图2中E、G和I)。相比之下，其他Acr蛋白的同源蛋白更广泛地分布在链球菌移动元件中。而AcrIIA26、AcrIIA27、AcrIIA29和AcrIIA31蛋白家族在链球菌的多种菌株中存在，如唾液链球菌(S.salivarius)和化脓链球菌(S.pyogenes)(见图2中C、D、F和H)。此外，AcrIIA24和AcrIIA25同源蛋白不仅存在于链球菌基因组菌株中，而且还存在于各种链球菌噬菌体中(见图2中A和B)。数据表明AcrIIA24-32蛋白家族主要分布在链球菌中，表明AcrIIA24-32在链球菌噬菌体与宿主之间的军备竞赛中具有潜在的作用。

2、AcrIIA24-32是链球菌CRISPR-Cas9系统特异性的抑制蛋白

为了进一步调查AcrIIA24-32是否具备广谱的抑制活性，进行了噬菌斑测定实验。选择了多种研究明确的Cas9同源蛋白进行了验证，包括II-A型(SpyCas9、St1Cas9、St3Cas9和SaCas9)、II-B型(FnCas9)和II-C型(NmeCas9)CRISPR系统(图3中A)。大肠杆菌携带能够靶向T4噬菌体基因23的Cas9表达质粒，而不靶向T4噬菌体的Cas9质粒为对照。在存在或者不存在Acr的情况下，用10倍连续稀释的T4噬菌体对这些化转Cas9表达质粒的大肠杆菌进行侵染(图3中A)。发现AcrIIA30和AcrIIA31可以特异性的抑制St1Cas9，而其他Acr蛋白可以同时强烈抑制SpyCas9和St3Cas9(图3中B)。

此外，AcrIIA24-32对SaCas9、NmeCas9和FnCas9没有显示出可检测的抑制活性。数据表明AcrIIA24-32是链球菌CRISPR-Cas9系统特异性的抑制蛋白。

3、AcrIIA24-32可在体外抑制II-A型Cas9同源蛋白

在质粒干涉实验中，AcrIIA24-32中有些蛋白对链球菌的CRISPR-Cas9系统展现了弱的抑制活性(如AcrIIA29弱抑制St3Cas9)。然而在噬菌斑测定实验中，AcrIIA24-32能够将T4噬菌体恢复至与非靶向对照几乎相同的水平，表明这些Acr蛋白对II-A型Cas9同系物(SpyCas9、St1Cas9和St3Cas9)都具有强健的抑制活性(图3中B)。

为了消除这种差异并确认AcrIIA24-32对链球菌CRISPR-Cas9系统的抑制活性，纯化了Cas9和Acr蛋白并在体外进行了DNA切割实验。AcrIIA24-32抑制SpyCas9、St1Cas9和St3Cas9蛋白的活性，可以通过Cas9 RNP在存在或不存在Acr的情况下靶向线性化质粒DNA来测定(图4中A)。结果显示，DNA切割实验的结果与质粒干涉实验的结果基本一致。SpyCas9能够被AcrIIA25、AcrIIA25.1、AcrIIA26、AcrIIA27、AcrIIA28、AcrIIA32和AcrIIA32.1抑制(图4中B)。除AcrIIA25.1和AcrIIA30之外的其他Acr蛋白可以抑制St3Cas9，而AcrIIA24、AcrIIA25、AcrIIA27、AcrIIA31和AcrIIA32对St3Cas9显示出更强的抑制活性(图4中C)。此外，只有AcrIIA30和AcrIIA31可以在体外有效地失活St1Cas9，这与质粒干涉和噬菌斑测定实验的结果一致(图4中D)。还进行了不同条件的DNA切割实验，即在将sgRNA和目标DNA引入反应之前，将apo-Cas9和Acr蛋白预孵育(数据未显示)。发现在这两种反应条件下实验结果并没有显着差异，表明AcrIIA24-32主要作用于Cas9 RNP，并影响Cas9 RNP的下游功能。

4、AcrIIA24-32可以在人类细胞中抑制Cas9介导的基因编辑

鉴于各种Cas9直系同源蛋白在真核细胞中的广泛应用，检查了相应的Acrs是否可以在人类细胞中抑制Cas9蛋白。将编码Cas9、基因组靶向的sgRNA和Acrs的质粒共转染进HEK293T细胞。转染72小时后使用T7核酸内切酶1(T7E1)分析了基因编辑效率(图5中A)。人类内源性基因座AAVS1和DYRK1A被设计可用于链球菌的II-A型Cas9直系同源蛋白进行基因编辑。

引人注目的是，观察到在人体细胞中多个Acrs对SpyCas9、St1Cas9和St3Cas9表现出强烈的抑制作用(见表6)。AcrIIA25.1、AcrIIA26、AcrIIA27、AcrIIA28、AcrIIA32和AcrIIA32.1蛋白几乎完全抑制了SpyCas9的活性，这些蛋白的抑制水平与已知的强效抑制蛋白AcrIIA5相当，而AcrIIA25仅微弱地抑制SpyCas9(平均抑制活性为44％)(图5中B和C)。此外，St3Cas9介导的基因编辑可被多种Acrs不同程度地抑制，包括AcrIIA24(平均91％)、AcrIIA25(平均56％)、AcrIIA27(平均83％)、AcrIIA28(平均84％)、AcrIIA29(平均33％)、AcrIIA32(平均98％)和AcrIIA32.1(平均93％)(图5中D和E)。还发现AcrIIA30、AcrIIA31和AcrIIA31同源蛋白(AcrIIA31.1)可以有效抑制St1Cas9的活性(图5中F和G)。

因此，结果表明来自AcrIIA24-32的多个Acrs及其直系同源蛋白可以有效地在人类细胞中抑制链球菌Cas9同源蛋白(SpyCas9、St1Cas9和St3Cas9)。

表6

/>

注：20％<抑制活性<50％，标记“+”；50％<抑制活性<80％，标记“++”；抑制活性>80％，标记“+++”；ND，没有确定。

5、Acrs在人类细胞中采用多种策略失活Cas9

为了研究Acr蛋白对Cas9的抑制机制，在U20S细胞系中执行了Cas9蛋白介导的端粒共定位荧光成像实验(图6中A和B)。选择AcrIIA24、AcrIIA25.1、AcrIIA26、AcrIIA27、AcrIIA30、AcrIIA31和AcrIIA32.1，考虑到这些蛋白在人类细胞中具备高的抑制Cas9的活性。Acrs的作用机制可以通过mCherry标记的链球菌Cas9蛋白对端粒DNA的成像进行评估，同时可以使用超折叠(super-folder,sf)GFP标记的NmeCas9作为端粒指示信号。

首先，研究了强效抑制蛋白对SpyCas9与DNA结合的影响，包括AcrIIA25.1、AcrIIA26、AcrIIA27和AcrIIA32.1，以及作为对照的AcrIIA4和AcrIIA5。观察到Spy_dCas9-(mCherry)₃和Nme_dCas9-(sfGFP)₃在共表达AcrIIA5的细胞中能够共定位到端粒上，而在表达AcrIIA4的细胞中，则消除了由Spy_dCas9-(mCherry)₃形成的红色端粒点(图6中C)。然而，在表达AcrIIA25.1、AcrIIA26、AcrIIA27或AcrIIA32.1的细胞中均导致Spy_dCas9-(mCherry)₃形成的红色端粒点丢失，而不影响Nme_dCas9-(sfGFP)₃形成的绿色端粒点(图6中C)。随后，量化了在不同Acr蛋白存在的情况下Spy_dCas9-(mCherry)₃形成端粒点的细胞数量。在表达AcrIIA5的细胞中观察到93.1％细胞存在Spy_dCas9-(mCherry)₃形成的红色端粒点，而在表达AcrIIA25.1、AcrIIA26、AcrIIA27、AcrIIA32.1或AcrIIA4的细胞中很少观察到红色端粒点(图6中D)。这些结果证实了AcrIIA25.1、AcrIIA26、AcrIIA27和AcrIIA32.1可以在人类细胞中高效阻断SpyCas9对靶向DNA的结合。

随后，为了探索St1Cas9和St3Cas9的强效抑制蛋白的作用机制，使用St1Cas9和St3Cas9建立了类似的荧光成像系统，用于靶向U2OS细胞中的人类端粒(图6中A和B)。观察到St3_dCas9-(mCherry)₃或St1_dCas9-(mCherry)₃与Nme_dCas9-(sfGFP)₃共定位到细胞中的端粒上(图6中E和G)。AcrIIA24对St3_dCas9-(mCherry)₃对端粒点的共定位没有影响，而AcrIIA27、AcrIIA32.1、AcrIIA30和AcrIIA31可以明显消除由St3Cas9或St1Cas9形成的红色端粒点(图6中G和E)。另外，通过定量实验，在96.8％表达AcrIIA5的细胞和96.4％表达AcrIIA24的细胞中观察到St3_dCas9-(mCherry)₃形成的红色端粒点，而在表达AcrIIA27或AcrIIA32.1的细胞中则没有观察到St3_dCas9-(mCherry)₃形成的红色端粒点(图6中F)。此外，在72.4％表达AcrIIA5的细胞、3.4％表达AcrIIA30的细胞和0％表达AcrIIA31的细胞中观察到了St1_dCas9-(mCherry)₃形成的红色端粒点(图6中H)。

结果表明，来自链球菌移动元件的Acrs采用多种抑制策略来抑制Cas9蛋白。AcrIIA25.1、AcrIIA26、AcrIIA27、AcrIIA30、AcrIIA31和AcrIIA32.1可有效阻断Cas9蛋白与DNA的结合。然而，AcrIIA24不阻止Cas9蛋白与DNA靶标的结合，表明AcrIIA24可能特异性地抑制Cas9对底物DNA的切割，其作用机制类似于AcrIIC1。

6、Acrs表现出多种作用机制来抑制Cas9

在体外进行了凝胶迁移实验(electrophoretic mobility shift assays，EMSA)，以进一步检查这些Acrs对Cas9的作用机制。首先进行了RNA EMSA以确定这些Acrs是否影响Cas9-sgRNA RNP复合物的形成。发现AcrIIA25.1、AcrIIA26、AcrIIA27、AcrIIA28和AcrIIA32.1对SpyCas9-sgRNA RNP的形成没有影响(图7中A和B)。AcrIIA24、AcrIIA30和AcrIIA31也没有阻止St3Cas9或St1Cas9与sgRNA的结合(图7中C和D)。

随后，进行了DNA EMSA实验以研究Acrs如何作用于Cas9 RNP以影响Cas9 RNP的下游功能。具备催化活性的Cas9蛋白与sgRNA混合形成Cas9 RNP复合物，同时在反应体系中加入10mM EDTA以消除Cas9对DNA的切割作用。一个荧光标记的底物DNA(Cy5标记的目标链)设计可被SpyCas9、St1Cas9和St3Cas9靶向。观察到AcrIIA25.1、AcrIIA26、AcrIIA27和AcrIIA32.1只有在添加目标DNA之前添加到反映体系时才有效地消除了SpyCas9 RNP与DNA的结合(图8中A-D)。还发现AcrIIA25.1和AcrIIA32.1可以捕获与DNA结合的Cas9复合物，从而导致DNA超迁移(“super-shift”)，而AcrIIA26、AcrIIA27则不能(图8中A-D)。

接下来，研究了AcrIIA32.1对St3Cas9的抑制机制，获得了与AcrIIA32.1对SpyCas9的相似的结果。还观察到，无论在添加目标DNA之前或之后添加AcrIIA24蛋白，AcrIIA24都可以捕获Cas9-DNA复合物，导致DNA超迁移(“super-shift”)(图8中E)。该结果表明AcrIIA24应特异性抑制St3Cas9对DNA底物的切割活性。还研究了AcrIIA30和AcrIIA31对St1Cas9的抑制机制，发现AcrIIA30和AcrIIA31只有在添加目标DNA之前添加到反映体系时才有效地阻止了St1Cas9 RNP与DNA的结合(图8中F)。与AcrIIA25.1和AcrIIA32.1一样，AcrIIA30可以与DNA结合的Cas9复合物结合，导致DNA超迁移(“super-shift”)，而AcrIIA31则不能(图8中F)。

考虑到AcrIIA25.1、AcrIIA32.1和AcrIIA30的一些非常规行为，推测这些Acr蛋白不仅可以阻断Cas9与DNA结合，还可以抑制Cas9-sgRNA-DNA-Acr四元复合物中Cas9对DNA的切割活性。为了验证假设，通过在EMSA中添加额外的Mg²⁺来恢复Cas9对DNA的切割活性来进行DNA切割实验(图8中G)。检查了不同反应条件下Acr蛋白是否会影响Cas9的DNA切割活性，即在反应体系中添加目标DNA之前或之后添加Acrs。数据显示，通过在EMSA中添加额外的Mg²⁺、SpyCas9、St1Cas9和St3Cas9的DNA切割活性都得到了有效恢复(图8中H、I和图9)。与AcrIIC1蛋白相比，AcrIIA25.1、AcrIIA32.1和对照AcrIIA4在添加靶DNA之前添加时到反应体系时可以强烈抑制SpyCas9对DNA的切割活性。然而与AcrIIA4对照相比，AcrIIA25.1和AcrIIA32.1在添加目标DNA后添加到反应体系中，也可以使SpyCas9的DNA切割活性失活(图8中H)。结合EMSA和DNA切割分析，数据显示AcrIIA25.1和AcrIIA32.1可以抑制SpyCas9的DNA结合和DNA切割活性，这是一种不同于其他先前报道的Acrs的新型抑制机制(图8中J)。

进一步研究了AcrIIA24、AcrIIA25和AcrIIA32.1是否抑制了St3Cas9的DNA切割活性。发现AcrIIA24、AcrIIA25和AcrIIA32.1无论在添加靶DNA之前或之后添加，均对St3Cas9的DNA切割表现出强烈的抑制作用(图9)。结果表明AcrIIA24可以有效抑制St3Cas9的DNA切割步骤，而AcrIIA25和AcrIIA32.1抑制St3Cas9的DNA结合和DNA切割活性。还研究了AcrIIA30和AcrIIA31对St1Cas9的DNA切割活性的抑制机制，特别是考虑到AcrIIA30可以在EMSA中结合到Cas9-sgRNA-DNA三元复合物。发现只有在添加目标DNA之前添加AcrIIA30和AcrIIA31，才可以有效抑制St1Cas9介导的DNA切割，表明AcrIIA30和AcrIIA31都可以抑制St1Cas9的DNA结合而不影响St1Cas9的DNA切割活性(图8中I和J)。总之，结果表明，发现的这些Acrs表现出抑制Cas9的多种能力，其机制包括阻断DNA结合、DNA切割或两者兼而有之。

7、化学诱导型iAcr(inducible anti-CRISPR)系统的建立以实现化学可控的的基因编辑

由于AcrIIA25.1和AcrIIA32.1可以抑制Cas9的DNA结合和DNA切割活性，展现出强大的应用潜力可用于调节Cas9介导的基因组编辑。选择这两个蛋白作为开发化学诱导型anti-CRISPR的候选蛋白。还使用AcrIIA4和AcrIIA5作为对照，考虑到AcrIIA4只能阻断Cas9与DNA的结合，而AcrIIA5专门抑制Cas9的DNA裂解，通过Acr蛋白与配体依赖性内含肽(intein)37R3-2融合设计了内含肽-Acr杂合体，将内含肽插入Acr蛋白会导致Acr失活，而4-羟基三苯氧胺(4-hydroxytamoxifen，4-HT)与内含肽的结合可触发内含肽蛋白自剪接并恢复Acr活性以抑制Cas9(图10中A)。

通过替换Acrs的单个残基(半胱氨酸、丙氨酸、丝氨酸或苏氨酸)将4-HT响应性内含肽插入Acrs，因为内含肽蛋白剪接留下了单个半胱氨酸残基，替换这些残基将最大限度地减少产生的半胱氨酸点突变的影响(表4)。为了检查人类细胞中内含肽-Acr杂交体对Cas9的影响，设计了一个BFP-to-GFP报告系统，使用引导编辑(Prime editing，PE)进行(图10中B)。建立了功能性HEK293T细胞即在AAVS1位点整合了蓝色荧光蛋白(HEK293T-BFP细胞)，流式细胞术分析显示HEK293T-BFP细胞中BFP的表达比例很高。PE可以通过将CC替换为GT将BFP转换为GFP，从而导致单个H66Y氨基酸替换(图10中B)。在存在或不存在4-HT(1μM)的情况下，用编码PE、BFP靶向的pegRNA和内含肽-Acr杂交体的质粒转染进HEK293T-BFP细胞(图10中B)。内含肽-Acr杂交体对Cas9的影响可以通过比较每种条件下BFP到GFP的编辑效率来计算。

结果表明，4-HT处理对人类细胞中PE和野生型(WT)Acrs的活性没有明显影响(图10中C)。在10个intein-Acr变体中，AcrIIA4(T28和A58)、AcrIIA5(S87)、AcrIIA25.1(S59)的活性不受4-HT的调控。尽管AcrIIA5(A68)、AcrIIA25.1(S30)和AcrIIA32.1(T24和A73)可以响应4-HT切换为激活状态以抑制Cas9，但这四种内含肽-Acr变体是弱4-HT依赖性的(平均1.8倍调节)。只有两种内含肽-Acr变体，AcrIIA25.1(S76)和AcrIIA32.1(T40)可以在4-HT存在下有效抑制PE介导的BFP-to-GFP编辑，表现出4-HT依赖性调节(分别3.3和3.6倍的变化)。然后我们将intein-AcrIIA25.1(S76)和intein-AcrIIA32.1(T40)分别称为iAcrIIA25.1(缩写为iA25.1)和iAcrIIA32.1(缩写为iA32.1)。

为了进一步检查iA25.1和iA32.1是否具备4-HT依赖性的活性以抑制Cas9介导的基因编辑，在HEK293T细胞中进行了T7E1实验。人类内源性基因座AAVS1和EMX1被设计用于SpyCas9的靶向编辑。与PE介导的BFP-to-GFP测定的结果一致，4-HT处理对SpyCas9和WTAcrs的活性没有影响(图10中D和E)。引人注目的是，观察到iA25.1和iA32.1的抑制活性是4-HT依赖性的。这两种蛋白质在没有4-HT的情况下对SpyCas9活性有轻微影响，但在4-HT存在的情况下，它们会切换到高活性状态以抑制Cas9(图10中D和E)。为了进一步检查iAcr的潜在应用，进行了T7E1分析，以研究iA32.1是否可以被4-HT激活以抑制人类细胞中St3Cas9介导的基因编辑。正如预期的那样，数据显示具有4-HT触发活性的iA32.1可以抑制人类细胞中St3Cas9介导的基因编辑(图10中F)。

因此，结果表明，这些iAcrs表现出有效的4-HT依赖性调节，以在人类细胞中对CRISPR-Cas9介导的基因组编辑进行翻译后控制。

以上对本发明进行了详述。对于本领域技术人员来说，在不脱离本发明的宗旨和范围，以及无需进行不必要的实验情况下，可在等同参数、浓度和条件下，在较宽范围内实施本发明。虽然本发明给出了特殊的实施例，应该理解为，可以对本发明作进一步的改进。总之，按本发明的原理，本申请欲包括任何变更、用途或对本发明的改进，包括脱离了本申请中已公开范围，而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围，可以进行一些基本特征的应用。

Claims

1.AcrIIA蛋白在细胞或真核生物中抑制Cas9基因编辑、调控和/或成像中的应用；

所述AcrIIA蛋白为AcrIIA24蛋白；

所述AcrIIA24蛋白为如下a1)或a2)：

a1)氨基酸序列是SEQ ID NO:1所示的蛋白质；

a2)在SEQ ID NO:1所示的蛋白质的N端或/和C端连接标签得到的融合蛋白质；所述Cas9蛋白为SpyCas9蛋白或/和St3Cas9蛋白。

2.根据权利要求1所述的应用，其特征在于：所述细胞为细菌细胞。

3.权利要求1中所述AcrIIA蛋白在抑制Cas9蛋白活性中的应用；所述Cas9蛋白为SpyCas9蛋白或/和St3Cas9蛋白。

4.根据权利要求3所述的应用，其特征在于：所述抑制Cas9蛋白活性表现为抑制Cas9蛋白与DNA结合和/或抑制Cas9蛋白对底物DNA的切割活性。

5.权利要求1中所述AcrIIA蛋白在制备化学诱导型iAcr的系统中的应用；所述iAcr为inducible anti-CRISPR；所述化学诱导为4-羟基三苯氧胺诱导。

6.权利要求1中所述AcrIIA蛋白在进行化学可控的基因编辑中的应用；所述化学可控为由4-羟基三苯氧胺调控。