CN116949011A

CN116949011A - 经分离的Cas13蛋白、基于它的基因编辑系统及其用途

Info

Publication number: CN116949011A
Application number: CN202310447170.3A
Authority: CN
Inventors: 李伟; 周琪; 胡艳萍; 陈阳灿
Original assignee: Beijing Institute Of Stem Cell And Regenerative Medicine; Institute of Zoology of CAS
Current assignee: Beijing Institute Of Stem Cell And Regenerative Medicine; Institute of Zoology of CAS
Priority date: 2022-04-26
Filing date: 2023-04-24
Publication date: 2023-10-27
Also published as: WO2023208256A1

Abstract

本申请涉及经分离的新型CRISPR/Cas13蛋白，基于它的基因编辑系统以及使用它们进行RNA水平基因编辑的方法。本申请提供了非天然存在或经工程化改造的RNA靶向系统，这些系统含有一个靶向RNA的新型Cas13效应蛋白，以及至少一种向导分子。

Description

经分离的Cas13蛋白、基于它的基因编辑系统及其用途

技术领域

本申请为生物技术领域，具体涉及经分离的Cas13蛋白，基于它的基因编辑系统以及使用它们进行RNA水平基因编辑的方法。

背景技术

基因编辑(gene editing)技术使得DNA序列定位点进行改造成为可能，比如第一代基因编辑工具锌指核酸酶(zinc fingernucleases,ZFNs)，第二代基因编辑工具类似转录激活的小型核酸酶(transcription activator-like effector nucleases,TALENs)，第三代基因编辑工具中的II型及V型的成簇的规律间隔的短回文重复序列(CRISPR,Clustered Regularly Interspaced Short Palindromic Repeat)/Cas(CRISPR-associated protein)都可以用于靶向改造基因组，但这些基因编辑系统只能靶向基因组及外来的DNA，而不能对体内RNA进行靶向编辑。

VI型的CRISPR/Cas13系统，是来自古生菌和细菌的天然免疫系统。其不同于以往基因编辑工具，利用核酸碱基互补配对原理进行目标RNA序列的识别，引导Cas效应蛋白进行靶向切割，适用性强、设计简单、效率高。

其中，VI-D型CRISPR/Cas13基因编辑系统是现下应用较为广泛的VI型CRISPR/Cas系统。这一系统在原核生物中可通过识别并切割靶向的多核苷酸上双侧的原间隔序列侧翼位点(Protospacer flanking site,PFS)序列，从而对单链RNA进行靶向编辑，而在真核生物中，VI-D型CRISPR/Cas系统对RNA的靶向编辑作用无PFS序列。同时相比于其他VI型系统，VI-D型系统具有更小的蛋白体积，在基于腺相关病毒(Adeno-associatedvirus,AAV)的基因治疗具有更好的前景。在庞大以及各色各样的宏基因组中，隐藏了尚未培养甚至尚未发现的微生物，可能存在大量的未被发现的VI型CRISPR/Cas13系统，在这些微生物中寻找和克隆获得更具优良特性的Cas蛋白是人们所期望的。

发明内容

本申请的目的就是在宏基因组中寻找新型Cas13基因编辑系统并开发其用途。具体地提供了：

1.经分离的Cas13核酸酶蛋白，所述Cas13蛋白的氨基酸序列包括：

a)如SEQ ID NO.1～28中任一项所示的氨基酸序列；或，

b)与SEQ ID NO.1～28中的任一项具有至少80％序列同一性、且具有RNA切割活性的氨基酸序列。

2.如项2所述的Cas13核酸酶蛋白，其中所述Cas13蛋白是Cas13bt1、Cas13bt2、Cas13g、Cas13h、Cas13i、Cas13j或Cas13k蛋白。

3.一种工程化的Cas13核酸酶效应蛋白，包含:

a)如SEQ ID NO.1～28中任一项所示的氨基酸序列；或，

b)与SEQ ID NO.1～28中的任一项具有80％以上序列同一性、且具有RNA切割活性的氨基酸序列。

4.项3的效应蛋白，其中所述Cas13核酸酶效应蛋白通过氨基酸突变失去催化活性，例如所述Cas13核酸酶蛋白在其C端、N端的HEPN结构域(RxxxxH基序)进行突变形成dCas13蛋白。

5.项3或4所述的效应蛋白，其还包含与所述Cas13核酸酶蛋白融合的功能结构域。

6.项5所述的效应蛋白，所述功能结构域选自如下的一项或多项：翻译起始结构域、翻译阻遏结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域、逆转录酶结构域、报告分子结构域和核酸酶结构域。

7.项6所述的效应蛋白，其中所述核碱基编辑结构域为腺苷脱氨酶、胞苷脱氨酶或所述它们的催化结构域融合。

8.一种多核苷酸，其编码项1或2的Cas13核酸酶蛋白或项3-7任一项的效应蛋白。

9.包含如项8所述的多核苷酸的载体，优选所述载体为质粒或慢病毒。

10.一种工程化的CRISPR-Cas13基因编辑系统，包含：

(a)项3-7中任一项所述的工程化Cas13核酸酶效应蛋白或编码所述效应蛋白的核酸；以及

(b)crRNA，其包含与靶序列互补的间隔区序列，当分别使用如SEQ ID NO.1～28所示的工程化Cas13核酸酶效应蛋白时所述crRNA还分别包含与SEQ ID NO.29～56所示的序列具有至少80％同一性的直接重复(directrepeat,DR)序列；

其中所述工程化的Cas13核酸酶效应蛋白和所述crRNA能够形成CRISPR复合物，所述CRISPR复合物特异性结合包含所述靶序列的靶核酸并诱导所述靶核酸的修饰。

11.包含如项10所述的工程化的CRISPR-Cas13基因编辑系统的试剂盒。

12.如项3-7任一项所述的工程化的CRISPR-Cas13核酸酶效应蛋白、项10的工程化的CRISPR-Cas13基因编辑系统在制备治疗与个体的细胞中与核酸突变相关的疾病或病症的药物中的用途。

13.一种修饰细胞中包含的靶核酸的方法，包括使所述细胞与项3-7任一项所述的工程化的CRISPR-Cas13核酸酶蛋白效应蛋白、项10的工程化的CRISPR-Cas13基因编辑系统接触从而实现对细胞中所述靶核酸的修饰。

14.如项3-7任一项所述的工程化的CRISPR-Cas13核酸酶效应蛋白或项10的工程化的CRISPR-Cas13基因编辑系统的用于制备用来治疗个体中与核酸突变相关的疾病或病症的药物的用途。

本申请还提供了：

1.经分离的Cas13核酸酶蛋白，所述Cas13核酸酶蛋白的氨基酸序列为：

a)如SEQ ID NO.1～28中任一序列所示的氨基酸序列；或，

b)与SEQ ID NO.1～28中的任一序列具有至少80％的序列同一性、且具有RNA切割活性的氨基酸序列。

2.如项1所述的Cas13核酸酶蛋白，其中所述Cas13核酸酶蛋白是Cas13bt1、Cas13bt2、Cas13g、Cas13h、Cas13i、Cas13j或Cas13k蛋白，优选为Cas13g3。

3.一种工程化的Cas13核酸酶效应蛋白，包含Cas13核酸酶蛋白，该Cas13核酸酶蛋白包含:

a)如SEQ ID NO.1～28中任一序列所示的氨基酸序列；或，

b)与SEQ ID NO.1～28中的任一序列具有80％以上序列同一性、且具有RNA切割活性的氨基酸序列。

4.如项3的所述效应蛋白，其中所述Cas13核酸酶蛋白通过氨基酸突变失去催化活性，例如所述Cas13核酸酶蛋白在其C端和/或N端的HEPN结构域(RxxxxH基序)通过氨基酸突变形成dCas13蛋白。

6.如项5所述的效应蛋白，所述功能结构域选自如下的一项或多项：翻译起始结构域、翻译阻遏结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域、逆转录酶结构域、报告分子结构域和核酸酶结构域。

7.如项6所述的效应蛋白，其中所述核碱基编辑结构域为腺苷脱氨酶、胞苷脱氨酶或它们的催化结构域。

9.包含如项8所述的多核苷酸的载体，所述载体为质粒或病毒，所述病毒优选为慢病毒。

10.一种工程化的CRISPR-Cas13基因编辑系统，包含：

(a)如项1或2所述的核酸酶、如项3-7中任一项所述的工程化Cas13核酸酶效应蛋白或编码所述效应蛋白的核酸；以及

(b)crRNA，其包含与靶核酸中的靶序列互补的间隔区序列；

11.如项10所述的CRISPR-Cas13基因编辑系统，其中所述crRNA还包含直接重复(DR)序列，优选所述直接重复(DR)序列包含SEQ ID NO.29～56中任一序列所示的序列，或包含与SEQ ID NO.29～56中任一序列所示的序列具有至少80％同一性的序列。

12.包含如项10或11所述的工程化的CRISPR-Cas13基因编辑系统的试剂盒。

13.如项1或2所述的Cas13核酸酶蛋白、如项3-7中任一项所述的工程化的CRISPR-Cas13核酸酶效应蛋白、如项10或11所述的工程化的CRISPR-Cas13基因编辑系统在制备治疗与个体的细胞中与核酸突变相关的疾病或病症的药物中的用途。

14.一种修饰细胞中包含靶核酸的方法，包括使所述细胞与如项1或2所述的Cas13核酸酶蛋白、如项3-7任一项所述的工程化的Cas13核酸酶效应蛋白、如项10或11所述的工程化的CRISPR-Cas13基因编辑系统接触，从而实现对所述细胞中所述靶核酸的修饰。

15.包含如项1或2所述的Cas13核酸酶蛋白、如项3-7任一项所述的工程化的Cas13核酸酶效应蛋白或如项10或11所述的工程化的CRISPR-Cas13基因编辑系统的组合物，其用于核酸的修饰。

本申请的技术方案实现的有益技术效果

本申请通过对宏基因组数据进行分析，最后鉴定出5个全新亚型共75个Cas13蛋白。全新Cas13亚型命名为Cas13g-k；其中Cas13g蛋白质大小约为800个氨基酸，Cas13h-k蛋白大小约为1100个氨基酸。这些新型蛋白都体现了良好的RNA水平的靶向切割活性。我们报道新发现的Cas13g3蛋白可以设计成可编程的RNA编辑。Cas13g3体积为767aa，被认为是目前效率最高的小Cas13蛋白，可被用作有前途的哺乳动物RNA编辑工具。

附图说明

图1示出了通过对宏基因组数据进行分析，最后鉴定出5个全新亚型共75个Cas13蛋白的流程图。

图2示出了7个亚型与4个旧亚型蛋白同源性以及每种亚型蛋白平均大小的示意图。

图3示出了7个亚型与4个旧亚型蛋白同源性的另一示意图。

图4示出了Cas13bt1-Cas13k的Loci位点的间隔-定向重复序列的示意图。

图5示出了Cas13bt1-Cas13k的在C端、N端的HEPN结构域的示意图。

图6示出了Cas13bt1-Cas13k的RxxxxH基序的比例。

图7为Cas13bt1-Cas13k的在C端、N端的HEPN结构域的RxxxxH基序序列保守性示意图。

图8示出了Cas13bt1-Cas13k的DR序列预测结构的示意图。

图9示出了Cas13a-Cas13k的在各种环境的微生物中的分布比例。

图10示出了Cas13a-Cas13k的在自然界的存在比例。

图11A和11B为分析HEK293T细胞中Cas13蛋白RNA切割活性的实验过程的示意图。

图12为使用3'-DR或5'-DR-crRNA敲低mCherrymRNA的效率比较图。

图13A和13B为敲低mCherry mRNA筛选编辑效率高的Cas13蛋白的结果图。

图14A和14B为新型Cas13介导的ANXA4 mRNA敲除的实时定量逆转录PCR(realtime quantitative reverse transcription PCR,RT-qPCR)结果图。

图15示出了RfxCas13d、Cas13X1、Cas13bt1-11和Cas13g3介导的内源mRNA敲低的定量RT-qPCR结果图。

图16为新型Cas13d介导的ANXA4 mRNA敲低的RT-qPCR结果图。

图17示出了RfxCas13d、Cas13X1、Cas13bt1-11和Cas13g3介导的ANXA4 mRNA敲低的RNA-seq分析结果图。

图18A和18B示出了RfxCas13d、Cas13X1、Cas13bt1-11和Cas13g3的反式活性评估。

图19A和19B示出了Cas13g3系统最优spacer长度分析。

图20示出了Cas13g3系统PFS偏好性分析。

图21示出了NLS对Cas13g3系统干扰活性的影响。

图22示出了Cas13g3系统与其他Cas13系统RNA干扰能力的比较。

具体实施方式

下面将参照附图更详细地描述本发明的具体实施例。虽然附图中显示了本发明的具体实施例，然而应当理解，可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本发明，并且能够将本发明的范围完整的传达给本领域的技术人员。

需要说明的是，在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解，技术人员可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名词的差异来作为区分组件的方式，而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”或“包括”为一开放式用语，故应解释成“包含但不限定于”。说明书后续描述为实施本发明的较佳实施方式，然所述描述乃以说明书的一般原则为目的，并非用以限定本发明的范围。本发明的保护范围当视所附权利要求所界定者为准。

如本文所用，就特定组分而言“基本上不含”在本文中用于表示特定组分未被有目的地配制到组合物中和/或仅作为污染物或以痕量存在。因此，由组合物的任何意外污染导致的特定组分的总量低于0.05％，优选低于0.01％。最优选的是其中特定组分的量用标准分析方法检测不到的组合物。

如在本说明书中所使用的，“一”或“一个”可以表示一个或多个。如权利要求中所使用的，当与单词“包含”一起使用时，单词“一”或“一个”可以表示一个或多于一个。

在权利要求中使用术语“或”用于表示“和/或”，除非明确指出仅指代替代方案或者替代方案是相互排斥的，尽管本公开内容支持仅指代替代方案和“和/或”的定义。如本文所用，“另一个”可以表示至少第二个或更多个。

贯穿本申请，术语“约”用于指示值包括装置的误差的固有变化，该方法用于测定该值或存在于研究对象之间的变化。

本申请在第一方面提供了一种经分离的Cas13核酸酶蛋白。

在一个具体实施方式中，提供了一种经分离的Cas13核酸酶蛋白，所述Cas13蛋白的氨基酸序列包括：a)如SEQ ID NO.1～28中任一项所示的氨基酸序列；或，b)与SEQ IDNO.1～28中的任一项具有80％以上序列同一性、且具有RNA切割活性的氨基酸序列。在又一具体实施方式中，提供了一种Cas13核酸酶蛋白，其中所述Cas13蛋白是Cas13bt1、Cas13bt2、Cas13g、Cas13h、Cas13i、Cas13j或Cas13k蛋白。

在本说明书的上下文中，术语Cas13a和C2c2可以互换使用。它最初是由Broad研究所的研究人员发现的。2015年，Shmakov及其同事利用Cas1作为“诱饵”，来鉴定细菌基因组中与CRISPR相关联的蛋白。通过此次分析，他们鉴定出53个候选基因，总共分成三大类：C2c1、C2c2和C2c3。C2c1和C2c3与Cpf1有些类似，不过它们需要tracrRNA和crRNA才能切割DNA目标，而Cpf1仅需要crRNA。而C2c2(也就是Cas13a)与Cas9的区别在于，Cas13a结合并切割RNA，而Cas9切割DNA。Cas9利用tracrRNA和crRNA来实现与DNA目标的结合和切割。而Cas13a只需要24个碱基的crRNA，它通过富含尿嘧啶的茎环结构与Cas13a分子相互作用，并通过Cas13a的一系列构象变化来促进目标的切割。与Cas9一样，Cas13a也能容忍crRNA与目标序列之间的单个错配，不过若存在2个错配，那切割效率就大大降低。它的PFS序列(相当于PAM序列)位于间隔区的3'端，由A、U或C碱基组成。Cas13a还有一个特别之处，那就是Cas13a一旦识别并切割由crRNA序列指定的RNA目标，它就转入了一种酶促“激活”状态，这时它将结合并切割其他的RNA，而不管它们是否与crRNA同源，或是否存在PFS；这一点与Cas9截然不同。在Cas13系统中不需要tracrRNA，只需要crRNA；而crRNA由DR序列(即直接重复序列)和spacer序列(间隔序列，即与靶序列互补的核苷酸序列)构成。

本申请在第二方面提供了一种工程化的Cas13核酸酶效应蛋白

在一个具体实施方式中，提供了一种工程化的Cas13核酸酶效应蛋白，包含:a)如SEQ ID NO.1～28中任一项所示的氨基酸序列；或，b)与SEQ ID NO.1～28中的任一项具有80％以上序列同一性、且具有RNA切割活性的氨基酸序列。优选所述核酸酶效应蛋白与与SEQ ID NO.1～28中的任一项具有80％以上、81％以上、82％以上、83％以上、84％以上、85％以上、86％以上、87％以上、88％以上、89％以上、90％以上、91％以上、92％以上、93％以上、94％以上、95％以上、96％以上、97％以上、98％以上、99％以上、或100％的序列同一性。

在一个具体实施方式中，提供了一种工程化的Cas13核酸酶效应蛋白，所述Cas13核酸酶效应蛋白通过氨基酸突变失去催化活性，例如所述Cas13核酸酶蛋白在其C端、N端的HEPN结构域(RxxxxH基序)进行突变形成dCas13蛋白。

在本说明书的上下文中，术语HEPN是指Cas13a含有的两个结构域，它对于Cas13的作用相当于HNH和RuvC结构域对于Cas9的作用，是来切割目标核酸。HEPN结构域对Cas13a切割RNA目标是必需的。HEPN核糖核酸酶结构域的RxxxxH基序分别位于Cas13蛋白质的N端和C端。另外，与Cas9类似，Cas13a分子中关键残基的突变可以形成核酸酶活性缺失的Cas13a(dCas13a)，它能够结合RNA目标但无法切割。RxxxxH基序为6个连续氨基酸，第一个氨基酸为精氨酸R，最后一个为组氨酸H，中间可以是任意氨基酸。RxxxxH基序即HEPN基序，具有核糖核酸酶功能。

在一个具体实施方式中，提供了一种工程化的Cas13核酸酶效应蛋白，其还包含与所述Cas13核酸酶蛋白融合的功能结构域。其中，所述功能结构域选自如下的一项或多项：翻译起始结构域、翻译阻遏结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域、逆转录酶结构域、报告分子结构域和核酸酶结构域；其中所述核碱基编辑结构域为腺苷脱氨酶、胞苷脱氨酶或所述它们的催化结构域融合。

本申请在第三方面涉及一种多核苷酸。

在一个具体实施方式中，提供了一种多核苷酸，其编码前述Cas13核酸酶蛋白或前述工程化效应蛋白。

本申请在第四方面涉及一种多核苷酸的载体。

在一个具体实施方式中，提供了一种多核苷酸的载体，优选所述载体为质粒或慢病毒。

本申请在第五方面涉及一种基因编辑系统。

在一个具体实施方式中，提供了一种工程化的CRISPR-Cas13基因编辑系统，包含：(a)前述的工程化Cas13核酸酶效应蛋白或编码所述效应蛋白的核酸；以及(b)crRNA，其包含与靶序列互补的间隔区序列，当分别使用如SEQ ID NO.1～28所示的工程化Cas13核酸酶效应蛋白时所述crRNA还分别包含与SEQ ID NO.29～56所示的序列具有至少80％同一性的直接重复(DR)序列；其中所述工程化的Cas13核酸酶效应蛋白和所述crRNA能够形成CRISPR复合物，所述CRISPR复合物特异性结合包含所述靶序列的靶核酸并诱导所述靶核酸的修饰。优选所述直接重复(DR)序列与SEQ ID NO.29～56所示的序列具有至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列同一性。

本申请在第六方面涉及一种试剂盒。

在一个具体实施方式中，提供了包含前述工程化的CRISPR-Cas13基因编辑系统的试剂盒。

本申请在第七方面涉及工程化CRISPR-Cas13核酸酶效应蛋白的用途。

在一个具体实施方式中，提供了前述的工程化的CRISPR-Cas13核酸酶效应蛋白、前述工程化的CRISPR-Cas13基因编辑系统在制备治疗与个体的细胞中与核酸突变相关的疾病或病症的药物中的用途。

本申请在第八方面涉及一种修饰细胞中包含的靶核酸的方法。

在一个具体实施方式中，提供了一种修饰细胞中包含靶核酸的方法，包括使所述细胞与前述的工程化的CRISPR-Cas13核酸酶蛋白效应蛋白、前述工程化的CRISPR-Cas13基因编辑系统接触，从而实现对所述细胞中所述靶核酸的修饰。

本申请在第九方面涉及一种治疗个体中与核酸突变相关的疾病或病症用途。

在一个具体实施方式中，提供了前述的工程化的CRISPR-Cas13核酸酶效应蛋白或前述工程化的CRISPR-Cas13基因编辑系统的用于制备用来治疗个体中与核酸突变相关的疾病或病症的药物的用途。

实施例部分

实施例1：鉴定Cas13新亚型

寻找新的Cas13

从JGI(Joint Genome Institute)数据库下载主要来自人类和动物宿主、水生、自然和农业土壤等近10Tb(Terabyte)组装的宏基因组数据。使用MinCED软件预测大约500251个CRISPR array，提取CRISPR array区域上下游20kb(kilobase)序列作为候选序列，对候选序列使用Meta-GeneMark 1进行蛋白质开放性阅读框(open reading frame,ORF)，得到2596558候选蛋白。鉴于已知Cas蛋白体积，我们将蛋白体积大于400个氨基酸的蛋白作为候选蛋白，获得395847个蛋白质。从NCBI(National Center forBiotechnologyInformation)中下载已知Cas13a、Cas13b、Cas13c和Cas13d序列，使用HH-suite3软件构建已知Cas13蛋白质数据库。将395847个候选蛋白与已知Cas13蛋白质数据库通过HH-suite3软件的hhsearch进行比对，获得具有比对结果的6400个蛋白。去除候选蛋白中不完整以及含有少于2个高等真核生物和原核生物的核苷酸结合(Higher eukaryotes andprokaryotes nuceotide-binding,HEPN)结构域蛋白，得到2253个候选物。除去已知Cas13蛋白序列，得到1139个新Cas13(图1)。

系统发育分析鉴定全新Cas13亚型

对候选蛋白进行系统发育分析以及分类，2253个候选蛋白首先通过MMseqs软件的cluster--min-seq-id 0.5-c 0.7参数进行初步聚类得到聚类，之后将每个聚类通过mmseqs软件的cluster--min-seq-id 0.9-c 0.8参数去除冗余蛋白。之后将每个聚类通过MAFFT软件进行多序列比对，比对结果通过HH-suite3软件的hhmake构建隐马尔可夫模型，之后将隐马尔可夫模型文件通过HH-suite3软件的hhalign进行相互比对。蛋白质之间比对分数用来计算进化距离。其中sij表示i蛋白与j蛋白比对分数；sji表示j蛋白与i蛋白比对分数；Sij表示i蛋白与j蛋白平均比对分数；dij代表i蛋白与j蛋白的进化距离。进化距离计算方式为Sij＝(sij+sji)/2，dij＝(log(min(Sii,Sjj))-log(Sij))/2。进化距离结果通过非加权组平均法(UPGMA)进行聚类分析。最后鉴定出很多已知Cas13a-d同源物和7个不同分支。其中两个分支与之前鉴定的Cas13X、Cas13Y和Cas13bt同源，我们将它们命名为Cas13bt1和Cas13bt2。剩余5个分支为全新亚型，我们命名为Cas13g-k。其中Cas13g蛋白质大小约为800个氨基酸，Cas13h-k蛋白大小约为1100个氨基酸(图1、2)。

Cas13亚型进化树分析

全新Cas13亚型蛋白与部分已知Cas13蛋白通过MUSCLE软件进行多序列比对，比对结果通过FastTree软件构建进化树，最后通过ITOL网站呈现进化树(图3)。

实施例2：鉴定Cas13新亚型的特征

新Cas13亚型CRISPR loci分析

提取CRISPR array区域上下游20kb序列进行ORF预测，获得的蛋白序列使用blast软件进行比对。Cas13i具有CRISPR保守蛋白Cas1和Cas2，而其他Cas13亚型对应的CRISPRLoci缺乏这些保守蛋白(图4)。

Cas13亚型HEPN结构域分析

对每种亚型蛋白质序列通过MUSCLE软件进行多序列比对，比对结果提取出各个蛋白的HEPN结构域信息。绘制对应HEPN结构域在每个Cas13亚型的代表蛋白分布图(图5)。对每个Cas13亚型蛋白对应的RXXXXH基序进行排序，展现前两种基序所占比例(图6)。最后对全新Cas13亚型蛋白的HEPN结构域保守性进行分析(图7)。

全新Cas13亚型CRISPR阵列分析

通过MinCED软件寻找直接重复序列(DR)，具体DR序列的信息见表1。通过RNAfold网站对全新Cas13亚型的DR序列的二级结构进行预测，显示其预测的结构也与之前Cas13a和Cas13b结构类似(图8)。全新Cas13亚型对应的spacer通过CRISPRTarget进行预测，其中部分序列比对到IMG/VR数据库，说明全新Cas13亚型蛋白可能帮助微生物防御外来可动遗传因子。

表1

SEQIDNO	CAS酶	DR序列
			29	Cas13bt1-2	GCTGAAGCAACCCTGGTTTTGCGGGGTGATTACAGC
30	Cas13bt1-5	GCTGTAGAAGCCTCCGATTTGTGAGGTGATGACAGC
			31	Cas13bt1-8	GCTGGAGCAGCCCCCGATTTGTGGGGTAATCACAGC
32	Cas13bt1-9	GTTGGAGCAGCCCCCGTTTTGTGGGGTAATCACAAC
			33	Cas13bt1-10	GCTGGAGAAGCCTCGGATTTGCGGGGTGATTACAGC
34	Cas13bt1-11	GCTGGAGCAGCCCTCGATTTGCAGGGTAATCACAGC
			35	Cas13bt1-14	GCTGGAGAAGCCTCGGTTTTGCGAGGTGATTACAGC
36	Cas13bt1-15	GCTGGAGCAGCCCTCGATTTGCAGGGTAATCACAGC
			37	Cas13bt1-16	GCTGGAGCAGCCCTCGATTTGCAGGGTAATCACAGC
38	Cas13bt2-5	GCTGTGATAGGCCCCGATTTGTGGGGTAGTAACAGC
			39	Cas13g1	GTTTTCGTCACCCCCGTTTTGGAGGGTAAGTACAAC
40	Cas13g2	GTCCGGCTTACCCCCCATTTAGAGGGTGTCCCCGGC
			41	Cas13g3	GCTGGAGACATCCCCATTTCTGTGGGTAAGCCAGAC
42	Cas13g4	GTTTTCGTCACCCTCGTTTTGGAGGGTAAGCACAAC
			43	Cas13g5	GTCTGGCTTACCTGCCATTTTGCAGGTGTCTCCAGC
44	Cas13g6	GCTGAAGACGCCCTGTCTATGACGGGCATGTCAGCT
			45	Cas13g7	GTCGAAGACGCTCCGTTTTTGAGGAGCAAGTACGAC
46	Cas13h1	GTTGTAACTGCCCTTATTTTAAAGGGTACAAACAAC
			47	Cas13i1	GTTGTGAAAGGCCGCCGAAATGGCGGTTCAAGCAAC
48	Cas13j1	GTTGTAACAAGCCTAAGTTTGAAAGGTAAAAACAAC
			49	Cas13k1	GGTGGAAAAGCCTTTGATTTGAAAGGTAAAAGCACC
50	Cas13d_896aa	GAGATAGACCCTTGTTAACTCGTAAGGTTCTGTGAC
			51	Cas13d_911aa	CTTATACAACACCCATTTTCACAGTGGGTCTATAAC
52	Cas13d_942aa	GATTGAAAGGATTGTAAATTTACAAGGTCTTAAAAC
			53	Cas13d_957aa	GATTGAAAGCTATGCGAATTTGCACAGTCTTAAAAC
54	Cas13d_968aa	GAACTACAGCCTTAACGAATGTTAAGGTTCTGAAAC
			55	Cas13d_982aa	GAACTACACCCGTGCAAAAATGCAGGGGTCTAAAAC
56	Cas13d_999aa	GTACAATAGCCCGTTGAAATAGATGGGTTCTAAGAC

新型Cas13分布

将所有新型Cas13(1139个)分类情况以及宏基因组来源进行统计发现，80％Cas13d来源于人体微生物，Cas13c都来自于水源，超过30％Cas13a来自人体微生物或水源，Cas13b分布较分散。其中Cas13d主要分布在动物微生物中，与之前发现其主要分布在革兰氏阳性菌中的瘤胃球菌属一致。对应新型Cas亚型，Cas13i分布于人体或动物体内，Cas13g主要分布于富含甲烷环境中(图9)。同时所有新型Cas13(1139个)中Cas13a、Cas13b、Cas13d分别占总量的23.7％、46.2％、9.5％(图10)。

实施例3：鉴定新型Cas13亚型crRNA方向

质粒构建

Cas13的编码序列通过密码子优化(人类)并合成。合成的Cas13效应蛋白序列插入到pCAG-2A-eGFP载体的XmaI和NheI限制性酶切位点中，构建pCAG-Cas13-2A-eGFP质粒，使用到的蛋白质序列见表2。合成的crRNA序列(U6启动子序列+DR序列+spacer序列或U6启动子序列+spacer序列+DR序列)插入到pUC19-U6载体的EcoRI和HindIII限制性酶切位点之间，构建pUC19-U6-5'-DR crRNA或pUC19-U6-3'-DR crRNA质粒。其中对应的crRNA靶向mCherry mRNA，mCherry spacer序列信息见表3。CAG启动子表达eBFP蛋白和EF1a启动子表达mCherry蛋白构建pCAG-eBFP-EF1a-mCherry质粒(图11A)。

表2

/>

表3：

/>

细胞培养，转染

HEK293T细胞在含有10％FBS(Gibco)和1％Penicillin-Streptomycin(Gibco)的DMEM(Gibco)培养基中培养。使用0.25％Trypsin-EDTA(Gibco)消化细胞，转入24孔板中培养12小时，等细胞密度达到90％时，使用LIPOFECTAMINE 3000Reagent(Invitrogen)进行转染。实验组每个孔转染600ng pCAG-Cas13-2A-eGFP质粒和300ng pUC19-U6-5'-DR crRNA质粒或pUC19-U6-3'-DR crRNA质粒，以及10ng pCAG-eBFP-EF1a-mCherry质粒。对照组只转染600ng pCAG-Cas13-2A-eGFP质粒和10ng pCAG-eBFP-EF1a-mCherry质粒。48小时之后，使用0.25％Trypsin-EDTA(Gibco)消化细胞，获得的悬浮细胞进行荧光激活细胞分选(FACS)(图11A)。

靶向mCherry mRNA鉴定新型Cas13亚型crRNA方向转染2天后通过FACS分析mCherry表达情况。比较5'-DR crRNA和3'-DR crRNA对应的mCherry表达情况，发现Cas13g1、Cas13h1、Cas13i1、Cas13j1、Cas13k1对应的3'-DR crRNA敲低效率高于5'-DRcrRNA。证明Cas13g-k对应crRNA方向为3'-DR(图12)，具体编辑结果信息见表4。图12每组都有3个生物学复本，使用双尾t-检验评价统计学意义。

表4：

	3'-DR	5'-DR
			Cas13g1	0.889667	0.947
Cas13h1	0.200667	0.938
			Cas13i1	0.943667	0.952333
Cas13j1	0.244333	0.948333
			Cas13k1	0.878667	0.921667

实施例4：通过靶向体内基因或体外基因筛选编辑效率高的新型Cas13蛋白

质粒构建

Cas13的编码序列通过密码子优化(人类)并合成。合成的Cas13效应蛋白序列插入到pCAG-2A-eGFP载体的XmaI和NheI酶切位点中，构建pCAG-Cas13-2A-eGFP质粒，使用到的蛋白质序列见表2。合成的crRNA序列(U6启动子序列+spacer序列+DR序列)插入到pUC19-U6载体的EcoRI和HindIII酶切位点之间，构建pUC19-U6-3'-DR crRNA质粒。其中spacer序列信息见表3。CAG启动子表达eBFP蛋白和EF1a启动子表达mCherry蛋白构建pCAG-eBFP-EF1a-mCherry质粒(图11A)。

细胞培养，转染

HEK293T细胞在含有10％FBS(Gibco)和1％Penicillin-Streptomycin(Gibco)的DMEM(Gibco)培养基中培养。使用0.25％Trypsin-EDTA(Gibco)消化细胞，转入24孔板中培养12小时，等细胞密度达到90％时，使用LIPOFECTAMINE 3000Reagent(Invitrogen)进行转染。实验组每个孔转染600ng pCAG-Cas13-2A-eGFP质粒和300ng pUC19-U6-3'-DR crRNA质粒，以及10ng pCAG-eBFP-EF1a-mCherry质粒。对照组只转染600ng pCAG-Cas13-2A-eGFP质粒和10ng pCAG-eBFP-EF1a-mCherry质粒。600ngpCAG-Cas13-2A-eGFP质粒、300ng非靶向(non-targeting,NT)的U6-crRNA质粒和10ng pCAG-eBFP-EF1a-mCherry质粒三者共转到HEK293T细胞中作为非靶标对照组。48小时之后，使用0.25％Trypsin-EDTA(Gibco)消化细胞，获得的悬浮细胞进行荧光激活细胞分选(FACS)(图11A)。

敲低mCherry mRNA筛选编辑效率高的Cas13蛋白转染2天后通过流式分析mCherry表达情况。实验组EGFP和mCherry双阳性细胞的平均荧光强度(mean fluorescenceintensity,MFI)与对照组进行了标准化处理。初步筛选编辑效率高的Cas13蛋白(图13A)，其中RfxCas13d、Cas13X1、Cas13bt1-8、Cas13bt1-10、Cas13bt1-11、Cas13bt1-14、Cas13bt1-15、Cas13g3敲低效率高于50％，这些蛋白用于接下来实验，具体编辑结果信息见表5A。

转染2天后通过流式分析mCherry表达情况。实验组EGFP和mCherry双阳性细胞的MFI与非靶标对照组进行了标准化处理。MFI结果(图13B)和具体编辑结果信息见表5B。

表5A：

	mCherry-spacer-1	mCherry-spacer-2
			RfxCas13d	0.06285	0.08915
Cas13X1	0.2535	0.2475
			Cas13bt1-8	0.227	0.2125
Cas13bt1-9	0.718	0.6685
			Cas13bt1-10	0.3095	0.3785
Cas13bt1-11	0.413	0.359
			Cas13bt1-14	0.2475	0.28335
Cas13bt1-15	0.387	0.3925
			Cas13bt2-5	0.606	0.6025
Cas13g3	0.3625	0.474
			Cas13g1	0.6665	0.7745
Cas13g4	0.6625	0.675

表5B：

细胞培养，转染

HEK293T细胞在含有10％FBS(Gibco)和1％Penicillin-Streptomycin(Gibco)的DMEM(Gibco)培养基中培养。使用0.25％Trypsin-EDTA(Gibco)消化细胞，转入24孔板中培养12小时，等细胞密度达到90％时，使用LIPOFECTAMINE 3000Reagent(Invitrogen)进行转染。实验组每个孔转染600ng pCAG-Cas13-2A-eGFP质粒和300ng pUC19-U6-3'-DR crRNA质粒。对照组只转染600ng pCAG-Cas13-2A-eGFP质粒(图11B)。非靶标对照组转染600ngpCAG-Cas13-2A-eGFP质粒和300ng非靶标的U6-crRNA质粒。

RNA提取，RNA定量分析

转染48小时后使用Reagent(Life Technologie)裂解细胞，之后使用PureLink^TMRNAMini Kit(Thermofisher)提取RNA。最后通过/>II One Step qRT-PCR SYBR Green Kit(Vazyme)进行RNA定量分析。RT-qPCR结果采用2^-ΔΔCT法进行分析，利用靶基因与内参基因GAPDH在3个生物学复本中的平均CT值的差异计算靶基因的相对表达量，并以对照组的相对表达量进行标准化。

敲低体内基因ANXA4 mRNA筛选编辑效率高的Cas13蛋白通过靶向ANXA4 mRNA与对照组的标准化RT-qPCR结果，发现Cas13bt1-11，Cas13bt1-15和Cas13g3具有较高编辑效率(图14A)，具体编辑结果信息见表6A。实验组与非靶标对照组的标准化RT-qPCR结果也显示Cas13bt1-8、Cas13bt1-11、Cas13bt1-15和Cas13g3具有较高编辑(图14B)，具体编辑结果信息见表6B。值得注意的是，两次实验都显示Cas13g3具有最强的RNA干扰能力和超小的蛋白质分子量(767个氨基酸)，我们选择Cas13g3蛋白进行进一步的特征分析。

表6A：

	ANXA4-spacer-1	ANXA4-spacer-2
			RfxCas13d	0.073333	0.163333
Cas13X1	0.313333	0.473333
			Cas13bt1-8	0.243333	0.393333
Cas13bt1-10	0.273333	0.166667
			Cas13bt1-11	0.146667	0.15
Cas13bt1-14	0.42	0.213333
			Cas13bt1-15	0.106667	0.136667
Cas13g3	0.186667	0.11

表6B：

	ANXA4-spacer-1	ANXA4-spacer-2
			RfxCas13d	0.215066	0.258412
Cas13X1	0.046716667	0.054699333
			Cas13bt1-8	0.188513333	0.153782667
Cas13bt1-10	0.363544667	0.214909
			Cas13bt1-11	0.200584333	0.188127667
Cas13bt1-14	0.275353333	0.105536
			Cas13bt1-15	0.086085667	0.146604667
Cas13g3	0.076056	0.150550667

敲低体内基因筛选编辑效率高的Cas13蛋白

通过靶向4个体内基因，发现RfxCas13d在STAT3和KRAS位点编辑效率高于Cas13g3，而在EGFR和CXCR4的编辑效果更低，整体来看，Cas13g3的编辑效果略低于RfxCas13d，但超过了Cas13X1(图15)，编辑结果见表7。

表7：

	STAT3-spacer	EGFR-spacer	KRAS-spacer	CXCR4-spacer
					Cas13X1	0.687478	1.046535	0.525891	0.769662
Cas13bt1-11	0.886987	0.735842	0.284075	0.71624
					Cas13g3	0.613047	0.772218	0.336777	0.598634
RfxCas13d	0.435223	0.785867	0.08919	0.890071

实施例5：通过靶向体内基因验证Cas13d同源物编辑效率

质粒构建

Cas13d同源物的编码序列通过密码子优化(人类)并合成。合成的Cas13效应蛋白序列插入到pCAG-2A-eGFP载体的XmaI和NheI酶切位点中，构建pCAG-Cas13d-2A-eGFP质粒，使用到的蛋白质序列见表2。合成的crRNA序列(U6启动子序列+DR序列+spacer序列)插入到pUC19-U6载体的EcoRI和HindIII酶切位点之间，构建pUC19-U6-5'-DR crRNA质粒。其中spacer序列信息见表3。

细胞培养，转染

HEK293T细胞在含有10％FBS(Gibco)和1％Penicillin-Streptomycin(Gibco)的DMEM(Gibco)培养基中培养。使用0.25％Trypsin-EDTA(Gibco)消化细胞，转入24孔板中培养12小时，等细胞密度达到90％时，使用LIPOFECTAMINE 3000Reagent(Invitrogen)进行转染。实验组每个孔转染600ng pCAG-Cas13d-2A-eGFP质粒和300ng pUC19-U6-5'-DR crRNA质粒。对照组只转染600ng pCAG-Cas13d-2A-eGFP质粒(图11B)。

RNA提取，RNA定量分析

转染48小时后使用Reagent(Life Technologie)裂解细胞，之后使用PureLink^TMRNA Mini Kit(Thermofisher)提取RNA。最后通过/>II One Step qRT-PCR SYBR Green Kit(Vazyme)进行RNA定量分析。RT-qPCR结果采用2^-ΔΔCT法进行分析，利用靶基因与内参基因GAPDH在3个生物学复本中的平均CT值的差异计算靶基因的相对表达量，并以对照组的相对表达量进行标准化。

敲低体内基因ANXA4 mRNA筛选编辑效率高的Cas13蛋白通过靶向ANXA4 mRNA的RT-qPCR结果，发现Cas13d_968aa，Cas13d_982aa和Cas13d_999aa具有较高编辑效率(图16)，具体编辑结果信息见表8。

表8：

	ANXA4-spacer-1
		RfxCas13d	0.096407
Cas13d_896aa	0.303705
		Cas13d_911aa	0.484585
Cas13d_942aa	0.582031
		Cas13d_957aa	0.555765
Cas13d_968aa	0.230899
		Cas13d_982aa	0.210199
Cas13d_999aa	0.13415

实施例6：使用RNA-seq探究Cas13的脱靶活性

细胞培养，转染

HEK293T细胞在含有10％FBS(Gibco)和1％Penicillin-Streptomycin(Gibco)的DMEM(Gibco)培养基中培养。使用0.25％Trypsin-EDTA(Gibco)消化细胞，转入24孔板中培养12小时，等细胞密度达到90％时，使用LIPOFECTAMINE 3000Reagent(Invitrogen)进行转染。实验组每孔转染600ng pCAG-Cas13-2A-eGFP质粒和300ng pUC19-U6-3'-DR crRNA质粒，crRNA靶向ANXA4 mRNA。对照组只转染600ng pCAG-Cas13-2A-eGFP质粒。

RNA-seq

转染2天后使用Reagent(Life Technologie)裂解细胞，之后使用PureLink^TMRNAMini Kit(Thermofisher)提取RNA。提取总RNA使用novaseq6000平台进行RNA-seq测序。获得的测序结果通过STAR软件比对到人基因组，然后通过StringTie软件计算基因表达量。与对照组相比，发现Cas13X1、Cas13g3和RfxCas13d对应的脱靶位点对应的脱靶位点分别为102、133和323。表明Cas13g3的特异性与Cas13X1相当，而其脱靶效应则低于RfxCas13d(图17)。图17中KD代表敲低效率，DG代表下调基因数目。

实施例7：探究Cas13反式切割活性

细胞培养，转染

HEK293T细胞在含有10％FBS(Gibco)和1％Penicillin-Streptomycin(Gibco)的DMEM(Gibco)培养基中培养。使用0.25％Trypsin-EDTA(Gibco)消化细胞，转入24孔板中培养12小时，等细胞密度达到90％时，使用LIPOFECTAMINE 3000Reagent(Invitrogen)进行转染。

细胞活性分析细胞活性实验组每个孔转染600ng pCAG-Cas13-2A-eGFP质粒和300ng pUC19-U6-3'-DR crRNA质粒，crRNA靶向ANXA4 mRNA。对照组不转染任何质粒。使用Calcein-AM/PI double strain kit(Solarbio)对转染2天后的HEK293T进行荧光细胞活力测定。总细胞定量在490nm激发和515nm发射，死细胞定量在535nm激发和617nm发射。使用流式细胞仪进行测量。通过鉴定转染细胞活性，发现转染Cas13蛋白后，不影响细胞活性(图18A)，具体细胞活性信息见表9A。图18每组都有3个生物学复本，使用双尾t-检验评价统计学意义。

表9A：

Neg	Cas13X1	Cas13bt1-11	Cas13g3	RfxCas13d
					98.56	97.68667	97.40333	97.57333	97.28

反式切割活性反式切割实验组每个孔转染600ng pCAG-Cas13-2A-eGFP质粒、10ngpCAG-eBFP-EF1a-mCherry质粒和300ng pUC19-U6-3'-DR crRNA质粒，其中crRNA靶向mCherry mRNA。反式切割对照组转染非靶向的U6-crRNA质粒。通过测量mCherry的荧光强度计算Cas13蛋白的顺式切割能力，同时通过测量EGFP的荧光强度计算反式切割能力。与之前的结果一致，Cas13X1、RfxCas13d和Cas13g3可以显著敲低mCherry mRNA(图18B)。与此同时，Cas13X.1和Cas13g3没有检测到反式切割活性，而RfxCas13d对EGFP转录本显示出显著的反式切割活性(图18B)。具体MFI结果信息见表9B。

表9B：

/>

实施例8：高编辑效率的Cas13g3系统特征鉴定

细胞培养，转染

Cas13g3系统最优spacer长度研究

为了探究Cas13g3系统的最优spacer长度，我们构建了靶向mCherrymRNA且spacer长度从5到50nt不等的U6-crRNA质粒。其中spacer长度在15-30nt之间，每隔1nt设计一条crRNA；当spacer长度为5-15nt和30-50nt时，每隔5nt设计一条crRNA。600ng pCAG-Cas13-2A-eGFP质粒、10ng pCAG-eBFP-EF1a-mCherry质粒和300ng pUC19-U6-3'-DR crRNA质粒三者共转到HEK293T细胞中作为实验组。600ng pCAG-Cas13-2A-eGFP质粒、300ng非靶向的U6-crRNA质粒和10ngpCAG-eBFP-EF1a-mCherry质粒三者共转到HEK293T细胞中作为对照组。实验组EGFP和mCherry双阳性细胞的MFI与阴性对照进行了标准化处理，标准化结果可以反映不同spacer长度对RNA干扰影响。结果显示，当使用长度为27nt的spacer时，Cas13g3在两个靶标位点的平均敲除效率最高(图19)。具体编辑结果信息见表10。

表10：

/>

Cas13g3系统PFS偏好分析

为了分析Cas13g3系统的PFS偏好性，在EF-1α-mCherry质粒的mCherry基因上游克隆了16种PFS组合的目标。实验组EGFP和mCherry双阳性细胞MFI与阴性对照的MFI进行标准化，实验组为转染600ng pCAG-Cas13-2A-eGFP质粒、10ngpCAG-eBFP-EF1a-mCherry质粒和300ng pUC19-U6-3'-DR crRNA质粒的HEK293T细胞；阴性对照为转染了600ng pCAG-Cas13-2A-eGFP质粒、300ng非靶向的U6-crRNA质粒和10ngpCAG-eBFP-EF1a-mCherry质粒的HEK293T细胞。结果显示，Cas13g3蛋白在这16种PFS序列中都展示了稳定且高效的干扰效果(图20)。具体编辑结果信息见表11(其中的spacer序列为：SEQ ID NO.81:GCCGGCACTGATGAGGGCTGCCTAATT)。

表11：

/>

NLS对Cas13g3系统干扰活性的影响

为了鉴定NLS和NES对Cas13g3系统干扰活性的影响，我们构建了3个分别融合NLS、融合NES和没有融合NLS和NES的Cas13蛋白表达质粒(图21)。600ng pCAG-Cas13-2A-eGFP质粒、10ng pCAG-eBFP-EF1a-mCherry质粒和300ng pUC19-U6-3'-DR crRNA质粒三者共转到HEK293T细胞中作为实验组。对照组只转染pCAG-eGFP质粒。分析并计算EGFP和mCherry双阳性细胞的MFI，与对照组的标准化结果显示相对于融合NES或者没有任何定位信号，NLS序列的融合可以提高Cas13g3的敲除效率(图21)。具体编辑结果信息见表12。

表12：

	标准化MFI
		NLS	0.260501
noNLS	0.274187
		NES	0.367439

因此，最佳的Cas13g3编辑器组成为27nt的spacer长度的crRNA质粒和融合NLS序列的Cas13g3蛋白质粒。

实施例9：最优的Cas13g3编辑器干扰能力验证

细胞培养，转染

HEK293T细胞在含有10％FBS(Gibco)和1％Penicillin-Streptomycin(Gibco)的DMEM(Gibco)培养基中培养。使用0.25％Trypsin-EDTA(Gibco)消化细胞，转入24孔板中培养12小时，等细胞密度达到90％时，使用LIPOFECTAMINE 3000Reagent(Invitrogen)进行转染。实验组每个孔转染600ng pCAG-Cas13-2A-eGFP质粒和300ng pUC19-U6-3'-DR crRNA质粒。非靶标对照组转染600ng pCAG-Cas13-2A-eGFP质粒和300ng非靶标的U6-crRNA质粒。

RNA提取，RNA定量分析

Cas13g3系统与其他Cas13系统RNA干扰能力的比较为了系统性地比较Cas13g3蛋白与目前最常用且切割效率最高的Cas13蛋白Cas13X1和RfxCas13d在相同靶标位点的RNA干扰活性并且更大规模地研究Cas13g3蛋白的敲除效率，我们设计了靶向5个内源基因的一共15个crRNAs质粒。通过靶向5个体内基因EZH2、NF2、HRAS、NRAS和PPARG，Cas13X1、RfxCas13d和Cas13g3能够在EZH2、NF2、HRAS、NRAS和PPARG基因上展现强大的RNA干扰活性，它们的平均敲低效率分别为52.84％、54.58％和60.37％(图22)，具体编辑结果见表13。干扰结果进行配对t检验(paired-t-test)统计学分析显示Cas13g3具有高效的RNA敲低活性，与Cas13X1和RfxCas13d相当。

表13：

尽管以上结合附图对本发明的实施方案进行了描述，但本发明并不局限于上述的具体实施方案和应用领域，上述的具体实施方案仅仅是示意性的、指导性的，而不是限制性的。本领域的普通技术人员在本说明书的启示下和在不脱离本发明权利要求所保护的范围的情况下，还可以做出很多种的形式，这些均属于本发明保护之列。

Claims

a)如SEQ ID NO.1～28中任一序列所示的氨基酸序列；或

2.如权利要求1所述的Cas13核酸酶蛋白，其中所述Cas13核酸酶蛋白是Cas13bt1、Cas13bt2、Cas13g、Cas13h、Cas13i、Cas13j或Cas13k蛋白，优选为Cas13g3。

a)如SEQ ID NO.1～28中任一序列所示的氨基酸序列；或，

4.如权利要求3的所述效应蛋白，其中所述Cas13核酸酶蛋白通过氨基酸突变失去催化活性，例如所述Cas13核酸酶蛋白在其C端和/或N端的HEPN结构域(RxxxxH基序)通过氨基酸突变形成dCas13蛋白。

5.权利要求3或4所述的效应蛋白，其还包含与所述Cas13核酸酶蛋白融合的功能结构域。

6.如权利要求5所述的效应蛋白，所述功能结构域选自如下的一项或多项：翻译起始结构域、翻译阻遏结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域、逆转录酶结构域、报告分子结构域和核酸酶结构域。

7.如权利要求6所述的效应蛋白，其中所述核碱基编辑结构域为腺苷脱氨酶、胞苷脱氨酶或它们的催化结构域。

8.一种多核苷酸，其编码权利要求1或2的Cas13核酸酶蛋白或权利要求3-7任一项的效应蛋白。

9.包含如权利要求8所述的多核苷酸的载体，所述载体为质粒或病毒，所述病毒优选为慢病毒。

10.一种工程化的CRISPR-Cas13基因编辑系统，包含：

(a)如权利要求1或2所述的核酸酶、如权利要求3-7中任一项所述的工程化Cas13核酸酶效应蛋白或编码所述效应蛋白的核酸；以及

(b)crRNA，其包含与靶核酸中的靶序列互补的间隔区序列；

11.如权利要求10所述的CRISPR-Cas13基因编辑系统，其中所述crRNA还包含直接重复(DR)序列，优选所述直接重复(DR)序列包含SEQ ID NO.29～56中任一序列所示的序列，或包含与SEQ ID NO.29～56中任一序列所示的序列具有至少80％同一性的序列。

12.包含如权利要求10或11所述的工程化的CRISPR-Cas13基因编辑系统的试剂盒。

13.如权利要求1或2所述的Cas13核酸酶蛋白、如权利要求3-7中任一项所述的工程化的CRISPR-Cas13核酸酶效应蛋白、如权利要求10或11所述的工程化的CRISPR-Cas13基因编辑系统在制备治疗与个体的细胞中与核酸突变相关的疾病或病症的药物中的用途。

14.一种修饰细胞中包含靶核酸的方法，包括使所述细胞与如权利要求1或2所述的Cas13核酸酶蛋白、如权利要求3-7任一项所述的工程化的Cas13核酸酶效应蛋白、如权利要求10或11所述的工程化的CRISPR-Cas13基因编辑系统接触，从而实现对所述细胞中所述靶核酸的修饰。

15.包含如权利要求1或2所述的Cas13核酸酶蛋白、如权利要求3-7任一项所述的工程化的Cas13核酸酶效应蛋白或如权利要求10或11所述的工程化的CRISPR-Cas13基因编辑系统的组合物，其用于核酸的修饰。