CN117625577A

CN117625577A - 一种突变的v型crispr酶及其应用

Info

Publication number: CN117625577A
Application number: CN202311101038.3A
Authority: CN
Inventors: 潘伟业; 孙阳; 陈重建; 朱鹏宇; 尤胜浩
Original assignee: Beijing Xunzhi Biotechnology Co ltd; Zhejiang Xunzhi Biotechnology Co ltd; Beijing Xunzhi Technology Co ltd
Current assignee: Beijing Xunzhi Biotechnology Co ltd; Zhejiang Xunzhi Biotechnology Co ltd; Beijing Xunzhi Technology Co ltd
Priority date: 2022-08-29
Filing date: 2023-08-29
Publication date: 2024-03-01
Also published as: WO2024046307A1

Abstract

本申请提供一种突变的V型CRISPR酶及其应用。本申请通过蛋白突变理性突变技术，把Cas12a或Cas12b中RuvC识别切割DNA底物的限制去除，使其能够高效率地识别和切割RNA底物，在实际应用中解决RNA底物识别的效率不足的问题。提高Cas12反式切割活性打开后对RNA底物反应效率，提高Cas12使用RNA探针的报告效率。

Description

一种突变的V型CRISPR酶及其应用

技术领域

本申请属于生物技术领域，具体地，涉及一种突变的V型CRISPR酶及其应用。

背景技术

V型CRISPR-Cas系统也被称为Cas12家族，它和其它CRISPR-Cas系统区别之处在于它是由单RuvC活性中心驱动的一个RNA介导的单效应子核酶。随着越来越多的Cas12被挖掘和识别出来，该家族已存在V-A，V-B，V-C，V-D，V-E，V-F，V-G，V-H，V-I，V-J，V-K等多个类别。

其中Cas12a和Cas12b由于其优异的反应性能，被用于多个与扩增技术联合的核酸检测技术及临床检测产品中。

在继往的报道中，Cas12a或Cas12b都是具备RNA介导的顺式DNase活性和反式DNase的活性，以及应运而生的检测应用；在某些报道中虽有提及Cas12a或Cas12b具备RNA介导的反式RNase的活性，可以以比DNA底物1/10的效率进行Rna底物的切割，但其对DNA底物的优先选择性，限制了在核酸扩增体系中其进一步的应用。这种有限的一个数量级的区分度，RNA探针作为另外一种报告底物进行检测的可能性。

发明内容

针对现有技术存在的问题，本申请提供一种突变的V型CRISPR酶及其应用。

具体来说，本申请涉及如下方面：

1.一种工程化的Cas12蛋白或其功能衍生物，其包含如下突变：

将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的限制去除，

优选地，参比Cas12蛋白的氨基酸序列如SEQ ID NO:1所示。

2.根据项1所述的工程化的Cas12蛋白或其功能衍生物，其中将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的限制去除通过以下方式实现：

将参比Cas12蛋白中的守门氨基酸的α螺旋上下游的手指替换为锌指结构域。

3.根据项1或2所述的工程化的Cas12蛋白或其功能衍生物，其中将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的限制去除是针对915-945位中的部分或全部区域进行结构域的替换，其中氨基酸位置编号如SEQ ID NO:1所定义。

4.根据项2所述的工程化的Cas12蛋白或其功能衍生物，其中所述锌指结构域具有1至2个锌结合位点，所述锌结合位点选自[CxxxxC]、[CxxxxH]、[CxxxC]、[HxxxH]、[CxxC]、[CxxH]中的一种，其中x表示任意天然氨基酸。

5.根据项4所述的工程化的Cas12蛋白或其功能衍生物，其中所述锌指结构域为Cas12g或HIV-1核壳体蛋白7(Ncp7)的锌指结构域。

6.根据项5所述的工程化的Cas12蛋白或其功能衍生物，其中参比Cas12蛋白的919-944位替换为SEQ ID NO:4所示的氨基酸序列，其中氨基酸位置编号如SEQ ID NO:1所定义。

7.根据项5所述的工程化的Cas12蛋白或其功能衍生物，其中参比Cas12蛋白的919-944位替换为SEQ ID NO:6所示的氨基酸序列，其中氨基酸位置编号如SEQ ID NO:1所定义。

8.根据项1所述的工程化的Cas12蛋白或其功能衍生物，其中参比Cas12蛋白的919-944位替换为SEQ ID NO:8所示的氨基酸序列，其中氨基酸位置编号如SEQ ID NO:1所定义。

9.根据项1所述的工程化的Cas12蛋白或其功能衍生物，其中参比Cas12蛋白的916-944位替换为SEQ ID NO:11所示的氨基酸序列，其中氨基酸位置编号如SEQ ID NO:1所定义。

10.一种工程化的Cas12蛋白或其功能衍生物，其包含基于参比Cas12蛋白的如下突变中的一种：

参比Cas12蛋白的919-944位替换为SEQ ID NO:4所示的氨基酸序列；

参比Cas12蛋白的919-944位替换为SEQ ID NO:6所示的氨基酸序列；

参比Cas12蛋白的919-944位替换为SEQ ID NO:8所示的氨基酸序列；

参比Cas12蛋白的916-944位替换为SEQ ID NO:11所示的氨基酸序列；

其中参比Cas12蛋白的氨基酸序列如SEQ ID NO:1所示。

11.一种工程化的Cas12蛋白或其功能衍生物，其序列为如SEQ ID NO:5、7、9或12中任一项所示的氨基酸序列。

12.一种用于检测靶标核酸分子的检测体系，所述体系包含：

项1-11中任一项所述的工程化的Cas12蛋白或其功能衍生物；

向导RNA，所述向导RNA引导Cas12蛋白或其功能衍生物特异性结合于靶标核酸分子；和核酸探针。

13.根据项12所述的检测体系，其中所述核酸探针为RNA探针。

14.一种检测样品中靶标核酸分子的方法，包括：

使样品与项1-11中任一项所述的工程化的Cas12蛋白或其功能衍生物、向导RNA和靶标核酸分子接触；以及

测量通过所述工程化的Cas12蛋白或其功能衍生物切割核酸探针而产生的可检测信号，从而检测所述靶标核酸分子。

15.根据项14所述的方法，其中核酸探针为RNA探针。

16.一种选择性检测靶标核酸分子的检测体系，所述体系包含：

两种以上对于RNA和DNA的切割特异性有显著性差异的Cas12蛋白或其功能衍生物；

向导RNA，所述向导RNA引导Cas12蛋白或其功能衍生物特异性结合于靶标核酸分子；和

核酸探针。

17.根据项16所述的检测体系，其中至少一种所述Cas12蛋白或其功能衍生物为项1-11中任一项所述的工程化的Cas12蛋白或其功能衍生物。

18.根据项17所述的检测体系，其中所述核酸探针为DNA探针或RNA探针。

本申请通过蛋白突变理性突变技术，把Cas12b中RuvC识别切割DNA底物的限制去除，可以特异性的识别DNA底物或特异性的识别RNA底物，在实际应用中解决DNA/RNA底物识别的区分度不足的问题。

本申请的工程化的Cas12蛋白或其功能衍生物提高Cas12反式切割活性打开后对RNA底物反应效率，提高Cas12使用RNA探针的报告效率。

附图说明

图1显示Cas12b和Cas12g的序列比对结果；

图2显示4种突变蛋白的电泳图；

图3显示野生型和突变蛋白的DNA探针CRISPR切割结果；

图4显示突变蛋白的DNA探针CRISPR切割结果；

图5显示突变蛋白的RNA探针CRISPR切割结果；

图6显示突变蛋白应用于RPA扩增反应体系CRISPR切割结果。

具体实施方式

下面结合实施例进一步说明本申请，应当理解，实施例仅用于进一步说明和阐释本申请，并非用于限制本申请。

除非另外定义，本说明书中有关技术的和科学的术语与本领域内的技术人员所通常理解的意思相同。虽然在实验或实际应用中可以应用与此间所述相似或相同的方法和材料，本文还是在下文中对材料和方法做了描述。在相冲突的情况下，以本说明书包括其中定义为准，另外，材料、方法和例子仅供说明，而不具限制性。以下结合具体实施例对本申请作进一步的说明，但不用来限制本申请的范围。

定义

如本文所用，术语“Cas12”或“Cas12蛋白”包括Cas12a(也称为Cpf1)、Cas12b、Cas12c、Cas12d、Cas12e、Cas12h、Cas12i、Cas12g等。在一些实施方案中，Cas12蛋白是Cas12b蛋白，Cas12b蛋白在其最广泛的意义上使用，并且包括亲本或参考Cas12b蛋白质(例如，氨基酸序列为SEQ ID NO:1的AaCas12b)、其衍生物或变体以及功能性片段，诸如其寡核苷酸结合片段。

如本文所用，某种蛋白的“功能衍生物”包括所述蛋白的各种变体或功能结构域，只要所述变体或功能结构域保留了所述蛋白的某个功能结构域的功能(无论是增强的所述功能或减弱的所述功能)，即可称为所述蛋白的功能衍生物。例如对于Cas12蛋白，保留了其部分结构域功能的Cas12蛋白变体或截短体均属于Cas12蛋白的功能衍生物。

如本文所用，“结构域”或“蛋白质结构域”是指可以独立于该蛋白质链的其余部分而存在并且起作用的蛋白质序列的一部分。

如本文所用，“向导RNA”、“sgRNA”“gRNA”在本文中可互换使用，是指能够与Cas12蛋白和靶标核酸形成复合物的RNA。

如本文所用，术语“核酸”、“多核苷酸”和“核苷酸序列”可互换使用，是指任何长度的核苷酸的聚合形式，包括脱氧核糖核苷酸、核糖核苷酸、其组合及其类似物。“寡核苷酸”和“低聚核苷酸”可互换使用，是指具有不超过约50个核苷酸的短多核苷酸。

如本文所用，核酸的“互补”是指一条核酸通过传统的Watson-Crick碱基配对与另一条核酸形成氢键的能力。百分比互补性表示核酸分子中可与另一核酸分子形成氢键(即，Watson-Crick碱基配对)的残基的百分比(例如，10个中的约5、6、7、8、9、10个分别为约50％，60％，70％，80％，90％和100％互补)。“完全互补”是指核酸序列的所有连续残基与第二核酸序列中相同数量的连续残基形成氢键。如本文所用，“基本上互补”是指在约40、50、60、70、80、100、150、200、250或更多个核苷酸的区域内，至少约70％，75％，80％，85％，90％，95％，97％，98％，99％或100％中的任何一个的互补程度，或指在严格条件下杂交的两条核酸。对于单个碱基或单个核苷酸，按照Watson-Crick碱基配对原则，A与T或U、C与G或I配对时，被称为互补或匹配，反之亦然；而除此以外的碱基配对都称为不互补或不匹配。如非特别指出，本申请的“互补”包含“完全互补”和“基本上互补”的情况。只要两条核酸序列可以通过Walson-Crick碱基配对形成稳定的杂合双链，则称所述两条核酸序列“互补”，其形成稳定的杂合双链的过程称为“互补杂交”。

如本文所用，术语“野生型”具有本领域技术人员通常理解的含义，意指当它存在于大自然中时，将其与突变体或变体区分开的、典型形式的生物体、菌株、基因或特征。它可以与自然界中的资源隔离开来，并没有被刻意修饰。

如本文所用，术语“非天然存在”或“工程化的”可互换使用，是指人工参与。当这些术语用于描述核酸分子或多肽时，是指所述核酸分子或多肽至少基本上不含其天然缔合的或天然存在的至少一种其他组分。

如本文所用，术语“同一性”用于表示两个多肽之间或两个核酸之间的序列匹配。当两个比较序列中的一个位置被相同的碱基或氨基酸单体亚基占据时(例如，两个DNA分子的每个中的一个位置都被腺嘌呤占据，或者两个多肽的每个中的一个位置被赖氨酸占据)，那么在那个位置每个分子均相同。这两个序列之间的“同一性百分比”是两个序列共有的匹配位置数除以要比较的位置数x 100的函数。例如，如果两个序列的10个位置中有6个匹配，则这两个序列具有60％的同一性。例如，DNA序列CTGACT和CAGGTT具有50％的同一性(总共6个位置中有3个匹配)。通常，当两个序列进行比对以产生最大的同一性时，进行这种比较。这种比对可以通过例如Needleman et al.(1970)J.Mol.Biol.48:443-453中的方法来实现，所述方法可方便地通过计算机程序如比对(Align)程序(DNAstar，Inc.)来进行。也可以采用PAM 120权重残基表，使用E.Meyers和W.Miller的算法(Comput.Appl Biosci.,4:11-17(1988))集成到ALIGN程序(2.0版)中。空缺长度罚分12和空缺罚分4，用于确定两个氨基酸序列之间的同一性百分比。此外，可以使用集成到GCG软件包(可从www.gcg.com获得)的GAP程序中的Needleman和Wunsch(J MoI Biol.48:444-453(1970))算法，采用Blossum 62矩阵或PAM250矩阵，空缺权重为16、14、12、10、8、6或4，长度权重为1、2、3、4、5或6，以确定两个氨基酸序列之间的同一性百分比。

如本文所用，“变体”或“突变体”解释为分别不同于参比多核苷酸或多肽但保留必要特性的多核苷酸或多肽。多核苷酸的典型变体与另一参比多核苷酸的核酸序列不同。变体核酸序列的变化可以改变或可以不改变参比多核苷酸编码的多肽的氨基酸序列。核苷酸变化可导致参比序列编码的多肽中的氨基酸替换、添加、缺失、融合和截短，如下所述。多肽的典型变体与另一参比多肽在氨基酸序列上不同。通常，差异是有限的，使得参比多肽和变体的序列总体上非常相似，并且在许多区域是相同的。变体和参比多肽的氨基酸序列可以通过一个或多个替换、添加、缺失的任何组合而不同。替换或插入的氨基酸残基可以是或可以不是遗传密码编码的氨基酸残基。多核苷酸或多肽的变体可以是天然存在的(诸如等位基因变体)，或者可以是未知天然存在的变体。多核苷酸和多肽的非天然存在的变体可以通过诱变技术，通过直接合成，以及通过本领域技术人员已知的其他重组方法来制备。

如本文所用，术语“靶标核酸”或“靶标核酸分子”是指样品中的目标核酸，可以是靶标RNA，也可以是靶标DNA，还可以同时含有靶标RNA和靶标DNA。

本申请提供一种工程化的Cas12蛋白或其功能衍生物，其包含如下突变：

将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的特异性进行改造。其中，参比Cas12蛋白可以是已知的野生型Cas12蛋白。在一些实施方案中，参比Cas12蛋白可以是已知的野生型Cas12蛋白。在一些实施方案中，参比Cas12蛋白可以是野生型Cas12b蛋白。

在一些实施方案中，参比Cas12蛋白可以是野生型AaCas12b蛋白。其氨基酸序列如SEQ ID NO:1所示。

在一些实施方案中，将参比Cas12蛋白中RuvC活性中心识别切割DNA底物的特异性进行改造。

在一些实施方案中，将参比Cas12蛋白中Nuc活性中心识别切割DNA底物的特异性进行改造。

在一些实施方案中，将参比Cas12蛋白中RuvC和Nuc活性中心识别切割DNA底物的特异性进行改造。

在一些实施方案中，将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的特异性进行改造包括如下方式：

在一些实施方案中，将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的限制去除是针对915-945位中的部分或全部区域进行结构域的替换，其中氨基酸位置编号如SEQ ID NO:1所定义。其中的部分区域可以是915-945位中的一个位点或多个位点，也可以是一段区域多段区域。例如，部分区域可以是位点P916，或位点L941，或位点P916和位点L941；部分区域可以是919-944位，或916-944位。

在一些实施方案中，将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的限制去除是针对919-944位中的部分或全部区域进行结构域的替换，其中氨基酸位置编号如SEQ ID NO:1所定义。

在一些实施方案中，将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的限制去除是针对916-944位中的部分或全部区域进行结构域的替换，例如替换为锌指结构域，其中氨基酸位置编号如SEQ ID NO:1所定义。

在一些实施方案中，所述锌指结构域具有1至2个锌结合位点，所述锌结合位点选自[CxxxxC]、[CxxxxH]、[CxxxC]、[HxxxH]、[CxxC]、[CxxH]中的一种，其中x表示任意天然氨基酸。

在一些实施方案中，所述锌指结构域为Cas12g的锌指结构域。

在一些实施方案中，所述锌指结构域为HIV-1核壳体蛋白7(Ncp7)的锌指结构域。

在一些实施方案中，参比Cas12蛋白的919-944位替换为Cas12g的锌指结构域。

在一些实施方案中，参比Cas12蛋白的919-944位替换为SEQ ID NO:4所示的氨基酸序列，其中氨基酸位置编号如SEQ ID NO:1所定义。得到的工程化Cas12蛋白的氨基酸序列如SEQ ID NO:5所示。

在一些实施方案中，参比Cas12蛋白的919-944位替换为Ncp7的锌指结构域。

在一些实施方案中，参比Cas12蛋白的919-944位替换为SEQ ID NO:6所示的氨基酸序列，其中氨基酸位置编号如SEQ ID NO:1所定义。得到的工程化Cas12蛋白的氨基酸序列如SEQ ID NO:7所示。

在一些实施方案中，对参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的特异性进行改造是通过将参比Cas12蛋白中的守门氨基酸的919-944位替换为SEQ IDNO:8所示的氨基酸序列，其中氨基酸位置编号如SEQ ID NO:1所定义。得到的工程化Cas12蛋白的氨基酸序列如SEQ ID NO:9所示。

在一些实施方案中，对参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的特异性进行改造是通过将参比Cas12蛋白中的守门氨基酸的916-944位替换为SEQ IDNO:11所示的氨基酸序列，其中氨基酸位置编号如SEQ ID NO:1所定义。得到的工程化Cas12蛋白的氨基酸序列如SEQ ID NO:12所示。

本申请还提供一种工程化的Cas12蛋白或其功能衍生物，其包含基于参比Cas12蛋白的如下突变中的一种：

参比Cas12蛋白的919-944位替换为SEQ ID NO:4所示的氨基酸序列；

参比Cas12蛋白的919-944位替换为SEQ ID NO:6所示的氨基酸序列；

参比Cas12蛋白的919-944位替换为SEQ ID NO:8所示的氨基酸序列；

参比Cas12蛋白的916-944位替换为SEQ ID NO:11所示的氨基酸序列；

其中参比Cas12蛋白的氨基酸序列如SEQ ID NO:1所示。

本申请还提供一种用于检测靶标核酸分子的检测体系，所述体系包含：上述任意一种或多种工程化的Cas12蛋白或其功能衍生物；向导RNA，所述向导RNA引导Cas12蛋白或其功能衍生物特异性结合于靶标核酸分子；和核酸探针。其中，靶标核酸分子可以为靶标RNA，也可以为靶标DNA。

在一些实施方案中，核酸探针为RNA探针，RNA探针的具体组成和长度可以根据实际需要进行设计。

在一些实施方案中，RNA探针的序列为5‘FAM-rUrUrUrArGrCrArGrGrArUrUrCrArGrGrUrUrU-3’BHQ1(SEQ ID NO:17)。

在一些实施方案中，RNA探针的序列为5‘FAM-rCrArUrArUrUrGrArCrGrCrArUrArCrArArArArCrArUrUrCrCrCrArCrCrArArCrArGrArGrCrCrU-3’BHQ1(SEQ ID NO:18)。

在一些实施方案中，RNA探针的序列为5‘FAM-rCrCrCrCrCrCrCrCrCrC-3’BHQ1(SEQID NO:19)。

本申请还提供一种检测样品中靶标核酸分子的方法，包括：使样品与上述任意一种或多种工程化的Cas12蛋白或其功能衍生物、向导RNA和靶标核酸分子接触；以及测量通过所述工程化的Cas12蛋白或其功能衍生物切割核酸探针而产生的可检测信号，从而检测所述靶标核酸分子。其中，靶标核酸分子可以为靶标RNA，也可以为靶标DNA。

本申请还提供一种选择性检测靶标核酸分子的检测体系，所述体系包含：两种以上对于RNA和DNA的切割特异性有显著性差异的Cas12蛋白或其功能衍生物；向导RNA，所述向导RNA引导Cas12蛋白或其功能衍生物特异性结合于靶标核酸分子；和核酸探针。其中，两种以上的Cas12蛋白或其功能衍生物可以为两种、三种、四种、或更多种。

在一些实施方案中，至少一种对于RNA和DNA的切割特异性有显著性差异的Cas12蛋白或其功能衍生物为上述任意一种工程化的Cas12蛋白或其功能衍生物。其中，靶标核酸分子可以为靶标RNA，也可以为靶标DNA。

在一些实施方案中，核酸探针为DNA探针或RNA探针，DNA探针和RNA探针的具体组成和长度可以根据实际需要进行设计。

本申请发现Cas12蛋白的特定结构域是核酸特异性俘获的结构域，影响核酸反式切割反应底物的特异性俘获的能力。因此，通过敲除该结构域，得到无论是DNA或者RNA底物反式切割反应活力大大削弱的结果。在此基础上通过回补不同的核酸特异性结合的结构域，理论上可以形成不同核酸俘获能力并呈递给RuvC进行切割的能力。在本申请中，申请人尝试置换了该区段同源性较高的Cas12g，和同源性较低的Ncp7的锌指结构。两个结构域均为对RNA有偏好性识别的结构域——Cas12g已经被证明了对RNA的切割能力远远高于对DNA的切割能力，而Ncp7则是RNA特异性结合的结构蛋白，这两者对原有Cas12b结构域的置换均在本申请中证实具有更高的RNA识别和切割能力。进一步地，置换其他特异性碱基识别的锌指结构后，得到的工程化的Cas12蛋白能获得具体碱基组合特异性识别以及切割的分辨能力。

实施例

实施例1——Cas12b和Cas12g的序列比对和偏好性分析

使用CLUSTAL 2.1Mμltiple Sequence Alignments工具，对Cas12b和Cas12g进行同源比对，结果如图1所示。

图中SEQ ID NO:13为：

RFDARTGAPGIRCRRVPARCAREQNPEPFPWWLNKFVAEHKLDGCPLRADDLIPTGEGEF

SEQ ID NO:14为：

RGMRVVTVPYLASSKVCAECRKKQ-KDNKQWEKNKKRGLFKCEGCGS

发现二者在RuvC(Nuv)区域的相似性比较高。识别出了Cas12b中与RuvC配合的α螺旋的与Cas12g1同源的结构，以及α螺旋上下游潜在的可形成更强锌指的位点P916和L941。

实施例2——Cas12b的守门氨基酸的α螺旋上下游的手指结构突变及蛋白质获取。

对野生型AaCas12b进行以下4种方式的突变。其中，野生型AaCas12b的氨基酸序列如SEQ ID NO:1所示，野生型Cas12g1的氨基酸序列如SEQ ID NO:2所示。

SEQ ID NO:1

MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCAREQNPEPFPWWLNKFVAEHKLDGCPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI*

SEQ ID NO:2

MAQASSTPAVSPRPRPRYREERTLVRKLLPRPGQSKQEFRENVKKLRKAFLQFNADVSGVCQWAIQFRPRYGKPAEPTETFWKFFLEPETSLPPNDSRSPEFRRLQAFEAAAGINGAAALDDPAFTNELRDSILAVASRPKTKEAQRLFSRLKDYQPAHRMILAKVAAEWIESRYRRAHQNWERNYEEWKKEKQEWEQNHPELTPEIREAFNQIFQQLEVKEKRVRICPAARLLQNKDNCQYAGKNKHSVLCNQFNEFKKNHLQGKAIKFFYKDAEKYLRCGLQSLKPNVQGPFREDWNKYLRYMNLKEETLRGKNGGRLPHCKNLGQECEFNPHTALCKQYQQQLSSRPDLVQHDELYRKWRREYWREPRKPVFRYPSVKRHSIAKIFGENYFQADFKNSVVGLRLDSMPAGQYLEFAFAPWPRNYRPQPGETEISSVHLHFVGTRPRIGFRFRVPHKRSRFDCTQEELDELRSRTFPRKAQDQKFLEAARKRLLETFPGNAEQELRLLAVDLGTDSARAAFFIGKTFQQAFPLKIVKIEKLYEQWPNQKQAGDRRDASSKQPRPGLSRDHVGRHLQKMRAQASEIAQKRQELTGTPAPETTTDQAAKKATLQPFDLRGLTVHTARMIRDWARLNARQIIQLAEENQVDLIVLESLRGFRPPGYENLDQEKKRRVAFFAHGRIRRKVTEKAVERGMRVVTVPYLASSKVCAECRKKQKDNKQWEKNKKRGLFKCEGCGSQAQVDENAARVLGRVFWGEIELPTAIP

(1)将野生型AaCas12b的氨基酸序列的919-944区段(该区段的氨基酸序列为CAREQNPEPFPWWLNKFVAEHKLDGC(SEQ ID NO:3))，替换为Cas12g1的同源区段(该区段的氨基酸序列为CARCRKKQKDNKQWEKNKKRGLFKCEGC(SEQ ID NO:4))，得到的蛋白称为AaCas12b-SCas12g，其氨基酸序列如SEQ ID NO:5所示。其中下划线部分表示替换的区段。

SEQ ID NO:5

MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCARCRKKQKDNKQWEKNKKRGLFKCEGCPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI*

(2)将野生型AaCas12b的氨基酸序列的919-944区段，替换为Ncp7锌指区段(该区段的氨基酸序列为CFNCGKEGHTARNCRAPRKKGCWKCGKEGHNMKDC(SEQ ID NO:6))，得到的蛋白称为AaCas12b-NCP7，其氨基酸序列如SEQ ID NO:7所示。其中下划线部分表示替换的区段。

SEQ ID NO:7

MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCFNCGKEGHTARNCRAPRKKGCWKCGKEGHNMKDCPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI*

(3)将野生型AaCas12b的氨基酸序列的919-944区段，替换为5MPL蛋白的区段(该区段的氨基酸序列为SQRPGAHLTVKKIFVGGIKEDTEEHHLRDYFEQYGKIEVIEIMTDRGSGKKRGFAFVTFDDHDSVDKIVIQKYHTVNGHNCEVRKALSKQEMASASSSQRGR(SEQ ID NO:8))，得到的蛋白称为AaCas12b-5MPL，其氨基酸序列如SEQ ID NO:9所示。其中下划线部分表示替换的区段。

SEQ ID NO:9

MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARSQRPGAHLTVKKIFVGGIKEDTEEHHLRDYFEQYGKIEVIEIMTDRGSGKKRGFAFVTFDDH DSVDKIVIQKYHTVNGHNCEVRKALSKQEMASASSSQRGRPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI*

(4)将野生型AaCas12b的氨基酸序列的916-944区段(该区段的氨基酸序列为CAREQNPEPFPWWLNKFVAEHKLDGCPLR(SEQ ID NO:10))，替换为GGGGGG(SEQ ID NO:11)得到的蛋白称为AaCas12b-ggg，其氨基酸序列如SEQ ID NO:12所示。其中下划线部分表示替换的区段。

SEQ ID NO:12

MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARGGGGGGPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI*

根据以上4种突变体的氨基酸序列设计相应的载体，转入pET28表达载体中在大肠杆菌菌株BL21中进行诱导表达，通过亲和层析、离子交换层析等蛋白纯化方法，得到4种相应的突变蛋白。图2为纯化好的4种蛋白的聚丙烯酰胺凝胶电泳图。

实施例3——几种突变蛋白的DNA探针切割活性验证，以野生型的AaCas12b为对照。

具体地，按照表1所示的组分构成将各组分置于qPCR仪器中进行荧光值分析，将突变型或野生型AaCas12b，靶标sgRNA(150ng，购自金斯瑞生物科技有限公司，序列为：GTCTAAAGGACAGATTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCAAGCGAAGTGGCACACTCAATACTTGAGCACACT(SEQ ID NO:15))，RNase inhibitor，ssDNA探针/ssRNA探针(购自上海百力格生物技术有限公司)，靶标合成模板(1E12拷贝，购自上海百力格生物技术有限公司)置于1×rCutSmart缓冲液中，使用qPCR仪在42℃下反应60min，截取前6分钟的荧光强度增长进行荧光分析，检测结果如图3和图4所示。其中，探针序列信息和样本序列信息如表2和表3所示。

表1新冠O靶的Crispr切割体系

组分名称	使用浓度	终浓度	1rxn/μL
				ddH2O	/	/	to 20μL
rCutSmart	10X	1X	2
				RNase inhibitor	20U/μL	0.5U/μL	0.5
Cas12b	600ng/μL	60ng/μL	2
				sgRNA	300ng/μL	7.5ng/μL	0.5
probe	5μM	500nM	2
				样本	2E11copies/μL	1E12copies	5

表2探针序列信息

T—FAM—BHQ1	5’FAM—TTTTTTT—3’BHQ1
		C—FAM—BHQ1	5’FAM—CCCCCCC—3’BHQ1
A—FAM—BHQ1	5’FAM—AAAAAAA—3’BHQ1
		G—FAM—BHQ1	5’FAM—GGGGGGG—3’BHQ1

表3样本序列信息

/>

其中图3为野生型和突变蛋白的DNA探针CRISPR切割结果，结果显示，对比野生型Cas12b蛋白的DNA探针切割活力，AaCas12b-SCas12g蛋白和Cas12b-NCP7蛋白对DNA探针的切割活力下降，对各碱基切割的偏好性发生改变，两个突变体蛋白对dA探针的切割偏好性明显下降。

图4为突变蛋白的DNA探针CRISPR切割结果，结果显示，对比置换了锌指结构的AaCas12b-SCas12g蛋白和Cas12b-NCP7蛋白，置换区域截短的突变AaCas12b-ggg和置换了非锌指结构的AaCas12b-5MPL对DNA探针的切割能力更低。

实施例4—几种突变蛋白的RNA探针切割活性验证，以野生型的AaCas12b为对照。

使用实施例3的切割体系测试各种RNA探针的活性。

具体地，按照实施例3的组分构成将各组分置于qPCR仪器中进行荧光值分析，我们将突变型或野生型AaCas12b，靶标sgRNA(SEQ ID NO:15)，RNase inhibitor，ssDNA探针/ssRNA探针(购自上海百力格生物技术有限公司)，靶标合成模板(1E12拷贝，购自上海百力格生物技术有限公司)置于1×rCutSmart缓冲液中，使用qPCR仪在42℃下反应60min，截取前6分钟的荧光强度增长进行荧光分析，检测结果如图5所示。其中探针序列信息如表4所示。

表4探针序列信息

结果显示，野生型Cas12b对不同长度的RNA探针切割活力相近。对于12b-RNAprobe探针的反应上，突变后的AaCas12b-SCas12g和Cas12b-NCP7蛋白切割活力要比野生型Cas12b蛋白切割各种RNA探针要高。

实施例5—AaCas12b-SCas12g和Cas12b-NCP7应用RNA探针进行检测的应用

具体地，按照试剂盒(购买自安普未来)构成将RPA体系A,B buffer，RPA上下游引物(各20pM，购自上海生工生物工程有限公司)，新冠实际样本置于qPCR仪器中42℃孵育30min，样本选择检测真实提取的新冠样本，按照实施例3的组分构成将RPA扩增后的组分与CRISPR切割体系组分置于qPCR仪器中进行荧光值分析，将突变型或野生型AaCas12b，靶标sgRNA(SEQ ID NO:15)，RNase inhibitor，ssRNA探针(购自上海百力格生物技术有限公司)，置于1×rCutSmart缓冲液中，使用qPCR仪在42℃下反应60min，截取前6分钟的荧光强度增长进行荧光分析，检测结果如图6所示。其中，引物序列信息如表5所示，RPA扩增反应体系如表6所示，CRISPR反应切割体系如表7所示。

表5 RPA引物序列信息

RPA-F	TTACTTCTTCTTCTAAAACACCTGAAGAACATT(SEQ ID NO:20)
		RPA-R	GTGTAGATTGTCCAGAATAGGACCAATCTTTAT(SEQ ID NO:21)

表6 RPA扩增反应体系

组分	体积(μL)
		A buffer	29.4
RPA-F(10μM)	2
		RPA-R(10μM)	2
ddH2O和RNA模板	14.1
		B buffer	2.5
总体积	50

表7 CRISPR反应切割体系

结果显示，经过等温扩增后，AaCas12b-SCas12g和Cas12b-NCP7两个蛋白使用靶向新冠病毒的特异性sgRNA作为引导，应用12b-RNA probe探针，能对阳性和阴性的新冠临床样本进行正确区分。

Claims

1.一种工程化的Cas12蛋白或其功能衍生物，其包含如下突变：

优选地，参比Cas12蛋白的氨基酸序列如SEQ ID NO:1所示。

2.根据权利要求1所述的工程化的Cas12蛋白或其功能衍生物，其中将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的限制去除通过如下方式实现：

3.根据权利要求1或2所述的工程化的Cas12蛋白或其功能衍生物，其中将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的限制去除是针对915-945位中的部分或全部区域进行结构域的替换，其中氨基酸位置编号如SEQ ID NO:1所定义。

4.根据权利要求2所述的工程化的Cas12蛋白或其功能衍生物，其中所述锌指结构域具有1至2个锌结合位点，所述锌结合位点选自[CxxxxC]、[CxxxxH]、[CxxxC]、[HxxxH]、[CxxC]、[CxxH]中的一种，其中x表示任意天然氨基酸。

5.根据权利要求4所述的工程化的Cas12蛋白或其功能衍生物，其中所述锌指结构域为Cas12g或HIV-1核壳体蛋白7(Ncp7)的锌指结构域。

6.根据权利要求5所述的工程化的Cas12蛋白或其功能衍生物，其中参比Cas12蛋白的919-944位替换为SEQ ID NO:4所示的氨基酸序列，其中氨基酸位置编号如SEQ ID NO:1所定义。

7.根据权利要求5所述的工程化的Cas12蛋白或其功能衍生物，其中参比Cas12蛋白的919-944位替换为SEQ ID NO:6所示的氨基酸序列，其中氨基酸位置编号如SEQ ID NO:1所定义。

8.根据权利要求1所述的工程化的Cas12蛋白或其功能衍生物，其中参比Cas12蛋白的919-944位替换为SEQ ID NO:8所示的氨基酸序列，其中氨基酸位置编号如SEQ ID NO:1所定义。

9.根据权利要求1所述的工程化的Cas12蛋白或其功能衍生物，其中参比Cas12蛋白的916-944位替换为SEQ ID NO:11所示的氨基酸序列，其中氨基酸位置编号如SEQ ID NO:1所定义。

参比Cas12蛋白的919-944位替换为SEQ ID NO:4所示的氨基酸序列；

参比Cas12蛋白的919-944位替换为SEQ ID NO:6所示的氨基酸序列；

参比Cas12蛋白的919-944位替换为SEQ ID NO:8所示的氨基酸序列；

参比Cas12蛋白的916-944位替换为SEQ ID NO:11所示的氨基酸序列；

其中参比Cas12蛋白的氨基酸序列如SEQ ID NO:1所示。

12.一种用于检测靶标核酸分子的检测体系，所述体系包含：

权利要求1-11中任一项所述的工程化的Cas12蛋白或其功能衍生物；

向导RNA，所述向导RNA引导Cas12蛋白或其功能衍生物特异性结合于靶标核酸分子；

和核酸探针。

13.根据权利要求12所述的检测体系，其中所述核酸探针为RNA探针。

14.一种检测样品中靶标核酸分子的方法，包括：

使样品与权利要求1-11中任一项所述的工程化的Cas12蛋白或其功能衍生物、向导RNA和靶标核酸分子接触；以及

15.根据权利要求14所述的方法，其中所述核酸探针为RNA探针。

核酸探针。

17.根据权利要求16所述的检测体系，其中至少一种所述Cas12蛋白或其功能衍生物为权利要求1-11中任一项所述的工程化的Cas12蛋白或其功能衍生物。

18.根据权利要求17所述的检测体系，其中所述核酸探针为DNA探针或RNA探针。