CN116254246A

CN116254246A - 工程化cas12b效应蛋白及其使用方法

Info

Publication number: CN116254246A
Application number: CN202211581644.5A
Authority: CN
Inventors: 李伟; 周琪; 陈阳灿
Original assignee: Beijing Institute Of Stem Cell And Regenerative Medicine; Institute of Zoology of CAS
Current assignee: Beijing Institute Of Stem Cell And Regenerative Medicine; Institute of Zoology of CAS
Priority date: 2021-12-09
Filing date: 2022-12-09
Publication date: 2023-06-13
Also published as: WO2023104185A1; CN118339285A

Abstract

本申请提供了工程化Cas12b核酸酶或其衍生物，其包含一种或多种类型的具有提高的活性(例如，基因编辑活性)或消除的核酸酶活性的突变。还提供了工程化Cas12b效应蛋白、工程化的gRNA(例如sgRNA或tracrRNA)、工程化CRISPR‑Cas12b系统，及其使用方法。

Description

工程化CAS12B效应蛋白及其使用方法

相关申请交叉引用

本申请要求了下述国际专利申请的优先权：2021年12月9日提交的PCT/CN2021/136761号，其全部内容通过整体引用并入本文。

电子序列表引用

电子序列表(253112000541SEQLIST.xml；文件大小111583比特；生成日期：2022年11月22日)的内容通过整体引用并入本文。

技术领域

本申请总体上涉及生物技术领域。更具体地，本申请涉及具有提高的活性(例如，基因编辑活性)或消除的核酸酶活性的工程化Cas12b效应蛋白和工程化的gRNA支架及其使用方法。

背景技术

基因组编辑在基因组研究和各种应用中是重要且有用的技术。各种可用于基因组编辑系统，包括规律间隔成簇短回文重复序列(CRISPR)-Cas系统、转录激活子样效应物核酸酶(TALEN)系统，以及锌指核酸酶(ZFN)系统。

CRISPR-Cas系统是一种高效且具有成本效益的基因组编辑技术，广泛适用于从酵母和植物到斑马鱼和人类的一系列真核生物(由VanderOost,2013《科学(Science)》339:768-770，以及Charpentier和Doudna,2013《自然(Na ture)》495:50-51综述)。CRISPR-Cas系统通过采用Cas效应蛋白和CRISPR RNA(crRNA)的组合来在古细菌和细菌中提供适应性免疫。迄今为止，根据系统的显著功能和进化模块性，已经对包括六种类型(I至VI型)的两个类别(1类和2类)的CRISPR-Cas系统进行了表征。在2类CRISPR-Cas系统中，II型Ca s9系统和V-A/B/E/J型Cas12a/Cas12b/Cas12e/Cas12f/Cas12j系统已经被用于基因组编辑，并且为生物医学研究提供了广阔的前景。

发明内容

当前的CRISPR-Cas系统有各种局限性，包括有限的基因编辑效率。本申请提供了改进的方法和系统，用于跨多基因组位点的有效基因组编辑。特别地，在此提供了具有提高的酶活性的工程化Cas12b核酸酶、工程化Cas12b效应蛋白，包含工程化支架的工程化gRNA(例如sgRNA和tracrRNA)，以及(诸如在基因编辑中)使用工程化Cas12b效应蛋白和/或工程化gRNA的方法。在一个方面，本申请提供了工程化Cas12b核酸酶，其包含相对于参考Cas12b核酸酶的一种、两种，或三种类型的突变，其中所述突变包含：(1)用带正电荷的氨基酸残基(例如R、H、K)取代参考Cas12b核酸酶中与前间区序列邻近基序(PAM)相互作用的一个或多个氨基酸残基；和/或(2)用具有芳环的氨基酸残基(例如F、Y、W)取代参考Cas12b核酸酶中参与打开DNA双链(dsDNA)的一个或多个氨基酸残基；和/或(3)用带正电荷的氨基酸残基(例如R、H、K)或疏水性氨基酸残基(例如F、Y、W)取代参考Cas12b核酸酶的RuvC结构域中与单链DNA(ssDNA)底物相互作用的一个或多个氨基酸残基。在一些实施方案中，参考Cas12b核酸酶是野生型Cas12b核酸酶。在一些实施方案中，参考Cas12b核酸酶是来自Alicyclobacillusacidiphilus的Cas12b核酸酶(AaCas12b)。在一些实施方案中，参考Cas12b核酸酶包含SEQ ID NO:1的氨基酸序列。

在根据上述工程化Cas12b核酸酶中的任一种的一些实施方案中，工程化Cas12b核酸酶包含用带正电荷的氨基酸残基取代参考Cas12b核酸酶中与PA M相互作用的一个或多个氨基酸残基。在一些实施方案中，与PAM相互作用的一个或多个氨基酸残基在三维结构中与PAM的距离在10(例如9、8、7、6、5、4、3、2、1或更少)埃内。在一些实施方案中，与PAM相互作用的一个或多个氨基酸残基位于以下的一个或多个位置：116、123、130、132、144、145、153、173、222、395、400和475。在一些实施方案中，与PAM相互作用的一个或多个氨基酸残基包含以下氨基酸残基中的一个或多个：D116、K123、D130、D132、N144、K145、E153、D173、Q222、D395、N400，和/或E475。在一些实施方案中，与PAM相互作用的一个或多个氨基酸残基包含以下氨基酸残基中的一个或多个：D116和E475。在一些实施方案中，带正电荷的氨基酸残基是R或K。在一些实施方案中，工程化Cas12b核酸酶包含以下取代中的一种或多种：D116R和E475R。在一些实施方案中，氨基酸残基根据SEQ ID NO:1编号。在一些实施方案中，所述工程化的Cas12b核酸酶包含SEQ ID NO:2或3的氨基酸序列。

在根据上述工程化Cas12b核酸酶中的任一种的一些实施方案中，工程化Cas12b核酸酶包含用具有芳环的氨基酸残基取代参考Cas12b核酸酶中参与打开DNA双链的一个或多个氨基酸残基。在一些实施方案中，参与打开DN A双链的一个或多个氨基酸残基与PAM中相对于靶链3'端的最后碱基对相互作用。在一些实施方案中，参与打开DNA双链的一个或多个氨基酸残基位于以下的一个或多个位置：118和119。在一些实施方案中，具有芳环的氨基酸残基是Y、F，或W。在一些实施方案中，所述用具有芳环的氨基酸残基取代参考Cas12b核酸酶中参与打开DNA双链的一个或多个氨基酸残基包含Q119Y、Q119F或Q119W。在一些实施方案中，所述氨基酸残基根据SEQ ID NO:1编号。在一些实施方案中，所述工程化Cas12b核酸酶包含SEQ ID NO:4至6的氨基酸序列。

在根据上述工程化Cas12b核酸酶中的任一种的一些实施方案中，工程化Cas12b核酸酶包含用带正电荷的氨基酸残基或疏水性氨基酸残基取代参考Cas12b核酸酶中位于RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基。在一些实施方案中，位于RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基在三维结构中与单链DNA底物的距离在10(例如9、8、7、6、5、4、3、2、1或更少)埃内。在一些实施方案中，位于RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基位于以下的一个或多个位置：300、301、304、329、636、639、647、682、757、758、761、764、768、852、854、856、857、858、860、862、863、865、866、867、869、938、956、957、958、994、1093和1097。在一些实施方案中，位于RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基包含以下氨基酸残基中的一个或多个：D300、K301、E304、N329、E636、Q639、T647、Q682、I757、E758、E761、E764、K768、E852、Q854、N856、N857、D858、P860、S862、E863、N865、Q866、L867、Q869、E938、E956、G957、E958、I994、Q1093和W1097。在一些实施方案中，工程化Cas12b核酸酶包含用带正电荷的氨基酸残基取代以下氨基酸残基中的一个或多个：E636、Q639、T647、Q682、I757、E758、E761、K768、Q854、N857、D858、N865、Q866、I994、Q1093和W1097。在一些实施方案中，带正电荷的氨基酸残基是R或K。在一些实施方案中，工程化Cas12b核酸酶包含以下取代中的一种或多种：E636R、Q639R、T647R、Q682R、I757R、E758R、E761R、Q854R、N857K、D858R、I994R、Q1093R和W1097R。在一些实施方案中，工程化Cas12b核酸酶包含用疏水性氨基酸残基取代以下氨基酸残基中的一个或多个：E758、E761、E863、N865、Q866、Q869、Q956和Q1093。在一些实施方案中，疏水性氨基酸残基是W、Y、F，或M，诸如W、Y或M。在一些实施方案中，工程化Cas12b核酸酶包含以下取代中的一种或多种：N865W、N865Y、Q866M、Q869M、Q1093W和Q1093Y。在一些实施方案中，氨基酸残基根据SEQ ID NO:1编号。在一些实施方案中，所述工程化的Ca s12b核酸酶包含如SEQ ID NO:7至19中任一项所述的氨基酸序列。

在根据上述工程化Cas12b核酸酶中的任一种的一些实施方案中，工程化Cas12b核酸酶包含以下取代中的任一种或其组合：(1)D116R；(2)E475R；(3)Q119F和E475R；(4)Q119F、E475R，以及E758R；(5)Q119Y；(6)Q119F；(7)Q119W；(8)I757R；(9)E758R；(10)E761R；(11)K768R；(12)I757R和E758R；(13)I757R和E761R；(14)I757R和K768R；(15)E758R和E761R；(16)E758R和K768R；(17)E761R和K768R；(18)I757R、E758R，以及E761R；(19)I757R、E758R，以及K768R；(20)I757R、E761R，以及K768R；(21)E758R、E761R，以及K768R；(22)I757R、E758R、E761R，以及K768R；(23)Q866M；(24)Q869M；以及(25)Q866M和Q869M；(26)E636R；(27)Q854R；(28)N857K；(29)N865W；(30)N865Y；(31)Q1093W；(32)Q1093Y和(33)D858R；而其中氨基酸残基根据SEQ ID NO:1编号。在一些实施方案中，所述工程化的Cas12b核酸酶包含下述取代中的任一项或其组合：(1)Q866M+Q869M；(2)Q119F+E475R；及(3)Q119F+E475R+E758R；且其中所述氨基酸残基根据SEQ ID NO:1编号。在一些实施方案中，所述工程化Cas12b核酸酶包含如SEQIDNOs:20至22中任一项所述的氨基酸序列。

在根据上述工程化Cas12b核酸酶中的任一种的一些实施方案中，工程化Cas12b核酸酶包含与SEQ ID NO:2至SEQ ID NO:22中的任一个具有至少约85％(88％、90％、95％、96％、97％、98％、99％或更多)序列同一性的氨基酸序列。在一些实施方案中，工程化Cas12b核酸酶包含(或由下述组成，或基本上由下述组成)SEQ ID NO:1至SEQ ID NO:22中的任一个的氨基酸序列。

在根据上述工程化Cas12b核酸酶中的任一种的一些实施方案中，工程化Cas12b核酸酶还包含增加柔性区域的柔性的一种或多种突变，所述柔性区域包含氨基酸残基855至859。在一些实施方案中，增加柔性的一种或多种突变包含N856G。在一些实施方案中，所述氨基酸位置根据SEQ ID NO:1编号。

本申请的一个方面提供了工程化Cas12b核酸酶，其包含以下突变中的任一个或多个：(1)D116R；(2)E475R；(3)Q119F+E475R；(4)Q119F+E475R+E758R；(5)Q119Y；(6)Q119F；(7)Q119W；(8)I757R；(9)E758R；(10)E761R；(11)K768R；(12)I757R+E758R；(13)I757R+E761R；(14)I757R+K768R；(15)E758R+E761R；(16)E758R+K768R；(17)E761R+K768R；(18)I757R+E758R+E761R；(19)I757R+E758R+K768R；(20)I757R+E761R+K768R；(21)E758R+E761R+K768R；(22)I757R+E758R+E761R+K768R；(23)Q866M；(24)Q869M；(25)Q866M+Q869M；(26)E636R；(27)Q854R；(28)N857K；(29)N865W；(30)N865Y；(31)Q1093W；(32)Q1093Y；和(33)D858R；且其中氨基酸位置根据SEQ ID NO:1编号。在一些实施方案中，所述工程化的Cas12b核酸酶包含下述取代的任一项或其组合：(1)Q866M+Q869M；(2)Q119F+E475R；和(3)Q119F+E475R+E758R；且其中所述氨基酸残基根据SEQ ID NO:1编号。在一些实施方案中，所述工程化Cas12b核酸酶包含下述取代：Q119F+E475R+E758R；且其中所述氨基酸残基根据SEQIDNO:1编号。

本申请的一个方面提供了工程化Cas12b核酸酶，其与SEQ ID NO:2至22的任一个具有至少约85％(例如至少约88％、90％、95％、96％、97％、98％、99％或更多)的序列同一性，或者包含SEQ ID NO:2至SEQ ID NO:22中的任一个的氨基酸序列。

本申请的一个方面提供了包含根据上述工程化Cas12b核酸酶中的任一种的工程化Cas12b核酸酶或其变体或其功能性衍生物的工程化Cas12b效应蛋白。在一些实施方案中，工程化Cas12b核酸酶或其功能性衍生物具有酶活性。在一些实施方案中，工程化Cas12b效应蛋白能够诱导DNA分子中的双链断裂。在一些实施方案中，工程化Cas12b效应蛋白能够诱导DNA分子中的单链断裂。在一些实施方案中，工程化Cas12b效应蛋白包含工程化Cas12b核酸酶的酶失活突变体。在一些实施方案中，所述工程化Cas12b核酸酶的酶失活突变体包含选自下组的一个或多个氨基酸残基的取代：D570A、E848A、R785A、E848A、R911A，和D977A，并且其中所述氨基酸残基根据SEQIDN O:1编号。在一些实施方案中，所述工程化Cas12b核酸酶的酶失活突变体包含(或由下述组成，或基本上由下述组成)SEQ ID NO:79至81的任一项的氨基酸序列，或者其与SEQ ID NO:79至81的任一个具有至少约85％(例如至少约88％、90％、95％、96％、97％、98％、99％或更多的任一项)序列同一性的变体。

在根据上述工程化Cas12b效应蛋白中的任一种的一些实施方案中，工程化Cas12b效应蛋白还包含融合至工程化Cas12b核酸酶或其功能性衍生物的功能结构域。在一些实施方案中，所述功能结构域选自：翻译起始子结构域、转录阻遏子结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域、逆转录酶结构域、报告子结构域，以及核酸酶结构域。在一些实施方案中，所述转录抑制结构域是Krüppel-相关盒(KRAB)结构域，诸如包含SEQIDNO:72的氨基酸序列。

在根据上述工程化Cas12b效应蛋白中的任一种的一些实施方案中，工程化Cas12b效应蛋白包含第一多肽和第二多肽，第一多肽包含工程化Cas核酸酶或其功能性衍生物的N末端部分，第二多肽包含工程化Cas核酸酶或其功能性衍生物的C末端部分，其中第一多肽和第二多肽能够在包含指导序列的指导RNA的存在下彼此缔合以形成特异性结合至包含与指导序列互补的靶序列的靶核酸的CRISPR复合物。在一些实施方案中，工程化Cas12b效应蛋白包含第一多肽和第二多肽，其中第一多肽包含工程化Cas12b核酸酶或其功能性衍生物的N末端氨基酸残基1至X，其中第二多肽包含工程化Cas12b核酸酶或其功能性衍生物的X+1残基至C末端,其中第一多肽和第二多肽能够在含有指导序列的指导RNA的存在下彼此缔合以形成特异性结合至靶核酸的CRIS PR复合物，其中该靶核酸包含与指导序列互补的靶序列。在一些实施方案中，第一多肽和第二多肽各自包含二聚化结构域。在一些实施方案中，第一二聚化结构域和第二二聚化结构域在诱导物的存在下彼此缔合。在一些实施方案中，第一多肽和第二多肽不包含二聚化结构域。

本申请的另一方面提供了一种单指导RNA(sgRNA)，其包含如SEQ IDNO:25至53中任一项所述的序列。

本申请的另一方面提供了工程化CRISPR-Cas12b系统，其包含：(a)根据上述工程化Cas12b核酸酶中任一项所述的工程化Cas12b核酸酶或者根据上述工程化Cas12b效应蛋白中的任一种的工程化Cas12b效应蛋白，或其编码核酸；和(b)包含与靶核酸的靶序列互补的指导序列的指导RNA，或编码该指导RNA的核酸，其中工程化Cas12b效应蛋白和指导RNA能够形成特异性结合至所述包含靶序列的靶核酸的CRISPR复合物并诱导靶核酸的修饰。在一些实施方案中，指导RNA包含crRNA和tracrRNA。在一些实施方案中，工程化CRISPR-Cas12b系统包含编码多个crRNA的前体指导RNA阵列。在一些实施方案中，指导RNA是单指导RNA(sgRNA)。在一些实施方案中，所述sgRNA包含如SEQ ID NO:23至53中任一项所述的序列。在一些实施方案中，工程化CRISPR-Cas12b系统包含编码所述工程化Cas12b核酸酶或所述工程化Cas12b效应蛋白的一种或多种载体。在一些实施方案中，该一种或多种载体是腺相关病毒(AAV)载体。在一些实施方案中，AAV载体还编码指导RNA。

本申请的另一方面提供了一种工程化CRISPR-Cas12b系统，其包括：(a)根据上述工程化Cas12b核酸酶中任一项的工程化Cas12b核酸酶，或根据上述工程化Cas12b效应蛋白中任一项的工程化Cas12b效应蛋白，该Cas12b核酸酶或效应蛋白包含SEQ ID NO:1至22和79至81中任一项的氨基酸序列或其编码核酸；以及(b)gRNA，其包含与靶核酸或编码所述gRNA的核酸的靶序列互补的指导序列，其中所述gRNA包含工程化支架，所述工程化支架包含SE Q ID NO:25至53中任一项的序列；其中Cas12b核酸酶(例如工程化的)或其效应蛋白和gRNA能够形成特异性结合靶核酸的CRISPR复合物并诱导靶核酸的修饰。在一些实施方案中，所述gRNA包含crRNA和tracrRNA，并且其中tracrRNA包含工程化支架或其部分。在一些实施方案中，所述工程化的CRIS PR-Cas12b系统包含编码多种crRNA的前体gRNA阵列。在一些实施方案中，所述gRNA是sgRNA。在一些实施方案中，所述工程化CRISPR-Cas12b系统包含一种或多种编码工程化Cas12b核酸酶或其效应蛋白、或Cas12b核酸酶或其效应蛋白的载体。在一些实施方案中，所述一个或多个载体是AAV载体。在一些实施方案中，所述一个或多个载体进一步编码所述gRNA。

本申请的一个方面提供了检测样品中的靶核酸的方法，其包括：(a)将样品与根据上述工程化CRISPR-Cas12b系统中的任一种的工程化CRISPR-Cas12b系统和带标记的检测核酸接触，其中所述gRNA包含与所述靶核酸的靶序列互补的指导序列，且其中带标记的检测核酸是单链的并且不与指导RNA的指导序列杂交；和(b)测量由工程化Cas12b核酸酶或其效应蛋白切割带标记的检测核酸而产生的可检测信号，从而检测靶核酸。

本申请的一个方面提供了修饰包含靶序列的靶核酸的方法，其包含将靶核酸与根据上述工程化CRISPR-Cas12b系统中的任一种的工程化CRISPR-Ca s12b系统接触。在一些实施方案中，该方法在体外进行。在一些实施方案中，所述靶核酸存在于细胞中。在一些实施方案中，所述细胞是细菌细胞、酵母细胞、植物细胞，或动物细胞(例如哺乳动物细胞)。在一些实施方案中，所述方法离体进行。在一些实施方案中，所述方法在体内进行。在一些实施方案中，所述靶核酸被切割。在一些实施方案中，通过工程化CRISPR-Cas12b系统改变靶核酸中的靶序列。在一些实施方案中，通过工程化CRISPR-Cas12b系统改变所述靶核酸的表达。在一些实施方案中，靶核酸是基因组DNA。在一些实施方案中，所述靶序列与疾病或病症相关联。在一些实施方案中，工程化CRISPR-Cas12b系统包含编码多个crRNA的前体指导RNA阵列，其中每个crRNA包含不同的指导序列。

本申请的另一方面提供了治疗与个体的细胞中的靶核酸相关联的疾病或病症的方法，其包含使用根据上述工程化CRISPR-Cas12b系统中的任一种的工程化CRISPR-Cas12b系统修饰个体的细胞中的靶核酸，从而治疗所述疾病或病症。在一些实施方案中，所述疾病或病症选自：癌症、心血管疾病、遗传疾病、自身免疫疾病、代谢疾病、神经变性疾病、眼病、细菌感染，以及病毒感染。

还提供了包含经修饰的靶核酸的工程化细胞，其中已经使用根据上述修饰靶核酸的方法中的任一种的方法修饰了靶核酸)。还提供了工程化非人动物，该工程化非人动物包含其一种或多种工程化细胞。

还提供了用于上述方法中的任一种的组合物、试剂盒，以及制品。

应当理解，为了清楚起见，在单独实施方案的上下文中描述的本公开的某些特征也可以在单个实施方案中组合提供。相反，为了简洁起见，在单个实施方案的上下文中描述的本公开的各种特征也可以单独或以任何合适的子组合提供。与特定方法步骤、试剂，或条件，或组合物的组分有关的实施方案的所有组合均被本公开具体地涵盖并且在本文中公开，就如同每个和每种组合被单独和明确地公开一样。

附图说明

图1示出了示例性AaCas12b变体的基因编辑效率(％indel(插入缺失))，其中野生型AaCas12b中与PAM相互作用的氨基酸残基被R取代。与野生型(WT)AaCas12b相比，具有D116R或E475R取代的AaCas12b变体显示出提高的编辑效率。

图2示出了示例性AaCas12b变体的基因编辑效率，其中野生型AaCas12b中参与打开DNA双链的氨基酸残基被芳族氨基酸残基取代。与WTAaCas12b相比，具有Q119Y、Q119F或Q119W取代的AaCas12b变体显示出提高的基因编辑效率。

图3示出了示例性AaCas12b变体的基因编辑效率，其中野生型AaCas12b中位于RuvC结构域中并与单链DNA底物相互作用的氨基酸残基被R取代。

图4A至图4B示出了示例性AaCas12b变体的基因编辑效率，其中野生型AaCas12b中位于RuvC结构域中并与单链DNA相互作用的氨基酸残基被赖氨酸(K)或精氨酸(R)残基取代。图4A示出了在基因组位点CCR5-3处的编辑效率，而图4B示出了在基因组位点RNF2-5处的编辑效率。与WTAaCas12b相比，具有E636R、I757R、E758R、E761R、Q854R，D858R、E758K、I994R或N857K或D858K取代的AaCas12b变体显示出最为提高的基因编辑效率。

图5示出了示例性AaCas12b变体的基因编辑效率，其中野生型AaCas12b中位于RuvC结构域中并与单链DNA底物相互作用的氨基酸残基被疏水性氨基酸残基W、Y、F，或M取代。与WTAaCas12b相比，具有N865W、N865Y、Q866M、Q869M、Q1093W，或Q1093Y取代的AaCas12b变体显示出最为提高的基因编辑效率。

图6示出了与WTAaCas12b相比，具有组合突变的示例性AaCas12b变体的基因编辑效率。

图7示出了与WTAaCas12b和对应单突变体相比，AaCas12b变体Q119F+E475R+E758R具有显著提高的基因编辑效率。

图8示出了Cas12b蛋白的氨基酸序列的比对，包括AlicyclobacillusacidiphilusCas12b(AaCas12b)(SEQ ID NO:1)、AlicyclobacilluskakegawensisC as12b(AkCas12b)(SEQ ID NO:54)、AlicyclobacillusmacrosporangiidusCas12b(AmCas12b)(SEQ ID NO:55)、芽孢杆菌属(Bacillussp.)V3-13Cas12b(Bs3Cas12b)(SEQ ID NO:56)、芽孢杆菌(Bacillus)Cas12b(BsCas12b)(SEQ IDNO:57)、沉积物莱斯氏菌(Laceyellasediminis)Cas12b(LsCas12b)(SEQ ID N O:58)、久志芽孢杆菌(Bacillushisashii)Cas12b(BhCas12b)(SEQ ID NO:59)，以及螺旋体属细菌(Spirochaetesbacterium)Cas12b(SbCas12b)(SEQ ID NO:60)。本文所述的基于AaCas12b的取代可以在本文所述的任一种Cas12b直向同源物的对应氨基酸位置处进行。

图9示出了具有工程化支架的sgRNA大大提高了AaCas12b变体Q119F+E475R+E758R的基因编辑效率。带有AaCas12b-Aa-sg支架或AacCas12b-sgRN A支架(V0)的sgRNA用作对照。

图10A是编码在CMV启动子控制下的AaCas12b变体Q119F+E475R+E758R+D570A以及在U6启动子控制之下的sgRNA的示例性构建体的示意图。图10B示出了以T7EI测定结果表示的AaCas12b(Q119F+E475R+E758R)和AaCas12b(Q119F+E475R+E758R+D570A)的核酸酶活性的测量。sgRNA1和sgRNA2特异性识别HBG1/2中的靶位点。不靶向HBG1/2任何序列的对照sgRNA作为阴性对照。

图11A是编码在CMV启动子控制下的AaCas12b变体Q119F+E475R+E758R+D570A+E848A或Q119F+E475R+E758R+D570A+D977A以及在U6启动子控制之下的sgRNA的示例性构建体的示意图。图11B示出了以T7EI测定结果表示的，由特异性识别HBG1/2中靶位点的sgRNA1和sgRNA2介导的AaCa s12b(Q119F+E475R+E758R)、AaCas12c(Q119F+E475R+E758R+D570A+E848A)和AaCas12d(Q119F/E475R+E758R+D570A+D977A)的核酸酶活性的测量。不靶向HBG1/2任何序列的对照sgRNA用作阴性对照。

图12A是编码在CMV启动子控制下的与KRAB融合的AaCas12b(Q119F+E475R+E758R+D570A+D977A)以及在U6启动子控制之下的sgRNA的示例性构建体的示意图。图12B示出了用AaCas12b(Q119F+E475R+E758R+D570A+D977A)-KRAB融合蛋白转染的小鼠N2a细胞中小鼠Nav1.7的相对mRNA水平，该融合蛋白由不同sgRNA介导靶向SCN9A基因的不同位点。无sgRNA转染用作对照。

具体实施方式

本申请通过引入相对于参考Cas12b核酸酶的一种、两种，或三种类型的突变，提供了具有增加的酶活性(诸如基因编辑活性)的工程化Cas12b核酸酶。还提供了具有降低或者消除的核酸酶活性的工程化Cas12b核酸酶或其效应蛋白(例如dCas12b)。还提供了带有工程化支架序列的工程化指导RNA(gRN A)，在与Cas12b核酸酶(野生型或工程化的)共同使用时其能增加Cas12b酶活性(例如基因编辑活性)。还提供了工程化Cas12b效应蛋白，和使用工程化Ca s12b核酸酶或工程化Cas12b效应蛋白和/或工程化的gRNA的方法。

I.定义

除非另有定义，否则本文所用的所有技术和科学术语的含义与本公开所属领域的普通技术人员通常理解的含义相同。

如本文所用，术语“Cas12b蛋白”在其最广泛的意义上使用，并且包括亲本或参考Cas12b蛋白质(例如，包含SEQ ID NO:1的AaCas12b)、其衍生物或变体(例如，工程化Cas12b、dCas12b或工程化Cas12b效应蛋白)以及功能性片段，诸如其寡核苷酸结合片段。

如本文所用，“效应蛋白”是指具有诸如位点特异性结合活性、单链DN A切割或编辑活性、双链DNA切割或编辑活性、单链RNA切割或编辑活性，或转录调节活性等活性的蛋白。

如本文所用，“指导RNA”和“gRNA”在本文中可互换使用，是指能够与Cas12b核酸酶或效应蛋白和靶核酸(例如，双螺旋DNA)形成复合物的RNA。指导RNA可以包含单个RNA分子或经由两个或多个RNA分子中的互补区域的杂交而彼此缔合的两个或多个RNA分子。当与双RNA指导的Cas核酸酶(诸如Cas12b)结合使用时，指导RNA包含crRNA和tracrRNA，或者单指导RNA(sgRNA)。“crRNA”或“CRISPRRNA”包含与靶核酸(例如，双螺旋DNA)的靶序列具有足够互补性的指导序列，其指导CRISPR复合物与靶核酸的序列特异性结合。“tracrRNA”或“反式激活CRISPRRNA”与crRNA部分互补并且与crRNA碱基配对，并且可以在crRNA的成熟中发挥作用。“单指导RNA”或“sgRNA”是在单个分子中具有彼此融合的crRNA和tracrRNA的工程化指导RNA。

如本文所用，术语“CRISPR阵列”是指包含CRISPR重复序列和间隔区的核酸(例如，DNA)片段，其从第一个CRISPR重复的第一个核苷酸开始，并在最后一个(末端)CRISPR重复中的最后一个核苷酸结束。通常，CRISPR阵列中的每个间隔区位于两个重复区之间。如本文所使用的，术语“CRISPR重复”或“CRISPR直接重复”或者“直接重复”是指在CRISPR阵列中表现出非常小或没有序列变化的多个短的直接重复序列。适当地，V-I直接重复可以形成茎环结构。

如本文所用，“供体模板核酸”或“供体模板”可互换使用，指代在本文所述的CRISPR酶改变靶核酸后可被一种或多种细胞蛋白用于改变靶核酸结构的核酸分子。在一些实例中，供体模板核酸是双链核酸。在一些实例中，供体模板核酸是单链核酸。在一些示例中，供体模板核酸是线性的。在一些实例中，供体模板核酸是环形的(例如质粒)。在一些实例中，供体模板核酸是外源核酸分子。在一些实例中，供体模板核酸是内源性核酸分子(例如，染色体)。

术语“核酸”、“多核苷酸”，以及“核苷酸序列”可互换使用，是指任何长度的聚合形式的核苷酸，包括脱氧核糖核苷酸、核糖核苷酸、其组合，及其类似物。“寡核苷酸”和“低聚核苷酸”可互换使用，是指具有不超过约50个核苷酸的短多核苷酸。

如本文所用，“互补性”是指核酸通过传统的沃森-克里克碱基配对与另一核酸形成氢键的能力。互补性百分比指示核酸分子中可以与第二核酸形成氢键(即，沃森-克里克碱基配对)的残基的百分比(例如，约5、6、7、8、9、10/10，分别为约50％、60％、70％、80％、90％，以及100％互补性)。“完全互补”意指核酸序列的所有连续残基与第二核酸序列中相同数目的连续残基形成氢键。如本文所用，“基本上互补”是指在约40、50、60、70、80、100、150、200、250或更多个核苷酸的区域上至少约70％、75％、80％、85％、90％、95％、97％、98％、99％，或100％中的任一个的互补性程度，或指在严格条件下杂交的两个核酸。

如本文所用，用于杂交的“严格条件”是指这样的条件，在该条件下，与靶序列具有互补性的核酸主要与靶序列杂交，并且基本上不与非靶序列杂交。严格条件通常是序列依赖性的，并且根据许多因素而变化。通常，序列越长，序列与其靶序列特异性杂交的温度越高。严格条件的非限制性实例详细描述于Tijssen(1993)《生物化学与分子生物学中的实验室技术-用核酸探针杂交(Laboratory Techniques In Biochemistry And MolecularBiology-Hybrid ization With Nucleic Acid Probes)》第一部分,第二章“杂交原理和核酸探针测定策略概述(Overview of principles of hybridization and the strategyof nucleic acid probe assay)”爱思唯尔出版公司(Elsevier),纽约。

“杂交”是指一个或多个多核苷酸反应形成复合物的反应，复合物经由核苷酸残基的碱基之间的氢键结合而被稳定。氢键结合可以通过沃森克里克碱基配对、Hoogstein结合，或以任何其它序列特异性方式发生。能够与给定序列杂交的序列称为给定序列的“互补序列”。

相对于核酸序列的“序列同一性百分比(％)”被定义为：在通过允许缺口(如果需要的话)而比对序列以实现最大序列同一性百分比之后，候选序列中与特定核酸序列中的核苷酸相同的核苷酸的百分比。相对于肽、多肽，或蛋白序列的“序列同一性百分比(％)”为：在通过允许缺口(如果需要的话)而比对序列以实现最大序列同源性百分比之后，候选序列中与特定肽或氨基酸序列中的氨基酸残基相同取代的氨基酸残基的百分比。用于确定氨基酸序列同一性百分比的目的的比对可以以本领域技术人员已知的各种方式实现，例如，使用公众可获得的计算机软件，诸如BLAST、BLAST-2、ALIGN，或MEGALIGN^TM(DNASTAR)软件。本领域技术人员可以确定用于测量比对的适当参数，包括在被比较的序列的全长上实现最大比对所需的任何算法。

术语“多肽”和“肽”在本文中可互换使用，是指任何长度的氨基酸的聚合物。聚合物可以是直链或支链的，它可以包含经修饰的氨基酸，并且它可以被非氨基酸中断。蛋白可以具有一种或多种多肽。该术语还涵盖已经被修饰的氨基酸聚合物；例如，二硫键形成、糖基化、脂化、乙酰化、磷酸化，或任何其它操控，诸如与标记组分缀合。

如本文所用，“变体”被解释为意指分别不同于参考多核苷酸或多肽但保留基本性质的多核苷酸或多肽。多核苷酸的典型变体在核酸序列上不同于另一参考多核苷酸。变体的核酸序列的改变可以改变或不改变由参考多核苷酸编码的多肽的氨基酸序列。如下所讨论，核苷酸变化可以导致由参考序列编码的多肽中的氨基酸取代、添加、缺失、融合，以及截短。多肽的典型变体在氨基酸序列上不同于另一参考多肽。通常，差异是有限的，使得参考多肽和变体的序列总体上非常类似，并且在许多区域中是相同的。变体和参考多肽在氨基酸序列上可以通过一个或多个取代、添加、缺失(以任何组合)而不同。经取代或插入的氨基酸残基可以是或不是由遗传密码编码的氨基酸残基。多核苷酸或多肽的变体可以是天然存在的，诸如等位基因变体，或者它可以是未知天然存在的变体。多核苷酸和多肽的非天然存在的变体可以通过诱变技术、通过直接合成，以及通过本领域技术人员已知的其它重组方法制成。

如本文所用，术语“野生型”具有本领域技术人员通常理解的含义，意指生物体、菌株、基因，或特征的典型形式，当其天然存在时，其区别于突变体或变体。它可以从天然来源中分离而非有意修饰。

如本文所用，术语“非天然存在的”或“工程化”可互换使用并且是指人工参与。当这些术语用于描述核酸分子或多肽时，是指该核酸分子或多肽至少基本上不含其天然的或天然发现的关联物的至少一种其它组分。

如本文所用，术语“直向同源物”或“直向同源”具有本领域普通技术人员通常理解的含义。作为进一步的指导，本文提及的蛋白的“直向同源物”是指属于不同种类的蛋白，其执行与作为其直向同源物的蛋白相同或类似的功能。

如本文所用，术语“同一性”用于意指两个多肽之间或两个核酸之间的序列匹配。当被比较的两个序列中的一个位置被相同碱基或氨基酸单体亚基占据时(例如，两个DNA分子中的每一个中的一个位置被腺嘌呤占据，或两个多肽中的每一个中的每个位置被赖氨酸占据)，每个分子在该位置处是相同的。两个序列之间的“同一性百分比”是两个序列共享的匹配位置的数目除以待比较的位置的数目×100的函数。例如，如果两个序列的10个位置中的6个匹配，则这两个序列具有60％同一性。例如，DNA序列CTGACT和CA GGTT共享50％同一性(总共6个位置中的3个匹配)。通常，当两个序列被比对以产生最大同一性时进行比较。这种比对可以通过例如Needleman等人(1970)《分子生物学杂志(J.Mol.Biol.)》48:443-453的方法实现，该方法可以通过计算机程序(诸如Align程序(DNAstar公司))方便地执行。还可以使用整合到ALIGN程序(版本2.0)中的E.Meyers和W.Miller(《生物科学中的计算机应用(Comput.ApplBiosci.)》4:11-17(1988))的算法，使用PAM120权重残差表。使用12的缺口长度罚分和4的缺口罚分来确定两个氨基酸序列之间的同一性百分比。此外，可以使用整合到GCG软件包(可以从www.gcg.com获得)中的GAP程序中的Needleman-Wunsch(《分子生物学杂志》48:444-453(1970))算法，使用Blossum62矩阵或PAM250矩阵和16、14、12、10、8、6，或4的缺口权重以及1、2、3、4、5，或6的长度权重来确定两个氨基酸序列之间的同一性百分比。

如本文所用，“细胞”应当理解为不仅指特定的单个细胞，而且指细胞的后代或潜在后代。因为由于突变或环境影响，某些修饰可能在随后的世代中发生，所以这种后代实际上可能与亲本细胞不同，但仍包括在如本文所用的术语的范围内。

如本文所用，术语“转导”和“转染”包括本领域已知的使用感染剂(诸如病毒)或其它方法将DNA引入细胞以表达感兴趣的蛋白或分子的所有方法。除了病毒或病毒样试剂之外，还有基于化学的转染方法，诸如使用磷酸钙、树状聚合物、脂质体，或阳离子聚合物(例如，DEAE-葡聚糖或聚乙烯亚胺)的那些方法；非化学方法，诸如电穿孔、细胞挤压、声致穿孔、光学转染、穿刺转染、原生质体融合、质粒递送，或转座子；基于粒子的方法，诸如使用基因枪、磁转染，或磁体辅助转染、粒子轰击；以及杂交方法，诸如核转染。

如本文所用，术语“经转染的”或“经转化的”或“经转导的”是指外源核酸被转移到或引入宿主细胞的过程。“经转染的”或“经转化的”或“经转导的”细胞是已经用外源核酸转染、转化，或转导的细胞。

术语“体内”是指获得细胞的生物体的身体之内。“离体”或“体外”意指获得细胞的生物体的身体之外。

如本文所用，“治疗(treatment)”或“治(treating)”是获得有益的或期望的结果(包括临床结果)的方式。出于本申请的目的，有益的或期望的临床结果包括但不限于以下各项中的一个或多个：减轻由疾病引起的一种或多种症状、降低疾病的程度、稳定疾病(例如，预防或延迟疾病的恶化)、预防或延迟疾病的扩散(例如，转移)、预防或延迟疾病的复发、降低疾病的复发率、延迟或减缓疾病的进展、改善疾病状态、提供疾病的缓解(部分或全部)、降低治疗疾病所需的一种或多种其它药物的剂量、延迟疾病的进展，提高生活质量，和/或延长存活。“治疗”还涵盖减少癌症的病理后果。本申请的方法设想了这些治疗方面中的任一个或多个。

如本文所用，术语“有效量”是指足以治疗指定病状、病症，或疾病(诸如改善、减轻、减轻，和/或延迟其症状中的一种或多种)的化合物或组合物的量。如本领域所理解的，“有效量”可以是在一剂或多剂中，即，可能需要单剂量或多剂量来实现期望的治疗终点。

出于治疗的目的，“受试者”、“个体”，或“患者”在本文中可互换使用，并且是指诸如哺乳动物(包括人类、家畜以及农场动物，以及动物园动物、运动动物，或宠物动物，诸如狗、马、猫、牛等)、鸟类、爬行类、鱼类等的任何动物。在一些实施方案中，个体是人类个体。

应当理解，本文所述的本申请的实施方案包括“由……组成”和/或“基本上由……组成”实施方案。

本文提及“约”一个值或参数包括(并描述)针对该值或参数本身的变化。例如，关于“约X”的描述包括“X”的描述。

如本文所用，提及“不是”一个值或参数通常意指并描述“除了”一个值或参数。例如，方法不用于治疗X型癌症意味着该方法用于治疗除了X以外的类型的癌症。

如本文所用，术语“约X-Y”具有与“约X至约Y”相同的含义。

如本文和所附权利要求中所用，单数形式“一个(a)”、“一个(an)”，以及“该/所述(the)”包括复数指示物，除非上下文另有明确规定。还应当注意，权利要求书可以被起草为排除任何可选要素。照此，该陈述旨在用作结合权利要求要素的叙述来使用诸如“仅”、“只”等排他性术语或使用“否定式”限制的先行基础。

如本文所用，术语“和/或”，诸如“A和/或B”的短语旨在包括A和B两者；A或B；A(单独)；以及B(单独)。同样地，如本文所用，术语“和/或”，诸如“A、B，和/或C”的短语旨在涵盖以下实施方案中的每一者：A、B，以及C；A、B，或C；A或C；A或B；B或C；A和C；A和B；B和C；A(单独)；B(单独)；以及C(单独)。

本领域普通技术人员将理解，尿嘧啶和胸腺嘧啶都可以用“t”表示，而不是尿嘧啶为“u”且胸腺嘧啶为“t”；在核糖核酸的上下文中，除非另有说明，“t”用于表示尿嘧啶。

II.Cas12b核酸酶和效应蛋白

本申请提供了具有提高的活性(诸如靶结合活性、双链切割活性、切口酶活性，和/或基因编辑活性)的工程化Cas12b核酸酶和效应蛋白。还提供了带有降低或消除的核酸酶活性的工程化Cas12b核酸酶(dCas12b)。在一些实施方案中，提供了工程化Cas12b效应蛋白(例如，Cas12b核酸酶、Cas12b切口酶、Cas12b融合效应蛋白，或分裂的Cas12b效应蛋白)，该工程化Cas12b效应蛋白包含本文所述的工程化Cas12b核酸酶或其功能性衍生物中的任一种。

工程化Cas12b核酸酶

在一方面，本申请提供了具有提高的活性(例如，靶结合活性、双链切割活性、切口酶活性，和/或基因编辑活性)的工程化Cas12b效应蛋白。

在一些实施方案中，提供了工程化Cas12b核酸酶，其包含相对于参考Ca s12b核酸酶的一种、两种，或三种类型的突变，其中突变包含：(1)用带正电荷的氨基酸残基(例如R、H、K)取代参考Cas12b核酸酶中与前间区序列邻近基序(PAM)相互作用的一个或多个氨基酸残基；和/或(2)用具有芳环的氨基酸残基(例如F、Y、W)取代参考Cas12b核酸酶中参与打开DNA双链(dsDNA)的一个或多个氨基酸残基；和/或(3)用带正电荷的氨基酸残基(例如R、H、K)或疏水性氨基酸残基(例如F、Y、W、M)取代参考Cas12b核酸酶的RuvC结构域中与单链DNA底物相互作用的一个或多个氨基酸残基。在一些实施方案中，参考Cas12b核酸酶是天然存在的野生型Cas12b核酸酶。在一些实施方案中，所述参考Cas12b核酸酶是天然变体Cas12b核酸酶。在一些实施方案中，所述参考Cas12b核酸酶是来自嗜酸脂环杆菌(Alicyclobacillusacidiphilus)的Cas12b核酸酶(AaCas12b)。在一些实施方案中，参考Cas12b核酸酶包含SEQ ID N O:1的氨基酸序列。在一些实施方案中，与所述参考Cas12b核酸酶相比，所述工程化的Cas12b核酸酶具有增加的(例如，增加至少约10％、20％、30％、40％、50％、60％、70％、80％、90％、1倍、1.2倍、1.5倍、2倍、5倍、10倍、20倍、50倍、100倍或更高)活性(例如，靶结合、双链切割活性、切口酶活性和/或基因编辑活性)。

工程化Cas12b核酸酶可以包含下面的下文A至C节中所述的突变中的一种或多种。在一些实施方案中，本申请中的突变中的一种或多种可以与已知Cas12b突变(诸如下文D节中所述的突变)中的任一种组合，以产生具有提高的活性的工程化Cas12b核酸酶。

在一些实施方案中，提供了包含相对于参考Cas12b核酸酶的一种或多种突变的工程化Cas12b核酸酶，其中该一种或多种突变包含用带正电荷的氨基酸残基(例如，R或K)取代参考Cas12b核酸酶中与(PAM)相互作用的一个或多个氨基酸残基。在一些实施方案中，提供了包含相对于参考Cas12b核酸酶的一种或多种突变的工程化Cas12b核酸酶，其中该一种或多种突变包含用具有芳环(例如，W、Y，或F)的氨基酸残基取代参考Cas12b核酸酶中参与打开DNA双链的一个或多个氨基酸残基。在一些实施方案中，提供了包含相对于参考Cas12b核酸酶的一种或多种突变的工程化Cas12b核酸酶，其中该一种或多种突变包含用带正电荷的氨基酸残基(例如，R或K)取代参考Cas12b核酸酶的RuvC结构域中与单链DNA底物相互作用的一个或多个氨基酸残基。在一些实施方案中，提供了包含相对于参考Cas12b核酸酶的一种或多种突变的工程化Cas12b核酸酶，其中该一种或多种突变包含用疏水性氨基酸残基(例如，W、Y、F，或M)取代参考Cas12b核酸酶的RuvC结构域中与单链DNA底物相互作用的一个或多个氨基酸残基。在一些实施方案中，所述参考Cas12b核酸酶包含SEQ ID NO:1的氨基酸序列。

在一些实施方案中，提供了包含相对于参考Cas12b核酸酶的一种或多种突变的工程化Cas12b核酸酶，其中该一种或多种突变包含：1)用带正电荷的氨基酸残基(例如R、H、K)取代参考Cas12b核酸酶中与PAM相互作用的一个或多个氨基酸残基，和2)用具有芳环的氨基酸残基(例如F、Y、W)取代参考Cas12b核酸酶中参与打开DNA双链的一个或多个氨基酸残基。在一些实施方案中，提供了包含相对于参考Cas12b核酸酶的一种或多种突变的工程化Cas12b核酸酶，其中该一种或多种突变包含：1)用带正电荷的氨基酸残基(例如R、H、K)取代参考Cas12b核酸酶中与PAM相互作用的一个或多个氨基酸残基，和2)用带正电荷的氨基酸残基(例如R、H、K)或疏水性氨基酸残基(例如F、Y、W、M)取代参考Cas12b核酸酶的RuvC结构域中与单链DNA底物相互作用的一个或多个氨基酸残基。在一些实施方案中，提供了包含相对于参考Cas12b核酸酶的一种或多种突变的工程化Cas12b核酸酶，其中该一种或多种突变包含：1)用具有芳环的氨基酸残基(例如F、Y、W)取代参考Cas12b核酸酶中参与打开DNA双链的一个或多个氨基酸残基，和2)用带正电荷的氨基酸残基(例如R、H、K)或疏水性氨基酸残基(例如F、Y、W、M)取代参考Cas12b核酸酶的RuvC结构域中与单链DNA底物相互作用的一个或多个氨基酸残基。在一些实施方案中，所述参考Cas12b核酸酶包含SEQ ID NO:1的氨基酸序列。

在一些实施方案中，提供了包含相对于参考Cas12b核酸酶的一种或多种突变的工程化Cas12b核酸酶，其中该一种或多种突变包含：1)用带正电荷的氨基酸残基(例如R、H、K)取代参考Cas12b核酸酶中与PAM相互作用的一个或多个氨基酸残基，2)用具有芳环的氨基酸残基(例如F、Y、W)取代参考Ca s12b核酸酶中参与打开DNA双链的一个或多个氨基酸残基，和3)用带正电荷的氨基酸残基(例如R、H、K)取代参考Cas12b核酸酶的RuvC结构域中与单链DNA底物相互作用的一个或多个氨基酸残基。在一些实施方案中，所述参考Cas12b核酸酶包含SEQ ID NO:1的氨基酸序列。

在一些实施方案中，提供了包含相对于参考Cas12b核酸酶的一种或多种突变的工程化Cas12b核酸酶，其中该一种或多种突变包含：1)用带正电荷的氨基酸残基(例如R、H、K)取代参考Cas12b核酸酶中与PAM相互作用的一个或多个氨基酸残基，2)用具有芳环的氨基酸残基(例如F、Y、W)取代参考Ca s12b核酸酶中参与打开DNA双链的一个或多个氨基酸残基，和3)用疏水性氨基酸残基(例如F、Y、W、M)取代参考Cas12b核酸酶的RuvC结构域中与单链DNA底物相互作用的一个或多个氨基酸残基。在一些实施方案中，所述参考Cas12b核酸酶包含SEQ ID NO:1的氨基酸序列。

本文所述的突变可以基于参考Cas12b核酸酶的结构来设计。作为二元复合物结合至sgRNA并且作为三元复合物结合至靶DNA的酸土脂环酸芽胞杆菌(Alicyclobacillusacidoterrestris)Cas12b的晶体结构已经描述于YangH.等人《细胞(Cell)》167:1814-1828(2016)和LiuL.等人《分子细胞(Mol.Cell)》65:310-322(2017)。简而言之，晶体结构显示出2个不连续的REC(识别，残基15至386、658至783)和NUC(核酸酶，残基1至14、387至658以及784至1129)叶，它们各自由若干结构域组成。crRNA(或单指导RNA、sgRNA)结合在两个叶之间的中心通道中。PAM识别是序列特异性的，并且主要经由与REC1(螺旋-1)和WED-II(OBD-II)结构域的相互作用而发生。sgRNA-靶DNA异源双螺旋主要以非序列依赖性方式结合至REC叶。

应当理解，其它Cas12b直向同源物，诸如BhCas12b(SEQ ID NO:59)、Bs3Cas12b(SEQ ID NO:56)、LsCas12b(SEQ ID NO:58)、SbCas12b(SEQ ID NO:60)、AkCas12b(SEQ IDNO:54)、AmCas12b(SEQ ID NO:55)、BsCas12b(SEQ ID NO:57)，以及DiCas12b等，具有与本文所述的AaCas12b(SEQ ID NO:1)和其它示例性参考Cas12b蛋白类似的结构域结构，并且可以基于直向同源物中的任一种使用对应于本文所述的示例性工程化AaCas12b蛋白的分裂位置来设计工程化Cas12b蛋白。当两个多肽的氨基酸序列彼此比对时，对应位置是指两个多肽中彼此比对的位置。参见本申请的图8。而且，TengF.等人《细胞发现(CellDiscovery)》(2019)5:23中的图S2提供了AaCa s12b，AkCas12b，AmCas12b，Bs3Cas12b，BsCas12b，LsCas12b，BhCas12b，以及SbCas12b的比对，该文通过引用整体并入本文。

A.用带正电荷的氨基酸残基取代参考Cas12b中与PAM相互作用的一个或多个氨基酸残基。

在一些实施方案中，工程化Cas12b核酸酶包含用带正电荷的氨基酸残基(例如R、H、K)取代参考Cas12b核酸酶中与(PAM)相互作用的一个或多个氨基酸残基。在一些实施方案中，工程化Cas12b核酸酶包含一个、两个、三个、四个、五个，或六个氨基酸取代。

在一些实施方案中，参考Cas12b核酸酶中与PAM相互作用的一个或多个氨基酸残基是在三维结构中与PAM的距离在15(例如在14、13、12、11、10、9、8、7、6、5、4、3、2、1或更少以内)埃内的氨基酸。在一些实施方案中，参考Cas12b核酸酶中与PAM相互作用的一个或多个氨基酸残基是三维结构中距PAM 10埃以内的氨基酸。在一些实施方案中，参考Cas12b核酸酶中与PAM相互作用的一个或多个氨基酸残基是三维结构中距PAM 9埃以内的氨基酸。在一些实施方案中，与PAM相互作用的一个或多个氨基酸残基位于以下的一个或多个位置：116、123、130、132、144、145、153、173、222、395、400和475。在一些实施方案中，与PAM相互作用的一个或多个氨基酸残基包含以下氨基酸残基中的一个或多个：D116、K123、D130、D132、N144、K145、E153、D173、Q222、D395、N400和E475。在一些实施方案中，与PAM相互作用的一个或多个氨基酸残基包含以下氨基酸残基中的一个或多个：D116和E475。在一些实施方案中，氨基酸残基根据SEQ ID NO:1编号。

在本申请的上下文中，D116是指被参考的氨基酸序列中的第116个氨基酸D(天冬氨酸)。常用氨基酸的3字母和1字母缩写如下列出：

Ala(A)	Leu(L)	Gln(Q)	Ser(S)
				Arg(R)	Lys(K)	Glu(E)	Thr(T)
Asn(N)	Met(M)	Gly(G)	Trp(W)
				Asp(D)	Phe(F)	His(H)	Tyr(Y)
Cys(C)	Pro(P)	Ile(I)	Val(V)

如本文所用，“氨基酸在位置X处，其中氨基酸根据SEQ ID NO:1编号”是指位于参考酶Cas12b的某一位置处的氨基酸残基，当参考酶Cas12b和SEQ ID NO:1的氨基酸序列基于序列同源性而比对时，该位置对应于SEQ ID NO:1中的位置X。例如，图8示出了Cas12b直向同源物(SEQ ID NO:1和SEQ ID NO:54至SEQ ID NO:60)的氨基酸序列的同源性比对。本领域技术人员可以容易地使用已知软件(诸如Clustal Omega)来将任何参考Cas12b核酸酶的氨基酸序列与SEQ ID NO:1进行比较和比对，以确定对应于SEQ ID NO:1中的位置X的氨基酸位置。

在一些实施方案中，所述带正电荷的氨基酸残基是R、H或K。在一些实施方案中，带正电荷的氨基酸残基是R。在一些实施方案中，带正电荷的氨基酸残基是K。

在一些实施方案中，用带正电荷的氨基酸残基取代与PAM相互作用的参考Cas12b核酸酶中的一个或多个氨基酸残基是以下取代中的一种或多种：D116R、K123R、D130R、D132R、N144R、K145R、E153R、D173R、Q222R、D395R、N400R和E475R。在一些实施方案中，用带正电荷的氨基酸残基取代参考Cas12b核酸酶中与PAM相互作用的一个或多个氨基酸残基是以下取代中的一种或多种：D116R和E475R。在一些实施方案中，工程化Cas12b核酸酶包含D116R突变。在一些实施方案中，工程化Cas12b核酸酶包含E475R突变。在一些实施方案中，氨基酸残基根据SEQ ID NO:1编号。

在一些实施方案中，工程化Cas12b核酸酶包含与SEQ ID NO:2或SEQ ID NO:3的氨基酸序列具有至少月85％序列同一性(诸如至少约87％、90％、91％、92％、93％、94％、95％、96％、97％、98％，或99％序列同一性中的任一个)的氨基酸序列。在一些实施方案中，工程化Cas12b核酸酶包含SE Q ID NO:2或SEQ ID NO:3的氨基酸序列。

B.用具有芳环的氨基酸残基取代参考Cas12b核酸酶中参与打开DNA双链的一个或多个氨基酸残基

在一些实施方案中，工程化Cas12b核酸酶包含用具有芳环的氨基酸残基(例如F、Y、W)取代参考Cas12b核酸酶中参与打开DNA双链的一个或多个氨基酸残基。在一些实施方案中，工程化Cas12b核酸酶包含一个、两个、三个、四个、五个，或六个氨基酸残基的取代。

在一些实施方案中，参与打开DNA双链的一个或多个氨基酸残基与PA M中相对于靶链3'端的最后碱基对相互作用。例如，由AaCas12b识别的PAM序列是5'-TTN-3'碱基对。PAM中相对于靶链3'端的最后碱基对是由PAM序列3'端处的N碱基形成的碱基对，随后是靶位点的序列。

在一些实施方案中，参与打开DNA双链的一个或多个氨基酸残基位于以下的一个或多个位置：118，和/或119，诸如Q118和/或Q119。在一些实施方案中，氨基酸残基根据SEQID NO:1编号。

在一些实施方案中，具有芳环的氨基酸残基是Y、F或W。在一些实施方案中，参与打开DNA双链的氨基酸残基被F、Y或W取代。在一些实施方案中，所述工程化的Cas12b核酸酶包含以下任一项：i)Q118Y、Q118F或Q118W；和/或ii)Q119Y、Q119F或Q119W。在一些实施方案中，所述氨基酸残基编号是根据SEQ ID NO:1。

在一些实施方案中，用具有芳环的氨基酸取代参考Cas12b核酸酶中参与打开DNA双链的一个或多个氨基酸残基是Q119Y、Q119F或Q119W取代。在一些实施方案中，氨基酸残基根据SEQ ID NO:1编号。

在一些实施方案中，工程化Cas12b核酸酶包含与SEQ ID NO:4、SEQ ID NO:5或SEQID NO:6的氨基酸序列具有至少约85％序列同一性(诸如至少约88％、90％、91％、92％、93％、94％、95％、96％、97％、98％，或99％序列同一性中的任一个)的氨基酸序列。在一些实施方案中，工程化Cas12b核酸酶包含SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6的氨基酸序列。

C.用带正电荷的氨基酸残基或疏水性氨基酸残基取代参考Cas12b核酸酶的RuvC结构域中与单链DNA底物相互作用的一个或多个氨基酸残基。

在一些实施方案中，工程化Cas12b核酸酶包含用带正电荷的氨基酸残基(例如R、H、K)取代参考Cas12b核酸酶中位于RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基。在一些实施方案中，工程化Cas12b核酸酶包含用疏水性氨基酸残基(例如F、Y、W、M)取代参考Cas12b核酸酶中位于RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基。在一些实施方案中，工程化Cas12b核酸酶包含一个、两个、三个、四个、五个，或六个氨基酸残基的取代。

在一些实施方案中，位于RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基在三维结构中与单链DNA底物的距离在15(例如在14、13、12、11、10、9、8、7、6、5、4、3、2、1或更少以内)埃内。在一些实施方案中，在RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基在三维结构中距离单链DNA底物10埃以内。在一些实施方案中，在RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基在三维结构中距离单链DNA底物9埃以内。RuvC结构域是负责分割单链DNA或双链DNA的Cas12b蛋白的活性结构域。在蛋白的一级序列中，RuvC结构域包含第一RuvC结构域(RuvC-1)、第二RuvC结构域(RuvC-II)，以及第三RuvC结构域(RuvC-III)。

在一些实施方案中，位于RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基位于以下的一个或多个位置：300、301、304、329、636、639、647、682、757、758、761、764、768、852、854、856、857、858、860、862、863、865、866、867、869、938、956、957、958、994、1093，和1097。在一些实施方案中，位于RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基包含以下氨基酸残基中的一个或多个：D300、K301、E304、N329、E636、Q639、T647、Q682、I757、E758、E761、E764、K768、E852、Q854、N856、N857、D858、P860、S862、E863、N865、Q866、L867、Q869、E938、E956、G957、E958、I994、Q1093，和W1097。在一些实施方案中，在RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基包含一个或更多个以下氨基酸残基：D300、K301、E636、Q639、T647、Q682、I757、E758、E761、K768、Q854、N857、D858、N865、Q866、Q869、I994、Q1093和W1097。在一些实施方案中，在RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基包括一个或更多个以下氨基酸残基：E636、I757、E758、E761、Q854、N857、D858、N865、Q866、Q869和Q1093。在一些实施方案中，氨基酸残基根据SEQIDNO:1编号。

在一些实施方案中，工程化Cas12b核酸酶包含用带正电荷的氨基酸残基(例如R、H、K)取代参考Cas12b核酸酶中位于RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基。在一些实施方案中，带正电荷的氨基酸残基是R。在一些实施方案中，带正电荷的氨基酸残基是K。在一些实施方案中，工程化的Cas12b核酸酶包含以下取代中的一种或多种：D300R、K301R、E304R、N329R、E636R、Q639R、T647R、Q682R、I757R、E758R、E761R、E764R、K768R、E852R、Q854R、N856R、N857R、D858R、P860R、S862R、E863R、N865R、Q866R、L867R、Q869R、E938R、E956R、G957R、E958R、I994R、Q1093R、W109R7R、E636K、Q639K、T647K、Q682K、I757K、E758K、E761K、Q854K、N857K、D858K、N865K、Q866K、I994K、Q1093K和W1097K，其中氨基酸残基根据SEQ ID NO:1编号。在一些实施方案中，工程化的Cas12b核酸酶包含以下取代中的一种或多种：D300R、K301R、E636R、Q639R、T647R、Q682R、I757R、E758R、E761R、K768R、Q854R、N857R、D858R、N865R、Q866R、I994R、Q1093R、W1097R、E635K、Q639K、T647K、Q682K、I757K、E758K、E761K、Q854K、，N857K、D858K、N865K、I994K、Q1093K和W1097K，其中所述氨基酸残基根据SEQ ID NO:1编号。在一些实施方案中，所述工程化Cas12b核酸酶包含以下取代中的一种或多种：E636R、I757R、E758R、E761R、Q854R、D858R、E636K、I757K、E758K、E761K、Q854K、N857K和D858K，其中氨基酸残基编码根据SEQ ID NO：1。在一些实施方案中，工程化Cas12b核酸酶包含E636R、I757R、E758R、E761R、Q854R，和D857R，其中氨基酸残基根据SEQID NO:1编号。在一些实施方案中，工程化Cas12b核酸酶包含以下取代中的一种或多种：E636K、I757K、E758K、E761K、Q854K、N857K和D858K，其中氨基酸残基根据SEQ ID NO:1编号。

在一些实施方案中，取代参考Cas12b核酸酶中位于RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基是以下取代中的一种或多种：E636R、I757R、E758R、E761R、Q854R、N857K和D858R，其中氨基酸残基根据SEQ ID NO:1编号。在一些实施方案中，所述工程化的Cas12b核酸酶包含与SEQ ID NO:7至13中任一项的氨基酸序列具有至少约85％序列同一性的氨基酸序列，例如至少约88％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的序列同一性。在一些实施方案中，所述工程化的Cas12b核酸酶包含SEQID NO:7至13中任一项的氨基酸序列。

在一些实施方案中，工程化Cas12b核酸酶包含用疏水性氨基酸残基取代参考Cas12b核酸酶中位于RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基。在一些实施方案中，疏水性氨基酸残基是A、M、L、I、V、C、Y、F，或W。在一些实施方案中，疏水性氨基酸残基是W、Y、F，或M。在一些实施方案中，疏水性氨基酸残基是W、Y或M。在一些实施方案中，工程化Cas12b核酸酶包含以下取代中的一种或多种：i)E758W、E758Y、E758F或E758M，ii)E761W、E761Y、E761F或E761M，iii)E863W、E863Y、E863F或E863M，iv)N865W、N865Y、N865F或N865M，v)Q866W、Q866F、Q866Y或Q866M，vi)Q869W、Q869Y、Q869F或Q869M，vii)E956W、E956Y、E956MF或E956M，以及viii)Q1093W、Q1093F、Q1093Y或Q1093M；其中所述氨基酸残基根据SEQ ID NO:1编号。在一些实施方案中，所述工程化Cas12b核酸酶包含以下取代中的一种或多种：i)E758W、E758Y或E758M，ii)E761Y，iii)N865W、N865F或N865Y，iv)Q866M，v)Q869M，和vi)Q1093W、Q1093F、Q1093Y或Q1093M；其中所述氨基酸残基根据SEQIDNO:1编号。在一些实施方案中，所述工程化Cas12b核酸酶包含以下取代中的一种或多种：i)N865W或N865Y，ii)Q866M，iii)Q869M，和iv)Q1093W或Q1093Y；其中所述氨基酸残基根据SEQ ID NO:1编号。

在一些实施方案中，所述工程化Cas12b核酸酶包含以下取代中的一种或多种：865W、865Y、866M、869M、1093W，和1093Y。在一些实施方案中，取代参考Cas12b核酸酶中位于RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基是以下取代中的一种或多种：N865W、N865Y、Q866M、Q869M、Q1093W，和/或Q1093Y。在一些实施方案中，工程化Cas12b核酸酶包含Q866M和Q869M取代。在一些实施方案中，氨基酸残基根据SE Q ID NO:1编号。

在一些实施方案中，工程化Cas12b核酸酶包含与SEQ ID NO:7至SEQ ID NO:20中的任一个的氨基酸序列具有至少约85％序列同一性(诸如至少约88％、90％、91％、92％、93％、94％、95％、96％、97％、98％，或99％序列同一性中的任一个)的氨基酸序列。在一些实施方案中，工程化Cas12b核酸酶包含SEQ ID NO:14至SEQ ID NO:20中的任一个的氨基酸序列。

D.其它突变

在上面A至C节中描述的突变中的任一种或多种可以与增加Cas12b活性(诸如靶结合活性、靶特异性、双链切割活性、切口酶活性，和/或基因编辑活性)的已知突变中的任一种或多种组合。示例性突变可以在例如以下文件WO2022120520、WO2022040909、WO2022042557、CN113308451A和CN112195164A中找到，它们的内容通过引用整体并入本文。

在一些实施方案中，参考Cas12b蛋白从N端到C端包含以下一个或多个：第一WED结构域(WED-I)、第一REC结构域(REC1)、第二WED结构(WED-II)、第一RuvC结构域(RuvC-I)、BH结构域、第二REC结构域(REC2)、第二RuvC结构域(RuvCII)、第一Nuc结构域(Nuc-I)、第三RuvC构造域(RucIII)和第二Nuc结构域(NucII)。在一些实施方案中，其他一个或多个突变(例如，插入、删除、替换)可以存在于一个或更多个这样的结构域中。

在一些实施方案中，工程化Cas12b核酸酶还包含一个或多个柔性区域突变，这些柔性区域突变增加参考Cas12b核酸酶中的柔性区域的柔性。可以使用本领域已知的任何方法确定参考Cas12b核酸酶中的柔性区域。在一些实施方案中，仅基于参考酶的氨基酸序列确定多个柔性区域。在一些实施方案中，基于参考酶的结构信息确定多个柔性区域，包括例如二级结构、晶体结构、NMR结构等。

在一些实施方案中，使用选自以下组的程序确定多个柔性分区：PredyF lexy、FoldUnfold、PROFbval、Flexserv、FlexPred、DynaMine，以及Disomi ne。在一些实施方案中，多个柔性区域位于随机卷曲处。在一些实施方案中，多个柔性区域在参考Cas12b核酸酶的DNA和/或RNA相互作用结构域中。在一些实施方案中，柔性区域的长度为至少约5(例如，5)个氨基酸。

在一些实施方案中，工程化Cas12b核酸酶包含一种或多种突变，该一种或多种突变增加对应于氨基酸残基855至859的柔性区域的柔性，其中氨基酸残基编号是基于SEQ IDNO:1，其中与参考Cas12b核酸酶相比，工程化Ca s12b核酸酶具有增加(例如，增加至少约10％、20％、30％、40％、50％、60％、70％、80％、90％、1倍、1.2倍、1.5倍、2倍、5倍、10倍、20倍、50倍、100倍或更高)的活性(例如，靶结合、双链切割活性、尼克酶活性和/或基因编辑活性)。在一些实施方案中，参考Cas12b核酸酶是AaCas12b。在一些实施方案中，参考Cas12b核酸酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中，一种或多种突变包含在柔性区域中插入一个或多个(例如，2个)G残基。在一些实施方案中，一个或多个G残基在柔性区域中柔性氨基酸残基的N末端处被插入，其中柔性氨基酸残基选自：G、S、N、D、H、M、T、E、Q、K、R、A，以及P。在一些实施方案中，根据以下优先次序选择柔性氨基酸残基：G>S>N>D>H>M>T>E>Q>K>R>A>P。在一些实施方案中，一种或多种突变包含用G基取代柔性区域中的疏水性氨基酸残基，其中疏水性氨基酸残基选自：L、I、V、C、Y、F，以及W。在一些实施方案中，增加柔性的一种或多种突变包含N856G。

E.突变组合

从本说明书A至D节中描述的方法获得的工程化酶与示例性序列表中的多个氨基酸取代的组合均在本申请的范围内。在一些实施方案中，工程化的Cas12b核酸酶包含上文第A-D节中描述的一个或多个突变(例如，取代)。

在一些实施方案中，工程化Cas12b核酸酶包含在以下氨基酸残基位置中的任一个处的取代或取代的组合：(1)116；(2)475；(3)119和475；(4)119、475以及758；(5)119；(6)636；(7)757；(8)758；(9)761；(10)768；(11)858；(12)854；(13)857；(14)119、475以及758；(15)768；(16)757和758；(17)757和761；(18)757和768；(19)758和761；(20)758和768；(21)761和768；(22)757、758以及761；(23)757、758以及768；(24)757、761以及768；(25)758、761以及768；(26)757、758、761以及768；(27)865；(28)866；(29)869；(30)1093；和(31)866和869，其中氨基酸位置根据SEQ ID NO:1编号。

在一些实施方案中，工程化Cas12b核酸酶包含在以下氨基酸残基中的任一个处的取代或取代的组合：(1)D116；(2)E475；(3)Q119和E475；(4)Q119、E475，以及E758；(5)Q119；(6)E636；(7)I757；(8)E758；(9)E761；(10)K768；(11)D858；(12)Q854；(13)N857；(14)Q119、E475，以及E758；(15)K768；(16)I757和E758；(17)I757和E761；(18)I757和K768；(19)E758和E761；(20)E758和K768；(21)E761和K768；(22)I757、E758，以及E761；(23)I757、E758，以及K768；(24)I757、E761，以及K768；(25)E758、E761，以及K768；(26)I757、E758、E761，以及K768；(27)N865；(28)Q866；(29)Q869；(30)Q1093；和(31)Q866和Q869；其中氨基酸位置根据SEQ ID NO:1编号。在一些实施方案中，所述工程化的Cas12b核酸酶在以下氨基酸残基中的任一项处包括取代或取代的组合：(1)Q866+Q869；(2)Q119+E475；(3)Q119+E475+E758；并且其中所述氨基酸残基根据SEQ ID NO:1编号。在一些实施方案中，在氨基酸位置D116和/或E475处的取代是用带正电荷的氨基酸残基(诸如R或K)取代。在一些实施方案中，在氨基酸位置Q119处的取代是用具有芳族侧链的氨基酸残基(诸如Y、F，或W)取代。在一些实施方案中，在氨基酸位置E636、I757、E758、E761、K768、Q854、D858和/或N857处的取代是用带正电荷的氨基酸残基(诸如R或K)取代。在一些实施方案中，在氨基酸位置N865、Q866、Q869和/或Q1093处的取代是用疏水性氨基酸残基(诸如W、Y或M)取代。

在一些实施方案中，工程化Cas12b核酸酶包含以下氨基酸残基或其组合中的任一个：(1)116R；(2)475R；(3)119F和475R；(4)119F、475R以及758R；(5)119Y；(6)119F；(7)119W；(8)636R；(9)757R；(10)758R；(11)761R；(12)854R；(13)857K；(14)768R；(15)757R和758R；(16)757R和761R；(17)757R和768R；(18)758R和761R；(19)758R和768R；(20)761R和768R；(21)757R、758R以及761R；(22)757R、758R以及768R；(23)757R、761R以及768R；(24)758R、761R以及768R；(25)757R、758R、761R以及768R；(26)865W；(27)865Y；(28)866M；(29)869M；(30)1093W；(31)1093Y；(32)866M和869M；和(33)858R；其中氨基酸位置根据SEQ IDNO:1编号。

在一些实施方案中，工程化Cas12b核酸酶包含以下取代或其组合中的任一个：(1)D116R；(2)E475R；(3)Q119F+E475R；(4)Q119F+E475R+E758R；(5)Q119Y；(6)Q119F；(7)Q119W；(8)I757R；(9)E758R；(10)E761R；(11)K768R；(12)I757R+E758R；(13)I757R+E761R；(14)I757R+K768R；(15)E758R+E761R；(16)E758R+K768R；(17)E761R+K768R；(18)I757R+E758R+E761R；(19)I757R+E758R+K768R；(20)I757R+E761R+K768R；(21)E758R+E761R+K768R；(22)I757R+E758R+E761R+K768R；(23)Q866M；(24)Q869M；(25)Q866M+Q869M；(26)E636R；(27)Q854R；(28)N857K；(29)N865W；(30)N865Y；(31)Q1093W；(32)Q1093Y；和(33)D858R；其中氨基酸位置根据SEQ ID NO:1编号。在一些实施方案中，所述工程化的Cas12b核酸酶包含以下取代中的任一种或其组合：(1)Q866M+Q869M；(2)Q119F+E475R；(3)Q119F+E475R+E758R；并且其中所述氨基酸残基根据SEQ ID NO:1编号。

在一些实施方案中，工程化Cas12b核酸酶包含一个或多个下述取代：D116R、K123R、D130R、D132R、N144R、K145R、E153R、D173R、Q222R、D395R、N400R，和E475R。在一些实施方案中，工程化Cas12b核酸酶包含一个或多个下述取代：Q118Y、Q118F、Q118W、Q119Y、Q119F和Q119W。在一些实施方案中，工程化Cas12b核酸酶包含一个或多个下述取代：D300R、K301R、E304R、N329R、E636R、Q639R、T647R、Q682R、I757R、E758R、E761R、E764R、K768R、E852R、Q854R、N856R、N857R、D858R、P860R、S862R、E863R、N865R、Q866R、L867R、Q869R、E938R、E956R、G957R、E958R、I944R、Q1093R和/或W1097R。在一些实施方案中，工程化Cas12b核酸酶包含一个或多个下述取代：E636K、Q639K、T647K、Q682K、I757K、E758K、E761K、Q854K、N857K、D858K、N865K、Q866K、I994K、Q1093K，和W1097K。在一些实施方案中，工程化Cas12b核酸酶包含一个或多个下述取代：E758W、E758Y、E758F、E758M、E761W、E761Y、E761F、E761M、E863W、E863Y、E863F、E863M、N865W、N865Y、N865F、N865M、Q866W、Q866Y、Q866F、Q866M、Q869W、Q869Y、Q869F、Q869M、E956W、E956Y、E956F、E956M、Q1093W、Q1093Y、Q1093F和Q1093M。在一些实施方案中，氨基酸位置根据SEQ ID NO:1编号。

在一些实施方案中，工程化Cas12b核酸酶包含在Q866和Q869处的氨基酸取代。在一些实施方案中，工程化Cas12b核酸酶包含氨基酸取代Q866M和Q869M。在一些实施方案中，所述氨基酸位置根据SEQ ID NO:1编号。在一些实施方案中，工程化Cas12b核酸酶包含与SEQ ID NO:20的氨基酸序列具有至少约85％序列同一性(诸如至少约88％、90％、91％、92％、93％、94％、95％、96％、97％、98％，或99％序列同一性中的任一个)的氨基酸序列。在一些实施方案中，工程化Cas12b核酸酶包含SEQ ID NO:20的氨基酸序列。

在一些实施方案中，工程化Cas12b核酸酶包含在Q119和E475处的氨基酸取代。在一些实施方案中，工程化Cas12b核酸酶包含氨基酸取代Q119F和E475R。在一些实施方案中，所述氨基酸位置根据SEQ ID NO:1编号。在一些实施方案中，工程化Cas12b核酸酶包含与SEQ ID NO:21的氨基酸序列具有至少约85％序列同一性(诸如至少约88％、90％、91％、92％、93％、94％、95％、96％、97％、98％，或99％序列同一性中的任一个)的氨基酸序列。在一些实施方案中，工程化Cas12b核酸酶包含SEQ ID NO:21的氨基酸序列。

在一些实施方案中，工程化Cas12b核酸酶包含在Q119、E475，以及E758处的氨基酸取代。在一些实施方案中，工程化Cas12b核酸酶包含氨基酸取代Q119F、E475R，以及E758R。在一些实施方案中，所述氨基酸位置根据SEQ ID NO:1编号。在一些实施方案中，工程化Cas12b核酸酶包含与SEQ ID NO:22的氨基酸序列具有至少约85％序列同一性(诸如至少约88％、90％、91％、92％、93％、94％、95％、96％、97％、98％，或99％序列同一性中的任一个)的氨基酸序列。在一些实施方案中，工程化Cas12b核酸酶包含SE Q ID NO:22的氨基酸序列。

参考Cas12b核酸酶

在一些实施方案中，参考Cas12核酸酶是AaCas12b或其直向同源物。在一些实施方案中，参考Cas12b核酸酶是天然存在的Cas12b核酸酶。在一些实施方案中，参考Cas12b核酸酶是野生型Cas12b核酸酶。在一些实施方案中，参考Cas12b核酸酶是工程化Cas12b核酸酶。

来自各种生物体的Cas12b核酸酶可以用作参考Cas12b核酸酶以提供本申请的工程化Cas12b核酸酶和效应蛋白。在一些实施方案中，参考Cas12b核酸酶具有酶活性。在一些实施方案中，参考Cas12b是分割靶双螺旋核酸(例如，双螺旋DNA)的双链的核酸酶。在一些实施方案中，参考Cas12b是分割靶双螺旋核酸(例如，双螺旋DNA)的单链的切口酶。在一些实施方案中，参考Cas12b核酸酶是无酶活性的(例如dCas12b)。与Cas12b或其功能性衍生物具有一定序列同一性(例如，至少约60％、70％、80％、85％、90％、95％、98％，或更高)的直系同源物可以用作设计本申请的工程化Cas12b核酸酶或效应蛋白的基础。在一些实施方案中，参考Cas12b核酸酶是突变体Cas12b，但不包含上文A-E节中描述的任何突变。

在一些实施方案中，工程化Cas12b核酸酶是基于天然存在的Cas12b核酸酶的功能性变体。在一些实施方案中，功能性变体具有一种或多种突变，诸如氨基酸取代、插入，以及缺失。例如，与野生型天然存在的Cas12b核酸酶相比，功能性变体可以包括1、2、3、4、5、6、7、8、9、10或更多个氨基酸取代。在一些实施方案中，一个或多个取代是保守取代。在一些实施方案中，功能性变体具有天然存在的Cas12b核酸酶的所有结构域。在一些实施方案中，功能性变体不具有天然存在的Cas12b核酸酶的一个或多个结构域。

V-B型CRISPR-Cas12b(也称为C2c1)系统已经被鉴定为双RNA指导的(即，crRNA和tracrRNA)DNA核酸内切酶系统，具有与Cas9和Cas12a不同的特征(Shmakov,S.等人《分子细胞》60,385-397(2015))。首先，据报道，当用crR NA/tracrRNA双螺旋重构时，Cas12b在体外生成远离(PAM)位点的交错末端。其次，尽管Cas12b的RuvC结构域类似于Cas9和Cas12a的RuvC结构域，但其推定的Nuc结构域与Cas9的HNH结构域和Cas12a的Nuc结构域不具有序列或结构类似性。此外，Cas12b蛋白比最广泛使用的SpCas9和Cas12a小(例如，AacCas12b:1,129氨基酸(aa)；SpCas9:1,369aa；AsCas12a:1,353aa；LbCas12a:1,228aa)，这使得Cas12b适用于基因治疗中腺相关病毒(AAV)介导的体内递送。与小型Cas9蛋白(诸如SaCas9和CjCas9)相比，Cas12b识别更简单的PAM序列(例如，AacCas12b:5′-TTN-3'；而SaCas9:5'-NNGRRT-3'，CjCas9:5'-NNNNRYAC-3')，这显著增加了基因组中Cas12b的靶向范围。附加地，Cas12b具有最小的脱靶效应，并且因此可以用作治疗和临床应用的更安全的选择。

来自各种生物体的Cas12b(C2c1)核酸酶可以用作参考Cas12b核酸酶以提供本申请的工程化Cas12b效应蛋白。示例性Cas12b核酸酶已经描述于例如Shmakov,S.等人《分子细胞》60,385-397(2015)；Shmakov,S.等人《自然微生物学综述(Nat.Rev.Microbiol.)》15,169-182(2017)；WO2016205764，以及WO2020/087631，它们的内容通过引用整体并入本文。

在一些实施方案中，工程化Cas12b效应蛋白是基于参考Cas12b蛋白(例如，Cas12b核酸酶)，该参考Cas12b蛋白选自：来自Alicyclobacillus acidiphilus的Cas12b蛋白(AaCas12b)、来自Alicyclobacillus kakegawensis的Cas12b(AkCas12b)、来自Alicyclobacillus macrosporangiidus的Cas12b(AmCas12b)、来自外村尚芽孢杆菌的Cas12b(BhCas12b)、来自芽孢杆菌的BsCas12b、来自芽孢杆菌的Bs3Cas12b、来自Desulfovibrio inopinatus的Cas12b(DiCas12b)、来自沉积物莱斯氏菌的Cas12b(LsCas12b)、来自螺旋体属细菌的Cas12b(SbCas12b)、来自热生肿块芽胞杆菌(Tuberibacillus calidus)的Cas12b(TcCas12b)，及其功能性衍生物。天然存在的Cas12b蛋白的序列已知于例如UniProtKB ID：T0D7A2、A0A6I3SPI6，以及A0A6I7FUC4中，它们通过引用整体并入本文。

在一些实施方案中，参考Cas12b蛋白是来自Alicyclobacillus acidiphilus的Cas12b核酸酶(AaCas12b)或其功能性衍生物。在一些实施方案中，工程化Cas12b效应蛋白是基于参考Cas12b蛋白，该参考Cas12b蛋白包含与SEQ ID NO:1的氨基酸序列具有至少约85％(例如，至少约90％、91％、92％、93％、94％、95％、96％、97％、98％，或99％中的任一个)序列同一性的氨基酸序列。在一些实施方案中，工程化Cas12b效应蛋白是基于参考Cas12b核酸酶，该参考Cas12b核酸酶包含SEQ ID NO:1的氨基酸序列。

应当注意，与参考Cas12b蛋白或其片段具有一定序列同一性(例如，至少约60％、70％、80％、85％、90％、95％、98％，或更高中的任一个)的直向同源物可以用作设计本申请的工程化Cas12b效应蛋白的基础。本领域技术人员可以基于目的和应用确定适用于本申请的Cas12b或其片段的直向同源物的序列同一性的百分比。用于确定序列同一性值的方法可以在以下各项中找到：《计算分子生物学(Computational Molecular Biology)》Lesk,A.M.编辑,牛津大学出版社,纽约,1988；《生物计算：信息学和基因组计划(Bioc omputing:Informatics and Genome Projects)》Smith,D.W.编辑,学术出版社,纽约,1993；《序列数据的计算机分析(Computer Analysis of Sequence Data)》第一部分,Griffin,A.M.和Griffin,H.G.编辑,胡玛纳出版社,新泽西,1994；《分子生物学中的序列分析(SequenceAnalysis in Molecular Biology)》von Heinje,G.,学术出版社,1987；以及《序列分析引物(Sequence Analysis Primer)》Gribskov,M.和Devereux,J.编辑,斯托克顿出版社,纽约,1991)。各种Cas12b直向同源物已经描述于WO2020/087631，其内容通过引用整体并入本文。在一些实施方案中，工程化Cas12b效应蛋白是基于参考Cas12b蛋白，该参考Cas12b蛋白包含与SEQ ID NO:54至SEQ ID NO:60中的任一个的氨基酸序列具有至少约85％(例如，至少约90％、91％、92％、93％、94％、95％、96％、97％、98％，或99％中的任一个)序列同一性的氨基酸序列。

工程化Cas12b的活性

在一些实施方案中，与参考Cas12b核酸酶相比，所述工程化Cas12b核酸酶具有增加的活性。在一些实施方案中，活性是靶DNA结合活性。在一些实施方案中，活性是位点特异性核酸酶活性。在一些实施方案中，活性是双链DNA切割活性。在一些实施方案中，活性是单链DNA切割活性，包括例如位点特异性DNA切割活性或非特异性DNA切割活性。在一些实施方案中，活性是单链RNA切割活性，诸如位点特异性RNA切割活性或非特异性RNA切割活性。在一些实施方案中，在体外测量活性。在一些实施方案中，在细胞(诸如细菌细胞、植物细胞，或真核细胞)中测量活性。在一些实施方案中，在哺乳动物细胞(诸如啮齿动物细胞或人类细胞)中测量活性。在一些实施方案中，在人类细胞(诸如293T细胞)中测量活性。在一些实施方案中，在小鼠细胞(诸如Hepa1-6细胞)中测量活性。在一些实施方案中，与参考Cas12b核酸酶相比，工程化Cas12b核酸酶具有相对于参考Cas12b核酸酶高至少约10％、20％、30％、40％、50％、60％、70％、80％、90％、1倍、1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、50倍或更多的活性。工程化Cas12b核酸酶的位点特异性核酸酶活性可以使用本领域已知的方法测量，包括例如PCR、测序或凝胶迁移测定，如本文提供的实例中所述。在一些实施方案中，活性是细胞中的基因编辑活性。在一些实施方案中，细胞是细菌细胞、植物细胞，或真核细胞。在一些实施方案中，细胞是哺乳动物细胞，诸如啮齿动物细胞或人类细胞。在一些实施方案中，细胞是293T细胞。在一些实施方案中，在小鼠细胞(诸如Hepa1-6细胞)中测量活性。在一些实施方案中，活性是细胞中靶基因组位点处的indel形成活性，诸如通过工程化Cas12b核酸酶对靶核酸进行的位点特异性切割以及用于DNA修复的非同源末端连接(NHEJ)机制。在一些实施方案中，活性是在细胞中靶基因组位点处插入外源核酸序列，例如，通过工程化Cas12b核酸酶对靶核酸进行的位点特异性切割以及用于DNA修复的同源重组(HR)机制。在一些实施方案中，所述在用所述工程化Cas12b核酸酶切割之后的同源重组进一步包括引入供体模板。在一些实施方案中，与参考Cas12b核酸酶相比，工程化Cas12b核酸酶在细胞(例如，人类细胞(诸如293T细胞)或小鼠Hepa1-6细胞)的基因组位点处的基因编辑(例如，indel形成)活性增加至少约20％，增加30％、40％、60％、70％、80％、90％、1.5倍、2倍、3倍、4倍、5倍、10倍，或更多中的任一个。在一些实施方案中，工程化Cas12b核酸酶能够比参考Cas12b核酸酶编辑更多数目(例如2、3、4、5、10、20、50、100或更多)的基因组位点。在一些实施方案中，工程化Cas12b核酸酶的共有PAM序列与参考Cas12b核酸酶相同。在一些实施方案中，与参考Cas12b核酸酶相比，工程化的Cas12b核酸酶识别更多(例如，1、2、3、4、5、10、20、50、100或更多)PAM序列。

本领域已知的任何方法可以用于确定细胞中工程化Cas12b核酸酶的切割或基因编辑效率，包括例如T7核酸内切酶1(T7E1)确定、PCR、靶DNA测序(包括例如Sanger序列，以及第二代测序)、缺失追踪插入缺失(TIDE)确定，或通过用于indel检测的扩增子分析(IDAA)确定。参见例如Sentmanat MF等人“针对CRISPR-Cas9编辑的验证策略概述(Asurvey of validation strategies for CRISPR-Cas9 editing)”《科学报告(ScientificReports)》2018,8,文章编号888，其内容通过引用整体并入本文。在一些实施方案中，例如如本文的实例中所述，使用靶向下一代测序(NGS)测量细胞中工程化Cas12b核酸酶的基因编辑效率。用于确定工程化Cas12b核酸酶的切割和基因编辑效率的示例性基因组位点包括但不限于CCR5、AAVS、CD34、RNF2、SCN9A、HBG1/2以及EMX1。在一些实施方案中，工程化Cas12b核酸酶的基因编辑效率可以切割或编辑至少约1、2、5、10、15、20、25、30、35、40、45、50、55、60、65、100或更多个基因座(相比于参考Cas12b核酸酶的平均切割或基因编辑效率)。在一些实施方案中，工程化Cas12b核酸酶的切割或基因编辑效率(例如，indel率)为至少约10％、20％、30％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、1倍、2倍、5倍、10倍、20倍、50倍或更高(相比于参考Cas12b核酸酶)。

工程化Cas12b效应蛋白

本申请还提供了基于本文所述的工程化Cas12b核酸酶、变体(例如dCas12b)或功能性衍生物中的任一种的工程化Cas12b效应蛋白。在一些实施方案中，工程化Cas12b效应蛋白包含(或由下述组成，或基本上由下述组成)本文所述的工程化Cas12b核酸酶、变体或功能性衍生物中的任一种。在一些实施方案中，工程化Cas12b效应蛋白包含工程化Cas12b核酸酶的功能性衍生物，诸如下文“功能性衍生物”一节中所述的功能性衍生物中的任一种。

在一些实施方案中，工程化Cas12b效应蛋白具有酶活性。在一些实施方案中，工程化Cas12b效应蛋白是切割靶双螺旋核酸(例如，双螺旋DNA)的双链的核酸酶。在一些实施方案中，工程化Cas12b效应蛋白是切口酶，即，切割靶双螺旋核酸(例如，双螺旋DNA)的单链。在一些实施方案中，工程化Ca s12b效应蛋白包含工程化Cas12b核酸酶的酶失活突变体(dCas12b)。在Cas12b核酸酶的活性位点中的一个或多个氨基酸残基处的突变可以导致酶死亡的Cas12b(dCas12b)。例如，AaCas12b的D570A、E848A、R785A、E848A、R911A，和/或D977A突变体(SEQ ID NO:1)在人类细胞中明显降低了(例如降低了至少约60％、70％、80％、90％、95％或更多的任一项)或没有核酸酶活性。参见例如TengF.等人《细胞发现》,4,文章编号:63(2018)，其内容通过引用整体并入本文。在一些实施方案中，工程化Cas12b效应蛋白包含具有对应于AaCas12b的D570A、E848A、R785A、E848A、R911A，和D977A的一种或多种突变的工程化Cas12b。在一些实施方案中，将选自D570A、E848A、R785A、E8486A、R911A和D977A的一种或多种突变进一步引入包含Q119F+E475R+E758R突变的AaCas12b中。在一些实施方案中，工程化Cas12b核酸酶的酶非活性突变体包含SEQ ID NO:79至81中任一项的氨基酸序列。在一些实施方案中，工程化Cas12b效应蛋白包含具有对应于AaCas12b的R785A突变的突变的工程化Cas12b。在一些实施方案中，工程化Cas12b效应蛋白包含具有对应于AaCas12b的R911A突变的突变的工程化Cas12b。在一些实施方案中，工程化Cas12b效应蛋白包含具有对应于AaCas12b的D977A突变的突变的工程化Cas12b。在一些实施方案中，工程化的Cas12b效应蛋白包含具有与AaCas12b的E848A突变对应的突变的工程化Cas12b。在一些实施方案中，工程化的Cas12b效应蛋白包含具有与AaCas12b的D570A突变相对应的突变的工程化Cas12b。在一些实施方案中，工程化的Cas12b效应蛋白包含具有与AaCas12b的D570A+E848A突变或AaCas12a的D570A+D977A突变相对应的突变的工程化Cas12b。

在一些实施方案中，提供了工程化Cas12b切口酶。在一些实施方案中，提供了工程化Cas12b融合效应蛋白，其包含融合至功能结构域的工程化Cas12b核酸酶或变体或其功能性衍生物(例如，工程化Cas12b核酸酶的酶失活突变体，诸如SEQ ID NO:79至81的任一项)，功能结构域为诸如翻译起始子结构域、转录阻遏子结构域(例如Krüppel相关盒(KRAB)结构域)、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域(例如，胞嘧啶碱基编辑器(CBE)或腺嘌呤碱基编辑器(ABE)结构域)、逆转录酶结构域、报告子结构域(例如，荧光结构域)，或核酸酶结构域(例如ZFN结构域)。在一些实施方案中，提供了工程化Cas12b碱基编辑器，其包含融合至胞嘧啶脱氨酶结构域或腺苷脱氨酶结构域的本文所述(例如SEQ ID NO:79至81的任一项)的工程化Cas12b核酸酶中的任一种的无催化活性变体。在一些实施方案中，提供了一种工程化的Cas12b碱基编辑器，其包含本文所述的工程化Cas12b核酸酶中的任一项(例如SEQ ID NO:79至81的任一项)的无催化活性变体，其融合到KRAB结构域或其功能片段，例如ZIM3KRAB结构域(SEQ ID NO:72)。在一些实施方案中，提供了工程化Cas12b先导编辑器，其包含融合至逆转录酶结构域的本文所述(例如SEQ ID NO:79至81的任一项)的工程化Cas12b核酸酶中的任一种的无催化活性变体。在一些实施方案中，提供了分裂的Cas12b效应蛋白系统。

变体/功能性衍生物

本申请还提供了根据本文所述的工程化Cas12b核酸酶的任一项的变体和功能性衍生物。在一些实施方案中，提供了工程化Cas12b效应蛋白，其包含(或由下述组成，或基本上由下述组成)本文所述的工程化Cas12b核酸酶的功能性变体。在一些实施方案中，与对应工程化Cas12b核酸酶(例如SEQ IDNO:2至22的任一项)的氨基酸序列相比，功能性变体的氨基酸序列具有至少一个氨基酸残基差异(例如，具有缺失、插入、取代，和/或融合)。在一些实施方案中，功能性变体具有一种或多种突变，诸如氨基酸取代、插入，和/或缺失。例如，与工程化Cas12b核酸酶相比，功能性变体可以包括1、2、3、4、5、6、7、8、9、10或更多个氨基酸取代中的任一个。在一些实施方案中，一个或多个取代是保守取代。在一些实施方案中，功能性变体具有工程化Ca s12b核酸酶的所有结构域。在一些实施方案中，功能性变体不具有工程化Ca s12b核酸酶的一个或多个结构域。

对于本文所述的Cas12b变体蛋白中的任一种(例如，切口酶Cas12b蛋白、失活或催化失活的Cas12b(dCas12b)、融合Cas12b)，Cas12b变体可以包括与本文所述的Cas12b蛋白序列中的任一种相同的参数(例如，结构域、序列同一性百分比等)。

Cas12b功能性变体中的示例性突变描述于WO2016205764、WO2016205749，以及WO2020/087631，它们的内容通过引用整体并入本文。

催化活性

在一些实施方案中，工程化Cas12b核酸酶的功能性变体与其非突变形式相比具有不同的催化活性。在一些实施方案中，突变(例如，氨基酸取代、插入，和/或缺失)在Cas12b效应蛋白的催化结构域(例如，RuvC结构域)中。在一些实施方案中，变体包含多个催化结构域中的突变。切割双链靶核酸的一条链但不切割另一条链的Cas12b效应蛋白在本文中称为“切口酶”(例如，“切口酶Cas”)。在一些实施方案中，工程化Cas12b效应蛋白包含(或由下述组成，或基本上由下述组成)工程化Cas12b核酸酶的切口酶突变体。基本上不具有核酸酶活性的Cas12b蛋白在本文中称为死亡的Cas12b蛋白(“dCas12b”)(注意在融合Cas12b效应蛋白的情况下，核酸酶活性可以由异源多肽—一种融合配偶体提供，这在下文中更详细地描述)。在一些实施方案中，当突变Cas12b的DNA切割活性相对于其非突变形式小于约25％、20％、10％、5％、1％、0.1％、0.01％或更低中的任一项时，认为Cas12b效应蛋白基本上缺乏所有DNA切割活性。

在一些实施方案中，所述工程化Cas12b核酸酶是dCas12b。在一些实施方案中，工程化Cas12b功能性变体包含对应于AaCas12b的D570A的突变(SE Q ID NO:1)。在一些实施方案中，所述工程化的Cas12b功能变体包含对应于AaCas12b的E848A的突变。在一些实施方案中，工程化Cas12b功能性变体包含对应于AaCas12b的R785A的突变。在一些实施方案中，工程化Cas12b功能性变体包含对应于AaCas12b的E848A的突变。在一些实施方案中，工程化Cas12b功能性变体包含对应于AaCas12b的R991A的突变。在一些实施方案中，工程化Cas12b功能性变体包含对应于AaCas12b的D977A的突变。在一些实施方案中，工程化Cas12b功能性变体包含对应于BthCas12b的D573A的突变。在一些实施方案中，AaCas12b的催化无活性或基本无活性变体(Q119F+E475R+E758R)进一步包含一个或多个选自D570A、E848A和D977A的取代，其中氨基酸位置对应于SEQ ID NO:22。在一些实施方案中，dCas12b包含SEQ ID NO:79至81中任一项的氨基酸序列。

分裂的Cas12b效应蛋白

本文所述的CRISPR-Cas12b系统可以包含在本节中包含分裂的Cas12b部分的任何多肽对(在本文中也称为“分裂的Cas12b多肽”)。示例性分裂的Ca s12b蛋白系统已经描述于例如PCT/CN2020/111057和PCT/CN2021/114339，其内容通过引用整体并入本文。

在一些实施方案中，提供了分裂的Cas12b效应蛋白，其包含第一多肽和第二多肽，第一多肽包含本文所述的工程化Cas12b核酸酶或其变体或功能性衍生物(在本节中也称为“亲本Cas12b蛋白”)中的任一种的N末端部分，第二多肽包含工程化Cas12b核酸酶或其变体或功能性衍生物的C末端部分，其中第一多肽和第二多肽能够在包含指导序列的指导RNA的存在下彼此缔合以形成特异性结合至包含与指导序列互补的靶序列的靶核酸的CRISPR复合物。在一些实施方案中，第一多肽和第二多肽各自包含二聚化结构域。在一些实施方案中，第一二聚化结构域和第二二聚化结构域在诱导物(例如，雷帕霉素)的存在下彼此缔合。在一些实施方案中，第一多肽和第二多肽不包含任何二聚化结构域。在一些实施方案中，分裂的Cas12b效应蛋白是自体诱导的。

分裂的Cas12b部分是基于本文所述的工程化Cas12b核酸酶或其变体或功能性变体中的任一种设计的。

Cas12b蛋白具有各种结构域。在一些实施方案中，亲本Cas12b蛋白从N末端到C末端包含：第一WED结构域(WED-I；也称为OBD-I结构域)、第一REC结构域(REC1)、第二WED结构域(WED-II；也称为OBD-II结构域)、第一RuvC结构域(RuvC-I)、桥螺旋(BH)结构域、第二RuvC结构域(RuvC-II)、第一Nuc结构域(Nuc-I；也称为UK-I结构域)、第三RuvC结构域(RuvC-III)，以及第二Nuc结构域(Nuc-II；也称为UK-II结构域)。可以使用本领域已知的方法确定结构域边界，诸如基于天然存在的Cas12b蛋白的晶体结构(例如，对于AaCas12b而言是PDBIDNo：5U30、5U31、5U33、5U34，以及5WQE)，和/或与亲本Cas12b蛋白中的已知功能结构域的序列同源性。在一些实施方案中，AaCas12b具有以下结构域：WEB-I结构域(氨基酸残基1至14)、REC1结构域(氨基酸残基15至386)、WED-II结构域(氨基酸残基387至518)、RuvC-I结构域(氨基酸残基519至628)、BH结构域(氨基酸残基629至658)、REC2结构域(氨基酸残基659至783)、RuvC-II结构域(氨基酸残基784-900)、Nuc-I结构域(氨基酸残基901至974)、RuvC-III结构域(氨基酸残基975至993)，以及Nuc-II结构域(氨基酸残基994至1129)，其中氨基酸编号是基于SEQ ID NO:1。

工程化Cas12b核酸酶或其变体或功能性衍生物是分裂的的，即两个分裂的Cas12b部分基本上包含功能性Cas12b。Cas12b可以充当基因组编辑酶(当与靶DNA和指导RNA形成复合物时)，诸如切割双螺旋核酸的单链或双链的核酸酶，或者它可以是催化死亡的Cas12b(dCas12b)，由于其催化结构域中的典型突变，它基本上是催化活性非常小或没有催化活性的DNA结合蛋白。在参考Cas12b的活性位点中的一个或多个氨基酸残基处的突变可以导致催化死亡的Cas12b，诸如AaCas12b的D570A、R785A、E848A、R911A，和/或D977A突变体。

本文所述的分裂的Cas12b部分可以通过将工程化Cas12b核酸酶或其变体或功能性衍生物(在本文中称为“亲本Cas12b蛋白”，诸如SEQ ID NO:2至22和79至81的任一项)(例如，全长Cas12b蛋白或其功能性变体)在分裂的位置分成(即，分裂成)两半来设计，分裂的位置是亲本Cas12b蛋白的N末端部分与C末端部分分开的点。在一些实施方案中，N末端部分包含亲本Cas12b蛋白的氨基酸残基1至X，而C末端部分包含氨基酸残基X+1至C末端。在该实例中，编号是连续的，但这可能并不总是必需的，因为氨基酸(或编码它们的核苷酸)可以从分裂末端中的任一个的末端修剪，和/或还设想了多肽链的内部区域处的突变(例如，插入、缺失，以及取代)，条件是重构Cas12b蛋白的足够DNA结合活性以及(如果需要的话)DNA切口酶或双链切割活性被保留，例如与亲本Cas12b蛋白相比至少约30％、40％、50％、60％、70％、80％、90％、95％或更多的任一项的活性。

还设想了具有一些N和/或C末端截短或缺失和/或相对于本文所述的工程化Cas12b核酸酶的内部突变的分裂的Cas12b部分。本领域技术人员可以容易地使用本文所述的示例性分裂的Cas12b多肽的信息来例如通过使用标准序列比对工具基于其它Cas12b蛋白和功能性变体设计对应的分裂的Cas12b多肽。

分裂的位置可以位于柔性区域(诸如环)内。优选地，分裂的位置出现在氨基酸序列的中断不导致结构特征(例如，α螺旋或β片层)的部分或完全破坏的地方。非结构化区域(在晶体结构中不出现的区域，因为这些区域的结构化程度不足以在晶体中“冻结”)通常是优选的选项。设想可以在暴露于亲本Cas12b蛋白的表面上的非结构化区域中产生裂片。

在一些实施方案中，亲本Cas12b蛋白不在参与与指导RNA和/或靶RNA的相互作用的氨基酸残基处或附近(例如，在约10、8、6、5、4、3、2，或1个氨基酸残基内)分裂。例如，AaCas12b蛋白的氨基酸残基4至9、118至122、143至144、442至446、573至574、742至746、753至754、792至796、800至819、835至839、897至900，以及973至978参与与单指导RNA和/或靶DNA的相互作用，其中编号是基于SEQ ID NO:1。

在一些实施方案中，亲本Cas12b蛋白在对应于AaCas12b蛋白的氨基酸残基516至793的氨基酸残基内的氨基酸残基处分裂，其中编号是基于SEQ IDNO:1。在一些实施方案中，亲本Cas12b蛋白在与WED-II结构域和RuvC-I结构域邻接的氨基酸残基处分裂。在一些实施方案中，亲本Cas12b蛋白在对应于AaCas12b蛋白的氨基酸残基516至519的氨基酸残基内的氨基酸残基处分裂，其中编号是基于SEQ ID NO:1。在一些实施方案中，亲本Cas12b蛋白在与BH结构域和REC2结构域邻接的氨基酸残基处分裂。在一些实施方案中，亲本Cas12b蛋白在对应于AaCas12b蛋白的氨基酸残基621至627的氨基酸残基内的氨基酸残基处分裂，其中编号是基于SEQ ID NO:1。在一些实施方案中，亲本Cas12b蛋白在与REC2结构域和RuvC-II结构域邻接的氨基酸残基处分裂。在一些实施方案中，亲本Cas12b蛋白在对应于AaCas12b蛋白的氨基酸残基777至793的氨基酸残基内的氨基酸残基处分裂，其中编号是基于SEQ ID NO:1。在一些实施方案中，亲本Cas12b蛋白在RCE2结构域内分裂。在一些实施方案中，亲本Cas12b蛋白在对应于AaCas12b蛋白的氨基酸残基659至664、676至684，或702至706的氨基酸残基内的氨基酸残基处分裂，其中编号是基于SEQ ID NO:1。

在一些实施方案中，亲本Cas12b蛋白在与对应于AaCas12b蛋白的氨基酸残基518的氨基酸残基的距离在不超过约20(例如，不超过约18、16、14、12、10、8、7、6、5、4、3、2，或1中的任一个)个氨基酸残基内的氨基酸残基处分裂，其中编号是基于SEQ ID NO:1。在一些实施方案中，亲本Cas12b蛋白在对应于AaCas12b蛋白的氨基酸残基518的氨基酸残基处分裂，其中编号是基于SEQ ID NO:1。在一些实施方案中，亲本Cas12b蛋白在与对应于AaCas12b蛋白的氨基酸残基658的氨基酸残基的距离在不超过约20(例如，不超过约18、16、14、12、10、8、7、6、5、4、3、2，或1中的任一个)个氨基酸残基内的氨基酸残基处分裂，其中编号是基于SEQ ID NO:1。在一些实施方案中，亲本Cas12b蛋白在对应于AaCas12b蛋白的氨基酸残基658的氨基酸残基处分裂，其中编号是基于SEQ ID NO:1。在一些实施方案中，亲本Cas12b蛋白在与对应于AaCas12b蛋白的氨基酸残基783的氨基酸残基的距离在不超过约20(例如，不超过约18、16、14、12、10、8、7、6、5、4、3、2，或1中的任一个)个氨基酸残基内的氨基酸残基处分裂，其中编号是基于SEQ ID NO:1。在一些实施方案中，亲本Cas12b蛋白在对应于AaCas12b蛋白的氨基酸残基783的氨基酸残基处分裂，其中编号是基于SEQ ID NO:1。

在一些实施方案中，亲本Cas12b蛋白的N末端部分包含AaCas12b蛋白的WED-I、REC1、WED-II、RuvC-I，以及BH结构域，并且其中亲本Cas12b蛋白的C末端部分包含AaCas12b蛋白的REC2、RuvC-II、Nuc-I、RuvC-III，以及Nuc-II结构域。在一些实施方案中，亲本Cas12b蛋白的N末端部分包含亲本Cas12b蛋白的氨基酸残基1至658，并且亲本Cas12b蛋白的C末端部分包含亲本Cas12b蛋白的氨基酸残基659至1129，其中氨基酸残基根据SEQIDNO:1编号。

在一些实施方案中，亲本Cas12b蛋白的N末端部分包含亲本Cas12b蛋白的WED-I、REC1、WED-II、RuvC-I、BH，以及REC2结构域，并且其中亲本Cas12b蛋白的C末端部分包含亲本Cas12b蛋白的RuvC-II、Nuc-I、RuvC-II I，以及Nuc-II结构域。在一些实施方案中，亲本Cas12b蛋白的N末端部分包含亲本Cas12b蛋白的氨基酸残基1至783，并且亲本Cas12b蛋白的C末端部分包含亲本Cas12b蛋白的氨基酸残基784至1129，其中氨基酸残基根据SEQIDNO:1编号。

在一些实施方案中，亲本Cas12b蛋白的N末端部分包含亲本Cas12b蛋白的WED-I、REC1、WED-II、RuvC-I，以及BH结构域，其中亲本Cas12b蛋白的C末端部分包含亲本Cas12b蛋白的RuvC-II、Nuc-I、RuvC-III，以及Nuc-II结构域，并且其中亲本Cas12b蛋白的REC2结构域在亲本Cas12b蛋白的N末端部分与亲本Cas12b蛋白的C末端部分之间分裂。

在一些实施方案中，亲本Cas12b蛋白的N末端部分包含亲本Cas12b蛋白的WED-I、REC1，以及WED-II结构域，并且其中亲本Cas12b蛋白的C末端部分包含亲本Cas12b蛋白的RuvC-I、BH、REC2、RuvC-II、Nuc-I、RuvC-II I，以及Nuc-II结构域。在一些实施方案中，亲本Cas12b蛋白的N末端部分包含亲本Cas12b蛋白的氨基酸残基1至518，并且亲本Cas12b蛋白的C末端部分包含亲本Cas12b蛋白的氨基酸残基519至1129，其中氨基酸残基根据SEQIDNO:1编号。

分裂点通常在计算机上设计并克隆到构建体中。两个分裂的Cas12b部分(N末端和C末端部分)一起形成功能性Cas12b蛋白，其优选地包含亲本Cas12b蛋白的氨基酸序列的至少约70％或更多，诸如亲本Cas12b蛋白的氨基酸序列的至少约75％、80％、85％、90％、95％、98％、99％，或更多中的任一个。构想了一些修剪和突变体。可以完全移除非功能结构域。对于所有分裂的Cas12b系统，可以将两个分裂的Cas12b部分组合在一起，并且恢复或重构威望的Cas12b功能。可以使用本领域已知的方法评估重构Cas12b蛋白或CRI SPR复合物(Cas12b+指导RNA复合物)的活性。例如，可以使用T7核酸内切酶I(T7EI)测定评估细胞内的核酸酶活性。还可以通过DNA测序评估基因编辑活性。

在一些实施方案中，亲本Cas12b蛋白分裂成多于两个部分。

分裂的Cas12b效应蛋白可以各自包含一个或多个二聚化结构域。在一些实施方案中，第一多肽包含融合至第一分裂的Cas12b效应物部分的第一二聚化结构域，并且第二多肽包含融合至第二分裂的Cas12b效应物部分的第二二聚化结构域。二聚化结构域可以经由肽接头(例如，柔性肽接头，诸如GS接头)或化学键融合至分裂的Cas12b效应物部分。在一些实施方案中，二聚化结构域融合至分裂的Cas12b效应物部分的N末端。在一些实施方案中，二聚化结构域融合至分裂的Cas12b效应物部分的C末端。

在一些实施方案中，分裂的Cas12b效应蛋白不包含任何二聚化结构域。

在一些实施方案中，二聚化结构域促进两个分裂的Cas12b效应物部分的缔合。在一些实施方案中，通过诱导物诱导分裂的Cas12b效应物部分缔合或二聚化为功能性Cas12b效应蛋白。在一些实施方案中，分裂的Cas12b效应蛋白包含可诱导二聚化结构域。在一些实施方案中，二聚化结构域不是可诱导二聚化结构域，即，二聚化结构域在不存在诱导物的情况下二聚化。

诱导物可以是诱导能量源或不同于指导RNA(例如，sgRNA)的诱导分子。诱导物的作用是经由二聚化结构域的诱导二聚化将两个分裂的Cas12b效应物部分重构为功能性Cas12b效应蛋白。在一些实施方案中，诱导物通过可诱导二聚化结构域的诱导缔合作用将两个分裂的Cas12b效应物部分组合在一起。在一些实施方案中，在没有诱导物的情况下，两个分裂的Cas12b效应物部分不彼此缔合以重构为功能性Cas12b效应蛋白。在一些实施方案中，在没有诱导物的情况下，两个分裂的Cas12b效应物部分可以彼此缔合以在指导RNA(例如，sgRNA)的存在下重构为功能性Cas12b效应蛋白。

本申请的诱导物可以是热、超声、电磁能，或化学化合物。在一些实施方案中，诱导物是抗生素、小分子、激素、激素衍生物、类固醇，或类固醇衍生物。在一些实施方案中，诱导物是脱落酸(ABA)、强力霉素(DOX)、cu mate、雷帕霉素、4-羟基他莫昔芬(4OHT)、雌激素，或蜕皮激素。在一些实施方案中，分裂的Cas12b效应物系统是诱导物控制的系统，其选自：基于抗生素的可诱导系统、基于电磁能的可诱导系统、基于小分子的可诱导系统、基于核受体的可诱导系统，以及基于激素的可诱导系统。在一些实施方案中，分裂的Cas12b效应物系统是诱导物控制的系统，其选自：四环素(Tet)/DOX可诱导系统、光可诱导系统、ABA可诱导系统、cumate阻遏子/操纵子系统、4OHT/雌激素可诱导系统、基于蜕皮激素的可诱导系统，以及FKBP12/FRAP(FKBP12-雷帕霉素复合物)可诱导系统。这种诱导物也在本文和PCT/US2013/051418中讨论，其内容通过引用整体并入本文。FRB/FKBP/雷帕霉素系统已经描述于Paulmurugan和Gambhir《癌症研究(CancerRes)》2005年8月15日,65；7413；和Crabtree等人《化学与生物学(Chemistry&Biology)》13,99-107,2006年1月，它们的内容通过引用整体并入本文。

在一些实施方案中，分裂的Cas12b效应蛋白对是分开且无活性的，直到二聚化结构域的诱导二聚化(例如，FRB和FKBP)，其导致功能性Cas12b效应物核酸酶的重新组装。在一些实施方案中，包含第一半可诱导二聚体(例如，FRB)的第一分裂的Cas12b效应蛋白与包含第二半可诱导二聚体(例如，FKBP)的第二分裂的Cas12b效应蛋白分开递送和/或分开定位。

可以用于本文所述的诱导物控制的分裂的Cas12b效应物系统的其它示例性的基于FKBP的可诱导系统包括但不限于：在FK506的存在下与钙调磷酸酶(CNA)二聚化的FKBP；在FKCsA的存在下与CyP-Fas二聚化的FKBP；在雷帕霉素的存在下与FRB二聚化的FKBP；在香豆霉素的存在下与GryB二聚化的GyrB；在赤霉素的存在下与GID1二聚化的GAI；或在HaXS的存在下与Ha loTag二聚化的Snap-tag。

还设想了FKBP家族自身内的替代物。例如FKBP，其在FK1012的存在下同源二聚化(即，一个FKBP与另一个FKBP二聚化)。

在一些实施方案中，二聚化结构域是FKBP并且诱导物是FK1012。在一些实施方案中，二聚化结构域是GryB并且诱导物是香豆霉素。在一些实施方案中，二聚化结构域是ABA并且诱导物是赤霉素。

在一些实施方案中，分裂的Cas12b效应物部分可以是自体诱导的(即，自体激活的或自身诱导的)以在不存在诱导物的情况下缔合/二聚化为功能性Cas12b效应蛋白。不受任何理论或假说的束缚，分裂的Cas12b效应物部分的自体诱导可以通过结合至指导RNA(诸如sgRNA)来介导。在一些实施方案中，第一多肽和第二多肽不包含二聚化结构域。在一些实施方案中，第一多肽和第二多肽包含二聚化结构域。

在一些实施方案中，本文所述的分裂的Cas12b效应物系统(包括诱导物控制的系统和自体可诱导系统)的重构Cas12b效应蛋白具有亲本Cas12b效应蛋白的编辑效率的至少约70％(诸如至少约70％、75％、80％、85％、90％、95％、98％、99％，或更高的效率，或100％的效率中的任一个)的编辑效率。

在一些实施方案中，本文所述的诱导物控制的分裂的Cas12b效应物系统的重构Cas12b效应蛋白在不存在亲本Cas12b效应蛋白的编辑效率的诱导物(即，由于自体诱导)的情况下具有不超过约50％(诸如不超过约50％、45％、40％、35％、30％、25％、20％、15％、10％、5％，或更低的效率，或0％的效率中的任一个)的编辑效率。

融合Cas12b效应蛋白

本申请还提供了包含附加蛋白结构域和/或组分的工程化Cas12b效应蛋白，附加蛋白结构域和/或组分为诸如接头、核定位/输出序列、功能结构域，和/或报告蛋白。

在一些实施方案中，工程化Cas12b效应蛋白是除了工程化Cas12b核酸酶或其变体或功能性衍生物的核酸靶向结构域之外还包含一个或多个异源蛋白结构域(例如，约或多于约1、2、3、4、5、6、7、8、9、10或更多的任一项个结构域)的蛋白复合物。在一些实施方案中，工程化Cas12b效应蛋白是包含融合至工程化Cas12b核酸酶或其变体或功能性衍生物的一个或多个异源蛋白结构域(例如，约或多于约1、2、3、4、5、6、7、8、9、10或更多个结构域)的融合蛋白。

在一些实施方案中，本申请的工程化Cas12b效应蛋白可以包含(例如，经由融合蛋白，诸如经由一种或多种肽接头，例如GS肽接头等)一个或多个功能结构域或与一个或多个功能结构域相关联(例如，经由多种蛋白的共表达)。在一些实施方案中，一个或多个功能结构域是酶结构域。这些功能结构域可以具有各种活性，例如DNA和/或RNA甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性，以及开关活性(例如，光可诱导)。在一些实施方案中，一个或多个功能结构域是转录激活结构域(即，反式激活结构域)或阻遏子结构域。在一些实施方案中，转录激活结构域或阻遏子结构域可招募染色质修饰物。在一些实施方案中，一个或多个功能结构域是组蛋白修饰结构域。在一些实施方案中，一个或多个功能结构域是转座酶结构域、HR(同源重组)机器结构域、重组酶结构域，和/或整合酶结构域。在一些实施方案中，功能结构域是Krüppel相关盒(KRAB)、VP64、VP16、Fok1、P65、HSF1、MyoD1、生物素-APEX、APOBEC1、AID、PmCD A1、Tad1，以及M-MLV逆转录酶。在一些实施方案中，功能结构域选自：翻译起始子结构域、转录阻遏子结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域(例如，CBE或ABE结构域)、逆转录酶结构域、报告子结构域(例如，荧光结构域)，以及核酸酶结构域。在一些实施方案中，功能结构域是KRAB结构域，诸如ZIM3的KRAB结构域。在一些实施方案中，KRAB结构包含SEQ ID NO:72的氨基酸序列。

在一些实施方案中，工程化Cas12b效应蛋白中的一个或多个功能结构域的定位允许功能结构域的正确空间定向以用所归属的功能效应影响靶标。例如，如果功能结构域是转录激活子(例如，VP16、VP64，或p65)，则转录激活子以允许其影响靶标转录的空间定向放置。同样地，转录阻遏子被定位成影响靶标转录，并且核酸酶(例如，Fok1)被定位为切割或部分切割靶标。在一些实施方案中，功能结构域(例如KRAB结构域,诸如包含SEQ ID NO:72)定位在工程化Cas12b效应蛋白(例如SEQ ID NO:79至81的任一项,诸如SE Q ID NO:81)的N末端处。在一些实施方案中，功能结构域(例如KRAB结构域,诸如包含SEQ ID NO:72)定位在工程化Cas12b效应蛋白(例如SEQ IDNO:79至81的任一项,诸如SEQ ID NO:81)的C末端处。在一些实施方案中，工程化Cas12b效应蛋白包含在N末端处的第一功能结构域和在C末端处的第二功能结构域。在一些实施方案中，工程化Cas12b效应蛋白包含融合至一个或多个功能结构域(例如KRAB结构域)的本文所述的工程化Cas12b核酸酶中的任一种的无催化活性突变体(例如SEQ ID NO:79至81的任一项)。在一些实施方案中，工程化Cas12b效应蛋白是转录激活子。在一些实施方案中，工程化Cas12b效应蛋白包含融合至反式激活结构域的本文所述的工程化Cas12b核酸酶中的任一种的无酶活性变体(例如SEQ ID NO:79至81的任一项)。在一些实施方案中，反式激活结构域选自：VP64、p65、HSF1、VP16、MyoD1、HSF1、RTA、SET7/9，及其组合。在一些实施方案中，反式激活结构域包含VP64、p65，以及HSF1。在一些实施方案中，工程化Cas12b效应蛋白包含两个分裂的Cas12b效应多肽，它们各自融合至反式激活结构域。在一些实施方案中，所述工程化的Cas12b效应蛋白进一步包含一个或多个核定位序列(例如SEQ ID NO:61、62和82中的任一项)。

在一些实施方案中，工程化Cas12b效应蛋白是转录阻遏子。在一些实施方案中，工程化Cas12b效应蛋白包含融合至转录阻遏子结构域(例如KRAB)的本文所述的工程化Cas12b核酸酶中的任一种的无酶活性变体(例如SEQIDNO:79至81的任一项)。在一些实施方案中，转录阻遏子结构域选自：Krüppel相关盒(KRAB)、EnR、NuE、NcoR、SID、SID4X，及其组合。在一些实施方案中，工程化Cas12b效应蛋白包含两个分裂的Cas12b效应多肽，它们各自融合至转录阻遏子结构域。在一些实施方案中，所述工程化的Cas12b效应蛋白进一步包含一个或多个核定位序列(例如，SEQ ID NO:61、62和82中的任一项)。

在一些实施方案中，工程化Cas12b效应蛋白是碱基编辑器，诸如胞嘧啶编辑器或腺苷编辑器。在一些实施方案中，工程化Cas12b效应蛋白包含融合至核碱基编辑结构域(诸如胞嘧啶碱基编辑(CBE)结构域或腺苷碱基编辑(AB E)结构域)的本文所述的工程化Cas12b核酸酶中的任一种的无酶活性变体(例如SEQ ID NO:79至81的任一项)。在一些实施方案中，核碱基编辑结构域是DNA编辑结构域。在一些实施方案中，核碱基编辑结构域具有脱氨酶活性。在一些实施方案中，核碱基编辑结构域是胞嘧啶脱氨酶结构域。在一些实施方案中，核碱基编辑结构域是腺苷脱氨酶结构域。基于Cas核酸酶的示例性碱基编辑已经描述于例如WO2018/165629A1和WO2019/226953A1，它们的内容通过引用整体并入本文。示例性CBE结构域包括但不限于激活诱导的胞苷脱氨酶或AID(例如，hAID)、载脂蛋白BmRNA编辑复合物，或APOBEC(例如，大鼠APOBEC1、hAPOBEC3A/B/C/D/E/F/G)，以及PmCDA1。示例性ABE结构域包括但不限于TadA、ABE8，及其变体(参见例如Gaudelli等人,2017《自然》551:464-471；和Richter等人,2020《自然·生物技术》38:883-891，它们中每一个的内容通过引用整体并入本文)。在一些实施方案中，功能结构域是APOBEC1结构域，例如大鼠APOBEC1结构域。在一些实施方案中，功能结构域是TadA结构域。在一些实施方案中，工程化Cas12b效应蛋白还包含一个或多个核定位序列(例如SEQ ID NO:61,62和82中的任一项)。

在一些实施方案中，工程化Cas12b效应蛋白是先导编辑器。基于Cas9的先导编辑器已经描述于例如A.Anzalone等人《自然》2019,576(7785):149-157，其内容通过引用整体并入本文。在一些实施方案中，工程化Cas12b效应蛋白包含融合至逆转录酶结构域的本文所述的工程化Cas12b核酸酶中的任一种的切口酶变体。在一些实施方案中，功能结构域是逆转录酶结构域。在一些实施方案中，逆转录酶结构域是M-MLV逆转录酶或其变体，例如具有D200N、T306K、W313F、T330P，以及L603W中的一种或多种突变的M-MLV逆转录酶。在一些实施方案中，提供了包含先导编辑器的工程化CRISP R/Cas12b系统。在一些实施方案中，工程化CRISPR/Cas12b系统还包含第二Cas12b切口酶，其例如基于与先导编辑器相同的工程化Cas12b核酸酶。在一些实施方案中，工程化CRISPR/Cas12b系统包含先导编辑器指导RNA(pegRN A)，其包含引物结合位点和逆转录酶(RT)模板序列。

在一些实施方案中，本申请提供了具有一个或多个(例如，1、2、3、4、5、6，或更多个)功能结构域的分裂的Cas12b效应物系统，这些功能结构域与一个或两个分裂的Cas12b效应物部分相关联(即，结合或融合)。功能结构域可以作为第一和/或第二分裂的Cas12b效应蛋白的一部分，作为该构建体内的融合体提供。功能结构域通常经由肽接头(诸如GS接头)融合至分裂的Cas12b效应蛋白中的其它部分(例如，分裂的Cas12b效应物部分)。功能结构域可以用于基于催化死亡的Cas12b效应物改换分裂的Cas12b效应物系统的功能的用途。

在一些实施方案中，工程化Cas12b效应蛋白包含一个或多个核定位序列(NLS)和/或一个或多个核输出序列(NES)。示例性NLS序列包括例如PKKKRKV(SEQ ID NO:82)、PKKKRKVPG(SEQ ID NO:61)和ASPKKKRKV(SEQ ID NO:62)。NLS和/或NES可以可操作地连接至工程化Cas12b效应蛋白或工程化Cas12b效应蛋白中的多肽链的N末端和/或C末端。

在一些实施方案中，工程化Cas12b效应蛋白可以编码附加组分，诸如报告蛋白。在一些实施方案中，工程化Cas12b效应蛋白包含荧光蛋白，例如GFP。这种系统可以允许基因组基因座的成像(参见例如“通过优化的CRISPR/Cas系统在活的人类细胞中进行基因组基因座的动态成像(Dynamic Imaging of Genomic Loci in Living Human Cells by anOptimized CRISPR/Cas System)”ChenB等人《细胞》2013)。在一些实施方案中，工程化Cas12b效应蛋白是可以对基因组基因座进行成像的可诱导分裂的Cas效应物系统。

工程化CRISPR-Cas12b系统

还提供了工程化CRISPR-Cas12b系统，其包括：(a)所述工程化的Cas12b核酸酶或其变体或衍生物(例如SEQ ID NO:2至22和79至81的任一项)或本文所述的工程化Cas12b效应蛋白(例如，工程化Cas12b核酸酶、切口酶、分裂的Cas12b蛋白、转录阻遏子、转录激活子、碱基编辑器，或先导编辑器)中的任一种，或者编码它们的核酸；和(b)包含与靶核酸的靶序列互补的指导序列的指导RNA，或编码该指导RNA的一种或多种核酸，其中所述工程化的Cas12b核酸酶或工程化Cas12b效应蛋白和指导RNA能够形成特异性结合至包含靶序列的靶核酸的CRISPR复合物并诱导靶核酸的修饰。在一些实施方案中，提供了一种工程化CRISPR-Cas12b系统，其包含：(a)工程化Cas12b核酸酶或其效应蛋白，其包含相对于参考Cas12b核酸酶的一种、两种或三种类型的突变，其中所述突变包括：(1)用带正电荷的氨基酸残基(例如R、H、K)取代与PAM相互作用的参考Cas12b核酸酶中的一个或多个氨基酸残基(例如以下位置的一个或多个：116、123、130、132、144、145、153、173、222、395、400和475)；和/或(2)用具有芳香环的氨基酸残基(例如F、Y、W)取代参比Cas12b核酸酶中参与打开DNA双链的一个或者多个氨基酸残基(例如以下位置中的一个或多个：118和119)；和/或(3)用带正电荷的氨基酸(例如R、H、K)或疏水性氨基酸残基(如，F、Y、W、M)取代与ssDNA底物相互作用的参考Cas12b核酸酶RuvC结构域中的一个或多个氨基酸残基(例如以下位置中的一或多个：300、301、304、329、636、639、647、682、757、758、761、764、768、852、854、856、857、858、860、862、863、865、866、867、869、938、956、957、958、994、1093和1097)，其中所述参考Cas12b核酸酶包含SEQ ID NO:1的氨基酸序列，或编码工程化Cas12b核酸酶或其效应蛋白的核酸；和(b)gRNA，其包含与靶核酸的靶序列互补的指导序列或编码所述gRNA的核酸，其中所述工程化的Cas12b核酸酶或其效应蛋白和所述gRNA能够形成CRISPR复合物，所述CRISPR复合体特异性结合包含所述靶序列的靶核酸并诱导所述靶核酸的修饰。在一些实施方案中，工程化CRISPR-Cas12b系统包含编码所述工程化核酸酶或其变体或衍生物的工程化Cas12b效应蛋白和/或指导RNA的一种或多种核酸。在一些实施方案中，所述gRNA包含cr RNA和tracrRNA。在一些实施方案中，工程化CRISPR-Cas12b系统包含前体指导RNA阵列，该前体指导RNA阵列可以例如由所述工程化的Cas12b核酸酶或其变体或衍生物或工程化Cas12b效应蛋白加工成多个crRNA。在一些实施方案中，所述gRNA是sgRNA。在一些实施凡是中，所述sgRNA包含SEQ ID NO:23至53中任一项的骨架序列。在一些实施方案中，工程化CRISPR-Ca s12b系统包含编码所述工程化Cas12b核酸酶或其变体或衍生物或所述工程化Cas12b效应蛋白和/或指导RNA的一种或多种载体。在一些实施方案中，所述工程化的Cas12b核酸酶或其变体或衍生物或工程化Cas12b效应蛋白和/或指导RNA由一种或多种载体(诸如腺相关病毒(AAV)载体)编码。在一些实施方案中，工程化CRISPR-Cas12b系统包含核糖核蛋白(RNP)复合物，该复合物包含结合至指导RNA的工程化Cas12b核酸酶或其变体或衍生物或工程化Cas12b效应蛋白。

在一些实施方案中，提供了一种工程化的CRISPR-Cas12b系统，其包含：(a)包含SEQ ID NO:1的氨基酸序列或其效应蛋白(例如，切口酶、分裂的Ca s12b蛋白、转录阻遏物、转录激活物、碱基编辑器或引导编辑器)的Cas12b核酸酶，或本文所述的任一项工程化Cas12b核酸酶或其变体或衍生物(例如，SEQ ID NO:2至22和79至81中的任一项)或工程化的Cas12b效应蛋白(例如，切口酶、分裂的Cas12b蛋白、转录阻遏物、转录激活物、碱基编辑器或引导编辑器)，或其编码核酸；和(b)gRNA，其包含与靶核酸或编码所述gRNA的核酸的靶序列互补的指导序列，其中所述gRNA包含工程化支架，所述工程化支架包含SEQ ID NO:25至53中任一项的序列；其中i)Cas12b核酸酶或其效应蛋白或工程化Cas12b核酸酶或其变体或衍生物或工程化的Cas12b效应蛋白，以及ii)gRNA能够形成特异性结合靶核酸的CRISPR复合物并诱导靶核酸的修饰。在一些实施方案中，提供了一种工程化CRISPR-Cas12b系统，其包含：(a)包含SEQ ID NO:1的氨基酸序列的Cas12b核酸酶或其效应蛋白(例如，切口酶、分裂的Cas12b蛋白、转录阻遏物、转录激活物、碱基编辑器或引导编辑器)，或相对于参考Cas12b核酸酶的三种类型的突变，其中所述突变包括：(1)用带正电荷的氨基酸残基(例如R、H、K)取代参考Cas12b核酸酶中与PAM相互作用的一个或多个氨基酸残基，例如以下位置中的一个或多个：116、123、130、132、144、145、153、173、222、395、400和475)；和/或(2)用具有芳香环的氨基酸残基(例如F、Y、W)取代参比Cas12b核酸酶中参与打开DNA双链的一个或者多个氨基酸残基(例如以下位置中的一个或多个：118和119)；和/或(3)用带正电荷的氨基酸(例如R、H、K)或疏水性氨基酸残基(例如F、Y、W、M)取代与ssDNA底物相互作用的参考Cas12b核酸酶RuvC结构域中的一个或多个氨基酸残基(例如以下位置中的一或多个：300、301、304、329、636、639、647、682、757、758、761、764、768、852、854、856、857、858、860、862、863、865、866、867、869、938、956、957、958、994、1093和1097)，其中所述参考Cas12b核酸酶包含SEQ ID NO:1的氨基酸序列，或编码Cas12b核酸酶或其效应蛋白的核酸；和(b)gRNA，其包含与靶核酸或编码所述gRNA的核酸的靶序列互补的指导序列，其中所述gRNA包含工程化支架，所述工程化支架包含SEQ ID NO:25至53中任一项的序列；其中i)Cas12b核酸酶或其效应蛋白或其工程化Cas12b核酸酶或效应蛋白，以及ii)gRNA能够形成特异性结合靶核酸的CRISPR复合物并诱导靶核酸的修饰。在一些实施方案中，提供了一种工程化CRISPR-Cas12b系统，其包含：(a)Cas12b核酸酶或Cas12b效应蛋白，其包含SEQ ID NO:1至22和79至81中任一项的氨基酸序列或其编码核酸；和(b)gRNA，其包含与靶核酸或编码所述gRNA的核酸的靶序列互补的指导序列，其中所述gRNA包含工程化支架，所述工程化支架包含SEQ IDNO:25至53中任一项的序列；其中Cas12b核酸酶或Ca s12b效应蛋白和gRNA能够形成特异性结合靶核酸的CRISPR复合物，并诱导靶核酸的修饰。在一些实施方案中，gRNA包含crRNA和tracrRNA，并且其中tracrRNA包含工程化支架或其部分。在一些实施方案中，工程化CRISPR-Cas12b系统包含编码多种crRNA的前体gRNA阵列。在一些实施方案中，所述gRNA是sgRNA。在一些实施方案中，所述工程化CRISPR-Cas12b系统包含一种或多种编码工程化Cas12b核酸酶、工程化Cas12b效应蛋白、Cas12b核酸酶或Cas12b效应蛋白的载体。在一些实施方案中，一个或多个载体是AAV载体。在一些实施方案中，一个或多个载体进一步编码gRNA。

PAM

在一些实施方案中，工程化的Cas12b核酸酶或其变体或衍生物、工程化的Cas12b效应蛋白、Cas12b核酸酶或Cas12b效应蛋白质Cas12b识别包含(或组成为)5′-TTN-3′序列(其中N是A、T、G或C)的PAM。在一些实施方案中，PAM包括或由5'-TTC-3'、5'-TTTA-3'、5'-TTT-3'或5'-TTG-3'组成。

指导RNA

本申请的工程化CRISPR-Cas12b系统可以包含任何合适的指导RNA。指导RNA(gRNA)可以包含能够与感兴趣的靶核酸(诸如细胞中感兴趣的基因组基因座)中的靶序列杂交的指导序列(或间隔区)。在一些实施方案中，gRNA包含CRISPRRNA(crRNA)序列，该crRNA序列包含指导序列。在一些实施方案中，本文所述的crRNA包括同向重复序列(DR)和间隔区序列。在某些实施方案中，crRNA包括连接至指导序列或间隔区序列的同向重复序列、基本上由连接至指导序列或间隔区序列的同向重复序列组成，或由连接至指导序列或间隔区序列的同向重复序列组成。在某些实施方式中，直接重复序列可以位于指导序列或间隔序列的上游(即5′)。在其他实施方式中，直接重复序列可以位于指导序列或间隔序列的下游(即3')。在一些实施方案中，crRNA包括同向重复序列、间隔区序列，以及同向重复序列(DR-间隔区-DR)，这是前体crRNA(前crRNA)构型的典型构型。在一些实施方案中，crRNA包括截短的同向重复序列和间隔区序列，这是经加工的或成熟的crRNA的典型序列。在一些实施方案中，crRNA包含突变体DR序列和间隔序列。在一些实施方案中，gRNA包含反式激活CRISPRRNA(tracrRNA)序列。在一些实施方案中，tracrRNA在DR序列的5'端与crRNA融合。在一些实施方案中，指导RNA是单指导RNA(sgRNA)。在一些实施方案中，gRNA或sgRNA包含tracrRNA和crR NA。在一些实施方案中，所述sgRNA包含SEQ ID NO:23至53中任一项的序列。在一些实施方案中，所述tracrRNA包含SEQ ID NO:23至53中任一项的序列或其一部分。

在一些实施方案中，gRNA包含非同源的crRNA序列和/或tracrRNA序列，这些序列在参考Cas12b蛋白的CRISPR基因座中没有天然发现。例如，在TengF.等人的CellDiscovery(2019)5:23的图S4和图S8中描述了AaCas12b、AkCa s12b，AmCas12b和BhCas12b的同源tracrRNA和crRNA序列，BsCas12b以及BsCas12b、LsCas12b和SbCas12b及其示例性sgRNA序列，其内容通过引用全部并入本文。

在一些实施方案中，本文所述的CRISPR-Cas12b系统包含一种或多种(例如1、2、3、4、5、10、15或更多)gRNA(例如crRNA、tracrRNA或sgRNA)或编码其的核酸。在一些实施方案中，两个或多个gRNA靶向不同的靶位点，例如同一靶DNA或基因的2个靶位点，或2个不同靶DNA或基因的2个靶位点。

本文所述的gRNA的序列和长度可以被优化。在一些实施方案中，gRN A的最佳长度可以通过鉴定crRNA的加工形式或通过crRNA的经验长度研究来确定。在一些实施方案中，gRNA包含碱基修饰，例如在gRNA支架区域中。

间隔区不需要完全互补，前提是gRNA(例如，crRNA或sgRNA)具有足够的互补性以发挥作用(即，将Cas12b核酸酶(例如工程化的)或其效应蛋白导向靶位点)。由gRNA介导的Cas12b核酸酶(例如工程化的)或其效应蛋白的编辑或切割效率可以通过引入一个或多个错配(例如，间隔区序列和靶序列之间的1或2个错配，包括沿着间隔区/靶序列的错配的位置)来调节。当错配(例如双错配)位于间隔区的更中心时(即，不在间隔区的3'或5'端)，对切割效率有更大的影响。因此，通过选择沿着间隔区序列的错配位置，可以调节Cas12b核酸酶(例如工程化的)或其效应蛋白的编辑或切割效率。例如，如果期望靶序列的编辑或切割少于100％(例如，在细胞群中)，则间隔区序列和靶序列之间的1或2个错配可以被引入到间隔区序列中。

在一些实施方案中，指导序列或间隔区被设计成与靶序列具有至少一个错配，使得在指导序列和靶序列之间形成的异源双链包括与靶A相对的指导序列中的非配对C，或与靶C相对的指导序列中的非配对A，用于靶序列上的脱氨基(例如用于碱基编辑)。在一些实施方案中，除了这种A-C或C-A错配之外，当使用合适的比对算法进行最佳比对时，互补程度约为或大于约50％、60％、75％、80％、85％、90％、95％、97.5％、99％或更多。所述指导序列可以具有合适的长度。在一些实施方案中，指导或间隔区序列的长度为约10nt至约50nt。在一些实施方案中，指导或间隔区序列的长度为至少约16个核苷酸，优选约16至约100个核苷酸，更优选约16到约50个核苷酸(例如，约16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个核苷酸中的任一项)。在一些实施方案中，间隔区为约16至约27个核苷酸，例如约17至约24个核苷酸、约18至约24种核苷酸或约18至22种核苷酸中的任一项。在一些实施方案中，指导序列在约18至约35个核苷酸之间，包括例如18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸中的任一项。

在一些实施方案中，指导或间隔区序列是与靶序列互补的至少约60％(例如，至少约70％、75％、80％、85％、90％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％中的任一项)。在一些实施方案中，在间隔区序列和靶核酸(例如DNA)的靶序列之间存在至少约15个(例如，至少约16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50个或更多个)碱基配对。

可以使用用于对齐序列的任何合适的算法来确定最佳对齐，其非限制性示例包括Smith-Waterman算法、Needleman-Wunsch算法、基于Burrows-Wh eeler变换的算法(例如，Burrows-Wheeler对齐器)、ClustalW、Clustal X、BL AT、Novolign(NovocraftTechnologies；可在www.Novocraft.com上获得)、，ELAND(Illumina，San Diego，CA)、SOAP(可在SOAP.genomis.org.cn上获得)和Maq(可在Maq.sourceforge.net上获得)。指导序列(在靶向核酸的指导RNA内)引导核酸靶向复合物与靶核酸序列的序列特异性结合的能力可以通过任何合适的测定来评估。例如，可将足以形成核酸靶向复合物的核酸靶向CRI SPR系统的组分(包括待测试的指导序列)提供给具有相应靶核酸序列的宿主细胞，例如通过用编码核酸靶向复合体的组分的载体转染，随后评估靶核酸序列内的优先靶向(例如切割)，例如通过本文所述的Surveyor分析。类似地，可通过提供靶核酸序列、核酸靶向复合物的组分(包括待测试的指导序列和不同于测试指导序列的对照指导序列)、并比较测试和对照指导序列反应之间靶序列处的结合或切割速率在测试中评估靶核酸序列的切割。其他测定是可能的，并且本领域技术人员会想到。

如本文所用，靶核酸与靶序列或靶核酸序列互换使用，以指包含与crR NA或gRNA中的间隔区的全部或部分互补的核酸序列的特定核酸。在一些实施方案中，靶核酸包含基因或基因内的序列。在一些实施方案中，靶核酸包含非编码区(例如启动子)。在一些实施方案中，靶核酸是单链的。在一些实施方案中，靶核酸是双链的。可以选择靶核酸以靶向任何靶核酸序列，诸如DNA或RNA序列(例如mRNA)。

靶核酸应与PAM(即由CRISPR复合物识别的短序列)相关联。根据CRISP R-Cas蛋白的性质，应选择下述靶序列，其在DNA双链体中的互补序列(靶序列的互补序列)位于PAM的上游或下游。在本申请的一个实施方式中，靶序列的互补序列是PAM的下游或3'。PAM的确切序列和长度的要求取决于所用的Cas12b蛋白。

“tracrRNA”序列或类似术语包括与crRNA序列具有足够互补性以进行杂交的任何多核苷酸序列。在一些实施方案中，当理想对齐时，tracrRNA序列和crRNA序列沿两者中较短者的长度的互补程度为约或大于约25％、30％、40％、50％、60％、70％、80％、90％、95％、97.5％、99％或更高。在一些实施方案中，tracr序列的长度为约或大于约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50或更多个核苷酸。在一些实施方案中，tracr序列和crRNA序列包含在单个转录物内，使得两者之间的杂交产生具有二级结构的转录物，例如一个或多个发夹。通常，互补程度是指指导序列和tracr序列沿着两个序列中较短序列的长度的理想对齐。理想对齐可以通过任何合适的对齐算法来确定，并且可以进一步考虑二级结构。

任何能介导本文所述Cas12b蛋白与相应gRNA(例如crRNA)结合的gRNA支架或tracrRNA或DR序列均可用于本申请。在一些实施方案中，gRNA支架或tracrRNA或DR序列在5'或3'端附近(紧邻间隔区序列)包含茎环结构。“茎环结构”是指具有下述二级结构的核酸，该二级结构包括已知或预测形成双链(茎)部分的核苷酸区域，并在一端通过基本单链核苷酸的连接区域(环)连接。术语“发夹”结构在本文中也用于指代茎环结构。这种结构在本领域中是公知的，并且这些术语根据其在本领域的公知含义来使用。茎环结构不需要精确的碱基配对。因此，杆可以包括一个或多个碱基错配。或者，碱基配对可能是精确的，即不包括任何错配。

在一些实施方案中，gRNA支架或tracrRNA或DR是野生型骨架或tracrR NA或DR的“功能变体”，例如“功能截短型”、“功能延长型”或“功能替代型”。“gRNA支架或tracrRNA或DR的“功能变体”是参考骨架或tracrRNA或DR(例如亲代DR)的5'和/或3'延长(功能延长版本)或截短(功能截短版本)变体，和/或一个或多个核苷酸相对于参考骨架或tracrRNA或DR(例如亲代DR)的取代(功能替代版本)。该功能介导Cas12b核酸酶(例如工程化的)或其效应蛋白与相应的sgRNA或crRNA的结合。gRNA支架或tracrRNA或DR功能变体通常保留可用于结合Cas12b核酸酶(例如工程化的)或其效应蛋白的茎环状二级结构或其部分。在一些实施方案中，所述gRNA支架或tracrRNA或DR或其功能变体包含至少两个(例如2、3、4、5或更多个)茎环状二级结构或其部分，可用于结合Cas12b核酸酶(例如工程化的)或其效应蛋白。

在一些实施方案中，DR或其功能变体包含至少约16个核苷酸(nt)，诸如16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或更多个核苷酸。在一些实施方案中，DR包含约20nt至约40nt，例如约20nt至约30nt、约22nt至约40nt、约23nt至约38nt、约23nt至约36nt、或约30nt至约40nt。在一些实施方案中，DR包括22nt、23nt或24nt。在一些实施方案中，DR包括35nt、36nt或37nt。在一些实施方案中，sgRNA支架或其功能变体包含约50nt至约180nt，例如约70nt至约140nt，或约90nt至约120nt中的任一项。

在一些实施方案中，sgRNA包含骨架序列，该骨架序列在间隔序列的5'端附近包含茎环结构(例如1、2、3、4或更多个茎环)。在一些实施方案中，所述茎包括至少约4bp，其包含互补的X和Y序列，但也可以考虑更多个例如5、6、7、8、9、10、11或12个或更少个例如3、2个碱基对的茎。因此，可以考虑例如X2-10和Y2-10(其中X和Y表示任何互补的核苷酸组)。在一些实施方案中，由X和Y核苷酸制成的茎与环一起将在整个二级结构中形成完整的发夹；并且，这可能是有利的，并且碱基对的数量可以是形成完整发夹的任何数量。在一些实施方案中，只要保留整个指导分子的二级结构，就可以容忍任何互补的X:Y碱基配对序列(例如关于长度)。在一些实施方案中，连接由X:Y碱基对制成的茎的环可以是相同长度(例如4或5个核苷酸)或更长的任何序列，其不中断指导分子的整体二级结构。在一些实施方案中，所述茎包含约5-7bp，其包含互补的X和Y序列，但也可以考虑更多或更少碱基对的茎。在一些实施方案中，设想非沃森-克里克基配对，其中这种配对通常在该位置保持茎环的结构。在一些实施方案中，包含在骨架序列中的茎包含(例如组成为)5对彼此杂交的互补碱基，环长度为6、7、8或9个核苷酸。在一些实施方案中，杆可以包括至少2个、至少3个、至少4个或至少5个碱基对。在一些实施方案中，茎环结构包括长度为5个核苷酸的第一茎核苷酸链；长度为5个核苷酸的第二茎核苷酸链，其中所述第一和第二茎核苷酸链可以彼此杂交；以及布置在所述第一和第二茎核苷酸链之间的环核苷酸链，其中所述环核苷酸链包括6、7或8个核苷酸。

在一些实施方案中，指导分子的自然发夹或茎环结构被延长或被延长的茎环取代。在某些情况下已经证明，茎的延长可以增强指导分子与CRISPR-Cas蛋白的组装(Chen等人，Cell.(2013)；155(7):1479-1491).在一些实施方案中，茎环的茎延长至少1、2、3、4、5或更多互补碱基对(即，对应于在指导分子中添加2、4、6、8、10或更多个核苷酸)。在一些实施方案中，它们位于茎的末端，邻近茎环的环。

如本文所用，两个或多个sgRNA或tracrRNA的二级结构基本相同或基本不同，这意味着这些sgRNA或tracrRNA包含长度相差不超过1、2或3个核苷酸的茎和/或环；就核苷酸类型(A、U、G或C)而言，当通过序列对齐进行比较时，这些sgRNA或tracrRNA的核苷酸序列的差异不超过1、2、3、4、5、6、7或8个核苷酸。在一些实施方案中，两个或多个sgRNA或tracrRNA的二级结构基本相同或非基本不同，这意味着sgRNA或tracrRNA含有相差最多一对互补碱基的茎和/或长度相差最多一个核苷酸的环，和/或含有长度相同但碱基错配的茎。

在一些实施方案中，可以将本申请的任何工程化Cas12b效应蛋白导向靶位点的gRNA支架序列包括一个或多个选自核苷酸添加、插入、缺失和/或缺失的核苷酸变化，以及与SEQ ID NO:23至53中任一项或其功能性截短版本中所述的骨架序列相比不会导致二级结构的实质性差异的取代。在一些实施方案中，所述gRNA支架包含SEQ ID NO:25至53中任一项的序列或其变体，其包含最高约10nt(例如10、9、8、7、6、5、4、3、2或1nt)的差异。

在一些实施方案中，指导RNA包含crRNA。在一些实施方案中，工程化CRISPR-Cas12b系统包含编码多个crRNA的前体指导RNA阵列。在一些实施方案中，Cas12b效应蛋白切割前体指导RNA阵列以产生多个crRNA。在一些实施方案中，工程化CRISPR-Cas12b系统包含编码多个crRNA的前体指导RN A阵列，其中每个crRNA包含不同的指导序列。在一些实施方案中，由前体指导RNA阵列编码的crRNA与tracrRNA相关联。

构建体和载体

本文还提供了编码本文所述的工程化Cas12b效应蛋白(包括工程化Cas12b核酸酶)中的任一种的构建体、载体，以及表达系统。在一些实施方案中，构建体、载体，或表达系统还包含一种或多种gRNA(例如，sgRNA)或crRNA阵列。

“载体”是包含分离的核酸并且可以用于将分离的核酸递送至细胞内部的物质组合物。本领域已知许多载体，包括但不限于线性多核苷酸、与离子或两亲化合物相关联的多核苷酸、质粒，以及病毒。通常，合适的载体含有在至少一种生物体中功能正常的复制起点、启动子序列、方便的限制性核酸内切酶位点，以及一个或多个可选择标记物。术语“载体”也应当被解释为包括促进核酸转移到细胞中的非质粒和非病毒化合物，诸如聚赖氨酸化合物、脂质体等。

在一些实施方案中，载体是病毒载体。病毒载体的实例包括但不限于腺病毒载体、腺相关病毒载体、慢病毒载体、逆转录病毒载体、痘苗病毒载体、单纯疱疹病毒载体，及其衍生物。在一些实施方案中，载体是噬菌体载体。病毒载体技术是本领域熟知的，并且描述于例如Sambrook等人(2001《分子克隆：实验室手册(Molecular Cloning:A LaboratoryManual)》冷泉港实验室,纽约)和其它病毒学和分子生物学手册。

已经开发了许多基于病毒的系统来将基因转移到哺乳动物细胞中。例如，逆转录病毒为基因递送系统提供了方便的平台。可以使用本领域已知的技术将异源核酸插入载体中并包装在逆转录病毒颗粒中。然后可以分离重组病毒并在体外或离体递送至工程化哺乳动物细胞。许多逆转录病毒系统是本领域已知的。在一些实施方案中，使用腺病毒载体。许多腺病毒载体是本领域已知的。在一些实施方案中，使用慢病毒载体。在一些实施方案中，使用自身失活慢病毒载体。

在某些实施方案中，载体是腺相关病毒(AAV)载体，例如AAV2、AAV8，或AAV9，它们可以以含有至少1×10⁵个颗粒(也称为颗粒单位，pu)的腺病毒或腺相关病毒的单剂量施用。在一些实施方案中，剂量为至少约1×10⁶个颗粒、至少约1×10⁷个颗粒、至少约1×10⁸个颗粒，或至少约1×10⁹个颗粒的腺相关病毒。递送方法和剂量描述于例如WO2016205764和美国专利第8,454,972号，它们每个的内容通过引用整体并入本文。

在一些实施方案中，载体是重组腺相关病毒(rAAV)载体。例如，在一些实施方案中，经修饰的AAV载体可以用于递送。经修饰的AAV载体可以基于若干衣壳类型中的一种或多种，包括AAV1、AV2、AAV5、AAV6、AAV8、AAV8.2.AAV9、AAVrh10、经修饰的AAV载体(例如，经修饰的AAV2、经修饰的AAV3、经修饰的AAV6)，以及假型化AAV(例如，AAV2/8、AAV2/5，以及AAV2/6)。可以用于产生rAAV颗粒的示例性AAV载体和技术是本领域已知的(参见例如Aponte-Ubillus等人(2018)《应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)》102(3):1045-54；Zhong等人(2012)《遗传综合征基因疗法杂志(J.Genet.Syndr.GeneTher.)》S1:008；West等人(1987)《病毒学(Virology)》160:38-47(1987)；Tratschin等人(1985)《分子细胞生物学(Mo l.Cell.Biol.)》5:3251-60；美国专利第4,797,368号和第5,173,414号；和国际公开案第WO2015/054653号和第WO93/24641号，它们中的每一者通过引用并入本文)。

用于递送Cas9和其它Cas12b蛋白的已知AAV载体中的任一种可以用于递送本申请的工程化Cas12b核酸酶或效应蛋白或系统。

将载体引入哺乳动物细胞的方法是本领域已知的。可以通过物理、化学，或生物方法将载体转移到宿主细胞中。

将载体引入宿主细胞的物理方法包括磷酸钙沉淀、脂质转染、粒子轰击、显微注射、电穿孔等。产生包含载体和/或外源核酸的细胞的方法是本领域熟知的。参见例如Sambrook等人(2001)《分子克隆：实验室手册》冷泉港实验室,纽约。在一些实施方案中，通过电穿孔将载体引入细胞。

用于将异源核酸引入宿主细胞的生物方法包括使用DNA和RNA载体。病毒载体已经成为最广泛使用的将基因插入哺乳动物(例如，人类细胞)中的方法。

用于将载体引入宿主细胞的化学手段包括胶体分散系统，诸如大分子复合物、纳米胶囊、微球、珠粒，以及基于脂质的系统，包括水包油乳液、胶束、混合胶束，以及脂质体。用作体外递送载体的示例性胶体系统是脂质体(例如，人工膜囊泡)。在一些实施方案中，工程化CRISPR-Cas12b系统作为纳米颗粒中的RNP递送。

在一些实施方案中，编码CRISPR-Cas12b系统或其组分的载体或表达系统包含一种或多种可选择的或可检测的标记物，这些标记物提供分离或有效选择含有CRISPR-Cas12b系统和/或已经被CRISPR-Cas12b系统修饰(例如，在早期阶段并且大规模地)的细胞的手段。

报告子基因可以用于鉴定潜在的经转染细胞以及评价调节序列的功能性。通常，报告子基因是这样的基因：其不存在于受体生物体或组织中或者不由受体生物体或组织表达，并且编码其表达由一些容易检测的性质(例如，酶活性)证明的多肽。在已经将DNA引入受体细胞之后的合适时间测定报告子基因的表达。合适的报告子基因可以包括编码荧光素酶、β半乳糖苷酶、氯霉素乙酰转移酶、分泌型碱性磷酸酶的基因，或绿色荧光蛋白基因(例如，Ui-Tei等人《FEBS快报(FEBSLetters)》479:79-82(2000))。

确认宿主细胞中存在异源核酸的其它方法包括例如本领域技术人员熟知的分子生物学测定，诸如Southern和Northern印迹、RT-PCR和PCR；生物化学测定，诸如通过免疫学方法(诸如ELISA和Western印迹)检测特定肽的存在与否。

在一些实施方案中，编码工程化Cas12b核酸酶或效应蛋白和/或指导RN A的核酸序列可操作地连接至启动子。在一些实施方案中，启动子相对于使用工程化CRISPR-Cas12b系统进行工程化的细胞是内源启动子。例如，可以使用本领域已知的任何方法将编码工程化Cas12b效应蛋白的核酸敲入内源启动子下游的工程化哺乳动物细胞的基因组中。在一些实施方案中，内源启动子是丰富蛋白(诸如β肌动蛋白)的启动子。在一些实施方案中，内源启动子是可诱导启动子，例如，可由工程化哺乳动物细胞的内源激活信号诱导。在一些实施方案(其中工程化哺乳动物细胞是T细胞)中，启动子是T细胞激活依赖性启动子(诸如IL-2启动子、NFAT启动子，或NFκB启动子)。

在一些实施方案中，启动子相对于使用工程化CRISPR-Cas12b系统进行工程化的细胞是异源启动子。已经探索了用于哺乳动物细胞中基因表达的各种启动子，并且本领域已知的启动子中的任一种均可以用于本申请。启动子可以被粗略地分类为组成型启动子或调节型启动子，诸如可诱导启动子。

在一些实施方案中，编码工程化Cas12b效应蛋白和/或指导RNA的核酸序列可操作地连接至组成型启动子。组成型启动子允许异源基因(也称为转基因)在宿主细胞中组成型表达。本文设想的示例性组成型启动子包括但不限于巨细胞病毒(CMV)启动子、人延长因子-1α(hEF1α)、泛素C启动子(Ub iC)、磷酸甘油激酶启动子(PGK)、猿猴病毒40早期启动子(SV40)，以及与CMV早期增强子偶联的鸡β肌动蛋白启动子(CAG)。在一些实施方案中，启动子是CAG启动子，其包含巨细胞病毒(CMV)早期增强子元件、启动子、鸡β肌动蛋白基因的第一外显子和第一内含子，以及兔β珠蛋白基因的剪接受体。

在一些实施方案中，编码工程化CRISPR-Cas12b蛋白和/或指导RNA的核酸序列可操作地连接至可诱导启动子。可诱导启动子属于调节型启动子的类别。可诱导启动子可以由一种或多种条件诱导，诸如宿主细胞的物理条件、微环境，或生理状态；诱导物(即，诱导剂)；或其组合。在一些实施方案中，诱导条件选自：诱导物、辐射(诸如电离辐射、光)、温度(诸如热)、氧化还原状态、肿瘤环境，以及待通过工程化CRISPR-Cas12b系统而工程化的细胞的激活状态。在一些实施方案中，启动子可以被小分子诱导物(诸如化学化合物)诱导。在一些实施方案中，小分子选自：强力霉素、四环素、醇、金属，或类固醇。已经最广泛地探索了化学诱导的启动子。这种启动子包括转录活性受小分子化学物质(诸如强力霉素、四环素、醇、类固醇、金属，以及其它化合物)的存在与否调节的启动子。具有逆四环素控制的反式激活子(rtTA)和四环素响应性元件启动子(TRE)的强力霉素可诱导系统是目前最成熟的系统。WO9429442描述了四环素响应性启动子对真核细胞中基因表达的严格控制。WO9601313公开了四环素调节的转录调制器。附加地，四环素技术(诸如四环素可调节(Tet-on)系统)已经描述于例如TetSystems.com的网站上。已知的化学调节的启动子中的任一种均可以用于驱动本申请中编码工程化C RISPR-Cas12b蛋白和/或指导RNA的表达。

在一些实施方案中，编码工程化Cas12b核酸酶或效应蛋白的核酸序列是密码子优化的。在一些实施方案中，表达构建体编码可操作地连接至工程化Cas12b核酸酶或效应蛋白的C末端的标签(例如，10xHis标签)。在一些实施方案中，每个工程化的分裂的Cas12b构建体编码荧光蛋白，诸如GFP或RFP。报告蛋白可以用于评估工程化的分裂的Cas12b蛋白的共定位和/或二聚化(例如，使用显微镜)。编码工程化Cas12b效应蛋白的核酸序列可以使用编码自身切割肽(诸如T2A、P2A、E2A，或F2A肽)的序列融合至编码附加组分的核酸序列。

在一些实施方案中，提供了用于哺乳动物细胞(例如，人类细胞)的表达构建体，该表达构建体包含编码工程化Cas12b核酸酶或效应蛋白的核酸序列。在一些实施方案中，表达构建体包含插入pCAG-2A-eGFP载体中的编码工程化Cas12b核酸酶或效应蛋白的密码子优化的序列，使得Cas12b蛋白可操作地连接至eGFP。在一些实施方案中，提供第二载体以用于在哺乳动物细胞(例如，人类细胞)中表达指导RNA(例如，sgRNA、crRNA，或前crRNA阵列)。在一些实施方案中，编码指导RNA的序列在pUC19-U6-Aa-sgRNA载体骨架中表达。

在一些实施方案中，编码Cas12b蛋白的核酸和编码gRNA的核酸位于不同的载体上。在一些实施方案中，编码Cas12b蛋白的核酸和编码gRNA的核酸位于同一载体上。在一些实施方案中，编码Cas12b蛋白的核酸和编码gRN A的核酸受不同启动子(例如CMV启动子和U6启动子)的控制。在一些实施方案中，编码Cas12b蛋白的核酸位于编码gRNA的核酸的上游。在一些实施方案中，编码Cas12b蛋白的核酸位于编码gRNA的核酸的下游。在一些实施方案中，使编码Cas12b蛋白的核酸和编码gRNA的核酸同时地与靶核酸接触或引入细胞。在一些实施方案中，使编码Cas12b蛋白的核酸和编码gRNA的核酸依次地与靶核酸接触或引入细胞，例如在编码gRNA的核酸之前引入编码Cas12a蛋白的核酸，或者在编码gRNA的核酸之后引入编码Cas12b蛋白的核酸。在一些实施方案中，细胞已经表达Cas12b蛋白。在一些实施方案中，只有编码gRNA的核酸被引入细胞。在一些实施方案中，细胞已经表达gRNA。在一些实施方案中，仅将编码Cas12b蛋白的核酸引入细胞。

III.使用方法

本申请的一个方面提供了使用本文所述的工程化Cas12b核酸酶或效应蛋白或CRISPR-Cas12b系统中的任一种在体外、离体，或在体内检测靶核酸或修饰核酸的方法，以及使用工程化Cas12b核酸酶或效应蛋白或CRISPR-Cas12b系统的治疗或诊断方法。还提供了本文所述的工程化Cas12b效应蛋白或CRISPR-Cas12b系统用于检测或修饰细胞中的核酸，以及用于治疗或诊断受试者的疾病或病症的用途；以及包含工程化Cas12b核酸酶或效应蛋白或工程化CRISPR-Cas12b系统的一种或多种组分中的任一种的组合物，该组合物用于制造用于检测或修饰细胞中的核酸以及用于治疗或诊断受试者的疾病或病症的药物。

修饰方法

在一些实施方案中，本申请提供了修饰包含靶序列的靶核酸的方法，其包含将靶核酸与本文所述的工程化CRISPR-Cas12b系统中的任一种或其组分接触。例如，当Cas12b蛋白或编码它的核酸已经存在时，则仅需要进一步提供gRNA或编码它的核酸；当gRNA或编码它的核酸已经存在时，则仅需要进一步提供Cas12b蛋白或编码它的核酸。在一些实施方案中，提供了一种修饰包含靶序列的靶核酸的方法，包括使靶核酸与CRISPR-Cas12b系统(例如工程化的、非天然存在的)接触(例如体外、离体或体内)，其中CRISPR-Cas12b系统包括：(a)工程化的Cas12b核酸酶或其效应蛋白(例如，切口酶、分裂的Ca s12b蛋白、转录阻遏物、转录激活物、碱基编辑器或引导编辑器)，其包含相对于参考Cas12b核酸酶的一种、两种或三种类型的突变，其中所述突变包括：(1)用带正电荷的氨基酸残基(例如R、H、K)取代与PAM相互作用的参考Cas12b核酸酶中的一个或多个氨基酸残基(例如以下位置中的一个或多个：116、123、130、132、144、145、153、173、222、395、400和475)；和/或(2)用具有芳香环的氨基酸残基(例如F、Y、W)取代参比Cas12b核酸酶中参与打开DNA双链的一个或者多个氨基酸残基(例如以下位置中的一个或多个：118和119)；和/或(3)用带正电荷的氨基酸残基(例如R、H、K)或疏水性氨基酸残基(例如F、Y、W、M)取代与ssDNA底物相互作用的参考Cas12b核酸酶RuvC结构域中的一个或多个氨基酸残基(例如以下位置中的一或多个：300、301、304、329、636、639、647、682、757、758、761、764、768、852、854、856、857、858、860、862、863、865、866、867、869、938、956、957、958、994、1093和1097)，其中参考Cas12b核酸酶包含SEQ IDNO:1的氨基酸序列，或编码工程化Cas12b核酸酶或其效应蛋白的核酸；和(b)gRNA，其包含与所述靶核酸的靶序列互补的指导序列或编码所述gRNA的核酸，导致靶核酸被工程化的Cas12b核酸酶或其效应蛋白修饰。在一些实施方案中，所述gRNA包含含有SEQ ID NO:23和25至53中任一序列的骨架。在一些实施方案中，所述工程化的Cas12b核酸酶或其效应蛋白包含SEQ ID NO：2至22和79至81中任一项的氨基酸序列。在一些实施方案中，提供了一种修饰包含靶序列的靶核酸的方法，该方法包括使靶核酸与CRISPR-Cas12b系统(例如工程化的、非天然存在的)接触(例如，体外、离体或体内)，其中所述CRISPR-Cas12b系统包含一种、两种或三种类型的相对于参考Cas12b核酸酶的的突变，其中所述突变包括：(1)用带正电的氨基酸残基(例如R、H、K)取代与PAM相互作用的参考Cas12b核酸酶中的一个或多个氨基酸残基，例如以下位置中的一或多个：116、123、130、132、144、145、153、173、222、395、400和475；和/或(2)用具有芳香环的氨基酸残基(例如F、Y、W)取代参比Cas12b核酸酶中参与打开DNA双链的一个或者多个氨基酸残基(例如以下位置中的一个或多个：118和119)；和/或(3)用带正电荷的氨基酸(例如R、H、K)或疏水性氨基酸残基(例如F、Y、W、M)取代与ssDNA底物相互作用的参考Cas12b核酸酶RuvC结构域中的一个或多个氨基酸残基(例如以下位置中的一或多个：300、301、304、329、636、639、647、682、757、758、761、764、768、852、854、856、857、858、860、862、863、865、866、867、869、938、956、957、958、994、1093和1097)残基，其中所述参考Cas12b核酸酶包含SEQ IDNO:1的氨基酸序列，或编码Cas12b核酸酶(例如工程化的)或其效应蛋白的核酸；和(b)gRNA，其包含与靶核酸的靶序列互补的指导序列或编码所述gRNA的核酸，其中所述gRNA包含工程化支架，所述工程化支架包含SEQ ID N O:25至53中任一项的序列；其中靶核酸的指导序列和靶序列的杂交介导Cas12b核酸酶(例如，工程化)或其效应蛋白与靶核酸的靶序列的接触，导致靶核酸被Cas12b核酸酶(例如工程化的)或者其效应蛋白修饰。在一些实施方案中，工程化的Cas12b核酸酶或其效应蛋白包含SEQ ID NO:2至22和79至81中任一项的序列。在一些实施方案中，该方法还包括提供包含修复/供体核酸的修复/供体模板，其中修复/供体的核酸能够在靶序列处(例如，通过同源重组)结合到修饰的靶核酸中。在一些实施方案中，靶核酸的修饰将靶核酸中的突变(例如，功能缺失突变)修复为野生型(或非有害型)序列。在一些实施方案中，靶核酸的修饰引入外源序列。在一些实施方案中，该方法在体外进行。在一些实施方案中，靶核酸存在于细胞中。在一些实施方案中，细胞是细菌细胞、酵母细胞、植物细胞，或动物细胞(例如哺乳动物细胞，诸如人或小鼠细胞)。在一些实施方案中，该方法离体进行。在一些实施方案中，该方法在体内进行。

在一些实施方案中，通过工程化CRISPR-Cas12b系统切割靶核酸或改变(例如碱基编辑)靶核酸中的靶序列。在一些实施方案中，通过工程化CRISP R-Cas12b系统改变靶核酸的表达。在一些实施方案中，靶核酸是基因组DN A，诸如在细胞中。在一些实施方案中，靶序列与疾病或病症关联。在一些实施方案中，修饰靶序列的方法治疗与靶序列关联的疾病或病症。在一些实施方案中，工程化CRISPR-Cas12b系统包含编码多个crRNA的前体指导RNA阵列，其中每个crRNA包含不同的指导序列。

在一些实施方案中，本申请提供了治疗与个体的细胞中的靶核酸相关联的疾病或病症的方法，其包含使用本文所述的修饰靶核酸的方法中的任一种修饰个体的细胞中的靶核酸，从而治疗疾病或病症。在一些实施方案中，该疾病或病症选自：癌症、心血管疾病、遗传疾病、自身免疫疾病、代谢疾病、神经变性疾病、眼病、细菌感染，以及病毒感染。

本文所述的工程化CRISPR-Cas12b系统可以以各种方式修饰细胞中的靶核酸，方式取决于CRISPR-Cas12b系统中工程化Cas12b效应蛋白的类型。在一些实施方案中，该方法诱导靶核酸中的位点特异性切割。在一些实施方案中，该方法切割细胞(诸如细菌细胞、植物细胞，或动物细胞(例如，哺乳动物细胞))中的基因组DNA。在一些实施方案中，该方法通过切割细胞中的基因组DNA而杀死细胞。在一些实施方案中，该方法切割细胞中的病毒核酸。在一些实施方案中，所述方法碱基编辑所述靶核酸，例如将有害或疾病相关突变修复为非疾病相关序列。在一些实施方案中，所述方法增强(例如增加至少约10％、20％、30％、40％、50％、60％、70％、80％、90％、1倍、2倍、5倍、10倍、20倍或更多中的任一项)靶核酸的表达(例如固定下调表达的有害突变)。在一些实施方案中，所述方法减少(例如减少至少约10％、20％、30％、40％、50％、60％、70％、80％、90％、1倍、2倍、5倍、10倍、20倍或更多中的任一项)靶核酸的表达(例如固定上调表达的有害突变)。

在一些实施方案中，该方法改变(诸如提高或降低)细胞中靶核酸的表达水平。在一些实施方案中，该方法提高细胞中靶核酸的表达水平(例如，使用基于融合至反式激活结构域的无酶活性Cas12b蛋白(例如SEQ ID NO:79至81中的任何)的工程化Cas12b效应蛋白)。在一些实施方案中，该方法降低细胞中靶核酸的表达水平(例如，使用基于融合至转录阻遏子结构域(诸如KR AB结构域)的无酶活性Cas12b蛋白(例如SEQ ID NO:79至81中的任何)的工程化Cas12b效应蛋白)。在一些实施方案中，该方法将表观遗传修饰引入细胞中的靶核酸(例如，使用基于融合至表观遗传修饰结构域的无酶活性Cas12b蛋白(例如SEQ IDNO:79至81中的任何)的工程化Cas12b效应蛋白)。在一些实施方案中，该方法将碱基编辑引入细胞中的靶核酸中，例如，使用基于与胞嘧啶脱氨酶结构域或腺苷脱氨酶结构域(例如TadA)或其功能片段融合的酶非活性Cas12b蛋白(例如SEQ ID NO:79至81中的任何)的工程化Cas12b效应蛋白。本文所述的工程化Cas12b系统可以用于将其它修饰引入靶核酸，其它修饰取决于工程化Cas12b效应蛋白所包含的功能结构域。

在一些实施方案中，该方法改变细胞中靶核酸中的靶序列。在一些实施方案中，该方法将突变引入细胞中的靶核酸。在一些实施方案中，该方法在细胞中使用一种或多种内源DNA修复途径，诸如非同源末端连接(NHEJ)或同源定向重组(HDR)，以修复由于CRISPR复合物进行序列特异性切割而在靶DNA中诱导的双链断裂。示例性突变包括但不限于插入、缺失、取代，以及移码。在一些实施方案中，该方法在靶基因座处插入供体DNA。在一些实施方案中，供体DNA的插入导致选择标记物或报告蛋白引入细胞。在一些实施方案中，供体DNA的插入导致基因敲入。在一些实施方案中，供体DNA的插入导致敲除突变。在一些实施方案中，供体DNA的插入导致取代突变，诸如单核苷酸取代。在一些实施方案中，该方法诱导细胞发生表型变化。

在一些实施方案中，工程化CRISPR-Cas12b系统用作遗传回路的一部分，或用于将遗传回路插入细胞的基因组DNA中。本文所述的诱导物控制的工程化的分裂的Cas12b效应蛋白尤其可以用作遗传回路的组分。遗传回路可以用于基因治疗。设计和使用遗传回路的方法和技术是本领域已知的。可以进一步参考例如Brophy,JenniferAN,以及ChristopherA.Voigt.“遗传回路设计原则(Principlesofgeneticcircuitdesign)”《自然方法(Naturemethods)》11.5(2014):508。

本文所述的工程化CRISPR-Cas12b系统可以用于修饰广泛的靶核酸。在一些实施方案中，靶核酸在细胞中。在一些实施方案中，靶核酸是基因组DNA。在一些实施方案中，靶核酸是染色体外DNA。在一些实施方案中，靶核酸对于细胞是外源的。在一些实施方案中，靶核酸是病毒核酸，诸如病毒DNA。在一些实施方案中，靶核酸是细胞中的质粒。在一些实施方案中，靶核酸是水平转移的质粒。在一些实施方案中，靶核酸是RNA，诸如mRNA。

在一些实施方案中，靶核酸是分离的核酸，诸如分离的DNA。在一些实施方案中，靶核酸存在于无细胞环境中。在一些实施方案中，靶核酸是分离的载体，诸如质粒。在一些实施方案中，靶核酸是分离的线性DNA片段。

本文所述的方法适用于任何合适的细胞类型。在一些实施方案中，细胞是细菌、酵母细胞、真菌细胞、藻类细胞、植物细胞，或动物细胞。(例如，哺乳动物细胞，诸如人类细胞)。在一些实施方案中，细胞是从天然来源分离的细胞，诸如组织活检。在一些实施方案中，细胞是从体外培养的细胞系分离的细胞。在一些实施方案中，细胞来自原代细胞系。在一些实施方案中，细胞来自无限增殖化细胞系。在一些实施方案中，细胞是遗传工程化细胞。

在一些实施方案中，细胞是来自生物体的动物细胞，该生物体包括但不限于：猫、狗、小鼠、大鼠、仓鼠、牛、绵羊、山羊、马、猪、鹿、鸡、鸭、鹅、兔，以及鱼。

在一些实施方案中，细胞是来自生物体的植物细胞，该生物体选自：玉米、小麦、大麦、燕麦、稻、大豆、油棕、红花、芝麻、烟草、亚麻、棉花、向日葵、珍珠粟、粟、高粱、油菜、大麻、蔬菜作物、饲料作物、经济作物、木本作物，以及生物质作物。

在一些实施方案中，细胞是哺乳动物细胞。在一些实施方案中，所述细胞是小鼠细胞，诸如Neuro 2A(N2a)细胞。在一些实施方案中，细胞是人类细胞。在一些实施方案中，人类细胞是人类胚肾293T(HEK293T或293T)细胞或HeLa细胞。在一些实施方案中，哺乳动物细胞选自：免疫细胞、肝细胞、肿瘤细胞、干细胞、神经元细胞、合子、肌肉细胞，以及皮肤细胞。

在一些实施方案中，细胞是免疫细胞，该免疫细胞选自：细胞毒性T细胞、辅助T细胞、自然杀伤(NK)T细胞、iNK-T细胞、NK-T样细胞、γδT细胞、肿瘤浸润T细胞，以及树突细胞(DC)激活的T细胞。在一些实施方案中，该方法产生经修饰的免疫细胞，诸如CAR-T细胞、CAR-NK细胞或TCR-T细胞。

在一些实施方案中，细胞是胚胎干(ES)细胞、诱导多能干(iPS)细胞、配子的祖细胞、配子、合子，或胚胎中的细胞。

本文所述的方法可以用于在体内、离体，或在体外修饰靶细胞，并且可以以这样的方式进行：改变细胞，以使得一旦经过修饰，经修饰的细胞的后代或细胞系保留改变的表型。经修饰的细胞和后代可以是多细胞生物体的一部分，该多细胞生物体为诸如进行了离体或体内应用(诸如基因组编辑和基因治疗)的植物或动物。

在一些实施方案中，该修饰方法离体进行。在一些实施方案中，在将工程化CRISPR-Cas12b系统引入细胞后，离体繁殖经修饰的细胞(例如，哺乳动物细胞)。在一些实施方案中，培养经修饰的细胞以使其繁殖至少约1天、2天、3天、4天、5天、6天、7天、10天、12天，或14天中的任一个。在一些实施方案中，培养经修饰的细胞不超过约1天、2天、3天、4天、5天、6天、7天、10天、12天，或14天中的任一个。在一些实施方案中，进一步经PCR或测序评价或筛选经修饰的细胞以选择具有一种或多种理想表型或性质的细胞。

在一些实施方案中，靶序列是与疾病或病症相关联的序列。示例性疾病或病症包括但不限于癌症、血液疾病、心血管疾病、遗传疾病、自身免疫疾病、代谢疾病、神经疾病、神经变性疾病、眼病、细菌感染，以及病毒感染。在一些实施方案中，所述疾病或病症是移植物抗宿主病(GvHD)或宿主抗移植物病(HvG)。在一些实施方案中，疾病或病症是遗传疾病。在一些实施方案中，疾病或病症是单基因疾病或病症。在一些实施方案中，疾病或病症是多基因疾病或病症。

在一些实施方案中，与野生型序列相比靶序列具有突变。在一些实施方案中，靶序列具有与疾病或病症相关联的单核苷酸多态性(SNP)。

在一些实施方案中，插入靶核酸中的供体DNA编码生物产物，该生物产物选自：报告蛋白、抗原特异性受体、治疗蛋白、抗生素抗性蛋白、RNAi分子、细胞因子、激酶、抗原、抗原特异性受体、嵌合受体、细胞因子受体，以及自杀多肽。在一些实施方案中，供体DNA编码治疗蛋白，例如细胞因子。在一些实施方案中，供体DNA编码可以用于基因治疗的治疗蛋白。在一些实施方案中，供体DNA编码治疗抗体。在一些实施方案中，供体DNA编码工程化受体，诸如嵌合抗原受体(CAR)或工程化TCR。在一些实施方案中，供体DNA编码治疗RNA，诸如小RNA(例如，siRNA、shRNA，或miRNA)或长非编码RNA(lincRNA)。

本文所述的方法可以用于在两个或更多个(例如，2、3、4、5、6、8、10或更多个)不同的靶基因座处进行多重基因编辑或调节。在一些实施方案中，该方法检测或修饰多个靶核酸或靶核酸序列。在一些实施方案中，该方法包含将靶核酸与包含多个(例如，2、3、4、5、6、8、10或更多个)crRNA序列的指导RNA接触，其中每个crRNA包含不同的靶序列。

还提供了包含经修饰的靶核酸的工程化细胞，这些工程化细胞使用本文所述的修饰方法中的任一种产生。工程化细胞可以用于细胞治疗。使用本文所述的用于细胞治疗的方法，自体或同种异体细胞可以用于制备工程化细胞。

本文所述的方法还可以用于生成细胞(例如，哺乳动物细胞)的等基因系，以研究遗传变体。

还提供了包含本文所述的工程化细胞的工程化植物或非人动物。在一些实施方案中，工程化植物或非人动物是经基因组编辑的非人动物。工程化植物或非人动物可以用作疾病模型。

产生非人的经基因组编辑或转基因动物的技术是本领域熟知的，并且包括但不限于原核显微注射、病毒感染，以及胚胎干细胞和诱导多能干(iPS)细胞的转化。可以使用的详细方法包括但不限于描述于以下两项的那些方法：Sundberg和Ichiki(2006《遗传工程化小鼠手册(Genetically Engineered Mice Handbook)》CRC出版社)和Gibson(2004《基因组科学浅谈(A Primer Of Gen ome Science)》第2版,马萨诸塞州桑德兰(Sunderland,Mass.),Sinauer出版社)。

工程化动物可以是任何合适的物种，包括但不限于诸如牛科动物、马科动物、羊科动物、犬科动物、鹿科动物、猫科动物、山羊、猪、灵长类动物，以及不太常见的已知哺乳动物，诸如大象、鹿、斑马，或骆驼。

治疗方法

还提供了使用本文所述的修饰细胞中的靶核酸的方法中的任一种的治疗方法，和使用本文所述的检测靶核酸的方法中的任一种的诊断方法。

在一些实施方案中，本申请提供了治疗个体的细胞中与靶核酸相关联的疾病或病症的方法，其包含将靶核酸与本文所述的工程化CRISPR-Cas12b系统中的任一种接触，其中指导RNA的指导序列与靶核酸的靶序列互补，其中Cas12b核酸酶(例如工程化的)或其效应蛋白(例如包括SEQ ID NO:1至22和79至81中的任何)和指导RNA彼此缔合以结合至靶核酸从而修饰靶核酸，由此治疗疾病或病症。在一些实施方案中，将突变(例如，敲除或敲入突变)引入靶核酸。在一些实施方案中，靶核酸的表达被增强。在一些实施方案中，靶核酸的表达被抑制。

在一些实施方案中，本申请提供了治疗个体的疾病或病症的方法，其包含向个体施用有效量的本文所述的工程化CRISPR-Cas12b系统中的任一种以及编码治疗剂的供体DNA，其中指导RNA的指导序列与个体的靶核酸的靶序列互补，其中Cas12b核酸酶(例如工程化的)或其效应蛋白(例如包括SEQ ID NO:1至22和79至81中的任何)和指导RNA彼此缔合以结合至靶核酸并将供体DNA插入靶序列中，从而治疗疾病或病症。

在一些实施方案中，本申请提供了治疗个体的疾病或病症的方法，其包含向个体施用有效量的包含经修饰的靶核酸的工程化细胞，其中工程化细胞通过将细胞与本文所述的工程化CRISPR-Cas12b系统中的任一种接触来制备，其中指导RNA的指导序列与靶核酸的靶序列互补，其中工程化Cas12b核酸酶(例如工程化的)或其效应蛋白(例如包括SEQ IDNO:1至22和79至81中的任何)和指导RNA彼此缔合以结合至靶核酸从而修饰靶核酸。在一些实施方案中，工程化细胞是免疫细胞。

在一些实施方案中，提供了一种治疗个体(例如人)细胞中与靶核酸关联的疾病或病症的方法，包括使靶核酸(例如体外或体内)与个体接触或向个体施用有效量的CRISPR-Cas12b系统(例如工程化的、非自然发生的)，其中所述CRISPR-Cas12b系统包括：(1)用带正电的氨基酸残基(例如R、H、K)取代与PAM相互作用的参考Cas12b核酸酶中的一个或多个氨基酸残基，例如以下位置中的一或多个：116、123、130、132、144、145、153、173、222、395、400和475；和/或(2)用具有芳香环的氨基酸残基(例如F、Y、W)取代参比Cas12b核酸酶中参与打开DNA双链的一个或者多个氨基酸残基(例如以下位置中的一个或多个：118和119)；和/或(3)用带正电荷的氨基酸残基(例如R、H、K)或疏水性氨基酸残基(例如F、Y、W、M)取代与ssDNA底物相互作用的参考Cas12b核酸酶RuvC结构域中的一个或多个氨基酸残基(例如以下位置中的一或多个：300、301、304、329、636、639、647、682、757、758、761、764、768、852、854、856、857、858、860、862、863、865、866、867、869、938、956、957、958、994、1093和1097)，其中参考Cas12b核酸酶包含SEQ ID NO:1的氨基酸序列，或编码工程化Cas12b核酸酶或其效应蛋白的核酸；和(b)gRNA，其包含与所述靶核酸的靶序列互补的指导序列或编码所述gRNA的核酸，导致靶核酸被工程化的Cas12b核酸酶或其效应蛋白修饰，从而治疗疾病或病症。在一些实施方案中，gRNA包含含有SEQ ID NO:23和25至53中任一序列的骨架。在一些实施方案中，提供了一种治疗个体(例如人)细胞中与靶核酸相关的疾病或病症的方法，包括使靶核酸(例如在体外或体内)与个体接触或向个体施用有效量的CRISPR-Cas12b系统(例如工程化的、非自然发生的)，其中所述CRISPR-Cas12b系统包含一种、两种或三种类型的相对于参考Cas12b核酸酶的突变，其中所述突变包括：(1)用带正电的氨基酸残基(例如R、H、K)取代与PAM相互作用的参考Cas12b核酸酶中的一个或多个氨基酸残基，例如以下位置中的一或多个：116、123、130、132、144、145、153、173、222、395、400和475；和/或(2)用具有芳香环的氨基酸残基(例如F、Y、W)取代参比Cas12b核酸酶中参与打开DNA双链的一个或者多个氨基酸残基(例如以下位置中的一个或多个：118和119)；和/或(3)用带正电荷的氨基酸残基(例如R、H、K)或疏水性氨基酸残基(例如F、Y、W、M)取代与ssDNA底物相互作用的参考Cas12b核酸酶RuvC结构域中的一个或多个氨基酸残基(例如以下位置中的一或多个：300、301、304、329、636、639、647、682、757、758、761、764、768、852、854、856、857、858、860、862、863、865、866、867、869、938、956、957、958、994、1093和1097)，其中所述参考Cas12b核酸酶包含SEQ ID NO:1的氨基酸序列，或编码Cas12b核酸酶(例如工程化的)或其效应蛋白的核酸；和(b)gRNA，其包含与靶核酸的靶序列互补的指导序列或编码所述gRNA的核酸，其中所述gRNA包含工程化支架，所述工程化支架包含SEQ ID NO:25至53中任一项的序列；其中靶核酸的指导序列和靶序列的杂交介导Cas12b核酸酶(例如工程化的)或其效应蛋白与所述靶核酸的靶序列接触，这导致通过所述Cas12b核酸酶(例如工程化的)或其效应蛋白修饰靶核酸，从而治疗疾病或病症。在一些实施方案中，工程化的Cas12b核酸酶或其效应蛋白包含SEQ ID NO:2至22和79至81中任一项的氨基酸序列。在一些实施方案中，该方法还包括使靶核酸(例如，离体或体内)与有效量的修复/供体核酸接触或向个体施用有效量的修复/供体核酸，其中修复/供体的核酸能够在靶序列处(例如，通过同源重组)结合到修饰的靶核酸中。在一些实施方案中，靶核酸的修饰将靶核酸中的突变(例如，功能缺失突变)修复为野生型(或非有害型)序列。在一些实施方案中，靶核酸的修饰引入外源序列。

在一些实施方案中，个体是人类。在一些实施方案中，个体是动物，例如模型动物(诸如啮齿动物(例如小鼠、大鼠、仓鼠))、宠物(例如猫、狗、兔)，或农场动物(例如马、牛、绵羊、山羊、驴、猪)。在一些实施方案中，个体是哺乳动物。

在一些实施方案中，疾病或病症与个体(例如，人)的靶核酸中的异常(例如，致病性点突变)关联。在一些实施方案中，由于CRISPR-Cas12b系统或复合物对靶核酸的修饰(例如，切割、碱基编辑或修复)(例如修复异常)而治疗疾病或病症。在一些实施方案中，该疾病是由一个或多个靶基因的过度表达或错误表达(例如错义突变、移码突变、无义突变)引起的，其中，所述CRISPR-Cas12b系统或者复合物可以靶向所述一个或多个靶基因以靶向修饰，诸如切割、碱基编辑或序列修复(例如通过进一步引入修复/供体模板以通过同源重组修复通过CRISPR-Cas12b系统或复合物切割的靶基因)。

在一些实施方案中，该疾病或病症选自：癌症、心血管疾病、遗传疾病、自身免疫疾病、代谢疾病、神经变性疾病、眼病、细菌感染，以及病毒感染。

在一些实施方案中，所述疾病或病症选自转甲状腺素淀粉样变(ATTR)(例如转甲状腺素相关的野生型淀粉样变症(ATTRwt)、转甲状腺素相关遗传性淀粉样变病(ATTRm)、家族性淀粉样多发性神经病(FAP、ATTR-PN)或家族性淀粉状心肌病(FAC、ATTR-CM))、囊性纤维化、遗传性血管性水肿(HA E)、糖尿病、进行性假性肥厚性肌营养不良症、贝克肌营养不良(BMD)、α-1抗胰蛋白酶缺乏症(AAT缺乏症)、庞贝病、强直性肌营养失调、亨廷顿舞蹈症、脆性X综合征(FXS)、弗里德里希共济失调(FRDA)、肌萎缩性侧索硬化症(ALS)、额颞叶痴呆症(FTD)、遗传性慢性肾病、高脂血症、高胆固醇血症(如家族性高胆固醇血症)、Leber先天性黑蒙(LCA)、镰状细胞病(SCD)和β-地中海贫血。在一些实施方案中，CRISPR-Cas12b系统或复合物被包装并经由脂质纳米颗粒递送。在一些实施方案中，脂质纳米颗粒通过静脉注射或输注给药于个体。

在一些实施方案中，靶核酸是PCSK9。在一些实施方案中，疾病或病症是心血管疾病。在一些实施方案中，疾病或病症是冠状动脉疾病。在一些实施方案中，该方法降低个体的胆固醇水平。在一些实施方案中，该方法治疗个体的糖尿病。在一些实施方案中，所述疾病或病症是高胆固醇血症，诸如家族性高胆固醇血症。

在一些实施方案中，所述靶核酸是HBG1和/或HBG2。在一些实施方案中，所述疾病或病症是镰状细胞病或β-地中海贫血。在一些实施方案中，所述疾病或病症是由于点突变导致的胎儿血红蛋白(HPFH)、HbS基因缺失HPFH或HbSHPFH的遗传持续。

在一些实施方案中，所述靶核酸是C-C趋化因子受体(CCR)5(CCR5)，其编码主要HIV-1辅受体。在一些实施方案中，所述疾病或病症是传染病，例如艾滋病。在一些实施方案中，所述疾病或病症是非传染性疾病，例如癌症(例如，乳腺癌或前列腺癌)、动脉粥样硬化、中风或炎症性肠病(IBD)。

在一些实施方案中，所述靶核酸是CD34。在一些实施方案中，所述疾病或病症是癌症。

在一些实施方案中，所述靶核酸是环指蛋白2(RNF2)。在一些实施方案中，所述疾病或病症是神经障碍，诸如Luo-Schoch Yamamoto综合征或非特异性综合征智力失能。

检测方法

本申请还提供了使用具有提高的活性的工程化Cas12b核酸酶或其效应蛋白(例如包含SEQ ID NO:2至22和79至81中的任何)或CRISPR-Cas12b系统中的任一种来检测靶核酸的方法。Cas12b效应蛋白作为检测剂的用途利用了这样的发现，即V型CRISPR/Cas12蛋白(例如，Cas12a、Cas12b、Cas12c、Cas12d、Cas12e(CasX)，以及Cas12i)一旦通过对靶DNA的检测而被激活就可以混杂地切割非靶向单链DNA(ssDNA)。使用Cas12b蛋白作为检测剂的方法已经描述于例如US10253365和WO2020/056924，它们的内容通过引用整体并入本文。在一些实施方案中，检测样品中的靶核酸来诊断疾病或病症。

在一些实施方案中，一旦Cas12b效应蛋白被指导RNA激活(这发生在样品包括与指导RNA杂交的靶DNA(即，样品包括靶向DNA)时)，Cas12b核酸酶或其效应蛋白就变成混杂地切割单链核酸(例如，非靶ssDNA或RNA，即，不与指导RNA的指导序列杂交的单链核酸)的核酸酶。因此，当样品中存在靶向DNA(双链或单链)时(例如，在一些情况下高于阈值量)，结果是样品中单链核酸的切割，这可以使用任何方便的检测方法(例如，使用已标记单链检测核酸，诸如DNA或RNA)检测。Cas12b可以切割ssDNA和ssRNA。

在一些实施方案中，提供了检测样品中的靶DNA(例如，双链或单链)的方法，其包含：(a)将样品与以下物质接触：(i)本文所述的工程化Cas12b核酸酶或其效应蛋白(例如包含SEQ ID NO:2至22和79至81中的任何)中的任一种；(ii)包含与靶DNA杂交的指导序列的指导RNA；和(iii)检测核酸，其是单链的(即，“单链检测核酸”)并且不与指导RNA的指导序列杂交；和(b)测量由工程化Cas12b效应蛋白切割单链检测核酸而产生的可检测信号。在一些实施方案中，提供了一种检测样品中靶DNA(例如，双链或单链)的方法，包括：(a)使所述样品接触于(i)本文所述的Cas12b核酸酶(例如，工程化或野生型)或其效应蛋白中的任一种(例如，包含SEQ ID NO:1至22和79至81中的任一项)；(ii)包含与靶DNA杂交的指导序列的指导RNA，以及包含SEQ ID NO:25至53中任一序列的工程化支架；和(iii)单链的检测器核酸(即“单链检测器核酸”)，并且不与指导RNA的指导序列杂交；和(b)测量由工程化Cas12b效应蛋白切割单链检测器核酸产生的可检测信号。在一些实施方案中，提供了一种检测样品中靶核酸的方法，包括：(a)将样品与本文所述的任何工程化CRISPR-Cas12b系统和标记的检测器核酸接触，其中gRNA包含与靶核酸的靶序列互补的指导序列，并且其中所述标记的检测器核酸是单链的并且不与所述gRNA的指导序列杂交；和(b)测量通过工程化CRISPR-Cas12b系统切割标记的检测器核酸产生的可检测信号，从而检测靶核酸。在一些情况下，单链检测核酸包括荧光发射染料对(例如，荧光发射染料对是荧光共振能量转移(FRET)对、淬灭剂/荧光剂对)。在一些情况下，靶DNA是病毒DNA(例如，乳多空病毒、嗜肝DNA病毒、疱疹病毒、腺病毒、痘病毒、细小病毒等)。在一些实施方案中，单链检测核酸是DNA。在一些实施方案中，单链检测核酸是RNA。在一些实施方案中，工程化Cas12b效应蛋白是工程化Cas12b核酸酶。在一些实施方案中，该方法在体外进行。在一些实施方案中，所述靶核酸存在于细胞中，诸如细菌细胞、酵母细胞、植物细胞或动物细胞。在一些实施方案中，该方法在体外进行。在一些实施方案中，该方法在体内进行。在一些实施方案中，所述靶核酸是基因组DNA。在一些实施方案中，所述靶序列与疾病或病症关联。

本公开的用于检测样品中的靶DNA(单链或双链)的方法可以以高灵敏度检测靶DNA。在一些情况下，本公开的方法可以用于检测存在于包含多个DNA(包括靶DNA和多个非靶DNA)的样品中的靶DNA，其中靶DNA以每10⁷个非靶DNA有一个或多个拷贝的量存在(例如，每10⁶个非靶DNA有一个或多个拷贝、每10⁵个非靶DNA有一个或多个拷贝、每10⁴个非靶DNA有一个或多个拷贝、每10³个非靶DNA有一个或多个拷贝。每10²个非靶DNA有一个或多个拷贝、每50个非靶DNA有一个或多个拷贝、每20个非靶DNA有一个或多个拷贝、每10个非靶DNA有一个或多个拷贝，或每5个非靶DNA有一个或多个拷贝)。

在一些实施方案中，与参考Cas12b核酸酶(例如SEQ ID NO:1)相比，本文所述的工程化Cas12b核酸酶或其效应蛋白(例如包含SEQ ID NO:2至22中的任何)可以以更高的灵敏度检测靶DNA。在一些实施方案中，与参考Cas12b核酸酶相比，工程化Cas12b效应蛋白可以10％、15％、20％、25％、30％、40％、50％、60％、70％、80％、90％，或更高的灵敏度检测靶DNA。

递送方法

在一些实施方案中，本文所述的工程化CRISPR-Cas12b系统，或其组分、其核酸分子，或编码或提供其组分的核酸分子，可以通过各种递送系统诸如质粒或病毒载体(例如，上文“构建体和载体”小节中所述的载体中的任一种)递送至宿主细胞。在一些实施方案或方法中，工程化CRISPR-Cas12b系统可以通过其它方法递送，诸如对由工程化Cas12b核酸酶或其效应蛋白和它们的同源RNA指导物组成的核糖核蛋白复合物进行核转染或电穿孔。

在一些实施方案中，经由纳米颗粒或外来体进行递送。

在一些实施方案中，可以使用纳米颗粒或其它直接蛋白递送方法直接递送成对Cas12b切口酶复合物，使得含有两个成对crRNA元件的复合物被共同递送。此外，可以通过病毒载体或直接将蛋白递送至细胞，随后直接递送CRISPR阵列，该CRISPR阵列含有用于双切口的两个成对间隔区。在一些情况下，对于直接RNA递送，RNA可以与至少一个糖部分缀合，诸如N-乙酰基半乳糖胺(GalNAc)(特别是三触角GalNAc)。在一些实施方案中，CRISPR-Cas12b系统或其组分被包装并经由脂质纳米颗粒递送。在一些实施方案中，脂质纳米颗粒通过静脉注射或输注给药于个体。

IV.试剂盒和制品

还提供了包含本文所述的工程化Cas12b核酸酶或其效应蛋白、包含工程化支架(例如SEQ ID NO:25至53中的任何)的sgRNA或工程化CRISPR-Cas12b系统中的任一种的一种或多种组分的组合物、试剂盒、单位剂量，以及制品。

在一些实施方案中，提供了试剂盒，其包含：一种或多种AAV载体，其编码本文所述的工程化Cas12b核酸酶或其效应蛋白或工程化CRISPR-Cas12b系统中的任一种。在一些实施方案中，试剂盒还包含一种或多种指导RNA，诸如包含工程化支架(例如SEQ ID NO:25至53中的任何)的sgRNA。在一些实施方案中，试剂盒还包含供体DNA。在一些实施方案中，试剂盒还包含细胞，诸如人类细胞。

试剂盒可以含有一种或多种附加组分，诸如容器、试剂、培养基、细胞因子、缓冲液、抗体等，以允许工程化细胞的繁殖。试剂盒还可以包含用于施用组合物的装置。

试剂盒还可以包含用于使用本文所述的工程化CRISPR-Cas12b系统的说明书，诸如检测或修饰靶核酸的方法。在一些实施方案中，试剂盒包含用于治疗或诊断疾病或病症的说明书。与试剂盒组分的使用相关的说明书通常包括关于剂量、给药方案，以及用于预期治疗的施用路径的信息。容器可以是单位剂量、散装包装(例如，多剂量包装)，或亚单位剂量。例如，可以提供含有足够剂量的本文公开的组合物的试剂盒，以长期提供对个体的有效治疗。试剂盒还可以包括多单位剂量的组合物和使用说明书，包装的量足以在药房(例如，医院药房和混合药房)中储存和使用。

本申请的试剂盒处于合适的包装中。合适的包装包括但不限于小瓶、瓶、罐、柔性包装(例如，密封Mylar聚酯薄膜或塑料袋)等。试剂盒可以可选地提供附加组分，诸如缓冲液和解释性信息。本申请因此还提供了制品，其包括小瓶(诸如密封小瓶)、瓶、罐、柔性包装等。

制品可以包含容器以及在容器上或与容器相关联的标记或包装插页。合适的容器包括例如瓶、小瓶、注射器等。容器可以由各种材料(诸如玻璃或塑料)形成。通常，容器容纳有效治疗本文所述的疾病或病状的组合物，并且可以具有无菌入口(例如，容器可以是静脉内溶液袋或者具有可被皮下注射针刺穿的塞子的小瓶)。标记或包装插页指示组合物用于治疗个体的特定病症。标记或包装插页还将包含用于将组合物施用至个体的说明书。

包装插页是指通常包括在治疗产品的商业包装中的说明书，其含有关于适应症、用法、剂量、施用、禁忌症，和/或关于使用这种治疗产品的注意事项的信息。

附加地，制品还可以包含第二容器，其包含药学上可接受的缓冲液，诸如抑菌注射用水(BWFI)、磷酸盐缓冲盐水、林格氏溶液，以及葡萄糖溶液。它还可以包括从商业和用户视角来看理想的其它材料，包括其它缓冲液、稀释剂、过滤器、针，以及注射器。

示例性实施方案

实施方案1.一种工程化Cas12b核酸酶，其包含相对于参考Cas12b核酸酶的一种、两种或三种类型的突变，其中所述突变包含：(1)用带正电荷的氨基酸残基取代参考Cas12b核酸酶中与前间隔序列邻近基序(PAM)相互作用的一种或多种氨基酸残基；和/或(2)用具有芳香环的氨基酸残基取代参比Cas12b核酸酶中涉及打开DNA双链的一个或多个氨基酸残基；和/或(3)用带正电的氨基酸残基或疏水性氨基酸残基取代与单链DNA底物相互作用的参考Cas12b核酸酶的RuvC结构域中的一个或多个氨基酸残基。

实施方案2.实施方案1的工程化Cas12b核酸酶，其中参考Cas12b核酸酶是野生型Cas12b核酸酶。

实施方案3.实施方案1或2的工程化Cas12b核酸酶，其中参考Cas12b核酸酶包含SEQ ID NO:1的氨基酸序列。

实施方案4.实施方案1-3中任一项的工程化Cas12b核酸酶，包括用带正电荷的氨基酸残基取代与PAM相互作用的参考Cas12b核酸酶中的一个或多个氨基酸残基。

实施方案5.实施方案4的工程化Cas12b核酸酶，其中与PAM相互作用的一个或多个氨基酸残基在三维结构中与PAM的距离在9埃内。

实施方案6.实施方案4或5的工程化Cas12b核酸酶，其中与PAM相互作用的一个或多个氨基酸残基位于以下位置中的一个或多个：116、123、130、132、144、145、153、173、222、395、400和/或475；其中所述氨基酸残基根据SEQ ID NO:1编号。

实施方案7.实施方案6的工程化Cas12b核酸酶，其中与PAM相互作用的一个或多个氨基酸残基包含以下氨基酸残基中的一个或多个：D116、K123、D130、D132、N144、K145、E153、D173、Q222、D395、N400和/或E475；其中所述氨基酸残基根据SEQ ID NO:1编号。

实施方案8.实施方案7的工程化Cas12b核酸酶，其中与PAM相互作用的一个或多个氨基酸残基包含以下氨基酸残基中的一个或多个：D116和/或E475；其中所述氨基酸残基根据SEQ ID NO:1编号。

实施方案9.实施方案4-8中任一项的工程化Cas12b核酸酶，其中带正电的氨基酸残基是R或K。

实施方案10.实施方案9的工程化Cas12b核酸酶，其中用带正电荷的氨基酸残基取代参考Cas12b核酸酶中与PAM相互作用的一个或多个氨基酸残基是以下取代中的一种或多种：D116R和/或E475R；其中所述氨基酸残基根据SEQ ID NO:1编号。

实施方案11.根据实施方案1-10中任一项所述的工程化Cas12b核酸酶，包括用具有芳香环的氨基酸残基取代参比Cas12b核酸酶中参与打开DNA双链的一个或多个氨基酸残基。

实施方案12.实施方案11的工程化Cas12b核酸酶，其中参与打开DNA双链的一个或多个氨基酸残基与PAM中相对于靶链3'端的最后碱基对相互作用。

实施方案13.实施方案11或12的工程化Cas12b核酸酶，其中参与打开DN A双链的一个或多个氨基酸残基位于以下的一个或多个位置：118和/或119；其中所述氨基酸残基根据SEQ ID NO:1编号。

实施方案14.实施方案11-13中任一项的工程化Cas12b核酸酶，其中具有芳环的氨基酸残基是Y、F或W。

实施方案15.实施方案14的工程化Cas12b核酸酶，其中用具有芳香环的氨基酸残基取代参比Cas12b核酸酶中涉及打开DNA双链的一个或多个氨基酸残基是Q119Y、Q119F或Q119W；其中所述氨基酸残基根据SEQ ID NO:1编号。

实施方案16.根据实施方案1-16中任一项所述的工程化Cas12b核酸酶，包括用带正电荷的氨基酸残基或疏水性氨基酸残基取代参考Cas12b核酸酶中位于RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基。

实施方案17.实施方案16的工程化Cas12b核酸酶，其中在RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基在三维结构中与单链DNA底物的距离在9埃内。

实施方案18.任何实施方案17所述的工程化Cas12b核酸酶，其中在RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基位于以下位置中的一个或多个：300、301、304、329、636、639、647、682、757、758、761、764、768、852、854、856、857、858、860、862、863、865、866、867、869、938、956、957、958、994、1093和/或1097；其中所述氨基酸残基根据SEQ ID NO:1编号。

实施方案19.实施方案18的工程化Cas12b核酸酶，其中在RuvC结构域中并与单链DNA底物相互作用的一个或多个氨基酸残基包含以下氨基酸残基中的一个或多个：D300、K301、E304、N329、E636、Q639、T647、Q682、I757、E758、E761、E764、K768、E852、Q854、N856、N857、D858、P860、S862、E863、N865、Q866、L867、Q869、，E938、E956、G957、E958、I994、Q1093和/或W1097；其中所述氨基酸残基根据SEQ ID NO:1编号。

实施方案20.实施方案19的工程化Cas12b核酸酶，包括用带正电荷的氨基酸残基取代一个或多个以下氨基酸残基：E636、I757、E758、E761、Q854、N857、N865、Q866、Q869和/或Q1093；其中所述氨基酸残基根据SEQIDNO:1编号。

实施方案21.实施方案20的工程化Cas12b核酸酶，其中带正电荷的氨基酸残基是R或K。

实施方案22.实施方案21的工程化Cas12b核酸酶，其中取代所述参考Cas12b核酸酶中位于所述RuvC结构域中并与所述单链DNA底物相互作用的一个或多个氨基酸残基是以下取代中的一种或多种：E636R、I757R、E758R、E761R、Q854R和/或N857K；其中所述氨基酸残基根据SEQ ID NO:1编号。

实施方案23.实施方案19的工程化Cas12b核酸酶，包括用疏水性氨基酸残基取代一个或多个以下氨基酸残基：E758、E761、E863、N865、Q866、Q869、Q956和/或Q1093；其中所述氨基酸残基根据SEQ ID NO:1编号。

实施方案24.实施方案23的工程化Cas12b核酸酶，其中疏水性氨基酸残基是W、Y、F或M。

实施方案25.实施方案24的工程化Cas12b核酸酶，其中其中取代所述参考Cas12b核酸酶中位于所述RuvC结构域中并与所述单链DNA底物相互作用的一个或多个氨基酸残基是以下取代中的一种或多种：N865W、N865Y、Q866M、Q869M、Q1093W和/或Q1093Y；其中所述氨基酸残基根据SEQ ID N O:1编号。

实施方案26.实施方案1-3中任一项的工程化Cas12b核酸酶，其中所述工程化Cas12b核酸酶包含以下取代中的任一种或其组合：(1)D116R；(2)E475R；(3)Q119F和E475R；(4)Q119F、E475R和E758R；(5)Q119Y；(6)Q119F；(7)Q119W；(8)I757R；(9)E758R；(10)E761R；(11)K768R；(12)I757R和E758R；(13)I757R和E761R；(14)I757R和K768R；(15)E758R和E761R；(16)E758R和K768R；(17)E761R和K768R；(18)I757R、E758R和E761R；(19)I757R、E758R和K768R；(20)I757R、E761R和K768R；(21)E758R、E761R和K768R；(22)I757R、E758R、E761R和K768R；(23)Q866M；(24)Q869M；以及(25)Q866M和Q869M；其中所述氨基酸残基根据SEQ ID N O:1编号。

实施方案27.实施方案1-26中任一项的工程化Cas12b核酸酶，其包含与SEQ IDNO:2至22中任一项具有至少85％序列同一性的氨基酸序列。

实施方案28.实施方案1-27中任一项的工程化Cas12b核酸酶，其进一步包含一个或多个突变，所述突变增加包含氨基酸残基855-859的柔性区域的柔性；其中所述氨基酸残基位置根据SEQ ID NO:1编号。

实施方案29.实施方案28的工程化Cas12b核酸酶，其中增加柔性的一个或多个突变包含N856G。

实施方案30.一种工程化Cas12b核酸酶，其包含以下突变中的任一种或多种：(1)D116R；(2)E475R；(3)Q119F和E475R；(4)Q119F、E475R和E758R；(5)Q119Y；(6)Q119F；(7)Q119W；(8)Q119F和E475R；(9)Q119F、E475R和E758R(10)E636R；(11)I757R；(12)E758R；(13)E761R；(14)Q854R；(15)N857K；(16)Q119F、E475R和E758R；(17)K768R；(18)I757R和E758R；(19)I757R和E761R；(20)I757R和K768R；(21)E758R和E761R；(22)E758R和K768R；(23)E761R和K768R；(24)I757R、E758R和E761R；(25)I757R、E758R和K768R；(26)I757R、E761R和K768R；(27)E758R、E761R和K768R；(28)I757R、E758R、E761R和K768R(29)N865W；(30)N865Y；(31)Q866M；(32)Q869M；(33)Q1093W；(34)Q1093Y；和/或(35)Q866M和Q869M；其中所述氨基酸残基位置根据SEQ ID NO:1编号。

实施方案31.一种工程化Cas12b核酸酶，其包含SEQ ID NO:2至22中任一项的氨基酸序列。

实施方案32.一种工程化的Cas12b效应蛋白，其包含根据实施方案1-31中任一项的工程化Cas12b核酸酶或其功能性衍生物。

实施方案33.实施方案32的工程化Cas12b效应蛋白，其中工程化Cas12b核酸酶或其功能性衍生物具有酶活性。

实施方案34.实施方案32或33的工程化Cas12b效应蛋白，其中工程化Cas12b效应蛋白能够诱导DNA分子中的双链断裂。

实施方案35.实施方案32或33的工程化Cas12b效应蛋白，其中工程化Cas12b效应蛋白能够诱导DNA分子中的单链断裂。

实施方案36.实施方案32的工程化Cas12b效应蛋白，其中所述工程化Cas12b效应蛋白包含工程化Cas12b核酸酶的酶失活突变体。

实施方案37.实施方案36的工程化Cas12b效应蛋白，其中所述酶失活突变体包含D570A、R785A、E848A、R911A和/或D977A。

实施方案38.实施方案32-37中任一项的工程化Cas12b效应蛋白，其进一步包含融合至所述工程化Cas12b核酸酶或其功能性衍生物的功能结构域。

实施方案39.实施方案38的工程化Cas12b效应蛋白，其中所述功能结构域选自翻译起始子结构域、转录阻遏子结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域、逆转录酶结构域、报告子结构域，以及核酸酶结构域。

实施方案40.实施方案32-37中任一项的工程化Cas12b效应蛋白，其包含工程化Cas核酸酶或其功能性衍生物的N端部分的第一多肽和包含工程化Cas核酸酶的C端部分或其功能性衍生物的第二多肽，其中所述第一多肽和所述第二多肽能够在包含指导序列的指导RNA的存在下彼此结合，以形成规律间隔成簇短回文重复(CRISPR)复合物，所述复合物特异性结合包含与指导序列互补的靶序列的靶核酸。

实施方案41.实施方案40的工程化Cas12b效应蛋白，其包含第一多肽和第二多肽，其中所述第一多肽包含工程化Cas12b核酸酶或其功能性衍生物的N末端的1至X个氨基酸残基，其中所述第二多肽包含工程化Cas12b核酸酶或其功能性衍生物的C末端的X+1个残基，其中所述第一多肽和所述第二多肽能够在包含指导序列的指导RNA的存在下彼此结合，以形成规律间隔成簇短回文重复(CRISPR)复合物，所述复合物特异性结合包含与指导序列互补的靶序列的靶核酸。。

实施方案42.实施方案40或41的工程化Cas12b效应蛋白，其中所述第一多肽和所述第二多肽各自包含二聚结构域。

实施方案43.实施方案42的工程化Cas12b效应蛋白，其中第一二聚化结构域和第二二聚化结构域在诱导剂存在下彼此结合。

实施方案44.实施方案40或41的工程化Cas12b效应蛋白，其中第一多肽和第二多肽不包含二聚结构域。

实施方案45.一种工程化CRISPR-Cas12b系统，其包含：(a)实施方案32-44中任一项的工程化Cas12b效应蛋白，或编码工程化Cas12b效应蛋白的核酸；和(b)包含与靶序列互补的指导序列的指导RNA或编码指导RNA的核酸，其中所述工程化的Cas12b效应蛋白和指导RNA能够形成CRISPR复合物，所述CRISPR复合物特异性结合包含靶序列的靶核酸并诱导靶核酸的修饰。

实施方案46.实施方案45的工程化CRISPR-Cas12b系统，其中所述指导RNA包含crRNA和tracrRNA。

实施方案47.实施方案45或46的工程化CRISPR-Cas12b系统，包含编码多种crRNA的前体指导RNA阵列。

实施方案48.根据实施方案45-47中任一项所述的工程化CRISPR-Cas12b系统，其中所述指导RNA是单指导RNA(sgRNA)。

实施方案49.实施方案45-48中任一项的工程化CRISPR-Cas12b系统，其包含编码工程化Cas12b效应蛋白的一个或多个载体。

实施方案50.实施方案49的工程化CRISPR-Cas12b系统，其中所述一项或多项载体是腺相关病毒(AAV)载体。

实施方案51.实施方案50的工程化CRISPR-Cas12b系统，其中所述AAV载体进一步编码所述指导RNA。

实施方案52.一种检测样品中靶核酸的方法，其包括：(A)使样品与实施方案45-51中任一项的工程化CRISPR-Cas12b系统和带标记的检测核酸接触，其中带标记的检测核酸是单链的并且不与指导RNA的指导序列杂交；和(b)测量由所述工程化Cas12b效应蛋白切割所述带标记的检测核酸而产生的可检测信号，从而检测所述靶核酸。

实施方案53.修饰包含靶序列的靶核酸的方法，包括使靶核酸与实施方案45-51中任一项的工程化CRISPR-Cas12b系统接触。

实施方案54.实施方案53的方法，其中所述方法在体外进行。

实施方案55.实施方案53的方法，其中所述靶核酸存在于细胞中。

实施方案56.实施方案55的方法，其中所述细胞是细菌细胞、酵母细胞、哺乳动物细胞、植物细胞或动物细胞。

实施方案57.实施方案53的方法，其中所述方法离体进行。

实施方案58.实施方案53的方法，其中所述方法在体内进行。

实施方案59.实施方案53-58中任一项的方法，其中通过所述工程化CRIS PR-Cas12b系统切割靶核酸或改变靶核酸中的靶序列。

实施方案60.实施方案53-58中任一项的方法，其中通过所述工程化CRIS PR-Cas12b系统改变靶核酸的表达。

实施方案61.实施方案53-60中任一项的方法，其中所述靶核酸是基因组DNA。

实施方案62.实施方案53-61中任一项的方法，其中所述靶序列与疾病或病症相关。

实施方案63.实施方案53-62中任一项的方法，其中所述工程化CRISPR-Cas12b系统包含编码多个crRNA的前体指导RNA阵列，其中每个crRNA包含不同的指导序列。

实施方案64.一种治疗与个体细胞中靶核酸相关的疾病或病症的方法，包括使用实施方案45-51中任一项的工程化CRISPR-Cas12b系统修饰个体细胞中的靶核酸，从而治疗所述疾病或病症。

实施方案65.实施方案64的方法，其中所述疾病或病症选自癌症、心血管疾病、遗传性疾病、自身免疫性疾病、代谢性疾病、神经变性疾病、眼部疾病、细菌感染和病毒感染。

实施方案66.包含修饰的靶核酸的工程化细胞，其中使用实施方案53-63中任一项的方法修饰所述靶核酸。

实施方案67.一种工程化非人动物，其包含一种或多种实施方案66的工程化细胞。

实施例

以下实施例仅为本申请的示例性实施例，并且因此不应当被认为以任何方式限制本申请。通过说明而非限制的方式提供以下实施例和详细描述。

方法

质粒的构建

AaCas12b的编码序列经密码子优化以用于在人类细胞中表达并被合成。通过基于PCR的定向位点诱变产生编码工程化AaCas12b蛋白突变体的核酸序列。具体地，将编码参考AaCas12b蛋白的DNA序列分成以突变位点为中心的两个部分。设计两对引物以扩增DNA序列的两个部分，并通过Gibson克隆组装成单个DNA片段，将该片段整合到pCAG-2A-eGFP载体。通过将编码参考AaCas12b蛋白的DNA分割成多段，并使用PCR和Gibson克隆进行扩增和组装，来构建突变组合。在pCAG-2A-eGFP载体的XmaI与NheI位点之间插入编码工程化AaCas12b蛋白的DNA。使用本领域常用的蛋白结构可视化软件(例如，PyMol或Chimera)，基于对AaCas12b的晶体结构的分析，设计AaC as12b蛋白变体中突变的位置。AaCas12b的晶体结构可以在RCSBPDB数据库获得，存取号为6LTU、6LTR、6LU0，以及6LTP。使用pCAG-2A-eGFP载体在人类293T细胞中表达AaCas12b变体。从头合成编码sgRNA支架的DNA序列，并通过Gibson克隆组装到pUC19-U6框架中。编码间隔序列的核酸也连接到相同的pUC19-U6框架中。

细胞培养、转染，以及荧光活化细胞分选(FACS)

在含有1％青霉素-链霉素(Gibco)和10％胎牛血清(Gibco)的DMEM(Gib co)中培养HEK293T细胞。将细胞接种在24孔培养皿(Corning)中16小时，直到细胞覆盖达到70％。使用Lipofectamine3000(Invitrogen)，在所述24孔培养皿的每个孔中将600ng的编码AaCas12b蛋白的质粒和不同量的编码sgRNA的质粒转染到细胞中。转染68小时之后，用胰蛋白酶-EDTA(0.05％)(Gibco)消化HEK293T细胞，并基于GFP信号(说明成功转染)使用MoFloXDP(Beck manCoulter)进行FACS分选。

用于基因组修饰的靶向深度测序分析

将通过FACS分选的GFP阳性HEK293T细胞用缓冲液L溶解并在55℃下孵育3小时，然后在95℃下孵育10分钟。对应引物用于对在不同基因组基因座处含有靶位点的dsDNA片段进行PCR扩增。对于目标区域深度测序，将细胞溶解产物直接用作模板DNA以通过条形码PCR进行扩增。将PCR产物纯化并汇集到若干文库中以进行高通量测序。通过计算含有插入或缺失的读段的比例，使用CRISPResso2软件分析indel的频率(％)。在本申请中，将indel频率(％)的指数用于比较和分析不同工程化Cas12b蛋白和/或在不同sgRNA支架存在下的基因编辑效率。丢弃少于总读段的0.05％的任何数目的读段。

实施例1：用带正电荷的氨基酸残基取代参考AaCas12b核酸酶中与PA M相互作用的一个或多个氨基酸残基。

根据上述方法设计和表达在与PAM相互作用的氨基酸残基中具有单个突变的工程化AaCas12b酶。简言之，在AaCas12b中距PAM

内选择了10个氨基酸：D116、K123、D130、D132、N144、K145、E153、D173、Q222、D395、N400和E475，并用精氨酸(R)取代每个氨基酸残基。设计了针对靶位点CCR5-11(SEQ ID NO:63)、CD34-7(SEQ ID NO:64)和RNF2-1(SEQ IDN O:65)编码sgRNA的核酸，其从5'至3'包含：编码Aa-sg-sgRNA支架序列(SEQ ID NO:23)的DNA-编码间隔序列的DNA，并克隆到pUC19-U6骨架中。使用Lipofectamine3000(Invitrogen)，如上所述，在24孔培养皿的每个孔中将600ng编码AaCas12b蛋白的质粒和300ng编码sgRNA的质粒转染到HEK293T细胞中。野生型AaCas12b(SEQ ID NO:1)用作对照。在AaCas12b酶中的氨基酸取代和对应基因编辑效率示于图1和表1中。与野生型AaCas12b相比，具有氨基酸取代D116R(SEQ ID NO:2)或E475R(SEQ ID NO:3)的AaCas12b变体显示出提高的基因编辑效率。如图1所示，AaCas12b-D116R(SEQ ID NO:2)和AaCas12b-E475R(SEQ IDNO:3)在三个基因组位点上具有的编辑效率平均值超过约20％，而参考野生型AaCas12b核酸酶的基因编辑效率平均值为约6％。AaCas12b-D116R(SEQ ID NO:2)和AaCas12b-E475R(SEQ ID NO:3)突变体的indel频率显著高于使用其它AaCas12b的突变体在该类别的测试。与野生型AaCas12b相比，AaCas12b-D395R在CD34-7位点获得了高得多的基因编辑效率，但在其他测试位点没有。

表1.不同AaCas12b在不同基因座的基因编辑效率

实施例2：用具有芳环的氨基酸残基取代参考AaCas12b核酸酶中参与打开DNA双链的一个或多个氨基酸残基。

根据上述方法设计和表达在参与打开DNA双链的氨基酸残基中具有单个取代的工程化AaCas12b核酸酶。简言之，氨基酸残基Q118或Q119被芳香族氨基酸残基(例如Y、F或W)取代。这里使用实施例1中相同的sgRNA编码质粒。使用Lipofectamine 3000(Invitrogen)，如上所述，在24孔培养皿的每个孔中将600ng编码AaCas12b蛋白的质粒和300ng编码sgRNA的质粒转染到HE K293T细胞中。野生型AaCas12b(SEQ ID NO:1)用作对照。AaCas12b酶中的氨基酸取代和对应基因编辑效率示于图2和表2中。与野生型AaCas12b相比，具有氨基酸取代Q119Y、Q119F或Q119W的AaCas12b在所有测试位点显示出提高的基因编辑效率。AaCas12b-Q119Y、AaCas12b-Q119F，以及AaCas12b-Q119W突变体的indel频率显著高于其它AaCas12b突变体(Q118Y、Q118F、Q118W)在该类别的测试。

表2.不同AaCas12b在不同基因座的基因编辑效率

实施例3：用带正电荷的氨基酸残基或疏水性氨基酸残基取代参考AaCa s12b核酸酶的RuvC结构域中与单链DNA底物相互作用的一个或多个氨基酸残基。

根据上述方法设计和表达在RuvC结构域中与单链DNA底物相互作用的氨基酸残基中具有单个氨基酸取代的工程化AaCas12b核酸酶。设计了针对靶位点CCR5-3(SEQ ID NO:66)和RNF2-5(SEQ ID NO:67)编码sgRNA的核酸，其从5'至3'包含：编码Aa-sg-sgRNA支架序列(SEQ ID NO:23)的DNA-编码间隔序列的DNA，并克隆到pUC19-U6框架中。使用Lipofectamine 3000(Invitr ogen)，在24孔培养皿的每个孔中将600ng编码AaCas12b蛋白的质粒和300ng编码sgRNA的质粒转染到HEK293T细胞中。野生型AaCas12b(SEQ ID NO:1)用作对照。

在第一组AaCas12b突变体中，用表3中的带正电荷的氨基酸残基精氨酸(R)取代以下氨基酸残基中的每一个：E636、I757、E758、E761、Q854、N857、N865、Q866、Q869，以及Q1093。在AaCas12b酶中的氨基酸取代和对应基因编辑效率示于图3-4B和表3中。

表3.不同AaCas12b在不同基因座的基因编辑效率

在第二组AaCas12b突变体中，用带正电荷的氨基酸残基赖氨酸(K)取代表4中的每一个氨基酸残基。在AaCas12b酶中的氨基酸取代和对应基因编辑效率示于表4和图4A至图4B中。

如表3-4和图3-4B所示，与野生型AaCas12b相比，具有氨基酸取代D300R、K301R、E636R、Q639R、T647R、Q682R、I757R、E758R、E761R、K768R、Q854R、N857R、D858R、N865R、Q866R、I994R、Q1093R、W1097R、E636K、Q639K、T647K、Q682K、I757K、E758K、E761K、Q854K、N857K、D858K、N865K、I994K、Q1093K或W1097K的AaCas12b突变体具有提高的基因编辑效率。AaCas12b的E636R、I757R、E758R、E761R、Q854R、D858R、E758K、N857K、I994R和D858K突变体的indel频率显著高于使用其它AaCas12b突变体在该类别(用带正电的氨基酸取代的)的测试。

表4.不同AaCas12b在不同基因座的基因编辑效率

在第三组AaCas12b突变体中，用疏水性氨基酸残基(例如，Y、F、M，或W)取代以下氨基酸残基中的每一个：E758、E761、E863、N865、Q866、Q869、E956，以及Q1093。在AaCas12b酶中的氨基酸取代和对应基因编辑效率示于图5和表5中。与野生型AaCas12b相比、具有氨基酸取代E758W、E758Y、E758M、E761Y、N865W、N865Y、N865F、Q866M、Q869M、Q1093W、Q1093Y、Q1093F、或Q1093M的AaCas12b突变体显示出提高的基因编辑效率。AaCas12b的N865W、N865Y、Q866M、Q869M、Q1093W，以及Q1093Y突变体的indel频率显著高于其它AaCas12b突变体在该类别(用疏水氨基酸残基取代)的测试。

表5.不同AaCas12b在不同基因座的基因编辑效率

实施例4.实施例1至实施例3的突变组合及其基因编辑效率的表征。

将实施例1、实施例2，以及实施例3中筛选的具有期望的基因编辑效率的氨基酸取代：即Q866M、Q869M、I757R、E758R、E761R、K768R以及I757R，用以制造带有多重突变的AaCas12b蛋白质，即Q866M+Q869M、I757R+E758R、I757R+E761R、I757R+K768R、E758R+E761R、E758R+K768R、E761R+K768R、I757R+E758R+E761R、I757R+E758R+K768R、I757R+E761R+K768R、E758R+E761R+K768R，以及I757R+E758R+E761R+K768R。设计了针对靶位点CCR5-3(SEQ ID NO:66)、CCR5-11(SEQ ID NO:63)、CD34-1(SEQ ID NO:68)和RNF2-5(SEQ ID NO.:67)的sgRNA的编码核酸，其从5'至3'包含：编码Aa-sg-sgRNA支架序列(SEQ ID NO:23)的DNA-编码间隔序列的DNA，并克隆到pUC19-U6框架中。野生型AaCas12b(SEQ ID NO:1)用作对照。使用Lipofectamine 3000(Invitrogen)，在24孔培养皿的每个孔中将600ng编码上述AaCas12b蛋白的质粒和300ng编码sgRNA的质粒转染到HEK293T细胞中。它们的基因编辑效率示于图6和表6中。与野生型AaCas12b相比，具有氨基酸取代组合的AaCas12b突变体在所有测试位点全部显示出显著提高的基因编辑效率。在某些测试位点与对应单突变体相比，某些AaCas12b组合突变体(诸如Q866M+Q869M、E758R+E761R、E758R+E768R、I757R+E758R+K768R，以及E758R+E761R+K768R)具有提高的基因编辑效率。

表6.不同AaCas12b在不同基因座的基因编辑效率

如上所述生成AaCas12b-Q119F+E475R和AaCas12b-Q119F+A475R+E758R。这里使用实施例1中相同的sgRNA编码质粒。野生型AaCas12b(SEQ ID NO:1)用作对照。使用Lipofectamine 3000(Invitrogen)，在24孔培养皿的每个孔中将600ng编码上述AaCas12b蛋白的质粒和300ng编码sgRNA的质粒转染至HEK293T细胞中。它们的基因编辑效率如图7和表7所示。结果显示，与野生型AaCas12b相比，AaCas12b-Q119F+E475R和AaCas12b-Q119F+E475R+E758R在所有测试位点显著提高了基因编辑效率。AaCas12b-Q119F+E475R+E758R在所有测试位点(CCR5-11、CD34-7，以及RNF2-1)处相对于野生型AaCas12b或相应的带有单取代的AaCas12b变体显示出最显著的基因编辑效率的提高。

表7.不同AaCas12b在不同基因座的基因编辑效率

实施例5：使用带有工程化支架的sgRNA增强工程化AaCas12b的基因编辑活性。

在本实施例中，使用来自实施例4的AaCas12b突变体(Q119F+E475R+E758R)测试具有工程化支架的各种sgRNA的基因编辑活性。设计了针对靶位点CCR5-11(SEQ ID NO:63)的sgRNA的编码核酸，其从5'至3'包含：编码sgR NA支架序列的DNA-编码间隔序列的DNA，并克隆到pUC19-U6框架中。在24孔培养皿的每个孔中使用Lipofectamine3000(Invitrogen)将600ng编码AaCa s12b变体蛋白的质粒和300ng编码具有工程化支架的sgRNA的质粒(SEQIDNO:25至53；基于AacCas12b-sgRNA支架V0进行修饰)、AacCas12b-sgRNA支架(SEQ ID NO:24；V0，对照；H.Yang等人，Cell.2016；167(7):1814-1828.e12)，或AaCas12b-Aa-sg支架(SEQ ID NO:23；对照)转染到的HEK293T细胞中。它们的基因编辑效率示于图9。图9中的数据显示，与AacCas12b-sgR NA支架(V0)相比，所有sgRNA工程化支架显著提高了AaCas12b(Q119F+E475R+E758R)变体的基因编辑效率。与Aa-sg支架相比，所有sgRNA工程化支架(V1和V8除外)也显著提高了AaCas12b(Q119F+E475R+E758R)变体的基因编辑效率。

实施例6：具有失活核酸酶活性的工程化AaCas12b。

为了产生失活的AaCas12b蛋白，进一步修饰来自实施例4的AaCas12b(Q119F+E475R+E758R)变体(SEQ ID NO:22)，以在溶核结构域中包含额外的单点突变(D570A)(图10A)。共编码i)在CMV启动子控制下的AaCas12b(Q119F+E475R+E758R)或AaCas12b(Q119F+E475R+E758R+D570A)(SEQ ID N O:79)，和ii)在U6启动子控制之下的对照sgRNA(不靶向血红蛋白亚基γ1/2(HBG1/2)，sgRNA1(靶向HBG1/2的靶序列SEQ ID NO:70)，或sgRNA2(靶向HBG1/2的靶序列SEQ ID NO:71)的质粒，用与上述类似的方法转染至HEK293细胞中(表8；质粒构建见图10A)。使用sgRNA支架(V9)(SEQ ID NO:53)构建这些sgRNA。转染后3天，从转染的细胞中提取基因组DNA。进行T7核酸内切酶I(T7EI)错配检测测定以确定切割效率(M.Crisso等人，PLoSOne.2015；10(8):e013690)。表9列出了T7EI测定中使用的引物序列。

如图10B所示，与AaCas12b(Q119F+E475R+E758R)相比，在由sgRNA1或sgRNA2引导的HBG1/2的两个不同靶位点的切割中，AaCas12b(Q119F+E475R+E758R+D570A)的催化活性显著降低。

表8.靶向HBG1/2的sgRNA的PAM和靶位点

sgRNA	PAM	靶序列
			sgRNA1	TTG	AGATAGTGTGGGGAAGGGGC(SEQ ID NO:70)
sgRNA2	TTT	GCATTGAGATAGTGTGGGGA(SEQ ID NO:71)

表9.T7EI测定中使用的引物序列

SEQIDNO	引物序列
		69	TCCTGCACTGAAACTGTTGC
78	TCCTGAGAAGCGACCTGGA

为了进一步降低工程化的AaCas12b的核酸酶活性，将额外的点突变引入AaCas12a(Q119F+E475R+E758R+D570A)中以产生AaCas12b(Q119F+E475R+E758R+D570A+E848A)(SEQID NO:80)或AaCas12c(Q119F/E475R+E758R+D570A+D977A)(图11A)。质粒共编码i)在CMV启动子控制下的AaCas12b(Q119F+E475R+E758R)、AaCas12b(Q119F+E475R+E758R+D570A+E848A)或AaCas12a(Q119F/E475R+E758R+D570A+D977A)，和ii)在U6启动子控制之下的sgRNA1(针对HBG1/2的靶序列SEQ ID NO:70)或sgRNA2(针对HBG1/2的靶顺序SEQ ID NO:11)，使用与上述类似的方法转染至HEK293细胞中(参见图11A的质粒构建)。作为阴性对照，将编码AaCas12b(Q119F+E475R+E758R)、AaCas12b(Q119F+E475R+E758R+D570A+E848A)或AaCas12b(Q119F+E475R+E758R+D570A+D977A)的质粒和对照sgRNA(不靶向血红蛋白亚单位γ1/2(HBG1/2)内的任何序列)类似地转染到HEK293细胞中，而没有任何编码sgRNA的序列。如图11B所示，AaCas12b(Q119F+E475R+E758R+D570A+E848A)和AaCas12b(Q119F+E475R+E758R+D570A+D977A)完全消除了AaCas12b(Q119F+E475R+E758R)的核酸酶活性。

实施例7：使用工程化AaCas12b融合蛋白的转录抑制。

将实施例6的AaCas12b(Q119F+E475R+E758R+D570A+D977A)(SEQ ID NO:81)进一步工程化以产生融合蛋白以沉默靶基因的转录。将AaCas12b(Q119F+E475R+E758R+D570A+D977A)(两个拷贝的核定位序列NLS位于两侧)与转录抑制模块ZIM3(SEQ ID NO:72)的

相关盒(KRAB)结构域融合，该结构域可以招募抑制性染色质修饰物。KRAB融合于AaCas12b(Q119F+E475R+E758R+D570A+D977A)的C端或N端，融合蛋白分别命名为Cd12bk和Nd12bk。同一质粒还编码特异性识别SCN9A基因(编码电压门控钠通道1.7Na_v1.7)中不同靶位点的sgRNA(图12A；表10)。使用sgRNA支架(V9)(SEQ ID NO:53)构建这些sgRNA。

为了检查Cd12bk和Nd12bk融合蛋白是否能招募染色质修饰复合物来沉默SCN9A的转录，将编码融合蛋白和sgRNA的质粒转染到Neuro2A(N2a；小鼠神经嵴衍生细胞系)细胞中。作为对照，用对照sgRNA(不靶向SCN9A内的任何序列)将编码Cd12bk的质粒类似地转染到N2a细胞中。转染后3天，收集转染的细胞并使用RNA提取试剂盒(Vazyme，目录号RC112-01)提取RNA。通过qPCR测定每个样品中Nav1.7的mRNA水平。使用对照sgRNA和Cd12bk(“Cd12bk非靶标”)将数据归一化。如图12B所示，Cd12bk或Nd12bk与sgR NA-msg6、sgRNA-msg8、sgRNA-msg13或sgRNA-mSG 18一起可以极大地抑制SCN9A的转录，其中sgRNA-mmsg8和sgRNA-mssg13表现出最强的抑制。Nd12bk与sgRNA-msg11一起也能显著抑制SCN9A的转录。这些结果显示，与KRAB融合的dAaCas12b，例如AaCas12b(Q119F+E475R+E758R+D570A+D977A)，可以用作真核细胞中的靶向转录调控工具。

表10.靶向SCN9A的sgRNA的PAM和靶位点

sgRNA	PAM	靶位点
			msg6	TTA	GCTGCCCGCCACACTGGCGC(SEQ ID NO:73)
msg8	TTG	GGCGTGGTGATGCTAGGGAT(SEQ ID NO:74)
			msg11	TTC	TAGTCTGCTCAGGATGAAGC(SEQ ID NO:75)
msg13	TTC	AATCCTGCCCACTGTGCAGG(SEQ ID NO:76)
			msg18	TTC	CCTTGGATCAGAATCCGCAG(SEQ ID NO:77)

尽管上文已经参考附图描述了本申请的实施例，但是本申请不限于上述具体实施例和应用领域。上述具体实施例仅是说明性、启发性，而非限制性的。在本说明书的启示下并且在不脱离本申请的权利要求的保护范围的情况下，本领域普通技术人员还可以做出许多形式，这些形式均属于本申请的保护范围。

示例性序列

Claims

1.一种工程化Cas12b核酸酶，其包含相对于参考Cas12b核酸酶的一种、两种或三种类型的突变，其中所述突变包含：

(1)用带正电荷的氨基酸残基取代所述参考Cas12b核酸酶中与前间隔序列邻近基序(PAM)相互作用的一个或多个氨基酸残基；和/或

(2)用具有芳环的氨基酸残基取代所述参考Cas12b核酸酶中参与打开DN A双链的一个或多个氨基酸残基；和/或

(3)用带正电荷的氨基酸残基或疏水性氨基酸残基取代所述参考Cas12b核酸酶的RuvC结构域中与单链DNA底物相互作用的一个或多个氨基酸残基。

2.根据权利要求1所述的工程化Cas12b核酸酶，其中所述参考Cas12b核酸酶是野生型Cas12b核酸酶。

3.根据权利要求1或2所述的工程化Cas12b核酸酶，其中所述参考Cas12b核酸酶包含SEQ ID NO:1的氨基酸序列。

4.根据权利要求1至3中任一项所述的工程化Cas12b核酸酶，其中所述工程化Cas12b核酸酶包含用带正电荷的氨基酸残基取代所述参考Cas12b核酸酶中与PAM相互作用的一个或多个氨基酸残基。

5.根据权利要求4所述的工程化Cas12b核酸酶，其中与PAM相互作用的所述一个或多个氨基酸残基在三维结构中与PAM的距离在10埃内。

6.根据权利要求4或5所述的工程化Cas12b核酸酶，其中与PAM相互作用的所述一个或多个氨基酸残基位于以下的一个或多个位置：116、123、130、132、144、145、153、173、222、395、400和475；且其中氨基酸残基根据SEQ ID NO:1编号。

7.根据权利要求4至6中任一项所述的工程化Cas12b核酸酶，其中与PA M相互作用的所述一个或多个氨基酸残基包含以下氨基酸残基中的一个或多个：D116和E475；且其中所述氨基酸残基根据SEQ ID NO:1编号。

8.根据权利要求4至7中任一项所述的工程化Cas12b核酸酶，其中所述带正电荷的氨基酸残基是R或K。

9.根据权利要求4至8中任一项所述的工程化Cas12b核酸酶，其中用所述带正电荷的氨基酸残基取代所述参考Cas12b核酸酶中与PAM相互作用的一个或多个氨基酸残基是以下取代中的一种或多种：D116R和E475R；且其中所述氨基酸残基根据SEQ ID NO:1编号。

10.根据权利要求1至9中任一项所述的工程化Cas12b核酸酶，其中所述工程化Cas12b核酸酶包含SEQ ID NO:2或3的氨基酸序列。

11.根据权利要求1至10中任一项所述的工程化Cas12b核酸酶，其中所述工程化Cas12b核酸酶包含用具有芳环的氨基酸残基取代所述参考Cas12b核酸酶中参与打开所述DNA双链的一个或多个氨基酸残基。

12.根据权利要求11所述的工程化Cas12b核酸酶，其中参与打开所述DN A双链的所述一个或多个氨基酸残基与PAM中相对于靶链3'端的最后碱基对相互作用。

13.根据权利要求11或12所述的工程化Cas12b核酸酶，其中参与打开所述DNA双链的所述一个或多个氨基酸残基位于以下的一个或多个位置：118，和119；且其中所述氨基酸残基根据SEQ ID NO:1编号。

14.根据权利要求11至13中任一项所述的工程化Cas12b核酸酶，其中所述具有芳环的氨基酸残基是Y、F或W。

15.根据权利要求11至14中任一项所述的工程化Cas12b核酸酶，其中用所述具有芳环的氨基酸残基取代所述参考Cas12b核酸酶中参与打开所述DN A双链的一个或多个氨基酸残基是Q119Y、Q119F或Q119W取代；且其中所述氨基酸残基根据SEQ ID NO:1编号。

16.根据权利要求1至3和11至15中任一项所述的工程化Cas12b核酸酶，其中所述工程化Cas12b核酸酶包含SEQ ID NO:4至6中任一项的氨基酸序列。

17.根据权利要求1至16中任一项所述的工程化Cas12b核酸酶，其中所述工程化Cas12b核酸酶包含用带正电荷的氨基酸残基或疏水性氨基酸残基取代所述参考Cas12b核酸酶中位于所述RuvC结构域中并与所述单链DNA底物相互作用的一个或多个氨基酸残基。

18.根据权利要求17所述的工程化Cas12b核酸酶，其中位于所述RuvC结构域中并与所述单链DNA底物相互作用的所述一个或多个氨基酸残基在三维结构中与所述单链DNA底物的距离在10埃内。

19.根据权利要求17或18所述的工程化Cas12b核酸酶，其中位于所述Ru vC结构域中并与所述单链DNA底物相互作用的所述一个或多个氨基酸残基位于以下的一个或多个位置：300、301、304、329、636、639、647、682、757、758、761、764、768、852、854、856、857、858、860、862、863、865、866、867、869、938、956、957、958、994、1093和1097；且其中所述氨基酸残基根据SEQ ID NO:1编号。

20.根据权利要求17至19中任一项所述的工程化Cas12b核酸酶，其中所述工程化Cas12b核酸酶包含用带正电荷的氨基酸残基取代以下氨基酸残基中的一个或多个：E636、Q639、T647、Q682、I757、E758、E761、K768、Q854、N857、D858、N865、Q866、I994、Q869、Q1093和W1097；其中所述氨基酸残基根据SEQ ID NO:1编号。

21.根据权利要求17至20中任一项所述的工程化Cas12b核酸酶，其中所述带正电荷的氨基酸残基是R或K。

22.根据权利要求17至21中任一项所述的工程化Cas12b核酸酶，其中取代所述参考Cas12b核酸酶中位于所述RuvC结构域中并与所述单链DNA底物相互作用的一个或多个氨基酸残基是以下取代中的一种或多种：E636R、Q639R、T647R、Q682R、I757R、E758R、E761R、Q854R、N857K、D858R、I994R、Q1093R和W1097R；且其中所述氨基酸残基根据SEQ ID NO:1编号。

23.根据权利要求1至3和17至22中任一项所述的工程化Cas12b核酸酶，其中所述工程化Cas12b核酸酶包含SEQ ID NO:7至13中任一项的氨基酸序列。

24.根据权利要求17至19中任一项所述的工程化Cas12b核酸酶，其中所述工程化Cas12b核酸酶包含用疏水性氨基酸残基取代以下氨基酸残基中的一个或多个：E758、E761、E863、N865、Q866、Q869、Q956和Q1093；且其中所述氨基酸残基根据SEQ ID NO:1编号。

25.根据权利要求17至19和24中任一项所述的工程化Cas12b核酸酶，其中所述疏水性氨基酸残基是W、Y、F或M。

26.根据权利要求17至19、24和25中任一项所述的工程化Cas12b核酸酶，其中取代所述参考Cas12b核酸酶中位于所述RuvC结构域中并与所述单链DN A底物相互作用的一个或多个氨基酸残基是以下取代中的一种或多种：N865W、N865Y、Q866M、Q869M、Q1093W和Q1093Y；且其中所述氨基酸残基根据SEQ ID NO:1编号。

27.根据权利要求1至3、17至19和24至26中任一项所述的工程化Cas12b核酸酶，其中所述工程化Cas12b核酸酶包含SEQ ID NO:14至19中任一项的氨基酸序列。

28.根据权利要求1至3中任一项所述的工程化Cas12b核酸酶，其中所述工程化Cas12b核酸酶包含以下取代中的任一种或其组合：(1)D116R；(2)E475R；(3)Q119F+E475R；(4)Q119F+E475R+E758R；(5)Q119Y；(6)Q119F；(7)Q119W；(8)I757R；(9)E758R；(10)E761R；(11)K768R；(12)I757R+E758R；(13)I757R+E761R；(14)I757R+K768R；(15)E758R+E761R；(16)E758R+K768R；(17)E761R+K768R；(18)I757R+E758R+E761R；(19)I757R+E758R+K768R；(20)I757R+E761R+K768R；(21)E758R+E761R+K768R；(22)I757R+E758R+E761R+K768R；(23)Q866M；(24)Q869M；(25)Q866M+Q869M；(26)E636R；(27)Q854R；(28)N857K；(29)N865W；(30)N865Y；(31)Q1093W；(32)Q1093Y；和(33)D858R；且其中所述氨基酸残基根据SEQ ID NO:1编号。

29.根据权利要求1至3和28中任一项所述的工程化Cas12b核酸酶，其中所述工程化Cas12b核酸酶包含以下取代中的任一种或其组合：(1)Q866M+Q869M；(2)Q119F+E475R；(3)Q119F+E475R+E758R；且其中所述氨基酸残基根据SEQ ID NO:1编号。

30.根据权利要求1至3、28和29中任一项所述的工程化Cas12b核酸酶，其中所述工程化Cas12b核酸酶包含如SEQ ID NO:20至22中的任一项的氨基酸序列。

31.根据权利要求1至30中任一项所述的工程化Cas12b核酸酶，其还在所述参考Cas12b核酸酶中包含一种或多种突变，所述一种或多种突变增加包含氨基酸残基855至859的柔性区域的柔性；且其中氨基酸残基根据SEQ ID N O:1编号。

32.根据权利要求31所述的工程化Cas12b核酸酶，其中增加柔性的所述一种或多种突变包含N856G。

33.一种工程化Cas12b效应蛋白，其包含根据权利要求1至32中任一项所述的工程化Cas12b核酸酶或其功能性衍生物。

34.根据权利要求33所述的工程化Cas12b效应蛋白，其中所述工程化Ca s12b核酸酶或其功能性衍生物具有酶活性。

35.根据权利要求33或34所述的工程化Cas12b效应蛋白，其中所述工程化Cas12b效应蛋白能够：i)诱导DNA分子中的双链断裂，和/或ii)诱导DNA分子中的单链断裂。

36.根据权利要求33所述的工程化Cas12b效应蛋白，其中所述工程化Ca s12b效应蛋白包含所述工程化Cas12b核酸酶的酶失活突变体。

37.根据权利要求36所述的工程化Cas12b效应蛋白，其中所述工程化Ca s12b核酸酶的酶失活突变体包含选自下组的一个或多个氨基酸残基取代：D570A、E848A、R785A、E848A、R911A和D977A；且其中所述氨基酸残基根据SEQ ID NO:1编号。

38.根据权利要求36或37所述的工程化Cas12b效应蛋白，其中所述工程化的Cas12b核酸酶的酶失活突变体包含SEQ ID NO:79至81中任一项的氨基酸序列。

39.根据权利要求33至38中任一项所述的工程化Cas12b效应蛋白，其中所述工程化Cas12b效应蛋白还包含融合至所述工程化Cas12b核酸酶或其功能性衍生物的功能结构域。

40.根据权利要求39所述的工程化Cas12b效应蛋白，其中所述功能结构域选自：翻译起始子结构域、转录阻遏子结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域、逆转录酶结构域、报告子结构域，以及核酸酶结构域。

41.根据权利要求40所述的工程化Cas12b效应蛋白，其中所述转录抑制结构域是Krüppel相关盒(KRAB)结构域。

42.根据权利要求41所述的工程化Cas12b效应蛋白，其中所述KRAB结构域包含SEQ IDNO:72的氨基酸序列。

43.一种单链指导RNA(sgRNA)，其包含SEQ ID NO:25至53中任一项所述的序列。

44.一种工程化CRISPR-Cas12b系统，其包含：

(a)根据权利要求1至32中任一项所述的工程化Cas12b核酸酶，或根据权利要求33至42中任一项所述的工程化Cas12b效应蛋白，或它们的编码核酸；以及

(b)包含与靶核酸的靶序列互补的指导序列的指导RNA(gRNA)，或编码所述gRNA的核酸，

其中所述工程化Cas12b核酸酶或所述工程化Cas12b效应蛋白和所述gR NA能够形成特异性结合至所述靶核酸的CRISPR复合物并诱导所述靶核酸的修饰。

45.根据权利要求44所述的工程化CRISPR-Cas12b系统，其中所述gRNA包含crRNA和tracrRNA。

46.根据权利要求44或45所述的工程化CRISPR-Cas12b系统，其中所述工程化CRISPR-Cas12b系统包含编码多个crRNA的前体gRNA阵列。

47.根据权利要求44所述的工程化CRISPR-Cas12b系统，其中所述gRNA是sgRNA。

48.根据权利要求47所述的工程化CRISPR-Cas12b系统，其中所述sgRN A包含SEQ IDNO:23至53中任一项的序列。

49.一种工程化的CRISPR-Cas12b系统，包含：

(a)Cas12b核酸酶或Cas12b效应蛋白，其包含SEQ ID NO:1至22和79至81中任一项的氨基酸序列或其编码核酸；以及

(b)包含与靶核酸的靶序列互补的指导序列的gRNA，或编码所述gRNA的核酸，其中所述gRNA包含工程化支架，所述工程化支架包含SEQ ID NO:25至53中任一项的序列；

其中Cas12b核酸酶或Cas12b效应蛋白和gRNA能够形成特异性结合靶核酸的CRISPR复合物并诱导靶核酸的修饰。

50.根据权利要求49所述的工程化CRISPR-Cas12b系统，其中所述gRNA包含crRNA和tracrRNA，并且其中所述tracrRNA包含工程化支架或其部分。

51.根据权利要求49或50所述的工程化CRISPR-Cas12b系统，其中所述工程化CRISPR-Cas12b系统包含编码多种crRNA的前体gRNA阵列。

52.根据权利要求49所述的工程化CRISPR-Cas12b系统，其中所述gRNA是sgRNA。

53.根据权利要求44至52中任一项所述的工程化CRISPR-Cas12b系统，其中所述工程化CRISPR-Cas12b系统包含一种或多种载体，所述一种或多种载体编码所述工程化Cas12b核酸酶、所述工程化Cas12b效应蛋白、所述Cas12b核酸酶或所述Cas12b效应蛋白。

54.根据权利要求53所述的工程化CRISPR-Cas12b系统，其中所述一种或多种载体是腺相关病毒(AAV)载体。

55.根据权利要求53或54所述的工程化CRISPR-Cas12b系统，其中所述一种或多种载体还编码所述gRNA。

56.一种检测样品中的靶核酸的方法，其包括：(a)将所述样品与根据权利要求44至55中任一项所述的工程化CRISPR-Cas12b系统和带标记的检测核酸接触，其中所述gRNA包含与所述靶核酸的靶序列互补的指导序列，且其中所述带标记的检测核酸是单链的并且不与所述gRNA的所述指导序列杂交；以及(b)测量由所述工程化Cas12b核酸酶或其效应蛋白切割所述带标记的检测核酸而产生的可检测信号，从而检测所述靶核酸。

57.一种修饰包含靶序列的靶核酸的方法，其包括将所述靶核酸与根据权利要求44至55中任一项所述的工程化CRISPR-Cas12b系统接触。

58.根据权利要求56或57所述的方法，其中所述方法在体外进行。

59.根据权利要求56或57所述的方法，其中所述靶核酸存在于细胞中。

60.根据权利要求59所述的方法，其中所述细胞是细菌细胞、酵母细胞、哺乳动物细胞、植物细胞或动物细胞。

61.根据权利要求56或57所述的方法，其中所述方法离体进行。

62.根据权利要求56或57所述的方法，其中所述方法在体内进行。

63.根据权利要求57至62中任一项所述的方法，其中通过所述工程化CR ISPR-Cas12b系统切割所述靶核酸或改变所述靶核酸中的所述靶序列。

64.根据权利要求57至62中任一项所述的方法，其中通过所述工程化CR ISPR-Cas12b系统改变所述靶核酸的表达。

65.根据权利要求56至64中任一项所述的方法，其中所述靶核酸是基因组DNA。

66.根据权利要求56至65中任一项所述的方法，其中所述靶序列与疾病或病症相关。

67.根据权利要求56至66中任一项所述的方法，其中所述工程化CRISP R-Cas12b系统包含编码多个crRNA的前体gRNA阵列，且其中每个crRNA包含不同的指导序列。

68.一种治疗与个体的细胞中的靶核酸相关联的疾病或病症的方法，其包括使用根据权利要求44至55中任一项所述的工程化CRISPR-Cas12b系统修饰所述个体的细胞中的靶核酸，从而治疗所述疾病或病症。

69.根据权利要求68所述的方法，其中所述疾病或病症选自：癌症、心血管疾病、遗传疾病、自身免疫疾病、代谢疾病、神经变性疾病、眼病、细菌感染，以及病毒感染。

70.一种包含经修饰的靶核酸的工程化细胞，其中使用根据权利要求57至67中任一项所述的方法修饰所述靶核酸。

71.一种工程化非人动物，其包含根据权利要求70所述的一种或多种工程化细胞。