WO2021175289A1

WO2021175289A1 - 多重基因组编辑方法和系统

Info

Publication number: WO2021175289A1
Application number: PCT/CN2021/079087
Authority: WO
Inventors: 高彩霞; 李超; 陈坤玲
Original assignee: 中国科学院遗传与发育生物学研究所
Priority date: 2020-03-04
Filing date: 2021-03-04
Publication date: 2021-09-10
Also published as: CN115667528B; EP4116426A1; US20240117368A1; EP4116426A4; CN115667528A; BR112022017704A2

Abstract

提供了一种适用于植物特别是作物的多重基因组编辑方法和系统，其是基于nCas9核酸酶、且能够同时实现不同类型基因组编辑的系统和方法。

Description

多重基因组编辑方法和系统

技术领域

本发明涉及植物基因工程领域。具体而言，本发明涉及一种适用于植物特别是作物的多重基因组编辑方法和系统。更具体而言，本发明涉及基于CRISPR切口酶的能够同时实现不同类型基因组编辑的系统和方法。

发明背景

作为一种可编程的分子生物学技术，成簇的规律间隔的短回文重复序列及其相关系统(Clustered Regularly Interspaced Short Palindromic Repeats/CRISPR-associated,CRISPR/Cas)极大的促进了分子生物学的发展。在Class 2系统中，越来越多的Cas蛋白被发现并工程化改造，其中包括Cas9靶向DNA，Cas12靶向单链DNA(Single Strand DNA,ssDNA)和RNA，Cas13靶向RNA，以及CAST系统用来插入DNA。CRISPR/Cas系统的多样性和简便性使其成为一个超级的分子工具箱。此外，Cas蛋白还可以被改造为核酸酶活性缺失的变体。来自酿脓链球菌的Cas9(Streptococcus pyogenes Cas9,SpCas9)蛋白由RuvC和HNH两个核酸酶结构域组成，分别切割非靶向链和靶向链。因此，通过替换第10位的天冬氨酸(Asp10)或第840位的组氨酸(His840)为丙氨酸(Ala)，SpCas9可以被工程化改造为一个切口酶nCas9(Nickase Cas9)；又或者将Asp10和His840同时替换为丙氨酸，使SpCas9失去核酸酶活性，成为dCas9(Deactive Cas9)。这些变体的开发，促进了CRISPR/Cas9系统成为基因组编辑系统的工具箱(图1a)。Cas9用来在基因组上产生双链断裂(Double Strand Break,DSB)；成对的nCas9也可以用于在基因组上产生高特异性的DSB，nCas9(D10A)还被用于单碱基编辑系统CBE(Cytosine Base Editor)和ABE(Adenine Base Editor)的开发；dCas9常被用于融合各种效应蛋白进而实现CRISPR干扰(CRISPR Interference,CRISPRi)、CRISPR激活(CRISPR Activation,CRISPRa)、基因组成像以及表观遗传修饰等。但是，大部分情况下，这些系统经过一次转化只执行一种类型的基因组编辑。

为了实施多重综合可编程的基因组编辑应用，目前已经开发了几种策略。一种策略利用截短的sgRNA或crRNA控制Cas9或Cas12a的核酸酶活性来调控基因的表达，同时利用全长的sgRNA或crRNA在另一位点产生DSB。另外一种策略将RNA适配体的发夹结构整合到sgRNA骨架上，形成支架RNA(Scaffold RNA,scRNA)，dCas9/scRNA复合体通过发夹结构招募基因激活或抑制因子，可以在不同的位点同时实现基因转录激活和抑制的双重功能。还有一种策略使用多个同源的CRISPR系统在不同的靶位点同时实现基因激活、抑制和删除三重功能。但是，这些基因组工程的多重策略多是在细菌、酵母和人类细胞中开发的。由于受到递送方法和PAM的限制，使用不同的同源CRISPR 系统在植物中开发一个多重基因组编辑系统依然具有挑战性。此外，植物中同源重组(Homologous Recombination,HR)的效率依然比较低，在遗传水平上将多个重要的农艺性状进行叠加或改变基因的调控网络对育种家具有重要意义。因此，本领域迫切需要能够在植物例如作物中实现多重基因组编辑的方法和系统。

发明简述

与Cas9和dCas9相比，nCas9在多重基因组编辑上的潜力并没有完全开发出来。本发明提供了一种基于nCas9核酸酶的多重基因组编辑系统，并命名为单系统产生的同时多重编辑(Simultaneous and Wide-editing Induced by Single System,SWISS)(图1a)。SWISS利用两种含有不同RNA适配体(aptamer)的scRNA分别招募相应RNA适配体结合蛋白融合的胞嘧啶脱氨酶或腺嘌呤脱氨酶，经一次转化即可在不同的靶位点分别实现CBE和ABE两种编辑类型。再将成对的sgRNA引入到该SWISS系统中，可以在第三个靶位点处产生DSB，使得SWISS成为具有三重编辑功能的CRISPR系统(图1a)。

附图简述

图1、RNA适配体募集的植物胞嘧啶碱基编辑器构建的优化。(a)基于nCas9核酸酶的CRISPR支架RNA编程的多重基因组编辑系统。(b)pOsU3-esgRNA-2×MS2构建体的结构，在esgRNA的3'末端带有两个MS2发夹结构。(c)PBEc1至PBEc5的体系结构。缩写：XTEN，16-aa的接头；NLS，核定位信号；CaMV，花椰菜花叶病毒；Term，终止子。(d)比较水稻原生质体中由PBE和五种PBEc诱导的BFP变GFP报告系统的C>T转换(n＝3)。值和误差棒表示三个独立实验的平均值±标准误差。(e)比较由PBE和五种PBEc诱导的水稻内源基因的C>T编辑频率(n＝3)。未经处理的原生质体样品用作对照。值和误差棒表示三个独立实验的平均值±标准误差。

图2、多种支架RNA和结合蛋白直系同源物可以有效介导C到T的转换。(a)PBEc6至PBEc8的结构。(b)在sgRNA和esgRNA的四环(tetraloop)和茎环2或在3'末端带有MS2、PP7、boxB或com RNA发夹结构的scRNA示意图。(c)比较水稻原生质体中由各种scRNA及其同源PBEc诱导的BFP变GFP报告系统的C>T转换(n＝3)。值和误差棒表示三个独立实验的平均值±标准误差。(d)比较由四种scRNA及其同源PBEc诱导的水稻内源基因的C>T编辑频率(n＝3)。未经处理的原生质体样品用作对照。值和误差棒表示三个独立实验的平均值±标准误差。(e)通过使用scRNA招募策略(n＝3)，可以增强APOBEC1窄窗口变体的C>T编辑频率。未经处理的原生质体样品用作对照。值和误差棒表示三个独立实验的平均值±标准误差。

图3、使用多种支架RNA和结合蛋白同源物优化植物腺嘌呤碱基编辑器构建体。(a)PABEc1到PABEc4的结构。缩写：ecTadA7.10，进化后的大肠杆菌TadA；aa，氨基酸；XTEN，16aa的链接器；NLS，核定位信号；CaMV，花椰菜花叶病毒；Term，终止子。(b)比较水稻原生质体中由PABE和四个PABEc诱导的mGFP-GFP报告系统的A>G 转换(n＝3)。值和误差棒表示三个独立实验的平均值±标准误差。(c)PABEc5至PABEc7的结构。(d)在水稻原生质体中，使用由多种scRNA及其同源PABEc诱导的mGFP变GFP报告系统的A>G转换比较(n＝3)。值和误差棒表示三个独立实验的平均值±标准误差。(e)比较由五种scRNA及其同源PABEc诱导的水稻内源基因的A>G编辑频率(n＝3)。未经处理的原生质体样品用作对照。值和误差棒表示三个独立实验的平均值±标准误差。

图4、在水稻原生质体中基于nCas9(D10A)平台的CRISPR支架RNA编程的同时多重基因组编辑。(a)由PBEc4用esgRNA-2×MS2和配对的sgRNA同时诱导的CBE和DSB。左图为SWISSv1.1策略示意图。右图，测试了两组sgRNA(n＝3)。将带有esgRNA-2×MS2的CBE靶标和用于DSB的成对sgRNA组装在同一载体中。未经处理的原生质体样品用作对照。值和误差棒表示三个独立实验的平均值±标准误差。(b)PABEc6用esgRNA-2×boxB和成对的sgRNA同时诱导ABE和DSB。左图是SWISSv1.2策略的示意图。右图，测试了两组sgRNA(n＝3)。将带有esgRNA-2xboxB的ABE靶标和用于DSB的成对sgRNA组装在同一载体中。未经处理的原生质体样品用作对照。值和误差棒表示三个独立实验的平均值±标准误差。(c)由esgRNA-2×MS2和esgRNA-2×boxB的MGE诱导的同时CBE和ABE。左图是SWISSv2策略的示意图。右图，测试了两组sgRNA(n＝3)。在同一载体中组装了一个带有esgRNA-2×MS2的CBE靶标和一个带有esgRNA-2×boxB的ABE靶标。未经处理的原生质体样品用作对照。值和误差棒表示三个独立实验的平均值±标准误差。(d)由MGE用esgRNA-2×MS2、esgRNA-2×boxB和成对的sgRNA诱导的同时CBE、ABE和DSB。上，SWISSv3策略示意图。下，测试了两组sgRNA(n＝3)。在同一载体中组装了一个带有esgRNA-2×MS2的CBE靶标，一个带有esgRNA-2×boxB的ABE靶标和用于DSB的成对sgRNA。未经处理的原生质体样品用作对照。值和误差棒表示三个独立实验的平均值±标准误差。(e)nCas9-NG PAM变体可以扩大SWISSv2和SWISSv3多重基因组编辑策略的范围。测试了两组用于SWISSv2的sgRNA和一组用于SWISSv3的sgRNA(n＝3)。将多个sgRNA组装在同一载体中。未经处理的原生质体样品用作对照。值和误差棒表示三个独立实验的平均值±标准误差。

图5、PBEc和Cas9在水稻原生质体中的插入缺失效率。PBE+sgRNA、PBEc1+esgRNA-2×MS2、PBEc2+esgRNA-2×MS2、PBEc3+esgRNA-2×MS2、PBEc4+esgRNA-2×MS2、PBEc5+esgRNA-2×MS2和Cas9+sgRNA在水稻原生质体中的插入缺失效率比较。值和误差棒表示三个独立生物学重复的平均值±标准误差。

图6、水稻原生质体中不同scRNA和同源PBEc对内源基因的碱基编辑效率。数据以箱线图的形式显示(中心线，中位数，框线限制，数据的第25和75个百分位数；上下须线分别延伸到最小值或最大值)。每个箱线图中的数据包括三个独立的实验(n＝39)。

图7、esgRNA-2×MS2、esgRNA-3×MS2、sgRNA4.0和esgRNA-2×com与相关PBEc在水稻原生质体中的产物纯度和插入缺失频率。(a)显示了水稻原生质体中带有同源PBEc的esgRNA-2×MS2、esgRNA-3×MS2，sgRNA4.0和esgRNA-2×com的编辑的DNA测序读数之间的产物分布。值和误差棒表示三个独立实验的平均值±标准误差。(b)esgRNA-2×MS2、esgRNA-3×MS2、sgRNA4.0和esgRNA-2×com与同源PBEc在水稻原生质体中的插入缺失效率。值和误差棒表示三个独立生物学重复的平均值±标准误差。

图8、水稻原生质体中支架RNA招募的APOBEC1窄窗口变体的C至T编辑频率。(a)YE1-PBE、YE2-PBE、EE-PBE和YEE-PBE的结构。缩写：XTEN，16-aa的接头；NLS，核定位信号；CaMV，花椰菜花叶病毒；Term，终止子。(b)YE1-PBEc4、YE2-PBEc4、EE-PBEc4和YEE-PBEc4的结构。缩写：XTEN，16-aa的接头；NLS，核定位信号；CaMV，花椰菜花叶病毒；Term，终止子。(c)APOBEC1窄窗口变体在nCas9融合结构与APOBEC1窄窗口变体在scRNA招募架构中的活性。测试了OsEV和OsOD。显示了三个独立的生物学重复之一。

图9、具有腺苷脱氨酶N末端结合蛋白的PABEc8至PABEc10的活性。(a)PABEc8到PABEc10的结构。缩写：ecTadA7.10，进化后的大肠杆菌TadA；aa，氨基酸；XTEN，16aa的接头；NLS，核定位信号；CaMV，花椰菜花叶病毒；Term，终止子。(b)比较由水稻原生质体中各种scRNA及其同源PABEc诱导的mGFP变GFP报告系统的A>G转换(n＝3)。值和误差棒表示三个独立实验的平均值±标准误差。

图10、水稻原生质体中所选支架RNA与同源PABEc的活性、产物纯度和插入缺失频率。(a)水稻原生质体中esgRNA-2×MS2、esgRNA-MS2+f6、esgRNA-1×PP7-1、esgRNA-2×boxB和esgRNA-2×com与同源PABEc的活性。测试了OsALS-T1、OsCDC48、OsDEP1-T1、OsNRT1.1B、OsEV和OsOD靶。显示了三个独立的生物学重复之一。(b)显示了在水稻原生质体中esgRNA-2×MS2、esgRNA-MS2+f6、esgRNA-1×PP7-1、esgRNA-2×boxB和esgRNA-2×com和关联PABEc编辑的DNA测序读段的产物分布。值和误差棒表示三个独立实验的平均值±标准误差。(c)水稻原生质体中esgRNA-2×MS2、esgRNA-MS2+f6、esgRNA-1×PP7-1、esgRNA-2×boxB和esgRNA-2×com与同源PABEc的插入缺失效率。值和误差棒表示三个独立生物学重复的平均值±标准误差。

图11、SWISSv1.1和SWISSv1.2的多种sgRNA组装示意图。(a)配对的sgRNA组装示意图。成对的sgRNA(成对的sgL和sgR)以PAM向外方向设计，切口位点之间的距离为40-68bp。从esgRNA-pTaU6模板扩增PCR产物，然后通过Golden Gate Assembly将其插入pOsU3-esgRNA的BsaI位点。(b)CBE靶标和成对sgRNA组装的示意图。将CBE靶插入pOsU3-esgRNA-2×MS2的BsaI位点，然后扩增pOsU3-CBE靶标-esgRNA-2×MS2的部分。从成对的sgRNAs质粒中扩增出具有成对的sgRNA的PCR产物。通过多步克隆将上述两种PCR产物组装到pOsU3-esgRNA的EcoRI和HindIII消化的骨架中。(c)ABE靶标和配对sgRNA装配的示意图。将ABE靶插入pOsU3-esgRNA-2×boxB的BsaI位点，然后扩增pOsU3-ABE靶标-esgRNA-2×boxB部分。从成对的sgRNAs质粒中扩增出具有成对的sgRNA的PCR产物。通过多重一步克隆将上述两种PCR产物组装到pOsU3-esgRNA的EcoRI和HindIII消化的骨架中。

图12、显示了SWISSv1.1、SWISSv1.2和SWISSv3插入缺失测序读段之间的缺失产物分布。值和误差棒表示三个独立实验的平均值±标准误差。

图13、SWISSv2和SWISSv3的多种sgRNA组装示意图。(a)MGE和MGE-NG的结构。缩写：ecTadA7.10，进化后的大肠杆菌TadA；aa，氨基酸；XTEN，16aa的接头；NLS，核定位信号；CaMV，花椰菜花叶病毒；Term，终止子。(b)CBE靶标和ABE靶组装的示意图。从esgRNA-2×boxB-pTaU6模板扩增PCR产物，然后通过Golden Gate Assembly将其插入pOsU3-esgRNA-2×MS2的BsaI位点。(c)CBE靶标、ABE靶标和成对的sgRNA装配的示意图。从CBE靶标和ABE靶标双重sgRNA质粒中扩增出具有CBE靶标和ABE靶标的PCR产物。从成对的sgRNA质粒中扩增出具有成对的sgRNA的PCR产物。通过多重一步克隆将上述两种PCR产物组装到pOsU3-esgRNA的EcoRI和HindIII消化的骨架中。

图14、水稻中同时进行CBE、ABE和DSB。(a)CBE靶标、ABE靶标和配对sgRNA的双元载体示意图。从CBE靶标和ABE靶标双重sgRNA质粒中扩增出具有CBE靶标和ABE靶标的PCR产物。从成对的sgRNA质粒中扩增出具有成对的sgRNA的PCR产物。通过多重一步克隆将以上两种PCR产物组装到HindIII消化的pH-MGE双元载体中。(b)OsALS-T2、OsACC-T2和OsBADH2-Indels突变体的T7E1分析结果。目标C/A碱基以红色突出显示。PAM序列显示为棕色。分析了十株T0苗(T0-1至T0-10)。WT/D和WT/U表示有或没有由T7E1消化的野生型(WT)对照的基因组DNA扩增子。总共鉴定出55个突变体。红色箭头标记的条带可诊断基因组编辑阳性。通过Sanger测序确定序列。通过在线工具DSDecodeM和TIDE进一步分析插入缺失的测序谱图。

图15、分析SWISSv2和SWISSv3引起的不期望的编辑脱靶。(a)“自切割”T2A肽介导的可能的MGE蛋白产物的示意图。T2A介导的“自切割”是通过核糖体跳过在C端形成甘氨酰-脯氨酰肽键的方式实现的。T2A的位置将影响多顺反子构建体的表达水平。成功跳过可按设计产生三种独立的蛋白质。但是，也可能发生跳过失败，从而产生融合蛋白产物。尤其是当产生了MCP-APOBEC1-UGI-T2A-ecTadA-ecTadA7.10-N22p融合蛋白时，esgRNA-2×MS2和esgRNA-2×boxB均可募集该融合蛋白，从而导致对ABE靶标进行不希望的胞嘧啶编辑和在CBE目标上进行不希望的腺嘌呤编辑。(b)由SWISSv2和SWISSv3引起的不希望的编辑脱靶的效率。分析了SWISSv2和SWISSv3中ABE靶的胞嘧啶和CBE靶的腺嘌呤。值和误差棒表示三个独立实验的平均值±标准误差。

图16、示出所设计的多种不同scRNA/sgRNA结构。

图17、示出所设计的多种不同的scRNA/sgRNA结构。

发明详述

一、定义

在本发明中，除非另有说明，否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且，本文中所用的蛋白质和核酸化学、分子生物学、细胞和组织培养、微生物学、免疫学相关术语和实验室操作步骤均为相应领域内广泛使用的术语和常规步骤。例如，本发明中使用的标准重组DNA和分子克隆技术为本领域技术人员熟知，并且在如下文献中有更全面的描述：Sambrook，J.，Fritsch，E.F.和Maniatis，T.，Molecular Cloning：A Laboratory Manual；Cold Spring Harbor Laboratory Press：Cold Spring Harbor，1989(下文称为“Sambrook”)。同时，为了更好地理解本发明，下面提供相关术语的定义和解释。

如本文所用，术语“和/或”涵盖由该术语连接的项目的所有组合，应视作各个组合已经单独地在本文列出。例如，“A和/或B”涵盖了“A”、“A和B”以及“B”。例如，“A、B和/或C”涵盖“A”、“B”、“C”、“A和B”、“A和C”、“B和C”以及“A和B和C”。

“包含”一词在本文中用于描述蛋白质或核酸的序列时，所述蛋白质或核酸可以是由所述序列组成，或者在所述蛋白质或核酸的一端或两端可以具有额外的氨基酸或核苷酸，但仍然具有本发明所述的活性。此外，本领域技术人员清楚多肽N端由起始密码子编码的甲硫氨酸在某些实际情况下(例如在特定表达系统表达时)会被保留，但不实质影响多肽的功能。因此，本申请说明书和权利要求书中在描述具体的多肽氨基酸序列时，尽管其可能不包含N端由起始密码子编码的甲硫氨酸，然而此时也涵盖包含该甲硫氨酸的序列，相应地，其编码核苷酸序列也可以包含起始密码子；反之亦然。

“基因组”如本文所用不仅涵盖存在于细胞核中的染色体DNA，而且还包括存在于细胞的亚细胞组分(如线粒体、质体)中的细胞器DNA。

“经遗传修饰的植物”意指在其基因组内包含外源多核苷酸或包含经修饰的基因或表达调控序列的植物。例如外源多核苷酸能够稳定地整合进植物的基因组中，并遗传连续的世代。外源多核苷酸可单独地或作为重组DNA构建体的部分整合进基因组中。经修饰的基因或表达调控序列为在植物基因组中所述基因或表达调控序列包含一个或多个脱氧核苷酸取代、缺失和添加。

针对序列而言的“外源”意指来自外来物种的序列，或者如果来自相同物种，则指通过蓄意的人为干预而从其天然形式发生了组成和/或基因座的显著改变的序列。

“多核苷酸”、“核酸序列”、“核苷酸序列”或“核酸片段”可互换使用并且是单链或双链RNA或DNA聚合物，任选地可含有合成的、非天然的或改变的核苷酸碱基。核苷酸通过如下它们的单个字母名称来指代：“A”为腺苷或脱氧腺苷(分别对应RNA或DNA)，“C”表示胞苷或脱氧胞苷，“G”表示鸟苷或脱氧鸟苷，“U”表示尿苷，“T”表示脱氧胸苷，“R”表示嘌呤(A或G)，“Y”表示嘧啶(C或T)，“K”表示G或T，“H”表示A或C或T，“D”表示A、T或G，“I”表示肌苷，并且“N”表示任何核苷酸。

“多肽”、“肽”、和“蛋白”在本发明中可互换使用，指氨基酸残基的聚合物。该术语适用于其中一个或多个氨基酸残基是相应的天然存在的氨基酸的人工化学类似物的氨基酸聚合物，以及适用于天然存在的氨基酸聚合物。术语“多肽”、“肽”、“氨基酸序列”和“蛋白”还可包括修饰形式，包括但不限于糖基化、脂质连接、硫酸盐化、谷氨酸残基的γ羧化、羟化和ADP-核糖基化。

如本发明所用，“表达构建体”是指适于感兴趣的核苷酸序列在生物体中表达的载体如重组载体。“表达”指功能产物的产生。例如，核苷酸序列的表达可指核苷酸序列的转录(如转录生成mRNA或功能RNA)和/或RNA翻译成前体或成熟蛋白质。

本发明的“表达构建体”可以是线性的核酸片段、环状质粒、病毒载体，或者，在一些实施方式中，可以是能够翻译的RNA(如mRNA)，例如是体外转录生成的RNA。

本发明的“表达构建体”可包含不同来源的调控序列和感兴趣的核苷酸序列，或相同来源但以不同于通常天然存在的方式排列的调控序列和感兴趣的核苷酸序列。

“调控序列”和“调控元件”可互换使用，指位于编码序列的上游(5'非编码序列)、中间或下游(3'非编码序列)，并且影响相关编码序列的转录、RNA加工或稳定性或者翻译的核苷酸序列。调控序列可包括但不限于启动子、翻译前导序列、内含子和多腺苷酸化识别序列。

“启动子”指能够控制另一核酸片段转录的核酸片段。在本发明的一些实施方案中，启动子是能够控制细胞中基因转录的启动子，无论其是否来源于所述细胞。启动子可以是组成型启动子或组织特异性启动子或发育调控启动子或诱导型启动子。

“组成型启动子”指一般将引起基因在多数细胞类型中在多数情况下表达的启动子。“组织特异性启动子”和“组织优选启动子”可互换使用，并且指主要但非必须专一地在一种组织或器官中表达，而且也可在一种特定细胞或细胞型中表达的启动子。“发育调控启动子”指其活性由发育事件决定的启动子。“诱导型启动子”响应内源性或外源性刺激(环境、激素、化学信号等)而选择性表达可操纵连接的DNA序列。

启动子的实例包括但不限于聚合酶(pol)I、pol II或pol III启动子。pol I启动子的实例包括鸡RNA pol I启动子。pol II启动子的实例包括但不限于巨细胞病毒立即早期(CMV)启动子、劳斯肉瘤病毒长末端重复(RSV-LTR)启动子和猿猴病毒40(SV40)立即早期启动子。pol III启动子的实例包括U6和H1启动子。可以使用诱导型启动子如金属硫蛋白启动子。启动子的其他实例包括T7噬菌体启动子、T3噬菌体启动子、β-半乳糖苷酶启动子和Sp6噬菌体启动子。当用于植物时，启动子可以是花椰菜花叶病毒35S启动子、玉米Ubi-1启动子、小麦U6启动子、水稻U3启动子、玉米U3启动子、水稻肌动蛋白启动子。

如本文中所用，术语“可操作地连接”指调控元件(例如但不限于，启动子序列、转录终止序列等)与核酸序列(例如，编码序列或开放读码框)连接，使得核苷酸序列的转录被所述转录调控元件控制和调节。用于将调控元件区域可操作地连接于核酸分子的技术为本领域已知的。

将核酸分子(例如质粒、线性核酸片段、RNA等)或蛋白质“导入”生物体是指用所述核酸或蛋白质转化生物体细胞，使得所述核酸或蛋白质在细胞中能够发挥功能。本发明所用的“转化”包括稳定转化和瞬时转化。“稳定转化”指将外源核苷酸序列导入基因组中，导致外源基因稳定遗传。一旦稳定转化，外源核酸序列稳定地整合进所述生物体和其任何连续世代的基因组中。“瞬时转化”指将核酸分子或蛋白质导入细胞中，执行功能而没有外源基因稳定遗传。瞬时转化中，外源核酸序列不整合进基因组中。

“性状”指细胞或生物体的生理的、形态的、生化的或物理的特征。

“农艺性状”特别是指作物植物的可测量的指标参数，包括但不限于：叶片绿色、籽粒产量、生长速率、总生物量或积累速率、成熟时的鲜重、成熟时的干重、果实产量、种子产量、植物总氮含量、果实氮含量、种子氮含量、植物营养组织氮含量、植物总游离氨基酸含量、果实游离氨基酸含量、种子游离氨基酸含量、植物营养组织游离氨基酸含量、植物总蛋白含量、果实蛋白含量、种子蛋白含量、植物营养组织蛋白质含量、除草剂的抗性抗旱性、氮的吸收、根的倒伏、收获指数、茎的倒伏、株高、穗高、穗长、抗病性、抗寒性、抗盐性和分蘖数等。

二、多重基因组编辑系统

在一方面，本发明提供一种用于在植物尤其是作物中进行多重编辑的基因组编辑系统，其包含：

i)CRISPR切口酶和/或含有编码所述CRISPR切口酶的核苷酸序列的表达构建体；和

ii)选自以下的一项或多项或全部：

ii-1)靶向所述植物基因组内的第一靶区域的第一scRNA和/或含有编码所述第一scRNA的核苷酸序列的表达构建体，所述第一scRNA包含至少一个第一RNA适配体(aptamer)；以及，第一融合蛋白和/或含有编码所述第一融合蛋白的核苷酸序列的表达构建体，所述第一融合蛋白包含第一RNA适配体特异性结合蛋白和胞嘧啶脱氨结构域；

ii-2)靶向所述植物基因组内的第二靶区域的第二scRNA和/或含有编码所述第二scRNA的核苷酸序列的表达构建体，所述第二scRNA包含至少一个第二RNA适配体；以及，第二融合蛋白和/或含有编码所述第二融合蛋白的核苷酸序列的表达构建体，所述第二融合蛋白包含第二RNA适配体特异性结合蛋白和腺嘌呤脱氨结构域；

ii-3)靶向所述植物基因组内的第三靶区域的成对gRNA和/或含有编码所述成对gRNA的核苷酸序列的表达构建体，所述成对gRNA分别靶向所述第三靶区域DNA的不同链。

如本文所用，“基因组编辑系统”是指用于对细胞或生物体内基因组进行编辑所需的成分的组合。其中所述系统的各个成分，例如CRISPR切口酶、第一scRNA、第一融合蛋白、第二scRNA、第二融合蛋白、成对gRNA，以及它们的表达载体可以各自独立地存在，或者可以以任意的组合作为组合物的形式存在。

如本文所用，“CRISPR切口酶”是指CRISPR核酸酶的切口酶形式，其在双链核酸分子形成切口(nick)，但不完全切断双链核酸，仍然保留gRNA指导的序列特异性DNA结合能力。

在一些实施方案中，所述CRISPR切口酶是Ca9切口酶，例如是衍生自化脓链球菌(S.pyogenes)Cas9(SpCas9)的Cas9切口酶。在一些实施方案中，所述Cas9切口酶包含SEQ ID NO:25所示的氨基酸序列(nCas9(D10A))。

在一些实施方案中，所述Cas9切口酶是识别PAM序列5’-NG-3’的Cas9变体切口酶，其包含SEQ ID NO:48所示氨基酸序列(nCas9-NG(D10A))。

如本文所用，“向导RNA”和“gRNA”可互换使用，指的是能够与CRISPR核酸酶或其衍生蛋白如CRISPR切口酶形成复合物并由于与靶序列具有一定相同性而能够将所述复合物靶向靶序列的RNA分子。gRNA通过与靶序列互补链之间的碱基配对而靶向所述靶序列。例如，Cas9核酸酶或其衍生蛋白如Cas9切口酶所采用的gRNA通常由部分互补形成复合物的crRNA和tracrRNA分子构成，其中crRNA包含与靶序列具有足够相同性以便与该靶序列的互补链杂交并且指导CRISPR复合物(Cas9+crRNA+tracrRNA)与该靶序列序列特异性地结合的引导序列(也称spacer)。然而，本领域已知可以设计单向导RNA(sgRNA)，其同时包含crRNA和tracrRNA的特征。

在一些实施方案中，所述sgRNA包含SEQ ID NO:3或SEQ ID NO:4所示核苷酸序列。

如本文所用，“RNA适配体(aptamer)”是指能够与特定蛋白特异性结合的RNA分子。适于本发明的RNA适配体的实例包括但不限于MS2、PP7、boxB和com，其相应的RNA适配体特异性结合蛋白为MCP(SEQ ID NO:34)、PCP(SEQ ID NO:35)、N22p(SEQ ID NO:36)和COM(SEQ ID NO:37)。

如本文所用，“scRNA”或可互换使用的术语“支架RNA”、“Scaffold RNA”是指在CRISPR系统的gRNA例如sgRNA上并入RNA适配体形成的RNA分子，其保留gRNA的功能，并能够招募所述RNA适配体的特异性结合蛋白或包含所述结合蛋白的融合蛋白。

在一些实施方案中，所述scRNA包含两个或更多个RNA适配体。在一些实施方案中，所述scRNA包含SEQ ID NO:5-24之一所述的核苷酸序列。

在一些优选实施方案中，所述第一scRNA包含SEQ ID NO:13或15所示核苷酸序列。相应的，所述第一RNA适配体特异性结合蛋白包含SEQ ID NO:34所示氨基酸序列。

在一些优选实施方案中，所述第一scRNA包含SEQ ID NO:24所示核苷酸序列。相应的，所述第一RNA适配体特异性结合蛋白包含SEQ ID NO:37所示氨基酸序列。

在一些优选实施方案中，所述第二scRNA包含SEQ ID NO:22所示核苷酸序列。相应的，所述第二RNA适配体特异性结合蛋白包含SEQ ID NO:36所示氨基酸序列。

如本文所用，“胞嘧啶脱氨结构域”指的是能够接受单链DNA作为底物，催化胞苷或脱氧胞苷分别脱氨化为尿嘧啶或脱氧尿嘧啶的结构域。在一些实施方案中，所述胞嘧啶脱氨结构域包含至少一个(例如一个或两个)胞嘧啶脱氨酶多肽。

在本发明中，第一融合蛋白中的胞苷脱氨结构域能够将CRIPR切口酶-第一scRNA-第一融合蛋白-DNA复合物形成中产生的单链DNA的胞苷C脱氨转换成尿嘧啶U，再通过碱基错配修复实现C至T的碱基替换。

可用于本发明的胞嘧啶脱氨酶的实例包括但不限于例如APOBEC1脱氨酶、激活诱导的胞苷脱氨酶(AID)、APOBEC3G、CDA1、人APOBEC3A脱氨酶，或它们的功能性变体。在一些实施方式中，所述胞嘧啶脱氨酶是APOBEC1脱氨酶或其功能性变体。在一些实施方案中，所述胞嘧啶脱氨酶包含SEQ ID NO:26-30之一的氨基酸序列。

在一些实施方案中，所述第一融合蛋白中，所述第一RNA适配体特异性结合蛋白位于所述胞嘧啶脱氨结构域的N端。在一些实施方案中，所述第一融合蛋白中，所述第一RNA适配体特异性结合蛋白与所述胞嘧啶脱氨结构域之间通过接头融合。

在一些实施方案中，所述第一融合蛋白还包含尿嘧啶DNA糖基化酶抑制剂(UGI)。在细胞中，尿嘧啶DNA糖基化酶催化U从DNA上的去除并启动碱基切除修复(BER)，导致将U:G修复成C:G。因此，不受任何理论限制，在本发明的第一融合蛋白包含尿嘧啶DNA糖基化酶抑制剂(UGI)将能够增加C至T碱基编辑的效率。

在一些实施方案中，所述UGI包含SEQ ID NO:31所示氨基酸序列。

如本文所用，“腺嘌呤脱氨结构域”是指能够接受单链DNA作为底物，催化腺苷或脱氧腺苷(A)形成肌苷(I)的结构域。在一些实施方案中，所述腺嘌呤脱氨结构域包含至少一个(例如一个)DNA依赖型腺嘌呤脱氨酶多肽。

在本发明中，融合蛋白中的腺嘌呤脱氨结构域能够将CRISPR切口酶-第二scRNA-第二融合蛋白-DNA复合物形成中产生的单链DNA的腺苷脱氨转换成肌苷(I)，由于DNA聚合酶会将肌苷(I)当做鸟嘌呤(G)处理，因此通过碱基错配修复可以实现A至G的取代。

在一些实施方案中，所述DNA依赖型腺嘌呤脱氨酶是大肠杆菌tRNA腺嘌呤脱氨酶TadA(ecTadA)的变体。示例性的野生型ecTadA氨基酸序列如SEQ ID NO:32所示。在本发明一些优选实施方式中，所述DNA依赖型腺嘌呤脱氨酶包含如SEQ ID NO:33所示的氨基酸序列。

由于大肠杆菌tRNA腺嘌呤脱氨酶(ecTadA)通常以二聚体发挥功能，因此预期两个DNA依赖型腺嘌呤脱氨酶形成二聚体或DNA依赖型腺嘌呤脱氨酶与野生型腺嘌呤脱氨酶形成二聚体可以显著提高融合蛋白A至G的编辑活性。在一些优选实施方案中，所述腺嘌呤脱氨结构域包含两个所述DNA依赖型腺嘌呤脱氨酶。

在一些优选实施方案中，所述腺嘌呤脱氨结构域还包含与所述DNA依赖型腺嘌呤脱氨酶(例如大肠杆菌tRNA腺嘌呤脱氨酶TadA的DNA依赖型变体)融合的对应的野生型腺嘌呤脱氨酶(例如大肠杆菌tRNA腺嘌呤脱氨酶TadA)。在一些优选实施方案中，所述DNA依赖型腺嘌呤脱氨酶(例如大肠杆菌tRNA腺嘌呤脱氨酶TadA的DNA依赖型变体)融合至对应的野生型腺嘌呤脱氨酶(例如大肠杆菌tRNA腺嘌呤脱氨酶TadA)的C端。

在一些实施方案中，所述两个DNA依赖型腺嘌呤脱氨酶(例如大肠杆菌tRNA腺嘌呤脱氨酶TadA的DNA依赖型变体)之间或所述DNA依赖型腺嘌呤脱氨酶(例如大肠杆菌tRNA腺嘌呤脱氨酶TadA的DNA依赖型变体)与所述对应的野生型腺嘌呤脱氨酶(例如大肠杆菌tRNA腺嘌呤脱氨酶TadA)之间通过接头融合。

在一些实施方案中，所述第二融合蛋白中，所述第二RNA适配体特异性结合蛋白位于所述腺嘌呤脱氨结构域的C端。在一些实施方案中，所述第二融合蛋白中，所述第二RNA适配体特异性结合蛋白与所述腺嘌呤脱氨结构域之间通过接头融合。

如本文所用，“接头”可以是长1-50个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或20-25个、25-50个)或更多个氨基酸、无二级以上结构的非功能性氨基酸序列。例如，所述接头可以是柔性接头等。在一些实施方案中，所述接头长16个氨基酸，例如所述接头包含SEQ ID NO:41所示氨基酸序列。在一些实施方案中，所述接头长36个氨基酸，例如所述接头包含SEQ ID NO:42或43所示氨基酸序列。

在本发明的一些实施方案中，本发明的CRISPR切口酶、第一融合蛋白和/或第二融合蛋白还可以包含核定位序列(NLS)。一般而言，所述CRISPR切口酶、第一融合蛋白和/或第二融合蛋白中的一个或多个NLS应具有足够的强度，以便在细胞的核中驱动所述蛋白以可实现其碱基编辑功能的量积聚。一般而言，核定位活性的强度由所述蛋白中NLS的数目、位置、所使用的一个或多个特定的NLS、或这些因素的组合决定。

在本发明的一些实施方案中，本发明的CRISPR切口酶、第一融合蛋白和/或第二融合蛋白的NLS可以位于N端和/或C端或中间。在一些实施方案中，所述CRISPR切口酶、第一融合蛋白和/或第二融合蛋白包含约1、2、3、4、5、6、7、8、9、10个或更多个NLS。在一些实施方案中，所述CRISPR切口酶、第一融合蛋白和/或第二融合蛋白包含在或接近于N端的约1、2、3、4、5、6、7、8、9、10个或更多个NLS。在一些实施方案中，所述CRISPR切口酶、第一融合蛋白和/或第二融合蛋白包含在或接近于C端约1、2、3、4、5、6、7、8、9、10个或更多个NLS。当存在多于一个NLS时，每一个可以被选择为不依赖于其他NLS。在一些具体实施方式中，NLS包含SEQ ID NO:39或40所示的氨基酸序列。

此外，根据所需要编辑的DNA位置，本发明的CRISPR切口酶、第一融合蛋白和/或第二融合蛋白还可以包括其他的定位序列，例如细胞质定位序列、叶绿体定位序列、线粒体定位序列等。

在一些实施方案中，本发明的CRISPR切口酶、第一融合蛋白和/或第二融合蛋白通过“自裂解肽”相互连接。

如本文所用“自裂解肽”意指可以在细胞内实现自剪切的肽。例如，所述自裂解肽可以包含蛋白酶识别位点，从而被细胞内的蛋白酶识别并特异性切割。或者，所述自裂解肽可以是2A多肽。2A多肽是一类来自病毒的短肽，其自切割发生在翻译期间。当用 2A多肽连接两种不同目的多肽在同一读码框表达时，几乎以1:1的比例生成两种目的多肽。常用的2A多肽可以是来自猪捷申病毒(porcine techovirus-1)的P2A、来自明脉扁刺蛾β四体病毒(Thosea asigna virus)的T2A、马甲型鼻病毒(equine rhinitis A virus)的E2A和来自口蹄疫病毒(foot-and-mouth disease virus)的F2A。本领域也已知多种这些2A多肽的功能性变体，这些变体也可以用于本发明。在一些具体实施方案中，所述2A多肽是T2A，例如包含SEQ ID NO:38所示氨基酸序列。

通过使用自裂解肽，可以将本发明的CRISPR切口酶、第一融合蛋白和/或第二融合蛋白置于同一个表达载体进行表达。

在一些实施方案中，所述第一scRNA、第二scRNA和/或所述成对的gRNA可以由同一表达构建体表达。

通过使用本发明的基因组编辑系统，可以通过一次转化同时实现不同靶位点的不同类型的基因组编辑。例如，如果将所述系统中的i)和ii-1)、ii-2)以及ii-3)共同(在同一载体或在分开的载体中)导入植物中，可以一次转化实现第一靶位点中C-T编辑，第二靶位点中A-G编辑，以及第三靶位点的缺失突变。

三、产生经遗传修饰的植物的方法

在另一方面，本发明提供了一种产生经遗传修饰的植物例如作物植物的方法，包括将本发明的基因组编辑系统导入植物。

在一些实施方案中，将所述系统中的i)和ii-1)共同导入植物中，由此实现第一靶位点中C-T编辑。

在一些实施方案中，将所述系统中的i)和ii-1)以及ii-2)共同导入植物中，由此实现第一靶位点的中C-T编辑，第二靶位点中的A-G编辑。

在一些实施方案中，将所述系统中的i)和ii-2)以及ii-3)共同导入植物中，实现第二靶位点中A-G编辑以及第三靶位点的缺失突变。

在一些实施方案中，将所述系统中的i)和ii-1)以及ii-3)共同导入植物中，实现第一靶位点中C-T编辑，以及第三靶位点的缺失突变。

在一些实施方案中，将所述系统中的i)和ii-1)、ii-2)以及ii-3)共同导入植物中，实现第一靶位点中C-T编辑，第二靶位点中A-G编辑，以及第三靶位点的缺失突变。

在一些实施方案中，所述系统中的i)、ii-1)、ii-2)、ii-3)及其组合是同时导入所述植物，例如在同一载体导入植物，或在一次转化中导入植物。

在一些实施方案中，所述方法包括：

a)将本发明的基因组编辑系统的i)导入植物，获得稳定表达所述CRSPR切口酶的转基因植物；

b)将本发明的基因组编辑系统的ii-1)、ii-2)、ii-3)及其任意组合导入步骤a)获得的转基因植物。

在本发明的产生经遗传修饰的植物的方法中，所述基因组编辑系统可以本领域技术人员熟知的各种方法导入植物。可用于将本发明的编辑系统导入植物的方法包括但不限于：基因枪法、PEG介导的原生质体转化、土壤农杆菌介导的转化、植物病毒介导的转化、花粉管通道法和子房注射法。优选地，通过瞬时转化将所述系统导入植物。

在本发明的方法中，只需在植物细胞中导入或产生所述蛋白和RNA分子即可实现对靶位点的修饰，并且所述修饰可以稳定遗传，无需将所述编辑系统稳定转化植物。这样避免了稳定存在的编辑系统的潜在脱靶作用，也避免外源核苷酸序列在植物基因组中的整合，从而具有更高生物安全性。

在一些优选实施方式中，所述导入在不存在选择压力下进行，从而避免外源核苷酸序列在植物基因组中的整合。

在一些实施方式中，所述导入包括将本发明的基因组编辑系统转化至分离的植物细胞或组织，然后使所述经转化的植物细胞或组织再生为完整植物。优选地，在不存在选择压力下进行所述再生，也即是，在组织培养过程中不使用任何针对表达载体上携带的选择基因的选择剂。不使用选择剂可以提高植物的再生效率，获得不含外源核苷酸序列的经修饰的植物。

在另一些实施方式中，可以将本发明的基因组编辑系统转化至完整植物上的特定部位，例如叶片、茎尖、花粉管、幼穗或下胚轴。这特别适合于难以进行组织培养再生的植物的转化。

在本发明的一些实施方式中，直接将体外表达的蛋白质和/或体外转录的RNA分子转化至所述植物。所述蛋白质和/或RNA分子能够在植物细胞中实现基因编辑，随后被细胞降解，避免了外源核苷酸序列在植物基因组中的整合。

因此，在一些实施方式中，使用本发明的方法对植物进行遗传修饰和育种可以获得无外源DNA整合的植物，即非转基因(transgene-free)的经修饰的植物。

可以通过本发明的系统和方法进行基因编辑的植物包括单子叶植物和双子叶植物。例如，所述植物可以是作物植物，例如小麦、水稻、玉米、大豆、向日葵、高粱、油菜、苜蓿、棉花、大麦、粟、甘蔗、番茄、烟草、木薯或马铃薯。

在本发明的一些实施方式中，其中所述靶位点与植物性状如农艺性状相关，由此所述编辑导致所述植物相对于野生型植物具有改变的性状。在本发明中，待进行修饰的靶序列可以位于基因组的任何位置，例如位于功能基因如蛋白编码基因内，或者例如可以位于基因表达调控区如启动子区或增强子区，从而实现对所述基因功能修饰或对基因表达的修饰。

在本发明的一些实施方式中，所述方法还包括获得所述经遗传修饰的植物的后代。在另一方面，本发明还提供了经遗传修饰的植物或其后代或其部分，其中所述植物通过本发明上述的方法获得。在一些实施方式中，所述经遗传修饰的植物或其后代或其部分是非转基因的。

在另一方面，本发明还提供了一种植物育种方法，包括将通过本发明上述的方法获得的经遗传修饰的第一植物与不含有所述遗传修饰的第二植物杂交，从而将所述遗传修饰导入第二植物。

实施例

实施例1、利用MS2介导C至T转换

植物胞嘧啶碱基编辑系统PBE，主要由以下几个模块组成：1)胞嘧啶脱氨酶用来将胞嘧啶(Cytosine,C)脱氨为尿嘧啶(Uracil,U)；2)nCas9(D10A)用于sgRNA可编程的DNA碱基编辑和促进内源的错配修复(Mismatch Repair,MMR)途径；3)尿嘧啶DNA糖基化酶抑制剂(Uracil DNA Glycosylase Inhibitor,UGI)用于抑制体内尿嘧啶糖基化酶UDG的活性，防止U变成AP位点。

MS2是常用的RNA适配体，已有研究表明将两个MS2发夹结构添加到esgRNA的3′端形成的scRNA，能够在人类细胞中能够高效的介导CRISPRa。因此，首先构建了由OsU3启动子驱动的该scRNA载体pOsU3-esgRNA-2×MS2(图1b)。为了构建RNA适配体招募的PBE系统载体PBEc，利用T2A“自剪切”肽同时表达多个蛋白模块，其中nCas9(D10A)融合或不融合APOBEC1或UGI作为RNA可编程的模块，MS2结合蛋白MCP融合APOBEC1或UGI作为被招募模块，构建了PBEc1至PBEc5。所有的PBEc载体均用作物密码子优化，并由玉米的Ubi-1启动子驱动(图1c)。

为了筛选出高效的PBEc载体，使用BFP变GFP报告系统对PBEc载体的C>T效率进行评价，该报告系统的GFP荧光活性需要BFP上CAC编码的His66变为TAC编码的Tyr66。因此，构建了靶向该位点的scRNA质粒esgRNA-2×MS2-BFP，使碱基C位于PAM远端的第4位。利用PEG诱导法，将不同的PBEc和esgRNA-2×MS2-BFP组合转化水稻原生质体，PBE和sgRNA-BFP作为对照组，GFP为阳性对照，未转化的水稻原生质体为阴性对照。22℃培养36h后，使用流式细胞仪检测各处理组的GFP荧光活性。三次实验重复结果表明，PBEc1至PBEc5组的GFP荧光活性为0.67-10.80％，其中具有MCP-APOBEC1-UGI被招募模块的PBEc4的荧光活性最高，其次为具有MCP-UGI-APOBEC1被招募模块的PBEc5，分别为PBE和sgRNA-BFP对照组的2.87倍、1.21倍(图1d)。PBEc1和PBEc2的被招募模块均为MCP-APOBEC1，其效率与PBE对照组相当(图1d)。虽然MCP以二聚体的形式结合MS2的发夹结构，但是当被招募模块为MCP-UGI时(PBEc3)，C>T的效率急剧下降(图1d)。

为了验证PBEc载体在内源靶位点上的C>T活性，将水稻的6个内源靶位点构建到pOsU3-esgRNA-2×MS2-BFP或pOsU3-sgRNA载体上(表1)。含有靶位点的scRNA载体分别与PBEc1至PBEc5共转化水稻原生质体，含有靶位点的sgRNA载体分别与PBE和Cas9共转化水稻原生质体作为对照组。22℃培养60h后，提取水稻原生质DNA，并进行扩增子NGS测序。结果表明，使用MS2和MCP配对的PBEc载体与PBE的编辑窗口一致，均为C ₃～C ₉(图1e)。所测试的5个PBEc载体在内源靶位点上C ₃～C ₉的编辑效率为0.13～11.73％(图1e)，其中PBEc4的编辑效率最高，在4个靶位点(OsACC-T1、OsDEP1-T2、OsEV和OsOD)上的活性是PBE的3.62倍，2个靶位点(OsCDC48和OsDEP1-T1)的活性与PBE相比略低。此外，nPBEc4具有较高的产物编辑纯度，非目的产物不明显(<0.04％)；其产生的Indel效率(0.04～0.29％)与未处理组的水稻原生质体一致(0.01～0.32％)，远低于Cas9(4.82～11.75％)(图5)。综上，scRNA编程的nCas9(D10A)复合体同时招募APOBEC1和UGI能够提升C>T的碱基编辑活性。因此，使用PBEc4的载体结构作为进一步研究的对象。

表1、用于比较PBEc and PABEc活性的sgRNA靶序列

^aPAM基序用粗体和下划线示出。

实施例2、设计不同的scRNA介导C至T转换

为了开发多重招募系统，并获得多种具有不同RNA适配体的scRNA，将PBEc4中的MCP替换为PCP、N22p和Com，分别识别病毒RNA发夹结构PP7、boxB和com，构建了PBEc6、PBEc7和PBEc8(图2a)。有报道表明将MS2发夹结构嵌合在sgRNA的二级结构四环(Tetraloop)和茎环2(Stem Loop 2)上形成的sgRNA2.0比在sgRNA 3′端连接两个MS2发夹结构形成的scRNA形式sgRNA-2×MS2效率更高。因此，在sgRNA或含有一个A-U或C-G翻转和发夹结构延长的esgRNA的四环和颈环2上分别嵌合一个MS2发夹结构，构建了sgRNA2.0至sgRNA4.0(图2b和图16、17)。使用相同的构建策略，还构建了分别含有PP7两种发夹结构变体和boxB发夹结构的sgRNA7-1、sgRNA7-2和sgRNAB.0(图2b和图16、17)。同时，使用3′端连接1个或2个RNA适配体(包括MS2、PP7、boxB、com)发夹结构的策略构建了多种scRNA(图2b和图16、17)。为了招募更多的APOBEC1-UGI模块，使用上述两种策略结合的方法构建了含有MS2发夹结构的sgRNA4.0(图2b和图16、17)。

为了比较不同scRNA与相应PBEc之间的活性，在水稻原生质体中使用BFP变GFP报告系统进行效率评价。BFP-sgRNA或BFP-esgRNA和PBE载体作为对照组。不同于已报道的结论，所有的sgRNA2.0构象的scRNA(包括MS2、PP7和boxB)在报告系统中介导的 C>T编辑效率都非常低(0.07～0.43％)(图2c)。相反地，scRNA 3′端含有2个或3个RNA适配体发夹结构和含有1个发夹结构的esgRNA-1×com构象均能介导高效的C>T编辑效率(1.83～8.83％)(图2c)。其中，PBEc4与esgRNA-2×MS2、esgRNA-3×MS2或sgRNA4.0的转化组合以及PBEc8与esgRNA-2×com的转化组合在报告系统中的C>T编辑效率分别是7.47％、8.00％、8.83％、6.90％，均比PBE和esgRNA的转化组合(6.03％)的效率高(图2c)。两种scRNA构象之间的活性之所以与已报道的结论不一致，是因为在本研究中使用的3′端scRNA构象中RNA适配体发夹结构之间具有一个双链linker，增加了scRNA 3′端多个发夹结构构象的稳定性。

为了评价上述高效scRNA(esgRNA-2×MS2、esgRNA-3×MS2、sgRNA4.0、esgRNA-2×com)介导的水稻内源靶位点的C>T编辑活性，将5个内源靶位点构建到4个scRNA载体上，并分别与PBEc4和PBEc8共转化水稻原生质体。含有靶位点的sgRNA或esgRNA载体分别与PBE和Cas9共转化水稻原生质体作为对照组。22℃培养60h后，提取水稻原生质DNA，并进行扩增子NGS测序。结果表明，在所测试的5个靶位点(OsACC-T1、OsDEP1-T1、OsDEP1-T2、OsEV和OsOD)的C ₃～C ₉编辑窗口上，使用esgRNA(平均值7.96％)、esgRNA-2×MS2(平均值18.04％)、esgRNA-3×MS2(平均值14.96％)以及esgRNA-2×com(平均值11.13％)介导的C>T碱基编辑活性均比使用sgRNA(平均值4.82％)和sgRNA4.0(平均值4.78％)高。在这些scRNA中，esgRNA-2×MS2、esgRNA-3×MS2、esgRNA-2×com介导的C>T编辑效率比sgRNA高2.31～3.75倍(图2d，图6)，并且具有相同的主要的单碱基窗口C ₃～C ₉(图2d)。同时，不同的scRNA在水稻原生质体中也具有较高的产物纯度(>99.68％)(图7a)和较低的Indel值(<0.56％)，远低于Cas9(<21.21％)(图7b)。

此外，为了开发窄编辑窗口的高效PBE系统，将PBE和PBEc4的APOBEC1部分替换为催化活性降低的APOBEC1变体YE1、YE2、EE和YEE(图8a,b)。使用OsEV和OsOD两个靶位点在水稻原生质体中测试这些变体在PBE和PBEc4构象下的C>T碱基编辑窗口和活性。扩增子测序结果表明，YE1-PBEc4、EE-PBEc4或YEE-PBEc4与esgRNA-2×MS2组合，均能提高C>T的碱基编辑活性，在编辑窗口中心位置上(OsEV的C ₅和OsOD的C ₆)的活性大概是这些变体在PBE构象下的1.37～1.78倍(图2e，图8c)。其中，EE-PBEc4在保持窄窗口的同时，也具有较低从属编辑产物(图2e，图8c)，说明窄窗口的PBE可以通过scRNA招募的方式增强其编辑活性。

综上，将不同的RNA适配体整合进sgRNA对于在植物中使用RNA编程的nCas9(D10A)的多重招募提供了有效的解决方案。此外，筛选出来的esgRNA-2×MS2、esgRNA-3×MS2和esgRNA-2×com可以作为多重基因组编辑系统中介导CBE功能的候选对象。

实施例3、优化载体和scRNA介导A至G转换

植物腺嘌呤单碱基编辑器PABE-7主要有以下几个模块构成：野生型腺嘌呤脱氨酶 ecTadA和人工进化的脱氧腺嘌呤脱氨酶ecTadA7.10组成的异二聚体，与PBE系统一致的nCas9(D10A)，以及在nCas9(D10A)C端的3个拷贝的SV40NLS。为了将PABE-7改造为RNA适配体招募的构象，首先基于PBEc4构建了用于esgRNA-2×MS2招募的PABEc1(图3a)。使用mGFP报告系统测试PABEc1介导的A>G碱基编辑活性，在该报告系统中非编码链上的A>G的转换使得编码链上的终止密码子TAG转变为CAG(Gln69)，从而产生GFP荧光报告活性。将PABEc1、Ubi-mGFP和mGFP-esgRNA-2×MS2共转化水稻原生质体，22℃培养24h后，使用流式细胞仪检测其GFP荧光活性。结果表明，与PBEc4和esgRNA-2×MS2组合提高C>T活性的特点不同，PABEc1在mGFP报告系统中的A>G活性(1.73％)比人类细胞中常用的构建形式PABE-2(7.03％)低很多(图3b)。由于ecTadA*变体与nCas9之间的linker长度为32个氨基酸时比16个氨基酸的XTEN linker提供更高的效率，因此将PABEc1的XTEN linker替换为32个氨基酸的linker((SGGS) ₂-XTEN-(SGGS) ₂)，构建了PABEc2，以及具有C端MCP的PABEc3(图3a)。在mGFP报告系统中，PABEc2和PABEc3的活性分别为7.23％和8.03％，比PABE-2略高，但仍低于PABE-7和esgRNA组合的效率(14.40％)(图3b)。为了评价一种类似于SAM系统的构建形式对于提高A>G活性的效力，将ecTadA-ecTadA7.10异二聚体融合到PABEc3上nCas9(D10A)的C端，构建了PABEc4(图3a)。然而，在mGFP报告系统中，PABEc4的A>G碱基编辑效率为10.60％，依然低于PABE-7和esgRNA组合(图3b)。该结果暗示，通过优化PABEc的构象来提升其在植物中的A>G碱基编辑活性是有限的。综上，PABEc3构象被用来进一步的多重系统的开发，并尝试利用其它的RNA适配体提升该构象的活性。

将PABEc3C端的MCP替换为PCP、N22p和Com，构建了PABEc5、PABEc6和PABEc7，分别用来识别PP7、boxB和com的RNA发夹结构(图3c)。利用mGFP报告系统测试相应的scRNA和PABEc3、PABEc5、PABEc6或PABEc7。其中，PABEc6和esgRNA-2×boxB组合在报告系统中的A>G活性为26.53％，略高于PABE-7和esgRNA组合的活性(25.57％)(图3d)。在其它类型的RNA适配体中，具有最高报告系统A>G活性的组合依次是：PABEc3和esgRNA-2×MS2+f6、PABEc5和esgRNA-1×PP7-1、PABEc7和esgRNA-2×com，效率分别为18.07％、21.03％、22.47％，均低于PABE-7和esgRNA组合(图3d)。同时，也构建了基于PABEc2构象的载体PABEc8、PABEc9和PABEc10(图9a)，分别在腺嘌呤脱氨酶的N端使用PCP、N22p或Com结合蛋白，但是所有测试的组合在mGFP报告系统中的效率(<21.23％)均低于PABE-2和sgRNA组合(22.87％)(图9b)。与在PBEc中使用在四环和茎环2上含有RNA发夹结构的scRNA一样，PABEc和这些scRNA也介导较低的GFP荧光信号(图3d)。因此，具有3′端RNA发夹结构的scRNA介导C>T和A>G的效率均比具有四环和茎环2上RNA发夹结构的scRNA的效率高。

为了评价PABEc介导的水稻内源基因的A>G碱基编辑效率，使用esgRNA-2×MS2、esgRNA-2×MS2+f6、esgRNA-1×PP7-1、esgRNA-2×boxB和esgRNA-2×com，并分别构建了6个内源靶位点载体，与相应的PABEc共转化水稻原生质体(表1)。PABE-2和sgRNA组合与PABE-7和esgRNA组合作为对照组。在所测试的PABEc和scRNA转化组合中， PABEc6和esgRNA-2×boxB介导最高的A>G碱基编辑效率，在主要的编辑窗口A ₄～A ₈上的效率平均为4.65％，与PABE-2和sgRNA组合的效率相当(平均4.78％)(图3e，图10a)。由于N22p在所测试的结合蛋白中的长度是最短的，为33个氨基酸，推测ecTadA-ecTadA7.10异二聚体的活性不仅受结合蛋白位置影响，也受到结合蛋白的长度影响。同样地，在水稻原生质体中PABEc6和esgRNA-2×boxB组合也具有较高的产物纯度(平均99.76％)(图10b)，其indel值为0.04～0.38％，与未处理对照组一致(0.05～0.40％)，远低于Cas9(10.94～23.84％)(图10c)。因此，选择esgRNA-2×boxB作为多重基因组编辑系统中介导ABE功能的scRNA。

实施例4、基于Cas9切口酶的多重基因组编辑系统

在水稻原生质体中成功地使用scRNA介导的CBE或ABE功能为进一步开发使用nCas9(D10A)平台同时编辑的多重基因组编辑系统奠定了基础。为了利用nCas9(D10A)的功能介导多重基因组编辑，首先基于PBEc4和同时表达的1个esgRNA-2×MS2与一组成对的sgRNA集成了SWISSv1.1，在不同的靶位点同时产生胞嘧啶碱基编辑和成对nCas9介导的DSB(图4a)。共测试了两组sgRNA(表2)，每组的多sgRNA均组装在同一个载体上，并由OsU3或TaU6驱动(图11)。在水稻原生质体中，所测试靶位点的编辑窗口C ₃～C ₉上，C>T的编辑活性为0.33～31.32％，同时在另一靶位点产生的indel效率为1.74～2.52％(图4a)。采用同样的策略，基于PABEc6和esgRNA-2×boxB以及成对的sgRNA，集成了SWISSv1.2(图4b)。在水稻原生质体的两个测试组中，A>G的效率高达2.85％，同时在另一靶位点产生的indel效率高达2.49％(图4b)。此外，NGS测序结果表明，在SWISSv1.1和SWISSv1.2中，成对的nCas9(D10A)产生的indel突变序列读数至少79％为删除(图12)。上述结果表明，scRNA介导的PBE和PABE系统均能使用多sgRNA实现碱基编辑和indel双重功能，证明了在使用PBEc4和PABEc6时，利用成对的nCas9(D10A)能产生indel。

为了测试scRNA介导的碱基编辑在不同靶位点同时产生CBE和ABE双重功能的能力，使用Ubi-1启动子和T2A“自剪切”肽同时表达nCas9(D10A)、MCP-APOBEC1-UGI和ecTadA-ecTadA7.10-N22p，构建了MGE载体(图13a)。由TaU6启动子驱动esgRNA-2×MS2用于C>T编辑，OsU3启动子驱动esgRNA-2×boxB用于A>G编辑(图13b)，与MGE集合成SWISSv2(图4c)。在水稻原生质体中，共测试了两组靶位点(表2)，结果表明，SWISSv2可以在一个靶位点产生C>T(<13.19％)碱基编辑的同时，也可以在另一靶产生位点A>G(<4.27％)碱基编辑。将成对的sgRNA加入到SWISSv2中，成为SWISSv3(图4d)。依然在水稻原生质体中测试了两组靶位点(表2，图13c)。扩增子NGS测序结果表明，SWISSv3作为一个多重综合可编程的基因组编辑系统能够同时在不同的靶位点实现三种功能的编辑：C>T(<11.68％)、A>G(<2.64％)和indel(<2.22％)(图4e)。综上，SWISSv3在植物中的基因叠加和可遗传的修饰上提供了一种可供选择的方案。

表2、用于在水稻原生质体测试SWISSv1.1、SWISSv1.2、SWISSv2和SWISSv3的sgRNA 靶序列

^aPAM基序用粗体和下划线示出。

^b成对的sgRNA根据以下规则设计：(1)以PAM在外的方向；(2)切口位点之间的距离为the40-68bp。

实施例5、水稻植株中的多重编辑

为了验证SWISSv3在水稻植株中的编辑能力，构建了多sgRNA载体靶向OsALS、OsACC和OsBADH2，并与MGE组装进pCAMBIA1300双元载体(图14a)。水稻再生植株中的突变位点使用T7E1和Sanger测序进行检测(图14b)，结果表明，发生CBE、ABE和indel的效率分别为25.45％、16.36％和52.73％(表3)。更重要的是，有4株包含了同时分别在三个不同靶位点产生CBE、ABE和indel的三突突变体，效率为7.27％；高达12.73％的再生植株具有双突；SWISSv3也能够产生三个位点的单突突变体(表4)。综上，SWISSv3使用scRNA可以在植物中作为三重功能的综合可编程的基因组编辑系统，将会有利于作物分子育种。

表3.SWISSv3在T0水稻植物中诱导的突变频率

^a携带观察到的突变的T0品系(水稻)的数量相对于所分析的T0转基因水稻品系总数。 ^b通过在线工具DSDecodeM(参考)和TIDE(参考)分析插入缺失的基因型。.

表4.使用SWISSv3在T0水稻植物中的多重基因组编辑

^aN.A.代表不可用。

实施例6、SWISS系统的脱靶分析

在SWISSv2和SWISSv3中，使用了T2A同时表达多个模块，推测T2A的“自剪切”效率会影响CBE或ABE靶位点的产物纯度(图15a)。如图15a所示，T2A介导的“自剪切”是通过核糖体跳读T2A C端形成的甘氨酸-脯氨酸肽键实现的，T2A的位置会影响多模块同时表达的水平。MGE中，成功的跳读将产生三个独立的目的蛋白，但是跳读失败，就会产生非目的性的融合蛋白，尤其是产生的MCP-APOBEC1-UGI-T2A-ecTadA-ecTadA7.10-N22p融合蛋白，均可以被 esgRNA-2×MS2和esgRNA-2×boxB招募，将会产生ABE靶位点的非目的C碱基编辑或CBE靶位点的非目的A碱基编辑，从而引起非目的性的脱靶。分析SWISSv2和SWISSv3的水稻原生质体的扩增子NGS测序结果，并检查ABE靶位点胞嘧啶编辑和CBE靶位点腺嘌呤编辑的效率。结果表明，两者都存在非目的编辑，C>T和A>G非目的编辑的效率分别低于0.90％和0.19％，但依然比未处理对照组高(C>T,<0.07％；A>G,<0.04％)(图15b)。同时，该结果提示需要采用更高效的共表达多个木块的策略。

使用Cas-OFFinder进一步在全基因组水平上搜索小于或等于3nt错配的潜在脱靶位点，并对这些位点进行测序，结果表明，在所有的潜在脱靶位点上均未发现脱靶现象(表5)。由于SWISS系统中整合了胞嘧啶脱氨酶和腺嘌呤脱氨酶，可能会存在潜在的不可预测的DNA和RNA脱靶，需要采用高效和高特异性的脱氨酶变体来进一步解决这个问题。

表5.分析了三重突变体中OsALS-T2，OsACC-T2，OsBADH2-Indels-sgL和OsBADH2-Indels-sgR的潜在脱靶位点。

^aPAM基序以粗体和下划线示出； ^bN.A.不可用。

使用多sgRNA策略的多重基因组编辑系统可以分为两个方面：一种是在不同的靶位点上进行相同类型的基因组编辑；另外一种是本研究中提出的在不同的靶位点进行不同类型的基因组编辑。到目前为止，本研究开发的SWISS系统能够在植物中使用一种可编程的Cas蛋白介同时导多重不同类型的基因组编辑尚属首次。尽管这种多重编辑可以使用CRISPR/Cas同源蛋白实现，但是多个同源蛋白的载体会更大，不利于基因枪介导的遗传转化，同时对PAM的需求也更严格。而SWISS系统只使用一种nCas9(D10A)，能够减轻上述两个缺点带来的问题，尤其是使用NG PAM的Cas9变体，能够进一步拓展SWISS的编辑范围(图4e，表2)。

在本研究中，使用了RNA聚合酶III型启动子OsU3和TaU6表达多sgRNA，也可以采用其他的多sgRNA策略以进一步优化SWISS系统，例如Csy4RNA核糖核酸酶或核酶产生多sgRNA。scRNA招募的构建的C>T平均活性比PBE的高，且并不伴随更宽的碱基编辑窗口，这种策略可以用来提升窄编辑窗口胞嘧啶变体的编辑活性。尽管scRNA招募的构建的A>G活性仅与PABE-2相当，但其活性足够介导SWISSv3获得水稻A>G突变体。同时，与PBEc构建不一样的是，使用不同的RNA适配体并不能提高PABEc构建的效率，也意味着优化PABEc的空间较为有限，需要开发更高效的腺嘌呤脱氨酶。

当然，双功能的SWISSv1.1和SWISSv1.2系统也可以采用PBE和PABE结合多sgRNA策略来实现，但是，本研究的RNA适配体招募策略提供了另外一种可以选择的方法，尤其是采用nCas9(D10A)过表达植物进行多重基因组编辑，本策略根据优势。因此，未来也可以构建nCas9(D10A)过表达水稻，作为一个开发平台，只需要转化多sgRNA和碱基编辑招募模块，经过二次转化即可实现SWISS的多重编辑功能，同时也可以降低非目的脱靶现象，并有利于作物的分子设计育种。此外，优化第三种scRNA，构建截短的间隔序列(14～15nt)，招募表观修饰因子、基因调控抑制子、激活子或荧光蛋白，便可以实现四重功能的CRISPR系统。SWISS系统还可以采用随机和多sgRNA策略进行植物内源基因的定向进化，以及超出植物的应用，例如改变细胞命运或代谢调控途径。

Claims

一种用于在植物尤其是作物中进行多重编辑的基因组编辑系统，其包含：

i)CRISPR切口酶和/或含有编码所述CRISPR切口酶的核苷酸序列的表达构建体；和

ii)选自以下的一项或多项或全部：

ii-1)靶向所述植物基因组内的第一靶区域的第一scRNA和/或含有编码所述第一scRNA的核苷酸序列的表达构建体，所述第一scRNA包含至少一个第一RNA适配体(aptamer)；以及，第一融合蛋白和/或含有编码所述第一融合蛋白的核苷酸序列的表达构建体，所述第一融合蛋白包含第一RNA适配体特异性结合蛋白和胞嘧啶脱氨结构域；

ii-2)靶向所述植物基因组内的第二靶区域的第二scRNA和/或含有编码所述第二scRNA的核苷酸序列的表达构建体，所述第二scRNA包含至少一个第二RNA适配体；以及，第二融合蛋白和/或含有编码所述第二融合蛋白的核苷酸序列的表达构建体，所述第二融合蛋白包含第二RNA适配体特异性结合蛋白和腺嘌呤脱氨结构域；

ii-3)靶向所述植物基因组内的第三靶区域的成对gRNA和/或含有编码所述成对gRNA的核苷酸序列的表达构建体，所述成对gRNA分别靶向所述第三靶区域DNA的不同链。
权利要求1的系统，其中所述CRISPR切口酶是Ca9切口酶，例如其包含SEQ ID NO:25或48所示的氨基酸序列。
权利要求1或2的系统，所述成对gRNA包含SEQ ID NO:3或SEQ ID NO:4所示核苷酸序列。
权利要求1-3中任一项的系统，所述RNA适配体选自MS2、PP7、boxB和com。
权利要求1-4中任一项的系统，所述RNA适配体特异性结合蛋白选自MCP、PCP、N22p和COM。
权利要求1-5中任一项的系统，所述scRNA包含两个或更多个RNA适配体。
权利要求1-6中任一项的系统，所述scRNA包含SEQ ID NO:5-24之一所述的核苷酸序列。
权利要求1-7中任一项的系统，所述第一scRNA包含SEQ ID NO:13或15所示核苷酸序列。
权利要求8的系统，所述第一RNA适配体特异性结合蛋白包含SEQ ID NO:34所示氨基酸序列。
权利要求1-7中任一项的系统，所述第一scRNA包含SEQ ID NO:24所示核苷酸序列。
权利要求10的系统，所述第一RNA适配体特异性结合蛋白包含SEQ ID NO:37 所示氨基酸序列。
权利要求1-11中任一项的系统，所述第二scRNA包含SEQ ID NO:22所示核苷酸序列。
权利要求12的系统，所述第二RNA适配体特异性结合蛋白包含SEQ ID NO:36所示氨基酸序列。
权利要求1-13中任一项的系统，所述胞嘧啶脱氨酶选自APOBEC1脱氨酶、激活诱导的胞苷脱氨酶(AID)、APOBEC3G、CDA1、人APOBEC3A脱氨酶，或它们的功能性变体。
权利要求14的系统，所述胞嘧啶脱氨酶是APOBEC1脱氨酶或其功能性变体。
权利要求15的系统，所述胞嘧啶脱氨酶包含SEQ ID NO:26-30之一的氨基酸序列。
权利要求1-16中任一项的系统，所述第一RNA适配体特异性结合蛋白位于所述胞嘧啶脱氨结构域的N端。
权利要求1-17中任一项的系统，所述第一RNA适配体特异性结合蛋白与所述胞嘧啶脱氨结构域之间通过接头融合。
权利要求1-18中任一项的系统，所述第一融合蛋白还包含尿嘧啶DNA糖基化酶抑制剂(UGI)，例如，所述UGI包含SEQ ID NO:31所示氨基酸序列。
权利要求1-19中任一项的系统，所述腺嘌呤脱氨结构域包含至少一个DNA依赖型腺嘌呤脱氨酶多肽。
权利要求20的系统，所述DNA依赖型腺嘌呤脱氨酶是大肠杆菌tRNA腺嘌呤脱氨酶TadA(ecTadA)的变体，例如，所述DNA依赖型腺嘌呤脱氨酶包含如SEQ ID NO:33所示的氨基酸序列。
权利要求21的系统，所述腺嘌呤脱氨结构域还包含与所述大肠杆菌tRNA腺嘌呤脱氨酶TadA的DNA依赖型变体融合的对应的野生型大肠杆菌tRNA腺嘌呤脱氨酶TadA，例如，所述野生型大肠杆菌tRNA腺嘌呤脱氨酶TadA包含SEQ ID NO:32所示的氨基酸序列。
权利要求22的系统，所述大肠杆菌tRNA腺嘌呤脱氨酶TadA的DNA依赖型变体融合至对应的野生型大肠杆菌tRNA腺嘌呤脱氨酶TadA的C端，优选地，通过接头融合。
权利要求1-23中任一项的系统，所述第二RNA适配体特异性结合蛋白位于所述腺嘌呤脱氨结构域的C端。
权利要求1-24中任一项的系统，所述第二RNA适配体特异性结合蛋白与所述腺嘌呤脱氨结构域之间通过接头融合。
权利要求1-25中任一项的系统，所述CRISPR切口酶、第一融合蛋白和/或第二融合蛋白还包含核定位序列(NLS)。
权利要求1-26中任一项的系统，所述CRISPR切口酶、第一融合蛋白和/或第二融合蛋白通过“自裂解肽”相互连接。
一种产生经遗传修饰的植物例如作物植物的方法，包括将权利要求1-27中任一项的基因组编辑系统导入所述植物。
权利要求28的方法，其中将所述系统中的i)和ii-1)共同导入植物中，由此实现第一靶位点中C-T编辑。
权利要求28的方法，其中将所述系统中的i)和ii-1)以及ii-2共同导入植物中，由此实现第一靶位点的中C-T编辑，第二靶位点中的A-G编辑。
权利要求28的方法，其中将所述系统中的i)和ii-2)以及ii-3)共同导入植物中，实现第二靶位点中A-G编辑以及第三靶位点的缺失突变。
权利要求28的方法，其中将所述系统中的i)和ii-1)以及ii-3)共同导入植物中，实现第一靶位点中C-T编辑，以及第三靶位点的缺失突变。
权利要求28的方法，其中将所述系统中的i)和ii-1)、ii-2)以及ii-3)共同导入植物中，实现第一靶位点中C-T编辑，第二靶位点中A-G编辑，以及第三靶位点的缺失突变。
权利要求28-33中的方法，其中所述系统中的i)、ii-1)、ii-2)、ii-3)或其组合是同时导入所述植物，例如在同一载体导入植物，或在一次转化中导入植物。
权利要求28的方法所述方法包括：

c)将所述系统的i)导入植物，获得稳定表达所述CRSPR切口酶的转基因植物；

d)将所述系统的ii-1)、ii-2)、ii-3)或其任意组合导入步骤a)获得的转基因植物。
权利要求28-35中任一项的方法，所述植物包括单子叶植物和双子叶植物，例如，所述植物是作物植物，例如小麦、水稻、玉米、大豆、向日葵、高粱、油菜、苜蓿、棉花、大麦、粟、甘蔗、番茄、烟草、木薯或马铃薯。