CN109312317A

CN109312317A - Cpf1内切核酸酶用于植物基因组修饰的用途

Info

Publication number: CN109312317A
Application number: CN201780037422.8A
Authority: CN
Inventors: A.M.希甘; V.德约坎维奇; J.K.杨
Original assignee: EI Du Pont de Nemours and Co
Current assignee: EIDP Inc
Priority date: 2016-06-14
Filing date: 2017-05-31
Publication date: 2019-02-05
Also published as: IL262795A; BR112018076027A2; CA3022854A1; KR20190016970A; EP3469077A1; AU2017286122A1; WO2017218185A1; ZA201807366B; MX2018014993A; US20200332305A1

Abstract

提供了用于以下的组合物和方法：植物或植物细胞的基因组中靶序列的基因组修饰、植物或植物细胞的基因组中核苷酸序列的基因组编辑、和/或将目的多核苷酸插入植物的基因组中或使目的多核苷酸从植物的基因组中缺失。所述方法和组合物采用指导多核苷酸/Cpf1内切核酸酶系统，以提供用于修饰或改变植物、植物细胞或种子的基因组内的靶序列的有效系统。还提供了指导多核苷酸/Cpf1内切核酸酶复合物、指导多核苷酸、植物优化的Cpf1内切核酸酶序列、包含植物优化的Cpf1内切核酸酶基因的重组DNA构建体、及其组合。

Description

CPF1内切核酸酶用于植物基因组修饰的用途

本申请要求美国临时申请号62/349826(2016年6月14日提交)和美国临时申请号62/468013(2017年3月7日提交)的权益，将这二者通过引用以其全文结合在此。

技术领域

本公开涉及植物分子生物学领域，具体涉及指导多核苷酸/Cpf1内切核酸酶系统的组合物以及用于改变植物细胞基因组的组合物和方法。

以电子方式提交的序列表的引用

该序列表的官方副本经由EFS-Web作为ASCII格式的序列表以电子方式提交，文件名为“20170518_7128PCT_ST25.txt”，创建于2017年5月18日，且具有94千字节的大小，并与本说明书同时提交。包括在该ASCII格式的文件中的序列表是本说明书的一部分并且以其全文通过引用并入本文。

背景技术

重组DNA技术使得有可能在靶标基因组位置处插入DNA序列和/或修饰特定内源染色体序列。已经使用了采用位点特异性重组系统的位点特异性整合技术以及其他类型的重组技术来在各种生物体中产生目的基因的靶向插入。基因组编辑技术例如设计师的锌指核酸酶(ZFN)或转录激活子样效应子核酸酶(TALEN)或归巢大范围核酸酶可以用于产生靶向基因组干扰，但这些系统倾向于具有低特异性并且使用需要对每个靶位点进行重新设计的经设计的核酸酶，这使得它们的制备成本高昂且耗时。

尽管已经开发了若干种方法来靶向植物基因组中的特定位点进行修饰，但仍然需要可负担的、易于建立的、可扩展的、并且适于靶向植物基因组中的多个位置的更有效的基因组工程技术。

发明内容

提供了指导多核苷酸/Cpf1内切核酸酶系统和包含此类系统的元件的组合物和方法，此类系统包括但不限于指导多核苷酸/Cpf1内切核酸酶复合物、指导多核苷酸、多核苷酸修饰模板、Cpf1内切核酸酶蛋白、包含植物优化的Cpf1内切核酸酶基因的重组DNA构建体、及其组合。还提供了组合物和方法，其用于植物基因组修饰中的Cpf1内切核酸酶系统。

在一个实施例中，Cpf1内切核酸酶用于植物细胞或植物，其中Cpf1内切核酸酶能够与指导多核苷酸形成复合物，其中在植物细胞或植物中，该复合物可以对靶序列进行识别、结合、并且任选地产生切口或进行切割。

在本公开的一个实施例中，该方法包括：一种用于在植物细胞的基因组中修饰靶序列的方法，该方法包括：a)将以下引入植物细胞：Cpf1内切核酸酶或编码Cpf1内切核酸酶的植物优化的多核苷酸、以及包含与植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸或表达该指导多核苷酸的重组DNA；以及b)在高于28℃的温度下，孵育该植物细胞至少约4hr的时段，其中该指导多核苷酸和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割。

在本公开的一个实施例中，该方法包括：一种用于在植物细胞的基因组中修饰靶序列的方法，该方法包括：a)将以下引入植物细胞：包含与植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸或表达该指导多核苷酸的重组DNA，该植物细胞在其基因组中包含重组DNA构建体，该重组DNA构建体包含有效地连接到编码Cpf1内切核酸酶的植物优化的多核苷酸的启动子；以及b)在高于28℃的温度下，孵育该植物细胞至少约4hr的时段，其中该指导多核苷酸和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割。

在本公开的一个实施例中，该方法包括：一种用于在植物或植物细胞的基因组中修饰靶序列的方法，该方法包括：a)获得在其基因组中包含第一重组DNA构建体和第二重组DNA构建体的植物或植物细胞，该第一重组DNA构建体包含有效地连接到编码Cpf1内切核酸酶的植物优化的多核苷酸的启动子，该第二重组DNA构建体包含有效地连接到编码指导RNA的核苷酸序列的启动子，其中该指导RNA和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割；以及b)在高于28℃的温度下，孵育该植物或植物细胞至少约4hr的时段，其中该指导RNA和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割。

该方法可以进一步包括鉴定至少一种在该靶序列处具有修饰的植物细胞、植物或子代植物，其中在靶序列处的修饰选自由以下组成的组：(i)至少一个核苷酸的替代、(ii)至少一个核苷酸的缺失、(iii)至少一个核苷酸的插入、和(iv)(i)-(iii)的任何组合。该方法可以进一步提供供体DNA到植物细胞中，其中该供体DNA包含目的多核苷酸。这可以产生具有可检测的靶向基因组修饰的植物细胞或植物。

在本公开的一个实施例中，该方法包括：一种用于在植物细胞的基因组中编辑核苷酸序列的方法，该方法包括：a)将以下引入植物细胞：Cpf1内切核酸酶或编码Cpf1内切核酸酶的植物优化的多核苷酸、包含与植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸或表达该指导多核苷酸的重组DNA、以及多核苷酸修饰模板，其中该多核苷酸修饰模板包含核苷酸序列的至少一个核苷酸修饰；以及b)在高于28℃的温度下，孵育该植物细胞至少约4hr的时段，其中该指导多核苷酸和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列的全部或一部分进行识别、结合、并且任选地产生切口或进行切割。

可以在高于28℃的温度下孵育该植物细胞、植物或子代植物。可以在植物细胞、植物胚和/或植物的任何发育阶段，将植物细胞暴露于高于28℃的温度。还可以将包含Cpf1内切核酸酶(或表达该Cpf1内切核酸酶的重组构建体)和指导RNA(和/或表达该指导RNA的重组构建体)的植物的子代暴露于高于28℃的温度，由此激活子代植物内的指导RNA/Cpf1复合物(在发育期间的希望的阶段)，这允许子代植物在由该指导RNA/Cpf1内切核酸酶复合物识别的特定靶位点处被修饰。

在本公开的一个实施例中，该重组DNA构建体是包含有效地连接到编码Cpf1内切核酸酶的植物优化的核苷酸序列的启动子的重组DNA构建体。

在本公开的一个实施例中，该方法包括：一种在植物细胞的基因组中同时修饰多个靶序列的方法，该方法包括：a)将以下引入植物细胞：Cpf1内切核酸酶蛋白、或编码Cpf1内切核酸酶的植物优化的多核苷酸、以及能够表达被加工成许多单指导RNA的单前体RNA的前体指导RNA转录盒，其中每个单指导RNA包含与植物基因组中的单靶序列基本上互补的在原型间隔子邻近基序(PAM)的3’的可变靶向结构域；以及b)在高于28℃的温度下，孵育(a)的植物细胞至少约4hr的时段，其中单指导RNA和Cpf1内切核酸酶蛋白中的每一个能够形成核糖核苷酸复合物，该复合物可以对靶序列进行识别、结合、并且任选地产生切口或进行切割。多个靶序列可以由至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个靶序列、高至100个靶序列组成。

在本公开的一个实施例中，该试剂盒是用于对植物细胞或植物中的靶序列进行结合、切割或产生切口的试剂盒，该试剂盒包含特异性针对靶序列的指导DNA、以及编码Cpf1内切核酸酶的植物优化的核苷酸序列，其中该指导DNA能够形成指导DNA/Cpf1内切核酸酶复合物，其中该复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割。

在本公开的一个实施例中，该方法是：一种用于在植物细胞的基因组中修饰DNA靶序列的方法，该方法包括：a)将以下引入植物细胞：Cpf1内切核酸酶、以及能够与Cpf1内切核酸酶形成复合物的指导多核苷酸、包含与植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸；以及b)引入多核苷酸修饰模板，该多核苷酸修饰模板包含对应于与由Cpf1复合物识别的PAM序列邻近的DNA靶序列的至少一个区域，其中对应于DNA靶序列的至少一个区域与PAM序列的3’侧+1至+19的位置的DNA靶序列相比包含至少一个核苷酸错配。该方法可以进一步包括在高于28℃的温度下，孵育该植物细胞至少约4hr的时段，和/或其中该Cpf1复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割。

在本公开的一个实施例中，该多核苷酸修饰模板是以下多核苷酸修饰模板：该多核苷酸修饰模板包含与DNA靶序列互补的至少一个区域，该DNA靶序列与由Cpf1复合物识别的PAM序列邻近，其中对应于DNA靶序列的至少一个区域与PAM序列的3’侧+1至+19的位置的DNA靶序列相比包含至少一个核苷酸错配。该多核苷酸修饰模板可以进一步在对应于PAM序列的3’侧+20至+24的位置的靶DNA序列的区域中包含修饰。

还提供的是通过本文描述的方法产生的具修饰的靶序列或具有植物的基因组中的核苷酸序列处的修饰的核酸构建体、植物、植物细胞、外植体、种子和谷粒。在本文中示出了本披露的这些方法和组合物的另外的实施例。

附图和序列表的说明

根据下列的详细描述和附图以及序列表，可以更全面地理解本公开，所述详细描述和附图以及序列表形成本申请的一部分。这些序列描述以及所附序列表遵守如37C.F.R.§§1.821-1.825所列出的管理专利申请中核苷酸和氨基酸序列公开内容的规则。这些序列描述包含如在37 C.F.R.§§1.821-1.825中所定义的用于氨基酸的三字母代码，将其通过引用结合在此。

附图

图1描绘了表达盒，该表达盒包含编码Cpf1内切核酸酶蛋白的玉蜀黍优化的Cpf1内切核酸酶基因(玉蜀黍优化的Cpf1 ORF)。组分包括有效地连接到泛素5’非翻译区(5’UTR)的启动子(例如像泛素启动子)、泛素内含子1和玉蜀黍密码子优化的Cpf1开放阅读框(ORF)、ST-LS1内含子-2，3’或C-末端SV40核定位信号(NLS)、和终止子。

图2描绘了表达盒，该表达盒包含有效地连接到编码指导多核苷酸(包含Cpf1识别结构域和Cpf1可变靶向结构域)的DNA序列的玉蜀黍小RNA转录起始序列(玉蜀黍U6聚合酶III启动子)，该指导多核苷酸可以与Cpf1内切核酸酶形成功能复合物，该内切核酸酶能够对单链或双链的靶位点进行结合、产生切口或进行切割。组分包括有效地连接到用来起始转录的G核苷酸的玉蜀黍U6聚合酶III启动子、编码可以由Cpf1识别的序列(Cpf1识别结构域)的5’约20个核苷酸(nt)、指导Cpf1切割活性的约23nt序列(Cpf1可变靶向结构域)、和终止子。

图3描绘了表达盒，该表达盒包含有效地连接到编码玉蜀黍优化的Cpf1内切核酸酶的DNA序列的BSV启动子和终止子。组分包括BSV启动子、HPLV9内含子1、玉蜀黍优化的Cpf1开放阅读框(ORF)、ST-LS1内含子2、C-末端SV40核定位信号(NLS)和终止子。

图4描绘了表达盒，该表达盒包含有效地连接到编码玉蜀黍优化的Cpf1内切核酸酶的DNA序列的PLTP启动子和终止子。组分包括PLTP启动子、PLTP 5’UTR、ST-LS1内含子-2、玉蜀黍优化的Cpf1开放阅读框(ORF)、C-末端SV40核定位信号(NLS)和终止子。

图5A-5B说明了可以由Cpf1内切核酸酶(图5A)或Cas内切核酸酶(图5B)切割的DNA靶位点。图5A说明了用于Cpf1内切核酸酶的DNA靶位点。正义(5’至3’上链)和反义(5’至3’下链)DNA链按黑色显示，并且指示了Cpf1 DNA靶位点的区域，包括PAM(原型间隔子邻近基序)和DNA靶位点区域(+1至+23)，该DNA靶位点区域与Cpf1指导RNA的可变靶向结构域(深灰色和浅灰色线)碱基配对。深灰色线描绘了表现出对错配低耐受性的Cpf1指导RNA的区域，而浅灰色线显示了具有对错配的高耐受性的区域(在PAM的3’侧的位置+20至+23)。用三角形指示了Cpf1 DNA切割位点。图5B说明了Cas9内切核酸酶的DNA靶位点。正义(5’至3’上链)和反义(5’至3’下链)DNA链按黑色显示，并且指示了Cas9 DNA靶位点的区域，包括PAM(原型间隔子邻近基序)和DNA靶位点区域(+1至+20)，该DNA靶位点区域与Cas9指导RNA的可变靶向结构域(深灰色和浅灰色线)碱基配对。深灰色线描绘了表现出对错配低耐受性的Cas9指导RNA的区域，而浅灰色线显示了具有对错配的更高耐受性的区域(在PAM的5’的位置～+10至+20)。用三角形指示了Cas9DNA切割位点。

图6描绘了表达盒，该表达盒包含有效地连接到编码指导多核苷酸的DNA序列的玉蜀黍小RNA转录起始序列(玉蜀黍U6聚合酶III启动子)，该指导多核苷酸可以与Cpf1内切核酸酶形成功能复合物，该内切核酸酶能够对单链或双链的靶位点进行结合、产生切口或进行切割。组分包括玉蜀黍U6聚合酶III启动子、Cpf1 CRISPR重复序列、AsMs26-1靶向结构域、AsLIGULELESS-1靶向结构域、AsMs45-1靶向结构域、和终止子。

图7描绘了表达盒，该表达盒包含有效地连接到编码指导多核苷酸的DNA序列的Pol-II启动子(泛素启动子)，该指导多核苷酸可以与Cpf1内切核酸酶形成功能复合物，该内切核酸酶能够对单链或双链的靶位点进行结合、产生切口或进行切割。组分包括泛素Pol-II启动子、泛素5’UTR、泛素内含子-1、Cpf1 CRISPR重复序列、AsMs26-1靶向结构域、AsLIGULELESS-1靶向结构域、AsMs45-1靶向结构域、和终止子。

图8描绘了杂合DNA-RNA指导多核苷酸(hDRNA)的一个实例，其包含Cpf1识别结构域中的至少一个DNA核苷酸(灰点)和/或可变靶向结构域中的至少一个DNA核苷酸(灰点)。

序列

表1.核酸和蛋白质SEQ ID号的汇总

具体实施方式

提供了指导多核苷酸/Cpf1内切核酸酶系统和包含的此类系统的元件的组合物和方法，其用于在植物基因组修饰中使用。公开了用于在植物细胞或植物的基因组中修饰靶核苷酸序列的方法。本公开还描述了用于编辑植物细胞的基因组中的核苷酸序列、用于靶向诱变、以及用于将目的多核苷酸插入植物细胞的基因组中的方法。

本文的术语“Cas基因”是指通常与侧翼CRISPR基因座联接的、相关的、或接近的、或邻近的一个或多个基因。术语“Cas基因”、“CRISPR相关(Cas)基因”和“成簇的规律间隔的短回文重复序列相关基因”在本文中可互换使用。

CRISPR(成簇的规律间隔的短回文重复序列)基因座是指DNA切割系统的某些遗传基因座编码组分，例如被细菌和古细胞用来破坏外源DNA(Horvath和Barrangou，2010，Science[科学]327：167-170；2007年3月1日公开的WO2007/025097)的那些。CRISPR基因座可以由CRISPR阵列组成，包含由短的可变DNA序列(称为‘间隔子’)分开的短的正向重复序列(CRISPR重复序列)，其可以侧翼是不同Cas(CRISPR相关的重复序列)基因。在给定的CRISPR基因座处的CRISPR相关基因数目在物种之间可以不同。已经描述了包括具有多亚基效应子复合物(包括I型、III型和IV型亚型)的1类系统和具有单一蛋白质效应子(包括II型和V型亚型，例如但不限于Cas9、Cpf1、C2c1、C2c2、C2c3)的2类系统的多重CRISPR/Cas系统。1类系统(Makarova等人，2015，Nature Reviews[自然评论]；Microbiology[生物学]卷13：1-15；Zetsche等人，2015，Cell[细胞]163，1-13；Shmakov等人，2015，Molecular_Cell[分子细胞]60，1-13；Haft等人，2005，Computational Biology[计算生物学]，PLoS Comput Biol[科学公共图书馆计算生物学]1(6)：e60.doi：10.1371/journal.pcbi.0010060和2013年11月23日公开的WO 2013/176772 A1，并将其通过引用结合在此)。来自细菌的II型CRISPR/Cas系统使用crRNA(CRISPR RNA)和tracrRNA(反式激活CRISPR RNA)来将Cas内切核酸酶指导到其DNA靶标上。该crRNA包含与双链DNA靶标的一条链互补的间隔子区域和与tracrRNA(反式激活CRISPR RNA)碱基配对的区域，该tracrRNA形成指导Cas内切核酸酶切割DNA靶标的RNA双链体。通过未完全理解的涉及Cas1和Cas2蛋白的过程获得间隔子。除cas9基因之外，所有的II型CRISPR/Cas基因座包含cas1和cas2基因(Chylinski et al.，2013，RNABiology[RNA生物学]10：726-737；Makarova等人2015，Nature Reviews Microbiology[自然评论-微生物]第13卷：1-15)。II型CRISPR-Cas基因座可以编码tracrRNA，该tracrRNA与重复序列在对应的CRISPR阵列内部分互补，并且可以包含其他蛋白质(如Csn1和Csn2)。在Cas 1和cas2基因附近cas9的存在是II型基因座的标志(Makarova等人.2015，NatureReviews Microbiology[微生物自然综述]第13卷：1-15)。

中术语“Cas蛋白”是指由Cas(CRISPR-associated)基因编码的蛋白质。Cas蛋白包括Cas9蛋白、Cpf1蛋白、C2c1蛋白、C2c2蛋白、C2c3蛋白、Cas3、Cas3-HD、Cas5、Cas7、Cas8、Cas10或这些的组合或复合物(Makarova等人，2015，Nature Reviews Microbiology[自然评论微生物学]卷13：1-15)。

Cas蛋白包括Cas内切核酸酶。当与适合的多核苷酸组分复合时，Cas内切核酸酶能够对特定DNA靶序列的全部或一部分进行识别、结合、并且任选地产生切口或进行切割。Cas内切核酸酶包含一个或多个核酸酶结构域。

本文中的“Cas9”(以前称为Cas5、Csn1、或Csx12)是指当与适合的多核苷酸组分(例如cr核苷酸和tracr核苷酸、或单指导多核苷酸)复合时，能够对DNA靶序列的全部或一部分进行识别、结合、并且任选地产生切口或进行切割的Cas内切核酸酶。Cas9蛋白包含RuvC核酸酶结构域和HNH(H-N-H)核酸酶结构域，它们各自可以在靶序列处切割单DNA链(两个结构域的协同作用导致DNA双链切割，而一个结构域的活性导致一个切口)。通常，RuvC结构域包含亚结构域I、II和III，其中结构域I位于Cas9的N-末端附近，并且亚结构域II和III位于蛋白质的中间，即位于HNH结构域的侧翼(Hsu等人，2013，Cell[细胞]，157：1262-1278)。Cas9内切核酸酶通常来源于II型CRISPR系统，该系统包括利用与至少一种多核苷酸组分复合的Cas9内切核酸酶的DNA切割系统。例如，Cas9可以与CRISPR RNA(crRNA)和反式激活CRISPR RNA(tracrRNA)复合。在另一个实例中，Cas9可以与单指导RNA复合(Makarova等人，2015，Nature Reviews Microbiology[自然评论微生物学]卷13：1-15)。

如本文使用的“Cpf1”是指2类V型系统的Cas内切核酸酶，其包含RuvC样核酸酶结构域和推定的第二核酸酶结构域，这二者协作切割双链DNA(Yamane等人，2016，Cell[细胞]165：949-962)。不存在明显的反式作用RNA(tracrRNA)是Cpf1内切核酸酶系统的另一个特征要素，因为Cpf1仅需要cr核苷酸来形成能够切割DNA靶序列的多核苷酸指导的内切核酸酶(PGEN)复合物。由Cpf1对靶序列的切割远离PAM(在crRNA非互补链上去除约19个碱基对)并且产生具有大约4个核苷酸的5’突出的双链断裂。(Zetsche等人，2015，Cell[细胞]163，1-13；Fagerlund等人，2015，Genome Biology[基因组生物学]16：251-253)。在一个方面，Cpf1内切核酸酶是氨基酸球菌属物种BV3L6 Cpf1内切核酸酶。(Zetsche等人，2015，Cell[细胞]163，1-13；Fagerlund等人，2015，Genome Biology[基因组生物学]16：251-253；Yamane等人，2016，Cell[细胞]165：949-962)。

本文中的术语“Cpf1基因”是指编码Cpf1内切核酸酶的基因。

意外地，如本文描述，当与指导多核苷酸复合时(例如指导多核苷酸/Cpf1内切核酸酶复合物)，可以用温度调节Cpf1内切核酸酶活性。与28℃下或低于该温度下的活性相比，高于28℃的温度导致增加的Cpf1切割活性。此意外的温度敏感性可以允许Cpf1内切核酸酶的受调节的激活并且因此，允许指导RNA/Cpf1内切核酸酶复合物的受调节的活性。使指导RNA/Cpf1内切核酸酶复合物(或包含该复合物的宿主细胞)暴露于升高的温度允许增加频率的靶位点诱变，这指示通过Cpf1蛋白的增加频率的切割活性。此外，本文描述了靶位点诱变中的这一增加的频率独立于用来驱动Cpf1表达的启动子(Pol-II)。

出于植物基因组和基因操纵的目的，本文描述的指导多核苷酸/Cpf1内切核酸酶系统和方法可以用于靶向植物细胞中的DNA以切割，并且可以用作对植物基因组DNA(包括染色体DNA、线粒体DNA、质体DNA)进行结合、产生切口或进行切割的工具。可以通过在高于28℃的温度，例如但不限于至少29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃或45℃高至50℃，或高至并且包括导致Cpf1内切核酸酶具有功能性的任何温度的温度下，孵育指导多核苷酸/Cpf1内切核酸酶复合物(或包含该指导多核苷酸/Cpf1内切核酸酶复合物的宿主细胞)，获得植物细胞中Cpf1内切核酸酶的最佳活性。在高于28℃的这些温度下的孵育时间可以持续至少约10min、20min、30min、40min、50min、1hr、2hr、3hr、4hr、5hr、6hr、7hr、8hr、9hr、10hr、11hr、12hr、13hr、14hr、15hr、16hr、17hr、18hr、19hr、20hr、21hr、22hr、23hr、24hr、25hr、26hr、27hr、28hr、29hr、30hr、31hr、32hr、33hr、34hr、35hr、36hr、37hr、38hr、39hr、40hr、41hr、42hr、43hr、44hr、45hr、46hr、47hr、48hr到至少3、4、5、6、7天、到至少1、2、3、4、5周、到至少1、2、3个月、高至生物体的完整寿命的时段。

可以通过在29℃和30℃之间、29℃和35℃之间、29℃和40℃之间、29℃和45℃之间、29℃和50℃之间、30℃和35℃之间、35℃和40℃之间、40℃和45℃和45℃和50℃之间的温度下，孵育指导多核苷酸/Cpf1内切核酸酶复合物(或包含该指导多核苷酸/Cpf1内切核酸酶复合物的宿主细胞)，获得植物细胞中Cpf1内切核酸酶的最佳活性。

在一些实施例中，可以通过将指导多核苷酸/Cpf1内切核酸酶复合物，或包含此类复合物的宿主细胞的温度环境从低于或等于28℃的温度(范围是从20℃、21℃、22℃、23℃、24℃、25℃、26℃、26高至28℃，其中Cpf1内切核酸酶几乎无活性的温度状况)升高到至少29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃或45℃，或高至50℃，或高至并且包括导致Cpf1内切核酸酶具有功能性的任何温度的温度下，激活Cpf1内切核酸酶活性。指导多核苷酸/Cpf1内切核酸酶复合物、或包含此类复合物的宿主细胞所暴露的升温时段可以持续至少约10min、20min、30min、40min、50min、1hr、2hr、3hr、4hr、5hr、6hr、7hr、8hr、9hr、10hr、11hr、12hr、13hr、14hr、15hr、16hr、17hr、18hr，19hr、20hr、21hr、22hr、23hr、24hr、25hr、26hr、27hr、28hr、29hr、30hr、31hr、32hr、33hr、34hr、35hr、36hr、37hr、38hr、39hr、40hr、41hr、42hr、43hr、44hr、45hr、46hr、47hr、48hr、3天、4天、5天、6天、7天、到至少1、2、3、4、5周、或到至少多个月、多至3个月，或高至并且包括导致Cpf1内切核酸酶具有功能性的任何时间段的时段。指导多核苷酸/Cpf1内切核酸酶活性的瞬时诱导(例如但不限于使包含Cpf1内切核酸酶的植物细胞暴露于高于28℃的温度下)，可以是在植物细胞、植物胚和/或植物的任何发育阶段，并且可以在任何植物细胞类型(包括花粉)中诱导。还可以将包含Cpf1内切核酸酶(或表达该Cpf1内切核酸酶的重组构建体)和指导RNA(和/或表达该指导RNA的重组构建体)的植物的子代暴露于升高的温度(高于28℃并且高至50℃)，由此激活子代植物内的指导RNA/Cpf1复合物(在发育期间的希望的阶段)，这允许子代植物在由该指导RNA/Cpf1内切核酸酶复合物识别的特定靶位点处被修饰。例如，在植物细胞的减数分裂期间，指导多核苷酸/Cpf1内切核酸酶系统的瞬时诱导可以增加仅在减数分裂期间可及的基因组区域(例如已知具有低重组频率的区域或着丝点区域)中的DNA切割的变化，同时将在其他植物细胞发育阶段期间的活性最小化或消除。

本文描述的调节型(温度可诱导的)指导RNA/Cpf1系统在核酸酶脱靶切割会对靶细胞有毒性或另外不希望的情况下，对于基因组工程(例如在植物的基因组工程中)是尤其有用的。Cpf1内切核酸酶活性的瞬时诱导允许脱靶切割的减少，因为Cpf1内切核酸酶将在升高的温度处理(高于28℃并且高至50℃)期间最有效地切割DNA，并且在植物细胞或Cpf1环境的温度降回低于29℃时无活性或活性最小。在一个方面，脱靶切割的减少可以是至少5％、10％、20％、30％、40％、50％、60％、70％、80％、90％、99％、5-10％、10-20％、20-30％、30-40％、40-50％、50-60％、60-70％、70-80％、80-90％、90-99％高至100％。可以通过本领域已知的任何方法测量百分比(％)脱靶切割，例如但不限于Koo等人，Molecules andCells[分子和细胞]2015，38(6)：475-481和Cho等人，Genome Res[基因组研究]2014，24(1)：132-141。

在一些实施例中，本公开提供了用于使用Cpf1系统，减少脱靶修饰的方法，包括：使具有靶序列的靶核酸分子与以下接触：包含可变靶向结构域的单指导多核苷酸，该可变靶向结构域包含脱氧核糖核酸(DNA)并且被配置成与核酸中的靶序列杂交；与包含核糖核酸(RNA)的可变靶向结构域邻近的Cpf1识别结构域；以及Cpf1多肽，其中单指导多核苷酸与Cpf1形成复合物，并且其中与靶核酸中的其他序列相比，更优先地在靶序列处切割或编辑靶核酸分子，由此减少脱靶修饰。在一些实施例中，靶核酸是DNA，在一些实施例中，靶核酸是RNA，在一些实施例中，靶核酸是RNA和DNA的混合物。在一些实施例中，Cpf1识别结构域在靶区域的下游。在一些实施例中，Cpf1识别结构域在靶区域的上游。在一些实施例中，Cpf1识别结构域包含选自由以下组成的组的结构：下部茎、环、上部茎、发夹，或其任何组合。在一些实施例中，Cpf1识别结构域包含茎环结构。在一些实施例中，Cpf1识别结构域与Cpf1多肽相互作用。在一些实施例中，Cpf1识别结构域包含DNA和RNA的混合物。在一些实施例中，可变靶向结构域包含DNA和RNA的混合物。在一些实施例中，可变靶向结构域并不包含尿嘧啶。

本文描述的Cpf1内切核酸酶可以用于靶向的基因组编辑(经由单和多个双链断裂和缺口)和靶向的基因组调控(经由将表观遗传效应子结构域系链到Cpf1蛋白或单指导RNA(sgRNA))。Cpf1内切核酸酶还可以被工程化作为RNA指导的重组酶起作用，并且经由RNA系链可以充当用于组装多蛋白和核酸复合物的支架(Mali等人，2013 Nature Methods[自然方法]第10卷：957-963)。

本文的Cpf1蛋白可以包含一个或多个异源核定位序列(NLS)。例如，本文中的异源NLS氨基酸序列可能具有足够的强度来驱动本文的真核细胞(例如植物细胞)的细胞核中可检测的量的蛋白的积累。NLS可以包含碱性、带正电荷的残基(例如赖氨酸和/或精氨酸)的一个(单分型)或多个(例如，二分型)短序列(例如，2至20个残基)，并且可以位于Cpf1氨基酸序列中的任何地方，但这样使得其暴露于蛋白质表面上。例如，NLS可以有效地连接到本文中的Cpf1蛋白的N-末端或C-末端。两个或更多个NLS序列可以连接到Cpf1蛋白，例如在Cpf1蛋白的N-末端和C-末端两者。Cpf1内切核酸酶基因可以有效地连接到Cpf1密码子区域上游的SV40核靶向信号和Cpf1密码子区域下游的二分型VirD2核定位信号(Tinland等人，(1992)Proc.Natl.Acad.Sci.USA[美国科学院院报]89：7442-6)。本文中适合的NLS序列的非限制性实例包括在美国专利号6660830和7309576中公开的那些，其都通过引用结合在此。

本文的术语“植物优化的Cpf1内切核酸酶”是指由已经针对在植物细胞或植物中表达进行优化的核苷酸序列编码的Cpf1蛋白。

“编码Cpf1内切核酸酶的植物优化的核苷酸序列”、“编码Cpf1内切核酸酶的植物优化的构建体”和“编码Cpf1的植物优化的多核苷酸”在本文中可互换使用，并且是指编码Cpf1内切核酸酶蛋白、或其变体或功能片段的核苷酸序列，已经针对在植物细胞或植物中表达对其进行优化。包含植物优化的Cpf1内切核酸酶的植物包括：包含编码Cpf1序列的核苷酸序列的植物，和/或包含Cpf1内切核酸酶蛋白的植物。在一个方面，当与对其进行优化的野生型序列相比时，植物优化的Cpf1内切核酸酶核苷酸序列导致增加的Cpf1蛋白表达。在一个方面，编码Cpf1内切核酸酶的植物优化的核苷酸序列是玉蜀黍优化的、卡诺拉油菜优化的、向日葵优化的、水稻优化的、小麦优化的、或大豆优化的Cpf1内切核酸酶。在一个方面，植物优化的核苷酸序列编码SEQ ID NO：10或SEQ ID NO：11的蛋白、或其功能片段。植物优化的核苷酸序列包括密码子优化的基因。可以使用一个或多个植物偏好的密码子来提高表达，通过修饰编码蛋白质(例如像，如本文公开的Cpf1内切核酸酶)的核苷酸序列，来合成植物优化的核苷酸序列。有关宿主偏好性密码子使用的讨论，参见例如Campbell和Gowri(1990)Plant Physiol.[植物生理学]92：1-11。

任何Cpf1蛋白(或编码Cpf1蛋白的任何DNA序列)都可以用于本文描述的方法，并且包括但不限于SEQ ID NO：10、11、32或33的Cpf1蛋白、或SEQ ID NO：10、11、32或33的功能变体、或SEQ ID NO：10、11、32或33的功能片段。用于在本文提供的组合物和方法中使用的其他Cpf1蛋白包括例如在美国专利公开号2016/0208243中描述的那些。

术语Cpf1内切核酸酶的“功能片段”、“功能上等效的片段”和“功能等效片段”在本文中可互换使用，并且是指Cpf1内切核酸酶蛋白序列的一部分或子序列，其中保留了对靶位点进行识别、结合、并且任选地产生切口或进行切割(引入单链或双链断裂)的能力。

术语Cpf1内切核酸酶的“功能变体”、“功能上等效的变体”和“功能等效变体”在本文中可互换使用，并且是指Cpf1内切核酸酶蛋白序列的变体，其中保留了对靶位点进行识别、结合、并且任选地产生切口或进行切割(引入单链或双链断裂)的能力。这些片段和变体可以经由例如定点诱变和合成构建等方法来获得。

Cpf1内切核酸酶的功能片段包括以下片段，这些片段包含参比Cpf1蛋白，例如SEQID NO：10或11的本公开的参比Cpf1内切核酸酶的50-100、100-200、100-300、100-400、100-500、100-600、100-700、100-800、100-900、100-1000、200-300、200-400、200-500、200-600、200-700、200-800、200-900、200-1000、300-400、300-500、300-600、300-700、300-800、300-900、300-1000、400-500、400-600、400-700、400-800、400-900、400-1000、500-600、500-700、500-800、500-900、500-1000、600-700、600-800、600-900、600-1000、700-800、700-900、700-1000、800-900、800-1000、900-1000、1000-1100、1100-1200或1200-1300个氨基酸。

Cpf1内切核酸酶的功能片段包括以下蛋白，这些蛋白包含选自由以下组成的组的至少一个结构域：指导多核苷酸结合结构域(可以与指导RNA结合或杂交的氨基酸结构域)、crRNA结合结构域(可以与crRNA结合或杂交的氨基酸结构域)、DNA结合结构域(可以与DNA靶序列结合的氨基酸结构域)、DNA切割结构域(可以切割DNA靶序列的氨基酸结构域)，及其任何组合。

用于在公开的方法中使用的Cpf1蛋白、或其功能片段可以分离自重组来源，其中遗传修饰的宿主细胞(例如昆虫细胞或酵母细胞或人类来源的细胞系)被修饰来表达编码Cpf1蛋白的核酸序列。可替代地，Cpf1蛋白可以是使用无细胞蛋白表达系统产生的，或是合成产生的。

Cpf1内切核酸酶的功能变体可以包括Cpf1多肽的修饰形式。Cpf1多肽的修饰形式可以包括降低Cpf1蛋白的天然存在的核酸酶活性的氨基酸变化(例如，缺失、插入、或取代)。例如，在一些情况下，Cpf1蛋白的修饰形式具有低于50％、低于40％、低于30％、低于20％、低于10％、低于5％、或低于1％的相应的野生型Cpf1多肽的核酸酶活性。在一些情况下，Cpf1多肽的修饰形式不具有实质性的核酸酶活性并且被称作催化“失活的Cpf1”或“失活的Cpf1(dCpf1)”。

可以使用Cpf1蛋白序列的功能变体，但是当与本文的RNA组分缔和时，它们应当具有针对DNA的特异性结合活性，并任选地具有内切核酸酶活性。这样的功能变体可以包含与参比Cpf1的氨基酸序列具有至少约20％、30％、40％、50％、60％、70％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％同一性的氨基酸序列。当与本文中的RNA组分缔合时，这样的变体Cpf1蛋白应当具有针对DNA的特异性结合活性，以及任选地切割或切口活性。

本文描述的指导多核苷酸Cpf1系统的温度诱导可以用于调节Cpf1内切核酸酶的切割活性。在一个方面，这可以提供来自质粒DNA表达盒的Cpf1内切核酸酶活性的瞬时脉冲，这将减小脱靶切割活性的潜力。另外，来自质粒DNA表达盒的指导RNA/Cpf1活性的温度诱导可以用于在其已经引入细胞后很久，对希望的细胞的、组织的培养物或植物发育阶段的时间切割活性。本文描述的指导多核苷酸Cpf1系统还可以与可诱导的(例如热休克、化学的或细胞的周期)或组织特异性的启动子组合，从而提供对Cpf1内切核酸酶活性的另外的控制。

Cpf1内切核酸酶片段和变体可以经由例如定点诱变和合成构建等方法来获得。

用于确定本公开的Cpf1内切核酸酶的片段和/或变体是否是功能性的方法包括测量当与适合的多核苷酸复合时片段或变体的内切核酸酶活性的方法。测量内切核酸酶活性的方法是本领域熟知的，例如但不限于2013年5月1日提交的PCT/US13/39011、2016年5月12日提交的PCT/US16/32073、2016年5月12日提交的PCT/US16/32028，将其通过引用结合在此。用于测量Cpf1内切核酸酶活性的方法包括测量在已经发生双链断裂后在靶位点处的突变频率的方法。

用于测量Cpf1内切核酸酶活性的方法包括测量在已经发生双链断裂后在靶位点处的突变频率的方法。用于测量本公开的Cpf1内切核酸酶的功能片段或功能变体是否可以制造双链断裂的方法包括以下方法：简言之，可以选择适当的CRISPR-Cpf1玉蜀黍基因组DNA靶位点，可以构建指导RNA转录盒(表达指导RNA的重组DNA)和表达本公开的Cpf1内切核酸酶(或本公开的Cpf1内切核酸酶的功能片段、或本公开内切核酸酶的Cpf1内切核酸酶变体的功能变体)的DNA重组构建体，并且可以在BBM和WUS2基因存在下，通过生物射弹转化将其共递送到Hi-II型10日龄未成熟玉蜀黍胚(IME)中，如在Svitashev等人(2015)中描述。还可以将编码黄色荧光蛋白的可视标记DNA表达盒与指导RNA转录盒和Cpf1内切核酸酶表达盒(重组DNA构建体)一起共递送，从而有助于均匀转化的IME的选择。2天后，可以基于其荧光，收获20-30个最均匀转化的IME。提取总基因组DNA，并且用高保真PCR预混合物(新英格兰生物实验室(New England Biolabs)，M0531L)，添加对于扩增子-特异性条形码和Illumnia测序必要的序列，对预期靶位点周围的DNA区域进行PCR扩增，并且深度测序。然后通过与其中从转化中省略指导RNA转录盒的对照实验相比，检测所得的读数在预期切割位点处是否存在突变。如果在使用与适合的指导多核苷酸复合的本公开的Cpf1内切核酸酶的片段或变体时，在预期靶位点处观察到突变，则这些片段或变体是功能性的。

用于测量本公开的Cpf1内切核酸酶的功能片段或功能变体是否可以在双链DNA靶位点处制造单链断裂(也称为切口；因此充当切口酶)的方法包括以下方法：在植物细胞，例如玉蜀黍中，典型地可以无缝地修复双链DNA靶中染色体单链断裂(SSB)的细胞修复。因此，为了检测Cpf1的功能Cpf1片段或功能变体的切口活性，可以靶向紧邻(0-200bp)的两个染色体DNA靶位点(各自靶向不同的链(正义和反义DNA链))。如果存在SSB活性，则来自全部两个靶位点的SSB活性将导致DNA双链断裂(DSB)(该断裂将导致玉蜀黍细胞中插入或缺失(插入缺失)诱变的产生)。然后可以将此结果用于检测并且监测Cpf1切口酶的活性，类似于Karvelis等人(2015)中描述。简言之，选择适当的CRISPR-Cpf1玉蜀黍基因组DNA靶位点，构建指导RNA转录盒和功能片段Cpf1切口表达盒，并且在BBM和WUS2基因存在下，通过生物射弹转化将其共递送到Hi-II型10日龄未成熟玉蜀黍胚(IME)中，如在Svitashev等人(2015)中描述。由于粒子枪转化会是高度可变的，所以也可以将编码黄色荧光蛋白的可视标记DNA表达盒共递送，从而有助于均匀转化的IME[未成熟玉蜀黍胚]的选择。2天后，基于其荧光，收获20-30个最均匀转化的IME，提取总基因组DNA，并且用高保真PCR预混合物(新英格兰生物实验室(New England Biolabs)，M0531L)，添加对于扩增子-特异性条形码和Illumnia测序必要的序列，对预期靶位点周围的DNA区域进行PCR扩增，并且深度测序。然后通过与其中从转录中省略小RNA转录盒的对照实验相比，检测所得的读数在预期切割位点处是否存在突变。

用于测量本公开的Cpf1内切核酸酶的功能片段或功能变体是否可以结合预期DNA靶位点的方法包括以下方法：玉蜀黍染色体DNA靶位点的结合并不导致双链DNA靶位点中的单链断裂(SSB)抑或双链断裂(DSB)。因此，为了检测功能Cpf1片段在玉蜀黍细胞中的结合活性，可以将另一种核酸酶结构域(例如FokI)附接到具有结合活性的功能Cpf1片段上。如果存在结合活性，则添加的核酸酶结构域可以用于产生DSB(该DSB将导致玉蜀黍细胞中插入或缺失(插入缺失)诱变的产生)。然后可以将此结果用于检测并且监测Cpf1的结合活性，类似于Karvelis等人(2015)中描述。简言之，可以选择适当的CRISPR-Cpf1玉蜀黍基因组DNA靶位点，可以构建指导RNA转录盒和功能片段Cpf1结合的并且核酸酶附接的表达盒，并且在BBM和WUS2基因存在下，通过生物射弹转化将其共递送到Hi-II型10日龄未成熟玉蜀黍胚(IME)中，如在Svitashev等人(2015)中描述。也可以将编码黄色荧光蛋白的可视标记DNA表达盒共递送，从而有助于均匀转化的IME[未成熟玉蜀黍胚]的选择。2天后，可以基于其荧光，收获20-30个最均匀转化的IME，提取总基因组DNA，并且用高保真PCR预混合物(新英格兰生物实验室(New England Biolabs)，M0531L)，添加对于扩增子-特异性条形码和Illumnia测序必要的序列，对预期靶位点周围的DNA区域进行PCR扩增，并且深度测序。然后可以通过与其中从转录中省略小RNA转录盒的对照实验相比，检测所得的读数在预期切割位点处是否存在突变。

可替代地，可以通过基因的转录诱导或抑制，监测玉蜀黍染色体DNA靶位点的结合活性。这可以通过以下实现：将转录激活或抑制结构域附接到功能Cpf1结合片段上，并且将其靶向到基因的启动子区域，并且通过基因转录物或蛋白的累积增加监测结合。靶向用于激活或抑制的基因可以是通过本领域已知的方法(例如粒子枪或农杆菌转化)引入玉蜀黍基因组中的任何天然存在的玉蜀黍基因，或工程化的基因(例如编码红色荧光蛋白的基因)。

Cpf1蛋白可以是包含一个或多个异源蛋白质结构域(例如除Cpf1蛋白之外的1、2、3或更多个结构域)的融合蛋白的一部分。这样的融合蛋白可以包含任何另外的蛋白质序列，以及任选地在任何两个结构域之间(例如在Cpf1和第一异源结构域之间)的连接体序列。可以与本文中的Cpf1蛋白融合的蛋白质结构域的实例包括但不限于表位标签(例如，组氨酸[His]、V5、FLAG、流感血球凝集素[HA]、myc、VSV-G、硫氧还蛋白[Trx])；报道子(例如谷胱甘肽-5-转移酶[GST]、辣根过氧化物酶[HRP]、氯霉素乙酰转移酶[CAT]、β-半乳糖苷酶、β-葡萄糖醛酸酶[GUS]、荧光素酶、绿色荧光蛋白[GFP]、HcRed、DsRed、青色荧光蛋白[CFP]、黄色荧光蛋白[YFP]、蓝色荧光蛋白[BFP])；以及具有一个或多个以下活性的结构域：甲基化酶活性、脱甲基酶活性、转录激活活性(例如，VP16或VP64)、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。Cpf1蛋白还可以与结合DNA分子或其他分子的蛋白质融合，例如麦芽糖结合蛋白(MBP)、S-标签、Lex A DNA结合结构域(DBD)、GAL4A DNA结合结构域和单纯疱疹病毒(HSV)VP16。

可以将催化失活的Cpf1融合到异源序列。适合的融合配偶体包括，但不限于提供活性的多肽，该活性通过直接作用于靶DNA上或与该靶DNA相关的多肽(例如，组蛋白或其他DNA-结合蛋白)上间接地增加转录。另外的适合的融合配偶体包括，但不限于提供甲基转移酶活性、脱甲基酶活性、乙酰基转移酶活性、脱乙酰基酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化酶活性、腺苷酸化活性、去腺苷酸化活性、苏素化活性、去苏素化活性、核糖基化活性、去核糖基化活性、豆蔻酰化活性，或去豆蔻酰化活性的多肽。此外适合的融合配偶体包括，但不限于直接提供靶核酸的增加的转录的多肽(例如，募集转录激活因子、小分子/药物-应答性转录调节因子等的转录激活因子或其片段，蛋白质或其片段)。还可以将催化失活的Cpf1融合到FokI核酸酶，从而产生双链断裂。

如本文使用，术语“指导多核苷酸”涉及可以与Cas内切核酸酶(例如Cpf1内切核酸酶或Cas9内切核酸酶)形成复合物的多核苷酸序列，并且使得Cas内切核酸酶能够识别、结合并任选地切割DNA靶位点。对于Cpf1内切核酸酶系统，术语指导多核苷酸和cr多核苷酸可以可互换使用。指导多核苷酸序列可以是RNA序列、DNA序列或其组合(RNA-DNA组合序列，也称为RNA-DNA多核苷酸)。任选地，指导多核苷酸可以包含至少一种核苷酸、磷酸二酯键或连接修饰，例如但不限于锁核酸(LNA)、5-甲基dC、2，6-二氨基嘌呤、2’-氟代A、2’-氟代U、2’-O-甲基RNA、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔子18(六乙二醇链)分子的连接、或导致环化的5’至3’共价连接。仅仅包含核糖核酸的指导多核苷酸也被称为“指导RNA”或“gRNA”(还参见于2015年3月19日公开的美国专利申请US20150082478和2015年2月26日公开的US20150059010，其都通过引用结合在此)。

指导多核苷酸包含由Cas内切核酸酶(例如Cpf1内切核酸酶)识别的第一核苷酸序列结构域(称为Cas内切核酸酶识别结构域(CER(Cas endonuclease recognition)结构域；针对Cpf1内切核酸酶的Cpf1识别结构域))和可以与靶DNA中的核苷酸序列杂交的可变靶向结构域或VT(Variable Targeting)结构域。对于Cpf1内切核酸酶系统，术语指导RNA和crRNA可以可互换使用。指导多核苷酸包括单分子(也称为单指导多核苷酸，sgRNA)。“结构域”意指可以为RNA、DNA和/或RNA-DNA组合序列(也称为杂合DNA-RNA或hDRNA)的核苷酸的连续延伸。指导多核苷酸的VT结构域和/或CER结构域可以包含RNA序列、DNA序列或RNA-DNA组合序列。指导多核苷酸可以被称为“指导RNA”(当由RNA核苷酸的连续延伸构成时)或“指导DNA”(当由DNA核苷酸的连续延伸构成时)或“指导RNA-DNA”(当由RNA和DNA核苷酸的组合构成时)。在一个方面，指导多核苷酸可以与Cpf1内切核酸酶形成复合物，其中指导多核苷酸/Cpf1内切核酸酶复合物(也称为指导多核苷酸/Cpf1内切核酸酶系统)可以将Cpf1内切核酸酶引导至基因组靶位点，使该Cpf1内切核酸酶能够对靶位点进行识别、结合、并且任选地产生切口或进行切割(引入单链或双链断裂)。

在一些实施例中，指导多核苷酸的VT结构域和/或Cpf1识别结构域可以包含RNA序列、DNA序列或RNA-DNA组合序列。例如，VT结构域可以包含RNA序列，或包含VT序列内的一个或多个DNA核苷酸的RNA序列。类似地，Cpf1识别结构域可以包含RNA序列，或包含CER序列内的一个或多个DNA核苷酸的RNA序列。在另一个实例中，指导多核苷酸可以包含：包含VT结构域内的一个或多个DNA核苷酸和CER结构域内的一个或多个DNA核苷酸的RNA序列。

在一个方面，指导多核苷酸是DNA-RNA指导多核苷酸(也称为杂合DNA-RNA指导多核苷酸、hDRNA、RNA-DNA多核苷酸)包含Cpf1识别结构域中的至少一个DNA核苷酸和/或可变靶向结构域中的至少一个DNA核苷酸。

在一个方面，指导多核苷酸的Cpf1识别结构域可以形成5’茎环3’茎二级结构，其中Cpf1识别结构域包含RNA和至少一个DNA核苷酸。该

在一个方面，Cpf1识别结构域包含在5’端或环结构处的DNA核苷酸。

在一个方面，可变靶向结构域包含在3’端的DNA核苷酸。

在一个方面，指导多核苷酸选自由以下组成的组：SEQ ID NO：40、41、42、43、44、45和46。

在一些实施例中，本公开提供了用于与Cpf1系统一起使用的单指导多核苷酸，该Cpf1系统包含可变靶向结构域，该可变靶向结构域包含脱氧核糖核酸(DNA)、核糖核酸(RNA)或DNA和RNA的混合物，并且被配置成与核酸中的靶序列杂交；以及与包含DNA、RNA、或DNA和RNA的混合物的可变靶向结构域邻近的Cpf1识别结构域。在一些实施例中，Cpf1识别结构域在可变靶向结构域的上游。在一些实施例中，Cpf1识别结构域包含选自由以下组成的组的至少一个二级结构：下部茎、环、上部茎、发夹，或这些中的一个或多个、及其组合。在一些实施例中，Cpf1识别结构域包含形成内部双链体的茎环结构。Cpf1可以按序列和结构特异性的方式结合指导多核苷酸的Cpf1识别结构域，即识别茎环和与茎环邻近的序列，最值得注意地，是与靶核酸杂交的可变靶向结构域的5’的核苷酸。茎环结构可以是至少8、9、10、11、12、13、14、15、16、17、18、19多至100个核苷酸的长度。茎环结构可以进一步包含在茎环的环结构中的另外的多核苷酸的插入。

茎环包含5’元件和3’元件。

在一些实施例中，Cpf1识别结构域的茎环的5’元件包含DNA、RNA或DNA-RNA的混合物。

在一些实施例中，Cpf1识别结构域的茎环的3’元件包含DNA、RNA、或DNA-RNA的混合物。

在一些实施例中，Cpf1识别结构域的茎环的环包含DNA、RNA或DNA-RNA的混合物。

在一些实施例中，Cpf1识别结构域包含：包含DNA和RNA的混合物的茎环结构。Cpf1识别结构域的DNA-RNA混合物可以包含不同比例的DNA和RNA。在某些实施例中，此分配可以是5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、或99％RNA以及其间的范围。

在一些实施例中，可变靶向结构域包含DNA和RNA的混合物。可变靶向结构域的DNA-RNA混合物可以包含不同比例的DNA和RNA。在某些实施例中，此分配可以是5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、或99％RNA以及其间的范围。

在一些实施例中，可变靶向结构域包含DNA并且Cpf1识别结构域包含DNA。

在一些实施例中，可变靶向结构域包含DNA并且Cpf1识别结构域包含RNA。

在一些实施例中，可变靶向结构域包含DNA并且Cpf1识别结构域包含DNA和RNA的混合物。

在一些实施例中，可变靶向结构域包含RNA并且Cpf1识别结构域包含DNA。

在一些实施例中，可变靶向结构域包含RNA并且Cpf1识别结构域包含RNA。

在一些实施例中，可变靶向结构域包含RNA并且Cpf1识别结构域包含DNA和RNA的混合物。

在一些实施例中，可变靶向结构域包含DNA和RNA的混合物并且Cpf1识别结构域包含DNA。

在一些实施例中，可变靶向结构域包含DNA和RNA的混合物并且Cpf1识别结构域包含RNA。

在一些实施例中，可变靶向结构域包含DNA和RNA的混合物并且Cpf1识别结构域包含DNA和RNA的混合物。

在一些实施例中，本公开提供了包含可变靶向结构域的单指导多核苷酸，该可变靶向结构域包含脱氧核糖核酸(DNA)并且被配置成与核酸中的靶序列杂交；与包含核糖核酸(RNA)的可变靶向结构域邻近的Cpf1识别结构域，其中单指导多核苷酸与Cpf1形成复合物，并且任选地，其中与靶核酸中的其他序列相比，更优先低在靶序列处切割或编辑靶核酸，由此减少脱靶修饰。在一些实施例中，靶核酸是DNA，在一些实施例中，靶核酸是RNA，在一些实施例中，靶核酸是RNA和DNA的混合物。在一些实施例中，Cpf1识别结构域在靶区域的下游。在一些实施例中，Cpf1识别结构域在靶区域的上游。在一些实施例中，Cpf1识别结构域包含选自由以下组成的组的结构：下部茎、凸出、上部茎、连结、以及发夹。在一些实施例中，Cpf1识别结构域包含茎环结构。在一些实施例中，Cpf1识别结构域与Cpf1多肽相互作用。在一些实施例中，Cpf1识别结构域包含DNA和RNA的混合物。在一些实施例中，可变靶向结构域包含DNA和RNA的混合物。在一些实施例中，可变靶向结构域不含尿嘧啶。

指导多核苷酸包括非天然存在的嵌合指导RNA，该指导RNA包含在自然中未发现在一起的区域(即它们是彼此异源的)。例如非天然存在的嵌合指导RNA(crRNA)包含与第二核苷酸序列结构域(Cpf1识别结构域)连接的、可以与靶DNA中的核苷酸序列杂交的第一核苷酸序列结构域(VT结构域)，这样使得第一和第二核苷酸序列结构域在自然中未发现连接在一起。

术语“可变靶向结构域”或“VT结构域”在本文中可互换使用，并且包括可以与双链DNA靶位点的一条链(核苷酸序列)杂交(互补)的核苷酸序列。第一核苷酸序列结构域(VT结构域)与靶序列之间的互补％可以为至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、63％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％。可变靶向结构域可以是至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸多至50个核苷酸的长度。

在一些方面，由于在指导多核苷酸的可变靶向结构域和靶序列之间存在错配，所以能够形成功能性指导多核苷酸/Cpf1内切核酸酶复合物的指导多核苷酸(cr多核苷酸)的可变靶向结构域和靶序列之间的互补百分比小于100％。如本文描述，Cpf1内切核酸酶在对于指导RNA(crRNA)和互补DNA靶之间的错配具有高耐受性的区域中切割其DNA靶位点。在位于+21、+22、+23和+24并且在PAM的3’的靶位点中的核苷酸位置可以与指导多核苷酸错配，并且仍导致在预期靶位点处的精确DNA切割(Kim，D.等人，(2016)Nature Biotechnology.[自然生物技术]34863-868；Kleinstivet，B.等人，(2016)Nature Biotechnology[自然生物技术].34，869-874)。在21个核苷酸的VT结构域中的4个错配的存在，代表约80％的互补百分比。

在一个实施例中，指导多核苷酸包含关于靶位点的错配，该靶位点在选自在PAM序列的3’的+21、+22、+23、+24，或位置+21、+22、+23、和+24的组合的位置处。

在一些方面，VT结构域可以具有在靶位点中的核苷酸位置处的错配，这些核苷酸位置选自位于+21、+22、+23和+24的靶位点中的核苷酸的组。在一些方面，VT结构域可以具有与其DNA靶位点的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、多至15个错配，并且仍导致指导Cpf1蛋白到其预期DNA靶位点处。

在一些实施例中，可变靶向结构域包含12至30、12至29、12至28、12至27、12至26、12至25、12至26、12至25、12至24、12至23、12至22、12至21、12至20、12至19、12至18、12至17、12至16、12至15、12至14、12至13、13至30、13至29、13至28、13至27、13至26、13至25、13至26、13至25、13至24、13至23、13至22、13至21、13至20、13至19、13至18、13至17、13至16、13至15、13至14、14至30、14至29、14至28、14至27、14至26、14至25、14至26、14至25、14至24、14至23、14至22、14至21、14至20、14至19、14至18、14至17、14至16、14至15、15至30、15至29、15至28、15至27、15至26、15至25、15至26、15至25、15至24、15至23、15至22、15至21、15至20、15至19、15至18、15至17、15至16、16至30、16至29、16至28、16至27、16至26、16至25、16至24、16至23、16至22、16至21、16至20、16至19、16至18、16至17、17至30、17至29、17至28、17至27、17至26、17至25、17至24、17至23、17至22、17至21、17至20、17至19、17至18、18至30、18至29、18至28、18至27、18至26、18至25、18至24、18至23、18至22、18至21、18至20、18至19、19至30、19至29、19至28、19至27、19至26、19至25、19至24、19至23、19至22、19至21、19至20、20至30、20至29、20至28、20至27、20至26、20至25、20至24、20至23、20至22、20至21、21至30、21至29、21至28、21至27、21至26、21至25、21至24、21至23、21至22、22至30、22至29、22至28、22至27、22至26、22至25、22至24、22至23、23至30、23至29、23至28、23至27、23至26、23至25、23至24、24至30、24至29、24至28、24至27、24至26、24至25、25至30、25至29、25至28、25至27、25至26、26至30、26至29、26至28、26至27、27至30、27至29、27至28、28至30、28至29、或29至30个核苷酸的连续延伸。

可变靶向域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列或其任何组合构成。

术语(指导多核苷酸，crRNA的)“Cpf1内切核酸酶识别结构域”或“Cpf1识别结构域”在本文中可互换使用，并且是指与Cpf1内切核酸酶多肽相互作用的核苷酸序列。Cpf1内切核酸酶识别结构域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列或其任何组合构成。

术语指导多核苷酸(或指导RNA、crRNA)的“功能片段”、“功能上等效的片段”和“功能等效片段”在本文中可互换使用，并且是指本公开的指导多核苷酸(或指导RNA、crRNA)的一部分或子序列，其中保留用作指导多核苷酸(指导RNA、crRNA)的能力。

术语指导多核苷酸(或指导RNA、crRNA)的“功能变体”、“功能上等效的变体”和“功能等效变体”在本文中可互换使用，并且是指本公开的指导多核苷酸(或指导RNA、crRNA)的变体，其中保留用作指导多核苷酸(指导RNA、crRNA)的能力。

本公开的指导RNA或指导多核苷酸的功能片段包括参比指导RNA，例如SEQ ID NO：15-18的参比指导RNA的20-40、20-45、20-50、20-55、20-60、20-65、20-70、20-75、20-80、25-40、25-45、25-50、25-55、25-60、25-65、25-70、25-75、25-80、30-40、30-45、30-50、30-55、30-60、30-65、30-70、30-75、30-80、35-40、35-45、35-50、35-55、35-60、35-65、35-70、35-75、35-80、40-45、40-50、40-55、40-60、40-65、40-70、40-75、40-80、45-50、45-55、45-60、45-65、45-70、45-75、45-80、50-55、50-60、50-65、50-70、50-75、50-80、55-55、55-60、55-65、55-70、55-75、55-80、60-65、60-70、60-75、60-80、65-70、65-75、65-80、70-75、70-80或75-80个核苷酸的片段。

本公开的单指导RNA或指导多核苷酸的功能变体可以包含与参比单指导RNA，例如本文描述的SEQ ID NO：15-18的参比单指导RNA的至少约60％、65％、70％、75％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％同一性的核苷酸序列。在一些实施例中，单指导RNA的功能片段包含在至少8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个连续核苷酸的延伸上与SEQ ID NO：15-18中列出的核苷酸序列中的任一个具有至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％、至少约99％、或100％核苷酸序列同一性的核苷酸序列。

本公开的指导多核苷酸的功能变体可以包括修饰的指导多核苷酸，其中修饰包括：与包括SEQ ID NO：15-18的指导多核苷酸的参比指导多核苷酸的杂交区域相比，杂交区域中的工程化的二级结构、和/或人工环、和/或长度和/或互补程度的减小，和/或在形成双链RNA双链体的蛋白结合区段的一部分中的长度和/或互补程度的减小。

本公开的指导多核苷酸的功能变体可以包括修饰的指导多核苷酸，其中修饰包括：在单指导RNA中，添加、去除、或另外改变环和/或发夹。本公开的指导多核苷酸的功能变体包括已经在5’末端处、在3’末端处、或在核苷酸序列内存在的任何位置处修饰的本公开的指导多核苷酸，或其任何组合。

本公开的指导多核苷酸的功能变体可以包括修饰的指导多核苷酸，其中修饰包括：在核苷酸序列中，或在5’或3’末端处的一个或多个修饰的多核苷酸，其中该一个或多个修饰的多核苷酸包括至少一个非天然存在的核苷酸、核苷酸模拟物(如在2014年3月6日公开的美国申请US2014/0068797中描述)、或其类似物，或其中该一个或多个修饰的核苷酸选自由以下组成的组：2’-0-甲基类似物、2’-氟类似物2-氨基嘌呤、5-溴-尿苷、假尿苷、和7-甲基鸟苷。

在一个方面，指导RNA(crRNA)的功能变体可以形成指导RNA/Cpf1内切核酸酶复合物，该复合物可以对靶序列进行识别、结合、并且任选地产生切口或进行切割。

该指导多核苷酸可以通过本领域已知的任何方法产生，包括化学合成指导多核苷酸(例如但不限于Hendel等人2015，Nature Biotechnology[自然生物技术]33，985-989)、体外产生的指导多核苷酸、和/或自剪接指导RNA(例如但不限于Xie等人2015，PNAS[美国国家科学院院刊]112：3570-3575)。

在真核细胞中表达RNA组分(例如gRNA)用于进行Cas介导的DNA靶向的方法已经使用RNA聚合酶III(Pol III)启动子，其允许具有精确定义的未修饰的5’-和3’-末端的RNA转录(DiCarlo等人，Nucleic Acids Res.[核酸研究]41：4336-4343；Ma等人，Mol.Ther.Nucleic Acids[分子治疗-核酸]3：e161)。此策略已经成功应用于若干不同物种(包括玉蜀黍和大豆)的细胞中(2015年3月19日公开的US 20150082478)。已经描述了用于表达并不具有5’-帽的RNA组分的方法(2016年2月18日公开的WO 2016/025131)。可以使用能够在原核或真核细胞中表达指导RNA的启动子。例如，能够在细胞中转录指导RNA的启动子，包括有效地连接到编码指导RNA的核苷酸序列的热休克/热可诱导的启动子。

可以从被加工成至少两个单指导多核苷酸的单前体多核苷酸同时产生许多指导多核苷酸(至少两个单指导多核苷酸)，其中每个单指导多核苷酸包含在与植物基因组中的单靶序列基本上互补的(在原型间隔子邻近基序的3’)的可变靶向结构域，其中指导多核苷酸能够形成指导多核苷酸/Cpf1内切核酸酶复合物，该复合物可以对靶序列进行识别、结合、并且任选地产生切口或进行切割。将前体多核苷酸加工成至少两个指导多核苷酸可以通过Cpf1内切核酸酶的核糖核酸酶活性来实现。简而言之，单前体多核苷酸可以被合成为多个指导多核苷酸，此类指导多核苷酸的每一个包含可变靶向结构域(该可变靶向结构域包含脱氧核糖核酸(DNA)、核糖核酸(RNA)或DNA和RNA的混合物，并且被配置成与核酸中的靶序列杂交)，以及与包含DNA、RNA、或DNA和RNA的混合物的可变靶向结构域邻近的Cpf1识别结构域。然后可以通过Cpf1内切核酸酶的核糖核苷酸活性，将前体多核苷酸加工成许多单指导多核苷酸。

在一个方面，前体多核苷酸是能够被Cpf1内切核酸酶加工成多个单指导多核苷酸的前体多核苷酸，其中单指导多核苷酸的每一个和Cpf1内切核酸酶能够形成复合物，该复合物可以对DNA靶序列进行识别、结合、并且任选地产生切口或进行切割。

在一个方面，前体多核苷酸是能够被Cpf1内切核酸酶加工成多个单指导多核苷酸的前体多核苷酸，其中前体多核苷酸被加工成至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、20、35、40、45、50、55、60、65、70、75、80、85、90、95多至100个单指导多核苷酸，其中单指导多核苷酸的每一个和Cpf1内切核酸酶能够形成复合物，该复合物可以对DNA靶序列进行识别、结合、并且任选地产生切口或进行切割。

在一个方面，前体多核苷酸可以被合成为包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、20、35、40、45、50、55、60、65、70、75、80、85、90、95多至100个单指导多核苷酸，其中每个单指导多核苷酸包含位于原型间隔子邻近基序的3’的可变靶向结构域，并且其中该可变靶向结构域与植物基因组中的单靶序列基本上互补。

可以从被加工成至少两个单指导RNA的单前体RNA同时产生许多指导RNA(至少两个单指导RNA)，其中每个单指导RNA包含在与植物基因组中的单靶序列基本上互补的(在原型间隔子邻近基序的3’)的可变靶向结构域，其中指导RNA能够形成指导RNA/Cpf1内切核酸酶复合物，该复合物可以对靶序列进行识别、结合、并且任选地产生切口或进行切割。将单前体RNA加工成至少两个指导RNA可以通过Cpf1内切核酸酶的核糖核酸酶活性来实现(Fonfara，I.等人，(2016)Nature.[自然]532：517-521)。简而言之，可以从能够表达单前体RNA的前体指导RNA转录起始盒产生单前体RNA分子。然后可以通过Cpf1内切核酸酶的核糖核苷酸活性，将前体RNA加工成许多单指导RNA。

如本文使用，术语“前体指导RNA转录起始盒”是指编码前体指导RNA的重组DNA分子，该前体RNA包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、20、35、40、45、50、55、60、65、70、75、80、85、90、95多至100个单指导RNA，其中每个单指导RNA包含位于原型间隔子邻近基序的3’的可变靶向结构域，并且其中该可变靶向结构域与植物基因组中的单靶序列基本上互补。

如本文使用，术语“前体指导RNA”是指单RNA分子，该单RNA分子包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、20、35、40、45、50、55、60、65、70、75、80、85、90、95多至100个单指导RNA，这些单指导RNA可以经由Cpf1蛋白的核糖核酸酶活性被加工成其个体单指导RNA(至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、20、35、40、45、50、55、60、65、70、75、80、85、90、95多至100个单指导RNA)，并且其中每个单指导RNA包含位于原型间隔子邻近基序的3’，并且与植物基因组中的单靶序列基本上互补的可变靶向结构域。

在一个方面，前体RNA是能够被Cpf1内切核酸酶加工成多个单指导RNA的前体指导RNA，其中单指导RNA的每一个和Cpf1内切核酸酶能够形成复合物，该复合物可以对DNA靶序列进行识别、结合、并且任选地产生切口或进行切割。

在一个方面，前体RNA是能够被Cpf1内切核酸酶加工成多个单指导RNA的前体指导RNA，其中前体RNA被加工成至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、20、35、40、45、50、55、60、65、70、75、80、85、90、95多至100个单指导RNA，其中单指导RNA的每一个和Cpf1内切核酸酶能够形成复合物，该复合物可以对DNA靶序列进行识别、结合、并且任选地产生切口或进行切割。

在一个方面，前体RNA可以由包含有效地连接到编码前体指导RNA的核苷酸序列的Pol-II或Pol-III启动子的重组DNA编码，该前体指导RNA包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、20、35、40、45、50、55、60、65、70、75、80、85、90、95多至100个单指导RNA，其中每个单指导RNA包含位于原型间隔子邻近基序的3’的可变靶向结构域，并且其中该可变靶向结构域与植物基因组中的单靶序列基本上互补。驱动前体RNA表达的Pol-III启动子的实例可以是，但不限于玉蜀黍U6聚合酶III启动子。驱动前体RNA表达的Pol-II启动子的实例可以是，但不限于泛素启动子。

在一个方面，将前体RNA加工成至少两个指导RNA的Cpf1蛋白是可以形成指导RNA/Cpf1内切核酸酶复合物的相同Cpf1蛋白，该复合物可以对靶序列进行识别、结合、并且任选地产生切口或进行切割。前体指导RNA转录起始盒包括：包含有效地连接到编码前体RNA的DNA序列的Pol-II或Pol-III启动子的重组DNA分子(也称为表达盒)。

指导多核苷酸、VT结构域和/或Cpf1识别结构域的核苷酸序列修饰可以选自但不限于下组，该组由以下组成：5’帽、3’聚腺苷酸尾、核糖开关序列、稳定性控制序列、形成dsRNA双链体的序列、将指导多核苷酸靶向亚细胞位置的修饰或序列、提供跟踪的修饰或序列、提供蛋白质结合位点的修饰或序列、锁核酸(LNA)、5-甲基dC核苷酸、2，6-二氨基嘌呤核苷酸、2’-氟A核苷酸、2’-氟U核苷酸、2’-O-甲基RNA核苷酸、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔物18分子的连接、5’至3’共价连接、或其任何组合。这些修饰可以产生至少一个另外的有益特征，其中该另外的有益特征选自由以下组成的组：修改的或调节的稳定性、亚细胞靶向、跟踪、荧光标记、用于蛋白或蛋白复合物的结合位点、对互补靶序列的修改的结合亲和力、修改的细胞降解抗性和增加的细胞通透性。

术语“5’-帽”和“7-甲基鸟苷酸(m⁷G)帽”在本文中可互换使用。7-甲基鸟苷酸残基位于真核生物中信使RNA(mRNA)的5’末端。在真核生物中，RNA聚合酶II(Pol II)转录mRNA。信使RNA加帽通常如下：用RNA末端磷酸酶去除mRNA转录物的最末端5’磷酸根基团，留下两个末端磷酸根。用鸟苷酸转移酶将一磷酸鸟苷(GMP)添加至转录物的末端磷酸根，在转录物末端处留下5′-5′三磷酸连接的鸟嘌呤。最后，此末端鸟嘌呤的7-氮被甲基转移酶甲基化。

术语“不具有5’-帽”等在本文中用于指具有例如5’-羟基基团而不是5’-帽的RNA。例如，此类RNA可以被称为“未带帽的RNA”。因为5’-带帽的RNA有核输出的倾向，转录以后未带帽的RNA可以更好地积累在细胞核中。本文中的一种或多种RNA组分是未带帽的。

如本文使用，术语“指导多核苷酸/Cas内切核酸酶复合物”、“指导多核苷酸/Cas内切核酸酶系统”、“指导多核苷酸/Cas复合物”、“指导多核苷酸/Cas系统”和“指导Cas系统”、“多核苷酸指导的内切核酸酶”、“PGEN”在本文中可互换使用，并且是指能够形成复合物的至少一种指导多核苷酸和至少一种Cas内切核酸酶，其中该指导多核苷酸/Cas内切核酸酶复合物可以将Cas内切核酸酶引导至DNA靶位点，使Cas内切核酸酶能够对DNA靶位点进行识别、结合、并且任选地产生切口或进行切割(引入单链或双链断裂)。

在一个方面，本文描述的指导多核苷酸/Cas内切核酸酶复合物是指导多核苷酸/Cpf1内切核酸酶复合物。指导多核苷酸/Cpf1内切核酸酶复合物可以包含已知V型CRISPR系统中的任一种的一种或多种Cpf1蛋白和适合的一种或多种多核苷酸组分(Makarova等人，2015，Nature Reviews Microbiology[自然评论微生物学]卷13：1-15；Zetsche等人，2015，Cell[细胞]163，1-13；Shmakov等人，2015，Molecular_Cell[分子细胞]60，1-13)。

指导多核苷酸/Cpf1内切核酸酶复合物可以切割原核和/或真核细胞中的DNA靶序列的一条或两条链。可以切割DNA靶序列的两条链的指导多核苷酸//Cpf1内切核酸酶酶复合物通常包含具有处于功能状态的所有其内切核酸酶酶结构域的/Cpf1蛋白(例如野生型内切核酸酶酶结构域或其变体在每个内切核酸酶酶结构域中保留一些或全部活性)。

可以切割DNA靶序列的一条链的指导多核苷酸/Cas内切核酸酶酶复合物可以在本文中表征为具有切口酶活性(例如，部分切割能力)。Cpf1切口酶通常包含一个功能性内切核酸酶酶结构域，该结构域允许Cpf1仅切割DNA靶序列的一条链(即，形成切口)(Yamano等人，2016，Cell[细胞]165：949-962)。可以使用一对Cpf1切口酶来增加DNA靶向的特异性。一般来说，这可以通过提供两个Cpf1切口酶来进行，这两个Cpf1切口酶通过与具有不同引导序列的RNA组分缔合，在希望靶向的区域的相反链上在DNA序列附近进行靶向和切口。

在某些实施例中指导多核苷酸/Cpf1内切核酸酶复合物可以结合DNA靶位点序列，但不切割在靶位点序列处的任何链。这样的复合物可以包含其中所有核酸酶结构域都是突变的、功能失调的Cpf1蛋白。例如，可以结合到DNA靶位点序列但在靶位点序列处不切割任何链的本文的Cpf1蛋白可以包含突变的、功能失调的RuvC结构域。

本公开的指导多核苷酸/Cpf1内切核酸酶复合物可以包含任何Cpf1蛋白，并且包括但不限于SEQ ID NO：10、11、32或33的Cpf1蛋白、或SEQ ID NO：10、11、32或33的功能变体、或SEQ ID NO：10、11、32或33的功能片段。

术语“指导RNA/Cpf1内切核酸酶复合物”、“指导RNA/Cpf1内切核酸酶系统”、“指导RNA/Cpf1复合物”、“指导RNA/Cpf1系统”、“gRNA/Cpf1复合物”、“gRNA/Cpf1系统”在本文中可互换使用，并且是指能够形成复合物的至少一种RNA组分和至少一种Cpf1内切核酸酶，其中该指导RNA/Cpf1内切核酸酶复合物可以将Cpf1内切核酸酶引导至DNA靶位点，使Cpf1内切核酸酶能够对DNA靶位点进行识别、结合、并且任选地产生切口或进行切割(引入单链或双链断裂)。

在一个方面，当在高于28℃的温度下孵育(或在高于28℃的温度中(暴露于其中)孵育的植物细胞或植物中存在)持续至少4hr时，指导RNA/Cpf1内切核酸酶复合物可以导致在靶位点处或其附近的双链断裂，并且当与在约28℃或约20℃至28℃之间的温度下孵育的包含指导RNA/Cpf1内切核酸酶复合物的对照植物细胞的靶序列处的突变的频率相比，导致靶位点的随后增加的突变频率。在一个实施例中，该方法包括：一种用于在植物细胞的基因组中修饰靶序列的方法，该方法包括：a)将以下引入植物细胞：Cpf1内切核酸酶或编码Cpf1内切核酸酶的植物优化的多核苷酸、以及包含与植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸；以及b)在高于28℃的温度下，孵育植物细胞至少约4hr的时段，其中指导多核苷酸和Cpf1内切核酸酶能够形成可以切割靶序列的复合物，其中当与在约28℃的温度下孵育的对照植物细胞(包含指导RNA/Cpf1内切核酸酶复合物)的靶位点处的突变的频率相比时，在靶位点处的突变的频率增加至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15倍。在一个方面，在高于28℃的温度下，孵育指导RNA/Cpf1内切核酸酶复合物至少4hr时，当与在约28℃的温度下孵育的对照植物细胞(包含指导RNA/Cpf1内切核酸酶复合物)的靶位点处的突变的频率相比时，在预期靶位点处的突变的增加频率增加至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少10倍、至少11倍、至少12倍、至少13倍、至少14倍、至少15倍、至少30倍、至少40倍、或至少50倍。

可以在植物细胞、植物胚和/或植物的任何发育阶段，将包含指导RNA/Cpf1内切核酸酶复合物的植物细胞暴露于高于28℃的温度。还可以将包含Cpf1内切核酸酶(或表达该Cpf1内切核酸酶的重组构建体)和指导RNA(和/或表达该指导RNA的重组构建体)的植物的子代暴露于高于28℃的温度，由此激活子代植物内的指导RNA/Cpf1复合物(在发育期间的希望的阶段)，这允许子代植物在由该指导RNA/Cpf1内切核酸酶复合物识别的特定靶位点处被修饰。

术语“靶位点”、“靶序列”、“靶位点序列”、“靶DNA”、“靶基因座”、“基因组靶位点”、“基因组靶序列”、“基因组靶基因座”和“前间区”在本文中可互换使用，并且是指多核苷酸序列，例如，但不限于，在细胞的染色体、附加体、转基因基因座或基因组中的任何其他DNA分子(包括染色体DNA、叶绿体DNA、线粒体DNA、质粒DNA)上的核苷酸序列，在这些序列处指导多核苷酸/Cas内切核酸酶复合物，例如本文描述的指导多核苷酸/Cpf1内切核酸酶复合物可以进行识别、结合并任选地产生切口或进行切割。靶位点可以是细胞的基因组中的内源性位点，或者可替代地，靶位点可以与细胞异源并且从而不是天然存在于细胞的基因组中，或者与在自然界发生的位置相比，可以在异质基因组位置中找到靶位点。如本文使用，术语“内源性靶序列”和“天然靶序列”在本文中可互换使用，是指对细胞基因组来说是内源的或天然的、并且位于细胞的基因组中该靶序列的内源或天然位置处的靶序列。“人工靶位点”或“人工靶序列”在本文中可互换使用，并且是指已经引入细胞的基因组中的靶序列。这样的人工靶序列可以在序列上与细胞的基因组中的内源性或天然靶序列相同，但是位于细胞的基因组中的不同位置(即，非内源性的或非天然的位置)处。

如本文描述，Cpf1 DNA靶位点是指由Cpf1内切核酸酶识别的DNA靶位点，其中Cpf1内切核酸酶能够形成复合物，该复合物可以对Cpf1 DNA靶位点进行识别、结合、并且任选地产生切口或进行切割。

如本文描述，氨基酸球菌属Cpf1 DNA靶位点包括由来自氨基酸球菌属的Cpf1内切核酸酶蛋白或在植物中产生的氨基酸球菌属Cpf1内切核酸酶蛋白识别的DNA靶位点，其中Cpf1内切核酸酶能够形成复合物，该复合物可以对氯基酸球菌属Cpf1 DNA靶位点进行识别、结合、并且任选地产生切口或进行切割。

“改变的靶位点”、“改变的靶序列”、“修饰的靶位点”、“修饰的靶序列”在本文中可互换使用，并且是指如本文公开的靶序列，当与非改变的靶序列相比时，该靶序列包括至少一个改变。此类“改变”包括，例如：(i)至少一个核苷酸的替代，(ii)至少一个核苷酸的缺失，(iii)至少一个核苷酸的插入，或(iv)(i)-(iii)的任何组合。

用于“修饰靶位点”和“改变靶位点”的方法在本文中可互换使用，并且是指用于产生改变的靶位点的方法。

靶DNA序列(靶位点)的长度可以变化，并且包括例如为至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个核苷酸长度的靶位点。还有可能靶位点可以是回文的，即，一条链上的序列与在互补链上以相反方向的读取相同。切口/切割位点可以在靶序列内，或者切口/切割位点可以在靶序列之外。在另一种变异中，切割可以发生在彼此正好相对的核苷酸位置处，以产生平端切割，或者在其他情况下，切口可以交错以产生单链突出端，也称为“粘性末端”，其可以是5’突出端抑或或3’突出端。还可以使用基因组靶位点的活性变体。这样的活性变体可以包含与给定靶位点至少65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性，其中该活性变体保留生物活性，因此能够被Cpf1内切核酸酶识别和切割。

测量由内切核酸酶引起的靶位点的单链或双链断裂的测定是本领域已知的，并且通常测量试剂在包含识别位点的DNA底物上的总体活性和特异性。

当与于暴露于约28℃的温度的对照植物细胞的靶序列处的修饰的频率相比时，当靶向的植物细胞暴露于激活如本文描述的CPf1内切核酸酶的温度处理时，由本文描述的指导RNA/Cpf1内切核酸酶系统的活性引起的靶向的植物细胞的靶位点处的突变的频率会增加。28℃下，当与对照指导RNA/Cpf1内切核酸酶系统相比时，温度诱导的指导RNA/Cpf1内切核酸酶系统的增加的突变频率可以是至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少10倍、至少11倍、至少12倍、至少13倍、至少14倍、至少15倍、至少30倍、至少40倍、或至少50倍。

本文中的“前间区序列邻近基序”(PAM)是指与由指导多核苷酸/Cas内切核酸酶系统，例如本文描述的指导多核苷酸/Cpf1内切核酸酶系统识别(靶向)的靶序列(前间区)邻近的短核苷酸序列。如果靶DNA序列不在PAM序列后面，则Cpf1内切核酸酶可能无法成功识别该靶DNA序列。本文中的PAM的序列和长度可以取决于所使用的Cpf1蛋白或Cpf1蛋白复合物而不同。该PAM序列可以是任何长度，但典型地是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸长度。由Cpf1内切核酸酶识别的PAM序列位于靶位点的5’。

本文描述的指导多核苷酸Cpf1系统可以用于基因靶向。

术语“基因靶向”、“靶向”和“DNA靶向”在本文中可互换使用。本文中的DNA靶向可能是在特定的DNA序列(例如细胞的染色体或质粒)中特异性引入敲除、编辑、或敲入。通常，DNA靶向可以通过在具有与合适的多核苷酸组分缔合的Cpf1蛋白的细胞中的特异性DNA序列处切割一条或两条链来进行。一旦在DNA中诱导单链断裂或双链断裂，则细胞的DNA修复机制被激活来经由会导致靶位点处的修饰的非同源末端连接(NHEJ)、或同源定向修复(HDR)过程修复断裂。

术语“敲除”、“基因敲除”和“遗传敲除”在本文中可互换使用。敲除表示已经通过用Cpf1蛋白进行靶向使得细胞的DNA序列部分或完全无效；例如，这样的DNA序列在敲除之前可能已编码氨基酸序列，或可能已具有调节功能(例如启动子)。

如本文描述，指导Cpf1内切核酸酶可以识别、结合DNA靶序列，并且引入单链(切口)或双链断裂。一旦在DNA中诱导单链断裂或双链断裂，则细胞的DNA修复机制被激活来修复断裂。易错DNA修复机制可以在双链断裂位点处产生突变。来将断裂的末端结合在一起的最常见的修复机制是非同源末端连接(NHEJ)途径(Bleuyard等人，(2006)DNA Repair[DNA修复]5：1-12)。染色体的结构完整性通常通过修复来保存，但是缺失、插入或其他重排(例如染色体易位)是可能的(Siebert和Puchta，2002 Plant Cell[植物细胞]14：1121-31；Pacher等人，2007 Genetics[遗传学]175：21-9)。

在本公开的一个实施例中，该方法包括：一种用于在植物细胞的基因组中修饰靶序列的方法，该方法包括：a)将以下引入植物细胞：Cpf1内切核酸酶或编码Cpf1内切核酸酶的植物优化的多核苷酸、以及包含与植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸；以及b)在高于28℃的温度下，孵育该植物细胞至少约4hr的时段，其中该指导多核苷酸和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割。

在本公开的一个实施例中，该方法包括：一种用于在植物细胞的基因组中修饰靶序列的方法，该方法包括：a)将以下引入植物细胞：包含与植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸，该植物细胞在其基因组中包含重组DNA构建体，该重组DNA构建体包含有效地连接到编码Cpf1内切核酸酶的植物优化的多核苷酸的启动子；以及b)在高于28℃的温度下，孵育该植物细胞至少约4hr的时段，其中该指导多核苷酸和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割。

可以通过插入缺失(通过NHEJ在靶DNA序列中插入或缺失核苷酸碱基)，或通过特异性去除在靶向位点处或其附近处降低或完全破坏序列功能的序列来产生敲除。

指导多核苷酸/Cpf1内切核酸酶系统可以与至少一个多核苷酸修饰模板组合使用以允许编辑(修饰)目的基因组核苷酸序列。

“修饰的核苷酸”或“编辑的核苷酸”是指当与其非修饰的核苷酸序列相比时，包含至少一个改变的目的核苷酸序列。此类“改变”包括，例如：(i)至少一个核苷酸的替代，(ii)至少一个核苷酸的缺失，(iii)至少一个核苷酸的插入，或(iv)(i)-(iii)的任何组合。

术语“多核苷酸修饰模板”包括，当与待编辑的核苷酸序列相比时，包含至少一个核苷酸修饰的多核苷酸。核苷酸修饰可以是至少一个核苷酸取代、添加或缺失。任选地，多核苷酸修饰模板可以进一步包含位于至少一个核苷酸修饰侧翼的同源核苷酸序列，其中侧翼同源核苷酸序列为待编辑的希望的核苷酸序列提供了充足同源性。多核苷酸修饰模板包括单链或双链DNA分子。

在一个方面，多核苷酸修饰模板可以包含对错配低耐受性的DNA靶序列的区域中的至少一个错配。错配包括碱基单核苷酸多态性(碱基snip)、碱基改变(碱基插入、碱基缺失或碱基修饰)、核苷酸序列的插入、或其任何组合。

如本文描述，Cpf1内切核酸酶在对于指导RNA(crRNA)和互补DNA靶之间的错配具有高耐受性的区域中，切割其DNA靶位点。在位于+21、+22、+23和+24并且在PAM的3’的靶位点中的核苷酸位置可以与指导多核苷酸错配，并且仍导致在预期靶位点处的精确DNA切割。可以利用在起自与靶位点邻近的PAM序列的位置+1至+19(3’)处的低错配耐受性的区域来设计多核苷酸修饰模板，所述多核苷酸修饰模板可以在DNA靶位点中的低耐受性位置处(例如起自与靶位点邻近的PAM序列的位置+1至+19(3’)处)引入至少一个碱基改变(错配)连同在DNA靶的低耐受性区域之外的位置处引入希望的基因编辑。这样的设计会导致原始DNA靶识别被Cpf1内切核酸酶破坏，由此确保一旦已经发生希望的基因编辑，Cpf1内切核酸酶并不继续具有活性。如此，通过小心地设计如本文描述的多核苷酸修饰模板，一旦已经发生希望的编辑(如将至少一个错配引入DNA靶的低耐受性区域中)，技术人员可以减小CPf1活性，并且由此可以减少通过Cpf1内切核酸酶的脱靶切割。

在本公开的一个实施例中，该多核苷酸修饰模板是以下多核苷酸修饰模板：该多核苷酸修饰模板包含与DNA靶序列互补的至少一个区域，该DNA靶序列与由Cpf1复合物识别的PAM序列邻近，其中对应于DNA靶序列的至少一个区域与PAM序列的3’侧+1至+19的位置的DNA靶序列相比包含至少一个核苷酸错配。该多核苷酸修饰模板可以进一步包含区域中的修饰，该区域对应于PAM序列的3’侧+20至+21、+20至+22、+20至+23、+20至+24、+21至+22、+21至+23、+21至+24、+22至+23、+22至+24、+23至+24的位置的靶DNA序列。

在本公开的一个实施例中，该多核苷酸修饰模板是以下多核苷酸修饰模板：该多核苷酸修饰模板包含与DNA靶序列互补的至少一个区域，该DNA靶序列与由Cpf1复合物识别的PAM序列邻近，其中对应于DNA靶序列的至少一个区域与PAM序列的3’侧+2至+19、+3至+19、+4至+19、+5至+19、+6至+19、+7至+19、+8至+19、+9至+19、+10至+19、+11至+19、+12至+19、+13至+19、+14至+19、+15至+19、+16至+19、+17至+19、+18至+19、+19至+19的位置的DNA靶序列相比包含至少一个核苷酸错配。该多核苷酸修饰模板可以进一步在对应于PAM序列的3’侧+20至+24的位置的靶DNA序列的区域中包含修饰。

在本公开的一个实施例中，该多核苷酸修饰模板是以下多核苷酸修饰模板：该多核苷酸修饰模板包含与DNA靶序列互补的至少一个区域，该DNA靶序列与由Cpf1复合物识别的PAM序列邻近，其中对应于DNA靶序列的至少一个区域与PAM序列的3’侧+1至+19、+2至+19、+3至+19、+4至+19、+5至+19、+6至+19、+7至+19、+8至+19、+9至+19、+10至+19、+11至+19、+12至+19、+13至+19、+14至+19、+15至+19、+16至+19、+17至+19、+18至+19、+19至+19的位置的DNA靶序列相比包含至少一个核苷酸错配。该多核苷酸修饰模板可以进一步包含区域中的修饰，该区域对应于PAM序列的3’侧+20至+21、+20至+22、+20至+23、+20至+24、+21至+22、+21至+23、+21至+24、+22至+23、+22至+24、+23至+24的位置的靶DNA序列。

在一个方面，与PAM序列的3’侧+1至+19的位置的DNA靶序列相比，该多核苷酸修饰模板包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18或更多个核苷酸错配。

在本公开的一个实施例中，该多核苷酸修饰模板是以下多核苷酸修饰模板：该多核苷酸修饰模板包含与DNA靶序列互补的至少一个区域，该DNA靶序列与由Cpf1复合物识别的PAM序列邻近，其中对应于DNA靶序列的至少一个区域与PAM序列的3’侧+1至+19、+2至+19、+3至+19、+4至+19、+5至+19、+6至+19、+7至+19、+8至+19、+9至+19、+10至+19、+11至+19、+12至+19、+13至+19、+14至+19、+15至+19、+16至+19、+17至+19、+18至+19、+19至+19的位置的DNA靶序列相比包含至少一个核苷酸错配。该多核苷酸修饰模板可以进一步包含区域中的至少一个核苷酸插入，该区域对应于PAM序列的3’侧+20至+21、+20至+22、+20至+23、+20至+24、+21至+22、+21至+23、+21至+24、+22至+23、+22至+24、+23至+24的位置的靶DNA序列。

在本公开的一个实施例中，该多核苷酸修饰模板是以下多核苷酸修饰模板：该多核苷酸修饰模板包含与DNA靶序列互补的至少一个区域，该DNA靶序列与由Cpf1复合物识别的PAM序列邻近，其中对应于DNA靶序列的至少一个区域与PAM序列的3’侧+1至+19、+2至+19、+3至+19、+4至+19、+5至+19、+6至+19、+7至+19、+8至+19、+9至+19、+10至+19、+11至+19、+12至+19、+13至+19、+14至+19、+15至+19、+16至+19、+17至+19、+18至+19、+19至+19的位置的DNA靶序列相比包含至少一个核苷酸错配。该多核苷酸修饰模板可以进一步包含与植物的基因组中的核苷酸序列互补的第二DNA区域，其中该多核苷酸修饰模板包含该核苷酸序列的至少一个核苷酸修饰。在一个方面，多核苷酸修饰模板进一步包含第一侧翼区和第二侧翼区，其中该第一和第二侧翼区位于靶DNA序列侧翼并且能够指导同源定向修复。

在一个方面，该多核苷酸修饰模板以下多核苷酸修饰模板：该多核苷酸修饰模板包含与DNA靶序列互补的至少一个区域，该DNA靶序列与由Cpf1复合物识别的PAM序列邻近，其中对应于DNA靶序列的至少一个区域与PAM序列的3’侧+1至+19的位置的DNA靶序列相比包含至少一个核苷酸错配，其中该错配是由PAM序列的3’侧+1至+19的位置中的至少一个核苷酸插入或至少一个多核苷酸插入引起的。在一些方面，多核苷酸插入可以是本文描述的目的多核苷酸的插入。

在一个方面，多核苷酸修饰模板选自由以下组成的组：SEQ ID NO：23、24和25。

在本公开的一个实施例中，该方法包括：一种用于在植物细胞的基因组中编辑核苷酸序列的方法，该方法包括；a)将以下引入植物细胞：Cpf1内切核酸酶或编码Cpf1内切核酸酶的植物优化的多核苷酸、包含与植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸、以及多核苷酸修饰模板，其中该多核苷酸修饰模板包含核苷酸序列的至少一个核苷酸修饰；以及b)在高于28℃的温度下，孵育该植物细胞至少约4hr的时段，其中该指导多核苷酸和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列的全部或一部分进行识别、结合、并且任选地产生切口或进行切割。

待编辑的核苷酸可以位于由Cpf1内切核酸酶识别和切割的靶位点的内部或外部。在一个实施例中，该至少一个核苷酸修饰不是由Cpf1内切核酸酶识别和切割的靶位点处的修饰。在另一个实施例中，该待编辑的至少一个核苷酸和基因组靶位点之间有至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、30、40、50、100、200、300、400、500、600、700、900或1000个核苷酸。

在本公开的一个实施例中，该方法包括：一种用于在植物细胞的基因组中编辑核苷酸序列的方法，该方法包括；a)将以下引入植物细胞：多核苷酸修饰模板和包含与植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸，该植物细胞在其基因组中包含重组DNA构建体，该重组DNA构建体包含有效地连接到编码Cpf1内切核酸酶的植物优化的多核苷酸的启动子，其中该多核苷酸修饰模板包含核苷酸序列的至少一个核苷酸修饰；以及b)在高于28℃的温度下，孵育该植物细胞至少约4hr的时段，其中该指导多核苷酸和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割。

在本公开的一个实施例中，该方法包括用于在植物或植物细胞的基因组中编辑核苷酸序列，该方法包括；a)将多核苷酸修饰模板引入在其基因组中包含第一重组DNA构建体和第二重组DNA构建体的植物或植物细胞，该第一重组DNA构建体包含有效地连接到编码Cpf1内切核酸酶的植物优化的多核苷酸的启动子，该第二重组DNA构建体包含有效地连接到编码指导RNA的核苷酸序列的启动子，其中该指导RNA和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割；以及b)在高于28℃的温度下，孵育该植物细胞至少约4hr的时段，其中该指导RNA和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割。

术语“敲入”、“基因敲入”、“基因插入”和“遗传敲入”在本文中可互换使用。敲入代表通过用Cpf1蛋白(例如通过同源重组(HR)，其中还使用适合的供体DNA多核苷酸)靶向在细胞中的特异性DNA序列处进行的DNA序列的替换或插入。敲入的实例是异源氨基酸编码序列在基因的编码区中的特异性插入，或转录调节元件在遗传基因座中的特异性插入。

可以采用不同方法和组合物来获得细胞或生物体，该细胞或生物体具有插入针对Cpf1内切核酸酶的靶位点中的目的多核苷酸。此类方法可以采用同源重组(HR)以提供目的多核苷酸在靶位点处的整合。在本公开的一个方面，经由供体DNA构建体，将目的多核苷酸引入生物体细胞。如本文使用，“供体DNA”是包括待插入到Cpf1内切核酸酶的靶位点的目的多核苷酸的DNA构建体。供体DNA构建体进一步包含位于目的多核苷酸侧翼的同源的第一区域和第二区域。供体DNA的同源的第一区域和第二区域分别与存在于细胞或生物体基因组的靶位点中或位于该靶位点侧翼的第一和第二基因组区域共享同源性。

在本公开的一个实施例中，该方法包括：一种用于将目的多核苷酸引入植物细胞的基因组中的方法，该方法包括；a)将以下引入植物细胞：Cpf1内切核酸酶或编码Cpf1内切核酸酶的植物优化的多核苷酸、包含与植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸，以及供体DNA，其中该供体DNA包含目的多核苷酸；以及b)在高于28℃的温度下，孵育该植物细胞至少约4hr的时段，其中该指导多核苷酸和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列的全部或一部分进行识别、结合、并且任选地产生切口或进行切割。目的多核苷酸可以被整合在由Cpf1内切核酸酶识别和切割的靶位点的内部或外部。

在本公开的一个实施例中，该方法包括：一种用于将目的多核苷酸引入植物细胞的基因组中的方法，该方法包括；a)将以下引入植物细胞：供体DNA和包含与植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸，该植物细胞在其基因组中包含重组DNA构建体，该重组DNA构建体包含有效地连接到编码Cpf1内切核酸酶的植物优化的多核苷酸的启动子，其中该多核苷酸修饰模板包含核苷酸序列的至少一个核苷酸修饰；以及b)在高于28℃的温度下，孵育该植物细胞至少约4hr的时段，其中该供体DNA包含目的多核苷酸，其中该指导多核苷酸和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割。

在本公开的一个实施例中，该方法包括用于将目的多核苷酸引入植物细胞的基因组中，该方法包括；a)将供体DNA引入在其基因组中包含第一重组DNA构建体和第二重组DNA构建体的植物或植物细胞，该第一重组DNA构建体包含有效地连接到编码Cpf1内切核酸酶的植物优化的多核苷酸的启动子，该第二重组DNA构建体包含有效地连接到编码指导RNA的核苷酸序列的启动子，其中该供体DNA包含目的多核苷酸，其中该指导RNA和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割；以及b)在高于28℃的温度下，孵育该植物细胞至少约4hr的时段，其中该指导RNA和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割。该方法可以进一步包括鉴定在其基因组中包含整合到该靶序列中或其附近的目的多核苷酸的至少一个植物细胞。

供体DNA可以与指导多核苷酸进行系链。系链的供体DNA可以允许共定位靶标和供体DNA，可用于基因组编辑、基因插入和靶向的基因组调控，并且还可以用于靶向有丝分裂后期细胞，在这些细胞中内源性HR机制的功能预计会大大降低(Mali等人2013NatureMethods[自然方法]第10卷：957-963)。

还可以将附加体DNA分子连接至双链断裂中，例如，将T-DNA整合至染色体双链断裂中(Chilton和Que，(2003)Plant Physiol[植物生理学]133：956-65；Salomon和Puchta，(1998)EMBO J[欧洲分子生物学学会杂志]17：6086-95)。一旦双链断裂周围的序列被改变，例如被涉及双链断裂的成熟的外切核酸酶活性改变，则基因转换途径可以恢复原始结构，如果有同源序列的话，例如非分裂的体细胞中的同源染色体，或DNA复制后的姊妹染色单体(Molinier等人，(2004)Plant Cell[植物细胞]16：342-52)。异位的和/或表观遗传的DNA序列还可以充当用于同源重组的DNA修复模板(多核苷酸修饰模板)(Puchta，(1999)Genetics[遗传学]152：1173-81)。

同源-定向修复(HDR)是在细胞中用来修复双链DNA和单链DNA断裂的机制。同源-定向修复包括同源重组(HR)和单链退火(SSA)(Lieber.2010 Annu.Rev.Biochem[生物化学年鉴].79：181-211)。HDR的最常见形式称为同源重组(HR)，其在供体和受体DNA之间具有最长的序列同源性要求。HDR的其他形式包括单链退火(SSA)和断裂诱导的复制，并且这些需要相对于HR更短的序列同源性。缺口(单链断裂)处的同源-定向修复可以经由与在双链断裂处的HDR不同的机制发生(Davis和Maizels.PNAS[美国国家科学院院刊](0027-8424)，111(10)，第E924-E932页)。

“同源”意指DNA序列是类似的。例如，在供体DNA上发现的“与基因组区域同源的区域”是与细胞或生物体基因组中给定的“基因组序列”具有类似序列的DNA的区域。同源的区域可以具有足以促进在切割的靶位点处的同源重组的任何长度。例如，同源的区域的长度可以包括至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-2800、5-2900、5-3000、5-3100或更多个碱基，这样使得同源的区域具有足够的同源性以与相应的基因组区域进行同源重组。“足够的同源性”表示两个多核苷酸序列具有足够的结构相似性以充当同源重组反应的底物。结构相似性包括每个多核苷酸片段的总长度以及多核苷酸的序列相似性。序列相似性可以通过在序列的整个长度上的百分比序列同一性和/或通过包含局部相似性(例如具有100％序列同一性的连续核苷酸)的保守区域以及在序列长度的一部分上的百分比序列同一性来描述。

由靶标和供体多核苷酸共享的同源性或序列同一性的量可以变化，并且包括总长度和/或在约1-20bp、20-50bp、50-100bp、75-150bp、100-250bp、150-300bp、200-400bp、250-500bp、300-600bp、350-750bp、400-800bp、450-900bp、500-1000bp、600-1250bp、700-1500bp、800-1750bp、900-2000bp、1-2.5kb、1.5-3kb、2-4kb、2.5-5kb、3-6kb、3.5-7kb、4-8kb、5-10kb、或多达并包括靶位点的总长度的范围内具有单位整数值的区域。这些范围包括该范围内的每个整数，例如1-20bp的范围包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19和20bp。同源性的量也可以通过在两个多核苷酸的完整比对长度上的百分比序列同一性来描述，其包括约至少50％、55％、60％、65％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的百分比序列同一性。足够的同源性包括多核苷酸长度、总体百分比序列同一性，和任选地连续核苷酸的保守区域或局部百分比序列同一性的任何组合，例如，足够的同源性可以被描述为与靶标基因座的区域具有至少80％序列同一性的75-150bp的区域。还可以通过用来在高严格条件下特异性杂交的两个多核苷酸的预测能力来描述足够的同源性，参见例如Sambrook等人，(1989)Molecular Cloning：A Laboratory Manual[分子克隆：实验室手册](Cold Spring HarborLaboratory Press，NY[纽约冷泉港实验室出版社])；Current Protocols in MolecularBiology[分子生物学现代方案]，Ausubel等人，编辑(1994)Current Protocols[实验室指南](Greene Publishing Associates，Inc.[格林出版合伙公司]和John Wiley&Sons，Inc.[约翰威利父子公司])；以及Tijssen(1993)Laboratory Techniques in Biochemistryand Molecular Biology--Hybridization with Nucleic Acid Probes[生物化学和分子生物学中的实验室技术--与核酸探针杂交](Elsevier[爱思唯尔出版社]，纽约)。

如本文使用，“基因组区域”是存在于靶位点任一侧上的细胞的基因组中的染色体的区段，或者可替代地，还包含靶位点的一部分。基因组区域可以包含至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-2800、5-2900、5-3000、5-3100或更多个碱基，使得基因组区域具有足够的同源性以与相应的同源的区域进行同源重组。

在给定的基因组区域和在供体DNA上发现的相应的同源的区域之间的结构相似性可以是允许同源重组发生的任何程度的序列同一性。例如，由供体DNA的“同源的区域”和生物体基因组的“基因组区域”共享的同源性或序列同一性的量可以是至少50％、55％、60％、65％、70％、75％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性，这样使得序列进行同源重组。

供体DNA上的同源的区域可以与靶位点侧翼的任何序列具有同源性。虽然在一些情况下，同源的区域与紧邻靶位点侧翼的基因组序列共享显著的序列同源性，但是应当认识到同源的区域可以被设计为与可能更靠近靶位点的5’或3’的区域具有足够的同源性。同源的区域还可以与靶位点的片段以及下游基因组区域具有同源性。

在一个实施例中，第一同源的区域进一步包含靶位点中的第一片段，并且第二同源的区域包含靶位点中的第二片段，其中第一片段和第二片段不同。

如本文使用，“同源重组”包括在同源的位点处的两个DNA分子之间的DNA片段的交换。同源重组的频率受多个因素影响。不同的生物体相对于同源重组的量和同源与非同源重组的相对比例而变化。通常，同源的区域的长度影响同源重组事件的频率：同源的区域越长，频率越高。为观察同源重组而需要的同源区域的长度也是随物种而异的。在许多情况下，已经利用了至少5kb的同源性，但已经观察到具有仅25-50bp的同源性的同源重组。参见，例如，Singer等人，(1982)Cell[细胞]31：25-33；Shen和Huang，(1986)Genetics[遗传学]112：441-57；Watt等人，(1985)Proc.Natl.Acad.Sci.USA[美国科学院院报]82：4768-72；Sugawara和Haber，(1992)Mol Cell Biol[分子细胞生物学]12：563-75；Rubnitz和Subramani，(1984)Mol Cell Biol[分子细胞生物学]4：2253-8；Ayares等人，(1986)Proc.Natl.Acad.Sci.USA[美国科学院院报]83：5199-203；Liskay等人，(1987)Genetics[遗传学]115：161-7。

植物细胞的基因组的改变，例如通过同源重组(HR)，其是对于遗传工程而言的有力工具。已经证明了在植物中(Halfter等人，(1992)Mol Gen Genet[分子和普通遗传学]231：186-93)和昆虫中(Dray和Gloor，1997，Genetics[遗传学]147：689-99)的同源重组。在其他生物体中也可以实现同源重组。例如，在寄生原生动物利什曼原虫中，至少需要150-200bp的同源性进行同源重组(Papadopoulou和Dumas，(1997)Nucleic Acids Res[核酸研究]25：4278-86)。在丝状真菌构巢曲霉中，已经用仅50bp侧翼同源性实现基因置换(Chaveroche等人，(2000)Nucleic Acids Res[核酸研究]28：e97)。在纤毛虫嗜热四膜虫中也已经证明了靶向基因置换(Gaertig等人，(1994)Nucleic Acids Res[核酸研究]22：5391-8)。在哺乳动物中，使用可以在培养基中生长、转化、选择、和引入小鼠胚胎中的多能胚胎干细胞系(ES)，同源重组在小鼠中已经是最成功的(Watson等人，(1992)RecombinantDNA[重组DNA]，第2版，(Scientific American Books distributed by WH Freeman&Co.[由WH Freeman&Co.公司发行的科学美国人图书])。

DNA双链断裂似乎是刺激同源重组途径的有效因子(Puchta等人，(1995)PlantMol Biol[植物分子生物学]28：281-92；Tzfira和White，(2005)Trends Biotechnol[生物技术趋势]23：567-9；Puchta，(2005)J Exp Bot[实验植物学杂志]56：1-14)。使用DNA断裂剂，在植物中的人工构建的同源DNA重复序列之间观察到同源重组的两倍至九倍的增加(Puchta等人，(1995)Plant Mol Biol[植物分子生物学]28：281-92)。在玉蜀黍原生质体中，用线状DNA进行的实验证实了在质粒之间增强的同源重组(Lyznik等人，(1991)Mol GenGenet[分子和普通遗传学]230：209-18)。

本领域技术人员可以按与使用指导的Cas9内切核酸酶系统类似的方式，使用指导的Cpf1内切核酸酶系统用于本领域已知的任何用途，例如但不限于修饰或置换目的核苷酸序列(例如调节元件)，复用(同时靶向两个或更多个DNA靶位点)、目的多核苷酸的插入和或堆叠、基因敲除、基因敲入、剪接位点的修饰和/或引入交替剪接位点、编码目的蛋白的核苷酸序列的修饰、氨基酸和/或蛋白质融合、以及通过在目的基因中表达反向重复序列引起的基因沉默。(2015年3月19日公开的美国专利申请US 2015-0082478 A1、2015年2月26日公开的WO2015/026886 A1、2015年2月26日公开的US 2015-0059010 A1、2014年7月7日提交的美国申请62/023246、2013年3月14日公开的WO2012/129373、和2013年1月24日公开的PCT/US13/22891、以及2014年8月13日提交的美国申请62/036,652，将其全部通过引用结合在此)。

如本文描述的指导多核苷酸/Cpf1系统还可以在用于按如在2013年3月14日公开的W02012/129373中公开的类似的方式指导转基因插入和/或用于产生包含多个转基因的复合转基因性状基因座的方法中使用，其中使用如本文公开的指导多核苷酸/Cpf1系统来代替使用双链断裂诱导剂，以引入目的基因。复杂性状基因座包括具有彼此遗传连锁的多个转基因的基因组基因座。通过将独立的转基因插入在彼此的0.1、0.2、0.3、0.4、0.5、1.0、2、或甚至5厘摩(cM)内，这些转基因可以作为单个遗传基因座进行育种(参见，例如，美国专利申请13/427,138或PCT申请PCT/US2012/030061)。在选择包含转基因的植物后，可以将包含(至少)一个转基因的植物进行杂交从而形成包含全部两个转基因的F1。在来自这些F1(F2或BC1)的子代中，1/500的子代将具有重组在相同的染色体上的两个不同的转基因。然后，可以将复合物基因座繁育为具有全部两个转基因性状的单遗传基因座。可以重复该过程以堆叠尽可能多的性状。

指导多核苷酸/Cpf1内切核酸酶复合物的任何一个组分、指导多核苷酸/Cpf1内切核酸酶复合物自身、连同一个或多个多核苷酸修饰模板和/或一个或多个DNA供体，可以通过本领域已知的任何方法，被引入到细胞中。

“引入”旨在意指以这样一种方式将多核苷酸或多肽或多核苷酸-蛋白复合物提供于生物体，例如细胞或生物体中，以致于这一种或多种组分得以进入该生物体的细胞的内部或进入细胞自身。这些方法不取决于用于将序列引入生物体或细胞中的具体方法，只要多核苷酸或多肽进入生物体的至少一个细胞的内部即可。引入包括提到将核酸合并到真核细胞或原核细胞中，其中核酸可以被并入细胞的基因组中，并且包括提到核酸、蛋白或多核苷酸-蛋白复合物(PGEN)被瞬时(直接)提供至细胞中。

用于将多核苷酸或多肽或多核苷酸-蛋白复合物引入细胞或生物体的方法是本领域已知的，并且包括但不限于显微注射、电穿孔、稳定转化方法、瞬时转化方法、弹道粒子加速(粒子轰击)、晶须介导的转化、农杆菌介导的转化、直接基因转移、病毒介导的引入、转染、转导、细胞穿透肽、介孔二氧化硅纳米粒子(MSN)-介导的直接蛋白质递送、局部应用、有性杂交、有性育种、及其任何组合。

例如可以将指导多核苷酸(指导RNA、指导DNA、指导RNA-DNA多核苷酸)作为单链或双链多核苷酸分子直接引入细胞(瞬时地)。指导RNA还可以通过引入包含编码指导RNA的异源核酸片段的重组DNA分子被间接引入细胞中，该指导RNA与能够在该细胞中转录该指导RNA的启动子有效地连接。启动子可以是但不限于RNA聚合酶III启动子，其允许具有精确定义的未修饰的5’-和3’-末端的RNA转录(Ma等人，2014，Mol.Ther.Nucleic Acids[分子治疗-核酸]3：e161；DiCarlo等人，2013，Nucleic Acids Res.[核酸研究]41：4336-4343；2015年2月26日公开的WO2015026887)。可以使用能够在细胞中转录指导RNA的任何启动子，并且这些启动子包括有效地连接到编码指导RNA的核苷酸序列的热休克/热可诱导的启动子。

可以通过使用本领域已知的任何方法直接引入Cpf1蛋白自身(称为Cpf1内切核酸酶的直接递送)、编码Cpf1蛋白的mRNA、和/或指导多核苷酸/Cpf1内切核酸酶复合物自身(也称为多核蛋白复合物、多核苷酸蛋白复合物、或PNP复合物)而将Cpf1内切核酸酶引入细胞。还可以通过引入包含有效地连接到编码植物优化的Cpf1内切核酸酶的核苷酸序列的启动子的重组DNA构建体而将Cpf1内切核酸酶间接引入细胞。包含有效地连接到编码植物优化的Cpf1内切核酸酶的核苷酸序列的启动子的重组DNA构建体可以稳定地整合到植物的基因组中。使用本领域已知的任何方法，可以瞬时地将内切核酸酶引入细胞，或将内切核酸酶并入植物细胞的基因组中。可以用如在2016年5月12日公开的WO 2016/073433中描述的细胞穿透肽(CPP)，促进内切核酸酶和/或指导的多核苷酸摄取进入细胞。可以使用能够在细胞中表达Cpf1内切核酸酶的任何启动子，并且这些启动子包括有效地连接到编码Cpf1内切核酸酶的核苷酸序列的热休克/热可诱导的启动子。

可以通过粒子介导的递送将多核苷酸修饰模板直接递送到植物细胞中。基于本文所述的实验，技术人员现在可以预想任何其他直接递送方法(例如但不限于聚乙二醇(PEG)介导的对原生质体的转染、晶须介导的转化、电穿孔、粒子轰击、细胞穿透肽或介孔二氧化硅纳米粒子(MSN)介导的直接蛋白质递送)都可以成功用于将多核苷酸修饰模板递送到植物细胞中。

可以通过本领域已知的任何手段引入供体DNA。可以通过本领域已知的任何转化方法(包括，例如农杆菌介导的转化或生物射弹粒子轰击)提供供体DNA。该供体DNA可以瞬时地存在于细胞中，或可以经由病毒复制子引入。在Cpf1内切核酸酶和靶位点的存在下，供体DNA被插入到转化植物的基因组中。

这些指导的Cpf1系统组分中的任一个的直接递送可以伴随着可以促进接受指导多核苷酸/Cpf1内切核酸酶复合物组分的细胞的富集和/或可视化的其他mRNA的直接递送(共递送)。例如，指导多核苷酸/Cpf1内切核酸酶组分(和/或指导多核苷酸/Cpf1内切核酸酶复合物自身)连同编码表型标记(例如但不限于转录激活子，例如CRC(Bruce等人，2000The Plant Cell[植物细胞]12：65-79))的mRNA的直接共递送可以使得能够选择和富集表达指导多核苷酸/Cpf1内切核酸酶组分的细胞，而不需要稳定地引入可选择地、表型的或可筛选的标记到细胞中。

用于在植物或植物细胞中引入多核苷酸、多肽或多核苷酸-蛋白复合物(PGEN)的方案是已知的并且包括显微注射(Crossway等人，(1986)Biotechniques[生物技术]4：320-34和美国专利号6,300,543)；分生组织转化(美国专利号5,736,369)；电穿孔(Riggs等人，(1986)Proc.Natl.Acad.Sci.USA[美国科学院院报]83：5602-6)；农杆菌介导的转化(美国专利号5,563,055和5,981,840)；晶须介导的转化(Ainlev等人2013，Plant BiotechnologyJournal[植物生物技术杂志]11：1126-1134；Shaheen A.和M.Arshad 2011 Propertiesand Applications of Silicon Carbide[碳化硅的特性和应用](2011)，345-358，编辑：Gerhardt，Rosario.，出版商：印天科技公司(InTech)，里耶卡(Riieka)，克罗地亚(Croatia)，代码：69PQBP；ISBN：978-953-307-201-2)；直接基因转移(Paszkowski等人，(1984)EMBO J[欧洲分子生物学学会杂志]3：2717-22)；以及弹道粒子加速(美国专利号4,945,050；5,879,918；5,886,244；5,932,782；Tomes等人，(1995)“Direct DNA Transferinto Intact Plant Cells via Microprojectile Bombardment”[经由微粒轰击将DNA直接转移到完整植物细胞中]在Plant Cell，Tissue，and Organ Culture：FundamentalMethods[植物细胞、组织和器官培养：基本方法]，编辑Gamborg和Phillips(Springer-Verlag，Berlin[柏林施普林格出版社)；McCabe等人(1988)Biotechnology[生物技术]6：923-6；Weissinger等人，(1988)Ann Rev Genet[遗传学年鉴]22：421-77；Sanford等人，(1987)Particulate Science and Technology[微粒科学与技术]5：27-37(洋葱)；Christou等人，(1988)Plant Physiol[植物生理学]87：671-4(大豆)；Finer和McMullen，(1991)In Vitro Cell Dev Biol[体外细胞与发育生物学]27P：175-82(大豆)；Singh等人，(1998)Theor Appl Genet[理论与应用遗传学]96：319-24(大豆)；Datta等人，(1990)Biotechnology[生物技术]8：736-40(稻)；Klein等人，(1988)Proc.Natl.Acad.Sci.USA[美国科学院院报]85：4305-9(玉蜀黍)；Klein等人，(1988)Biotechnology[生物技术]6：559-63(玉蜀黍)；美国专利号5,240,855；5,322,783和5,324,646；Klein等人，(1988)PlantPhysiol[植物生理学]91：440-4(玉蜀黍)；Fromm等人，(1990)Biotechnology[生物技术]8：833-9(玉蜀黍)；Hooykaas-Van Slogteren等人，(1984)Nature[自然]311：763-4；美国专利号5,736,369(谷类)；Bytebier等人，(1987)Proc.Natl.Acad.Sci.USA[美国科学院院报]84：5345-9(百合科(Liliaceae))；De Wet等人，(1985)在The Experimental Manipulationof Ovule Tissues[胚珠组织的实验操作]中，编辑Chapman等人，(Longman，New York[纽约朗文出版社])，第197-209页(花粉)；Kaeppler等人，(1990)Plant Cell Rep[植物细胞报告]9：415-8)以及Kaeppler等人，(1992)Theor Appl Genet[理论与应用遗传学]84：560-6(晶须介导的转化)；D’Halluin等人，(1992)Plant Cell[植物细胞]4：1495-505(电穿孔)；Li等人，(1993)Plant Cell Rep[植物细胞报告]12：250-5；Christou和Ford(1995)AnnalsBotany[植物学年鉴]75：407-13(稻)以及Osjoda等人，(1996)Nat Biotechnol自然生物技术]14：745-50(经由根癌农杆菌转化的玉蜀黍)。

可替代地，可以通过使细胞或生物体与病毒或病毒核酸接触来将多核苷酸引入植物或植物细胞中。通常，此类方法涉及将多核苷酸掺入病毒DNA或RNA分子内。在一些实例中，可以最初将目的多肽作为病毒多聚蛋白的一部分合成，然后将合成的多肽在体内或在体外通过蛋白水解加工从而产生所希望的重组蛋白。用于将多核苷酸引入植物，并且表达在其中编码的蛋白质(涉及病毒DNA或RNA分子)的方法是已知的，参见例如，美国专利号5,889,191、5,889,190、5,866,785、5,589,367、以及5,316,931。

可以使用多种瞬时转化方法，将多核苷酸或重组DNA构建体提供至或引入植物细胞中。这种瞬时转化法包括但不限于将多核苷酸构建体直接引入植物中。

可以通过任何方法将核酸和蛋白质提供给细胞，所述方法包括使用分子来促进指导的Cpf1系统(蛋白质和/或核酸)的任何或所有组分(例如细胞穿透肽和纳米载体)的摄取的方法。还参见US20110035836 Nanocarrier based plant transfection andtransduction[基于植物转染和转导的纳米载体]，和EP 2821486 A1 Method ofintroducing nucleic acid into plant cells[将核酸引入植物细胞中的方法]，通过引用结合在此。

可以使用将多核苷酸引入植物或植物部分的其他方法，包括质体转化方法，以及用于将多核苷酸引入来自幼苗或成熟种子的组织中的方法。

“稳定转化”旨在表示经引入生物体中的核苷酸构建体合并到该生物体的基因组中，并且能够被其子代遗传。“瞬时转化”旨在表示将多核苷酸引入该生物体中并且不合并到该生物体的基因组中，或者将多肽引入生物体中。瞬时转化表明所引入的组合物仅在生物体中暂时表达或存在。

影响植物的农杆菌介导的转化的因素是本领域熟知的(回顾参见Cheng等人，2004，In vitro Cell.Dev.Biol.Plant[体外细胞和发育生物学-植物]40：31-45)。通常在低于30℃的温度(室温)下，进行植物转化和生长。发现对于双子叶植物中的T-DNA递送，22℃的温度是最佳的。在特定外植体和农杆菌菌株中，对于T-DNA递送和对于稳定转化(植物细胞和农杆菌的共培养)而言，最佳温度可以变化，但是通常范围是从23-25℃(室温)(Cheng等人，2004，In vitro Cell.Dev.Biol.Plant[体外细胞和发育生物学-植物]40：31-45；Methods in Molecular Biology.[分子生物学方法]Kang Wang编辑，AgrobacteriumProtocols[农杆菌方案]卷1-2，2015)。已经通过农杆菌和未成熟胚在20℃下的共培养，随后是28℃的传代培养，从近交系获得转基因玉蜀黍植物(Gordon-Kamm等人，2002，PNAS卷99(18期)11975-11980)。

玉蜀黍细胞的粒子介导的轰击通常随后是使轰击的组织保持在室温下，在培养基上大约4小时，随后是在25℃至约28℃之间的温度下的传代培养(组织转移到新培养基)(2002年4月11日公开的US2002/0042929)。

如本文描述，可以将Cpf1内切核酸酶用于修饰植物细胞或植物的基因组中的靶序列。在一个方面，此文件特征是一种用于在植物细胞或植物的基因组中修饰靶序列的方法。该方法可以包括a)将以下引入包含靶序列的植物细胞：Cpf1内切核酸酶或编码Cpf1内切核酸酶的植物优化的多核苷酸、以及包含与植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸；以及b)在高于28℃的温度下，孵育该植物细胞至少约4hr的时段，其中该指导多核苷酸和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割。该方法还可以包括：a)将以下引入植物细胞：包含与植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸，该植物细胞在其基因组中包含重组DNA构建体，该重组DNA构建体包含有效地连接到编码Cpf1内切核酸酶的植物优化的多核苷酸的启动子；以及b)在高于28℃的温度下，孵育该植物细胞至少约4hr的时段，其中该指导多核苷酸和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割。该方法还可以包括：a)获得包含第一重组DNA构建体和第二重组DNA构建体的植物，该第一重组DNA构建体包含有效地连接到编码Cpf1内切核酸酶的植物优化的多核苷酸的启动子，该第二重组DNA构建体包含有效地连接到编码指导RNA的核苷酸序列的启动子，其中该指导RNA和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割；以及，

b)以及在高于28℃的温度下，孵育该植物细胞至少约4hr的时段，其中该指导RNA和Cpf1内切核酸酶能够形成复合物，该复合物可以对该靶序列进行识别、结合、并且任选地产生切口或进行切割。

可以在至少29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃或45℃的温度下孵育植物细胞、植物或子代植物至少约10min、20min、30min、40min、50min、1hr、2hr、3hr、4hr、5hr、6hr、7hr、8hr、9hr、10hr、11hr、12hr、13hr、14hr、15hrs、16hr、17hrs、18hrs、19hr、20hr、21hr、22hr、23hr、24hrs、25hr、26hr、27hr、28hr、29hr、30hr、31hr、32hr、33hr、34hr、35hr、36hr、37hr、38hrs、39hr、40hr、41hrs、42hr、43hr，44hr、45hr、46hr、47hr、48hr到至少3、4、5、6、7天、到至少1、2、3、4、5周、或到至少多个月的时段。

可以在植物细胞、植物胚和/或植物的任何发育阶段，将植物细胞暴露于高于28℃的温度。例如，用于修饰植物的基因组中的靶序列的方法可以包括，获得包含至少一种Cpf1内切核酸酶(或表达Cpf1内切核酸酶的重组构建体)和指导RNA(和/或表达指导RNA的重组构建体)的植物，该指导RNA包含与植物基因组中的靶序列基本上互补的可变靶向结构域；以及b、)在植物发育的特定阶段，例如但不限于在花粉产生和发育的发育阶段期间，在高于28℃的温度下，孵育植物约至少4hr的时段。还可以将包含Cpf1内切核酸酶(或表达该Cpf1内切核酸酶的重组构建体)和指导RNA(和/或表达该指导RNA的重组构建体)的植物的子代暴露于升高的温度(至少29℃)，由此激活子代植物内的指导RNA/Cpf1复合物(在发育期间的希望的阶段)，这允许子代植物在由该指导RNA/Cpf1内切核酸酶复合物识别的特定靶位点处被修饰。

在本文中进一步描述了目的多核苷酸，并且包括反映涉及作物发育的那些的商业市场和利益的多核苷酸。感兴趣的作物和市场发生变化，以及随着发展中国家打开国际市场，新作物和技术也将出现。此外，随着我们对农学性状和特征(例如产量和杂种优势增加)的理解逐渐深入，对用于遗传工程的基因的选择将会相应变化。

目的多核苷酸包括但不限于编码对农艺学、除草剂-抗性、杀昆虫抗性、疾病抗性、线虫抗性、除草剂抗性、微生物抗性、真菌抗性、病毒抗性、能育性或不育性、谷粒特征、和商业产品而言重要的性状的多核苷酸。

目的多核苷酸的一般类别包括，例如涉及信息的那些目的基因(例如锌指)，涉及通讯的那些基因(例如激酶)，以及涉及管家的那些基因(例如热休克蛋白)。更具体的目的多核苷酸包括但不限于：涉及作物产量、谷粒质量、作物营养成分、淀粉和碳水化合物质量和数量的基因、连同及影响籽粒大小、蔗糖载量、蛋白质量和数量、固氮和/或氮利用、脂肪酸和油组成的那些基因、编码赋予对非生物胁迫(例如干旱、氮、温度、盐度、毒性金属、或痕量元素)的抗性的蛋白质，或赋予对毒素(例如杀有害生物剂和除草剂)的抗性的那些蛋白质的基因、编码赋予对生物胁迫(例如真菌、病毒、细菌、昆虫和线虫的攻击以及与这些生物体相关的疾病的发展)的抗性的蛋白质的基因。

除了使用传统的育种方法之外，还可通过遗传方式改变农学上重要的性状(例如油、淀粉、和蛋白质含量)。修饰包括增加油酸、饱和及不饱和油的含量、增加赖氨酸和硫的水平、提供必需氨基酸、以及还有对淀粉的修饰。在美国专利号5,703,049、5,885,801、5,885,802、和5,990,389中描述了Hordothionin蛋白质修饰，将这些专利通过引用结合在此。

目的多核苷酸包括编码改进作物的合意性的蛋白或多肽的任何核苷酸序列。目的多核苷酸序列可以编码涉及提供疾病或有害生物抗性的蛋白质。“疾病抗性”或“有害生物抗性”意在是植物避免为植物-病原体相互作用后果的有害症状的发生。有害生物抗性基因可以编码对严重影响产量的有害生物的抗性，这些有害生物例如根虫、切根虫、欧洲玉蜀黍螟等。疾病抗性基因和抗昆虫基因，例如用于抗细菌保护的溶菌酶或天蚕杀菌肽，或用于抗真菌保护的蛋白质，例如防御素、葡聚糖酶、或几丁质酶，或用于控制线虫或昆虫的苏云金芽孢杆菌内毒素、蛋白酶抑制剂、胶原酶、凝集素、或糖苷酶，均是有用的基因产物的实例。编码疾病抗性性状的基因包括解毒基因，例如抗伏马毒素(美国专利号5,792,931)；无毒力(avr)和疾病抗性(R)基因(Jones等人(1994)Science[科学]266：789；Martin等人(1993)Science[科学]262：1432；和Mindrinos等人(1994)Cell[细胞]78：1089)；等。抗昆虫基因可以编码对严重影响产量的有害生物的抗性，这些有害生物例如根虫、切根虫、欧洲玉蜀黍螟等。此类基因包括，例如，苏云金芽孢杆菌毒性蛋白基因(美国专利号5,366,892；5,747,450；5,736,514；5,723,756；5,593,881；和Geiser等人(1986)Gene[基因]48：109)；等。

“除草剂抗性蛋白”或由“除草剂抗性编码核酸分子”表达生成的蛋白质包括这样的蛋白质，其赋予细胞与未表达该蛋白质的细胞相比耐受更高浓度除草剂的能力，或赋予细胞与未表达该蛋白质的细胞相比对某种浓度的除草剂耐受更长时段的能力。除草剂抗性性状可通过如下基因引入进植物中：编码对起到抑制乙酰乳酸合酶(ALS，也称为乙酰羟基酸合酶，AHAS)的作用的除草剂(特别是磺酰脲(sulfonylurea)(UK：磺酰脲(sulphonylurea))类除草剂)的抗性的基因、编码对起到抑制谷氨酰胺合酶的作用的除草剂(例如草丁膦或basta)的抗性的基因(例如bar基因)、编码对草甘膦的抗性的基因(例如EPSP合酶基因和GAT基因)、编码对HPPD抑制剂的抗性的基因(例如HPPD基因)或本领域已知的其他此类基因。参见，例如，美国专利号7,626,077、5,310,667、5,866,775、6,225,114、6,248,876、7,169,970、6,867,293，以及美国临时申请号61/401,456，其各自通过引用结合在此。bar基因编码对除草剂basta的抗性，nptII基因编码对抗生素卡那霉素和遗传霉素的抗性，以及ALS-基因突变体编码对除草剂氯磺隆的抗性。

此外，认识到目的多核苷酸还可以包括与针对目的所靶向的基因序列的信使RNA(mRNA)的至少一部分互补的反义序列。构建反义核苷酸以与相应的mRNA杂交。可以对该反义序列作出修饰，只要该序列与相应的mRNA杂交并干扰相应的mRNA的表达。在该方式中，可以使用与相应的反义序列具有70％、80％、或85％序列同一性的反义构建体。此外，反义核苷酸的部分可以用来破坏该靶基因的表达。通常，可以使用至少50个核苷酸、100个核苷酸、200个核苷酸、或更多个核苷酸的序列。

此外，目的多核苷酸还可以按有义取向来使用从而抑制植物中内源基因的表达。以有义取向使用多核苷酸用于抑制植物中基因表达的方法是本领域已知的。这些方法通常涉及用包含启动子的DNA构建体的转化植物，该启动子有效地连接到至少一部分的对应于该内源基因的转录物的核苷酸序列上，驱动在植物中的表达。通常，此类核苷酸序列与内源基因的转录物的序列具有实质性的序列同一性，通常大于约65％序列同一性、约85％序列同一性、或大于约95％序列同一性。参见，美国专利号5,283,184和5,034,323；将这些文献通过引用结合在此。

目的多核苷酸还可以是表型标记。表型标记是可筛选或可选择标记，其包括视觉标记和可选择标记，无论它是阳性还是阴性可选择标记。可以使用任何表型标记。具体地，可选择或可筛选标记包含允许人们通常在特定条件下鉴定或选择包含它的分子或细胞或对其进行选择的DNA区段。这些标记可以编码活性，例如但不限于RNA、肽或蛋白质的产生，或可以提供RNA、肽、蛋白质、无机和有机化合物或组合物等的结合位点。

可选择标记的实例包括但不限于包含限制性内切酶位点的DNA区段；编码对另外的毒性化合物提供抗性的产物的DNA区段，所述毒性化合物包括抗生素，例如壮观霉素、氨苄青霉素、卡那霉素、四环素、Basta、新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)；编码在受体细胞中本身缺乏的产物的DNA区段(例如，tRNA基因、营养缺陷型标记)；编码可以容易地鉴定的产物(例如，表型标记，例如β-半乳糖苷酶、GUS；荧光蛋白，例如绿色荧光蛋白(GFP)、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)和细胞表面蛋白)的DNA区段；产生用于PCR的新引物位点(例如，以前未并列的两个DNA序列的并列)，包含通过限制性内切核酸酶或其他DNA修饰酶、化学品等不起作用或起作用的DNA序列；并且包含允许其鉴定的特异性修饰(例如，甲基化)所需的DNA序列。

另外的可选择标记包括赋予除草剂化合物(例如磺酰脲、草胺磷、溴草腈、咪唑啉酮和2，4-二氯苯氧基乙酸酯(2，4-D))抗性的基因。参见例如，用于对磺酰脲、咪唑啉酮、三唑并嘧啶磺酰胺、嘧啶水杨酸和磺酰基氨基羰基-三唑啉酮(Shaner和Singh，1997，Herbicide Activity：Toxicol Biochem Mol Biol[除草剂活性：毒理学，生物化学，分子生物学]69-110)；草甘膦抗性5-烯醇丙酮莽草酸-3-磷酸(EPSPS)(Saroha等人，1998，J.PlantBiochemistry&Biotechnology[植物生物化学&生物技术杂志]卷7：65-72)的抗性的乙酰乳酸合酶(ALS)；

目的多核苷酸包括与其他性状(例如但不限于除草剂抗性或本文描述的任何其他性状)组合堆叠或使用的的基因。目的多核苷酸和/或性状可以在复合物性状基因座中堆叠在一起，如在2013年10月3日公开的US-2013-0263324-A1和2013年1月24日公开的PCT/US13/22891中所述，将这两个申请通过引用特此结合。

目的多肽包括由本文描述的目的多核苷酸编码的蛋白或多肽。

进一步提供了用于鉴定至少一个植物细胞的方法，该植物细胞在其基因组中包含在靶位点处整合的目的多核苷酸。可以使用多种方法来鉴定在靶位点处或靶位点附近插入到基因组中的那些植物细胞，而不使用可筛选的标记表型。此类方法可被认为是直接分析靶序列以检测靶序列中的任何变化，包括但不限于PCR方法、测序方法、核酸酶消化、DNA印迹法、及其任何组合。参见，例如，美国专利申请12/147,834，将该申请通过引用结合在此至本文所述方法所必需的程度。该方法还包括从植物细胞重新获得包含整合至其基因组中的目的多核苷酸的植物。该植物可以是不育的或可育的。应当认识到，可以提供任何目的多核苷酸，将该多核苷酸在靶位点处整合到植物的基因组中，并在植物中表达。

如本文使用，“核酸”意指多核苷酸，并且包括脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。核酸还可以包括片段和修饰的核苷酸。因此，术语“多核苷酸”、“核酸序列”、“核苷酸序列”和“核酸片段”可互换使用以表示单链或双链的任选地包含合成的、非天然的或改变的核苷酸碱基的RNA和/或DNA和/或RNA-DNA多核苷酸(同时包含RNA和DNA二者的多核苷酸)的聚合物。核苷酸(通常以其5’-单磷酸酯形式发现)以其单字母名称表示如下：“A”表示腺苷或脱氧腺苷(分别用于RNA或DNA)，“C”表示胞苷或脱氧胞苷，“G”表示鸟苷或脱氧鸟苷，“U”表示尿苷，“T”表示脱氧胸苷，“R”表示嘌呤(A或G)，“Y”表示嘧啶(C或T)，“K”表示G或T，“H”表示A或C或T，“I”表示肌苷，并且“N”表示任何核苷酸。

“可读框”缩写为ORF。

术语“在功能上等价的片段”和“功能等价片段”在本文中可互换使用。这些术语是指分离的核酸片段或多肽的一部分或子序列，其中不管该片段是否编码活性酶，改变基因表达或产生某种表型的能力被保留。例如，片段可用于设计基因以在修饰的植物中产生所希望的表型。可以将基因设计为用于在抑制中使用，无论该基因是否编码活性酶，通过以相对于植物启动子序列的有义或反义取向连接其核酸片段。

术语“保守结构域”或“基序”是指沿进化相关蛋白的比对序列在特定位置处保守的一组氨基酸。虽然同源蛋白质之间在其他位置处的氨基酸可以发生变化，但在特定位置处高度保守的氨基酸表明对蛋白质的结构、稳定性或活性来说是必需的氨基酸。因为它们通过蛋白质同系物家族的比对序列中的高度保守性而被鉴定，所以它们可以用作标识符或“特征”，以确定具有新确定的序列的蛋白质是否属于先前鉴定的蛋白质家族。

多核苷酸和多肽序列、其变体、以及这些序列的结构关系，可用术语“同源性”、“同源的”、“基本上同一的”、“基本上类似的”、以及“基本上相应”来描述，这些术语在本文中可互换使用。这些是指多肽或核酸序列，其中在一个或多个氨基酸或核苷酸碱基上的变化不影响分子的功能，例如介导基因表达或产生某种表型的能力。这些术语还意指相对于初始未修饰的核酸，基本上不改变所得核酸的功能特性的核酸序列的一个或多个修饰。这些修饰包括在核酸片段中一个或多个核苷酸的缺失、取代、和/或插入。

所涵盖的基本上类似的核酸序列可以通过这些核酸序列与本文所示例的序列杂交，或与本文所公开的并且与任何本文所公开的核酸序列在功能上等价的核苷酸序列的任何部分杂交(在中严格条件下，例如0.5X SSC，0.1％SDS，60℃)的能力来定义。可以调整严格条件以筛选适度类似的片段(例如来自远缘生物体的同源序列)，至高度类似的片段(例如复制来自近缘生物体的功能性酶的基因)。杂交后的洗涤决定了严格条件。

术语“选择性杂交”包括参考在严格的杂交条件下将核酸序列杂交到特定的核酸靶序列上，相比其杂交到非靶核酸序列和基本上排除非靶核酸，该杂交达到可检测地更大程度(例如，至少为背景值的2倍)。选择性杂交序列通常彼此具有约至少80％序列同一性、或90％序列同一性、高达并且包括100％序列同一性(即，完全互补)。

术语“严格条件”或“严格杂交条件”包括提及在体外杂交测定中探针将与其靶序列选择性杂交的条件。严格条件是序列依赖性的，并且在不同情况下将有所不同。通过控制杂交条件和/或洗涤条件的严格性，可以鉴定与探针100％互补的靶序列(同源探测)。可替代地，也能够调节严格条件以允许序列中的某些错配，以便检测到更低程度的相似性(异源探测)。通常，探针长度为小于约1000个核苷酸，任选地是长度小于500个核苷酸。

通常，严格条件将是以下条件：在pH 7.0至8.3下盐浓度为小于约1.5M Na离子、通常约0.01至1.0M Na离子浓度(或其他一种或多种盐)，并且对于短探针(例如，10至50个核苷酸)为至少约30℃，并且对于长探针(例如，超过50个核苷酸)为至少约60℃。添加去稳定剂例如甲酰胺也可以实现严格条件。示例性低严格条件包括在37℃下用30％至35％甲酰胺、1M NaCl、1％SDS(十二烷基硫酸钠)的缓冲溶液杂交，并且在50℃至55℃下在1X至2XSSC(20X SSC＝3.0M NaCl/0.3M柠檬酸三钠)中洗涤。示例性中严格条件包括在37℃下在40％至45％甲酰胺、1M NaCl、1％SDS中杂交，并且在55℃至60℃下在0.5X至1X SSC中洗涤。示例性高严格条件包括在37℃下在50％甲酰胺、1M NaCl、1％SDS中杂交，并且在60℃至65℃下在0.1X SSC中洗涤。

在核酸的或多肽的序列的背景下，“序列同一性”或“同一性”是指在两个序列中的核酸碱基或氨基酸残基当在指定的比较窗口上比对最大对应度时是相同的。

“序列同一性的百分比”是指通过在比较窗口上比较两个最佳比对的序列所确定的值，其中与参考序列(其不包含添加或缺失)比较两个序列的最佳比对时，该多核苷酸或多肽序列在比较窗口中的部分可以包含添加或缺失(即空位)。通过以下方式计算该百分比：确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目，将匹配位置的数目除以比较窗口中的位置的总数目，然后将该结果乘以100以产生序列同一性的百分比。百分比序列同一性的有用实例包括但不限于50％、55％、60％、65％、70％、75％、80％、85％、90％或95％，或从50％至100％的任何整数百分比。可以使用在此描述的任何程序确定这些同一性。

序列比对和百分比同一性或相似性计算可以使用设计用于检测同源序列的多种比较方法来确定，这些方法包括但不限于LASERGENE生物信息计算包(DNASTAR公司(DNASTAR Inc.)，麦迪逊(Madison)，威斯康星州)的MegAlign^TM程序。在此申请的上下文中，应当理解的是，在使用序列分析软件来分析的情况下，分析的结果将基于参考的程序的“默认值”，除非另有说明。如本文使用，“默认值”将意指当第一次初始化时，最初加载该软件的任何一组值或参数。

“比对的Clustal V方法”对应于标记为Clustal V的比对方法(由以下描述：Higgins和Sharp，(1989)CABIOS 5：151-153；Higgins等人，(1992)Comput Appl Biosci[生物科学中的计算机应用]8：189-191)，并且发现于LASERGENE生物信息计算包(DNASTAR公司(DNASTAR Inc.)，麦迪逊(Madison)，威斯康星州)的MegAlign^TM程序中。对于多重比对，默认值对应于空位罚分(GAP PENALTY)＝10和空位长度罚分(GAP LENGTH PENALTY)＝10。使用Clustal方法进行逐对比对和蛋白质序列的百分比同一性计算的默认参数为KTUPLE＝1、空位罚分＝3、窗口(WINDOW)＝5、以及存储的对角线(DIAGONALS SAVED)＝5。对于核酸，这些参数是KTUPLE＝2、空位罚分＝5、窗口＝4、并且存储的对角线＝4。使用Clustal V程序比对序列后，可能通过查看同一程序中的“序列距离”表来获得“百分比同一性”。

“Clustal W比对方法”对应于标记为Clustal W的比对方法(由以下描述：Higgins和Sharp，(1989)CABIOS 5：151-153；Higgins等人，(1992)Comput Appl Biosci[生物科学中的计算机应用]8：189-191)，并且发现于LASERGENE生物信息计算包(DNASTAR公司(DNASTAR Inc.)，麦迪逊(Madison)，威斯康星州)的MegAlign^TM v6.1程序中。用于多重比对的默认参数(空位罚分＝10、空位长度罚分＝0.2、延迟发散序列(Delay Divergen Seqs)(％)＝30、DNA转换权重＝0.5、蛋白质权矩阵＝Gonnet系列、DNA权矩阵＝IUB)。使用Clustal W程序比对序列后，可能通过查看同一程序中的“序列距离”表来获得“百分比同一性”。

除非另行说明，否则在此提供的序列同一性/相似性值是指使用采用以下参数的GAP版本10((GCG，Accelrys公司，圣地亚哥，加利福尼亚州)获得的值：核苷酸序列的％同一性和％相似性采用50的空位产生罚分权重和3的空位长度延伸罚分权重以及nwsgapdna.cmp评分矩阵；氨基酸序列的％同一性和％相似性采用8的空位产生罚分权重和2的空位长度延伸罚分权重以及BLOSUM62评分矩阵(Henikoff和Henikoff，(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报]89：10915)。GAP使用Needleman和Wunsch(1970)J Mol Biol[分子生物学杂志]48：443-53的算法来找到使匹配数目最大化并且使空位数目最小化的两个完整序列的比对。GAP考虑所有可能的比对和空位位置，并且使用匹配碱基的单位中的空位产生罚分和空位延伸罚分，产生具有最大数目的匹配碱基和最少的空位的比对。

“BLAST”是美国国家生物技术信息中心(National Center for BiotechnologyInformation，NCBI)提供的用于寻找生物序列之间的相似性的区域的搜索算法。该程序将核苷酸或者蛋白质序列与序列数据库比较，并计算匹配的统计显著性以鉴定出与查询序列具有足够的相似性的序列，这样使得相似性不会被预测为已经随机发生。BLAST报告鉴定的序列和它们与查询序列的局部比对。

本领域技术人员很清楚地理解，许多水平的序列同一性在鉴定来自其他物种的多肽或修饰的天然的或合成的多肽中是有用的，其中这样的多肽具有相同或类似的功能或活性。百分比同一性的有用实例包括但不限于50％、55％、60％、65％、70％、75％、80％、85％、90％或95％，或从50％至100％的任何整数百分比。实际上，在描述本公开中，从50％至100％的任何整数氨基酸同一性会是有用的，例如51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％。

“基因”包括表达功能性分子(例如但不限于，特定蛋白质)的核酸片段，包括在编码序列之前(5’非编码序列)和之后(3’非编码序列)的调节序列。“天然基因”是指自然界中发现的具有其自身调节序列的基因。

“突变基因”是通过人为干预已经改变的基因。这样的“突变基因”具有通过至少一个核苷酸添加、缺失或取代而与相应的非突变基因的序列不同的序列。在本公开的某些实施例中，该突变的基因包含由如本文公开的指导多核苷酸/Cpf1内切核酸酶系统引起的改变。突变的植物是包含突变基因的植物。

如本文使用，术语“靶向突变”是通过使用本领域技术人员已知的任何方法(包括涉及如本文公开的指导的Cpf1内切核酸酶系统的方法)改变靶基因内的靶序列而产生的基因(称为靶基因)包括天然基因中的突变。

指导多核苷酸/Cpf1内切核酸酶诱导的靶向突变可以发生在位于由Cpf1内切核酸酶识别和切割的基因组靶位点内部或外部的核苷酸序列中。

术语“基因组”当应用于植物细胞时不仅涵盖在细胞核内发现的染色体DNA，还涵盖在细胞的亚细胞组分(例如线粒体、或质体)内发现的细胞器DNA。

“等位基因”是占据染色体上给定基因座的基因的若干种替代形式中的一种。当染色体上在给定基因座处存在的所有等位基因都相同时，该植物在该基因座处是纯合的。如果染色体上在给定基因座处存在的等位基因不同，则该植物在该基因座处是杂合的。

“编码序列”是指编码特定氨基酸序列的多核苷酸序列。“调节序列”是指位于编码序列的上游(5’非编码序列)、内部或下游(3’非编码序列)的核苷酸序列，并且其影响相关的编码序列的转录、RNA加工或稳定性、或翻译。调节序列包括但不限于：启动子、翻译前导序列、5’非翻译序列、3’非翻译序列、内含子、聚腺苷酸化靶序列、RNA加工位点、效应子结合位点、和茎环结构。

“密码子修饰的基因”或“密码子偏好的基因”或“密码子优化的基因”是其密码子使用的频率被设计为模拟宿主细胞的偏好的密码子使用的频率的基因。

“植物优化的核苷酸序列”是为了在植物中表达(特别是为了在植物中增加的表达)而优化的核苷酸序列。植物优化的核苷酸序列包括密码子优化的基因。可以使用一个或多个植物偏好的密码子来提高表达，通过修饰编码蛋白质(例如像，如本文公开的Cpf1内切核酸酶)的核苷酸序列，来合成植物优化的核苷酸序列。有关宿主偏好性密码子使用的讨论，参见例如Campbell和Gowri(1990)Plant Physiol.[植物生理学]92：1-11。

本领域中可获得用于合成植物偏好的基因的方法。参见，例如，美国专利号5,380,831和5,436,391，以及Murray等人(1989)Nucleic Acids Res.[核酸研究]17：477-498，通过引用并入本文。已知另外的序列修饰以增强在植物宿主中的基因表达。这些包括例如消除以下项：编码假的聚腺苷酸化信号、一个或多个外显子-内含子剪接位点信号的一个或多个序列、一个或多个转座子样重复序列、以及可能对基因表达有害的其他此类充分表征的序列。可以将序列的G-C含量调节至通过参考宿主植物细胞中表达的已知基因而计算出的给定植物宿主的平均水平。当可能时，修饰序列以避免出现一个或多个预测的发夹二级mRNA结构。因此，本公开的“植物优化的核苷酸序列”包括一个或多个此类序列修饰。

启动子是参与RNA聚合酶和其他蛋白质的识别和结合以起始转录的DNA区域。启动子序列由近端元件和较远端上游元件组成，后一元件通常称为增强子。“增强子”是可以刺激启动子活性的DNA序列，并且可以是该启动子的固有元件或被插入以增强启动子的水平或组织特异性的异源元件。启动子可以全部来源于天然基因，或者由来源于在自然界存在的不同启动子的不同元件构成，和/或包含合成的DNA区段。本领域技术人员应当理解，不同的启动子可能引导基因在不同组织或细胞类型中、或在不同发育阶段、或者响应于不同环境条件的表达。进一步认识到，由于在大多数情况下调节序列的确切边界尚未完全限定，一些变异的DNA片段可能具有相同的启动子活性。在多数情况下引起基因在大多数细胞型中表达的启动子通常称为“组成型启动子”。

已经显示某些启动子能够以比其他启动子更高的速率指导RNA合成。这些被称为“强启动子”。已经显示某些其他启动子仅以较高的水平在特定类型的细胞或组织中指导RNA合成，并且如果所述启动子优选在某些组织中而且还以降低的水平在其他组织中指导RNA合成则通常将其称为“组织特异性启动子”或“组织偏好性启动子”。

植物启动子包括能够在植物细胞中起始转录的启动子。关于植物启动子的综述，参见Potenza等人，2004 In Vitro Cell Dev Biol[体外细胞与发育生物学]40：1-22；Porto等人，2014，Molecular Biotechnology[分子生物技术](2014)，56(1)，38-49。

组成型启动子包括，例如，核心CaMV 35S启动子(Odell等人，(1985)Nature[自然]313：810-2)；稻肌动蛋白(McElroy等人，(1990)Plant Cell[植物细胞]2：163-71)；泛素(Christensen等人，(1989)Plant Mol Biol[植物分子生物学]12：619-32；ALS启动子(美国专利号5,659,026)等。

组织偏好性启动子可以用于靶向特定植物组织内的增强的表达。组织偏好性启动子包括，例如，2013年7月11日公开的WO2013/103367，Kawamata等人，(1997)Plant CellPhysiol[植物细胞生理学]38：792-803；Hansen等人，(1997)Mol Gen Genet[分子和普通遗传学]254：337-43；Russell等人，(1997)Transgenic Res[转基因研究]6：157-68；Rinehart等人，(1996)Plant Physiol[植物生理学]112：1331-41；Van Camp等人，(1996)PlantPhysiol.[植物生理学]112：525-35；Canevascini等人，(1996)Plant Physiol.[植物生理学]112：513-524；Lam，(1994)Results Probl Cell Differ[细胞分化中的结果与问题]20：181-96；以及Guevara-Garcia等人，(1993)PlantJ.[植物杂志]4：495-505。叶偏好性启动子包括，例如，Yamamoto等人，(1997)Plant J[植物杂志]12：255-65；Kwon等人，(1994)PlantPhysiol[植物生理学]105：357-67；Yamamoto等人，(1994)Plant Cell Physiol[植物细胞生理学]35：773-8；Gotor等人，(1993)Plant J[植物杂志]3：509-18；Orozco等人，(1993)Plant Mol Biol[植物分子生物学]23：1129-38；Matsuoka等人，(1993)Proc.Natl.Acad.Sci.USA[美国科学院院报]90：9586-90；Simpson等人，(1958)EMBO J[欧洲分子生物学学会杂志]4：2723-9；Timko等人，(1988)Nature[自然]318：57-8。根偏好性启动子包括，例如，Hire等人，(1992)Plant Mol Biol[植物分子生物学]20：207-18(大豆根特异性谷氨酰胺合酶基因)；Miao等人，(1991)Plant Cell[植物细胞]3：11-22(胞质谷氨酰胺合酶(GS))；Keller和Baumgartner，(1991)Plant Cell[植物细胞]3：1051-61(法国菜豆的GRP 1.8基因中的根特异性控制元件)；Sanger等人，(1990)Plant Mol Biol[植物分子生物学]14：433-43(根癌农杆菌(A.tumefaciens)的甘露氨酸合酶(MAS)的根特异性启动子)；Bogusz等人，(1990)Plant Cell[植物细胞]2：633-41(从榆科糙叶山黄麻(Parasponiaandersonii)和山黄麻(Trema tomentosa)分离的根特异性启动子)；Leach和Aoyagi，(1991)Plant Sci[植物科学]79：69-76(发根农杆菌(A.rhizogenes)rolC和rolD根诱导型基因)；Teeri等人，(1989)EMBO J[欧洲分子生物学学会杂志]8：343-50(农杆菌伤口诱导的TR1’和TR2’基因)；VfENOD-GRP3基因启动子(Kuster等人，(1995)Plant Mol Biol[植物分子生物学]29：759-72)；以及rolB启动子(Capana等人，(1994)Plant Mol Biol[植物分子生物学]25：681-91)；菜豆球蛋白基因(Murai等人，(1983)Science[科学]23：476-82；Sengopta-Gopalen等人，(1988)Proc.Natl.Acad.Sci.USA[美国科学院院报]82：3320-4)。还参见美国专利号5,837,876；5,750,386；5,633,363；5,459,252；5,401,836；5,110,732和5,023,179中找到。

种子偏好性启动子包括在种子发育期间有活性的种子特异性启动予以及在种子发芽期间有活性的种子发芽性启动子两者。参见Thompson等人，(1989)BioEssays[生物学分析]10：108。种子偏好性启动子包括但不限于Cim1(细胞分裂素诱导的信息)；cZ19B1(玉蜀黍19kDa玉蜀黍醇溶蛋白)；和milps(肌醇-1-磷酸盐合酶)；(WO00/11177；和U.S.Patent6,225,529)。对于双子叶植物，种子偏好性启动子包括但不限于：菜豆β-菜豆素、油菜籽蛋白、β-伴大豆球蛋白、大豆凝集素、十字花科蛋白等。对于单子叶植物，种子偏好性启动子包括但不限于玉蜀黍15kDa玉蜀黍蛋白、22kDa玉蜀黍蛋白、27kDaγ玉蜀黍蛋白、蜡质、收缩素1、收缩素2、球蛋白1、油质蛋白和nuc1。还参见WO 00/12733，其中公开了来自END1和END2基因的种子偏好性启动子。

术语“诱导型启动子”是指对内源或外源刺激的存在，例如通过化学化合物(化学诱导剂)响应，或对环境、激素、化学品、和/或发育信号响应，选择性表达编码序列或功能RNA的启动子。诱导型或调节型启动子包括例如通过光、热、胁迫、水淹或干旱、盐胁迫、渗透胁迫、植物激素、伤口或化学品(例如乙醇、脱落酸(ABA)、苿莉酮酸酯、水杨酸或安全剂)诱导或调节的启动子。

可以使用化学品诱导型(调节型)启动子以通过应用外源化学调节剂来调节植物中的基因表达。在应用化学品诱导基因表达的情况下启动子可以是化学品诱导型启动子，或者在应用化学品阻抑基因表达的情况下启动子可以是化学品阻抑型启动子。化学品诱导型启动子包括但不限于：由苯磺酰胺除草剂安全剂激活的玉蜀黍In2-2启动子(De Veylder等人，(1997)Plant Cell Physiol[植物细胞生理学]38：568-77)、由用作出苗前除草剂的疏水性亲电子化合物激活的玉蜀黍GST启动子(GST-II-27，WO93/01294)、以及由水杨酸激活的烟草PR-1a启动子(Ono等人，(2004)Biosci Biotechnol Biochem[生物科学生物技术生物化学]68：803-7)。其他化学品调节型启动子包括类固醇反应启动子(参见，例如，糖皮质激素诱导型启动子(Schena等人，(1991)Proc.Natl.Acad.Sci.USA[美国科学院院报]88：10421-5；McNellis等人，(1998)Plant J[植物杂志]14：247-257)；四环素诱导型启动子和四环素阻抑型启动子(Gatz等人，(1991)Mol Gen Genet[分子和普通遗传学]227：229-37；美国专利号5,814,618和5,789,156)。

在被病原体感染后诱导的病原体诱导型启动子包括但不限于调节PR蛋白、SAR蛋白、β-1，3-葡聚糖酶、几丁质酶等的表达的启动子。

胁迫诱导型启动子包括RD29A启动子(Kasuga等人(1999)Nature Biotechnol[自然生物技术].17：287-91)。本领域技术人员熟悉模拟胁迫条件(例如干旱、渗透胁迫、盐胁迫、和温度胁迫)并评价植物的胁迫耐受性的规程，所述植物已经遭受了模拟的或天然存在的胁迫条件。

在植物细胞中有用的诱导型启动子的另一个实例是热诱导型和/或化学品诱导型启动子ZmCAS1启动子，在于2013年11月21日公开的美国专利申请US 2013-0312137A1中进行了描述，将该申请通过引用结合在此。包含或融合至热休克元件的其他热可诱导的启动子或启动子是本领域已知的，例如但不限于在US544858和US561399中描述的植物热休克启动子或元件。

不断发现在植物细胞中有用的不同类型的新启动子；许多实例可以在Okamuro和Goldberg，(1989)The Biochemistry of Plants[植物生物化学]，115卷，Stumpf和Conn，编辑(纽约，纽约州：学术出版社)1-82页的汇编中发现。

“翻译前导序列”是指位于基因的启动子序列和编码序列之间的多核苷酸序列。翻译前导序列存在于翻译起始序列的mRNA上游。翻译前导序列可以影响初级转录物对mRNA的加工、mRNA稳定性、或翻译效率。已经描述了翻译前导序列的实例(例如，Turner和Foster，(1995)Mol Biotechnol[分子生物技术]3：225-236)。

“3’非编码序列”、“转录终止子”、或“终止序列”是指位于编码序列的下游的DNA序列，并且包括聚腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调节信号的其他序列。聚腺苷酸化信号通常特征在于影响聚腺苷酸片添加到mRNA前体的3’端。由Ingelbrecht等人，(1989)Plant Cell[植物细胞]1：671-680示例了不同的3’非编码序列的用途。

“RNA转录物”是指由DNA序列的RNA聚合酶催化的转录产生的产物。当RNA转录物是DNA序列的完全互补拷贝时，该RNA转录物被称为初级转录物或前mRNA。当RNA转录物是源自初级转录物前mRNA的转录后加工的RNA序列时，RNA转录物被称为成熟RNA或mRNA。“信使RNA”或“mRNA”是指不含内含子并且可以被细胞翻译成蛋白质的RNA。“cDNA”是指与mRNA模板互补并且使用逆转录酶从mRNA模板合成的DNA。cDNA可以是单链的或者可以使用DNA聚合成酶I的Klenow片段转化成双链形式。“正义”RNA是指包括mRNA并且可在细胞内或体外翻译成蛋白质的RNA转录物。“反义RNA”是指与靶初级转录物或mRNA的全部或部分互补、并且阻断靶基因的表达的RNA转录物(参见，例如美国专利号5,107,065)。反义RNA可与特定基因转录物的任何部分，即5’非编码序列、3’非编码序列、内含子或编码序列互补。“功能性RNA”是指反义RNA、核糖酶RNA、或可以不进行翻译但是仍对细胞过程具有作用的其他RNA。术语“互补序列”和“反向互补序列”在本文中关于mRNA转录物可互换使用，并且意在限定信使的反义RNA。

术语有效地连接是指单个核酸片段上的核酸序列的关联，这样使得其中一个核酸序列的功能被另一个核酸序列调节。例如，当启动子能够调节编码序列的表达(即，该编码序列在启动子的转录控制下)时，启动子与该编码序列有效地连接。编码序列可以在正义或反义取向上有效地连接到调节序列。在另一个实例中，互补的RNA区域可以直接或间接与靶mRNA的5’、或靶mRNA的3’有效地连接、或在靶mRNA内、或第一个互补区是5’且其互补序列是靶mRNA的3’。

本文使用的标准重组DNA和分子克隆技术是在本领域熟知的，并且更全面地描述于Sambrook等人，Molecular Cloning：A Laboratory Manual[分子克隆：实验室手册]；Cold Spring Harbor Laboratory：Cold Spring Harbor，NY[冷泉港实验室：冷泉港，纽约州](1989)中。转化方法是本领域技术人员熟知的并且在下文中进行了描述。

术语“重组”是指例如通过化学合成或者通过基因工程技术操纵分离的核酸区段来将两个原本分离的序列区段进行人工组合。

术语“质粒”、“载体”和“盒”是指线性或环状染色体外元件，其通常携带非细胞中心代谢的一部分的基因，并且通常呈双链DNA的形式。这样的元件可以是衍生自任何来源的、单链或双链DNA或RNA的、处于直链或环状形式的自主复制序列、基因组整合序列、噬菌体、或核苷酸序列，其中许多核苷酸序列已经被连接或重组成能够将目的多核苷酸引入细胞中的独特构造。“转化盒”是指包含基因并具有促进特定宿主细胞转化的基因之外的元件的特定载体。“表达盒”是指包含基因并具有允许在宿主中表达该基因的基因之外的元件的特定载体。

术语“重组DNA分子”、“重组DNA构建体”、“表达构建体”、“构建体”、和“重组构建体”在本文中可互换使用。重组DNA构建体包含核酸序列，例如在自然界中未全部一起发现的调节序列和编码序列的人工组合。例如，重组DNA构建体可以包含衍生自不同来源的调节序列和编码序列，或者包含衍生自相同来源但以不同于天然发生的方式排列的调节序列和编码序列。这样一个构建体可以单独使用或可以与载体结合使用。如果使用载体，则载体的选择取决于如本领域技术人员熟知的将用于将载体引入宿主细胞的方法。例如，可以使用质粒载体。技术人员充分了解必须存在于载体上以便成功转化，选择和繁殖宿主细胞的遗传元件。技术人员还将认识到，不同的独立转化事件可以导致不同水平和模式的表达(Jones等人，(1985)EMBO J[欧洲分子生物学学会杂志]4：2411-2418；De Almeida等人，(1989)Mol Gen Genetics[分子和普通遗传学]218：78-86)，并且因此通常筛选多个事件，从而获得显示希望的表达水平和模式的品系。此类筛选可以是完成的标准分子生物学测定、生物化学测定以及其他测定，这些测定包括DNA的印迹分析、mRNA表达的Northern分析、PCR、实时定量PCR(qPCR)、逆转录PCR(RT-PCR)、蛋白表达的免疫印迹分析、酶测定或活性测定、和/或表型分析。

如本文使用，术语“表达”是指处于前体抑或成熟形式的功能性终产物(例如，mRNA、指导RNA或蛋白质)的产生。

“成熟”蛋白质是指翻译后加工的多肽(即，从其中已经去除存在于初级翻译产物中的任何前肽(pre-peptide)或原肽(propeptide)的一种多肽)。“前体”蛋白质是指mRNA的翻译的初级产物(即，仍存在前肽或原肽)。前肽或原肽可以是但不限于细胞内定位信号。

目前公开的指导多核苷酸、Cpf1内切核酸酶、多核苷酸修饰模板、供体DNA、指导多核苷酸/Cpf1内切核酸酶系统及其任一组合可以引入细胞，例如原核的或真核的细胞中。

细胞包括但不限于人类、非人类、动物、细菌、真菌、昆虫、酵母、非常规酵母和植物细胞，以及通过本文所述的方法产生的植物和种子。

可以使用任何植物或植物部分，包括单子叶植物和双子叶植物或植物部分。

可以使用的单子叶植物的实例包括但不限于，玉蜀黍(玉蜀黍(Zea mays))、水稻(水稻(Oryza sativa))、黑麦(黑麦(Secale cereale))、高粱(双色高粱(Sorghumbicolor)、高粱(Sorghum vulgare))、粟(例如，珍珠粟、御谷(Pennisetum glaucum))、黍稷(粟米(Panicum miliaceum))、谷子(谷子(Setaria italica))、穇子(龙爪稷(Eleusinecoracana))、小麦(小麦属物种、小麦(Triticum aestivum)、一粒小麦(Triticummonococcum))、甘蔗(甘蔗属物种(Saccharum spp.))、燕麦(燕麦属(Avena))、大麦(大麦属(Hordeum))、柳枝稷(柳枝黍(Panicum virgatum))、菠萝(菠萝(Ananas comosus))、香蕉(香蕉属物种(Musa spp.))、棕榈、观赏植物、草坪草、以及其他草。

术语“双子叶的”或“双子叶植物”是指被子植物的亚类，也被称为“双子叶植物类”，并且包括提及整株植物、植物器官(例如叶、茎、根、等)、种子、植物细胞、及其子代。可以使用的双子叶植物的实例包括但不限于大豆(大豆(Glycine max))、芸苔属物种(卡诺拉油菜)(欧洲油菜(Brassica napus)和白菜型油菜(B.campestris)、芜菁(Brassica rapa)、芥菜(Brassica.juncea))、苜蓿(紫花苜蓿(Medicago sativa))、烟草(烟草(Nicotianatabacum))、拟南芥属(Arabidopsis)(拟南芥(A.thaliana))、向日葵(向日葵(Helianthusannuus))、棉花(木本棉(Gossypium arboreum)、海岛棉(Gossypium barbadense))、和花生(花生(Arachis hypogaea))、番茄(番茄(Solanum lycopersicum))、马铃薯(马铃薯(Solanum tuberosum))等。

可以使用的植物包括红花(safflower、Carthamus tinctorius)、甘薯(番薯(Ipomoea batatas))，木薯(cassava，Manihot esculenta)，咖啡(咖啡属(Coffea)物种)，椰子(coconut，Cocos nucifera)，柑橘树(柑橘属(Citrus)物种)，可可(cocoa，Theobromacacao)，茶树(tea，Camellia sinensis)，香蕉(芭蕉属(Musa)物种)，鳄梨(avocado，Perseaamericana)，无花果(fig或(Ficus casica))，番石榴(guava，Psidium guajava)，芒果(mango，Mangifera indica)，橄榄(olive，Olea europaea)，木瓜(番木瓜(Caricapapaya))，腰果(cashew，Anacardium occidentale)，澳洲坚果(macadamia，Macadamiaintegrifolia)，巴旦杏(almond，Prunus amygdalus)，甜菜(sugar beets，Betavulgaris)，蔬菜，观赏植物和针叶树。

蔬菜包括番茄(Lycopersicon esculentum)、莴苣(例如，莴苣(Lactucasativa))、青豆(菜豆(Phaseolus vulgaris))、利马豆(lima bean，Phaseolus limensis)、豌豆(香豌豆属(Lathyrus spp.))和黄瓜属的成员诸如黄瓜(cucumber，C.sativus)、香瓜(cantaloupe，C.cantalupensis)和甜瓜(musk melon，C.melo)。观赏植物包括杜鹃(杜鹃花属(Rhododendron)物种)、八仙花(Macrophylla hydrangea)、朱槿(Hibiscusrosasanensis)、玫瑰(蔷薇属(Rosa)物种)、郁金香(郁金香属(Tulipa)物种)、水仙(水仙属(Narcissus)物种)、矮牵牛(Petunia hybrida)、康乃馨(Dianthus caryophyllus)、一品红(Euphorbia pulcherrima)和菊花。

可用于实践本发明的针叶树包括(例如)松树诸如火炬松(Pinus taeda)、湿地松(Pinus elliotii)、西黄松(Pinus ponderosa)、黑松(Pinus contorta)和辐射松(Pinusradiata)；花旗松(Pseudotsuga menziesii)；西部铁杉(Tsuga canadensis)；北美云杉(Picea glauca)；红杉(Sequoia sempervirens)；枞树(true firs)诸如银枞(Abiesamabilis)和胶枞(Abies balsamea)；以及雪松诸如西方红雪松(Thuja plicata)和阿拉斯加黄雪松(Chamaecyparis nootkatensis)。

术语“植物”包括整株植物、植物器官、植物组织、种子、植物细胞、种子和植物的子代。植物细胞包括但不限于得自下列物质的细胞：种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。植物部分包括分化和未分化的组织，包括但不限于根、茎、芽、叶、花粉、种子、肿瘤组织和各种形式的细胞和培养物(例如单细胞、原生质体、胚和愈伤组织)。植物组织可以是在植物中或在植物器官、组织或细胞培养物中的。术语“植物器官”是指植物组织或构成植物的形态上和功能上不同部分的一组组织。术语“基因组”意指存在于生物体或病毒或细胞器的每个细胞中的遗传物质的全部互补序列(基因和非编码序列)；和/或从一个亲本遗传为(单倍体)单位的完整染色体组。“子代”包括植物的任何后续世代。

如本文使用，术语“植物部分”是指植物细胞、植物原生质体、可再生植物的植物细胞组织培养物、植物愈伤组织、植物块和在植物或植物部分(如胚、花粉、胚珠、种子、叶、花、枝、果、核、穗、穗轴、壳、茎、根、根尖、花药等)中完好的植物细胞，连同这些部分自身。籽粒意指由商业种植者出于栽培或繁殖物种之外的目的所生产的成熟种子。这些再生植物的子代、变体和突变体也包括在本发明的范围内，条件是这些部分包含经引入的多核苷酸。

转基因植物包括例如在其基因组中包含通过转化步骤引入的异源多核苷酸的植物。异源多核苷酸可以稳定地整合到基因组内，这样使得多核苷酸被传递给连续世代。异源多核苷酸可以单独地或作为重组DNA构建体的部分整合进基因组中。转基因植物还可以在其基因组内包含多于一个异源多核苷酸。各异源多核苷酸均可对所述转基因植物产生不同的性状。异源多核苷酸可以包括源自外来物种的序列，或者如果源自相同物种，可以是从其天然形式上进行实质修饰的序列。转基因可以包括其基因型已经通过异源核酸的存在改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物，这些异源核酸包括最初如此改变的那些转基因以及通过有性杂交或无性繁殖从初始转基因产生的那些。通过常规植物育种方法，通过在此所述的不导致外源多核苷酸的插入的基因组编辑程序，或通过天然存在的事件例如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变的基因组(染色体或染色体外)的改变并不旨在被视为转基因。

在本公开的某些实施例中，可育植物是产生活雄配子和雌配子并且是自身可育的植物。这样的自体受精的植物可以产生子代植物，而没有来自任何其他植物的配子及其中所含的遗传物质的贡献。本公开的其他实施例可以涉及使用非自身可育的植物，因为该植物不产生有活力的或在其他情况下能够受精的雄配子或雌配子或二者。如本文使用，“雄性不育植物”是不产生有活力的或在其他情况下能够受精的雄配子的植物。如本文使用，“雌性不育植物”是不产生有活力的或在其他情况下能够受精的雌配子的植物。应当认识到雄性不育植物和雌性不育植物可以分别是雌性可育的和雄性可育的。应当进一步认识到，雄性可育(但雌性不育)植物当与雌性可育植物杂交时可以产生有活力的子代，并且雌性可育(但雄性不育)植物当与雄性可育植物杂交时可以产生有活力的子代。

在本公开的上下文中，术语“杂交的”或“杂交”(cross或crossing)是指经由授粉将配子融合从而产生子代(即，细胞、种子、或植物)。该术语涵盖有性杂交(一株植物被另一株植物授粉)和自交(自体授粉，即当花粉和胚珠(或小孢子和大孢子)是来自同一植物或基因相同的植物时)。

术语“渗入”是指基因座的期望等位基因从一种遗传背景传递到另一种遗传背景的现象。例如，可以经由两个亲本植物之间的有性杂交将指定基因座处的所希望的等位基因的渗入传递给至少一个子代植物，其中至少一个亲本植物在其基因组内具有所希望的等位基因。可替代地，例如等位基因的传递可以通过两个供体基因组之间的重组而发生，例如在融合原生质体中，其中至少其中一个供体原生质体在其基因组中具有所希望的等位基因。所希望的等位基因可以是，例如转基因、修饰的(突变的或编辑的)天然等位基因、或标记或QTL的选择的等位基因。

“厘摩”(cM)或“图距单位”是两个连锁的基因、标记、靶位点、基因座或它们的任何配对之间的距离，其中1％的减数分裂的产物是重组的。因此，一厘摩与等于两个连锁的基因、标记、靶位点、基因座或它们的任何配对之间的1％平均重组频率的距离相当。

本公开可用于育种包含一个或多个引入性状的植物。

玉蜀黍植物(玉蜀黍)可以通过自花授粉和异花传粉技术二者来进行育种。玉蜀黍在同一植物上具有位于雄穗上的雄花和位于雌穗上的雌花。玉蜀黍可自花授粉(“自交”)或异花授粉。当风将花粉从雄穗吹到从初期(incipient)雌穗顶端伸出的须上时，玉蜀黍中就发生了自然授粉。授粉可以通过本领域技术人员已知的技术容易地控制。对玉蜀黍杂交体的开发需要开发纯合纯合近交系，将这些纯合近交系杂交，以及对这些杂交的评价。谱系育种和轮回选择是用于从种群开发近交系的两种育种方法。育种程序将来自两个或更多个近交系或不同基础广泛来源的所希望的性状组合进育种库，从该育种库中通过自交和对所希望表型的选择从而开发出新的近交系。杂交玉蜀黍品种是两种此类近交系的杂交，每种都可能具有由另一种所缺少的一个或多个所希望的特征，或补足另一种。新的近交系与其他近交系杂交，并对来自这些杂交的杂交体进行评价，以确定哪些具有商业潜力。第一代的杂交子代被指定为F1。F1杂种比其近交的亲本更有活力。这种杂交活力或杂种优势可以按许多方式表现，包括增加的营养生长和增加的产量。

杂交玉蜀黍种子可以通过结合人工去雄在内的雄性不育系统来生产。为了产生杂交种子，将雄花穗从生长的雌性近交亲本中去除，这些雌性近交亲本可以与雄性近交亲本以不同交替行排列模式种植。因此，如果与外来玉蜀黍花粉的来源有足够的隔离，则雌性近交系的穗将只能用来自雄性近交系的花粉进行受精。因此，所得的种子是杂种(F1)，并将形成杂种植物。

影响植物发育的田间变化可以导致在对雌性亲本的人工去雄完成后的植物抽穗。或，在去雄过程中雌性近交植物雄穗可能没有完全去除。无论如何，结果是雌性植物将成功地散播花粉，并且一些雌性植物将会自花授粉。这将导致雌性近交系的种子与正常产生的杂交种子一起被收获。雌性近交系种子不显示杂种优势，并且因此不如F1种子多产。此外，雌性近交系种子的存在可以代表生产杂交体的公司的种质安全风险。

可替代地，雌性近交系可以通过机器进行机械地去雄。机械去雄和手工去雄的可靠性大致相同，但更快并且成本更低。然而，相比手工去雄，大多数去雄机器会对植物造成更多伤害。因此，目前没有令人完全满意的去雄形式，并且仍存在对替代方案的需求，这些替代方案进一步降低生产成本，并且消除在杂交种子的生产中的雌性亲本的自花授粉。

介导基因靶向的调节型(温度诱导型)指导RNA/Cpf1系统可以在用于按如在WO2013/0198888(于2013年8月1日公开)中公开的类似的方式指导基因插入和/或用于产生包含多个基因(性状)的复合性状基因座的方法中使用，其中使用如本文公开的调节型指导RNA/Cpf1系统来代替使用双链断裂诱导剂，以引入目的基因。在一个实施例中，复合转基因性状基因座是具有彼此遗传连锁的多个目的基因的基因组基因座。通过插入在0.1、0.2、0.3、04、0.5、1、2、或甚至5厘摩(cM)内的彼此独立的基因，这些基因可以作为单个遗传基因座进行育种(参见，例如，美国专利申请13/427,138或PCT申请PCT/US2012/030061)。在选择包含目的基因(例如转基因)的植物后，可以将包含(至少)一个或多个目的基因的植物进行杂交从而形成包含全部两个目的基因的F1。在来自这些F1(F2或BC1)的子代中，1/500的子代将具有重组在相同的染色体上的两个不同的基因。然后，可以将复合物基因座繁育为具有全部两个目的基因(两个性状)的单遗传基因座。可以重复该过程以堆叠尽可能多的性状。

在植物中引起雄性不育的突变具有可用于作物植物(例如玉蜀黍)的杂交种子生产的方法的潜力，并且可以通过消除对耗费大量劳动力从用作杂交亲本的母本植物上去除雄花(也称为去雄)的需要来降低生产成本。以此类方式使用的基因的实例包括雄性能育性基因，例如MS26(参见例如美国专利7,098,388、7,517,975、7,612,251)、MS45(参见例如美国专利5,478,369、6,265,640)、或MSCA1(参见例如美国专利7,919,676)。

在玉蜀黍中引起雄性不育的突变已通过多种方法产生，这些方法例如X射线或紫外线照射、化学处理、或转座元件插入(ms23、ms25、ms26、ms32)(Chaubal等人(2000)Am JBot[美国植物学杂志]87：1193-1201)。通过能育性/不育性“分子转换”对能育性基因进行条件调节可以增强用于设计新的雄性不育系统来进行作物改进的选项(Unger等人(2002)Transgenic Res[转基因研究]11：455-465)。

可以鉴定与目的表型或性状相关的染色体区间。本领域熟知的多种方法可用于鉴定染色体区间。此类染色体区间的边界扩展到涵盖将与控制目的性状的基因连锁的标记。换句话说，扩展染色体区间，这样使得位于区间内的任何标记(包括限定区间的边界的末端标记)可以用作北方叶枯病抗性的标记。在一个实施例中，染色体区间包含至少一个QTL，并且此外，确实可以包含多于一个QTL。相同区间中非常接近的多个QTL可以搅乱特定标记与特定QTL的关联，因为一个标记可显示与多于一个QTL连锁。相反地，例如如果非常接近的两个标记显示与期望表型性状共分离，则有时分不清楚是否那些标记中的每一个鉴定相同QTL或两个不同的QTL。术语“数量性状座位”或“QTL”是指在至少一种遗传背景下(例如在至少一个育种群体中)，与数量表型性状的差异表达关联的DNA区域。QTL的区域涵盖或紧密地连锁于影响所考虑的性状的一个或多个基因。“QTL的等位基因”可以包含在连续的基因组区域或连锁群中的多个基因或其他遗传因子，例如单倍型。QTL的等位基因可以表示在指定窗口内的单倍型，其中该窗口是可以用一组的一个或多个多态性标记定义和追踪的连续的基因组区域。单倍型可以指定被窗口内的每一标记的等位基因的独特指纹定义。

可以使用多种方法来鉴定在靶位点处或靶位点附近具有改变的基因组的那些细胞，而不使用可筛选标记表型。此类方法可被认为是直接分析靶序列以检测靶序列中的任何变化，包括但不限于PCR方法、测序方法、核酸酶消化、DNA印迹法、及其任何组合。

标准的DNA分离、纯化、分子克隆、载体构建、和验证/表征方法、蛋白修饰/改变是完善确立的，参见，例如Sambrook等人，(1989)Molecular Cloning：A Laboratory Manual[分子克隆：实验室手册]Cold Spring Harbor Laboratory Press，NY[纽约冷泉港实验室出版社])。载体和构建体包括环状质粒和包含目的多核苷酸的线状多核苷酸，以及任选地包括接头、衔接子、用于调节或分析的其他组分。在一些实例中，识别位点和/或靶位点可以包含在内含子、编码序列、5’UTR、3’UTR、和/或调节区内。

缩写的含义如下：“sec”意指秒、“min”意指分钟、“h”意指小时、“d”意指天、“μL”意指微升、“mL”意指毫升、“L”意指升、“μM”意指微摩尔、“mM”意指毫摩尔、“M”意指摩尔、“mmol”意指毫摩尔、“μmole”微摩尔、“g”意指克、“μg”意指微克、“ng”意指纳克、“U”意指单位、“bp”意指碱基对、以及“kb”意指千碱基。

本文公开的组合物和方法的非限制性实例如下：

1.一种用于在植物细胞的基因组中修饰靶序列的方法，所述方法包括：

a)将以下引入植物细胞：Cpf1内切核酸酶或编码所述Cpf1内切核酸酶的植物优化的多核苷酸、以及包含与所述植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸或表达所述指导多核苷酸的重组DNA；以及，

b)在高于28℃的温度下孵育所述植物细胞至少约4hr的时段，

其中所述指导多核苷酸和Cpf1内切核酸酶能够形成复合物，所述复合物可以对所述靶序列进行识别、结合、并且任选地产生切口或进行切割。

2.一种用于在植物细胞的基因组中修饰靶序列的方法，所述方法包括：

a)将以下引入植物细胞：包含与植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸或表达所述指导多核苷酸的重组DNA，所述植物细胞在其基因组中包含重组DNA构建体，所述重组DNA构建体包含有效地连接到编码Cpf1内切核酸酶的植物优化的多核苷酸的启动子；以及，

b)在高于28℃的温度下孵育所述植物细胞至少约4hr的时段，

3.一种用于在植物或植物细胞的基因组中修饰靶序列的方法，所述方法包括：

a)获得在其基因组中包含第一重组DNA构建体和第二重组DNA构建体的植物或植物细胞，所述第一重组DNA构建体包含有效地连接到编码Cpf1内切核酸酶的植物优化的多核苷酸的第一启动子，所述第二重组DNA构建体包含有效地连接到编码指导RNA或能够表达多个指导RNA的前体指导RNA的核苷酸序列的第二启动子，其中所述指导RNA和Cpf1内切核酸酶能够形成复合物，所述复合物可以对所述靶序列进行识别、结合、并且任选地产生切口或进行切割；以及，

b)在高于28℃的温度下孵育所述植物或植物细胞至少约4hr的时段，

其中所述指导RNA或所述多个指导RNA中的每一个和Cpf1内切核酸酶能够形成复合物，所述复合物可以对所述靶序列进行识别、结合、并且任选地产生切口或进行切割。

4.如实施例1所述的方法，其中所述植物优化的多核苷酸是编码所述Cpf1内切核酸酶的植物优化的mRNA，或包含有效地连接到编码所述Cpf1内切核酸酶的植物优化的多核苷酸的启动子的重组DNA构建体。

5.如实施例1-4所述的方法，所述方法进一步包括鉴定至少一种在所述靶序列处具有修饰的植物细胞，其中在所述靶序列处的修饰选自由以下组成的组：(i)至少一个核苷酸的替代、(ii)至少一个核苷酸的缺失、(iii)至少一个核苷酸的插入、和(iv)(i)-(iii)的任何组合。

6.如实施例1-4所述的方法，所述方法进一步包括向所述植物细胞中引入供体DNA，其中所述供体DNA包含目的多核苷酸。

7.如实施例6所述的方法，所述方法进一步包括鉴定在基因组中包含整合到所述靶序列中或其附近的目的多核苷酸的至少一种植物细胞。

8.一种用于编辑植物细胞的基因组中的核苷酸序列的方法，所述方法包括；

a)将以下引入植物细胞：Cpf1内切核酸酶或编码所述Cpf1内切核酸酶的植物优化的多核苷酸、包含与植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸或表达所述指导多核苷酸的重组DNA、以及多核苷酸修饰模板；

其中所述多核苷酸修饰模板包含所述核苷酸序列的至少一个核苷酸修饰；以及，

b)在高于28℃的温度下孵育所述植物细胞至少约4hr的时段，

其中所述指导多核苷酸和Cpf1内切核酸酶能够形成复合物，该复合物可以对所述靶序列的全部或一部分进行识别、结合、并且任选地产生切口或进行切割。

9.一种用于编辑植物细胞的基因组中的核苷酸序列的方法，所述方法包括；

a)将以下引入植物细胞：多核苷酸修饰模板和包含与植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸或表达所述指导多核苷酸的重组DNA，所述植物细胞在其基因组中包含重组DNA构建体，所述重组DNA构建体包含有效地连接到编码Cpf1内切核酸酶的植物优化的多核苷酸的启动子，其中所述多核苷酸修饰模板包含所述核苷酸序列的至少一个核苷酸修饰；以及b)在高于28℃的温度下孵育所述植物细胞至少约4hr的时段，

10.一种用于编辑植物或植物细胞的基因组中的核苷酸序列的方法，所述方法包括；

a)将多核苷酸修饰模板引入在其基因组中包含第一重组DNA构建体和第二重组DNA构建体的植物或植物细胞，所述第一重组DNA构建体包含有效地连接到编码Cpf1内切核酸酶的植物优化的多核苷酸的第一启动子，所述第二重组DNA构建体包含有效地连接到编码指导RNA的核苷酸序列的第二启动子，其中所述指导RNA和Cpf1内切核酸酶能够形成复合物，所述复合物可以对所述靶序列进行识别、结合、并且任选地产生切口或进行切割；以及，

b)在高于28℃的温度下孵育所述植物细胞至少约4hr的时段，

其中所述指导RNA和Cpf1内切核酸酶能够形成复合物，所述复合物可以对所述靶序列进行识别、结合、并且任选地产生切口或进行切割。

11.如实施例8-10所述的方法，所述方法进一步包括鉴定在基因组中包含所述核苷酸序列的所述至少一个核苷酸修饰的至少一种植物细胞。

12.如实施例1-2所述的方法，其中所述指导多核苷酸选自由以下组成的组：RNA多核苷酸、DNA多核苷酸、或RNA-DNA多核苷酸。

13.如实施例1-2所述的方法，其中将所述指导多核苷酸引入植物细胞是经由选自由以下组成的组的直接递送进行：粒子介导的递送、晶须介导的递送、细胞穿透肽介导的递送、电穿孔、PEG介导的转染、病毒介导的递送和纳米粒子介导的递送。

14.如实施例1或8所述的方法，其中将所述Cpf1内切核酸酶或编码所述Cpf1内切核酸酶的植物优化的多核苷酸引入植物细胞是通过选自由以下组成的组的直接递送进行：粒子介导的递送、晶须介导的递送、细胞穿透肽介导的递送、电穿孔、PEG介导的转染、病毒介导的递送和纳米粒子介导的递送。

15.如实施例1-2中任一项所述的方法，其中所述指导多核苷酸和所述Cpf1内切核酸酶在通过将复合物直接递送至植物细胞而被引入所述植物细胞中之前，在适合形成指导多核苷酸-Cpf1内切核酸酶复合物的条件下预混合。

16.如实施例1-15中任一项所述的方法，其中所述Cpf1内切核酸酶包含SEQ IDNO：10或其功能片段。

17.如实施例1-16中任一项所述的方法，其中所述Cpf1内切核酸酶与内切核酸酶密码子区域上游的核靶向信号和/或内切核酸酶密码子区域下游的核定位信号有效地连接。

18.如实施例1-17中任一项所述的方法，其中该植物细胞是单子叶植物细胞或双子叶植物细胞。

19A.如实施例18所述的方法，其中该植物细胞选自由以下组成的组：玉蜀黍、稻、高粱、黑麦、大麦、小麦、粟、燕麦、甘蔗、草坪草、或柳枝稷、大豆、卡诺拉油菜、苜蓿、向日葵、棉花、烟草、花生、马铃薯、烟草、拟南芥属(Arabidopsis)和红花细胞。

19B.如实施例1-18中任一项所述的方法，其中所述Cpf1内切核酸酶选自由以下组成的组：SEQ ID NO：10、11、32、33，SEQ ID NO：10、11、32、33的功能片段和SEQ ID NO：10、11、32、33的功能变体。

20.一种通过如实施例1-17所述的方法中的任一项产生的植物细胞。

21.一种从如实施例20所述的植物细胞产生的植物。

22.一种包含重组DNA多核苷酸的植物，所述重组DNA多核苷酸包含有效地连接到编码Cpf1内切核酸酶的植物优化的多核苷酸的启动子。

23.一种重组DNA多核苷酸，所述重组DNA多核苷酸包含有效地连接到编码Cpf1内切核酸酶的植物优化的多核苷酸的启动子。

24.一种用于对植物细胞或植物中的靶序列进行结合、切割或产生切口的试剂盒，所述试剂盒包含特异性针对所述靶序列的指导多核苷酸、以及Cpf1内切核酸酶或编码Cpf1内切核酸酶的植物优化的多核苷酸，其中所述指导多核苷酸能够形成指导多核苷酸/Cpf1内切核酸酶复合物，其中所述复合物可以对所述靶序列进行识别、结合、并且任选地产生切口或进行切割。

25.如实施例1-19所述的方法，其中植物优化的多核苷酸是玉蜀黍优化的多核苷酸。

26.如实施例1-19所述的方法，其中植物优化的多核苷酸是大豆优化的多核苷酸。

27.如实施例1-19所述的方法，其中在约37℃的温度下孵育所述植物细胞约48hr的时段。

28.如实施例1-19所述的方法，所述方法进一步包括确定在所述靶位点处的突变的频率，其中当与在约28℃的温度下孵育的对照植物细胞的靶序列处的修饰的频率相比时，所述突变的频率增加至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15倍。

29.如实施例5所述的方法，其中当与对照方法相比时，在所述靶序列处的所述修饰以增加的频率发生，其中在约28℃的典型植物组织培养温度下孵育b)的植物细胞。

30.如实施例29所述的方法，其中当与所述对照方法相比时，所述增加的频率是增加至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少10倍、至少11倍，至少12倍、至少13倍、至少14倍、至少15倍、至少30倍、至少40倍、或至少50倍。

31.一种在植物细胞的基因组中同时修饰多个靶序列的方法，所述方法包括：

a)将以下引入所述植物细胞：Cpf1内切核酸酶蛋白、或编码所述Cpf1内切核酸酶的植物优化的多核苷酸、以及能够表达被加工成许多单指导RNA的单前体RNA的前体指导RNA转录起始盒，其中每个单指导RNA包含在原型间隔子邻近基序(PAM)的3’的可变靶向结构域，其中所述可变靶向结构域与所述植物基因组中的单靶序列互补；以及，

b)在高于28℃的温度下孵育(a)的植物细胞至少约4hr的时段，

其中所述单指导RNA和所述Cpf1内切核酸酶蛋白中的每一个能够形成核糖核苷酸复合物，所述复合物可以对靶序列进行识别、结合、并且任选地产生切口或进行切割。

32.如实施例31所述的方法，其中所述多个靶序列由至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个靶序列组成。

33.如实施例31所述的方法，其中所述前体指导RNA转录起始盒包含有效地连接到所述前体指导RNA的Pol-II启动子。

34.如实施例31所述的方法，其中所述前体指导RNA转录起始盒包含有效地连接到所述前体指导RNA的Pol-III启动子。

35.如实施例31所述的方法，其中所述单前体指导RNA被加工成三个单指导RNA，其中所述单指导RNA和所述Cpf1内切核酸酶蛋白中的每一个能够形成核糖核苷酸复合物，所述复合物能切割靶序列，其中三个靶位点被修饰。

36.一种指导RNA，选自由以下组成的组：SEQ ID NO：15、16、17、或18。

37.一种用于在植物细胞的基因组中修饰DNA靶序列的方法，所述方法包括：

a)将以下引入植物细胞：Cpf1内切核酸酶、以及能够与Cpf1内切核酸酶形成复合物的指导多核苷酸、包含与植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸；以及，

b)引入多核苷酸修饰模板，所述多核苷酸修饰模板包含与由所述Cpf1复合物识别的PAM序列邻近的DNA靶序列对应的至少一个区域，其中与DNA靶序列对应的至少一个区域与所述PAM序列的3’侧+1至+19的位置的DNA靶序列相比包含至少一个核苷酸错配。

38.如实施例37所述的方法，其中所述方法进一步包括在高于28℃的温度下孵育所述植物细胞至少约4hr的时段。

39.如实施例37所述的方法，其中所述Cpf1复合物可以对所述靶序列进行识别、结合、并且任选地产生切口或进行切割。

40.多核苷酸修饰模板，所述多核苷酸修饰模板包含与由Cpf1复合物识别的PAM序列邻近的DNA靶序列互补的至少一个区域，其中与DNA靶序列对应的至少一个区域与所述PAM序列的3’侧+1至+19的位置的DNA靶序列相比包含至少一个核苷酸错配。

41如实施例40所述的多核苷酸修饰模板，其中所述至少一个核苷酸错配在所述PAM序列的3’侧+14至+19的位置。

42如实施例40所述的多核苷酸修饰模板，其中所述模板与所述PAM序列的3’侧+1至+19的位置的DNA靶序列相比包含2个核苷酸错配。

43如实施例41所述的多核苷酸修饰模板，其中所述模板与所述PAM序列的3’侧+1至+19的位置的DNA靶序列相比包含3、4、5、6、7、8、9、10或更多个核苷酸错配。

44如实施例40所述的多核苷酸修饰模板，其中所述与DNA靶序列对应的至少一个区域进一步包含与所述PAM序列的3’侧+20至+24的位置的靶DNA序列对应的区域中的修饰。

45如实施例44所述的多核苷酸修饰模板，其中与所述PAM序列的3’侧+20至+24的位置的靶DNA序列对应的区域中的修饰包含至少一个核苷酸插入。

46如实施例45所述的多核苷酸修饰模板，其中所述至少一个插入是与所述PAM序列的3’侧位置+21和+22之间位置的靶DNA序列对应的区域中的核苷酸插入。

47如实施例40所述的多核苷酸修饰模板，其中所述模板可以进一步包含与植物的基因组中的核苷酸序列互补的第二DNA区域，其中所述多核苷酸修饰模板包含所述核苷酸序列的至少一个核苷酸修饰。

48如实施例40所述的多核苷酸修饰模板，其中所述模板进一步包含第一侧翼区和第二侧翼区，其中所述第一和第二侧翼区位于所述靶DNA序列侧翼并且能够指导同源定向修复。

49多核苷酸修饰模板，所述多核苷酸修饰模板包含与由Cpf1复合物识别的PAM序列邻近的DNA靶序列互补的至少一个区域，其中与DNA靶序列对应的至少一个区域与所述PAM序列相比包含至少一个核苷酸错配。

50多核苷酸修饰模板选，其自由以下组成的组：SEQ ID NO：23、24和25。

51如实施例37-50所述的多核苷酸，其中所述DNA靶序列是Cpf1 DNA靶位点。

52如实施例40所述的多核苷酸修饰模板，其中所述DNA靶序列是氨基酸球菌属Cpf1内切核酸酶DNA靶位点。

53.如实施例37所述的方法，其中所述植物细胞是单子叶植物细胞或双子叶植物细胞。

54.如实施例53所述的方法，其中该植物细胞选自由以下组成的组：玉蜀黍、稻、高粱、黑麦、大麦、小麦、粟、燕麦、甘蔗、草坪草、或柳枝稷、大豆、卡诺拉油菜、苜蓿、向日葵、棉花、烟草、花生、马铃薯、烟草、拟南芥和红花细胞。

实例

在以下实例中，除非另有说明，份数和百分比以重量计，并且度数为摄氏度。应当理解的是，尽管这些实例说明了本公开的实施例，但仅是通过说明的方式给出的。从上述讨论和这些实例，本领域技术人员可以对本公开进行各种改变和修改以使其适应各种用途和条件。这样的修改也旨在落入所附权利要求的范围内。

实例1

用于玉蜀黍植物中的基因组修饰的玉蜀黍优化的Cpf1内切核酸酶和指导多核苷酸表达盒

为了赋予在玉蜀黍细胞中的有效表达，来自氨基酸球菌属的Cpf1内切核酸酶基因(SEQ ID NO：1)是按本领域已知的标准技术进行玉蜀黍密码子优化的，并且引入马铃薯ST-LS1内含子2(SEQ ID NO：2)以便于消除该基因在大肠杆菌和农杆菌中的表达。为了促进玉蜀黍优化的Cpf1内切核酸酶蛋白在玉蜀黍细胞中的核定位，将编码猿猴病毒40(SV40)单分型核定位信号(SRADPKKKRKV，SEQ ID NO：3)的核苷酸序列添加至3’末端，生成SEQ ID NO：4。然后通过标准分子生物学技术，将编码玉蜀黍优化的氨基酸球菌属Cpf1内切核酸酶基因和核定位信号的SEQ ID NO：4的核苷酸序列与玉蜀黍泛素启动子(SEQ ID NO：12)、玉蜀黍泛素5’非翻译区(UTR)(SEQ ID NO：13)、玉蜀黍泛素内含子1(SEQ ID NO：14)和适合的终止子有效地连接。图1中说明了所得玉蜀黍优化的Cpf1表达盒的关键组分。

用小RNA(本文中称为指导RNA)指导Cpf1内切核酸酶，从而切割双链DNA。这些指导RNA由以下构成：帮助Cpf1识别的大约20nt 5’序列(SEQ ID NO：5)(称为Cpf1识别结构域)，随后是用于通过与DNA靶位点的一条链碱基配对而指导Cpf1切割的大约23nt序列(Cpf1可变靶向结构域)。为了在玉蜀黍细胞中转录对于指导Cpf1内切核酸酶切割活性必需的小RNA，将U6聚合酶III启动子(SEQ ID NO：6)和终止子(TTTTTTTT)从玉蜀黍分离，并且与在转录时将生成对于Cpf1而言适合的指导RNA的DNA序列的末端有效地融合。为了促进指导RNA从玉蜀黍U6聚合酶III启动子的最佳转录，将一个G核苷酸添加至待转录的序列的5’端。图2中说明了本文产生的所得玉蜀黍优化的Cpf1小RNA转录盒的关键组分。从此盒转录的玉蜀黍优化的Cpf1指导RNA如列出在SEQ ID NO：15中(N表示其中可以存在任何核苷酸的可变靶向结构域)。

实例2

来自氨基酸球菌属的玉蜀黍优化的Cpf1/指导多核苷酸系统可以用于指导玉蜀黍染色体DNA的切割

为了测试在实例1中描述的玉蜀黍优化的氨基酸球菌属Cpf1内切核酸酶(SEQ IDNO：11)和指导多核苷酸系统可以用于识别、切割和突变玉蜀黍染色体DNA，将三个不同基因组靶序列(表2)靶向用于切割，并且将其通过深度测序来检测指示切割的突变的存在。

表2.氨基酸球菌属Cpf1玉蜀黍基因组靶序列

选择针对氨基酸球菌属Cpf1具有适当的原型间隔子邻近基序(PAM)(TTTN)和在PAM的3’的大约23nt的靶位点(表2)。然后按标准分子生物学技术，将用于各个靶的在PAM的3’的DNA序列分别引入实例1中描述的编码可变靶向结构域的玉蜀黍优化的小RNA转录盒的区域，这样使得当转录时，各个盒产生指导RNA(SEQ ID NO：16-18)，这些指导RNA将形成能够将Cpf1内切核酸酶指导至其靶位点的指导RNA/Cpf1内切核酸酶复合物。然后通过生物射弹转化，在如在Svitashev等人(2015)Plant Physiology.[植物生理学]169：931-945中描述的BBM和WUS2基因存在下，将所得指导RNA转录盒的每一个分别与实例1中描述的玉蜀黍优化的Cpf1内切核酸酶表达盒一起共递送至Hi-II型10日龄未成熟玉蜀黍胚(IME)中。为了比较在实例1中描述的玉蜀黍优化的Cpf1/指导RNA系统与先前描述的(Svitashev等人(2015))玉蜀黍优化的酿脓链球菌(Spy)Cas9/指导RNA系统，选择靶位点以在AsMS26-1、AsLIGULELESS-1和AsMS45-1靶位点区域(分别称为SpyMS26-1(SEQ ID NO：34)、SpyLIGULELESS-1(SEQ ID NO：26)、SpyMS45-1(SEQ ID NO：35))的每一个内进行切割。然后构建Spy Cas9指导RNA表达载体，并且通过如以上针对Cpf1描述的，通过生物射弹转化，与Spy Cas9内切核酸酶表达载体以及BBM和WUS2基因一起共递送。由于粒子枪转化会是高度可变的，所以也将编码黄色荧光蛋白的可视标记DNA表达盒共递送，从而有助于均匀转化的IME的选择，并且一式三份进行每个处理。为了确定对于指导RNA/Cpf1突变活性最佳的植物转化培养条件，将转化的IME在28℃下(用于粒子抢转化的标准)孵育48hr，并且就在转化后，在升高的温度37℃下孵育48hr。2天后，基于其荧光，收获20-30个最均匀转化的IME。提取总基因组DNA，并且用高保真PCR预混合物(新英格兰生物实验室(NewEngland Biolabs)，M0531L)，添加对于扩增子-特异性条形码必要的和使用“加尾的”引物通过两轮PCR进行Illumnia测序必要的序列，对预期靶位点周围的区域进行PCR扩增，并且深度测序，类似于Karvelis等人(2015)(Methods Section：In planta mutationdetection[方法部分：植物中的突变检测])中描述。如Karvelis等人(2015)中描述，通过与其中从转化中省略小RNA转录盒的对照实验相比，检测所得的读数在预期切割位点处是否存在突变，除了使用24个最普遍的突变类型来计算总突变频率。

靶向用于使用本文描述的指导的多核苷酸/Cpf1系统进行切割的所有3个位点都显示存在小插入或缺失(插入缺失)的形式的突变，指示染色体切割和修复。意外地，如表3中所示，在其中在37℃下孵育植物细胞的实验中，这些靶位点处的突变的频率最大。这与对于酿脓链球菌Cas9/指导多核苷酸系统观察到的形成鲜明对比，其中在28℃和37℃之间的温度处理下的染色体DNA靶位点突变频率中的差异是可忽视的(表3)。相对于28℃温度处理，在37℃下的突变频率的增加倍数(通过在37℃温度处理下的突变频率除以在28℃温度处理下的突变频率进行计算)范围是从大约2倍(对于靶序列AsLIGULELESS-1)至约15倍(对于AsMS26-1)(表3)。

表3.在用于AsCpf1/指导多核苷酸系统和Spy Cas9/指导多核苷酸系统二者的转化后，在不同胚温度孵育下，在3个玉蜀黍位点处插入缺失的频率。

为了进一步限定针对本文描述的AsCpf1/指导RNA系统的最佳植物组织培养条件，将用本文描述的玉蜀黍优化的AsCpf1和AsMS26-1指导RNA表达盒生物射弹转化的IME在25℃、28℃、31℃、34℃、37℃、40℃抑或43℃下孵育2天。然后通过如以上描述的深度测序，测定源自染色体DNA靶位点切割和不完美细胞DNA修复的插入缺失突变的频率。如表4中所示，大约37℃(例如34℃、37℃和40℃)的温度产生了DNA靶位点插入缺失的最高频率，而此范围外的温度积累了显著更低频率的插入缺失。相对于37℃温度处理，分别在40℃和25℃温度处理下的突变频率的减少倍数(通过在37℃温度处理下的突变频率除以在不同温度处理下的突变频率进行计算)范围是从1.0倍至154.5倍(表4)。

表4.植物组织培养温度对本文描述的AsCpf1/指导多核苷酸系统的突变活性的影响

接下来，通过当与两种不同植物启动子，香蕉条纹病毒(BSV)(SEQ ID NO：19)和磷脂转移蛋白(PLTP)(SEQ ID NO：20)启动子配对时检测活性来进一步确认本文描述的指导RNA/Cpf1复合物的温度敏感性。为了最佳表达，将BSV启动子与HPLV9内含子1(SEQ ID NO：21)配对，而PLTP启动子与来自PLTP基因(SEQ ID NO：22)的5’非翻译区(UTR)组合。通过本领域已知的方法，将新启动子和内含子或5’UTR组合与玉蜀黍密码子优化的包含内含子和NLS的AsCpf1基因(SEQ ID NO：4)以及适合的终止子有效地连接。图3和4中说明了所得玉蜀黍优化的Cpf1表达盒。接下来，在AsMS26-1靶位点(SEQ ID NO：7)处，如以上描述评估温度对AsCpf1及其同源指导RNA切割玉蜀黍染色体DNA和诱导靶向突变的能力的影响。如表5中所示，指示AsCpf1切割活性的诱变的频率是温度依赖性的，与使用的玉蜀黍启动子无关。

表5.在转化后，在不同胚温度方案下，使用BSV和PLTP玉蜀黍启动子时的插入缺失的频率。

总之，这些数据表明，出于植物基因组和基因操纵的目的，本文针对氨基酸球菌属描述的Cpf1内切核酸酶和指导多核苷酸系统可以用于靶向玉蜀黍染色体DNA以便进行切割，并且被用作工具从而对植物染色体DNA进行结合、产生切口或进行切割。此外，对于本文描述的玉蜀黍优化的氨基酸球菌属指导多核苷酸/Cpf1系统的最佳活性而言，需要在升高的温度(＞28℃)下孵育的植物转化和生长条件是必需的。

实例3

直系同源玉蜀黍优化的Cpf1/指导多核苷酸系统可以用于指导玉蜀黍染色体DNA 的切割

为了研究直系同源Cpf1/指导多核苷酸系统在植物细胞中的活性，如实例1中描述，优化来自新凶手弗朗西丝菌U112(Fn)和毛螺科菌ND2006(Lb)的Cpf1内切核酸酶和小指导RNA，用于在玉蜀黍中使用。简言之，编码Fn和Lb Cpf1内切核酸酶(SEQ ID NO：32和33)的细菌序列(SEQ ID NO：30和31)是经玉蜀黍密码子优化的。接下来，插入马铃薯ST-LS1内含子2(SEQ ID NO：2)，并且将编码猿猴病毒40(SV40)核定位信号(NLS)(SRADPKKKRKV，SEQ IDNO：3)的序列附加至基因的3’端，生成SEQ ID NO：36和37。接下来，通过如在实例1中描述并且在图1中说明的标准分子生物学技术，利用玉蜀黍泛素启动子(SEQ ID NO：12)、玉蜀黍泛素5’非翻译区(UTR)(SEQ ID NO：13)、玉蜀黍泛素内含子1(SEQ ID NO：14)和适合的终止子将玉蜀黍优化的基因组装成植物表达盒。为了转录能够在玉蜀黍细胞中指导Cpf1内切核酸酶切割活性的小RNA，如实例1中描述和图2中说明组装指导RNA转录盒，除了将编码Cpf1内切核酸酶识别结构域的区域修饰为包含特异性针对Fn和Lb的Cpf1/指导多核苷酸系统的序列(表6)。从此盒转录的玉蜀黍优化的Fn和LbCpf1指导RNA如列出在表6中(N表示其中可以存在任何核苷酸的可变靶向结构域)。

表6.新凶手弗朗西丝菌U112和毛螺科菌ND2006玉蜀黍优化的Cpf1指导多核苷酸。

由于针对FnCpf1(TTN)和LbCpf1(TTTN)PAM识别与AsCpf1(TTTN)的PAM识别重叠，所以选择AsMS26-1靶序列(SEQ ID NO：7)来评价FnCpf1和LbCpf1指导多核苷酸系统的活性。接下来，按照标准分子生物学技术，将针对AsMS26-1的PAM的3’的DNA序列(表2)引入以上描述的玉蜀黍优化的小RNA转录盒的可变靶向结构域，这样使得当转录时，每个盒产生能够形成指导RNA/Cpf1内切核酸酶复合物的指导RNA(SEQ ID NO：42和43)，该复合物可以指导玉蜀黍染色体DNA靶位点切割。

接下来，如以上描述，将Cpf1内切核酸酶和指导RNA表达盒(适当地配对在一起(例如一起使用FnCpf1内切核酸酶和相应的FnCpf1指导RNA表达盒))生物射弹共转化到IME中，并且测定指示染色体DNA靶位点切割和不完美细胞DNA修复的插入或缺失(插入缺失)突变。将其中省略指导RNA转录盒的粒子枪转化用作阴性对照。将其中共递送AsCpf1内切核酸酶和AsMS26-1表达盒的转化用作阳性对照。

如表7中所示，FnCpf1和LbCpf1指导多核苷酸系统二者都产生指示DNA靶位点切割和不完美细胞修复的插入缺失突变。另外，类似于针对本文描述的AsCpf1/指导多核苷酸系统观察到的，直系同源Cpf1系统显示响应升高的温度。针对37℃温度处理观察到的突变频率的增加倍数(通过在37℃温度处理下的突变频率除以在28℃温度处理下的突变频率进行计算)范围分别是从接近2倍(对于LbCpf1指导多核苷酸系统)至大于5倍(对于FnCpf1指导多核苷酸系统)(表7)。

表7.在来自新凶手弗朗西丝菌U112和毛螺科菌ND2006的玉蜀黍优化的Cpf1指导多核苷酸系统的转化后，在玉蜀黍靶位点处的插入缺失的频率。

总之，这些数据表明，出于植物基因组和基因操纵的目的，本文描述的直系同源Cpf1内切核酸酶和指导多核苷酸系统可以用于靶向玉蜀黍染色体DNA以便进行切割，并且被用作工具从而对植物染色体DNA进行结合、产生切口或进行切割。此外，对于本文描述的指导多核苷酸/Cpf1系统的最佳活性而言，需要在升高的温度(＞28℃)下孵育的植物转化和生长条件是必需的。

实例4

补充有多核苷酸修饰模板的玉蜀黍优化的Cpf1内切核酸酶和指导多核苷酸系统可以用于精确修饰玉蜀黍染色体DNA

在具有对于指导RNA和互补DNA靶之间的错配的高耐受性的区域(在PAM的3’大约位置+20至+24)中，Cpf1切割其DNA靶位点(图5A，Kim，D.等人，(2016)NatureBiotechnology.[自然生物技术]34863-868；Kleinstiver，B.等人(2016)NatureBiotechnology.[自然生物技术]34,869-874)。这不同于在具有对于指导RNA和靶DNA错配的低耐受性的区域(在PAM的5’大约位置+3至+4)中切割其DNA靶位点的其他RNA指导的内切核酸酶(例如来自酿脓链球菌的Cas9)(图5B，Jinek，M.等人(2012)Science.[科学]337,816-821)。这使得利用同源定向多核苷酸修饰模板(DNA修复模板)变得困难，因为通常直接在切割位点引入的所需改变仍可被Cpf1切割。为了克服这一点，针对氨基酸球菌属(As)Cpf1多核苷酸指导的系统的特异性，定制了多核苷酸修饰模板。这是通过以下实现的：在具有对于指导RNA和互补DNA靶链之间的错配的低耐受性的邻近切割位点的AsCpf1靶位点的区域(从PAM的位置+1至+19)(图5A)中，将碱基改变引入多核苷酸修饰模板。总之，设计了三个类型的多核苷酸修饰模板。第一个在AsLIGULELESS-1靶位点中切割的5’的区域中包含两个碱基差异(从PAM的位置+15和+16)(DNA修复模板-1，SEQ ID NO：23)。相对于AsLIGULELESS-1靶位点，第二个修复模板设计包括5个碱基差异(从PAM的位置+14至+20)(DNA修复模板-2，SEQ ID NO：24)。并且在第一个上构建第三修复模板，并且除了从PAM的位置+21和+22之间的9个碱基插入以外，还包括两个碱基差异(从PAM的位置+15和+16)(DNA修复模板-3，SEQ ID NO：25)。为了促进同源定向修复(HDR)，将所有多核苷酸修饰模板设计为与AsLIGULELESS-1靶位点侧翼的DNA区域具有同源性。取决于多核苷酸修饰模板设计，这可以略微变化，并且是针对5’同源侧翼区的65-66个碱基对和针对3’同源侧翼区的79-83个碱基对。

为了测试设计的DNA模板指导AsLIGULELESS-1 Cpf1切割的染色体DNA靶位点的修复的效率，通过如实例2中描述的粒子枪生物射弹转化，将实例1中描述的玉蜀黍优化的AsCpf1和指导多核苷酸与20ng的各个双链多核苷酸修饰模板共递送至未成熟玉蜀黍胚中，并且将HDR的频率与来自酿脓链球菌(Spy)Cas9的Cas9和指导多核苷酸系统(如在Svitashev等人(2015)中描述)进行比较。为了实现两个RNA指导的内切核酸酶之间的更精确的比较，选择Spy Cas9靶位点(SpyLIGULELESS-1)(SEQ ID NO：26)来在由AsCpf1切割的AsLIGULELESS-1靶位点区域内切割，并且通过生物射弹转化将与针对AsCpf1设计的相同的修复模板与Spy Cas9指导多核苷酸系统共同递送到未成熟玉蜀黍胚中。将其中省略指导RNA转录盒的粒子枪转化用作阴性对照。如实例2中描述，在转化后，将胚在37℃下孵育48小时，来诱导最佳AsCpf1活性。在温度处理后，基于共递送的颜色标记基因的荧光，收获同样转化的胚。然后，如实例2中描述，分离基因组DNA，并且进行PCR和深度测序。最后，通过针对在多核苷酸修饰模板中是否包含指定的改变检查所得序列读数来检测HDR。为了进一步将转化效率中的差异标准化，通过用源自DSB的非同源末端连接(NHEJ)修复的突变序列读数的总数除以HDR读数的数目，计算HDR的频率。如表8中所示，所有三个修复模板显示了与用Spy Cas9产生的结果类似的NHEJ比HDR读数的比率。

总之，这些数据表明，补充有本文描述的Cpf1定制的多核苷酸修饰模板的本文描述的Cpf1内切核酸酶和指导多核苷酸系统可以用于精确地修饰玉蜀黍染色体DNA。

表8.在玉蜀黍染色体AsLIGULELESS-1靶位点处的NHEJ和HDR结果的频率。

实例5

玉蜀黍优化的Cpf1内切核酸酶和指导多核苷酸系统可以用于同时修饰多个玉蜀黍染色体DNA靶位点

为了检测本文描述的玉蜀黍优化的Cpf1内切核酸酶和指导多核苷酸系统同时将双链断裂(DSB)引入玉蜀黍染色体DNA的能力，从单启动子转录靶向AsLIGULELESS-1、AsMS45-1和AsMS26-1基因座的Cpf1指导RNA，并且通过深度测序检测是否存在指示切割的突变。

以一定方式设计指导RNA转录盒，从而产生稍后被Cpf1的核糖核酸酶活性加工的单RNA转录物，进而产生能够指导Cpf1内切核酸酶切割的三个成熟小RNA。将两个转录盒设计为包含实例2中描述的AsLIGULELESS-1、AsMS45-1和AsMS26-1玉蜀黍靶向序列，在其两侧侧翼是当RNA转录时将由Cpf1切割成能够指导Cpf1染色体DNA靶位点切割的指导RNA的35bp序列(SEQ ID NO：27)(图6和7)。第一指导RNA转录盒包含与多个靶向序列的末端有效地融合的U6聚合酶III启动子(SEQ ID NO：6)和终止子(TTTTTTTT)(图6)，生成SEQ ID NO：28。第二指导RNA转录盒包含与多个靶向序列的末端有效地融合的玉蜀黍泛素聚合酶II启动子(SEQ ID NO：12)、泛素5’非翻译区(UTR)(SEQ ID NO：13)、泛素内含子1(SEQ ID NO：14)和适合的终止子(图7)，生成SEQ ID NO：29。

通过如实例2中描述的生物射弹转化，将每个指导RNA转录盒分别与玉蜀黍优化的氨基酸球菌属(As)Cpf1内切核酸酶表达盒(实例1中描述)共递送到玉蜀黍未成熟胚(IME)中。如实例2中描述，就在转化后，将转化的IME在37℃下孵育48hr。在温度处理后，基于其荧光，收获20-30个最均匀转化的IME，并且提取总基因组DNA。如实例2中描述进行PCR和深度测序，并且如Karvelis等人(2015)中描述，通过与其中从转化中省略小RNA转录盒的对照实验相比，针对在预期切割位点处是否存在突变检查所得的读数。

出人意料地，相对于阴性对照，由本文描述的AsCpf1内切核酸酶和多重指导多核苷酸系统靶向切割的所有三个位点均显示了指示染色体切割和不精确DNA修复的插入和缺失(插入缺失)突变(表9)。另外，聚合酶II和III转录构建体均允许所有三个玉蜀黍染色体靶位点的靶向。

总之，这些数据表明，本文描述的Cpf1内切核酸酶和聚合酶II和III多重指导多核苷酸系统可以用于同时靶向多个玉蜀黍染色体DNA靶位点。

表9.当从单聚合酶II或III启动子串联转录指导RNA时，在AsMS26-1、 AsLIGULELESS-1和AsMS45-1玉蜀黍位点处的突变的频率。

实例6

温度可调节的指导多核苷酸Cpf1系统

本文描述的指导多核苷酸Cpf1系统的观察到的温度诱导可以用于调节Cpf1内切核酸酶的切割活性。在一个方面，这可以提供来自质粒DNA表达盒的Cpf1内切核酸酶活性的瞬时脉冲，这将减小脱靶切割活性的潜力。这与将基因组编辑试剂作为核糖核蛋白(RNP)复合物瞬时递送到细胞中来减小脱靶切割活性的其他方法相反(Svitashev，S.等人，(2016)Nature Communications.[自然通讯]7：13274)。另外，来自质粒DNA表达盒的指导RNA/Cpf1活性的温度诱导可以用于在其已经引入不可能通过RNP递送的细胞后很久，对希望的细胞的、组织的培养物或植物发育阶段的时间切割活性。本文描述的指导多核苷酸Cpf1系统还可以与可诱导的(例如热休克、化学的或细胞的周期)或组织特异性的启动子组合，从而提供对Cpf1内切核酸酶活性的另外的控制。

实例7

在玉蜀黍染色体DNA靶位点处，DNA RNA杂合指导多核苷酸指导Cpf1内切核酸酶切割

此实例说明了以下方法，其中杂合DNA RNA(hDRNA)指导多核苷酸(也称为RNA-DNA指导多核苷酸)能够与Cpf1复合，并且指导内切核酸酶在玉蜀黍染色体DNA靶位点处切割。

首先，设计了hDRNA设计。如图8中所示，将DNA核苷酸合并进入Cpf1识别结构域和可变靶向结构域二者。在Cpf1识别结构域中，将DNA核苷酸合并进入5’末端抑或环结构中，而在可变靶向结构域中，将DNA核苷酸引入3’末端(图8)。总之，设计了靶向AsLIGULELESS-1靶序列的4种hDRNA，并且合成了它们(集成DNA技术公司(Integrated DNA Technologies)，美国)。四种hDRNA包括：杂合DNA-RNA指导多核苷酸1，

[T]AAUUUCUACUCUUGUAGAUCUCUUAGCUCAUCACCUAUGUGG(SEQ ID NO：44)，杂合DNA-RNA指导多核苷酸2，

UAAUUUCUACU[C]UUGUAGAUCUCUUAGCUCAUCACCUAUGUGG(SEQ ID NO：45)，杂合DNA-RNA指导多核苷酸3，

UAAUUUCUACUC[T]UGUAGAUCUCUUAGCUCAUCACCUAUGUGG，以及DNA-RNA指导多核苷酸4，

UAAUUUCUACUCUUGUAGAUCUCUUAGCUCAUCACCUAUGUG[G]。

接下来，通过如实例2和Svitashev等人(2015)中描述，用粒子枪转化将35ng的合成的hDRNA与Cpf1 DNA表达盒、视觉可选择标记和细胞周期刺激基因BBM(ZmODP2(美国公开号20050257289))以及WUS2(ZmWUS2(美国专利号7,256,322))共递送到未成熟玉蜀黍胚(IME)中，评估hDRNA与Cpf1形成复合物并且指导玉蜀黍染色体DNA切割的能力。作为阳性对照，将玉蜀黍优化的酿脓链球菌(Spy)Cas9 DNA表达盒(如Svitashev等人，2015中描述)与靶向序列GGCCGAGGTCGACTACCGGCCGG(SpyMS45-2(SEQ ID NO：49))的75ng的体外T7转录的(MegaScript T7转录试剂盒(赛默飞世尔科技公司(Thermo Fisher Scientific)，美国))Spy单指导RNA(sgRNA)(SEQ ID NO：48)一起共递送到IME中。一式两份进行转化实验，将无指导多核苷酸的组装的测试用作阴性对照，并且在转化后在37℃下孵育IME。在转化后两天之后，从转化的玉蜀黍胚提取总基因组DNA，并且进行靶位点的PCR扩增。如实例2中描述，所得扩增子经受Illumina深度测序，从而确定指示玉蜀黍染色体DNA靶位点切割和不完美修复的小插入或缺失(插入缺失)突变的频率。

在针对AsLIGULELESS-1靶位点的预期切割位点处，所有四种hDRNA都产生插入缺失突变。另外，突变的频率接近利用酿脓链球菌Cas9 DNA表达盒和T7转录的sgRNA的阳性对照的结果(表10)。总之，这些数据表明，出于植物基因组和基因操纵的目的，本文描述的Cpf1内切核酸酶和hDRNA指导多核苷酸系统能够形成功能复合物，该复合物可以识别并且切割玉蜀黍染色体DNA靶位点，并且可以被用作工具对植物染色体DNA进行结合、产生切口或进行切割。

表10.与Spy Cas9指导RNA复合物相比，在玉蜀黍染色体DNA靶位点处由Cpf1 hDRNA指导多核苷酸Cas9复合物诱导的插入缺失的频率。

实例8

玉蜀黍未成熟胚的转化

转化可以通过已知在植物中有效的各种方法来完成，包括粒子介导的递送、农杆菌介导的转化、PEG介导的递送和电穿孔。

a.粒子介导的递送

如下进行使用粒子递送转化玉蜀黍未成熟胚。培养基配方如下。

将穗剥皮并在30％Clorox漂白剂加上0.5％微量洗涤剂中表面消毒20分钟，并用无菌水冲洗两次。将未成熟胚分离，并以每个平板25个胚将胚轴侧向下(盾片侧向上)放置于560Y培养基上持续4小时，并且然后排列在2.5-cm靶区内准备进行轰击。可替代地，将分离的胚置于560L(起始培养基)上并在范围从26℃至37℃的温度下在黑暗中放置8至24小时，之后在26℃下放置于560Y中4小时，之后如上所述进行轰击。

使用标准分子生物学技术构建含有双链断裂诱导剂和供体DNA的质粒，并用含有发育基因ODP2(AP2结构域转录因子ODP2(胚珠发育蛋白2)；US20090328252 A1)和Wushel(US2011/0167516)的质粒进行共同轰击。

如下使用水溶性阳离子脂质转染试剂，将质粒和目的DNA沉淀到0.6μm(平均直径)金球粒上。使用1μg的质粒DNA和任选地用于共轰击的其他构建体(例如50ng(0.5μl)的包含发育基因ODP2(AP2结构域转录因子ODP2(胚珠发育蛋白2)；US20090328252 A1)和Wushel的各个质粒)，在冰上制备DNA溶液。向预混的DNA中添加在水中的20μl的制备的金粒子(15mg/ml)和5μl的水溶性阳离子脂质转染试剂并小心混合。将金粒子在微型离心机中以10,000rpm沉淀1分钟并去除上清液。用100ml的100％EtOH小心冲洗所得球粒，而不重悬球粒，并且小心去除EtOH冲洗剂。添加105μl的100％EtOH，并通过简短的超声处理将粒子进行重悬。然后，将10μl点在每个巨载体的中心上，并在轰击前允许其干燥约2分钟。

可替代地，使用氯化钙(CaCl₂)沉淀程序，通过混合在水中的100μl的制备的钨粒子、Tris EDTA缓冲液中的10μl(1μg)DNA(1μg总DNA)、100μl 2.5M CaC12、和10μl 0.1M亚精胺，将质粒和目的DNA沉淀到1.1μm(平均直径)钨球粒上。混合下，将每种试剂顺序地添加至钨粒子悬浮液中。将最终混合物短暂超声处理，并且允许在恒定涡旋下孵育10分钟。在沉淀期后，将管短暂离心，去除液体，并且用500ml l00％乙醇洗涤粒子，随后是30秒离心。再次，去除液体，并且添加105μl的100％乙醇到最终钨粒子球粒。为了粒子枪轰击，将钨/DNA粒子短暂超声处理。将10ul的钨/DNA粒子点在每个巨载体的中心上，此后在轰击前允许点的粒子干燥约2分钟。

用Biorad氦气枪，在水平#4轰击样品板。所有样品接受在450PSI的单次射击，其中从每个制备的粒子/DNA的管中取总共十个等分试样。

轰击后，将胚在26℃至37℃的温度范围下在560P(维持培养基)上孵育12至48小时，并且然后置于26℃。在5至7天后，将胚转移至包含3mg/升双丙氨膦的560R选择培养基上，并在26℃下每2周继代培养。在约10周的选择之后，将选择抗性愈伤组织克隆转移到288J培养基中以开始植物再生。在体细胞胚成熟(2-4周)后，将发育良好的体细胞胚转移到培养基上进行萌芽，并且转移到有光照的培养室中。在约7-10天后，将发育的小植物转移到试管中的272V不含激素的培养基中7-10天，直到小植物良好地生长。然后将植物转移到包含盆栽土壤的平托花盆(inserts in flats)(相当于2.5″盆)中，并在生长室中生长1周，随后在温室中再生长1-2周，然后转移到经典的600盆(1.6加仑)中并生长至成熟。对植物进行监测并对转化效率和/或再生能力的改变进行评分。

起始培养基(560L)包含4.0g/l N6基础盐(西格玛公司(SIGMA)C-1416)、1.0ml/lEriksson’s维生素混合液(1000X西格玛公司(SIGMA)-1511)、0.5mg/l硫胺素HCl、20.0g/l蔗糖、1.0mg/l 2，4-D、以及2.88g/l L-脯氨酸(用D-I H2O定容，之后用KOH调节至pH 5.8)；2.0g/l结冷胶(在用D-I H2O定容之后添加)；以及8.5mg/l硝酸银(在对培养基进行灭菌并冷却至室温之后添加)。

维持培养基(560P)包含4.0g/lN6基础盐(西格玛公司(SIGMA)C-1416)、1.0ml/lEriksson’s维生素混合液(1000X西格玛公司(SIGMA)-1511)、0.5mg/l硫胺素HCl、30.0g/l蔗糖、2.0mg/l 2，4-D、以及0.69g/l L-脯氨酸(用D-I H2O定容，之后用KOH调节至pH 5.8)；3.0g/l结冷胶(在用D-I H2O定容之后添加)；以及0.85mg/l硝酸银(在对培养基进行灭菌并冷却至室温之后添加)。

轰击培养基(560Y)包含4.0g/l N6基础盐(西格玛公司(SIGMA)C-1416)、1.0ml/lEriksson’s维生素混合液(1000X西格玛公司(SIGMA)-1511)、0.5mg/l硫胺素HCl、120.0g/l蔗糖、1.0mg/l 2，4-D、以及2.88g/l L-脯氨酸(用D-I H2O定容，之后用KOH调节至pH 5.8)；2.0g/l结冷胶(在用D-I H2O定容之后添加)；以及8.5mg/l硝酸银(在对培养基进行灭菌并冷却至室温之后添加)。

选择培养基(560R)包含4.0g/l N6基础盐(西格玛公司(SIGMA)C-1416)、1.0ml/lEriksson’s维生素混合液(1000X西格玛公司(SIGMA)-1511)、0.5mg/l硫胺素HCl、30.0g/l蔗糖、以及2.0mg/l 2，4-D(用D-I H2O定容，之后用KOH调节至pH 5.8)；3.0g/l结冷胶(在用D-I H2O定容之后添加)；以及0.85mg/l硝酸银和3.0mg/l双丙氨膦(在对培养基进行灭菌并冷却至室温之后添加这两者)。

植物再生培养基(288J)包含4.3g/l MS盐(GIBCO 11117-074)、5.0ml/l MS维生素储液(0.100g烟酸、0.02g/l硫胺素HCL、0.10g/l吡哆醇HCL、和0.40g/l甘氨酸，用精制的D-IH2O定容)(Murashige和Skoog(1962)Physiol.Plant.[植物生理学]15：473)、100mg/l肌醇、0.5mg/l玉米素、60g/l蔗糖、以及1.0ml/l的0.1mM脱落酸(用精制的D-I H2O定容，之后调节至pH 5.6)；3.0g/l结冷胶(在用D-I H2O定容之后添加)；以及1.0mg/l吲哚乙酸和3.0mg/l双丙氨膦(在对培养基进行灭菌并冷却至60℃之后添加)。

无激素培养基(272V)包含4.3g/l MS盐(GIBCO 11117-074)、5.0ml/l MS维生素储液(0.100g/l烟酸、0.02g/l硫胺素HCL、0.10g/l吡哆醇HCL、和0.40g/l甘氨酸，用精制的D-IH2O定容)、0.1g/l肌醇、以及40.0g/l蔗糖(用精制的D-I H2O定容，之后调节pH至5.6)；以及6g/l细菌用琼脂(在用精制的D-I H2O定容之后添加)，灭菌并冷却至60℃。

b.农杆菌介导的转化

基本上如在Djukanovic等人(2006)Plant Biotech J[植物生物技术杂志]4：345-57中所描述地进行农杆菌介导的转化。简言之，将10-12日龄的未成熟胚(尺寸为0.8-2.5mm)从灭菌的仁切下并放置于液体培养基(4.0g/L N6基础盐(西格玛公司(Sigma)C-1416)、1.0ml/L Eriksson’s维生素混合液(西格玛公司(Sigma)E-1511)、1.0mg/L硫胺素HCl、1.5mg/L 2，4-D、0.690g/L L-脯氨酸、68.5g/L蔗糖、36.0g/L葡萄糖，pH 5.2)中。收集胚后，用1ml浓度为0.35-0.45 OD550的农杆菌代替培养基。将玉蜀黍胚与农杆菌在室温下一起孵育5分钟，然后将混合物倾倒在培养基平板上，该培养基平板包含4.0g/L N6基础盐(西格玛公司(Sigma)C-1416)、1.0ml/L Eriksson’s维生素混合液(西格玛公司(Sigma)E-1511)、1.0mg/L硫胺素HCl、1.5mg/L 2，4-D、0.690g/L L-脯氨酸、30.0g/L蔗糖、0.85mg/L硝酸银、0.1nM乙酰丁香酮、以及3.0g/L结冷胶，pH 5.8。将胚轴侧向下在20℃在黑暗中孵育3天，然后在28℃在黑暗中孵育4天，然后转移到新的培养基平板上，该培养基平板包含4.0g/L N6基础盐(西格玛公司(Sigma)C-1416)、1.0ml/L Eriksson’s维生素混合液(西格玛公司(Sigma)E-1511)、1.0mg/L硫胺素HCl、1.5mg/L 2，4-D、0.69g/L L-脯氨酸、30.0g/L蔗糖、0.5g/L MES缓冲液、0.85mg/L硝酸银、3.0mg/L双丙氨膦、100mg/L羧苄青霉素、以及6.0g/L琼脂，pH 5.8。将胚每三周进行继代培养，直到鉴定到转基因事件。通过将少量组织转移到再生培养基(4.3g/L MS盐(Gibco 11117)、5.0ml/L MS维生素储液、100mg/L肌醇、0.1μMABA、1mg/L IAA、0.5mg/L玉蜀黍素、60.0g/L蔗糖、1.5mg/L双丙氨膦、100mg/L羧苄青霉素、3.0g/L结冷胶，pH 5.6)上来诱导体细胞胚发生，并在28℃下在黑暗中孵育两周。将所有具有可视芽和根的物质都转移到以下培养基上，该培养基包含4.3g/L MS盐(Gibco 11117)、5.0ml/L MS维生素储液、100mg/L肌醇、40.0g/L蔗糖、1.5g/L结冷胶(pH 5.6)，并在28℃下在人造光下孵育。一周后，将小植物移入包含相同培养基的玻璃管中并生长直到它们被取样和/或移植到土壤中。

实例9

BBM的瞬时表达增强转化

可以修改转化方案的参数以确保BBM活性是瞬时的。一种这样的方法涉及例如通过使用化学品PEI，以允许转录和表达、但是排除随后的DNA释放的方式沉淀包含BBM的质粒。在一个实例中，用PEI将BBM质粒沉淀到金粒子上，同时使用标准的氯化钙方法将待整合的转基因表达盒(UBI：moPAT～GFPm：：PinII；moPAT是玉蜀黍优化的PAT基因)沉淀到金粒子上。

简言之，如下用PEI包被金粒子。首先，洗涤金粒子。在微量离心管中称出35mg的平均直径为1.0的金粒子(A.S.I.#162-0010)，并添加1.2ml纯EtOH并涡旋一分钟。将该管在室温下孵育15分钟，并且然后在4℃下使用微型离心机高速离心15分钟。弃去上清液，并添加新鲜的1.2ml等分试样的乙醇(EtOH)，涡旋一分钟，离心一分钟，并再次弃去上清液(重复两次)。添加新鲜的1.2ml等分试样的EtOH，并将该悬浮液(在EtOH中的金粒子)在-20℃储存数周。为了用聚乙烯亚胺(PEI；西格玛公司(Sigma)#P3143)包被粒子，将250μl的洗涤过的金粒子/EtOH混合物进行离心并弃去EtOH。将粒子在100μl ddH2O中洗涤一次以去除残留的乙醇，添加250μl的0.25mM PEI，然后进行脉冲超声处理以悬浮粒子，并且然后将该管插入干冰/EtOH浴中以快速冷冻该悬浮液，然后将其冷冻干燥过夜。此时，干燥的包被的粒子可以在-80℃储存至少3周。在使用之前，用250μl等分试样的2.5mM HEPES缓冲液(pH 7.1)冲洗粒子3次，伴随1x脉冲超声处理，并且然后在每次离心之前快速涡旋。然后将粒子悬浮在最终体积为250μl的HEPES缓冲液中。在附着DNA之前，将25μl等分试样的粒子添加到新鲜的管中。为了附着未包被的DNA，将粒子进行脉冲超声处理，然后添加1μg的DNA(在5μl水中)，随后通过用Pipetteman上下移液几次而混合并孵育10分钟。短暂(即10秒)旋转粒子，弃去上清液，并添加60μl EtOH。将具有PEI沉淀的DNA-1的粒子在60μl的EtOH中洗涤两次。将粒子离心，弃去上清液，并将粒子重悬于45μl水中。为了附着第二DNA(DNA-2)，使用其中使用水溶性阳离子脂质转染试剂的沉淀。短暂超声处理45μl的粒子/DNA-1悬浮液，并且然后添加5μl的100ng/μl的DNA-2和2.5μl的水溶性阳离子脂质转染试剂。将溶液置于旋转式摇床上10分钟，以10,000g离心1分钟。去除上清液，并将粒子重悬于60μl的EtOH中。将该溶液点在巨载体上，并使用针对PDS-1000的标准方案将其上依次附着有DNA-1和DNA-2的金粒子递送到10个DAP Hi-II未成熟胚的盾片细胞中。对于该实验，该DNA-1质粒包含UBI：RFP：pinII表达盒，并且DNA-2包含UBI：CFP：pinII表达盒。轰击后两天，观察到CFP和RFP荧光标记两者的瞬时表达，因为未成熟胚表面上有许多红色和蓝色细胞。然后将胚置于非选择性培养基上并使其生长3周，然后对稳定的集落进行评分。在这3周后，与仅有一个红色集落相比，观察到10个多细胞的稳定表达的蓝色集落。这表明，PEI沉淀可用于有效地引入DNA用于瞬时表达，同时显著地减少PEI引入的DNA的整合，并因此减少表达RFP的转基因事件的回收率。以此方式，PEI沉淀可以用于递送BBM和/或WUS2的瞬时表达。

例如，首先使用PEI将粒子用UBI：BBM：pinII包被，然后使用水溶性阳离子脂质转染试剂将粒子用UBI：：moPAT～YFP包被，并且然后轰击到未成熟胚的表面上的盾片细胞中。PEI介导的沉淀导致在未成熟胚表面上瞬时表达细胞的频率较高，并且稳定转化体的回收率极低。因此，预期PEI沉淀的BBM盒瞬时表达并刺激在组织的轰击表面(即盾片表面)上胚生长的爆发，但该质粒将不会整合。预期从Ca++/金粒子释放的PAT～GFP质粒以导致转基因事件回收率大幅度提高的频率整合并表达可选择标记。作为对照处理，将包含UBI：GUS：pinII(而不是BBM)的PEI沉淀的粒子与PAT～GFP/Ca++粒子混合。将来自这两种处理的未成熟胚移至含有3mg/l双丙氨膦的培养基上。在6-8周后，预期在PEI/BBM处理中将以相对于对照处理(PEI/GUS)高得多的频率观察到GFP+、双丙氨膦抗性愈伤组织。

作为一种替代方法，将BBM质粒用PEI沉淀到金粒子上，并且然后引入未成熟胚表面上的盾片细胞中，并随后BBM基因的瞬时表达引起胚生长的快速增殖。在这个诱导生长期间，使用针对玉蜀黍的标准方法(参见实例1)用农杆菌处理外植体，其中T-DNA递送到引入转基因表达盒(如UBI：：moPAT～GFPm：：piniI)的细胞中。在共培养后，允许外植体在正常培养基上回收，并且然后移至含有3mg/l双丙氨膦的培养基上。在6-8周后，预期在PEI/BBM处理中将以相对于对照处理(PEI/GUS)高得多的频率观察到GFP+、双丙氨膦抗性愈伤组织。

通过瞬时表达BBM和/或WUS2多核苷酸产物来“启动(kick start)”愈伤组织生长可能是期望的。这可以通过递送BBM和WUS2 5’加帽的聚腺苷酸化的RNA、含有BBM和WUS2DNA的表达盒、或BBM和/或WUS2蛋白来完成。所有这些分子都可以使用生物射弹粒子枪来递送。例如，使用阿姆比恩公司(Ambion)的mMessage mMachine试剂盒可以容易地在体外制备5’加帽的聚腺苷酸化的BBM和/或WUS2 RNA。将RNA与含有目的多核苷酸和用于选择/筛选的标记的DNA(如Ubi：：moPAT～GFPm：：PinII)一起共同递送。预期接受该RNA的细胞将立即开始更加快速地分裂，并且这些细胞中的大部分将整合上农艺学基因。这些事件可以进一步被验证为转基因克隆集落，因为它们也将表达该PAT～GFP融合蛋白(并因此将在适当照明下显示绿色荧光)。然后可以筛选从这些胚再生的植物中目的多核苷酸的存在。

Claims

a)将以下引入植物细胞：Cpf1内切核酸酶蛋白或编码所述Cpf1内切核酸酶蛋白的植物优化的多核苷酸、以及包含与所述植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸或表达所述指导多核苷酸的重组DNA；以及，

b)在高于28℃的温度下孵育所述植物细胞至少约4小时的时段，

其中所述指导多核苷酸和Cpf1内切核酸酶能够形成复合物，所述复合物能够对所述靶序列进行识别、结合、并且任选地产生切口或进行切割。

2.如权利要求1所述的方法，其中所述植物优化的多核苷酸是编码所述Cpf1内切核酸酶蛋白的植物优化的mRNA，或是包含有效地连接到编码所述Cpf1内切核酸酶蛋白的植物优化的多核苷酸的启动子的重组DNA构建体。

3.如权利要求1所述的方法，所述方法进一步包括鉴定至少一种在所述靶序列处具有修饰的植物细胞，其中在所述靶序列处的修饰选自由以下组成的组：(i)至少一个核苷酸的替代、(ii)至少一个核苷酸的缺失、(iii)至少一个核苷酸的插入、和(iv)(i)-(iii)的任何组合。

4.如权利要求3所述的方法，其中当与对照方法相比时，在所述靶序列处的所述修饰以增加的频率发生，其中在约28℃的典型植物组织培养温度下孵育b)的植物细胞。

5.如权利要求4所述的方法，其中当与所述对照方法相比时，所述增加的频率是增加至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少10倍、至少11倍、至少12倍、至少13倍、至少14倍、至少15倍、至少30倍、至少40倍、或至少50倍。

6.如权利要求1所述的方法，所述方法进一步包括向所述植物细胞中引入供体DNA，其中所述供体DNA包含目的多核苷酸。

7.如权利要求6所述的方法，所述方法进一步包括鉴定在其基因组中包含整合到所述靶序列中或其附近的目的多核苷酸的至少一种植物细胞。

a)将以下引入植物细胞：Cpf1内切核酸酶蛋白或编码所述Cpf1内切核酸酶蛋白的植物优化的多核苷酸、包含与所述植物基因组中的靶序列基本上互补的可变靶向结构域的指导多核苷酸、以及多核苷酸修饰模板；

其中所述指导多核苷酸和Cpf1内切核酸酶蛋白能够形成复合物，所述复合物能够对所述靶序列的全部或一部分进行识别、结合、并且任选地产生切口或进行切割。

9.如权利要求8所述的方法，所述方法进一步包括鉴定在其基因组中包含所述核苷酸序列的所述至少一个核苷酸修饰的至少一种植物细胞。

10.如权利要求1或8所述的方法，其中所述指导多核苷酸选自由以下组成的组：RNA多核苷酸、DNA多核苷酸、或RNA-DNA多核苷酸。

11.如权利要求1所述的方法，其中所述植物细胞是单子叶植物细胞或双子叶植物细胞。

12.如权利要求11所述的方法，其中该植物细胞选自由以下组成的组：玉蜀黍、稻、高粱、黑麦、大麦、小麦、粟、燕麦、甘蔗、草坪草、或柳枝稷、大豆、卡诺拉油菜、苜蓿、向日葵、棉花、烟草、花生、马铃薯、烟草、拟南芥属和红花细胞。

13.一种在植物细胞的基因组中同时修饰多个靶序列的方法，所述方法包括：

a)将以下引入所述植物细胞：Cpf1内切核酸酶蛋白、或编码所述Cpf1内切核酸酶蛋白的植物优化的多核苷酸、以及能够表达被加工成许多单指导RNA的单前体RNA的前体指导RNA转录起始盒，其中每个单指导RNA包含在原型间隔子邻近基序(PAM)的3’的可变靶向结构域，其中所述可变靶向结构域与所述植物基因组中的单靶序列互补；以及，

b)在高于28℃的温度下孵育(a)的植物细胞至少约4小时的时段，

其中所述单指导RNA和所述Cpf1内切核酸酶蛋白中的每一个能够形成核糖核苷酸复合物，所述复合物能够对靶序列进行识别、结合、并且任选地产生切口或进行切割。

14.如权利要求13所述的方法，其中所述多个靶序列由至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个靶序列组成。

15.如权利要求13所述的方法，其中所述前体指导RNA转录起始盒包含有效地连接到所述前体指导RNA的Pol-II启动子。

16.如权利要求13所述的方法，其中所述前体指导RNA转录起始盒包含有效地连接到所述前体指导RNA的Pol-III启动子。

17.一种用于在植物细胞的基因组中修饰DNA靶序列的方法，所述方法包括：

a)将以下引入植物细胞：Cpf1内切核酸酶蛋白或编码所述Cpf1内切核酸酶蛋白的植物优化的多核苷酸、以及能够与所述Cpf1内切核酸酶蛋白形成Cpf1复合物的指导多核苷酸或表达所述指导多核苷酸的重组DNA，所述指导多核苷酸包含与所述植物基因组中的靶序列基本上互补的可变靶向结构域；以及，

b)引入多核苷酸修饰模板，所述多核苷酸修饰模板包含与由所述Cpf1复合物识别的PAM序列邻近的DNA靶序列对应的至少一个区域，其中所述与DNA靶序列对应的至少一个区域与所述PAM序列的3’侧+1至+19的位置的DNA靶序列相比包含至少一个核苷酸错配。

18.如权利要求17所述的方法，其中所述方法进一步包括在高于28℃的温度下孵育所述植物细胞至少约4小时的时段。

19.如权利要求17所述的方法，其中所述Cpf1复合物能够对所述靶序列进行识别、结合、并且任选地产生切口或进行切割。

20.一种多核苷酸修饰模板，所述多核苷酸修饰模板包含与由Cpf1复合物识别的PAM序列邻近的DNA靶序列互补的至少一个区域，其中所述与DNA靶序列对应的至少一个区域与所述PAM序列的3’侧+1至+19的位置的DNA靶序列相比包含至少一个核苷酸错配。

21.如权利要求20所述的多核苷酸修饰模板，其中所述至少一个核苷酸错配在所述PAM序列的3’侧+14至+19的位置。

22.如权利要求21所述的多核苷酸修饰模板，其中所述模板与所述PAM序列的3’侧+1至+19的位置的DNA靶序列相比包含2个核苷酸错配。

23.如权利要求21所述的多核苷酸修饰模板，其中所述模板与所述PAM序列的3’侧+1至+19的位置的DNA靶序列相比包含3、4、5、6、7、8、9、10或更多个核苷酸错配。

24.如权利要求20所述的多核苷酸修饰模板，其中所述与DNA靶序列对应的至少一个区域进一步包含与离所述PAM序列的3’从+20至+24的位置的靶DNA序列对应的区域中的修饰。

25.如权利要求24所述的多核苷酸修饰模板，其中与所述PAM序列的3’侧+20至+24的位置的靶DNA序列对应的区域中的修饰包含至少一个核苷酸插入。

26.如权利要求25所述的多核苷酸修饰模板，其中所述至少一个插入是与所述PAM序列的3’侧位置+21和+22之间位置的靶DNA序列对应的区域中的核苷酸插入。

27.如权利要求20所述的多核苷酸修饰模板，其中所述模板进一步包含与植物基因组中的核苷酸序列互补的第二DNA区域，其中所述多核苷酸修饰模板包含所述核苷酸序列的至少一个核苷酸修饰。

28.如权利要求40所述的多核苷酸修饰模板，其中所述模板进一步包含第一侧翼区和第二侧翼区，其中所述第一和第二侧翼区位于所述靶DNA序列侧翼并且能够指导同源定向修复。

29.一种多核苷酸修饰模板，所述多核苷酸修饰模板包含与PAM序列互补的至少一个区域，所述PAM序列与由Cpf1复合物识别的DNA靶序列邻近，其中与PAM序列对应的至少一个区域包含至少一个核苷酸错配。