CN118302434A

CN118302434A - 用于改善小花育性和种子产量的方法

Info

Publication number: CN118302434A
Application number: CN202280078202.0A
Authority: CN
Inventors: M·米勒; D·奥康纳
Original assignee: Pairing Plant Service Co ltd
Current assignee: Pairing Plant Service Co ltd
Priority date: 2021-10-07
Filing date: 2022-10-06
Publication date: 2024-07-05
Also published as: CA3234455A1; MX2024004058A; EP4413022A2; WO2023060152A2; WO2023060152A3; AR127300A1; US20230116819A1

Abstract

本发明涉及用于修饰编码组蛋白去甲基化酶多肽的核酸的组合物和方法，所述组蛋白去甲基化酶多肽调节植物的小花育性、种子数量和/或种子重量。

Description

用于改善小花育性和种子产量的方法

关于序列表的电子提交的声明

XML文本格式的序列表命名为1499-78_ST26.xml，大小为236,700字节，在2022年9月17日生成并随本申请提交，其公开内容通过引用并入本说明书中。

优先权声明

本申请根据35U.S.C.§119(e)要求于2021年10月7日提交的美国临时申请号63/253,179的权益，该申请的全部内容通过引用并入本文。

技术领域

本发明涉及用于修饰编码组蛋白去甲基化酶多肽的核酸的组合物和方法，所述组蛋白去甲基化酶多肽调节植物的小花育性、种子数量和/或种子重量，任选地，所述组蛋白去甲基化酶是Jumonji C型H3K9me2/me3甲基化酶。本发明还涉及使用本发明的方法和组合物产生的植物。

背景技术

小花育性是产量的关键组成部分，可直接影响单株种子数量或籽粒数量。谷物作物的一个共同特征是不育小花，玉米中的每个小穗有一个不育小花，并且在硬质小麦和面包小麦中有不同数量的不育侧生小花。这种性状被认为是祖传的，并且不育小花可能有助于作物祖先物种的谷粒分散。在小麦和大麦等小粒谷物中，增加的小花育性是驯化的目标，以增加谷粒数量和总产量。大麦和小麦中的几个参与小花育性的基因已进行良好表征，其中一些是通过自然变异研究鉴定的，另一些是通过诱变方法鉴定的。然而，这些直系同源物的功能在包括玉米在内的其它物种中是未知的。

需要用于改善小花育性、种子数量和/或种子重量的新策略来改善作物表现。

发明内容

本发明的一个方面提供了一种植物或其部分，所述植物或其部分包含内源性组蛋白去甲基化酶基因中的至少一个突变，所述组蛋白去甲基化酶基因编码组蛋白去甲基化酶多肽，所述组蛋白去甲基化酶多肽包含锌指DNA结合结构域(ZnF结构域)、Jumonji C型(Jmj-C)结构域和Jumonji N型(Jmj-N)结构域，其中所述突变破坏组蛋白去甲基化酶多肽与DNA的结合和/或降低组蛋白去甲基化酶多肽的组蛋白去甲基化活性，任选地，其中所述突变可以是非天然突变。

本发明的第二方面提供了一种包含编辑系统的植物细胞，所述编辑系统包含：(a)CRISPR相关效应蛋白；和(b)引导核酸(例如，gRNA、gDNA、crRNA、crDNA)，所述引导核酸具有与编码组蛋白去甲基化酶的内源性靶基因互补的间隔序列，任选地所述组蛋白去甲基化酶是SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶，任选地是Jumonji C型H3K9me2/me3去甲基化酶。

本发明的第三方面提供了植物细胞，所述植物细胞包含组蛋白去甲基化酶基因的DNA结合位点中的突变，所述突变阻止或减少编码的组蛋白去甲基化酶与DNA的结合或降低编码的组蛋白去甲基化酶的活性，其中所述基因组修饰是使用编辑系统引入的置换、插入和/或缺失，所述编辑系统包含与组蛋白去甲基化酶基因中的靶位点结合的核酸结合结构域，其中所述组蛋白去甲基化酶基因：(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；和/或(b)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽，任选地，其中突变可以是非天然突变。

本发明的第四方面提供了一种提供具有增加的小花育性、增加的种子数量和/或增加的种子重量的多种植物的方法，所述方法包括在生长区域种植两种或更多种本发明的植物，从而提供与不包含突变并种植在生长区域的多种对照植物相比具有增加的小花育性、增加的种子数量和/或增加的种子重量的多种植物。

本发明的第五方面提供了一种产生/育种无转基因的基因组编辑(例如碱基编辑)的植物的方法，所述方法包括：(a)使本发明的植物与无转基因的植物杂交，从而将突变或修饰引入无转基因的(例如，子代)植物；以及(b)选择包含突变或修饰但无转基因的子代植物，从而产生无转基因的基因组编辑的(例如，碱基编辑的)植物。

第六方面提供了一种在植物的内源性组蛋白去甲基化酶基因中产生突变的方法，所述方法包括：(a)使基因编辑系统靶向内源性组蛋白去甲基化酶基因的部分，所述部分：(i)包含与SEQ ID NO:75、76、78、79、81、82、84或85中任一个具有至少80％的序列同一性的核苷酸序列和/或编码与SEQ ID NO:87、88、90或91中任一个具有至少80％的同一性的氨基酸序列，任选地包含与SEQ ID NO:75、78、81或84中任一个具有至少80％的序列同一性的核苷酸序列和/或编码与SEQ ID NO:87或SEQ ID NO:90具有至少80％的同一性的氨基酸序列，和/或(ii)包含与SEQ ID NO:77、80、83或86中任一个具有至少80％的序列同一性的核苷酸序列和/或编码与SEQ ID NO:89或92任一个具有至少80％的同一性的氨基酸序列；以及(b)选择包含位于内源性组蛋白去甲基化酶基因的部分中的修饰的植物，所述部分与SEQID NO:75、76、77、78、79、80、81、82、83、84、85或86中任一个核苷酸序列具有至少80％的序列同一性。

第七方面提供了一种在植物细胞的组蛋白去甲基化酶多肽中产生变异的方法，所述方法包括：将编辑系统引入植物细胞，其中所述编辑系统靶向植物细胞的组蛋白去甲基化酶基因的区域；并使组蛋白去甲基化酶基因的区域与所述编辑系统接触，从而将突变引入组蛋白去甲基化酶基因并在植物细胞的组蛋白去甲基化酶多肽中产生变异。

第八方面提供了一种检测植物的突变组蛋白去甲基化酶基因(内源性组蛋白去甲基化酶基因中的突变)的方法，所述方法包括在植物基因组中检测SEQ ID NO:69、70、72、73或75-87中任一个的核酸序列，所述核酸序列具有至少一个突变，所述突变破坏组蛋白去甲基化酶与DNA的结合或降低组蛋白去甲基化酶的组蛋白去甲基化活性。

本发明的第九方面提供了一种编辑植物细胞基因组中特定位点的方法，所述方法包括：以位点特异性方式切割植物细胞中内源性组蛋白去甲基化酶基因中的靶位点，所述内源性组蛋白去甲基化酶基因：(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；和/或(b)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽，从而在植物细胞的内源性组蛋白去甲基化酶基因中产生编辑。

第十方面提供了一种产生植物的方法，所述方法包括：(a)使包含编码组蛋白去甲基化酶的野生型内源性基因的植物细胞群体与靶向野生型内源性基因的核酸酶接触，其中所述核酸酶与结合野生型内源性基因中的靶位点的核酸结合结构域连接，所述内源性基因：(i)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％序列同一性的序列；和/或(ii)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽；(b)从所述群体中选择包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物细胞，其中所述突变是(i)或(ii)中任一多肽中至少一个氨基酸残基的置换和/或缺失，其中所述突变降低或消除组蛋白去甲基化酶结合DNA的能力或降低组蛋白去甲基化酶的组蛋白去甲基化活性；(c)使选择的植物细胞生长成包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物。

第十一方面提供了一种增加植物小花育性、种子数量和/或种子重量的方法，所述方法包括：(a)使包含编码组蛋白去甲基化酶的野生型内源性基因的植物细胞与靶向野生型内源性基因的核酸酶接触，其中所述核酸酶与结合野生型内源性基因中的靶位点的核酸结合结构域连接，所述野生型内源性基因：(i)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；和/或(ii)编码包含与SEQ ID NO:71或SEQID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽，从而产生包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物细胞；以及(b)使植物细胞生长成包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物，从而增加植物的小花育性、种子数量和/或种子重量。

第十二方面提供了一种产生植物或其部分的方法，所述植物或其部分包含至少一个具有内源性组蛋白去甲基化酶基因中的突变的细胞，所述方法包括使植物或植物部分中的组蛋白去甲基化酶基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触，其中所述核酸结合结构域与组蛋白去甲基化酶基因中的靶位点结合，其中所述组蛋白去甲基化酶基因：(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；和/或(b)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽，从而产生包含至少一个具有内源性组蛋白去甲基化酶基因中的突变的细胞的植物或其部分。

第十三方面提供了一种产生植物或其部分的方法，所述植物或其部分包含内源性组蛋白去甲基化酶中的突变，突变的组蛋白去甲基化酶具有减少的DNA结合或降低的活性，所述方法包括使植物或植物部分中的内源性组蛋白去甲基化酶基因中的靶位点与包含切割结构域和DNA结合结构域的核酸酶接触，其中所述核酸结合结构域与组蛋白去甲基化酶基因中的靶位点结合，其中所述组蛋白去甲基化酶基因：(a)包含与SEQ ID NO:69、70、72或73中任一个的核苷酸序列具有至少80％的序列同一性的序列；和/或(b)编码包含与SEQ IDNO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽，从而产生具有内源性组蛋白去甲基化酶中的突变的植物或其部分，突变的组蛋白去甲基化酶具有减少的DNA结合。

第十四个方面提供了与组蛋白去甲基化酶基因内的靶位点结合的引导核酸，所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个或多个核苷酸序列具有至少80％的同一性的序列；或编码与SEQ ID NO:71或74中任一个或多个氨基酸序列具有至少80％的序列同一性的序列，任选地，其中组蛋白去甲基化酶基因包含：(1)JmjN结构域，所述JmjN结构域：(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80％的序列同一性的多肽，(2)JmjC结构域，所述JmjC结构域：(a)与SEQ ID NO:76、79、82或85中任一个核苷酸具有至少80％的序列同一性，或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80％的序列同一性的多肽，和/或(3)ZnF结构域，所述ZnF结构域：(a)与SEQ IDNO:77、80、83或86中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ IDNO:89或SEQ ID NO:92的氨基酸序列具有至少80％的序列同一性的多肽。

第十五方面提供了一种系统，所述系统包含本发明的引导核酸和与所述引导核酸缔合的CRISPR-Cas效应蛋白。

第十六方面提供了一种基因编辑系统，所述基因编辑系统包含与引导核酸缔合的CRISPR-Cas效应蛋白，其中所述引导核酸包含与内源性组蛋白去甲基化酶基因结合的间隔序列。

在第十七方面，提供了一种包含CRISPR-Cas效应蛋白和引导核酸的复合物，所述CRISPR-Cas效应蛋白包含切割结构域，其中所述引导核酸与组蛋白去甲基化酶基因中的靶位点结合，所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；和/或编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽，其中所述切割结构域切割组蛋白去甲基化酶基因中的靶链。

在第十八方面，提供了一种表达盒，其包含：(a)编码包含切割结构域的CRISPR-Cas效应蛋白的多核苷酸和(b)与组蛋白去甲基化酶基因中的靶位点结合的引导核酸，其中所述引导核酸包含与组蛋白去甲基化酶基因中的靶位点互补并结合的间隔序列，所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；和/或编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽。

在另一方面，提供了包含本发明的核酸的植物或其部分，任选地，其中所述植物是玉米植物。

在另一方面，提供了一种植物或其部分，所述植物或其部分包含改善的小花育性和/或增加的种子数量和/或种子重量，任选地，其中所述植物是玉米植物。

在另一方面，提供了一种玉米植物或其部分，所述玉米植物或其部分包含位于1号染色体上且具有基因识别号(基因ID)Zm00001d030108或位于5号染色体上且具有基因IDZm00001d014422的内源性SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶基因中的至少一个非自然突变，任选地，其中所述至少一个突变导致突变的SHI基因，所述突变的SHI基因与SEQ ID NO:107、109、111、113、115、117、119和121中任一个具有至少90％的序列同一性，任选地，其中所述突变的SHI基因编码与SEQ ID NO:108、110、112、114、116、118、120或122中任一个具有至少90％的序列同一性的突变的VRS2多肽序列，任选地，其中所述至少一个突变是非自然突变。

在另一方面，提供了一种引导核酸，所述引导核酸与玉米植物的内源性SIX-ROWEDSPIKE 3(VRS3)组蛋白去甲基化酶基因中的靶核酸结合，其中所述靶核酸位于1号染色体上并具有基因识别号(基因ID)Zm00001d030108或位于5号染色体上并具有基因IDZm00001d014422。

还提供了在其基因组中包含通过本发明方法产生的一个或多个突变的组蛋白去甲基化酶基因的植物，以及用于产生本发明的植物的多肽、多核苷酸、核酸构建体、表达盒和载体。

本发明的这些和其它方面在下文对本发明的描述中更详细地阐述。

序列的简要说明

SEQ ID NO:1-17是用于本发明的示例性Cas12a氨基酸序列。

SEQ ID NO:18-20是用于本发明的示例性Cas12a核苷酸序列。

SEQ ID NO:21-22是编码启动子和内含子的示例性调控序列。

SEQ ID NO:23-29是用于本发明的示例性胞嘧啶脱氨酶序列。

SEQ ID NO:30-40是用于本发明的示例性腺嘌呤脱氨酶氨基酸序列。

SEQ ID NO:41是用于本发明的示例性尿嘧啶DNA糖基化酶抑制剂(UGI)序列。

SEQ ID NO:42-44提供了用于本发明的实例肽标签和亲和多肽。

SEQ ID NO:45-55提供了用于本发明的实例RNA募集基序和相应的亲和多肽。

SEQ ID NO:56-57是用于本发明的示例性Cas9多肽序列。

SEQ ID NO:58-68是用于本发明的示例性Cas9多核苷酸序列。

SEQ ID NO:69和SEQ ID NO:72是实例VRS3基因组序列，分别位于1和5号染色体上。

SEQ ID NO:70和SEQ ID NO:73分别是SEQ ID NO:69和SEQ ID NO:72的实例VRS3编码(cDNA，cds)序列。

SEQ ID NO:71和SEQ ID NO:74是由SEQ ID NO:69和SEQ ID NO:72编码的实例VRS3多肽序列。

SEQ ID NO:75-86是来自VRS3多核苷酸的实例核酸序列(区域)(SEQ ID NO:75,78(JmjN，1号染色体)、SEQ ID NO:76,79(JmjC，1号染色体)、SEQ ID NO:77,80(ZfN，1号染色体)、SEQ ID NO:81,84(JmjN，5号染色体)、SEQ ID NO:82,85(JmjC，5号染色体)、SEQ IDNO:83,86(ZfN，5号染色体))。

SEQ ID NO:87-92是来自VRS3多肽的实例氨基酸序列(区域)(SEQ ID NO:87(JmjN，1号染色体)、SEQ ID NO:88(JmjC，1号染色体)、SEQ ID NO:89(ZfN，1号染色体)、(SEQ ID NO:(JmjN，5号染色体)、SEQ ID NO:91(JmjC，5号染色体)、SEQ ID NO:92(ZfN，5号染色体))。

SEQ ID NO:93-103是用于本发明的核酸引导物的实例间隔序列。

SEQ ID NO:104、106或108是编辑的VRS2基因组序列，分别编码SEQ ID NO:105、107或109的突变的VRS2多肽序列。

具体实施方式

现在将在下文中参考所附的实施例来描述本发明，在实施例中示出了本发明的实施方案。该描述并不旨在成为可实施本发明的所有不同方式或可添加到本发明的所有特征的详细目录。例如，关于一个实施方案示出的特征可以合并到其它实施方案中，并且关于特定实施方案示出的特征可以从该实施方案中删除。因此，本发明预期在本发明的一些实施方案中，可以排除或省略本文阐述的任何特征或特征的组合。另外，根据本公开，对本文提出的各种实施方案的多种变化和添加对于本领域技术人员来说将是显而易见的，这些变化和添加不背离本发明。因此，以下描述旨在说明本发明的一些特定实施方案，而不是穷举地指定其所有排列、组合和变化。

除非另外定义，本文中使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同含义。本文中在本发明的描述中使用的术语仅用于描述特定实施方案的目的，并且不旨在限制本发明。

本文引用的所有出版物、专利申请、专利和其它参考文献均通过引用以其整体并入，以用于与其中呈现参考文献的句子和/或段落相关的教导。

除非上下文另有说明，否则具体意在本文描述的本发明的各种特征可以以任何组合使用。此外，本发明还考虑到在本发明的一些实施方案中，可以排除或省略本文阐述的任何特征或特征的组合。为了说明，如果说明书陈述组合物包含组分A、B和C，则具体意在A、B或C中的任一个或其组合可以单独地或以任何组合地被省略和放弃。

如本发明的描述和所附权利要求中所使用的，单数形式“一种”、“一个”和“该/所述”也旨在包括复数形式，除非上下文明确地另有说明。

同样如本文所使用的，“和/或”是指并涵盖一个或多个相关的列出项目的任何和所有可能的组合，以及当以替代方式(“或”)解释时缺少组合。

如本文所用的术语“约”当指可测量值诸如量或浓度等时，意在涵盖规定值的±10％、±5％、±1％、±0.5％或甚至±0.1％的变化以及规定值。例如，“约X”，其中X是可测量值，意在包括X以及X的±10％、±5％、±1％、±0.5％或甚至±0.1％的变化。本文提供的可测量值的范围可以包括其中的任何其它范围和/或单个值。

如本文所用，短语诸如“在X和Y之间”和“在约X和Y之间”应当解释为包括X和Y。如本文所用，短语诸如“在约X和Y之间”是指“在约X和约Y之间”，短语诸如“从约X到Y”是指“从约X到约Y”。

除非本文另有说明，本文中数值范围的列举仅旨在用作单独提及落入该范围内的每个单独值的简写方法，并且每个单独值并入说明书中，如同其在本文中被单独描述一样。例如，如果公开了范围10至15，则也公开了11、12、13和14。

如本文所用的术语“包含”指定所陈述的特征、整数、步骤、操作、元件和/或组件的存在，但不排除一个或多个其它特征、整数、步骤、操作、元件、组件和/或其组的存在或添加。

如本文所用，过渡短语“基本上由......组成”意味着权利要求的范围应被解释为涵盖权利要求中列举的指定材料或步骤以及不实质上影响所要求保护的发明的基本和新颖特征的那些材料或步骤。因此，当用在本发明的权利要求中时，术语“基本上由......组成”不旨在被解释为等同于“包含”。

如本文所用，术语“增加”、“增强”(及其语法变体)描述了与对照相比，至少约5％、10％、15％、20％、25％、50％、75％、100％、150％、200％、300％、400％、500％或更多的升高。例如，如本文所述的包含VRS3基因中的突变的植物可以表现出增加的小花育性或增加的种子产量，包括增加的种子重量和/或种子数量，比没有相同突变的植物(例如，与不包含突变的同基因植物(例如，野生型未编辑的植物或空缺分离体)相比)高至少约5％(例如，增加约5％至约100％，任选地，增加约10％至约30％)。

如本文所用，术语“减少”、“减小”和“降低”(及其语法变体)描述，例如，与对照相比，至少约5％、10％、15％、20％、25％、35％、50％、75％、80％、85％、90％、95％、96％、97％、98％、99％、99.5％、99.6％、99.7％、99.8％、99.9％或100％的减少。在特定实施方案中，减少可导致没有或基本上没有(即，不显著的量，例如，小于约10％或甚至5％)可检测的活性或量。例如，如本文所述的包含VRS3基因中的突变的植物可以包含产生具有减少的DNA结合和/或降低的去甲基化酶活性的VRS3多肽的VRS3基因，与没有相同突变的植物相比(例如，与不包含突变的同基因植物(例如，野生型未编辑的植物或空缺分离体)相比)，DNA结合和/或去甲基化酶活性降低至少约5％。在一些实施方案中，具有如本文所述的突变的VRS3基因的表达可以降低至少5％。

如本文所用，关于核酸分子和/或核苷酸序列(例如，RNA或DNA)的术语“表达”等表示核酸分子和/或核苷酸序列被转录并且任选地被翻译。因此，核酸分子和/或核苷酸序列可以表达感兴趣的多肽或例如功能性非翻译RNA。

“异源”或“重组”核苷酸序列是与其引入的宿主细胞不天然相关的核苷酸序列，包括天然存在的核苷酸序列的非天然存在的多个拷贝。

“天然”或“野生型”核酸、核苷酸序列、多肽或氨基酸序列是指天然存在的或内源的核酸、核苷酸序列、多肽或氨基酸序列。因此，例如，“野生型内源性VRS3基因”是在参考生物体(例如植物)中天然存在或是参考生物体(例如植物)内源的VRS3基因。

如本文所用，术语“杂合的”是指其中不同等位基因位于同源染色体上的相应基因座处的遗传状态。

如本文所用，术语“纯合的”是指其中相同等位基因位于同源染色体上的相应基因座处的遗传状态。

如本文所用，术语“等位基因”是指在特定基因座处出现的两种或更多种不同核苷酸或核苷酸序列之一。

“无效等位基因”是由基因突变引起的无功能等位基因，其导致相应蛋白质的产生完全缺乏或产生无功能的蛋白质。

“隐性突变”是基因中的当纯合时产生表型但当基因座杂合时表型不可观察到的突变。

“显性负性突变”是产生改变的基因产物(例如，相对于野生型具有异常功能)的突变，该基因产物不利地影响野生型等位基因或基因产物的功能。例如，“显性负性突变”可以阻断野生型基因产物的功能。显性负性突变也可称为“反效等位基因突变”。

“半显性突变”是指杂合生物体中表型的外显率小于纯合生物体中观察到的表型外显率的突变。

“弱功能丧失突变”是导致基因产物与野生型基因产物相比具有部分功能或功能降低(部分失活)的突变。

“亚效等位基因突变”是导致基因功能部分丧失的突变，其可以通过表达减少(例如，蛋白质减少和/或RNA减少)或功能性能降低(例如，活性降低)而发生，但不是完全丧失功能/活性。“亚效”等位基因是由基因突变引起的半功能等位基因，其导致产生以正常效率的1％-99％之间的任何水平发挥作用的相应蛋白质。

“超等位基因突变”是导致基因产物的表达增加和/或基因产物的活性增加的突变。

“基因座”是染色体上基因或标记或等位基因所在的位置。在一些实施方案中，基因座可涵盖一个或多个核苷酸。

如本文所用，术语“所需等位基因”、“靶等位基因”和/或“感兴趣的等位基因”可互换使用，指与所需性状相关的等位基因。在一些实施方案中，所需等位基因可以与给定性状的增加或减少(相对于对照)相关，这取决于所需表型的性质。

当性状与标记连锁时，并且当该标记的存在是包含该标记的植物/种质中是否和/或以何种程度出现所需性状或性状形式的指示时，该标记与该性状“相关”。类似地，当标记与等位基因或染色体区间连锁并且当标记的存在是等位基因或染色体区间是否存在于包含标记的植物/种质中的指示时，该标记与该等位基因或染色体区间“相关”。

如本文所用，术语“回交”是指子代植物与其亲本之一杂交一次或多次(例如1、2、3、4、5、6、7、8次等)。在回交方案中，“供体”亲本是指具有要渗入的所需基因或基因座的亲本植物。“受体亲本(使用一次或多次)或“轮回”亲本(使用两次或更多次)是指基因或基因座渗入其中的亲本植物。例如，参见Ragot,M.等人，Marker-assisted Backcrossing:APractical Example,in TECHNIQUES ET UTILISATIONSDES MARQUEURS MOLECULAIRES LESCOLLOQUES,Vol.72,第45-56页(1995)；和Openshaw等人，Marker-assisted Selection inBackcross Breeding,in PROCEEDINGS OF THE SYMPOSIUM"ANALYSIS OF MOLECULARMARKER DATA,"第41-43页(1994)。初始的杂交产生F1代。术语“BC1”是指轮回亲本的第二次使用，“BC2”是指轮回亲本的第三次使用，依此类推。

如本文所用，术语“杂交”是指通过授粉的配子融合以产生子代(例如，细胞、种子或植物)。该术语涵盖有性杂交(一株植物通过另一株植物授粉)和自交(自花授粉，例如当花粉和胚珠来自同一植物时)。术语“杂交”是指通过授粉融合配子以产生子代的行为。

如本文所用，术语“基因渗入”是指一个或多个遗传基因座的所需等位基因或所需等位基因的组合从一种遗传背景到另一种遗传背景的天然和人工传递。例如，特定基因座处的所需等位基因可以通过同一物种的两个亲本之间的有性杂交传递给至少一个子代，其中至少一个亲本在其基因中具有所需等位基因。备选地，例如，等位基因的传递可以通过两个供体基因组之间的重组而发生，例如在融合的原生质体中，其中至少一个供体原生质体在其基因组中具有所需的等位基因。所需的等位基因可以是标记、QTL、转基因等的选定等位基因。包含所需等位基因的子代可以与具有所需遗传背景的品系回交一次或多次(例如，1、2、3、4或更多次)，针对所需等位基因进行选择，结果是所需等位基因固定在所需的遗传背景中。例如，与非水胁迫条件下增加的产量相关的标记可以从供体渗入到不包含该标记并且在非水胁迫条件下不表现出增加的产量的轮回亲本中。然后可以使所得子代回交一次或多次并进行选择，直到子代在轮回亲本背景中拥有与非水胁迫条件下产量增加相关的遗传标记为止。

“遗传图谱”是对给定物种内一个或多个染色体上的基因座之间遗传连锁关系的描述，通常以图表或表格形式描绘。对于每个遗传图谱，基因座之间的距离是通过它们之间的重组频率来测量的。可以使用多种标记来检测基因座之间的重组。遗传图谱是做图群体、所用标记类型以及不同群体之间每个标记的多态性潜力的产物。基因座之间的顺序和遗传距离可以因遗传图谱而异。

如本文所用，术语“基因型”是指个体(或个体群体)在一个或多个遗传基因座处的遗传构成，与可观察和/或可检测和/或表现的性状(表型)形成对比。基因型是由个体从其亲本遗传的一个或多个已知基因座的等位基因定义的。术语基因型可用于指代个体在单个基因座、多个基因座处的遗传构成，或更一般地，术语基因型可用于指个体基因组中所有基因的遗传组成。基因型可以例如使用标记间接表征和/或通过核酸测序直接表征。

如本文所用，术语“种质”是指个体(例如植物)、一组个体(例如植物品系、品种或科)或衍生自品系、品种、物种或培养物的克隆的遗传物质或来自个体(例如植物)、一组个体(例如植物品系、品种或科)或衍生自品系、品种、物种或培养物的克隆的遗传物质。种质可以是生物体或细胞的一部分或者可以与生物体或细胞分开。一般来说，种质提供具有特定遗传组成的遗传物质，为生物体或细胞培养物的部分或全部遗传品质提供基础。如本文所用，种质包括可生长新植物的细胞、种子或组织，以及可培养成完整植物的植物部分(例如叶、茎、芽、根、花粉、细胞等)。

如本文所用，术语“栽培品种”和“品种”是指通过结构或遗传特征和/或性能可与同一物种内的其它品种区分开的一组相似植物。

如本文所用，术语“外来”、“外来品系”和“外来种质”是指非良种的任何植物、品系或种质。一般而言，外来植物/种质并非源自任何已知的优良植物或种质，而是被选择以将一种或多种所需的遗传元件引入育种计划中(例如，将新的等位基因引入育种计划中)。

如本文所用，术语“杂种”在植物育种的背景下是指通过使不同品系或品种或物种的植物杂交产生的遗传上不同的亲本的子代的植物，所述杂交包括但不限于两个自交系之间的杂交。

如本文所用，术语“近交”是指基本上纯合的植物或品种。该术语可以指在整个基因组中基本上纯合的植物或植物品种，或者关于特别感兴趣的基因组的一部分基本上纯合的植物或植物品种。

“单倍型”是个体在多个遗传基因座处的基因型，即等位基因的组合。通常，定义单倍型的遗传基因座在物理上和遗传上是连锁的，即在相同的染色体节段上。术语“单倍型”可以指特定基因座处的多态性，诸如单个标记基因座，或者沿着染色体节段的多个基因座处的多态性。

如本文所用，术语“异源”是指源自外来物种的核苷酸/多肽，或者如果来自同一物种，则通过人为干预在组成和/或基因组位点上从其天然形式进行实质性修饰。

如本文所用，“对照植物”是指不包含本文所述的编辑的组蛋白去甲基化酶基因的植物，所述编辑的组蛋白去甲基化酶基因赋予增强/改善的性状或改变的表型(例如减少的收获后黄化/减少的叶绿素降解)。对照植物用于鉴别和选择如本文所述进行编辑的并且与对照植物相比具有增强的性状或改变的表型的植物。合适的对照植物可以是用于产生包含突变的去甲基化酶基因的植物的亲本系的植物，例如，缺乏如本文所述的内源性去甲基化酶基因中的编辑的野生型植物。合适的对照植物还可以是含有赋予其它性状的重组核酸的植物，例如，具有增强的除草剂耐受性的转基因植物。在一些情况下，合适的对照植物可以是缺乏如本文所述的突变的甲基化酶基因的杂合或半合转基因植物品系的子代，称为负分离体或负同基因系。

增强的性状(例如，改善的产量性状)可以包括，例如，与对照植物相比，从种植到成熟的天数减少、增加的茎大小、增加的叶数、增加的营养阶段株高生长速率、增加的穗大小、增加的每株植物穗干重、增加的每穗籽粒数、增加的每籽粒重量、增加的每株籽粒数、减少的穗空、延长的灌浆期、降低的株高、增加的根分枝数量、增加的总根长、增加的产量、提高的氮利用效率和/或提高的水利用效率。改变的表型可以是，例如，株高、生物量、冠层面积、花青素含量、叶绿素含量、施用的水、含水量和水利用效率。

在一些实施方案中，本发明的植物可以包含一种或多种改善的产量性状，包括但不限于，在一些实施方案中，一种或多种改善的产量性状包括：与没有至少一个突变的对照植物相比，更高的产量(蒲式耳/英亩)、增加的生物量、增加的株高、增加的茎直径、增加的叶面积、增加的花数、增加的籽粒行数(任选地其中穗长没有显著减少)、增加的籽粒数、增加的籽粒大小、增加的穗长、减少的分蘖数、减少的雄穗分枝数、增加的荚果数量(包括增加的每个节点的荚果数和/或增加的每株植物的荚果数)、每个荚果增加的种子数量、增加的种子数量、增加的种子大小和/或增加的种子重量(例如，增加的百粒种子重量)。在一些实施方案中，与对照植物或其部分相比，本发明的植物可以包含一种或多种改善的产量性状，包括但不限于，任选地，增加的产量(蒲式耳/英亩)、种子大小(包括籽粒大小)、种子重量(包括籽粒重量)、增加的籽粒行数(任选地其中穗长不显著减少)、增加的荚果数量、每个荚果增加的种子数量以及增加的穗长。

如本文所用，“性状”是植物或特定植物材料或细胞的生理学、形态学、生物化学或物理特征。在一些情况下，该特征是人眼可见的并且可以机械地测量，诸如种子或植物的大小、重量、形状、形式、长度、高度、生长速率和发育阶段，或者可以通过生物化学技术测量，诸如检测种子或叶的蛋白质、淀粉、某些代谢物或油含量，或通过观察代谢或生理过程而测量，例如，通过测量对缺水或特定盐或糖浓度的耐受性，或通过测量一个或多个基因的表达水平而测量，例如，通过采用Northern分析、RT-PCR、微阵列基因表达测定或报告基因表达系统，或通过农业观察诸如高渗胁迫耐受性或产量而测量。然而，任何技术都可以用来测量转基因植物中任何选定的化学化合物或大分子的量、比较水平或差异。

如本文所用，“增强的性状”是指由如本文所述的SGR基因中的突变引起的植物特征。此类性状包括但不限于，增强的农艺性状，其特征在于增强的植物形态学、生理学、生长和发育、产量、营养增强、病害或害虫抗性、或环境或化学耐受性。在一些实施方案中，增强的性状/改变的表型可以是，例如，从种植到成熟的天数减少、增加的茎大小、增加的叶数、增加的营养阶段株高生长速率、增加的穗大小、增加的每株植物穗干重、增加的每穗籽粒数、增加的每籽粒重量、增加的每株植物籽粒数、减少的穗空、延长的灌浆期、降低的株高、增加的根分枝数量、增加的总根长、耐旱性、提高的水利用效率、耐寒性、提高的氮利用效率和/或增加的产量。在一些实施方案中，性状是在非胁迫条件下增加的产量或在环境胁迫条件下增加的产量。胁迫条件可包括生物胁迫和非生物胁迫，例如，干旱、荫蔽、真菌病、病毒病、细菌病、昆虫侵扰、线虫侵扰、低温暴露、热暴露、渗透胁迫、氮养分利用度降低、磷养分利用度降低和高植株密度。“产量”可以受到许多特性的影响，包括但不限于株高、植物生物量、荚果数、植株上的荚果位置、节间数、荚果开裂的发生率、籽粒大小、穗大小、穗尖灌浆度、籽粒败育、结瘤和固氮效率、养分同化效率、生物和非生物胁迫抗性、碳同化、植物结构、抗倒伏性、种子发芽率、幼苗活力和子苗性状。产量还可能受到以下因素的影响：发芽效率(包括胁迫条件下的发芽)、生长速率(包括胁迫条件下的生长速率)、开花时间和持续时间、穗数、穗大小、穗重量、每穗或荚果的种子数、种子大小、种子的成分(淀粉、油、蛋白质)和种子饱满的特征。

还如本文所用，术语“性状修饰”涵盖通过在包含如本文所述的内源性SGR基因中的突变的植物中相对于不包含该突变的植物(诸如野生植型物，或负分离体)产生可检测到的特征差异来改变天然存在的性状。在一些情况下，可以定量评估性状修饰。例如，与对照植物相比，性状修饰可以导致观察到的性状特征或表型的增加或减少。众所周知，在经过修饰的性状中可以存在自然变异。因此，与对照植物相比，观察到的性状修饰可以导致植物中性状特征或表型的正态分布和幅度的变化。

本公开涉及一种具有改善的经济相关特性、更具体是具有增加的产量和/或改善的植物结构(其有助于改善的产量性状)的植物。更具体地，本公开涉及如本文所述的包含SGR基因中的突变的植物，其中与没有所述突变的对照植物相比，所述植物具有增加的产量。在一些实施方案中，如本文所述产生的植物与对照植物相比表现出增加的产量或改善的产量性状成分，任选地，改善的植物结构(例如，增加的分枝、增加的节数、半矮小的株高)。在一些实施方案中，本公开的植物表现出与产量有关的改善的性状，包括但不限于增加的氮利用效率、增加的氮胁迫耐受性、增加的水利用效率和/或增加的耐旱性，如下文所定义和讨论的。

产量可以定义为作物的可测量的经济价值产生。产量可以在数量和/或质量的范围内定义。产量可以直接取决于几个因素，例如器官的数量和大小(例如花数)、植物结构(诸如分枝数、植物生物量，例如增加的根生物量、更陡的根角和/或更长的根等)、开花时间和持续时间、谷物灌浆期。根系结构和发育、光合效率、养分吸收、胁迫耐受性、早期活力、延迟衰老和功能性滞绿表型可能是决定产量的因素。因此，优化上述因素有助于提高作物产量。

本文提及的产量相关性状的增加/改善也可以被认为是指植物的一个或多个部分的生物量(重量)的增加，其可以包括地上和/或地下(可收获的)植物部分。具体地，此类可收获部分是种子，并且本公开的方法的实施导致相对于合适的对照植物的种子产量具有增加的产量、特别是增加的种子产量的植物。术语植物的“产量”可以涉及该植物的营养生物量(根和/或枝条生物量)、繁殖器官和/或繁殖体(诸如种子)。

本公开的植物增加的产量可以通过多种方式测量，包括测试重量、每株植物的种子数、种子重量、每单位面积的种子数(例如，每英亩的种子或种子的重量)、每英亩蒲式耳数、每英亩吨数或每公顷公斤数。增加的产量可以通过改善关键生化化合物(诸如氮、磷和碳水化合物)的利用，或改善对环境胁迫(诸如冷、热、干旱、盐、荫蔽、高植株密度以及害虫或病原体攻击)的反应来实现。

“增加的产量”可以表现为以下一种或多种：(i)植物的一个或多个部分，特别是植物的地上(可收获)部分的增加的植物生物量(重量)，增加的根生物量(增加的根数、增加根厚度、增加根长度)或增加的任何其它可收获部分的生物量；或(ii)增加的早期活力，本文定义为发芽后约三周的幼苗地上面积的提高。

“早期活力”是指活跃健康的植物生长，尤其是在植物生长的早期阶段，并且可以由于例如植物更好地适应其环境(例如，优化对能源的利用、对养分的吸收以及在芽和根之间分配碳)引起的植物适应度增加产生。例如，早期活力可以是种子在种植后发芽和出苗的能力以及幼苗在出苗后生长和发育的能力的组合。具有早期活力的植物还表现出增加的幼苗存活率和更好的作物种植，这通常导致高度均匀的田地，其中大多数植物基本上同时达到各个发育阶段，这通常导致产量增加。因此，早期活力可以通过测量各种因素来确定，诸如籽粒重量、发芽率、出苗率、幼苗生长、幼苗高度、根长、根和芽生物量、冠层大小和颜色等。

此外，增加的产量还可以表现为增加的总种子产量，这可以由于下列中的一种或多种所致：由于基于每株植物和/或单个种子的种子重量的增加所致的种子生物量(种子重量)的增加，例如，每株植物的花/圆锥花序数量增加；荚果数量增加；节数量增加；每个圆锥花序/植物的花(“小花”)数量增加；种子饱满率提高；饱满种子的数量增加；种子大小(长度、宽度、面积、周长和/或重量)的增加，这也会影响种子的组成；和/或种子体积增加，这也会影响种子的组成。在一个实施方案中，增加的产量可以是增加的种子产量，例如，增加的种子重量；增加的饱满种子数量；和/或增加的收获指数。

增加的产量还可以导致结构改变，或者可以由于植物结构改变而发生。

增加的产量也可以表现为收获指数的增加，收获指数表示为可收获部分(诸如种子)的产量与总生物量的比率。

本公开还延伸至植物的可收获部分，诸如但不限于种子、叶、果实、花、棉铃、荚果、长角果、坚果、茎、根茎、块茎和球茎。本公开还涉及源自此类植物的可收获部分的产品，诸如干颗粒、粉末、油、脂肪和脂肪酸、淀粉或蛋白质。

本公开提供了用于增加植物的“产量”或植物或植物部分的“泛英亩产量(broadacre yield)”的方法，其被定义为每单位面积可收获的植物部分，例如种子，或种子的重量，每英亩，每英亩磅数、每英亩蒲式耳数、每英亩吨数(tones per acre)、每英亩吨数、每公顷公斤数。

如本文所用，“氮利用效率”是指导致施用的每单位氮的植物产量、生物量、活力和生长速率增加的过程。这些过程可以包括植物对氮的吸收、同化、积累、信号传导、传感、再转移(在植物内)和利用。

如本文所用，“提高的氮利用效率”是指在经受与正常或标准条件下相同的可利用/施用量的氮时，植物比正常情况更快或更好地生长、发育或产出的能力；在经受低于最适的可利用/施用量的氮，或在氮限制条件下植物正常生长、发育或产出的能力，或更快或更好地生长、发育或产出的能力。

如本文所用，“氮限制条件”是指提供低于植物充分或成功的代谢、生长、繁殖成功和/或存活所需的最适氮量的生长条件或环境。

如本文所用，“增加的氮胁迫耐受性”是指在经受低于最适的可利用/施用量的氮时，或在氮限制条件下植物正常生长、发育或产出的能力，或更快或更好地生长、发育或产出的能力。

增加的植物氮利用效率可以在田间转化为在供应较少的氮的同时收获相似数量的产量，或者通过供应最适/足够量的氮来获得增加的产量。提高的氮利用效率可以提高植物氮胁迫耐受性，还可以改善作物品质和种子的生化成分，诸如蛋白质产量和油产量。术语“增加的氮利用效率”、“提高的氮利用效率”和“氮胁迫耐受性”在本公开中可互换使用，是指在氮限制条件下具有提高的生产力的植物。

如本文所用，“水利用效率”是指每单位蒸腾的水蒸气被叶子同化的二氧化碳的量。它是控制干燥环境中植物生产力的最重要性状之一。“耐旱性”是指植物适应干旱或干旱条件的程度。植物对缺水的生理反应包括叶子枯萎、叶面积减小、叶离现象以及通过将养分引导到植物的地下部分来刺激根部生长。通常，植物在开花和种子发育(繁殖阶段)期间更容易受到干旱的影响，因为植物的资源被用来支持根系生长。此外，脱落酸(ABA)是一种植物应激激素，诱导叶片气孔(参与气体交换的微孔)关闭，从而减少蒸腾作用造成的水分损失，并降低光合作用速率。这些反应在短期内提高了植物的水利用效率。术语“增加的水利用效率”、“提高的水利用效率”和“增加的耐旱性”在本公开中可互换使用，是指在水限制条件下具有改善的生产力的植物。

如本文所用，“增加的水利用效率”是指在经受与正常或标准条件下相同的可利用/施用量的水时，植物比正常情况更快或更好地生长、发育或产出的能力；在经受减少的可利用/施用量的水(水输入)时，或在水分胁迫或缺水胁迫的条件下植物正常生长、发育或产出的能力，或更快或更好地生长、发育或产出的能力。

如本文所用，“增强的耐旱性”是指在经受减少的可利用/施用量的水和/或在短期或长期干旱的条件下，植物正常生长、发育或产出的能力，或者比正常情况更快或更好地生长、发育或产出的能力；在经受减少的可利用/施用量的水(水输入)时，或在缺水胁迫的条件下或短期或长期干旱的条件下植物正常生长、发育或产出的能力。

如本文所用，“干旱胁迫”是指导致缺水并使植物受到胁迫和/或对植物组织造成损害和/或对谷物/作物产量产生负面影响的干旱期(短期或长期/延长)；导致缺水和/或温度升高并使植物受到胁迫和/或对植物组织造成损害和/或对谷物/作物产量产生负面影响的干旱期(短期或长期/延长)。

如本文所用，“缺水”是指提供低于植物充分/成功的生长和发育所需的最适水量的条件或环境。

如本文所用，“水分胁迫”是指提供相对于植物/作物充分/成功的生长和发育所需的水量不适当(较少/不足或更多/过量)的水量的条件或环境，从而使植物受到胁迫和/或对植物组织造成损害和/或对谷物/作物产量产生负面影响。

如本文所用，“缺水胁迫”是指提供相对于植物/作物充分/成功的生长和发育所需的水量较少/不足的水量的条件或环境，从而使植物受到胁迫和/或对植物组织造成损害和/或对谷物产量产生负面影响。

如本文所用，术语“核酸”、“核酸分子”、“核苷酸序列”和“多核苷酸”是指线性或支链、单链或双链的RNA或DNA，或其杂交体。该术语还涵盖RNA/DNA杂交体。当合成产生dsRNA时，不太常见的碱基，诸如肌苷、5-甲基胞嘧啶、6-甲基腺嘌呤、次黄嘌呤等也可用于反义、dsRNA和核酶配对。例如，含有尿苷和胞苷的C-5丙炔类似物的多核苷酸已被证明以高亲和力结合RNA，并且是基因表达的有效反义抑制剂。也可以进行其它修饰，诸如对磷酸二酯骨架或RNA核糖基团中的2'-羟基的修饰。

如本文所用，术语“核苷酸序列”是指核苷酸的异聚物或这些核苷酸从核酸分子的5'至3'端的序列，包括DNA或RNA分子，包括cDNA、DNA片段或部分、基因组DNA、合成(例如化学合成)DNA、质粒DNA、mRNA和反义RNA，其中任一个都可以是单链或双链。术语“核苷酸序列”、“核酸”、“核酸分子”、“核酸构建体”、“寡核苷酸”和“多核苷酸”在本文中也可互换使用，以指代核苷酸的异聚物。本文提供的核酸分子和/或核苷酸序列在此从左到右以5'至3'方向呈现，并使用美国序列规则37CFR§§1.821-1.825中规定的用于表示核苷酸字符的标准代码和世界知识产权组织(WIPO)标准ST.25表示。本文中使用的“5'区域”可以表示最接近多核苷酸5'端的多核苷酸区域。因此，例如，多核苷酸5'区域中的元素可以位于从位于多核苷酸5'端的第一个核苷酸到位于多核苷酸中间的核苷酸的任何位置。如本文中使用的“3'区域”可以表示最接近多核苷酸3'端的多核苷酸区域。因此，例如，多核苷酸3'区域中的元素可以位于从位于多核苷酸3'端的第一个核苷酸到位于多核苷酸中间的核苷酸的任何位置。

如本文所用，关于核酸，术语“片段”或“部分”是指相对于参考核酸长度减少的核酸(例如，减少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、400、450、500、550、600、650、700、750、800、850、900、950或1000个或更多个核苷酸，或其中的任何范围或值)，并且包含下列核苷酸序列，或基本上由下列核苷酸序列组成和/或由下列核苷酸序列组成：与参考核酸的对应部分相同或几乎相同(例如，70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％相同)的连续核苷酸的核苷酸序列。在适当情况下，这种核酸片段可以包含在较大的多核苷酸中。作为实例，本发明的引导核酸的重复序列可以包含野生型CRISPR-Cas重复序列的“部分”(例如，野生型CRISPR-Cas重复序列；例如，来自例如Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b和/或Cas14c等的CRISPR Cas系统的重复序列。在一些实施方案中，核酸片段可包含下列连续核苷酸、基本上由下列连续核苷酸组成或由下列连续核苷酸组成：编码VRS3多肽的核酸(例如，基因组DNA或编码区)的20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、101、102、103、104、105、106、107、108、109、110、120、140、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、166、167、168、169、170、180、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、220、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、300、350、360、361、362、363、364、365、366、367、368、369、370、380、390、400、450、500、510、520、530、531、532、533、534、535、536、537、538、539、540、550、560、570、580、590或600个或更多个连续核苷酸，或其中的任何范围或值，任选地，VRS3多核苷酸的片段可以是约20个核苷酸至约120个核苷酸，约20个核苷酸至约250个核苷酸，约20个核苷酸至约600个核苷酸，约100个核苷酸至约250个核苷酸，约100个核苷酸至约400个核苷酸，约150个核苷酸至约400个核苷酸，约200个核苷酸至约600个核苷酸，例如，约20、40、60、80、100、120、140、160、180或200个核苷酸至约210、220、240、260、280、300、350、400、450、500、550或600个或更多个连续核苷酸。

在一些实施方案中，VRS3基因的核酸片段可以是从3'端/区域、5'端/区域和/或从编码VRS3基因的基因内缺失核苷酸的结果。在一些实施方案中，VRS3核酸的缺失包括从VRS3基因的JmjN结构域、JmjC结构域和/或锌指(ZnF)结构域缺失部分连续核苷酸，其中所述VRS3基因包含例如SEQ ID NO:69、70、72或73的核苷酸序列或包含与SEQ ID NO:69、70、72或73具有至少80％分序列同一性的序列的核酸。在一些实施方案中，VRS3基因的JmjN结构域包含SEQ ID NO:75、78、81或84中任一个的核苷酸序列，或与SEQ ID NO:75、78、81或84中任一个具有至少80％序列同一性的序列，VRS3基因的JmjC结构域包含SEQ ID NO:76、79、82或85中任一个的核苷酸序列，或与SEQ ID NO:76、79、82或85中任一个具有至少80％序列同一性的序列，和/或VRS3基因的锌指(ZnF)结构域包含SEQ ID NO:77、80、83或86中任一个的核苷酸序列，或与SEQ ID NO:77、80、83或86中任一个具有至少80％序列同一性的序列。在一些实施方案中，这种缺失可以是点突变，当其包含在植物中时，可以导致植物具有增加的小花育性、增加的种子重量和/或增加的种子数量。在一些实施方案中，这种缺失可以是显性负性突变、半显性突变、弱功能丧失突变、亚效等位基因突变或无效突变，当包含在植物中时，可以导致植物具有增加的小花育性、增加的种子数量(例如，籽粒数量)和/或增加的种子重量(例如，籽粒重量)(与没有相同突变的植物相比，例如，不包含突变的同基因植物(例如，野生型未编辑的植物或空缺分离体))。

如本文所用，关于多肽，术语“片段”或“部分”可以指相对于参考多肽长度减少的多肽，并且包含下列氨基酸序列，基本上由下列氨基酸序列组成和/或由下列氨基酸序列组成：与参考多肽的对应部分相同或几乎相同(例如，90％、91％、92％、93％、94％、95％、96％、97％、98％、99％相同)的连续氨基酸的氨基酸序列。在适当情况下，这种多肽片段可以包含在较大的多肽中，所述多肽片段是所述较大的多肽的组成部分。在一些实施方案中，多肽片段可以包含下列连续氨基酸，基本上由下列连续氨基酸组成或由下列连续氨基酸组成：参考多肽的至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、300、350、400个或更多个连续氨基酸。在一些实施方案中，VRS3多肽片段可以包含以下连续氨基酸残基、基本上由以下连续氨基酸残基组成或由以下连续氨基酸残基组成：VRS3多肽的约2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125或更多个连续氨基酸(例如，VRS3多肽的约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54，55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、80、90、100、110、111、112、113、114、116、117、118、119、120、121、122、123、124、125、126、127、128、129或130个或更多个连续氨基酸)。

在一些实施方案中，“部分”可以与从多肽中缺失的氨基酸的数量有关。因此，例如，VRS3多肽的缺失的“部分”可以包含从SEQ ID NO:71或SEQ ID NO:74的氨基酸序列中(或从与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性(例如，至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性)的序列中)缺失的至少一个(例如，一个或多个)氨基酸残基(例如，至少1个或至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、80、90、100、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129或130个或更多个连续氨基酸残基)。在一些实施方案中，VRS3多肽的缺失的部分可以是框内突变或框外突变，其中至少一个(例如，一个或多个)氨基酸缺失。在一些实施方案中，这种缺失可以是显性负性突变、半显性突变、弱功能丧失突变、亚效等位基因突变或无效突变，当其包含在植物中时，与不包含所述缺失的植物相比，可导致植物表现出增加的小花育性、增加的种子数量和/或增加的种子重量。在一些实施方案中，这种突变导致VRS3多肽具有减少的DNA结合或降低的组蛋白去甲基化酶活性。

多核苷酸或多肽的“区域”分别是指该多核苷酸或多肽的连续核苷酸或连续氨基酸残基的部分。例如，多核苷酸序列的区域可以是SEQ ID NO:69的核苷酸序列的连续核苷酸3927-4165、3100-3631或2216-2424，SEQ ID NO:72的核苷酸序列的连续核苷酸3987-4233、3162-3692或2268-2477，SEQ ID NO:70的核苷酸序列的连续核苷酸1495-1654、832-1199或301-402，SEQ ID NO:73的核苷酸序列的连续核苷酸1498-1656、835-1203或305-405；或者，例如，多肽序列的区域可以是SEQ ID NO:71的氨基酸序列的连续氨基酸残基499-551、278-400或101-135或SEQ ID NO:74的氨基酸序列的连续氨基酸残基500-552、123-401或102-136。VRS3多核苷酸的区域也可以是指SEQ ID NO:75-86中任一个核苷酸序列。VRS3多肽的区域也可以是指SEQ ID NO:87-92中任一个氨基酸序列。

在一些实施方案中，“序列特异性核酸结合结构域”或“序列特异性DNA结合结构域”可以结合VRS3核酸(例如，SEQ ID NO:75-86)的一个或多个片段或部分或如本文所述的VRS3基因组序列(例如，SEQ ID NO:69、70、72或73)的非翻译区。

如本文中关于核酸所使用的，术语“功能性片段”是指编码多肽的功能性片段的核酸。关于多肽的“功能性片段”是保留天然参考多肽的一种或多种活性的多肽片段。

如本文所用，术语“基因”是指能够用于产生mRNA、反义RNA、miRNA、抗微小RNA反义寡脱氧核糖核苷酸(AMO)等的核酸分子。基因可以或不可以能够用于产生功能性蛋白质或基因产物。基因可以包括编码区和非编码区(例如，内含子、调控元件、启动子、增强子、终止序列和/或5'和3'非翻译区)两者。基因可以是“分离的”，这意味着基本上或实质上不含通常与天然状态的核酸相关的组分的核酸。这些组分包括其它细胞材料、来自重组产生的培养基和/或用于化学合成核酸的各种化学品。

术语“突变”是指点突变(例如，错义或无义，或导致移码的单个碱基对的插入或缺失)、插入、缺失和/或截短。当突变是氨基酸序列中的一个残基被另一个残基置换，或者序列中的一个或多个残基的缺失或插入时，突变通常通过标示原始残基、然后是残基在序列中的位置以及新置换的残基的身份来描述。截短可以包括在多肽的C末端或多肽的N末端的截短。多肽的截短可能是编码多肽的基因的相应的5'端或3'端缺失的结果。

如本文所用，术语“互补的”或“互补性”是指多核苷酸在允许的盐和温度条件下通过碱基配对的天然结合。例如，序列“A-G-T”(5'至3')与互补序列“T-C-A”(3'至5')结合。两个单链分子之间的互补性可以是“部分的”，其中只有一些核苷酸结合，或者当单链分子之间存在完全互补性时，它可以是完全的。核酸链之间的互补程度对核酸链之间的杂交效率和强度有显著影响。

如本文所用，“互补体”可以表示与比较核苷酸序列的100％互补性，或者它可以表示与比较核苷酸序列的互补性小于100％(例如，约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％等的互补性；例如，基本互补性)。

具有同源性的不同核酸或蛋白质在本文中称为“同源物”。术语同源物包括来自同一物种和其它物种的同源序列以及来自同一物种和其它物种的直系同源序列。“同源性”是指两个或更多个核酸和/或氨基酸序列之间的相似程度，以位置同一性(即序列相似性或同一性)的百分比表示。同源性也指不同核酸或蛋白质之间具有相似功能特性的概念。因此，本发明的组合物和方法还包括本发明的核苷酸序列和多肽序列的同源物。如本文所用，“直系同源”是指不同物种中的同源核苷酸序列和/或氨基酸序列，这些序列在物种形成过程中产生于共同的祖先基因。本发明的核苷酸序列的同源物与本发明的所述核苷酸序列具有基本的序列同一性(例如，至少约70％、71％、72％、73％、74％、75％、76％、77％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％或100％)。

如本文所用，“序列同一性”是指两个最佳比对的多核苷酸或多肽序列在整个组分(例如核苷酸或氨基酸)比对窗中不变的程度。“同一性”可以很容易地通过已知的方法计算，包括但不限于以下方法：Computational Molecular Biology(Lesk，A.M.编辑)OxfordUniversity Press、New York(1988)；Biocomputing:Informatics and Genome Projects(Smith，D.W.编辑)Academic Press、New York(1993)；Computer Analysis of SequenceData、Part I(Griffin，A.M.和Griffin，H.G.编辑)Humana Press、New Jersey(1994)；Sequence Analysis in Molecular Biology(von Heinje，G.编辑)Academic Press(1987)；和Sequence Analysis Primer(Gribskov，M.和Devereux，J.编辑)StocktonPress、New York(1991)。

如本文所用，术语“百分比序列同一性”或“百分比同一性”是指当两个序列最佳比对时，与测试(“对象”)多核苷酸分子(或其互补链)相比，参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列中相同核苷酸的百分比。在一些实施方案中，“百分比序列同一性”可以指与参考多肽相比，氨基酸序列中相同氨基酸的百分比。

如本文所用，短语“基本上相同”或“基本同一性”在两个核酸分子、核苷酸序列或多肽序列的情形中，是指两个或更多个序列或子序列，当比较和比对最大对应关系时，使用以下序列比较算法之一或目视检查进行测量，其具有至少约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％或100％的核苷酸或氨基酸残基同一性。在本发明的一些实施方案中，在本发明的核苷酸序列的连续核苷酸区域存在基本同一性，所述区域的长度为约10个核苷酸至约20个核苷酸，约10个核苷酸至约25个核苷酸，约10个核苷酸至约30个核苷酸，约15个核苷酸至约25个核苷酸，约30个核苷酸至约40个核苷酸，约50个核苷酸至约60个核苷酸，约70个核苷酸至约80个核苷酸，约90个核苷酸至约100个核苷酸，约100个核苷酸至约200个核苷酸，约100个核苷酸至约300个核苷酸，约100个核苷酸至约400个核苷酸，约100个核苷酸至约500个核苷酸，约100个核苷酸至约600个核苷酸，约100个核苷酸至约800个核苷酸，约100个核苷酸至约900个核苷酸，或更多个核苷酸，或其中的任何范围，至多达全长序列。在一些实施方案中，核苷酸序列可以在至少约20个核苷酸(例如，约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2500、3000、3500、4000、4500、5000、5500、6000或5500个核苷酸或更多个核苷酸)是基本上相同的。

在本发明的一些实施方案中，在本发明的多肽的连续氨基酸残基区域存在基本同一性，所述区域包含约3个氨基酸残基至约20个氨基酸残基，约5个氨基酸残基至约25个氨基酸残基，约7个氨基酸残基至约30个氨基酸残基，约10个氨基酸残基至约25个氨基酸残基，约15个氨基酸残基至约30个氨基酸残基，约20个氨基酸残基至约40个氨基酸残基，约25个氨基酸残基至约40个氨基酸残基，约25个氨基酸残基至约50个氨基酸残基，约30个氨基酸残基至约50个氨基酸残基，约40个氨基酸残基至约50个氨基酸残基，约40个氨基酸残基至约70个氨基酸残基，约50个氨基酸残基至约70个氨基酸残基，约60个氨基酸残基至约80个氨基酸残基，约70个氨基酸残基至约80个氨基酸残基，约90个氨基酸残基至约100个氨基酸残基，或其中的任何长度或范围，至多达全长序列。在一些实施方案中，多肽序列可以在至少约8个连续氨基酸残基(例如，长度为约8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、130、140、150、175、200、225、230、235、240、245、250、260、270、280、290、300、350、400、450、500、550、600、650、700、750、800或850个或更多个氨基酸或更多个连续氨基酸残基)的范围与另一个序列基本上相同。在一些实施方案中，两种或更多种VRS3多肽可以是相同或基本上相同的(例如，至少70％至99.9％相同；例如，约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.9％相同，或其中的任何范围或值)。

对于序列比较，通常一个序列充当与测试序列比较的参考序列。当使用序列比较算法时，将测试序列和参考序列输入计算机，必要时指定子序列坐标，并指定序列算法程序参数。然后，序列比较算法根据指定的程序参数计算测试序列相对于参考序列的序列同一性百分比。

用于比对比较窗口的序列最佳比对是本领域技术人员所熟知的，并且可以通过诸如Smith和Waterman的局部同源算法，Needleman和Wunsch的同源比对算法，Pearson和Lipman的相似性搜索方法等工具进行，并且任选地通过这些算法的计算机化形式来实施，诸如GAP、BESTFIT、FASTA和TFASTA，它们可作为Wisconsin(AccelrysInc.，San Diego，CA)的一部分获得。用于测试序列和参考序列的比对节段的“同一性分数”是两个比对序列共享的相同组分的数量除以参考序列节段(例如，整个参考序列或参考序列的较小定义部分)中的组分总数。百分比序列同一性表示为同一性分数乘以100。一个或多个多核苷酸序列的比较可以是全长多核苷酸序列或其部分，或者是较长的多核苷酸序列。就本发明的目的而言，还可以使用BLASTX 2.0版为翻译的核苷酸序列确定“百分比同一性”，以及使用BLASTN 2.0版为多核苷酸序列确定“百分比同一性”。

当两个核苷酸序列在严格条件下彼此杂交时，也可以认为这两个核苷酸序列基本上是互补的。在一些实施方案中，被认为基本上互补的两个核苷酸序列在高度严格的条件下彼此杂交。

在核酸杂交实验(诸如Southern和Northern杂交)的背景下，“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的，并且在不同的环境参数下是不同的。在TijssenLaboratory Techniques in Biochemistry and Molecular Biology-Hybridizationwith Nucleic Acid Probes第I部分第2章"Overview of principles of hybridizationand the strategy of nucleic acid probe assays"Elsevier、New York(1993)中提供了有关核酸杂交的广泛指南。通常，高度严格的杂交和洗涤条件选择为，在规定的离子强度和pH值下，比具体序列的解链温度(T_m)低约5℃。

T_m是50％靶序列与完美匹配的探针杂交时的温度(在规定的离子强度和pH值下)。非常严格的条件选择为等于特定探针的T_m。在Southern或Northern印迹中，具有超过100个互补残基的互补核苷酸序列在滤器上杂交的严格杂交条件的实例是50％甲酰胺与1mg肝素在42℃，杂交过夜。高度严格的洗涤条件的实例是0.1 5M NaCl在72℃约15分钟。严格洗涤条件的实例是在65℃用0.2x SSC洗涤15分钟(对于SSC缓冲液的描述，参见Sambrook，同前所述)。通常，在进行高度严格清洗之前，先进行低严格清洗，以去除背景探针信号。例如，超过100个核苷酸的双联体的中等严格洗涤的实例是在45℃ 1x SSC 15分钟。例如，超过100个核苷酸的双联体的低严格洗涤的实例是在40℃ 4-6x SSC 15分钟。对于短探针(例如，约10个至50个核苷酸)，严格的条件通常涉及低于约1.0M Na离子的盐浓度，通常约0.01至1.0M Na离子浓度(或其它盐)在pH 7.0至8.3，温度通常至少为约30℃。通过添加诸如甲酰胺等去稳定剂也可以达到严格的条件。通常，在特定的杂交测定中，为对不相关探针观察到的信噪比2倍(或更高)的信噪比表明检测到特异性杂交。如果核苷酸序列编码的蛋白质基本相同，则在严格条件下彼此不杂交的核苷酸序列仍然基本相同。例如，当使用遗传密码允许的最大密码子简并性生成核苷酸序列的拷贝时，就会发生这种情况。

本发明的多核苷酸和/或重组核酸构建体(例如，表达盒和/或载体)可以针对表达进行密码子优化。在一些实施方案中，本发明的编辑系统的多核苷酸、核酸构建体、表达盒和/或载体(例如，包含/编码序列特异性核酸结合结构域(例如，来自以下的序列特异性核酸结合结构域：多核苷酸引导的核酸内切酶、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)、Argonaute蛋白和/或CRISPR-Cas核酸内切酶(例如，CRISPR-Cas效应蛋白)(例如，I型CRISPR-Cas效应蛋白、II型CRISPR-Cas效应蛋白、III型CRISPR-Cas效应蛋白、IV型CRISPR-Cas效应蛋白、V型CRISPR-Cas效应蛋白或VI型CRISPR-Cas效应蛋白))，核酸酶(例如，核酸内切酶(例如，Fok1)，多核苷酸引导的核酸内切酶，CRISPR-Cas核酸内切酶(例如，CRISPR-Cas效应蛋白)，锌指核酸酶和/或转录激活因子样效应物核酸酶(TALEN))，脱氨酶蛋白/结构域(例如，腺嘌呤脱氨酶，胞嘧啶脱氨酶)，编码逆转录酶蛋白或结构域的多核苷酸，编码5'-3'核酸外切酶多肽的多核苷酸，和/或亲和多肽，肽标签等)可以对植物中的表达进行密码子优化。在一些实施方案中，本发明的密码子优化的核酸、多核苷酸、表达盒和/或载体与没有进行密码子优化的参考核酸、多核苷酸、表达盒和/或载体具有约70％至约99.9％(例如，70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.9％或100％)或更高的同一性。

在本文描述的任何实施方案中，本发明的多核苷酸或核酸构建体可以与多种启动子和/或其它调控元件可操作缔合以用于在植物和/或植物细胞中表达。因此，在一些实施方案中，本发明的多核苷酸或核酸构建体还可以包含与一个或多个核苷酸序列可操作连接的一个或多个启动子、内含子、增强子和/或终止子。在一些实施方案中，启动子可以与内含子可操作地缔合(例如，Ubi1启动子和内含子)。在一些实施方案中，与内含子缔合的启动子可以被称为“启动子区域”(例如，Ubi1启动子和内含子)。

如本文所用，提及多核苷酸时“可操作地连接”或“可操作地缔合”，意指所指示的元件在功能上彼此相关，并且通常也在物理上相关。因此，如本文所用的术语“可操作地连接”或“可操作地缔合”是指单个核酸分子上功能上关联的核苷酸序列。因此，可操作地连接到第二核苷酸序列的第一核苷酸序列意指第一核苷酸序列以与第二核苷酸序列功能相关的关系进行定位的情形。例如，如果启动子影响所述核苷酸序列的转录或表达，则启动子与该核苷酸序列可操作地缔合。本领域技术人员将理解，控制序列(例如，启动子)不必和与其可操作地缔合的核苷酸序列相邻，只要控制序列的功能是指导其表达即可。因此，例如，启动子和核苷酸序列之间可以存在介于中间的不翻译但转录的核酸序列，并且启动子仍可被视为与核苷酸序列“可操作地连接”。

如本文所用，在提及多肽时，术语“连接”是指一个多肽与另一个多肽的连接。多肽可以直接(例如，通过肽键)或通过接头与另一个多肽(在N-末端或C-末端)连接。

术语“接头”是本领域公认的，是指连接两个分子或部分的化学基团或分子，所述两个分子或部分例如融合蛋白的两个结构域，诸如，例如，核酸结合多肽或结构域(例如，DNA结合多肽或结构域)和肽标签和/或逆转录酶和与肽标签结合的亲和多肽；或DNA核酸内切酶多肽或结构域和肽标签和/或逆转录酶和与肽标签结合的亲和多肽。接头可以由单个连接分子组成，或可以包含多于一个连接分子。在一些实施方案中，接头可以是有机分子、基团、聚合物或化学部分，诸如二价有机部分。在一些实施方案中，接头可以是氨基酸，或者也可以是肽。在一些实施方案中，接头是肽。

在一些实施方案中，可用于本发明的肽接头可以是约2至约100个或更多个氨基酸的长度，例如，约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个氨基酸的长度(例如，约2至约40、约2至约50、约2至约60、约4至约40、约4至约50、约4至约60、约5至约40、约5至约50、约5至约60、约9至约40、约9至约50、约9至约60、约10至约40、约10至约50、约10至约60，或约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25个氨基酸至约26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个氨基酸的长度(例如，约105、110、115、120、130、140、150个或更多个氨基酸的长度)。在一些实施方案中，肽接头可以是GS接头。

如本文所用，在提及多核苷酸时，术语“连接”或“融合”是指一个多核苷酸与另一个多核苷酸的连接。在一些实施方案中，两个或更多个多核苷酸分子可以通过接头连接，接头可以是有机分子、基团、聚合物或化学部分，诸如二价有机部分。多核苷酸可以通过共价或非共价键或结合与另一个多核苷酸(在5'端或3'端)连接或融合，包括例如通过Watson-Crick碱基配对或通过一个或多个连接核苷酸连接或融合。在一些实施方案中，某种结构的多核苷酸基序可以插入到另一个多核苷酸序列中(例如，引导RNA中发夹结构的延伸)。在一些实施方案中，连接核苷酸可以是天然存在的核苷酸。在一些实施方案中，连接核苷酸可以是非天然存在的核苷酸。

“启动子”是控制或调节与启动子可操作地缔合的核苷酸序列(例如，编码序列)转录的核苷酸序列。由启动子控制或调节的编码序列可以编码多肽和/或功能性RNA。通常，“启动子”是指包含RNA聚合酶II的结合位点并指导转录起始的核苷酸序列。通常，启动子位于相对于对应编码序列的编码区起点的5'或上游。启动子可以包含作为基因表达调节物的其它元件；例如，启动子区。这些包括TATA盒共有序列，通常还包括CAAT盒共有序列(Breathnach和Chambon，(1981)Annu.Rev.Biochem.50:349)。在植物中，CAAT盒可以被AGGA盒替代(Messing等人，(1983)在Genetic Engineering of Plants中，T.Kosuge，C.Meredith和A.Hollaender(编辑)，Plenum Press，第211-227页)。

可用于本发明的启动子可以包括，例如，组成性、诱导性、时间调控性、发育调控性、化学调控性、组织偏好性和/或组织特异性的启动子，用于制备重组核酸分子，例如，“合成核酸构建体”或“蛋白质-RNA复合物”。这些不同类型的启动子是本领域已知的。

对启动子的选择可以因表达的时间和空间要求而异，也可以因要转化的宿主细胞而异。许多不同生物体的启动子在本领域是众所周知的。基于本领域存在的广泛知识，可以为感兴趣的特定宿主生物体选择适当的启动子。因此，例如，模式生物体中高度组成性表达的基因上游的启动子是已知的，并且这些知识可以很容易地获得，并酌情在其它系统中实施。

在一些实施方案中，在植物中有功能的启动子可以与本发明的构建体一起使用。可用于驱动在植物中表达的启动子的非限制性实例包括RubisCo小亚基基因1的启动子(PrbcS1)、肌动蛋白基因的启动子(Pactin)、硝酸还原酶基因的启动子(Pnr)和双拷贝碳酸酐酶基因1的启动子(Pdca1)(参见Walker等人，Plant Cell Rep.23:727-735(2005)；Li等人，Gene 403:132-142(2007)；Li等人，Mol Biol.Rep.37:1143-1154(2010))。PrbcS1和Pactin是组成性启动子，Pnr和Pdca1是诱导性启动子。Pnr由硝酸盐诱导并被铵抑制(Li等人，Gene 403:132-142(2007))，Pdca1由盐诱导(Li等人，Mol Biol.Rep.37:1143-1154(2010))。在一些实施方案中，可用于本发明的启动子是RNA聚合酶II(Pol II)启动子。在一些实施方案中，来自玉米的U6启动子或7SL启动子可以用于本发明的构建体。在一些实施方案中，来自玉米的U6c启动子和/或7SL启动子可以用于驱动引导核酸的表达。在一些实施方案中，来自大豆(Glycine max)的U6c启动子、U6i启动子和/或7SL启动子可用于本发明的构建体。在一些实施方案中，来自大豆的U6c启动子、U6i启动子和/或7SL启动子可以用于驱动引导核酸的表达。

对植物有用的组成性启动子的实例包括但不限于，洋丁香病毒启动子(cmp)(美国专利号7,166,770)、水稻肌动蛋白1启动子(Wang等人，(1992)Mol.Cell.Biol.12:3399-3406；以及美国专利号5,641,876)、CaMV 35S启动子(Odell等人，(1985)Nature 313:810-812)、CaMV 19S启动子(Lawton等人，(1987)Plant Mol.Biol.9:315-324)、nos启动子(Ebert等人(1987)Proc.Natl.Acad.Sci USA 84:5745-5749)、Adh启动子(Walker等人(1987)Proc.Natl.Acad.Sci.USA 84:6624-6629)、蔗糖合酶启动子(Yang&Russell(1990)Proc.Natl.Acad.Sci.USA 87:4144-4148)和泛素启动子。源自泛素的组成性启动子在许多细胞类型中积累。泛素启动子已从几种植物物种中克隆出来，用于转基因植物，例如，向日葵(Binet等人，1991.Plant Science 79:87-94)，玉米(Christensen等人，1989.PlantMolec.Biol.12:619-632)和拟南芥(Norris等人1993.Plant Molec.Biol.21:895-906)。玉米泛素启动子(UbiP)已在转基因单子叶植物系统中开发，构建用于单子叶植物转化的其序列和载体在专利公布EP 0 342 926中公开。泛素启动子适用于本发明的核苷酸序列在转基因植物中的表达，特别是单子叶植物。此外，McElroy等人(Mol.Gen.Genet.231:150-160(1991))描述的启动子表达盒可以很容易地被改良用于本发明的核苷酸序列的表达，并且特别适用于单子叶植物宿主。

在一些实施方案中，组织特异性/组织偏好性启动子可用于在植物细胞中表达异源多核苷酸。组织特异性或偏好表达模式包括但不限于，绿色组织特异性或偏好性、根特异性或偏好性、茎特异性或偏好性、花特异性或偏好性或花粉特异性或偏好性。适合在绿色组织中表达的启动子包括调节参与光合作用的基因的许多启动子，其中许多是从单子叶植物和双子叶植物克隆而来的。在一个实施方案中，可用于本发明的启动子是来自磷酸烯醇羧化酶基因的玉米PEPC启动子(Hudspeth&Grula、Plant Molec.Biol.12:579-589(1989))。组织特异性启动子的非限制性实例包括与编码种子储存蛋白(诸如β-伴大豆球蛋白、十字花科蛋白、油菜贮藏蛋白和菜豆蛋白)、玉米醇溶蛋白或油体蛋白(诸如油质蛋白)或参与脂肪酸生物合成的蛋白(包括酰基载体蛋白、硬脂酰-ACP去饱和酶和脂肪酸去饱和酶(fad 2-1))的基因缔合的那些，以及胚发育过程中表达的其它核酸(诸如Bce4，参见，例如，Kridl等人(1991)Seed Sci.Res.1:209-219；以及EP专利号255378)。可用于在植物、特别是玉米中表达本发明的核苷酸序列的组织特异性或组织偏好性启动子包括但不限于那些指导在根、髓、叶或花粉中表达的启动子。例如，在WO 93/07278(其全部内容通过引用并入本文)中公开了此类启动子。可用于本发明的组织特异性或组织偏好性启动子的其它非限制性实例是美国专利6,040,504中公开的棉花rubisco启动子；在美国专利5,604,121中公开的水稻蔗糖合酶启动子；由de Framond(FEBS290:103-106(1991)；Ciba-Geigy的EP 0 452 269)所述的根特异性启动子；在美国专利5,625,136(Ciba-Geigy)中描述的茎特异性启动子，其可驱动玉米trpA基因的表达；在WO 01/73087中公开的洋丁香黄曲叶病毒启动子；以及花粉特异性或偏好性启动子，包括但不限于，来自水稻的ProOsLPS10和ProOsLPS11(Nguyen等人Plant Biotechnol.Reports 9(5):297-306(2015))，来自玉米的ZmSTK2_USP(Wang等人Genome 60(6):485-495(2017))、来自番茄的LAT52和LAT59(Twell等人Development 109(3):705-713(1990))、Zm13(美国专利号10,421,972)、来自拟南芥的PLA₂-δ启动子(美国专利号7,141,424)和/或来自玉米的ZmC5启动子(国际PCT公开号WO1999/042587)。

植物组织特异性/组织偏好性启动子的其它实例包括但不限于，根毛特异性顺式元件(RHE)(Kim等人The Plant Cell 18:2958-2970(2006))、根特异性启动子RCc3(Jeong等人Plant Physiol.153:185-197(2010))和RB7(美国专利号5459252)、凝集素启动子(Lindstrom等人(1990)Der.Genet.11:160-167；和Vodkin(1983)Prog.Clin.Biol.Res.138:87-98)、玉米醇脱氢酶1启动子(Dennis等人(1984)NucleicAcids Res.12：3983-4000)、S-腺苷-L-蛋氨酸合成酶(SAMS)(Vander Mijnsbrugge等人(1996)Plant and Cell Physiology，37(8):1108-1115)、玉米光捕获复合物启动子(Bansal等人(1992)Proc.Natl.Acad.Sci.USA 89:3654-3658)、玉米热休克蛋白启动子(O'Dell等人(1985)EMBO J.5:451-458；和Rochester等人(1986)EMBO J.5:451-458)、豌豆小亚基RuBP羧化酶启动子(Cashmore，"Nuclear genes encoding the small subunit ofribulose-l,5-bisphosphate carboxylase"第29-39页，In:Genetic Engineering ofPlants(Hollaender编辑，Plenum Press 1983；和Poulsen等人(1986)Mol.Gen.Genet.205:193-200)、Ti质粒甘露糖碱合酶启动子(Langridge等人(1989)Proc.Natl.Acad.Sci.USA86:3219-3223)、Ti质粒胭脂碱合酶启动子(Langridge等人(1989)，见上)、矮牵牛查尔酮异构酶启动子(van Tunen等人(1988)EMBO J.7:1257-1263)、豆类富甘氨酸蛋白1启动子(Keller等人(1989)Genes Dev.3:1639-1646)、截短的CaMV 35S启动子(O'Dell等人(1985)Nature 313:810-812)、马铃薯块茎储藏蛋白启动子(Wenzler等人(1989)PlantMol.Biol.13:347-354)、根细胞启动子(Yamamoto等人(1990)Nucleic Acids Res.18:7449)、玉米醇溶蛋白启动子(Kriz等人(1987)Mol.Gen.Genet.207:90-98；Langridge等人(1983)Cell 34:1015-1022；Reina等人(1990)Nucleic Acids Res.18:6425；Reina等人(1990)Nucleic Acids Res.18:7449；和Wandelt等人(1989)Nucleic Acids Res.17:2354)、球蛋白-1启动子(Belanger等人(1991)Genetics 129:863-872)、α-微管蛋白cab启动子(Sullivan等人(1989)Mol.Gen.Genet.215:431-440)、PEPCase启动子(Hudspeth&Grula(1989)Plant Mol.Biol.12:579-589)、R基因复合物相关启动子(Chandler等人(1989)Plant Cell 1:1175-1183)和查尔酮合酶启动子(Franken等人(1991)EMBO J.10:2605-2612)。

可用于种子特异性表达的是豌豆球蛋白启动子(Czako等人(1992)Mol.Gen.Genet.235:33-40)；以及美国专利号5,625,136中公开的种子特异性启动子。可用于在成熟叶片中表达的启动子是那些在衰老开始时切换的启动子，诸如来自拟南芥的SAG启动子(Gan等人(1995)Science 270:1986-1988)。

此外，还可以使用叶绿体中起作用的启动子。这种启动子的非限制性实例包括噬菌体T3基因9 5'UTR和美国专利号7,579,516中公开的其它启动子。可用于本发明的其它启动子包括但不限于S-E9小亚基RuBP羧化酶启动子和Kunitz胰蛋白酶抑制剂基因启动子(Kti3)。

可用于本发明的其它调控元件包括但不限于内含子、增强子、终止序列和/或5'和3'非翻译区。

可用于本发明的内含子可以是在植物中鉴定并从中分离、然后插入到用于植物转化的表达盒中的内含子。正如本领域技术人员所理解的那样，内含子可以包含自我切除所需的序列，并被框内掺入到核酸构建体/表达盒中。内含子可以用作间隔子以在一个核酸构建体中分开多个蛋白质编码序列，或者也可以在一个蛋白质编码序列内使用内含子，例如，以稳定mRNA。如果它们在蛋白质编码序列中使用，则将它们“框内”插入，并包括切除位点。内含子也可以与启动子缔合以改善或修饰表达。作为实例，可用于本发明的启动子/内含子组合包括但不限于玉米Ubi1启动子和内含子的启动子/内含子组合(参见，例如，SEQ IDNO:21和SEQ ID NO:22)。

可用于本发明的内含子的非限制性实例包括来自以下的内含子：ADHI基因(例如，Adh1-S内含子1、2和6)，泛素基因(Ubi1)，RuBisCO小亚基(rbcS)基因，RuBisCO大亚基(rbcL)基因，肌动蛋白基因(例如，肌动蛋白-1内含子)，丙酮酸脱氢酶激酶基因(pdk)，硝酸还原酶基因(nr)，双拷贝碳酸酐酶基因1(Tdca1)，psbA基因、atpA基因或其任意组合。

在一些实施方案中，本发明的多核苷酸和/或核酸构建体可以是“表达盒”，或可以包含在表达盒内。如本文所用，“表达盒”是指重组核酸分子，包含例如，本发明的一个或多个多核苷酸(例如，编码序列特异性核酸结合结构域的多核苷酸、编码脱氨酶蛋白或结构域的多核苷酸、编码逆转录酶蛋白或结构域的多核苷酸、编码5'-3'核酸外切酶多肽或结构域的多核苷酸、引导核酸和/或逆转录酶(RT)模板)，其中多核苷酸可操作地缔合一个或多个控制序列(例如，启动子、终止子等)。因此，在一些实施方案中，可以提供一个或多个表达盒，其设计用于表达，例如，本发明的核酸构建体(例如，编码序列特异性核酸结合结构域的多核苷酸、编码核酸酶多肽/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶蛋白/结构域的多核苷酸、编码5'-3'核酸外切酶多肽/结构域的多核苷酸、编码肽标签的多核苷酸和/或编码亲和多肽的多核苷酸等，或包含引导核酸、延伸的引导核酸和/或RT模板等)。当本发明的表达盒包含多于一个多核苷酸时，多核苷酸可以可操作地连接到驱动所有多核苷酸表达的单个启动子，或者该多核苷酸可以可操作地连接到一个或多个单独的启动子(例如，三个多核苷酸可以由一个、两个或三个启动子以任意组合驱动)。当使用两个或更多个单独的启动子时，启动子可以是相同的启动子，或它们可以是不同的启动子。因此，当包含在单个表达盒中时，编码序列特异性核酸结合结构域的多核苷酸、编码核酸酶蛋白/结构域的多核苷酸、编码CRISPR-Cas效应蛋白/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶多肽/结构域的多核苷酸(例如，RNA依赖性DNA聚合酶)和/或编码5'-3'核酸外切酶多肽/结构域的多核苷酸、引导核酸、延伸的引导核酸和/或RT模板可以各自可操作地连接单个启动子或任意组合的独立启动子。

包含本发明的核酸构建体的表达盒可以是嵌合的，这意味着其至少一个组分相对于其至少一个其它组分是异源的(例如，来自宿主生物体的启动子可操作地连接到要在宿主生物体中表达的感兴趣多核苷酸，其中所述感兴趣多核苷酸来自与宿主不同的生物体，或者通常不与该启动子缔合)。表达盒也可以是天然存在的，但已以可用于异源表达的重组形式获得。

表达盒可以任选地包括转录和/或翻译终止区(即终止区)和/或在所选宿主细胞中起作用的增强子区。本领域已知的多种转录终止子和增强子可用于表达盒。转录终止子负责终止转录和纠正mRNA多聚腺苷酸化。终止区和/或增强子区可以对转录起始区来说是天然的，可以对下列来说是天然的：例如，编码序列特异性核酸结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等，或者可以对宿主细胞来说天然的，或者可以对另一来源(例如，外源的或异源的，例如，对启动子、编码序列特异性核酸结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等，或对宿主细胞，或它们的任意组合)来说是天然的。

本发明的表达盒还可以包括编码可选择标记物的多核苷酸，其可用于选择转化的宿主细胞。如本文所用，“可选择标记物”是指这样的多核苷酸序列：当表达时，赋予表达该标记物的宿主细胞独特的表型，从而允许将这种转化的细胞与没有该标记物的细胞区分开来。这种多核苷酸序列可以编码可选择或可筛选的标记物，这取决于该标记物是否赋予可以通过化学手段选择的性状，诸如使用选择性剂(例如，抗生素等)，或者该标记物是否只是人们可以通过观察或测试识别的性状，诸如通过筛选(例如，荧光)识别。许多合适的可选择标记物的实例是本领域已知的，并且可用于本文所述的表达盒中。

除表达盒外，本文所述的核酸分子/构建体和多核苷酸序列可与载体结合使用。术语“载体”是指用于将核酸(或多个核酸)转移、递送或引入细胞的组合物。载体包括包含要转移、递送或引入的核苷酸序列的核酸构建体(例如，表达盒)。用于转化宿主生物体的载体是本领域公知的。一般类别载体的非限制性实例包括病毒载体、质粒载体、噬菌体载体、噬菌粒载体、粘粒载体、fosmid载体、噬菌体、人工染色体、微环或双链或单链线性或环状形式的农杆菌二元载体，这些载体可以是或可以不是可自主转移或可动员的。在一些实施方案中，病毒载体可以包括但不限于逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒载体。本文定义的载体可以通过整合到细胞基因组中或染色体外存在(例如，具有复制起点的自主复制质粒)来转化原核或真核宿主。此外，还包括穿梭载体，其是指天然地或通过设计能够在两种不同的宿主生物体中复制的DNA载体，其可以选自放线菌和相关物种、细菌和真核生物(例如，高等植物、哺乳动物、酵母或真菌细胞)。在一些实施方案中，载体中的核酸受适当的启动子或其它调控元件的控制，并可操作地与适当的启动子或其它调控元件连接，以便在宿主细胞中进行转录。该载体可以是在多个宿主中起作用的双功能表达载体。在基因组DNA的情况下，这可以包含其自己的启动子和/或其它调控元件，而在cDNA的情况下，这可以在适当的启动子和/或其它调控元件的控制下，以便在宿主细胞中表达。因此，本发明的核酸或多核苷酸和/或包含所述核酸或多核苷酸的表达盒可以包含在本文所述和本领域已知的载体中。

如本文所用，“接触”及其语法变体，是指在适合进行所需反应(例如，转化、转录控制、基因组编辑、做切口和/或裂解)的条件下将所需反应的组分放在一起。作为实例，靶核酸可以与序列特异性核酸结合蛋白(例如，多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如，CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)和/或Argonaute蛋白))和脱氨酶或编码这些的核酸构建体在以下的条件下接触：序列特异性核酸结合蛋白、逆转录酶和/或脱氨酶表达，序列特异性核酸结合蛋白与靶核酸结合，逆转录酶和/或脱氨酶可以与序列特异性核酸结合蛋白融合或募集到序列特异性核酸结合蛋白(例如，通过与序列特异性核酸结合蛋白融合的肽标签和与逆转录酶和/或脱氨酶融合的亲和标签)，因此，脱氨酶和/或逆转录酶位于靶核酸附近，从而修饰靶核酸。可以使用其它募集逆转录酶和/或脱氨酶的方法，利用其它蛋白质-蛋白质相互作用，并且RNA-蛋白质相互作用和化学相互作用也可用于蛋白质-蛋白质和蛋白质-核酸募集。

如本文所用，提及靶核酸，“修饰”包括编辑(例如，突变)、共价修饰、交换/置换核酸/核苷酸碱基、缺失、裂解、做切口和/或改变对靶核酸的转录控制。在一些实施方案中，修饰可以包括任何类型的一个或多个单碱基变化(SNP)。

在转录因子“调控”表型(例如，小花育性、种子数量和/或种子重量)的情形下使用的术语“调控”意指转录因子影响一种或多种基因的表达的能力，从而使诸如小花育性、种子数量和/或种子重量的表型被改变。

在感兴趣多核苷酸的背景下，“引入”(及其语法变体)意指使感兴趣的核苷酸序列(例如，多核苷酸、RT模板、核酸构建体和/或引导核酸)呈递给植物、其植物部分或其细胞，以这种方式使核苷酸序列能够进入细胞内部。

术语“转化”或“转染”可以互换使用，如本文所用是指将异源核酸引入细胞。细胞的转化可以是稳定的或瞬时的。因此，在一些实施方案中，宿主细胞或宿主生物体(例如，植物)可以用本发明的多核苷酸/核酸分子稳定地转化。在一些实施方案中，宿主细胞或宿主生物体可以用本发明的多核苷酸/核酸分子瞬时转化。

在多核苷酸的背景下，“瞬时转化”意指多核苷酸被引入细胞中，并且不整合到细胞的基因组中。

在将多核苷酸引入细胞的背景下，通过“稳定引入”或“被稳定引入”，意指将引入的多核苷酸稳定地掺入细胞的基因组中，从而使细胞被多核苷酸稳定地转化。

如本文所用，“稳定转化”或“稳定地转化”意指将核酸分子引入细胞并整合到细胞的基因组中。因此，整合的核酸分子能够被其子代继承，更具体地说，能够被连续多代的子代继承。如本文所用的“基因组”包括核基因组和质体基因组，因此包括将核酸整合到例如叶绿体或线粒体基因组中。如本文所用的稳定转化也可以指在染色体外维持的转基因，例如，作为微染色体或质粒。

瞬时转化可以通过例如酶联免疫吸附测定(ELISA)或蛋白质印迹法来检测，其可以检测由引入生物体的一个或多个转基因编码的肽或多肽的存在。例如，可以通过对细胞的基因组DNA与核酸序列进行Southern印迹杂交测定来检测细胞的稳定转化，所述核酸序列与引入生物体(例如，植物)的转基因的核苷酸序列特异性杂交。例如，可以通过对细胞的RNA与核酸序列进行Northern印迹杂交测定来检测细胞的稳定转化，所述核酸序列与引入宿主生物体的转基因的核苷酸序列特异性杂交。细胞的稳定转化也可以通过，例如，聚合酶链反应(PCR)或本领域公知的其它扩增反应来检测，采用与转基因的靶序列杂交的特异性引物序列，从而扩增转基因序列，其可以根据标准方法检测。转化也可以通过本领域公知的直接测序和/或杂交方案来检测。

因此，在一些实施方案中，本发明的核苷酸序列、多核苷酸、核酸构建体和/或表达盒可以被瞬时表达和/或它们可以稳定地掺入宿主生物体的基因组中。因此，在一些实施方案中，本发明的核酸构建体(例如，一个或多个包含如本文所述的用于编辑的多核苷酸的表达盒)可以瞬时引入到具有引导核酸的细胞中，因此，没有DNA在细胞中维持。

本发明的核酸构建体可以通过本领域技术人员已知的任何方法引入植物细胞中。转化方法的非限制性实例包括通过细菌介导的核酸递送(例如，通过农杆菌)的转化、病毒介导的核酸递送、碳化硅或核酸晶须介导的核酸递送、脂质体介导的核酸递送、显微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米颗粒介导的转化、超声处理、浸润、PEG介导的核酸摄取，以及导致将核酸引入植物细胞的任何其它电、化学、物理(机械)和/或生物机制，包括它们的任意组合。转化真核生物和原核生物的程序在本领域是众所周知和常规的，并且其描述遍布文献(参见，例如，Jiang等人2013.Nat.Biotechnol.31:233-239；Ran等人Nature Protocols8:2281–2308(2013))。对本领域已知的各种植物转化方法的一般指南包括Miki等人("Procedures for Introducing Foreign DNA intoPlants"in Methods in Plant Molecular Biology and Biotechnology，Glick，B.R.和Thompson，J.E.编辑(CRC Press，Inc.，Boca Raton，1993)，第67-88页)和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.7:849-858(2002))。

在本发明的一些实施方案中，细胞的转化可以包括核转化。在其它实施方案中，细胞的转化可以包括质体转化(例如，叶绿体转化)。在进一步的实施方案中，本发明的核酸可以通过常规育种技术引入细胞中。在一些实施方案中，一种或多种多核苷酸、表达盒和/或载体可以通过农杆菌转化引入植物细胞中。

因此，多核苷酸可以以本领域公知的任意数量的方式引入植物、植物部分、植物细胞中。本发明的方法不依赖于将一个或多个核苷酸序列引入植物的特定方法，只要它们能够进入细胞内部即可。如果要引入多个多核苷酸，它们可以组装为单个核酸构建体的一部分，也可以组装为单独的核酸构建体，并且可以位于相同或不同的核酸构建体上。因此，多核苷酸可以在单个转化事件中引入感兴趣细胞，或者，也可以在单独的转化事件中引入感兴趣细胞，或者，备选地，可以将多核苷酸作为育种方案的一部分掺入植物中。

在一些实施方案中，本发明提供了一种植物或其部分，所述植物或其部分包含内源性组蛋白去甲基化酶基因中的至少一个(例如，一个或多个)突变(任选地，非天然突变)，所述内源性组蛋白去甲基化酶基因编码组蛋白去甲基化酶多肽，所述组蛋白去甲基化酶多肽包含锌指DNA结合结构域(ZnF结构域)、Jumonji C型(Jmj-C)结构域和Jumonji N型(Jmj-N)结构域，其中所述突变破坏组蛋白去甲基化酶多肽与DNA的结合和/或降低组蛋白去甲基化酶多肽的组蛋白去甲基化活性，任选地，VRS3基因可能由于突变而减少表达(例如，与对照相比减少了至少约5％，例如，减少了约5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％)。在一些实施方案中，内源性组蛋白去甲基化酶是SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶，任选地是Jumonji C型H3K9me2/me3去甲基化酶。在一些实施方案中，由内源性组蛋白去甲基化酶基因编码的组蛋白去甲基化酶多肽调节小花育性，种子数量(例如，籽粒数量)和/或种子重量(例如，籽粒重)，任选地，其中所述调节小花育性、种子数量和/或种子重量的组蛋白去甲基化酶是SIX-ROWED SPIKE 3(VRS3)转录因子，任选地是Jumonji C型H3K9me2/me3去甲基化酶。种子数量和种子重量也可以称为“种子产量”

如本文所用，“非自然突变”是指通过人类干预产生的突变，其不同于在自然界中发生的相同基因中发现的突变(例如，自然发生的突变)。

如本文所述，编辑技术用于靶向植物中的内源性去甲基化酶组蛋白基因，任选地SIX-ROWED SPIKE 3(VRS3)(任选地Jumonji C型H3K9me2/me3去甲基化酶)基因，以产生具有增加的小花育性、增加的种子产量(例如，种子(例如籽粒)数量和/或重量)的植物。在一些方面，由编辑技术产生的突变可以是显性负性突变、半显性突变、弱功能丧失突变、亚效等位基因突变或无效突变。在一些实施方案中，突变可以在VRS3基因的锌指结合结构域(ZnF，ZnF区域)中、在Jumonji C型(Jmj-C)结构域和/或Jumonji N型(Jmj-N)结构域中，其中所述突变破坏组蛋白去甲基化酶多肽与DNA的结合和/或降低组蛋白去甲基化酶多肽的组蛋白去甲基化活性。VSR3基因中的突变类型可用于产生表现出增加的小花育性、增加的种子(例如籽粒)数量和/或增加的种子(例如籽粒)重量的植物，所述突变包括，例如置换、缺失和插入。在一些实施方案中，突变可以是框内缺失或框外缺失。

在一些实施方案中，用于玉米VRS3直系同源物和其它植物的VRS3直系同源物的编辑策略可能涉及破坏VRS3多核苷酸的ZnF DNA结合结构域、Jumonji C型(Jmj-C)结构域和/或Jumonji N型(Jmj-N)结构域，以产生例如，显性负性VSR3等位基因。作为实例，玉米在1号和5号染色体上有两个VRS3直系同源物。在一些实施方案中，可以同时编辑两个VRS3直系同源物。为了破坏DNA结合结构域和/或降低组蛋白去甲基化酶多肽(VRS3)的组蛋白去甲基化活性，编辑策略包括但不限于使用CRISPR-Cas(例如Cas12a、Cas9等)以去除以下的至少一部分或全部：ZnF DNA结合结构域，Jumonji C型(Jmj-C)结构域和/或Jumonji N型(Jmj-N)结构域，或被靶向的框内缺失JmjN结构域5'端附近的和/或JmjC结构域5'端附近的残基或JmjN结构域的其它位置的残基和/或JmjC结构域的其它位置(例如，JmjC结构域的中间)的残基和/或ZnF结构域的3'端附近的残基。使用这种策略破坏ZnF DNA结合结构域、Jmj-C结构域和/或Jmj-N结构域有望增加小花育性、籽粒大小和籽粒数量(例如籽粒或种子产量)。可使用的其它编辑策略包括但不限于兆核酸酶、锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN)、碱基编辑和/或先导编辑，所述编辑策略可用于实现如本文所述的内源性组蛋白甲基酶基因的这些突变。

在一些实施方案中，本发明提供了一种植物或其植物部分，所述植物或植物部分在编码组蛋白去甲基化酶多肽的内源性组蛋白去甲基化酶基因中包含至少一个突变(例如，一个或多个突变，例如1、2、3、4、5或更多个突变)。在一些实施方案中，所述突变是非天然突变。在一些实施方案中，所述内源性组蛋白去甲基化酶基因：(a)编码与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％(例如，80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％)的序列同一性的多肽；或(b)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％(例如，80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％)的序列同一性的序列。在一些实施方案中，内源性组蛋白去甲基化酶基因包含：(1)JmjN结构域，所述JmjN结构域：(a)与SEQ IDNO:75、78、81或84中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ IDNO:87或SEQ ID NO:90的氨基酸序列具有至少80％的序列同一性的多肽，(2)JmjC结构域，所述JmjC结构域：(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80％的序列同一性的多肽，和/或(3)ZnF结构域，所述ZnF结构域：(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80％的序列同一性的多肽。

在一些实施方案中，至少一个突变是碱基置换、碱基缺失和/或碱基插入。在一些实施方案中，至少一个突变包含对A、T、G或C的碱基置换。在一些实施方案中，至少一个突变是至少一个(例如，1、2、3、4、5、6、7、8、9或10个或更多个)碱基对的置换。在一些实施方案中，编码组蛋白去甲基化酶的内源性基因中的至少一个突变包括碱基缺失(例如，至少一个(例如，1、2、3、4、5、6、7、8、9或10个或更多个)碱基对的缺失)，任选地，其中所述碱基缺失是框内缺失或框外缺失。在一些实施方案中，所述至少一个突变是非天然突变。

在一些实施方案中，至少一个突变可以是点突变(例如，缺失、置换、添加)。在一些实施方案中，突变可以是一个或多个碱基或氨基酸的缺失。在一些实施方案中，突变可以是一个或多个碱基或氨基酸的置换。在一些实施方案中，至少一个突变是碱基置换，其中所述碱基置换导致氨基酸置换。在一些实施方案中，至少一个突变是碱基缺失，其中所述碱基缺失导致移码突变。在一些实施方案中，至少一个突变产生显性负性突变、半显性突变、弱功能丧失突变、亚效等位基因突变或无效突变。在一些实施方案中，至少一个突变是显性负性突变或半显性突变。在一些实施方案中，至少一个突变是非天然突变。

在一些实施方案中，内源性组蛋白去甲基化酶基因可以存在于多于一条染色体(例如，多于一个拷贝)上，并且组蛋白去甲基化酶基因包含一个拷贝或两个拷贝中的突变。当内源性组蛋白去甲基化酶基因包含多于一个拷贝中的突变时，所述突变可能与另一个拷贝中的突变相同，也可能是不同的突变。在一些实施方案中，内源性组蛋白去甲基化酶基因是位于1号染色体上的VRS3基因(SEQ ID NO:69、70；Zm00001d030180)和5号染色体上的VRS3基因(SEQ ID NO:72、73；Zm00001d014422)，其中一种或两种内源性VRS3基因包含突变(例如，一个或多个突变)，任选地，其中所述突变在一种或两种VRS3基因的ZnF结构域中，在一种或两种VRS3基因的JmjN结构域中，和/或一种或两种VRS3基因的JmjC结构域中。

在一些实施方案中，提供了一种植物或其部分，所述植物或其部分在编码组蛋白去甲基化酶多肽的内源性组蛋白去甲基化酶基因中包含至少一个(例如，一个或多个)突变，其中所述突变导致组蛋白去甲基化酶多肽具有被破坏的(例如，减少或丧失)DNA结合和/或降低的组蛋白去甲基化活性。

在一些实施方案中，提供了在编码组蛋白去甲基化酶多肽的内源性组蛋白去甲基化酶基因中包含至少一个(例如，一个或多个)突变的植物或其部分，其中所述突变破坏组蛋白去甲基化酶多肽与DNA的结合和/或降低组蛋白去甲基化酶多肽的组蛋白去甲基化活性，任选地减少组蛋白去甲基化酶基因的表达，并导致植物或其部分中的籽粒数量增加。在一些实施方案中，至少一个突变是组蛋白去甲基化酶基因的部分ZnF结构域或整个ZnF结构域的缺失，组蛋白去甲基化酶基因的部分JmjC结构域或整个JmjC结构域的缺失和/或组蛋白去甲基化酶基因的部分JmjN结构域或整个JmjN结构域的缺失。在一些实施方案中，缺失可以是至少一个核苷酸(例如，1、2、3、4、5、6、7、8、9、10、12、15、18、21、24、27、30、35、40、45、50、55、60、65、70、75、80、90、100、110、120、130、140、150、160、170、180、190或200个或更多个核苷酸，或其中的任何值或范围)。在一些实施方案中，碱基缺失包括三个或更多个连续核苷酸(例如，3、4、5、6、7、8、9、10、12、15、18、21、24、27、30、35、40、45、50、55、60、65、70、75、80、90、100、110、120、130、140、150、160或更多个核苷酸，或其中的任何值或范围)的缺失。在一些实施方案中，至少一个突变是非天然突变。

在一些实施方案中，碱基缺失包括从组蛋白去甲基化酶基因的ZnF结构域缺失至少一个碱基对或缺失三个或更多个连续核苷酸(例如，参考SEQ ID NO:69的核苷酸位置编号，从位置3927到位置4165缺失至少一个核苷酸，参考SEQ ID NO:70的核苷酸位置编号，从位置1495到位置1654缺失至少一个核苷酸，参考SEQ ID NO:72的核苷酸位置编号，从位置3987到位置4233缺失至少一个核苷酸，和/或参考SEQ ID NO:73的核苷酸位置编号，从位置1498到位置1656缺失至少一个核苷酸)。

在一些实施方案中，碱基缺失包括从组蛋白去甲基化酶基因的JmjC结构域缺失至少一个碱基对或缺失三个或更多个连续核苷酸(例如，参考SEQ ID NO:69的核苷酸位置编号，从位置3100到位置3631缺失至少一个核苷酸，参考SEQ ID NO:70的核苷酸位置编号，从位置832到位置1199缺失至少一个核苷酸，参考SEQ ID NO:72的核苷酸位置编号，从位置3162到位置3692缺失至少一个核苷酸，和/或参考SEQ ID NO:73的核苷酸位置编号，从位置835到位置1203缺失至少一个核苷酸)。

在一些实施方案中，碱基缺失包括从组蛋白去甲基化酶基因的JmjN结构域缺失至少一个碱基对或缺失三个或更多个连续核苷酸(例如，参考SEQ ID NO:69的核苷酸位置编号，从位置2216到位置2424缺失至少一个核苷酸，参考SEQ ID NO:70的核苷酸位置编号，从位置301到位置402缺失至少一个核苷酸，参考SEQ ID NO:72的核苷酸位置编号，从位置2268到位置2477缺失至少一个核苷酸，和/或参考SEQ ID NO:73的核苷酸位置编号，从位置305到位置405缺失至少一个核苷酸)。

在一些实施方案中，碱基缺失导致组蛋白去甲基化酶的ZnF结构域的一个或多个氨基酸残基、组蛋白去甲基化酶的JmjN结构域的一个或多个氨基酸残基和/或组蛋白去甲基化酶的JmjC结构域的一个或多个氨基酸残基的缺失(例如，来自组蛋白去甲基化酶(例如VRS3多肽，例如SEQ ID NO:71或SEQ ID NO:74)的ZnF结构域、JmjN结构域或JmjC结构域的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83或84个氨基酸残基的缺失，任选地，其中所缺失的氨基酸是连续的，或者是连续和非连续氨基酸残基的组合)。

在一些实施方案中，碱基缺失导致组蛋白去甲基化酶的ZnF结构域的一个或多个氨基酸残基的缺失，即，参考SEQ ID NO:71的氨基酸位置编号，从位置499到位置551缺失一个或多个氨基酸残基，和/或参考SEQ ID NO:74的氨基酸位置编号，从位置500到位置552缺失一个或多个氨基酸残基。在一些实施方案中，碱基缺失导致组蛋白去甲基化酶的JmjC结构域的一个或多个氨基酸残基的缺失，即，参考SEQ ID NO:71的氨基酸位置编号，从位置278到位置400缺失一个或多个氨基酸残基，和/或参考SEQ ID NO:74的氨基酸位置编号，从位置123到位置401缺失一个或多个氨基酸残基。在一些实施方案中，碱基缺失导致组蛋白去甲基化酶的JmjN结构域的一个或多个氨基酸残基的缺失，即，参考SEQ ID NO:71的氨基酸位置编号，从位置101到位置135缺失一个或多个氨基酸残基，和/或参考SEQ ID NO:74的氨基酸位置编号，从位置101到位置136缺失一个或多个氨基酸残基。

本发明有用的突变(例如，内源性组蛋白去甲基化酶基因中一个或多个核苷酸的置换或缺失，或内源性组蛋白去甲基化酶中一个或多个氨基酸的置换或缺失)可能导致显性负性突变、半显性突变、弱功能丧失突变、亚效等位基因突变或无效突变，任选地，其中所述突变可能是非自然突变。在一些实施方案中，突变导致显性负性突变、半显性和/或亚效等位基因突变。在一些实施方案中，突变破坏组蛋白去甲基化酶多肽与DNA的结合和/或降低组蛋白去甲基化酶多肽的组蛋白去甲基化活性，任选地，其中所述突变导致显性负性突变或半显性突变。

在一些实施方案中，提供了一种植物细胞，所述植物细胞包含编辑系统，所述编辑系统包含：(a)CRISPR相关效应蛋白；和(b)引导核酸(例如，gRNA、gDNA、crRNA、crDNA、sgRNA和sgDNA)，所述引导核酸包含与编码组蛋白去甲基化酶的内源性靶基因互补的间隔序列。在一些实施方案中，组蛋白去甲基化酶是SIX-ROWED SPIKE 3(VRS3)，任选地是Jumonji C型H3K9me2/me3去甲基化酶。在一些实施方案中，编码组蛋白去甲基化酶(例如VRS3)的内源性靶基因：(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；和/或(b)编码与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的多肽序列。在一些实施方案中，编码组蛋白去甲基化酶(例如VRS3)的内源性靶基因包含：(1)JmjN结构域、所述JmjN结构域：(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80％的序列同一性的多肽，(2)JmjC结构域，所述JmjC结构域：(a)与SEQID NO:76、79、82或85中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQID NO:88或SEQ ID NO:91的氨基酸序列具有至少80％的序列同一性的多肽，和/或(3)ZnF结构域，所述ZnF结构域：(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80％的序列同一性的多肽。在一些实施方案中，植物细胞可以来自玉米植物。

在一些实施方案中，所述编辑系统在编码VRS3蛋白的内源性靶基因中产生突变。在一些实施方案中，突变是非天然突变。在一些实施方案中，编辑系统的引导核酸可以包含SEQ ID NO:93-103(即SEQ ID NO:93、94、95、96、97、98、99、100、101、102、103)中任一个的核苷酸序列(例如，间隔序列)，其中所述包含SEQ ID NO:93-103的间隔子可以用于靶向VRS3基因，任选地靶向例如，玉米植物的1号染色体和/或5号染色体上的VRS3基因。在一些实施方案中，包含含有SEQ ID NO:93-96(即SEQ ID NO:93、94、95、96)中任一个或多个核苷酸序列的间隔子的引导核酸可用于靶向VRS3多核苷酸的JmjN区域，以例如产生框内缺失。在一些实施方案中，包含含有SEQ ID NO:97-99(即SEQ ID NO:97、98、99)中任一个或多个核苷酸序列的间隔子的引导核酸可用于靶向VRS3多核苷酸的JmjN区域，以例如产生框内缺失和/或框外缺失。在一些实施方案中，可以使用包含含有SEQ ID NO:100-103(即SEQ IDNO:100、101、102、103)中任一个或多个核苷酸序列的间隔子的引导核酸，所述间隔子包含，例如，以缺失VRS3多核苷酸的ZnF结构域。

在一些实施方案中，提供了一种植物细胞，所述植物细胞包含组蛋白去甲基化酶基因的DNA结合位点中的突变，突变的组蛋白去甲基化酶基因的DNA结合位点阻止或减少编码的组蛋白去甲基化酶与DNA的结合或降低编码的组蛋白去甲基化酶的活性，其中所述基因组修饰是使用编辑系统引入的置换、插入和/或缺失，所述编辑系统包含与组蛋白去甲基化酶基因中的靶位点结合的核酸结合结构域，其中所述组蛋白去甲基化酶基因：(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％序列同一性的序列；(b)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽。在一些实施方案中，组蛋白去甲基化酶基因编码SIX-ROWED SPIKE 3(VRS3)，任选地是Jumonji C型H3K9me2/me3去甲基化酶。在一些实施方案中，组蛋白去甲基化酶基因包括：(1)JmjN结构域，所述JmjN结构域：(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80％的序列同一性的多肽，(2)JmjC结构域，所述JmjC结构域：(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:88或SEQID NO:91具有至少80％的序列同一性的多肽的氨基酸序列，和/或(3)ZnF结构域，所述ZnF结构域：(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80％序列同一性的多肽。在一些实施方案中，编辑系统的核酸结合结构域来自多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)和/或Argonaute蛋白。在一些实施方案中，植物可以从植物细胞再生，任选地，其中所述植物表现出增加的小花育性、增加的种子数量和/或增加的种子重量。在一些实施方案中，植物细胞可以来自玉米植物。

植物或其部分或植物细胞的内源性VRS3基因中的突变可以是任何类型的突变，包括碱基置换、缺失和/或插入。在一些实施方案中，突变可以是非天然突变。在一些实施方案中，至少一个突变可以是点突变。在一些实施方案中，突变可以包含对A、T、G或C的碱基置换。在一些实施方案中，突变可以是至少一个碱基对的缺失或至少一个碱基对的插入。在一些实施方案中，突变可导致VRS3蛋白中氨基酸残基的置换。在一些实施方案中，突变可以是内源性组蛋白去甲基化酶的锌指DNA结合结构域(ZnF结构域)、Jumonji C型(Jmj-C)结构域和Jumonji N型(Jmj-N)结构域的全部或部分缺失。在一些实施方案中，缺失可以是框内缺失或框外缺失。

在一些实施方案中，本发明有用的缺失可以是VRS3基因座的锌指DNA结合结构域(ZnF结构域)、Jumonji C型(Jmj-C)结构域和Jumonji N型(Jmj-N)结构域中的缺失。在一些实施方案中，缺失可以包含至少1个碱基对和/或至少2个连续碱基对(例如，1个碱基对和/或约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70，71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、110、120、121、122、123、124、125、126、127、128、129、130、140、150、151、152、153、154、155、156、157、158、159、160、180、200、201、202、203、204、205、206、207、208、209、210、220、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、260、270、280、290、300、310、320、330、340、350、360、361、362、363、364、365、366、367、368、369、370、380、390、400、450、500、510、520、530、531或532个或更多个连续碱基对，或其中的任何范围或值)。在一些实施方案中，缺失可以是：至少1个碱基对至约3、4、5、6个连续碱基对，至少1个碱基对至约10个连续碱基对，约10个连续碱基对至约15个连续碱基对，约10个连续碱基对至约30个连续碱基对，约10个连续碱基对至约50个连续碱基对，约50个连续碱基对至约100、101、102、103、104或105个或更多个连续碱基对，约50个连续碱基对至约200、201、202、203、204、205、206、207、208、209或210个或更多个连续碱基对，约50、100、150或200个连续碱基对至约250、300、350、360、361、362、363、364、365、366、367、368、369或370个或更多个连续碱基对，或约100、150、200、250、300或350个连续碱基对至约400、410、420、430、440、450、460、470、480、490、500、510、520、530、531、532、533、534、535、536、537、538、539或540个或更多个连续碱基对。在一些实施方案中，缺失可以包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71，72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98或99个连续碱基对至约100、101、102、103、104、105、110、120、121、122、123、124、126、127、128、129、130、140、150、151、152、153、154、155、156、158、159、160、180、200、201、202、203、204、205、207、209、210、220、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、260、270、280、290、300、310、320、330、340、350、360、361、362、363、364、365、366、367、368、369、370、380、390、400、450、500、510、520、530、531或532个或更多个连续碱基对，或其中的任何范围或值。

在一些实施方案中，本发明提供了一种植物或植物部分，所述植物或植物部分包含编码修饰的组蛋白去甲基化酶多肽的修饰的内源性组蛋白去甲基化酶基因。在一些实施方案中，植物或植物部分可以是玉米植物。

在一些实施方案中，提供了一种产生/育种无转基因的编辑的植物的方法，所述方法包括：使本发明的植物(例如，包含VRS3基因中的突变并具有增加的小花育性、增加的种子数量(例如，籽粒数)和/或增加的种子重量(例如，粒籽重量))与无转基因的植物杂交，从而使至少一个突变(任选地，非天然突变)引入无转基因的植物(例如，引入子代植物)中；以及选择包含至少一个突变并且无转基因的子代植物，从而产生无转基因的编辑的植物。

本文还提供了一种提供具有增加的产量(例如，增加的小花育性、增加的种子数量和/或增加的种子重量)的多种植物的方法，所述方法包括在生长区域(例如，田地(例如，耕地，农田)、生长室、温室、休闲区、草坪和/或路边等)种植本发明的两种或更多种植物(例如，2、3、4、5、6、7、8、9、10种或更多种植物，所述植物包含VRS3多肽中的突变，并且具有例如增加的小花育性、增加的种子数量和/或增加的种子重量)，从而提供与不包含突变的多种对照植物相比(例如，与不包含突变的同基因植物(例如，野生型未编辑的植物或空缺分离体)相比)具有增加的产量的多种植物。

在一些实施方案中，提供了一种用于编辑植物细胞基因组中特定位点的方法，所述方法包括：以位点特异性方式切割植物细胞中的内源性组蛋白去甲基化酶基因中的靶位点，所述内源性组蛋白去甲基化酶基因：(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；和/或(b)编码包含与SEQ ID NO:71或SEQ IDNO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽，从而在植物细胞的内源性组蛋白去甲基化酶基因(例如VRS3基因)中产生编辑。在一些实施方案中，组蛋白去甲基化酶基因包括：(1)JmjN结构域，所述JmjN结构域：(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80％的序列同一性的多肽，(2)JmjC结构域，所述JmjC结构域：(a)与SEQ IDNO:76、79、82或85中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ IDNO:88或SEQ ID NO:91的氨基酸序列具有至少80％的序列同一性的多肽，和/或(3)ZnF结构域，所述ZnF结构域：(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80％的序列同一性的多肽。在一些实施方案中，内源性组蛋白去甲基化酶基因中的编辑导致突变，包括但不限于缺失、置换或插入，其中所述编辑可以是点突变和/或框内突变和/或框外缺失，任选地，其中所述突变可以是显性负性突变或半显性突变。在一些实施方案中，突变是缺失，任选地，其中所述缺失包含如本文所述的VRS3基因的ZnF区域、JmjC区域和/或JmjN区域中至少1个碱基对或更多个碱基对的缺失。在一些实施方案中，参考SEQ ID NO:71的氨基酸位置编号，从位置499到位置551和/或参考SEQ ID NO:74的氨基酸位置编号，从位置500到位置552，缺失组蛋白去甲基化酶的ZnF结构域的一个或多个氨基酸残基，参考SEQ ID NO:71的氨基酸位置编号，从位置278到位置400和/或参考SEQ ID NO:74的氨基酸位置编号，从位置123到位置401，缺失组蛋白去甲基化酶的JmjC结构域的一个或多个氨基酸残基，和/或参考SEQ ID NO:71的氨基酸位置编号，从位置101到位置135和/或参考SEQ ID NO:74的氨基酸位置编号，从位置101到位置136，缺失组蛋白去甲基化酶的JmjN结构域的一个或多个氨基酸残基。

在一些实施方案中，编辑方法还可以包括从包含内源性组蛋白去甲基化酶基因(例如VRS3基因)中的编辑的植物细胞再生植物，从而产生包含其内源性组蛋白去甲基化酶基因中的编辑的植物，任选地，其中包含其内源性组蛋白去甲基化酶基因中的编辑的所述植物与不包含编辑的对照植物(例如，不包含编辑的同基因植物(例如野生型未编辑的植物或空缺分离体))相比，表现出增加的小花育性、增加的种子数量和/或增加的种子重量。在一些实施方案中，所述编辑提供内源性组蛋白去甲基化酶基因中的突变(任选的，非天然突变)，突变的组蛋白去甲基化酶基因产生具有减少的DNA结合和/或降低的组蛋白去甲基化活性的组蛋白去甲基化酶多肽，任选地，其中所述突变是显性负性突变或半显性突变。

在一些实施方案中，提供了一种产生植物的方法，所述方法包括：(a)使包含编码组蛋白去甲基化酶的野生型内源性基因的植物细胞群体与靶向野生型内源性基因的核酸酶接触，其中所述核酸酶与结合野生型内源性基因中靶位点的核酸结合结构域(例如DNA结合结构域)连接，所述野生型内源性基因：(i)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；或(ii)编码包含与SEQ ID NO:71或SEQ IDNO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽；(b)从所述群体中选择包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物细胞，其中所述突变是(i)或(ii)中任一项的多肽中至少一个氨基酸残基的置换和/或缺失，其中所述突变降低或消除组蛋白去甲基化酶结合DNA的能力或降低组蛋白去甲基化酶的组蛋白去甲基化活性；以及(c)使选择的植物细胞生长成包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物。

在一些实施方案中，提供了一种增加植物的小花育性、种子数量和/或种子重量的方法，所述方法包括：(a)使包含编码组蛋白去甲基化酶的野生型内源性基因的植物细胞与靶向野生型内源性基因的核酸酶接触，其中所述核酸酶与结合野生型内源性基因中靶位点的核酸结合结构域连接，所述野生型内源性基因：(i)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；或(ii)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽，从而产生包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物细胞；(b)使植物细胞生长成包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物，从而增加植物的小花育性、种子数量和/或种子重量。

在一些实施方案中，提供了一种产生植物或其部分的方法，所述植物或其部分包含至少一个具有内源性组蛋白去甲基化酶基因中的突变的细胞，所述方法包括使植物或植物部分中的组蛋白去甲基化酶基因中的靶位点与包含切割结构域和DNA结合结构域的核酸酶接触，其中所述核酸结合结构域与组蛋白去甲基化酶基因中的靶位点结合，其中所述组蛋白去甲基化酶基因：(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；或(b)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽，从而产生包含至少一个具有内源性组蛋白去甲基化酶基因中的突变的细胞的植物或其部分。在一些实施方案中，突变的内源性组蛋白去甲基化酶基因产生具有减少的DNA结合和/或降低的组蛋白去甲基化活性的组蛋白去甲基化酶多肽。

本文还提供了一种产生植物或其部分的方法，所述植物或其部分包含内源性组蛋白去甲基化酶中的突变，突变的内源性组蛋白去甲基化酶具有减少的DNA结合和/或降低的组蛋白去甲基化活性，所述方法包括使植物或植物部分中的内源性组蛋白去甲基化酶基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触，其中所述核酸结合结构域与组蛋白去甲基化酶基因中的靶位点结合，其中所述组蛋白去甲基化酶基因：(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；或(b)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽，从而产生具有内源性组蛋白去甲基化酶中的突变的植物或其部分，突变的内源性组蛋白去甲基化酶具有减少的DNA结合和/或降低的组蛋白去甲基化活性。

在一些实施方案中，可用于本发明的组蛋白去甲基化酶基因包含JmjN结构域、JMjC结构域和/或锌指结合(ZnF)结构域，(1)JmjN结构域，所述JmjN结构域：(a)与SEQ IDNO:75、78、81或84中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ IDNO:87或SEQ ID NO:90的氨基酸序列具有至少80％的序列同一性的多肽，(2)JMjC结构域，所述JMjC结构域：(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80％的序列同一性的多肽，和/或(3)ZnF结构域，所述ZnF结构域：(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80％的序列同一性的多肽。

在一些实施方案中，核酸酶可以切割内源性组蛋白去甲基化酶基因(例如，VRS3)，从而将突变引入内源性组蛋白去甲基化酶基因。本发明有用的核酸酶可以是可用于编辑/修饰靶核酸的任何核酸酶。这种核酸酶包括但不限于锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)、核酸内切酶(例如，Fok1)和/或CRISPR-Cas效应蛋白。同样，本发明有用的任何核酸结合结构域(例如，DNA结合结构域)可以是可用于编辑/修饰靶核酸的任何核酸结合结构域。此类核酸结合结构域包括但不限于锌指、转录激活因子样DNA结合结构域(TAL)、argonaute和/或CRISPR-Cas效应物DNA结合结构域。

在一些实施方案中，提供了一种编辑植物或植物部分的内源性VRS3基因的方法，所述方法包括使植物或植物部分的VRS3基因中的靶位点与胞嘧啶碱基编辑系统接触，所述胞嘧啶碱基编辑系统包含胞嘧啶脱氨酶和与VRS3基因中的靶位点结合的核酸结合结构域，所述VRS3基因包含与SEQ ID NO:75、76、77、78、79、80、81、82、83、84、85或86中任一个核苷酸序列具有至少80％的序列同一性的区域，和/或编码(i)与SEQ ID NO:87、88、89、90、91或92中任一个氨基酸序列具有至少80％序列同一性的多肽，从而产生包含具有突变的内源性VRS3基因的植物或其部分，所述突变减少VRS3多肽的DNA结合和/或降低组蛋白去甲基化活性，并且任选地，其中所述植物表现出增加的小花育性、增加的种子数量(例如籽粒数量)和/或增加的种子重量。

在一些实施方案中，提供了一种编辑植物或植物部分的内源性VRS3基因的方法，所述方法包括使植物或植物部分的VRS3基因中的靶位点与胞嘧啶碱基编辑系统接触，所述胞嘧啶碱基编辑系统包含腺苷脱氨酶和与VRS3基因中的靶位点结合的核酸结合结构域，所述VRS3基因包含与SEQ ID NO:75、76、77、78、79、80、81、82、83、84、85或86中任一个核苷酸序列具有至少80％序列同一性的区域，和/或编码(i)与SEQ ID NO:87、88、89、90、91或92中任一个氨基酸序列具有至少80％的序列同一性的多肽，从而产生包含具有突变的内源性VRS3基因的植物或其部分，所述突变减少VRS3多肽的DNA结合和/或降低VRS3多肽的组蛋白去甲基化活性，并且任选地，其中所述植物表现出增加的小花育性、增加的种子数量(例如，籽粒数量)和/或增加的种子重量。

在一些实施方案中，提供了一种检测突变VRS3基因(内源性VRS3基因中的突变)的方法，所述方法包括在植物基因组中检测编码例如SEQ ID NO:71、74、87、88、89、90、91或92中任一个的氨基酸序列的核酸中的突变，所述突变导致氨基酸序列的氨基酸残基置换或编码的氨基酸序列的部分缺失。

在一些实施方案中，提供了一种检测突变VRS3基因(内源性VRS3基因中的突变)的方法，所述方法包括在植物基因组中检测例如SEQ ID NO:69、70、72、73、75、76、77、78、79、80、81、82、83、84、85或86中任一个核苷酸序列中的突变，任选地其中所述突变是至少一个(例如1、2、3、4、5、6、7、8、9、10个或更多个)核苷酸的置换或缺失。

在一些实施方案中，本发明提供了一种检测内源性VRS3基因中的突变的方法，所述方法包括在植物基因组中检测如本文所述产生的突变的VRS3基因。

在一些实施方案中，本发明提供了一种产生包含内源性VRS3基因中的突变和至少一个感兴趣的多核苷酸的植物的方法，所述方法包括使包含内源性VRS3基因中的至少一个突变的本发明植物(第一植物)与包含至少一个感兴趣的多核苷酸的第二植物杂交以产生子代植物；以及选择包含VRS3基因中的至少一个突变和至少一个感兴趣的多核苷酸的子代植物，从而产生包含内源性VRS3基因中的突变和至少一个感兴趣的多核苷酸的植物。

本发明还提供了一种产生包含内源性VRS3基因中的突变和至少一个感兴趣的多核苷酸的植物的方法，所述方法包括将至少一个感兴趣的多核苷酸引入包含VRS3基因中的至少一个突变的本发明的植物中，从而产生包含VRS3基因中的至少一个突变和至少一个感兴趣的多核苷酸的植物。

在一些实施方案中，本发明提供了一种产生包含内源性VRS3基因中的突变和至少一个感兴趣的多核苷酸的植物的方法，所述方法包括将至少一个感兴趣的多核苷酸引入包含内源性VRS3基因中的至少一个突变的本发明的植物中，从而产生包含VRS3基因中的至少一个突变和至少一个感兴趣的多核苷酸的植物。

感兴趣的多核苷酸可以是可以赋予植物以期望的表型或另外改变表型或基因型的任何多核苷酸。在一些实施方案中，感兴趣的多核苷酸可以是赋予除草剂耐受性、抗虫性、抗病性、增加的产量、增加的养分利用效率和/或非生物胁迫抗性的多核苷酸。因此，根据本发明优选的待处理的植物或植物栽培种包括通过基因修饰获得遗传物质的所有植物，这些遗传物质赋予这些植物特别有利的有用特性(“性状”)。这些特性的例子是更好的植物生长、活力、抗胁迫性、站立性、抗倒伏性、养分吸收、植物营养和/或产量，特别是改善的生长、增加的对高温或低温的耐受性、增加的对干旱或对水或土壤盐度的耐受性、增强的开花性能、更容易收获、加速成熟、更高的产量、更高的质量和/或收获产品的更高营养价值，更长的储存寿命和/或收获产品的可加工性。

这些特性的进一步实例是对动物和微生物害虫的抵抗力提高，诸如对昆虫、蛛形纲动物、线虫、螨虫、蛞蝓和蜗牛的抵抗力，例如，因植物中形成的毒素所致。在编码赋予对此类动物和微生物害虫，特别是昆虫的耐受性特性的蛋白质的DNA序列中，将特别提到来自苏云金芽孢杆菌的编码Bt蛋白的遗传物质，Bt蛋白在文献中被广泛描述并为本领域技术人员所熟知。还将提到从细菌中提取的蛋白质，所述细菌诸如发光杆菌属(Photorhabdus)(WO97/17432和WO98/08932)。特别要提到的是Bt Cry或VIP蛋白，包括CrylA、CryIAb、CryIAc、CryIIA、CryIIIA、CryIIIB2、Cry9c Cry2Ab、Cry3Bb和CryIF蛋白或其毒性片段，以及它们的杂交体或组合，特别是CrylF蛋白或源自CrylF蛋白的杂交体(例如杂交CrylA-CrylF蛋白或其毒性片段)、CrylA型蛋白或其毒性片段，优选CrylAc蛋白或衍生自CrylAc蛋白的杂交体(例如，杂交CrylAb-CrylAc蛋白)或CrylAb或Bt2蛋白或其毒性片段、Cry2Ae、Cry2Af或Cry2Ag蛋白或其毒性片段、CrylA.105蛋白或其毒性片段、VIP3Aa19蛋白、VIP3Aa20蛋白、在COT202或COT203棉花事件中产生的VIP3A蛋白、VIP3Aa蛋白或其毒性片段，如Estruch等人(1996)，Proc Natl Acad Sci USA.28；93(11):5389-94中所述，如WO2001/47952中所述的Cry蛋白，来自致病杆菌属(Xenorhabdus)的杀虫蛋白(如WO98/50427中所述)、沙雷氏菌属(特别是来自嗜虫沙雷氏菌)或发光杆菌属菌株，诸如WO98/08932中所述的来自发光杆菌属的Tc蛋白。此外，这些蛋白质中任一个在某些氨基酸(1-10个，优选1-5个)上与上述命名的序列中任一个不同的任何变体或突变体，特别是它们的毒性片段的序列，或与转运肽(诸如质体转运肽)融合，或另一种蛋白质或肽，都包括在本文中。

这种特性的另一个特别强调的实例是赋予对一种或多种除草剂的耐受性，所述除草剂例如咪唑啉酮、磺酰脲类、草甘膦或草丁膦。在编码蛋白质(即，感兴趣的多核苷酸)的DNA序列中，这些蛋白质赋予经转化的植物细胞和植物对某些除草剂的耐受性的特性，将特别提到WO2009/152359中描述的bar或PAT基因或天蓝链霉菌(Streptomyces coelicolor)基因，该基因赋予对草铵膦除草剂的耐受性；编码合适的EPSPS(5-烯醇丙酮酰莽草酸-3-磷酸-合酶)的基因赋予对以EPSPS为靶标的除草剂的耐受性，特别是诸如草甘膦及其盐类的除草剂；编码草甘膦-n-乙酰转移酶的基因，或编码草甘膦氧化还原酶的基因。其它合适的耐除草剂性状包括至少一种ALS(乙酰乳酸合酶)抑制剂(例如，WO2007/024782)，突变的拟南芥ALS/AHAS基因(例如，美国专利6,855,533)，编码2,4-D-单加氧酶的基因赋予对2,4-D(2,4-二氯苯氧乙酸)的耐受性和编码麦草畏单加氧酶的基因赋予对麦草畏(3,6-二氯-2-甲氧基苯甲酸)的耐受性。

这些特性的进一步实例是对植物病原真菌、细菌和/或病毒的抗性增强，例如，因系统获得性抗性(SAR)、系统素(systemin)、植物抗毒素、诱导子以及抗性基因和相应表达的蛋白质和毒素所致。

可以优先地根据本发明处理的转基因植物或植物栽培种中的特别有用的转基因事件包括：事件531/PV-GHBK04(棉花，昆虫防治，记载于WO2002/040677)，事件1143-14A(棉花，昆虫防治，未保藏，记载于WO2006/128569)；事件1143-51B(棉花，昆虫防治，未保藏，记载于WO2006/128570)；事件1445(棉花，除草剂耐受性，未保藏，记载于US-A2002-120964或WO2002/034946)；事件17053(水稻，除草剂耐受性，保藏为PTA-9843，记载于WO2010/117737)；事件17314(水稻，除草剂耐受性，保藏为PTA-9844，记载于WO2010/117735)；事件281-24-236(棉花，昆虫防治-除草剂耐受性，保藏为PTA-6233，记载于WO2005/103266或US-A 2005-216969)；事件3006-210-23(棉花，昆虫防治-除草剂耐受性，保藏为PTA-6233，记载于US-A 2007-143876或WO2005/103266)；事件3272(玉米，质量性状，保藏为PTA-9972，记载于WO2006/098952或US-A 2006-230473)；事件33391(小麦，除草剂耐受性，保藏为PTA-2347，记载于WO2002/027004)，事件40416(玉米，昆虫防治-除草剂耐受性，保藏为ATCCPTA-11508，记载于WO 11/075593)；事件43A47(玉米，昆虫防治-除草剂耐受性，保藏为ATCCPTA-11509，记载于WO2011/075595)；事件5307(玉米，昆虫防治，保藏为ATCC PTA-9561，记载于WO2010/077816)；事件ASR-368(翦股颖，除草剂耐受性，保藏为ATCC PTA-4816，记载于US-A 2006-162007或WO2004/053062)；事件B16(玉米，除草剂耐受性，未保藏，记载于US-A2003-126634)；事件BPS-CV127-9(大豆，除草剂耐受性，保藏为NCIMB No.41603，记载于WO2010/080829)；事件BLRl(油菜，恢复雄性不育，保藏为NCIMB 41193，记载于WO2005/074671)，事件CE43-67B(棉花，昆虫防治，保藏为DSMACC2724，记载于US-A 2009-217423或WO2006/128573)；事件CE44-69D(棉花，昆虫防治，未保藏，记载于US-A 2010-0024077)；事件CE44-69D(棉花，昆虫防治，未保藏，记载于WO2006/128571)；事件CE46-02A(棉花，昆虫防治，未保藏，记载于WO2006/128572)；事件COT102(棉花，昆虫防治，未保藏，记载于US-A2006-130175或WO2004/039986)；事件COT202(棉花，昆虫防治，未保藏，记载于US-A2007-067868或WO2005/054479)；事件COT203(棉花，昆虫防治，未保藏，记载于WO2005/054480)；)；事件DAS21606-3/1606(大豆，除草剂耐受性，保藏为PTA-11028，记载于WO2012/033794)，事件DAS40278(玉米，除草剂耐受性，保藏为ATCC PTA-10244，记载于WO2011/022469)；事件DAS-44406-6/pDAB8264.44.06.l(大豆，除草剂耐受性，保藏为PTA-11336，记载于WO2012/075426)，事件DAS-14536-7/pDAB8291.45.36.2(大豆，除草剂耐受性，保藏为PTA-11335，记载于WO2012/075429)，事件DAS-59122-7(玉米，昆虫防治-除草剂耐受性，保藏为ATCC PTA 11384，记载于US-A 2006-070139)；事件DAS-59132(玉米，昆虫防治-除草剂耐受性，未保藏，记载于WO2009/100188)；事件DAS68416(大豆，除草剂耐受性，保藏为ATCCPTA-10442，记载于WO2011/066384或WO2011/066360)；事件DP-098140-6(玉米，除草剂耐受性，保藏为ATCC PTA-8296，记载于US-A 2009-137395或WO 08/112019)；事件DP-305423-1(大豆，质量性状，未保藏，记载于US-A 2008-312082或WO2008/054747)；事件DP-32138-1(玉米，杂交系统，保藏为ATCC PTA-9158，记载于US-A 2009-0210970或WO2009/103049)；事件DP-356043-5(大豆，除草剂耐受性，保藏为ATCC PTA-8287，记载于US-A 2010-0184079或WO2008/002872)；事件EE-I(茄子，昆虫防治，未保藏，记载于WO 07/091277)；事件Fil 17(玉米，除草剂耐受性，保藏为ATCC 209031，记载于US-A 2006-059581或WO 98/044140)；事件FG72(大豆，除草剂耐受性，保藏为PTA-11041，记载于WO2011/063413)，事件GA21(玉米，除草剂耐受性，保藏为ATCC 209033，记载于US-A 2005-086719或WO 98/044140)；事件GG25(玉米，除草剂耐受性，保藏为ATCC 209032，记载于US-A 2005-188434或WO98/044140)；事件GHB119(棉花，昆虫防治-除草剂耐受性，保藏为ATCC PTA-8398，记载于WO2008/151780)；事件GHB614(棉花，除草剂耐受性，保藏为ATCC PTA-6878，记载于US-A 2010-050282或WO2007/017186)；事件GJ11(玉米，除草剂耐受性，保藏为ATCC 209030，记载于US-A 2005-188434或WO98/044140)；事件GM RZ13(糖用甜菜，抗病毒性，保藏为NCIMB-41601，记载于WO2010/076212)；事件H7-l(糖用甜菜，除草剂耐受性，保藏为NCIMB 41158或NCIMB 41159，记载于US-A 2004-172669或WO 2004/074492)；事件JOPLINl(小麦，抗病性，未保藏，记载于US-A 2008-064032)；事件LL27(大豆，除草剂耐受性，保藏为NCIMB41658，记载于WO2006/108674或US-A2008-320616)；事件LL55(大豆，除草剂耐受性，保藏为NCIMB 41660，记载于WO 2006/108675或US-A2008-196127)；事件LLcotton25(棉花，除草剂耐受性，保藏为ATCCPTA-3343，记载于WO2003/013224或US-A 2003-097687)；事件LLRICE06(水稻，除草剂耐受性，保藏为ATCC 203353，记载于US 6,468,747或WO2000/026345)；事件LLRice62(水稻，除草剂耐受性，保藏为ATCC 203352，记载于WO2000/026345)，事件LLRICE601(水稻，除草剂耐受性，保藏为ATCC PTA-2600，记载于US-A 2008-2289060或WO2000/026356)；事件LY038(玉米，质量性状，保藏为ATCC PTA-5623，记载于US-A2007-028322或WO2005/061720)；事件MIR162(玉米，昆虫防治，保藏为PTA-8166，记载于US-A 2009-300784或WO2007/142840)；事件MIR604(玉米，昆虫防治，未保藏，记载于US-A 2008-167456或WO2005/103301)；事件MON15985(棉花，昆虫防治，保藏为ATCC PTA-2516，记载于US-A 2004-250317或WO2002/100163)；事件MON810(玉米，昆虫防治，未保藏，记载于US-A2002-102582)；事件MON863(玉米，昆虫防治，保藏为ATCC PTA-2605，记载于WO2004/011601或US-A 2006-095986)；事件MON87427(玉米，人工授粉，保藏为ATCC PTA-7899，记载于WO2011/062904)；事件MON87460(玉米，胁迫抗性，保藏为ATCC PTA-8910，记载于WO2009/111263或US-A 2011-0138504)；事件MON87701(大豆，昆虫防治，保藏为ATCC PTA-8194，记载于US-A 2009-130071或WO2009/064652)；事件MON87705(大豆，质量性状-除草剂耐受性，保藏为ATCC PTA-9241，记载于US-A 2010-0080887或WO2010/037016)；事件MON87708(大豆，除草剂耐受性，保藏为ATCC PTA-9670，记载于WO2011/034704)；事件MON87712(大豆，产量，保藏为PTA-10296，记载于WO2012/051199)，事件MON87754(大豆，质量性状，保藏为ATCC PTA-9385，记载于WO2010/024976)；事件MON87769(大豆，质量性状，保藏为ATCC PTA-8911，记载于US-A 2011-0067141或WO2009/102873)；事件MON88017(玉米，昆虫防治-除草剂耐受性，保藏为ATCCPTA-5582，记载于US-A 2008-028482或WO2005/059103)；事件MON88913(棉花，除草剂耐受性，保藏为ATCC PTA-4854，记载于WO2004/072235或US-A2006-059590)；事件MON88302(油菜，除草剂耐受性，保藏为PTA-10955，记载于WO2011/153186)，事件MON88701(棉花，除草剂耐受性，保藏为PTA-11754，记载于WO2012/134808)，事件MON89034(玉米，昆虫防治，保藏为ATCC PTA-7455，记载于WO 07/140256或US-A 2008-260932)；事件MON89788(大豆，除草剂耐受性，保藏为ATCC PTA-6708，记载于US-A 2006-282915或WO2006/130436)；事件MSl 1(油菜，人工授粉-除草剂耐受性，保藏为ATCC PTA-850或PTA-2485，记载于WO2001/031042)；事件MS8(油菜，人工授粉-除草剂耐受性，保藏为ATCC PTA-730，记载于WO2001/041558或US-A 2003-188347)；事件NK603(玉米，除草剂耐受性，保藏为ATCC PTA-2478，记载于US-A 2007-292854)；事件PE-7(水稻，昆虫防治，未保藏，记载于WO2008/114282)；事件RF3(油菜，人工授粉-除草剂耐受性，保藏为ATCC PTA-730，记载于WO2001/041558或US-A2003-188347)；事件RT73(油菜，除草剂耐受性，未保藏，记载于WO2002/036831或US-A2008-070260)；事件SYHT0H2/SYN-000H2-5(大豆，除草剂耐受性，保藏为PTA-11226，记载于WO2012/082548)，事件T227-1(糖用甜菜，除草剂耐受性，未保藏，记载于WO2002/44407或US-A 2009-265817)；事件T25(玉米，除草剂耐受性，未保藏，记载于US-A 2001-029014或WO2001/051654)；事件T304-40(棉花，昆虫防治-除草剂耐受性，保藏为ATCC PTA-8171，记载于US-A 2010-077501或WO2008/122406)；事件T342-142(棉花，昆虫防治，未保藏，记载于WO2006/128568)；事件TC1507(玉米，昆虫防治-除草剂耐受性，未保藏，记载于US-A 2005-039226或WO2004/099447)；事件VIP1034(玉米，昆虫防治-除草剂耐受性，保藏为ATCC PTA-3925，记载于WO2003/052073)，事件32316(玉米，昆虫防治-除草剂耐受性，保藏为PTA-11507，记载于WO2011/084632)，事件4114(玉米，昆虫防治-除草剂耐受性，保藏为PTA-11506，记载于WO2011/084621)，事件EE-GM3/FG72(大豆，除草剂耐受性，ATCC登录号N°PTA-11041)任选地叠加事件EE-GM1/LL27或事件EE-GM2/LL55(WO2011/063413A2)，事件DAS-68416-4(大豆，除草剂耐受性，ATCC登录号N°PTA-10442，WO2011/066360A1)，事件DAS-68416-4(大豆，除草剂耐受性，ATCC登录号N°PTA-10442，WO2011/066384A1)，事件DP-040416-8(玉米，昆虫防治，ATCC登录号N°PTA-11508，WO2011/075593A1)，事件DP-043A47-3(玉米，昆虫防治，ATCC登录号N°PTA-11509，WO2011/075595A1)，事件DP-004114-3(玉米，昆虫防治，ATCC登录号N°PTA-11506，WO2011/084621A1)，事件DP-032316-8(玉米，昆虫防治，ATCC登录号N°PTA-11507，WO2011/084632A1)，事件MON-88302-9(油菜，除草剂耐受性，ATCC登录号N°PTA-10955，WO2011/153186A1)，事件DAS-21606-3(大豆，除草剂耐受性，ATCC登录号No.PTA-11028，WO2012/033794A2)，事件MON-87712-4(大豆，质量性状，ATCC登录号N°.PTA-10296，WO2012/051199A2)，事件DAS-44406-6(大豆，叠加了除草剂耐受性，ATCC登录号N°.PTA-11336，WO2012/075426A1)，事件DAS-14536-7(大豆，叠加了除草剂耐受性，ATCC登录号N°.PTA-11335，WO2012/075429A1)，事件SYN-000H2-5(大豆，除草剂耐受性，ATCC登录号N°.PTA-11226，WO2012/082548A2)，事件DP-061061-7(油菜，除草剂耐受性，无保藏N°可获得，WO2012071039A1)，事件DP-073496-4(油菜，除草剂耐受性，无保藏N°可获得，US2012131692)，事件8264.44.06.1(大豆，叠加了除草剂耐受性，登录号N°PTA-11336，WO2012075426A2)，事件8291.45.36.2(大豆，叠加了除草剂耐受性，登录号N°.PTA-11335，WO2012075429A2)，事件SYHT0H2(大豆，ATCC登录号N°.PTA-11226，WO2012/082548A2)，事件MON88701(棉花，ATCC登录号N°PTA-11754，WO2012/134808A1)，事件KK179-2(苜蓿，ATCC登录号N°PTA-11833，WO2013/003558A1)，事件pDAB8264.42.32.1(大豆，叠加了除草剂耐受性，ATCC登录号N°PTA-11993，WO2013/010094A1)，事件MZDT09Y(玉米，ATCC登录号N°PTA-13025，WO2013/012775A1)。

赋予关心的期望性状的基因/事件(例如，感兴趣的多核苷酸)也可以在转基因植物中与另一基因/事件彼此组合存在。可以提及的转基因植物的实例是重要作物植物，诸如谷物(小麦、水稻、黑小麦、大麦、黑麦、燕麦)、玉米、大豆、马铃薯、糖用甜菜、甘蔗、番茄、豌豆和其它类型的蔬菜、棉花、烟草、油菜和水果植物(水果有苹果、梨、柑橘类水果和葡萄)，特别强调玉米、大豆、小麦、水稻、马铃薯、棉花、甘蔗、烟草和油菜。特别强调的性状是植物对昆虫、蛛形纲动物、线虫、蛞蝓和蜗牛的抗性增强，以及植物对一种或多种除草剂的耐受性增强。

根据本发明可以优先处理的此类植物、植物部分或植物种子的市售实例包括商业产品，诸如以和/或XTENDFLEX^TM商品名销售或分销的植物种子。

本发明有用的组蛋白去甲基化酶基因包括任何组蛋白去甲基化酶基因，其中如本文所述的突变可以赋予包含所述突变的植物或其部分增加的小花育性、增加的种子数量和/或增加的种子重量。在一些实施方案中，组蛋白去甲基化酶基因是SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶基因，任选地是Jumonji C型H3K9me2/me3去甲基化酶。在一些实施方案中，组蛋白去甲基化酶(例如VRS3)多肽包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的氨基酸序列，或包含与SEQ ID NO:87、88、89、90、91或92中任一个或多个氨基酸序列具有至少80％的序列同一性的区域的多肽；和/或由与SEQID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列编码；或由与SEQ ID NO:75、76、77、78、79、80、81、82、83、84、85或86中任一个或多个核苷酸序列具有至少80％的同一性的区域编码。

在一些实施方案中，内源性组蛋白去甲基化酶(例如SIX-ROWED SPIKE 3(VRS3)；例如，任选地，Jumonji C型H3K9me2/me3去甲基化酶)基因中的至少一个突变是点突变。在一些实施方案中，至少一个突变可以是非天然突变。在一些实施方案中，内源性组蛋白去甲基化酶基因中的至少一个突变是显性负性突变。在一些实施方案中，植物的内源性组蛋白去甲基化酶基因中的至少一个突变可以是置换、缺失和/或插入。在一些实施方案中，植物的内源性组蛋白去甲基化酶基因中的至少一个突变可以是导致点突变的置换、缺失和/或插入，并且使植物具有增加的小花育性、增加的种子数量和/或增加的种子重量。在一些实施方案中，植物的内源性组蛋白去甲基化酶基因中的至少一个突变可以是导致显性负性突变或半显性突变的置换、缺失和/或插入，并且使植物具有增加的小花育性、增加的种子数量和/或增加的种子重量。例如，突变可以是1、2、3、4、5个或更多个氨基酸残基的置换、缺失和/或插入，或者是约1、2、3、4、5个或更多个核苷酸的置换、缺失和/或插入。在一些实施方案中，至少一个突变可以是对A、T、G或C的碱基置换。在一些实施方案中，至少一个突变可以是组蛋白去甲基化酶基因或蛋白质(例如VRS3基因或多肽)的部分或整个同源结构域的缺失。在一些实施方案中，至少一个突变可以是框内缺失。在一些实施方案中，至少一个突变可以是框外缺失。在一些实施方案中，突变可以是导致VRS3蛋白中的氨基酸残基置换的编辑。

在一些实施方案中，对本发明有用的缺失可以是一个碱基对和/或至少2个连续碱基对(例如，1个碱基对和/或约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70，71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、110、120、121、122、123、124、125、126、127、128、129、130、140、150、151、152、153、154、155、156、158、159、160、180、200、201、202、203、204、205、206、208、209、210、220、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、260、270、280、290、300、310、320、330、340、350、360、361、362、363、364、365、366、367、368、369、370、380、390、400、450、500、510、520、530、531或532个或更多个连续碱基对，或其中的任何范围或值)的碱基缺失。在一些实施方案中，缺失在VRS3基因的ZnF区域(例如，SEQ ID NO:69、70、72或73的区域；例如，SEQ ID NO:77或SEQID NO:80)中。在一些实施方案中，缺失包括丢失来自编码VRS3基因(例如，SEQ ID NO:69、70、72或73，例如，SEQ ID NO:77或SEQ ID NO:80)的内源性基因的ZnF结构域的1个碱基对和/或约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95或100个连续碱基对至约110、120、130、140、150，151、152、153、154、155、156、157、158、159、160、180、200、201、202、203、204、205、206、207、208、209、210、220、230、231、232、233、234、235、236、237、238或239个碱基对或更多个连续碱基对。在一些实施方案中，缺失在VRS3基因的JmjN区域(例如，SEQ ID NO:69、70、72或73的区域；例如，SEQ IDNO:78或SEQ ID NO:81)中。在一些实施方案中，缺失包括丢失来自编码VRS3基因(例如，SEQID NO:69、70、72或73，例如，SEQ ID NO:78或SEQ ID NO:81)的内源性基因的JmjN结构域的1个碱基对和/或约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95或100个碱基对至约110、120、130、140、150、151、152、153、154、155、156、157、158、159、160、180、200、201、202、203、204、205、206、207、208、209、210、220、230、231、232、233、234、235、236、237、238或239个或更多个连续碱基对。在一些实施方案中，缺失在VRS3基因的JmjC区域(例如，SEQ ID NO:69、70、72或73的区域；例如，SEQID NO:79或SEQ ID NO:82)中。在一些实施方案中，缺失包括丢失来自编码VRS3基因(例如，SEQ ID NO:69、70、72或73，例如，SEQ ID NO:79或SEQ ID NO:82)的内源性基因的JmjC结构域的1个碱基对和/或约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95个或100个至约150、200、250、250、300、350、360、361、362、363、364、365、366、367、368、369、370、380、390、400、420、440、460、480、500、510、520、530或531个或更多个连续碱基对。在一些实施方案中，碱基缺失包含框内缺失或框外缺失。

在一些实施方案中，碱基缺失可以包括内源性组蛋白去甲基化酶的锌指DNA结合结构域(ZnF结构域)、Jumonji C型(Jmj-C)结构域和Jumonji N型(Jmj-N)结构域的全部或部分缺失，任选地，其中所述缺失是从组蛋白去甲基化酶基因的ZnF结构域缺失至少一个核苷酸或缺失三个或更多个连续核苷酸(例如，至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95或100个)，即，参考SEQ ID NO:69的核苷酸位置编号，从3927位置到4165位置缺失至少一个核苷酸，参考SEQID NO:70的核苷酸位置编号，从1495位置到1654位置缺失至少一个核苷酸，参考SEQ IDNO:72的核苷酸位置编号，从3987位置到4233位置缺失至少一个核苷酸，和/或参考SEQ IDNO:73的核苷酸位置编号，从1498位到1656位缺失至少一个核苷酸；从组蛋白去甲基化酶基因的JmjC结构域缺失至少一个核苷酸或缺失三个或更多个连续核苷酸(例如，参考SEQ IDNO:69的核苷酸位置编号，从位置3100到位置3631缺失至少一个核苷酸，参考SEQ ID NO:70的核苷酸位置编号，从位置832位到位置1199缺失至少一个核苷酸，参考SEQ ID NO:72的核苷酸位置编号，从位置3162到位置3692缺失至少一个核苷酸，和/或参考SEQ ID NO:73的核苷酸位置编号，从位置835位到位置1203位缺失至少一个核苷酸)；或从组蛋白去甲基化酶基因的JmjN结构域中缺失至少一个核苷酸或缺失三个或更多个连续核苷酸(例如，参考SEQID NO:69的核苷酸位置编号，从位置2216到位置2424缺失至少一个核苷酸，参考SEQ IDNO:70的核苷酸位置编号，从位置301到位置402缺失至少一个核苷酸，参考SEQ ID NO:72的核苷酸位置编号，从位置2268到位置2477缺失至少一个核苷酸，和/或参考SEQ ID NO:73的核苷酸位置编号，从位置305到位置405缺失至少一个核苷酸)。

在一些实施方案中，缺失VRS3基因的一个或多个核苷酸可能导致VRS3多肽的一个或多个氨基酸残基的缺失(例如，缺失SEQ ID NO:71或SEQ ID NO:74的ZnF结构域的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52或53个或更多个氨基酸残基；例如，缺失SEQ ID NO:89或SEQ ID NO:92的全部或部分)。在一些实施方案中，碱基缺失导致组蛋白去甲基化酶的ZnF结构域(即，参考SEQ ID NO:71的氨基酸位置编号，从位置499到位置551，和/或参考SEQ ID NO:74的氨基酸位置编号，从位置500到位置552)的一个或多个氨基酸残基缺失。在一些实施方案中，缺失VRS3基因的一个或多个核苷酸可能导致VRS3多肽的一个或多个氨基酸残基的缺失(例如，缺失SEQ ID NO:71或SEQID NO:74的JmjC结构域的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、70、80、90、100、110、120、121或123个或更多个氨基酸残基；例如，缺失SEQ ID NO:88或SEQ ID NO:91的全部或部分)。在一些实施方案中，碱基缺失导致组蛋白去甲基化酶的JmjC结构域(即，参考SEQ ID NO:71的氨基酸位置编号，从位置278到位置400，和/或参考SEQ ID NO:74的氨基酸位置编号，从位置279到位置401)的一个或多个氨基酸残基缺失。在一些实施方案中，缺失VRS3基因的一个或多个核苷酸可能导致VRS3多肽的一个或多个氨基酸残基的缺失(例如，缺失SEQ ID NO:71或SEQID NO:74的JmjN结构域的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个或更多个氨基酸残基；例如，缺失SEQ ID NO:87或SEQ ID NO:90的全部或部分)。在一些实施方案中，碱基缺失导致组蛋白去甲基化酶的JmjC结构域(即，参考SEQ ID NO:71的氨基酸位置编号，从位置101到位置135，和/或参考SEQ ID NO:74的氨基酸位置编号，从位置101到位置136)的一个或多个氨基酸残基缺失。

如本文所述，编码VRS3的内源性基因中的突变(例如，碱基缺失、碱基置换、氨基酸置换、氨基酸缺失)可能破坏VRS3多肽结合DNA的能力(例如，破坏ZnF DNA结合结构域)或降低组蛋白去甲基化活性。在一些实施方案中，VRS3基因的突变可以是显性负性突变、半显性突变、弱功能丧失突变、亚效等位基因突变或无效突变。在一些实施方案中，VRS3基因的突变可以是显性隐性突变或半显性突变。在一些实施方案中，产生具有减少的DNA结合的VRS3多肽的突变可以是显性负性突变或半显性突变。在一些实施方案中，产生具有降低的去甲基化活性的VRS3多肽的突变可以是显性负性突变或半显性突变。如本文所述的VRS3基因的突变可以提供与没有VRS3基因的突变的植物相比(例如，与不包含突变的同基因植物(例如，野生型未编辑的植物或空缺分离体)相比)，表现出增加的小花育性、增加的种子重量和/或增加的种子数量的植物。在一些实施方案中，如本文所述的VRS3基因的突变可以是非自然突变。

在一些实施方案中，内源性VRS3基因中的突变可以在编辑系统切割后进行，所述编辑系统包含核酸酶和与内源性VRS3基因中的靶位点结合的DNA结合结构域，其中所述内源性VRS3基因：(a)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽和/或包含与SEQ ID NO:87-92中任一个氨基酸序列具有至少80％的序列同一性的区域的多肽；或(b)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；或包含与SEQ ID NO:75-86中任一个核苷酸序列具有至少80％的同一性的区域，从而产生包含具有突变的内源性VRS3基因并表现出增加的小花育性、种子重量和/或种子数量的植物或其部分。

本文还提供了与内源性组蛋白去甲基化酶基因(例如VRS3基因)中的靶位点结合的引导核酸(例如gRNA、gDNA、crRNA、crDNA)，其中所述内源性组蛋白去甲基化酶基因：(a)包含与SEQ ID NO:75、76、77、78、79、80、81、82、83、84、85或86中任一个或多个核苷酸序列具有至少80％的同一性的序列；或编码与SEQ ID NO:87-92中任一个或多个氨基酸序列具有至少80％的序列同一性的序列。在一些实施方案中，内源性组蛋白去甲基化酶基因(例如VRS3基因)中的靶位点在组蛋白去甲基化酶基因的ZnF结构域中(参见例如SEQ ID NO:77、80、83或86)。在一些实施方案中，内源性组蛋白去甲基化酶基因(例如VRS3基因)中的靶位点在组蛋白去甲基化酶基因的JmjC结构域中(参见例如，SEQ ID NO:76、79、82或85)。在一些实施方案中，内源性组蛋白去甲基化酶基因(例如VRS3基因)中的靶位点在组蛋白去甲基化酶基因的JmjN结构域中(参见例如，SEQ ID NO:75、78、81或84)。

在一些实施方案中，靶位点在内源性组蛋白去甲基化酶基因(例如VRS3基因)的JmjN结构域的5'区域中、JmjC结构域的5'或3'区域中和/或ZnF结构域的3'区域中。在一些实施方案中，引导核酸可以包含具有SEQ ID NO:93-103中任一个核苷酸序列的间隔子。

在一些实施方案中，本发明的引导核酸与玉米植物的至少一个内源性SIX-ROWEDSPIKE 3(VRS3)转录因子基因中的靶核酸结合，其中所述靶核酸位于1号染色体上，并且具有基因识别号(基因ID)Zm00001d030108，或位于5号染色体上，并且具有基因IDZm00001d014422。

另外提供了一种系统，所述系统包含本发明的引导核酸和与引导核酸缔合的CRISPR-Cas效应蛋白，任选地，其中所述引导核酸包含具有SEQ ID NO:93-103的核苷酸序列的间隔序列。在一些实施方案中，系统还包含与引导核酸缔合的tracr核酸和CRISPR-Cas效应蛋白，任选地，其中所述tracr核酸和引导核酸共价连接。

如本文所用，“与引导核酸缔合的CRISPR-Cas效应蛋白”是指在CRISPR-Cas效应蛋白和引导核酸之间形成的复合物，以将CRISPR-Cas效应蛋白引导至基因中的靶位点。

本发明还提供了一种基因编辑系统，所述基因编辑系统包含与引导核酸缔合的CRISPR-Cas效应蛋白，其中所述引导核酸包含与内源性组蛋白去甲基化酶基因结合的间隔序列。在一些实施方案中，组蛋白去甲基化酶基因是VRS3基因，任选地是Jumonji C型H3K9me2/me3去甲基化酶基因，所述去甲基化酶基因：(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；和/或(b)编码与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的多肽序列。在一些实施方案中，组蛋白去甲基化酶基因包含：(1)JmjN结构域，所述JmjN结构域：(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:87或SEQID NO:90的氨基酸序列具有至少80％的序列同一性的多肽，(2)JmjC结构域，所述JmjC结构域：(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80％的序列同一性的多肽，和/或(3)ZnF结构域，所述ZnF结构域：(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80％序列同一性的多肽。在一些实施方案中，引导核酸包含具有SEQ ID NO:93-103中任一个的核苷酸序列的间隔序列。在一些实施方案中，基因编辑系统可以还包含与引导核酸缔合的tracr核酸和CRISPR-Cas效应蛋白，任选地，其中所述tracr核酸和引导核酸共价连接。

本发明还提供了一种复合物，所述复合物包含CRISPR-Cas效应蛋白和引导核酸，所述CRISPR-Cas效应蛋白包含切割结构域，其中所述引导核酸与组蛋白去甲基化酶基因中的靶位点结合，所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；或编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽，其中所述切割结构域切割组蛋白去甲基化酶基因中的靶链。

在一些实施方案中，提供了表达盒，所述表达盒包含：(a)编码包含切割结构域的CRISPR-Cas效应蛋白的多核苷酸和(b)与组蛋白去甲基化酶基因中的靶位点结合的引导核酸，其中所述引导核酸包含与组蛋白去甲基化酶基因中的靶位点互补并结合的间隔序列，所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；或编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽。在一些实施方案中，引导核酸的间隔序列与编码SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶(任选地是Jumonji C型H3K9me2/me3去甲基化酶)的组蛋白去甲基化酶互补并结合。在一些实施方案中，引导核酸的间隔序列与组蛋白去甲基化酶基因的JmjN结构域、JmjC结构域或ZnF区域互补并结合，(1)所述JmjN结构域：(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80％的序列同一性的多肽，(2)所述JmjC结构域：(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80％的序列同一性的多肽，和/或(3)所述ZnF结构域：(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80％的序列同一性的多肽。

本文还提供了编码组蛋白去甲基化酶基因(例如VRS3基因)中的突变的核酸，其中当存在于植物或植物部分(例如玉米植物)中时，与没有突变的植物或植物部分相比(例如，与没有突变的同基因植物(例如，野生型未编辑的植物或空缺分离体)相比)，所述突变导致植物表现出增加的小花育性、增加的种子重量和/或增加的种子数量。

在一些实施方案中，提供了一种玉米植物或其部分，所述玉米植物或其部分包含位于1号染色体上且具有基因识别号(基因ID)Zm00001d030108或位于5号染色体上且具有基因ID Zm00001d014422的至少一个内源性SIX-ROWED SPIKE 3(VRS3)基因中的至少一个突变，任选地，其中所述突变可以是非自然突变。

本发明的核酸构建体(例如，包含序列特异性核酸结合结构域、CRISPR-Cas效应结构域、脱氨酶结构域、逆转录酶(RT)、RT模板和/或引导核酸等的构建体)和包含其的表达盒/载体可用作本发明的编辑系统，以用于修饰靶核酸(例如内源性VRS3基因)和/或其表达。

包含能够赋予小花育性和/或种子产量增加(例如，增加的种子/籽粒数量和/或重量)的内源性组蛋白去甲基化酶基因(例如，VRS3基因)的任何植物可以如本文所述(例如，使用本发明的多肽、多核苷酸、RNP、核酸构建体、表达盒和/或载体)进行修饰(例如，突变，例如，碱基编辑、切割、切口等)以增加植物的小花育性和/或种子产量。

与不包含突变的内源性组蛋白去甲基化酶基因(例如VRS3基因)的植物或其部分相比，具有增加的小花育性和/或种子产量(例如，增加的种子/籽粒数量和/或重量)的植物的育性或种子产量可能增加约5％至约100％(例如，约5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％或更多，或其中的任何范围或值)。在一些实施方案中，种子数量可以增加约5％至约100％(例如，约5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68，69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％或更多，或其中的任何范围或值)，任选地，种子数量增加约10％至约30％(例如，约10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％或30％或更多，或其中的任何范围或值)。在一些实施方案中，种子重量可以增加约5％至约100％(例如，约5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68，69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％或更多，或其中的任何范围或值)，任选地种子数量增加约10％至约30％(例如，约10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％或30％或更多，或其中的任何范围或值)。

如本文所用，术语“植物部分”包括但不限于繁殖组织(例如，花瓣、萼片、雄蕊、雌蕊、花托、花药、花粉、花、果实、花蕾、胚珠、种子和胚)；营养组织(例如，叶柄、茎、根、根毛、根尖、髓、胚芽、茎杆、芽、枝、树皮、顶端分生组织、腋芽、子叶、下胚轴和叶)；维管组织(例如，韧皮部和木质部)；特化细胞，诸如表皮细胞、薄壁细胞、厚角细胞(chollenchymacells)、厚壁组织细胞、气孔细胞、保卫细胞、角质层、叶肉细胞；愈伤组织；和插条。术语“植物部分”还包括植物细胞，包括在植物和/或植物部分中完整的植物细胞、植物原生质体、植物组织、植物器官、植物细胞组织培养物、植物愈伤组织、植物团块等。如本文所用，“枝条”是指地上部分，包括叶和茎。如本文所用，术语“组织培养物”包括组织、细胞、原生质体和愈伤组织的培养物。

如本文所用，“植物细胞”是指植物的结构和生理单元，其通常包含细胞壁但也包含原生质体。本发明的植物细胞可以是分离的单细胞的形式，或可以是培养的细胞，或者可以是更高组织单元的一部分，诸如，例如，植物组织(包括愈伤组织)或植物器官的一部分。“原生质体”是一种分离的植物细胞，没有细胞壁或只有部分细胞壁。因此，在本发明的一些实施方案中，包含本发明的核酸分子和/或核苷酸序列的转基因细胞是任何植物或植物部分的细胞，包括但不限于，根细胞、叶细胞、组织培养细胞、种子细胞、花细胞、果实细胞、花粉细胞等。在本发明的某些方面，植物部分可以是植物种质。在某些方面，植物细胞可以是不繁殖的植物细胞，不会再生为植物。

“植物细胞培养物”是指植物单元的培养物，诸如，例如，原生质体、细胞培养物细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、受精卵和处于不同发育阶段的胚。

如本文所用，“植物器官”是植物的独特且可见的结构和分化部分(诸如根、茎、叶、花蕾或胚)。

如本文所用，“植物组织”是指一组组织成结构和功能单元的植物细胞。原位植物或培养物中的任何组织都包括在内。该术语包括但不限于，整个植物、植物器官、植物种子、组织培养物和组织成结构和/或功能单元的任何植物细胞组。将该术语与上述任何特定类型的植物组织结合使用或在缺少上述任何特定类型的植物组织，或在本定义所包含的任何特定类型的植物组织的情况下使用，并不意味着排除任何其它类型的植物组织。

在本发明的一些实施方案中，提供了转基因组织培养物或转基因植物细胞培养物，其中所述转基因组织或细胞培养物包含本发明的核酸分子/核苷酸序列。在一些实施方案中，转基因可以从由转基因组织或细胞发育的植物中消除，方法是使转基因植物与非转基因植物杂交，并在子代中选择包含所需基因编辑而不含用于产生该编辑的转基因的植物。

具有内源性组蛋白去甲基化酶基因(例如VRS3基因)的任何植物(或植物细胞或其植物部分)均可与本发明一起使用。在一些实施方案中，可用于本发明的植物可包括但不限于玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、红薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、扁桃、核桃、草莓、西瓜、辣椒、葡萄、番茄、黄瓜、黑莓、覆盆子、黑覆盆子或芸苔属物种。

在一些实施方案中，用于本发明的植物可以是例如绿叶植物(例如莴苣、羽衣甘蓝、甘蓝、芝麻菜、菠菜等)。在一些实施方案中，用于本发明的植物可以是十字花科植物，包括但不限于西兰花、抱子甘蓝、卷心菜、花椰菜等植物。在一些实施方案中，本发明还可用于产生深色水果，包括。但不限于茄科植物(例如番茄、辣椒、茄子等)和/或产生浆果和核果(例如樱桃)的植物。在一些实施方案中，用于本发明的植物可以是行播作物种类(例如玉米、大豆等)。

用于本发明的植物的其它非限制性实例包括草坪草(例如，蓝草、本特草、黑麦草、羊茅)，羽苇草，簇毛草，芒草属，芒草(arundo)，柳枝稷，蔬菜作物，包括洋蓟、大头菜、芝麻菜、韭菜、芦笋、莴苣(例如，结球莴苣、散叶莴苣、长叶莴苣)、马兰加、瓜(例如，甜瓜、西瓜、克伦肖瓜、蜜瓜、哈密瓜)，菜类作物(如抱子甘蓝、卷心菜、花椰菜、西兰花、散叶甘蓝、羽衣甘蓝、大白菜、小白菜)，cardoni，胡萝卜，纳帕(napa)，秋葵，洋葱，芹菜，欧芹，鹰嘴豆，欧洲防风草，菊苣，辣椒，马铃薯，葫芦(如西葫芦(marrow)、黄瓜、密生西葫芦、笋瓜、南瓜、蜜瓜、西瓜、哈密瓜)，萝卜，干球洋葱，芜菁甘蓝(rutabaga)，茄子，婆罗门参(salsify)，茅菜(escarole)，小葱，菊苣，大蒜，菠菜，大葱，南瓜，绿色蔬菜，甜菜(糖用甜菜和饲料甜菜)，红薯，莙荙菜，辣根，番茄，芜菁和香料；水果作物，如苹果，杏，樱桃，油桃，桃，梨，李子，梅子，樱桃，木瓜，无花果，坚果(如栗子、山核桃、开心果、榛子、开心果、花生、核桃、澳洲坚果、扁桃等)，柑橘(如小柑桔，金桔，橙子，葡萄柚，橘子，柑橘，柠檬，酸橙等)，蓝莓，黑覆盆子，博伊森莓，蔓越莓，醋栗，鹅莓，罗根莓，覆盆子，草莓，黑莓，葡萄(酿酒葡萄和鲜食葡萄)，鳄梨，香蕉，猕猴桃，柿子，石榴，菠萝，热带水果，梨果，甜瓜，芒果，木瓜和荔枝，大田作物，如三叶草、苜蓿、梯牧草(timothy)、月见草、白池花、玉米/玉蜀黍(饲料玉米、甜玉米、爆米花)、蛇麻草、荷荷巴、荞麦、红花、藜麦、小麦、水稻、大麦、黑麦、小米、高粱、燕麦、黑小麦、高粱、烟草、木棉，豆科植物(豆类(如四季豆和干豆)，扁豆，豌豆，大豆)，油料植物(油菜、油菜籽、芥菜、罂粟、橄榄、向日葵、椰子、蓖麻油植物、可可豆、花生、油棕)，浮萍，拟南芥，纤维植物(棉花、亚麻、麻类植物、黄麻)，大麻属(如大麻(Cannabis sativa)、印度大麻(Cannabisindica)和莠草大麻(Cannabis ruderalis))，月桂科(肉桂、樟脑)，或咖啡、甘蔗、茶和天然橡胶植物等植物；和/或花坛植物，如开花植物、仙人掌、多肉植物和/或观赏植物(如玫瑰、郁金香、紫罗兰)，以及树木，如森林树木(阔叶树和常青树，如针叶树；如榆树、白蜡树、橡树、枫树、冷杉、云杉、雪松、松树、桦树、柏树、桉树、柳树)，以及灌木和其它苗木。在一些实施方案中，本发明的核酸构建体和/或编码其的表达盒和/或载体可用于修饰玉米、大豆、小麦、油菜、水稻、番茄、辣椒、向日葵、覆盆子、黑莓、黑覆盆子和/或樱桃。在一些实施方案中，本发明的核酸构建体和/或编码其的表达盒和/或载体可用于修饰悬钩子属(例如黑莓、黑覆盆子、博伊森莓、罗根莓、覆盆子，例如蔓越莓)、越桔属(例如蔓越莓)、茶藨子属(例如鹅莓、醋栗(例如红醋栗、黑醋栗))或草莓属(例如草莓)。

可用于本发明的编辑系统可以是现在已知或以后开发的任何位点特异性(序列特异性)基因组编辑系统，所述系统可以以靶标特异性的方式引入突变。例如，编辑系统(例如，位点或序列特异性编辑系统)可以包括但不限于，CRISPR-Cas编辑系统、兆核酸酶编辑系统、锌指核酸酶(ZFN)编辑系统、转录激活因子样效应物核酸酶(TALEN)编辑系统、碱基编辑系统和/或先导编辑系统，其中每个系统可以包含一个或多个多肽和/或一个或多个多核苷酸，当在细胞中作为一个系统表达时可以以序列特异性方式修饰(突变)靶核酸。在一些实施方案中，编辑系统(例如，位点或序列特异性编辑系统)可以包含一个或多个多核苷酸和/或一个或多个多肽，包括但不限于核酸结合结构域(DNA结合结构域)、核酸酶、和/或其它多肽、和/或多核苷酸。

在一些实施方案中，编辑系统可以包含一个或多个序列特异性核酸结合结构域(DNA结合结构域)，这些结构域可以来自，例如，多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如，CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)和/或Argonaute蛋白。在一些实施方案中，编辑系统可以包含一个或多个切割结构域(例如，核酸酶)，包括但不限于，核酸内切酶(例如，Fok1)、多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如，CRISPR-Cas效应蛋白)、锌指核酸酶和/或转录激活因子样效应物核酸酶(TALEN)。在一些实施方案中，编辑系统可以包含一种或多种多肽，包括但不限于，脱氨酶(例如，胞嘧啶脱氨酶、腺嘌呤脱氨酶)、逆转录酶、Dna2多肽和/或5'flap核酸内切酶(FEN)。在一些实施方案中，编辑系统可以包含一个或多个多核苷酸，包括但不限于，CRISPR阵列(CRISPR引导)核酸、延伸的引导核酸和/或逆转录酶模板。

在一些实施方案中，修饰或编辑组蛋白去甲基化酶基因(VRS3基因)的方法可以包括使靶核酸(例如编码VRS3蛋白的核酸)与融合到脱氨酶结构域(例如，腺嘌呤脱氨酶和/或胞嘧啶脱氨酶)和引导核酸的碱基编辑融合蛋白(例如，序列特异性DNA结合蛋白(例如，CRISPR-Cas效应蛋白或结构域))接触，其中所述引导核酸能够引导碱基编辑融合蛋白至靶核酸/使碱基编辑融合蛋白靶向靶核酸，从而编辑靶核酸内的位点。在一些实施方案中，碱基编辑融合蛋白和引导核酸可以包含在一个或多个表达盒中。在一些实施方案中，靶核酸可以与碱基编辑融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中，序列特异性DNA结合融合蛋白和引导物可以作为核糖核蛋白(RNP)提供。在一些实施方案中，细胞可以与多于一个碱基编辑融合蛋白和/或一个或多个引导核酸接触，所述引导核酸可以靶向细胞中的一个或多个靶核酸。

在一些实施方案中，修饰或编辑组蛋白去甲基化酶基因(VRS3基因)的方法可以包括使靶核酸(例如编码VRS3蛋白的核酸)与融合至肽标签的序列特异性DNA结合融合蛋白(例如，序列特异性DNA结合蛋白(例如，CRISPR-Cas效应蛋白或结构域))、包含融合至能够结合肽标签的亲和多肽的脱氨酶结构域(例如，腺嘌呤脱氨酶和/或胞嘧啶脱氨酶)的脱氨酶融合蛋白、以及引导核酸接触，其中所述引导核酸能够将序列特异性DNA结合融合蛋白引导/靶向至靶核酸，并且所述序列特异性DNA结合融合蛋白能够通过肽标签-亲和多肽相互作用将脱氨酶融合蛋白募集至靶核酸，从而编辑靶核酸内的基因座。在一些实施方案中，序列特异性DNA结合融合蛋白可以与结合肽标签的亲和多肽融合，并且脱氨酶可以与肽标签融合，从而将脱氨酶募集到序列特异性DNA结合融合蛋白和靶核酸上。在一些实施方案中，序列特异性结合融合蛋白、脱氨酶融合蛋白和引导核酸可以包含在一个或多个表达盒中。在一些实施方案中，靶核酸可以与序列特异性结合融合蛋白、脱氨酶融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中，序列特异性DNA结合融合蛋白、脱氨酶融合蛋白和引导物可以作为核糖核蛋白(RNP)提供。

在一些实施方案中，诸如先导编辑的方法可用于在内源性组蛋白去甲基化酶基因(VRS3基因)中产生突变。在先导编辑中，RNA依赖性DNA聚合酶(逆转录酶，RT)和逆转录酶模板(RT模板)与序列特异性核酸结合结构域组合使用，这些结构域赋予以序列特异性方式识别和结合靶标的能力，并且还可以导致靶标内含PAM的链出现缺口。核酸结合结构域可以是CRISPR-Cas效应蛋白，在这种情况下，CRISPR阵列或引导RNA可以是延伸的引导物，其包括包含引物结合位点(PSB)和要掺入基因组的编辑(模板)的延伸部分。与碱基编辑类似，先导编辑可以利用各种募集蛋白质的方法用于对靶位点进行编辑，这些方法包括在选定的基因组编辑过程中使用的蛋白质和核酸之间的非共价和共价相互作用两者。

如本文所用，“CRISPR-Cas效应蛋白”是裂解或切割核酸、结合核酸(例如，靶核酸和/或引导核酸)和/或鉴定、识别或结合如本文定义的引导核酸的蛋白质或多肽或其结构域。在一些实施方案中，CRISPR-Cas效应蛋白可以是酶(例如，核酸酶、核酸内切酶、切口酶等)或其部分和/或可以作为酶起作用。在一些实施方案中，CRISPR-Cas效应蛋白是指CRISPR-Cas核酸酶多肽或其结构域，其包含核酸酶活性或其中核酸酶活性已降低或消除，和/或包含切口酶活性或其中切口酶已降低或消除，和/或包含单链DNA裂解活性(ss DNAse活性)或其中ss DNAse活性已降低或消除，和/或包含自加工RNAse活性或其中自加工RNAse活性已降低或消除。CRISPR-Cas效应蛋白可以与靶核酸结合。

在一些实施方案中，序列特异性核酸结合结构域可以是CRISPR-Cas效应蛋白。在一些实施方案中，CRISPR-Cas效应蛋白可以来自I型CRISPR-Cas系统、II型CRISPR-Cas系统、III型CRISPR-Cas系统、IV型CRISPR-Cas系统、V型CRISPR-Cas系统或VI型CRISPR-Cas系统。在一些实施方案中，本发明的CRISPR-Cas效应蛋白可以来自II型CRISPR-Cas系统或V型CRISPR-Cas系统。在一些实施方案中，CRISPR-Cas效应蛋白可以是II型CRISPR-Cas效应蛋白，例如，Cas9效应蛋白。在一些实施方案中，CRISPR-Cas效应蛋白可以是V型CRISPR-Cas效应蛋白，例如Cas12效应蛋白。

在一些实施方案中，CRISPR-Cas效应蛋白可以包括但不限于，Cas9、C2c1、C2c3、Cas12a(也称为Cpf1)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3'、Cas3”、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)，和/或Csf5核酸酶，任选地其中CRISPR-Cas效应蛋白可以是Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b和/或Cas14c效应蛋白。

在一些实施方案中，可用于本发明的CRISPR-Cas效应蛋白可以包含在其核酸酶活性位点(例如，RuvC、HNH，例如，Cas12a核酸酶结构域的RuvC位点；例如，Cas9核酸酶结构域的RuvC位点和/或HNH位点)中的突变。CRISPR-Cas效应蛋白在其核酸酶活性位点发生突变，因此不再包含核酸酶活性，通常称为“死”，例如，dCas。在一些实施方案中，与没有突变的相同CRISPR-Cas效应蛋白(例如，切口酶，例如，Cas9切口酶，Cas12a切口酶)相比，在其核酸酶活性位点中具有突变的CRISPR-Cas效应蛋白结构域或多肽可以具有受损的活性或降低的活性。

可用于本发明的CRISPR Cas9效应蛋白或CRISPR Cas9效应结构域可以是任何已知或后来鉴定的Cas9核酸酶。在一些实施方案中，CRISPR Cas9多肽可以是来自例如链球菌属(例如，酿脓链球菌、嗜热链球菌)、乳杆菌属(Lactobacillus spp.)、双歧杆菌属(Bifidobacterium spp.)、坎德尔菌属(Kandleria spp.)、明串珠菌属(Leuconostocspp.)、酒球菌属(Oenococcus spp.)、片球菌属(Pediococcus spp.)、魏斯氏菌属(Weissella spp.)和/或欧鲁森氏菌属(Olsenella spp.)的Cas9多肽。示例性Cas9序列包括但不限于，SEQ ID NO:56和SEQ ID NO:57的氨基酸序列或SEQ ID NO:58-68的核苷酸序列。

在一些实施方案中，CRISPR-Cas效应蛋白可以是源自酿脓链球菌的Cas9多肽，并识别PAM序列基序NGG、NAG、NGA(Mali等人，Science2013；339(6121):823-826)。在一些实施方案中，CRISPR-Cas效应蛋白可以是源自嗜热链球菌的Cas9多肽，并识别PAM序列基序NGGNG和/或NNAGAAW(W＝A或T)(参见，例如，Horvath等人，Science，2010；327(5962):167-170，和Deveau等人，J Bacteriol 2008；190(4):1390-1400)。在一些实施方案中，CRISPR-Cas效应蛋白可以是源自变形链球菌的Cas9多肽，并识别PAM序列基序NGG和/或NAAR(R＝A或G)(参见，例如，Deveau等人，J BACTERIOL 2008；190(4):1390-1400)。在一些实施方案中，CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌的Cas9多肽，并识别PAM序列基序NNGRR(R＝A或G)。在一些实施方案中，CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌的Cas9蛋白，其识别PAM序列基序N GRRT(R＝A或G)。在一些实施方案中，CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌的Cas9多肽，其识别PAM序列基序N GRRV(R＝A或G)。在一些实施方案中，CRISPR-Cas效应蛋白可以是源自脑膜炎奈瑟氏菌的Cas9多肽，并识别PAM序列基序N GATT或N GCTT(R＝A或G，V＝A、G或C)(参见，例如，Hou等人，PNAS2013，1-6)。在上述实施方案中，N可以是任何核苷酸残基，例如，A、G、C或T中的任一种。在一些实施方案中，CRISPR-Cas效应蛋白可以是来源于沙氏纤毛菌(Leptotrichia shahii)的Cas13a蛋白，其识别单个3'A、U或C的原间隔子侧翼序列(PFS)(或RNA PAM(rPAM))序列基序，其可以位于靶核酸内。

在一些实施方案中，CRISPR-Cas效应蛋白可衍生自Cas12a，其为V型成簇规则间隔短回文重复序列(CRISPR)-Cas核酸酶(参见，例如SEQ ID NO:1-17的氨基酸序列，SEQ IDNO:18-20的核酸序列)。Cas12a在几个方面与更知名的II型CRISPR Cas9核酸酶不同。例如，Cas9识别富含G的原间隔子邻接基序(PAM)，该基序在其引导RNA(gRNA、sgRNA、crRNA、crDNA、CRISPR阵列)结合位点(原间隔子、靶核酸、靶DNA)的3'(3'-NGG)，而Cas12a识别富含T的PAM，其位于靶核酸的5'(5'-TTN，5'-TTTN)。事实上，Cas9和Cas12a结合其引导RNA的方向相对于它们的N和C末端几乎是相反的。此外，Cas12a酶使用单一引导RNA(gRNA、CRISPR阵列、crRNA)而不是天然Cas9系统中发现的双引导RNA(sgRNA(例如，crRNA和tracrRNA))，并且Cas12a处理其自身的gRNA。此外，Cas12a核酸酶活性产生交错的DNA双链断裂，而不是Cas9核酸酶活性产生的平端，Cas12a依靠单个RuvC结构域切割两条DNA链，而Cas9利用HNH结构域和RuvC结构域进行切割。

可用于本发明的CRISPR Cas12a效应蛋白/结构域可以是任何已知的或后来鉴定的Cas12a多肽(以前称为Cpf1)(参见，例如，美国专利号9,790,490，其公开的Cpf1(Cas12a)序列通过引用并入)。术语“Cas12a”、“Cas12a多肽”或“Cas12a结构域”是指包含Cas12a多肽或其片段的RNA引导的核酸酶，其包含Cas12a的引导核酸结合结构域和/或Cas12a的活性、无活性或部分活性DNA切割结构域。在一些实施方案中，可用于本发明的Cas12a可以包含核酸酶活性位点(例如，Cas12a结构域的RuvC位点)中的突变。Cas12a结构域或Cas12a多肽在其核酸酶活性位点具有突变，因此不再包含核酸酶活性，通常称为deadCas12a(例如，dCas12a)。在一些实施方案中，在其核酸酶活性位点具有突变的Cas12a结构域或Cas12a多肽可以具有受损的活性，例如，可以具有切口酶活性。

任何可用于碱基编辑的脱氨酶结构域/多肽都可以用于本发明。在一些实施方案中，脱氨酶结构域可以是胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域。可用于本发明的胞嘧啶脱氨酶(或胞苷脱氨酶)可以是来自任何生物体的任何已知或后来鉴定的胞嘧啶脱氨酶(参见，例如，美国专利号10,167,457和Thuronyi等人Nat.Biotechnol.37:1070–1079(2019)，其中每一篇文献关于胞嘧啶脱氨酶的公开内容通过引用并入本文)。胞嘧啶脱氨酶可分别催化胞苷或脱氧胞苷水解脱氨为尿苷或脱氧尿苷。因此，在一些实施方案中，可用于本发明的脱氨酶或脱氨酶结构域可以是胞苷脱氨酶结构域，催化胞嘧啶水解脱氨为尿嘧啶。在一些实施方案中，胞嘧啶脱氨酶可以是天然存在的胞嘧啶脱氨酶的变体，包括但不限于，灵长类动物(例如，人、猴、黑猩猩、大猩猩)、狗、牛、大鼠或小鼠。因此，在一些实施方案中，可用于本发明的胞嘧啶脱氨酶可以与野生型胞嘧啶脱氨酶约70％至约100％相同(例如，与天然存在的胞嘧啶脱氨酶约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同，以及其中的任何范围或值)。

在一些实施方案中，可用于本发明的胞嘧啶脱氨酶可以是载脂蛋白B mRNA-编辑复合物(APOBEC)家族脱氨酶。在一些实施方案中，胞嘧啶脱氨酶可以是APOBEC1脱氨酶、APOBEC2脱氨酶、APOBEC3A脱氨酶、APOBEC3B脱氨酶、APOBEC3C脱氨酶、APOBEC3D脱氨酶、APOBEC3F脱氨酶、APOBEC3G脱氨酶、APOBEC3H脱氨酶、APOBEC4脱氨酶、人激活诱导脱氨酶(hAID)、rAPOBEC1、FERNY和/或CDA1，任选地pmCDA1、atCDA1(例如，At2g19570)及其进化形式(例如，SEQ ID NO:27、SEQ ID NO:28或SEQ ID NO:29)。在一些实施方案中，胞嘧啶脱氨酶可以是具有SEQ ID NO:23的氨基酸序列的APOBEC1脱氨酶。在一些实施方案中，胞嘧啶脱氨酶可以是具有SEQ ID NO:24的氨基酸序列的APOBEC3A脱氨酶。在一些实施方案中，胞嘧啶脱氨酶可以是CDA1脱氨酶，任选地是具有SEQ ID NO:25的氨基酸序列的CDA1。在一些实施方案中，胞嘧啶脱氨酶可以是FERNY脱氨酶，任选地是具有SEQ ID NO:26的氨基酸序列的FERNY。在一些实施方案中，可用于本发明的胞嘧啶脱氨酶可以与天然存在的胞嘧啶脱氨酶(例如，进化的脱氨酶)的氨基酸序列约70％至约100％相同(例如，70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％或100％相同)。在一些实施方案中，可用于本发明的胞嘧啶脱氨酶可以与SEQ ID NO:23、SEQ ID NO:24、SEQID NO:25或SEQ ID NO:26的氨基酸序列约70％至约99.5％相同(例如，约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或99.5％相同)(例如，与SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28或SEQ ID NO:29的氨基酸序列至少80％、至少85％、至少90％、至少92％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.5％相同)。在一些实施方案中，编码胞嘧啶脱氨酶的多核苷酸可以进行密码子优化以在植物中表达，并且密码子优化的多肽可以与参考多核苷酸约70％至99.5％相同。

在一些实施方案中，本发明的核酸构建体可以进一步编码尿嘧啶糖基化酶抑制剂(UGI)(例如，尿嘧啶-DNA糖基化酶抑制剂)多肽/结构域。因此，在一些实施方案中，编码CRISPR-Cas效应蛋白和胞嘧啶脱氨酶结构域的核酸构建体(例如，编码融合蛋白，所述融合蛋白包含融合到胞嘧啶脱氨酶结构域的CRISPR-Cas效应蛋白结构域，和/或融合到肽标签或融合到能够结合肽标签的亲和多肽的CRISPR-Cas效应蛋白结构域和/或融合到肽标签或融合到能够结合肽标签的亲和多肽的脱氨酶蛋白结构域)可以进一步编码尿嘧啶-DNA糖基化酶抑制剂(UGI)，任选地其中UGI可以进行密码子优化以在植物中表达。在一些实施方案中，本发明提供融合蛋白，其包含CRISPR-Cas效应多肽、脱氨酶结构域和UGI和/或编码它们的一个或多个多核苷酸，任选地其中一个或多个多核苷酸可以进行密码子优化以在植物中表达。在一些实施方案中，本发明提供融合蛋白，其中CRISPR-Cas效应多肽、脱氨酶结构域和UGI可以融合到如本文所述的肽标签和亲和多肽的任意组合，从而将脱氨酶结构域和UGI募集到CRISPR-Cas效应多肽和靶核酸。在一些实施方案中，引导核酸可以与募集RNA基序连接，并且脱氨酶结构域和/或UGI中的一个或多个可以融合到能够与募集RNA基序相互作用的亲和多肽，从而将脱氨酶结构域和UGI募集到靶核酸。

可用于本发明的“尿嘧啶糖基化酶抑制剂”可以是能够抑制尿嘧啶-DNA糖基化酶碱基切除修复酶的任何蛋白质。在一些实施方案中，UGI结构域包括野生型UGI或其片段。在一些实施方案中，可用于本发明的UGI结构域可以与天然存在的UGI结构域的氨基酸序列约70％至约100％相同(例如，70％、71％、72％、73％、75％、76％、77％、79％、80％、81％、82％、83％、84％、85％、86％、87％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％或100％相同，以及其中的任何范围或值)。在一些实施方案中，UGI结构域可以包含SEQ ID NO:41的氨基酸序列或与SEQ ID NO:41的氨基酸序列具有约70％至约99.5％序列同一性的多肽(例如，与SEQ ID NO:41的氨基酸序列至少80％、至少85％、至少90％、至少92％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.5％相同)。例如，在一些实施方案中，UGI结构域可以包含SEQ ID NO:41的氨基酸序列片段，该片段与SEQ ID NO:41的氨基酸序列的一部分连续核苷酸(例如，10、15、20、25、30、35、40、45、50、55、60、65、70、75、80个连续核苷酸；例如，约10、15、20、25、30、35、40、45至约50、55、60、65、70、75、80个连续核苷酸)100％相同。在一些实施方案中，UGI结构域可以是已知UGI(例如，SEQ ID NO:41)的变体，与已知UGI具有约70％至约99.5％的序列同一性(例如，70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％的序列同一性，以及其中的任何范围或值)。在一些实施方案中，编码UGI的多核苷酸可以进行密码子优化以在植物(例如，植物)中表达，并且密码子优化的多肽可以与参考多核苷酸约70％至约99.5％相同。

可用于本发明的腺嘌呤脱氨酶(或腺苷脱氨酶)可以是任何已知或后来鉴定的来自任何生物体的腺嘌呤脱氨酶(参见，例如，美国专利号10,113,163，其关于腺嘌呤脱氨酶的公开内容通过引用并入本文)。腺嘌呤脱氨酶可以催化腺嘌呤或腺苷的水解脱氨反应。在一些实施方案中，腺嘌呤脱氨酶可分别催化腺苷或脱氧腺苷的水解脱氨为肌苷或脱氧肌苷。在一些实施方案中，腺苷脱氨酶可以催化DNA中腺嘌呤或腺苷的水解脱氨反应。在一些实施方案中，由本发明的核酸构建体编码的腺嘌呤脱氨酶可以产生靶核酸的有义(例如，“+”；模板)链中的A→G转换或靶核酸的反义(例如，“-”，互补)链中的T→C转换。

在一些实施方案中，腺苷脱氨酶可以是天然存在的腺嘌呤脱氨酶的变体。因此，在一些实施方案中，腺苷脱氨酶可以与野生型腺嘌呤脱氨酶约70％至100％相同(例如，与天然存在的腺嘌呤脱氨酶约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同，以及其中的任何范围或值)。在一些实施方案中，腺嘌呤脱氨酶或腺苷脱氨酶在自然界中不存在，可称为工程化、突变或进化的腺苷脱氨酶。因此，例如，工程化、突变或进化的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域可以与天然存在的腺嘌呤脱氨酶多肽/结构域约70％至99.9％相同(例如，与天然存在的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.1％、99.2％、99.3％、99.4％、99.5％、99.6％、99.7％、99.8％或99.9％相同，以及其中的任何范围或值)。在一些实施方案中，腺苷脱氨酶可以来自细菌，(例如，大肠杆菌、金黄色葡萄球菌(Staphylococcus aureus)、流感嗜血杆菌(Haemophilusinfluenzae)、新月柄杆菌(Caulobacter crescentus)等)。在一些实施方案中，编码腺嘌呤脱氨酶多肽/结构域的多核苷酸可以进行密码子优化以在植物中表达。

在一些实施方案中，腺嘌呤脱氨酶结构域可以是野生型tRNA特异性腺苷脱氨酶结构域，例如，tRNA-特异性腺苷脱氨酶(TadA)和/或突变/进化的腺苷脱氨酶结构域，例如，突变/进化的tRNA-特异性腺苷脱氨酶结构域(TadA*)。在一些实施方案中，TadA结构域可以来自大肠杆菌。在一些实施方案中，TadA可以被修饰，例如，截短，相对于全长TadA丢失一个或多个N-末端和/或C末端氨基酸(例如，可以相对于全长TadA缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个N-末端和/或C末端氨基酸残基)。在一些实施方案中，TadA多肽或TadA结构域不包含N-末端蛋氨酸。在一些实施方案中，野生型大肠杆菌TadA包含SEQ ID NO:30的氨基酸序列。在一些实施方案中，突变/进化的大肠杆菌TadA*包含SEQID NO:31-40的氨基酸序列(例如，SEQ ID NO:31、32、33、34、35、36、37、38、39或40)。在一些实施方案中，编码TadA/TadA*的多核苷酸可以进行密码子优化以在植物中表达。

胞嘧啶脱氨酶催化胞嘧啶脱氨并产生胸苷(通过尿嘧啶中间体)，导致基因组中的互补链中C到T转换或G到A转换。因此，在一些实施方案中，由本发明的多核苷酸编码的胞嘧啶脱氨酶产生靶核酸的有义(例如，“+”；模板)链中的C→T转换或靶核酸的反义(例如，“-”，互补)链中的G→A转换。

在一些实施方案中，由本发明的核酸构建体编码的腺嘌呤脱氨酶产生靶核酸的有义(例如，“+”；模板)链中的A→G转换或靶核酸的反义(例如，“-”，互补)链中的T→C转换。

编码包含序列特异性核酸结合蛋白和胞嘧啶脱氨酶多肽的碱基编辑器的本发明的核酸构建体，以及编码它们的核酸构建体/表达盒/载体，可以与引导核酸组合用于修饰靶核酸，包括但不限于，在靶核酸(包括，但不限于质粒序列)中产生C→T或G→A突变；在编码序列中产生C→T或G→A突变以改变氨基酸身份；在编码序列中产生C→T或G→A突变以产生终止密码子；在编码序列中产生C→T或G→A突变以破坏起始密码子；在基因组DNA中产生点突变以破坏功能；和/或在基因组DNA中产生点突变以破坏剪接连接。

编码包含序列特异性核酸结合蛋白和腺嘌呤脱氨酶多肽的碱基编辑器的本发明的核酸构建体，以及编码它们的表达盒和/或载体，可以与引导核酸组合用于修饰靶核酸，包括但不限于，在靶核酸(包括，但不限于质粒序列)中产生A→G或T→C突变；在编码序列中产生A→G或T→C突变以改变氨基酸身份；在编码序列中产生A→G或T→C突变以产生终止密码子；在编码序列中产生A→G或T→C突变以破坏起始密码子；在基因组DNA中产生点突变以破坏功能；和/或在基因组DNA中产生点突变以破坏剪接连接。

包含CRISPR-Cas效应蛋白或其融合蛋白的本发明的核酸构建体可以与引导RNA(gRNA，CRISPR阵列，CRISPR RNA，crRNA)组合使用，引导RNA设计用于与编码的CRISPR-Cas效应蛋白或结构域一起发挥作用，以修饰靶核酸。可用于本发明的引导核酸包含至少一个间隔序列和至少一个重复序列。引导核酸能够与CRISPR-Cas核酸酶结构域形成复合物，CRISPR-Cas核酸酶结构域由本发明的核酸构建体编码和表达，并且间隔序列能够与靶核酸杂交，从而引导复合物(例如，CRISPR-Cas效应融合蛋白(例如，融合到脱氨酶结构域的CRISPR-Cas效应结构域和/或融合到肽标签或亲和多肽的CRISPR-Cas效应结构域以募集脱氨酶结构域和任选地，UGI)到靶核酸，其中靶核酸可以被脱氨酶结构域修饰(例如，裂解或编辑)或调节(例如，调节转录)。

作为实例，编码与胞嘧啶脱氨酶结构域(例如，融合蛋白)相连的Cas9结构域的核酸构建体可以与Cas9引导核酸组合使用来修饰靶核酸，其中融合蛋白的胞嘧啶脱氨酶结构域使靶核酸中的胞嘧啶碱基脱氨，从而编辑靶核酸。在另一个实例中，编码与腺嘌呤脱氨酶结构域(例如，融合蛋白)相连的Cas9结构域的核酸构建体可以与Cas9引导核酸组合使用以修饰靶核酸，其中融合蛋白的腺嘌呤脱氨酶结构域使靶核酸中的腺苷碱基脱氨，从而编辑靶核酸。

同样，编码与胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域(例如，融合蛋白)相连的Cas12a结构域(或其它选定的CRISPR-Cas核酸酶，例如，C2c1，C2c3，Cas12b，Cas12c，Cas12d，Cas12e，Cas13a，Cas13b，Cas13c，Cas13d，Casl，CaslB，Cas2，Cas3，Cas3'，Cas3"，Cas4，Cas5，Cas6，Cas7，Cas8，Cas9(也称为Csnl和Csx12)，Cas10，Csyl，Csy2，Csy3，Csel，Cse2，Cscl，Csc2，Csa5，Csn2，Csm2，Csm3，Csm4，Csm5，Csm6，Cmrl，Cmr3，Cmr4，Cmr5，Cmr6，Csbl，Csb2，Csb3，Csxl7，Csxl4，Csx10，Csx16，CsaX，Csx3，Csxl，Csxl5，Csfl，Csf2，Csf3，Csf4(dinG)和/或Csf5)的核酸构建体可以与Cas12a引导核酸(或其它选定的CRISPR-Cas核酸酶的引导核酸)组合使用来修饰靶核酸，其中融合蛋白的胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域将靶核酸中的胞嘧啶碱基脱氨，从而编辑靶核酸。

本文所用的“引导核酸”、“引导RNA”、“gRNA”、CRISPR RNA/DNA”、“crRNA”或“crDNA”是指包含至少一个间隔序列和至少一个重复序列的核酸，所述间隔序列与靶DNA(例如，原间隔子)互补(并杂交)，(所述至少一个重复序列例如：V型Cas12a CRISPR-Cas系统的重复序列，或其片段或部分；II型Cas9 CRISPR-Cas系统的重复序列，或其片段；V型C2c1 CRISPR Cas系统的重复序列，或其片段；CRISPR-Cas系统的重复序列或其片段，所述CRISPR-Cas系统例如，C2c3，Cas12a(也称为Cpf1)，Cas12b，Cas12c，Cas12d，Cas12e，Cas13a，Cas13b，Cas13c，Cas13d，Casl，CaslB，Cas2，Cas3，Cas3'，Cas3"，Cas4，Cas5，Cas6，Cas7，Cas8，Cas9(也称为Csnl和Csx12)，Cas10，Csyl，Csy2，Csy3，Csel，Cse2，Cscl，Csc2，Csa5，Csn2，Csm2，Csm3，Csm4，Csm5，Csm6，Cmrl，Cmr3，Cmr4，Cmr5，Cmr6，Csbl，Csb2，Csb3，Csxl7，Csxl4，Csx10，Csx16，CsaX，Csx3，Csxl，Csxl5，Csfl，Csf2，Csf3，Csf4(dinG)和/或Csf5)，其中重复序列可以连接到间隔序列的5'端和/或3'端。本发明的gRNA的设计可以基于I型、II型、III型、IV型、V型或VI型CRISPR-Cas系统。

在一些实施方案中，Cas12a gRNA可以在5'至3'包含重复序列(全长或其部分(“手柄”)；例如，假结样结构)和间隔序列。

在一些实施方案中，引导核酸可以包含多于一个重复序列-间隔序列(例如，2、3、4、5、6、7、8、9、10个或更多个重复序列-间隔序列)(例如，重复序列-间隔序列-重复序列，例如，重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列等)。本发明的引导核酸是合成的、人造的，在自然界中没有发现。gRNA可以很长，可以用作适配体(如MS2募集策略)或是悬挂间隔序列的其它RNA结构。

如本文所用，“重复序列”是指，例如，野生型CRISPR Cas基因座(例如，Cas9基因座、Cas12a基因座、C2c1基因座等)的任何重复序列，或与由本发明的核酸构建体编码的CRISPR-Cas效应蛋白一起发挥作用的合成crRNA的重复序列。可用于本发明的重复序列可以是CRISPR-Cas基因座(例如，I型、II型、III型、IV型、V型或VI型)的任何已知或后来鉴定的重复序列，或可以是设计用于在I、II、III、IV、V或VI型CRISPR-Cas系统中起作用的合成重复序列。重复序列可以包含发夹结构和/或茎环结构。在一些实施方案中，重复序列可以在其5'端形成假结样结构(即“手柄”)。因此，在一些实施方案中，重复序列可以与来自野生型I型CRISPR-Cas基因座、II型CRISPR-Cas基因座、III型CRISPR-Cas基因座、IV型CRISPR-Cas基因座、V型CRISPR-Cas基因座和/或VI型CRISPR-Cas基因座的重复序列相同或基本相同。来自野生型CRISPR-Cas基因座的重复序列可以通过已建立的算法来确定，诸如使用CRISPRdb提供的CRISPRfinder(参见，Grissa等人Nucleic Acids Res.35(Web Serverissue):W52-7)。在一些实施方案中，重复序列或其部分在其3'端与间隔序列的5'端相连，从而形成重复序列-间隔序列(例如，引导核酸、引导RNA/DNA、crRNA、crDNA)。

在一些实施方案中，重复序列包括至少10个核苷酸，基本上由或由至少10个核苷酸组成，这取决于特定的重复序列以及包含该重复序列的引导核酸是经过处理还是未处理(例如，约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50至100个或更多个核苷酸，或其中的任何范围或值)。在一些实施方案中，重复序列包含约10至约20、约10至约30、约10至约45、约10至约50、约15至约30、约15至约40、约15至约45、约15至约50、约20至约30、约20至约40、约20至约50、约30至约40、约40至约80、约50至约100个或更多个核苷酸，基本上由或由约10至约20、约10至约30、约10至约45、约10至约50、约15至约30、约15至约40、约15至约45、约15至约50、约20至约30、约20至约40、约20至约50、约30至约40、约40至约80、约50至约100个或更多个核苷酸组成。

连接到间隔序列的5'端的重复序列可以包含重复序列的一部分(例如，野生型重复序列的5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35或更多个连续核苷酸)。在一些实施方案中，连接到间隔序列的5'端的重复序列的一部分可以是约5至约10个连续核苷酸的长度(例如，约5、6、7、8、9、10个核苷酸)并且与野生型CRISPR Cas重复核苷酸序列的相同区域(例如，5'端)具有至少90％(例如，至少约90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多)的序列同一性。在一些实施方案中，重复序列的一部分可以在其5'端包含假结样结构(例如，“手柄”)。

本文使用的“间隔序列”是与靶核酸(例如靶DNA)(例如原间隔序列)(例如VRS3基因的连续核苷酸的部分)互补的核苷酸序列，其中所述VRS3基因：(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；或与SEQ ID NO:75-86中任一个或多个核苷酸序列具有至少80％的同一性的区域，和/或(b)编码与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的多肽序列，或包含与SEQ IDNO:87-92中任一个或多个氨基酸序列具有至少80％的序列同一性的区域的多肽。在一些实施方案中，间隔序列与VRS3基因的区域的至少15个连续核苷酸具有至少70％的互补性，所述区域与SEQ ID NO:75-86中任一个或多个核苷酸序列具有至少80％的同一性，或(b)编码与SEQ ID NO:87-92中任一个氨基酸序列具有至少80％的序列同一性的多肽序列。在一些实施方案中，间隔序列可以包括但不限于SEQ ID NO:93-103(即SEQ ID NO:93、94、95、96、97、98、99、100、101、102、103)中任一个的核苷酸序列。间隔序列可以与靶核酸完全互补或基本上互补(例如，至少约70％互补(例如，约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多)。因此，在一些实施方案中，与靶核酸相比，间隔序列可以有一个、两个、三个、四个或五个错配，这些错配可以是连续的或不连续的。在一些实施方案中，间隔序列可以与靶核酸有70％的互补性。在其它实施方案中，间隔子核苷酸序列可以与靶核酸具有80％的互补性。在其它实施方案中，间隔核苷酸序列可以与靶核酸(原间隔子)具有85％、90％、95％、96％、97％、98％、99％或99.5％的互补性，等等。在一些实施方案中，间隔序列与靶核酸100％互补。间隔序列的长度可以为约15个核苷酸到约30个核苷酸(例如，15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸，或其中的任何范围或值)。因此，在一些实施方案中，间隔序列可以在靶核酸(例如，原间隔子)长度至少为约15个核苷酸至约30个核苷酸的区域上具有完全互补性或基本互补性。在一些实施方案中，间隔子长度约为20个核苷酸。在一些实施方案中，间隔子的长度为约21、22或23个核苷酸。

在一些实施方案中，引导核酸的间隔序列的5'区可以与靶DNA相同，而间隔子的3'区可以与靶DNA基本上互补(例如，参见V型CRISPR-Cas系统的间隔序列)，或者引导核酸的间隔序列的3'区可以与靶DNA相同，而间隔子的5'区可以与靶DNA基本上互补(例如，参见II型CRISPR-Cas系统的间隔序列)，因此，间隔序列与靶DNA的整体互补性可以小于100％。因此，例如，在V型CRISPR-Cas系统的引导物中，例如，20个核苷酸间隔序列的5'区域(即种子区域)中的前1、2、3、4、5、6、7、8、9、10个核苷酸可以与靶DNA 100％互补，而间隔序列的3'区域中的剩余核苷酸与靶DNA基本上互补(例如，至少约70％互补)。在一些实施方案中，间隔序列的5'端的前1至8个核苷酸(例如，前1、2、3、4、5、6、7、8个核苷酸，以及其中的任何范围)可以与靶DNA100％互补，而间隔序列的3'区域中的剩余核苷酸与靶DNA基本上互补(例如，至少约50％互补(例如，50％、55％、60％、65％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多))。

作为另一个实例，在II型CRISPR-Cas系统的引导物中，例如，20个核苷酸间隔序列的3'区域(即种子区域)中的前1、2、3、4、5、6、7、8、9、10个核苷酸可以与靶DNA 100％互补，而间隔序列的5'区域中的剩余核苷酸与靶DNA基本上互补(例如，至少约70％互补)。在一些实施方案中，间隔序列的3'端的前1至10个核苷酸(例如，前1、2、3、4、5、6、7、8、9、10个核苷酸，以及其中的任何范围)可以与靶DNA 100％互补，而间隔序列的5'区域中的剩余核苷酸与靶DNA基本上互补(例如，至少约50％互补(例如，至少约50％、55％、60％、65％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多，或其中的任何范围或值))。

在一些实施方案中，间隔子的种子区域的长度可以为约8至约10个核苷酸，长度为约5至约6个核苷酸，或长度为约6个核苷酸。

如本文所用，“靶核酸”、“靶DNA”、“靶核苷酸序列”、“靶区”或“基因组中的靶区”是指植物基因组中与本发明的引导核酸中的间隔序列完全互补(100％互补)或基本上互补(例如，至少70％互补(例如，70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多))的区域。可用于CRISPR-Cas系统的靶区可以位于生物体基因组(例如，植物基因组)中PAM序列的紧邻3'(例如V型CRISPR-Cas系统)或紧邻5'(例如II型CRISPR-Cas系统)的位置。靶区可以选自紧邻PAM序列的至少15个连续核苷酸(例如，16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个核苷酸等)的任何区域。

“原间隔序列”是指靶双链DNA，特别是靶DNA中与CRISPR重复序列-间隔序列(例如，引导核酸、CRISPR阵列、crRNA)的间隔序列完全或基本上互补(和杂交)的部分(例如，或基因组中的靶区)。

在V型CRISPR-Cas(例如，Cas12a)系统和II型CRISPR-Cas(Cas9)系统的情况下，原间隔序列的两侧是(例如，紧邻)原间隔子邻接基序(PAM)。对于IV型CRISPR-Cas系统，PAM位于非靶链的5'端和靶链的3'端(见下文，作为实例)。

在II型CRISPR-Cas(例如，Cas9)系统的情况下，PAM紧邻靶区的3'。I型CRISPR-Cas系统的PAM位于靶链的5'。目前尚无针对III型CRISPR-Cas系统的已知PAM。Makarova等人描述了CRISPR系统的所有类别、类型和亚型的命名法(Nature Reviews Microbiology 13:722–736(2015))。R.Barrangou(Genome Biol.16:247(2015))描述了引导结构和PAM。

经典的Cas12a PAM富含T。在一些实施方案中，经典的Cas12a PAM序列可以是5'-TTN、5'-TTTN或5'-TTTV。在一些实施方案中，经典的Cas9(例如，酿脓链球菌)PAM可以是5'-NGG-3'。在一些实施方案中，可以使用非经典PAM，但效率可能较低。

其它PAM序列可由本领域技术人员通过已建立的实验和计算方法确定。因此，例如，实验方法包括靶向侧翼为所有可能的核苷酸序列的序列，并鉴别不进行靶向的序列成员，诸如通过对靶质粒DNA的转化(Esvelt等人2013.Nat.Methods 10:1116-1121；Jiang等人2013.Nat.Biotechnol.31:233-239)。在某些方面，计算方法可以包括对天然间隔子进行BLAST搜索，以鉴别噬菌体或质粒中的原始靶DNA序列，并对这些序列进行比对以确定与靶序列相邻的保守序列(Briner和Barrangou.2014.Appl.Environ.Microbiol.80:994-1001；Mojica等人2009.Microbiology 155:733-740)。

在一些实施方案中，本发明提供包含本发明的核酸构建体(例如，本发明编辑系统的一个或多个组分)的表达盒和/或载体。在一些实施方案中，可以提供包含本发明的核酸构建体和/或一种或多种引导核酸的表达盒和/或载体。在一些实施方案中，本发明的编码碱基编辑器的核酸构建体(例如，包含CRISPR-Cas效应蛋白和脱氨酶结构域(例如，融合蛋白)的构建体)或用于碱基编辑的组分(例如，融合到肽标签或亲和多肽的CRISPR-Cas效应蛋白，融合到肽标签或亲和多肽的脱氨酶结构域，和/或融合到肽标签或亲和多肽的UGI)可以包含在与包含一种或多种引导核酸的表达盒或载体相同的或分开的表达盒或载体上。当编码碱基编辑器的核酸构建体或用于碱基编辑的组分包含在与包含所述引导核酸的表达盒或载体分开的表达盒或载体上时，靶核酸可以与编码碱基编辑器的表达盒或载体或用于碱基编辑的组分以彼此的任何顺序以及引导核酸接触(例如，向所述靶核酸提供后者)，例如，在提供包含引导核酸的表达盒之前、同时或之后(例如，与靶核酸接触)。

本发明的融合蛋白可以包含序列特异性核酸结合结构域(例如，DNA结合结构域)、CRISPR-Cas多肽、和/或融合到肽标签或亲和多肽(亲和多肽与肽标签相互作用)的脱氨酶结构域，如本领域所知，用于将脱氨酶募集到靶核酸。募集方法还可以包括与RNA募集基序相连的引导核酸和与能够与RNA募集基序相互作用的亲和多肽融合的脱氨酶，从而将脱氨酶募集到靶核酸。备选地，化学相互作用可用于将多肽(例如，脱氨酶)募集到靶核酸。

可用于本发明的肽标签(例如表位)可以包括但不限于，GCN4肽标签(例如Sun-Tag)、c-Myc亲和标签、HA亲和标签、His亲和标签、S亲和标签、蛋氨酸-His亲和标签、RGD-His亲和标签、FLAG八肽、strep标签或strep标签II、V5标签、和/或VSV-g表位。在一些实施方案中，肽标签还可以包括SH2结构域识别的特定序列情况下的磷酸化酪氨酸、含有由14-3-3蛋白识别的磷酸丝氨酸的特征共有序列、由SH3结构域识别的富含脯氨酸的肽基序、PDZ蛋白相互作用结构域或PDZ信号序列、以及来自植物的AGO hook基序。肽标签在WO2018/136783和美国专利申请公开号2017/0219596中公开，其通过引用将其关于肽标签的公开内容并入本文。可以与多肽连接并且具有可以与另一多肽连接的相应亲和多肽的任何表位可以与本发明一起用作肽标签。肽标签可以包含或存在于肽标签(例如，多聚肽标签或多聚表位)(例如，约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、9、20、21、22、23、24或25或更多个肽标签)的一个拷贝或2个或更多个拷贝中。当多聚时，肽标签可以直接彼此融合，或者可以通过一个或多个氨基酸(例如，1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个氨基酸，任选约3至约10、约4至约10、约5至约10、约5至约15或约5至约20个氨基酸等，以及其中的任何值或范围)彼此连接。在一些实施方案中，与肽标签相互作用/结合的亲和多肽可以是抗体。在一些实施方案中，所述抗体可以是scFv抗体。在一些实施方案中，与肽标签结合的亲和多肽可以是合成的(例如，进化为亲和相互作用)，包括但不限于，亲和体、抗运载蛋白、monobody和/或DARPin(参见，例如，Sha等人，Protein Sci.26(5):910-924(2017))；Gilbreth(Curr Opin Struc Biol 22(4):413-420(2013))，美国专利号9,982,053，每一项关于与亲和体、抗运载蛋白、monobodies和/或DARPin相关的教导通过引用全部并入)。肽标签序列及其亲和多肽实例包括但不限于SEQ ID NO:42-44的氨基酸序列。

在一些实施方案中，引导核酸可以与RNA募集基序连接，并且要募集的多肽(例如，脱氨酶)可以融合到与RNA募集基序结合的亲和多肽，其中引导与靶核酸结合，RNA募集基序与亲和多肽结合，从而将多肽募集到引导物并使靶核酸与多肽(例如，脱氨酶)接触。在一些实施方案中，可以将两个或更多个多肽募集到引导核酸，从而使两个或更多个多肽(例如，脱氨酶)接触靶核酸。RNA募集基序及其亲和多肽的实例包括但不限于SEQ ID NO:45-55的序列。

在一些实施方案中，与亲和多肽融合的多肽可以是逆转录酶，而引导核酸可以是与RNA募集基序相连的延伸的引导核酸。在一些实施方案中，RNA募集基序可以位于延伸的引导核酸的延伸部分的3'端(例如，5'-3'，重复序列-间隔序列-延伸部分(RT模板-引物结合位点)-RNA募集基序)。在一些实施方案中，RNA募集基序可以嵌入到延伸部分中。

在本发明的一些实施方案中，延伸的引导RNA和/或引导RNA可以连接到一个或连接到两个或更多个RNA募集基序(例如，1、2、3、4、5、6、7、8、9、10个或更多个基序；例如，至少10至约25个基序)，任选地，其中两个或更多个RNA募集基序可以是相同的RNA募集基序或不同的RNA募集基序。在一些实施方案中，RNA募集基序和相应的亲和多肽可以包括但不限于，端粒酶Ku结合基序(例如，Ku结合发夹)和相应的亲和多肽Ku(例如，Ku异二聚体)，端粒酶Sm7结合基序和相应的亲和多肽Sm7，MS2噬菌体操纵子茎环和相应的亲和多肽MS2外壳蛋白(MCP)，PP7噬菌体操纵子茎环和相应的亲和多肽PP7外壳蛋白(PCP)，SfMu噬菌体Com茎环和相应的亲和多肽Com RNA结合蛋白，PUF结合位点(PBS)和亲和多肽Pumilio/fem-3mRNA结合因子(PUF)，和/或合成RNA适配体和作为相应的亲和多肽的适配体配体。在一些实施方案中，RNA募集基序和相应的亲和多肽可以是MS2噬菌体操纵子茎环和亲和多肽MS2外壳蛋白(MCP)。在一些实施方案中，RNA募集基序和相应的亲和多肽可以是PUF结合位点(PBS)和亲和多肽Pumilio/fem-3mRNA结合因子(PUF)。

在一些实施方案中，用于募集多肽和核酸的组分可以是那些通过化学相互作用起作用的组分，其可以包括但不限于，雷帕霉素诱导的FRB–FKBP二聚化；生物素-链霉亲和素；SNAP标签；Halo标签；CLIP标签；化合物诱导的DmrA-DmrC异二聚体；双功能配体(例如，将两个结合蛋白质的化学物质融合在一起，例如，二氢叶酸还原酶(DHFR)。

在一些实施方案中，被优化以在植物中表达的本发明的核酸构建体、表达盒或载体与包含相同的多核苷酸但没有针对在植物中表达进行密码子优化的核酸构建体、表达盒或载体可以约70％至100％相同(例如，约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％或100％)。

本文还提供包含本发明的一种或多种多核苷酸、引导核酸、核酸构建体、表达盒或载体的细胞。

现在将参照以下实施例来描述本发明。应当理解，这些实施例并不旨在将权利要求的范围限制到本发明，而是旨在作为某些实施方案的示例。本领域技术人员想到的示例方法中的任何变化都将落入本发明的范围中。

实施例

实施例1.用于VRS3编辑的编辑构建体的设计

设计了一种策略，以在玉米VRS3基因Zm00001d014422(SEQ ID NO:72)和Zm00001d030108(SEQ ID NO:69)中产生改变的等位基因，以改变分生组织的大小和/或形态。为了产生一系列等位基因，设计了包含间隔子PWsp581(SEQ ID NO:93)、PWsp582(SEQID NO:94)、PWsp583(SEQ ID NO:95)和PWsp584(SEQ ID NO:96)的CRISPR-Cas引导核酸，所述CRISPR-Cas引导核酸与任一种或两种VRS3基因内的靶标具有互补性(或反向互补性)，并置于构建体中，并使用农杆菌将其引入干燥的切开的玉米胚中。通过抗生素选择在体外维持转化的组织以再生阳性转化体。选择健康的非嵌合植物(E0)并种植在生长托盘中。从再生的植物(E0代)中收集组织用于DNA提取，随后进行分子筛选以鉴定靶VRS3基因中的编辑。被鉴定为(1)健康的非嵌合、可育的、具有(2)低转基因拷贝和(3)在任一种或两种VRS3基因中包含编辑的植物被推进到下一代。

产生了一系列靶基因的编辑的等位基因，并在下面的表1中进一步描述。

表1.编辑的等位基因

实施例2.性状活动的表型评估

种子在平地上播种，然后在幼苗形成后转移到盆中。所有植物均在标准温室条件下培养并生长至生殖成熟。按照标准做法，在出现穗丝之前，用小纸袋覆盖新发的穗，在开花期间覆盖穗状雄花，以便逐个植物捕获花粉。在一些情况下，开花期和穗丝期不同步，并且没有对穗授粉。我们将这些称为“未授粉”的穗，并在干燥后从植物中取出所有穗后，分别对它们进行评估以确定籽粒行数(如下所述)。

将穗收获并干燥后，人工计数所有穗的籽粒行数。数据代表每穗的三行计数的平均值，所述三行计数取自最完整定义的行谱系的穗的中段。为了防止行重复计数，在开始计数前的行之间插入了一个标记(例如回形针)，以指示应该停止行计数的位置。

所有的穗都用佳能数码相机和EOS应用程序进行了照片记录。随后将图像导入ImageJ，并使用线条追踪功能测量所有穗。穗长是通过图像分析程序中的设置比例(以厘米为单位)确定的，以厘米为单位输出距离，然后沿着从穗尖端到穗底部的穗长用线条追踪穗。未编辑的种质以及用Gus质粒转化的品系用作表型分析的对照。表2和表3分别显示了来自自花授粉植物的E1家族和E2家族的籽粒行数(KRN)和穗长的测量值。

表2.E1

表3.E2

上述内容是对本发明的示例说明，而不应被解释为对本发明的限制。本发明由后附权利要求以及其中所包括的权利要求的等同物所定义。

Claims

1.一种植物或其部分，所述植物或其部分包含内源性组蛋白去甲基化酶基因中的至少一个突变，所述组蛋白去甲基化酶基因编码组蛋白去甲基化酶多肽，所述组蛋白去甲基化酶多肽包含锌指DNA结合结构域(ZnF结构域)、Jumonji C型(Jmj-C)结构域和Jumonji N型(Jmj-N)结构域，其中所述突变破坏组蛋白去甲基化酶多肽与DNA的结合和/或降低组蛋白去甲基化酶多肽的组蛋白去甲基化活性。

2.根据权利要求1所述的植物或其部分，其中所述内源性组蛋白去甲基化酶调节小花育性、种子数量和/或种子重量。

3.根据权利要求1和权利要求2所述的植物或其部分，其中所述内源性组蛋白去甲基化酶是SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶，任选地是Jumonji C型H3K9me2/me3去甲基化酶。

4.根据权利要求1-3所述的植物或其部分，其中所述植物是单子叶植物。

5.根据权利要求1-3所述的植物或其部分，其中所述植物是双子叶植物。

6.根据前述权利要求中任一项所述的植物或其部分，其中所述植物是玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、红薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、扁桃、核桃、草莓、西瓜、辣椒、葡萄、番茄、黄瓜、黑莓、覆盆子、黑覆盆子或芸苔属物种。

7.根据权利要求1-5所述的植物或其部分，其中所述植物是玉米。

8.根据权利要求5所述的植物或其部分，其中所述内源性组蛋白去甲基化酶基因位于1号染色体和/或5号染色体上。

9.根据前述权利要求中任一项所述的植物或其部分，其中所述内源性组蛋白去甲基化酶基因：

(a)编码与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的多肽；和/或

(b)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列。

10.根据前述权利要求中任一项所述的植物或其部分，其中所述组蛋白去甲基化酶基因包含：(1)JmjN结构域，所述JmjN结构域：(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80％的序列同一性的多肽，(2)JmjC结构域，所述JmjC结构域：(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80％的序列同一性的多肽，和/或(3)ZnF结构域，所述ZnF结构域：(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80％的序列同一性的多肽。

11.根据前述权利要求中任一项所述的植物或其部分，其中所述至少一个突变是碱基置换、碱基缺失和/或碱基插入。

12.根据前述权利要求中任一项所述的植物或其部分，其中所述至少一个突变包含对A、T、G或C的碱基置换。

13.根据前述权利要求中任一项所述的植物或其部分，其中所述至少突变是至少一个碱基对的置换。

14.根据权利要求1至12中任一项所述的植物或其部分，其中编码组蛋白去甲基化酶的内源性基因中的所述至少一个突变包含碱基缺失。

15.根据权利要求11或权利要求14所述的植物或其部分，其中所述碱基缺失是框内缺失或框外缺失。

16.根据权利要求11或权利要求14所述的植物或其部分，其中所述碱基缺失包括从组蛋白去甲基化酶基因的ZnF结构域中缺失至少一个碱基对(例如，参考SEQ ID NO:69的核苷酸位置编号，从位置3927到位置4165缺失至少一个核苷酸，参考SEQ ID NO:70的核苷酸位置编号，从位置1495到位置1654缺失至少一个核苷酸，参考SEQ ID NO:72的核苷酸位置编号，从位置3987到位置4233缺失至少一个核苷酸，和/或参考SEQ ID NO:73的核苷酸位置编号，从位置1498到位置1656缺失至少一个核苷酸)。

17.根据权利要求11或权利要求14所述的植物或其部分，其中所述碱基缺失包括从组蛋白去甲基化酶基因的JmjC结构域中缺失至少一个碱基对(例如，参考SEQ ID NO:69的核苷酸位置编号，从位置3100到位置3631缺失至少一个核苷酸，参考SEQ ID NO:70的核苷酸位置编号，从位置832到位置1199缺失至少一个核苷酸，参考SEQ ID NO:72的核苷酸位置编号，从位置3162到位置3692缺失至少一个核苷酸，和/或参考SEQ ID NO:73的核苷酸位置编号，从位置835到位置1203缺失至少一个核苷酸)。

18.根据权利要求11或权利要求14所述的植物或其部分，其中所述碱基缺失包括从组蛋白去甲基化酶基因的JmjN结构域中缺失至少一个碱基对(例如，参考SEQ ID NO:69的核苷酸位置编号，从位置2216到位置2424缺失至少一个核苷酸，参考SEQ ID NO:70的核苷酸位置编号，从位置301到位置402缺失至少一个核苷酸，参考SEQ ID NO:72的核苷酸位置编号，从位置2268到位置2477缺失至少一个核苷酸，和/或参考SEQ ID NO:73的核苷酸位置编号，从位置305到位置405缺失至少一个核苷酸)。

19.根据权利要求11或14-18中任一项所述的植物或其部分，其中所述碱基缺失导致组蛋白去甲基化酶的ZnF结构域的一个或多个氨基酸残基、组蛋白去甲基化酶的JmjN结构域的一个或多个氨基酸残基和/或组蛋白去甲基化酶的JmjC结构域的一个或多个氨基酸残基的缺失(例如，来自组蛋白去甲基化酶(例如VRS3多肽，例如，SEQ ID NO:71或SEQ ID NO:74)的ZnF结构域、JmjN结构域或JmjC结构域的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58,59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83或84个氨基酸残基的缺失)。

20.根据权利要求12或15-18中任一项所述的植物或其部分，其中所述碱基缺失导致组蛋白去甲基化酶的ZnF结构域的一个或多个氨基酸残基的缺失，即，参考SEQ ID NO:71的氨基酸位置编号，从位置499到位置551缺失一个或多个氨基酸残基，和/或参考SEQ ID NO:74的氨基酸位置编号，从位置500到位置552缺失一个或多个氨基酸残基。

21.根据权利要求12或15-18中任一项所述的植物或其部分，其中所述碱基缺失导致组蛋白去甲基化酶的JmjC结构域的一个或多个氨基酸残基的缺失，即，参考SEQ ID NO:71的氨基酸位置编号，从位置278到位置400缺失一个或多个氨基酸残基，和/或参考SEQ ID NO:74的氨基酸位置编号，从位置123到位置401缺失一个或多个氨基酸残基。

22.根据权利要求12或15-18中任一项所述的植物或其部分，其中所述碱基缺失导致组蛋白去甲基化酶的JmjN结构域的一个或多个氨基酸残基的缺失，即，参考SEQ ID NO:71的氨基酸位置编号，从位置101到位置135缺失一个或多个氨基酸残基，和/或参考SEQ ID NO:74的氨基酸位置编号，从位置101到位置136缺失一个或多个氨基酸残基。

23.根据权利要求11-13中任一项所述的植物或其部分，其中所述碱基置换导致氨基酸置换。

24.根据权利要求23所述的植物或其部分，其中所述氨基酸置换破坏组蛋白去甲基化酶与DNA的结合或降低组蛋白去甲基化酶的组蛋白去甲基化活性。

25.根据前述权利要求中任一项所述的植物或其部分，其中所述至少一个突变是显性负性突变、半显性突变、弱功能丧失突变、亚效等位基因突变或无效突变，任选地，其中所述突变是显性负性突变。

26.根据前述权利要求中任一项所述的植物或其部分，其中所述至少一个突变导致突变的组蛋白去甲基化酶基因，所述突变的组蛋白去甲基化酶基因与SEQ ID NO:104、106或108中任一个具有至少90％的序列同一性，任选地，其中所述突变的组蛋白去甲基化酶基因编码与SEQ ID NO:105、107或109中任一个具有至少90％的序列同一性的突变的组蛋白去甲基化酶多肽序列。

27.根据前述权利要求中任一项所述的植物或其部分，其中所述至少一个突变是非自然突变。

28.一种包含编辑系统的植物细胞，所述编辑系统包含：

(a)CRISPR相关效应蛋白；和

(b)引导核酸(例如gRNA、gDNA、crRNA、crDNA)，所述引导核酸具有与编码组蛋白去甲基化酶的内源性靶基因互补的间隔序列。

29.根据权利要求28所述的植物细胞，其中所述组蛋白去甲基化酶是SIX-ROWED SPIKE3(VRS3)组蛋白去甲基化酶，任选地是Jumonji C型H3K9me2/me3去甲基化酶。

30.根据权利要求28或权利要求29所述的植物细胞，其中所述编码组蛋白去甲基化酶的内源性靶基因：

(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；和/或

(b)编码与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的多肽序列。

31.根据权利要求28-30中任一项所述的植物细胞，其中所述编码组蛋白去甲基化酶的所述内源性靶基因包含：(1)JmjN结构域，所述JmjN结构域：(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:87或SEQ IDNO:90的氨基酸序列具有至少80％的序列同一性的多肽，(2)JmjC结构域，所述JmjC结构域：(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80％的序列同一性的多肽，和/或(3)ZnF结构域，所述ZnF结构域：(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80％的序列同一性的多肽。

32.根据权利要求28-31中任一项所述的植物细胞，其中所述引导核酸包含SEQ ID NO:93-103中任一个的核苷酸序列(例如，间隔序列)。

33.根据权利要求28-32中任一项所述的植物细胞，其中所述植物细胞是玉米植物细胞。

34.从权利要求1-27中任一项所述的植物部分或从权利要求28-33中任一项所述的植物细胞再生的植物。

35.根据权利要求34所述的植物，其中所述植物表现出增加的小花育性、增加的种子数量和/或增加的种子重量。

36.一种植物细胞，所述植物细胞包含组蛋白去甲基化酶基因的DNA结合位点中的突变，所述突变阻止或减少编码的组蛋白去甲基化酶与DNA的结合或降低编码的组蛋白去甲基化酶的活性，

其中基因组修饰是使用编辑系统引入的置换、插入和/或缺失，所述编辑系统包含与组蛋白去甲基化酶基因中的靶位点结合的核酸结合结构域，

其中所述组蛋白去甲基化酶基因：

(b)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽。

37.根据权利要求36所述的植物细胞，其中组蛋白去甲基化酶基因包含：(1)JmjN结构域，所述JmjN结构域：(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80％的序列同一性的多肽，(2)JmjC结构域，所述JmjC结构域：(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80％的序列同一性的多肽，和/或(3)ZnF结构域，所述ZnF结构域：(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80％的序列同一性的多肽。

38.根据权利要求36或权利要求37所述的植物细胞，其中所述编辑系统的核酸结合结构域来自多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)和/或Argonaute蛋白。

39.根据权利要求36-38中任一项所述的植物细胞，其中所述突变是置换和/或缺失。

40.根据权利要求39所述的植物细胞，其中所述缺失是内源性组蛋白去甲基化酶的锌指DNA结合结构域(ZnF结构域)、Jumonji C型(Jmj-C)结构域和Jumonji N型(Jmj-N)结构域的全部或部分缺失。

41.根据权利要求39或权利要求40所述的植物细胞，其中所述缺失是框内缺失或框外缺失。

42.根据权利要求36-39中任一项所述的植物细胞，其中所述突变包含对A、T、G或C的碱基置换，任选地，其中所述碱基置换导致氨基酸置换。

43.根据权利要求36-42中任一项所述的植物细胞，其中所述组蛋白去甲基化酶基因编码SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶。

44.根据权利要求36-43中任一项所述的植物细胞，其中所述植物细胞是来自玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、红薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、扁桃、核桃、草莓、西瓜、辣椒、葡萄、番茄、黄瓜、黑莓、覆盆子、黑覆盆子或芸苔属植物的细胞。

45.根据权利要求36-44中任一项所述的植物细胞，其中所述细胞是玉米植物细胞。

46.根据权利要求36-45中任一项所述的植物细胞，其中所述突变导致突变的组蛋白去甲基化酶基因，所述突变的组蛋白去甲基化酶基因与SEQ ID NO:104、106或108中任一个具有至少90％的序列同一性，任选地，其中所述突变的组蛋白去甲基化酶基因编码与SEQ IDNO:105、107或109中任一个具有至少90％的序列同一性的突变的组蛋白去甲基化酶多肽序列。

47.根据权利要求36-46中任一项所述的植物细胞，其中所述突变是非自然突变。

48.从权利要求34-47中任一项所述的植物细胞再生的植物，其中所述植物表现出增加的小花育性、增加的种子数量和/或增加的种子重量。

49.根据权利要求48所述的植物，其中所述植物包含突变的组蛋白去甲基化酶基因，所述突变的组蛋白去甲基化酶基因与SEQ ID NO:104、106或108中任一个的核苷酸序列具有至少90％的序列同一性，任选地，其中所述突变的组蛋白去甲基化酶基因编码与SEQ IDNO:105、107或109中任一个具有至少90％的序列同一性的突变的组蛋白去甲基化酶多肽序列。

50.根据权利要求48或权利要求49所述的植物，其中所述突变是非自然突变。

51.一种提供具有增加的小花育性、增加的种子数量和/或增加的种子重量的多种植物的方法，所述方法包括：

在生长区域种植权利要求1-27、34、35或48-50中任一项所述的两种或更多种植物，从而提供与不包含突变的多种对照植物相比具有增加的小花繁育性、增加的种子数量和/或增加的种子重量的多种植物。

52.一种产生/育种无转基因的基因组编辑的(例如碱基编辑的)植物的方法，所述方法包括：

(a)使权利要求1-27、34、35或48-50中任一项所述的植物与无转基因的植物杂交，从而将突变或修饰引入无转基因的植物中；和

(b)选择包含所述突变或修饰但无转基因的子代植物，从而产生无转基因的基因组编辑的植物。

53.一种在植物的内源性组蛋白去甲基化酶基因中产生突变的方法，所述方法包括：

(a)使基因编辑系统靶向内源性组蛋白去甲基化酶基因的部分，所述部分：

(i)包含与SEQ ID NO:75、76、78、79、81、82、84或85中任一个具有至少80％的序列同一性的核苷酸序列和/或编码与SEQ ID NO:87、88、90或91中任一个具有至少80％的同一性的氨基酸序列，任选地包含与SEQ ID NO:75、78、81或84中任一个具有至少80％的序列同一性的核苷酸序列和/或编码与SEQ ID NO:87或SEQ ID NO:90具有至少80％的同一性的氨基酸序列，和/或

(ii)包含与SEQ ID NO:77、80、83或86中任一个具有至少80％的序列同一性的核苷酸序列和/或编码与SEQ ID NO:89或92中任一个具有至少80％的同一性的氨基酸序列；和

(b)选择包含位于内源性组蛋白去甲基化酶基因的部分中的修饰的植物，所述内源性组蛋白去甲基化酶基因的部分与SEQ ID NO:75、76、77、78、79、80、81、82、83、84、85或86中任一个核苷酸序列具有至少80％的序列同一性。

54.根据权利要求53所述的方法，其中检测到的所述突变位于突变的组蛋白去甲基化酶基因中，所述突变的组蛋白去甲基化酶基因与SEQ ID NO:104、106或108中任一个具有至少90％的序列同一性，任选地，其中所述突变的组蛋白去甲基化酶基因编码突变的组蛋白去甲基化酶多肽序列，所述突变的组蛋白去甲基化酶多肽序列与SEQ ID NO:105、107或109中任一个具有至少90％的序列同一性。

55.一种在植物细胞的组蛋白去甲基化酶多肽中产生变异的方法，所述方法包括：

将编辑系统引入植物细胞，其中所述编辑系统靶向植物细胞中的组蛋白去甲基化酶基因的区域；和

使所述组蛋白去甲基化酶基因的区域与所述编辑系统接触，从而将突变引入组蛋白去甲基化酶基因，并在植物细胞的组蛋白去甲基化酶多肽中产生变异。

56.根据权利要求55所述的方法，其中所述组蛋白去甲基化酶多肽包含锌指DNA结合结构域(ZnF结构域)、Jumonji C型(Jmj-C)结构域和Jumonji N型(Jmj-N)结构域，并且组蛋白去甲基化酶基因中的突变破坏组蛋白去甲基化酶多肽与DNA的结合和/或降低组蛋白去甲基化酶多肽的组蛋白去甲基化活性。

57.根据权利要求55或权利要求56所述的方法，其中所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列和/或包含与SEQ ID NO:75-86中任一个核苷酸序列具有至少80％的序列同一性的区域。

58.根据权利要求55-57中任一项所述的方法，其中所述组蛋白去甲基化酶多肽包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的氨基酸序列，和/或产生变异的所述组蛋白去甲基化酶多肽的区域包含与SEQ ID NO:87-92中任一个具有至少80％的序列同一性的氨基酸序列。

59.根据权利要求55-58中任一项所述的方法，其中在植物的组蛋白去甲基化酶多肽中产生变异导致植物表现出增加的小花育性、增加的种子数量和/或增加的种子重量。

60.根据权利要求55-59中任一项所述的方法，其中使植物细胞中所述内源性组蛋白去甲基化酶基因的区域与所述编辑系统接触产生在基因组中包含编辑的内源性组蛋白去甲基化酶基因的植物细胞，所述方法还包括：(a)从所述植物细胞再生植物；(b)自交植物以产生子代植物(E1)；(c)测定(b)的子代植物的增加的小花育性、增加的种子数量和/或增加的种子重量；以及(d)选择表现出增加的小花育性、增加的种子数量和/或增加的种子重量的子代植物，以产生与对照植物相比表现出增加的小花育性、增加的种子数量和/或增加的种子重量的子代植物。

61.根据权利要求60所述的方法，所述方法还包括：(e)自交(d)的选择的子代植物以产生子代植物(E2)；(f)测定(e)的子代植物的增加的小花育性、增加的种子数量和/或增加的种子重量；以及(g)选择表现出增加的小花育性、增加的种子数量和/或增加的种子重量的子代植物，以产生与对照植物相比表现出增加的小花育性、增加的种子数量和/或增加的种子重量的选择的子代植物，任选地重复(e)至(g)额外的一次或多次。

62.一种检测植物的突变组蛋白去甲基化酶基因(内源性组蛋白去甲基化酶基因中的突变)的方法，所述方法包括在植物基因组中检测SEQ ID NO:69、70、72、73或75-87中任一个的核酸序列，所述核酸序列具有至少一个突变，所述突变破坏组蛋白去甲基化酶与DNA的结合或降低组蛋白去甲基化酶的组蛋白去甲基化活性。

63.一种用于编辑植物细胞基因组中特定位点的方法，所述方法包括：以位点特异性方式切割植物细胞中内源性组蛋白去甲基化酶基因中的靶位点，所述内源性组蛋白去甲基化酶基因：

(b)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽，

从而在植物细胞的内源性组蛋白去甲基化酶基因中产生编辑。

64.根据权利要求63所述的方法，其中组蛋白去甲基化酶基因包含：(1)JmjN结构域，所述JmjN结构域：(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80％的序列同一性的多肽，(2)JmjC结构域，所述JmjC结构域：(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80％的序列同一性的多肽，和/或(3)ZnF结构域，所述ZnF结构域：(a)与SEQID NO:77、80、83或86中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQID NO:89或SEQ ID NO:92的氨基酸序列具有至少80％的序列同一性的多肽。

65.根据权利要求63或权利要求64所述的方法，所述方法还包括从包含内源性组蛋白去甲基化酶基因中的编辑的植物细胞再生植物，以产生在其内源性组蛋白去甲基化酶基因中包含所述编辑的植物。

66.根据权利要求63-65中任一项所述的方法，其中与不包含所述编辑的对照植物相比，在其内源性组蛋白去甲基化酶基因中包含所述编辑的植物表现出增加的小花育性、增加的种子数量和/或增加的种子重量。

67.根据权利要求63-66中任一项所述的方法，其中所述编辑导致内源性组蛋白去甲基化酶基因中的突变，突变的组蛋白去甲基化酶基因产生具有减少的DNA结合和/或降低的组蛋白去甲基化活性的组蛋白去甲基化酶。

68.根据权利要求63-67中任一项所述的方法，其中所述编辑产生突变的组蛋白去甲基化酶基因，所述突变的组蛋白去甲基化酶基因与SEQ ID NO:104、106或108中任一个具有至少90％的序列同一性，其中所述突变的组蛋白去甲基化酶基因编码突变的组蛋白去甲基化酶多肽序列，所述突变的组蛋白去甲基化酶多肽序列与SEQ ID NO:105、107或109中任一个具有至少90％的序列同一性，任选地，其中所述编辑产生非自然突变。

69.一种产生植物的方法，所述方法包括：

(a)使包含编码组蛋白去甲基化酶的野生型内源性基因的植物细胞群体与靶向野生型内源性基因的核酸酶接触，其中所述核酸酶与核酸结合结构域连接，所述核酸结合结构域与野生型内源性基因中的靶位点结合，所述野生型内源性基因：(i)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；或(ii)编码包含与SEQID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽；

(b)从所述群体中选择包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物细胞，其中所述突变是(i)或(ii)中任一项的多肽中的至少一个氨基酸残基的置换和/或缺失，其中所述突变降低或消除组蛋白去甲基化酶结合DNA的能力或降低组蛋白去甲基化酶的组蛋白去甲基化活性；和

(c)使选择的植物细胞生长成包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物。

70.一种增加植物的小花育性、种子数量和/或种子重量的方法，所述方法包括：

(a)使包含编码组蛋白去甲基化酶的野生型内源性基因的植物细胞与靶向野生型内源性基因的核酸酶接触，其中所述核酸酶与核酸结合结构域连接，所述核酸结合结构域与野生型内源性基因中的靶位点结合，所述野生型内源性基因：(i)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；和/或(ii)编码包含与SEQID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽，从而产生包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物细胞；和

(b)使所述植物细胞生长成包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物，从而增加植物的小花育性、种子数量和/或种子重量。

71.一种产生植物或其部分的方法，所述植物或其部分包含至少一个具有内源性组蛋白去甲基化酶基因中的突变的细胞，所述方法包括：

使植物或植物部分的组蛋白去甲基化酶基因中的靶位点与包含切割结构域和DNA结合结构域的核酸酶接触，其中所述核酸酶的核酸结合结构域与组蛋白去甲基化酶基因中的靶位点结合，

其中所述组蛋白去甲基化酶基因：(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；和/或(b)编码包含与SEQ ID NO:71或SEQ IDNO:74具有至少80％的序列同一性的序列的多肽，

从而产生包含至少一个具有内源性组蛋白去甲基化酶基因中的突变的细胞的植物或其部分。

72.根据权利要求69-71中任一项所述的方法，其中内源性组蛋白去甲基化酶基因中的所述突变产生具有减少的DNA结合或降低的活性的组蛋白去甲基化酶。

73.一种产生植物或其部分的方法，所述植物或其部分包含内源性组蛋白去甲基化酶中的突变，突变的组蛋白去甲基化酶具有减少的DNA结合和/或降低的组蛋白去甲基化活性，所述方法包括使植物或植物部分的内源性组蛋白去甲基化酶基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触，其中所述核酸结合结构域与组蛋白去甲基化酶基因中的靶位点结合，

其中所述组蛋白去甲基化酶基因：(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；和/或(b)编码包含与SEQ ID NO:71或SEQ IDNO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽，

从而产生具有内源性组蛋白去甲基化酶中的突变的植物或其部分，突变的组蛋白去甲基化酶具有减少的DNA结合和/或降低的组蛋白去甲基化活性。

74.根据权利要求69-73中任一项所述的方法，其中组蛋白去甲基化酶基因包含：(1)JmjN结构域，所述JmjN结构域：(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80％的序列同一性的多肽，(2)JmjC结构域，所述JmjC结构域：(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:88或SEQ IDNO:91的氨基酸序列具有至少80％的序列同一性的多肽，和/或(3)ZnF结构域，所述ZnF结构域：(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80％的序列同一性的多肽。

75.根据权利要求69-74中任一项所述的方法，其中所述突变是非自然突变，任选地是碱基置换、碱基缺失和/或碱基插入。

76.根据权利要求69-75中任一项所述的方法，其中所述突变包含对A、T、G或C的碱基置换。

77.根据权利要求69-76中任一权利要求所述的方法，其中所述突变是至少一个碱基对的置换。

78.根据权利要求69-76中任一项所述的方法，其中编码组蛋白去甲基化酶的内源性基因中的所述突变包含碱基缺失。

79.根据权利要求75或权利要求78所述的方法，其中所述碱基缺失包括框内缺失和/或框外缺失。

80.根据权利要求75、78或79中任一项所述的方法，其中所述碱基缺失包括从组蛋白去甲基化酶基因的ZnF结构域中缺失至少一个碱基对(例如，参考SEQ ID NO:69的核苷酸位置编号，从位置3927到位置4165缺失至少一个核苷酸，参考SEQ ID NO:70的核苷酸位置编号，从位置1495位到位置1654缺失至少一个核苷酸，参考SEQ ID NO:72的核苷酸位置编号，从位置3987到位置4233缺失至少一个核苷酸，和/或参考SEQ ID NO:73的核苷酸位置编号，从位置1498到位置1656缺失至少一个核苷酸)。

81.根据权利要求75、78或79中任一项所述的方法，其中所述碱基缺失包括从组蛋白去甲基化酶基因的JmjC结构域中缺失至少一个碱基对(例如，参考SEQ ID NO:69的核苷酸位置编号，从位置3100到位置3631缺失至少一个核苷酸，参考SEQ ID NO:70的核苷酸位置编号，从位置832到位置1199缺失至少一个核苷酸，参考SEQ ID NO:72的核苷酸位置编号，从位置3162到位置3692缺失至少一个核苷酸，和/或参考SEQ ID NO:73的核苷酸位置编号，从位置835到位置1203缺失至少一个核苷酸)。

82.根据权利要求75、77或79中任一项所述的方法，其中所述碱基缺失包括从组蛋白去甲基化酶基因的JmjN结构域中缺失至少一个碱基对(例如，参考SEQ ID NO:72的核苷酸位置编号，从位置2216到位置2424缺失至少一个核苷酸，参考SEQ ID NO:70的核苷酸位置编号，从位置301到位置402缺失至少一个核苷酸，参考SEQ ID NO:72的核苷酸位置编号，从位置2268到位置2477缺失至少一个核苷酸，和/或参考SEQ ID NO:73的核苷酸位置编号，从位置305到位置405缺失至少一个核苷酸)。

83.根据权利要求75或77-82中任一项所述的方法，其中所述碱基缺失导致组蛋白去甲基化酶的ZnF结构域的一个或多个氨基酸残基、组蛋白去甲基化酶的JmjN结构域的一个或多个氨基酸残基和/或组蛋白去甲基化酶的JmjC结构域的一个或多个氨基酸残基的缺失(例如，来自组蛋白去甲基化酶(例如，VRS3多肽，例如，SEQ ID NO:71或SEQ ID NO:74)的ZnF结构域、JmjN结构域或JmjC结构域的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58,59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83或84个氨基酸残基的缺失)。

84.根据权利要求75-77中任一项所述的方法，其中所述碱基置换导致氨基酸置换。

85.根据权利要求84中任一项所述的方法，其中所述氨基酸置换破坏组蛋白去甲基化酶与DNA的结合或降低组蛋白去甲基化酶的组蛋白去甲基化活性。

86.根据权利要求69-85中任一项所述的方法，其中所述突变是显性负性突变、半显性突变、弱功能丧失突变、亚效等位基因突变或无效突变，任选地，其中所述突变是显性负性突变。

87.根据权利要求69-86中任一项所述的方法，其中与不包含内源性组蛋白去甲基化酶中的突变的对照植物相比，具有内源性组蛋白去甲基化酶中的突变的所述植物表现出增加的小花育性、增加的种子数量和/或增加的种子重量。

88.根据权利要求69-87中任一项所述的方法，其中所述核酸酶切割内源性组蛋白去甲基化酶基因，并将突变引入内源性组蛋白去甲基化酶基因编码的内源性组蛋白去甲基化酶的ZnF结构域、JmjC结构域和/或JmjN结构域。

89.根据权利要求69-88中任一项所述的方法，其中所述核酸酶是锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)、核酸内切酶(例如Fok1)或CRISPR-Cas效应蛋白。

90.根据权利要求69-89中任一项所述的方法，其中所述组蛋白去甲基化酶能够调节小花育性、种子数量和种子重量。

91.根据权利要求69-90中任一项所述的方法，其中所述组蛋白去甲基化酶是SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶，任选地是Jumonji C型H3K9me2/me3去甲基化酶。

92.根据权利要求69-91中任一项所述的方法，其中所述突变导致突变的组蛋白去甲基化酶基因，所述突变的组蛋白去甲基化酶基因与SEQ ID NO:104、106或108中任一个具有至少90％的序列同一性，任选地，其中所述突变的组蛋白去甲基化酶基因编码与SEQ ID NO:105、107或109中任一个具有至少90％的序列同一性的突变的组蛋白去甲基化酶多肽序列。

93.与组蛋白去甲基化酶基因中的靶位点结合的引导核酸，所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个或多个核苷酸序列具有至少80％的同一性的序列；或编码与SEQ ID NO:71或74中任一个或多个氨基酸序列具有至少80％的序列同一性的序列。

94.根据权利要求93所述的引导核酸，其中组蛋白去甲基化酶基因包含：(1)JmjN结构域，所述JmjN结构域：(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80％的序列同一性的多肽，(2)JmjC结构域，所述JmjC结构域：(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80％的序列同一性的多肽，和/或(3)ZnF结构域，所述ZnF结构域：(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80％的序列同一性的多肽。

95.根据权利要求94所述的引导核酸，其中所述引导核酸包含间隔子，所述间隔子具有SEQ ID NO:92、93、94、95、96、97、98、99、100、101、102或103中任一个的核苷酸序列。

96.根据权利要求93-95中任一项所述的引导核酸，其中所述组蛋白去甲基化酶基因编码SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶，任选地是Jumonji C型H3K9me2/me3去甲基化酶。

97.一种系统，所述系统包含权利要求93-96中任一项所述的引导核酸和与引导核酸缔合的CRISPR-Cas效应蛋白。

98.根据权利要求97所述的系统，所述系统还包含与引导核酸缔合的tracr核酸和CRISPR-Cas效应蛋白，任选地，其中所述tracr核酸和引导核酸共价连接。

99.一种基因编辑系统，所述基因编辑系统包含与引导核酸缔合的CRISPR-Cas效应蛋白，其中所述引导核酸包含与组蛋白去甲基化酶基因结合的间隔序列。

100.根据权利要求99所述的基因编辑系统，其中所述组蛋白去甲基化酶包含与SEQ IDNO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；或编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽。

101.根据权利要求99或权利要求100所述的基因编辑系统，其中组蛋白去甲基化酶基因包含：(1)JmjN结构域，所述JmjN结构域：(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80％的序列同一性的多肽，(2)JmjC结构域，所述JmjC结构域：(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80％的序列同一性的多肽，和/或(3)ZnF结构域，所述ZnF结构域：(a)与SEQ ID NO:77、80、86或86中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80％的序列同一性的多肽。

102.根据权利要求99-101中任一项所述的基因编辑系统，其中所述引导核酸包含间隔序列，所述间隔序列具有SEQ ID NO:92、93、94、95、96、97、98、99、100、101、102或103中任一个核苷酸序列。

103.根据权利要求99-102中任一项所述的基因编辑系统，所述基因编辑系统还包含与引导核酸缔合的tracr核酸和CRISPR-Cas效应蛋白，任选地，其中所述tracr核酸和引导核酸共价连接。

104.根据权利要求99-103中任一项所述的基因编辑系统，其中所述组蛋白去甲基化酶编码SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶。

105.一种包含CRISPR-Cas效应蛋白和引导核酸的复合物，所述CRISPR-Cas效应蛋白包含切割结构域，其中所述引导核酸与组蛋白去甲基化酶基因中的靶位点结合，所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；或编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽，其中所述切割结构域切割组蛋白去甲基化酶基因中的靶链。

106.一种表达盒，所述表达盒包含：(a)编码包含切割结构域的CRISPR-Cas效应蛋白的多核苷酸和(b)与组蛋白去甲基化酶基因中的靶位点结合的引导核酸，其中所述引导核酸包含与组蛋白去甲基化酶基因中的靶位点互补并结合的间隔序列，所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80％的序列同一性的序列；和/或编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80％的序列同一性的序列的多肽。

107.根据权利要求105所述的复合物或根据权利要求104所述的表达盒，其中组蛋白去甲基化酶基因包含：(1)JmjN结构域，所述JmjN结构域：(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80％的序列同一性的多肽，(2)JmjC结构域，所述JmjC结构域：(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80％的序列同一性的多肽，和/或(3)ZnF结构域，所述ZnF结构域：(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80％的序列同一性，或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80％的序列同一性的多肽。

108.根据权利要求105或权利要求107所述的复合物，或根据权利要求104或权利要求105所述的表达盒，其中所述组蛋白去甲基化酶编码SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶，任选地是Jumonji C型H3K9me2/me3去甲基化酶。

109.一种编码具有突变的DNA结合位点的组蛋白去甲基化酶的核酸，其中所述突变的DNA结合位点包含破坏组蛋白去甲基化酶的DNA结合和/或降低组蛋白去甲基化酶的组蛋白去甲基化活性的突变。

110.根据权利要求109所述的核酸，其中所述突变消除组蛋白去甲基化酶与DNA的结合。

111.根据权利要求109或权利要求110所述的核酸，其中所述组蛋白去甲基化酶编码SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶，任选地是Jumonji C型H3K9me2/me3去甲基化酶。

112.一种植物或其部分，所述植物或其部分包含权利要求109-111中任一项所述的核酸。

113.一种玉米植物或其部分，所述玉米植物或其部分包含权利要求109-111中任一项所述的核酸。

114.根据权利要求113所述的玉米植物或其部分，其中所述组蛋白去甲基化酶在1号染色体和/或5号染色体上，所述组蛋白去甲基化酶在ZnF结构域、JmjC结构域和/或JmjN结构域中具有突变，并且具有减少的DNA结合和/或降低的组蛋白去甲基化活性。

115.根据权利要求112所述的植物或根据权利要求113或权利要求114所述的玉米植物，与不包含在ZnF结构域、JmjC结构域和/或JmjN结构域中具有突变的组蛋白去甲基化酶的植物相比，所述植物或玉米植物包含增加的小花育性、增加的种子数量和/或增加的种子重量。

116.一种玉米植物或其植物部分，所述玉米植物或其植物部分包含内源性SIX-ROWEDSPIKE 3(VRS3)组蛋白去甲基化酶基因中的至少一个突变，所述组蛋白去甲基化酶基因位于1号染色体上并且具有基因识别号(基因ID)Zm00001d030108，或位于5号染色体上并且具有基因ID Zm00001d014422，任选地，其中所述至少一个突变导致突变的VRS3基因，所述突变的VRS3基因与SEQ ID NO:104、106和108中任一个具有至少90％的序列同一性，任选地，其中所述突变的VRS3基因编码突变的VRS3多肽序列，所述突变的VRS3多肽序列与SEQ IDNO:105、107和109中任一个具有至少90％的序列同一性，任选地，其中所述至少一个突变是非自然突变。

117.一种引导核酸，所述引导核酸与玉米植物的内源性SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶基因中的靶核酸结合，其中所述靶核酸位于1号染色体上并且具有基因识别号(基因ID)Zm00001d030108，或位于5号染色体上并且具有基因ID Zm00001d014422。

118.一种产生植物的方法，所述植物包含内源性组蛋白去甲基化酶基因中的突变和至少一个感兴趣的多核苷酸，所述方法包括：

使第一植物与包含至少一个感兴趣的多核苷酸的第二植物杂交以产生子代植物，所述第一植物是根据权利要求1-27、34、35或48-50或112-116中任一项所述的植物；和

选择包含组蛋白去甲基化酶基因中的突变和至少一个感兴趣的多核苷酸的子代植物，从而产生包含内源性组蛋白去甲基化酶基因中的突变和至少一个感兴趣的多核苷酸的植物。

119.一种产生植物的方法，所述植物包含内源性组蛋白去甲基化酶基因中的突变和至少一个感兴趣的多核苷酸，所述方法包括：

将至少一个感兴趣的多核苷酸引入权利要求1-27、34、35、48-50或112-116中任一项所述的植物中，从而产生包含内源性组蛋白去甲基化酶基因中的突变和至少一个感兴趣的多核苷酸的植物。

120.一种产生植物的方法，所述植物包含内源性组蛋白去甲基化酶基因中的突变并表现出增加的小花育性、增加的种子数量和/或增加的种子重量的表型，所述方法包括：

使第一植物与表现出增加的小花育性、增加的种子数量和/或增加的种子重量的表型第二植物杂交，所述第一植物是权利要求1-27、34、35、48-50或112-116中任一项所述的植物；和

选择包含内源性组蛋白去甲基化酶基因中的突变和增加的小花育性、增加的种子数量和/或增加的种子重量的表型的子代植物，从而产生包含内源性组蛋白去甲基化酶基因中的突变并且与对照植物相比表现出增加的小花育性、增加的种子数量和/或增加的种子重量的表型的植物。

121.一种防治容器(例如花盆或育苗盘等)、生长室、温室、田地、休闲区、草坪或路边杂草的方法，所述方法包括：

对在容器、生长室、温室、田地、休闲区、草坪或路边生长的权利要求1-27、34、35、48-50或112-116中任一项所述的一种或多种(多株)植物施用除草剂，从而防治其中生长有所述一种或多种植物的容器、生长室、温室、田地、休闲区、草坪或路边的杂草。

122.一种减少昆虫对植物的捕食的方法，所述方法包括向权利要求1-27、34、35、48-50或112-116中任一项所述的一种或多种植物施用杀虫剂，从而减少昆虫对所述一种或多种植物的捕食。

123.一种减少植物上的真菌病害的方法，所述方法包括将杀真菌剂施用于权利要求1-27、34、35、48-50或112-116中任一项所述的一种或多种植物，从而减少所述一种或多种植物上的真菌病害。

124.根据权利要求122或权利要求123所述的方法，其中所述一种或多种植物生长在容器、生长室、温室、田地、休闲区、草坪或路边。

125.根据权利要求115-124中任一项所述的方法，其中所述感兴趣的多核苷酸是赋予除草剂耐受性、抗虫性、抗病性、增加的产量、提高养分利用效率或非生物胁迫抗性的多核苷酸。