CN112585274A

CN112585274A - 用于在稻植物中改变成熟的组合物和方法

Info

Publication number: CN112585274A
Application number: CN201980054276.9A
Authority: CN
Inventors: A·莫汉蒂; B·鲁德拉帕; V·S·塔瓦
Original assignee: Pioneer Hi Bred International Inc
Current assignee: Pioneer Hi Bred International Inc
Priority date: 2018-08-21
Filing date: 2019-08-15
Publication date: 2021-03-30
Also published as: US20210348178A1; WO2020041079A1

Abstract

公开了调节稻植物成熟的方法和组合物。本公开进一步公开了组合物、多核苷酸构建体、转化的宿主细胞、表现出改变的株高特征的植物和种子或产生表现出改变的成熟参数的植物。

Description

用于在稻植物中改变成熟的组合物和方法

技术领域

本公开涉及在稻植物中改变成熟的组合物和方法。

以电子方式递交的序列表的引用

该序列表的官方副本经由EFS-Web作为ASCII格式的序列表以电子方式提交，文件名为“7438_ST25.txt”，创建于2018年8月17日，且具有123.4千字节大小，并与本说明书同时提交。包含在所述ASCII格式的文件中的序列表是本说明书的一部分并且通过引用以其全文并入本文。

背景技术

植物遗传工程的最新进展已为对植物进行工程化以使其具有改善的特性或性状(例如成熟、株高、高度和其他结构)打开了新的大门。对于多种商业目的的作物，根据需要，早熟或晚熟是育种中的希望的性状。成熟调适提高了收获指数，有利地在谷粒和非谷粒生物质之间分配了碳和营养素，提高了肥料利用效率、水利用效率，并在增加种植密度方面发挥了作用。

发明内容

本文提供了一种改变成熟的方法，所述方法包括通过在植物的基因组基因座处靶向DNA断裂来引入一个或多个核苷酸修饰，其中所述基因组基因座包含参与开花时间调节(FTR)的多核苷酸，所述多核苷酸编码以下：含反应调节子接收结构域的蛋白、含CCT基序的蛋白、BHLH转录因子、TCP家族转录因子、含NAC结构域的蛋白、含微管蛋白/FtsZ结构域的蛋白、hsp20/α晶体蛋白、核心组蛋白H2A/H2B/H3/H4推定蛋白、AAA型ATP酶家族蛋白、含通用胁迫蛋白结构域的蛋白、PHD指家族蛋白、或甲基结合结构域蛋白，并且其中与不包含一个或多个引入的遗传修饰的对照植物相比，植物成熟得到了修饰。在某些实施例中，所述FTR多核苷酸编码多肽，所述多肽包含与选自SEQ ID NO：14-26的序列具有至少90％同一性的氨基酸序列。在某些实施例中，靶向DNA修饰靶向涉及植物的FTR的超过一个不同基因组基因座。

在某些实施例中，所述靶向DNA修饰选自由以下组成的组：插入、缺失、单核苷酸多态性(SNP)、和多核苷酸修饰，使得FTR多肽的表达减少。在某些实施例中，靶向DNA修饰导致以下一种或多种：所述FTR多核苷酸的表达减少；所述FTR多核苷酸编码的蛋白质的转录活性减少；所述FTR多核苷酸的一种或多种可变剪接转录物的产生；一个或多个DNA结合结构域的缺失；所述FTR多核苷酸的一个或多个外显子的移码突变；所述FTR多核苷酸的实质部分的缺失或所述FTR多核苷酸的全长开放阅读框的缺失；存在于编码所述FTR多核苷酸的调节区内的增强子基序的抑制；一个或多个核苷酸的修饰或可操作地连接至所述FTR多核苷酸的表达的调节元件的缺失，其中所述调节元件存在于启动子、内含子、3′UTR、终止子或其组合中。在某些实施例中，靶向DNA修饰靶向FTR多核苷酸的基因组基因座，使得一个或多个核苷酸修饰存在于编码涉及成熟的多肽的内源多核苷酸的(a)相同的编码区；(b)非编码区；(c)调节序列；(d)非翻译区，或(e)(a)-(d)的任何组合内。

在某些实施例中，通过RNA指导的内切核酸酶、位点特异性脱氨酶或位点特异性内切核酸酶引入靶向DNA修饰。在某些实施例中，通过基因组修饰技术进行靶向DNA修饰，所述基因组修饰技术选自由以下组成的组：多核苷酸指导的内切核酸酶、CRISPR-Cas内切核酸酶、碱基编辑脱氨酶、锌指核酸酶、转录激活子样效应子核酸酶(TALEN)、工程化位点特异性大范围核酸酶、或Argonaute。在某些实施例中，通过使用与靶序列相对应的指导RNA诱导靶向DNA修饰，所述靶序列包含编码多肽的多核苷酸，所述多肽包含与选自SEQ ID NO：14-26的序列具有至少90％同一性的氨基酸序列。

在某些实施例中，当靶向DNA修饰导致FTR多核苷酸编码的蛋白质的表达或活性减少时，植物表现出早熟。在一个实施例中，所述植物比对照植物提前约5至15天表现出第一次开花。

在某些实施例中，当靶向DNA修饰导致FTR多核苷酸编码的蛋白质的表达或活性减少时，植物表现出晚熟。在一个实施例中，如通过至第一次或50％开花或出穗或穗分化的天数所测量的，与对照植物相比，所述植物的成熟延迟约5％至约50％。

在某些实施例中，在不显著降低每株植物或作为每单位面积的植物群体的谷粒产率度量的情况下获得成熟的修饰。在某些实施例中，如通过植物高度的降低所测量的，与对照稻植物相比，所述植物的株高没有显著改变。在某些实施例中，与不包含所述一个或多个修饰的对照植物相比，所述植物的靶向DNA修饰基本上不改变所述植物的根结构或不显著增加根倒伏。

在某些实施例中，所述植物是稻植物。在某些实施例中，所述稻植物是雌性自交系。在某些实施例中，所述稻植物是杂交种。在某些实施例中，所述稻植物是籼稻(Oryzasativa var.indica)。

本文还提供了表现出早熟的稻植物，其包括参与开花时间调节(FTR)的经修饰的基因组基因座，其中与对照植物相比，所述基因组基因座包含一个或多个引入的突变，并且其中所述FTR基因组基因座编码与选自SEQ ID NO：14-21的氨基酸序列具有至少90％同一性的多肽。在某些实施例中，如通过第一次开花时间所测量的，所述稻植物表现出约5至15天范围内的早熟。在某些实施例中，所述稻植物是雌性自交系。在某些实施例中，所述稻植物是杂交种。在某些实施例中，所述稻植物是籼稻(Oryza sativa var.indica)。在某些实施例中，在不显著降低每株植物或作为每单位面积的植物群体的谷粒产率度量的情况下获得成熟的修饰。在某些实施例中，如通过植物高度的降低所测量的，与对照稻植物相比，所述植物的株高没有显著改变。在某些实施例中，与不包含所述一个或多个修饰的对照植物相比，所述植物的靶向DNA修饰基本上不改变所述植物的根结构或不显著增加根倒伏。

本文提供了表现出晚熟的稻植物，其包括参与开花时间调节(FTR)的经修饰的基因组基因座，其中与对照植物相比，所述基因组基因座包含一个或多个引入的突变，并且其中所述FTR基因组基因座编码与选自SEQ ID NO：22-26的氨基酸序列具有至少90％同一性的多肽。在某些实施例中，如通过至第一次或50％开花或出穗或穗分化的天数所测量的，与对照稻植物相比，所述稻植物的成熟延迟约5％至约50％。在某些实施例中，所述稻植物是雌性自交系。在某些实施例中，所述稻植物是杂交种。在某些实施例中，所述稻植物是籼稻(Oryza sativa var.indica)。在某些实施例中，在不显著降低每株植物或作为每单位面积的植物群体的谷粒产率度量的情况下获得成熟的修饰。在某些实施例中，如通过植物高度的降低所测量的，与对照稻植物相比，所述植物的株高没有显著改变。在某些实施例中，与不包含所述一个或多个修饰的对照植物相比，所述植物的靶向DNA修饰基本上不改变所述植物的根结构或不显著增加根倒伏。

本文还提供了一种重组DNA构建体，所述重组DNA构建体包含编码氨基酸序列的多核苷酸序列，所述氨基酸序列与选自SEQ ID NO：14-26的氨基酸序列具有至少95％同一性，所述多核苷酸序列可操作地连接至至少一个异源核酸序列。

另外，本文还提供了一种植物细胞，所述植物细胞包含重组DNA构建体，所述重组DNA构建体包含编码氨基酸序列的多核苷酸序列，所述氨基酸序列与选自SEQ ID NO：14-26的氨基酸序列具有至少95％同一性，所述多核苷酸序列可操作地连接至至少一个异源核酸序列。

本文提供了一种指导RNA序列，所述指导RNA序列靶向植物细胞的基因组基因座，其中所述基因组基因座包含编码多肽的多核苷酸，所述多肽包含与选自SEQ ID NO：14-26的序列具有至少90％同一性的氨基酸序列。在某些实施例中，所述指导RNA存在于重组DNA构建体中。

还提供了包含指导RNA序列的植物细胞，所述指导RNA序列靶向植物细胞的基因组基因座，其中所述基因组基因座包含编码多肽的多核苷酸，所述多肽包含与选自SEQ IDNO：14-26的序列具有至少90％同一性的氨基酸序列，以及提供了包含含有指导RNA序列的重组DNA构建体的植物细胞，所述指导RNA序列靶向植物细胞基因组基因座，其中所述基因组基因座包含编码多肽的多核苷酸，所述多肽包含与选自SEQ ID NO：14-26的序列具有至少90％同一性的氨基酸序列。

本文进一步提供了一种植物或由其产生的种子，所述植物或种子具有稳定地并入其基因组的重组DNA构建体，所述重组DNA构建体包含指导RNA序列，所述指导RNA序列靶向植物细胞的基因组基因座，其中所述基因组基因座包含编码多肽的多核苷酸，所述多肽包含与选自SEQ ID NO：14-26组成的组的序列具有至少90％同一性的氨基酸序列。在一个实施例中，所述植物是单子叶植物。在一个实施例中，所述植物是稻植物。在某些实施例中，所述植物进一步包含选自由以下组成的组的异源核酸序列：植物中的报道基因、选择标志、抗病性基因、除草剂抗性基因、昆虫抗性基因；参与碳水化合物代谢的基因、参与脂肪酸代谢的基因、参与氨基酸代谢的基因、参与植物发育的基因、参与植物生长调节的基因、参与产率改善的基因、参与抗旱性的基因、参与增加营养物利用效率的基因、参与抗寒性的基因、参与抗热性的基因、和参与抗盐性的基因。

序列表简述

从以下详细描述和构成本申请的一部分的所附序列表(将其通过援引并入本文)可以更全面地理解本公开。

序列说明总结了本文所附的序列表，将其通过引用特此并入。如描述于以下文献中的IUPAC-IUB标准中所定义的，序列表包含核苷酸序列字符的单字母代码和氨基酸的单字母和三字母代码：Nucleic Acids Research[核酸研究]13：3021-3030(1985)和Biochemical Journal[生物化学杂志]219(2)：345-373(1984)。

表1：序列表说明

具体实施方式

本文引用的所有专利、专利申请、和出版物的公开内容通过引用以其全文并入。

除非上下文另外明确指示，否则本文和所附权利要求中所用的单数形式“一个/一种(a/an)”和“所述(the)”包括复数指示物。因此，例如，提及“植物”包括多个此类植物，提及“细胞”包括本领域技术人员已知的一种或多种细胞及其等效物等。

如本文所述，连接短语“基本上由…组成”通常是指除了字面公开的那些以外还包括材料、步骤、特征、组分、或元素的组合物、方法，前提是这些附加的材料、步骤、特征、组分、或元素不会实质影响受权利要求书保护的主题的基本和新颖特征。

本文提供了一种修饰植物(例如稻植物)的成熟的方法，所述方法包括以下、基本上由以下组成、或由以下组成：通过在植物基因组基因座进行靶向DNA修饰来引入一个或多个核苷酸修饰。

如本文所用，“改变成熟”、“成熟调节”等是指与对照植物(例如不包含DNA修饰的野生型植物)相比，经修饰的植物达到发育阶段的时间的任何可检测到的变化。例如，可以将成熟测量为至第一次开花、出穗或穗分化的天数，或者可替代地，可以将成熟测量为达到50％开花、出穗或穗分化的天数。测量成熟的发育阶段没有特别限制。然而，在某些实施例中，基于至第一次开花、出穗或穗分化的天数来测量成熟。

在稻植物成熟的阶段，出穗标志着穗分化(PI)(通常称为第4阶段)。通常，最后一个茎节出的幼穗是可见的圆锥形的器官(如果解剖茎的话)。当所述圆锥形成后约10天，其变得可见，这取决于稻品种的成熟。在生殖期的发育过程中，通常确定穗中的谷粒数量。例如，在短时变化中，最大分蘖、节间伸长和穗分化通常同时出现或出现在一个短窗口内。取决于品种的持续时间，例如中等至长期，这些阶段以上述顺序发生。稻穗分化的时间也可能受许多因素的影响，例如温度和光周期，某些品种已经对其适应。穗分化通常标志着稻植物生殖期的开始，因此是评估稻植物成熟的度量。

穗发育通常被称为稻发育的第5阶段，其特征在于由于穗在茎内部向上生长，穗叶底部的膨胀。穗分化(第4阶段)后，穗向茎顶部生长，导致茎中发生膨胀，称为伸长。花的器官发育，并且穗生长直至达到最终大小，然后从旗叶中出现，通常称为抽穗。

抽穗和开花通常被称为第6阶段，其特征是从穗/旗叶的底部的出穗，这可能需要大约两至三周的时间才能从茎中完全出穗。抽穗三天后开始开花，此过程一直持续到穗完全出现。开花通常意味着花开了，并且发生了授粉。

乳熟期，通常称为第7阶段，在受精后发生，其特征是子房肿胀，并且颖果发育直至达到成熟大小。谷粒(颖果)首先是水性的，然后达到乳状稠度，当挤压谷粒时可以观察到。穗是绿色的，直立直到稻生殖期的这个阶段。

蜡熟期，通常称为第8阶段，通常其特征在于谷粒软化并在开花后达到硬糊状稠度。直立的穗开始下垂，而谷粒的颜色变化是品种的特征，例如黄色、红色、黑色。

成熟，通常被称为第9阶段，通常以成熟的谷粒为特征，并且当谷粒达到其最终大小和最大重量时，以下垂的外观为特征。谷粒变硬并显示其特征颜色。当约85％至90％的穗粒成熟时，达到该阶段。

如本文使用的，“植物的基因组基因座”通常指在植物的染色体上的位置，在该位置上发现了基因，诸如参与开花时间调节(FTR)的多核苷酸。如本文使用的，“基因”包括表达功能性分子的核酸片段，诸如但不限于特定蛋白质编码序列和调节元件，诸如在编码序列之前(5′非编码序列)和之后(3′非编码序列)的那些调节元件。

“调节元件”通常是指参与调节核酸分子(例如基因或靶基因)的转录的转录调节元件。调节元件是核酸，并且可以包括启动子、增强子、内含子、5’-非翻译区(5’-UTR，还被称为前导序列)、或3’-UTR或其组合。调节元件能以“顺式”或“反式”起作用，并且通常以“顺式”起作用，即其激活位于调节元件所在的相同核酸分子(例如染色体)上的基因的表达。

“增强子”元件是当功能性连接至启动子时(无论其相对位置如何)都可增加核酸分子的转录的任何核酸分子。

将“阻遏物”(本文中有时也被称为沉默子)定义为当在功能上与启动子连接时(无论相对位置如何)都抑制转录的任何核酸分子。

“启动子”通常是指能够控制另一核酸片段转录的核酸片段。启动子通常包括核心启动子(也称为最小启动子)序列，所述序列包括最小调节区以启动转录(即转录起始位点)。通常，核心启动子包括TATA盒和与CAAT盒或CCAAT盒相关的GC富集区域。这些元件起作用使RNA聚合酶II与启动子结合并辅助聚合酶定位RNA起始位点。一些启动子可能不含TATA盒或CAAT盒或CCAAT盒，但可以含有用于转录起始位点的起始元件。核心启动子是指导转录起始所需的最小序列，并且通常不包括增强子或其他UTR。

术语“顺式元件”通常是指影响或调控可操作地连接的可转录的多核苷酸表达的转录调节元件，其中所述可转录的多核苷酸存在于相同DNA序列中。顺式元件可以起到结合转录因子的作用，所述转录因子是调节转录的反式作用多肽。

“内含子”是转录成RNA、但是然后在产生成熟mRNA的过程中被切除的基因中的间插序列。所述术语也用于切除的RNA序列。“外显子”是经转录的基因的序列的一部分，并且在源自所述基因的成熟信使RNA中被发现，但不一定是编码最终基因产物的序列的一部分。

5′非翻译区(5’UTR)(也称为翻译前导序列或前导RNA)是直接位于起始密码子上游的mRNA的区域。该区域涉及通过病毒、原核生物和真核生物中的不同机制对转录物的翻译的调节。

“3’非编码序列”是指位于编码序列下游的DNA序列，并且包括聚腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调节信号的其他序列。聚腺苷酸化信号通常表征为影响聚腺苷酸片添加到mRNA前体的3′末端。

“RNA转录物”通常是指产生自DNA序列的RNA聚合酶催化的转录产物。当RNA转录物是DNA序列的完全互补拷贝时，它被称为初级转录物，或者它可以来源于初级转录物的转录后加工的RNA序列并被称作成熟RNA。“信使RNA”(“mRNA”)通常是指不含内含子并且可由细胞翻译成蛋白质的RNA。“cDNA”通常是指与mRNA模板互补并且使用逆转录酶从mRNA模板合成的DNA。cDNA可以是单链的或可以使用DNA聚合酶I的Klenow片段转化成双链。“正义”RNA通常是指包含mRNA并且因此可以在细胞内或体外翻译成蛋白质的RNA转录物。“反义RNA”通常是指与靶初级转录物或mRNA的全部或部分互补，并阻断靶基因的表达或转录物积累的RNA转录物。反义RNA可与特定基因转录物的任何部分，即5′非编码序列、3′非编码序列、内含子或编码序列互补。“功能性RNA”通常是指反义RNA、核糖酶RNA、或可以不进行翻译但是仍对细胞过程具有作用的其他RNA。

“靶向DNA修饰”可以与靶向的DNA突变同义地使用，并且是指位点特异性修饰的引入，其修改或改变植物(例如稻)的特定基因组基因座处的核苷酸序列。

在某些实施例中，靶向DNA修饰发生在基因组基因座，所述基因组基因座包含参与开花时间调节(FTR)的多核苷酸。

在某些实施例中，参与FTR的多核苷酸是编码以下的多核苷酸：含反应调节子接收结构域的蛋白、含CCT基序的蛋白、BHLH转录因子、TCP家族转录因子、含NAC结构域的蛋白、含微管蛋白/FtsZ结构域的蛋白、hsp20/α晶体蛋白、核心组蛋白H2A/H2B/H3/H4推定蛋白、AAA型ATP酶家族蛋白、含通用胁迫蛋白结构域的蛋白、PHD指家族蛋白、和/或甲基结合结构域蛋白。

FTR中涉及的多核苷酸的多核苷酸序列、编码的蛋白质和相应的基因组基因座是本领域已知的，或者可以使用本领域的常规方法容易地鉴定。在某些实施例中，参与FTR的多核苷酸编码多肽，所述多肽包含与选自由SEQ ID NO：14-26组成的组的氨基酸序列至少90％(例如，91％、92％、93％、94％、95％、96％、97％、98％、99％、或100％)相同的氨基酸序列。

序列比对和同一性百分比计算可以使用设计用于检测相似或相同序列的多种比较方法来确定，所述方法包括但不限于

生物信息计算包(

公司(

Inc.)，麦迪逊(Madison)，威斯康星州)的

程序。除非另外说明，本文提供的序列的多重比对用Clustal V比对方法(Higgins和Sharp(1989)，CABIOS.[计算机在生物学中的应用]5：151-153)和默认参数(空位罚分＝10，空位长度罚分＝10)进行。使用Clustal V方法进行逐对比对和蛋白质序列的同一性百分比计算的默认参数为KTUPLE＝1、空位罚分＝3、窗口(WINDOW)＝5、以及存储的对角线(DIAGONALS SAVED)＝5。对于核酸，这些参数是KTUPLE＝2、空位罚分＝5、窗口＝4、并且存储的对角线＝4。使用Clustal V程序比对序列后，通过查看相同程序中的“序列距离”表来获得“同一性百分比”和“散度”值是可能的；除非另外说明，本文提供的和申明的同一性百分比和散度是以该方式计算的。

可替代地，可以使用Clustal W比对方法。Clustal W比对方法(描述于Higgins和Sharp，CABIOS.[计算机在生物学中的应用]5：151-153(1989)；Higgins，D.G.等人，Comput.Appl.Biosci.[计算机应用生物科学]8：189-191(1992))可以在

生物信息计算包(

公司，麦迪逊，威斯康星州)的MegAlign^TM v6.1程序中找到。用于多重比对的默认参数对应于空位罚分＝10、空位长度罚分＝0.2、延迟发散序列(Delay Divergent Sequence)＝30％、DNA转换权重＝0.5、蛋白质权重矩阵＝Gonnet系列、DNA权重矩阵＝IUB。对于逐对比对，默认参数为比对＝缓慢-精确(Slow-Accurate)、空位罚分＝10.0、空位长度＝0.10、蛋白质权重矩阵＝Gonnet 250并且DNA权重矩阵＝IUB。用Clustal W程序比对序列后，通过查看相同程序中的“序列距离”表来获得“同一性百分比”和“散度”值是可能的。

在一个实施例中，在分子(核苷酸或氨基酸)的整个长度上测定序列同一性％。

本文所述的靶向DNA修饰可以是本领域已知的任何修饰，诸如，例如，插入、缺失、单核苷酸多态性(SNP)、和或多核苷酸修饰。另外，基因组基因座上的靶向DNA修饰可位于基因组基因座上的任何位置，诸如，例如，所编码的多肽的编码区(例如，外显子)、非编码区(例如，内含子)、调节元件、或非翻译区。

FTP多核苷酸的靶向DNA修饰的类型和位置不受特别限制，只要靶向DNA修饰导致由FTR多核苷酸编码的蛋白质的表达或活性减少即可。在某些实施例中，所述靶向DNA修饰是在基因组基因座中缺失一个或多个核苷酸(优选是连续的)。

如本文使用的“减少的”、“减少”等是指与对照组(例如，不包含靶向DNA修饰的野生型稻植物)相比，实验组(例如，具有本文所述的靶向DNA修饰的稻植物)中的任何可检测的降低。

因此，减少的蛋白质表达包含样品中蛋白质总水平的任何可检测的降低，并且可使用本领域的常规方法来确定，例如，蛋白质印迹法和ELISA。

在某些实施例中，由FTR多核苷酸编码的蛋白质的表达或活性的减少是由于导致以下一项或多项的在植物的基因组基因座处的靶向DNA修饰：(a)FTR多核苷酸的表达减少；(b)FTR多核苷酸编码的蛋白质的转录活性减少；(c)FTR多核苷酸的一种或多种可变剪接转录物的产生；(d)编码的FTR多肽的一个或多个DNA结合结构域的缺失；(e)FTR多核苷酸的一个或多个外显子的移码突变；(f)FTR多核苷酸的实质部分的缺失或FTR多核苷酸的全开放阅读框的缺失；(g)抑制存在于编码FTR多核苷酸的调节区内的增强基序的抑制；或(h)一个或多个核苷酸的修饰或可操作地连接至FTR多核苷酸的表达的调节元件的缺失，其中所述调节元件存在于启动子、内含子、3′UTR、终止子或其组合中。

在某些实施例中，在参与FTR的基因组基因座处的靶向DNA修饰导致与对照植物相比表现出早熟的植物(例如稻)。例如，与对照植物相比，表现出早开花的植物。在某些实施例中，经修饰的植物的第一次开花发生在比对照植物早约5至15(例如5至14、5至13、5至12、5至11、5至10、5至9、5至8、5至7、5至6)天的范围内。在某些实施例中，导致早熟的靶向DNA修饰发生在包含参与FTR的多核苷酸的基因组基因座处，所述多核苷酸编码以下：含反应调节子接收结构域的蛋白、含CCT基序的蛋白、BHLH转录因子、TCP家族转录因子、含NAC结构域的蛋白、含微管蛋白/FtsZ结构域的蛋白、hsp20/α晶体蛋白、和/或核心组蛋白H2A/H2B/H3/H4推定蛋白。在某些实施例中，导致早熟的DNA修饰是在基因组基因座处参与FTR的多核苷酸的缺失。

在其他实施例中，与对照植物相比，靶向DNA修饰导致植物(例如，稻)表现出晚熟。例如，与对照植物相比，所述植物表现出延迟的第一次开花时间。在某些实施例中，与对照植物相比，所述植物的成熟减少了约5％-50％。换句话说，与对照植物相比，经修饰的植物需要约5％-50％更长的时间(例如，天数)才能达到特定的发育阶段。在某些实施例中，导致晚熟的靶向DNA修饰发生在包含参与FTR的多核苷酸的基因组基因座处，所述多核苷酸编码AAA型ATP酶家族蛋白、含通用胁迫蛋白结构域的蛋白、PHD指家族蛋白、或甲基结合结构域蛋白。在某些实施例中，导致晚熟的DNA修饰是在基因组基因座处参与FTR的多核苷酸的缺失。

在某些实施例中，所述基因组基因座具有超过一个(例如，2个、3个、4个、5个、6个、7个、8个、9个、或10个)靶向DNA修饰。例如，基因组基因座的翻译区和调节元件可各自包含靶向DNA修饰。

在某些实施例中，所述植物可以在参与所述植物(例如稻)的开花时间调节的超过一个(例如2、3、4、5、6、7、8、9或10个)基因组基因座处具有靶向DNA修饰。

在本文所述的方法的某些实施例中，修饰植物成熟的一个或多个DNA修饰不会不利地影响其他农艺性状。例如，在某些实施例中，在包含参与FTR的多核苷酸的基因组基因座处的靶向DNA修饰与不包含修饰的对照植物相比不：(a)显著减少谷粒产率，如通过每株稻植物或作为每单位面积的稻植物群体所测量的，(b)显著减少株高，如通过植物高度减少测量的，和/或(c)不显著改变根结构和/或根倒伏。

可以使用本领域已知的任何基因组修饰技术来完成基因组基因座的靶向DNA修饰。在某些实施例中，通过基因组修饰技术进行靶向DNA修饰，所述基因组修饰技术选自由以下组成的组：多核苷酸指导的内切核酸酶、CRISPR-Cas内切核酸酶、碱基编辑脱氨酶、锌指核酸酶、转录激活子样效应子核酸酶(TALEN)、工程化位点特异性大范围核酸酶、或Argonaute。

在一些实施例中，可以通过在所需改变附近的基因组中的确定位置诱导双链断裂(DSB)或单链断裂来促进基因组修饰。可以使用任何可用的DSB诱导剂诱导DSB，所述诱导剂包括但不限于，TALEN、大范围核酸酶、锌指核酸酶、Cas9-gRNA系统(基于细菌性CRISPR-Cas系统)、指导的cpf1内切核酸酶系统等。在一些实施例中，可以将DSB的引入与多核苷酸修饰模板的引入组合。

可以通过本领域已知的任何方法将多核苷酸修饰模板引入细胞中，所述方法例如但不限于瞬时引入方法、转染、电穿孔、显微注射、颗粒介导的递送、局部施用、晶须介导的递送、经由细胞穿透肽的递送或介孔二氧化硅纳米颗粒(MSN)介导的直接递送。

可以将多核苷酸修饰模板作为单链多核苷酸分子、双链多核苷酸分子或作为环状DNA(载体DNA)的一部分引入细胞中。所述多核苷酸修饰模板还可以与指导RNA和/或Cas内切核酸酶进行系链。系链的DNA可以允许共定位靶标和模板DNA，可用于基因组编辑和靶向的基因组调控，并且还可以用于靶向有丝分裂后期细胞，在这些细胞中内源性HR机制的功能预计会大大降低(Mali等人2013Nature Methods[自然方法]第10卷：957-963)。所述多核苷酸修饰模板可以瞬时地存在于细胞中，或可以经由病毒复制子引入。

“经修饰的核苷酸”或“经编辑的核苷酸”是指当与其非修饰的核苷酸序列相比时，包含至少一个改变的目的核苷酸序列。此类“改变”包括，例如：(i)至少一个核苷酸的替代、(ii)至少一个核苷酸的缺失、(iii)至少一个核苷酸的插入、或(iv)(i)-(iii)的任何组合。

术语“多核苷酸修饰模板”包括，当与待编辑的核苷酸序列相比时，包含至少一个核苷酸修饰的多核苷酸。核苷酸修饰可以是至少一个核苷酸取代、添加或缺失。任选地，多核苷酸修饰模板可以进一步包含位于至少一个核苷酸修饰侧翼的同源核苷酸序列，其中侧翼同源核苷酸序列为待编辑的希望的核苷酸序列提供了充足同源性。

组合DSB和修饰模板的基因组序列的编辑过程通常包括：向宿主细胞提供DSB诱导剂或编码DSB诱导剂的核酸(识别染色体序列中的靶序列并且能够诱导基因组序列中的DSB)，和与待编辑的核苷酸序列相比时包含至少一个核苷酸改变的至少一个多核苷酸修饰模板。多核苷酸修饰模板还可以包含侧翼于所述至少一个核苷酸变化的核苷酸序列，其中侧翼序列与侧翼于DSB的染色体区域基本同源。

内切核酸酶可以通过本领域已知的任何方法提供给细胞，所述方法例如但不限于瞬时引入方法、转染、显微注射、和/或局部施用、或间接经由重组构建体。内切核酸酶可以作为蛋白质或作为指导多核苷酸复合物直接提供给细胞或经由重组构建体间接提供。使用本领域已知的任何方法，可以瞬时地将内切核酸酶引入细胞中，或可以将内切核酸酶并入宿主细胞的基因组中。在CRISPR-Cas系统的情况下，如2016年5月12日公开的WO2016073433中所述的，可以用细胞穿透肽(CPP)促进内切核酸酶和/或指导多核苷酸摄入进细胞。

如本文所用的，“基因组区域”是存在于靶位点任一例上的细胞的基因组中的染色体的区段，或者可替代地，进一步包含靶位点的一部分。基因组区域可以包含至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-2800。5-2900、5-3000、5-3100或更多个碱基，这样使得基因组区域具有足够的同源性以与相应的同源区域进行同源重组。

TAL效应子核酸酶(TALEN)是一类序列特异性核酸酶，其可以被用于在植物或其他生物体的基因组中特异性靶序列处造成双链断裂。(Miller等人(2011)NatureBiotechnology[自然生物技术]29：143-148)。

内切核酸酶是在多核苷酸链内切割磷酸二酯键的酶。内切核酸酶包括限制性内切核酸酶，其在特异性位点处切割DNA而不损坏碱基；并且包括大范围核酸酶，也称为归巢内切核酸酶(HE酶)，其相似于限制性内切核酸酶，在特异性识别位点处结合并且切割，然而对于大范围核酸酶，识别位点典型地更长，约18bp或更长(于2012年3月22日提交的专利申请PCT/US12/30061)。基于保守的序列基序将大范围核酸酶分类为四个家族，所述家族是LAGLIDADG、GIY-YIG、H-N-H、和His-Cys box家族。这些基序参与金属离子的配位和磷酸二酯键的水解。HE酶的显著之处在于它们的长识别位点，并且还在于耐受其DNA底物中的一些序列多态性。对于大范围核酸酶的命名约定相似于对其他限制性内切核酸酶的约定。大范围核酸酶还分别表征为针对由独立的ORF、内含子、和内含肽编码的酶的前缀F-、I-、或PI-。在重组过程中的一个步骤涉及在识别位点处或在所述识别位点附近的多核苷酸切割。可以将切割活性用于产生双链断裂。对于位点特异性重组酶和它们的识别位点的综述，参见，Sauer(1994)Curr Op Biotechnol[生物技术新见]5：521-7；以及Sadowski(1993)FASEB[美国实验生物学学会联合会杂志]7：760-7。在一些实例中，重组酶来自整合酶(Integrase)或解离酶(Resolvase)家族。

锌指核酸酶(ZFN)是由锌指DNA结合结构域和双链-断裂-诱导剂结构域组成的工程化双链断裂诱导剂。识别位点特异性由锌指结构域赋予，所述锌指结构域典型地包含两个、三个、或四个锌指，例如具有C2H2结构，然而其他锌指结构是已知的并且已经被工程化。锌指结构域适于设计特异性结合所选择的多核苷酸识别序列的多肽。ZFN包括连接至非特异性内切核酸酶结构域(例如来自IIs型内切核酸酶例如FokI的核酸酶结构域)的工程化DNA结合锌指结构域。额外的功能性可以融合到锌指结合结构域中，所述额外的功能性包括转录激活子结构域、转录阻遏物结构域、和甲基化酶。在一些实例中，核酸酶结构域的二聚化是切割活性所需的。每个锌指在靶DNA中识别三个连续的碱基对。例如，3指结构域识别9个连续核苷酸的序列，由于所述核酸酶的二聚化需要，因此两组锌指三联体用于结合18个核苷酸的识别序列。

例如在2015年3月19日公开的美国专利申请US 2015-0082478 A1、2015年2月26日公开的WO 2015/026886 A1、2016年1月14日公开的WO 2016007347、以及2016年2月18日公开的WO 201625131(将其全部通过引用并入本文)中已经描述了使用DSB诱导剂(例如Cas9-gRNA复合物)进行的基因组编辑。

本文中术语“Cas基因”是指在细菌系统中通常与侧翼CRISPR基因座偶联、缔合或接近或在邻近处的基因。术语“Cas基因”，“CRISPR相关的(Cas)基因”在本文中可互换地使用。本文的术语“Cas内切核酸酶”是指由Cas基因编码的蛋白质。当与适合的多核苷酸组分复合时，本文的Cas内切核酸酶能够识别、结合特异性DNA靶序列的全部或部分、并任选地使特异性DNA靶序列的全部或部分产生切口或切割特异性DNA靶序列的全部或部分。本文描述的Cas内切核酸酶包含一个或多个核酸酶结构域。本公开的Cas内切核酸酶包括具有HNH或HNH-样核酸酶结构域和/或RuvC或RuvC-样核酸酶结构域的那些。本公开的Cas内切核酸酶包括Cas9蛋白、Cpfl蛋白、C2c1蛋白、C2c2蛋白、C2c3蛋白、Cas3、Cas5、Cas7、Cas8、Cas10或这些的复合物。

如本文所用的，术语“指导多核苷酸/Cas内切核酸酶复合物”、“指导多核苷酸/Cas内切核酸酶系统”、“指导多核苷酸/Cas复合物”、“指导多核苷酸/Cas系统”、“指导Cas系统”在本文中可互换地使用，并且是指能够形成复合物的至少一种指导多核苷酸和至少一种Cas内切核酸酶，其中所述指导多核苷酸/Cas内切核酸酶复合物可以将Cas内切核酸酶引导至DNA靶位点，使Cas内切核酸酶能够识别、结合到、并任选地使DNA靶位点产生切口或切割(引入单链或双链断裂)DNA靶位点。本文中指导多核苷酸/Cas内切核酸酶复合物可以包含四种已知的CRISPR系统(Horvath和Barrangou，2010，Science[科学]327：167-170)(例如I型、II型或III型CRISPR系统)中任一种的一种或多种Cas蛋白和一种或多种合适的多核苷酸组分。Cas内切核酸酶在靶序列处解开DNA双链体并任选地切割至少一条DNA链，如通过由与Cas蛋白复合的多核苷酸(例如但不限于crRNA或指导RNA)识别靶序列所介导的。如果正确的前间区序列邻近基序(PAM)位于或相邻于DNA靶序列的3′末端，则通过Cas内切核酸酶对靶序列进行的此类识别和切割典型地会发生。可替代地，本文中的Cas蛋白可能缺乏DNA切割或切口活性，但是当与合适的RNA组分复合时，仍然可以特异性结合DNA靶序列。(还参见于2015年3月19日公开的美国专利申请US 2015-0082478 A1和于2015年2月26日公开的US 2015-0059010 A1，两者均通过引用以其全文特此并入)。

指导多核苷酸/Cas内切核酸酶复合物可以切割DNA靶序列的一条或两条链。可以切割DNA靶序列的两条链的指导多核苷酸/Cas内切核酸酶复合物典型地包含具有处于功能状态的所有其内切核酸酶结构域的Cas蛋白(例如野生型内切核酸酶结构域或其变体在每个内切核酸酶结构域中保留一些或全部活性)。适用于本文使用的Cas9切口酶的非限制性实例公开于美国专利申请公开号2014/0189896中，将其通过引用并入本文。

其他Cas内切核酸酶系统已经在2016年5月12日提交的PCT专利申请PCT/US16/32073和2016年5月12日提交的PCT/US16/32028中描述，将这两个申请通过援引并入本文中。

本文中的“Cas9”(以前称为Cas5、Csn1、或Csx12)是指与cr核苷酸和tracr核苷酸或与单指导多核苷酸形成复合物的II型CRISPR系统的Cas内切核酸酶，其用于特异性识别和切割DNA靶序列的全部或部分。Cas9蛋白包含RuvC核酸酶结构域和HNH(H-N-H)核酸酶结构域，它们各自可以在靶序列处切割单个DNA链(两个结构域的协同作用导致DNA双链切割，而一个结构域的活性导致一个切口)。通常，RuvC结构域包含亚结构域I、II和III，其中结构域I位于Cas9的N-末端附近，并且亚结构域II和III位于蛋白质的中间，即位于HNH结构域的侧翼(Hsu等人，Cell[细胞]，157：1262-1278)。II型CRISPR系统包括利用与至少一种多核苷酸组分复合的Cas9内切核酸酶的DNA切割系统。例如，Cas9可以与CRISPR RNA(crRNA)和反式激活CRISPR RNA(tracrRNA)复合。在另一个实例中，Cas9可以与单一指导RNA复合。

任何指导的内切核酸酶可以用于本文公开的方法中。此类内切核酸酶包括但不限于Cas9和Cpf1内切核酸酶。迄今为止，已经描述了许多可以识别特定PAM序列(参见例如-Jinek等人(2012)Science[科学]337p 816-821，2016年5月12日提交的PCT专利申请PCT/US16/32073和2016年5月12日提交的PCT/US16/32028，以及Zetsche B等人2015.Cell[细胞]163，1013)并在特定位置切割靶DNA的内切核酸酶。应当理解的是，基于本文所述的使用指导的Cas系统的方法和实施例，现在人们可以定制这些方法这样使得它们可以利用任何指导的内切核酸酶系统。

指导多核苷酸也可以是包含连接至tracr核苷酸序列的cr核苷酸序列的单分子(也称为单指导多核苷酸)。单指导多核苷酸包含可以与靶DNA中的核苷酸序列杂交的第一核苷酸序列结构域(被称为可变靶向结构域或VT结构域)和与Cas内切核酸酶多肽相互作用的Cas内切核酸酶识别结构域(CER结构域)。“结构域”意指可以为RNA、DNA和/或RNA-DNA组合序列的核苷酸的连续延伸。单指导多核苷酸的VT结构域和/或CER结构域可以包含RNA序列、DNA序列或RNA-DNA组合序列。由来自cr核苷酸和tracr核苷酸的序列构成的单指导多核苷酸可以被称为“单指导RNA”(当由RNA核苷酸的连续延伸构成时)或“单指导DNA”(当由DNA核苷酸的连续延伸构成时)或“单指导RNA-DNA”(当由RNA和DNA核苷酸的组合构成时)。单指导多核苷酸可以与Cas内切核酸酶形成复合物，其中所述指导多核苷酸/Cas内切核酸酶复合物(还称为指导多核苷酸/Cas内切核酸酶系统)可以将Cas内切核酸酶引导至基因组靶点，使所述Cas内切核酸酶能够识别、结合靶点、并任选地使靶点产生切口或切割靶位点(引入单链或双链断裂)。(还参见于2015年3月19日公开的美国专利申请US 2015-0082478 A1和于2015年2月26日公开的US 2015-0059010 A1，两者均通过引用以其全文特此并入)。

术语“可变靶向结构域”或“VT结构域”在本文中可互换使用，并且包括可以与双链DNA靶位点的一条链(核苷酸序列)杂交(互补)的核苷酸序列。在一些实施例中，可变靶向结构域包含12至30个核苷酸的连续延伸。可变靶向结构域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列或其任何组合构成。

术语“单指导RNA”和“sgRNA”在本文中可互换使用，并涉及两个RNA分子的合成融合，其中包含可变靶向结构域(与tracrRNA杂交的tracr配对序列连接)的crRNA(CRISPRRNA)与tracrRNA(反式激活CRISPR RNA)融合。单指导RNA可以包含可与II型Cas内切核酸酶形成复合物的II型CRISPR/Cas系统的crRNA或crRNA片段和tracrRNA或tracrRNA片段，其中所述指导RNA/Cas内切核酸酶复合物可以将Cas内切核酸酶引导至DNA靶位点，使得Cas内切核酸酶能够识别、结合DNA靶位点、并任选地使DNA靶位点产生切口或切割(引入单链或双链断裂)DNA靶位点。

术语“指导RNA/Cas内切核酸酶复合物”、“指导RNA/Cas内切核酸酶系统”、“指导RNA/Cas复合物”、“指导RNA/Cas系统”、“gRNA/Cas复合物”、“gRNA/Cas系统”、“RNA-指导的内切核酸酶”，“RGEN”在本文中可互换地使用并且意指至少一种RNA组分和至少一种能够形成复合物的Cas内切核酸酶，其中所述指导RNA/Cas内切核酸酶复合物可以将Cas内切核酸酶引导至DNA靶位点，使Cas内切核酸酶能够识别、结合DNA靶位点并任选地使DNA靶位点产生切口或切割(引入单链或双链断裂)DNA靶位点。本文中的指导RNA/Cas内切核酸酶复合物可以包含四种已知的CRISPR系统(Horvath和Barrangou，2010，Science[科学]327：167-170)(诸如I型、II型或III型CRISPR系统)中任一种的一种或多种Cas蛋白和一种或多种合适的RNA组分。指导RNA/Cas内切核酸酶复合物可以包括II型Cas9内切核酸酶和至少一种RNA组分(例如，crRNA和tracrRNA、或gRNA)。(还参见于2015年3月19日公开的美国专利申请US2015-0082478 A1和于2015年2月26日公开的US 2015-0059010 A1，两者均通过引用以其全文特此并入)。

本文描述的方法和组合物的指导多核苷酸可以是靶向植物细胞的基因组基因座的任何多核苷酸序列，所述基因组基因座包含编码氨基酸序列的多核苷酸，所述氨基酸序列与选自由SEQ ID NO：14-26组成的组的序列至少90％(例如，91％、92％、93％、94％、95％、96％、97％、98％、99％、或100％)相同。在某些实施例中，所述指导多核苷酸是指导RNA。所述指导多核苷酸也可以存在于重组DNA构建体中。

使用在本领域已知的任何方法(例如，但不限于，粒子轰击、农杆菌转化或局部施用)，可以将作为单链多核苷酸或双链多核苷酸的指导多核苷酸瞬时地引入细胞。指导多核苷酸还可以通过引入(通过，诸如但不限于粒子轰击或农杆菌转化等方法)包含编码指导多核苷酸的异源核酸片段的重组DNA分子被间接引入细胞，所述重组DNA分子可操作地连接于能够在所述细胞转录所述指导RNA的特异性启动子。特异性启动子可以是但不限于RNA聚合酶III启动子，其允许具有精确定义的未修饰的5′末端和3′末端的RNA转录(DiCarlo等人，Nucleic Acids Res.[核酸研究]41：4336-4343；Ma等人，Mol.Ther.Nucleic Acids[分子治疗-核酸]3：e161)，如在2016年2月18日公开的WO 2016025131中所述，其通过援引以其全文并入本文。

术语“靶位点”、“靶序列”、“靶位点序列”、“靶DNA”、“靶基因座”、“基因组靶位点”、“基因组靶序列”、“基因组靶基因座”和“前间区”在本文中可互换地使用，并且意指多核苷酸序列，例如，但不限于，在细胞的染色体、附加体，或基因组中的任何其他DNA分子(包括染色体DNA、叶绿体DNA、线粒体DNA、质粒DNA)上的核苷酸序列，在所述序列处指导多核苷酸/Cas内切核酸酶复合物可以进行识别、结合并任选地产生切口或进行切割。靶位点可以是细胞的基因组中的内源位点，或者可替代地，靶位点对于该细胞可以是异源的并且从而不是天然存在于细胞的基因组中，或者与在自然界发生的位置相比，可以在异质基因组位置中找到靶位点。如本文所用，术语“内源性靶序列”和“天然靶序列”在本文中可互换使用，是指对细胞基因组来说是内源的或天然的、并且位于细胞的基因组中该靶序列的内源或天然位置处的靶序列。细胞包括但不限于人、非人、动物、细菌、真菌、昆虫、酵母、非常规酵母和植物细胞，以及通过本文所述的方法产生的植物和种子。“人工靶位点”或“人工靶序列”在本文中可互换使用，并且是指已经引入细胞的基因组中的靶序列。这种人工靶序列可以在序列上与细胞的基因组中的内源或天然靶序列相同，但是位于细胞的基因组中的不同位置(即，非内源的或非天然的位置)处。

“改变的靶位点”、“改变的靶序列”、“修饰的靶位点”、“修饰的靶序列”在本文中可互换使用，并且是指如本文公开的靶序列，当与非改变的靶序列相比时，所述靶序列包含至少一个改变。此类“改变”包括，例如：(i)至少一个核苷酸的替代、(ii)至少一个核苷酸的缺失、(iii)至少一个核苷酸的插入、或(iv)(i)-(iii)的任何组合。

用于“修饰靶位点”和“改变靶位点”的方法在本文中可互换使用，并且是指用于产生改变的靶位点的方法。

靶DNA序列(靶位点)的长度可以变化，并且包括例如为至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个核苷酸长度的靶位点。还有可能靶位点可以是回文的，即，一条链上的序列与在互补链上以相反方向的读取相同。切口/切割位点可以在靶序列内，或者切口/切割位点可以在靶序列之外。在另一种变异中，切割可以发生在彼此正好相对的核苷酸位置处，以产生平端切割，或者在其他情况下，切口可以交错以产生单链突出端，也称为“粘性端”，其可以是5′突出端抑或3′突出端。还可以使用基因组靶位点的活性变体。此类活性变体可以包含与给定靶位点至少65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性，其中所述活性变体保留生物活性，因此能够被Cas内切核酸酶识别和切割。测量由内切核酸酶引起的靶位点的单链或双链断裂的测定是本领域已知的，并且通常测量试剂在含有识别位点的DNA底物上的总体活性和特异性。

本文中的“前间区序列邻近基序”(PAM)指与由本文所述的指导多核苷酸/Cas内切核酸酶系统识别的(靶向的)靶序列(前间区序列)邻近的短核苷酸序列。如果靶DNA序列后面不是PAM序列，则Cas内切核酸酶可能无法成功识别所述靶DNA序列。本文中的PAM的序列和长度可以取决于所使用的Cas蛋白或Cas蛋白复合物而不同。所述PAM序列可以是任何长度，但典型地是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸长度。

术语“靶向”、“基因靶向”和“DNA靶向”在本文中可互换地使用。本文中的DNA靶向可能是在特异性的DNA序列(例如细胞的染色体或质粒)中特异性引入敲除、编辑、或敲入。通常，本文中可以通过在具有与合适的多核苷酸组分缔合的内切核酸酶的细胞中的特异性DNA序列处切割一条或两条链来进行DNA靶向。这种DNA切割，如果是双链断裂(DSB)，可以促进NHEJ或HDR过程，这可能导致靶位点处的修饰。

本文的靶向方法能以例如在该方法中靶向两个或更多个DNA靶位点的这样的方式进行。这种方法可以任选地被表征为多重方法。在某些实施例中，可以同时靶向两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个靶位点。多重方法典型地通过本文的靶向方法进行，其中提供了多个不同的RNA组分，每一个被设计成将指导多核苷酸/Cas内切核酸酶复合物引导到唯一的DNA靶位点。

术语“敲除”、“基因敲除”和“基因敲除”在本文中可互换使用。敲除表示已经通过用Cas蛋白进行靶向使得细胞的DNA序列部分或完全无效；例如，这种DNA序列在敲除之前可能已编码氨基酸序列，或可能已具有调节功能(例如启动子)。可以通过插入缺失(通过NHEJ在靶DNA序列中插入或缺失核苷酸碱基)，或通过特异性去除在靶向位点处或其附近处降低或完全破坏序列功能的序列来产生敲除。

指导多核苷酸/Cas内切核酸酶系统可以与共同递送的多核苷酸修饰模板组合使用以允许编辑(修饰)目的基因组核苷酸序列。(还参见于2015年3月19日公开的美国专利申请US 2015-0082478 A1和2015年2月26日公开的WO 2015/026886 A1，两者均通过引用以其全文特此并入)。

术语“敲入”、“基因敲入”、“基因插入”和“基因敲入”在本文中可互换使用。敲入代表通过用Cas蛋白靶向在细胞中的特异性DNA序列处进行的DNA序列的替换或插入(通过HR，其中还使用合适的供体DNA多核苷酸)。敲入的实例是异源氨基酸编码序列在基因的编码区中的特异性插入，或转录调节元件在遗传基因座中的特异性插入。

可以采用不同方法和组合物来获得细胞或生物，所述细胞或生物具有插入到针对Cas内切核酸酶的靶位点中的目的多核苷酸。此类方法可以采用同源重组以提供目的多核苷酸在靶位点处的整合。在提供的一种方法中，在供体DNA构建体中将目的多核苷酸提供至生物细胞。如本文所用的，“供体DNA”是包括待插入到Cas内切核酸酶的靶位点的目的多核苷酸的DNA构建体。供体DNA构建体进一步包含位于目的多核苷酸侧翼的同源的第一区域和第二区域。供体DNA的同源的第一区域和第二区域分别与存在于细胞或生物基因组的靶位点中或位于所述靶位点侧翼的第一和第二基因组区域具有同源性。“同源”意指DNA序列是相似的。例如，在供体DNA上发现的“与基因组区域同源的区域”是与细胞或生物体基因组中给定的“基因组序列”具有类似序列的DNA的区域。同源的区域可以具有足以促进在切割的靶位点处的同源重组的任何长度。例如，同源的区域的长度可以包括至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-2800、5-2900、5-3000、5-3100或更多个碱基，这样使得同源的区域具有足够的同源性以与相应的基因组区域进行同源重组。“足够的同源性”表示两个多核苷酸序列具有足够的结构相似性以充当同源重组反应的底物。结构相似性包括每个多核苷酸片段的总长度以及多核苷酸的序列相似性。序列相似性可以通过在序列的整个长度上的百分比序列同一性和/或通过包含局部相似性(例如具有100％序列同一性的连续核苷酸)的保守区域以及在序列长度的一部分上的百分比序列同一性来描述。

靶标和供体多核苷酸具有的序列同一性的量可以变化，并且包括总长度和/或在约1-20bp、20-50bp、50-100bp、75-150bp、100-250bp、150-300bp、200-400bp、250-500bp、300-600bp、350-750bp、400-800bp、450-900bp、500-1000bp、600-1250bp、700-1500bp、800-1750bp、900-2000bp、1-2.5kb、1.5-3kb、2-4kb、2.5-5kb、3-6kb、3.5-7kb、4-8kb、5-10kb，或多达并包括靶位点的总长度的范围内具有单位整数值的区域。这些范围包括所述范围内的每个整数，例如1-20bp的范围包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19和20bp。同源性的量也可以通过在两个多核苷酸的完整比对长度上的百分比序列同一性来描述，其包括约至少50％、55％、60％、65％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的百分比序列同一性。足够的同源性包括多核苷酸长度、总体百分比序列同一性，和任选地连续核苷酸的保守区域或局部百分比序列同一性的任何组合，例如，足够的同源性可以被描述为与靶基因座的区域具有至少80％序列同一性的75-150bp的区域。还可以通过用来在高严格条件下特异性杂交的两个多核苷酸的预测能力来描述足够的同源性，参见例如Sambrook等人，(1989)Molecular Cloning：ALaboratory Manual[分子克隆：实验室手册](Cold Spring Harbor Laboratory Press，NY[纽约冷泉港实验室出版社])；Current Protocols in Molecular Biology[分子生物学现代方案]，Ausubel等人，编辑(1994)Current Protocols[实验室指南](Greene PublishingAssociates，Inc.[格林出版合伙公司]和John Wiley&Sons，Inc.[约翰威利父子公司])；以及Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes[生物化学和分子生物学中的实验室技术--与核酸探针杂交](Elsevier[爱思唯尔出版社]，纽约)。

在给定的基因组区域和在供体DNA上发现的相应的同源的区域之间的结构相似性可以是允许同源重组发生的任何程度的序列同一性。例如，由供体DNA的“同源的区域”和生物体基因组的“基因组区域”共享的同源性或序列同一性的量可以是至少50％、55％、60％、65％、70％、75％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性，这样使得序列进行同源重组

供体DNA上的同源的区域可以与靶位点侧翼的任何序列具有同源性。虽然在一些实施例中，同源的区域与紧邻靶位点侧翼的基因组序列共享显著的序列同源性，但是应当认识到同源的区域可以被设计为与可能更靠近靶位点的5′或3′的区域具有足够的同源性。在又其他实施例中，同源的区域还可以与靶位点的片段以及下游基因组区域具有同源性。在一个实施例中，第一同源的区域进一步包含靶位点中的第一片段，并且第二同源的区域包含靶位点中的第二片段，其中第一片段和第二片段不同。

如本文所用的，“同源重组”包括在同源的位点处的两个DNA分子之间的DNA片段的交换。

指导RNA/Cas内切核酸酶系统的另外的用途已进行了描述(参见2015年3月19日公开的美国专利申请US 2015-0082478 A1、2015年2月26日公开的WO2015/026886 A1、2015年2月26日公开的US 2015-0059010 A1、2014年7月7日提交的美国申请62/023246，和2014年8月13日提交的美国申请62/036,652，将其全部通过引用结合在此)，并包括，但不限于修饰或取代目的核苷酸序列(如调节元件)、目的多核苷酸插入、基因敲除、基因敲入、剪接位点的修饰和/或引入交替剪接位点、编码目的蛋白的核苷酸序列的修饰、氨基酸和/或蛋白质融合物、以及通过在目的基因中表达反向重复序列引起的基因沉默。

已经公开了主要通过使用根癌农杆菌(Agrobacterium tumefaciens)来转化双子叶植物并获得转基因植物的方法，尤其是对于棉花(美国专利号5,004,863、美国专利号5,159,135)；大豆(美国专利号5,569,834、美国专利号5,416,011)；芸苔(美国专利号5,463,174)；花生(Cheng等人，Plant Cell Rep.[植物细胞报告]15：653-657(1996)，McKently等人，Plant Cell Rep.[植物细胞报告]14：699-703(1995))；木瓜(Ling等人，Bio/technology[生物技术]9：752-758(1991))；和豌豆(Grant等人，Plant Cell Rep.[植物细胞报告]15：254-258(1995))。对于其他常用的植物转化方法的综述参见如下文献：Newell，C.A.，Mol.Biotechnol.[分子生物技术]16：53-65(2000)。这些转化方法之一使用发根土壤杆菌(Tepfler，M.和Casse-Delbart，F.，Microbiol.Sci.[微生物科学]4：24-28(1987))。已经公开了采用如下手段使用DNA的直接递送进行的大豆转化：PEG融合(PCT公开号WO 92/17598)、电穿孔(Chowrira等人，Mol.Biotechnol.[分子生物技术]3：17-23(1995)；Christou等人，Proc.Natl.Acad.Sci.U.S.A.[美国科学院院报]84：3962-3966(1987))、显微注射或粒子轰击(McCabe等人，Biotechnology[生物技术]6：923-926(1988)；Christou等人，Plant Physiol.[植物生理学]87：671-674(1988))。

有各种各样的方法用于从植物组织再生植物。特定的再生方法将取决于起始植物组织和待再生的特定植物种类。来自单一植物原生质体转化体或来自各种转化的外植体的植物的再生、发育和培养是本领域所熟知的(Weissbach和Weissbach编辑；Methods forPlant Molecular Biology[植物分子生物学方法]；Academic Press，Inc.[学术出版社有限公司]：San Diego，CA[加利福尼亚州圣地亚哥]，1988)。这种再生和生长过程典型地包括如下步骤：选择转化的细胞，通过胚性发育的通常阶段或通过生根苗阶段培养那些个体化细胞。以同样的方式再生转基因胚和种子。然后将所得的转基因生根芽苗种植在合适的植物生长培养基(如土壤)中。优选地，再生植物自花授粉以提供纯合的转基因植物。或者，将得自再生植物的花粉与农学上重要的品系的产生种子的植物进行杂交。相反地，将来自这些重要品系的植物的花粉用于给再生植物授粉。使用本领域技术人员熟知的方法培养含有所需多肽的本公开的转基因植物。

本文提供了包含SEQ ID NO：14-26所示的多核苷酸序列中的一个或多个的重组DNA构建体。

还提供了引入本文所述的多核苷酸的植物、植物细胞和/或种子。在某些实施例中，所述植物、植物细胞或种子包含重组DNA构建体，所述重组DNA构建体包含SEQ ID NO：14-26中所示的多核苷酸序列中的一个或多个。在某些实施例中，所述植物、植物细胞或种子包含重组DNA构建体，所述重组DNA构建体包含靶向植物细胞的基因组基因座的一种或多种指导多核苷酸，所述基因组基因座包含编码氨基酸序列的多核苷酸，所述氨基酸序列与选自由SEQ ID NO：14-26组成的组的序列至少90％(例如，91％、92％、93％、94％、95％、96％、97％、98％、99％、或100％)相同。

所述植物、植物细胞或种子的多核苷酸可以被稳定地引入或可以被所述植物、植物细胞或种子瞬时表达。在某些实施例中，将多核苷酸稳定地引入植物、植物细胞或种子中。

术语“多核苷酸”、“多核苷酸序列”、“核酸序列”、“核酸片段”和“分离的核酸片段”在本文中可互换使用。这些术语涵盖核苷酸序列等。多核苷酸可以是单链或双链的RNA或DNA的聚合物，其任选地包含合成的、非天然的或改变的核苷酸碱基。DNA聚合物形式的多核苷酸可以由cDNA、基因组DNA、合成DNA或其混合物的一个或多个区段组成。核苷酸(通常以其5′单磷酸形式被发现)通过单字母名称表示如下：“A”表示腺苷酸或脱氧腺苷酸(分别用于RNA或DNA)，“C”表示胞苷酸或脱氧胞苷酸，“G”表示鸟苷酸或脱氧鸟苷酸，“U”表示尿苷酸，“T”表示脱氧胸苷酸，“R”表示嘌呤(A或G)，“Y”表示嘧啶(C或T)，“K”表示G或T，“H”表示A或C或T，“I”表示肌苷，并且“N”表示任何核苷酸。

术语“重组DNA构建体”或“重组表达构建体”可互换地使用，并且通常是指可以将核酸序列或片段移动到其中的离散多核苷酸。优选地，它是包含本公开的启动子的质粒载体或其片段。质粒载体的选择取决于将用于转化宿主植物的方法。本领域技术人员非常了解必须存在于质粒载体上的遗传元件，以便成功地转化、选择和繁殖含有嵌合基因的宿主细胞。技术人员还将认识到，不同的独立的转化事件将导致表达的不同水平和模式(Jones等人，EMBO J[欧洲分子生物学学会杂志]4：2411-2418(1985)；De Almeida等人，Mol GenGenetics[分子遗传学和普通遗传学]218：78-86(1989))，并且因此必须筛选多个转植项，从而获得显示希望的表达水平和模式的品系。这种筛选可以通过DNA的PCR和Southern分析、mRNA表达的RT-PCR和Northern分析、蛋白质表达的Western分析或表型分析来完成。

术语“质粒”、“载体”和“盒”意指染色体外元件，其通常携带非细胞中心代谢的一部分的基因，并且通常处于环状双链DNA片段的形式。此类元件可以是来源于任何来源的单链或双链DNA或RNA的线性或环状自主复制序列、基因组整合序列、噬菌体或核苷酸序列，其中许多核苷酸序列已连接或重组到单一结构中，所述单一结构能够将针对选定基因产物的启动子片段和DNA序列连同适当3′未翻译序列引入到细胞中。

用于在载体中使用的启动子可以全部衍生自天然基因，或者由衍生自在自然界发现的不同启动子的不同元件构成，或者甚至包含合成的DNA区段。本领域技术人员应当理解，不同的启动子可能引导基因在不同组织或细胞类型中、或在不同发育阶段、或者响应于不同环境条件的表达。通常修饰核心启动子以产生人工、嵌合或杂合启动子，并且可以进一步与其他调节元件(例如顺式元件、5’UTR、增强子或内含子)组合使用，所述调节元件对于活性核心启动子是异源的或与其自身部分或完整的调节元件组合。在某些实施例中，重组DNA构建体的启动子可以是组织特异性启动子、受发育调控的启动子或组成型启动子。

“组织特异性启动子”和“组织偏好性启动子”可互换使用，用来指主要但不一定仅在一个组织或器官中表达，但也可以在一个特异性细胞中表达的启动子。“受发育调控的启动子”通常指其活性由发育事件决定的启动子。“组成型启动子”通常是指在所有或大多数发育阶段的植物的全部或多数组织或细胞类型中起作用的启动子。与分类为“组成型”(例如泛素)的其他启动子一样，绝对表达水平的某一变异可以存在于不同组织或阶段之间。术语“组成型启动子”或“组织独立性”在本文中可互换使用。

在某些实施例中，重组DNA构建体的启动子对表达的核苷酸序列来说是异源的。“异源核苷酸序列”通常是指不与本公开的序列一起天然存在的序列。虽然这种核苷酸序列对序列来说是异源的，但相对植物宿主，可以是同源的或天然的、或者异源的、或者外来的。然而，应当认识到，即时序列可以与其天然编码序列一起使用以增加或降低导致转化的种子中表型变化的表达。术语“异源核苷酸序列”、“异源序列”、“异源核酸片段”和“异源核酸序列”在本文中可互换使用。

可以修饰包含在本公开的重组DNA构建体中的分离的启动子序列，以提供一系列组成型表达水平的异源核苷酸序列。因此，可以利用少于整个启动子的区域并且驱动编码序列表达的能力被保留。然而，认识到，mRNA的表达水平可能随着启动子序列部分的缺失而降低。同样，表达的组织独立性、组成性性质可能会改变。

本公开的经分离的启动子序列的修饰可以提供异源核苷酸序列的一系列组成型表达。因此，它们可以被修饰为弱组成型启动子或强组成型启动子。通常，“弱启动子”意指以低水平驱动编码序列表达的启动子。“低水平”意指约1/10,000转录物至约1/100,000转录物至约1/500,000转录物的水平。相反地，强启动子以高水平或者说以约1/10转录物至约1/100个转录物至约1/1,000转录物的水平驱动编码序列的表达。类似地，“中等组成型”启动子比强组成型启动子(如玉蜀黍泛素启动子)要弱一些。

术语“可操作地连接”或“功能性地连接”通常是指核酸序列在单个核酸片段上的缔合，这样使得一个核酸片段的功能受到另一个影响。例如，当启动子能够影响编码序列的表达时，它与编码序列可操作地连接(即编码序列在启动子的转录控制下)。编码序列可以在正义或反义方向上可操作地连接到调控序列上。

术语“启动转录”、“启动表达”、“驱动转录”和“驱动表达”在本文中可互换使用，并且都是指启动子的主要功能。如本公开所详述的，启动子是非编码基因组DNA序列，通常在相关编码序列的上游(5′)，并且其主要功能是作为RNA聚合酶的结合位点，并通过RNA聚合酶启动转录。此外，当经转录的RNA最终被翻译成相应的多肽时，存在RNA(包括功能性RNA)的“表达”，或可操作地连接的编码核苷酸序列的多肽的表达。

如本文所用的，术语“表达”通常是指功能性终产物(例如mRNA或蛋白质(前体或成熟的))的产生。

如本文所用的，术语“表达盒”通常是指可以通过分子生物学技术将核酸序列或片段克隆或合成到其中的离散核酸片段。

如本文所用的，“转化”通常是指稳定转化和瞬时转化。“稳定转化”通常是指将核酸片段引入宿主生物体的基因组中，导致遗传稳定的遗传。一旦经稳定地转化，核酸片段稳定地整合入宿主生物体和任何后代的基因组中。含有经转化的核酸片段的宿主生物体被称为“转基因的”生物体。“瞬时转化”通常是指将核酸片段引入宿主生物体的细胞核或含DNA的细胞器中，导致不具遗传稳定遗传的基因表达。

术语“引入的”是指向细胞中提供核酸(例如，表达构建体)或蛋白质。引入的包括提到将核酸并入真核细胞或原核细胞中，其中可以将所述核酸并入细胞的基因组中，并且包括提到核酸或蛋白被瞬时提供至细胞中。引入的包括提到稳定或瞬时转化方法以及有性杂交。因此，在将核酸片段(例如，重组DNA构建体/表达构建体)插入细胞的上下文中，“引入的”是指“转染”、“转化”或“转导”，并且包括提到将核酸片段并入真核或原核细胞中，其中可以将所述核酸片段并入细胞的基因组(例如，染色体、质粒、质体或线粒体DNA)中，转化成自主复制子或进行瞬时表达(例如，经转染的mRNA)。

异源多核苷酸可以稳定地整合到基因组内，这样使得多核苷酸被传递给连续世代。异源多核苷酸可以单独地或作为重组DNA构建体的部分整合进基因组中。通过常规植物育种方法，通过不导致外来多核苷酸的插入的基因组编辑程序，或通过天然存在的事件(例如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变)对基因组(染色体或染色体外)的改变也是修饰宿主基因组的方法。

“瞬时表达”通常是指在选择的某些细胞类型的通过转化方法将转基因基因暂时引入其中的宿主生物体中，常规报道基因如β-葡萄糖苷酸酶(GUS)基因，荧光蛋白基因ZS-GREEN1、ZS-YELLOW1 N1、AM-CYAN1、DS-RED的暂时表达。随后在瞬时基因表达测定后弃去宿主生物体的转化的物质。

本文使用的标准重组DNA和分子克隆技术是本领域熟知的并且更全面地描述于以下文献中：Sambrook，J.等人，在Molecular Cloning：A Laboratory Manual[分子克隆：实验室手册]中；第2版；Cold Spring Harbor Laboratory Press：Cold Spring Harbor，NewYork[冷泉港实验室出版社：冷泉港，纽约]，1989(在下文中，“Sambrook等人，1989”)或Ausubel，F.M.、Brent，R.、Kingston，R.E.、Moore，D.D.、Seidman，J.G.、Smith，J.A.和Struhl，K.，编辑；在Current Protocols in Molecular Biology[分子生物学现代方法]中；John Wiley and Sons[约翰·威利父子出版公司]：纽约，1990(在下文中，“Ausubel等人，1990”)。

本文所述的组合物和方法的植物、植物细胞和种子没有特别限制，并且可以是任何植物物种，包括但不限于单子叶植物和双子叶植物。术语“单子叶”和“单子叶植物”在本文中可互换使用。本公开的单子叶植物包括稻。术语“双子叶”和“双子叶植物”在本文中可互换使用。本公开的双子叶包括以下家族：十字花科(Brassicaceae)、豆科(Leguminosae)和茄科(Solanaceae)。

在某些实施例中，所述植物是稻(Oryza)属的稻植物。在某些实施例中，所述稻植物是亚洲栽培稻(Oryza sativa)，任选地属于品种籼稻，或非洲栽培稻(Oryzaglaberrima)。在某些实施例中，所述稻植物是自交稻系(例如，雌性自交系)，而在其他实施例中，所述稻植物是杂交稻植物。

“植物”包括提到全植物、植物器官、植物组织、种子和植物细胞及其子代。植物细胞包括但不限于得自下列物质的细胞：种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。

本文所述的组合物和方法的植物、植物细胞和种子可以进一步包含异源核酸序列，所述异源核酸序列赋予植物、植物细胞和/或种子有利的特性，例如改善的农艺表现。所述异源核酸序列是本领域普通技术人员已知的，并且可以使用本领域常规方法，例如本文描述的那些，常规地掺入本文描述的植物、植物细胞和/或种子中。

在某些实施例中，异源核酸序列选自由以下组成的组：报道基因、选择标志、抗病性基因、除草剂抗性基因、昆虫抗性基因、参与碳水化合物代谢的基因、参与脂肪酸代谢的基因、参与氨基酸代谢的基因、参与植物发育的基因、参与植物生长调节的基因、参与产率改善的基因、参与抗旱性的基因、参与增加营养物利用效率的基因、参与抗寒性的基因、参与抗热性的基因、和参与抗盐性的基因。

在某些实施例中，本公开考虑了用不止一个有利的基因对受体细胞进行转化。可以使用不同的转基因编码载体或并入两种或更多种基因编码序列的单一载体在单一转化事件中供应两种或更多种基因。可以根据需要使用任何描述的任何两种或更多种基因，例如赋予除草剂、昆虫、疾病(病毒、细菌、真菌和线虫)或旱抗性以及油量和油质的那些基因，或增加产率或营养品质的那些基因。

实例

在以下实例中进一步定义本公开。从以上的讨论和这些实例中，本领域的技术人员能够确定本公开的本质特性，并且在不脱离本公开的精神和范围的情况下，可进行本公开的各种变化和修改以使其适应各种用途和条件。因此，从上述说明书来看，除了本文所示出和描述的那些之外，本公开的各种修改对于本领域技术人员来说是显而易见的。此类修改也当视为落入所附权利要求的范围内。

本文所示的每个参考文献的公开内容通过引用以其全文并入本文。

实例1

用于成熟调节的稻基因靶

该实例表明用于成熟修饰的稻基因靶的鉴定。

最佳的开花时间是确定作物产率和杂交种子产量的关键因素。成熟通常可以描述为从幼苗到收获的时间、开花时间的变化、早或晚地影响植物的成熟。如果不更好地了解参与开花时间的基因及其调控，就不可能针对生长条件调节开花时间。

为了鉴定参与稻FTR相关的基因，在田间条件下筛选了稻活化标签群体，并分析了开花表型。鉴定出与对照相比显示开花较晚或较早的品系，并克隆了在基因组DNA中在T-DNA插入位点上游和下游存在的基因，并在组成型启动子下过表达。选择在过表达后产生早开花或晚开花表型的基因以通过CRISPR-Cas介导的SDN1基因组编辑方法逆转所述表型。

实例2

参与开花时间调节的基因组基因座的靶向DNA修饰

进行实例1中鉴定的基因的基因组基因座的靶向DNA修饰，以确定对成熟的影响。

CRISPR/Cas9辅助的靶向基因组编辑提供了敲除任何基因序列并通过小缺失、靶基因内的内部小片段缺失或全长基因缺失产生敲除。通过CRISPR-Cas基因组编辑，将等位基因的新变异直接引入到优良目标种质中，其中与常规育种材料相关的遗传累赘(geneticdrag)最小。靶基因包括DP1492、DP1249、DP1856、DP1722、DP1315、DP0830、DP2300、DP1564、DP1103、DP0998、DP0885、DP0896和DP0995。下表1-5提供了指导多核苷酸和靶向策略以敲低靶基因的表达。

表1：参与FTR的多核苷酸的CRISPR/Cas靶向序列

表2：靶向FTR基因中观察到的编辑的描述

表3：单一指导构建体产生的变体中预期的编辑的描述

表4：双指导构建体产生的变体中预期的编辑的描述

表5：双指导构建体产生的变体中预期的编辑的描述

实例3

稻植物成熟调节的表型分析

稻转化

通过基因枪介导的粒子轰击产生基因组编辑的变体的方法如下所述：

1)种子灭菌和愈伤组织诱导：种子来自稻自交系；将IRV95、SDIA18G9C和SRPA17M5C在75％的乙醇中灭菌2-3分钟，并用水彻底洗涤，并在4％的次氯酸钠中孵育10分钟。然后将种子用水洗涤5次，并在室温下完全干燥。将干燥的种子接种在愈伤组织诱导培养基上，并将平板在28℃下于光照下孵育5-7天。之后，将从水稻种子中获得的增殖的愈伤组织置于渗透培养基中4小时，然后用DNA轰击：金颗粒。

2)粒子轰击：

a.金微载体的制备：称取足量的金颗粒(金颗粒的数量取决于轰击的数量)，并置于2.0ml的eppendorf管中。将1ml 100％的乙醇添加到管中，并超声30秒，然后离心1min。将含有金颗粒的沉淀重悬于1ml 100％乙醇中，涡旋30秒，并再次离心。将该步骤重复两次，然后将沉淀重悬于1ml无菌水中。将50ul金颗粒悬浮液等分到eppendorf管中，并储存于4℃下。

b.DNA和金颗粒的制备：将5μg的DNA，50μl的2.5mM CaCl2和20μl的0.1M亚精胺添加到50μl金颗粒悬浮液中；涡旋1-2分钟，并允许混合物沉降5分钟。将管离心2分钟，然后弃去上清液。将沉淀重悬于40μl 100％乙醇中，并通过涡旋轻轻混合，并将5μl样品快速分配到巨载体盘上并完全干燥。

c.使用Bio-Rad基因枪(PDS 1000)进行粒子轰击：将携带DNA：金颗粒制备物的巨载体盘装载到巨载体盘支架上，并在该盘的顶部放置一个停止屏。遵循制造商的说明将DNA：金颗粒递送至置于渗透培养基上的组织样品上。轰击后，在32℃下在黑暗中将组织样品保持在相同的渗透培养基中24小时。

3)转化变体的选择和再生：轰击后24小时后，将样品传代培养到静息培养基上，并在28℃下在黑暗中保持5天。然后将培养物转移到含有潮霉素作为选择试剂的选择培养基中。在3-4轮选择后，将增殖的，潮霉素抗性的和Zs-Yellow阳性愈伤组织变体传代培养到再生培养基上，然后传代培养到生根培养基和硬化培养基上以获得稳定的品系。将每个独立的品系转移到温室中的单独盆中，并收集样品以进行分子和表型分析。

表型分析

开花通常意味着花开了，并且发生了授粉。达到50％开花的天数(DFF)是指当50％的穗达到开花状态的天数。表6-8中提供了T0或T1群体的表型分析结果。

表6：从T0变体收集的开花数据

表7：从T0变体收集的开花数据

表8：从T0变体收集的开花数据

这些研究结果表明，通过调节以下来调节植物的开花时间表型可以缩短植物成熟：推定的核心组蛋白H2A/H2B/H3/H4基因(DP1492)；含反应调节子接收结构域的蛋白(DP1564)；CCT基序家族蛋白(DP2300)；推定的BHLH转录因子(DP0830)；推定的TCP家族转录因子(DP1249)；推定的含NAC结构域的蛋白67(DP1856)；含微管蛋白/FtsZ结构域的蛋白基因(DP1722)或推定的hsp20/α晶体蛋白家族蛋白基因(DP1315)。与野生型对照稻植物相比，敲除所列基因后的表型导致早开花和成熟缩短，没有已知的多重效应。指导RNA/Cas9内切核酸酶系统用于靶向并诱导位于所列基因的编码区内的Cas9内切核酸酶靶位点的双链断裂。选择在基因的编码区内包含小缺失或内部片段缺失的植物，并评估其缩短成熟的表型。

相反，可通过调节以下来调节植物的开花时间表型，从而延迟植物成熟：含通用胁迫蛋白结构域的蛋白(DP0998)；推定的AAA型ATP酶家族蛋白基因(DP1103)；推定的PHD指家族蛋白基因(DP0896)；甲基结合结构域蛋白基因(DP0995)或‘表达蛋白’基因(DP0885)基因。与野生型对照稻植物相比，敲除所列基因后的表型将导致开花延迟并最终延迟成熟，而没有已知的多重效应。指导RNA/Cas9内切核酸酶系统用于靶向并诱导位于所列基因的编码区内的Cas9内切核酸酶靶位点的双链断裂。将选择在基因的编码区内包含少数核苷酸缺失或内部小片段缺失的植物，并评估晚熟表型。

实例4

过表达参与开花时间调节的基因的转基因植物

通过转化携带在玉蜀黍泛素启动子和PINII终止子下克隆的所示基因(SEQ ID NO9、10、11、12、13)的构建体，产生了转基因植物。在温室(T0)和网棚(T1)条件下评估产生的事件。从所有产生的T0事件中收集达到50％开花的天数数据，并将其与从对照中收集的数据进行比较。评估了由T0事件衍生的T1品系(用DP1103、DP0998或DP0995基因构建体转化)，并收集达到50％开花的天数和达到成熟的天数。从T1品系(在玉蜀黍泛素启动子下过表达DP0995基因)收集的数据(表9)，与种子衍生的野生型植物相比，显示开花和成熟早10-12天。

表9：从T1转基因稻事件收集的开花数据

这些研究的结果表明，可以通过调节含通用胁迫蛋白结构域的蛋白(推定的表达的)(DP0998)和PHD指家族蛋白(推定的表达的)(DP0896)来调节植物的开花时间表型，从而延迟植物成熟。指导RNA/Cas9内切核酸酶系统用于靶向并诱导位于编码区外部的Cas9内切核酸酶靶位点的双链断裂，以缺失全长基因。将选择包含全长基因缺失的植物，并评估晚熟表型。

Claims

1.一种改变稻植物的成熟的方法，所述方法包括通过靶向DNA修饰在所述稻植物的基因组基因座处引入一个或多个核苷酸修饰，其中

(a)所述基因组基因座包含参与开花时间调节(FTR)的多核苷酸，所述多核苷酸编码：含反应调节子接收结构域的蛋白、含CCT基序的蛋白、BHLH转录因子、TCP家族转录因子、含NAC结构域的蛋白、含微管蛋白/FtsZ结构域的蛋白、hsp20/α晶体蛋白、核心组蛋白H2A/H2B/H3/H4推定蛋白、AAA型ATP酶家族蛋白、含通用胁迫蛋白结构域的蛋白、PHD指家族蛋白、或甲基结合结构域蛋白，并且

(b)其中与不包含一个或多个引入的DNA修饰的对照稻植物相比，所述稻植物的成熟受到调节。

2.权利要求1的方法，其中当所述靶向DNA修饰导致所述FTR多核苷酸编码的蛋白质的表达或活性降低时，所述稻植物表现出早熟。

3.权利要求1的方法，其中在不显著降低以每株稻植物或作为每单位面积的稻植物群体测量的谷粒产率的情况下改变所述成熟。

4.权利要求1的方法，其中所述一个或多个核苷酸修饰靶向参与所述稻植物的开花时间调节的超过一个不同基因组基因座。

5.权利要求1的方法，其中如通过至第一次或50％开花或出穗或穗分化的天数所测量的，与所述对照稻植物相比，所述稻植物的成熟延迟约5％至约50％。

6.权利要求1的方法，其中所述稻植物是雌性自交系。

7.权利要求1的方法，其中所述稻植物是杂交种。

8.权利要求1的方法，其中如通过植物高度的降低所测量的，与所述对照稻植物相比，所述稻植物的株高没有显著改变。

9.权利要求1的方法，其中与不包含靶向DNA修饰的对照植物相比，所述稻植物的靶向DNA修饰基本上不改变所述植物的根结构或不显著增加根倒伏。

10.权利要求1的方法，其中所述稻植物比所述对照植物提前约5至15天表现出第一次开花。

11.权利要求1的方法，其中所述稻植物是籼稻(Oryza sativa var.indica)。

12.权利要求1的方法，其中所述FTR多核苷酸编码多肽，所述多肽包含与选自SEQ IDNO：14-26的序列具有至少90％同一性的氨基酸序列。

13.权利要求1的方法，其中所述FTR多核苷酸编码多肽，所述多肽包含与选自SEQ IDNO：14-26的序列具有至少95％同一性的氨基酸序列。

14.权利要求1的方法，其中所述靶向DNA修饰选自：插入、缺失、单核苷酸多态性(SNP)、和多核苷酸修饰，使得所述FTR多核苷酸的表达减少或受影响。

15.权利要求1的方法，其中所述靶向DNA修饰靶向所述FTR多核苷酸的基因组基因座，使得所述一个或多个核苷酸修饰存在于编码涉及成熟的多肽的内源多核苷酸的(a)相同的编码区内；(b)非编码区内；(c)调节序列内；(d)非翻译区内。

16.权利要求1的方法，其中所述靶向DNA修饰通过RNA指导的内切核酸酶引入。

17.权利要求1的方法，其中所述靶向DNA修饰通过位点特异性脱氨酶引入。

18.权利要求1的方法，其中所述靶向DNA修饰通过位点特异性内切核酸酶引入。

19.权利要求1的方法，其中所述FTR多核苷酸基因组基因座在多核苷酸中包含DNA修饰，所述多核苷酸编码包含氨基酸序列的多肽，所述氨基酸序列与选自SEQ ID NO：14-26的序列具有至少95％同一性，使得所述编辑导致以下一项或多项：

(a)所述FTR多核苷酸的表达减少；

(b)所述FTR多核苷酸编码的蛋白质的转录活性减少；

(c)所述FTR多核苷酸的一种或多种可变剪接转录物的产生；

(d)一个或多个DNA结合结构域的缺失

(e)所述FTR多核苷酸的一个或多个外显子的移码突变；

(f)所述FTR多核苷酸的实质部分的缺失或所述FTR多核苷酸的全长开放阅读框的缺失；

(g)存在于编码所述FTR多核苷酸的调节区内的增强子基序的抑制；

(h)一个或多个核苷酸的修饰或可操作地连接至所述FTR多核苷酸的表达的调节元件的缺失，其中所述调节元件存在于启动子、内含子、3′UTR、终止子或其组合中。

20.权利要求1的方法，其中通过使用与靶序列相对应的指导RNA诱导所述靶向DNA修饰，所述靶序列包含编码多肽的多核苷酸，所述多肽包含与选自SEQ ID NO：14-26的序列具有至少90％同一性的氨基酸序列。

21.权利要求1的方法，其中通过基因组修饰技术进行所述靶向DNA修饰，所述基因组修饰技术选自：多核苷酸指导的内切核酸酶、CRISPR-Cas内切核酸酶、碱基编辑脱氨酶、锌指核酸酶、转录激活子样效应子核酸酶(TALEN)、工程化位点特异性大范围核酸酶、或Argonaute。

22.一种表现出早熟的稻植物，所述稻植物包含参与开花时间调节(FTR)的修饰的基因组基因座，其中与对照植物相比，所述基因组基因座包含一个或多个引入的突变，并且其中FTR基因组基因座编码与选自SEQ ID NO：14-21的氨基酸序列具有至少90％同一性的多肽。

23.一种表现出晚熟的稻植物，所述稻植物包含参与开花时间调节(FTR)的修饰的基因组基因座，其中与对照植物相比，所述基因组基因座包含一个或多个引入的突变，并且其中FTR基因组基因座编码与选自SEQ ID NO：22-26的氨基酸序列具有至少90％同一性的多肽。

24.权利要求22或23的稻植物，其中所述稻植物是雌性自交系。

25.权利要求22或23的稻植物，其中所述稻植物是杂交种。

26.权利要求22或23的稻植物，其中如通过植物高度的降低所测量的，与所述对照稻植物相比，所述稻植物的株高没有显著改变。

27.权利要求22或23的稻植物，其中与不包含所述修饰的对照植物相比，所述稻植物的成熟调节基本上不改变所述植物的根结构或不显著增加根倒伏。

28.权利要求22的稻植物，其中如通过第一次开花时间所测量的，所述稻植物表现出约5至15天范围内的早熟。

29.权利要求23的稻植物，其中如通过至第一次或50％开花或出穗或穗分化的天数所测量的，与所述对照稻植物相比，所述稻植物的成熟延迟约5％至约50％。

30.权利要求22或23的稻植物，其中所述稻植物是籼稻。

31.权利要求22的稻植物，其中所述FTR多核苷酸编码多肽，所述多肽包含与选自SEQID NO：14-21的序列具有至少95％同一性的氨基酸序列。

32.权利要求23的稻植物，其中所述FTR多核苷酸编码多肽，所述多肽包含与选自SEQID NO：22-26的序列具有至少95％同一性的氨基酸序列。

33.一种重组DNA构建体，所述重组DNA构建体包含编码氨基酸序列的多核苷酸序列，所述氨基酸序列与选自SEQ ID NO：14-26的氨基酸序列具有至少95％同一性，所述多核苷酸序列可操作地连接至至少一个异源核酸序列。

34.一种植物细胞，所述植物细胞包含权利要求33的重组构建体。

35.一种指导RNA序列，所述指导RNA序列靶向植物细胞的基因组基因座，其中所述基因组基因座包含编码多肽的多核苷酸，所述多肽包含与选自SEQ ID NO：14-26的序列具有至少90％同一性的氨基酸序列。

36.一种重组DNA构建体，所述重组DNA构建体表达权利要求35的指导RNA。

37.一种植物细胞，所述植物细胞包含权利要求35的指导RNA。

38.一种植物细胞，所述植物细胞包含权利要求36的重组DNA构建体。

39.一种植物，所述植物已经在其基因组中稳定地并入了权利要求36的重组DNA构建体。

40.权利要求39的植物，其中所述植物是单子叶植物。

41.权利要求39的植物，其中所述植物是稻。

42.一种由权利要求39的植物产生的种子。

43.权利要求39的植物，所述植物进一步包含选自以下的异源核酸序列：植物中的报道基因、选择标志、抗病性基因、除草剂抗性基因、昆虫抗性基因；参与碳水化合物代谢的基因、参与脂肪酸代谢的基因、参与氨基酸代谢的基因、参与植物发育的基因、参与植物生长调节的基因、参与产率改善的基因、参与抗旱性的基因、参与增加营养物利用效率的基因、参与抗寒性的基因、参与抗热性的基因、和参与抗盐性的基因。