CN113416738A

CN113416738A - 包含雄性育性序列的组合物和方法

Info

Publication number: CN113416738A
Application number: CN202110682594.9A
Authority: CN
Inventors: M·阿伯特森; A·M·西干; H·赫舍伊; M·拉斯纳; Y·吴
Original assignee: Pioneer Hi Bred International Inc
Current assignee: Pioneer Hi Bred International Inc
Priority date: 2012-09-06
Filing date: 2013-09-06
Publication date: 2021-09-21
Also published as: CA2884049A1; WO2014039815A2; AU2021201561A1; EA029014B1; AU2019240727A1; CA2884049C; AU2013312392C1; EA201590507A1; US20220403411A1; US20140075597A1; CA3172512A1; CN104837861A; AU2013312392B2; IL237521A0; AU2019240727B2; CA3172506A1; US11377668B2; WO2014039815A3; AU2017265123A1; US20150252382A1

Abstract

本发明提供了用于调节植物中的雄性育性的组合物和方法。所述组合物包含调节雄性育性的核苷酸序列及其活性片段和变体。本发明还提供了表达盒，所述表达盒包含有效连接到启动子的雄性育性多核苷酸或其活性片段或变体，其中所述多核苷酸的表达调节植物的雄性育性。本发明还提供了各种方法，其中影响雄性育性的序列的水平和/或活性在植物或植物部分中得到调节。

Description

包含雄性育性序列的组合物和方法

本申请是与母案发明名称相同的分案申请，母案的中国申请号是201380046655.6，国际申请号是PCT/US2013/058500，申请日是2013年9月6日。

技术领域

本发明涉及植物分子生物学领域，更具体地讲，涉及影响雄性育性。

对以电子方式提交的序列表的引用

通过EFS-Web以电子方式将序列表的正式文本作为ASCII格式的序列表提交，该文件名称为5282-PCT_ST25.txt，最后修改日期为2013年9月6日，文件大小为42KB，并且该文件与本说明书同时提交。该ASCII格式文档中所含的序列表是本说明书的一部分，并且全文以引用的方式并入本文。

背景技术

杂交植物育种的发展已使产生的作物在质量和数量方面取得相当大的进展成为可能。由于经过了杂交程序，故产量增加，所需特性的组合如对病害和虫害的抗性、耐热性和耐旱性，以及植物组成发生变化都可能出现。这些程序在很多情况下主要依赖于提供向雌性亲本贡献花粉的雄性亲本以产生所得的杂交体。

大田作物通过利用植物的授粉方法的技术进行育种。如果来自植物的一朵花的花粉转移到同一植物或遗传上相同的植物的同一朵花或另一朵花，则植物自花授粉。如果花粉来自遗传上不同的植物的花，则植物异花授粉。

在某些物种中，诸如芸苔(Brassica campestris)，植物通常自花不育，并且只能够异花授粉。在自花授粉的物种中，诸如大豆和棉花，雄性和雌性植株在解剖学上是雌雄同株的。在自然授粉过程中，一朵花的雄性繁殖器官给同一朵花的雌性繁殖器官授粉。

普通小麦(Triticum aestivum)是具有限定基因组A、B和D的三对同源染色体的六倍体植物。小麦籽粒的胚乳包括来自母本细胞的2个单倍体补体和来自父本细胞的1个单倍体补体。小麦籽粒的胚包括来自母本细胞和父本细胞中的每一者的一个单倍体补体。六倍性被认为是研究和开发小麦的有用变体的过程中的重大障碍。实际上，人们对小麦的同源基因如何相互作用、如何调控这些同源基因的表达、以及由同源基因产生的不同蛋白质如何独立或协同地发挥作用方面知之甚少。

用遗传性雄性不育体系进行的大部分工作的必要方面是识别影响雄性育性的基因。这种基因可以在包括本文所述的那些体系在内的多种体系中使用以控制雄性育性。

发明内容

本发明提供了用于调节植物中的雄性育性的组合物和方法。组合物包含调节雄性育性的核苷酸序列，及其活性片段和变体。本发明还提供了表达盒，该表达盒包含有效连接到启动子的雄性育性多核苷酸、或其活性片段或变体中的一者或多者，其中所述多核苷酸的表达调节植物的雄性育性。本发明还提供了各种方法，其中影响雄性育性的多核苷酸的水平和/或活性在植物或植物部分中得到调节。

附图简述

图1示出小麦MS26基因，即A基因组(SEQ ID NO：28)、B基因组(SEQ ID NO：29)和D基因组(SEQ ID NO：30)，较之玉蜀黍的MS26直系同源基因(SEQ ID NO：31)、高梁的MS26直系同源基因(SEQ ID NO：32)和水稻的MS26直系同源基因(SEQ ID NO：33)横跨MS26+靶标位点(SEQ ID NO：21)进行的比对。

图2示出本文所述的由MS26+归巢核酸内切酶诱导的NHEJ(非同源末端连接)突变的比对。所述突变通过深度测序进行鉴定。参考序列示出未经修饰的基因座，基因组靶标位点以下划线表示。还指示了预期的切割位点。由于不完美的NHEJ导致的缺失以“-”示出。参考序列对应于Fielder小麦Ms26(SEQ ID NO：34)。

图3示出本文所述的由MS26+归巢核酸内切酶诱导的NHEJ突变的类型。所述突变通过对DNA载体中的亚克隆PCR产物进行测序来鉴定。MS26等位基因标号1、2和3很可能分别指小麦基因组拷贝D、A和B。

图4示出由MS26+归巢核酸内切酶诱导的NHEJ突变的比对。顶部序列是与示出未经修饰的基因座的参考序列(SEQ ID NO：45)进行比较的MS26靶标位点(SEQ ID NO：21)。由于不完美的NHEJ导致的缺失以“-”示出，而空位代表SEQ ID NO：50中的C核苷酸插入。所述突变通过对DNA载体中的亚克隆PCR产物进行测序来鉴定。

具体实施方式

下文将结合附图更详细地描述本发明，附图中只显示了本发明的一些实施例，而非全部实施例。事实上，这些发明可以多种不同形式呈现，且不应理解为受限于本文陈述的实施例；更确切地说，提供这些实施例以使得本公开将满足适用的法律要求。类似的编号在全文中是指类似的要素。

借助前面的描述和随附的附图中给出的教导，本发明所属领域的技术人员将会想到本文所述的发明的许多修改形式和其他实施例。因此，应当了解，本发明不限于所公开的特定实施例，并旨在将修改形式和其他实施例包括在所附权利要求的范围内。虽然本文中采用特定术语，但所述术语仅在一般性和描述性意义上使用而并非用于限制目的。

I.雄性育性多核苷酸

本文所公开的组合物包含影响雄性育性的多核苷酸和多肽。具体地讲，提供了分离的多核苷酸，其包含编码SEQ ID NO：2、4、6、8、10、12、14、16或18示出的氨基酸序列或它们的活性片段或变体的核苷酸序列。还提供了具有由本文所述的多核苷酸编码的氨基酸序列的多肽，所述多核苷酸例如SEQ ID NO：1、3、5、7、9、11、13、15或17示出的那些或它们的活性片段或变体。

有性繁殖植物发育出特用于产生雄性配子和雌性配子的特化组织。雄性配子的成功产生依赖于雄性繁殖组织的正确形成。体现植物的雄性繁殖器官的雄蕊包含各种细胞类型，包括例如花丝、花药、绒毡层和花粉。如本文所用，“雄性组织”是指有性繁殖植物中的负责产生雄性配子的特化组织。雄性组织包括但不限于雄蕊、花丝、花药、绒毡层和花粉。

成熟花粉粒形成的过程始于小孢子发生，其中性母细胞形成于花药的造孢组织中。随后是小配子发生，其中小孢子以有丝分裂的形式分裂，随后发育成小配子体或花粉粒。“雄性育性”或“雄性能育的”的状态是指产生成熟花粉粒的那些植物，所述成熟花粉粒能够使雌性配子受精以产生后代。如本文所用，术语“影响雄性育性”或“调节雄性育性”是指在与合适的对照比较时植物产生成熟花粉粒的能力的任何增强或下降。“成熟花粉粒”或“成熟花粉”是指任何能够使雌性配子受精以产生后代的花粉粒。同样，术语“雄性育性多核苷酸”或“雄性育性多肽”是指调节雄性育性的多核苷酸或多肽。雄性育性多核苷酸可例如编码参与小孢子发生或小配子发生的过程的多肽。

本文所公开的雄性育性多核苷酸包括被证实影响雄性育性的多核苷酸的同源物和直系同源物。例如，本文所公开的雄性育性多核苷酸及其活性片段和变体包括Ms22(也称为Mscal)的同源物和直系同源物。Ms22的诱变研究得到了表型为雄性不育的玉蜀黍植物，其花药不从穗伸出并且缺乏造孢组织。West and Albertsen(1985)Maize Newsletter 59：87(West和Albertsen，1985年，《玉蜀黍时事通讯》，第59卷，第87页)；Neuffer et al.(1977)Mutants of maize.Cold Spring Harbor Laboratory Press，Cold SpringHarbor，NY(Neuffer等人，1977年，《玉蜀黍突变体》，冷泉港实验室出版社，纽约冷泉港)。

缺乏Ms22表达的植物在繁殖组织发育早期表现出生理改变。据信，Ms22在另一种发育中具有作用，该作用的出现早于Ms45或Ms26的作用。某些雄性不育基因诸如MAC1、EMS1或GNE2(Sorensen et al.(2002)Plant J.29：581-594(Sorensen等人，2002年，《植物杂志》，第29卷，第581-594页))阻止四分孢子阶段中的细胞生长。SPOROCYTELESS/NOZZLE基因中的突变在发育早期起作用，但不仅影响花药形成而且影响胚珠形成，使得植物为雄性不育和雌性不育。拟南芥(Arabidopsis)的SPOROCYTELESS基因是孢子发生的起始所必需的，并且编码新型的核蛋白(Genes Dev.1999 Aug 15；13(16)：2108-17(《基因和发育》，1999年8月15日，第13卷，第16期，第2108-2117页))。由于Ms22对于小孢子发生的进展至关重要，所以与其他雄性不育突变构建体相比，在Ms22突变体中维持雄性非常可靠。如本文别处所公开，来自小麦的Ms22多核苷酸由SEQ ID NO：1、3和5示出。

另外的雄性育性多核苷酸包括Ms26多核苷酸及其同源物和直系同源物。已报道Ms26多肽与存在于酵母、植物和哺乳动物中的P450酶具有显著同源性。P450酶已被广泛地研究并且特征性蛋白结构域已被阐明。Ms26蛋白质包含真核P450蛋白质的若干结构基序特征，包括血红素结合结构域FxxGxRxCxG(结构域D；SEQ ID NO：19)、结构域A A/GGXD/ETT/S(双氧结合结构域；SEQ ID NO：20)、结构域B(类固醇结合结构域)和结构域C在内。系谱树分析表明，Ms26与存在于拟南芥(Arabidopsis thaliana)和救荒野豌豆(Vicia sattva)中的脂肪酸ω羟化所涉及的P450最密切相关。参见例如美国专利公布No.2012/0005792，该专利公布以引用的方式并入本文。如本文别处所公开，来自小麦的Ms26多核苷酸由SEQ ID NO：7、9和11示出。

本文所公开的另外的雄性育性多核苷酸及其活性片段和变体还可包括Ms45多核苷酸的同源物和直系同源物。Ms45多核苷酸是在玉蜀黍中得到表征的雄性育性多核苷酸。在小孢子空泡化期间，Ms45的突变可导致小孢子发生出现中断，从而致使突变的植物雄性不育。当克隆的玉蜀黍Ms45多核苷酸被引入到此类突变的雄性不育植物中时，该基因可与所述突变互补并赋予雄性育性。如本文别处所公开，来自小麦的Ms45多核苷酸由SEQ IDNO：13、15和17示出。

操纵雄性育性多核苷酸在小麦中的表达的策略将需要考虑各个小麦品种的倍性水平。普通小麦是包含被指定为A、B和D的三个基因组的六倍体(N＝21)；每个基因组包含七对非同源染色体。一粒小麦品种是二倍体(N＝7)，而二粒小麦品种是四倍体(N＝14)。

本文公开了分离的或实质上纯化的核酸分子或蛋白质组合物。“分离的”或“纯化的”核酸分子、多核苷酸、或蛋白质、或它们的生物活性部分，实质上或基本上不含通常在该多核苷酸或蛋白质的天然环境中存在的、与该多核苷酸或蛋白质相伴随或相互作用的组分。因此，分离的或纯化的多核苷酸或蛋白质，当通过重组技术产生时基本上不含其他细胞物质或培养基，或者当通过化学法合成时基本上不含化学前体或其他化学品。最优的是，“分离的”多核苷酸不含在得到该多核苷酸的生物体的基因组DNA中天然位于该多核苷酸的旁侧的序列(即，位于该多核苷酸的5′和3′末端的序列)(最佳的是蛋白质编码序列)。例如，在各种实施例中，分离的多核苷酸可含有少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的在衍生该多核苷酸的细胞的基因组DNA中天然位于该多核苷酸的旁侧的核苷酸序列。基本上不含细胞物质的蛋白质包括具有小于约30％、20％、10％、5％或1％(以干重计)的污染性蛋白质的蛋白质制备物。当本文所公开的多肽或其生物活性部分用重组法产生时，最佳的是，培养基具有少于约30％、20％、10％、5％或1％(以干重计)的化学前体或非目的蛋白质的化学品。

“受试植物”或“受试植物细胞”是其中已针对目的基因实现了遗传变更(诸如转化)的植物或植物细胞，或者是从经如此变更的植物或细胞遗传下来并包含该变更的植物或植物细胞。“对照”或“对照植物”或“对照植物细胞”提供测量受试植物或植物细胞的表型变化的参考点。

对照植物或植物细胞可例如包括：(a)野生型植物或植物细胞，即，具有与用于进行遗传变更的起始材料相同的基因型的植物或植物细胞，该遗传变更会得到受试植物或细胞；(b)具有与起始材料相同的基因型但已用无效构建体(即，用对目的性状不具有已知效果的构建体，诸如包含标记基因的构建体)转化的植物或植物细胞；(c)为受试植物或植物细胞的子代中的非转化分离子的植物或植物细胞；(d)在遗传上与受试植物或植物细胞相同但不暴露于会诱导目的基因的表达的条件或刺激因素的植物或植物细胞；或者(e)处于目的基因不被表达的条件下的受试植物或植物细胞本身。

A.雄性育性序列的片段和变体

还提供了本发明所公开的多核苷酸的片段和变体以及由其编码的蛋白质。所谓“片段”，意指多核苷酸的一部分或由其编码的氨基酸序列从而由其编码的蛋白质的一部分。多核苷酸的片段可编码保留该天然蛋白质的生物活性从而影响雄性育性的蛋白质片段。作为另一种选择，可用作杂交探针的多核苷酸片段通常不编码保持生物活性的片段蛋白质。因此，核苷酸序列的片段的范围可为本文所公开的编码多肽的至少约20个核苷酸、约50个核苷酸、约100个核苷酸、直至全长多核苷酸。

编码影响雄性育性的多肽的生物活性部分的多核苷酸的片段将编码至少15、25、30、50、100、150、200、250、300、350、400、450、500、525或537个连续的氨基酸，或直至存在于影响雄性育性的全长多肽(例如，分别为SEQ ID NO：2、4、6、8、10、12、14、16和18)中的氨基酸的总数。编码影响雄性育性的多肽的多核苷酸的可用作杂交探针或PCR引物的片段，通常不需要编码影响雄性育性的多肽的生物活性部分。

因此，如本文所公开的雄性育性多核苷酸的片段可以编码雄性育性多肽的生物活性部分，或者其可以是可使用下文所公开的方法被用作杂交探针或PCR引物的片段。雄性育性多肽的生物活性部分可通过以下所述来制备：分离本文所公开的雄性育性多核苷酸中的一者的一部分，表达雄性育性蛋白质的编码部分(例如，通过体外重组表达)，以及评估雄性育性多肽的编码部分的活性。作为雄性育性多核苷酸的片段的多核苷酸包含至少16、20、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、800、900、1000、1100、1200、1300、1400、1500、1600或1629个核苷酸、或者直至本文所公开的全长雄性育性多核苷酸(即，分别为SEQ ID NO：1、3、5、7、9、11、13、15或17)中存在的核苷酸的数目。

“变体”旨在意指实质上相似的序列。对于多核苷酸，变体包含在天然多核苷酸当中的一个或多个内部位点处的一个或多个核苷酸的缺失和/或添加，和/或在天然多核苷酸中的一个或多个位点处的一个或多个核苷酸的置换。如本文所用，“天然”或“野生型”多核苷酸或多肽分别包含天然存在的核苷酸序列或氨基酸序列。对于多核苷酸而言，保守变体包含那些由于遗传密码的简并性而编码本文所公开的雄性育性多肽中的一者的氨基酸序列的序列。诸如这些变体的天然存在的等位基因变体可用公知的分子生物学技术(例如，用下文概述的聚合酶链反应(PCR)和杂交技术)进行鉴定。变体多核苷酸还包括通过合成获得的多核苷酸，诸如那些例如通过使用定点诱变产生但仍编码雄性育性多肽的多核苷酸。通常，本文所公开的特定多核苷酸的变体将与该特定多核苷酸(例如SEQ ID NO：1、3、5、7、9、11、13、15或17中的任一者)具有至少约40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性，这通过本文别处所述的序列比对程序和参数进行测定。

本文所公开的特定多核苷酸(即，参考多核苷酸)的变体还可通过比较变体多核苷酸所编码的多肽与该参考多核苷酸所编码的多肽之间的序列同一性百分数来进行评估。因此，例如，公开了编码与SEQ ID NO：2、4、6、8、10、12、14、16或18的多肽具有给定序列同一性百分数的多肽的分离的多核苷酸。任何两种多肽之间的序列同一性百分数可用本文别处描述的序列比对程序和参数来计算。在任何给定的本文所公开的多核苷酸对是通过比较它们编码的两种多肽所共享的序列同一性百分数进行评估的情况中，两种被编码的多肽之间的序列同一性百分数为至少约40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性。

“变体”蛋白质旨在意指通过在天然蛋白质中的一个或多个内部位点处缺失或添加一个或多个氨基酸和/或在天然蛋白质的一个或多个位点处置换一个或多个氨基酸而从该天然蛋白质衍生的蛋白质。本文所公开的变体蛋白质具有生物活性，即它们继续具有天然蛋白质的所需生物活性，即本文所述的雄性育性活性。这种变体可例如由遗传多态性或由人类操纵而得到。本文所公开的雄性育性蛋白质的生物活性变体将与该天然蛋白质的氨基酸序列(例如，SEQ ID NO：2、4、6、8、10、12、14、16或18中的任一者)具有至少约40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性，这通过本文别处所述的序列比对程序和参数进行测定。本文所公开的蛋白质的生物活性变体与该蛋白质可相差少至1-15个氨基酸残基，少至1-10个(诸如6-10个)、少至5个、少至4个、3个、2个或甚至1个氨基酸残基。

本文所公开的蛋白质可通过各种方式(包括氨基酸置换、缺失、截短和插入)进行变更。这类操纵的方法是本领域公知的。例如，雄性育性多肽的氨基酸序列变体和片段可通过在DNA中作出突变来制备。诱变和多核苷酸变更的方法是本领域熟知的。参见，例如，Kunkel(1985)Proc.Natl.Acad.Sci.USA 82：488-492(Kunkel，1985年，《美国国家科学院院刊》，第82卷，第488-492页)；Kunkel et al.(1987)Methods in Enzymol.154：367-382(Kunkel等人，1987年，《酶学方法》，第154卷，第367-382页)；美国专利No.4,873,192；Walker and Gaastra，eds.(1983)Techniques in Molecular Biology(MacMillanPublishing Company，New York)(Walker和Gaastra编辑，1983年，《分子生物学技术》，麦克米兰出版公司，纽约)以及其中引用的参考文献。有关不影响目的蛋白质的生物活性的适当氨基酸置换的指导，可见于Dayhoff et al.(1978)Atlas of Protein Sequence andStructure(Natl.Biomed.Res.Found.，Washington，D.C.(Dayhoff等人，1978年，《蛋白质序列和结构图表集》，美国国家生物医学研究基金会，华盛顿特区)的模型，该文献以引用方式并入本文。保守置换，诸如将一个氨基酸用另一个具有相似性质的氨基酸进行交换，可能是最佳的。

因此，本文所公开的基因和多核苷酸包括天然存在的序列以及保持功能的DNA序列变体这两者。同样，雄性育性多肽和蛋白质涵盖天然存在的多肽以及其变型形式和修饰形式这两者。此类多核苷酸和多肽变体将继续具有所需的雄性育性活性。将在编码该变体的DNA中所作的突变一定不能将序列设置在阅读框外，并且最佳地将不会产生互补区域，该互补区域可能产生二级mRNA结构。参见EP专利申请公开No.75,444。

本文所涵盖的蛋白质序列的缺失、插入和置换预期不会造成该蛋白质特性的根本变化。然而，当在进行置换、缺失或插入之前难以预测其确切效应时，本领域技术人员将认识到该效应将通过常规的筛选测定法进行评估。即，该活性可通过测定雄性育性活性来评估。

雄性育性的增强或下降可以以多种方式来测定。本领域的普通技术人员可以通过以下所述来容易地评估变体或片段的活性：将该多核苷酸引入到对于该多核苷酸的稳定雄性不育等位基因而言为纯合的植物中，随后观察植物中的雄性组织发育。例如，要测定Ms22(即，SEQ ID NO：1、3或5)的雄性育性活性，本领域的技术人员可通过构造对于导致雄性不育的天然Ms22基因中的突变而言为纯合的植物来开始。随后，技术人员可通过以下所述来对突变进行弥补：提供Ms22多核苷酸、或其活性片段或变体，随后观察植物的雄性组织是否正常发育以及是否能够产生成熟花粉。同样，本文还公开了可以执行相同的程序来测定Ms26(即，SEQ ID NO：7、9或11)或Ms45(即，SEQ ID NO：13、15或17)的变体或片段的雄性育性活性。

功能性变体多核苷酸和蛋白质还涵盖由诱变和重组程序(诸如DNA改组)获得的序列和蛋白质。用这种程序，可操纵一种或多种不同的雄性育性序列以产生具有所需性质的新的雄性育性多肽。以此方式，从一组相关的多核苷酸序列产生重组多核苷酸的文库，所述相关的多核苷酸序列包含具有实质的序列同一性且可以在体外或体内同源重组的序列区域。例如，使用该方法，可将编码目的结构域的序列基序在本文所公开的雄性育性多核苷酸和其他已知的雄性育性多核苷酸之间进行改组，以获得编码具有改善的目的性质(诸如在酶的情况中为提高的K_m)的蛋白质的新基因。这种DNA改组的策略是本领域已知的。参见，例如，Stemmer(1994)Proc.Natl.Acad.Sci.USA 91：10747-10751(Stemmer，1994年，《美国国家科学院院刊》，第91卷，第10747-10751页)；Stemmer(1994)Nature 370：389-391(Stemmer，1994年，《自然》，第370卷，第389-391页)；Crameri et al.(1997)NatureBiotech.15：436-438(Crameri等人，1997年，《自然生物技术》，第15卷，第436-438页)；Moore et al.(1997)J.Mol.Biol.272：336-347(Moore等人，1997年，《分子生物学杂志》，第272卷，第336-347页)；Zhang et al.(1997)Proc.Natl.Acad.Sci.USA 94：4504-4509(Zhang等人，1997年，《美国国家科学院院刊》，第94卷，第4504-4509页)；Crameri et al.(1998)Nature 391：288-291(Crameri等人，1998年，《自然》，第391卷，第288-291页)；以及美国专利No.5,605,793和No.5,837,458。

II.序列分析

如本文所用，“序列同一性”或“同一性”在两个多核苷酸或多肽序列的情形中是指当在指定的比较窗口上进行比对以获得最大对应时两个序列中相同的残基。当序列同一性百分数针对蛋白质使用时，认识到不相同的残基位置往往差别在于保守氨基酸置换，其中氨基酸残基由具有相似化学性质(例如电荷或疏水性)的其他氨基酸残基置换，因此不会改变分子的功能性质。当序列差别在于保守置换，则可以上调序列同一性百分数以校正置换的保守性质。差异在于这类保守置换的序列称为具有“序列相似性”或“相似性”。作出这个调整的方法是本领域技术人员公知的。通常，这涉及将保守置换评定为部分错配而不是完全错配，从而增加序列同一性百分数。因而，例如，如果相同的氨基酸给予1分，非保守置换给予0分，则保守置换给予0至1之间的分数。保守置换的评分是例如在程序PC/GENE(美国加利福尼亚州山景城(Mountain View，California)的Intelligenetics公司)中所执行那样进行计算。

本文所用的“序列同一性百分数”意指通过在比较窗口上比较两个最佳比对的序列所确定的数值，其中多核苷酸序列在该比较窗口中的部分与参比序列(不包含添加或缺失)相比可包含添加或缺失(即，空位)，以便两个序列的最佳比对。通过以下方式计算这种百分数：确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以得到匹配的位置的数目，将匹配的位置的数目除以比较窗口中位置的总数目，然后将结果乘以100以得到序列同一性百分数。

除非另外指明，否则本文提供的序列同一性/相似性值指使用采用如下参数的GAP版本10或其任何等同程序获得的值：核苷酸序列的％同一性和％相似性采用GAP权重50和长度权重3以及nwsgapdna.cmp评分矩阵；氨基酸序列的％同一性和％相似性采用GAP权重8和长度权重2以及BLOSUM62评分矩阵。所谓“等同程序”意指任何这样的序列比较程序，其对于任何两个所考虑的序列，相比于GAP版本10所产生的相应比对，能产生出具有相同的核苷酸或氨基酸残基匹配和相同的序列同一性百分数的比对。

术语“多核苷酸”的使用并不旨在将本发明局限于包含DNA的多核苷酸。本领域普通技术人员会认识到，多核苷酸可包含核糖核苷酸以及包含核糖核苷酸和脱氧核糖核苷酸的组合。这种脱氧核糖核苷酸和核糖核苷酸既包括天然的分子也包括合成的类似物。本文所公开的多核苷酸还涵盖所有形式的序列，包括但不限于单链形式、双链形式、发夹结构、茎-环结构等。

III.表达盒

本文所公开的雄性育性多核苷酸可在表达盒中提供，以用于在目的生物体中表达。表达盒可包含有效连接到本文所公开的雄性育性多核苷酸的5′和3′调控序列。“有效连接”旨在意指两个或更多个元件之间的功能性连接。例如，目的多核苷酸与调控序列(例如，启动子)之间的有效连接是可使该目的多核苷酸得以表达的功能性连接。有效连接的元件可以是连续的或非连续的。当用来指两个蛋白质编码区域的连接时，所谓有效连接意指所述编码区域处于相同的阅读框中。

本文所公开的表达盒在5′-3′转录方向上可包含在宿主细胞(即，植物)中起作用的转录和翻译起始区(即，启动子)、目的多核苷酸、以及转录和翻译终止区(即，终止区)。表达盒还提供有多个限制性位点和/或重组位点，以使雄性育性多核苷酸的插入处于本文别处所述的调控区的转录调控之下。调控区(即，启动子、转录调控区和翻译终止区)和/或目的多核苷酸对于宿主细胞而言或彼此之间可以是天然的/同功的。作为另一种选择，调控区和/或目的多核苷酸对于宿主细胞而言或彼此之间可以是异源的。如本文所用，指涉多核苷酸或多肽序列的“异源”为起源于外来物种的序列，或者，如果起源于相同物种的话，则为通过蓄意的人为干预从其天然形式在组成和/或基因座方面进行实质性修饰得到的序列。例如，有效连接到异源多核苷酸的启动子来自与衍生这种多核苷酸的物种不同的物种，或者如果来自于相同/相似的物种，则一者或者两者实质上从它们的原始形式和/或基因座修饰而获得，或者该启动子不是用于有效连接的多核苷酸的天然启动子。如本文所周，嵌合多核苷酸包括与转录起始区有效连接的编码序列，该转录起始区对于该编码序列是异源的。

在某些实施例中，本文所公开的多核苷酸可与本文别处所公开的目的多核苷酸序列或表达盒的任何组合进行堆叠。例如，本文所公开的雄性育性多核苷酸可与本文别处所公开的编码雄性配子破坏性多核苷酸或多肽、细胞毒素、标记、或其他雄性育性序列的任何其他多核苷酸堆叠。堆叠的多核苷酸可有效连接到与雄性育性多核苷酸相同的启动子，或者可有效连接到另外的启动子多核苷酸。

如本文别处所述，表达盒可包含有效连接到目的多核苷酸的启动子，连同对应的终止区。终止区对于转录起始区可以是天然的，对于有效连接的目的雄性育性多核苷酸或雄性育性启动子序列可以是天然的，对于植物宿主可以是天然的，或者可以源自另一来源(即，外来的或异源的)。便利的终止区可获自根瘤农杆菌(A.tumefaciens)的Ti质粒，诸如章鱼氨酸合酶和胭脂氨酸合酶终止区。还可参见Guerineau et al.(1991)Mol.Gen.Genet.262：141-144(Guerineau等人，1991年，《分子遗传学与普通遗传学》，第262卷，第141-144页)；Proudfoot(1991)Cell 64：671-674(Proudfoot，1991年，《细胞》，第64卷，第671-674页)；Sanfacon et al.(1991)Genes Dev.5：141-149(Sanfacon等人，1991年，《基因和发育》，第5卷，第141-149页)；Mogen et al.(1990)Plant Cell 2：1261-1272(Mogen等人，1990年，《植物细胞》，第2卷，第1261-1272页)；Munroe et al.(1990)Gene 91：151-158(Munroe等人，1990年，《基因》，第91卷，第151-158页)；Ballas et al.(1989)Nucleic Acids Res.17：7891-7903(Ballas等人，1989年，《核酸研究》，第17卷，第7891-7903页)；以及Joshi et al.(1987)Nucleic Acids Res.15：9627-9639(Joshi等人，1987年，《核酸研究》，第15卷，第9627-9639页)。

如适当的话，可对目的多核苷酸进行优化以使其在转化的植物中的表达提高。也就是说，可使用植物优选的密码子来合成多核苷酸，以改进表达。有关宿主优选密码子用法的讨论，参见例如Campbell and Gowri(1990)Plant Physiol.92：1-11(Campbell和Gowri，1990年，《植物生理学》，第92卷，第1-11页)。本领域可获得用于合成植物优选的基因的方法。参见，例如，美国专利No.5,380,831和No.5,436,391，以及Murray et al.(1989)Nucleic Acids Res.17：477-498(Murray等人，1989年，《核酸研究》，第17卷，第477-498页)，所述专利和文献以引用方式并入本文。

已知有另外的序列修饰能增强细胞宿主中的基因表达。这些包括消除以下序列：编码假多腺苷酸化信号、外显子-内含子剪接位点信号的序列、转座子样重复序列以及其他此类得到充分表征的可能有害于基因表达的序列。可将序列的G-C含量调整到给定的细胞宿主的平均水平，这通过参考在宿主细胞中表达的已知基因计算得到。当可能时，修饰序列以避免预测的发夹二级mRNA结构。

表达盒可以另外含有5′前导序列。此类前导序列可以起到增强翻译的作用。翻译前导序列是本领域已知的并且包括：小核糖核酸病毒前导序列，例如，EMCV前导序列(脑心肌炎5′非编码区)(Elroy-Stein et al.(1989)Proc.Natl.Acad.Sci.USA 86：6126-6130(Elroy-Stein等人，1989年，《美国国家科学院院刊》，第86页，第6126-6130页))；马铃薯Y病毒组前导序列，例如TEV前导序列(烟草蚀纹病毒)(Gallie，et al.，(1995)Gene 165(2)：233-238(Gallie等人，1995年，《基因》，第165卷，第2期，第233-238页))、MDMV前导序列(玉蜀黍矮花叶病毒)(Johnson，et al.，(1986)Virology 154：9-20(Johnson等人，1986年，《病毒学》，第154卷，第9-20页))和人免疫球蛋白重链结合蛋白(BiP)(Macejak，et al.，(1991)Nature 353：90-94(Macejak等人，1991年，《自然》，第353卷，第90-94页))；来自苜蓿花叶病毒的外壳蛋白mRNA的非翻译前导序列(AMV RNA 4)(Jobling et al.(1987)Nature 325：622-625(Jobling等人，1987年，《自然》，第325卷，第622-625页))；烟草花叶病毒前导序列(TMV)(Gallie et al.(1989)in Molecular Biology of RNA，ed.Cech(Liss，New York)，pp.237-256(Gallie等人，1989年，载于《RNA的分子生物学》，Cech编辑(Liss，纽约)，第237-256页))；以及玉蜀黍枯黄斑点病毒前导序列(MCMV)(Lommel et al.(1991)Virology 81：382-385(Lommel等人，1991年，《病毒学》，第81卷，第382-385页))。还可参见Della-Cioppaet al.(1987)Plant Physiol.84：965-968(Della-Cioppa等人，1987年，《植物生理学》，第84卷，第965-968页)。也可利用其他已知的用于增强翻译的方法，例如内含子等等。

在制备表达盒时，可对各种DNA片段进行操纵，以提供处于正确取向的DNA序列，且适当时提供处于正确的阅读框的DNA序列。为此目的，可应用衔接子或接头将DNA片段连接在一起，或者可涉及其他的操纵以提供便利的限制性位点、去除多余的DNA、去除限制性位点等。出于这个目的，可涉及到体外诱变、引物修复、限制性酶切、退火、再置换(例如，转换和颠换)。

A.包含雄性育性多核苷酸的表达盒

在特定实施例中，本文所公开的表达盒包含有效连接到雄性育性多核苷酸的启动子、或其活性片段或变体，如本文所公开。在某些实施例中，雄性育性启动子或其活性片段或变体有效连接到本文所公开的雄性育性多核苷酸，诸如SEQ ID NO：1、3、5、7、9、11、13、15或17示出的雄性育性多核苷酸、或其活性片段或变体。

在某些实施例中，植物启动子可优先地在某些组织(诸如雄蕊、花药、花丝和花粉)或发育生长阶段(诸如造孢组织、小孢子和小配子体)中起始转录。此类植物启动子称为“组织优选的”、“细胞类型优选的”或“生长阶段优选的”。仅在某些组织中起始转录的启动子称为“组织特异性的”。同样，仅在某些生长阶段起始转录的启动子称为“生长阶段特异性的”。“细胞类型特异性的”启动子仅在一个或多个器官中的某些细胞类型(例如，雄蕊细胞)或雄蕊内的各细胞类型(诸如花药、花丝或花粉细胞)中驱动表达。

本文所公开的雄性育性多核苷酸及其活性片段和变体可有效连接到雄性组织特异性的或雄性组织优选的启动子，包括例如雄蕊特异性的或雄蕊优选的启动子、花药特异性的或花药优选的启动子、花粉特异性的或花粉优选的启动子、绒毡层特异性的启动子或绒毡层优选的启动子，等等。可基于所需的结果来选择启动子。例如，目的多核苷酸可有效连接到组成型启动子、组织优选的启动子、生长阶段优选的启动子或其他启动子，以在植物中表达。

在一个实施例中，启动子可以是在植物的雄性组织中优先地表达目的多核苷酸的那些启动子。该过程中没有一定要使用特定的雄性育性组织优选的启动子，而是可以使用本领域的技术人员已知的许多此类启动子中的任一种。一个这种启动子为5126启动子，其优先地将其所连接的多核苷酸的表达引导向植物的雄性组织，如在美国专利No.5,837,851和No.5,689,051中所述。其他例子包括美国专利No.6,037,523中描述的玉蜀黍Ms45启动子；美国专利No.6,452,069中描述的SF3启动子；WO 02/063021中描述的BS92-7启动子；美国专利No.5,470,359中描述的SGB6调控元件；TA29启动子(Koltunow，et al.，(1990)PlantCell 2：1201-1224(Koltunow等人，1990年，《植物细胞》，第2卷，第1201-1224页)；Goldberg，et al.，(1993)Plant Cell 5：1217-1229(Goldberg等人，1993年，《植物细胞》，第5卷，第1217-1229页)以及美国专利No.6,399,856)；2型金属硫蛋白样基因启动子(Charbonnel-Campaa，et al.，Gene(2000)254：199-208(Charbonnel-Campaa等人，《基因》，2000年，第254卷，第199-208页))以及芸苔属Bca9启动子(Lee，et al.，(2003)Plant CellRep.22：268-273(Lee等人，2003年，《植物细胞报告》，第22卷，第268-273页))。

在一些实施例中，表达盒包含有效连接到雄性育性多核苷酸的雄性配子优选的启动子。雄性配子优选的启动子包括PG47启动子(US 5,412,085；US 5,545,546；Plant J 3(2)：261-271(1993)(《植物杂志》，第3卷，第2期，第261-271页，1993年))，以及ZM13启动子(Hamilton，et al.，(1998)Plant Mol.Biol.38：663-669(Hamilton等人，1998年，《植物分子生物学》，第38卷，第663-669页))；肌动蛋白解聚因子启动子(诸如Zmabp1、Zmabp2；参见例如Lopez，et al.，(1996)Proc.Natl.Acad.Sci.USA 93：7415-7420(Lopez等人，1996年，《美国国家科学院院刊》，第93卷，第7415-7420页))；玉蜀黍果胶甲酯酶样基因的启动子ZmC5(Wakeley，et al.，(1998)Plant Mol.Biol.37：187-192(Wakeley等人，1998年，《植物分子生物学》，第37卷，第187-192页))；肌动蛋白抑制蛋白基因启动子Zmpro1(Kovar，etal.，(2000)The Plant Cell 12：583-598(Kovar等人，2000年，《植物细胞》，第12卷，第583-598页))；硫酸化五肽phytosulphokine基因启动子ZmPSK1(Lorbiecke，et al.，(2005)Journal of Experimental Botany 56(417)：1805-1819(Lorbiecke等人，2005年，《实验植物学杂志》，第56卷，第417期，第1805-1819页))；钙调蛋白结合蛋白的启动子Mpcbp(Reddy，et al.，(2000)J.Biol.Chem.275(45)：35457-70(Reddy等人，2000年，《生物化学杂志》，第275卷，第45期，第35457-35470页))。

如本文所公开，组成型启动子包括例如Rsyn7启动子的核心启动子和WO 99/43838和美国专利No.6,072,050中公开的其他组成型启动子；CaMV35S核心启动子(Odell et al.(1985)Nature 313：810-812(Odell等人，1985年，《自然》，第313卷，第810-812页))；水稻肌动蛋白(McElroy et al.(1990)Plant Cell 2：163-171(McElroy等人，1990年，《植物细胞》，第2卷，第163-171页))；遍在蛋白(Christensen et al.(1989)Plant Mol.Biol.12：619-632(Christensen等人，1989年，《植物分子生物学》，第12卷，第619-632页)和Christensen et al.(1992)Plant Mol.Biol.18：675-689(Christensen等人，1992年，《植物分子生物学》，第18卷，第675-689页))；pEMU(Last et al.(1991)Theor.Appl.Genet.81：581-588(Last等人，1991年，《理论和应用遗传学》，第81卷，第581-588页))；MAS(Velten etal.(1984)EMBO J.3：2723-2730(Velten等人，1984年，《欧洲分子生物学组织杂志》，第3卷，第2723-2730页))；ALS启动子(美国专利No.5,659,026)，等等。其他组成型启动子包括例如美国专利No.5,608,149、No.5,608,144、No.5,604,121、No.5,569,597、No.5,466,785、No.5,399,680、No.5,268,463、No.5,608,142、和No.6,177,611。

“种子优选的”启动子包括在种子发育期间活跃的那些启动子(诸如种子贮藏蛋白的启动子)以及在种子萌发期间活跃的那些启动子。参见Thompson et al.(1989)BioEssays 10：108(Thompson等人，1989年，《生物测定法》，第10卷，第108页)，该文献以引用方式并入本文。这类种子优选的启动子包括但不限于Cim1(细胞分裂素诱导信息)；cZ19B1(玉蜀黍19kDa玉米醇溶蛋白)；milps(肌醇-1-磷酸合酶)(参见WO 00/11177和美国专利No.6,225,529；所述专利以引用方式并入本文)。γ-玉米醇溶蛋白基因启动子是胚乳特异性启动子。球蛋白-1(Glob-1)基因启动子是代表性的胚特异性启动子。对于双子叶植物而言，种子特异性启动子包括但不限于菜豆β-菜豆蛋白基因启动子、油菜籽蛋白(napin)基因启动子、β-伴球蛋白基因启动子、大豆凝集素基因启动子、十字花科蛋白基因启动子等。对于单子叶植物而言，种子特异性启动子包括但不限于玉蜀黍15kDa玉米醇溶蛋白基因启动子、22kDa玉米醇溶蛋白基因启动子、27kDa玉米醇溶蛋白基因启动子、γ-玉米醇溶蛋白基因启动子、糯性蛋白基因(waxy)启动子、超甜蛋白1(shrunken 1)基因启动子、超甜蛋白2(shrunken 2)基因启动子、球蛋白1基因启动子等。还可参见WO 00/12733，其中公开了来自endl和end2基因的种子优选的启动子；该专利以引用方式并入本文。另外的胚特异性启动子在如下文献中公开：Sato et al.(1996)Proc.Natl.Acad.Sci.93：8117-8122(Sato等人，1996年，《美国国家科学院院刊》，第93卷，第8117-8122页)；Nakase et al.(1997)Plant J 12：235-46(Nakase等人，1997年，《植物杂志》，第12卷，第235-246页)；以及Postma-Haarsma et al.(1999)Plant Mol.Biol.，39：257-71(Postma-Haarsma等人，1999年，《植物分子生物学》，第39卷，第257-271页)。另外的胚乳特异性启动子在如下文献中公开：Albani et al.(1984)EMBO 3：1405-15(Albani等人，1984年，《欧洲分子生物学组织杂志》，第3卷，第1405-1415页)；Albani et al.(1999)Theor.Appl.Gen.98：1253-62(Albani等人，1999年，《理论与应用遗传学》，第98卷，第1253-1262页)；Albani et al.(1993)PlantJ.4：343-55(Albani等人，1993年，《植物杂志》，第4卷，第343-355页)；Mena et al.(1998)The Plant Journal 116：53-62(Mena等人，1998年，《植物杂志》，第116卷，第53-62页)，以及Wu et al.(1998)Plant Cell Physiology 39：885-889(Wu等人，1998年，《植物细胞生理学》，第39卷，第885-889页)。

分裂细胞或分生组织优选的启动子已在如下文献中公开：Ito et al.(1994)Plant Mol.Biol.24：863-878(Ito等人，1994年，《植物分子生物学》，第24卷，第863-878页)；Reyad et al.(1995)Mo.Gen.Genet.248：703-711(Reyad等人，1995年，《分子遗传学与普通遗传学》，第248卷，第703-711页)；Shaul et al.(1996)Proc.Natl.Acad.Sci.93：4868-4872(Shaul等人，1996年，《美国国家科学院院刊》，第93卷，第4868-4872页)；Ito etal.(1997)Plant J.11：983-992(Ito等人，1997年，《植物杂志》，第11卷，第983-992页)；以及Trehin et al.(1997)Plant Mol.Biol.，35：667-672(Trehin等人，1997年，《植物分子生物学》，第35卷，第667-672页)。

胁迫诱导型启动子包括盐/水胁迫诱导型启动子，诸如P5CS(Zang et al.(1997)Plant Sciences 129：81-89(Zang等人，1997年，《植物科学》，第129卷，第81-89页))；冷诱导型启动子，诸如cor15a(Hajela et al.(1990)Plant Physiol.93：1246-1252(Hajela等人，1990年，《植物生理学》，第93卷，第1246-1252页))、cor15b(Wlihelm et al.(1993)Plant Mol Biol 23：1073-1077(Wlihelm等人，1993年，《植物分子生物学》，第23卷，第1073-1077页))、wsc120(Ouellet et al.(1998)FEBS Lett.423-324-328(Ouellet等人，1998年，《欧洲微生物学会联合会微生物学快报》，第423卷，第324-328页))、ci7(Kirch etal.(1997)Plant Mol Biol.33：897-909(Kirch等人，1997年，《植物分子生物学》，第33卷，第897-909页))、ci21A(Schneider et al.(1997)Plant Physiol.113：335-45(Schneider等人，1997年，《植物生理学》，第113卷，第335-345页))；干旱诱导型启动子，诸如Trg-31(Chaudhary et al(1996)Plant Mol.Biol.30：1247-57(Chaudhary等人，1996年，《植物分子生物学》，第30卷，第1247-1257页))、rd29(Kasuga et al.(1999)NatureBiotechnology18：287-291(Kasuga等人，1999年，《自然生物技术》，第18卷，第287.291页))；渗透诱导型启动子，诸如Rab17(Vilardell，et al.，(1991)Plant Mol.Biol.17：985-93(Vilardell等人，1991年，《植物分子生物学》，第17卷，第985-993页))和渗透蛋白(Raghothama et al.(1993)Plant Mol Biol23：1117-28(Raghothama等人，1993年，《植物分子生物学》，第23卷，第1117-1128页))；以及热诱导型启动子，诸如热休克蛋白(Barroset al.(1992)Plant Mol.19：665-75(Barros等人，1992年，《植物分子生物学》，第19卷，第665-675页)；Marrs et al.(1993)Dev.Genet.14：27-41(Marrs等人，1993年，《遗传学发展》，第14卷，第27-41页))和smHSP(Waters et al.(1996)J.Experimental Botany 47：325-338(Waters等人，1996年，《实验植物学杂志》，第47卷，第325-338页))。其他胁迫诱导型启动子包括rip2(美国专利No.5,332,808和美国专利公开No.2003/0217393)和rp29a(Yamaguchi-Shinozaki et al.(1993)Mol.Gen.Genetics 236：331-340(Yamaguchi-Shinozaki等人，1993年，《分子遗传学与普通遗传学》，第236卷，第331-340页))。

如本文别处所述，包含雄性育性多核苷酸的表达盒可与其他目的多核苷酸堆叠。任何目的多核苷酸均可与雄性育性多核苷酸堆叠，包括例如雄性配子破坏性多核苷酸和标记多核苷酸。

本文所公开的雄性育性多核苷酸可堆叠在包含有效连接到具有雄性配子破坏性的多核苷酸(即，干扰雄性配子的功能、形成或传播的多核苷酸)的启动子的表达盒中，或与该表达盒堆叠。可通过多种方法中的任一种来操作雄性配子破坏性多核苷酸以阻止雄性配子的功能、形成或传播。以举例而非限制的方式，这可包括使用这样的多核苷酸，其编码基因产物诸如DAM-甲基化酶或芽孢杆菌RNA酶(参见例如，美国专利No.5,792,853或No.5,689,049，PCT/EP89/00495)；编码干扰淀粉累积或影响花粉中的渗透平衡的基因产物(参见例如，美国专利No.7,875,764、No.8,013,218、No.7,696,405)；抑制对于雄性配子的功能、形成或传播而言重要的基因产物的形成(参见例如，美国专利No.5,859,341、No.6,297,426)；编码与另一种基因产物结合以阻止雄性配子的形成或功能的基因产物(参见美国专利No.6,162,964、No.6,013,859、No.6,281,348、No.6,399,856、No.6,248,935、No.6,750,868、No.5,792,853)；与对雄性配子的功能、形成或传播至关重要的基因反义，或导致所述基因的共抑制(参见美国专利No.6,184,439、No.5,728,926、No.6,191,343、No.5,728,558、No.5,741,684)；通过使用发夹式形成物干扰雄性育性多核苷酸的表达(Smith et al.(2000)Nature 407：319-320(Smith等人，2000年，《自然》，第407卷，第319-320页)；WO 99/53050和WO 98/53083)等。

雄性配子破坏性多核苷酸包括显性负基因，诸如甲基化酶基因和生长抑制基因。参见美国专利No.6,399,856。显性负基因包括白喉毒素A链基因(Czako and An(1991)Plant Physiol.95687-692(Czako和An，1991年，《植物生理学》，第95卷，第687-692页)；Greenfield et al.(1983)PNAS80：6853(Greenfield等人，1983年，《美国国家科学院院刊》，第80卷，第6853页))；细胞周期分裂突变体诸如玉蜀黍中的CDC(Colasanti et al.(1991)PNAS 88：3377-3381(Colasanti等人，1991年，《美国国家科学院院刊》，第88卷，第3377-3381页))；WT基因(Farmer et al.(1994)Mol.Genet.3：723-728(Farmer等人，1994年，《分子遗传学》，第3卷，第723-728页))；以及P68(Chen et al.(1991)PNAS 88：315-319(Chen等人，1991年，《美国国家科学院院刊》，第88卷，第315-319页))。

雄性配子破坏性多核苷酸的另外的例子包括但不限于来自菊欧文氏菌(Erwiniachrysanthermi)的果胶裂解酶基因pelE(Kenn et al(1986)J.Bacteriol.168：595(Kenn等人，1986年，《细菌学杂志》，第168卷，第595页))；来自苏云金芽孢杆菌以色列亚种(Bacillus thuringiensis Israeliensis)的CytA毒素基因(McLean et al(1987)J.Bacteriol.169：1017(1987)(McLean等人，1987年，《细菌学杂志》，第169卷，第1017页)，美国专利No.4,918,006)；DNA酶、RNA酶、蛋白酶、或表达反义RNA的多核苷酸。雄性配子破坏性多核苷酸可编码涉及抑制花粉和柱头的相互作用、花粉管生长、受精或它们的组合的蛋白质。

本文所公开的雄性育性多核苷酸可与本文所公开的表达盒堆叠，所述表达盒包含有效连接到编码报道分子或标记产物的目的多核苷酸的启动子。本领域已知的合适报道分子多核苷酸的例子可见于例如以下文献：Jefferson et al.(1991)in Plant MolecularBiology Manual，ed.Gelvin et al.(Kluwer Academic Publishers)，pp.1-33(Jefferson等人，1991年，载于《植物分子生物学手册》，Gelvin等人编辑，克吕维尔学术出版社，第1-33页)；DeWet et al.Mol.Cell.Biol.7：725-737(1987)(DeWet等人，《分子细胞生物学》，第7卷，第725-737页，1987年)；Goff et al.EMBO J.9：2517-2522(1990)(Goff等人，《欧洲分子生物学组织杂志》，第9卷，第2517-2522页，1990年)；Kain et al.BioTechniques 19：650-655(1995)(Kain等人，《生物技术》，第19卷，第650-655页，1995年)；以及Chiu etal.Current Biology 6：325-330(1996)(Chiu等人，1996年，《当代生物学》，第6卷，第325-330页)。在某些实施例中，目的多核苷酸编码选择性报道分子。这些多核苷酸可包括赋予抗生素抗性或除草剂抗性的多核苷酸。合适的选择性标记多核苷酸的例子包括但不限于编码对氯霉素、甲氨蝶呤、潮霉素、链霉素、壮观霉素、博来霉素、磺酰胺、溴苯腈、草甘膦和膦丝菌素的抗性的基因。

在一些实施例中，本文公开的表达盒包含编码可评分的或可筛选的标记的目的多核苷酸，其中所述多核苷酸的存在产生可测量的产物。例子包括β-葡糖苷酸酶或uidA基因(GUS)，其编码各种显色底物已知的酶(例如，美国专利No.5,268,463和No.5,599,670)；氯霉素乙酰转移酶和碱性磷酸酶。其他可筛选的标记包括花青素/类黄酮多核苷酸，包括例如编码调控植物组织中花青素色素(红色)的产生的产物的R-基因座多核苷酸，控制类黄酮色素的生物合成的基因，诸如玉蜀黍C1和C2、B基因、p1基因和bronze基因座基因等。由目的多核苷酸编码的合适的标记的另外的例子包括青色荧光蛋白(CYP)基因、黄色荧光蛋白基因、编码荧光素酶的发光基因(其存在可使用例如X光片、闪烁计数、荧光分光光度法、微光摄像机、光子计数照相机或多孔发光测定法来检测)、绿色荧光蛋白(GFP)和DsRed2，其中用标记基因转化的植物细胞为红色，并因而为视觉上可选择的。另外的例子包括编码各种显色底物(例如，PADAC、显色头孢菌素)已知的酶的p-内酰胺酶基因、编码可转化显色儿茶酚的儿茶酚双加氧酶的xylE基因、α-淀粉酶基因和编码能够将酪氨酸氧化为多巴和多巴醌(其继而缩合以形成易于检测的化合物黑色素)的酶的酪氨酸酶基因。

表达盒还可包含用于选择转化的细胞的选择性标记基因。选择性标记基因用于选择转化的细胞或组织。标记基因包括编码抗生素抗性的基因，诸如那些编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)的基因，以及赋予对除草化合物的抗性的基因，所述除草化合物为例如草铵膦、溴苯腈、咪唑啉酮和2，4-二氯苯氧基乙酸(2，4-D)。另外的选择性标记包括表型标记诸如β-半乳醣苷酶和荧光蛋白诸如绿色荧光蛋白(GFP)(Su et al.(2004)Biotechnol Bioeng 85：610-9(Su等人，2004年，《生物技术和生物工程》，第85卷，第610-619页)和Fetter et al.(2004)Plant Cell 16：215-28(Fetter等人，2004年，《植物细胞》，第16卷，第215-228页))、青色荧光蛋白(CYP)(Bolte et al.(2004)J.Cell Science117：943-54(Bolte等人，2004年，《细胞科学杂志》，第117卷，第943-954页)和Kato et al.(2002)Plant Physiol 129：913-42(Kato等人，2002年，《植物生理学》，第129卷，第913-942页))和黄色荧光蛋白(来自Evrogen公司的PhiYFP^TM，参见Bolte et al.(2004)J.CellScience 117：943-54(Bolte等人，2004年，《细胞科学杂志》，第117卷，第943-54页))。对于另外的选择性标记，通常参见Yarranton(1992)Curr.Opin.Biotech.3：506-511(Yarranton，1992年，《生物技术新见》，第3卷，第506-511页)；Christopherson et al.(1992)Proc.Natl.Acad.Sci.USA 89：6314-6318(Christopherson等人，1992年，《美国国家科学院院刊》，第89卷，第6314-6318页)；Yao et al.(1992)Cell71：63-72(Yao等人，1992年，《细胞》，第71卷，第63-72页)；Reznikoff(1992)Mol.Microbiol.6：2419-2422(Reznikoff，1992年，《分子微生物学》，第6卷，第2419-2422页)；Barkley et al.(1980)inThe Operon，pp.177-220(Barkley等人，1980年，载于《操纵子》，第177-220页)；Hu et al.(1987)Cell 48：555-566(Hu等人，1987年，《细胞》，第48卷，第555-566页)；Brown et al.(1987)Cell 49：603-612(Brown等人，1987年，《细胞》，第49卷，第603-612页)；Figge etal.(1988)Cell 52：713-722(Figge等人，1988年，《细胞》，第52卷，第713-722页)；Deuschleet al.(1989)Proc.Natl.Acad.Aci.USA 86：5400-5404(Deuschle等人，1989年，《美国国家科学院院刊》，第86卷，第5400-5404页)；Fuerst et al.(1989)Proc.Natl.Acad.Sci.USA86：2549-2553(Fuerst等人，1989年，《美国国家科学院院刊》，第86卷，第2549-2553页)；Deuschle et al.(1990)Science248：480-483(Deuschle等人，1990年，《科学》，第248卷，第480-483页)；Gossen(1993)Ph.D.Thesis，University of Heidelberg(Gossen，1993年，海德尔堡大学博士论文)；Reines et al.(1993)Proc.Natl.Acad.Sci.USA90：1917-1921(Reines等人，1993年，《美国国家科学院院刊》，第90卷，第1917-1921页)；Labow et al.(1990)Mol.Cell.Biol.10：3343-3356(Labow等人，1990年，《分子细胞生物学》，第10卷，第3343-3356页)；Zambretti et al.(1992)Proc.Natl.Acad.Sci.USA 89：3952-3956(Zambretti等人，1992年，《美国国家科学院院刊》，第89卷，第3952-3956页)；Baim et al.(1991)Proc.Natl.Acad.Sci.USA 88：5072-5076(Baim等人，1991年，《美国国家科学院院刊》，第88卷，第5072-5076页)；Wyborski et al.(1991)Nucleic Acids Res.19：4647-4653(Wyborski等人，1991年，《核酸研究》，第19卷，第4647-4653页)；Hillenand-Wissman(1989)Topics Mol.Struc.Biol.10：143-162(Hillenand-Wissman，1989年，《分子和结构生物学专题》，第10卷，第143-162页)；Degenkolb et al.(1991)Antimicrob.Agents Chemother.35：1591-1595(Degenkolb等人，1991年，《抗微生物剂和化学治疗》，第35卷，第1591-1595页)；Kleinschnidt et al.(1988)Biochemistry 27：1094-1104(Kleinschnidt等人，1988年，《生物化学》，第27卷，第1094-1104页)；Bonin(1993)Ph.D.Thesis，University ofHeidelberg(Bonin，1993年，海德尔堡大学博士论文)；Gossen et al.(1992)Proc.Natl.Acad.Sci.USA 89：5547-5551(Gossen等人，1992年，《美国国家科学院院刊》，第89卷，第5547-5551页)；Oliva et al.(1992)Antimicrob.Agents Chemother.36：913-919(Oliva等人，1992年，《抗微生物剂和化学治疗》，第36卷，第913-919页)；Hlavka et al.(1985)Handbook of Experimental Pharmacology，Vol.78(Springer-Verlag，Berlin)(Hlavka等人，1985年，《实验药理学手册》，第78卷，斯普林格出版社，柏林)；Gill et al.(1988)Nature 334：721-724(Gill等人，1988年，《自然》，第334卷，第721-724页)。这些公开内容以引用的方式并入本文。上面关于选择性标记基因的列表并不意指是限制性的。任何选择性标记基因均可用于本文所公开的组合物和方法中。

在一些实施例中，本文所公开的表达盒包含编码有效连接到第一启动子多核苷酸的雄性育性多核苷酸的第一目的多核苷酸，该第一目的多核苷酸与编码有效连接到雄性组织优选的启动子多核苷酸的雄性配子破坏性基因产物的第二目的多核苷酸堆叠。在其他实施例中，本文所述的表达盒还可以与编码有效连接到第三启动子多核苷酸的标记多核苷酸的第三目的多核苷酸堆叠。

在特定实施例中，本文所公开的表达盒包含编码本文所公开的有效连接到组成型启动子(诸如花椰菜花叶病毒(CaMV)35S启动子)的小麦雄性育性基因(诸如Ms22、Ms26或Ms45)的第一目的多核苷酸。表达盒还可以包含编码有效连接到雄性组织优选的启动子的雄性配子破坏性基因产物的第二目的多核苷酸。在某些实施例中，本文所公开的表达盒还可以包含编码有效连接到组成型启动子(诸如花椰菜花叶病毒(CaMV)35S启动子)的标记基因(诸如来自产绿色链霉菌(Streptomyces viridochomagenes)的膦丝菌素乙酰基转移酶(PAT)基因)的第三目的多核苷酸。

IV.植物

A.具有改变的雄性育性多肽的水平/活性的植物

还提供了具有改变的雄性育性多肽的水平和/或活性和/或改变的雄性育性水平的植物。在一些实施例中，本文所公开的植物已在它们的基因组中稳定地整合了如本文所公开的异源雄性育性多核苷酸或其活性片段或变体。因此，提供了这样的植物、植物细胞、植物部分和种子，它们包含本文所公开的如SEQ ID NO：1、3、5、7、9、11、13、15或17的任一者示出的至少一种异源雄性育性多核苷酸或任何活性片段或变体。

还提供了包含本文所公开的表达盒的植物，该表达盒包含有效连接到在植物中有活性的启动子的雄性育性多核苷酸。在一些实施例中，雄性育性多核苷酸的表达调节植物的雄性育性。在某些实施例中，雄性育性多核苷酸的表达增强植物的雄性育性。例如，提供了包含这样的表达盒的植物，该表达盒包含有效连接到组成型启动子(诸如CaMV 35S启动子)的如SEQ ID NO：1、3或5示出的Ms22多核苷酸、或其活性片段或变体。当Ms22多核苷酸表达时，植物的雄性育性增强。

在某些实施例中，向雄性不育植物提供表达盒，该表达盒包含如本文所公开的有效连接到在植物中有活性的启动子的异源雄性育性多核苷酸、或其活性片段或变体。当异源雄性育性多核苷酸表达时，植物的雄性育性得到恢复。在特定实施例中，本文所公开的植物包含具有如本文所公开的有效连接到启动子的异源雄性育性多核苷酸、或其活性片段或变体的表达盒，该表达盒与包含有效连接到在植物中有活性的启动子的目的多核苷酸的一个或多个表达盒堆叠。例如，目的堆叠多核苷酸可包括雄性配子破坏性多核苷酸和/或标记多核苷酸。

本文所公开的植物还可以包含本文所述的具有至少两种多核苷酸的堆叠表达盒，使得所述至少两种多核苷酸在超过50％的减数分裂中(即，不是随机地)被一起继承。因此，当包含具有两种多核苷酸的堆叠表达盒的植物或植物细胞发生减数分裂时，所述两种多核苷酸分离到同一个子代(子系)细胞中。这样，堆叠的多核苷酸将很可能在它们被呈递至的任何细胞中一起表达。例如，植物可以包含具有雄性育性多核苷酸的表达盒，该表达盒与包含雄性配子破坏性多核苷酸的表达盒堆叠，使得雄性育性多核苷酸和雄性配子破坏性多核苷酸被一起继承。特别地，雄性不育植物可以包含具有本文所公开的有效连接到组成型启动子的雄性育性多核苷酸的表达盒，该表达盒与包含有效连接到雄性组织优选启动子的雄性配子破坏性多核苷酸的表达盒堆叠，使得所述植物产生成熟的花粉粒。然而，在这种植物中，具有雄性育性多核苷酸的花粉子细胞的发育将被雄性配子破坏性多核苷酸的表达阻止。

B.植物和方法介绍

如本文所用，术语“植物”包括植物细胞、植物原生质体、从中可再生出植物的植物细胞组织培养物、植物愈伤组织、在植物或植物部分中完好的植物块和植物细胞诸如胚、花粉、胚珠、种子、叶、花、枝、果实、仁、穗、穗轴、壳、茎、根、根尖、花药、谷粒等。如本文所用，“谷粒”意指商业种植者出于栽培或繁殖物种之外的目的生产的成熟种子。再生植物的子代、变体和突变体也包括在本发明的范围内，前提条件是这些部分包含所引入的核酸序列。

本文所公开的方法包括将多肽或多核苷酸引入植物细胞。“引入”旨在意指以使得多核苷酸或多肽的序列得以进入细胞内部的方式将多核苷酸或多肽呈递到植物。本文所公开的方法不依赖于将序列引入宿主细胞的具体方法，只要多核苷酸或多肽可进入宿主的至少一个细胞的内部即可。用于将多核苷酸或多肽引入宿主细胞(即，植物)的方法是本领域已知的，包括但不限于稳定转化方法、瞬时转化方法和病毒介导的方法。

“稳定转化”旨在意指被引入宿主(即，植物)的核苷酸构建体整合到了植物的基因组中，并能够被其子代继承。“瞬时转化”旨在意指多核苷酸被引入宿主(即，植物)并短暂表达，或者多肽被引入宿主(即，植物)。

转化规程以及将多肽或多核苷酸序列引入到植物中的规程，可根据要进行转化的植物或植物细胞的类型(即，单子叶植物或双子叶植物)而异。将多肽和多核苷酸引入植物细胞的合适方法包括微注射(Crossway et al.(1986)Biotechniques 4：320-334)(Crossway等人，1986年，《生物技术》，第4卷，第320-334页))、电穿孔(Riggs et al.(1986)Proc.Natl.Acad.Sci.USA 83：5602-5606(Riggs等人，1986年，《美国国家科学院院刊》，第83卷，第5602-5606页))、农杆菌(Agrobacterium)介导的转化(Townsend等人，美国专利No.5,563,055；Zhao等人，美国专利No.5,981,840)、直接基因转移(Paszkowski et al.(1984)EMBO J.3：2717-2722(Paszkowski等人，1984年，《欧洲分子生物学学会杂志》，第3卷，第2717-2722页))和弹道粒子加速法(参见例如Sanford等人，美国专利No.4,945,050；Tomes等人，美国专利No.5,879,918；Tomes等人，美国专利No.5,886,244；Bidney等人，美国专利No.5,932,782；Tomes et al.(1995)“Direct DNA Transfer into Intact PlantCells via Microprojectile Bombardment，”in Plant Cell，Tissue，and OrganCulture：Fundamental Methods，ed.Gamborg and Phillips(Springer-Verlag，Berlin)(Tomes等人，1995年，“通过微粒轰击直接将DNA转移进完整植物细胞中”，载于《植物细胞、组织和器官培养：基本方法》，Gamborg和Phillips编辑(施普林格，柏林))；McCabe et al.(1988)Biotechnology 6：923-926)(McCabe等人，1988年，《生物技术》，第6卷，第923-926页)；以及Lecl转化(WO 00/28058)。另参见Weissinger et al.(1988)Ann.Rev.Genet.22：421-477(Weissinger等人，1988年，《遗传学年鉴》，第22卷，第421-477页)；Sanford et al.(1987)Particulate Science and Technology 5：27-37(Sanford等人，1987年，《颗粒科学与技术》，第5卷，第27-37页)(洋葱)；Christou et al.(1988)Plant Physiol.87：671-674(Christou等人，1988年，《植物生理学》，第87卷，第671-674页)(大豆)；McCabe et al.(1988)Bio/Technology 6：923-926(McCabe等人，1988年，《生物技术》，第6卷，第923-926页)(大豆)；Finer and McMullen(1991)In Vitro Cell Dev.Biol.27P：175-182(Finer和McMullen，1991年，《体外细胞发育生物学》，第27P卷，第175-182页)(大豆)；Singh et al.(1998)Theor.Appl.Genet.96：319-324(Singh等人，1998年，《理论和应用遗传学》，第96卷，第319-324页)(大豆)；Datta et al.(1990)Biotechnology8：736-740(Datta等人，1990年，《生物技术》，第8卷，第736-740页)(水稻)；Klein et al.(1988)Proc.Natl.Acad.Sci.USA85：4305-4309(Klein等人，1988年，《美国国家科学院院刊》，第85卷，第4305-4309页)(玉蜀黍)；Klein et al.(1988)Biotechnology 6：559-563(Klein等人，1988年，《生物技术》，第6卷，第559-563页)(玉蜀黍)；Tomes，美国专利No.5,240,855；Buising等人，美国专利No.5,322,783和5,324,646；Tomes et al.(1995)“Direct DNA Transfer into Intact PlantCeUs via Microprojectile Bombardment，”in Plant Cell，Tissue，and Organ Culture：Fundamental Methods，ed.Gamborg(Springer-Verlag，Berlin)(maize)(Tomes等人，1995年，“通过微粒轰击直接将DNA转移到完整植物细胞中”，载于《植物细胞、组织和器官培养：基本方法》，Gamborg编辑，施普林格出版社，柏林)(玉蜀黍)；Klein et al.(1988)PlantPhysiol.91：440-444(Klein等人，1988年，《植物生理学》，第91卷，第440-444页)(玉蜀黍)；Fromm et al.(1990)Biotechnology 8：833-839(Fromm等人，1990年，《生物技术》，第8卷，第833-839页)(玉蜀黍)；Hooykaas-Van Slogteren et al.(1984)Nature(London)311：763-764(Hooykaas-Van Slogteren等人，1984年，《自然》(伦敦)，第311卷，第763-764页)；Bowen等人，美国专利No.5,736,369(谷类)；Bytebier et al.(1987)Proc.Natl.Acad.Sci.USA 84：5345-5349(Bytebier等人，1987年，《美国国家科学院院刊》，第84卷，第5345-5349页)(百合科)；De Wet et al.(1985)in The ExperimentalManipulation of Ovule Tissues，ed.Chapman et al.(Longman，New York)，pp.197-209(De Wet等人，1985年，载于《胚珠组织的实验操纵》，Chapman等人编辑，(朗文公司，纽约)，第197-209页)(花粉)；Kaeppler et al.(1990)Plant Cell Reports 9：415-418(Kaeppler等人，1990年，《植物细胞报道》，第9卷，第415-418页)以及Kaeppler et al.(1992)Theor.Appl.Genet.84：560-566(Kaeppler等人，1992年，《理论和应用遗传学》，第84卷，第560-566页)(晶须介导的转化)；D′Halluin et al.(1992)Plant Cell 4：1495-1505(D′Halluin等人，1992年，《植物细胞》，第4卷，第1495-1505页)(电穿孔)；Li et al.(1993)Plant Cell Reports 12：250-255(Li等人，1993年，《植物细胞报道》，第12卷，第250-255页)以及Christou and Ford(1995)Annals of Botany 75：407-413(Christou和Ford，1995年，《植物学年鉴》，第75卷，第407-413页)(水稻)；Osjoda et al.(1996)NatureBiotechnology 14：745-750(Osjoda等人，1996年，《自然生物技术》，第14卷，第745-750页)(玉蜀黍，通过根瘤农杆菌(Agrobacterium tumefaciens))；所有这些文献均以引用方式并入本文。

在具体的实施例中，可以使用多种瞬时转化方法为植物提供本发明所公开的雄性育性多核苷酸或表达盒。此类瞬时转化方法包括但不限于直接向植物中引入雄性育性多肽或其变体和片段，或者向植物中引入雄性育性转录物。这类方法包括例如微注射或粒子轰击。参见例如Crossway et al.(1986)Mol Gen.Genet.202：179-185(Crossway等人，1986年，《分子遗传学与普通遗传学》，第202卷，第179-185页)；Nomura et al.(1986)PlantSci.44：53-58(Nomura等人，1986年，《植物科学》，第44卷，第53-58页)；Hepler et al.(1994)Proc.Natl.Acad.Sci.91：2176-2180(Hepler等人，1994年，《美国国家科学院院刊》，第91卷，第2176-2180页)以及Hush et al.(1994)The Journal of Cell Science 107：775-784(Hush等人，1994年，《细胞科学杂志》，第107卷，第775-784页)，所有文献均以引用方式并入本文。作为另一种选择，可以使用本领域已知的技术将本文所公开的雄性育性多核苷酸或表达盒瞬时转化到植物中。此类技术包括病毒载体系统以及将多核苷酸以避免DNA随后释放的方式进行沉淀。因此，从粒子结合的DNA可发生转录，但它释放出来而整合到基因组中的频率则大大降低。此类方法包括使用包被有聚乙基亚胺(PEI；Sigma#P3143)的粒子。

在其他实施例中，通过使植物与病毒或病毒核酸接触，可以将本文所公开的雄性育性多核苷酸或表达盒引入植物中。一般来讲，此类方法涉及将本文所公开的核苷酸构建体整合到病毒DNA或RNA分子内部。认识到，本文所公开的雄性育性序列可最初作为病毒聚蛋白的一部分来合成，其随后可通过体内或体外蛋白水解进行加工，由此产生所需的重组蛋白。涉及病毒DNA或RNA分子的用于将多核苷酸引入植物中并表达其中所编码的蛋白质的方法是本领域已知的。参见例如美国专利No.5,889,191、No.5,889,190、No.5,866,785、No.5,589,367、No.5,316,931，以及Porta et al.(1996)Molecular Biotechnology 5：209-221(Porta等人，1996年，《分子生物技术》，第5卷，第209-221页)；这些专利和文献以引用方式并入本文。

用于在植物基因组中特定位置处定向插入多核苷酸的方法是本领域已知的。在一个实施例中，使用位点特异性重组系统，实现在所需的基因组位置处插入多核苷酸。参见例如WO99/25821、WO99/25854、WO99/25840、WO99/25855和WO99/25853，所有这些专利以引用方式并入本文。简而言之，可将本文所公开的多核苷酸包含在旁侧分布有两个不相同的重组位点的转移盒中。将转移盒引入到在其基因组中稳定整合了这样的靶标位点的植物中，该靶标位点在旁侧分布有与该转移盒的所述位点对应的两个不相同的重组位点。提供适当的重组酶，将转移盒整合在该靶标位点处。目的多核苷酸因此整合在植物基因组中的特定染色体位置处。

可以根据常规方式将已转化的细胞培育成植物。参见例如McCormick et al.(1986)Plant Cell Reports 5：81-84(McCormick等人，1986年，《植物细胞报道》，第5卷，第81-84页)。然后可使这些植物生长，用相同的转化植株或不同的植株进行授粉，所得的子代具有所鉴定的所需表型特征的所需表达。可培养两代或更多代以确保所需表型特征的表达得到稳定保持和遗传，然后收获种子以确保所需表型特征的表达已得到实现。以此方式，本公开提供在其基因组中稳定整合了本文所公开的雄性育性多核苷酸(例如本文所公开的表达盒)的转化种子(也称为“转基因种子”)。包含本文所公开的任何表达盒的种子可根据尺寸参数分选，所述尺寸参数包括但不限于种子长度、种子宽度、种子密度、或它们的任何组合。

本文所公开的雄性育性多核苷酸和表达盒可用于任何植物物种的转化，包括但不限于单子叶植物和双子叶植物。目的植物物种的例子包括但不限于：玉米(Zea mays)、芸苔属(Brassica)物种(例如，卷心菜型油菜(B.napus)、芜菁(B.rapa)、芥菜(B.juncea))、苜蓿(Medicago sativa)、水稻(Oryza sativa)、黑麦(Secale cereale)、高粱(Sorghumbicolor，Sorghum vulgare)、粟(例如珍珠粟(Pennisetum glaucum)、黄米(Panicummiliaceum)、谷子(Setaria italica)、龙爪稷(Eleusine coracana))、向日葵(Helianthusannuus)、红花(Carthamus tinctorius)、小麦(Triticum aestivum)、大豆(Glycine max)、烟草(Nicotiana tabacum)、马铃薯(Solanum tuberosum)、落花生(Arachis hypogaea)、棉花(海岛棉(Gossypium barbadense)、陆地棉(Gossypium hirsutum))、甘薯(Ipomoeabatatus)、木薯(Manihot esculenta)、咖啡(Coffea spp.)、椰子(Cocos nucifera)、菠萝(Ananas comosus)、柑橘属果树(Citrus spp.)、可可(Theobroma cacao)、茶(Camelliasinensis)、香蕉(Musa spp.)、鳄梨(Persea americana)、无花果(Ficus casica)、番石榴(Psidium guajava)、芒果(Mangifera indica)、橄榄(Olea europaea)、木瓜(Caricapapaya)、腰果(Anacardium occidentale)、澳洲坚果(Macadamia integrifolia)、扁桃树(Prunus amygdalus)、糖用甜菜(Beta vulgaris)、甘蔗(Saccharum spp.)、燕麦、大麦、蔬菜、观赏植物、稻科植物和针叶树。

在特定实施例中，将小麦植物用于本文所公开的方法和组合物中。如本文所用，术语“小麦”是指小麦属(Triticum)的任何物种，包括其亲代以及通过与其他物种进行杂交而得到的其子代。小麦包括“六倍体小麦”和“四倍体小麦”，前者具有AABBDD的基因组结构、由42条染色体构成，后者具有AABB的基因组结构、由28条染色体构成。六倍体小麦包括普通小麦(T.aestivum)、斯佩耳特小麦(T.spelta)、摩卡小麦(T.mocha)、密穗小麦(T.compactum)、印度圆粒小麦(T.sphaerococcum)、瓦维洛夫小麦(T.vavilovii)，以及它们的种间杂交品种。四倍体小麦包括硬粒小麦(T.durum)(也称为硬质小麦或Triticumturgidum ssp.durum)、野生二粒小麦(T.dicoccoides)、栽培二粒小麦(T.dicoccum)、波兰小麦(T.polonicum)，以及它们的种间杂交品种。此外，术语“小麦”包括六倍体或四倍体小麦属物种的可能亲代，诸如提供A基因组的乌拉尔图小麦(T.uartu)、栽培一粒小麦(T.monococcum)或野生一粒小麦(T.boeoticum)，提供B基因组的拟斯卑尔托山羊草(Aegilops speltoides)，以及提供D基因组的粗山羊草(T.tauschii)(也称为节节麦(Aegilops squarrosa)或Aegilops tauschii)。用于本公开中的小麦栽培种可属于但不限于上文列出物种中的任一种。还涵盖了通过常规技术使用小麦属物种作为亲本与非小麦属物种进行有性杂交产生的植物，所述非小麦属物种诸如黑麦(Secale cereale)，包括但不限于黑小麦。在一些实施例中，小麦植物适用于具有本领域技术人员已知的合适农学特性的谷物(诸如六倍体小麦或硬质小麦的商业品种)的商业生产。

蔬菜包括番茄(Lycopersicon esculentum)、莴苣(例如Lactuca sativa)、青豆(Phaseolus vulgaris)、利马豆(Phaseolus limensis)、豌豆(Lathyrus spp.)和黄瓜属(Cucumis)的成员诸如黄瓜(C.sativus)、香瓜(C.cantalupensis)和甜瓜(C.melo)。观赏植物包括杜鹃(Rhododendron spp.)、八仙花(Macrophylla hydrangea)、朱槿(Hibiscusrosasanensis)、玫瑰(Rosa spp.)、郁金香(Tulipa spp.)、水仙(Narcissus spp.)、矮牵牛(Petunia hybrida)、康乃馨(Dianthus caryophyllus)、一品红(Euphorbia pulcherrima)和菊花(chrysanthemum)。

可用于实施本发明的方法和组合物的针叶树包括例如松树诸如火炬松(Pinustaeda)、湿地松(Pinus elliotii)、西黄松(Pinus ponderosa)、美国黑松(Pinuscontorta)和辐射松(Pinus radiata)；花旗松(Pseudotsuga menziesii)；西铁杉(Tsugacanadensis)；北美云杉(Picea glauca)；红杉(Sequoia sempervirens)；枞树(true firs)诸如银枞(Abies amabilis)和胶枞(Abies balsamea)；以及雪松诸如西方红雪松(Thujaplicata)和阿拉斯加黄雪松(Chamaecyparis nootkatensis)。在特定实施例中，本文所公开的植物是作物植物(例如玉米、苜蓿、向日葵、芸苔属、大豆、棉花、红花、花生、高梁、小麦、粟、烟草等等)。在其他实施例中，玉米和大豆植物是最佳的，在另外其他实施例中，玉米植物是最佳的。

其他目的植物包括提供目的种子的谷物植物、油料种子植物和豆科植物。目的种子包括谷物种子，诸如玉米、小麦、大麦、水稻、高梁、黑麦等。油料种子植物包括棉花、大豆、红花、向日葵、芸苔、玉蜀黍、苜蓿、棕榈、椰子等。豆科植物包括豆类和豌豆。豆类包括瓜尔豆、槐豆、胡芦巴、大豆、四季豆、豇豆、绿豆、利马豆、蚕豆、小扁豆、鹰嘴豆等等。

通常，中间宿主细胞将被用于实施本文所公开的方法和组合物，以增加克隆载体的拷贝数。随着拷贝数增加，可分离极大数量的含有目的核酸的载体来引入所需的植物细胞中。在一个实施例中，采用不会引起所述多肽在细菌中的表达的植物启动子。

原核生物最常由各种大肠杆菌(E.coli)菌株代表；然而，也可以使用其他微生物菌株。在本文中定义为包括用于转录起始的启动子(任选具有操纵子)以及核糖体结合序列的常用原核控制序列包括诸如β-内酰胺酶(青霉素酶)启动子系统和乳糖(lac)启动子系统(Chang et al.(1977)Nature198：1056(Chang等人，1977年，《自然》，第198卷，第1056页))、色氨酸(trp)启动子系统(Goeddel et al.(1980)Nucleic Acids Res.8：4057(Goeddel等人，1980年，《核酸研究》，第8卷，第4057页))和λ衍生的PL启动子之类的常用启动子，以及N-基因核糖体结合位点(Shimatake et al.(1981)Nature 292：128(Shimatake等人，1981年，《自然》，第292卷，第128页))。在转柒进大肠杆菌中的DNA载体中包含选择标记也是有用的。这种标记的例子包括确定对氨苄青霉素、四环素或氯霉素的抗性的基因。

选择载体以使得能引入到适当的宿主细胞中。细菌载体通常是质粒或噬菌体起源的。将适当的细菌细胞用噬菌体载体颗粒感染或用裸噬菌体载体DNA转染。如果使用质粒载体，则将细菌细胞用质粒载体DNA转染。用于表达本文所公开的蛋白质的表达系统可用芽孢杆菌属(Bacillus)物种和沙门氏菌属(Salmonella)提供(Palva et al.(1983)Gene 22：229-235(Palva等人，1983年，《基因》，第22卷，第229-235页))；Mosbach et al.(1983)Nature 302：543-545(Mosbach等人，1983年，《自然》，第302卷，第543-545页))。

在一些实施例中，本文所公开的表达盒或雄性育性多核苷酸在植物中维持在半合子状态。半合子状态为当仅有基因(或一组基因)的一个拷贝，而在姊妹染色体上没有对应等位基因时存在的遗传状态。在某些实施例中，本文所公开的表达盒包含有效连接到雄性育性多核苷酸的第一启动子，该雄性育性多核苷酸与有效连接到雄性组织优选启动子的雄性配子破坏性多核苷酸堆叠，并且将此类表达盒引入处于半合子状态的雄性不育植物。当雄性育性多核苷酸表达时，由于雄性育性多核苷酸使该植物恢复到能育状态，故该植物能够成功地产生成熟的花粉粒。鉴于表达盒处于半合子状态，故在花粉粒形成过程中，只有某些子细胞将遗传该表达盒。由于堆叠的被编码的雄性配子破坏性基因产物的雄性组织优选的表达，遗传了包含雄性育性多核苷酸的表达盒的子细胞将不会发育为成熟的花粉粒。未遗传该表达盒的那些花粉粒将继续发育为成熟的花粉粒并具有功能性，但它们将不包含该表达盒的雄性育性多核苷酸，因此将不会通过花粉将雄性育性多核苷酸传递到子代。

V.调节雄性育性多肽的浓度和/或活性

提供了用于调节植物中的本文所公开的雄性育性多肽的浓度和/或活性的方法。本文针对雄性育性多肽的浓度和/或活性所用的术语“影响”或“调节”，是指当与适当的对照比较时，雄性育性多肽的浓度和/或活性的任何增大或减小。一般来讲，本文所公开的雄性育性多肽的浓度和/或活性相对于天然的对照植物、植物部分或细胞增大或减小至少1％、5％、10％、20％、30％、40％、50％、60％、70％、80％或90％。本文所公开的调节可在植物生长至所需的发育阶段过程中和/或在其后进行。在特定的实施例中，在单子叶植物(特别是小麦)中对本文所公开的雄性育性多肽进行调节。

可采用多种方法来测定雄性育性多肽的浓度和/或活性的调节。例如，雄性育性多肽的表达水平可以例如通过测定植物中雄性育性多肽的水平来直接测量(即，蛋白质印迹法或RNA印迹法)，或者例如通过测定植物中雄性育性多肽的雄性育性活性来间接测量。用于测量雄性育性活性的方法在本文别处进行描述。在特定的实施例中，对雄性育性多肽浓度和/或活性的调节包括对植物中的雄性育性多肽的水平的调节(即，增大或减小)。测量雄性育性多肽的水平和/或活性的方法在本领域中是已知的并且在本文别处进行讨论。在另有其他实施例中，对营养组织中、繁殖组织中、或营养组织和繁殖组织两者中的雄性育性多肽的水平和/或活性进行调节。

在一个实施例中，通过将雄性育性多肽或相应的雄性育性多核苷酸引入植物来增大该多肽的活性和/或浓度。随后，使用本领域技术人员已知的方法选出具有引入的雄性育性序列的植物，所述方法诸如但不限于DNA印迹分析、DNA测序、PCR分析或表型分析。在某些实施例中，将标记多核苷酸与雄性育性多核苷酸一起引入，以便帮助选择具有或缺乏本文所公开的雄性育性多核苷酸的植物。将经前述实施例改变或修饰的植物或植物部分在形成植物的条件下培育足以调节雄性育性多肽在该植物中的浓度和/或活性的时间。形成植物的条件在本领域中是公知的。

如本文别处所讨论，许多用来将多肽提供给植物的方法是本领域已知的，包括但不限于将多肽直接引入植物中，或者将编码雄性育性多肽的多核苷酸构建体引入植物中(瞬时引入或稳定引入)。还应认识到，本文所公开的方法可采用不能够在转化的植物中指导蛋白质或RNA的表达的多核苷酸。因而，雄性育性多肽的水平和/或活性可通过改变编码雄性育性多肽的基因或其启动子来增大。参见例如，Kmiec的美国专利5,565,350；Zarling等人的PCT/US93/03868。因此提供了在雄性育性基因中携带突变的经诱变处理的植物，其中所述突变增加雄性育性基因的表达或增大被编码的雄性育性多肽的活性。

在其他实施例中，通过向植物引入如本文别处所公开的包含雄性育性多核苷酸(例如SEQ ID NO：1、3、5、7、9、11、13、15或17)或其活性片段或变体的表达盒来增大雄性育性多肽的浓度和/或活性。雄性育性多核苷酸可以有效连接到对于植物是异源的或者对于植物是天然的启动子。通过增大植物中的雄性育性多肽的浓度和/或活性，该植物的雄性育性也增大。因此，可以通过增大雄性育性多肽的浓度和/或活性来增大植物的雄性育性。例如，通过增大雄性育性多肽的浓度和/或活性，可使雄性不育植物恢复雄性育性。

还应认识到，可通过采用不能够在转化的植物中指导蛋白质或RNA的表达的多核苷酸，来调节该多肽的水平和/或活性。例如，本文所公开的多核苷酸可用来设计可在用于改变或突变生物体中的基因组核苷酸序列的方法中应用的多核苷酸构建体。这类多核苷酸构建体包括但不限于：RNA:DNA载体、RNA:DNA突变载体、RNA:DNA修复载体、混合双链体寡核苷酸、自身互补RNA:DNA寡核苷酸和引起重组的寡核苷酸。这类核苷酸构建体和使用方法是本领域已知的。参见美国专利No.5,565,350、No.5,731,181、No.5,756,325、No.5,760,012、No.5,795,972和No.5,871,984，所有这些专利以引用方式并入本文。还可参见WO 98/49350、WO 99/07865、WO 99/25821和Beetham，et al.，(1999)Proc.Natl.Acad.Sci.USA96：8774-8778(Beetham等人，1999年，《美国国家科学院院刊》，第96卷，第8774-8778页)；这些专利和文献以引用方式并入本文。因此应认识到，本文所公开的方法并不依赖于将完整多核苷酸整合到基因组中，只要将该多核苷酸引入细胞而使植物或其细胞被改变即可。

在一个实施例中，基因组可在将该多核苷酸引入细胞之后被改变。例如，可将多核苷酸或其任何部分整合到植物的基因组中。本文所公开的基因组的变更包括但不限于基因组中核苷酸的添加、缺失和置换。虽然本文所公开的方法并不依赖于任何具体数目的核苷酸的添加、缺失和置换，但应认识到此类添加、缺失或置换包含至少一个核苷酸。

表1：SEO ID NO汇总

本文所用的词语“一个”和“一种”指一个(种)或不止一个(种)(即，指至少一个(种))该词语的语法对象。举例而言，“一个要素”意指一个或多个要素。

本说明书中提到的所有公布和专利申请指示了本发明所属领域的技术人员的水平。所有公布和专利申请以引用方式并入本文，如同每个单独的公布或专利申请被具体地和独立地指出以引用方式并入本文一样。

虽然为了清楚地理解而已经通过举例说明和实例较详细地描述了本发明，但显然可以在权利要求书范围内实施一些改变和修饰。

实验

实例1：小麦中雄性育性多核苷酸的鉴定

可以使用生物信息学方法鉴定本文所公开的雄性育性多核苷酸。例如，推定为代表小麦中的雄性育性基因的序列最初通过使用来自其他物种(诸如玉蜀黍)的已知育性基因对专有数据库进行计算机(in silico)搜索来鉴定。基于与参考序列的蛋白质水平同源性和对候选序列所源于的库的考虑来选择候选EST，例如代表雄性繁殖组织中的表达。基于候选EST序列创建引物，并使用该引物对专有的小麦BAC库进行筛选。使用适当的引物对鉴定出的超级池(super-pool)进行进一步筛选，以鉴定包含EST的特定BAC克隆。

可使用如下循环参数进行降落式PCR(

PCR系统9700，应用生物系统公司(Applied Biosystems))：94℃3分钟(1个循环)；94℃1分钟，55℃1分钟，随后72℃1分30秒(35个循环)；72℃7分钟，结束于4℃。Pfu Ultra Hotstart^TM DNA聚合酶(Stratagene公司)可能是优选的，因为其具有非常低的平均误差率(每500bp的扩增片段小于0.5％)。

将分离自BAC克隆的小麦DNA插入物消化，用于使用候选EST克隆作为探针进行DNA印迹确认。将BAC片段亚克隆进

(美国加利福利亚州拉荷亚的Stratagene有限公司(Stratagene Inc.，La Jolla，CA))。LB培养基上长出白色菌落，使用斑点印迹程序将其转移到膜上。在变性之后，用候选EST克隆对膜进行探测。鉴定阳性克隆，并测序。

实例2：小麦雄性育性多核苷酸与已知序列的比较

表2：小麦、玉蜀黍和水稻Ms22多核苷酸和多肽的全局同一性

(多核苷酸结果在阴影框中列出；多肽结果在非阴影框中列出。)

表3：小麦、玉蜀黍和水稻Ms26多核苷酸和多肽的全局同一性

表4：小麦、玉蜀黍和水稻Ms45多核苷酸和多肽的全局同一性

实例3：小麦转化

本领域技术人员可获知小麦转化方案。参见例如，He et al.(2010)J.Exp.Botany61(6)：1567-1581(He等人，2010年，《实验植物学杂志》，第61卷，第6期，第1567-1581页)；Wuet al.(2008)Transgenic Res.17：425-436(Wu等人，2008年，《转基因研究》，第17卷，第425-436页)；Nehra et al.(1994)Plant J.5(2)：285-297(Nehra等人，1994年，《植物杂志》，第5卷，第2期，第285-297页)；Rasco-Gaunt et al.(2001)J.Exp.Botany 52(357)：865-874(Rasco-Gaunt等人，2001年，《实验植物学杂志》，第52卷，第357期，第865-874页)；Razzaq et al.(2011)African J.Biotech.10(5)：740-750(Razzaq等人，2011年，《非洲生物技术杂志》，第10卷，第5期，第740-750页)。

实例4：MS26的定向修饰。

本实例描述了使用双链断裂技术使小麦基因突变以使得能够进行定向DNA修饰或经由同源重组进行基因插入的方法。更具体地讲，本实例描述了一种方法，其包括但不限于递送定制的归巢核酸内切酶MS26+，以便识别、切割小麦染色体DNA并通过不精确的非同源末端连接(NHEJ)修复对该DNA进行突变。

载体和转化：

位于小麦基因组A、B和D内的雄性育性MS26基因包含22个碱基对的序列(5’-GATGGTGACGTACGTGCCCTAC-3’；SEQ ID NO：21)，该序列被MS26+归巢核酸内切酶识别为用于引入双链断裂的底物。22bp的MS26识别位点存在于A、B和D小麦基因组内，并且在整个玉蜀黍、高粱和水稻MS26直系同源基因中为保守的(图1)。已证实MS26+归巢核酸内切酶在玉蜀黍、水稻和高粱植物中产生突变，参见2013年5月10日公布的WO2013/066423。为了在小麦植物的基因组Ms26基因中产生突变，通过类似于以下文献所述方法的农杆菌介导的转化方法将PHP42063引入小麦Fielder品种中(Tamas-Nyitrai et al Plant Cell CulturesProtocols Methods in Molecular Biology 877，2012，357-384(Tamas-Nyitrai等人，植物细胞培养方案方法，载于《分子生物学》，2012年，第877卷，第357-384页)；He，et al.，(2010)J.Exp.Botany 61(6)：1567-1581(He等人，2010年，《实验植物学杂志》，第61卷，第6期，第1567-1581页)；Wu，et l.，(2008)Transgenic Res.17：425-436(Wu等人，2008年，《转基因研究》，第17卷，第425-436页)；Nehra，et al.，(1994)Plant J.5(2)：285-297(Nehra等人，1994年，《植物杂志》，第5卷，第2期，第285-297页)；Rasco-Gaunt，et al.，(2001)J.Exp.Botany 52(357)：865-874(Rasco-Gaunt等人，2001年，《实验植物学杂志》，第52卷，第357期，第865-874页)；Razzaq，et al.，(2011)African J.Biotech.10(5)：740-750(Razzaq等人，2011年，《非洲生物技术杂志》，第10卷，第5期，第740-750页))。

PHP42063包含处于玉蜀黍CAS1启动子的转录控制下的单链MS26+。CAS1启动子可通过磺酰脲类安全剂2-CBSU、或通过高温以转录方式诱导(2013年5月17日提交的美国专利申请13/896,437)。PHP42063还包含由ZmEND2启动子调节的蓝色荧光基因(CFP)，其被用作对T-DNA向小麦细胞中的整合进行选择的可视标记。此外，PHP42063包含由玉蜀黍组蛋白2B启动子调节的红色荧光基因的拷贝。该构建体中的红色荧光基因的一部分以正向取向的方式复制，由具有369bp重叠的RFP基因的两个片段组成。这两个片段被包含MS26靶标位点的136bp的间隔区隔开。选择发蓝色荧光的愈伤组织并用于小麦植物的再生，随后使该小麦植物在温室中生长至成熟和结实。通过拷贝数分析对包含PHP42063的TDNA插入的小麦植物进行验证。选择四株独立的转化了单拷贝或低拷贝PHP42063的植物用于另外的实验。在授粉、杀菌、放置于维持培养基上并在暗处于37℃温育24小时之后的14-20天收获发蓝色荧光的未成熟胚。在该期间结束时，将在高温下温育的胚移至室温(＜26C)，随后使胚在暗处生长。在高温处理起始之后的大约72小时，于37C下温育的胚开始发育出发红色荧光的部分。该观察结果表明，热诱导型基因盒CAS1:MS26+已导致在RF-FP报告基因的两个重叠序列之间的MS26靶标位点处发生双链断裂，从而促成分子内重组并产生功能性RFP基因，该功能性RFP基因由相对蓝色荧光背景发红色荧光的细胞的出现而显示。选择发红色荧光的愈伤组织事件进行另外的分子表征和植物再生。

植物组织中TaMS26靶标位点处的突变的鉴定。

从用MS26+归巢核酸内切酶转化的经热处理和未经热处理的愈伤组织提取总基因组DNA，随后用

高保真PCR扩增预混试剂(

High Fidelity PCR MasterMix)(纽英伦生物技术公司(New England Biolabs)，M0531L)对基因组靶标位点周围的区域进行PCR扩增，从而添加上扩增子特异性条形码所必需的序列，由此使用“带尾的”引物通过两轮PCR进行Illumnia测序。一级PCR反应中所用的引物在表5中示出。

表5：PCR引物序列

二级PCR反应中所用的引物为AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACG(正向，SEQ ID NO：24)和CAAGCAGAAGACGGCATA(反向，SEQ ID NO：25)。从未转化的Fielder植物的叶片中提取的基因组DNA充当阴性对照。

使用凯杰公司(Qiagen)的Minielute PCR纯化离心柱将所得的PCR扩增产物浓缩，接着置于2％的琼脂糖凝胶上进行电泳，随后切除适当的扩增产物并用凯杰公司的凝胶提取离心柱进行纯化。采用基于Hoechst染料的荧光测定法，以等摩尔比结合测量凝胶纯化的扩增产物的浓度，随后在Illumina的基因组分析仪IIx(Genome Analyzer IIx，ELIM生物制药有限公司(ELIM Biopharmaceuticals，Inc.))上周PhiX对照v3(Illumina，FC-110-3001)的30-40％(v/v)加标(用于抵消序列偏差)来进行100核苷酸长度的深度单端(singleread)测序。只有在以预期的裂解位点为中心的6核苷酸窗口内出现的核苷酸插入与缺失(indel)≥1，并且不以类似的水平存在于阴性对照中的那些读段(read)才被归类为NHEJ突变。然后使用NHEJ突变的总数，基于具有包含与条形码和正向引物的完全匹配的适当长度的读段的总数来计算突变读段的百分比(％)。

表6中示出通过深度测序为用MS26+归巢核酸内切酶转化的未经热处理和经热处理的愈伤组织回收的NHEJ突变的频率与阴性对照的比较。从经热处理的愈伤组织回收的十种最普遍的NHEJ突变类型在图2中示出。这些数据表明，MS26+归巢核酸内切酶将NHEJ突变和变更有效地引入到了天然的MS26小麦基因中。

表6：小麦MS26+归巢核酸内切酶靶标基因座处的突变读段的百分比(％)。

再生植物中TaMS26靶标位点处的突变的鉴定。

选择发红色荧光的愈伤组织事件进行植物再生。使植物在温室中生长，然后对来自各个再生小麦植株(n＝122)的叶片DNA进行MS26-1靶标位点突变的筛选，方式为：使用引物对UNIMS265’-2(GACGTGGTGCTCAACTTCGTGAT；SEQ ID NO：26)和UNIMS263’-1(GCCATGGAGAGGATGGTCATCAT；SEQ ID NO：27)，通过PCR将该区域扩增，随后使用识别序列5’-CGTACG-3’的DNA限制性酶BsiWI将扩增的产物消化。使这些反应的产物在1％的琼脂糖凝胶上进行电泳，随后筛选耐BsiWI消化的条带，这些条带指示在MS26-1靶标位点处的突变。

从PHP42063经热处理的胚筛选的122株再生植物中的10株包含耐BsiWI限制性酶消化的PCR产物，其指示MS26靶标位点处的突变。对这些PCR产物的亚克隆和DNA序列分析表明，在整个MS26靶标位点上的多种突变从插入单个核苷酸到缺失4至98个核苷酸不等。在这些再生的小麦植株中，总共鉴定出七种不相同的突变(图3)。使包含这些突变的植株进行自花授粉。通过PCR扩增以显示指示MS26-1靶标位点处的突变的耐BsiWI消化的条带(如上所述)，来对子代植物进行针对上述突变的减数分裂遗传的筛选。在由从包含突变型Ms26等位基因的亲本植株得到的自交种子生长而来的子代植物中鉴定出耐BsiWI的PCR扩增产物，同时对这些产物的DNA序列分析证实原始突变经有性繁殖方式传递到了下一代。

本实例证明了通过定向递送双链断裂试剂(在这种情况下是定制的归巢核酸内切酶)对小麦基因的修饰，该双链断裂试剂识别、切割小麦染色体DNA并通过了末端连接修复对该DNA进行突变。

序列表

<110> 先锋国际良种公司(PIONEER HI-BRED INTERNATIONAL, INC.)

<120> 包含雄性育性序列的组合物和方法

<130> 5282-PCT

<150> US 61/697,590

<151> 2012-09-06

<160> 52

<170> PatentIn版本3.5

<210> 1

<211> 414

<212> DNA

<213> 乌拉尔图小麦(Triticum urartu)

<400> 1

atgttgagga tgcagcagca ggtggagggc gtggtgggcg gcggcatcgt ggccgaggcg 60

gaggaggcgg cggtgtacga gcgggtggct cgcatggcca gcggcaacgc ggtggtcgtc 120

ttcagcgccm gcggctgctg catgtgccac gtcgtcaagc gcctcctgct tggcctgggg 180

gtcggcccca ccgtctacga gttggaccag atgggcggcg ccgggcgaga gatccaggcg 240

gcgctggcgc agctgctgcc ccccggaccc ggcgccggcc accaccagca gccgccagtg 300

cccgtggtgt tcgtcggcgg gaggctcctg ggcggcgtgg agaaggtcat ggcgtgccac 360

atcaacggca cgctcgtccc gctcctcaag gacgccggcg cgctctggct ctga 414

<210> 2

<211> 137

<212> PRT

<213> 乌拉尔图小麦(Triticum urartu)

<220>

<221> misc_feature

<223> Xaa =任何氨基酸

<220>

<221> misc_feature

<222> (44)..(44)

<223> Xaa可以是任何天然存在的氨基酸

<400> 2

Met Leu Arg Met Gln Gln Gln Val Glu Gly Val Val Gly Gly Gly Ile

1 5 10 15

Val Ala Glu Ala Glu Glu Ala Ala Val Tyr Glu Arg Val Ala Arg Met

20 25 30

Ala Ser Gly Asn Ala Val Val Val Phe Ser Ala Xaa Gly Cys Cys Met

35 40 45

Cys His Val Val Lys Arg Leu Leu Leu Gly Leu Gly Val Gly Pro Thr

50 55 60

Val Tyr Glu Leu Asp Gln Met Gly Gly Ala Gly Arg Glu Ile Gln Ala

65 70 75 80

Ala Leu Ala Gln Leu Leu Pro Pro Gly Pro Gly Ala Gly His His Gln

85 90 95

Gln Pro Pro Val Pro Val Val Phe Val Gly Gly Arg Leu Leu Gly Gly

100 105 110

Val Glu Lys Val Met Ala Cys His Ile Asn Gly Thr Leu Val Pro Leu

115 120 125

Leu Lys Asp Ala Gly Ala Leu Trp Leu

130 135

<210> 3

<211> 414

<212> DNA

<213> 拟斯卑尔托山羊草(Aegilops speltoides)

<400> 3

atgttgagga tgcagcagca ggtggagggc gtggtgggcg gcggcatcgt ggcggaggcg 60

gaggaggcgg ccgtgtacga gcgggtggct cgcatggcca gcggcaacgc ggtggtcgtc 120

ttcagcgcca gcggctgctg catgtgccac gtcgtcaagc gcctcctgct tggcctggga 180

gtcggcccca ccgtgtacga gttggaccag atgggcggcg ccgggcggga gatccaggcg 240

gccctggcgc agctgctgcc ccccggaccc ggcgccggcc accaccagca gccgccggtg 300

cccgtggtgt tcgtyggcgg gaggctcctg ggcggcgtgg agaaggtgat ggcgtgccac 360

atcaacggca cgctcgtccc gctcctcaag gacgccggcg cgctctggct ctga 414

<210> 4

<211> 137

<212> PRT

<213> 拟斯卑尔托山羊草(Aegilops speltoides)

<220>

<221> misc_feature

<223> Xaa =任何氨基酸

<220>

<221> misc_feature

<222> (105)..(105)

<223> Xaa可以是任何天然存在的氨基酸

<400> 4

Met Leu Arg Met Gln Gln Gln Val Glu Gly Val Val Gly Gly Gly Ile

1 5 10 15

Val Ala Glu Ala Glu Glu Ala Ala Val Tyr Glu Arg Val Ala Arg Met

20 25 30

Ala Ser Gly Asn Ala Val Val Val Phe Ser Ala Ser Gly Cys Cys Met

35 40 45

Cys His Val Val Lys Arg Leu Leu Leu Gly Leu Gly Val Gly Pro Thr

50 55 60

Val Tyr Glu Leu Asp Gln Met Gly Gly Ala Gly Arg Glu Ile Gln Ala

65 70 75 80

Ala Leu Ala Gln Leu Leu Pro Pro Gly Pro Gly Ala Gly His His Gln

85 90 95

Gln Pro Pro Val Pro Val Val Phe Xaa Gly Gly Arg Leu Leu Gly Gly

100 105 110

Val Glu Lys Val Met Ala Cys His Ile Asn Gly Thr Leu Val Pro Leu

115 120 125

Leu Lys Asp Ala Gly Ala Leu Trp Leu

130 135

<210> 5

<211> 414

<212> DNA

<213> 粗山羊草(Aegilopsm tauschii)

<400> 5

atgttgagga tgcagcagca ggtggagggc gtggtgggcg gcggcatcat ggcggaggcg 60

gaggaggcgg cggtgtacga gcgggtggct cgcatggcca gcggcaacgc ggtggtcgtc 120

ttcagcgcca gcggctgctg catgtgccac gtcgtcaagc gcctcctgct tggcctgggg 180

gtcggcccca ccgtctacga gttggaccag atgggcggcg ccgggcgaga gatccaggcg 240

gcgctggcgc agctgctgcc ccccggaccc ggcgccggcc accaccagca gccgccagtg 300

cccgtggtgt tcgtcggcgg gaggctcctg ggcggcgtgg agaaggtgat ggcgtgccac 360

atcaacggca cgctcgtccc gctcctcaag gacgccggcg cgctctggct ctga 414

<210> 6

<211> 137

<212> PRT

<213> 粗山羊草(Aegilopsm tauschii)

<400> 6

Met Leu Arg Met Gln Gln Gln Val Glu Gly Val Val Gly Gly Gly Ile

1 5 10 15

Met Ala Glu Ala Glu Glu Ala Ala Val Tyr Glu Arg Val Ala Arg Met

20 25 30

Ala Ser Gly Asn Ala Val Val Val Phe Ser Ala Ser Gly Cys Cys Met

35 40 45

Cys His Val Val Lys Arg Leu Leu Leu Gly Leu Gly Val Gly Pro Thr

50 55 60

Val Tyr Glu Leu Asp Gln Met Gly Gly Ala Gly Arg Glu Ile Gln Ala

65 70 75 80

Ala Leu Ala Gln Leu Leu Pro Pro Gly Pro Gly Ala Gly His His Gln

85 90 95

Gln Pro Pro Val Pro Val Val Phe Val Gly Gly Arg Leu Leu Gly Gly

100 105 110

Val Glu Lys Val Met Ala Cys His Ile Asn Gly Thr Leu Val Pro Leu

115 120 125

Leu Lys Asp Ala Gly Ala Leu Trp Leu

130 135

<210> 7

<211> 1934

<212> DNA

<213> 乌拉尔图小麦(Triticum urartu)

<400> 7

atggaggaag ctcacggcgg catgccgtcg acgacgacgg cgttcttccc gctggcaggg 60

ctccacaagt tcatggccat cttcctcgtg ttcctctcgt ggatcttggt ccactggtgg 120

agcctgagga agcagaaggg gccgaggtca tggccggtca tcggcgcgac gctggagcag 180

ctgaggaact actaccggat gcacgactgg ctcgtggagt acctgtccaa gcaccggacg 240

gtcaccgtcg acatgccctt cacctcctac acctacatcg ccgaccccgt gaacgtcgag 300

catgtgctca agaccaattt caacaattac cccaaggtga aacaatcctc gagatgtcag 360

acaaggttca gtaatcggta ctgacagtgt tacaaatgtc tgaaatctga aattgtatgt 420

ctagggggag gtgtacaggt cctacatgga cgtgctgctc ggcgacggca tattcaacgc 480

cgacggcgag ctctggagga agcagaggaa gacggcgagc ttcgagttcg cttccaagaa 540

cctgagagac ttcagcacga tcgtgttcag ggagtactcg ctgaagctgt ccagcatcct 600

gagccaggct tgcaaggccg gcaaagtcgt ggacatgcag gcaactgaac tcattccctt 660

ggtcatctga acgttgattt cttggacaaa atttcaagat tctgacgcga gcggacgaat 720

tcaggagctg tacatgagga tgacgctgga ctcgatctgc aaggtcgggt tcggggtcga 780

gatcggcacg ctgtcgccgg agctgccgga gaacagcttc gcgcaggcgt tcgacgccgc 840

caacatcatc gtgacgctgc ggttcatcga cccgctgtgg cgcgtgaaga agttcctgca 900

cgtcggctcg gaggcgctgc tggagcagag catcaagctc gtcgacgagt tcacctacag 960

cgtcatccgc cggcgcaagg ccgagatcgt gcaggcccgg gccagcggca agcaggagaa 1020

ggtgcgtgcg tgatcatcgt cattcgtcaa gctccggatc gctggtttgt gtagtaggtg 1080

ccattgatca ctgacacgtt aactgggtgc gcagatcaag cacgacatac tgtcgcggtt 1140

catcgagctg ggcgaggccg gcggcgacga cggcggcagc ctgttcgggg acgacaaggg 1200

cctccgcgac gtggtgctca acttcgtgat cgccgggcgg gacaccacgg ccacgacgct 1260

gtcctggttc acctacatgg ccatgacgca cccggccgtg gccgagaagc tccgccgcga 1320

gctggccgcc ttcgaggcgg atcgcgcccg cgaggagggc gtcgctctgg tcccctgcag 1380

cgacggcgag ggcgccgacg aggccttcgc cgcccgcgtg gcgcagttcg cggggctcct 1440

gagctacgac gggctcggga agctggtgta cctccacgcg tgcgtgacgg agacgctgcg 1500

gctgtacccg gcggtgccgc aggaccccaa gggcatcgcg gaggacgacg tgctcccgga 1560

cggcaccaag gtgcgcgccg gcgggatggt gacgtacgtg ccctactcca tggggcggat 1620

ggagtataac tggggccccg acgccgccag cttccggccg gagcggtgga tcggcgacga 1680

cggcgcgttc cgcaacgcgt cgccgttcaa gttcacggcg ttccaggcgg ggccgcggat 1740

ctgcctcggc aaggactcgg cgtacctgca gatgaagatg gcgctggcca tactgtgcag 1800

gttcttcagg ttcgagctcg tggagggcca ccccgtcaag taccgcatga tgaccatcct 1860

ctccatggcg cacggcctca aggtccgcgt ctccagggcg ccgctcgcct gatcttgatc 1920

tgggttccgg cgag 1934

<210> 8

<211> 548

<212> PRT

<213> 乌拉尔图小麦(Triticum urartu)

<400> 8

Met Glu Glu Ala His Gly Gly Met Pro Ser Thr Thr Thr Ala Phe Phe

1 5 10 15

Pro Leu Ala Gly Leu His Lys Phe Met Ala Ile Phe Leu Val Phe Leu

20 25 30

Ser Trp Ile Leu Val His Trp Trp Ser Leu Arg Lys Gln Lys Gly Pro

35 40 45

Arg Ser Trp Pro Val Ile Gly Ala Thr Leu Glu Gln Leu Arg Asn Tyr

50 55 60

Tyr Arg Met His Asp Trp Leu Val Glu Tyr Leu Ser Lys His Arg Thr

65 70 75 80

Val Thr Val Asp Met Pro Phe Thr Ser Tyr Thr Tyr Ile Ala Asp Pro

85 90 95

Val Asn Val Glu His Val Leu Lys Thr Asn Phe Asn Asn Tyr Pro Lys

100 105 110

Gly Glu Val Tyr Arg Ser Tyr Met Asp Val Leu Leu Gly Asp Gly Ile

115 120 125

Phe Asn Ala Asp Gly Glu Leu Trp Arg Lys Gln Arg Lys Thr Ala Ser

130 135 140

Phe Glu Phe Ala Ser Lys Asn Leu Arg Asp Phe Ser Thr Ile Val Phe

145 150 155 160

Arg Glu Tyr Ser Leu Lys Leu Ser Ser Ile Leu Ser Gln Ala Cys Lys

165 170 175

Ala Gly Lys Val Val Asp Met Gln Glu Leu Tyr Met Arg Met Thr Leu

180 185 190

Asp Ser Ile Cys Lys Val Gly Phe Gly Val Glu Ile Gly Thr Leu Ser

195 200 205

Pro Glu Leu Pro Glu Asn Ser Phe Ala Gln Ala Phe Asp Ala Ala Asn

210 215 220

Ile Ile Val Thr Leu Arg Phe Ile Asp Pro Leu Trp Arg Val Lys Lys

225 230 235 240

Phe Leu His Val Gly Ser Glu Ala Leu Leu Glu Gln Ser Ile Lys Leu

245 250 255

Val Asp Glu Phe Thr Tyr Ser Val Ile Arg Arg Arg Lys Ala Glu Ile

260 265 270

Val Gln Ala Arg Ala Ser Gly Lys Gln Glu Lys Ile Lys His Asp Ile

275 280 285

Leu Ser Arg Phe Ile Glu Leu Gly Glu Ala Gly Gly Asp Asp Gly Gly

290 295 300

Ser Leu Phe Gly Asp Asp Lys Gly Leu Arg Asp Val Val Leu Asn Phe

305 310 315 320

Val Ile Ala Gly Arg Asp Thr Thr Ala Thr Thr Leu Ser Trp Phe Thr

325 330 335

Tyr Met Ala Met Thr His Pro Ala Val Ala Glu Lys Leu Arg Arg Glu

340 345 350

Leu Ala Ala Phe Glu Ala Asp Arg Ala Arg Glu Glu Gly Val Ala Leu

355 360 365

Val Pro Cys Ser Asp Gly Glu Gly Ala Asp Glu Ala Phe Ala Ala Arg

370 375 380

Val Ala Gln Phe Ala Gly Leu Leu Ser Tyr Asp Gly Leu Gly Lys Leu

385 390 395 400

Val Tyr Leu His Ala Cys Val Thr Glu Thr Leu Arg Leu Tyr Pro Ala

405 410 415

Val Pro Gln Asp Pro Lys Gly Ile Ala Glu Asp Asp Val Leu Pro Asp

420 425 430

Gly Thr Lys Val Arg Ala Gly Gly Met Val Thr Tyr Val Pro Tyr Ser

435 440 445

Met Gly Arg Met Glu Tyr Asn Trp Gly Pro Asp Ala Ala Ser Phe Arg

450 455 460

Pro Glu Arg Trp Ile Gly Asp Asp Gly Ala Phe Arg Asn Ala Ser Pro

465 470 475 480

Phe Lys Phe Thr Ala Phe Gln Ala Gly Pro Arg Ile Cys Leu Gly Lys

485 490 495

Asp Ser Ala Tyr Leu Gln Met Lys Met Ala Leu Ala Ile Leu Cys Arg

500 505 510

Phe Phe Arg Phe Glu Leu Val Glu Gly His Pro Val Lys Tyr Arg Met

515 520 525

Met Thr Ile Leu Ser Met Ala His Gly Leu Lys Val Arg Val Ser Arg

530 535 540

Ala Pro Leu Ala

545

<210> 9

<211> 1929

<212> DNA

<213> 拟斯卑尔托山羊草(Aegilops speltoides)

<400> 9

atggaggaag ctcaccttgg catgccgtcg acgacggcct tcttcccgct ggcagggctc 60

cacaagttca tggccatctt cctcgtgttc ctctcgtgga tcctggtcca ctggtggagc 120

ctgaggaagc agaaggggcc gaggtcatgg ccggtcatcg gcgccacgct ggagcagctg 180

aggaactact accggatgca cgactggctc gtggagtacc tgtccaagca ccggacggtc 240

accgtcgaca tgcccttcac ctcctacacc tacatcgccg acccggtgaa cgtcgagcat 300

gtgctcaaga ccaacttcaa caattacccc aaggtgaaac aatcctcgag atgtcagtca 360

aggttcggta taatcggtac tgacagtgtt acaaatgtct gaaatctgaa attgtgtgtg 420

tagggggagg tgtacaggtc ctacatggac gtgctgctcg gcgacggcat attcaacgcc 480

gacggcgagc tctggaggaa gcagaggaag acggcgagct tcgagttcgc ttccaagaac 540

ctgagagact tcagcacgat cgtgttccgg gagtactccc tgaagctgtc cagcatcctg 600

agccaggctt gcaaggccgg caaagttgtg gacatgcagg taactgaact ctttcccttg 660

gtcatctgaa cgttgatttc ttggacaaaa tttcaagatt gtgacgcgag cgagccaatt 720

caggagctgt acatgaggat gacgctggac tcgatctgca aggtggggtt cggggtggag 780

atcggcacgc tgtcgccgga gctgccggag aacagcttcg cgcaggcctt cgacgccgcc 840

aacatcatcg tgacgctgcg gttcatcgac ccgctgtggc gcgtgaagaa gttcctgcac 900

gtcggctcgg aggcgctgct ggagcagagc atcaagctcg tcgacgagtt cacctacagc 960

gtcatccgcc ggcgcaaggc cgagatcgtg caggcccggg ccagcggcaa gcaggagaag 1020

gtgcgtacgc ggtcatcgtc attcgtcaag ctcccgatcg ctggtttgtg cagatgccat 1080

tgatcactga cacattaact gggcgcgcag atcaagcacg acatactgtc gcggttcatc 1140

gagctgggcg aggccggcgg cgacgacggc ggcagcctgt tcggggacga caagggcctc 1200

cgcgacgtgg tgctcaactt cgtgatcgcc gggcgggaca ccacggccac gacgctctcc 1260

tggttcacct acatggccat gacgcacccg gacgtggccg agaagctccg ccgcgagctg 1320

gccgccttcg agtccgagcg cgcccgcgag gagggcgtcg ctctggtccc ctgcagcgac 1380

ggcgagggct ccgacgaggc cttcgccgcc cgcgtggcgc agttcgcggg gctcctgagc 1440

tacgacgggc tcgggaagct ggtgtacctc cacgcgtgcg tgacggagac gctgcgcctg 1500

tacccggcgg tgccgcagga tcccaagggc atcgcggagg acgacgtgct cccggacggc 1560

accaaggtgc gcgccggcgg gatggtgacg tacgtgccct actccatggg gcggatggag 1620

tacaactggg gccccgacgc cgccagcttc cggccggagc ggtggatcgg cgacgatggc 1680

gccttccgca acgcgtcgcc gttcaagttc acggcgttcc aggcggggcc gcggatctgc 1740

ctgggcaagg actcggcgta cctgcagatg aagatggcgc tggccatcct gtgcaggttc 1800

ttcaggttcg agctcgtgga gggccacccc gtcaagtacc gcatgatgac catcctctcc 1860

atggcgcacg gcctcaaggt ccgcgtctcc agggcgccgc tcgcctgatc ttgatctggt 1920

tccggcgag 1929

<210> 10

<211> 547

<212> PRT

<213> 拟斯卑尔托山羊草(Aegilops speltoides)

<400> 10

Met Glu Glu Ala His Leu Gly Met Pro Ser Thr Thr Ala Phe Phe Pro

1 5 10 15

Leu Ala Gly Leu His Lys Phe Met Ala Ile Phe Leu Val Phe Leu Ser

20 25 30

Trp Ile Leu Val His Trp Trp Ser Leu Arg Lys Gln Lys Gly Pro Arg

35 40 45

Ser Trp Pro Val Ile Gly Ala Thr Leu Glu Gln Leu Arg Asn Tyr Tyr

50 55 60

Arg Met His Asp Trp Leu Val Glu Tyr Leu Ser Lys His Arg Thr Val

65 70 75 80

Thr Val Asp Met Pro Phe Thr Ser Tyr Thr Tyr Ile Ala Asp Pro Val

85 90 95

Asn Val Glu His Val Leu Lys Thr Asn Phe Asn Asn Tyr Pro Lys Gly

100 105 110

Glu Val Tyr Arg Ser Tyr Met Asp Val Leu Leu Gly Asp Gly Ile Phe

115 120 125

Asn Ala Asp Gly Glu Leu Trp Arg Lys Gln Arg Lys Thr Ala Ser Phe

130 135 140

Glu Phe Ala Ser Lys Asn Leu Arg Asp Phe Ser Thr Ile Val Phe Arg

145 150 155 160

Glu Tyr Ser Leu Lys Leu Ser Ser Ile Leu Ser Gln Ala Cys Lys Ala

165 170 175

Gly Lys Val Val Asp Met Gln Glu Leu Tyr Met Arg Met Thr Leu Asp

180 185 190

Ser Ile Cys Lys Val Gly Phe Gly Val Glu Ile Gly Thr Leu Ser Pro

195 200 205

Glu Leu Pro Glu Asn Ser Phe Ala Gln Ala Phe Asp Ala Ala Asn Ile

210 215 220

Ile Val Thr Leu Arg Phe Ile Asp Pro Leu Trp Arg Val Lys Lys Phe

225 230 235 240

Leu His Val Gly Ser Glu Ala Leu Leu Glu Gln Ser Ile Lys Leu Val

245 250 255

Asp Glu Phe Thr Tyr Ser Val Ile Arg Arg Arg Lys Ala Glu Ile Val

260 265 270

Gln Ala Arg Ala Ser Gly Lys Gln Glu Lys Ile Lys His Asp Ile Leu

275 280 285

Ser Arg Phe Ile Glu Leu Gly Glu Ala Gly Gly Asp Asp Gly Gly Ser

290 295 300

Leu Phe Gly Asp Asp Lys Gly Leu Arg Asp Val Val Leu Asn Phe Val

305 310 315 320

Ile Ala Gly Arg Asp Thr Thr Ala Thr Thr Leu Ser Trp Phe Thr Tyr

325 330 335

Met Ala Met Thr His Pro Asp Val Ala Glu Lys Leu Arg Arg Glu Leu

340 345 350

Ala Ala Phe Glu Ser Glu Arg Ala Arg Glu Glu Gly Val Ala Leu Val

355 360 365

Pro Cys Ser Asp Gly Glu Gly Ser Asp Glu Ala Phe Ala Ala Arg Val

370 375 380

Ala Gln Phe Ala Gly Leu Leu Ser Tyr Asp Gly Leu Gly Lys Leu Val

385 390 395 400

Tyr Leu His Ala Cys Val Thr Glu Thr Leu Arg Leu Tyr Pro Ala Val

405 410 415

Pro Gln Asp Pro Lys Gly Ile Ala Glu Asp Asp Val Leu Pro Asp Gly

420 425 430

Thr Lys Val Arg Ala Gly Gly Met Val Thr Tyr Val Pro Tyr Ser Met

435 440 445

Gly Arg Met Glu Tyr Asn Trp Gly Pro Asp Ala Ala Ser Phe Arg Pro

450 455 460

Glu Arg Trp Ile Gly Asp Asp Gly Ala Phe Arg Asn Ala Ser Pro Phe

465 470 475 480

Lys Phe Thr Ala Phe Gln Ala Gly Pro Arg Ile Cys Leu Gly Lys Asp

485 490 495

Ser Ala Tyr Leu Gln Met Lys Met Ala Leu Ala Ile Leu Cys Arg Phe

500 505 510

Phe Arg Phe Glu Leu Val Glu Gly His Pro Val Lys Tyr Arg Met Met

515 520 525

Thr Ile Leu Ser Met Ala His Gly Leu Lys Val Arg Val Ser Arg Ala

530 535 540

Pro Leu Ala

545

<210> 11

<211> 1930

<212> DNA

<213> 粗山羊草(Aegilopsm tauschii)

<400> 11

atggaggaag ctcacggcgg catgccgtcg acgacggcct tcttcccgct ggcagggctc 60

cacaagttca tggccatctt cctcgtgttc ctctcgtgga tcttggtcca ctggtggagc 120

ctgaggaagc agaaggggcc gaggtcatgg ccggtcatcg gcgcgacgct ggagcagctg 180

aggaactact accggatgca cgactggctc gtggagtacc tgtccaagca ccggacggtg 240

accgtcgaca tgcccttcac ctcctacacc tacatcgccg acccggtgaa cgtcgagcat 300

gtgctcaaga ccaacttcaa caattacccc aaggtgaaac aatcctcgag atgtcagtaa 360

aggttcagta taatcggtac tgacagtgtt acaaatgtct gaaatctgaa attgtatgtg 420

tagggggagg tgtacaggtc ctacatggac gtgctgctcg gcgacggcat attcaacgcc 480

gacggcgagc tctggaggaa gcagaggaag acggcgagct tcgagttcgc ttccaagaac 540

ttgagagact tcagcacgat cgtgttcagg gagtactccc tgaagctgtc cagcatactg 600

agccaggctt gcaaggccgg caaagttgtg gacatgcagg taactgaact cattcccttg 660

gtcatctgaa cgttgatttc ttggacaaaa tttcaagatt ctgacgcgag cgagcgaatt 720

caggagctgt atatgaggat gacgctggac tcgatctgca aagtggggtt cggagtcgag 780

atcggcacgc tgtcgccgga gctgccggag aacagcttcg cgcaggcgtt cgacgccgcc 840

aacatcatcg tgacgctgcg gttcatcgac ccgctgtggc gcgtgaagaa gttcctgcac 900

gtcggctcgg aggcgctgct ggagcagagc atcaagctcg tcgacgagtt cacctacagc 960

gtcatccgcc ggcgcaaggc cgagatcgtg caggcccggg ccagcggcaa gcaggagaag 1020

gtgcgtgcgt ggtcatcgtc attcgtcaag ctcccggtcg ctggtttgtg tagatgccat 1080

ggatcactga cacactaact gggcgcgcag atcaagcacg acatactgtc gcggttcatc 1140

gagctgggcg aggccggcgg cgacgacggc ggcagtctgt tcggggacga caagggcctc 1200

cgcgacgtgg tgctcaactt cgtgatcgcc gggcgggaca ccacggccac gacgctgtcc 1260

tggttcacct acatggccat gacgcacccg gacgtggccg agaagctccg ccgcgagctg 1320

gccgccttcg aggcggagcg cgcccgcgag gatggcgtcg ctctggtccc ctgcggcgac 1380

ggcgagggct ccgacgaggc cttcgctgcc cgcgtggcgc agttcgcggg gttcctgagc 1440

tacgacggcc tcgggaagct ggtgtacctc cacgcgtgcg tgacggagac gctgcgcctg 1500

tacccggcgg tgccgcagga ccccaagggc atcgcggagg acgacgtgct cccggacggc 1560

accaaggtgc gcgccggcgg gatggtgacg tacgtgccct actccatggg gcggatggag 1620

tacaactggg gccccgacgc cgccagcttc cggccggagc ggtggatcgg cgacgacggc 1680

gccttccgca acgcgtcgcc gttcaagttc acggcgttcc aggcggggcc gcggatttgc 1740

ctcggcaagg actcggcgta cctgcagatg aagatggcgc tggcaatcct gtgcaggttc 1800

ttcaggttcg agctcgtgga gggccacccc gtcaagtacc gcatgatgac catcctctcc 1860

atggcgcacg gcctcaaggt ccgcgtctcc agggcgccgc tcgcctgatc ttgatctggt 1920

tccggcgagg 1930

<210> 12

<211> 547

<212> PRT

<213> 粗山羊草(Aegilopsm tauschii)

<400> 12

Met Glu Glu Ala His Gly Gly Met Pro Ser Thr Thr Ala Phe Phe Pro

1 5 10 15

Leu Ala Gly Leu His Lys Phe Met Ala Ile Phe Leu Val Phe Leu Ser

20 25 30

Trp Ile Leu Val His Trp Trp Ser Leu Arg Lys Gln Lys Gly Pro Arg

35 40 45

Ser Trp Pro Val Ile Gly Ala Thr Leu Glu Gln Leu Arg Asn Tyr Tyr

50 55 60

Arg Met His Asp Trp Leu Val Glu Tyr Leu Ser Lys His Arg Thr Val

65 70 75 80

Thr Val Asp Met Pro Phe Thr Ser Tyr Thr Tyr Ile Ala Asp Pro Val

85 90 95

Asn Val Glu His Val Leu Lys Thr Asn Phe Asn Asn Tyr Pro Lys Gly

100 105 110

Glu Val Tyr Arg Ser Tyr Met Asp Val Leu Leu Gly Asp Gly Ile Phe

115 120 125

Asn Ala Asp Gly Glu Leu Trp Arg Lys Gln Arg Lys Thr Ala Ser Phe

130 135 140

Glu Phe Ala Ser Lys Asn Leu Arg Asp Phe Ser Thr Ile Val Phe Arg

145 150 155 160

Glu Tyr Ser Leu Lys Leu Ser Ser Ile Leu Ser Gln Ala Cys Lys Ala

165 170 175

Gly Lys Val Val Asp Met Gln Glu Leu Tyr Met Arg Met Thr Leu Asp

180 185 190

Ser Ile Cys Lys Val Gly Phe Gly Val Glu Ile Gly Thr Leu Ser Pro

195 200 205

Glu Leu Pro Glu Asn Ser Phe Ala Gln Ala Phe Asp Ala Ala Asn Ile

210 215 220

Ile Val Thr Leu Arg Phe Ile Asp Pro Leu Trp Arg Val Lys Lys Phe

225 230 235 240

Leu His Val Gly Ser Glu Ala Leu Leu Glu Gln Ser Ile Lys Leu Val

245 250 255

Asp Glu Phe Thr Tyr Ser Val Ile Arg Arg Arg Lys Ala Glu Ile Val

260 265 270

Gln Ala Arg Ala Ser Gly Lys Gln Glu Lys Ile Lys His Asp Ile Leu

275 280 285

Ser Arg Phe Ile Glu Leu Gly Glu Ala Gly Gly Asp Asp Gly Gly Ser

290 295 300

Leu Phe Gly Asp Asp Lys Gly Leu Arg Asp Val Val Leu Asn Phe Val

305 310 315 320

Ile Ala Gly Arg Asp Thr Thr Ala Thr Thr Leu Ser Trp Phe Thr Tyr

325 330 335

Met Ala Met Thr His Pro Asp Val Ala Glu Lys Leu Arg Arg Glu Leu

340 345 350

Ala Ala Phe Glu Ala Glu Arg Ala Arg Glu Asp Gly Val Ala Leu Val

355 360 365

Pro Cys Gly Asp Gly Glu Gly Ser Asp Glu Ala Phe Ala Ala Arg Val

370 375 380

Ala Gln Phe Ala Gly Phe Leu Ser Tyr Asp Gly Leu Gly Lys Leu Val

385 390 395 400

Tyr Leu His Ala Cys Val Thr Glu Thr Leu Arg Leu Tyr Pro Ala Val

405 410 415

Pro Gln Asp Pro Lys Gly Ile Ala Glu Asp Asp Val Leu Pro Asp Gly

420 425 430

Thr Lys Val Arg Ala Gly Gly Met Val Thr Tyr Val Pro Tyr Ser Met

435 440 445

Gly Arg Met Glu Tyr Asn Trp Gly Pro Asp Ala Ala Ser Phe Arg Pro

450 455 460

Glu Arg Trp Ile Gly Asp Asp Gly Ala Phe Arg Asn Ala Ser Pro Phe

465 470 475 480

Lys Phe Thr Ala Phe Gln Ala Gly Pro Arg Ile Cys Leu Gly Lys Asp

485 490 495

Ser Ala Tyr Leu Gln Met Lys Met Ala Leu Ala Ile Leu Cys Arg Phe

500 505 510

Phe Arg Phe Glu Leu Val Glu Gly His Pro Val Lys Tyr Arg Met Met

515 520 525

Thr Ile Leu Ser Met Ala His Gly Leu Lys Val Arg Val Ser Arg Ala

530 535 540

Pro Leu Ala

545

<210> 13

<211> 1581

<212> DNA

<213> 乌拉尔图小麦(Triticum urartu)

<400> 13

atggaagaga agaagccgcg gcggcaggga gccgcaggac gcgatggcat cgtgcagtac 60

ccgcacctct tcatcgcggc cctggcgctg gccctggtcc tcatggaccc cttccacctc 120

ggcccgctgg ccgggatcga ctaccggccg gtgaagcacg agctggcgcc gtacagggag 180

gtcatgcagc gctggccgag ggacaacggc agccgcctca ggctcggcag gctcgagttc 240

gtcaacgagg tgttcgggcc ggagtccatc gagttcgacc gccagggccg cgggccctac 300

gccgggctcg ccgacggccg cgtcgtgcgg tggatggggg acaaggccgg gtgggagacg 360

ttcgccgtca tgaatcctga ctggtattgg cttactgcag aaaaaccata gcttacctgt 420

gtgtgtgcaa actaaaatag tttctttcgg aaaaaaaaag gtcggagaaa gtttgtgcta 480

acggagtgga gtcgacgacg aagaagcagc acgggaagga gaagtggtgc ggccggcctc 540

tcgggctgag gttccacagg gagaccggcg agctcttcat cgccgacgcg tactatgggc 600

tcatggccgt tggcgaaagc ggcggcgtgg cgacctccct ggcgagggag gccggcgggg 660

acccggtcca cttcgccaac gacctcgaca tccacatgaa cggctcgata ttcttcaccg 720

acacgagcac gagatacagc agaaagtgag cggagtactg ctgccgatct cctttttctg 780

ttcttgagat ttgtgtttga caaatgactg atcatgcagg gaccatttga acattttgct 840

ggaaggagaa ggcacgggga ggctgctgag atatgaccga gaaaccggtg ccgttcatgt 900

cgtgctcaac gggctggtct tcccaaacgg cgtgcagatc tcacaggacc agcaatttct 960

cctcttctcc gagacaacaa actgcaggtg agataaactc aggttttcag tatgatccgg 1020

ctcgagagat ccaggaactg atgacgcctt tattaatcgg ctcatgcatg cacactagga 1080

tcatgaggta ctggctggaa ggtccaagag cgggccaggt ggaggtgttc gcgaacctgc 1140

cggggttccc cgacaacgtg cgcttgaaca gcaaggggca gttctgggtg gcgatcgact 1200

gctgccggac gccgacgcag gaggtgttcg cgcggtggcc gtggctgcgg accgcctact 1260

tcaagatccc ggtgtcgatg aagacgctgg ggaagatggt gagcatgaag atgtacacgc 1320

ttctcgcgct cctcgacggc gaggggaacg tggtcgaggt actcgaggac cggggcggcg 1380

aggtgatgaa gctggtgagc gaggtgaggg aggtggaccg gaggctgtgg atcgggaccg 1440

ttgcgcacaa ccacatcgcc acgatccctt acccgttgga ctagagtgtg tagtgtctca 1500

tttgatttgc tggttttata ttagcaagga ggtgtatcag tttatggttt gcttgtttat 1560

tgggttcgtg tgatgatcgt g 1581

<210> 14

<211> 413

<212> PRT

<213> 乌拉尔图小麦(Triticum urartu)

<400> 14

Met Glu Glu Lys Lys Pro Arg Arg Gln Gly Ala Ala Gly Arg Asp Gly

1 5 10 15

Ile Val Gln Tyr Pro His Leu Phe Ile Ala Ala Leu Ala Leu Ala Leu

20 25 30

Val Leu Met Asp Pro Phe His Leu Gly Pro Leu Ala Gly Ile Asp Tyr

35 40 45

Arg Pro Val Lys His Glu Leu Ala Pro Tyr Arg Glu Val Met Gln Arg

50 55 60

Trp Pro Arg Asp Asn Gly Ser Arg Leu Arg Leu Gly Arg Leu Glu Phe

65 70 75 80

Val Asn Glu Val Phe Gly Pro Glu Ser Ile Glu Phe Asp Arg Gln Gly

85 90 95

Arg Gly Pro Tyr Ala Gly Leu Ala Asp Gly Arg Val Val Arg Trp Met

100 105 110

Gly Asp Lys Ala Gly Trp Glu Thr Phe Ala Val Met Asn Pro Asp Trp

115 120 125

Ser Glu Lys Val Cys Ala Asn Gly Val Glu Ser Thr Thr Lys Lys Gln

130 135 140

His Gly Lys Glu Lys Trp Cys Gly Arg Pro Leu Gly Leu Arg Phe His

145 150 155 160

Arg Glu Thr Gly Glu Leu Phe Ile Ala Asp Ala Tyr Tyr Gly Leu Met

165 170 175

Ala Val Gly Glu Ser Gly Gly Val Ala Thr Ser Leu Ala Arg Glu Ala

180 185 190

Gly Gly Asp Pro Val His Phe Ala Asn Asp Leu Asp Ile His Met Asn

195 200 205

Gly Ser Ile Phe Phe Thr Asp Thr Ser Thr Arg Tyr Ser Arg Lys Asp

210 215 220

His Leu Asn Ile Leu Leu Glu Gly Glu Gly Thr Gly Arg Leu Leu Arg

225 230 235 240

Tyr Asp Arg Glu Thr Gly Ala Val His Val Val Leu Asn Gly Leu Val

245 250 255

Phe Pro Asn Gly Val Gln Ile Ser Gln Asp Gln Gln Phe Leu Leu Phe

260 265 270

Ser Glu Thr Thr Asn Cys Arg Ile Met Arg Tyr Trp Leu Glu Gly Pro

275 280 285

Arg Ala Gly Gln Val Glu Val Phe Ala Asn Leu Pro Gly Phe Pro Asp

290 295 300

Asn Val Arg Leu Asn Ser Lys Gly Gln Phe Trp Val Ala Ile Asp Cys

305 310 315 320

Cys Arg Thr Pro Thr Gln Glu Val Phe Ala Arg Trp Pro Trp Leu Arg

325 330 335

Thr Ala Tyr Phe Lys Ile Pro Val Ser Met Lys Thr Leu Gly Lys Met

340 345 350

Val Ser Met Lys Met Tyr Thr Leu Leu Ala Leu Leu Asp Gly Glu Gly

355 360 365

Asn Val Val Glu Val Leu Glu Asp Arg Gly Gly Glu Val Met Lys Leu

370 375 380

Val Ser Glu Val Arg Glu Val Asp Arg Arg Leu Trp Ile Gly Thr Val

385 390 395 400

Ala His Asn His Ile Ala Thr Ile Pro Tyr Pro Leu Asp

405 410

<210> 15

<211> 1536

<212> DNA

<213> 拟斯卑尔托山羊草(Aegilops speltoides)

<400> 15

atggaagaga agaagccgcg gcggcaggga gccgcagtac gcgatggcat cgtgcagtac 60

ccgcacctct tcatcgcggc cctggcgctg gccctggtcg tcatggaccc cttccacctc 120

ggcccgctgg ccgggatcga ctaccggccg gtgaagcacg agctggcgcc gtacagggag 180

gtcatgcagc gctggccgag ggacaacggc agccggctga gactcggcag gctcgagttc 240

gtcaacgagg tgttcgggcc ggagtccatc gagttcgacc gccagggccg cgggccctac 300

gccggcctcg ccgacggccg cgtcgtgcgg tggatggggg agaaggccgg gtgggagacg 360

ttcgccgtca tgaatcctga ctggtattgg cttactgcag ataaatccat agcttacctg 420

tgtgtttgca aactaaaatg gtttcttgga aaaaaaaagg tcggagaaag tttgtgctaa 480

cggagtggag tcaacgacga agaagcagca cgggaaggag aagtggtgcg gccggcctct 540

cgggctgagg ttccacaggg agaccggcga gctcttcatc gccgacgcgt actatgggct 600

catggccgtc ggcgaaagcg gcggcgtggc gacctccctg gcaagggagg ccggcgggga 660

cccggtccac ttcgccaacg accttgacat ccacatgaac ggctcgatat tcttcaccga 720

cacgagcacg agatacagca gaaagtgagc gaactgctgc cgctgttctc catttttgtt 780

aatgagatgt tgtgtttgag tgtctgacac catgactgat catgcaggga ccatttgaac 840

attttgctgg aaggagaagg cacggggagg ctgctgagat atgaccgaga aaccggtgcc 900

gttcatgtcg tgctcaacgg gctggtcttc ccaaacggcg tgcagatttc acaggaccag 960

caatttctcc tcttctccga gacaacaaac tgcaggtgag ataaactcag attttcagta 1020

tgatccggct cgagagatcc aggaactgat gacggctcat gcacgcacgc taggatcatg 1080

aggtactggc tggaaggtcc aagagcgggc caggtggagg tgttcgcgaa cctgccgggg 1140

ttccccgaca acgtgcgcct gaacagcaag gggcagttct gggtggcgat cgactgctgc 1200

cggacgccga cgcaggaggt gttcgcgcgg tggccgtggc tgcggaccgc ctacttcaag 1260

atcccggtgt cgatgaagac gctggggaag atggtgagca tgaagatgta cacgcttctc 1320

gcgctcctcg acggcgaggg gaacgtcgtg gaggtgctcg aggaccgggg cggcgaggtg 1380

atgaagctgg tgagcgaggt gagggaggtg gaccggaggc tgtggatcgg gaccgttgcg 1440

cacaaccaca tcgccacgat cccttacccg ctggactaga gggagtgtgt agtgtccatt 1500

tgctggttta tattagcaag gaggtgtatc agttta 1536

<210> 16

<211> 413

<212> PRT

<213> 拟斯卑尔托山羊草(Aegilops speltoides)

<400> 16

Met Glu Glu Lys Lys Pro Arg Arg Gln Gly Ala Ala Val Arg Asp Gly

1 5 10 15

Ile Val Gln Tyr Pro His Leu Phe Ile Ala Ala Leu Ala Leu Ala Leu

20 25 30

Val Val Met Asp Pro Phe His Leu Gly Pro Leu Ala Gly Ile Asp Tyr

35 40 45

Arg Pro Val Lys His Glu Leu Ala Pro Tyr Arg Glu Val Met Gln Arg

50 55 60

Trp Pro Arg Asp Asn Gly Ser Arg Leu Arg Leu Gly Arg Leu Glu Phe

65 70 75 80

Val Asn Glu Val Phe Gly Pro Glu Ser Ile Glu Phe Asp Arg Gln Gly

85 90 95

Arg Gly Pro Tyr Ala Gly Leu Ala Asp Gly Arg Val Val Arg Trp Met

100 105 110

Gly Glu Lys Ala Gly Trp Glu Thr Phe Ala Val Met Asn Pro Asp Trp

115 120 125

Ser Glu Lys Val Cys Ala Asn Gly Val Glu Ser Thr Thr Lys Lys Gln

130 135 140

His Gly Lys Glu Lys Trp Cys Gly Arg Pro Leu Gly Leu Arg Phe His

145 150 155 160

Arg Glu Thr Gly Glu Leu Phe Ile Ala Asp Ala Tyr Tyr Gly Leu Met

165 170 175

Ala Val Gly Glu Ser Gly Gly Val Ala Thr Ser Leu Ala Arg Glu Ala

180 185 190

Gly Gly Asp Pro Val His Phe Ala Asn Asp Leu Asp Ile His Met Asn

195 200 205

Gly Ser Ile Phe Phe Thr Asp Thr Ser Thr Arg Tyr Ser Arg Lys Asp

210 215 220

His Leu Asn Ile Leu Leu Glu Gly Glu Gly Thr Gly Arg Leu Leu Arg

225 230 235 240

Tyr Asp Arg Glu Thr Gly Ala Val His Val Val Leu Asn Gly Leu Val

245 250 255

Phe Pro Asn Gly Val Gln Ile Ser Gln Asp Gln Gln Phe Leu Leu Phe

260 265 270

Ser Glu Thr Thr Asn Cys Arg Ile Met Arg Tyr Trp Leu Glu Gly Pro

275 280 285

Arg Ala Gly Gln Val Glu Val Phe Ala Asn Leu Pro Gly Phe Pro Asp

290 295 300

Asn Val Arg Leu Asn Ser Lys Gly Gln Phe Trp Val Ala Ile Asp Cys

305 310 315 320

Cys Arg Thr Pro Thr Gln Glu Val Phe Ala Arg Trp Pro Trp Leu Arg

325 330 335

Thr Ala Tyr Phe Lys Ile Pro Val Ser Met Lys Thr Leu Gly Lys Met

340 345 350

Val Ser Met Lys Met Tyr Thr Leu Leu Ala Leu Leu Asp Gly Glu Gly

355 360 365

Asn Val Val Glu Val Leu Glu Asp Arg Gly Gly Glu Val Met Lys Leu

370 375 380

Val Ser Glu Val Arg Glu Val Asp Arg Arg Leu Trp Ile Gly Thr Val

385 390 395 400

Ala His Asn His Ile Ala Thr Ile Pro Tyr Pro Leu Asp

405 410

<210> 17

<211> 1573

<212> DNA

<213> 粗山羊草(Aegilopsm tauschii)

<400> 17

atggaagaga agaaaccgcg gcggcaggga gccgcagtac gcgatggcat cgtgcagtac 60

ccgcacctct tcatcgcggc cctggcgctg gccctggtcc tcatggaccc gttccacctc 120

ggcccgctgg ccgggatcga ctaccgaccg gtgaagcacg agctggcgcc gtacagggag 180

gtcatgcagc gctggccgag ggacaacggc agccgcctca ggctcggcag gctcgagttc 240

gtcaacgagg tgttcgggcc ggagtccatc gagttcgacc gccagggccg cgggccttac 300

gccgggctcg ccgacggccg cgtcgtgcgg tggatggggg acaaggccgg gtgggagacg 360

ttcgccgtca tgaatcctga ctggtactgg cttactgcag aaaaacccat agcttacctg 420

tgtgtgtgca gactaaaata gtttctttca taaaaaaaaa ggtcggagaa agtttgtgct 480

aacggagtgg agtcgacgac gaagaagcag cacgggaagg agaagtggtg cggccggcct 540

ctcggcctga ggttccacag ggagaccggc gagctcttca tcgccgacgc gtactatggg 600

ctcatggccg tcggcgaaag gggcggcgtg gcgacctccc tggcgaggga ggccggcggg 660

gacccggtcc acttcgccaa cgaccttgac atccacatga acggctcgat attcttcacc 720

gacacgagca cgagatacag cagaaagtga gcggagtact gctgccgatc tcctttttct 780

gttcttgaga tttgtgtttg acaaatgact gatcatgcag ggaccatttg aacattttgc 840

tggaaggaga aggcacgggg aggctgctga gatatgaccg agaaaccggt gccgttcatg 900

tcgtgctcaa cgggctggtc ttcccaaacg gcgtgcagat atcacaggac cagcaatttc 960

tcctcttctc cgagacaaca aactgcaggt gagataaact caggttttca gtatgatccg 1020

gctcgagaga tccaggaact gatgacggct catgcatgca cactaggatc atgaggtact 1080

ggctggaagg tccaagagcg ggccaggtgg aggtgttcgc gaacctgccg gggttccccg 1140

acaatgtgcg cctgaacagc aaggggcagt tctgggtggc catcgactgc tgccgtacgc 1200

cgacgcagga ggtgttcgcg cggtggccgt ggctgcggac cgcctacttc aagatcccgg 1260

tgtcgatgaa gacgctgggg aagatggtga gcatgaagat gtacacgctt ctcgcgctcc 1320

tcgacggcga ggggaacgtc gtggaggtgc tcgaggaccg gggcggcgag gtgatgaagc 1380

tggtgagcga ggtgagggag gtggaccgga ggctgtggat cgggaccgtt gcgcacaacc 1440

acatcgccac gatcccttac ccgctggact agagggagtg tgtagtgtcc catttgattt 1500

gctggtttta tattagcaag gaggtgtatc agtttatggt ttgcttgttc attgggttcg 1560

tgtgatgatc gtg 1573

<210> 18

<211> 415

<212> PRT

<213> 粗山羊草(Aegilopsm tauschii)

<400> 18

Met Glu Glu Lys Lys Pro Arg Arg Gln Gly Ala Ala Val Arg Asp Gly

1 5 10 15

Ile Val Gln Tyr Pro His Leu Phe Ile Ala Ala Leu Ala Leu Ala Leu

20 25 30

Val Leu Met Asp Pro Phe His Leu Gly Pro Leu Ala Gly Ile Asp Tyr

35 40 45

Arg Pro Val Lys His Glu Leu Ala Pro Tyr Arg Glu Val Met Gln Arg

50 55 60

Trp Pro Arg Asp Asn Gly Ser Arg Leu Arg Leu Gly Arg Leu Glu Phe

65 70 75 80

Val Asn Glu Val Phe Gly Pro Glu Ser Ile Glu Phe Asp Arg Gln Gly

85 90 95

Arg Gly Pro Tyr Ala Gly Leu Ala Asp Gly Arg Val Val Arg Trp Met

100 105 110

Gly Asp Lys Ala Gly Trp Glu Thr Phe Ala Val Met Asn Pro Asp Trp

115 120 125

Tyr Trp Ser Glu Lys Val Cys Ala Asn Gly Val Glu Ser Thr Thr Lys

130 135 140

Lys Gln His Gly Lys Glu Lys Trp Cys Gly Arg Pro Leu Gly Leu Arg

145 150 155 160

Phe His Arg Glu Thr Gly Glu Leu Phe Ile Ala Asp Ala Tyr Tyr Gly

165 170 175

Leu Met Ala Val Gly Glu Arg Gly Gly Val Ala Thr Ser Leu Ala Arg

180 185 190

Glu Ala Gly Gly Asp Pro Val His Phe Ala Asn Asp Leu Asp Ile His

195 200 205

Met Asn Gly Ser Ile Phe Phe Thr Asp Thr Ser Thr Arg Tyr Ser Arg

210 215 220

Lys Asp His Leu Asn Ile Leu Leu Glu Gly Glu Gly Thr Gly Arg Leu

225 230 235 240

Leu Arg Tyr Asp Arg Glu Thr Gly Ala Val His Val Val Leu Asn Gly

245 250 255

Leu Val Phe Pro Asn Gly Val Gln Ile Ser Gln Asp Gln Gln Phe Leu

260 265 270

Leu Phe Ser Glu Thr Thr Asn Cys Arg Ile Met Arg Tyr Trp Leu Glu

275 280 285

Gly Pro Arg Ala Gly Gln Val Glu Val Phe Ala Asn Leu Pro Gly Phe

290 295 300

Pro Asp Asn Val Arg Leu Asn Ser Lys Gly Gln Phe Trp Val Ala Ile

305 310 315 320

Asp Cys Cys Arg Thr Pro Thr Gln Glu Val Phe Ala Arg Trp Pro Trp

325 330 335

Leu Arg Thr Ala Tyr Phe Lys Ile Pro Val Ser Met Lys Thr Leu Gly

340 345 350

Lys Met Val Ser Met Lys Met Tyr Thr Leu Leu Ala Leu Leu Asp Gly

355 360 365

Glu Gly Asn Val Val Glu Val Leu Glu Asp Arg Gly Gly Glu Val Met

370 375 380

Lys Leu Val Ser Glu Val Arg Glu Val Asp Arg Arg Leu Trp Ile Gly

385 390 395 400

Thr Val Ala His Asn His Ile Ala Thr Ile Pro Tyr Pro Leu Asp

405 410 415

<210> 19

<211> 10

<212> PRT

<213> 人工

<220>

<223> MS26的血红素结合结构域

<220>

<221> misc_feature

<223> Xaa =任何氨基酸

<220>

<221> misc_feature

<222> (2)..(3)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> misc_feature

<222> (5)..(5)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> misc_feature

<222> (7)..(7)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> misc_feature

<222> (9)..(9)

<223> Xaa可以是任何天然存在的氨基酸

<400> 19

Phe Xaa Xaa Gly Xaa Arg Xaa Cys Xaa Gly

1 5 10

<210> 20

<211> 9

<212> PRT

<213> 人工

<220>

<223> 双氧结合结构域

<220>

<221> misc_feature

<222> (1)..(10)

<223> Xaa =任何氨基酸

<400> 20

Ala Gly Gly Xaa Asp Glu Thr Thr Ser

1 5

<210> 21

<211> 22

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 21

gatggtgacg tacgtgccct ac 22

<210> 22

<211> 58

<212> DNA

<213> 人工

<220>

<223> 一级PCR正向引物

<400> 22

ctacactctt tccctacacg acgctcttcc gatctaaccc gcggaggacg acgtgctc 58

<210> 23

<211> 54

<212> DNA

<213> 人工

<220>

<223> 一级PCR反向引物

<400> 23

caagcagaag acggcatacg agctcttccg atctcgtcgg ggccccagtt gtac 54

<210> 24

<211> 43

<212> DNA

<213> 人工

<220>

<223> 二级PCR正向引物

<400> 24

aatgatacgg cgaccaccga gatctacact ctttccctac acg 43

<210> 25

<211> 18

<212> DNA

<213> 人工

<220>

<223> 二级PCR反向引物

<400> 25

caagcagaag acggcata 18

<210> 26

<211> 23

<212> DNA

<213> 人工

<220>

<223> UNIMS26 5'-2引物

<400> 26

gacgtggtgc tcaacttcgt gat 23

<210> 27

<211> 23

<212> DNA

<213> 人工

<220>

<223> UNIMS26 3'-1引物

<400> 27

gccatggaga ggatggtcat cat 23

<210> 28

<211> 112

<212> DNA

<213> 乌拉尔图小麦(Triticum urartu)

<400> 28

ggaggacgac gtgctcccgg acggcaccaa ggtgcgcgcc ggcgggatgg tgacgtacgt 60

gccctactcc atggggcgga tggagtataa ctggggcccc gacgccgcca gc 112

<210> 29

<211> 112

<212> DNA

<213> 拟斯卑尔托山羊草(Aegilops speltoides)

<400> 29

ggaggacgac gtgctcccgg acggcaccaa ggtgcgcgcc ggcgggatgg tgacgtacgt 60

gccctactcc atggggcgga tggagtacaa ctggggcccc gacgccgcca gc 112

<210> 30

<211> 112

<212> DNA

<213> 粗山羊草(Aegilopsm tauschii)

<400> 30

ggaggacgac gtgctcccgg acggcaccaa ggtgcgcgcc ggcgggatgg tgacgtacgt 60

gccctactcc atggggcgga tggagtacaa ctggggcccc gacgccgcca gc 112

<210> 31

<211> 112

<212> DNA

<213> 玉米(Zea mays)

<400> 31

ggaggacgac gtgctgccgg acgggacgaa ggtgagggcc ggcgggatgg tgacgtacgt 60

gccctactcg atggggcgga tggagtacaa ctggggcccc gacgcggcga gc 112

<210> 32

<211> 112

<212> DNA

<213> 高粱(Sorghum bicolor)

<400> 32

ggaggacgac gtgctgccgg acgggacgaa ggtgagggcc ggcgggatgg tgacgtacgt 60

gccctactcg atggggcgga tggagtacaa ctggggaccc gacgcggcga gc 112

<210> 33

<211> 112

<212> DNA

<213> 水稻(Oryza sativa)

<400> 33

ggaggacgac gtgctccccg acggcaccaa ggtgcgcgcc ggcgggatgg tgacgtacgt 60

gccctactcc atggggagga tggagtacaa ctggggcccc gacgcggcga gc 112

<210> 34

<211> 100

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 34

cgcggaggac gacgtgctcc cggacggcac caaggtgcgc gccggcggga tggtgacgta 60

cgtgccctac tccatggggc ggatggagta caactggggc 100

<210> 35

<211> 77

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 35

aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt gccctactcc atggggcgga 60

tggagtacaa ctggggc 77

<210> 36

<211> 95

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 36

aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt gcgcgccggc gggatggtga 60

cgtactccat ggggcggatg gagtacaact ggggc 95

<210> 37

<211> 71

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 37

aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt gcgcgccggc gggatggagt 60

acaactgggg c 71

<210> 38

<211> 100

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 38

aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt gcgcgccggc gggatggtga 60

cgtgccctac tccatggggc ggatggagta caactggggc 100

<210> 39

<211> 77

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 39

aacccgcgga ggacgacgtg ctcccggacg gcaccaacgt gccctactcc atggggcgga 60

tggagtacaa ctggggc 77

<210> 40

<211> 94

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 40

aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt gcgcgccggc gggatggtga 60

cgtacccatg gggcggatgg agtacaactg gggc 94

<210> 41

<211> 87

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 41

aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt gcgcgccggc gggatactcc 60

atggggcgga tggagtacaa ctggggc 87

<210> 42

<211> 81

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 42

aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt acgtgcccta ctccatgggg 60

cggatggagt acaactgggg c 81

<210> 43

<211> 98

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 43

aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt gcgcgccggc gggatggtga 60

cgtactactc catggggcgg atggagtaca actggggc 98

<210> 44

<211> 76

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 44

aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt gcgcgccggc gggatgtcca 60

tggggcggat ggagta 76

<210> 45

<211> 156

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 45

ctgcgcctgt acccggcggt gccgcaggac cccaagggca tcgcggagga cgacgtgctc 60

ccggacggca ccaaggtgcg cgccggcggg atggtgacgt acgtgcccta ctccatgggg 120

cggatggagt acaactgggg ccccgacgcc gccagc 156

<210> 46

<211> 66

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 46

ctgcgcctgt acgtgcccta ctccatgggg cggatggagt acaactgggg ccccgacgcc 60

gccagc 66

<210> 47

<211> 60

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 47

ctgcgcctgt acccggcggt gccgcaggac cccaagggca tcgcggagga cgacgtcggc 60

<210> 48

<211> 133

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 48

ctccgcctgt acccggcggt gccgcaggac cccaagggca tcgcggagga cgacgtgctc 60

ccggacggca ccaaggtacg tgccctactc catggggcgg atggagtaca actggggccc 120

cgacgccgcc agc 133

<210> 49

<211> 152

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 49

ctgcgcctgt acccggcggt gccgcaggac cccaagggca tcgcggagga cgacgtgctc 60

ccggacggca ccaaggtgcg cgccggcggg atggtgacgt gccctactcc atggggcgga 120

tggagtacaa ctggggcccc gacgccgcca gc 152

<210> 50

<211> 157

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 50

ctccgcctgt acccggcggt gccgcaggac cccaagggca tcgcggagga cgacgtgctc 60

ccggacggca ccaaggtgcg cgccggcggg atggtgacgt accgtgccct actccatggg 120

gcggatggag tacaactggg gccccgacgc cgccagc 157

<210> 51

<211> 75

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 51

ctccgcctgt acccggcggt gccgcaggac cccaagggca tcgcggagga cgacgtgctc 60

ccggacggca ccaag 75

<210> 52

<211> 147

<212> DNA

<213> 普通小麦(Triticum aestivum)

<400> 52

ctccgcctgt acccggcggt gccgcaggac cccaagggca tcgcggagga cgacgtgctc 60

ccggacggca ccaaggtgcg cgccggcggg atggtgacgt actccatggg gcggatggag 120

tacaactggg gccccgacgc cgccagc 147

Claims

1.一种赋予突变的 MS45 雄性不育小麦植物，相对于对照植物，雄性育性的方法，其中所述方法包括：

将与在植物中驱动表达的启动子可操作地连接的多核苷酸引入到所述突变的MS45雄性不育小麦植物中，所述多核苷酸包含选自由以下组成的组的核苷酸序列：

(a) 包含 SEQ ID NO: 15 的核苷酸序列；和

(b) 包含与 SEQ ID NO: 15 至少 95% 序列同一性的核苷酸序列，其中当在所述植物中表达时，所述核苷酸赋予突变的 MS45 雄性不育植物雄性育性；和

在植物中表达所述多核苷酸以赋予植物雄性育性。

2.根据权利要求1所述的方法，其中所述启动子是组成型启动子、诱导型启动子、组织优选启动子或生长阶段优选启动子。

3.根据权利要求2所述的的方法，其中所述组织优选启动子是雄性组织优选启动子。

4.一种分离的多核苷酸，其包含选自以下的核苷酸序列：

(a) 包含SEQ ID NO: 1、7或13的核苷酸序列；

(b) 编码包含SEQ ID NO: 2、8或14的氨基酸序列的核苷酸序列；

(c) 与SEQ ID NO: 1、7或13具有至少85%的序列同一性的核苷酸序列，其中所述多核苷酸编码调节雄性育性的多肽；

(d) 包含SEQ ID NO: 1、7或13的至少50个连续核苷酸的核苷酸序列，其中所述多核苷酸编码调节雄性育性的多肽；以及

(e) 编码与SEQ ID NO: 2、8或14具有至少85%的同一性的多肽的核苷酸序列，其中所述多肽调节雄性育性。

5.根据权利要求4所述的分离的多核苷酸，其中所述核苷酸序列选自：

(a) 包含SEQ ID NO: 3、5、9、11、15或17的核苷酸序列；以及

(b) 编码包含SEQ ID NO: 4、6、10、12、16或18的氨基酸序列的核苷酸序列。

6.一种包含表达盒的多核苷酸，所述表达盒包含有效连接到驱动在植物中的表达的第一异源启动子的第一多核苷酸，所述第一多核苷酸是权利要求4-5中任一项所述的多核苷酸。

7.根据权利要求6所述的多核苷酸，其中所述表达盒的所述第一启动子是组成型启动子、诱导型启动子、组织优选的启动子、或生长阶段优选的启动子。

8.根据权利要求7所述的多核苷酸，其中所述表达盒的所述第一启动子是雄性组织优选的启动子。

9.根据权利要求6-8中任一项所述的多核苷酸，还包括有效连接到驱动在植物中的表达的第二启动子的第二多核苷酸。

10.根据权利要求9所述的多核苷酸，其中所述第二多核苷酸编码干扰雄性配子的功能、形成或传播的多核苷酸或多肽。

11.根据权利要求10所述的多核苷酸，其中所述第二多核苷酸编码芽孢杆菌RNA酶、DAM-甲基化酶、淀粉酶、或ADP核糖基化酶。

12.根据权利要求9-11中任一项所述的多核苷酸，还包括有效连接到第三启动子的第三多核苷酸，其中所述第三多核苷酸编码标记基因产物。

13.根据权利要求12所述的表达盒，其中所述标记基因产物包括抗生素抗性标记基因产物或可视标记基因产物。

14.一种分离的多肽，其包含选自以下的氨基酸序列：

(a) 包含SEQ ID NO: 2、8或14的氨基酸序列；

(b) 与SEQ ID NO: 2、8或14具有至少85%的序列同一性的氨基酸序列，其中所述多肽调节雄性育性；以及

(c) 包含SEQ ID NO: 2、8或14的至少50个连续氨基酸的氨基酸序列，其中所述多肽调节雄性育性。

15.根据权利要求14所述的分离的多肽，其包含选自以下的氨基酸序列：SEQ ID NO:4、6、10、12、16和18。

16.一种载体，其包含权利要求6-13中任一项所述的表达盒。

17.一种植物细胞，其包含权利要求4-5中任一项所述的多核苷酸，其中所述多核苷酸对于所述植物细胞而言是异源的。

18.根据权利要求17所述的植物细胞，其中所述多核苷酸有效连接到其天然启动子序列。

19.一种植物细胞，其包含权利要求6-13中任一项所述的表达盒。

20.根据权利要求17-19中任一项所述的植物细胞，其中所述植物细胞来自单子叶植物或双子叶植物。

21.根据权利要求20所述的植物细胞，其中所述植物是玉蜀黍、大麦、粟、小麦、水稻、高粱、黑麦、大豆、卡诺拉油菜、苜蓿、向日葵、红花、甘蔗、烟草、拟南芥(Arabidopsis)或棉花。

22.一种植物，其包含权利要求17-21中任一项所述的植物细胞。

23.根据权利要求22所述的植物，其中当与对照植物比较时，所述多核苷酸的表达调节所述植物的雄性育性。

24.根据权利要求22或23所述的植物，其中当与对照植物比较时，所述植物具有增强的雄性育性。

25.根据权利要求22-24中任一项所述的植物，其中所述多核苷酸的表达赋予雄性不育植物雄性育性。

26.根据权利要求22-25中任一项所述的植物，其中所述植物是雌性能育植物。

27.根据权利要求22-26中任一项所述的植物，其中当与对照植物比较时，所述植物的至少一种雄性组织的形成在所述第一多核苷酸表达之后得到调节。

28.根据权利要求27所述的植物，其中所述雄性组织包括雄蕊、花药、花丝或花粉。

29.根据权利要求27或28所述的植物，其中至少一种雄性组织的所述得到调节的形成包括至少一种雄性组织的形成增加。

30.根据权利要求22-26中任一项所述的植物，其中所述异源第一多核苷酸被稳定地整合到所述植物的基因组中。

31.一种权利要求22-30中任一项所述的植物的种子，其中所述种子包含所述异源第一多核苷酸。

32.一种用于增加植物中的多肽的活性和/或水平的方法，其包括向所述植物提供权利要求14或15中任一项所述的多肽。

33.一种增加植物中的多肽的活性和/或水平的方法，其包括向所述植物中引入有效连接到在所述植物中有活性的启动子的多核苷酸，所述多核苷酸包含选自以下的核苷酸序列：

(a) 包含SEQ ID NO: 1、7或13的核苷酸序列；

(b) 编码包含SEQ ID NO: 2、8或14的氨基酸序列的核苷酸序列；

34.根据权利要求33所述的方法，其中所述多核苷酸包含SEQ ID NO: 3、5、9、11、15或17示出的核苷酸序列。

35.根据权利要求33-34中任一项所述的方法，其中当与对照植物比较时，所述多核苷酸的表达调节所述植物中的雄性育性。

36.根据权利要求35所述的方法，其中当与对照植物比较时，所述多核苷酸的表达增强所述植物中的雄性育性。

37.根据权利要求33-36中任一项所述的方法，其中所述多核苷酸的表达赋予雄性不育植物雄性育性。

38.根据权利要求33-37中任一项所述的方法，其中所述植物是雌性能育植物。

39.根据权利要求33-38中任一项所述的方法，其中所述启动子是组成型启动子、诱导型启动子、组织优选的启动子、或生长阶段优选的启动子。

40.根据权利要求39所述的方法，其中所述启动子是雄性组织优选的启动子。

41.根据权利要求33-40中任一项所述的方法，其中当与对照植物比较时，所述多核苷酸的表达调节至少一种雄性组织的形成。

42.根据权利要求41所述的方法，其中所述雄性组织包括雄蕊、花药、花丝或花粉。

43.根据权利要求41或42所述的方法，其中至少一种雄性组织的所述得到调节的形成包括至少一种雄性组织的形成增加。