CN109715811A

CN109715811A - 包含小麦g型胞质雄性不育恢复基因、分子标志物的植物及其用途

Info

Publication number: CN109715811A
Application number: CN201780056753.6A
Authority: CN
Inventors: A·罗德; J·雅各布斯; M·达韦
Original assignee: BASF SE
Current assignee: BASF SE
Priority date: 2016-07-18
Filing date: 2017-07-18
Publication date: 2019-05-03
Also published as: EP3485022A1; US20210269822A1; CA3031238A1; WO2018015403A1; EA201990247A1; BR112019000881A2; US20190256865A1; AU2017300616A1; AU2017300616B2; CL2019000142A1; MX2019000850A

Abstract

描述了选择或产生包含小麦G型胞质雄性不育的功能恢复基因的禾谷类植物的方法和用于其中的核酸。

Description

包含小麦G型胞质雄性不育恢复基因、分子标志物的植物及其用途

发明领域

本发明总体上涉及植物育种及分子生物学领域并且涉及一种选择或产生包含小麦G型胞质雄性不育的功能恢复基因的禾谷类植物(cereal plant)的方法和用于其中的核酸。

背景

胞质雄性不育(CMS)是商业杂交种子生产背景下禾谷植物如小麦中主要的目的性状(Kihara，1951；Wilson和Ross，1962；Lucken，1987；Sage，1976)。作为普通小麦(Triticumaestivum)中雄性不育的诱导物，广泛地研究了提莫非维小麦(Triticum timopheevi)(G型)和粘果山羊草(Aegilops kotschyi)(K型)的细胞质，原因在于极少的有害影响(Kaul，1988；Lucken，1987；Mukai和Tsunewaki，1979)。

在使用G型细胞质的杂交种子生产系统中，能育性恢复是关键问题。大部分六倍体小麦天然地不合能育性恢复基因(Ahmed等人，Genes Genet.Syst.2001)。在提莫非维小麦复杂的恢复体系中，八个Rf基因据报道恢复了对抗提莫非维小麦细胞质的能育性，并且已经确定了它们的染色体位置，即，Rf1(1A)、Rf2(7D)、Rf3(1B)、Rf4(6B)、Rf5(6D)、Rf6(5D)、Rf7(7B)和Rf8(Tahir和Tsunewaki，1969；Yen等人，1969；Bahl和Maan，1973；Du等人，1991；Sihna等人，2013)。Ma等人(1991)将Rf基因从伞穗山羊草(Aegilops umbellulata)转移到小麦，该基因位于染色体6AS和6BS上(来自Zhou等人，2005)。

Ma和Sorrels(Crop Science 1995)报道Rf3与染色体1BS上的RFLP标志物Xbcd249和Xcdo442连锁。

Kojima(Genes Genet Syst 1997)在与RFLP标志物Xcdo388和Xabc156分别距离1.2cM和2.6cM的位置定位了一个来自中国春(Chinese Spring)的能育性恢复基因，称作Rf3基因，不过作者能够将Rf3与Xcdo388分离。估计这个Rf3可以在邻近RFLP标志物的500Kbp区域内存在。

Ahmed Talaat等人(Genes Genet.Syst.，2001)确定了染色体1B上一个针对G型细胞质的主要Rf QTL与RFLP标志物XksuG9c紧密连锁，接近于标志物Xabc156，如Kojima等人(见上文)报道。

Zhang等人(遗传学报，2003)描述了一个位于1BS上与微卫星标志物Xgwm550的遗传距离为5.1cM的Rf基因。

Zhou等人(2005)描述了Rf3基因位于SSR标志物Xgwm582和Xbarc207之间或Xbarc207和Xgwm131之间，但非常接近于Xbarc207。由于Kojima、Ahmed和Ma与Sorrels先前鉴定的RFLP标志物未在其定位群体中定位，故不能构建包含这些RFLP标志物的连锁图来更好地评估Rf3和已鉴定的SSR标志物之间的距离。

因此，仍需要在育种过程中鉴定及跟踪Rf基因座的更精确标志物，所述标志物特别可用于杂交种子生产并用于提莫非维小麦细胞质中能育性恢复的改进方法。通过公开染色体1B上的功能性Rf基因和通过提供与构成原因的基因更紧密连锁的标志物，本发明提供了超过现有技术的贡献。

附图说明

图1：如在二个不同位置(g、m)观察的主要穗部(main head)的结实率(Seed set)(ss_mh)。每类种子量(x-轴)的植物数目(y-轴)。

图2：以-log10(p)为单位沿染色体1B的标志物-性状关联的显著性轮廓图，指示阈值＝3.9。

图3：(A)-已鉴定PPR基因的预测基因结构。@表示CDS，#表示5’UTR并且＊表示3’UTR。(B)已鉴定PPR基因的氨基酸序列，其显示了转运肽(斜体)和PPR基序(按交替方式加下划线和不加下划线)，包括在RNA识别时暗示的第5位和第35位氨基酸(粗体)。(C)具有转运肽和PPR基序的PPR蛋白的结构图示。

图4：(A)已鉴定PPR蛋白的推定性RNA识别基序与ORF256的总体比对结果。(B)显示核苷酸比对结果的放大图。

图5：‘资源-5’和CMS系之间杂交的Rf3恢复和野生型(非恢复)F4后代的组织中Rf3-PPR的归一化平均表达水平。用精细定位标志物做KASP基因分型后鉴定含有Rf3的后代，并进行表型分型以证实能育性恢复。

发明详述

本发明描述了鉴定位于染色体1B(短臂1BS)上小麦G型胞质雄性不育(即，提莫非维小麦细胞质)的功能恢复(Rf)基因座和基因以及与之相关的标志物。所述标志物可以用于标志物辅助选择(MAS)包含位于染色体1B上的所述功能恢复基因的禾谷类植物，如小麦。对这些基因和标志物的鉴定因此在杂交种子生产方法中特别有用，因为它们可以例如用于恢复拥有G型胞质雄性不育的植物的后代中能育性的方法中，由此从G型胞质雄性不育亲本植物产生能育后代植物。同样，本公开还允许鉴定缺少目的等位基因的植物，从而可以鉴定非恢复植物，并且例如，从后续的杂交繁育消除之。

对于能育性恢复而言，标志物辅助选择胜过田间评估的一个优点是可以在一年中随时进行MAS，无论生长季节是什么。另外，环境效应对标志物辅助选择无关紧要。

当群体正在对影响一个或多个性状的多个基因座(例如，涉及能育性恢复的多个基因座或各自涉及不同胞质雄性不育(CMS)系统的能育性恢复的多个基因座或影响不同性状的基因座(例如能育性和抗病性))分离时，与表型筛选相比，MAS的效率变得甚至更高，因为可以在实验室中从单份DNA样品一并处理全部基因座。可以同时测定任一个或多个标志物和/或标志物等位基因，例如，两个或多个，直至并且包括全部鉴定的标志物。

植物育种中MAS的另一个用途是通过回交育种，辅助回归亲本基因型的恢复。回交育种是使后代与其亲本之一回返杂交的过程。通常出于以下目的进行回交：将一个或一些来自供体亲本的基因座渐渗入回归亲本的其他方面是合乎需要的遗传背景。进行的回交的轮次越多，回归亲本对所产生变种的遗传贡献越大。经常必需如此，因为供体亲本植物否则可能不合乎需要，即，由于产量低、多产性低等不合乎需要。与之相反，作为深入的育种计划之结果的变种可以具有优异的产量、多产性等，仅在一个所需性状(如能育性恢复)方面有缺陷。如技术人员理解，可以进行回交以选择或反选择性状。例如，在本发明中，可以选择恢复基因以繁育恢复系或可以反选择恢复基因以繁育保种者(雌池)。

本发明描述的染色体1B上的Rf基因座定位到沿染色体1B在约15.8cM的区间中的区段，所述区间旁侧为SEQ ID NO 2和SEQ ID NO 8的标志物。

因此，在第一方面，提供一种选择包含小麦G型胞质雄性不育的功能恢复基因等位体的禾谷类植物或产生包含小麦G型胞质雄性不育的功能恢复基因等位体的禾谷类植物的方法，所述方法包括步骤：

(a)鉴定至少一个禾谷类植物，其包含与小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体连锁的至少一个标志物等位基因；和

(b)选择包含所述至少一个标志物等位基因的植物，其中所述植物包含小麦G型胞质雄性不育的位于染色体1B上的所述功能恢复基因

其中所述至少一个标志物等位基因定位于染色体1B上的区间内部，所述区间包含SEQ ID NO 2和SEQ ID NO 8的标志物并且旁侧有这些标志物。

在第二方面，提供一种在G型胞质雄性不育禾谷类植物的后代恢复能育性或从G型胞质雄性不育禾谷类亲本植物产生能育后代植物的方法，所述方法包括步骤：

(a)提供从雌性禾谷类亲本植物与雄性禾谷类亲本植物杂交获得的后代植物群体，其中雌性亲本植物是G型胞质雄性不育禾谷类植物，并且其中雄性亲本植物包含小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体；

(b)在所述群体中鉴定能育后代植物，所述能育后代植物包含至少一个与小麦G型胞质雄性不育的所述功能恢复基因等位体连锁的标志物等位基因，其中所述后代植物包含小麦G型胞质雄性不育的位于染色体1B上的所述功能恢复基因等位体；和任选地

(c)选择所述能育后代植物；和任选地

(d)繁殖能育后代植物，

与本发明有关的雄性不育指植物不能或部分地不能产生有功能的花粉或雄性配子。这可以归因于天然或人工引入的遗传素质或人类对田间植物的干预。在另一方面，雄性能育涉及能够产生有正常功能的花粉和雄性配子的植物。雄性不育/能育性可以在自交(例如通过穗头套袋以引起自我受精)时在结实率(seed set)方面反映出来。同样，与因杂交(或自交)完全能育植物而产生的结实率相比时，也可以根据雄性不育植物与携带功能恢复基因的植物杂交的结实率描述能育性恢复。

雄性亲本或花粉亲本是提供雄性配子(花粉)供受精的亲本植物，而雌性亲本或种子亲本是提供雌性配子供受精的植物，所述雌性植物是携带种子的植物。

胞质雄性不育或“CMS”指基于胞质和母系遗传的雄性不育。CMS是植物中因胞核和线粒体特异性相互作用所致的完全或部分雄性不育并借助细胞质母系遗传。雄性不育是植物不能产生有功能的花药、花粉或雄性配子，尽管CMS植物仍产生有活力的雌性配子。胞质雄性不育在农业中用于促进杂交种子产生。

如本文所用，“小麦G型胞质雄性不育”指这样的提莫非维小麦细胞质，其引入普通小麦(即Triticum aestivum)时可以赋予雄性不育，因而产生携带普通小麦核基因、但携带雄性不育的提莫非维小麦细胞质的植物。作为普通小麦中雄性不育的诱导物，已经广泛地研究了提莫非维小麦细胞质(G型)(Wilson和Ross，Genes Genet.Syst.1962；Kaul，Malesterility in higher plants.Springer Verlag，Berlin.1988；Lucken，Hybrid wheat.引自Wheat and wheat improvement.E.G.Heyne编著.American Society of Agronomy，Madison，Wis，1987；Mukai和Tsunewaki，Theor.Appl.Genet.54，1979；Tsunewaki，Jpn.Soc.Prom.Sci.1980；Tsunewaki等人，Genes Genet.Syst.71，1996)。提莫非维小麦细胞质赋予的CMS表型的起源涉及一个称作orf256的新嵌合基因，其位于coxI序列上游并且随明显正常的cox1基因共转录。针对预测自orf256的多肽序列制备的抗血清识别到一种在CMS系中存在、但亲本系或恢复系中不存在的7kDa蛋白质(Song和Hedgcoth，Genome 37(2)，1994；Hedgcoth等人，Curr.Genet.41，357-365，2002)。

如本文所用，“小麦G型胞质雄性不育的功能恢复基因等位体”或“小麦G型胞质雄性不育的功能恢复基因座”或“小麦G型胞质雄性不育的恢复QTL”表示能够在与G型胞质雄性不育(“CMS”)株系的杂交的后代(即，携带普通小麦核基因、但细胞质来自提莫非维小麦的株系)中恢复能育性的等位基因。对抗G型细胞质的恢复例如已经由Robertson和Curtis(Crop Sci.9，1967)、Yen等人(Can.J.Genet.Cytol.11，1969)、Bahl和Maan(Crop Sci.13，1973)、Talaat等人(Egypt.J.Genet.2，195-205，1973)、Zhang等人(2003，上文)、Ma和Sorrels(1995，上文)、Kojima(1997，上文)、Ahmed Talaat等人(2001，上文)、Zhou等人(2005，上文)描述。这类恢复基因或等位基因也称作Rf基因和Rf等位基因。

术语“保种者”指与CMS植物杂交时不恢复能育性并在后代中维持不育的植物。保种者用来繁殖CMS系，并且也可以称作非恢复系。保种系具有与不育系相同的核基因(即不含有功能性Rf基因)，但在造成植物中雄性不育的胞质因子组成方面有差异，即保种者具有“能育性”细胞质。因此当雄性不育系与其保种者杂交时，将获得具有相同雄性不育基因型的后代。

术语“禾谷类”涉及单子叶禾本科(Poaceae)的成员，其中栽培所述成员以得到其籽粒的可食用组分。这些籽粒包含胚乳、胚芽和麸糠。玉米、小麦和稻合计占超过80％的全球籽粒产量。禾本科的其他成员包括黑麦、燕麦、大麦、黑小麦、高粱、野生稻、斯佩耳特小麦、单粒小麦、二粒小麦、硬粒小麦和远古硬质小麦(kamut)。

在一个实施方案中，本发明的禾谷类植物是包含至少B基因组或相关基因组的禾谷类植物，如小麦(普通小麦；ABD)、斯佩耳特小麦(斯佩耳特小麦(Triticum spelta)；ABD)、硬粒小麦(硬粒小麦(T.turgidum)；AB)、大麦(Hordeum vulgare；H)和黑麦(黑麦(Secale cereale)；R)。在一个具体实施方案中，本发明的禾谷类植物是小麦(普通小麦；ABD)。

如本文所用，“分子标志物”或“标志物”或“标志物核酸”或“遗传标志物”指多态性基因座，即某个特定基因座处的多态性核苷酸(所谓的单核苷酸多态性或SNP)或多态性DNA序列。标志物指在基因组中位置固定的可测量遗传特征，其通常以孟德尔方式遗传并且可以用于目的性状定位或鉴定具有某个目的性状的个体。标志物因此指基因或核苷酸序列，其可以用来鉴定具有特定等位基因(例如，本发明描述的染色体1B上的Rf等位基因)的植物。可以将标志物描述为给定的基因组座位处的变异。它可以是短DNA序列，如包围单碱基对变化的序列(单核苷酸多态性，或“SNP”)，或长序列，例如，微卫星/简单序列重复序列(“SSR”)。分子标志物还可以包括‘插入缺失(indels)’，其指生物的DNA中碱基插入或缺失或二者组合并可以用作分子标志物。

术语“标志物基因型”指在染色体对的每条染色上多态性基因座处存在的标志物等位基因的组合。术语“标志物等位基因”指在特定植物中一条染色体处存在的标志物的形式。一般地，一个标志物可以作为二个标志物等位基因存在或可以称作具有或包含二个标志物等位基因。如本文所用，术语“单倍型”指如某种植物或(相关)植物群组内部存在的标志物等位基因的特定组合。还参见SNP(标志物)基因型和SNP(标志物)等位基因的以下定义。

如本文所用，“标志物邻近序列”或“标志物前后序列”，指标志物(如SNP标志物)上游的50-150bp和/或这种标志物下游的50-150bp。序列表中给出本文中所述的(SNP)标志物的标志物邻近序列，于SNP位置旁侧分布。(SNP)标志物的上游序列和下游序列也可以称作(上游和/或下游)侧翼序列。

可以使用使用分子标志物测定法，实现鉴定禾谷类植物，其包含与小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体连锁的至少一个标志物等位基因，其中所述的分子标志物测定法检测这类标志物等位基因(例如，本文所述的与小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体连锁的标志物等位基因)中至少一者的存在。这可以涉及获得或提供生物样品，即植物材料，或提供植物的基因组DNA，并对该材料的基因组DNA分析所述标志物等位基因中至少一者的存在(或这类标志物中至少一者的标志物基因型)。在这种方法中，还可以使用本文其他处描述的其他分子标志物检测。

如本领域技术人员将熟知，标志物和标志物测定法例如包括限制性片段长度多态性(RFLP)、随机扩增的多态性DNA(RAPD)、扩增片段长度多态性(AFLP)、DAF、序列表征的扩增区域(SCAR)、微卫星或简单序列重复标志物(SSR)、序列表征的扩增区域(SCA)、单核苷酸多态性(SNP)、KBioscience竞争性等位基因-特异性PCR(KASPar)，尤其如Jonah等人(Global Journal of Science Frontier Research 11∶5，2011)和Lateef(Journal ofBiosciences and Medicines，2015，3，7-18)中描述。

如本文所用，术语“单核苷酸多态性”(SNP)可以指当基因组(或其他共有序列)中单核苷酸在物种各成员或个体中配对染色体之间差异时出现的DNA序列变异。

在群体内部，可以向SNP赋予微小等位基因频率，即特定群体中观察到的基因座处最低的等位基因频率。对于单核苷酸多态性，这仅是二个等位基因频率中的较低者。各种群体之间存在变异，因此一个地理群组或品种中常见的SNP等位基因可能在另一个群组或品种中稀有得多。

单核苷酸多态性可以落在基因的编码序列、基因的非编码区内部或落在基因之间的基因间区内。编码序列内部的SNP并不将必然改变产生的蛋白质的氨基酸序列，原因在于遗传密码简并性。两种形式均形成导致相同多肽序列的SNP称作“同义”(有时称作沉默突变)。如果产生不同的多肽序列，则它们称作“非同义”。非同义变化可能是错义或无义的，其中错义变化产生不同的氨基酸并且无义变化产生提前终止密码子。不在蛋白质编码区中的SNP仍可能产生结果，例如基因剪接、转录因子结合或非编码性RNA的序列(例如，影响转录物稳定性、翻译)。SNP通常是双等位的并且因此在植物和动物中容易地分析之。

一种检测SNP标志物的特别有用的测定法例如是KBioscience竞争性等位基因.特异性PCR(KASP，参见www.kpbioscience.co.uk)。为了开发KASP测定法，选择SNP上游的70碱基及其下游70个碱基对，并且设计二个等位基因特异性正向引物和一个等位基因特异性反向引物。关于KASP测定方法，参见，例如Allen等人，2011，Plant Biotechnology J.9，1086-1099，尤其第1097-1098页。

如本文所用，术语“与……连锁”或“连锁”指位于给定染色体上的基因或标志物一起传递至下一世代个体的可度量概率。因此，术语“连锁”可以指以大于0.5的概率与某基因一起传递的一个或多个基因或标志物(在标志物倦因位于不同染色体的情况下，从独立分配过程预期所述概率)。因为二个基因或标志物在染色体上的接近程度与基因或标志物将一起传递至下一世代个体的概率直接相关，所以术语“连锁”还可以在本文中指位于相同染色体上彼此约50厘摩(cM)或更小范围内的一个或多个基因或标志物。遗传连锁通常以cM表示。厘摩是计量遗传连锁的重组频率的单位，定义为基因或标志物之间按照100计算一个减数分裂产物为重组的距离，或换言之，厘摩等于染色体上一个遗传基因座处的标志物将与第二基因座处的标志物因单一世代中杂交而分离的1％机会。它经常用来推算沿着染色体的距离。与cM相对应的碱基对的数目跨各基因组(染色体的不同区域具有不同的互换倾向)和各物种(即基因组总尺寸)大幅度变动。

本发明描述的染色体1B上的Rf基因座定位到染色体1B处约15.8cM的区间中的区段，所述区间旁侧为SEQ ID NO 2和SEQ ID NO 8的标志物。位于其间的这些标志物和任何标志物可以称作包含小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因连锁的等位基因。因此，在这个方面，术语连锁可以是约15.8cM或更小如约12.5cm、约10cM、7.5cM、约6cM、约5cM、约4cM、约3cM、约2.5cM、约2cM或甚至更小的分离。表1中详述了包含与小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因连锁的等位基因的标志物的具体例子。峰标志物是SEQ ID NO.6的标志物。

进一步精细定位收窄1B区域至约1.25cM(从6.8至8.05cM)的区间，所述区间包含如SEQ ID NO.11、SEQ ID NO.12、SEQ ID NO.12和SEQ ID NO.14所示的标志物。位于所述区间的这些和任何其他标志物可以称作包含小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因“紧密连锁”的等位基因。因此，如本文所用的术语“紧密连锁”可以是约1.25cM或甚至更小，如约1.0cM、约0.95cM、约0.9cM、约0.85cM、约0.8cM、约0.75cM、约0.5cM、约0.4cM、约0.3cM、约0.25cM、约0.20cM、约0.15cM、约0.10cM或甚至更小的分离。表2中给出了包含与小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因紧密连锁的等位基因的标志物的具体例子。最靠近峰的标志物是SEQ ID NO.13。

因此，与位于染色体1B上的所述功能恢复基因等位体连锁的所述至少一个标志物等位基因可以选自以下任一个：

a.在SEQ ID NO：2的T；

b.在SEQ ID NO：3的C；

c.在SEQ ID NO：4的T；

d.在SEQ ID NO：5的T；

e.在SEQ ID NO：6的A；

f.在SEQ ID NO：7的A；

g.在SEQ ID NO：8的G；

h.在SEQ ID NO：11的C；

i.在SEQ ID NO：12的A；

j.在SEQ ID NO：13的T；

k.在SEQ ID NO：14的T；

或其任意组合。

如本文所用，“在SEQ ID NO：2的T”或“在SEQ ID NO：3的C”等指T或C等存在于与所述SEQ ID NO中的SNP位置相对应的位置处，例如，如表1或表2中指示。这可以例如通过将基因组序列与所述SEQ ID NO比对来确定因此，“在SEQ ID NO：2的T”意指“与SEQ ID NO：2的位置51相对应的位置处的T”等。

在又一个实施方案中，所述至少一个标志物等位基因定位至染色体1B上6.8至8.05cM的区间。所述1.25cM区间在如表2中所示的位置包含SEQ ID NO.11、SEQ ID NO.12、SEQ ID NO.13和SEQ ID NO.14的标志物。

因此，与所述功能恢复基因等位体连锁的所述至少一个标志物等位基因可以选自以下任一个：

a.在SEQ ID NO：11的C；

b.在SEQ ID NO：12的A；

c.在SEQ ID NO：13的T；

d.在SEQ ID NO：14的T；

或其任意组合。

在甚至又一个实施方案中，与小麦G型胞质雄性不育的位于染色体1B上的所述功能恢复基因连锁的所述至少一个标志物等位基因定位至染色体1B上0.95cM(从7.1至8.05cM)的区间，所述区间包含并旁侧为SEQ ID NO.11和SEQ ID NO.14的标志物对。

在一个具体实施方案中，与所述功能恢复基因等位体连锁的所述至少一个标志物等位基因是在SEQ ID NO.13处的T。

术语“区间”是指末端依据定位位置和/或标志物确定的染色体DNA的一段连续线性区域。例如，包含并旁侧为SEQ ID NO：11和SEQ ID NO：14的标志物对的区间包含具体提到的侧翼标志物和位于其间的标志物，例如如下表2中列出的SEQ ID NO：12和13。包含并旁侧为SEQ ID NO：2和SEQ ID NO：8的标志物对的区间包含SEQ ID NO：3至7的标志物以及SEQID NO：11-14的标志物。因此，如本文所用的侧翼标志物是限定了区间的一个末端(并且包含于该区间内的)标志物。显而易见的是，这类区间的任一者可以包含本文未具体提到的其他标志物。

鉴定的染色体区段及其标志物的位置当表示为重组频率或图谱单位时，在本文中作为一般信息提供。使用特定的小麦群体，获得本文所述的实施方案。因此，参考使用的群体，将具体区段和标志物的位置表示为图谱单位。预期以图谱单位给出的具体区段和标志物的数目可以在栽培品种之间变动并且不是DNA区段和标志物的必需定义的部分，否则的话例如通过核苷酸序列描述DNA区段和标志物。

如本文所用，术语“基因座”(复数形式：基因座(loci))指基因组上(例如，染色体上)的某个地点或位置，其中存在例如基因或遗传标志物。如本文所用，QTL(数量性状基因座)指基因组上与可度量特征(即，性状)对应的位置，如本发明描述的Rf基因座。

如本文中所用，术语“等位基因”(如基因的等位基因)意指基因或特定基因座的任意一个或多个备选形式。在生物体的二倍体细胞中，给定基因的等位基因位于染色体上的一个特定位置或基因座(多个基因座)处。一个等位基因存在于成对同源染色体的每条染色体上或可能存在于同源染色体上。

如本文中所用，术语“同源染色体”意指这样的染色体，它们含有相同生物学特征的信息并且在相同基因座处含有相同的基因，但可能含有这些基因的不同等位基因。同源染色体是减数分裂期间配对的染色体。代表某生物的全部生物学特征的“非同源染色体”形成一个集合，并且细胞中的集合数目称作倍性。二倍体生物含有两组非同源染色体，其中每条同源染色体从不同的亲本继承。在四倍体物种中，存在两组二倍体基因组，因而这两个基因组的染色体称作“同源染色体”(并且类似地，这两个基因组的基因座或基因称作同源基因座或基因)。同样地，六倍体物种具有三组二倍体基因组等。二倍体、四倍体或六倍体植物物种可以在特定基因座包含巨大数目的不同等位基因。驯化小麦物种的倍性水平从二倍体(单粒小麦(Triticum monococcum)，2n＝14，AA)、四倍体(硬粒小麦(T.turgidum)，2n＝28，AABB)至六倍体(普通小麦，2n＝42，AABBDD)。

如本文中所用，术语“杂合”意指两个不同等位基因位于某个特定基因座处，但各自定位在细胞中的相应同源染色体对上的遗传情况。相反地，如本文中所用，术语“纯合”意指两个相同等位基因位于某个特定基因座处，但各自定位在细胞中的相应同源染色体对上的遗传情况。

特定基因或基因座的等位基因可以具有特定的外显率，即它可以是显性、部分显性、共显性、部分隐性或隐性的。显性等位基因是特定基因座或基因的变体，在生物中以杂合形式存在时，所述变体导致与纯合形式存在时相同的表型。在另一方面，隐性等位基因是等位基因的变体，其中杂合形式下，所述变体受显性等位基因支配，因此产生显性等位基因赋予的表型，而仅在纯合形式下才产生隐性表型。部分显性、共显性或部分隐性指这样的情况，其中杂合子显示作为对特定基因座或基因的一个等位基因纯合的生物和对其另一个等位基因纯合的生物的表型之间的中间表型。这种中间表型是部分或不完全显性或外显率的展示。当部分显性出现时，后代当中通常观察到一系列表型。这同样适用于部分隐性的等位基因。

胞质雄性不育由线粒体基因组中的一个或多个突变引起(称作“不育细胞质”)并且作为显性、母系传递性状遗传。对于杂交种子生产中待用的胞质雄性不育，种子亲本必须含有不育细胞质并且花粉亲本必须含有(核)恢复基因(Rf基因)，以恢复从杂交种子培育的杂交植物的能育性。因此，这类Rf基因还优选地是至少部分显性的、最优选地显性的，以便在后代中具有足够的恢复能力。

旁侧为上文提到的标志物的染色体区间例如是具体提到的标志物之间如下表1-2表中所列的标志物，或是未明确显示、但也旁侧为所提到的标志物对的其他标志物。本领域普通技术人员可以容易地在基因组区或亚基因组区中鉴定旁侧为上文所列的任何标志物对的新标志物。这类标志物无需是SNP标志物，而可以是绘图至这个基因组区或亚基因组区的任何类型的基因型或表型标志物。优选地，这类标志物在遗传上和物理上与本发明描述的Rf基因座连锁，所述基因座如至少登录号PI 583676(USDA美国小粒谷类作物保藏中心)中那样存在(并且如可衍生自其中)，但优选地还如包含Rf 1B基因座的其它禾谷类中那样存在。换句话说，标志物优选地表示Rf基因座以非来源特异性方式存在。

在又一个实施方案中，可以使用至少两个、三个、四个或更多个与小麦G型胞质雄性不育的位于染色体1B上的所述功能恢复基因连锁的标志物等位基因，如，至少两个、三个、四个或更多个选自以下任一者的标志物核酸：SEQ IN NO.2、SEQ ID NO.3、SEQ IDNO.4、SEQ ID NO.5、SEQ ID NO.6、SEQ ID NO.7、SEQ ID NO.8、SEQ ID NO.11、SEQ IDNO.12、SEQ ID NO.13、SEQ ID NO.14。

在又一个实施方案中，可以使用至少两个、三个、四个或更多个与小麦G型胞质雄性不育的位于染色体1B上的所述功能恢复基因连锁的近邻标志物等位基因。如本文所用的近邻标志物是位于另一个标志物“上游”或“下游”的核苷酸序列，这取决于来自染色体的近邻核苷酸序列是否在原标志物的5’或3’侧上，如常规理解的那样，例如，处于如表1或表2中列出的顺序。

精细图谱与部分基因组序列的整合确定了SEQ ID NO.15所示的支架为携带功能恢复基因等位体。因此，在本文所述的实施方案或方面的任一者中，小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体可以定位至SEQ ID NO.15所示的基因组支架。

如本文所用，“重叠群”指共同代表DNA共有区域的一组重叠DNA区段。在自下而上的测序项目中，重叠群指重叠的序列数据(读段)；在自上而下的测序项目中，重叠群指形成用来指导测序和组装的基因组物理图谱的重叠克隆。取决于语境，重叠群因此可以指重叠的DNA序列和克隆中所含的重叠的物理区段(片段)。

如本文所用的“支架(scaffold)”指共同代表DNA共有区域的重叠的DNA重叠群。

在又一个实施方案中，所述功能恢复基因等位体是定位在前述任一区间内部或定位至所述支架的编码三角状五肽重复序列(pentatricopeptide repeat，PPR)蛋白的基因(即PPR基因)的功能等位基因。

PPR蛋白基于其结构域架构分类。P类PPR蛋白拥有规范的35个氨基酸基序并且正常情况下缺少额外的结构域。这个类别的成员在细胞器基因表达的大部分方面具有功能。PLS类PPR蛋白具有三个不同类型的PPR基序，其长度各异；P(35个氨基酸)、L(长，35-36个氨基酸)和S(短，～31个氨基酸)，并且认为这个类别的成员主要在RNA编辑方面发挥作用。PLS类的各亚型基于它们拥有的额外C末端结构域归类(Manna等人，2015，Biochimie 113，第93-99页综述，所述文献通过引用的方式并入本文作为参考)。

大部分能育性恢复(Rf)基因来自编码三角状五肽重复序列(PPR)蛋白的基因的小进化枝(Fuji等人，2011，PNAS 108(4)，1723-1728-通过引用的方式并入本文作为参考)。作为能育性恢复(Rf)基因发挥作用的PPR基因在Fu.ji(见上文)中称作Rf-PPR基因。Rf-PPR基因通常存在于成簇的相似Rf-PPR样基因中，与其他PPR基因相比，所述基因显示众多的特征性特征。它们主要包含串联阵列的15-20个PPR基序，所述基序各自包含35个氨基酸。

大部分RfPPR基因属于P类PPR亚家族，不过也已经鉴定到PLS类PPR Rf基因，并且其特征在于存在串联阵列的15至20个各自包含35个氨基酸残基的PPR基序。对否则非常保守的PPR基序内部的特定氨基酸观察到高置换率，提示多样化选择，这促成以下结论：这些残基可能直接涉及与RNA靶结合。这已经导致开发了允许预测天然存在的PPR蛋白的RNA靶的“PPR代码”以及设计出可以结合目的RNA分子的合成的PPR蛋白，因而通过比对的PPR基序中位置5和35处每个RNA碱基和氨基酸侧链之间不同的氢键形成样式，确保序列特异性(Melonek等人，2016，Nat Sci Report 6∶35152；Barkan等人，2012，PLoS Genet 8(8)：e1002910，所述两篇文献均通过引用的方式并入本文作为参考)。

因此，如本文所用，PPR基因的功能等位基因指这样的PPR基因的等位基因，其为如本文所述的小麦G型胞质雄性不育的功能恢复基因等位体，即在(性相容)禾谷类植物中表达时，所述等位基因能够在与G型胞质雄性不育禾谷类植物杂交的后代中恢复能育性。PPR基因的这种功能等位基因也称作PPR-Rf基因(或Rf-PPR基因)，后者随后编码PPR-Rf(或Rf-PPR)蛋白。

在一个实施方案中，所述功能恢复基因等位体编码多肽，如具有与CMS ORF256(SEQ ID NO.23)(特异性)结合的能力的PPR蛋白。如本文所用，结合或特异性结合于或(特异性)识别，意指根据上述的PPR代码，PPR蛋白含有众多PPR基序，所述基序在位置5和35处具有特定残基并且以如此方式排序，从而能够以序列特异性或序列优选方式与靶mRNA结合(在这种情况下ORF256mRNA)。

例如，功能恢复基因等位体可以编码含有PPR基序的PPR蛋白，所述基序在上文所示位置具有特定残基，从而识别ORF256的靶序列AACTGTTTCTATTTGCAC(SEQ ID NO.23的nt129-146)。在一个例子中，预测的识别序列可以是AUUUKCASNCNYACGU(SEQ ID NO.22)。

在又一个实施方案中，所述功能恢复基因等位体是PPR基因的功能等位基因，其由SEQ ID NO.16、SEQ ID NO 18、SEQ ID NO 19、SEQ ID NO.21的核酸序列编码，或编码SEQID NO.17或SEQ ID NO.20的多肽的PPR基因。例如，所述功能恢复基因等位体可以包含或编码这样的序列，如本文定义，所述序列与SEQ ID NO.16、SEQ ID NO.17、SEQ ID NO.18、SEQID NO 19、SEQ ID NO.20、SEQ ID NO.21基本上同一，如与SEQ ID NO.16、SEQ ID NO.17、SEQ ID NO.18、SEQ ID NO 19、SEQ ID NO.20、SEQ ID NO.21至少85％、85.5％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或99.5％同一。

在又一个实施方案中，所述功能恢复基因等位体是如至少登录号PI 583676(USDA美国小粒谷类作物保藏中心，也称作Dekalb 582M并且登记为US PVP7400045)中那样存在(并且如可衍生自其中)的功能恢复基因等位体。

在甚至又一个实施方案中，所述功能恢复基因等位体包含SEQ ID NO.16、SEQ IDNO 18、SEQ ID NO 19、SEQ ID NO 21的核苷酸序列或编码SEQ ID NO.17或SEQ ID NO 20的多肽。

显而易见的是，当本文中提到特定基因组序列中的某个SNP基因型或SNP等位基因(或标志物基因型或标志物等位基因)(例如，其选自SEQ ID NO：1至SEQ ID NO：14，或其片段)时，这还涵盖在基因组序列的变体中的SNP基因型或等位基因，即与所提及序列(其选自SEQ ID NO：1至SEQ ID NO：14，或其片段)同源(例如相对于所提及序列包含至少90％、95％、98％、99％(基本上的)或更多序列同一性)的基因组序列中的SNP基因型或等位基因。因此在一个方面，本文中对SEQ ID NO：1至14(或其片段)中任一者的任何提及还涵盖SEQID NO：1至14(或其片段)中任一者的变体，所述变体(同源序列)相对于所述序列包含至少85％、90％、95％、98％、99％或更大序列同一性(使用例如程序‘Needle’)，但包含所述SNP(标志物)基因型或等位基因。

SNP基因型指二个核苷酸，和包含这两个核苷酸之一的基因组序列，在染色体对的每条染色体上各一个。因此例如对于SEQ ID NO.6具有AA基因型的植物在两条染色体上与SEQ ID NO：6的核苷酸32相对应的位置处具有相同核苷酸(A)，而对于SEQ ID NO.6具有AG基因型的植物具有一条在SEQ ID NO：6的核苷酸32相对应的位置处为A的染色体和一条在所述核苷酸位置处为G的染色体。因此，SNP等位基因指如染色体上那样存在的SNP基因型的二个核苷酸之一。

基于本公开，技术人员可以容易地鉴定如上文所列的任何其他Rf特异性标志物或标志物等位基因。这可以例如通过将本文提到的任何标志物之间的基因组区测序或通过将新标志物定位到上文所列的任何标志物区间或子区间之间的区域来进行。优选地，但不必然地，这类标志物是共同标志物，即它们存在于多于一个Rf来源的染色体1B上。

本发明进一步描述一种产生包含小麦G型胞质雄性不育的功能恢复基因等位体的禾谷类(例如小麦)植物的方法，所述方法包括步骤：

a.使包含小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因的第一禾谷类植物与第二植物杂交(其中所述第一植物包含至少一个与如本文所述的小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体连锁的标志物等位基因并且因此使用本文所述的方法可鉴定)

b.根据本文所述的任何方法，通过鉴定包含至少一个与如本文所述的小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体连锁的标志物等位基因的后代植物，确定(并任选地选择)包含小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体的后代植物(其中所述后代植物包含小麦G型胞质雄性不育的位于染色体1B上的所述功能恢复基因)。

还提供一种产生禾谷类植物的方法，所述禾谷类植物包含小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体，所述方法包括步骤：

a.使第一禾谷类植物与第二禾谷类植物杂交，所述第一禾谷类植物对小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因为纯合(其中所述第一禾谷类植物包含至少一个与如本文所述的小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体连锁的标志物等位基因，优选地其中所述植物对所述至少一个标志物等位基因纯合)

b.获得后代植物，其中所述后代植物包含小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体(其中所述后代植物包含至少一个与如本文所述的小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体连锁的标志物等位基因并且因此使用本文所述的方法可鉴定)。

所述第二植物可以是不包含小麦G型胞质雄性不育的位于染色体1B上的功能恢.复基因的植物。

在甚至又一个实施方案中，本发明提供一种产生F1杂交种子或F1杂交植物的方法，所述方法包括步骤：

a.提供雄性禾谷类(例如小麦)亲本植物，其包含小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体；

b.使所述雄性亲本植物与雌性禾谷类(例如小麦)亲本植物杂交，其中雌性亲本植物是G型胞质雄性不育禾谷类植物；

c.任选地收集来自所述杂交的杂交种子。

F1杂交种子和植物优选地包含至少一个与如本文所述的小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体连锁的标志物等位基因，并且培育自这些种子的F1植物因此能育。优选地，雄性亲本植物因此对所述小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体纯合并且因此对所述至少一个标志物等位基因也纯合。

在上述方法中，可以使用本文中所述的选择包含小麦G型胞质雄性不育的功能恢复基因的禾谷类植物的任何方法，选择用于杂交的雄性亲本植物。因此，雄性亲本植物包含与小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体连锁的至少一个标志物等位基因，优选地为纯合形式。

本发明也提供通过前述任一方法获得的禾谷类植物，如小麦植物，所述禾谷类植物包含与小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体连锁的至少一个标志物等位基因。

所述与小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体连锁的至少一个标志物等位基因可以定位至相同的染色体区间或重叠群并且可以选自如上文对其他实施方案和方面所述的相同群组。

还描述了包含小麦G型胞质雄性不育的位于染色体1B上的至少一个功能恢复基因等位体的禾谷类植物、植物部分、植物细胞或种子，所述植物包含与小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体连锁的至少一个标志物等位基因，其中所述至少一个标志物等位基因定位在染色体1B上的区间内部，所述区间包含并旁侧为SEQ ID NO 2和SEQ ID NO 8的标志物，优选地其中所述植物包含以下至少一者(如一、二、三、四、五、六、七、八、九、十者或全部)：

a.在SEQ ID NO：2的T；

b.在SEQ ID NO：3的C；

c.在SEQ ID NO：4的T；

d.在SEQ ID NO：5的T；

e.在SEQ ID NO：6的A；

f.在SEQ ID NO：7的A；

g.在SEQ ID NO：8的G；

h.在SEQ ID NO：11的C；

i.在SEQ ID NO：12的A；

j.在SEQ ID NO：13的T；

k.在SEQ ID NO：14的T；

所述植物不包含以下任一者或全部

l.在SEQ ID NO：1的A；

m.在SEQ ID NO：9的T。

还描述了包含小麦G型胞质雄性不育的位于染色体1B上的至少一个功能恢复基因等位体的禾谷类植物、植物部分、植物细胞或种子，所述植物包含与小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体连锁的至少一个标志物等位基因，其中所述至少一个标志物等位基因定位在染色体1B上的区间内部，所述区间包含并旁侧为SEQ ID NO 11和SEQ ID NO 14的标志物，优选地其中所述植物包含以下至少一者(如一、二、三者或全部)：

a.在SEQ ID NO：11的C；

b.在SEQ ID NO：12的A；

c.在SEQ ID NO：13的T；

d.在SEQ ID NO：14的T；

所述植物不包含以下任一者或全部

e.在SEQ ID NO：2的T；

f.在SEQ ID NO：8的A。

a.在SEQ ID NO：11的C；

b.在SEQ ID NO：12的A；

c.在SEQ ID NO：13的T；

d.在SEQ ID NO：14的T；

所述植物不包含以下任一者或全部

e.在SEQ ID NO：10的T；

f.在SEQ ID NO：5的T。

在又一个实施方案中，前述植物、植物部分、植物细胞或种子的任一者包含SEQ IDNO：13的T。在又一个实施方案中，所述植物包含SEQ ID NO：13的T，不包含以下任一者或全部：SEQ ID NO：11处的C；SEQ ID NO：12处的A、SEQ ID NO：14处的T。

还提供来自本发明禾谷类植物的植物部分、植物细胞和种子，其包含所述至少一个标志物等位基因和所述功能恢复基因等位体。本发明的植物、植物部分、植物细胞和种子也可以是杂交植物、植物部分、植物细胞或种子。

还提供一种确定禾谷类植物的生物样品中小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体的存在或不存在或其接合性状态的方法，所述方法包括：从所述生物样品提供基因组DNA，并且对所述DNA分析至少一个标志物等位基因的存在或不存在或其接合性状态，所述标志物等位基因与本文所述的小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因连锁。显而易见的是，可以使用与如本文所述的功能恢复基因连锁的标志物等位基因，确定存在，而可以(额外地)通过检测其他的非恢复等位基因的存在，确定不存在。可以通过检测与功能恢复基因连锁的标志物等位基因的存在或不存在和通过检测其他的非恢复等位基因的存在，确定接合性状态，即植物是否对恢复等位基因纯合、对非恢复等位基因纯合或杂合(即Rf基因型)，但是取决于亲本起源，确定仅一个等位基因的存在或不存在也可能足以能够推断植物的完整基因型(接合性状态)。

还提供一种鉴定和/或选择包含小麦G型胞质雄性不育的功能恢复基因等位体的禾谷类(例如小麦)植物的方法，所述方法包括步骤：

a.在所述植物中鉴定或检测编码如本文所述的小麦G型胞质雄性不育的功能恢复基因的核酸或多肽的存在

b.和任选地选择包含所述核酸或多肽的所述植物。

同样地，鉴定或检测可以包括获得生物样品(例如蛋白质)或基因组DNA并且根据本领域熟知的方法，如杂交、PCR、Rt-PCR、DNA印迹法、DNA印迹加测序、SNP检测方法(例如，如本文所述)、蛋白质印迹法、elisa等，例如基于本文提供的序列的方法，确定核酸或多肽的存在。

本发明也提供至少一个包含与小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因连锁的等位基因的标志物的用途，用于鉴定至少一个包含与小麦G型胞质雄性不育的位于染色体1B上的所述功能恢复基因连锁的等位基因的其他标志物。这类标志物也遗传连锁于或紧密连锁于恢复基因，并且也处于本发明的范围内。可以通过多种遗传作图或物理作图技术中的任一者鉴定标志物。确定是否标志物与恢复基因遗传连锁的方法是本领域技术人员已知的并且例如包括区间作图(Lander和Botstein，(1989)Genetics 121：185)、回归作图(Haley和Knott，(1992)Heredity 69：315)或MQM作图(Jansen，(1994)Genetics138：871)、rMQM作图。此外，这类物理作图技术如染色体步移、重叠群作图和组装，扩增子再测序、转录组测序、定向捕获和测序、下一代测序等，可以用来鉴定和分离在本发明背景下可用作标志物的额外序列。

本发明还提供至少一个与如本文所述的小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因连锁的标志物等位基因的用途，用于鉴定包含小麦G型胞质雄性不育的所述功能恢复基因的植物。

还提供植物用于恢复G型胞质雄性不育禾谷类植物(如小麦植物)的后代中能育性或产生杂交禾谷类植物(如小麦植物)群体或产生杂交种子的用途，其中所述植物通过如本文所述的任一方法获得并且包含至少一个与如本文所述的小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因连锁的标志物等位基因。

还提供一种鉴定小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体的方法，所述方法包括步骤：

a.提供F2植物群体，其从雌性禾谷类亲本植物与雄性禾谷类亲本植物杂交所获得的F1植物群体自交而产生，其中雌性亲本植物是G型胞质雄性不育禾谷类植物，并且其中雄性亲本植物包含小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体。

b.将多个所述F2植物的能育性分类。

c.测定染色体1B区域的至少部分的核苷酸序列，所述区域包含并旁侧为从所述多个F2植物中每一者分离的基因组DNA的SEQ ID NO2和SEQ ID NO8的标志物。

d.鉴定所述区域内部与已恢复能育性的表型具有最高关联性的编码序列，其中鉴定的编码序列是小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因等位体。

在上述方法或用途的任一者中，标志物和标志物等位基因可以定位至相同的染色体区间并且可以选自如上文对其他实施方案和方面所述的相同群组。

如本文所述，还提供任何包含等位基因的标志物，所述等位基因与本文所述的小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因连锁。

本文中还提供染色体片段，其包含如本说明书通篇范围内所述那样的小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因。在一个方面，染色体片段与其天然环境分离。在另一个方面，它在植物细胞中，特别地在禾谷类细胞中，特别地在小麦细胞中。本文还提供染色体片段的分离部分，所述染色体片段包含小麦G型胞质雄性不育的位于染色体1B上的功能恢复基因。这种染色体片段可以例如如与SEQ ID NO.16相对应的重叠群或支架。

还提供了包含本发明的功能恢复基因的重组核酸分子，尤其重组DNA分子。在一个方面，功能恢复基因是通过本文所述的一种或多种分子标志物测定法可检测的。还提供包含重组DNA的DNA载体。重组DNA分子或DNA载体可以是分离的核酸分子。包含功能恢复基因的DNA可以处于微生物如细菌(例如农杆菌(Agrobacterium)或大肠杆菌(E.coli))中。

因此，在一个实施方案中，本发明提供(分离的)编码小麦G型胞质雄性不育的功能恢复基因等位体的核酸分子，其中所述功能恢复基因等位体定位于染色体1B上的区间内部，所述区间包含SEQ ID NO 2和SEQ ID NO8的标志物并且旁侧有这些标志物。因此，(分离的)编码或包含小麦G型胞质雄性不育的功能恢复基因等位体的核酸分子可衍生自或衍生自染色体1B上的区间，所述区间包含SEQ ID NO 2和SEQ ID NO 8的标志物并且旁侧有这些标志物。所述功能恢复基因等位体可以使用与如本文所述的所述功能恢复基因等位体连锁的任何标志物和标志物等位基因来鉴定并且因此是可鉴定的。

在又一个实施方案中，由所述(分离的)核酸分子编码的所述功能恢复基因等位体位于染色体1B上的区间内部，所述区间包含SEQ ID NO 11和SEQ ID NO14的标志物并且旁侧有这些标志物。

在又一个实施方案中，由所述(分离的)核酸分子编码的所述功能恢复基因等位体定位至如SEQ ID NO.15所示的重叠群。

在又一个实施方案中，由所述(分离的)核酸分子编码的所述功能恢复基因等位体可以是定位在所述区间的任一者内部或定位至所述重叠群的PPR基因的功能等位基因。

在一个实施方案中，所述(分离的)编码所述功能恢复基因等位体的核酸编码(分离的)具有与CMS ORF256(SEQ ID NO.22)(特异性)结合的能力的多肽，如PPR蛋白。如本文所用，结合或特异性结合于或(特异性)识别，意指根据上述的PPR代码，PPR蛋白含有众多PPR基序，所述基序在位置5和35处具有特定残基并且以如此方式排序，从而能够以序列特异性或序列优选方式与靶mRNA(在这种情况下ORF256mRNA)结合。

例如，功能恢复基因等位体可以编码(分离的)含有PPR基序的PPR蛋白，所述基序在上文所示位置具有特定残基，从而识别ORF256的靶序列AACTGTTTCTATTTGCAC(SEQ IDNO.23的nt 129-146)。在一个例子中，预测的识别序列可以是AUUUKCASNCNYACGU(SEQ IDNO.21)。

功能恢复基因等位体还可以编码在表达时靶向至线粒体的PPR蛋白。这可以例如因存在(植物中有功能的)线粒体靶向序列或线粒体信号肽或线粒体转运肽而实现。线粒体靶向信号是长10-70个氨基酸的肽，其指引新合成的蛋白质至线粒体，一般存在于N末端。线粒体转运肽富含带正电荷的氨基酸，但通常缺少负电荷。它们具有在非水质环境(如，膜)中形成两亲性α-螺旋的潜力。线粒体靶向信号可以含有额外的信号，所述信号随后靶向蛋白质至线粒体的不同区域，如线粒体基质。如同信号肽那样，一旦靶向过程完成，则切除线粒体靶向信号。线粒体转运肽例如在Shewry和Gutteridge(1992，Plant ProteinEngineering，143-146，及其中参考文献)、Sjoling和Glaser(Trends Plant Sci第3卷，第4期，1998年4月1日，第136-140页)、Pfanner(2000，Current Biol，第10卷，第11期)、Huang等人(2009，Plant Phys 150(3)：1272-1285)、Chen等人(1996，PNAS，第93卷，第11763-11768页)，Fuji等人(Plant J 2016)中描述。在一个实例中，这种序列可以是SEQ ID NO.20的氨基酸1-50。

在又一个实施方案中，所述功能恢复基因等位体是PPR基因的功能等位基因，其由SEQ ID NO.16、SEQ ID NO 18、SEQ ID NO 19、SEQ ID NO.21编码、或编码SEQ ID NO.17或SEQ ID NO.20的多肽的PPR基因。例如，所述功能恢复基因等位体可以包含或编码这样的序列，如本文定义，所述序列与SEQ ID NO.16、SEQ ID NO.17、SEQ ID NO.18、SEQ ID NO.19、SEQ ID NO 20、SEQ ID NO.21基本上同一，如与SEQ ID NO.16、SEQ ID NO.17、SEQ IDNO.18、SEQ ID NO.19、SEQ ID NO 20、SEQ ID NO.21至少85％、85.5％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或99.5％同一。

在甚至又一个实施方案中，所述功能恢复基因等位体包含SEQ ID NO.16、SEQ IDNO.18、SEQ ID NO.19、SEQ ID NO 21的核苷酸序列或编码SEQ ID NO.17或SEQ ID NO.20的多肽。

在又一个实施方案中，由所述(分离的)核酸分子编码的所述功能恢复基因等位体从USDA登录号PI 583676可获得。

还提供(分离的)由如上文所述的核酸分子编码的多肽(所述多肽编码小麦G型胞质雄性不育的功能恢复蛋白)。

也可以克隆功能恢复基因等位体并可以例如通过以下方式产生嵌合基因：将植物可表达启动子与功能恢复基因等位体和任选地在植物中有功能的参与转录终止和聚腺苷酸化的3’末端区有效连接。可以将这种嵌合基因引入植物细胞，并可以将植物细胞再生成完整植物以产生转基因植物。在一个方面，根据本领域熟知的任何方法，转基因植物是禾谷类植物，如小麦植物。

因此，在一个具体实施方案中，提供了嵌合基因，其包含(分离的)如上文所述的编码功能恢复基因等位体的核酸分子，所述核酸分子与异源性植物可表达启动子和任选地3’终止和聚腺苷酸化区有效连接。

本文涵盖这种(分离或提取的)核酸分子和/或这种嵌合基因和/或这种染色体片段用于产生包含功能恢复基因等位体的植物细胞和植物的用途。在一个方面，它可以用来产生包含功能恢复基因等位体的转基因禾谷类(例如小麦)细胞、植物和植物部分或种子和能够针对如上文所述的小麦G型胞质雄性不育恢复能育性的植物。

提供了宿主或宿主细胞，如(禾谷类)植物细胞或(禾谷类)植物或其种子，如小麦植物细胞或植物或其种子，其包含如上文所述的(分离的)核酸分子、(分离的)多肽或嵌合基因，其中优选地所述多肽、所述核酸或所述嵌令基因在每种情况下均相对于所述植物细胞或植物或种子是异源的。宿主细胞例如还可以是细菌，如大肠杆菌或农杆菌(根癌农杆菌)。

因此，还提供一种用于产生禾谷类植物细胞或植物或其种子如小麦植物细胞或植物或其种子的方法，所述植物细胞或植物或其种子包含用于小麦G型胞质雄性不育的或用于增加禾谷类植物如小麦植物中小麦G型胞质雄性不育(“CMS”)恢复能力的功能恢复基因，所述方法包括步骤：向所述植物细胞或植物提供如本文所述的(重组)染色体片段或(分离的)核酸分子或嵌合基因，其中所述提供包括转化、杂交、回交、基因组编辑或诱变。如本文所用，恢复能力意指植物在与G型胞质雄性不育(“CMS”)系的杂交的后代中恢复能育性的能力。优选地，所述植物表达本发明的多肽或具有增加的本发明多肽表达。优选地，所述表达(增加)是至少在花粉发育和减数分裂(早期阶段)期间，如在花药或更具体地绒毡层，或正在发育的小孢子中(其中在提供步骤之前，所述植物不表达或更低程度地表达该多肽)。

因此，还提供一种用于产生禾谷类植物细胞或植物或其种子如小麦植物细胞或植物或其种子的方法，所述植物细胞或植物或其种子包含用于小麦G型胞质雄性不育的或用于增加禾谷类植物如小麦植物中小麦G型胞质雄性不育(“CMS”)恢复能力的功能恢复基因，所述方法包括步骤：在所述植物细胞或植物或种子中增加(分离的)如本文所述的多肽表达。优选地，所述表达(增加)是至少在花粉发育和减数分裂(早期阶段)期间，如在花药或更具体地绒毡层，或正在发育的小孢子中。在该提供步骤之前，所述植物不表达或较低程度地表达多肽和/或没有或较低程度她具有小麦G型胞质雄性不育(“CMS”)恢复能力。

可以通过以下方式增加表达：向植物提供如本文所述的(重组)染色体片段或(分离的)核酸分子或嵌合基因，因而编码功能恢复基因等位体的核酸处于适宜调节元件(如在目的组织/细胞中驱动表达的启动子)的控制下，而且还通过下方式增加表达：向植物提供与转录增强子偶联的例如(特异性)识别启动子区并促进转录的转录因子，如TAL效应子、dCas、dCpf1等。

还描述了一种将不能够在与G型胞质雄性不育(“CMS”)系杂交的后代中恢复能育性的禾谷类植物(如小麦植物)(非恢复植物)转化成能够在与G型胞质雄性不育(“CMS”)系杂交的后代中恢复能育性的植物(恢复植物)的方法，所述方法包括步骤：修饰所述植物的基因组以包含(分离的)编码如本文所述的小麦G型胞质雄性不育的功能恢复基因等位体的核酸分子或嵌合基因，其中所述修饰包括转化、杂交、回交、基因组编辑或诱变。优选地，所述植物表达本发明的多肽，尤其至少在花粉发育和减数分裂(早期阶段)期间，如在花药或更具体地绒毡层，或正在发育的小孢子中表达。在所述修饰之前，所述植物不表达或较低程度地表达多肽和/或没有或较低程度地具有小麦G型胞质雄性不育(“CMS”)恢复能力。

因此，还提供一种将非恢复的禾谷类植物如小麦植物转化成用于小麦G型胞质雄性不育的或用于增加禾谷类植物如小麦植物中小麦G型胞质雄性不育(“CMS”)恢复能力的恢复植物的方法，所述方法包括步骤：修饰所述植物的基因组以增加所述植物中本发明多肽的表达。优选地，所述表达(增加)是至少在花粉发育和减数分裂(早期阶段)期间，如在花药或更具体地绒毡层，或正在发育的小孢子中。在所述修饰之前，所述植物不表达或较低程度地表达多肽和/或没有或较低程度地具有小麦G型胞质雄性不育(“CMS”)恢复能力。

可以例如通过修饰天然启动子以包含增加转录的调节元件(如某些增强子元件)，还通过失活或移除某些负向调节元件(如阻遏子元件或miRNA或lncRNA的靶位点)，修饰基因组以增加多肽表达。包含启动子的Rf35’/上游区域包含于SEQ ID NO 21或其片段中，例如，如nt 7907-11981所示。

还描述了植物细胞或植物、优选地禾谷类植物细胞或禾谷类植物或其种子，如小麦植物细胞或植物或其种子，其根据前述任一方法产生，优选地其中与提供步骤或修饰步骤之前的所述植物相比，所述植物具有增加的小麦G型胞质雄性不育(“CMS”)恢复能力。还描述了根据以上方法获得的这种植物在与G型胞质雄性不育(“CMS”)植物杂交的后代中恢复能育性或产生杂交植物或杂交种子的用途。这种植物细胞、植物或种子可以是杂交植物细胞、植物或种子。

如本文所用，基因组编辑指使用序列特异性酶(如核酸内切酶，切刻酶，碱基转化酶)和/或供体核酸(例如dsDNA、寡聚物)，靶向修饰基因组DNA以在DNA中引入所需的改变。可以接受编程以识别特定DNA序列的序列特异性核酸酶包括大范围核酸酶(meganucleases)(MGN)、锌指核酸酶(ZFN)、TAL效应子核酸酶(TALEN)和RNA指导的或DNA指导的核酸酶如Cas9，Cpf1，CasX，CasY，C2c1，C2c3、某些argonout系统(参见，例如Osakabe和Osakabe，Plant Cell Physiol.2015Mar；56(3)：389-400；Ma等人，Mol Plant.2016Jul 6；9(7)：961-74；Bortesie等人，Plant Biotech J，2016，14；Murovec等人，Plant BiotechnolJ.2017Apr 1；Nakade等人，Bioengineered 8-3，2017；Burstein等人，Nature 542，37-241；Komor等人，Nature 533，420-424，2016；所述文献均通过引用的方式并入本文作为参考)。供体核酸可以用作修复序列特异性核酸酶所致DNA断口的模板，但也可以如此用于基因打靶(不引起DNA断口)，以将目的变化引入基因组DNA中。

因此，使用这些技术，通过对现有PPR基因做出所需改变或备选地在特定基因组位置处引入一个或多个编码(例如，如本文所述的)功能性PPR Rf蛋白质的完整序列，可以将缺少小麦G型胞质雄性不育的功能恢复基因的植物(非恢复植物)转化成恢复植物。

如本文所用的诱变例如指EMS诱变或辐射所致诱变等。

因此，本发明的一个实施方案还是转基因禾谷类细胞，例如转基因小麦细胞，所述细胞在其基因组中包含含有如所述的功能恢复基因等位体的重组染色体片段或(分离的)如所述的核酸分子或如所述的嵌合基因。在一个方面，包含Rf等位基因的DNA分子稳定整合入禾谷类(例如小麦)基因组。

因此，提供禾谷类植物、植物部分、植物细胞或其种子，尤其小麦，其包含编码本发明功能恢复基因的本发明染色体片段或核酸分子或本发明的多肽或本发明的嵌合基因，所述植物具有针对本文提供的小麦G型胞质雄性不育恢复能育性的能力。在一个实施方案中，染色体片段、核酸分子、多肽或嵌合基因对所述植物而言为异源，如转基因禾谷类植物或转基因小麦植物。这还包括包含这个染色体片段或核酸分子、多肽或嵌合基因的植物细胞或细胞培养物，与是否通过转基因方法或通过育种方法引入无关。细胞例如是在体外的并且可再生成包含本发明染色体片段或嵌合基因的植物。所述植物、植物部分、植物细胞和种子也可以是杂交植物、植物部分、植物细胞或种子。

这类植物也可以作为雄性亲本植物用于如上文所述的产生F1杂交种子或F1杂交植物的方法中。

如本文所用的植物可表达启动子可以是至少在(早期)花粉发育和减数分裂期间，如在花药或更具体地绒毡层或正在发育的小孢子中驱动足够表达的任何启动子。这可以例如是组成型启动子、诱导型启动子，还可以是花粉特异性、花药特异性或更具体地绒毡层特异性或小孢子特异性/偏好性启动子。

组成型启动子是能够在大多数细胞类型(以空间时间非依赖性方式)指导高水平表达的启动子。植物可表达的组成型启动子的例子包括细菌源启动子，如来自农杆菌的章鱼碱合酶(OCS)启动子和胭脂碱合酶(NOS)启动子，还包括病毒源启动子，如花椰菜花叶病毒(CaMV)35S转录物(Hapster等人，1988，Mol.Gen.Genet.212：182-190)或19S RNA基因(Odell等人，1985，Nature.6；313(6005)：810-2；美国专利号5,352,605；WO 84/02913；Benfey等人，1989，EMBO J.8∶2195-2202)的启动子、增强型2x35S启动子(Kay等人，1987，Science236：1299-1302；Datla等人(1993)，Plant Sci 94：139-149)、木薯叶脉花叶病毒(cassava vein mosaic virus)启动子(CsVMV；WO 97/48819、US 7,053,205)、2x CsVMV(WO2004/053135)、圆环病毒(AU 689 311)启动子、甘蔗杆形DNA病毒(sugarcane bacilliformbadnavirus，ScBV)启动子(Samac等人，2004，Transgenic Res.13(4)：349-61)、玄参花叶病毒(FMV)启动子(Sanger等人，1990，Plant Mol Biol.14(3)：433-43)、地三叶病毒启动子第4号或第7号(WO 96/06932)和如US 5,164,316、US 5,196,525、US 5,322,938、US 5,359,142和US 5,424,200中所述的增强型35S启动子。在植物源的启动子当中，将提到以下启动子：来自玉米和向日葵的植物核酮糖.二磷酸羧化酶/加氧酶(Rubisco)小亚基启动子(US4,962,028；WO99/25842)、拟南芥组蛋白H4基因启动子(Chabouté等人，1987)、玉米、稻和甘蔗的遍在蛋白启动子(Holtorf等人，1995，Plant Mol.Biol.29：637-649、US 5,510,474)、稻肌动蛋白1启动子(Act-1，US 5,641,876)、如EP 0 507 698 A1中所述的组蛋白启动子、玉米醇脱氢酶1启动子(Adh-1)(来自http：//www.patentlens.net/daisy/promoters/242.html))。如果使用菊属(Chrysanthemum)小亚基启动子与使用相应的终止子组合，则还可以使用该启动子(Outchkourov等人，Planta，216：1003-1012，2003)。

有花粉/小孢子活性的启动子例如包括玉米花粉特异性启动子(参见，例如，Guerrero(1990)MoI.Gen.Genet.224：161168)、PTA29、PTA26和PTAl 3(参见，例如，美国专利号5,792,929)和例如Baerson等人(1994Plant MoI.Bio1.26：1947-1959)中所述，例如WO97/30166中所述的NMT19小孢子特异性启动子。在Khurana等人，2012(Critical Reviewsin Plant Sciences，31：359-390)、WO2005100575、WO 2008037436中描述了其他花药/花粉特异性的或有花药/花粉活性的启动子。其他合适的启动子例如是大麦vrn1启动子，如Alonso-Peral等人(2001，PLoS One.2011；6(12)：e29456)中所述。

显而易见的是，本文鉴定的编码功能恢复基因的核酸和多肽可以用来鉴定其他的小麦G型胞质雄性不育的功能恢复基因。因此，本发明还提供(分离的)如本文中公开的核酸或多肽(如SEQ ID NO.16或17)鉴定一个或多个其他的小麦G型胞质雄性不育的功能恢复基因的用途。

另外，可以使用本领域已知的方法，鉴定同源的或基本上同一的功能恢复基因。可以通过使用如上文所述的包含例如SEQ ID NO：16的核苷酸序列或其部分核酸作为探针，在严格条件或高严格条件下杂交，鉴定并分离同源核苷酸序列。也可以使用对编码功能恢复基因的基因特异的寡核苷酸作为引物，如但不限于包含来自SEQ ID NO：16或其互补序列的约20个至约50个连续核苷酸或由其组成的寡核苷酸，通过DNA扩增，获得编码功能恢复基因的其他序列。可以使用基础局部比对检索工具(BLAST)以如本文中提供的核苷酸或氨基酸序列进行同源性检索，计算机鉴定同源的或基本上同一的功能恢复基因。

可以例如通过以下方式验证如上文鉴定的恢复基因或其等位基因的功能：在不具有恢复G型胞质雄性不育小麦植物后代的能育性的禾谷类(小麦)植物中提供(例如，通过转化或杂交来提供)植物可表达启动子控制下的这种恢复基因，将因此产生的禾谷类植物与G型胞质雄性不育小麦植物杂交并在后代中评价结实率。备选地，恢复系可以用RNAi构建体转化或用例如CRISPR-Cas技术或任何其他序列特异性核酸酶进行基因编辑，从而旨在产生功能丧失，令植物未恢复。类似地，用于突变恢复基因的其他手段(例如EMS、g-辐射)可以用来评估功能丧失的突变对恢复能力的影响。

在任一个本文所述的实施方案和方面，植物可以包含或可以选择所述植物以包含或可以向其提供又一个(位于相同或另一个染色体上或可自相同或另一个染色体获得的)小麦G型胞质雄性不育的功能恢复基因，如Rf1(1A)、Rf2(7D)、Rf4(6B)、Rf5(6D)、Rf6(5D)、Rf7(7B)、Rf8、6AS或6BS(Tahir和Tsunewaki，1969；Yen等人，1969；Bahl和Maan，1973；Du等人，1991；Sihna等人，2013；Ma等人，1991；Zhou等人，2005)。

本文中所述的方法、标志物和标志物等位基因、核酸、多肽、嵌合基因、植物等中任一者也可以用来恢复针对S^v-类型细胞质的能育性，例如Ahmed等人2001(见上文)中所述。

如本文所用，“嵌合基因”指正常情况下在植物物种中不存在的核酸构建体。嵌合核酸构建体可以是DNA或RNA。“嵌合DNA构建体”和“嵌合基因”可互换地用来指这样的基因，其中基因的启动子或一个或多个其他调节区，如转录终止和聚腺苷酸化区在自然界中并不与转录的DNA区域的部分或全部接合，或这样的基因，其存在于植物基因组中它并不天然存在的基因座内，或存在于它并不天然存在的植物中。换句话说，基因和有效连接的调节区或者基因和基因组座位或者基因和植物彼此为异源，即它们不天然地一起出现。

第一核酸序列与第二核酸序列处于功能性关系时，第一核苷酸序列与第二核酸序列“有效连接”。例如，如果启动子影响编码序列的转录或表达，则启动子与编码序列有效连接。当重组地产生时，有效连接的核酸序列通常是连续的，并且在需要连接两个编码蛋白质的区域情况下，处于相同的可读框中(例如，在多顺反子ORF中)。但是，核酸无需邻近以有效地连接。

“回交”指可以籍此将(单一)性状(如能育性恢复(Rf))从一个遗传背景(“供体”)转移入另一个遗传背景(也称作“回归亲本”)(例如不包含这个Rf基因或基因座的植物)的育种方法。杂交后代(例如，通过含有Rf的植物与缺少Rf的植物杂交所获得的F1植物；或从F1自交获得的F2植物或F3植物等)与亲本“回交”。在反复回交(BC1、BC2等)和任选地自交(BC1S1、BC2S1等)后，将一个遗传背景的性状并入另一个遗传背景中。

“标志物辅助选择”或“MAS”是利用与特定基因座或特定染色体区域(例如渐渗片段)遗传连锁的分子标志物的存在，就特定基因座或区域(渐渗片段)的存在而选择植物的方法。例如，与Rf基因座遗传和物理连锁的分子标志物可以用来检测和/或选择包含Rf基因座的植物。分子标志物与基因座的遗传连锁越近，则该标志物经由减数分裂重组从该基因座脱离的可能性更小。

“LOD评分”(可能性的对数(10为底))指经常用于动物种群和植物种群中关联分析的统计检验。LOD评分比较如果二个基因座(分子标志物基因座和/或表型性状基因座)的确连锁则获得测试数据的可能性与存粹因偶然而观察到相同数据的可能性。正LOD评分支持连锁的存在并且大于3.0的LOD评分视为连锁的证据。LOD评分+3表示1000/1可能性，观察到的连锁并非是偶然发生的。

“生物样品”可以是植物或植物的部分如植物组织或植物细胞。

如本文所用的“提供基因组DNA”指提供包含来自植物的基因组DNA的样品。样品可以指已经从所述植物获得的组织样品，例如，叶样品，其包含来自所述植物的基因组DNA。样品还可以指从组织样品获得的基因组DNA，如已经从组织(如叶样品)获得的基因组DNA。提供基因组DNA可以包括，但不需要包括，从组织样品纯化基因组DNA。提供基因组DNA因此还包括从植物或较大组织片获得组织材料并从中制备粗提物或裂解物。

如本文所用的“分离的DNA”指不在其天然基因组背景下出现的DNA，无论其长度和序列是什么。分离的DNA可以例如指与其基因组背景物理分离的DNA，如基因组DNA的片段。分离的DNA也可以是人工产生的DNA，如化学合成的DNA，或如借助扩增反应(如本领域熟知的聚合酶链反应(PCR))产生的DNA。分离的DNA还可以指在其不天然存在的DNA背景下存在的DNA。例如，分离DNA可以指质粒中存在的一段DNA。另外，分离的DNA可以指另一个与它天然存在的背景不同的染色体背景下(例如在基因组中异于天然位置的另一个位置、在另一个与它天然存在的物种相异的物种的基因组中或在人工染色体中)存在的一段DNA。

无论何时提到本发明的“一个植物”或“多个植物”时，除非另外说明，否则应当理解本文中还包括植物部分(细胞、组织或器官、种荚、种子、分开的部分(severed parts)如根、叶、花、花粉等)、植物的仍保留亲本突出特征(尤其恢复能力)的后代、如通过自交或杂交获得的种子，例如(通过两个近交亲本系杂交获得的)杂交种子、杂交植物和从中衍生的植物部分。

在一些实施方案中，本发明的植物细胞可以是非繁殖性细胞。

根据本发明获得的植物可以在常规育种方案中用来产生更多具有相同特征的植物，或用来在相同或相关植物物种的其它品种中或在杂交植物中引入存在本发明的恢复基因的特征。获得的植物还可以用于产生繁殖材料。本发明的植物还可以用来产生通过本发明方法所获得的植物的配子、种子、粉、胚、合子胚或体细胞胚、后代或杂交种。还涵盖从本发明植物获得的种子。

如本文所用，“产生繁殖材料”指本领域已知的产生进一步的植物、植物部分或种子的任何手段并且尤其包括营养性繁殖方法(例如空中压条法或地面压条法、分株、嫁(芽)接、微繁殖，匍匐茎或长匐茎、贮藏器官如鳞茎、球茎、块茎和根状茎、嵌条(striking)或插条、双鳞片)、有性繁殖(与另一株植物杂交)和无性繁殖(例如无融合生殖、体细胞杂交)。

如本文所用，转化意指将核苷酸序列以引起该序列稳定表达或瞬时表达的方式引入植物。单子叶植物细胞和双子叶植物细胞的转化和再生现在是例行技术，并且由实施者决定最适宜转化技术的选择。方法的选择将随待转化植物的类型变动；本领域技术人员将确认针对给定植物类型的特定方法的适宜性。合适的方法可以包括但不限于植物原生质体电穿孔法；脂质体介导的转化法；聚乙二醇(PEG)介导转化法；使用病毒转化；微量注射植物细胞；微抛射体轰击植物细胞；真空浸润法；和农杆菌介导转化法。

如本文所用，术语“同源的”或“基本上同一的”可以指超过85％同一的核苷酸序列。例如，基本上同一的核苷酸序列可以与参考序列85.5％；86％；87％；88％；89％；90％；91％；92％；93％；94％；95％；96％；97％；98％；99％或99.5％同一。探针也可以是与待检测标志物的精确副本(“DNA靶”)“可特异性杂交于”或“与之特异性互补”的核酸分子。“可特异性杂交”或“特异性互补”是表示互补程度如此大，从而核酸分子和DNA靶之间出现稳定和特异性结合的术语。核酸分子不必要与其靶序列100％互补以可特异性杂交。当存在足够的互补程度以避免核酸在想要特异性结合时，例如，在严格杂交条件，优选地高严格性条件下与非靶序列非特异性结合，则核酸分子是可特异性杂交的。

“严格杂交条件”可以用来鉴定与给定的核苷酸序列同源或基本上同一的核苷酸序列。严格条件是序列依赖的并且会在不同环境中不同。通常，将严格条件选择成在确定的离子强度和pH时比特定序列的热解链温度(T_m)低约5℃。T_m是(在确定的离子强度和pH下)这样的温度，在所述温度，50％的靶序列与完美匹配的探针杂交。一般地，选择其中盐浓度是在pH 7约0.02摩尔并且温度是至少60℃的严格条件。降低盐浓度和/或增加温度增加严格性。用于RNA-DNA杂交的严格条件(使用例如100nt的探针的RNA印迹)例如是包括至少一个在63℃于0.2X SSC中20分钟洗涤或等同条件洗涤的那些条件。

可以例如通过以下方式提供“高严格性条件”：在65℃于含有6x SSC(20x SSC含有3.0M NaCl，0.3M柠檬酸钠，pH 7.0)、5x Denhardt(100x Denhardt含有2％Ficoll、2％聚乙烯吡咯烷酮、2％牛血清白蛋白)、0.5％十二烷基硫酸钠(SDS)和作为非特异性竞争物的20μg/ml变性载体DNA(单链鱼精DNA，平均长度为120-3000个核苷酸)的水溶液中杂交。在杂交后，可以在几个步骤中进行高严格性洗涤，在杂交温度于0.2-0.1×SSC，0.1％SDS中进行最终洗涤(约30分钟)。

“中等严格性条件”指与上述溶液中但是在约60-62℃杂交等同的条件。中等严格性洗涤可以在杂交温度于1x SSC，0.1％SDS中进行。

“低严格性”指与上述溶液中在约50-52℃杂交等同的条件。低严格性洗涤可以在杂交温度于2x SSC，0.1％SDS中进行。还参见Sambrook等人(1989)和Sambrook和Russell(2001)。

出于本发明目的，两个相关核苷酸序列或氨基酸序列的“序列同一性”(表述为百分数)指两个最佳比对的序列中具有相同残基的位置的数目(x 100)除以比较的位置的数目。空位(即，比对结果中这样的位置，其中一个残基存在于一个序列中，但不存在于另一个序列中)视为具有不相同残基的位置。根据欧洲分子生物学开放软件包(The EuropeanMolecular Biology Open Software Suite)(EMBOSS，Rice等人，2000，Trends inGenetics 16(6)：276-277；例如参见http：//www.ebi.ac.uk/emboss/align/index.html)中的Needleman和Wunsch总体比对算法(Needleman和Wunsch，1970，J Mol Biol 48(3)：443-53)，使用默认设置(空位开放罚分＝10(用于核苷酸)/10(用于蛋白质)和空位延伸罚分＝0.5(用于核苷酸)/0.5(用于蛋白质))，通过在整个长度范围内比对两个序列，找到这两个序列的“最佳比对”。对于核苷酸，所用的默认计分矩阵是EDNAFULL，并且对于蛋白质，默认计分矩阵是EBLOSUM62。应当清楚，每逢RNA分子的核苷酸序列通过参照相应DNA分子的核苷酸序列定义时，该核苷酸序列中的胸腺嘧啶(T)都应当被替换为尿嘧啶(U)。是否指DNA分子或RNA分子将从本申请的上下文中显而易见。

如本文所用，“包含”应解释为特指存在如所提到的特征、整数、步骤或组分，但是不排除存在或附加一种或多种特征、整数、步骤或组分或它们的群组。因此，例如，包含一个核苷酸序列或氨基酸序列的核酸或蛋白质可以包含比实际所引述更多的核苷酸或氨基酸，即，包含于更大的核酸或蛋白质中。包含以结构方式或功能方式定义的核酸的嵌合基因可以包含额外的DNA区域等。

除非在实施例中另外指出，否则全部重组DNA技术均按照Sambrook等人(1989)Molecular Cloning：A Laboratory Manual，第2版，Cold Spring Harbor LaboratoryPress，NY和Ausubel等人(1994)Current Protocols in Molecular Biology，CurrentProtocols，USA的第1和第2卷中所述的标准方案实施。在BIOS Scientific PublicationsLtd(UK)和Blackwell Scientific Publications，UK联合出版的Plant MolecularBiology Labfax(1993)(R.D.D.Croy)中描述了用于植物分子操作的标准材料和方法。用于标准分子生物学技术的其他参考文献包括Sambrook和Russell(2001)Molecular Cloning：A Laboratory Manual，第3版，Cold Spring Harbor Laboratory Press，NY；Brown(1998)Molecular Biology LabFax第I卷和第II卷，第2版，Academic Press(UK)。可以在Dieffenbach和Dveksler(1995)PCR Primer：A Laboratory Manual，Cold Spring HarborLaboratory Press中并在McPherson等人(2000)PCR-Basics：From Background toBench，第1版，德国Springer Verlag中找到用于聚合酶链反应的标准材料和方法。

通过引用的方式完整并入本文中提及或援引的全部专利、专利申请和出版物或对公众公开(包括互联网上的出版物)。

在83千字节(大小如Microsoft 中所测量)、含有26个序列SEQ IDNO：1至SEQ ID NO：26并且名为“BCS16-2008-WO1_ST25”的文件中所含的序列表在此通过电子提交方式提交并且通过引用的方式并入本文。

本发明将参考本文所述的实施例进一步描述；然而，应当理解本发明不限于这类实施例。

SEQ ID NO.1-SEQ ID NO.14：标志物序列(参见表1和表2)

SEQ ID NO.15：含有Rf3-PPR的重叠群

SEQ ID NO.16：编码序列Rf3-PPR

SEQ ID NO.17：氨基酸序列Rf3-PPR

SEQ ID NO.18：手动注释的mRNA Rf-PPR3

Nt 1.64：5’UTR

Nt 65-2437：CDS

Nt 2438.3438：3’UTR

SEQ ID NO.19：手动注释的编码序列Rf3-PPR

SEQ ID NO.20：手动注释的氨基酸序列Rf3-PPR

SEQ ID NO.21：基因组序列Rf3-PPR

Nt 4468.5470：3’UTR(互补序列)

Nt 5471.7843：CDS(互补序列)

Nt 7844-7907：5’UTR(互补序列)

SEQ ID NO.22：预测的RNA靶

SEQ ID NO.23：ORF256

Nt 84-857：CDS

SEQ ID NO.24：Fw引物

SEQ ID NO.25：Rev引物

SEQ ID NO.26：探针

实施例

实施例1：植物材料和遗传作图

使用携带提莫非维小麦CMS(CMS005)的雄性不育系和应答于提莫非维小麦CMS的雄性不育恢复系(提莫非维小麦/2＊Iowin//2＊Quivira，登录号PI583676，USDA美国小粒谷类作物保藏中心；http：//www.ars.usda.gov/Main/docs.htm？docid＝21891，也称作Dekalb 582M并且登记为US PVP 7400045，通过美国植物种质系统https：//npgsweb.ars-grin.gov/gringlobal/accessiondetail.aspx？id＝1478647可获得)作为亲本以产生F1后代。F1后代自交以产生F2群体。由281个个体组成的F2群体用于鉴定与恢复基因座连锁的标志物。建立具有总计2080个SNP标志物的遗传图并且它覆盖小麦基因组的全部染色体。染色体1B由150个SNP标志物描述。

实施例2：能育性分类和初级定位

根据套袋的主要穗部的结实率，对这个F2群体中276株植物进行表型分类。将套袋下无种子的植物分类为不育。具有结实率的植物分类为能育。图1详述了2个不同位置的F2数目/单个穗头上所结种子的量。2个位置中的41株和45株F2植物分类为不育。指出了2个位置中完全不育的F2植物。

使用2080SNP遗传图，使用Haley-Knott回归，实施QTL分析以测试涵盖全部标志物的结实率变异的影响。通过大于3的-log变换p值区分显著的标志物-性状关联。从而，描述了具有显著相关标志物(包括左侧翼标志物和右侧翼标志物(SEQ ID NO.2和SEQ IDNO.8))的区间。具有最高显著性并对恢复影响最大的标志物是SEQ ID NO.6的峰标志物(如下表1中用X表示)。使用以下标准，描述具有显著相关标志物的区间：显著性阈值在2.5，显著性降幅在1.5和峰间显著性降幅在2。依据左侧翼标志物和右侧翼标志物，这种描述将区间界定至1B的15.8cM(图2)。

表1：1B上区间中具有标志物-性状关联显著性和对恢复的效应量(以整个群体中高于平均结实率的种子数计)的标志物。

在两个位置对次生穗头使用结实率时和下一年在两个位置使用这个群体的F3后代的表型数据时，确认定位位置。

实施例3：1B中Rf区域的精细定位

为了进一步精细定位，基于表型和基因型，选择40个在QTL区域中杂合的F2个体。田间在2个位置培育总计2560株独立F3植物。对每株植物，测量套袋下主要穗部上的结实率。开发了额外的SNP测定法以增加QTL区间中的标志物密度。1B区域定位时使用了总计374个额外的SNP标志物。表2提供定位于该区域中的示例性SNP标志物。

使用基于F2和F3基因分型数据建立的染色体1B遗传图，使用R-QTL确定标志物-性状关联。每个位置处理总计1094名具有基因型数据和表型数据的个体。Rf基因座可以进一步界定至约1.25cM 1B的区域(沿染色体1B从6.8至8.05cM)。

表2：1B上精细定位区域中的示例性标志物。显著标志物(以x突出显示)是处于QTL支持区间中(LOD阈值＞3；距最高标志物降低2LOD)的标志物例子。最接近该峰的标志物以(v)标注。位于显著区间外部的其他标志物由‘左侧翼区’(上方)和‘右侧翼区’(下方)指示。

实施例4：精细图谱与鉴定的部分基因组序列和候选基因的整合

使用精细定位标志物的序列针对小麦中国春基因组序列的重叠群和支架进行Blast。应用严格BLAST和解析标准以定位部分基因组序列中的SNP，如序列同一性＞98％、比对长度158bp、命中于1B序列和非对齐突出端的额外标准。支架针对精细图谱(及额外的遗传图谱)排序。接下来，使用Fu.jii等人的基因家族分析，收集来自玉米、高粱属(Sorghum)、稻和短柄草属(Brachypodium)的三角状五肽重复序列蛋白质序列的Rf进化枝(PNAS，2011，上文，参见表S1)。总计43个蛋白质序列用于BLAST并且在精细作图的区间中鉴定到一个基因座。

含有PPR基因的支架作为SEQ ID NO.15给出。

因此，鉴定的PPR基因由SEQ ID NO.16(nt-编码序列)和17(aa)示出。

手动注释产生SEQ ID NO.18的mRNA序列，其中SEQ ID NO.19的编码序列编码SEQID NO.20的氨基酸序列。

实施例5-1B(F4)中Rf区域的进一步精细定位和计算机方式分析

将一组用于Rf3基因座精细定位的SNP标志物与适宜的参考基因组比对，以确定代表参考基因组上Rf3QTL区域的物理区域。这个QTL区域用来鉴定潜在候选基因和开发筛选BAC文库的额外标志物(参见下文)。使用从头计算基因注释程序(自有注释管线)以及通过比对从公共数据库可获得的小麦EST序列、小麦FL-cDNA序列、小麦基因模型和来自直向同源物种的已知恢复基因，对Rf3QTL区域进行结构性注释。使用Blast2GO和PLAZA软件程序并咨询已发表的文献实施QTL区域中基因的功能性注释。随后将这些候选基因基于其预测功能及其与已知Rf基因的同源性优先处理(Chen和Liu，2014；Dahan和Mireau，2013)。

将精细定位的遗传标志物定位到‘小麦中国春’参考基因组，确定了染色体1B上一个代表Rf3QTL区域的约1.3Mb区域。在‘小麦中国春’参考中，这个区域含有已鉴定的三角状五肽(PPR)基因。PPR蛋白是一个庞大的蛋白质家族，其特征在于拥有规范的、简并35个氨基酸重复基序并已经在其他作物中鉴定为参与能育性恢复。这主要借助涉及调节细胞毒性线粒体转录物加工和/或转录的机制进行(Dahan和Mireau，2013；Gaborieau等人，2016)(Chen和Liu，2014；Schmitzlinneweber和Small，2008)。能育性恢复型PPR(Rf-PPR)是一般以序列特异性方式结合单链RNA的P类PPR蛋白的成员(Barkan等人，2012；Binder等人，2013；Chen和Liu，2014；Gaborieau等人，2016；Schmitzlinneweber和Small，2008)。Rf3QTL区域中存在的PPR基因序列的序列比较显示它们与来自其他作物物种的已知P类Rf-PPR直向同源物聚类(数据未显示)。

实施例6-恢复系的BAC文库

与计算机方式分析(见上文)平行地，通过以下方式构建上述小麦恢复系的BAC文库(此后称作‘资源-5’)：用限制性酶消化高分子量‘资源-5’gDNA并将所得到的片段(插入物平均大小约80-130Kb)转化入大肠杆菌。精细定位的SNP标志物序列或从参考基因组上Rf3QTL区域开发的标志物随后用来设计PCR引物以筛选汇集的BAC克隆。一旦已经鉴定PCR阳性BAC汇集物，则来自汇集物的BAC个体化并用相同标志物再次筛选。PCR阳性的各个BAC随后接受BAC端测序，以确认完整性和存在筛选标志物序列。最后，使用PacBio技术，对验证的阳性BAC深度测序并且组装读段以产生BAC插入物的共有序列。随后将已测序的阳性BAC通过从头组装法或通过比照参考基因组组装法对齐或利用筛选标志物叠覆，以产生Rf3QTL区域的新‘资源-5’参考序列。随后对‘资源-5’Rf3 QTL参考序列进行结构和功能注释，以鉴定该区域内部相对于(非恢复)参考基因组所捕获的候选基因中基因内容和/或多态性的任何结构性变化和/或差异。

使用从精细定位标志物、参考基因组或分离的BAC序列开发的PCR标志物，筛选‘资源-5’BAC文库多次。随后叠覆十四个个体化的已测序BAC，以相对于‘小麦中国春’参考基因组，产生由一个约75Kb缺口相隔的一个约650Kb连续序列和一个121Kb额外的序列。这些重叠群代表Rf3QTL区域的独特‘资源-5’基因组序列并且发现它们捕获最初鉴定的Rf-PPR候选基因。

如图3A中所示，Rf3-PPR的基因结构相对简单，由一个单一外显子组成且无内含子。这种相对简单的基因结构似乎对Rf-PPR常见。

将‘资源.5’Rf3-PPR候选基因之一与‘小麦中国春’直向同源物比较，显示该序列高度保守并且在CDS中或在CDS上游和下游+/-3Kb无SNP。这表明所述恢复表型与Rf-PPR蛋白的结构差异不连锁。

SEQ ID NO.21代表Rf3-PPR基因的基因组DNA序列。

实施例7-PPR氨基酸序列的注释

已知的Rf-PPR是P类PPR蛋白的成员，并且每个蛋白质含有多达约30个PPR基序，其中每个基序包含35个氨基酸(Gaborieau等人，2016)。结构上，PPR蛋白由2个形成发夹的α-螺旋和一个超级沟组成，并且正是这个超级沟与RNA分子相互作用。各个PPR基序的氨基酸组成决定RNA识别哪个核苷酸，并且PPR基序的数目决定靶转录物上RNA序列的长度。这里，注释Rf3-PPR候选物以鉴定PPR基序和其他序列特征并且在图3B和C中总结结果。

Rf3-PPR由790个氨基酸组成并含有18个连续的35个氨基酸PPR基序和将该蛋白质靶向线粒体的预测转运肽(SEQ ID NO.20)。这与从稻克隆的Rf-1A基因的结构非常相似，其长度为791个氨基酸并含有16个PPR重复序列(Akagi等人，2004；Komori等人，2004)。

每个PPR基序由2个反平行螺旋组成，所述反平行螺旋形成与单链RNA分子相互作用的发夹结构。研究已经显示，识别代码的存在将重复序列内部特定氨基酸的身份和所研究PPR蛋白的靶RNA序列联系(Barkan等人，2012；Yagi等人，2013)。特别地，已经显示每个基序的第5位和第35位氨基酸的身份特别重要，并且在CMS背景下，特异性对特异性靶向赋予CMS的转录物为必需。基于Rf-PPR基序中位置5和35处氨基酸的身份，可以确定Rf3-PPR的预测靶转录物序列。遵循PPR代码(Melonek等人，2016，上文)，预测的RNA靶序列因此是5’-ACCUGUNCGUAYNYGCAU-3’(SEQ ID NO.22，还参见下表3)。

如图4中所示，预测的靶序列Rf3-PPR与嵌合线粒体ORF-256转录物(SEQ ID NO.23(已经提出其负责CMS表型(Hedgcoth等人，2002))的比对结果表示，位置129-146(序列ACTGCTTTCTATTTGCAC)处存在潜在的相互作用位点。

此处结果显示，Rf3-PPR潜在地结合负责CMS表型Rand的嵌合ORF256转录物，其中认为它通过以下方式发挥作用：通过降低相应RNA的稳定性或通过减少翻译，降低有害性ORF256的稳态水平(Binder等人，2013)。

表3：PPR基序和碱基识别-也参见图3。

实施例8-表达分析

mRNA

使用Sigma Spectrum植物总RNA试剂盒(Sigma-Aldrich)，从约70-100mgfw组织分离总RNA是，并且使用Qiagen无RNA酶的DNA酶套装(目录号79254)，移除任何gDNA污染物。用Agilent Expert BioAnalyser确定DNA浓度和完整性。使用来自衍生于‘资源-5’的F4-群体后代的个体，在四个发育阶段(幼叶、穗2.5-3.5cm、穗3.5.4.5cm、穗4.5-5.5cm和花药)进行组织采样。使用精细定位标志物对这些后代进行基因分型，进行能育性状的表型分型，并分类为非恢复（-/-)或Rf3杂合(Rf3/-)。每个组织类型每个基因型制备三个独立的生物学重复。

qRT-PCR分析

使用来自Clonetech的EcoMix dry试剂盒，将来自每个组织/Rf3基因型的mRNA转化成cDNA。设计基因特异性探针以使用TaqMan测定法定量基因表达水平，如表4中总结。测试并优化探针特异性和效率并且对如上文产生的cDNA样品实施表达分析。

表4-用于基因表达分析的TaqMan引物序列和探针序列。

基因身份	名称	类型	靶区域	序列5′--＞3′	SEQ ID NO.
						Rf3-PPR	Fw2	引物	1648..1671	TGATGGTGTTGGACCTGATAATGT	24
	Rev2	引物	互补序列(1696..1717)	CCAGTGGCCTGAAGAGGAATAT	25
							P2	探针	1673..1693	ACGTATAGTAGCCTCATCCAT	26

在选自针对Rf3基因座分离的f4精细定位后代的各个植物中，在四种不同组织中检查基因表达。幼叶、正在发育的穗2.5-3.5cm、正在发育的穗3.5-4.5cm、正在发育的穗4.5-5.5cm和花药。由于预计胞质雄性不育表型归因于产生无活力的花粉，故而Rf基因必须至少在花粉发育和减数分裂阶段期间表达。还预计Rf基因表达将在花粉发育早期阶段最高。

如图5中所示，显而易见，PPR基因的平均表达仅排他地与Rf3基因座的存在相关，并且在穗发育的3.5-4.5cm阶段也最高。

资源-5Rf3-PPR候选物在以CDS为中心的12Kb区域内不具有与非恢复的中国春小麦参照相关的任何SNP或多态性。但是，它位于恢复表型的QTL峰处/位于恢复表型的QTL峰附近，并且表达与活性Rf3基因座的存在正好相关。但是，Rf3-PPR确实在ATG起始5′的160.270bp区域具有多个预测的miRNA结合位点，并且充分记载了PPR特别受到sRNAs/miRNAs的调节(Xia等人，2013)。例如。在稻中，产生21nt sRNA的lncRNA的表达是白昼长的条件下花粉发育所必需的，并且改变二级lncRNA结构的单个SNP导致该lncRNA的启动子区域的甲基化增加、减少转录并导致发育中花药的成熟前程序性细胞死亡(Ding等人，2012)。类似地，Ding等人阐述了稻sRNA osa-smR5864m中的单一多态性是粳稻系(japonica line)和籼稻系(indica line)中花粉不育的常见原因(Ding等，2012)。Wei等人还鉴定了在大白菜(Chinese cabbage)中对花粉败育负有责任的miRNA(Wei等人，2015)，并且改变的miRNA表达与柚(pumello)中的雄性不育有关(Fang等人，2016)、与芦笋(asparagus)中的雄性不育有关(Chen等人，2016)、与棉花中的雄性不育有关(Wei等人，2013)。因此，表达可以通过影响转录物稳定性或转录的反式作用miRNA/sRNA来驱动。

实施例9候选基因验证

通过诱变

构建恢复系的诱变群体。基于测序，鉴定了在Rf候选PPR基因中具有失活突变的突变植物。对纯合突变植物及它们的野生型分离子筛选能育性恢复能力。具有突变的PPR基因的植物不再具有恢复能力，从而证实鉴定的候选PPR基因是有功能的Rf基因。

通过过量表达

在包含选择标志物(如bar基因)的T-DNA表达载体中，将候选PPR-Rf基因的编码序列克隆处于组成型泛素启动子控制下(例如来自玉米的pUbiZm)或处于组成型花椰菜花叶病毒启动子(p35S)控制下或处于春化相关的大麦启动子(pvrn1)控制下(或处于其天然启动子控制下)。根据本领域熟知的小麦转化方法，将所得到的载体转化入没有恢复能力的小麦系，如可转化品种Fielder(或小麦中国春)(参见例如Ishida等人Methods MolBiol.2015；1223：189-98)。通过对选择标志物基因的实时PCR确定转基因植物中转基因的拷贝数。包含、优选地以单拷贝包含候选PPR-Rf基因盒的已转化植物转移至温室。通过qRT-PCR测试叶组织中和正在发育的幼穗中转基因的表达。表达候选PPR-Rf基因的转基因T0植物作为雄性亲本与G型胞质雄性不育(“CMS”)小麦系杂交。这些杂交的F1后代含有G型细胞质并且显示部分或完全恢复雄性能育性，原因在于存在候选PPR Rf基因。

使用四种不同测定法，测试F1后代中恢复的水平。在第一种测定法中，使用针对合成的ORF256蛋白产生的多克隆抗体，在蛋白质印迹物上定量线粒体ORF256蛋白。有功能的候选PPR Rf基因的表达导致ORF256蛋白积累减少。在第二种测定法中，使用AmphaZ30装置定量花粉积累和花粉活力。有功能的候选PPR Rf基因表达导致数目较高的有活力花粉。在第三种测定法中，显微镜检查花药组织的完整性。有功能的候选PPR-Rf基因表达导致更好地保存有功能的绒毡层。在第四种测定法中，定量来自自我授粉的每穗结实率。有功能的候选PPR-Rf基因表达导致更高的每穗籽粒数。在全部试验中，来自非转基因Fielder植物与相同的G型胞质雄性不育(“CMS”)小麦系杂交的F1后代充当对照。

通过定向敲除

通过使用例如CAS-finder工具设计CRISPR介导基因编辑的向导RNA，其靶向候选PPR Rf基因的mRNA编码序列、优选地蛋白质编码序列，或候选PPR Rf基因的紧邻上游启动子序列。优选地，每个靶基因设计四个独特的或近乎独特的向导RNA。通过PEG介导的瞬时共递送适宜启动子控制下的gRNA表达载体连同相应核酸酶(例如Cas9或Cpf1)的表达载体，测试向导RNA向含有候选PPR-Rf目的基因的小麦恢复系的原生质体，优选地命名为提莫非维小麦/2＊Iowin//2＊Quivira，USDA登录号PI 583676的品系的原生质体的靶向效率。在递送向导RNA和核酸酶载体后，从原生质体提取基因组DNA。在PCR扩增后，通过测序评估靶向的候选PPR Rf基因序列的完整性。

一个或两个最有效的向导RNA用于也含有G型CMS细胞质的相同小麦恢复系中的稳定基因编辑。为此目的，使用例如粒子枪轰击法，将选定的向导RNA表达载体连同核酸酶表达模块和选择标志物基因一起引入从前文提到的小麦恢复系分离的胚。使用本领域技术人员已知的方法，再生显示选择剂抗性的转基因植物。通过PCR扩增和测序，鉴定含有基因打靶事件、优选地可能产生无功能候选RfPPR靶基因的小缺失的转基因T0植物。

含有G型CMS细胞质和可能含有、优选地以纯合态含有、但备选地以杂合态含有候选PPR-Rf基因功能性敲除的转基因T0植物作为雌性亲本与具有正常细胞质且无PPR-Rf基因的春小麦品系杂交。这些杂交的F1后代含有G型“CMS”细胞质并且50％(在杂合T0的情况下)或100％(在纯合T0的情况下)的F1后代将缺少功能形式的RfPPR靶基因。使用基因组PCR测定法，鉴定缺少功能性RfPPR靶基因的F1植物。F1植物显示因候选PPR Rf基因敲除所致的雄性能育性部分或完全丧失。

使用四个不同测定法，在缺少功能性形式的候选Rf PPR基因的F1后代中测试雄性能育性水平。在第一种测定法中，使用针对合成的ORF256蛋白产生的多克隆抗体，在蛋白质印迹物上定量线粒体ORF256蛋白。敲除有功能的候选PPR Rf基因导致ORF256蛋白积累增加。在第二种测定法中，使用AmphaZ30装置定量花粉积累和花粉活力。敲除有功能的候选PPR Rf基因导致数目较低的有活力花粉。在第三种测定法中，显微镜检查花药组织的完整性。敲除有功能的候选PPR Rf基因导致绒毡层层早期劣化。在第四种测定法中，定量源于自我授粉的每穗结实率。敲除有功能的候选PPR Rf基因导致每穗籽粒数降低。在全部试验中，来自未编辑的Rf植物与相同春小麦系杂交的F1后代充当对照。

参考文献

Akagi，H.，Nakamura，A.，Yokozeki-Misono，Y.，Inagaki，A.，Takahashi，H.，Mori，K.和Fujimura，T.(2004).稻Rf-1基因的定位克隆，Rf-1基因是一种BT型胞质雄性不育的恢复基因，其编码线粒体靶向PPR蛋白(Positional cloning of the rice Rf-1gene，arestorer of BT-type cytoplasmic male sterility that encodes a mitochondria-targeting PPR protein).Theor.Appl.Genet.108，1449-1457.

Barkan，A.，Rojas，M.，Fujii，S.，Yap，A.，Chong，Y.S.，Bond，C.S.和Small，I.(2012).用于通过三角状五肽重复序列的蛋白进行RNA识别的组合氨基酸代码(ACombinatorial Amino Acid Code for RNA Recognition by Pentatricopeptide RepeatProteins).PLoS Genet.8，e1002910.

Binder，S.，Stoll，K.和Stoll，B.(2013).P类三角状五肽重复序列的蛋白是植物线粒体转录物5′末端有效形成所必需的(P-class pentatricopeptide repeat proteinsare required for efficient 5′end formation of plant mitochondrialtranscripts).RNA Biol.10，1511-1519.

Chen，L.和Liu，Y.-G.(2014).作物雄性不育和育性恢复(Male Sterility andFertility Restoration in Crops).Annu.Rev.Plant Bio1.65，579-606.

Chen，J.，Zheng，Y.，Qin，L.，Wang，Y.，Chen，L.，He，Y.，Fei，Z.和Lu，G.(2016).在雄性和雌性芦笋中通过高通量测序和降解组分析鉴定miRNA及其靶标(Identification ofmiRNAs and their targets through high-throughput sequencing and degradomeanalysis in male and female Asparagus officinalis).BMC Plant Biol.16.80.

Dahan，J.和Mireau，H.(2013).高等植物中的Rf和Rf样PPR是PPR基因的快速进化亚类(The Rf and Rf-like PPR in higher plants，a fast-evolving subclass of PPRgenes).RNA Biol.10，1469-1476.

Ding，J.，Lu，Q.，Ouyang，Y.，Mao，H.，Zhang，P.，Yao，J.，Xu，C.，Li，X.，Xiao，J.和Zhang，Q.(2012).长链非编码RNA调节光周期敏感的雄性不育，这是杂交水稻的重要组分(Along noncoding RNA regulates photoperiod.sensitive male sterility，anessential component of hybrid rice).Proc.Natl.Acad.Sci.109，2654-2659.

Fang，Y.-N.，Zheng，B.-B.，Wang，L.，Yang，W.，Wu，X.-M.，Xu，Q.和Guo，W.-W.(2016).高通量测序和降解组分析揭示了miRNA及它们的靶标在雄性不育的胞质杂种柚(Citrus grandis)中的表达改变(High-throughput sequencing and degradomeanalysis reveal altered expression of miRNAs and their targets in a male-sterile cybrid pummelo(Citrus grandis)).BMC Genomics 17，591.

Gaborieau，L.，Brown，G.G.和Mireau，H.(2016).三角状五肽重复序列的基因进化为胞质雄性不育的恢复基因的倾向(The Propensity of Pentatricopeptide RepeatGenes to Evolve into Restorers of Cytoplasmic Male Sterility).Front.PlantSci.7.

Hedgcoth，C.，El-Shehawi，A.M.，Wei，P.，Clarkson，M.和Tamalis，D.(2002).具有提莫非维小麦线粒体的异质小麦中与胞质雄性不育相关的嵌合开放阅读框存在于几种小麦和山羊草属物种、大麦和黑麦中(A chimeric open reading flrame associated withcytoplasmic male sterility in alloplasmic wheat with Triticum timopheevimitochondria is present in several Triticum and Aegilops species，barley，andrye).Curr.Genet.41，357-366.

Komori，T.，Ohta，S.，Murai，N.，Takakura，Y.，Kuraya，Y.，Suzuki，S.，Hiei，Y.，Imaseki，H.和Nitta，N.(2004).在稻中基于绘图克隆育性恢复基因Rf-1(Map-basedcloning of a fertility restorer gene，Rf-1，in rice(Oryza sativa L.)).PlantJ.37.315-325.

Schmitzlinneweber，C.和Small，I.(2008).三角状五肽重复序列的蛋白质：用于细胞器基因表达的socket组(Pentatricopeptide repeat proteins：a socket set fororganelle gene expression).Trends Plant Sci.13，663-670.

Wei，M.，Wei，H.，Wu，M.，Song，M.，Zhang，J.，Yu，J.，Fan，S.和Yu，S.(2013).遗传雄性不育和野生型棉花的花药发育过程中miRNA的比较表达谱(Comparative expressionprofiling of miRNA during anther development in genetic male sterile and wildtype cotton).BMC Plant Biol.13，66.

Wei，X.，Zhang，X.，Yao，Q.，Yuan，Y.，Li，X.，Wei，F.，Zhao，Y.，Zhang，Q.，Wang，Z.，Jiang，W.等人(2015).通过对miRNA、降解组和转录组的高通量测序揭示Ogura-CMS大白菜中负责花粉败育的miRNA及其调控网络(The miRNAs and their regulatory networksresponsible for pollen abortion in Ogura-CMS Chinese cabbage revealed byhigh-throughput sequencing of miRNAs，degradomes，and transcriptomes).Front.Plant Sci.6.

Xia，R.，Meyers，B.C.，Liu，Z.，Beers，E.P.，Ye，S.和Liu，Z.(2013).来自miR390的MicroRNA超家族及其在真双子叶植物中继发性小干扰RNA生物发生中的作用(MicroRNASuperfamilies Descended from miR390and Their Roles in Secondary SmallInterfering RNA Biogenesis in Eudicots).Plant Cell Online 25.1555-1572.

Yagi，Y.，Hayashi，S.，Kobayashi，K.，Hirayama，T.和Nakamura，T.(2013).植物中参与细胞器RNA编辑的三角状五肽重复序列蛋白的RNA识别代码的阐述(Elucidation ofthe RNA Recognition Code for Pentatricopeptide Repeat Proteins Involved inOrganelle RNA Editing in Plants).PLoS ONE 8，e57286.

Claims

1.编码小麦G型胞质雄性不育的功能恢复基因等位体的核酸分子，其中所述功能恢复基因等位体定位至SEQ ID NO 15所示的支架。

2.根据权利要求1所述的核酸分子，其中所述功能恢复基因等位体是定位至所述支架的PPR基因的功能等位基因。

3.根据权利要求1或2所述的核酸，其中所述功能恢复基因等位体是由SEQ ID NO.19、SEQ ID NO.18或SEQ ID NO.16、SEQ ID NO.21编码的PPR基因的或SEQ ID NO.20或SEQ IDNO.17的多肽的功能等位基因。

4.根据权利要求1-3中任一项所述的核酸，其中所述功能恢复基因选自

a.包含与SEQ ID NO.19、SEQ ID NO 18、SEQ ID NO：16、SEQ ID NO.21具有至少85％序列同一性的核苷酸序列的核酸；

b.编码与SEQ ID NO.20或SEQ ID NO.17具有至少85％序列同一性的多肽的核酸。

5.根据权利要求1-4中任一项所述的核酸，其中所述功能恢复基因等位体编码能够与ORF256的mRNA结合、优选地与SEQ ID NO.23的nt 129-146结合的PPR蛋白。

6.根据权利要求1-5中任一项所述的核酸，其中所述功能恢复基因等位体从USDA登录号PI 583676可获得。

7.根据权利要求1-6中任一项所述的核酸，其中所述功能恢复基因等位体包含SEQ IDNO 19、SEQ ID NO 18、SEQ ID NO.16、SEQ ID NO 21的核苷酸序列或其中所述功能恢复基因等位体编码SEQ ID NO 20或SEQ ID NO.17的多肽。

8.多肽，其由权利要求1-7中任一项所述的核酸分子编码。

9.嵌合基因，其包含以下有效连接的元件：

a.植物可表达的启动子；

b.包含权利要求1-7中任一项所述核酸分子或编码权利要求8所述多肽的核酸；和任选地

c.在植物细胞中有功能的转录终止和聚腺苷酸化区，

其中所述有效连接的元件的至少之一相对于至少一个其他元件是异源的。

10.根据权利要求9所述的嵌合基因，其中所述启动子能够指导有效连接的核酸至少在(早期)花粉发育和减数分裂期间如在花药或更具体地绒毡层或正在发育的小孢子中表达。

11.禾谷类植物细胞或禾谷类植物或其种子，如小麦植物细胞或植物或其种子，包含权利要求1-7中任一项所述的核酸分子、权利要求8所述的多肽或权利要求9或10所述的嵌合基因，其中所述多肽、所述核酸或所述嵌合基因在每种情况下均相对于所述植物细胞或植物或种子是异源的。

12.根据权利要求11所述的植物细胞、植物或种子，其中权利要求8所述的多肽至少在(早期)花粉发育和减数分裂期间如在花药或更具体地绒毡层或正在发育的小孢子中表达。

13.根据权利要求11或12所述的植物细胞、植物或种子，其是杂交植物细胞、植物或种子。

14.用于产生禾谷类植物细胞或植物或其种子如小麦植物细胞或植物或其种子的方法，所述植物细胞或植物或其种子包含用于小麦G型胞质雄性不育的或用于增加禾谷类植物如小麦植物中小麦G型胞质雄性不育(“CMS”)恢复能力的功能恢复基因，所述方法包括步骤：向所述植物细胞或植物提供权利要求1-7中任一项所述的核酸分子或权利要求9或10所述的嵌合基因，其中所述提供包括转化、杂交、回交、基因组编辑或诱变。

15.用于产生禾谷类植物细胞或植物或其种子如小麦植物细胞或植物或其种子的方法，所述植物细胞或植物或其种子包含用于小麦G型胞质雄性不育的或用于增加禾谷类植物如小麦植物中小麦G型胞质雄性不育(“CMS”)恢复能力的功能恢复基因，所述方法包括步骤：在所述植物细胞或植物或种子中增加权利要求8所述多肽的表达。

16.将非恢复的禾谷类植物如小麦植物转化成用于小麦G型胞质雄性不育的或用于增加禾谷类植物如小麦植物中小麦G型胞质雄性不育(“CMS”)恢复能力的恢复植物的方法，所述方法包括步骤：修饰所述植物的基因组以包含权利要求1-7中任一项所述的核酸分子或权利要求9或10所述的嵌合基因，其中所述修饰包括转化、杂交、回交、基因组编辑或诱变。

17.将非恢复的禾谷类植物如小麦植物转化成用于小麦G型胞质雄性不育(“CMS”)的或用于增加禾谷类植物如小麦植物中小麦G型胞质雄性不育(“CMS”)恢复能力的恢复植物的方法，所述方法包括步骤：修.饰所述植物的基因组以增加所述植物中权利要求8所述多肽的表达。

18.禾谷类植物细胞或禾谷类植物或其种子，如小麦植物细胞或植物或其种子，其根据权利要求14-17中任一项所述的方法获得，优选地其中所述植物具有增加的小麦G型胞质雄性不育(“CMS”)恢复能力。

19.根据权利要求18所述的植物细胞、植物或种子，其是杂交植物细胞、植物或种子。

20.一种鉴定和/或选择包含小麦G型胞质雄性不育的功能恢复基因等位体的禾谷类(例如小麦)植物的方法，包括步骤：

a.在所述植物中鉴定或检测权利要求1-7中任一项所述的核酸、或权利要求8所述的多肽或权利要求9或10所述的嵌合基因的存在。

b.和任选地选择包含所述核酸或多肽或嵌合基因的所述植物。

21.根据权利要求20所述的方法，其中所述多肽至少在(早期)花粉发育和减数分裂期间如在花药或更具体地绒毡层或正在发育的小孢子中表达。

22.一种产生包含小麦G型胞质雄性不育的功能恢复基因等位体的禾谷类植物如小麦植物的方法，包括步骤：

a.将权利要求11、12或18中任一项所述的包含小麦G型胞质雄性不育的功能恢复基因的第一禾谷类植物如小麦植物与第二禾谷类植物杂交；

b.根据权利要求20或21所述的方法鉴定包含小麦G型胞质雄性不育的功能恢复基因等位体的后代植物。

23.一种产生包含小麦G型胞质雄性不育的功能恢复基因等位体的禾谷类植物如小麦植物的方法，包括步骤：

a.将权利要求11、12或18中任一项所述的对小麦G型胞质雄性不育的功能恢复基因纯合的第一禾谷类植物如小麦植物与第二禾谷类植物杂交；

b.获得后代植物，其中所述后代植物包含小麦G型胞质雄性不育的功能恢复基因等位体。

24.产生杂交种子的方法，包括步骤：

a.提供权利要求11、12或18中任一项所述的雄性禾谷类亲本植物，如小麦植物，所述植物包含小麦G型胞质雄性不育的所述功能恢复基因等位体，其中所述功能恢复基因等位体优选地以纯合形式存在；

b.提供作为G型胞质雄性不育禾谷类植物的雌性禾谷类亲本植物；

c.将所述雌性禾谷类亲本植物与所述雄性禾谷类亲本植物杂交；和任选地

d.收获种子。

25.根据权利要求1-7中任一项所述的核酸的用途，用于鉴定小麦G型胞质雄性不育的一个或多个其他功能恢复基因等位体。

26.根据权利要求1-7中任一项所述的核酸、根据权利要求8所述的多肽或根据权利要求9或10所述的嵌合基因的用途，用于鉴定包含小麦G型胞质雄性不育的所述功能恢复基因等位体的植物。

27.根据权利要求11、12或18中任一项所述的植物或通过根据权利要求14-17或23-24中任一项所述的方法获得的植物的用途，所述植物包含小麦G型胞质雄性不育的所述功能恢复基因，用于在G型胞质雄性不育禾谷类植物如小麦植物的后代中恢复能育性。

28.根据权利要求11、12或18中任一项所述的植物或通过权利要求14-17或23-24中任一项获得的植物的用途，所述植物包含小麦G型胞质雄性不育的所述功能恢复基因，用于产生杂交种子或杂交禾谷类植物的群体，如小麦种子或植物。