CN112218524B

CN112218524B - 高粱细胞质雄性不育标记和基因座

Info

Publication number: CN112218524B
Application number: CN201980036966.1A
Authority: CN
Inventors: S·R·基拉卡马里; D·A·赫塞尔; S·S·A·耶蒂; M·L·梅厄
Original assignee: Pioneer Hi Bred International Inc
Current assignee: Pioneer Hi Bred International Inc
Priority date: 2018-06-01
Filing date: 2019-05-30
Publication date: 2023-03-07
Anticipated expiration: 2039-05-30
Also published as: AU2019277364A1; US20220340982A1; MX2020012954A; US11384402B2; WO2019232112A1; BR112020024587A2; US20210207225A1; CN112218524A

Abstract

提供了用于鉴定和/或选择具有或不具有细胞质雄性不育性(CMS)性状的高粱植物或种质的各种方法和组合物。在某些实施例中，所述方法包括检测与CMS相关联的QTL之内的或与其连锁的一个或多个标记基因座的至少一个等位基因。在进一步的实施例中，所述方法包括将选择的高粱植物与轮回高粱亲本植物杂交，并用选择具有CMS的后代。

Description

高粱细胞质雄性不育标记和基因座

相关申请的交叉引用

本申请要求于2018年6月1日提交的美国临时申请号62/679,361的优先权，其全部内容通过引用并入本文。

技术领域

本公开涉及区分高粱细胞质雄性不育系统中的不育细胞质和可育细胞质的线粒体基因座，以及将其用于杂种育种的方法。

背景技术

天然细胞质雄性不育性(CMS)可用于商业化生产杂种高粱(双色高粱(Sorghumbicolor L.Moench))。已知的CMS系统使用3系育种系统，其包括不育雌性自交系(A系)、可育雌性维持系(B系)和能育性恢复雄性系(R系)。B和A系是遗传上几乎相同的近交系，唯一的实质性差异在于能育性/不育性状。B系是雄性不育A系的种子产生亲本，其用于与R系杂交以产生商业杂种。存在高粱CMS系统保持遗传纯度并改善生产率的需要。

发明内容

本发明提供了用于高粱CMS系统的方法和线粒体标记，以保持遗传纯度并改善种子生产的生产率。

在一个实施例中，本发明提供了一种选择具有细胞质雄性不育性(CMS)的高粱植物或种质的方法，包括：(a)在高粱植物或种质的组织中检测以下包含单倍型的标记，所述标记与和CMS相关联的定量性状基因座(QTL)连锁：

i.在位置32084具有C等位基因的标记SEQ ID NO：55；

ii在位置72950具有T等位基因的标记SEQ ID NO：59；

iii.在位置315577具有C等位基因的标记SEQ ID NO：61；

iv.在位置347518具有A等位基因的标记SEQ ID NO：62；和

v.在位置373170具有A等位基因的标记SEQ ID NO：63；并且

(b)选择包含步骤(a)中检测的与和CMS相关联的QTL连锁的标记的高粱植物或种质，从而选择具有CMS的植物或种质。所述方法可包括使用在位置32084具有C等位基因的标记SEQ ID NO：55。所述方法可包括使用在位置72950具有T等位基因的标记SEQ ID NO：59。所述方法可包括使用在位置315577具有C等位基因的标记SEQ ID NO：61。所述方法可包括使用在位置347518具有A等位基因的标记SEQ ID NO：62。所述方法可包括使用在位置373170具有A等位基因的标记SEQ ID NO：63。

在另一个实施例中，本发明包括用细胞质雄性不育性(CMS)渐渗高粱植物的方法，所述方法包括：(a)将具有CMS的高粱植物与不具有CMS的高粱植物杂交以产生后代高粱植物或种质的群体；(b)在来自步骤(a)的后代高粱植物或种质的群体的组织中检测以下包含单倍型的标记，所述标记与和CMS相关联的定量性状基因座(QTL)连锁：

i.在位置32084具有C等位基因的标记SEQ ID NO：55；

ii在位置72950具有T等位基因的标记SEQ ID NO：59；

iii.在位置315577具有C等位基因的标记SEQ ID NO：61；

iv.在位置347518具有A等位基因的标记SEQ ID NO：62；和

v.在位置373170具有A等位基因的标记SEQ ID NO：63；并且

(c)从后代高粱植物或种质的群体中选择一个或多个后代高粱植物或种质，其包含步骤(b)中检测的与和CMS相关联的QTL连锁的标记，从而选择一个或多个具有CMS的植物或种质。所述方法可包括使用在位置32084具有C等位基因的标记SEQ ID NO：55。所述方法可包括使用在位置72950具有T等位基因的标记SEQ ID NO：59。所述方法可包括使用在位置315577具有C等位基因的标记SEQ ID NO：61。所述方法可包括使用在位置347518具有A等位基因的标记SEQ ID NO：62。所述方法可包括使用在位置373170具有A等位基因的标记SEQID NO：63。

在另一个实施例中，本发明包括杂种高粱种子生产的方法，所述方法包括：(a)在高粱植物或种质的组织中检测以下包含单倍型的标记，所述标记与和CMS相关联的定量性状基因座(QTL)连锁：

i.在位置32084具有C等位基因的标记SEQ ID NO：55；

ii在位置72950具有T等位基因的标记SEQ ID NO：59；

iii.在位置315577具有C等位基因的标记SEQ ID NO：61；

iv.在位置347518具有A等位基因的标记SEQ ID NO：62；和

v.在位置373170具有A等位基因的标记SEQ ID NO：63；并且

(b)选择包含在步骤(a)中检测的与和CMS相关联的QTL连锁的标记的高粱植物或种质，从而选择具有CMS的植物或种质；(c)将步骤(b)中选择的高粱植物或种质与不具有CMS的高粱植物或种质以交替行种植；(d)用步骤(c)中种植的不具有CMS的植物的花粉对步骤(c)中选择的高粱植物或种质授粉；并且

从步骤(d)中授粉的高粱植物或种质中收获种子。所述方法可包括使用在位置32084具有C等位基因的标记SEQ ID NO：55。所述方法可包括使用在位置72950具有T等位基因的标记SEQ ID NO：59。所述方法可包括使用在位置315577具有C等位基因的标记SEQ ID NO：61。所述方法可包括使用在位置347518具有A等位基因的标记SEQ ID NO：62。所述方法可包括使用在位置373170具有A等位基因的标记SEQID NO：63。

以电子方式递交的序列表的引用

所述序列表的官方副本经由EFS-Web作为ASCII格式的序列表以电子方式提交，文件名为7779WOPCT_ST25.txt，产生于2019年5月20日，且具有44千字节大小，并且与本说明书同时提交。包括在该ASCII格式的文件中的序列表是本说明书的一部分并且以其全文通过引用并入本文。

描述

本发明解决了高粱CMS系统的实际实施中的两个主要挑战；两者都与保持纯度和提高生产率有关。首先，在支持开发纯雌性(雄性不育)自交A系的育种中、以及在育种选择和种质鉴定和改良中，并且其次是在商业杂交种子生产中。

为了在CMS育种系统中使用，应对B系进行绝育处理，以产生无法自花授粉的雄性不育A系，并使来自雄性可育(R)系的花粉授粉。此过程需要重复回交以恢复轮回亲本核基因组，同时保持不育(线粒体)细胞质。回交的选择可以通过表型分析来完成-目视检查以确保不育(A)系不脱落花粉。有时，在回交过程中，由于污染(由于异型杂交)和环境因素(例如温度)，不育可能会变得部分或完全消失，这可能导致遗传杂质，并且最终导致品系的弃用。但是由于不能通过表型分析鉴定这种污染直到开花期，因此在育种过程中也会产生效率低下，例如由于部分不育或没有如期望的不育而最终将被丢弃的生长材料。另外，检查以确认不育的视觉过程需要遍历地块，这需要人工和时间，并且容易出错，这可能导致部分可育雌性在筛选过程中被遗漏。

鉴定和定量A-B污染的程度对于以下是有用的：确保成功的不育，管理研究中‘育种前’/基础和优良近交种子的纯度以及在商业CMS种子繁殖和杂种生产中丢弃受污染的种子批次。在本发明之前，没有实验室工具或技术来支持对高粱CMS系统的这些潜在改善。

CMS是由线粒体基因组组成方面的差异导致。在一个方面，本发明鉴定了一组线粒体DNA序列多态性，其可靠地将可育B系与不育A系区分开。本发明的另一方面提供了使用这些多态性对线粒体进行基因分型以使用叶或种子样品以高通量方式鉴定B对A系污染的实验室方法。该发现通过直接具有与不育细胞质紧密相关的标记而有助于解决上述问题。跨大量种质，这些标记似乎很稳健，而且具有很高的信息价值。这样的发现消除了确定不育与可育的很多主观任务，并提供了可以直接并入到育种过程中的独立答案。

此外，与不育细胞质相关的一种或多种标记可根据材料类型实现系的区分，以及我们的恢复系携带雄性不育细胞质的程度(这是种质表征的重要部分)的鉴定。它还使我们能够轻松鉴定引入程序的新种质的材料类型，而无需进行实验和进行能育性反应。最后，具有能够区分可育雌性(B系)和不育雌性(A系)的标记可以实现在没有遗传标记情况下很难实现的生产纯净优质种子的目标，所述种子可以传递给种子供应商和客户。到目前为止，通过目视检查在特定系的大型实验中生长的数千种植物的花穗，完成了纯度与不育性存在或不存在的相关。现在，可以通过在大田种植不同种子批之前对其进行采样并在基因型水平上对它们进行不育筛选来简化纯度评估，而不是在大田进行最昂贵的表型评估。

应当理解，此公开不限于特定实施例，这些实施例当然可以变化。还应当理解，本文使用的术语仅用于描述特定实施例，而不旨在是限制性的。

定义

在本公开中，使用了许多术语和缩写。此公开和权利要求中使用的某些定义在下文提供。为了提供对本公开和权利要求的清晰一致的理解，包括在给出此类术语的范围内，除非另有明确说明，否则以下定义适用。

此外，本文中所列出的每篇参考文献的公开内容均全文以引用方式并入本文。

当在本说明书和所附权利要求中使用时，单数和单数形式的术语例如“一个/一种(a/an)”以及“该(the)”包括复数指代物，除非上下文中另外明确指明。因此，例如术语“植物(plant)、所述植物(the plant)、或一个植物(a plant)”也包括多个植物；也取决于上下文，使用的术语“植物”也可包括该植物遗传相似或相同的后代；使用的术语“核酸”实际上任选地包括该核酸分子的多个拷贝；同样地，术语“探针”任选地(并且通常)涵盖许多相似或相同的探针分子。

此外，如本文所用，将“包含”解释为明确说明存在提及的所述特征、整数、步骤或组分，但是不排除一种或多种特征、整数、步骤、组分或其组的存在或添加。因此，例如，包含一对寡核苷酸引物的试剂盒可以具有两对或更多对寡核苷酸引物。另外，术语“包含”旨在包括由术语“基本上由……组成”和“由……组成”涵盖的实施例。类似地，术语“基本上由……组成”旨在包括由术语“由……组成”涵盖的实施例。

“农学”、“农艺性状”、和“农艺性状表现”是指给定植物品种的性状(以及潜在遗传元件)，所述性状在生长期过程中有助于产量。个体农艺性状包括出苗活力、营养势、胁迫耐受性、疾病抗性或耐受性、昆虫抗性或耐受性、除草剂抗性、发生分枝、开花、种子形成、种子大小、种子密度、抗倒伏性、脱粒性等。

“等位基因”意指遗传序列的一个或多个可替代的形式的任一个。在二倍体细胞或生物体中，给定序列的两个等位基因典型地占据一对同源染色体上的对应的基因座。关于SNP标记，等位基因是指存在于单独的植物中的所述SNP基因座处的特定核苷酸碱基。如果等位基因与某种表型性状正相关，则该等位基因对该表型性状是“有利的”。如果等位基因与某种表型性状负相关，则该等位基因对该表型性状是“不利的”。

在核酸扩增的上下文中的术语“扩增”是任何借以产生所选择的核酸(或其转录形式)的一个或多个另外的拷贝的方法。“扩增子”是扩增的核酸，例如通过任何可用的扩增对模板核酸进行扩增所产生的核酸。

当用于提及标记、标记等位基因、和/或多态性和表型性状和/或单倍型时，术语“相关联的”或“相关联”是指标记基因座的给定等位基因的存在与表型性状和/或单倍型之间的任何统计学上显著的相关性，其可以是定性的或定量的。

“回交”是其中育种者将后代品种与亲本基因型之一杂交一次或多次的方法。

术语“染色体区段”是指存在于植物单一染色体上的基因组DNA的连续线性跨度。“染色体间隔”是指由特定侧翼标记基因座定义的染色体区段。

“栽培种”和“品种”同义地使用并是指一个物种(例如双色高粱(Sorghum bicolorL.))中的一组植物，这些植物共享某些遗传特性，将它们与该物种内的其他可能品种区分开。高粱栽培种是几代自花授粉后产生的自交系。高粱栽培种中的个体是同质的、在遗传上几乎相同的，其中大多数基因座处于纯合状态。

“优良种系”是农学上优越的品系，其从针对优异农艺性能的多个循环的育种和选择产生。许多优良种系是可获得的并且是高粱育种领域的技术人员已知的。

“优良种群”是可以用于代表给定作物物种(例如高粱)的农学上优越的基因型的现有技术水平的优良个体或品系的混合。

“杂种”是通过杂交至少两个遗传上不相似的亲本而获得的后代植物。

“基因型”是一个或多个基因座处的等位基因状态的描述。

“种质”意指包含生物体的遗传特性的物理基础的遗传物质。如本文所用，种质包括新植物可以从其生长的种子和活组织；或者，是可以将其培养为整个植物的另一个植物部分(如叶、茎、花粉或细胞)。种质资源提供植物育种者用于改良商业栽培种的遗传性状的来源。

如果个体在给定基因座处仅具有一种类型的等位基因(例如，二倍体个体在两个同源染色体中的每一个的基因座处具有同一等位基因的拷贝)，则该个体是“纯合的”。如果在给定基因座处存在超过一种等位基因类型(例如，具有两个不同等位基因中的各一个的一个拷贝的二倍体个体)，则该个体是“杂合的”。术语“同质性”指示群组的成员在一个或多个特定基因座具有相同的基因型。相反，术语“异质性”用于指示所述群组内的个体在一个或多个特定基因座处的基因型不同。

“渐渗”是指将基因、QTL、单倍型、标记谱、标记基因座、标记等位基因、性状或性状基因座从一个植物的基因组输入或引入另一个植物的基因组。

术语“标记”或“可检测的标记”是指能够检测的分子。可检测的标记还可以包括报告基因和猝灭剂的组合，例如用于FRET探针或TaqMan^TM探针中。术语“报告基因”是指能够显示可检测信号的物质或其部分，该信号可由猝灭剂抑制。报告基因的可检测信号例如是可检测范围内的荧光。术语“猝灭剂”是指能够遏制、减少、抑制等由报道基因产生的可检测信号的物质或其部分。如本文所用，术语“猝灭”和“荧光能量转移”是指当报告基因和猝灭剂紧密接近并且报告基因被能量源激发时的过程，其中激发态的相当部分能量非辐射地转移到猝灭剂，在那里它以非辐射方式消散或以与报告基因不同的发射波长发射。

“品系”或“品种”是一组具有相同亲本的个体，其通常在一定程度上是近交的，并且在大多数基因座处通常是纯合和同质的(同基因的或接近同基因的)。“亚系”是指遗传上不同于起源于相同祖先的其他类似近交系亚群的近交系亚群。传统上，通过以下来获得亚系：从F3到F5世代选择的单个高粱植物进行近交，直到在大多数或所有基因座上使残留的分离基因座“固定”或纯合。

“连锁”是指如果等位基因的传播是独立的，等位基因比偶然预期更频繁地共分离的倾向。典型地，连锁是指在相同染色体上的等位基因。遗传重组在整个基因组上以假定的随机频率发生。通过测量性状对或标记对之间的重组频率来构建遗传图谱。染色体上的性状或标记彼此越接近，则重组频率越低，且连锁程度越大。如果它们通常共分离，则本文认为性状或标记是连锁的。将每代1/100重组概率定义为1.0厘摩(1.0cM)的遗传图谱距离。

位于单条染色体区段上的遗传元件或基因是物理连锁的。在一些实施例中，两个基因座于非常近的距离，在减数分裂过程中同源染色体对之间的重组不会在这两个基因座之间高频率发生，例如使得连锁基因座有至少约90％的机会共分离，例如，91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.75％或更多的机会。位于染色体区段内的遗传元件也是“遗传连锁的”，通常在小于或等于50cM的遗传重组距离内，例如约49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、0.75、0.5、0.25cM或更少。即，单个染色体区段内的两个遗传元件在减数分裂期间以小于或等于约50％的频率重组，例如，约49％、48％、47％、46％、45％、44％、43％、42％、41％、40％、39％、38％、37％、36％、35％、34％、33％、32％、31％、30％、29％、28％、27％、26％、25％、24％、23％、22％、21％、20％、19％、18％、17％、16％、15％、14％、13％、12％、11％、10％、9％、8％、7％、6％、5％、4％、3％、2％、1％、0.75％、0.5％、0.25％或更小。“紧密连锁的”标记显示与给定标记的交叉频率为约10％或更小，例如，9％、8％、7％、6％、5％、4％、3％、2％、1％、0.75％、0.5％、0.25％或更小(给定的标记基因座在紧密连锁的标记基因座的约10cM之内，例如，在紧密连锁的标记基因座的9、8、7、6、5、4、3、2、1、0.75、0.5、0.25cM或更少之内)。换句话说，紧密连锁的标记基因座在至少约90％的时间共分离，例如，91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.75％或更多的时间。

如果遗传元件(例如标记)之间的间隔小于约5000万个核苷酸碱基(50Mb)，例如，50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、0.75、0.5、0.25Mb或更少，则可以认为其是“连锁的”。如果遗传元件之间的间隔小于约10Mb(例如，9、8、7、6、5、4、3、2、1、0.75、0.5、0.25Mb)，则可以认为其是“紧密连锁的”。

当提及两个遗传元件(例如有助于CMS的遗传元件和近端标记)之间的关系时，“偶联”相连锁表示以下状态，其中与CMS相关联的等位基因与相应的系标记基因座的有利等位基因在同一条染色体链上物理地相关联。在偶联阶段，两个有利的等位基因由继承该染色体链的后代一起继承。在“相斥”相连锁(“repulsion”phase linkage)中，目的基因座(例如，与CMS相关联的QTL或单倍型)处的有利等位基因与邻近的标记基因座处的不利等位基因物理上连锁，并且两个有利等位基因不被一起继承(即这两个基因座彼此“异相”)。

“连锁不平衡”是两个或更多个基因座处的等位基因的非随机关联，其中两个或更多个等位基因以比其各自频率预期的更高的频率一起出现。“连锁不平衡”也可以在未连锁的标记之间发生。它基于群体内的等位基因频率并受到连锁影响但不取决于连锁。

“连锁群”(LG)是指通常共同分离的性状或标记。连锁群通常对应于包含编码性状或标记的遗传物质的染色体区域。

“基因座”是DNA的确定区段。

“标记”或“分子标记”或“标记基因座”是用于表示足以独特于表征基因组上特定基因座的核酸或氨基酸序列的术语。任何可检测的多态性状都可以用作标记，只要它是差异地遗传并且表现出与目的表型性状的连锁不平衡。

“标记辅助选择”是指在一个植物或多个植物中选择所希望的性状的方法，其是通过检测来自所述植物的一种或多种核酸(其中所述核酸与所希望的性状连锁)，然后选择拥有那些一种或多种核酸的植物或种质。

“混合的经定义的植物群体”是指包含许多不同的植物科和系的植物群体。通常，经定义的植物群体对于目的表型表现出定量的变异性。“多个植物科”是指群体中相关植物的不同科。

“单倍型”是指特定植物基因组内存在于两个或更多个连锁标记基因座(例如在特定连锁群上的两个或更多个基因座)处的特定等位基因的组合。“CMS单倍型”是指鉴定CMS的特定来源的特定等位基因的组合。

术语“植物”包括指未成熟或成熟的完整植物，包括已从其中除去种子或谷粒或花药的植物。将产生植物的种子或胚胎也被认为是植物。

“植物部分”是指植物的任何部分或块，包括叶、茎、芽、根、根尖、花药、种子、谷粒、胚、花粉、胚珠、花、子叶、下胚轴、豆荚、花、枝条、秆(stalk)、组织、组织培养物、细胞等。

“多态性”是指两个相关核酸之间的改变或差异。“核苷酸多态性”是指当将两个核酸比对以得到最大对应性时，当与相关序列比较时，在一个序列中不同的核苷酸。

“多核苷酸”、“多核苷酸序列”、“核酸”、“核酸分子”、“核酸序列”、“核酸片段”和“寡核苷酸”在本文中可互换使用以表示单链或多链的核苷酸的聚合物，其任选地含有合成的、非天然的或改变的RNA或DNA核苷酸碱基。DNA多核苷酸可以由cDNA、基因组DNA、合成DNA或其混合物的一条或多条链组成。

“引物”是指当置于互补链的合成被聚合酶催化的条件下时，能够作为核酸合成或沿互补链复制的起始点的寡核苷酸。典型地，引物的长度为约10至30个核苷酸，但可以使用更长或更短的序列。能以双链形式提供引物，但更典型地使用单链形式。引物可进一步包含可检测的标记，例如5′末端标记。

“探针”是指与目的多核苷酸互补(但不一定完全互补)并通过与目的多核苷酸的至少一条链杂交形成双链体结构的寡核苷酸。典型地，探针的长度为从10至50个核苷酸的寡核苷酸，但可以使用更长或更短的序列。探针可进一步包含可检测的标记。

“数量性状基因座”或“QTL”是指控制数量性状的遗传元件。

“重组频率”是两个遗传基因座之间的杂交事件(重组)的频率。重组频率可以通过遵循减数分裂期间的标记和/或性状的分离来观察。

“抗性”和“改善的抗性”在本文可互换使用并且是抗性的任何类型的增加，或对易感性抵抗，或易感性的任何类型的减少。“抗性植物”或“抗性植物品种”不需要具有绝对或完全抗性。相反，“抗性植物”，“抗性植物品种”或具有“改善的抗性”的植物或植物品种将具有比可比较的敏感植物或品种更高的抗性或耐受水平。

“耐受”和“改善的耐受”在本文可互换使用并且是指对易感性的任何类型的耐受，或易感性的任何类型的减少。“耐受性植物”或“耐受性植物品种”不需要具有绝对或完全的耐受。相反，“耐受性植物”，“耐受性植物品种”或具有“改善的耐受”的植物或植物品种将具有比可比较的敏感植物或品种更高的耐受水平。

″自交″或″自花授粉″或″自体受精″是其中育种者将植物与其自身杂交的方法；例如，第二代杂种F2与其自身产生命名为F2：3的后代。

“SNP”或“单核苷酸多态性”是指当基因组序列中的单个核苷酸(A、T、C或G)被改变或可变时发生的序列变异。当将SNP定位到高粱基因组上的位点时，存在“SNP标记”。

术语“产量”指具有商业价值的特定植物产品每单位面积的生产力。例如，高粱产量一般以每季每英亩种子蒲式耳数或每公顷种子公吨数来测量。产量受遗传和环境因素二者的影响。

如本文所使用的，“分离的”或“纯化的”多核苷酸或多肽或其生物活性部分是基本上或本质上不含与如在其天然存在的环境中发现的多核苷酸或多肽正常相伴或相互作用的组分。典型地，“分离的”多核苷酸不含在从其衍生出该多核苷酸的生物体的基因组DNA中天然地在该多核苷酸侧翼的序列(即，位于该多核苷酸的5′和3′末端的序列)(最佳地是蛋白质编码序列)。例如，该分离的多核苷酸可以包含小于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸序列，在该多核苷酸从其衍生出的细胞的基因组DNA中，该核苷酸序列天然地位于该多核苷酸的侧翼。基本上不含细胞物质的多肽包括具有小于约30％、20％、10％、5％、或1％(以干重计)的污染蛋白质、培养基或其他化学组分的多肽的制剂。本文使用的标准重组DNA和分子克隆技术在本领域是已知的，并且在以下文献中进行了更全面的描述：Sambrook，J.，Fritsch，E.F.和Maniatis，T.，Molecular Cloning：A Laboratory Manual[分子克隆：实验室手册]；Cold Spring Harbor Laboratory Press：Cold Spring Harbor[冷泉港实验室出版社：冷泉港]，1989(以下称为“Sambrook”)。

生物序列总结

通过将来自30个系(15个A-B对)的全基因组测序数据与参考线粒体序列进行比对来鉴定SNP。Illumina全基因组鸟枪测序在30个系(15个A-B对)上进行，覆盖率为20X。通过这种深度的测序，我们预计细胞器DNA会污染核DNA，因此也能够获得线粒体的序列数据。对于SNP调用，将读段与从NCBI获得的登录号DQ984518的参考线粒体DNA进行比对。针对低丢失数据，过滤出已鉴定的SNP。设计了55个合适的KASPar标记，并用于对30个系进行基因分型。其中有五十个通过了QC，并且能够完美区分A和B系。为了鉴定仅起源于线粒体的SNP，将SNP序列(在SNP的任一侧200bp)针对高粱参考基因组(JGI Sbi v1)进行blast分析以选择不对齐的那些并设计

标记。这些在更广泛的A和B系(384个系)上进行了测试，性能最佳的标记被用于常规的商业基因分型。下面给出了一种适合鉴定具有CMS的种质的标记的引物和探针信息：

标记名称：SEQ ID NO.63

SEQ_名称：gi|115278525|ref|nc_008360.1|：373170

引物_F_SEQ：SEQ ID NO.263

引物_R_SEQ：SEQ ID NO.264

PROBE_1_SEQ：SEQ ID NO.265

PROBE_2_SEQ：SEQ ID NO.266

FULL_SEQUENCE：_SEQ ID NO.63

针对标记SEQ ID NO.63在物理位置373，170p处的相关联的SNP调用是“T”或“A”。“TT”建立了雄性可育表型，“AA”建立了如下的雄性不育表型。

表1.CMS标记的详细信息。

下面列出了设计和测试的全套标记序列：SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63和64。

等位基因检测方法

在本文所述的某些方面，选择具有CMS的高粱植物或高粱种质的方法包括检测步骤。尽管不旨在限于任何特定的实施例，但本文提供的是适用于本发明方法的示例性检测方法。例如，结合存档的表型信息分析高粱栽培种的序列数据库(例如，通过按基因型逐序列的方法产生的数据库)适合于鉴定包含在与CMS相关联的QTL内或与和CMS相关联的QTL连锁的合适标记。

在另一个实施例中，检测方法包括本文提供的至少一个标记基因座的DNA测序。如本文所用，“测序”是指用于确定DNA分子中核苷酸的顺序的测序方法。本领域已知的任何DNA测序方法可以用于本文提供的方法中。在本文提供的方法中有用的DNA测序方法的非限制性实施例包括下一代测序(NGS)技术，例如在Egan，A.N等人，(2012)American Journalof Botany[美国植物学期刊]99(2)：175-185中描述的；通过测序进行的基因分型(GBS)方法，例如在Elshire，R.J.等人，(2011)PLoS ONE[公共科学图书馆]6(5)：e19379中描述；分子倒置探针(MIP)基因分型，如例如在Hardenbol，P.等人，(2003)Nature Biotechnology[自然生物技术]21(6)：673-678中描述；或者通过全基因组重测序进行高通量基因分型，如实例在Huang，X等人，(2009)Genome Research[基因组研究]19：1068-1076中描述。以上参考文献的每个通过引用以其整体结合在此。

在其他方面，检测可以包含设计引物或探针，其与涵盖标记基因座的至少部分基因组DNA互补或部分互补并且能够在至少中等严格条件下与目的标记基因座特异性杂交。在这些方面，引物或探针任选地包含可检测标记。可以使用本领域任何合适的技术从植物材料中提取基因组DNA，例如通过Stacey和Isaac(Methods in Molecular Biology[分子生物学方法]，第28卷：Protocols for Nucleic Acid Analysis by Nonradioactive Probes[非放射性探针分析核酸的方案]，编辑：Isaac，胡马娜出版社公司(Humana Press Inc)，托托瓦市(Totowa)，新泽西(NJ)1994，第2章，第9-15页)描述的CTAB(十六烷基三乙基澳化铵，Sigma H5882)方法。检测可包含分离核酸、扩增涵盖标记基因座的基因组DNA或涵盖标记基因座的基因组DNA的部分、并检测所得的扩增标记扩增子。在一些实施例中，扩增包含将扩增引物或扩增引物对和任选的至少一种核酸探针与从高粱植物或高粱种质中分离的核酸混合，其中引物或引物对和任选的探针与涵盖标记基因座的至少部分基因组DNA是互补的或部分互补的，并且能够使用高粱核酸作为模板通过DNA聚合酶启动DNA聚合；以及在包含DNA聚合酶和模板核酸的DNA聚合反应中延伸引物或引物对，以产生至少一个扩增子，例如以下中任一个代表的扩增子SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、或64。在具体的实施例中，检测包含实时PCR分析。

在某些方面，提供了一种针对CMS选择高粱植物的方法，所述方法包括从高粱植物的遗传多样性群体提取基因组DNA，并将分离的多核苷酸与每个基因组DNA样品混合，其中所述多核苷酸能够与如本文表中所述的标记基因座的有利等位基因杂交。在另一个实施例中，多核苷酸能够与标记基因座的有利等位基因杂交，所述标记基因座选自由以下组成的组：SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64和其组合。在一个优选的实施例中，所述多核苷酸能够与标记基因座的有利等位基因杂交，所述标记基因座选自由以下组成的组：SEQ ID NO：51、52、53、54、55、56、57、58、59、60、61、62、63、64和其组合。在某些实施例中，分离的多核苷酸是引物或探针。在一个特定的实施例中，所述方法进一步包括检测一个或多个基因组样品中杂交的多核苷酸的存在，以作为具有用CMS的高粱植物或高粱种质的指示。在其他实施例中，将检测到杂交多核苷酸的存在的高粱植物或高粱种质与另一种高粱植物(例如轮回高粱亲本)杂交，以产生后代高粱种质的群体。在这样的实施例中，可以使用本文所述的检测方法，针对与CMS相关联的标记等位基因的存在，对后代高粱种质进行基因型分型。

在某些实施例中，提供了选择具有或不具有CMS的高粱植物的方法，所述方法包括从高粱植物的遗传多样性群体提取基因组DNA，并将分离的多核苷酸与每个基因组DNA样品混合，其中所述多核苷酸包含与选自由SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、和64组成的组的核酸序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％序列同一性的核酸序列，其前提是所述核酸序列包含与如本文表中所述的有利等位基因互补并与其杂交的核酸。在一个优选的实施例中，分离的多核苷酸能够与标记基因座SEQ ID NO：51、52、53、54、55、56、57、58、59、60、61、62、63或64杂交，并包含与由SEQ ID NO：51、52、53、54、55、56、57、58、59、60、61、62、63、或64表示的核酸序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％序列同一性的核酸序列。

在一些实施例中，使用合适的基于扩增的检测方法检测分子标记。典型的扩增方法包括各种基于聚合酶的复制方法，包括聚合酶链式反应(PCR)、连接酶介导的方法(如连接酶链式反应(LCR))和基于RNA聚合酶的扩增(如，通过转录)方法。在这些类型的方法中，核酸引物通常与多态性标记区侧翼的保守区杂交。在某些方法中，还使用与扩增区域结合的核酸探针。通常，用于制备寡核苷酸(包括引物和探针)的合成方法是本领域熟知的。例如，寡核苷酸可以例如使用可商购的自动合成仪(如描述在Needham-VanDevanter等人(1984)Nucl Acids Res[核酸研究]12：6159-6168中的)根据Beaucage和Caruthers(1981)Tetrahedron Letts[四面体通讯]22：1859-1862描述的固相亚磷酰胺三酯方法化学合成。寡核苷酸(包括修饰的寡核苷酸)也可以从本领域技术人员已知的各种商业来源订购。

应当理解，可以使用任何合适的方法设计合适的引物和探针。本发明并不旨在限于任何特定的引物、引物对或探针。例如，可以使用任何合适的软件程序，如

或引物3来设计引物。

这些引物不限于产生任何特定大小的扩增子。例如，用于扩增本文标记基因座和等位基因的引物不限于扩增相关基因座的整个区域。在一些实施例中，标记扩增产生长度为至少20个核苷酸、或者可替代地长度为至少50个核苷酸、或者可替代长度为至少100个核苷酸、或者可替代地长度为至少200个核苷酸、或者可替代地长度为至少300个核苷酸、或者可替代地长度为至少400个核苷酸、或者可替代地长度为至少500个核苷酸、或者可替代地长度为至少1000个核苷酸、或者可替代地长度至少2000个核苷酸或更多的扩增子。

PCR、RT-PCR、和LCR是用于扩增目的核酸(例如，those comprising标记基因座)的常用的扩增和扩增-检测方法，有助于检测标记。关于这些和其他扩增方法的使用的细节是本领域熟知的，并且可以在各种标准文本中找到。这些技术的细节也可以在许多参考文献中找到，如Mullis等人(1987)美国专利4,683,202；Arnheim和Levinson(1990)C&EN 36-47；Kwoh等人(1989)Proc Natl Acad Sci USA[美国国家科学院院刊]86：1173；Guatelli等人(1990)Proc Natl Acad Sci USA[美国国家科学院院刊]87：1874；Lomell等人(1989)JClin Chem[临床化学杂志]35：1826；Landegren等人(1988)Science[科学]241：1077-1080；Van Brunt(1990)Biotechnology[生物技术]8：291-294；Wu和Wallace(1989)Gene[基因]4：560；Barringer等人(1990)Gene[基因]89：117；以及Sooknanan和Malek(1995)Biotechnology[生物技术]13：563-564。

可以使用此类核酸扩增技术来扩增和/或检测目的核酸，如包含标记基因座的核酸。提供了用于扩增有用标记基因座的扩增引物和用于检测有用标记基因座或对等位基因进行基因分型(如SNP等位基因)的合适探针。实时扩增测定(包括MB或基于

的测定)尤其适用于检测SNP等位基因。在此类情况下，通常将探针设计成与包括SNP基因座的扩增子区域结合，其中针对每个可能的SNP等位基因设计一个等位基因特异性探针。例如，如果对于特定SNP基因座有两个已知的SNP等位基因“A”或“C”，则一个探针在SNP位置设计为具有“A”，而分开的探针设计为在SNP位置具有“C”。虽然探针通常除了在SNP位置之外彼此相同，但它们不必是。例如，两个等位基因特异性探针可以相对于彼此向上游或下游移动一个或多个碱基。然而，如果探针在其他方面不相同，则应将它们设计成使它们以大致相同的效率结合，这可以通过在限制探针化学性质的严格参数集下设计来实现。此外，典型地在每个不同的等位基因-特异性探针上应用不同的可检测的标记(例如不同的报告基因-猝灭剂对)以允许每个探针的差异检测。在某些实施例中，针对某个SNP基因座的每个等位基因-特异性探针的长度是13-18个核苷酸，在3′末端具有荧光猝灭剂双重标记，并且在5′末端具有6-FAM(6-羧基荧光素)或VIC(4，7，2′-三氯-7′-苯基-6-羧基荧光素)荧光团。

在某些实施例中，本文公开的方法中的检测步骤包括使用扩增引物的PCR检测，所述扩增引物用于扩增高粱基因组的与选自由SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、和64组成的组的核酸序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％的序列同一性的一个或多个基因组区域的至少一部分。在一个优选的实施例中，本文公开的方法中的检测步骤包括使用扩增引物的PCR检测，所述扩增引物用于使用包含选自由SEQ ID NO：215、216、219、220、223、224、227、228、231、232、235、236、239、240、243、244、247、248、251、252、255、256、259、260、263、264、267、268组成的组的核酸序列的核酸引物扩增高粱基因组的与选自由SEQ ID NO：51、52、53、54、55、56、57、58、59、60、61、62、63、和64组成的组的核酸序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％的序列同一性的一个或多个基因组区域的至少一部分。在一些方面，扩增步骤还包括使用能够与标记基因座的特异性等位基因杂交的等位基因特异性探针。例如，一种或多种探针(其包含选自由SEQ ID NO：217、218、221、222、225、226、229、230、233、234、237、238、241、242、245、246、249、250、253、254、257、258、261、262、265、266、269、270组成的组的核酸序列)可用于本方法中，用于检测与CMS或非CMS性状相关联的标记基因座的等位基因。在其他方面，提供了用于检测与本文所述的CMS相关联的任何标记基因座的多态性的引物或探针。在某些实施例中，引物或探针包含一个或多个选自由以下组成的组的核酸序列：SEQ ID NO：65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270。示例性引物和探针在本文的表中提供。

除了本文所述的引物和探针序列之外，技术人员将立即认识到也可以使用其他引物和探针序列。例如，可以使用给定引物任一侧的引物代替给定引物，只要引物可以扩增包括待检测等位基因的区域，针对其他标记基因座的探针和引物也可以。此外，将理解的是，用于检测的精确探针可以变化，例如，任何可以鉴定待检测的标记扩增子区域的探针都可以代替本文实施例提供的那些。此外，扩增引物和检测探针的构型当然可以变化。因此，组合物和方法不限于本文具体叙述的引物和探针。在其他实施例中，可以设计引物和探针以检测表中提供的基因组DNA序列中的SNP等位基因。

在某些实施例中，探针将具有可检测的标签。任何合适的标签都可以与探针一起使用。适用于核酸探针的可检测标记包括，例如，可通过光谱、放射性同位素、光化学、生物化学、免疫化学、电学、光学、或化学方法检测的任何组合物。有用的标签包括用于用标记的链霉抗生物素蛋白缀合物染色的生物素、磁珠、荧光染料、放射性标记、酶和比色标记。其他标签包括配体，其与用荧光团标记的抗体、化学发光剂、和酶结合。探针还可以构成放射性标记的PCR引物，其用于产生放射性标记的扩增子。用于标记核酸的标记策略及其相应的检测策略可以例如在Haugland(1996)Handbook of Fluorescent Probes and Research Chemicals[荧光探针和研究化学品手册]第六版，由分子探针公司(Molecular Probes，Inc.)(Eugene，OR)；或Haugland(2001)Handbook of Fluorescent Probes and Research Chemicals[荧光探针和研究化学品手册]第八版，由分子探针公司(Molecular Probes，Inc.)(Eugene，OR)。

可检测标记也可以包括报告基因-猝灭剂对，如在分子信标和

探针中使用的。报告基因可以是用合适的连接基团修饰的荧光有机染料用于连接寡核苷酸，例如末端3′碳或末端5′碳。猝灭剂也可以是有机染料，其可以是或可以不是荧光的。通常，无论猝灭剂是荧光的还是仅通过非辐射衰变从报告基因释放转移的能量，猝灭剂的吸收带应该至少基本上与报告基因的荧光发射带重叠以优化猝灭。非荧光猝灭剂或暗猝灭剂通常通过从激发的报告基因吸收能量起作用，但不会辐射释放能量。

可以根据已知的技术选择用于特定探针的合适的报告基因-猝灭剂对。例如在Berlman，Handbook of Fluorescence Spectra of Aromatic Molecules[芳香族分子的荧光光谱手册]，第2版，美国学术出版社(Academic Press)，纽约，1971(其内容通过引用结合在此)中列出并描述了荧光和暗猝灭剂及其相关的光学性质，其中可以选择例性报告基因-猝灭剂对。可以例如在Haugland(2001)Handbook of Fluorescent Probes and Research Chemicals[荧光探针和研究化学品手册]第八版，由分子探针公司(Molecular Probes，Inc.)(Eugene，OR)(其内容通过引用结合在此)中发现经由可以添加到本发明的寡核苷酸中的常见反应基团来修饰用于共价连接的报告基因和猝灭剂的实例。

在某些实施例中，报告基因-猝灭剂对选自包括荧光素和罗丹明染料的xanthene染料。这些化合物的许多合适形式可商购获得，在苯基上具有取代基，其可用作键合位点或用作附接寡核苷酸的键合官能团。用作报告基因的另一组有用的荧光化合物是萘基胺，其在α或β位具有氨基。这些萘基氨基化合物中包括1-二甲基氨基萘基-5磺酸酯、1-苯胺基-8-萘磺酸酯和2-对甲苯基-6-萘磺酸酯。其他染料包括3-苯基-7-异氰酸基香豆素；吖啶，例如9-异硫氰酸基吖啶；N-(p-(2-苯并噁唑基)苯基)马来酰亚胺；苯并噁二唑基；芪；芘等。在某些其他实施例中，报告基因和猝灭剂选自荧光素和罗丹明染料。这些染料和用于附接寡核苷酸的合适连接方法是本领域熟知的。

报告基因的合适的实例可以选自染料，如SYBR green、5-羧基荧光素(5-FAM^TM，从加利福尼亚州的福斯特市的应用生物系统公司(Applied Biosystems)可得)、6-羧基荧光素(6-FAM)、四氯-6-羧基荧光素(TET)、2，7-二甲氧基-4，5-二氯-6-羧基荧光素、六氯-6-羧基荧光素(HEX)、6-羧基-2′，4，7，7′-四氯荧光素(6-TET^TM，从应用生物系统公司(AppliedBiosystems)可得)、羧基-X-若丹明(ROX)、6-羧基-4′，5′-二氯-2′，7′-二甲氧基荧光素(6-JOE^TM，从应用生物系统公司(Applied Biosystems)可得)、VIC^TM染料产物(从分子探针公司(Molecular Probes，Inc.)可得)、NED^TM染料产物(从应用生物系统公司(AppliedBiosystems)可得)等。猝灭剂的合适的实例可以选自6-羧基-四甲基-若丹明、4-(4-二甲基氨基苯基偶氮)苯甲酸(DABYL)、四甲基若丹明(TAMRA)、BHQ-0^TM、BHQ-1T^M、BHQ-2^TM、和BHQ-3^TM(其每个从加利福尼亚州的诺瓦托市的生物搜索技术公司(Biosearch Technologies，Inc.)可得)、QSY-7^TM、QSY-9^TM、QSY-21T^M和QSY-35^TM(其每个分子探针公司(MolecularProbes，Inc.)可得)等。

在一个方面，例如进行使用分子信标或

探针，对本文描述的扩增混合物进行实时PCR或LCR。分子信标(MB)是在适当的杂交条件下自身杂交以形成茎和环结构的寡核苷酸。MB在寡核苷酸的末端具有标签和猝灭剂；因此，在允许分子内杂交的条件下，标签通常被猝灭剂猝灭(或至少改变其荧光)。在其中MB不显示分子内杂交的条件下(例如，当结合至靶核酸时，如至扩增期间扩增子的区域)，MB标签未被猝灭。关于制备和使用MB的标准方法的细节在文献中已经很好地建立，且MB可以从许多商业试剂来源获得。还参见例如Leone等人(1995)Nucl Acids Res[核酸研究]26：2150-2155；Tyagi和Kramer(1996)NatBiotechnol[自然生物技术]14：303-308；Blok和Kramer(1997)Mol Cell Probes[分子细胞探针]11：187-194；Hsuih等人(1997)J Clin Microbiol[临床化学杂志]34：501-507；Kostrikis等人(1998)Science[科学]279：1228-1229；Sokol等人(1998)Proc Natl AcadSci USA[美国国家科学院院刊]95：11538-11543；Tyagi等人(1998)Nat Biotechnol[自然生物技术]16：49-53；Bonnet等人(1999)Proc Natl Acad Sci USA[美国国家科学院院刊]96：6171-6176；Fang等人(1999)J Am Chem Soc[美国化学学会杂志]121：2921-2922；Marras等人(1999)Genet Anal Biomol Eng[遗传分析生物分子工程]14：151-156；和Vet等人(1999)Proc Natl Acad Sci USA[美国国家科学院院刊]96：6394-6399。关于MB构建和用途的另外的细节也可在以下专利文献中找到：例如美国专利号5,925,517；6,150,097；和6,037,130。

另一个实时检测方法是5′-核酸外切酶检测方法，也称为

测定，如列于美国专利号5,804,375；5,538,848；5,487,972；和5,210,015，其各自通过引用将其全部内容并入本文。在

测定中，在PCR期间使用修饰的探针(长度通常为10-30个核苷酸)，其将中间体结合到扩增引物对的两个成员上或之间。修饰的探针具有报告基因和猝灭剂，并被设计为产生可检测的信号以在PCR期间指示其与靶核酸序列杂交。只要报告基因和猝灭剂都在探针上，猝灭剂就会阻止报告基因发出可检测的信号。然而，当聚合酶在扩增过程中延伸引物时，聚合酶的固有5′至3′核酸酶活性降解探针，将报告基因与猝灭剂分离，并使可检测信号能发射。通常，在扩增循环期间产生的可检测信号的量与每个循环中产生的产物的量成比例。

众所周知，猝灭效率是报告基因和猝灭剂接近的强函数，即随着两个分子越来越近，猝灭效率增加。由于猝灭强烈取决于报告基因和猝灭剂的物理接近，报告基因和猝灭剂通常在彼此的几个核苷酸内(通常在彼此的30个核苷酸内、或在6到16个核苷酸内)附接到探针上。典型地，通过将报告基因-猝灭剂对的一个成员附接到探针的5′末端并将另一个成员附接到约6到16个核苷酸远处的核苷酸上(在一些情况下在探针的3′末端)实现这种分离。

在扩增/检测方法中也可以省略单独的检测探针，例如，通过进行实时扩增反应，该反应通过在并入产物中后修饰相关的扩增引物、将标记的核苷酸掺入扩增子中来检测产物形成，或通过监测(例如，通过荧光偏振)与未扩增的前体相比的扩增子的分子旋转性质的变化。

不使用与两种引物中间结合的单独探针的合适的实时检测技术的一个实施例是KASPar检测系统/方法，其是本领域熟知的。在KASPar中，设计两个等位基因特异性引物，使得每个引物的3’核苷酸与多态性碱基杂交。例如，如果SNP是A/C多态性，其中一个引物在3′位置具有“A”，而另一个引物在3′位置具有“C”。这两个等位基因特异性引物中的每一个在引物的5′末端也具有独特的尾部序列。使用常见的反向引物，其连同两个等位基因特异性引物中的任一个一起扩增。两个5’氟标记的报告基因寡核苷酸也包括在反应混合物中，一个设计用于与等位基因特异性引物的每个独特尾部序列相互作用。最后，对于两个报告基因寡核苷酸中的每一个包括一个猝灭剂寡核苷酸，猝灭剂寡核苷酸与报告基因寡核苷酸互补并且当与报告基因寡核苷酸结合时能够猝灭荧光信号。在PCR期间，等位基因特异性引物和反向引物与互补DNA结合，这允许发生扩增子的扩增。在随后的循环期间，产生含有与等位基因特异性引物的独特尾部序列互补的序列的互补核酸链。在另外的循环中，报告基因寡核苷酸与此互补尾部序列相互作用，充当标记的引物。因此，由PCR的此循环产生的产物是荧光标记的核酸链。因为并入此扩增产物中的标记对导致扩增的等位基因特异性引物是特异性的，所以检测呈递信号的特异性荧光可用于确定样品中存在的SNP等位基因。

此外，应当理解，扩增不是标记检测的要求-例如，可以简单地通过对基因组DNA的样品进行DNA印迹来直接检测未扩增的基因组DNA。用于进行DNA印迹、扩增(例如PCR、LCR等)、和许多其他核酸检测方法的程序已经良好建立并且例如在以下中教导：Sambrook；Current Protocols in Molecular Biology[分子生物学实验指南]，F.M.Ausubel等人编辑，实验指南公司(Current Protocols)是格林出版公司(Greene PublishingAssociates，Inc.)与约翰威立父子公司(John Wiley&Sons，Inc.)的合资企业(由2002年补充)(“Ausubel”)；和PCR Protocols A Guide to Methods and Applications[PCR方案方法和应用指南](Innis等人编辑)学术出版社有限公司(Academic Press Inc.)圣地亚哥，CA(1990)(“Innis”)。关于植物中核酸的检测的另外的细节可以在以下中找到：例如在Plant Molecular Biology[植物分子生物学](1993)Croy(编辑)BIOS科学出版社(BIOSScientific Publishers，Inc.)。

也可以使用检测SNP的其他技术，如等位基因特异性杂交(ASH)或核酸测序技术。ASH技术基于短的单链寡核苷酸探针与完全互补的单链靶核酸的稳定退火。经由附接至探针的同位素或非同位素标记进行检测。对于每种多态性，设计两种或更多种不同的ASH探针以除了在多态性核苷酸处以外具有相同的DNA序列。每个探针与一个等位基因序列具有精确的同源性，因此探针的范围可以区分所有已知的可替代的等位基因序列。每个探针与靶DNA杂交。在适当的探针设计和杂交条件下，探针与靶DNA之间的单碱基错配将阻止杂交。

分离的多核苷酸或其片段(例如引物和/或探针)能够在适当的条件下与其他核酸分子特异性杂交。在一些实施例中，核酸分子包含本发明的任何标记基因座。应当理解，可以使用任何合适的方法设计合适的引物和探针。这不旨在限于任何特定的引物、引物对或探针。例如，可以使用任何合适的软件程序，如

或引物3来设计引物或探针。在一个实施例中，核酸分子包含任何以下中的任一个：SEQ ID NO：65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、其互补序列及其片段。在另一方面，本发明的核酸分子包括例如在高或低严格下杂交、基本上同源的序列或与这些分子同时具有两者的核酸分子。传统的严格条件由Sambrook以及由Haymes等人在以下中描述：Nucleic Acid Hybridization，A PracticalApproach[核酸杂交，一种实用方法]，IRL出版社(IRL Press)，华盛顿特区(Washington，D.C.)(1985)。因此，允许完全互补的偏离，只要此类偏离不完全排除分子形成双链结构的能力。为了使核酸分子用作引物或探针，其仅需要在序列上充分互补以能够在所用的特定溶剂和盐浓度下形成稳定的双链结构。促进DNA杂交的适当的严格条件是本领域技术人员已知的或可以在以下发现：Current Protocols in Molecular Biology[分子生物学实验指南]，约翰威立父子公司(John Wiley&Sons)，纽约，1989，6.3.1-6.3.6。

典型地，严格条件是以下条件，在这些条件下该盐浓度在pH 7.0至8.3时是小于约1.5M钠离子、典型为约0.01至约1.0M钠离子浓度(或其他盐)，并且对于短探针(例如，10至50个核苷酸)的温度为至少约30℃，而对于长探针(例如，超过50个核苷酸)的温度为至少约60℃。添加去稳定剂如甲酰胺也可以实现严格条件。示例性低严格条件包括在37℃使用30％至35％甲酰胺、1M NaC1、1％SDS(十二烷基硫酸钠)的缓冲溶液进行杂交，并且在50℃至55℃在1x至2xSSC(20xSSC＝3.0M NaCI/0.3M柠檬酸三钠)中洗涤。示例性中严格条件包括在37℃在40％至45％甲酰胺、1M NaC1、1％SDS中进行杂交，并且在55℃至60℃在0.5x至1xSSC中洗涤。示例性高严格条件包括在37℃在50％甲酰胺、1M NaC1、1％SDS中杂交，并且在60℃至65℃在0.1xSSC中洗涤。特异性典型地取决于杂交后洗涤的功能，关键因素是最终洗涤溶液的离子强度以及温度。对于DNA-DNA杂交物，热熔点(Tm)可以从Meinkoth等人Anal.Biochem.[分析生物化学]138：267-284(1984)的等式中进行估计：Tm＝81.5℃+16.6(log M)4-0.41(％GC)-0.61(％形式)-500/L；其中M为单价阳离子的摩尔浓度，％GC为DNA中乌苷和胞嘧啶核苷酸的百分比，％form为杂交溶液中甲酰胺的百分比，并且L为杂合体的碱基对长度。Tm是温度(在定义的离子强度以及pH下)，在该温度下50％的互补靶序列杂交到完全配对的探针上。对于每1％的错配，Tm降低约1℃；因此，可调整Tm、杂交和/或洗涤条件以与所期需同一性的序列杂交。例如，如果查找具有≥90％同一性的序列，该Tm可以降低10℃。通常，将严格条件选择为比特定序列及其互补序列在所限定的离子强度和pH下的T_m低约5℃。然而，极严格条件可以利用比Tm低1℃、2℃、3℃或4℃的杂交和/或洗涤；中等严格条件可以利用比Tm低6℃、7℃、8℃、9℃或10℃的杂交和/或洗涤；低严格条件可以利用比Tm低11℃、12℃、13℃、14℃、15℃或20℃的杂交和/或洗涤。使用方程、杂交和洗涤组合物以及所需的Tm，本领域普通技术人员将理解，本质上描述了杂交和/或洗涤溶液的严格性的变化。如果所希望的错配程度导致Tm小于45℃(水溶液)或32℃(甲酰胺溶液)，则优选增加SSC浓度以使得可使用较高温度。对核酸杂交的全面指导见于以下文献：Tijssen，LaboratoryTechniques in Biochemistry and Molecular Biology-Hybridization with NucleicAcid Probes[生物化学与分子生物学技术-与核酸探针的杂交]，第I部分，第2章“Overviewof principles of hybridization and the strategy of nucleic acid probe assays[杂交原理概述和核酸探针测定策略]”，爱思唯尔公司(Elsevier)，纽约(1993)；和CurrentProtocols in Molecular Biology[分子生物学实验指南]，第2章，Ausubel等人编辑，Greene Publishing and Wiley-Inter-science[格林出版与威利交叉科学出版社]，纽约(New York)(1995)。杂交和/或洗涤条件可以应用至少10、30、60、90、120、或240分钟。

在一些实施例中，本发明的核酸，例如引物和/或探针将在中等严格条件下与以下中所示的核酸分子中的一个或多个杂交：SEQ ID NO：66、67、69、70、72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94、96、97、99、100、102、103、105、106、108、109、111、112、114、115、117、118、120、121、123、124、126、127、129、130、132、133、135、136、138、139、141、142、144、145、147、148、150、151、153、154、156、157、159、160、162、163、165、166、168、169、171、172、174、175、177、178、180、181、183、184、186、187、189、190、192、193、195、196、198、199、201、202、204、205、207、208、210、211、213、214、217、218、221、222、225、226、229、230、233、234、237、238、241、242、245、246、249、250、253、254、257、258、261、262、265、266、269、270或其互补序列，或其片段。一方面，本发明的核酸将在高严格条件下与以下中的一个或多个特异性杂交：SEQ ID NO：66、67、69、70、72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94、96、97、99、100、102、103、105、106、108、109、111、112、114、115、117、118、120、121、123、124、126、127、129、130、132、133、135、136、138、139、141、142、144、145、147、148、150、151、153、154、156、157、159、160、162、163、165、166、168、169、171、172、174、175、177、178、180、181、183、184、186、187、189、190、192、193、195、196、198、199、201、202、204、205、207、208、210、211、213、214、217、218、221、222、225、226、229、230、233、234、237、238、241、242、245、246、249、250、253、254、257、258、261、262、265、266、269、270或任一个的互补序列或片段。

在一些实施例中，在与优选的生殖生长表型相关联的QTL之内的或与其连锁的标记基因座于包含以下中任一个的基因组区域内：SEQ ID NO：66、67、69、70、72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94、96、97、99、100、102、103、105、106、108、109、111、112、114、115、117、118、120、121、123、124、126、127、129、130、132、133、135、136、138、139、141、142、144、145、147、148、150、151、153、154、156、157、159、160、162、163、165、166、168、169、171、172、174、175、177、178、180、181、183、184、186、187、189、190、192、193、195、196、198、199、201、202、204、205、207、208、210、211、213、214、217、218、221、222、225、226、229、230、233、234、237、238、241、242、245、246、249、250、253、254、257、258、261、262、265、266、269、270。在其他实施例中，标记基因座于与SEQ ID NO：66、67、69、70、72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94、96、97、99、100、102、103、105、106、108、109、111、112、114、115、117、118、120、121、123、124、126、127、129、130、132、133、135、136、138、139、141、142、144、145、147、148、150、151、153、154、156、157、159、160、162、163、165、166、168、169、171、172、174、175、177、178、180、181、183、184、186、187、189、190、192、193、195、196、198、199、201、202、204、205、207、208、210、211、213、214、217、218、221、222、225、226、229、230、233、234、237、238、241、242、245、246、249、250、253、254、257、258、261、262、265、266、269、270或其互补序列或片段中任一个具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、或100％序列同一性的基因组区域内。除非另有说明，否则序列同一性百分比是使用用于核酸比对的GAP程序默认参数(Accelrys，圣地亚哥，加利福尼亚州，美国)确定。

在一些实施例中，提供了用于检测标记或单倍型和/或用于将标记或单倍型与所需表型(例如，CMS表型)相联系的试剂盒。因此，典型的试剂盒可包括一组标记探针和/或引物，其被配置为检测与CMS相关联的一个或多个标记基因座的至少一个有利等位基因或多态性。可以将这些探针或引物配置为，例如，使用任何可用的等位基因检测格式，例如基于固相或液相阵列的检测，基于微流体的样品检测等来检测本文表和实施例中所述的标记等位基因或多态性。试剂盒可进一步包括用于包装探针、引物或说明书的包装材料；对照，例如包含用于扩增的探针、引物和/或模板核酸的对照扩增反应；分子大小标记；等。

还提供了描述如何使用系统或试剂盒和/或使等位基因的存在与否与预测的优选或非优选表型相联系的系统或试剂盒说明书。例如，说明书可包括至少一个查找表，所述查找表包括与CMS相关联的一个或多个等位基因存在与否之间的相关性。说明书的精确形式可以根据系统的组分而变化，例如，它们可以作为系统软件存在于系统的一个或多个集成单元(例如，微处理器、计算机或计算机可读介质)中，或可以存在于可操作地偶联到检测器的一个或多个单元(例如，计算机或计算机可读介质)中。

MAS选择与渐渗

提供了基于对特定标记或目的单倍型的检测，进行标记辅助选择(MAS)以选择高粱植物或种质的用途。例如，在某些实施例中，将通过MAS选择具有某些预定的有利标记等位基因或单倍型的高粱植物或种质。使用MAS，可以针对与CMS正相关或负相关的标记或标记等位基因来选择高粱植物或种质，而实际上不培养高粱或针对CMS或其缺乏进行表型分型。MAS是选择所需表型和向高粱中渐渗所需性状(例如，向优良品系中渐渗所需性状)的强大工具。MAS易于适应高通量分子分析方法，所述方法可以针对目标标记快速筛选大量植物或种质遗传材料，并且比培养和观察植物的可见性状更具成本效益。

在其他方面，本文公开的关于标记基因座、标记等位基因、单倍型和/或标记谱的信息可用于帮助创建和/或选择高粱植物、高粱种质、高粱后代、高粱育种植物、系，以及具有或不具有CMS性状的群体。在一个优选的方面，利用与CMS来源相关联的标记可以选择具有或不具有CMS的高粱植物、高粱种质和高粱后代。换句话说，即使在单个标记基因座(例如本文表中描述的任何标记基因座)处对高粱植物进行基因分型足以检测具有或不具有CMS的高粱植物或高粱种质，以便将具有CMS分离高粱植物和高粱种质与不具有CMS的高粱植物和高粱种质分开。在一个实施例中，用于选择高粱植物和高粱种质的方法和试剂盒包括检测与CMS正相关或与其相关联的标记等位基因，其中所述标记基因座选自由以下组成的组：SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61，62、63、和64和其组合。因此，与以前的基因分型技术(其需要使用多个标记基因座来鉴定和/或选择具有或不具有CMS的高粱植物和高粱种质)相比，本发明的方法改善了通过MAS甚至从异质群体和/或来自不同高粱栽培种的高粱植物和高粱种质选择的效率和准确性。

在一个方面，提供了一种用于从遗传多样和/或异质高粱植物群体中选择具有或不具有CMS的高粱植物的方法。在一个实施例中，所述方法包括从遗传多样和/或异质群体中的每个高粱植物提取基因组DNA样品，并将第一分离的多核苷酸与每个基因组DNA样品混合，其中所述第一多核苷酸能够与选自由以下组成的组的标记基因座杂交：SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、及其组合。在这样的实施例中，在一个或多个基因组DNA样品中杂交的第一多核苷酸的检测指示具有或不具有CMS的高粱植物，然后选择所述高粱植物用于育种程序。在一个优选的实施例中，所述第一多核苷酸是探针；更优选地，它是等位基因特异性探针。另外，本公开的方法可用于选择具有CMS的后代植物，所述后代植物是从具有CMS的高粱植物与另一高粱植物(例如外来高粱植物品种、优良高粱植物品种等)之间的杂交产生。

提供了向非CMS高粱种质中渐渗CMS。可以使用本领域技术人员已知的将一种或多种标记基因座渐渗进入高粱植物中的任何方法。通常，提供包含衍生自特定标记基因座、单倍型、QTL或标记谱的CMS性状的第一高粱种质和缺少衍生自所述标记基因座、单倍型、QTL或标记谱的此类CMS的第二高粱种质。第一高粱种可以与第二高粱种杂交以提供后代高粱种质。筛选后代种质以确定衍生自所述标记基因座、单倍型、QTL或标记谱的CMS的存在并且选择针对衍生自所述标记基因座、单倍型、QTL或标记谱的CMS经测试阳性的后代作为高粱种质，其中已渐渗所述标记基因座、单倍型、QTL或标记谱。进行这种筛选的方法是本领域众所周知的，并且可以使用任何合适的方法。

MAS的一种应用是使用CMS标记、单倍型或标记谱，以提高旨在将CMS性状引入所需(通常为高产)背景的渐渗或回交工作的效率。在来自供体来源的特定标记的标记辅助回交中，例如，与优良遗传背景进行回交，选择回交后代中的供体性状，然后重复回交至优良系，以重构尽可能多的优良背景基因组。因此，这些标记和方法可用于指导MAS或高粱栽培种的育种，所述高粱栽培种具有与优异农艺性能(抗性、以及针对产量的任何可用标记、抗病性等)相关联的染色体区段的等位基因形式的所需互补序列(组)。可以经由渐渗，通过传统育种(或通过转化引入，或通过两者)，将任何公开的标记基因座、标记等位基因、单倍型、QTL或标记谱引入到高粱系中，以产生具有优异农艺性能的高粱植物。可以引入或存在于高粱植物中的与抗性相关联的等位基因的数量在1至本文公开的等位基因的数量的范围内，其每个整数都如同明确地叙述地并入本文。

这也提供了一种制备后代高粱植物和这些后代高粱植物自身的方法。所述方法包括将第一亲本高粱植物与第二高粱植物杂交，并在植物生长条件下使雌性高粱植物生长以产生高粱植物后代。杂交和使高粱植物生长的方法完全在本领域普通技术人员的能力范围内。可以测定此类高粱植物后代中与CMS相关联的等位基因，从而选择所需的后代。这样的后代植物或种子可以商业出售用于高粱生产，用于食品，被加工以获得所需的高粱成分，或进一步用于随后轮次的育种。第一或第二高粱植物中的至少一个是高粱植物，因为其包含标记基因座或标记谱中的至少一个，使得后代能够遗传所述标记基因座或标记谱。

遗传多样性对于任何育种计划中的长期遗传增益都很重要。在有限的多样性下，当所有有利等位基因都已固定在优良群体中时，遗传增益将最终稳定下来。一个目标是在不损失已经获得的遗传增益的情况下，以尽可能少的投资将多样性并入优良池。MAS提供的指示说明随着时间的推移，已选择并保留了来自原始祖先的哪些基因组区域和哪些有利的等位基因，从而有助于努力并入来自外来种质资源(与优良基因池无关的亲本)的有利变异，以希望发现目前在优良基因池中不存在的有利等位基因。

例如，标记、单倍型、引物、探针和标记谱可通过使分离后代经受MAS以维持主要的产量等位基因以及本文的抗性标记等位基因而用于涉及优良x外来高粱系的杂交中的MAS。

在一个实施例中，使用本文所述的方法和标记基因座鉴定和/或选择具有CMS的高粱植物或高粱种质。在这样的实施例中，将选择的高粱植物或高粱种质与另一种高粱植物，例如优良高粱植物或轮回高粱亲本杂交，以产生后代高粱种质群体，其中与CMS相关联的QTL渐渗到后代高粱种质亚群中。高粱后代种质的亚群可显示CMS。

实例

由于所使用的标记是线粒体DNA所特有的，因此以下实例中使用的粗DNA提取物预期具有低量的细胞器DNA污染，这可能会导致数据丢失。

实例1

在初步发现和设计CMS标记集之后，在更广泛的种质范围对这些标记进行了测试。使用与按材料类型(A系、B系、R系)分类的自交系来测试不育性关联。初步验证是在一组368个系上完成的，其中包括144个B系，91个杂种和133个R系。进行此初步验证主要是为了评估标记性能以及轻松分辨不同标记类别的能力。以3次重复对全集368个个体进行基因分型，并针对5种标记中的每一个和验证集中的每个材料类型评估重复之间的一致性(表2)。

所有5个标记的一致率极高，表明它们在每个重复中的表现几乎相同。在所有3个材料类型中具有最高一致性的两个标记是SEQ ID NO：62和SEQ ID NO：63(99.8％)。可以预期，在B系中，对于每个标记均具有相同的调用。除2个B系(1.4％)外，所有其他均是如此。这两个例外可能是基因分型错误，或者它们确实与纯度有关。鉴于重复之间具有如此高的一致性，这两个例外更可能与纯度有关，而不是与基因分型错误有关-在所有5个标记和全部3次重复中，相同的两个系与其他B系分离。由于信号低或无法区分基因型类别，所有5个标记在3次重复中的缺失数据也非常低(平均：％0.46)。SEQ ID NO：61的缺失百分比最高，为1.36％，SEQ ID NO：62的缺失百分比最低，为0.09％。总之，这个初步验证实例提供了很好的证据，证明标记性能很强。

表2.对于三次重复中的每个，验证集中存在的B系、杂种和R系之间的基因型调用频率和一致性。

基于所有重复中各个等位基因调用差异的数量

实例2

在初始轮验证之后，这证明了开发的标记集的稳健性和准确性，然后对CMS特异性种质集测试标记小组。该测试小组包括自交系集(A-B配对系)，其针对这些标记区分不育(A系)与可育(B系)材料类型的能力涵盖了先锋雌性育种池内的广泛多样性。总共播种了368个自交系(184个A-B对)，收集叶片样品，提取DNA，并使用通过初始标记验证的上述5个SNP进行测定。表3总结了这些标记的基因型调用、不同重复之间的一致性以及信息性。

测试的所有5个标记均能够完全分辨A系，这意味着标记成功检测不育细胞型的能力的错误率为0％。因此，在所有标记和所有重复中，A系具有单个可分辨的单倍型而没有异型。在B系中，平均错误率为2.2％，因此184个系中只有8个系的基因型实际上与A系分组(推断为不育细胞型)。这8个例外在所有标记和所有重复之间都是一致的。在仔细检查这8个B系后，它们中的50％具有以下基因型数据，所述基因型数据表明它们对于可育等位基因是纯合的，这说明提交该项目的B系纯度或库存发生问题。其余的4个例外尚未进行基因分型，但也可能与纯度有关，因为那里谱系与具有确认的可育细胞型指定的其他B系紧密重叠。对于所有标记而言，缺失数据再次非常低，在所有三次重复中平均为0.07％。综上所述，该数据提供了有力的证据，表明CMS标记集在区分雄性可育和雄性不育的细胞型方面既高度准确又具有很高的信息价值。

表3.对于三次重复中的每个，CMS验证集中存在184个A-B配对系的集的基因型调用频率和一致性。

“C”等位基因

是不育的

“T”等位基因

是不育的

“C”等位基因

是不育的

“A”等位基因

是不育的

“A”等位基因

是不育的

基于所有重复中各个等位基因调用差异的数量

实例3

高粱有几种不同类型的不育细胞质(命名为A1、A2、A3等)，其伴有它们自己的能够恢复其能育性的R系的集。一些R系恢复多种细胞型的能育性，而某些只能恢复一种。线粒体基因组中的核苷酸差异被认为是支持1种细胞型相比于另一种。因此，有可能在Al细胞型方面区分A系和B系的SNP在其他方面也是如此，但是给定的SNP也可能是特定细胞型所独有的。因此，测试了这些标记区分B系和由多种不同细胞型转化的其不育A系对应物的能力。该测试的结果示于表4。

筛选出的4个标记中的两个能够完全区分每个A系转化与其B系对应物-SEQ IDNO：59和SEQ ID NO：63，其中在Al细胞型测试中观察到的期望的等位基因(表3)。另一标记SEQ ID NO：55在区分A系和B系方面提供了信息，但是缺失数据很高(33％)。最终标记SEQID NO：62仅将A2、A4和A5型细胞型，而不将A3和A9与B系区分。该数据提供了另外的证据，即标记SEQ ID NO：59和SEQ ID NO：63能够区分不育和可育细胞质，此外，它们可跨独特细胞型起作用，使得从应用的育种角度看，它们甚至更具吸引力。

表4.4个CMS SNP区分B系的集和使用非Al细胞质来源转化的A系的能力。

EQV：可疑(不计分)

实例4

表现最出色的CMS标记SEQ ID NO：63包含在6个遗传纯度项目中。这些项目用于评估在亲本增加用于高级杂种测试之前种子源中的纯度水平并且是商业植物育种计划的正常组成部分。在将种子从研究转移到生产之前，必须认为种子是遗传纯的。表5显示了使用CMS标记对169个系进行的纯度测试的结果。

CMS标记在分离A与B系方面具有很高的信息价值。正如预期的那样，筛选出的99.7％以上的A系样品在CMS标记处有A/A调用。同样，超过99.6％的B系在此标记处有T/T调用。有12个A系例外和10个B系例外。经进一步检查后，两种材料类型分类中这些中的10个都对应于单一基线，表明可能的种子混入。对于此特定基线，A系的所有10个样品都具有T/T调用，而B系的所有10个样品都具有A/A调用，并且这是所有被筛选的系中唯一发生的情况。对进行采样的大田实验的调查鉴定了上传源信息中的错误。在雄性可育和雄性不育版本之间的条目列表中存在所切换，其直到后来才更新。因此，标记正确鉴定了此切换。这提供了该标记主要预期用途之一的出色实例，即遗传纯度测试。除了这20个例外，在所有4，292个A系样品中只有2个另外的例外样品，而在2，670个B系样品中有零个例外样品。此外，在这些基因分型项目中，标记的性能非常出色，其中由于无法分离等位基因调用而丢失的数据少于0.5％。

表5.对于在6个基因分型项目中筛选的86个A系和83个B系的集，标记SEQ ID NO：63处的不育(A/A)和可育(T/T)调用数。

材料类型	系计数	A/A	T/T	EQV	％EQV
						A系	86	4,280	12	9	0.21％
B系	83	10	2,660	13	0.49％

Claims

1.一种选择具有细胞质雄性不育性(CMS)的高粱植物或高粱种质的方法，所述方法包括：

(a)在来自高粱植物或高粱种质的组织中检测以下包含单倍型的标记，所述标记与和CMS相关联的定量性状基因座(QTL)连锁：

(i)在位置32084处具有C等位基因的标记SEQ ID NO:55；

(ii)在位置72950处具有T等位基因的标记SEQ ID NO:59；

(iii)在位置315577处具有C等位基因的标记SEQ ID NO:61；

(iv)在位置347518处具有A等位基因的标记SEQ ID NO:62；和

(v)在位置373170处具有A等位基因的标记SEQ ID NO:63；

其中所述位置是相对于从NCBI获得的登录号DQ984518的参考线粒体DNA的物理位置；并且

(b)选择包含步骤(a)中检测的与和CMS相关联的QTL连锁的标记的高粱植物或高粱种质，由此选择具有CMS的植物或种质。

2.权利要求1的方法，其中与所述QTL连锁的所述标记是在位置32084处具有C等位基因的SEQ ID NO:55。

3.权利要求1的方法，其中与所述QTL连锁的所述标记是在位置72950处具有T等位基因的SEQ ID NO:59。

4.权利要求1的方法，其中与所述QTL连锁的所述标记是在位置315577处具有C等位基因的SEQ ID NO:61。

5.权利要求1的方法，其中与所述QTL连锁的所述标记是在位置347518处具有A等位基因的SEQ ID NO:62。

6.权利要求1的方法，其中与所述QTL连锁的所述标记是在位置373170处具有A等位基因的SEQ ID NO:63。

7.一种用细胞质雄性不育性(CMS)渐渗高粱植物的方法，所述方法包括：

(a)将具有CMS的高粱植物与不具有CMS的高粱植物杂交以产生后代高粱植物或高粱种质的群体；

(b)在来自步骤(a)的后代高粱植物或高粱种质的群体的组织中检测以下包含单倍型的标记，所述标记与和CMS相关联的定量性状基因座(QTL)连锁：

i.在位置32084处具有C等位基因的标记SEQ ID NO:55；

ii.在位置72950处具有T等位基因的标记SEQ ID NO:59；

iii.在位置315577处具有C等位基因的标记SEQ ID NO:61；

iv.在位置347518处具有A等位基因的标记SEQ ID NO:62；和

v.在位置373170处具有A等位基因的标记SEQ ID NO:63；

其中所述位置是相对于从NCBI获得的登录号DQ984518的参考线粒体DNA的物理位置；

(c)从所述后代高粱植物或高粱种质的群体选择一个或多个后代高粱植物或高粱种质，其包含步骤(b)中检测的与和CMS相关联的QTL连锁的标记，由此选择一个或多个具有CMS的植物或种质。

8.权利要求7的方法，其中与所述QTL连锁的所述标记是在位置32084具有C等位基因的SEQ ID NO:55。

9.权利要求7的方法，其中与所述QTL连锁的所述标记是在位置72950处具有T等位基因的SEQ ID NO:59。

10.权利要求7的方法，其中与所述QTL连锁的所述标记是在位置315577处具有C等位基因的SEQ ID NO:61。

11.权利要求7的方法，其中与所述QTL连锁的所述标记是在位置347518处具有A等位基因的SEQ ID NO:62。

12.权利要求7的方法，其中与所述QTL连锁的所述标记是在位置373170处具有A等位基因的SEQ ID NO:63。

13.一种杂交高粱种子生产方法，所述方法包括：

i.在位置32084处具有C等位基因的标记SEQ ID NO:55；

ii.在位置72950处具有T等位基因的标记SEQ ID NO:59；

iii.在位置315577处具有C等位基因的标记SEQ ID NO:61；

iv.在位置347518处具有A等位基因的标记SEQ ID NO:62；和

v.在位置373170处具有A等位基因的标记SEQ ID NO:63；

其中所述位置是相对于从NCBI获得的登录号DQ984518的参考线粒体DNA的物理位置，并且

(b)选择包含步骤(a)中检测的与和CMS相关联的QTL连锁的标记的高粱植物或高粱种质，由此选择具有CMS的植物或种质；

(c)将步骤(b)中选择的高粱植物或高粱种质与不具有CMS的高粱植物或高粱种质以交替行种植；

(d)用来自步骤(c)中种植的不具有CMS的植物的花粉对步骤(c)中选择的高粱植物或高粱种质授粉；并且

(e)从步骤(d)中授粉的高粱植物或高粱种质收获种子。

14.权利要求13的方法，其中与所述QTL连锁的所述标记是在位置32084处具有C等位基因的SEQ ID NO:55。

15.权利要求13的方法，其中与所述QTL连锁的所述标记是在位置72950处具有T等位基因的SEQ ID NO:59。

16.权利要求13的方法，其中与所述QTL连锁的所述标记是在位置315577处具有C等位基因的SEQ ID NO:61。

17.权利要求13的方法，其中与所述QTL连锁的所述标记是在位置347518处具有A等位基因的SEQ ID NO:62。

18.权利要求13的方法，其中与所述QTL连锁的所述标记是在位置373170处具有A等位基因的SEQ ID NO:63。