CN105052729B

CN105052729B - 一种基于受选择位点指数评估动植物品种育种潜力的方法

Info

Publication number: CN105052729B
Application number: CN201510551134.7A
Authority: CN
Inventors: 谢为博; 张启发; 练兴明; 王功伟
Original assignee: Huazhong Agricultural University
Current assignee: Huazhong Agricultural University
Priority date: 2015-08-31
Filing date: 2015-08-31
Publication date: 2017-12-22
Anticipated expiration: 2035-08-31
Also published as: CN105052729A

Abstract

本发明公开了一种基于受选择位点指数评估动植物品种育种潜力的方法及其应用，所述的方法包括以下步骤：1）获得同一物种大量品种的基因型数据；2）通过群体遗传分析将品种划分不同亚群；3）基于多种指标鉴定不同亚群之间的受选择区段；4）鉴定受选择区段上的受选择的单倍型；5）计算不同品种的受选择位点指数。受选择位点指数可用于评估动植物品种综合育种潜力。

Description

一种基于受选择位点指数评估动植物品种育种潜力的方法

技术领域

本发明属于动植物育种领域，具体涉及一种基于受选择位点评估动植物品种育种潜力的方法。

背景技术

育种是对原有品种中的遗传变异进行选择和重新组装，以获得目标性状改良的新品种的技术。长期育种实践中，众多的育种工作者为着相同或相似的育种目标而努力，对大量品种资源进行密集选择，并由此改变了有利基因型在品种群体中的频率分布，在基因组中留下了相关的“印迹”。因此，通过对大量品种的序列进行分析，可以鉴定出育种过程中受选择的位点，这些位点将能对进一步的品种改良提供指导。但是，如何将这些育种选择位点用于指导育种，尚未见相关报道。

发明内容

本发明的目的是提供一种基于受选择位点指数评估动植物品种育种潜力的方法，该方法是在鉴定育种过程中受选择区段的基础上，分析受选择单倍型，计算每个品种的受选择位点指数，并可结合基因组选择实现快速培育新品种或杂交组合的一种育种方法。

本发明的另一个目的是提供一种基于受选择位点指数评估动植物品种育种潜力的方法的应用，利用本发明所述的方法，可实现品种改良，杂交组合等育种目的。

为了达到上述目的，本发明采取以下技术措施：

一种基于受选择位点指数评估动植物品种育种潜力的方法，包括以下步骤：

步骤S1，获得同一物种大量品种的多态性位点的基因型数据，去除缺失值大于20％的位点；

步骤S2，对步骤S1获得的预处理数据进行群体遗传分析，划分亚群；即基于随机选择的基因组上均匀分布的位点，或基于连锁不平衡筛选独立的位点，或选择使用所有位点，使用基于最大似然法或贝叶斯方法的软件划分亚群；

步骤S3，对步骤S2获得的不同亚群，选择任意两个亚群，使用群体遗传学方法鉴定亚群间有差异的受选择区段；

步骤S4，对步骤S3获得的受选择区段，鉴定受选择的单倍型；即选择两个亚群后，再选一个差异最大的亚群作为外群，鉴定每个位点原始基因型和衍生基因型；外群中的主要基因型定义为原始基因型；对所选外群和两个亚群，筛选外群中原始基因型频率大于98％且衍生基因型在这两个亚群中频率差异最大的小于25％的位点。

具体根据不同物种的等位基因型频率及基因亚群间频率差异的分布来确定所需位点的百分数。

对所选两个亚群间的每个差异受选择区段，计算每个品种中属于衍生基因型位点的个数，所有品种中该数值最大值的一半确定为阈值；大于该阈值的品种认为在该区段具有受选择的单倍型。

步骤S5，对步骤S4获得的受选择单倍型，计算不同品种包含的具有受选择单倍型的受选择区段的数目，即受选择位点指数。

以上所述的步骤中：

步骤S2中的软件包括但不限于STRUCTURE和ADMIXTURE，所假定亚群的数目不小于3个，划分亚群的参数为最大亚群组分值与第二亚群组分值之间差异大于或等于0.4，小于0.4的品种视为中间型不归入任何亚群；

步骤S3中鉴定受选择区段的群体遗传学方法包括但不限于Fst、Tajima’s D、CLR、XP-CLR和XP-EHH；

本发明所述的受选择位点指数指得是：一个品种包含的具有受选择单倍型的受选择区段的数目。

以上所述的方法优选适用于水稻品种育种潜力的评估；

根据以上所述的方法，获得的籼稻品种中受选择区段为表1所示。

一种基于受选择位点指数评估动植物品种育种潜力的方法的应用，包括该方法可用于但不限于以下几种用途：

1.背景选择。当有若干材料能同时满足育种目标时，可优选具有较大受选择位点指数的材料。

2.品种改良。对于现有优良品种，可通过导入其不具有的受选择单倍型，使其具有更高的受选择位点指数。

3.杂交组合。如果两个亲本组合在一起包含更多的受选择单倍型，其杂种可能有更强的杂种优势。

4.新品种受选择位点指数的获得。获得大量的的受选择区段和受选择单倍型后，可以直接对新品种进行分析，计算受选择位点指数。具体而言包括以下步骤：

(1)通过SNP芯片或测序方法获得新品种基因型；(2)基于上述获得的受选择区段及区段内多态性位点的原始基因型及衍生基因型信息，判断不同受选择区段内是否具有受选择单倍型；(3)计算受选择位点指数。

以上技术可结合基因组选择育种实现快速培育新品种或杂交组合。

附图说明

图1为295个籼稻品种受选择位点指数的分布

具体实施方式

以下实施例用于说明本发明，但不用来限制本发明的范围。

实施例1：

计算水稻品种受选择位点指数

实验数据是1479份水稻品种，所有品种使用Illumina Hiseq2000进行了测序，通过数据预处理分析(详见Chen W,Gao Y,Xie W,Gong L,Lu K,Wang W,Li Y,Liu X,ZhangH,Dong H,Zhang W,Zhang L,Yu S,Wang G,Lian X,Luo J.Genome-wide associationanalyses provide genetic and biochemical insights into natural variation inrice metabolism.Nat Genet,2014,46: 714-721)，获得了6,551,358个高质量的SNP位点及其在不同品种中的基因型。此外，对其中的295份籼稻品种进行了三次田间实验，获得了产量数据。

本实施例以对籼稻的受选择位点指数为例，对本发明所述方法进行说明：

步骤S1，对基因型数据进行预处理，即去除缺失值大于20％的位点，得到6,428,770个 SNP位点；

步骤S2，对步骤S1获得的预处理数据随机挑选基因组均匀分布的188,637个SNP位点，使用ADMIXTURE软件进行群体遗传分析，划分为六个不同亚群；其中籼稻品种分为IndI和IndII两个亚群，正好分别对应中国南方血缘和东南亚血缘；

步骤S3，对步骤S2获得的IndI和IndII两个亚群，基于XP-CLR(-w1 0.0005 100100 1 -p1 0.7)鉴定两个亚群之间差异的受选择区段；共获得200个区段(表1)，占水稻基因组的7.8％；

表1.籼稻品种中受选择区段列表

表1中染色体受选择区段坐标基于日本晴(Nipponbare)基因组(序列版本Michigan State University，version 6.1， ftp://ftp.plantbiology.msu.edu/pub/data/Eukaryotic_Projects/o_sativa/annotation_dbs/pseudomole cules/version_6.1/all.dir/all.con.gz)。

步骤S4，对步骤S3获得的受选择区段，使用粳稻群作为外群(在6个亚群中，粳稻与籼稻差异最大)，筛选出2,161,733个SNP，其基因型在粳稻中基本固定(>98％)，且在籼稻中有差异(次要等位基因频率>5％)。计算这些SNP在IndI和IndII两个亚群中的衍生基因型的频率差异，有大约20.6％的位点(446,593个)频率差异大于0.3，其中16.7％的位点(74,724个)位于受选择区段。基于这74,724个位点，对于每个受选择区段，统计每个籼稻品种该区段包含多少衍生基因型位点，最大值的一半确定为阈值；大于该阈值的籼稻品种认为在该区段具有受选择单倍型；

步骤S5，对步骤S4获得的受选择单倍型，计算籼稻包含的具有受选择单倍型的受选择区段的数目，获得受选择位点指数。

295个籼稻品种的产量与受选择位点指数的对应关系如表2所示。

表2

图1显示有产量数据的295个籼稻品种的受选择位点指数分布。

实施例2：

籼稻品种受选择位点指数与产量数据显著相关

由于产量是水稻育种中最重要的目标，为检验本发明的实施效率，将多年多点产量数据与实施例1所得受选择位点指数作相关性分析。

表3显示籼稻品种受选择位点指数与产量数据具有很好的相关性。其中，最佳线性无偏预测法获得的产量育种值与受选择位点指数有着更显著的正相关。由于2011年和2012年武汉的产量数据的Spearman秩相关系数只有0.17，而2012年武汉和2012年陵水的产量数据的相关系数也只有0.14，因此品种受选择位点指数要比单次田间实验的产量数据更加可靠，能对进一步筛选育种材料起到参考作用。

表3.籼稻品种受选择位点指数与产量的相关性

相关系数和统计检验基于Spearman秩相关系数，正规化的平均值计算方法为每次田间实验的产量减去该次实验的平均值，最后不同批次实验的结果取平均值。BLUP育种值基于岭回归最佳线性无偏预测法，整合多年多点产量数据获得。

实施例3：

水稻重组自交系群体中受选择位点指数与产量显著相关

实验数据是由珍汕97和明恢63杂交构建得到的210份水稻重组自交系(RIL)材料及三次田间试验获得的产量数据(yd97x，yd98x，yd98h；该数据为公开数据，详见Hua J P,Xing Y Z,Xu C G,Sun X L,Yu S B,Zhang Q.Genetic dissection of an elite ricehybrid revealed that heterozygotes are not always advantageous forperformance.Genetics,2002,162:1885-1895； Xing Y Z,Tan Y F,Hua J P,Sun X L,XuC G,Zhang Q.Characterization of the main effects, epistatic effects and theirenvironmental interactions of QTLs on the genetic basis of yield traits inrice.Theor Appl Genet,2002,105:248-257)。所有材料使用Illumina GAIIx进行了测序，通过数据预处理分析，获得了包含1,619个重组区段(bin)的高精度重组图谱(bin map)。

亲本珍汕97(表2中的C145)和明恢63(表2中的C147)分别有84和102个受选择区段包含受选择单倍型，对应到bin map分别为156和177个bin。

根据RIL的bin来自于哪个亲本可推知每个RIL具有多少含受选择单倍型的bin，由于 bin的数目正比于受选择区段的数目，本实施例中使用含受选择单倍型的bin的数目代替品种受选择指数。210个RIL的产量与受选择位点指数的对应关系如表4所示。

表4

表5显示RIL材料中受选择位点指数与产量数据具有很好的相关性。其中，最佳线性无偏预测法获得的产量育种值与受选择位点指数有着更显著的正相关。该实例表明受选择位点指数可用于纯系品种的选育及育种潜力评估。

表5.重组自交系(RILs)及永久F₂(IMF₂)群体受选择位点指数与产量的相关性

实施例4：

水稻永久F₂群体中受选择位点指数与产量显著相关

实验数据是由实施例3所述重组自交系(RIL)材料相互间杂交产生的永久F₂群体(IMF₂) 278份材料及两次田间试验获得的产量数据(yd98，yd99)。

通过实施例3所述bin map可获知永久F₂材料的基因型。认定只要构建永久F₂材料的两个RIL的其中一个具有某个受选择单倍型，则该永久F₂材料也具有该受选择单倍型，按照实施例3的方法，可计算出每个永久F₂材料的受选择位点指数，278个F₂材料的产量与受选择位点指数的对应关系如表6所示。

表6

表5显示永久F₂材料中受选择位点指数与产量数据具有很好的相关性。其中，最佳线性无偏预测法获得的产量育种值与受选择位点指数有着更显著的正相关。该实例表明受选择指数可应用于杂交品种的选育及育种潜力评估。

虽然，上文中已经用一般性说明、具体实施方式及试验，对本发明作了详尽的描述，但在本发明基础上，可以对之作一些修改或改进，这对本领域技术人员而言是显而易见的。因此，在不偏离本发明精神的基础上所做的这些修改或改进，均属于本发明要求保护的范围。

Claims

1.一种基于受选择位点指数评估籼稻育种潜力的方法，包括以下步骤：

步骤S4，对步骤S3获得的受选择区段，鉴定受选择的单倍型；即选择两个亚群后，再选一个差异最大的亚群作为外群，鉴定每个位点原始基因型和衍生基因型；外群中的主要基因型定义为原始基因型；对所选外群和两个亚群，筛选外群中原始基因型频率大于98％且衍生基因型在这两个亚群中频率差异最大的少于25％的位点；

基于上一步操作所筛选出的位点，对所选两个亚群间的每个差异受选择区段，计算每个品种中属于衍生基因型位点的个数，所有品种中该数值最大值的一半确定为阈值；大于该阈值的品种认为在该区段具有受选择的单倍型；

步骤S5，对步骤S4获得的受选择单倍型，计算不同品种包含的具有受选择单倍型的受选择区段的数目，即受选择位点指数；依据受选择位点指数与育种目标值之间的正相关关系评估待测品种的育种潜力；

所述的物种为籼稻。

2.根据权利要求1所述的方法，步骤S2中的软件包括但不限于STRUCTURE和ADMIXTURE，所假定亚群的数目不小于3个，划分亚群的参数为最大亚群组分值与第二亚群组分值之间差异大于或等于0.4，小于0.4的品种视为中间型不归入任何亚群。

3.根据权利要求1所述的方法，步骤S3中群体遗传学方法包括但不限于Fst、Tajima’sD、CLR、XP-CLR和XP-EHH。

4.根据权利要求1所述方法，经步骤S3获得的籼稻品种中受选择区段包括：

染色体受选择区段坐标基于日本晴 Nipponbare基因组Michigan State University拼接版本6.1。