CN110867209A

CN110867209A - 预测籼稻亚种穗粒数强优势杂交组合的snp标记及其高通量检测方法

Info

Publication number: CN110867209A
Application number: CN201911190458.7A
Authority: CN
Inventors: 张洪亮; 谢建引; 祝晓阳; 王学强; 张淑阳; 张志方; 李自超; 李金杰; 张战营
Original assignee: China Agricultural University
Current assignee: China Agricultural University
Priority date: 2019-11-28
Filing date: 2019-11-28
Publication date: 2020-03-06
Anticipated expiration: 2039-11-28
Also published as: CN110867209B

Abstract

本发明涉及一种高通量检测用于预测籼稻亚种穗粒数强优势杂交组合的SNP标记的方法。本发明还涉及用于预测籼稻亚种穗粒数强优势杂交组合的标签SNP以及用于检测或扩增核心标签SNP的引物组。本发明进一步涉及评估和预测籼稻穗粒数强优势杂交组合的方法以及本发明的标签SNP和引物组在评估和预测籼稻穗粒数强优势杂交组合中的应用。

Description

预测籼稻亚种穗粒数强优势杂交组合的SNP标记及其高通量检测方法

技术领域

本发明属于水稻生物技术与分子标记应用领域，具体地涉及用于预测籼稻亚种内(Oryza sativa L.ssp.Xian，Oryza sativa L.ssp.indica)穗粒数杂种F₁强优势杂交组合的标签SNP标记及其高通量检测方法。

背景技术

水稻是世界上主要的粮食作物之一，作为我国和东南亚国家的主要口粮，其产量的稳定和提高关系着我国乃至全世界的粮食安全。目前，杂交稻在我国种植面积占到一半以上，对粮食增产作用显著，但是自上世纪90年代以来，水稻单产遇到了瓶颈，我国南方的杂交籼稻产量徘徊不前,北方杂交粳稻在单产上也没有超过常规粳稻,其中最主要的原因是亲本的遗传基础狭窄,如三系杂交籼稻仍主要在利用我国南方的野败型不育细胞质类型与东南亚恢复系间的杂种优势。相比玉米杂种优势群的成功划分，水稻的现有研究主要针对一些常用的强优势组合，较少有从遗传多样性丰富的水稻种质资源的角度对杂种表现预测和亲本利用潜力进行研究。随着近些年大量水稻品种基因组测序的完成，以及成熟的全基因组关联分析方法的建立，利用核心种质鉴定杂种优势QTL已经成为可能。基于杂种QTL进行杂种F₁表现的预测不仅对于提高杂种优势利用效率具有着重要的理论意义，对拓宽籼稻种质资源，克服杂交配组的盲目性具有重要的指导意义。

穗粒数作为水稻产量三大因子之一，其杂种优势最为明显，对杂种产量的遗传贡献也最大。开展水稻杂种穗粒数QTL检测，杂种穗粒数QTL标记开发和杂种预测研究，有助于实现水稻杂种穗粒数的精准预测和强优势组合筛选，进而培育出高产杂交稻，避免大量盲目的测配工作，提高杂交组配亲本选择的质量和效率。

发明内容

为解决现有技术中的上述问题，本发明利用水稻栽培稻微核心种质的籼稻与测验系(例如，9311)的杂交组合，通过全基因组关联分析检测与水稻杂种F₁穗粒数关联的SNP，并针对这些SNP开发了可用于MassARRAY平台检测的一套可预测籼稻杂种穗粒数的SNP标记组合及其扩增引物。

在第一个方面，本发明提供了一种用于预测籼稻亚种穗粒数强优势杂交组合的SNP标记的高通量检测方法(下文中有时简称为“本发明的检测方法”)，该方法包括以下步骤：

1)选择多份目标籼稻亲本材料分别与籼稻测验系材料杂交，得到一套含目标籼稻和籼稻测验系组合的杂种F₁群体；

2)将步骤1中获得的杂种F₁群体采用两个重复的随机区组种植，对所有籼稻亲本和杂种F₁进行穗粒数的田间考察，获得亲本和杂种F₁的穗粒数表型数据，所述穗粒数为每穗总颖花数；

3)利用高通量测序法完成对所述目标籼稻亲本材料的基因组测序，获得至少5X的测序深度(优选，15.2X的测序深度)，通过生物信息软件(例如，BWA或GATK)提取SNP，以MAF(最小等位基因频率)>＝0.05和缺失率低于50％作为筛选条件，筛选获得多个SNP作为基础SNP库；通过目标籼稻亲本材料和籼稻测验系双亲的基因型派生出每个目标籼稻和籼稻测验系组合的F₁基因型；

4)利用步骤2)中获得的F₁穗粒数表型和步骤3)所得的SNP基因型，开展F₁穗粒数的全基因组关联分析(GWAS)，将相邻两个SNP间隔不超过170kb且至少3个以上SNP定义为一个QTL，据此获得F₁穗粒数QTL；

5)针对步骤4)中获得的F₁穗粒数QTL，利用haploview软件计算所述F₁穗粒数QTL内所有显著位点的标签SNP，并通过Perl脚本提取与每个QTL内的所述标签SNP强连锁的SNP位点(在本发明的具体实施方案中，设定连锁不平衡系数r²≥0.8为强连锁)，将所述提取的标签SNP以及与所述标签SNP强连锁的SNP位点作为每个QTL内的显著标签SNP；

6)针对步骤5)中获得的每个QTL内的显著标签SNP，对其进行MassARRAY检测，通过GWAS信号强度评估获得每个能用于MassARRAY检测的标签SNP的综合得分(综合得分＝-log₁₀(P)/干扰SNP个数)，并选取一组综合得分最高的标签SNP作为每个QTL中的最优标签SNP用于最终MassARRAY检测。

在第二个方面，本发明提供了一种评估和预测籼稻亚种F₁穗粒数或强优势杂交组合的方法，所述方法包括通过上述方法获得用于最终MassARRAY检测的最优标签SNP，然后执行下列步骤：

7)提取与步骤6)中获得的每个QTL中的最优标签SNP高度关联(在本发明的具体实施方案中，设定连锁不平衡系数r²≥0.8为高度关联)的所有SNP，将其在GWAS中所估计的效应的平均值作为每个QTL的标签SNP的效应；所述每个QTL的标签SNP效应包括加性效应值和显性效应值，其中杂种F₁中SNP为杂合基因型的为显性效应，纯合基因型为加性效应；利用所有QTL的最优标签SNP基因型及其效应估计值建立线性回归方程：y＝b×Q_eff+a，其中y表示表型矩阵，a和b分别表示回归截距和回归系数，Q_eff为每个个体所有标签SNP的基因型效应的累加值，即Q_eff＝ΣQTL_add+ΣQTL_domi,ΣQTL_add表示所有QTL的标签SNP的加性效应值累加值，ΣQTL_domi表示所有QTL的标签SNP的显性效应值累加值；利用每个组合的F₁基因型计算的穗粒数累加效应Q_eff和实际观察到每个组合的穗粒数表型，估计a和b的参数，建立目标群体和环境下杂交组合穗粒数的预测方程，利用所建立的预测方程预测各个目标籼稻亲本材料和籼稻测验系材料组合的杂种F₁穗粒数，所述杂种F₁穗粒数用以评估所述目标籼稻亲本配制穗粒数强优势杂交组合的潜力。

在一个实施方案中，上述第二个方面的方法还包括：确定大于所有被预测的组合表现分布的最高10％分位，优选最高5％分位的杂交组合为穗粒数强优势杂交组合。

在本发明中，综合得分可以包括GWAS信号强度、MassARRAY检测的干扰点个数(其综合得分＝-log₁₀(P)/干扰SNP个数)。

在一个实施方案中，每个SNP加性效应计算公式为：QTL_add＝abs(P_AA–(P_AA+P_aa)/2)，显性效应值计算公式为：QTL_domi＝F_Aa-(F_AA+F_aa)/2，其中测验系的基因型被定义为AA，非测验系的基因型被定义为aa，其中，P_AA和P_aa分别表示AA和aa基因型亲本穗粒数平均值，F_Aa、F_AA和F_aa分别表示AA、aa和Aa基因型杂种F₁穗粒数平均值。

在一个具体的实施方案中，所述测验系材料是9311，加性效应和显性效应值是根据籼稻亲本以及籼稻×9311组合的杂种F₁计算得到。但是本领域技术人员要理解的是，根据本发明，测验系材料不限于9311，其可以是下面所述的任一籼稻亚种。

在一个实施方案中，每穗总颖花数包括主穗的饱粒数和瘪粒数。

在一个优选实施方案中，全基因组关联分析(GWAS)采用压缩的混合线性模型cMLM(compressed mixed linear model)模型；优选地，通过多次置换检验获得F₁穗粒数QTL，更优选地，通过500-20000次置换检验。在一个优选实施方案中，可以采用10000次置换检验。

在本发明中，生物信息软件可采用本领域中熟知的各种生物信息软件，包括，但不限于，基因组工具软件BWA、GATK、Haploview等。

在一个优选实施方案中，所述高通量测序法可以采用本领域中已知的任何高通量测序仪来进行，优选采用二代高通量测序技术的仪器，例如，hiseq2000平台(具体操作可参考Wang,W.,et al.(2018)."Genomic variation in 3,010 diverse accessions ofAsian cultivated rice."Nature 557(7703):43-49)。

在第三个方面，本发明涉及一种评估和预测籼稻亚种F₁穗粒数或强优势杂交组合的方法，该方法包括利用通过本发明的检测方法获得的显著标签SNP鉴定供试籼稻亚种亲本自交系的基因型，然后通过上述第二方面的方法中获得的表型矩阵公式预测杂交F₁籼稻穗粒数，用以评估所述供试籼稻亚种亲本配制穗粒数强优势杂交组合的潜力。

在第四个方面，本发明涉及一种筛选用于培育高产杂交稻的亲本品种的方法，该方法包括选择多份目标籼稻亲本材料和籼稻测验系材料，通过上述方法获得F₁穗粒数强优势杂交组合(目标亲本与测验系间或目标亲本间)，选取F₁穗粒数强优势杂交组合中的目标籼稻亲本材料作为用于培育高产杂交稻的亲本品种。

在一个实施方案中，上述筛选方法在获得F₁穗粒数强优势杂交组合后，可以计算与所述杂交组合中的籼稻亲本所有可能的杂交组合F₁的平均穗粒数，其中平均数较高的材料可作为配制其它高产杂交稻的优选亲本品种。

在第五个方面，本发明涉及一种培育高产杂交稻的方法，该方法包括选择多份目标籼稻亲本材料和籼稻测验系材料，通过上述方法获得F₁穗粒数强优势杂交组合，将所述F₁穗粒数强优势杂交组合中的目标籼稻亲本与另一个籼稻品种杂交，获得杂种F₁，即所述高产杂交稻。优选地，所述另一个籼稻品种是籼稻测验系。

在第六个方面，本发明涉及通过上述本发明的检测方法获得的标签SNP(下文中有时简称为“本发明的标签SNP”)。优选地，所述标签SNP是步骤5)中所获得的显著标签SNP，更优选是步骤6)中获得的可用于MassARRAY检测的最优标签SNP(下文中有时也称“核心标签SNP”)，具体地是表3中所示的任一SNP或其任意组合，最优选地是表4中所列举的核心标签SNP。

在第七个方面，本发明提供了用于扩增或检测上述核心标签SNP的引物组(下文中有时简称为“本发明的引物组”)，所述引物组包括表4中用于检测核心标签SNP的任一个引物组以及两个或两个以上引物组的任意组合，每个引物组包括正向引物、反向引物和延伸引物。

在本发明中，引物的设计主要根据SNP两侧的DNA序列进行(SNP左右两侧各200bp的DNA序列通过perl脚本提取)，引物设计原则是要求待检测SNP左右两侧各15bp内不存在或者仅存在少于两个干扰SNP位点。

在第八个方面，涉及本发明的标签SNP的任意组合或本发明的引物组的任意组合在下列任一项中的应用：

1)预测籼稻亚种杂交组合F₁的穗粒数；

2)制备用于预测籼稻亚种F₁穗粒数的产品；

3)培育高产籼型杂交稻亲本；

4)筛选籼稻亚种穗粒数强优势组合；或

5)制备用于筛选籼稻亚种穗粒数强优势组合的产品。

在第九个方面，本发明提供了以下任一项产品：

1)用于预测籼稻亚种F₁穗粒数的产品，所述产品包含本发明的引物组的任意组合，优选地，所述产品是试剂盒；或

2)用于筛选籼稻亚种穗粒数强优势组合的产品，所述产品包含本发明的引物组的任意组合，优选地，所述产品是试剂盒。

在本发明中，籼稻(包括目标籼稻亲本材料和籼稻测验系材料)包括但不限于以下的品种：矮移四、伊空、田旱稻、越南早稻、马来红、CO 22、2037(Rajahamsal)、斯里兰卡1号、卡哈姆、布雷达A-75、几内亚稻、Seln 244A6-20、暹罗斯赤、Padi Ladang Ase Polo Komek、Tjantajan、C 894-21、IR 10179-23-1-3、Dumai、Jaibattey、Ngatsin、WD-15446、Rohini、BW293-2、BRC 25-146-2-1、美国稻、P1790-5-1M-4-5M-1B-3M-B、IRAT 10、K 24、71011、三田糯、CHANH 148、SLK 2-18-2、CISOKAN、Weedy rice 13、JC 78、RP 1570-44-1、GZ 1368-5-4、J34、R42、C.MEDIO 7、ECIA 179-S13、PMS 10B、二九南1号、南京11号、矮脚南特、广陆矮4号、南特号、桂朝2号、台中籼选220号、解放籼、湘早籼7号、黄丝桂占、金优1号、成农水晶米、包协123B、秕五升、抚宁紫皮粳子、秋前白、金溪白、台山糯、矮禾迟、金包银、闽北晚籼、陆财号、秕五升、饿死牛、南雄早油占、黑督4、七月籼、洞庭晚籼、柳叶粘、宣恩长坛青粘、须谷糯、旱麻稻、中农4号、红谷、三颗寸、三七十箩、齐头白谷、紫米、小红谷、公居73、齐头谷、紫糯、魔王谷内、毫莱、金枝糯、鸡血糯、饭毫皮、背子糯、马尾粘、油粘、加巴拉、闷加高1、包选21号、文香糯、大弯糯、香谷、闷加丁2、洞庭晚籼、柳沙1号、郴晚3号、成都矮3号、矮麻抗、蜀丰101、二钢矮、广陆矮15-1、红晚1号、湘矮早10号、湘晚籼1号、泸科3号、矮沱谷151、早熟香黑、墨米、湘晚籼3号、镇籼232、早籼240、当育5号、四倍体朝63、红矮糯、万利籼、矮仔占、小白米、盐水赤、红粳旱谷、80B、古154、圭630、IR661-1、培C122、粳7623、特青选恢、Xiang hui91269、JWR 221、白壳旱禾、香稻、老造谷、毫香、金南特B、竹珍B、朝阳一号B、L301B、金南特43B、青四矮16B、献改B、江农早1号B、京虎B、滇瑞409B、包协-7B、G珍汕97B、88B、雷火占、台中65号/台中HR539、台中在来1号/台中65、麻麻谷、梅花糯、六十早、三百粒、乌壳占、QingKe、毫荒腊、南高谷和9311。在本发明中，测验系材料采用9311。但是本领域技术人员还要理解的是，只要属于籼稻亚种，均可在本发明中作为目标籼稻品种或者籼稻测验系使用。

本发明的有益效果

1.本发明首次针对具有丰富多样性和代表性的水稻微核心种质材料进行穗粒数杂种F₁预测，该方法具有一定的普适性，对于其他作物杂种表现预测研究具有极好的参考价值。

2.本发明针对籼稻筛选了49个核心标签SNP标记，利用训练群体获得每个标记的加性和显性效应值，对籼稻48个组合的F₁穗粒数进行了预测，并配制其杂交组合于2016年在长沙种植评价，48个组合预测穗粒数与实际穗粒数的相关系数达到0.5770，说明本发明筛选的SNP能够较为准确的评估和预测杂种F₁穗粒数。

3.通过对自交系亲本中49个标签SNP基因型(即，49个QTL中针对每个QTL选取了一个最优标签SNP)鉴定，直接评估自交系的杂种F₁穗粒数表现和利用潜力，可以避免大量盲目的测配工作，提高杂交组配亲本选择的质量和效率。

附图说明

图1显示了籼稻×9311组合F₁的GWAS曼哈顿图：图中黑色的点(即，灰度较高的点)表示1000次置换检验显著，且位于QTL内的SNP位点。

图2为籼稻×9311F₁中检测到的标签SNP对籼稻杂种F₁训练群体的预测情况。图中横坐标为基于基因型效应预测得到的穗粒数表型值，纵坐标为训练群体的实际杂种F₁穗粒数。

图3显示了48个籼籼组合预测值与田间实际观测值之间的相关性。图中横坐标为基于基因型效应预测得到的穗粒数表型值，纵坐标为2016年田间考察获得的实际杂种F₁穗粒数，其中黑色的点(即，灰度较高的点)表示预测处于最高5％组合F₁在实际组合中的表现。

图4显示了表4，即用于检测基于MassARRAY平台检测的最优标签SNP的引物组序列。

具体实施方式

定义：

QTL：QTL是Quantitative Trait Locus的缩写，即数量性状座位或者数量性状基因座，它指的是控制数量性状的基因在基因组中的位置。对QTL的定位必须使用遗传标记，即，标记和QTL是连锁的。

SNP：全称Single Nucleotide Polymorphisms，SNP主要是指在基因组水平上由单个核苷酸的变异所引起的DNA变异，包括转换和颠换，其数量很多，多态性丰富。

标签SNP：在基因组中，有些区域是较为紧密连锁在一起的，这个区域可大可小，组成一个单倍型框，在区域里也会存在很多的SNP。从中选出一个代表性的SNP，其可以反映这个区域的情况。这个被选取能够代表整个单倍型框的SNP就被称为标签SNP。

MAF：指最小等位基因频率。

Haploview软件：本发明采用的是java命令版的Haploview 4.2，软件可从官网：https://www.broadinstitute.org/haploview/haploview免费获取。在本发明中，该软件的主要参数可以如下选择：-hwcutoff 0-maxMendel 1-maxDistance 2000-pairwiseTagging-mintagdistance 500-taglodcutoff 3-tagrsqcutoff 0.8。但是要理解的是，本领域技术人员可以根据本发明所教导的原理和应用场景选择合适的参数，本发明不限于上述参数。

MassARRAY检测平台：

分子量阵列技术是Sequenom公司推出的世界上领先的基因分析工具，通过引物延伸或切割反应与灵敏、可靠的MALDITOF质谱技术相结合，实现基因分型检测。Sequenom SNP检测系统基本原理为基质辅助激光解吸电离飞行时间质谱(MALDT-TOF MS)技术。

GWAS(Genome-Wide Association Study)：即全基因组关联分析，是指在全基因组范围内找出存在的序列变异，即单核苷酸多态性(SNP)，从中鉴定出与目标性状相关的SNP。

BWA软件：BWA是一款将序列比对到参考基因组上的软件，通常情况下选择BWA-MEM算法。BWA的源代码存储在github上，可从https://github.com/lh3/bwa获得。

GATK软件：GATK是Genome Analysis ToolKit的缩写，是一款从高通量测序数据中分析变异信息的软件，目前最新版本为4.0.4.0,称为GATK4。其下载链接为https://software.broadinstitute.org/gatk/download/。

下面结合具体实施方式对本发明进行进一步的详细描述，给出的实施例仅为了阐明本发明，而不是为了限制本发明的范围。下述实施例中的实验方法，如无特殊说明，均为常规方法。下述实施例中所用的材料、试剂、仪器等，如无特殊说明，均可从商业途径得到。以下实施例中的定量试验，均设置三次重复实验，结果取平均值。下述实施例中，如无特殊说明，所示的引物序列以及序列表中各核苷酸序列的第1位均为相应DNA/RNA的5′末端核苷酸，末位均为相应DNA/RNA的3′末端核苷酸。

籼稻测验系9311：9311(9311，Oryza sativa ssp.indica)，公众可从位于中国农业科学院作物科学研究所的国家种质资源库获得。记载过该材料的非专利文献是：DayongLi等人，(2016)Integrated analysis of phenome,genome,and transcriptome ofhybrid rice uncovered multiple heterosis-related loci for yieldincrease.Proceedings of the National Academy of Sciences of the United Statesof America 113,E6026-E6035。

栽培稻微核心种质籼稻(实施例中的162份测试籼稻)：这些材料收录在国家种质资源库，公众可以根据国家种质资源库编号(参见表1中的国家统一编号)/品种名从中国农业大学农学院稻种资源基因组学与分子育种实验室以及中国农业科学院作物科学研究所的国家种质资源库获取。

实施例1杂种F₁关联分析群体构建和穗粒数表型的鉴定

选取栽培稻微核心种质162份测试籼稻(其名称和来源地参见表1)，与籼稻测验系9311进行组配得到籼稻×9311组合的F₁群体。

表1试验材料名称及来源

所有F₁组合于2013年长沙，设置两个重复进行种植，成熟后每一份材料收取中间的5个单株，每个单株选取1个主穗考察饱粒数和瘪粒数，最终以每穗总颖花数(包括饱粒数和瘪粒数)作为穗粒数表型。

实施例2穗粒数全基因组关联分析和标签SNP的获得

利用高通量二代测序技术(HiSeq2000)完成162份测试籼稻的基因组测序，获得15.2×的测序深度数据，通过BWA(release 0.7.10)提取SNP，并以MAF>＝0.05和缺失率低于50％作为筛选条件，筛选获得2710826个SNP作为基础SNP库；通过测试籼稻亲本材料和籼稻测验系双亲的基因型派生出每个目标籼稻和籼稻测验系组合的F₁基因型。然后采用GAPIT软件(2016.03.01(version：Kinship defined by Zhiwu Zhang),http://zzlab.net/GAPIT)中提供的压缩的混合线性模型(cMLM)对F₁穗粒数表型和SNP基因型间进行全基因组关联分析，将相邻两个不超过170kb的显著关联的SNP且至少3个SNP合并为一个QTL，通过1000次置换检验获得F₁穗粒数QTL(结果参见图1的GWAS曼哈顿图)。

针对每个F₁穗粒数QTL，利用haploview软件(Haploview 4.2)计算F₁穗粒数QTL内所有显著SNP位点的标签SNP，并通过perl脚本提取每个QTL内与标签SNP强连锁的显著SNP，即与标签SNP连锁不平衡程度≥0.8(r²≥0.8)的所有SNP，标签SNP及与标签SNP强连锁的显著SNP作为每个QTL内的显著标签SNP。

针对上面中获得的每个QTL内的显著标签SNP，对其进行MassARRAY检测，通过GWAS信号强度评估获得每个能用于MassARRAY检测的标签SNP的综合得分，并选取一组综合得分最高的标签SNP用于最终MassARRAY检测，所述综合得分包括GWAS信号强度、MassARRAY检测的干扰点个数(综合得分＝-log₁₀(P)/干扰SNP个数)。

提取每个QTL中的最优标签SNP所高度关联的SNP(r²≥0.8)，将其在GWAS中所估计的效应的平均值作为每个QTL中标签SNP的效应；所述每个QTL的标签SNP效应包括加性效应值和显性效应值(其中，杂种F₁中SNP为杂合基因型的为显性效应，纯合基因型为加性效应，参见下面的表2)；利用所有QTL的最优标签SNP基因型及其效应估计值建立线性回归方程：y＝b×Q_eff+a，其中y表示表型矩阵，a和b分别表示回归截距和回归系数，Q_eff为每个个体所有标签SNP的基因型效应的累加值，即Q_eff＝ΣQTL_add+ΣQTL_domi,ΣQTL_add表示所有QTL的标签SNP的加性效应值累加值，ΣQTL_domi表示所有QTL的标签SNP的显性效应值累加值。

表2籼稻×9311检测到的QTL及其标签SNP基因型及其效应

表3 QTL内MassARRAY测试通过的标签SNP位点

针对选取的49个核心标签SNP(见表3中最右列)，设计了可在MassARRAY平台上进行籼稻亚种内检测的引物组(参见表3和图4中的表4)，每个引物组包括正向引物、反向引物和延伸引物。设计原则是根据SNP两侧的DNA序列进行(SNP左右两侧各200bp的DNA序列通过perl脚本提取)，引物设计原则是要求待检测SNP左右两侧各15bp内不存在或者仅存在少于两个干扰SNP位点，引物质量评估利用Extend Primer Assay Design(v4.1.0.17)软件进行：具体参数如下：

Assay Type:Replex

Replex Mode:Re-design extend primers

Multiplexing:40,1

Max alleles/SNP:4

Allow multiSnp strand design:Yes

Allow INDEL/MNP strand design:Yes

Mutant allele occulsion control:Optimize

Annotation type:Scan and Restrict

SNP Set Representation:Once per Run

Use exchange replexing:Yes,0,No

Report verbosity:Detailed

Amplicon length control:80,100,200

Amplicon design score cutoffs(u/m-plex):0.3,0.4

实施例3建立利用标签SNP预测籼稻杂种F₁穗粒数的预测方程

利用162份测试籼稻与9311配制的杂交组合(最终成功杂交组合117份)，通过上面实施例所确定的标签SNP基因型及其在长沙环境下估计所得累加遗传效应以及每个组合F₁的实际穗粒数，对方程y＝bQ_eff+a进行求解，最终建立了可以预测籼稻组合长沙环境下F₁穗粒数的预测方程：y＝0.1682Q_eff+229.07，其中，每个SNP加性效应计算公式为abs(P_AA–(P_AA+P_aa)/2)，显性效应值计算公式为F_Aa-(F_AA+F_aa)/2(此处定义测验系的基因型为AA，非测验系的基因型为aa，其中F_aa＝P_aa+(F_AA-P_AA)，P_AA、P_aa表示AA基因型和aa基因型亲本穗数平均值，F_AA、F_aa和F_Aa分别表示AA、aa和Aa杂合基因型F₁的穗粒数平均值)；该方程所得籼稻×9311预测值与实际观测值的相关性达到0.8122，5倍交叉检验得到的相关系数为0.765，说明这种预测具有较高的准确度和可靠性(图2和表5)。

表5籼稻训练群体以及验证群体的预测值与实际观测值

实施例4对48个籼稻杂交组合的田间验证

从163份(即162份测试籼稻和9311)籼稻品种中随机选取52份材料，理论上52份材料两两组配可以配制52×(52-1)/2＝1326个组合。随机配制了其中的48个组合，根据亲本推算得到这48个组合F₁的基因型，并利用方程y＝0.1682Q_eff+229.07预测这48个组合的表现。

对这随机配制的48份杂交组合，于2016年长沙地区，以每行9株，16cm×25cm行株距种植两个重复进行田间种植，成熟后，收取中间5株，每株选取主穗考察穗粒数，并以5株×2重复的平均值作为最终的穗粒数表型数据。

对比预测的表型与实际得到的表型数据，二者相关性为0.5770，可见该预测方程对实际组合的预测效率较高，具有较高实用性(参见表5和图3)。

虽然已经举例说明和描述了本发明的具体实施方案，但是对于本领域技术人员来说显而易见的是，在不脱离本发明实质和范围的情况下可以做出多种其他改变和变型。因此，在随附的权利要求书中包括属于本发明范围内的所有这些改变和变型。

Claims

1.一种高通量检测用于预测籼稻亚种穗粒数强优势杂交组合的SNP标记的方法，所述方法包括以下步骤：

2)将步骤1)中获得的杂种F₁群体采用两个重复的随机区组种植，对所有亲本和杂种F₁进行穗粒数的田间考察，获得亲本和杂种F₁的穗粒数表型数据，所述穗粒数为每穗总颖花数；

3)利用高通量测序法完成对所述目标籼稻亲本材料的基因组测序，获得至少5X的测序深度，优选15.2X的测序深度，然后通过生物信息软件提取SNP，以最小等位基因频率MAF≥0.05和缺失率低于50％作为筛选条件，筛选获得多个SNP作为基础SNP库；通过目标籼稻亲本材料和籼稻测验系双亲的基因型派生出每个目标籼稻和籼稻测验系组合的F₁基因型；

4)利用步骤2)中获得的F₁穗粒数表型和步骤3)所得的SNP基因型，开展F₁穗粒数的全基因组关联分析，将相邻两个不超过170kb的显著关联的SNP且至少3个SNP作为一个QTL，从而获得F₁穗粒数QTL；

5)针对步骤4)中获得的F₁穗粒数QTL，利用haploview软件计算所述F₁穗粒数QTL内所有显著位点的标签SNP，并通过perl脚本提取与每个QTL内的所述标签SNP以及与标签SNP强连锁的SNP位点，将所述提取的标签SNP以及与所述标签SNP强连锁的SNP位点作为每个QTL内的显著标签SNP；

6)针对步骤5)中获得的每个QTL内的显著标签SNP，对其进行MassARRAY检测评估，通过GWAS信号强度评估，从而获得每个能用于MassARRAY检测的标签SNP的综合得分，并选取一组综合得分最高的标签SNP作为每个QTL中的最优标签SNP用于最终MassARRAY检测。

2.一种评估和预测籼稻亚种F₁穗粒数或强优势杂交组合的方法，所述方法包括利用权利要求1所述的方法获得最优标签SNP，然后执行下列步骤：

7)提取与步骤6)中获得的每个QTL中的最优标签SNP高度关联的所有SNP，将它们在全基因组关联分析中所估计的效应的平均值作为每个QTL的标签SNP的效应；所述每个QTL的标签SNP效应包括加性效应值和显性效应值，其中杂种F₁中SNP为杂合基因型的为显性效应，纯合基因型为加性效应；利用所有QTL的最优标签SNP基因型及其效应估计值建立线性回归方程：y＝b×Q_eff+a，其中y表示表型矩阵，a和b分别表示回归截距和回归系数，Q_eff为每个个体所有标签SNP的基因型效应的累加值，即Q_eff＝ΣQTL_add+ΣQTL_domi,ΣQTL_add表示所有QTL的标签SNP的加性效应值累加值，ΣQTL_domi表示所有QTL的标签SNP的显性效应值累加值；利用每个组合的F₁基因型计算的穗粒数累加效应Q_eff和实际观察到每个组合的穗粒数表型，估计a和b的参数，建立目标群体和环境下杂交组合穗粒数的预测方程，通过所建立的预测方程预测各个目标籼稻亲本材料和籼稻测验系材料组合的杂种F₁穗粒数；所述杂种F₁穗粒数用于强优势杂交组合的预测和筛选；优选地，所述方法还包括确定大于所有预测组合表现分布的最高10％分位，优选最高5％分位的杂交组合为穗粒数强优势杂交组合的步骤。

3.根据权利要求2所述的方法，其特征在于每个SNP加性效应计算公式为：QTL_add＝abs(P_AA–(P_AA+P_aa)/2)，显性效应值计算公式为：QTL_domi＝F_Aa-(F_AA+F_aa)/2，其中测验系的基因型被定义为AA，非测验系的基因型被定义为aa，其中，P_AA和P_aa分别表示AA和aa基因型亲本穗粒数平均值，F_Aa、F_AA和F_aa分别表示AA、aa和Aa基因型杂种F₁穗粒数平均值。

4.下列任一项的方法：

1)一种评估和预测籼稻亚种F₁穗粒数或强优势杂交组合的方法，该方法包括利用通过权利要求1所述的方法获得的显著标签SNP鉴定供试籼稻亚种亲本自交系的基因型，然后通过权利要求2或3所述的方法中获得的表型矩阵公式预测杂交F₁籼稻穗粒数，用以评估所述供试籼稻亚种亲本配制穗粒数强优势杂交组合的潜力；

2)一种筛选用于培育高产杂交稻的亲本品种的方法，所述方法包括选择多份目标籼稻亲本材料和籼稻测验系材料，通过权利要求2或3的方法获得F₁穗粒数强优势杂交组合，选取所述F₁穗粒数强优势杂交组合中的目标籼稻亲本材料作为用于培育高产杂交稻的亲本品种；或

3)一种培育高产杂交稻的方法，所述方法包括选择多份目标籼稻亲本材料和籼稻测验系材料，通过权利要求2或3的方法获得F₁穗粒数强优势杂交组合，将所述F₁穗粒数强优势杂交组合中的目标籼稻亲本与另一个籼稻品种杂交，获得杂种F₁，即所述高产杂交稻，优选地，所述另一个籼稻品种是所述籼稻测验系。

5.权利要求1-4中任一项所述的方法，其特征在于所述全基因组关联分析采用压缩的混合线性模型cMLM模型；优选地，通过多次置换检验获得F₁穗粒数QTL，更优选地，通过500-20000次置换检验。

6.通过权利要求1所述的方法获得的标签SNP，优选所述标签SNP是步骤5)中所获得的显著标签SNP，更优选是步骤6)中获得的能用于MassARRAY检测的最优标签SNP，具体地是表3中所示的任一SNP或其任意组合，优选地是下列的任一SNP或其任意组合：

7.用于扩增或检测权利要求6所述的标签SNP的引物组，每个引物组包括正向引物、反向引物和延伸引物，优选地所述引物组包括表4中所示的任一个引物组或两个以上引物组的任意组合。

8.权利要求6所述的标签SNP的任意组合或权利要求7所述的引物组在下列任一项中的应用：

1)预测籼稻亚种F₁穗粒数；

2)制备用于预测籼稻亚种F₁穗粒数的产品；

3)培育高产籼型杂交稻；

4)筛选籼稻亚种穗粒数强优势组合；或

5)制备用于筛选籼稻亚种穗粒数强优势组合的产品。

9.以下任一项产品：

1)用于预测籼稻亚种F₁穗粒数的产品，所述产品包含权利要求7所述的引物组，优选地，所述产品是试剂盒；或

2)用于筛选籼稻亚种穗粒数强优势组合的产品，所述产品包含权利要求7所述的引物组，优选地，所述产品是试剂盒。

10.权利要求1-9中任一项所述的方法，其特征在于所述籼稻选自以下品种的任一籼稻品种或两种以上的任意组合：矮移四、伊空、田旱稻、越南早稻、马来红、CO 22、2037(Rajahamsal)、斯里兰卡1号、卡哈姆、布雷达A-75、几内亚稻、Seln 244A6-20、暹罗斯赤、Padi Ladang Ase Polo Komek、Tjantajan、C 894-21、IR 10179-23-1-3、Dumai、Jaibattey、Ngatsin、WD-15446、Rohini、BW 293-2、BRC 25-146-2-1、美国稻、P1790-5-1M-4-5M-1B-3M-B、IRAT 10、K 24、71011、三田糯、CHANH 148、SLK 2-18-2、CISOKAN、Weedyrice 13、JC 78、RP 1570-44-1、GZ 1368-5-4、J34、R42、C.MEDIO 7、ECIA 179-S13、PMS10B、二九南1号、南京11号、矮脚南特、广陆矮4号、南特号、桂朝2号、台中籼选220号、解放籼、湘早籼7号、黄丝桂占、金优1号、成农水晶米、包协123B、秕五升、抚宁紫皮粳子、秋前白、金溪白、台山糯、矮禾迟、金包银、闽北晚籼、陆财号、秕五升、饿死牛、南雄早油占、黑督4、七月籼、洞庭晚籼、柳叶粘、宣恩长坛青粘、须谷糯、旱麻稻、中农4号、红谷、三颗寸、三七十箩、齐头白谷、紫米、小红谷、公居73、齐头谷、紫糯、魔王谷内、毫莱、金枝糯、鸡血糯、饭毫皮、背子糯、马尾粘、油粘、加巴拉、闷加高1、包选21号、文香糯、大弯糯、香谷、闷加丁2、洞庭晚籼、柳沙1号、郴晚3号、成都矮3号、矮麻抗、蜀丰101、二钢矮、广陆矮15-1、红晚1号、湘矮早10号、湘晚籼1号、泸科3号、矮沱谷151、早熟香黑、墨米、湘晚籼3号、镇籼232、早籼240、当育5号、四倍体朝63、红矮糯、万利籼、矮仔占、小白米、盐水赤、红粳旱谷、80B、古154、圭630、IR661-1、培C122、粳7623、特青选恢、Xiang hui 91269、JWR 221、白壳旱禾、香稻、老造谷、毫香、金南特B、竹珍B、朝阳一号B、L301B、金南特43B、青四矮16B、献改B、江农早1号B、京虎B、滇瑞409B、包协-7B、G珍汕97B、88B、雷火占、台中65号/台中HR539、台中在来1号/台中65、麻麻谷、梅花糯、六十早、三百粒、乌壳占、Qing Ke、毫荒腊、南高谷和9311；优选地，所述测验系材料是9311。