CN107535350A - 一种基于ssr标记的玉米组配模式优选方法及系统 - Google Patents

一种基于ssr标记的玉米组配模式优选方法及系统 Download PDF

Info

Publication number
CN107535350A
CN107535350A CN201710762834.XA CN201710762834A CN107535350A CN 107535350 A CN107535350 A CN 107535350A CN 201710762834 A CN201710762834 A CN 201710762834A CN 107535350 A CN107535350 A CN 107535350A
Authority
CN
China
Prior art keywords
cenospecies
self
parent
group
measured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710762834.XA
Other languages
English (en)
Other versions
CN107535350B (zh
Inventor
刘哲
史梦莹
昝糈莉
汪雪滢
曲艺伟
刘帝佑
刘玮
李绍明
张晓东
朱德海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Agricultural University
Original Assignee
China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Agricultural University filed Critical China Agricultural University
Priority to CN201710762834.XA priority Critical patent/CN107535350B/zh
Publication of CN107535350A publication Critical patent/CN107535350A/zh
Application granted granted Critical
Publication of CN107535350B publication Critical patent/CN107535350B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于SSR标记的玉米组配模式优选方法及系统,所述方法包括:S1,基于待测自交系与群代表间遗传距离最短原则,对所有待测自交系进行类群划分;S2,对每个亲本未知的杂交种,选择两个对当前杂交种不包含度最小的待测自交系作为亲本进行组配,并推测当前杂交种与亲本间的对应关系;S3,基于所有杂交种与亲本间的对应关系计算类群划分后各类群间的特殊配合力,并对所述特殊配合力进行排序,筛选出优异组配模式。本发明以小群多模式为杂交育种思路,基于改进的遗传分析方法以及群配合力建立了组配模式的优选模型,能够有效地利用历史育种数据,以较少的田间组配量最大程度地选出强优势组合,提高了育种效率。

Description

一种基于SSR标记的玉米组配模式优选方法及系统
技术领域
本发明涉及玉米育种材料遗传关系分析技术领域,更具体地,涉及一种基于SSR标记的玉米组配模式优选方法及系统。
背景技术
Darwin(1877)提出了异花授粉有利和自花授粉有害的观点,发现了杂种优势现象,并且被育种界广泛利用。玉米是世界上杂种优势利用最早、种植推广和研究最多的作物。玉米育种重在选系,难在配组。长期以来,我国玉米育种主要通过常规技术进行,很大程度上取决于育种家的经验,周期长、偶然性大、效率低,难以满足当前玉米生产对良种的需求。据统计,中国每年玉米自交系配组的成功率不足万分之一。商业育种中,每年用于组配的自交系材料数量剧增导致了杂交组合数量激增,近年来,试验土地的租金每年以500~1000元/亩的幅度增长,导致杂交种测试成本大幅度提高。因此,通过大量测配和测试来考察杂交优势是不可行的,需要提高配组效率以提高玉米杂交育种效率。
对种质资源的充分认知是配出强优势杂交组合的关键前提。传统方法对种质资源的认知研究主要包括种质类群划分、亲缘关系、杂优模式、遗传多样性等,而研究角度包括表型方面、DNA指纹方面及两者结合方面。另外,杂种优势群的划分和杂种优势模式的构建,也是近年来国内外玉米育种人员研究的热点。随着生物信息、计算机技术的发展和普及,分子育种成为目前比较新兴、高效的育种方法之一,利用分子技术配合其他传统方法进行种质资源以及杂种优势模式的研究利用是未来的趋势。
但是由于数据、方法和工具的缺失,国内的分子育种研究尚处于起步阶段,如何利用分子技术结合传统种质资源研究方法找到优秀的组配模式以提高育种效率是一个亟待解决的问题。
发明内容
为了解决现有技术存在的玉米育种效率较低的问题,本发明提出一种基于SSR标记的玉米组配模式优选方法及系统。
根据本发明的一个方面,提供一种基于SSR标记的玉米组配模式优选方法,包括:
S1,基于待测自交系与群代表间遗传距离最短原则,对所有待测自交系进行类群划分;
S2,对每个亲本未知的杂交种,选择两个对当前杂交种不包含度最小的待测自交系作为亲本进行组配,并推测当前杂交种与亲本间的对应关系;
S3,基于所有杂交种与亲本间的对应关系计算类群划分后各类群间的特殊配合力,并对所述特殊配合力进行排序,筛选出优异组配模式。
其中,在所述步骤S1前还包括:
获取经SSR分子标记检测的DNA指纹数据材料,并根据预设的划分标准,将所述经SSR分子标记检测的DNA指纹数据材料划分为待测自交系和杂交种。
其中,所述步骤S1进一步包括:
S11,为各类群分别选取一个自交系作为群代表;
S12,对每个待测自交系,确定与当前待测自交系遗传距离最短的群代表,并将当前待测自交系划归所述群代表所对应的类群;
其中,根据改进的SMC算法计算遗传距离。
其中,所述改进的SMC算法包括:
基于模糊对比原则计算两个DNA指纹数据的同一位点的相似程度,遗传距离的计算公式如下:
GD=1-∑Si/n (1)
式(1)中,Si为第i个位点的位点相似度,n为有效对比位点数,GD为遗传距离;
其中,每个位点的位点相似度的计算公式如下:
Si=NRA/NCA (2)
式(2)中,NRA代表重复等位基因个数,NCA代表参与对比的所有数据个数。
其中,所述步骤S2进一步包括:
S21,计算所有待测自交系对各亲本未知的杂交种的不包含度;
S22,对每个亲本未知的杂交种,选择两个对当前杂交种不包含度最小的待测自交系作为亲本进行组配,获得杂交组合,并计算所述杂交组合的指纹与当前杂交种指纹间的吻合度,根据所述吻合度推测当前杂交种与所述亲本间的对应关系。
其中,S21中所述不包含度的计算公式为:
GNI=1-∑Ii/n (3)
式(3)中,Ii为第i个位点上的自交系包含于杂交种的程度,n为有效比对位点数;
其中,Ii的计算公式如下:
Ii=NIA/CIA (4)
式(4)中,NIA表示自交系包含于杂交种的等位基因个数,CIA表示自交系的等位基因个数。
其中,步骤S3进一步包括:
S31,对类群划分后的各类群进行不完全双列组配,获得群组配模式;
S32,基于所有杂交种与亲本间的对应关系,在所述群组配模式中查找存在组配记录的群组配模式;
S33,计算所述存在组配记录的所有群组配模式所对应的类群间的特殊配合力;
S34,将所述特殊配合力按照从大到小进行排序,选择排名靠前的组配模式作为优异组配模式。
其中,S33中计算类群间的特殊配合力的步骤为:
对任意一个群组配模式,利用已有的杂交种表型数据,获取所有杂交种的表型平均值、所述群组配模式所对应的所有杂交组合的表型平均值,并分别计算所述群组配模式所对应的两个类群中每个亲本所形成的杂种组合的表型平均值;
根据所述群组配模式所对应的两个类群中每个亲本所形成的杂种组合的表型平均值,以及所有杂交种的表型平均值分别计算所述两个类群的一般配合力;
根据所述所有杂交种的表型平均值、所述群组配模式所对应的所有杂交组合的表型平均值和所述两个类群的一般配合力,计算得到所述群组配模式所对应的类群间的特殊配合力。
根据本发明的又一个方面,提供一种基于SSR标记的玉米组配模式优选系统,包括:
类群划分模块,用于基于待测自交系与群代表间遗传距离最短原则,对所有待测自交系进行类群划分;
亲本推测模块,用于对每个亲本未知的杂交种,选择两个对当前杂交种不包含度最小的待测自交系作为亲本进行组配,并推测当前杂交种与亲本间的对应关系;
优异模式筛选模块,用于基于所有杂交种与亲本间的对应关系计算类群划分后各类群间的特殊配合力,并对所述特殊配合力进行排序,筛选出优异组配模式。
其中,还包括:
材料获取模块,获取经SSR分子标记检测的DNA指纹数据材料,并根据预设的划分标准,将所述经SSR分子标记检测的DNA指纹数据材料划分为待测自交系和杂交种。
本发明提出的一种基于SSR标记的玉米组配模式优选方法及系统,以小群多模式为杂交育种思路,基于改进的遗传分析方法以及群配合力建立了组配模式的优选模型,能够有效地利用历史育种数据,以较少的田间组配量最大程度选出强优势组合,提高了育种效率。
附图说明
图1为本发明一实施例提供的一种基于SSR标记的玉米组配模式优选方法的流程示意图;
图2为根据本发明一实施例提供的类群划分后群大小与群数量关系图;
图3为根据本发明一实施例提供的杂交种与亲本组配后形成的杂交组合指纹吻合度图;
图4为本发明另一实施例提供一种基于SSR标记的玉米组配模式优选系统的结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,为本发明一实施例提供的一种基于SSR标记的玉米组配模式优选方法的流程示意图,包括:
S1,基于待测自交系与群代表间遗传距离最短原则,对所有待测自交系进行类群划分;
S2,对每个亲本未知的杂交种,选择两个对当前杂交种不包含度最小的待测自交系作为亲本进行组配,并推测当前杂交种与亲本间的对应关系;
S3,基于所有杂交种与亲本间的对应关系计算类群划分后各类群间的特殊配合力,并对所述特殊配合力进行排序,筛选出优异组配模式。
具体地,明确玉米自交系之间的血缘关系,准确地对其进行类群划分,是构建玉米杂种优势利用模式,有目的性地改良玉米自交系和选配杂交组合,提高玉米育种效率,减少育种工作盲目性的一个十分重要的途经。S1是进行自交系的类群划分,基于待测自交系与群代表间遗传距离最短原则是指从所有待测自交系中依据预设的条件挑选出某些自交系作为群代表,其它自交系与哪个群代表的遗传距离最小,即遗传相似度最大,便将该自交系归类到该群代表所代表的类群中。或者是,在已有稳定类群的基础上,以这些类群中被熟知的自交系作为群代表,计算待测自交系与这些群代表之间的遗传距离,确定待测自交系与哪个群代表间的遗传距离最小,则将该待测自交系划归至相应群代表所对应的类群中。其中,群代表的选取原则是杂合度低、有效位点多的自交系,具体的选取条件由育种家设置,并且该材料的遗传距离在区间(0,分组距离阈值)内的距离至少有一个。
群代表能够代表某个类群的特征,以遗传距离作为归类依据,体现了遗传关系越近的自交系越容易成为同类。基于待测自交系与群代表间遗传距离最短原则对所有待测自交系进行类群划分既适用于聚类式类群划分方法,也适应于判别式类群划分方法。现有基于遗传距离的类群划分方法,如UPGMA划分类群的个数是受划分材料影响的,而本发明实施例提出的基于待测自交系与群代表间遗传距离最短原则的类群划分方法弥补了这一缺点,可以在已有稳定类群的基础上,把未知归属的自交系划分到已有类群中,为育种人员划分类群提供帮助。
S2中利用已有的杂交种数据材料,推测亲本未知的杂交种的亲本,以此来获取杂交种与待测自交系之间的遗传关系。本发明提出不包含度的概念来研究杂交种和自交系间的遗传关系。不包含度是指自交系在指纹上不包含于杂交种的程度。计算所有待测自交系与所有亲本未知的杂交种之间的不包含度之后,对每个亲本未知的杂交种,选择两个对该杂交种不包含度最小的待测自交系作为亲本进行组配,得到杂交组合,计算杂交组合的指纹与该杂交种指纹的吻合度,根据吻合度来推测这对亲本是否为该杂交种亲本。对于有亲本记录的杂交种,则已知其亲本,不需要推测其亲本,直接用记录数据即可。根据上述方法,可以获得所有杂交种与待测自交系间的对应关系,利用这个对应关系,可以更好地进行优异组配模式的筛选,而不再需要对所有组配模式获得的杂交组合去做田间试验。根据基于不包含度的杂交种双亲推测方法不但有利于掌握已有材料的遗传关系,还可以对研究杂交组配模式起到重大作用。
S3进行组配模式的优选,在对杂交种进行双亲推测后,获得所有杂交种与亲本间的对应关系,将该对应关系用于群配合力的计算。之所以用群配合力是因为不需要把所有的组配模式获得的杂交组合都进行种植后再得到杂交组合的表型数据值去计算群配合力来筛选优异组配模式,而是用群里已组配过的自交系的表型数据值去计算两个群之间的特殊配合力,这样就实现了有效利用历史育种数据,以较少的田间组配量,最大程度选出强优势组合,提高育种效率。将类群划分后的所有类群进行不完全双列组配,获得许多个组配模式,利用已有的杂交种表型数据计算这些组配模式所对应的类群间的群特殊配合力,计算各类群间的群特殊配合力之后,对这些特殊配合力进行排序,筛选出优异组配模式,例如可以按照特殊配合力从大到小进行排序,将特殊配合力排名靠前(如排名前十或前二十等)的组配模式作为优异组配模式。
本发明实施例提出的一种基于SSR标记的玉米组配模式优选方法,以小群多模式为杂交育种思路,基于改进的遗传分析方法以及群配合力建立了组配模式的优选模型,能够有效地利用历史育种数据,以较少的田间组配量最大程度选出强优势组合,提高了育种效率。
其中,在所述步骤S1前还包括:
获取经SSR分子标记检测的DNA指纹数据材料,并根据预设的划分标准,将所述经SSR分子标记检测的DNA指纹数据材料划分为待测自交系和杂交种。
SSR是简单重复序列标记(Simple Sequence Repeat)的简称,是以PCR技术为核心的DNA分子标记技术,也称为微卫星DNA(Micro satellite DNA)。与其它分子标记相比,SSR标记具有以下的优点:数量丰富,覆盖整个基因组,揭示的多态性高;多等位基因的特性,提供的信息量高;以孟德尔方式遗传,呈共显性;其标记带型简单,记录的条带一致、客观且明确;采用PCR技术进行检测只需少量DNA样品,且质量要求不高;即使是部分降解的样品也可进行分析;每个位点由设计的引物顺序决定,便于不同的实验室相互交流合作开发引物。SSR是目前较为优秀的遗传标记技术之一。随着微卫星研究的深入,植物中的微卫星DNA不断被发现,新的序列大量进入GeneBank数据库中,可利用的成品SSR引物对越来越多,将可有效地减少SSR标记的烦琐操作,弥补其不足,它必定会在DNA多态性研究领域发挥更重要的作用。因此,本发明实施例均采用经SSR分子标记检测的DNA指纹数据作为材料。根据预设的划分标准,将所述经SSR分子标记检测的DNA指纹数据材料划分为待测自交系和杂交种。例如,预设的标准为当DNA指纹的杂合度>0.35时,为杂交种,杂合度<=0.35时,为待测自交系。
基于上述实施例,所述步骤S1进一步包括:
S11,为各类群分别选取一个自交系作为群代表;
S12,对每个待测自交系,确定与当前待测自交系遗传距离最短的群代表,并将当前待测自交系划归所述群代表所对应的类群;
其中,根据改进的SMC算法计算遗传距离。
玉米自交系的类群划分是合理选配亲本,构建玉米杂种优势群,以及预测杂种优势的依据。具体地,S11为各类群分别选取一个自交系作为群代表是指根据预设的条件为各类群分别选取一个自交系作为群代表,或者,在已有稳定类群的基础上,以这些类群中被熟知的自交系作为群代表。在群代表确定好之后,将所有待测自交系划分到与其遗传距离最短的群代表所对应的类群中,即有S12中对每个待测自交系,确定与当前待测自交系遗传距离最短的群代表,并将当前待测自交系划归所述群代表所对应的类群。其中,遗传距离是根据改进的SMC(Simple Matching Coefficient简单匹配系数)算法计算得到的。
基于待测自交系与群代表间遗传距离最短原则对所有待测自交系进行类群划分既适用于聚类式类群划分方法,也适应于判别式类群划分方法。
其中,聚类式类群划分方法的步骤为:
1)根据改进的SMC算法计算所有待测自交系间的遗传距离;
2)根据预设划分距离阈值确定独立个体;
独立个体单独构成一个群,即该群中只有一个个体,独立个体通常是与所有其他待测自交系的遗传距离都长于预设的划分距离阈值,即找不到与该独立个体遗传距离最短的群代表;
3)根据预设的划分距离阈值、有效位点数以及杂合度对待测自交系进行筛选,得到候选群代表;
满足预设条件的待测自交系可以作为候选的群代表,其中,划分距离阈值、有效位点数和杂合度,视样本和育种家的经验而定,尽量保证群代表的指纹质量。
4)为非独立个体找群代表,与非独立个体遗传距离最小的候选群代表可以成为该非独立个体的群代表,并将该非独立个体确定为该群的群成员。
非独立个体是指不能单独成群,也不能成为群代表的自交系。每个非独立个体所在的群中至少有两个自交系。
判别式类群划分方法的步骤为:在已有稳定类群的基础上,以这些类群中被熟知的自交系作为群代表,根据改进的SMC算法计算所有待测自交系与所有群代表之间的遗传距离;然后为每个待测自交系找群代表,即若当前待测自交系与某个群代表的遗传距离最短,则将该自交系归入该群代表所对应的类群中。
基于上述实施例,所述改进的SMC算法包括:
基于模糊对比原则计算两个DNA指纹数据的同一位点的相似程度,遗传距离的计算公式如下:
GD=1-∑Si/n (1)
式(1)中,Si为第i个位点的位点相似度,n为有效对比位点数,GD为遗传距离;
其中,每个位点的位点相似度的计算公式如下:
Si=NRA/NCA (2)
式(2)中,NRA代表重复等位基因个数,NCA代表参与对比的所有数据个数。
表1为遗传相似度计算结果,从位点相似度的算法来看,若在某位点上,两个样品(即DNA指纹数据)都是纯合子,非常简单,与精确对比相同,如表1中的位点3,该位点上没有重复的等位基因,NRA为0,所以,该位点的相似度是0;若一个是纯合子,另一个是杂合子,如表1中的位点4,NRA是277的个数,为2,NCA是对比数据的个数,为3,即该位点的相似度为2/3;若两个位点都是杂合子,如表1中的位点5,重复等位基因是326,即NRA为2,所有的数据个数为4,即NCA为4,所以该位点的相似度为1/2。由于位点2不是有效对比位点,所以不参与计算,这两个样品的遗传相似度如表1所示,S1和S2是样品名,LS(N)是Nei&Li的位点相似度,LS(S)是SMC的位点相似度,SS是改进SMC的位点相似度。由此可见,改进SMC方法的位点相似度值域是0到1之间的数值。
表1遗传相似度计算表
从算法的理念和计算结果来看,本文提出的改进SMC算法计算遗传距离比Nei&Li和SMC方法更精确,对共有位点的判断标准稍稍修改,以模糊匹配方式计算位点遗传相似度,有助于研究两个材料在位点上等位基因的共性。
基于上述实施例,所述步骤S2进一步包括:
S21,计算所有待测自交系对各亲本未知的杂交种的不包含度;
S22,对每个亲本未知的杂交种,选择两个对当前杂交种不包含度最小的待测自交系作为亲本进行组配,获得杂交组合,并计算所述杂交组合的指纹与当前杂交种指纹间的吻合度,根据所述吻合度推测当前杂交种与所述亲本间的对应关系。
具体地,S21计算所有待测自交系对各个杂交种的不包含度,不包含度是指自交系在指纹上不包含于杂交种指纹的程度,是包含度的反面。
S22,推测所有亲本未知的杂交种的亲本,杂交种亲本推测方法的原理是对每个杂交种,将与杂交种不包含度最小的两个待测自交系作为亲本进行组配,获得杂交组合,计算杂交组合指纹与杂交种指纹的吻合度,吻合度越高,这对自交系是杂交种亲本的概率越大。
通过不包含度,推测一对自交系A、B是否是杂交种C亲本的步骤如下:
(1)判断自交系A对该杂交种C的不包含度、自交系B对杂交种C的不包含度是否满足要求,即自交系A和自交系B是否为对该杂交种的不包含度最小的一对自交系;
(2)如果满足要求,则将A和B的指纹杂交,形成杂交组合AB。
(3)计算AB与C的指纹吻合度,方法同改进的SMC算法。
(4)AB与C的指纹吻合度越高,则自交系A和B越有可能是杂交种B的亲本,当吻合度为1时,AB和C确定是亲子关系。
将杂交种与亲本之间的对应关系保存下来。
基于上述实施例,S21中所述不包含度的计算公式为:
GNI=1-∑Ii/n (3)
式(3)中,Ii为第i个位点上的自交系包含于杂交种的程度,n为有效比对位点数;
其中,Ii的计算公式如下:
Ii=NIA/CIA (4)
式(4)中,NIA表示自交系包含于杂交种的等位基因个数,CIA表示自交系的等位基因个数。
基于上述实施例,步骤S3进一步包括:
S31,对类群划分后的各类群进行不完全双列组配,获得群组配模式;
S32,基于所有杂交种与亲本间的对应关系,在所述群组配模式中查找存在组配记录的群组配模式;
S33,计算所述存在组配记录的所有群组配模式所对应的类群间的特殊配合力;
S34,将所述特殊配合力按照从大到小进行排序,选择排名靠前的组配模式作为优异组配模式。
具体地,群配合力是指把两个群中的材料随机组配,以其组配出的杂交种的一般配合力的平均值作为两群的群配合力。优点在于充分利用已组配杂交种的试验结果,提高数据的利用率;减少田间试验,提高试验的可行性。S31中不完全双列组配是指对各类群划分后的各类群两两进行群间杂交,而不进行群内杂交,即杂交的亲本来自两个不同类群,进行不完全双列组配后,获得多个群组配模式。S32,基于所有杂交种与亲本间的对应关系,在获得的多个群组配模式中查找已经有过组配记录的群组配模式,这样就可以利用已有的育种数据,去计算该群组配模式所对应的两个类群间的群配合力,而不需要将该群组配模式所对应的所有杂交组合都去做田间试验后再计算群配合力,本发明实施例的方法适用于数据材料特别多的情况下,可以有效地提升优异组配模式的筛选效率。在S33中则利用已有的育种数据,即杂交种的某个类型的表型数据(例如产量数据)和自交系的该类型的表型数据,计算所述存在组配记录的所有群组配模式所对应的类群间的特殊配合力,最后S4中,将所述计算得到的特殊配合力按照从大到小进行排序,选择排名靠前的组配模式作为优异组配模式,例如,选择排名前十或排名前二十的群组配模式,具体选择排民前多少可以根据育种家需求而定。
其中,S33中计算类群间的特殊配合力的步骤为:
对任意一个群组配模式,利用已有的杂交种表型数据,获取所有杂交种的表型平均值、所述群组配模式所对应的所有杂交组合的表型平均值,并分别计算所述群组配模式所对应的两个类群中每个亲本所形成的杂种组合的表型平均值;
根据所述群组配模式所对应的两个类群中每个亲本所形成的杂种组合的表型平均值,以及所有杂交种的表型平均值分别计算所述两个类群的一般配合力;
根据所述所有杂交种的表型平均值、所述群组配模式所对应的所有杂交组合的表型平均值和所述两个类群的一般配合力,计算得到所述群组配模式所对应的类群间的特殊配合力。
具体地,自交系i和j的特殊配合力(SCAij)的计算方式如公式如下:
其中,GCAi是自交系i的一般配合力,Xij是自交系i和自交系j配成的杂交组合的某表型值,是所有组合的某表型的平均值,是与材料i组配的所有组合的某表型值之和。
根据上述自交系间特殊配合力的计算原理可得,步骤S33中对任一个群组配模式所对应的一对类群间的特殊配合力的计算公式为:
其中,
上述各式中,GSCAab是群a和群b的特殊配合力,Xab是群a和群b配成的所有杂交组合的表型平均值,GGCAa是群a的一般配合力,GGCAb是群b的一般配合力,是所有杂交种的表型平均值,Yij是群a中的亲本和群b中的亲本配成的某一杂交组合的某表型,Pab为群a和群b所组配的杂交组合个数,m为群a的亲本数,n为群b的亲本数,X为群a中每个亲本所形成的杂交组合的表型平均值,j=1,2,...,m,X为群b中每个亲本所形成的杂交组合的表型平均值,i=1,2,...,n。
即具体的计算过程为:
对任意一个群组配模式,首先利用已有的杂交种表型数据获取所有杂交种的表型平均值所述群组配模式所对应的所有杂交组合的表型平均值Xab,并分别计算所述群组配模式所对应的两个群中每个亲本所形成的杂种组合的表型平均值X(j=1,2,...,m)和X(i=1,2,...,n);
根据所述群组配模式所对应的两个群中每个亲本所形成的杂种组合的表型平均值X(j=1,2,...,m)和X(i=1,2,...,n),以及所有杂交种的表型平均值分别计算所述两个类群的一般配合力,即根据公式(6)、(7)分别得到群a的一般配合力GGCAa和群b的一般配合力GGCAb
根据所述所有杂交种的表型平均值、所述群组配模式所对应的所有杂交组合的表型平均值和所述两个类群的一般配合力,根据公式(5)计算得到所述群组配模式所对应的类群间的特殊配合力GSCAab
下面结合一个具体的例子,来说明本发明实施例的操作流程。
本发明以筛选东华北地区的玉米高产杂优模式为目标,利用3932份材料进行遗传关系分析,按照杂交组配模型的流程依次进行数据选取、遗传距离计算、类群划分、不包含度计算、杂交种亲本推测、组配模式优选的操作,并分析各个阶段的计算结果。
数据选取:选择经SSR分子标记检测的DNA指纹数据共3932份,其中自交系3206份,杂交种726份;区分自交系和杂交种的标准是,当DNA指纹的杂合度>0.35时,为杂交种,杂合度<=0.35时,为自交系。选用的40对SSR引物是由北京市农林科学院玉米研究中心报道的第Ⅰ组的20对基本核心引物和第Ⅱ组的20对扩展引物,这40对SSR引物为国家玉米品种区域试验DNA鉴定指定引物。使用ABI 3730xl测序仪对上述材料进行分型。
遗传距离计算:对3206份自交系计算遗传距离,形成3206×3206大小的矩阵,并将计算结果保存到Excel中,便于下一步类群划分使用。根据上述实施例中所述的SMC改进算法,计算遗传距离,以矩阵的形式显示,遗传距离介于0和1之间。对计算结果进行简单统计,某自交系与其他所有自交系遗传距离的平均值最大为0.7,最小0.49,平均值为0.6。
类群划分:假设目前没有已有的固定类群,对所有自交系进行类群划分。由于划分类群结果是受划分距离阈值影响的,阈值越大,群数量越少,每个群包含的自交系数量越多;阈值越小,群数量越多,每个群包含的自交系数量越少。如果要划分的材料没有重复材料,当阈值为1时,所有自交系都被划分到了一个群中;当阈值为0时,一个群里有一个材料。本实施方案中设定划分阈值0.35,最少有效位点为15,最小杂合度为0,最大杂合度为0.35。划分结果是:3602个自交系被划分为392个群,其中205个自交系独立成群,其他自交系被划分成187个群,最小的群中有2个成员,最大的群中有498个成员,群大小与群数量的关系如图2所示,从图可见,群成员数量主要集中在10个以下,占88%。
不包含度的计算:根据不包含度的计算方法,分别选择全部自交系和全部杂交种,计算即可得到所有自交系对所有杂交种的不包含度。以矩阵的形式显示,不包含度介于0和1之间。参与计算的所有材料的有效位点数都不少于15个,不存在没有意义的不包含度。在所有计算的不包含度结果中,最小值为0,最大值为1,平均值为0.43,可见这些自交系和杂交种中,一定存在亲子关系的自交系和杂交种。
推测杂交种亲本:首先设定自交系最少有效位点数15,双亲最大不包含度0.15,对每个亲本未知的杂交种,找到对其不包含度最小的一对自交系,并且满足前述条件才有可能成为亲本。并且一对亲本组成的杂交组合与杂交种的指纹吻合度不小于0.5时才能成为其亲本。经计算,指纹吻合度最小0.53,最大1,平均值0.85。其中指纹吻合度≥0.9的有320个,杂交种与亲本组配后形成的杂交组合的指纹吻合度如图3所示。
优选组配模式,经过以上遗传分析,已经满足了组配模式优选的数据条件,3206个自交系以阈值为0.35被划分为392个类群,利用推测杂交种亲本方式,推测出726个杂交种的双亲。对392个群进行不完全双列组配设计,生成(392×392-392)/2=76636个组配模式,经杂交种与亲本关系查询发现,这些群组配模式中,有302个模式已经有过组配记录,这302个组配模式利用了120个群。这些组配模式的已配杂交组合数量最少有1个,占总杂交组合数量的69%,已配杂交组合数量最多有81个。
以东华北玉米区高产为育种目标,对这些群组配模式计算产量特殊配合力,并按产量特殊配合力排序,群组配模式的优劣一目了然,选择前10名作为本次育种的杂优模式。杂交种产量值的值域为(429,840),组配模式的群特殊配合力值域为(-248,108),前10个杂优模式如表2。经过群一般配合力和特殊配合力分析,这些杂优模式有个共同的特点,即构成杂优模式的两个群的一般配合力差距比较大。另外,还发现前10名杂优模式中已组配过的杂交组合都只有一个,所以,历史数据对组配模式优选的影响比较大。
表2前10名杂优模式
另外,表3列出了已配组合数量较多的组配模式相关信息,这些组配模式在302个组配模式中排名中、下游,典型杂交种有农华101,先玉335,郑单958等,说明本发明采用的类群划分是有效的。
表3已配组合数量较多的组配模式
如图4所示,为本发明另一实施例提供一种基于SSR标记的玉米组配模式优选系统的结构示意图,包括:类群划分模块41、亲本关系获取模块42和优异模式筛选模块43,其中,
类群划分模块41,用于基于待测自交系与各类群的群代表间遗传距离最短原则,对所有待测自交系进行类群划分;
亲本关系获取模块42,用于对每个优势杂交种,选择两个对当前优势杂交种不包含度最小的不同类群中的待测自交系作为亲本进行组配,并获取优势杂交种与亲本间的对应关系;
优异模式筛选模块43,用于基于所有杂交种与亲本间的对应关系计算类群划分后各类群间的特殊配合力,并对所述特殊配合力进行排序,筛选出优异组配模式。
具体地,明确玉米自交系之间的血缘关系,准确地对其进行类群划分,是构建玉米杂种优势利用模式,有目的性地改良玉米自交系和选配杂交组合,提高玉米育种效率,减少育种工作盲目性的一个十分重要的途经。类群划分模块41用于进行自交系的类群划分,基于待测自交系与群代表间遗传距离最短原则是指从所有待测自交系中依据预设的条件挑选出某些自交系作为群代表,其它自交系与哪个群代表的遗传距离最小,即遗传相似度最大,便将该自交系归类到该群代表所代表的类群中。或者是,在已有稳定类群的基础上,以这些类群中被熟知的自交系作为群代表,计算待测自交系与这些群代表之间的遗传距离,确定待测自交系与哪个群代表间的遗传距离最小,则将该待测自交系划归至相应群代表所对应的类群中。其中,群代表的选取原则是杂合度低、有效位点多的自交系,具体的选取条件由育种家设置,并且该材料的遗传距离在区间(0,分组距离阈值)内的距离至少有一个。
亲本关系获取模块42中利用已有的杂交种数据材料,推测亲本未知的杂交种的亲本,以此来获取杂交种与待测自交系之间的遗传关系。本发明提出不包含度的概念来研究杂交种和自交系间的遗传关系。不包含度是指自交系在指纹上不包含于杂交种的程度。计算所有待测自交系与所有亲本未知的杂交种之间的不包含度之后,对每个亲本未知的杂交种,选择两个对该杂交种不包含度最小的待测自交系作为亲本进行组配,得到杂交组合,计算杂交组合的指纹与该杂交种指纹的吻合度,根据吻合度来推测这对亲本是否为该杂交种亲本。对于有亲本记录的杂交种,则已知其亲本,不需要推测其亲本,直接用记录数据即可。根据上述方法,可以获得所有杂交种与待测自交系间的对应关系,利用这个对应关系,可以更好地进行优异组配模式的筛选,而不再需要对所有组配模式获得的杂交组合去做田间试验。根据基于不包含度的杂交种双亲推测方法不但有利于掌握已有材料的遗传关系,还可以对研究杂交组配模式起到重大作用。
优异模式筛选模块43用于进行组配模式的优选,在对杂交种进行双亲推测后,获得所有杂交种与亲本间的对应关系,将该对应关系用于群配合力的计算。之所以用群配合力是因为不需要把所有的组配模式获得的杂交组合都进行种植后再得到杂交组合的表型数据值去计算群配合力来筛选优异组配模式,而是用群里已组配过的自交系的表型数据值去计算两个群之间的特殊配合力,这样就实现了有效利用历史育种数据,以较少的田间组配量,最大程度选出强优势组合,提高育种效率。将类群划分后的所有类群进行不完全双列组配,获得许多个组配模式,计算这些组配模式所对应的类群间的群特殊配合力,计算各类群间的群特殊配合力之后,对这些特殊配合力进行排序,筛选出优异组配模式,例如可以按照特殊配合力从大到小进行排序,将特殊配合力排名靠前(如排名前十或前二十等)的组配模式作为优异组配模式。
本发明实施例提出的一种基于SSR标记的玉米组配模式优选系统,以小群多模式为杂交育种思路,基于改进的遗传分析方法以及群配合力建立了组配模式的优选模型,能够有效地利用历史育种数据,以较少的田间组配量最大程度选出强优势组合,提高了育种效率。
其中,所述系统还包括:
材料获取模块,用于获取经SSR分子标记检测的DNA指纹数据材料,并根据预设的划分标准,将所述经SSR分子标记检测的DNA指纹数据材料划分为待测自交系和杂交种。
基于SSR的分子标记稳定性好,不易受环境因素的影响,因此,本发明实施例均采用经SSR分子标记检测的DNA指纹数据作为材料。根据预设的划分标准,将所述经SSR分子标记检测的DNA指纹数据材料划分为待测自交系和杂交种。例如,预设的标准为当DNA指纹的杂合度>0.35时,为杂交种,杂合度<=0.35时,为待测自交系。
最后,本发明的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于SSR标记的玉米组配模式优选方法,其特征在于,包括:
S1,基于待测自交系与群代表间遗传距离最短原则,对所有待测自交系进行类群划分;
S2,对每个亲本未知的杂交种,选择两个对当前杂交种不包含度最小的待测自交系作为亲本进行组配,并推测当前杂交种与亲本间的对应关系;
S3,基于所有杂交种与亲本间的对应关系计算类群划分后各类群间的特殊配合力,并对所述特殊配合力进行排序,筛选出优异组配模式。
2.根据权利要求1所述的方法,其特征在于,在所述步骤S1前还包括:
获取经SSR分子标记检测的DNA指纹数据材料,并根据预设的划分标准,将所述经SSR分子标记检测的DNA指纹数据材料划分为待测自交系和杂交种。
3.根据权利要求1所述的方法,其特征在于,所述步骤S1进一步包括:
S11,为各类群分别选取一个自交系作为群代表;
S12,对每个待测自交系,确定与当前待测自交系遗传距离最短的群代表,并将当前待测自交系划归所述群代表所对应的类群;
其中,根据改进的SMC算法计算遗传距离。
4.根据权利要求3所述的方法,其特征在于,所述改进的SMC算法包括:
基于模糊对比原则计算两个DNA指纹数据的同一位点的相似程度,遗传距离的计算公式如下:
GD=1-∑Si/n (1)
式(1)中,Si为第i个位点的位点相似度,n为有效对比位点数,GD为遗传距离;
其中,每个位点的位点相似度的计算公式如下:
Si=NRA/NCA (2)
式(2)中,NRA代表重复等位基因个数,NCA代表参与对比的所有数据个数。
5.根据权利要求1所述的方法,其特征在于,所述步骤S2进一步包括:
S21,计算所有待测自交系对各亲本未知的杂交种的不包含度;
S22,对每个亲本未知的杂交种,选择两个对当前杂交种不包含度最小的待测自交系作为亲本进行组配,获得杂交组合,并计算所述杂交组合的指纹与当前杂交种指纹间的吻合度,根据所述吻合度推测当前杂交种与所述亲本间的对应关系。
6.根据权利要求5所述的方法,其特征在于,S21中所述不包含度的计算公式为:
GNI=1-∑Ii/n (3)
式(3)中,Ii为第i个位点上的自交系包含于杂交种的程度,n为有效比对位点数;
其中,Ii的计算公式如下:
Ii=NIA/CIA (4)
式(4)中,NIA表示自交系包含于杂交种的等位基因个数,CIA表示自交系的等位基因个数。
7.根据权利要求1所述的方法,其特征在于,所述步骤S3进一步包括:
S31,对类群划分后的各类群进行不完全双列组配,获得群组配模式;
S32,基于所有杂交种与亲本间的对应关系,在所述群组配模式中查找存在组配记录的群组配模式;
S33,计算所述存在组配记录的所有群组配模式所对应的类群间的特殊配合力;
S34,将所述特殊配合力按照从大到小进行排序,选择排名靠前的组配模式作为优异组配模式。
8.根据权利要求7所述的方法,其特征在于,S33中计算类群间的特殊配合力的步骤为:
对任意一个群组配模式,利用已有的杂交种表型数据,获取所有杂交种的表型平均值、所述群组配模式所对应的所有杂交组合的表型平均值以及所述群组配模式所对应的两个类群中每个亲本所形成的杂种组合的表型平均值;
根据所述群组配模式所对应的两个类群中每个亲本所形成的杂种组合的表型平均值以及所有杂交种的表型平均值分别计算所述两个类群的一般配合力;
根据所述所有杂交种的表型平均值、所述群组配模式所对应的所有杂交组合的表型平均值和所述两个类群的一般配合力,计算得到所述群组配模式所对应的类群间的特殊配合力。
9.一种基于SSR标记的玉米组配模式优选系统,其特征在于,包括:
类群划分模块,用于基于待测自交系与群代表间遗传距离最短原则,对所有待测自交系进行类群划分;
亲本推测模块,用于对每个亲本未知的杂交种,选择两个对当前杂交种不包含度最小的待测自交系作为亲本进行组配,并推测当前杂交种与亲本间的对应关系;
优异模式筛选模块,用于基于所有杂交种与亲本间的对应关系计算类群划分后各类群间的特殊配合力,并对所述特殊配合力进行排序,筛选出优异组配模式。
10.一种基于SSR标记的玉米组配模式优选系统,其特征在于,还包括:
材料获取模块,获取经SSR分子标记检测的DNA指纹数据材料,并根据预设的划分标准,将所述经SSR分子标记检测的DNA指纹数据材料划分为待测自交系和杂交种。
CN201710762834.XA 2017-08-28 2017-08-28 一种基于ssr标记的玉米组配模式优选方法及系统 Active CN107535350B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710762834.XA CN107535350B (zh) 2017-08-28 2017-08-28 一种基于ssr标记的玉米组配模式优选方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710762834.XA CN107535350B (zh) 2017-08-28 2017-08-28 一种基于ssr标记的玉米组配模式优选方法及系统

Publications (2)

Publication Number Publication Date
CN107535350A true CN107535350A (zh) 2018-01-05
CN107535350B CN107535350B (zh) 2020-04-10

Family

ID=60959202

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710762834.XA Active CN107535350B (zh) 2017-08-28 2017-08-28 一种基于ssr标记的玉米组配模式优选方法及系统

Country Status (1)

Country Link
CN (1) CN107535350B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108416189A (zh) * 2018-02-08 2018-08-17 北京市农林科学院 一种基于分子标记技术的农作物品种杂种优势模式鉴定方法
CN108427866A (zh) * 2018-02-08 2018-08-21 北京市农林科学院 一种基于分子标记技术的农作物自交系类群的鉴定方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1922982A (zh) * 2006-09-14 2007-03-07 中国农业大学 一种辅助选育玉米自交系的方法及其应用
EP1962212A1 (en) * 2007-01-17 2008-08-27 Syngeta Participations AG Process for selecting individuals and designing a breeding program
CN105046108A (zh) * 2015-07-07 2015-11-11 中国农业大学 基于自交系ssr和表型信息的玉米杂交组配方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1922982A (zh) * 2006-09-14 2007-03-07 中国农业大学 一种辅助选育玉米自交系的方法及其应用
EP1962212A1 (en) * 2007-01-17 2008-08-27 Syngeta Participations AG Process for selecting individuals and designing a breeding program
CN105046108A (zh) * 2015-07-07 2015-11-11 中国农业大学 基于自交系ssr和表型信息的玉米杂交组配方法和系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SU XIA XU等: "The use of SSRs for predicting the hybrid yield and yield heterosis in 15 key inbred lines of Chinese maize", 《HEREDITAS》 *
刘志雄: "SSR分子标记在玉米遗传育种中的应用", 《中国优秀硕士学位论文全文数据库》 *
段智利等: "利用配合力和分子标记划分玉米自交系杂种优势群", 《分子植物育种》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108416189A (zh) * 2018-02-08 2018-08-17 北京市农林科学院 一种基于分子标记技术的农作物品种杂种优势模式鉴定方法
CN108427866A (zh) * 2018-02-08 2018-08-21 北京市农林科学院 一种基于分子标记技术的农作物自交系类群的鉴定方法
CN108416189B (zh) * 2018-02-08 2022-02-08 北京市农林科学院 一种基于分子标记技术的农作物品种杂种优势模式鉴定方法
CN108427866B (zh) * 2018-02-08 2022-03-01 北京市农林科学院 一种基于分子标记技术的农作物自交系类群的鉴定方法

Also Published As

Publication number Publication date
CN107535350B (zh) 2020-04-10

Similar Documents

Publication Publication Date Title
Barnaud et al. Local genetic diversity of sorghum in a village in northern Cameroon: structure and dynamics of landraces
Lu et al. Molecular characterization of global maize breeding germplasm based on genome-wide single nucleotide polymorphisms
Trucco et al. Amaranthus
Ni et al. Genetic diversity and population structure of ramie (Boehmeria nivea L.)
Wambulwa et al. Nuclear microsatellites reveal the genetic architecture and breeding history of tea germplasm of East Africa
Schulthess et al. Genomics-informed prebreeding unlocks the diversity in genebanks for wheat improvement
Jin et al. Genetic diversity of 324 cultivated tomato germplasm resources using agronomic traits and InDel markers
Shen et al. Development of GBTS and KASP panels for genetic diversity, population structure, and fingerprinting of a large collection of broccoli (Brassica oleracea L. var. italica) in China
Li et al. Genetic diversity analysis of Gossypium arboreum germplasm accessions using genotyping-by-sequencing
Li et al. Association mapping identifies markers related to major early‐maturating traits in upland cotton (Gossypium hirsutum L.)
Wang et al. Analysis of the genetic structure and diversity of upland cotton groups in different planting areas based on SNP markers
CN114774570B (zh) 与小麦茎基腐病抗性qtl紧密连锁的分子标记及应用
CN107535350A (zh) 一种基于ssr标记的玉米组配模式优选方法及系统
CN112226529A (zh) 一种冬瓜抗枯萎病基因的snp分子标记及应用
Muehlbauer et al. Application of the Near‐Isogenic Line Gene Mapping Technique to Isozyme Markers
Maulana et al. Hybrid performance as related to genomic diversity and population structure in public sorghum inbred lines
CN108416189B (zh) 一种基于分子标记技术的农作物品种杂种优势模式鉴定方法
Olmos et al. Genetic diversity and linkage disequilibrium in the Argentine public maize inbred line collection
CN114231656A (zh) 花菜杂交种纯度鉴定的ssr核心引物组及其筛选方法和应用
CN111100946B (zh) 一种油菜粒重性状主效基因位点的分子标记引物及应用
CN107447022A (zh) 一种预测玉米杂种优势的snp分子标记及应用
Taranto et al. An overview of genotyping by sequencing in crop species and its application in pepper
Feng et al. Identification of genomewide single-nucleotide polymorphisms associated with presummer, summer and autumn bolls in upland cotton
Sun et al. Genetic Diversity and Association Analysis of Lint Percentage Variation Population in Gossypium Hirsutum L. Based on Microsatellite Markers
CN108060246B (zh) 一种与陆地棉7号染色体纤维强度相关的单体型

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant