CN105868584B - 通过选取极端性状个体来进行全基因组选择育种的方法 - Google Patents

通过选取极端性状个体来进行全基因组选择育种的方法 Download PDF

Info

Publication number
CN105868584B
CN105868584B CN201610341966.0A CN201610341966A CN105868584B CN 105868584 B CN105868584 B CN 105868584B CN 201610341966 A CN201610341966 A CN 201610341966A CN 105868584 B CN105868584 B CN 105868584B
Authority
CN
China
Prior art keywords
group
estimation
individual
extreme
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610341966.0A
Other languages
English (en)
Other versions
CN105868584A (zh
Inventor
邱和松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Shengji Technology Co Ltd
Original Assignee
Xiamen Shengji Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Shengji Technology Co Ltd filed Critical Xiamen Shengji Technology Co Ltd
Priority to CN201610341966.0A priority Critical patent/CN105868584B/zh
Publication of CN105868584A publication Critical patent/CN105868584A/zh
Application granted granted Critical
Publication of CN105868584B publication Critical patent/CN105868584B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Abstract

本发明公开了一种通过选取极端性状个体来进行全基因组选择育种的方法,对于某一数量性状,选取一部分性状表现上极端的个体,其中最高和最低的个体各占一半;构建估计群体,并进行估计群体性状测量;对极端性状参考群和估计群进行基因组测序和全基因组SNP标记挖掘;利用极端个体的表型值和基因型信息,计算每个SNP标记的育种效应值,并使用估计群全基因组分型,得到估计群个体的育种值,对估计群进行最终的选种。本发明尽可能少地牺牲基因组育种值估计准确度,节省大量的基因组测序费用;也通过极端群体降低了参考群体的大小对基因组选择准确度的影响,有利于样本珍贵的物种的相关研究,为基因组选择在各个物种上开展提供新的思路。

Description

通过选取极端性状个体来进行全基因组选择育种的方法
技术领域
本发明涉及生物信息学和基因组选择育种领域,具体是一种通过选取极端性状个体来进行全基因组选择育种的方法。
背景技术
育种是农业养殖中动植物繁育的重要内容,是优良品种培育和保持的重要方法。传统的人工育种是直接通过动植物的经济性状进行选种。由于农业上大多数的物种已经经历上长时间的人工选育,传统的人工选择的方法在现代农业很多物种的应用效果越来越有限。
随着动植物基因组和重要性状相关的基因定位和功能研究的深入,Meuwissen 等在2001年提出了利用全基因标记分型进行分子育种的方法,即基因组选择育种。全基因组选择本质上是一种基于全基因组范围内的标记辅助选择方法,其基本思想是:通过参考群体性状测定获得全基因组育种值,使用性状相关的 QTLs紧密连锁的 SNP 位点,应用统计学方法计算出每一个位点所对应的育种值大小; 然后再根据估计群体的个体的基因分型,对所要选择的个体进行全基因组育种值估计(genomic estimated breeding value,GEBV), 最后根据育种值的高低进行选择育种。
在基因组选择应用中需要两类群体:即参考群体和估计群体。基因组选择需要对参考群和估计群的个体进行全基因组的大量SNP分型。虽然现在有基因芯片和全基因组测序的生物基因可以用于大规模基因分型,但是上述芯片和测序费用昂贵,如果将所有参考群体都进行测序的话,成本是相当大的。因此,如果能够只测定一部分性状上有代表性的个体的基因型,就可以大大节省基因组选择的成本。本发明提出利用的极端性状的个体构建参考群,这样可以在低样本情况下挖掘到重要性状显著相关的SNP位点,利用这些位点对估计群进行基因组选择,从而大大降低基因组选择的测序费用。
发明内容
本发明的目的在于提供一种通过选取极端性状个体来进行全基因组选择育种的方法,通过性状测定获取每个参考群个体的表型值,然后只选取其中极端性状的部分的个体进行测序,从而降低对参考群体的测序费用,这些被测序的个体中,性能表现上最优和最差的个体各占一半,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种通过选取极端性状个体来进行全基因组选择育种的方法,对于某一数量性状,选取一部分性状表现上极端的个体,其中最高和最低的个体各占一半;构建估计群体,并进行估计群体性状测量;对极端性状参考群和估计群进行基因组测序和全基因组SNP标记挖掘;利用极端个体的表型值和基因型信息,计算每个SNP标记的育种效应值,并使用估计群全基因组分型,得到估计群个体的育种值,对估计群进行最终的选种。
作为本发明进一步的方案:所述的通过选取极端性状个体来进行全基因组选择育种的方法,具体包括以下步骤:
(1)选取极端性状的个体,构建极端性状参考群:
a.对所有估计群和参考群个体进行性状测量,获得所有个体的性状数据;
b.分析上述性状数据,通过统计分析和预先欲构建的极端群体参考群大小估计极端性状值范围;
c.根据极端性状值,确定组成极端性状参考群体的个体,其中最高和最低极端性状数目相等;
(2)构建估计群体,估计群体性状测量:
d.构建估计群体,保证估计群体的遗传背景尽量与参考群一致;
e.对估计群体的个体,依次测量其性状;
(3)对性状极端个体和估计群体进行基因组测序和全基因组SNP标记挖掘:
f.使用全基因组测序技术对极端性状参考群和估计群构建基因组测序文库;
g.使用高通量测序技术完成极端性状个体和估计群的基因组测序,并使用生物信息学技术获得参考群和估计群全基因组的SNP分型数据;
h.上述过程也能通过生物芯片高通量分型技术获得;
(4)计算每个SNP标记的育种效应值,对估计群进行育种值估计:
i.利用极端个体的表型值和基因型信息,加入到基于GBLUP、Bayes分析方法的基因组预测模型,计算每个SNP标记的育种效应值;
j.利用估计群全基因组分型结果和每个SNP的效应值,计算估计群每个个体的育种值;
k.对估计群个体按照育种值高低进行排列,选取育种高的个体进行育种。
作为本发明再进一步的方案:通过选择性状表现上极端的个体进行测序,从而预测估计群体的基因组育种值,通过只对部分个体进行测序,从而达到节省基因组测序费用的目的。
作为本发明再进一步的方案:将所有个体表型值进行排序,筛选其中表现最优和最差的极端个体作为参考群体。
作为本发明再进一步的方案:筛选出的个体中,最优和最差的个体各占一半。
作为本发明再进一步的方案:只对筛选出来的个体进行基因组测序,对其他个体不再进行测序。
与现有技术相比,本发明的有益效果是:
1.本发明能不增加任何额外费用的基础上,通过筛选性状表现最高和最低的个体构建参考群进行基因组测序,从而实现进行全基因组选择育种。
2.本发明在牺牲极少的GEBV估计准确度的基础上,能够节省大量的基因组的测序费用,为基因组选择的广泛应用实践提供了基础。
3.本发明的效果受全基因组分子标记数目和动植物物种的影响比较小,在一定程度上降低了参考群的规模,为难以获得大量样品的物种的相关研究带来了方便,为各种动植物基因组选择应用的开展提供了新的思路。
附图说明
图1为通过选取极端性状个体来进行全基因组选择育种的方法的流程图。
图2为通过选取极端性状个体来进行全基因组选择育种的方法中估计准确度在不同数量的极端选择个体和随机选择个体下的变化趋势图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1~2,本发明实施例中,一种通过选取极端性状个体来进行全基因组选择育种的方法,通过XII QTL-MAS会议提供的基因组选择数据包括如下步骤:
(1)试验群体和标记信息
试验群体为XII QTL-MAS(http://www.ncbi.nlm.nih.gov/pubmed/19278535?dopt=Abstract)研讨会上所使用的 模拟群体,所述群体分为参考群和估计群,其中参考群个体数为4665,估计群为1200,所模拟的性状遗传力为0.3,一共模拟6条染色体,共5726个SNP标记;
(2)极端性状参考群体的获得
将参考群体的4665个个体按照表型值由高到低进行排序,然后选择一部分极端的个体,其中表型值最高和最低的个体各占一半,为能够和极端个体的结果进行比较,也随机选择同样数量的随机个体作为对照,所筛选的个体数量分别从4000一直到500(分成8个组别,每个组别相差500个体);
(3)利用极端性状参考群体的性状和SNP分型数据获得SNP位点育种效应值
使用R和java程序,利用GBLUP算法实现SNP效应值的估算的方法,将筛选出来的个体表型和基因组SNP分型结果加入到基因组选择预测模型中,估计每个SNP位点的育种效应值;
(4)估计群个体育种值计算
利用估计群的基因型结果和SNP位点效应值,通过GBLUP算法预测估计群体的估计育种值(GEBV)。结合计算机模拟出的真实育种值(TBV),与GEBV做线性回归分析,评估GEBV的估计准确度。其中GEBV高的个体为用于繁育后代的亲本。
(5)分析实验结果,评估基于极端群体的基因组选择的选育效果
观察实验结果,以寻找最合适的极端个体比例作为后续实际生产中的标准,以图2为例,我们可以看到筛选极端个体,GEBV准确度随个体数下降的速度明显低于随机选择个体;当极端个体数量为2500时,所估计的GEBV准确度是所有个体估计出的GEBV准确度的97.1%,也就是说当牺牲不到3%的GEBV准确度进行基因组选择时,却可以节省46.4%的测序成本。在本实施例中,可以选择53.6%的极端个体进行基因组测序,从而节省大量的来自于参考群体的测序费用。
本发明通过将所有参考群个体中性状表现型最高和最低的个体筛选出来构建极端参考群,只对该部分个体进行基因组测序,进而获得估计群体的基因组育种值。由于只对部分个体进行测序,因此可以达到节省测序成本的目的。本发明的方法可以尽可能少地牺牲基因组育种值估计准确度,并且节省大量的基因组测序费用;同时本发明也通过极端群体降低了参考群体的大小对基因组选择准确度的影响,有利于样本珍贵的物种的相关研究,为基因组选择在各个物种上开展提供新的思路。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (5)

1.一种通过选取极端性状个体来进行全基因组选择育种的方法,其特征在于,构建 极端性状参考群,对于某一数量性状,选取一部分性状表现上极端的个体;构建估计群体,并进行估计群体性状测量;对极端性状参考群和估计群进行基因组测序和全基因组SNP标记挖掘;利用极端个体的表型值和基因型信息,计算每个SNP标记的育种效应值,并使用估计群全基因组分型,得到估计群个体的育种值,对估计群进行最终的选种。
2.根据权利要求1所述的通过选取极端性状个体来进行全基因组选择育种的方法,其特征在于,具体包括以下步骤:
(1)选取极端性状的个体,构建极端性状参考群:
a.对所有估计群和参考群个体进行性状测量,获得所有个体的性状数据;
b.分析上述性状数据,通过统计分析和预先欲构建的极端群体参考群大小估计极端性状值范围;
c.根据极端性状值,确定组成极端性状参考群体的个体;
(2)构建估计群体,估计群体性状测量:
d.构建估计群体,保证估计群体的遗传背景尽量与参考群一致;
e.对估计群体的个体,依次测量其性状;
(3)对性状极端个体和估计群体进行基因组测序和全基因组SNP标记挖掘:
f.使用全基因组测序技术对极端性状参考群和估计群构建基因组测序文库;
g.使用高通量测序技术完成极端性状个体和估计群的基因组测序,并使用生物信息学技术获得参考群和估计群全基因组的SNP分型数据;
h.步骤g也能通过生物芯片高通量分型技术获得;
(4)计算每个SNP标记的育种效应值,对估计群进行育种值估计:
i.利用极端个体的表型值和基因型信息,加入到基于GBLUP、Bayes分析方法的基因组预测模型,计算每个SNP标记的育种效应值;
j.利用估计群全基因组分型结果和每个SNP的效应值,计算估计群每个个体的育种值;
k.对估计群个体按照育种值高低进行排列,选取育种高的个体进行育种。
3.根据权利要求1或2所述的通过选取极端性状个体来进行全基因组选择育种的方法,其特征在于,通过选择性状表现上极端的个体进行测序,从而预测估计群体的基因组育种值,通过只对部分个体进行测序,从而达到节省基因组测序费用的目的。
4.根据权利要求1或2所述的通过选取极端性状个体来进行全基因组选择育种的方法,其特征在于,将所有个体表型值进行排序。
5.根据权利要求1或2所述的通过选取极端性状个体来进行全基因组选择育种的方法,其特征在于,只对筛选出来的个体进行基因组测序,对其他个体不再进行测序。
CN201610341966.0A 2016-05-23 2016-05-23 通过选取极端性状个体来进行全基因组选择育种的方法 Active CN105868584B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610341966.0A CN105868584B (zh) 2016-05-23 2016-05-23 通过选取极端性状个体来进行全基因组选择育种的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610341966.0A CN105868584B (zh) 2016-05-23 2016-05-23 通过选取极端性状个体来进行全基因组选择育种的方法

Publications (2)

Publication Number Publication Date
CN105868584A CN105868584A (zh) 2016-08-17
CN105868584B true CN105868584B (zh) 2019-03-26

Family

ID=56635703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610341966.0A Active CN105868584B (zh) 2016-05-23 2016-05-23 通过选取极端性状个体来进行全基因组选择育种的方法

Country Status (1)

Country Link
CN (1) CN105868584B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107338321B (zh) * 2017-08-29 2020-05-19 集美大学 一种确定最佳snp数量及其通过筛选标记对大黄鱼生产性能进行基因组选择育种的方法
CN109817281B (zh) * 2019-01-23 2022-12-23 湖南农业大学 基因组品种构成的估计方法、装置及电子设备
CN111524545B (zh) * 2020-04-30 2023-11-10 天津诺禾致源生物信息科技有限公司 全基因组选择育种的方法和装置
CN113373245A (zh) * 2021-07-14 2021-09-10 广东海洋大学 基于全基因组选择的马氏珠母贝金黄壳色性状良种培育方法
CN114220478A (zh) * 2021-11-29 2022-03-22 北京东方联鸣科技发展有限公司 牧场动物体征全数字智能采集系统
CN115579057A (zh) * 2022-09-15 2023-01-06 中国科学院植物研究所 基于全基因组选择研究的水稻籽粒镉积累性状预测装置和预警系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914631A (zh) * 2014-02-26 2014-07-09 中国农业大学 一种基于snp芯片的综合基因组育种值估计方法及应用
CN103914632A (zh) * 2014-02-26 2014-07-09 中国农业大学 一种快速估计基因组育种值的方法和应用

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050026173A1 (en) * 2003-02-27 2005-02-03 Methexis Genomics, N.V. Genetic diagnosis using multiple sequence variant analysis combined with mass spectrometry

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914631A (zh) * 2014-02-26 2014-07-09 中国农业大学 一种基于snp芯片的综合基因组育种值估计方法及应用
CN103914632A (zh) * 2014-02-26 2014-07-09 中国农业大学 一种快速估计基因组育种值的方法和应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
全基因组关联分析和全基因组预测法解析犬髋关节疾病;周正奎;《中国博士学位论文全文数据库 农业科技辑》;20120315;第D050-11页
基于SNP芯片和全测序数据的奶牛全基因组关联分析和基因组选择研究;吴晓平;《中国博士学位论文全文数据库 农业科技辑》;20150315;第D050-14页

Also Published As

Publication number Publication date
CN105868584A (zh) 2016-08-17

Similar Documents

Publication Publication Date Title
CN105868584B (zh) 通过选取极端性状个体来进行全基因组选择育种的方法
Holderegger et al. Adaptive vs. neutral genetic diversity: implications for landscape genetics
Burstin et al. Genetic diversity and trait genomic prediction in a pea diversity panel
Zhang et al. Accuracy of whole-genome prediction using a genetic architecture-enhanced variance-covariance matrix
Heffner et al. Genomic selection accuracy using multifamily prediction models in a wheat breeding program
CN107278877B (zh) 一种玉米出籽率的全基因组选择育种方法
Porter Subterranean biogeography: what have we learned from molecular techniques
CN111223520B (zh) 一种预测烟草尼古丁含量的全基因组选择模型及其应用
CN107419000A (zh) 一种基于单倍型取样预测大豆农艺性状表型的全基因选择方法及其应用
Phillips Testing hypotheses regarding the genetics of adaptation
CN110782943B (zh) 一种预测烟草株高的全基因组选择模型及其应用
Wang et al. Spatial genetic structure and restricted gene flow in a functionally dioecious fig, Ficus pumila L. var. pumila (Moraceae)
Raffo et al. Integrating a growth degree-days based reaction norm methodology and multi-trait modeling for genomic prediction in wheat
CN110853711B (zh) 一种预测烟草果糖含量的全基因组选择模型及其应用
CN108388765A (zh) 基于网络平台的全基因组选择育种值无偏估计工具gs1.0
CN109346124A (zh) 基于snp分型的遗传定位方法
Bailey et al. Are solitary and gregarious Mormon crickets (Anabrus simplex, Orthoptera, Tettigoniidae) genetically distinct?
Eizenga et al. Phenotypic variation and the impact of admixture in the Oryza rufipogon species complex (ORSC)
CN107267641B (zh) 一种小麦品种遗传组成图谱的绘制方法
CN110853710B (zh) 一种预测烟草淀粉含量的全基因组选择模型及其应用
CN109706231A (zh) 一种用于凡纳滨对虾分子育种的高通量snp分型方法
CN111898807B (zh) 一种基于全基因组选择烟叶产量预测方法及应用
CN105462964B (zh) 水稻中胚轴延长特性相关的分子标记及其应用
CN108416189A (zh) 一种基于分子标记技术的农作物品种杂种优势模式鉴定方法
CN111798920B (zh) 基于全基因组选择烟草经济性状表型值预测方法及应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant