CN110867208B - 一种提高水产动物全基因组选择育种效率的方法 - Google Patents

一种提高水产动物全基因组选择育种效率的方法 Download PDF

Info

Publication number
CN110867208B
CN110867208B CN201911196722.8A CN201911196722A CN110867208B CN 110867208 B CN110867208 B CN 110867208B CN 201911196722 A CN201911196722 A CN 201911196722A CN 110867208 B CN110867208 B CN 110867208B
Authority
CN
China
Prior art keywords
breeding
value
whole genome
analysis
marker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911196722.8A
Other languages
English (en)
Other versions
CN110867208A (zh
Inventor
李富花
于洋
罗正
相建海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Oceanology of CAS
Original Assignee
Institute of Oceanology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Oceanology of CAS filed Critical Institute of Oceanology of CAS
Priority to CN201911196722.8A priority Critical patent/CN110867208B/zh
Publication of CN110867208A publication Critical patent/CN110867208A/zh
Application granted granted Critical
Publication of CN110867208B publication Critical patent/CN110867208B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/80Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in fisheries management
    • Y02A40/81Aquaculture, e.g. of fish

Landscapes

  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种适合水产的动物的全基因组选择育种方法,具体地,对育种基础群或核心群个体的进行高密度SNP分型,并测定其目标性状的表型值,利用SNP分型数据和表型数据进行全基因组关联分析(GWAS)分析,获得每个SNP标记的显著性P值,并将标记按照P值由低到高排序,根据不同的性状,按照P值选择排序靠前的不同标记数组合,利用全基因组选择分析方法包括GBLUP、BayesB等进行分析,通过交叉验证评估按照P值选择的不同标记数的预测准确性,最终确定出预测准确性最高的标记组合。利用筛选出的最优标记组合对候选群体或者下一代育种群体进行SNP分型,使用GBLUP、BayesB或者ssGBLUP等方法对候选群体或者下一代育种群体进行育种值预测,可以显著提高预测的准确性。

Description

一种提高水产动物全基因组选择育种效率的方法
技术领域
本发明属于分子育种领域,具体涉及一种适合水产动物的全基因组选择育种方法。
背景技术
全基因组选择育种最早由Meuwissen于2001年提出,其利用覆盖全基因组的SNP标记对参考群体和候选群体进行分型,根据参考群体的表型和基因型信息,获得每个SNP标记的效应,利用SNP效应对候选群体进行预测和评估。随着高通量的SNP分型技术的发展,该方法在比较重要的经济动物包括奶牛、猪、鸡等进行了应用。
为了提高全基因组选择的效率,研究人员开展一系列工作,一方面是发展高密度SNP分型方法,目前普遍使用的SNP芯片一般在50000个标记左右,更高密度的200000个标记的芯片也有应用;一方面是分析影响全基因组选择准确率的因素,包括参考群体的选择,标记数量的选择,群体亲缘关系等,从而为全基因组选择的应用提供指导;另一个方面是开发高效的全基因组选择算法,目前已经开发了包括GBLUP、BayesA、BayesB、BayesLASSO、ss-GBLUP等多种分析方法,这些研究工作极大地推动了全基因组选择技术在育种中的应用,也大大加速了多个畜禽品种的良种选育进展。
然而,对于水产动物,单个个体的价值往往较低,全基因组选择方法的应用仍受大较大限制,主要是相对高昂的SNP分型成本限制了该方法的应用,另外,育种效率的提升不明显也限制了该方法的广泛应用。
本发明旨在提供一种通过低密度标记实现准确的全基因组选择的方法,该方法实现了全基因组关联分析方法和全基因组选择方法的结合,充分利用了效应SNP标记,降低了SNP分型成本,提高了全基因组选择准确率。该方法适合所有的水产动物中实施,具有广阔的应用前景。
发明内容
为实现上述目的,本发明采用的技术方案为:
一种利用低密度SNP标记提高水产动物全基因组选择育种效率的方法,其特征在于:对参考群体进行高密度SNP分型,并测定个体的目标表型性状,利用SNP分型数据和表型数据进行全基因组关联分析(GWAS),根据GWAS分析获得每个SNP标记的P值进行标记选择,并利用选择出的最优标记组合对候选群体或者下一代育种群体进行SNP分型,通过GBLUP、BayesB、ssGBLUP等方法预测候选群体或者下一代育种群体的育种值,实现全基因组选育,提高育种的准确性。
根据GWAS分析获得每个SNP标记的P值进行标记选择的方法:根据GWAS分析获得每个SNP标记的显著性P值,并将标记按照P值由低到高排序,分别选择排序前500,前1000,前2000,前5000个标记和全部标记,利用全基因组选择分析方法包括GBLUP、BayesB、ssGBLUP等进行分析,通过交叉验证评估按照P值选择的不同标记数的预测准确性,最终确定出预测准确性最高的标记组合。
利用低密度标记提高全基因组选择效率的方法,其特征在于:利用筛选出的最优标记组合对参考群体和候选群体进行SNP分型,利用常用的GBLUP、BayesB、ssGBLUP等软件对候选群体进行基因组育种值预测,其预测准确率较使用全部标记显著提升,尤其是对于低遗传力性状,其准确率的提升更为明显。并且由于所筛选的标记组合数均低于5000,SNP分型成本较全部标记大幅下降,也大大降低了分型和分析成本,提高了全基因组选择的效率。
本发明还提供了上述全基因组选择育种方法在水产动物中的应用,较传统全基因组选择方法具有准确率高、成本低的优势,可以广泛水产动物的全基因组选育。
本发明所具有的优点:
(1)本发明所提供全基因组选择育种方法,首先对核心育种群体进行全基因组关联分析,获得每个SNP位点的效应,从而筛选出最优的用于全基因组选择的标记组合,可以提高预测的准确率。
(2)本发明仅使用有效应的SNP标记进行全基因组选择育种分析,相较于使用高密度的SNP标记能够大幅降低分型成本,有利于该方法的推广应用。
(3)本发明所提供的方法对于低遗传力的性状,预测准确率的提升更高,因此该方法可以大大加速低遗传力性状如抗性、品质等的育种进展。
附图说明
图1基于GWAS选择标记进行对虾体重性状全基因组选择分析结果。
图2基于GWAS标记进行大西洋鲑鱼抗病性状全基因组选择分析结果。
具体实施方式
实施例1:一种提高水产动物全基因组选择育种效率的方法
(1)数据来源
1.对虾分析的数据包括200个个体的SNP分型数据和表型数据,SNP分型数据通过2b-RAD的分型方法获得(Wang Q.,Yu Y.,Zhang Q.,Zhang X.,Huang H.,Xiang J.&Li F.(2019)Evaluation on the genomic selection in Litopenaeus vannamei for theresistance against Vibrio parahaemolyticus.Aquaculture 505,212-6),2b-RAD的测序的数据与已经发表的凡纳滨对虾参考基因组(Xiaojun Zhang,Jianbo Yuan,Yamin Sun,Shihao Li,Yi Gao,Yang Yu,Chengzhang Liu,Quanchao Wang,Xinjia Lv,Xiaoxi Zhang,Ka Yan Ma,Xiaobo Wang,Wenchao Lin,Long Wang,Xueli Zhu,Chengsong Zhang,JiquanZhang,Songjun Jin,Kuijie Yu,Jie Kong,Peng Xu,Jack Chen,Hongbin Zhang,PatrickSorgeloos,Amir Sagi,Acacia Alcivar-Warren,Zhanjiang Liu,Lei Wang,Jue Ruan,KaHou Chu*,Bin Liu*,Fuhua Li*,Jianhai Xiang*,Penaeid shrimp genome providesinsights into benthic adaptation and frequent molting,Nature Communications,2019,10:356)比对进行SNP分型,进一步通过最小等位基因频率过滤(>0.05)和位点分型成功率过滤(>0.9)后每个个体94,113个SNP标记用于后续的分析,同时测定并记录每个个体的体重,每个个体的SNP分型信息和体重信息用于后续的GWAS分析和全基因选择育种分析。
大西洋鲑鱼的数据下载于已经发表的文章(Robledo D.,Matika O.,HamiltonA.&Houston R.D.(2018)Genome-Wide Association and Genomic Selection forResistance to Amoebic Gill Disease in Atlantic Salmon.G3-Genes|Genomes|Genetics 8,1195-1203),总计包括1481个个体的分型数据,通过最小等位基因频率过滤(>0.05)和位点分型成功率过滤(>0.9)后最终保留了1,430个个体的7,168个SNP分型信息。其表型数据为“阿米巴鳃病”的抗性指标,包括“腮评分值指标”和“阿米巴虫载量”指标,这两个性状的遗传力分别为0.24和0.36。
(2)全基因组关联分析
将对虾的基因型和表型数据以及大西洋鲑鱼的基因型和表型数据分别导入R/GenABEL(Aulchenko Y.S.,Ripke S.,Isaacs A.&Van Duijn C.M.(2007b)GenABEL:an Rlibrary for genome-wide association analysis.Bioinformatics 23,1294-1296),使用默认的参数进行全基因组关联分析(GWAS),首先使用gkin命令计算每个数据的遗传关系矩阵,之后使用混合模型和γ回归方法(GRAMMAR-Gamma)计算每个SNP的矫正P值。
(3)全基因组选择分析
根据GWAS分析获得的每个SNP的P值,在每个分析数据中,将每个SNP的P值按照从小到大的顺序排序,从对虾的数据中分别选择排序前500,前1000,前2000,前5000和前10000个标记和全部标记组成6组数据,为了做对照,从所有的标记中随机选择500,1000,2000,5000,10000个标记组成对照数据。从大西洋鲑鱼的数据中分别选择前50,100,500,1000,2000和全部标记组成6组数据,同样从所有的标记中随机选择50,100,500,1000,2000作为对照数据。利用GBLUP(GBLUP-A)模型和BayesB模型进行分析,GBLUP-A分析通过HIBLUP软件(https://hiblup.github.io/)完成,BayesB使用R/BGLR(Perez P.&de los CamposG.(2014)Genome-Wide Regression and Prediction with the BGLR StatisticalPackage.Genetics 198,483-U63)软件完成,参数均采用默认设置,分别计算在不同标记数下的每个个体的基因组育种值(GEBV)。
(4)不同标记数目准确率评估
为了评估在不同物种中通过GWAS选择的不同标记数的全基因选择预测准确率,针对每种标记组合的数据,将80%的个体作为参考群体,计算标记效应,再对剩余的20%个体育种值进行预测,通过步骤(3)中的方法计算出预测育种值,并与每个个体的实际育种值进行比较,计算预测育种值和实际育种值的相关系数。通过比较在不同标记数量下的预测育种值和实际育种值的相关系数,获得每种标记组合的预测准确率,选择预测准确率最高的标记组合作为最优标记组合进行后续的分析。
(5)GWAS选择标记在对虾体重性状基因组选择分析结果对于对虾的体重性状,通过GWAS选择标记全基因组选择预测准确率均高于随机选择的标记,并且更重要的,通过GWAS进行标记选择后,其预测准确率高于使用全部标记的预测准确率。GBLUP(GBLUP-A)模型和BayesB模型的分析结果基本一致,整体上BayesB的预测准确率高于GBLUP方法。预测准确率最高的组为利用GBLUP方法分析前5000个标记,该组的预测准确率为0.728±0.02,是使用全部标记预测准确率(0.368±0.02)的两倍,说明根据GWAS选择的5000个标记是最优的标记组合,利用该标记组合进行后续的全基因组选择分析能够显著提升全基因组选择的准确率(图1)。
(6)GWAS选择标记对大西洋鲑鱼抗性性状基因组选择分析结果在大西洋鲑鱼两个指标的全基因组预测中,通过全基因组选择的标记预测准确率同样高于使用全部标记的预测准确率。最优的预测准确率为使用前500标记组合获得(图2)。对于遗传力较高的阿米巴虫载量性状,使用前500个标记较使用全部标记提升了53.64%,而对于遗传力较低的“腮评分值指标”,其预测准确率的提升为77.88%,因此针对大西洋鲑鱼抗病性状的最优标记组合为GWAS选择的前500个标记,使用前500个标记组合能够显著提高预测准确率,该结果同时显示,最优标记组合的选择对于低遗传力性状的准确率提升更明显。

Claims (4)

1.一种提高水产动物全基因组选择育种效率的方法,其特征在于:对进行全基因选择分析的育种群体进行高密度SNP分型,并测定每个个体的目标表型性状,利用SNP分型数据和表型数据进行全基因组关联分析GWAS,根据GWAS分析获得每个SNP标记的P值,并按照P值从小到大排序,选择排序靠前的最优标记组合对育种群体和下一代育种群体进行SNP分型,通过GBLUP、 BayesB、ssGBLUP方法预测育种群体和下一代育种群体每个个体的基因组育种值,并根据基因组育种值从高到低进行个体选择。
2.权利要求1所述的方法,其特征在于:根据GWAS分析获得每个SNP标记的显著性P值,并将标记按照P值由低到高排序,分别选择排序前500,前1000,前2000,前5000个标记和全部标记,利用全基因组选择分析方法包括GBLUP、 BayesB、ssGBLUP进行全基因组选择分析,评估按照P值选择的不同标记数在育种群体中的预测准确性,选择预测准确性最高的标记组合作为最优标记组合。
3.按照权利要求1所述的方法,其特征在于:利用筛选出的最优标记组合对育种群体和下一代育种群体进行SNP分型,获得每个个体的SNP分型数据,利用常用的GBLUP、 BayesB、ssGBLUP软件对SNP分型数据进行分析,计算出每个个体的基因组育种值,并根据基因组育种值从高到低进行个体选择。
4.按照权利要求1所述的方法,其特征在于:所述水产动物包括但不限于对虾或鱼类。
CN201911196722.8A 2019-11-29 2019-11-29 一种提高水产动物全基因组选择育种效率的方法 Active CN110867208B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911196722.8A CN110867208B (zh) 2019-11-29 2019-11-29 一种提高水产动物全基因组选择育种效率的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911196722.8A CN110867208B (zh) 2019-11-29 2019-11-29 一种提高水产动物全基因组选择育种效率的方法

Publications (2)

Publication Number Publication Date
CN110867208A CN110867208A (zh) 2020-03-06
CN110867208B true CN110867208B (zh) 2023-06-20

Family

ID=69657608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911196722.8A Active CN110867208B (zh) 2019-11-29 2019-11-29 一种提高水产动物全基因组选择育种效率的方法

Country Status (1)

Country Link
CN (1) CN110867208B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111524545B (zh) * 2020-04-30 2023-11-10 天津诺禾致源生物信息科技有限公司 全基因组选择育种的方法和装置
CN112599191A (zh) * 2020-12-28 2021-04-02 深兰科技(上海)有限公司 数据关联分析方法、装置、电子设备及存储介质
CN114410746B (zh) * 2022-03-29 2022-07-12 中国海洋大学三亚海洋研究院 一种东星斑分子溯源选择育种方法及其应用
CN115305289B (zh) * 2022-07-06 2024-06-04 中国农业科学院北京畜牧兽医研究所 一种整合snp点集先验信息的鸡腹脂率降低的基因组选择方法
CN117238363B (zh) * 2023-10-25 2024-04-16 青岛极智医学检验实验室有限公司 一种表型预测方法、预测系统、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105010233A (zh) * 2015-08-11 2015-11-04 吉林康大食品有限公司 一种应用snp辅助选择育种技术培育高繁殖性能种兔的方法
CN107338321A (zh) * 2017-08-29 2017-11-10 集美大学 一种确定最佳snp数量及其通过筛选标记对大黄鱼生产性能进行基因组选择育种的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2013310937A1 (en) * 2012-08-28 2015-03-26 Aarhus Universitet Genetic markers for mastitis resistance

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105010233A (zh) * 2015-08-11 2015-11-04 吉林康大食品有限公司 一种应用snp辅助选择育种技术培育高繁殖性能种兔的方法
CN107338321A (zh) * 2017-08-29 2017-11-10 集美大学 一种确定最佳snp数量及其通过筛选标记对大黄鱼生产性能进行基因组选择育种的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Wang Quanchao et al..Predictive ability of genomic selection models for breeding value estimation on growth traits of Pacific white shrimp Litopenaeus vannamei.《Chinese Journal of Oceanology and Limnology》.2016,第35卷(第35期),全文. *
Yang Yu et al..Genome Scan for Genomic Regions and Genes Associated with Growth Trait in Pacific White Shrimp Litopeneaus vannamei.《Marine Biotechnology》.2019,全文. *
Young-Sup Lee et al..Genome-wide Association Study (GWAS) and Its Application for Improving the Genomic Estimated Breeding Values (GEBV) of the Berkshire Pork Quality Traits.《Asian Australas. J. Anim. Sci.》.2015,第28卷(第28期),全文. *
冯建英 ; 温阳俊 ; 张瑾 ; 章元明 ; .植物关联分析方法的研究进展.作物学报.(第07期),全文. *

Also Published As

Publication number Publication date
CN110867208A (zh) 2020-03-06

Similar Documents

Publication Publication Date Title
CN110867208B (zh) 一种提高水产动物全基因组选择育种效率的方法
Lee et al. Hanwoo cattle: origin, domestication, breeding strategies and genomic selection
AU2019272062B2 (en) Deep learning-based techniques for pre-training deep convolutional neural networks
EP3659143A1 (en) Deep learning-based techniques for pre-training deep convolutional neural networks
CN110218799B (zh) 猪剩余采食量性状的分子遗传标记及应用
CN110358840B (zh) 与剩余采食量相关的tpp2基因的snp分子遗传标记
CN115992265B (zh) 一种石斑鱼全基因组液相芯片及其应用
Zhou et al. Development and evaluation of a high-throughput single-nucleotide polymorphism array for large yellow croaker (Larimichthys crocea)
CN116516029A (zh) 一种金鲳全基因组育种芯片及应用
KR20110139010A (ko) 돼지 등지방두께 진단용 단일염기 다형성 바이오마커 및 이의 선별방법
Arbon et al. Development and validation of a SNP-based genotyping tool for pedigree establishment in Australian greenlip abalone Haliotis laevigata Donovan, 1808
CN111235282A (zh) 一种与猪总乳头数相关的snp分子标记及其应用和获取方法
CN114686605A (zh) 一种用于评估公猪精液品质的遗传标记、筛选方法和应用
Bernard et al. Development of a high-density 665 K SNP array for rainbow trout genome-wide genotyping
Fan et al. Development and validation of a 1 K sika deer (Cervus nippon) SNP Chip
CN110273006A (zh) 一种公猪有效精子数相关的分子遗传标记
CN111199773B (zh) 一种精细定位性状关联基因组纯合片段的评估方法
CN112575096A (zh) 与大白猪总乳头数相关的snp分子标记及其获取方法
CN114736974B (zh) 与母猪产程性状相关的snp分子标记及其应用
Kim et al. Artificial selection increased body weight but induced increase of runs of homozygosity in Hanwoo cattle
Woolley et al. Recent advances in the genomic resources for sheep
CN116287297A (zh) 一种凡纳滨对虾全基因组snp芯片及其应用
CN112779339A (zh) 与大白猪总乳头数相关的snp分子标记及其获取和应用
CN110195116B (zh) 一种与公猪精子活力相关的分子遗传标记及其应用和获取方法
CN114736975B (zh) 与母猪产仔数性状相关的snp分子标记及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant