CN114863991A - 基于二步预测模型建立的提高全基因组预测精度方法 - Google Patents
基于二步预测模型建立的提高全基因组预测精度方法 Download PDFInfo
- Publication number
- CN114863991A CN114863991A CN202210703391.8A CN202210703391A CN114863991A CN 114863991 A CN114863991 A CN 114863991A CN 202210703391 A CN202210703391 A CN 202210703391A CN 114863991 A CN114863991 A CN 114863991A
- Authority
- CN
- China
- Prior art keywords
- prediction
- population
- genotype
- value
- modeling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 230000002068 genetic effect Effects 0.000 claims abstract description 22
- 238000000513 principal component analysis Methods 0.000 claims abstract description 18
- 238000012216 screening Methods 0.000 claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims abstract description 4
- 239000000463 material Substances 0.000 claims description 22
- 230000000694 effects Effects 0.000 claims description 16
- 238000004458 analytical method Methods 0.000 claims description 15
- 238000012217 deletion Methods 0.000 claims description 10
- 230000037430 deletion Effects 0.000 claims description 10
- 108700028369 Alleles Proteins 0.000 claims description 7
- 238000004088 simulation Methods 0.000 claims description 6
- 238000011160 research Methods 0.000 claims description 5
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 238000013178 mathematical model Methods 0.000 claims description 2
- 239000002773 nucleotide Substances 0.000 claims 1
- 125000003729 nucleotide group Chemical group 0.000 claims 1
- 108090000623 proteins and genes Proteins 0.000 abstract description 9
- 239000003550 marker Substances 0.000 abstract description 8
- 102000004169 proteins and genes Human genes 0.000 abstract description 7
- 238000011156 evaluation Methods 0.000 abstract description 4
- 240000008042 Zea mays Species 0.000 description 12
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 12
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 11
- 235000009973 maize Nutrition 0.000 description 11
- 238000012163 sequencing technique Methods 0.000 description 8
- 239000002585 base Substances 0.000 description 7
- 238000009395 breeding Methods 0.000 description 5
- 230000001488 breeding effect Effects 0.000 description 5
- 101100273030 Schizosaccharomyces pombe (strain 972 / ATCC 24843) caf1 gene Proteins 0.000 description 4
- 101150000810 BVES gene Proteins 0.000 description 3
- 101150025129 POP1 gene Proteins 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 238000012098 association analyses Methods 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000009394 selective breeding Methods 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physiology (AREA)
- General Engineering & Computer Science (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供一种基于二步预测模型建立的提高全基因组预测精度方法,包括以下步骤:S1、自交系基因组信息的处理;S2、难预测群体的筛选;S3、对基因型文件进行群体结构、主成分分析和遗传距离的计算;S4、建模群体和预测群体的划分;S5、初步GS预测;S6、筛选得到与目标性状关联的SNPs;S7、第二步GS预测。本发明根据育种所用的遗传材料群体遗传构成多样性的特点和GWAS对SNP标记关联度的评价功能,建立了一种基于遗传材料群体遗传构成、与性状关联SNP标记和二步预测模型建立的提高全基因组预测精度的新方法。
Description
技术领域
本发明属于分子育种技术领域,具体涉及一种基于二步预测模型建立的提高全基因组预测精度方法。
背景技术
在实际育种过程中,通过提高建模群体的比例提高预测精度,消耗较多的土地、人力和时间,而且,预测精度提高有限。同时,随机抽取材料作为建模群体,很可能遇到将预测精度很低的材料作为建模的情况,导致预测的结果较差,失去应用价值。
目前,已经开发出一些遗传算法如CDmean和PEVmean等,但在实际应用时效果并不明显,对预测精度的提高有限,而且计算时间较长,计算的效率较低;而且PEVmean不考虑群体的遗传变异,会导致近亲缘关系取样。
另外,选取和目标性状关联的SNPs是通过对群体所有材料的表型和基因型进行分析,获得标记与表型性状的关联程度(P值),进而选取不同数量的性状关联标记进行研究。但在实际生产应用中,直接利用所有材料进行关联或连锁分析及GS分析,虽然结果上取得了较好的效果,但并不能达到节省时间、人力物力和提高效率的目的。但只利用建模群体中与目标表型显著关联的标记对预测精度的改善效果较小。
发明内容
本发明根据育种所用的遗传材料群体遗传构成多样性的特点和GWAS对SNP标记关联度的评价功能,建立了一种基于遗传材料群体遗传构成、与性状关联SNP标记和二步预测模型建立的提高全基因组预测精度的新方法。
本发明要解决以下几个问题:
1、难预测遗传材料的剔除:提取难以预测材料的基因型特征,并根据这些特征先将群体划分为能预测和难预测群体,难预测群体需直接种植观察表型,通过传统方法进行育种;
2、建模群体的抽取:通过群体结构、主成分分析和遗传距离计算将能预测群体划分为合适的建模群体和预测群体,达到较高并稳定的预测精度;
3、全基因组SNP标记与性状关联度评价:利用固定效应和随机效应交替运用模型对群体基因型和表型进行关联分析计算标记效应,根据P值筛选与目标性状关联的SNP标记;
4、基于建模群体基因型和表现型数据的预测模型(初步预测模型)建立:利用建模群体的观测表型值和基因型数据建立预测模型,通过预测群体的基因型计算得到预测群体的预测表型值;
5、基于全部群体基因型和表现型(包括观测表型值和预测表型值)数据的预测模型(第二步预测模型)建立:合并建模群体的观测表型值和预测群体的预测表型值得到包含群体所有材料的一个与整个群体大小一致的“半真实半模拟群体”,结合关联分析,确定和“半真实半模拟群体”群体所有材料目标性状关联的SNP标记,再利用有关联的SNP完成全基因组预测,去掉非关联标记对预测的不良影响,提高预测精度。
具体技术方案为:
S1、自交系基因组信息的处理方法
一些测序方法如GBS会产生大量缺失值,在后续分析中会影响分析结果,应尽量避免有缺失值的等位碱基座(等位基因座),应保持缺失值等位碱基座不高于20%,甚至没有缺失值。
由于基因型的目的主要用于全基因组选择育种策略,没有多态性的等位碱基座(等位基因座)在应用全基因组选择做预测时没有任何作用,因此需要剔除,避免程序出错、减少程序运算时间。大部分作物属于二倍体,等位基因分别来自两个亲本,同一个碱基(基因)座极少数出现3种不同碱基的情况,一是由于自然界的突变随机发生,在同一个碱基(基因)座上多次出现的概率很低;二是这种突变多数会在被DNA修复机制矫正,突变后未必能留下稳定后代。另外,由于测序的结果无法保证100%正确,有些碱基是由于测序错误造成,因此,通常等位基因频率低于0.05的碱基被视作缺失值,需要被筛除,以避免I类型(假阳性)错误。
当自交系的基因型信息中包含少量缺失值时,会影响GS预测的结果。因此可以利用beagle软件根据群体中基因型出现的概率进行基因型补缺失,得到最终使用的基因型文件。
S2、难预测群体的筛选
根据基因型文件的SNPs标记获取难预测材料特征建立特征库,根据特征库,将整个群体中难预测的材料分离出来,难预测群体通过GS预测得到的预测精度波动很大,这部分材料不建议做预测,需要通过种植才能进行材料的选择。
S3、对基因型文件进行群体结构、主成分分析和遗传距离的计算
群体结构分析使用STRUCTURE软件(Evanno et al,2009),将群体自交系按照K值划分亚群;
主成分分析(principal component analysis,PCA)使用R软件中stats包中的prcomp()函数进行PCA的计算,和使用base包中的plot()函数,绘制PCA图;
MRD(modified Rogers distance)遗传距离使用由CIMMYT开发的Bio-R(Biodiversity Analysis with R)软件(https://hdl.handle net/11529/10820)进行计算,公式如下:
其中,plax是位于位点l,基因型x的等位基因a的估计频率;l是位点数,nl是位点l处的等位基因数。
S4、建模群体和预测群体的划分
根据群体结构或主成分分析或MRD遗传距离划分出建模群体和预测群体,如根据MRD遗传距离,遗传距离较近的两个材料,一个可被分为建模群体,另一个则为预测群体。
S5、初步GS预测
利用挑选出来的建模群体的观测表型值和基因型数据构建GS数学模型,将预测群体的基因型代入预测模型,得到预测群体的预测GEBV和预测表型值。
S6、筛选得到与目标性状关联的SNPs
合并建模群体的观测表型值和预测群体的预测表型值,组成一个包含所有群体材料的一个与整个群体大小一致的“半真实半模拟群体”。
利用固定效应和随机效应交替运用模型计算“半真实半模拟群体”与性状紧密关联的SNP效应值(P),根据P值可以选取不同数量的性状关联标记进行研究。此方法可以大幅减少标记数量,降低无关标记对预测的影响,提高预测精度。
S7、第二步GS预测
利用与“半真实半模拟群体”的目标性状关联的SNPs进行第二步GS的预测。将筛选得到的与目标性状关联的SNPs作为基因型,和第(4)步划分的建模群体的观测表型值进行GS模型的构建,根据划分的预测群体基因型,计算得到第二步GS预测的GEBVs,根据GEBVs即可以筛选优良的自交系。
本发明根据育种所用的遗传材料群体遗传构成多样性的特点和GWAS对SNP标记关联度的评价功能,建立了一种基于遗传材料群体遗传构成、与性状关联SNP标记和二步预测模型建立的提高全基因组预测精度的新方法。
附图说明
图1是本发明的流程示意图。
具体实施方式
结合附图说明本发明的具体技术方案。
本实施例以379份玉米自交系关联群体为研究材料,以干旱条件下测定的出苗率为表型值进行分析。按照图1所示的流程:
1、自交系基因组信息的处理方法
DArT-seq法对玉米关联群体所有自交系进行的基因分型在SAGA测序实验室进行(https://seedsofdiscovery.org/about/genotyping-platform/),该实验室由DArT公司和CIMMYT联合建立。利用PstI(CTGCAG)和HpaII(CCGG)两种酶消化DNA样本,以降低基因组的复杂性。对于每个96孔板,复制16%的样品以评估再现性(Pereira et al.,2020)。酶切后,将不同样品的DNA与不同碱基组合的条形码连接并测序,构建DNA简化测序文库。通过平板收集来自每个样本的等摩尔量扩增产物,并通过c-Bot(Illumina)桥式PCR进行扩增,然后在Illumina Hiseq 2500(www.Illumina.com)上进行片段测序。混合样品的DNA简化测序文库利用短片段测序技术(150bp)在单通道上进行测序(Kilian et al.,2012)(https://www.diversityarrays.com/)。DArT的SNP开发不同于简化基因组测序,其不依赖于参考基因组信息,而主要依赖于DArT公司测序的样本库数据。所有的reads都是通过基于宏基因组代表性玉米标签的序列分析进行比对的。DArT-seq已广泛应用于遗传学和分子标记辅助选择育种领域。最初,DArT-seq平台检测到39,659个SNPs,其中39,112个SNPs位于玉米1-10号染色体,547个SNPs位点不能锚定在任何一条玉米染色体上。
在DArT数据集中,利用TASSEL 5进行质量控制,筛选去除次要等位基因频率(minor allele frequency,MAF)<0.05且缺失率>20%的标记。缺失率高于20%的玉米材料被去除。因此,DArT剩余379玉米品系和7837个SNPs位点,最后利用beagle软件进行补缺失,得到最终用于全基因组选择研究的基因型数据。
2、难预测群体的筛选
根据基因型文件的SNPs标记获取难预测材料特征建立特征库,根据本项目组建立的特征库,将整个群体中难预测的材料分离出来,难预测群体通过GS预测得到的预测精度波动很大,这部分材料不建议做预测,需要通过种植才能进行材料的选择。
3、对基因型文件进行群体结构、主成分分析和遗传距离的计算
利用可预测群体的基因型文件进行遗传距离、群体结构和主成分分析的计算。CIMMYT开发的Bio-R(Biodiversity Analysis with R)软件(https://hdl.handle net/11529/10820)用于计算可预测群体之间的遗传距离。首先要将基因型文件数值化,其次根据数值化基因型格式设置Bio-R所需的参数,进行分析,得到RogersDistances文件。
群体结构分析使用STRUCTURE软件,Length of Burnin Period设置为10000,Number of MCMC Reps after Burnin设置为10000,K设置为1至10,Number of Iterations设置为5,进行分析。Structure的运算结果Results.zip提交到在线工具StructureHarvester以判断群体的Clusters数(即最可能的K值)。对于推断的最佳K值,利用CLUMPP进行后续的重复抽样分析。本关联群体根据K值确定为6,即该群体可分为6个亚群。
利用R软件(v 4.1.3)中stats包的prcomp()函数和base包中的plot()函数对玉米自交系进行主成分分析(principal component analysis,PCA)和可视化,根据前两个主成分(PC1和PC2)进行亚群的划分。本群体可划分为3个亚群。
4、建模群体和预测群体的划分
从RogersDistances文件中获取遗传距离最近的且成对存在的玉米自交系,成对存在的玉米自交系,一个作为建模群体,一个作为预测群体用于全基因组选择研究。基于群体结构和主成分分析划分的亚群,分别从不同亚群中抽取一部分群体合并作为建模群体用于分析。
5、初步GS预测
将建模群体作为pop1,预测群体为pop2,利用RR-BLUP模型进行GS分析,pop1预测pop2,得到最终的预测精度,以及pop2的预测表型值。
6、筛选得到与目标性状关联的SNPs
合并pop1的观测表型值和pop2的预测表型值以及pop和pop2的基因型进行关联分析。根据固定效应和随机效应交替运用模型计算该关联群体基因型中与出苗率性状关联程度的P值,根据不同的P值筛选得到不同关联程度的标记。本实施例是根据P<0.001、P<0.01、P<0.1和P<0.5设置关联梯度,并提取关联SNPs。
7、第二步GS预测
将关联的SNPs提取后进行数值化,根据步骤5的流程利用关联标记进行预测,得到预测精度及基因组估计育种值(GEBVs)。
表1建模群体的选择及与目标性状关联标记得到的预测精度
在随机选择建模群体时(重复100次),预测精度范围为11.53%-38.72%,平均预测精度为24.98%,预测精度范围跨度大,在实际生产应用中,随机抽取材料作为建模群体,很可能遇到将预测精度很低的材料作为建模的情况,导致预测的结果较差,失去应用价值。在利用建模群体目标性状的关联标记进行GS分析时,在P<0.1的条件下,预测精度为26.93%,仅提高了1.95%。在根据遗传距离选择建模群体后,达到了较稳定的预测精度,为32.70%,运行步骤6后进行第二步GS预测,在P<0.1时,预测精度达到35.86%,和随机选择建模群体的平均预测精度24.98%相比,提高了10.88%。
Claims (4)
1.基于二步预测模型建立的提高全基因组预测精度方法,其特征在于,包括以下步骤:
S1、自交系基因组信息的处理
S2、难预测群体的筛选
根据基因型文件的SNPs标记获取难预测材料特征建立特征库,根据特征库,将整个群体中难预测的材料分离出来,这部分材料不做预测;
S3、对基因型文件进行群体结构、主成分分析和遗传距离的计算
S4、建模群体和预测群体的划分
根据群体结构或主成分分析或MRD遗传距离划分出建模群体和预测群体;
S5、初步GS预测
利用挑选出来的建模群体的观测表型值和基因型数据构建GS数学模型,将预测群体的基因型代入预测模型,得到预测群体的预测GEBV和预测表型值;
S6、筛选得到与目标性状关联的SNPs
合并建模群体的观测表型值和预测群体的预测表型值,组成一个包含所有群体材料的一个与整个群体大小一致的“半真实半模拟群体”;
利用固定效应和随机效应交替运用模型计算“半真实半模拟群体”与性状紧密关联的SNP效应值P,根据P值选取不同数量的性状关联标记进行研究;
S7、第二步GS预测
利用与“半真实半模拟群体”的目标性状关联的SNPs进行第二步GS的预测。
2.根据权利要求1所述的基于二步预测模型建立的提高全基因组预测精度方法,其特征在于,S1中,避免有缺失值的等位碱基座,保持缺失值等位碱基座不高于20%;
没有多态性的等位碱基座要剔除,等位基因频率低于0.05的碱基被视作缺失值,要被筛除;
当自交系的基因型信息中包含少量缺失值时,利用beagle软件根据群体中基因型出现的概率进行基因型补缺失,得到最终使用的基因型文件。
4.根据权利要求1所述的基于二步预测模型建立的提高全基因组预测精度方法,其特征在于,S7中,具体方法为:将筛选得到的与目标性状关联的SNPs作为基因型,和S4步划分的建模群体的观测表型值进行GS模型的构建,根据划分的预测群体基因型,计算得到第二步GS预测的GEBVs,根据GEBVs筛选优良的自交系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210703391.8A CN114863991B (zh) | 2022-06-21 | 基于二步预测模型建立的提高全基因组预测精度方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210703391.8A CN114863991B (zh) | 2022-06-21 | 基于二步预测模型建立的提高全基因组预测精度方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114863991A true CN114863991A (zh) | 2022-08-05 |
CN114863991B CN114863991B (zh) | 2024-10-29 |
Family
ID=
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116072226A (zh) * | 2023-01-17 | 2023-05-05 | 中国农业大学 | 一种用于蛋鸡产蛋性状基因组选择的机器学习方法及系统 |
CN116863998A (zh) * | 2023-06-21 | 2023-10-10 | 扬州大学 | 一种基于遗传算法的全基因组预测方法及其应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2007214360A1 (en) * | 2006-09-01 | 2008-03-20 | Innovative Dairy Products Pty Ltd | Whole genome based genetic evaluation and selection process |
US20160132635A1 (en) * | 2013-06-14 | 2016-05-12 | Keygene N.V. | Directed strategies for improving phenotypic traits |
CN111210868A (zh) * | 2020-02-17 | 2020-05-29 | 沈阳农业大学 | 玉米关联群体中气生根全基因组选择潜力分析方法 |
CN111528087A (zh) * | 2020-04-17 | 2020-08-14 | 中国农业科学院作物科学研究所 | 一种选育玉米高配合力优良种质的方法 |
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2007214360A1 (en) * | 2006-09-01 | 2008-03-20 | Innovative Dairy Products Pty Ltd | Whole genome based genetic evaluation and selection process |
US20160132635A1 (en) * | 2013-06-14 | 2016-05-12 | Keygene N.V. | Directed strategies for improving phenotypic traits |
CN111210868A (zh) * | 2020-02-17 | 2020-05-29 | 沈阳农业大学 | 玉米关联群体中气生根全基因组选择潜力分析方法 |
CN111528087A (zh) * | 2020-04-17 | 2020-08-14 | 中国农业科学院作物科学研究所 | 一种选育玉米高配合力优良种质的方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116072226A (zh) * | 2023-01-17 | 2023-05-05 | 中国农业大学 | 一种用于蛋鸡产蛋性状基因组选择的机器学习方法及系统 |
CN116863998A (zh) * | 2023-06-21 | 2023-10-10 | 扬州大学 | 一种基于遗传算法的全基因组预测方法及其应用 |
CN116863998B (zh) * | 2023-06-21 | 2024-04-05 | 扬州大学 | 一种基于遗传算法的全基因组预测方法及其应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Goel et al. | SyRI: finding genomic rearrangements and local sequence differences from whole-genome assemblies | |
Myles et al. | Rapid genomic characterization of the genus Vitis | |
Beissinger et al. | Marker density and read depth for genotyping populations using genotyping-by-sequencing | |
Nicolas et al. | Genetic diversity, linkage disequilibrium and power of a large grapevine (Vitis vinifera L) diversity panel newly designed for association studies | |
Kumar et al. | Characterization of genetic diversity and population structure in wheat using array based SNP markers | |
Lovell et al. | Mutation accumulation in an asexual relative of Arabidopsis | |
Kono et al. | The role of deleterious substitutions in crop genomes | |
Bancroft et al. | Dissecting the genome of the polyploid crop oilseed rape by transcriptome sequencing | |
Chen et al. | Genome sequencing reveals evidence of adaptive variation in the genus Zea | |
Reddy et al. | High-resolution genetic map for understanding the effect of genome-wide recombination rate on nucleotide diversity in watermelon | |
Jamann et al. | QTL mapping using high-throughput sequencing | |
Tinker et al. | Genome analysis in Avena sativa reveals hidden breeding barriers and opportunities for oat improvement | |
Basu et al. | Genome-wide generation and genotyping of informative SNPs to scan molecular signatures for seed yield in chickpea | |
Happ et al. | Generating high density, low cost genotype data in soybean [Glycine max (L.) Merr.] | |
Timmermans et al. | Mimicry diversification in Papilio dardanus via a genomic inversion in the regulatory region of engrailed–invected | |
Fuller et al. | Evidence for stabilizing selection on codon usage in chromosomal rearrangements of Drosophila pseudoobscura | |
CN117095746A (zh) | 一种用于水牛的gbs全基因组关联分析方法 | |
CN109461473B (zh) | 胎儿游离dna浓度获取方法和装置 | |
Ruperao et al. | Exploring the sorghum race level diversity utilizing 272 sorghum accessions genomic resources | |
Masharing et al. | ddRAD sequencing based genotyping of six indigenous dairy cattle breeds of India to infer existing genetic diversity and population structure | |
CN117133354B (zh) | 一种高效鉴定林木关键育种基因模块的方法 | |
Fu et al. | Transcriptomic and methylomic analyses provide insights into the molecular mechanism and prediction of heterosis in rice | |
CN112226529A (zh) | 一种冬瓜抗枯萎病基因的snp分子标记及应用 | |
CN113793637B (zh) | 基于亲本基因型与子代表型的全基因组关联分析方法 | |
CN114863991B (zh) | 基于二步预测模型建立的提高全基因组预测精度方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |