WO2020133588A1

WO2020133588A1 - 一种快速稳定的动物个体基因组育种值评估方法

Info

Publication number: WO2020133588A1
Application number: PCT/CN2019/071514
Authority: WO
Inventors: 赵书红; 刘小磊; 杨翔; 李新云; 朱猛进; 项韬; 马云龙; 余梅; 王志全; 尹立林
Original assignee: 华中农业大学; 广州影子科技有限公司
Priority date: 2018-12-28
Filing date: 2019-01-14
Publication date: 2020-07-02
Also published as: CN109524059A; EP3905253B1; EP3905253A1; US20220076781A1; CN109524059B; EP3905253A4

Abstract

一种快速稳定的动物个体基因组育种值评估方法，涉及动物育种技术领域。该方法采用HIBLUP使用表型、基因型和谱系信息进行基因组育种值的预测，最终输出中包括估计的个体遗传价值、每个个体的加性效应和显性效应值以及用于基因分型芯片中的每个遗传标记效应的反向解析值。该方法全面利用谱系、表型和基因型信息来预测每个动物的遗传价值以及每个SNP标记位点的效应值，实现最先进的基因组育种值的预测和方差组分估计算法而实现基因组选择。

Description

一种快速稳定的动物个体基因组育种值评估方法

技术领域

本发明涉及动物育种技术领域，尤其涉及一种快速稳定的动物个体基因组育种值评估方法。

背景技术

随着覆盖整个基因组高密度单核苷酸多态性(SNP)基因分型技术的发展，基因组选择(预测)作为基因组统计分析的强大工具，被广泛应用于植物和动物育种中复杂性状的遗传价值(种用价值)预测和评估，以及在人类遗传学研究中的应用也越来越多。方差组分的估计可能是基因组选择过程中最耗时的部分。在基因组选择中流行的方差组分估计算法，例如EMAI，需要迭代计算，并且每次迭代的计算复杂度非常高。以前的基因组选择程序需要计算基因组亲缘关系矩阵的逆矩阵，并且随着基因分型样本量的增加，计算时间也随之迅速增加。

发明内容

本发明要解决的技术问题是针对上述现有技术的不足，提出一种快速稳定的动物个体基因组育种值评估方法，基于HE-AI算法的BLUP(即最优线性无偏预测)被称为HIBLUP，HIBLUP全面利用谱系、表型和基因型信息来预测每个动物的遗传(加性和显性效应)价值以及每个SNP标记位点的效应值，实现最先进的基因组育种值的预测和方差组分估计算法而实现基因组选择。

为解决上述技术问题，本发明所采取的技术方案是：一种快速稳定的动物个体基因组育种值评估方法，采用HIBLUP使用表型、基因型和谱系信息进行基因组育种值的预测，最终输出中包括估计的个体遗传价值、每个个体的加性效应和显性效应值以及用于基因分型芯片中的每个遗传标记效应的反向解析值；具体包括以下步骤：

步骤1：将基因型进行数值化，基因型AA、AB和BB的编码分别为0、1和2；分别使用Henderson列表法的谱系信息和VanRaden方法的基因组信息构建个体之间的关系A(亲缘相关IBD)矩阵和G(状态相关IBS)矩阵，然后根据A矩阵和G矩阵的信息，构建动物个体间的混合相关矩阵H，如下式所示：

根据群体中的动物个体是否具有基因分型信息将个体分成两种不同的群组，下角标为“1”的代表仅具有系谱而没有基因组分型信息的个体群组，下角标为“2”的代表同时具有谱系和基因组分型信息的个体群组；其中A ₁₁、A ₂₂分别表示群组“1”内个体之间的亲缘相关和群组“2”内个体之间的亲缘相关矩阵，A ₁₂表示群组“1”和群组“2”的个体之间的亲缘相关矩阵，并且A ₂₁是A ₁₂的转置矩阵，α是融合矩阵G和矩阵A ₂₂之间的关系调和百分比；

步骤2：使用HE回归算法从H矩阵和表型值导出遗传方差和残差方差，其方程如下：

其中，y为表型值向量；

为第i个随机效应所解释的方差；

为残差方差，n是模型中随机效应的数目；A _j为对称非负矩阵，

为A _j的最优估计值，

K _i和K _j分别是第i个和第j个加性效应协变量矩阵；

步骤3：将HE回归的遗传方差和残差方差设置为后续AI迭代的先验值，然后使用AI迭代算法推导遗传方差和残差方差至收敛标准，并得到所估计的遗传参数；

AI算法分部分描述为：

a.Newton-Raphson算法：

其中，θ是要估计的遗传参数，k是迭代次数，

是要估计的每个参数的最大对数似然函数的一阶导数，Hes是黑塞矩阵，它是每个方差的最大对数似然函数的二阶导数；

b.Fisher得分方法，Hes矩阵的逆矩阵用它的期望矩阵F取代，得到：

AI矩阵通过下式计算得到；

AI＝(-Hes+F)/2；

参数估计如下：

步骤4：通过Henderson方法3使用步骤3中估计的遗传参数求解混合模型方程，并获得每个个体的估计育种值，混合模型方程为：

其中，

Cov(u,e')＝0，

X代表对应固定效应的设计矩阵，Z是对应随机效应的设计矩阵，I是单位矩阵，K ^-1是亲缘关系矩阵的逆矩阵，

是估计的固定效应向量，

是估计育种值向量；

步骤5：用反向求解方法计算基因分型芯片中每个SNP标记的加性效应，计算公式为：

其中，

是SNP标记的加性效应值向量，m是SNP标记数量，M′是加性标记协变量矩阵，p _i和q _i为第i个SNP遗传标记的等位基因频率；

步骤6：当等位基因AA、AB和BB的基因型分别编码为0、1和0时，使用步骤2至步骤5相同的方法处理显性模型来反向求解每个SNP标记的显性效应值。

采用上述技术方案所产生的有益效果在于：本发明提出的一种快速稳定的动物个体基因组育种值评估方法，使用Haseman-Elston(HE)回归和平均信息(AI)算法的组合策略来有效地获得方差组分的稳定估计，基于HE-AI算法的BLUP(最优线性无偏预测)被称为HIBLUP，HIBLUP全面利用谱系、表型和基因型信息来预测每个动物的遗传(加性和显性效应)价值以及每个SNP标记位点的效应值，实现最先进的基因组育种值的预测和方差组分估计算法而实现基因组选择。

附图说明

图1为本发明实施例提供的快速稳定的动物个体基因组育种值评估方法流程图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

如图1所示，本实施例的方法如下所述。

一种快速稳定的动物个体基因组育种值评估方法，采用HIBLUP使用表型、基因型和谱系信息进行基因组育种值的预测，最终输出中包括估计的个体遗传价值、每个个体的加性效应和显性效应值以及用于基因分型芯片中的每个遗传标记效应的反向解析值；具体包括以下步骤：

步骤1：将基因型进行数值化，基因型AA、AB和BB的编码分别为0、1和2；分别使用Henderson列表法的谱系信息和VanRaden方法的基因组信息构建个体之间的关系A(亲缘相关IBD)矩阵和G(状态相关IBS)矩阵，然后根据A矩阵和G矩阵的信息，构建动物个体间的混合相关矩阵H，该矩阵包含来自A矩阵和G矩阵的信息，如下式所示：

根据群体中的动物个体是否具有基因分型信息将个体分成两种不同的群组，下角标为“1”的群组代表仅具有系谱而没有基因组分型信息的个体群组，下角标为“2”的群组代表同时具有谱系和基因组分型信息的个体群组；其中，A ₁₁、A ₂₂分别表示群组“1”内个体之间的亲缘相关和群组“2”内个体之间的亲缘相关矩阵，A ₁₂表示群组“1”和群组“2”的个体之间的亲缘相关矩阵，并且A ₂₁是A ₁₂的转置矩阵，α是融合矩阵G和矩阵A ₂₂之间的关系调和百分比；