CN111797544A - 基于blup算法的遗传育种信息处理系统及处理方法 - Google Patents

基于blup算法的遗传育种信息处理系统及处理方法 Download PDF

Info

Publication number
CN111797544A
CN111797544A CN202010724507.7A CN202010724507A CN111797544A CN 111797544 A CN111797544 A CN 111797544A CN 202010724507 A CN202010724507 A CN 202010724507A CN 111797544 A CN111797544 A CN 111797544A
Authority
CN
China
Prior art keywords
breeding
blup
module
calculation
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010724507.7A
Other languages
English (en)
Other versions
CN111797544B (zh
Inventor
胡小亮
黄涛
陈文�
肖国亮
党乐
胡广东
邓强
谢彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinjiang Qisehua Information Technology Co ltd
Original Assignee
Xinjiang Qisehua Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xinjiang Qisehua Information Technology Co ltd filed Critical Xinjiang Qisehua Information Technology Co ltd
Priority to CN202010724507.7A priority Critical patent/CN111797544B/zh
Publication of CN111797544A publication Critical patent/CN111797544A/zh
Application granted granted Critical
Publication of CN111797544B publication Critical patent/CN111797544B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Geometry (AREA)
  • Computer Hardware Design (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于畜牧养殖技术领域,公开了一种基于BLUP算法的遗传育种信息处理系统及处理方法,计算性状管理模块用于对主要关注的性状选择方向以及各项性能数据进行管理;模型变量管理模块用于管理养殖生产过程中的系统环境效应和随机环境效应;模型表达式管理模块用于根据实际生产情况对模型变量进行调整;指数管理模块用于管理相关选择指数表达式;BLUP计算模块用于进行个体计算,并输出计算结果。本发明可以提高联合育种的效率,降低所有参与单位的资本投入,在大数据服务的支持下更能提高选择强度,充分发挥BLUP方法选择准确的优点,同时还可有效地避免各生产单位场内群体太小而导致的被迫近交,提高选育的效果和育种效率。

Description

基于BLUP算法的遗传育种信息处理系统及处理方法
技术领域
本发明属于畜牧养殖技术领域,尤其涉及一种基于BLUP算法的遗传育种信息处理系统及处理方法。
背景技术
目前,家畜育种工作与畜牧业发达国家相比尚有较大差距,畜牧业生产水平还比较低。要改变这种现状,从科技方面看,家畜群体本身的遗传改良,遗传结构的改变,是从根本上起作用的。据美国农业部1996年统计,在影响家畜生产效益的几大科技因素中,遗传育种与繁殖的科技贡献率占50%,饲料营养占20%,疾病控制占10%,环境占10%,其他占10%。可见遗传结构的变化是迅速改变畜群面貌的根本手段。
传统的育种值估计方法主要是选择指数法,这个方法的基本架设是,不存在影响观察值的系统环境效应,或者在使用前剔除了系统的环境效应。在这一架设的基础上,由选择指数法得到的估计育种值具有这样的性质:①是真实育种值A的无偏估计值;②估计误差的方差最小,这意味着估计值的精确性最大;③群体按估计育种值排序与按真实育种值派寻相吻合的概率最大。
遗憾的是这个基本假设在几乎所有情况下都是不能成立的,例如乳用母牛饲养在管理条件不同的牛群中,这样对公牛产奶量育种值估计,必须按其女儿的牛群效应来校正。通常做法是将个体表型值减去与其同群同期的所有其他个体的平均数,从而达到对系统环境效应进行校正的目的。但这样做有一个重要缺陷,那就是如果在不同群体或不同世代之间个体存在着固定的遗传差异,则这种差异也被随之校正掉了,因而所得到的估计育种值就不再是无偏估计值,选择指数法的上述理想性也就不成立。
综上所述,现有技术存在的问题及缺陷是:现有传统育种评估方法评估结果并不准确,且没有考虑环境效应,不精确,导致联合育种效率低。
发明内容
针对现有技术存在的问题,本发明提供了一种基于BLUP算法的遗传育种信息处理系统及处理方法。
本发明是这样实现的,一种基于BLUP算法的遗传育种信息处理系统,包括:
计算性状管理模块,与BLUP计算模块连接,用于根据养殖类型对关注的性状选择方向进行管理,同时管理在养殖过程中突出或具有更高优先级的生产性能的各项性能数据;
模型变量管理模块,与BLUP计算模块连接,用于管理养殖生产过程中的系统环境效应和随机环境效应;
模型表达式管理模块,与BLUP计算模块连接,用于根据实际生产情况对模型变量进行调整;
指数管理模块,与BLUP计算模块连接,用于管理相关选择指数表达式,同时根据实际情况,对指数进行新增、编辑,调整各项影响因素的权重占比,对应性状指数各因子权重系数进行划分,完善表达式;
BLUP计算模块,与BLUP计算模块连接,用于调用计算性状管理模块、模型变量管理模块、模型表达式管理模块的相关数据,进行个体计算,并输出计算结果。
进一步,所述计算性状管理模块包括:
计算性状管理模块还用于进行新计算性状的添加或对已有性状选项进行编辑,完成源数据的选择对接、相关性状的数据维护及其他相关处理;
所述已有性状的编辑包括对已有性状进行维护、管理,具体包括更新已有性状的关联因子数据、对性状属性重新排序或对该性状重新定义。
进一步,所述模型变量管理模块包括系统环境效应子模块和随机环境效应子模块;系统环境效应子模块用于在一定时间内以固定的相同的方式影响该环境下的所有个体的因子;
随机环境效应子模块,用于以随机方式影响家畜个体的因子;
所述模型变量模块还用于新增、编辑模型变量;所述模型变量的新增中,当有新的环境变量对性状计算产生影响,新增一个变量到系统中,加入到运算序列;
所述模型变量的编辑中,对已有模型变量进行管理和维护,当数据源更新、调整等变化时即需对该变量进行相应调整,用于保证模型变量的数据准确性和时效性。
进一步,所述模型表达式管理模块还用于管理系统中预先存储的性状的运算模型,同时用于根据实际情况进行模型变量进行新增、适应性调整。
进一步,所述BLUP计算模块还用于获得育种值计算值。
进一步,所述基于BLUP算法的遗传育种信息处理系统进一步包括:
系统管理员模块,用于对整体系统的后台维护、权限分配、角色设定、功能展现进行管理;
养殖场管理员模块,用于对养殖场所有种畜的单证进行数据管理、单证审核、记录查询及相关操作;
育种技术员模块,用于根据种畜个体历史繁殖记录、个体信息、性能测定信息、系谱信息及相关数据进行个体育种估算值的科学运算;同时根据种畜个体号自动生成种畜三证,并进行打印。
本发明的另一目的在于提供一种应用所述基于BLUP算法的遗传育种信息处理系统的基于BLUP算法的遗传育种信息处理方法,所述基于BLUP算法的遗传育种信息处理方法包括以下步骤:
步骤一,根据养殖类型对主要关注的性状选择方向进行管理,管理在养殖过程中突出或具有更高优先级的生产性能的各项性能数据;同时,根据测试方案,测量所有养殖个体的育种目标性状的测定值。
步骤二,设定环境效应的表征指数为温度和湿度,采用格栅法确定养殖环境效应的观测点;根据环境效应计算公式计算各观测点的环境效应指数;
所述环境效应计算公式为:
THI=T-(0.55-0.55RH)×(T-14.5);
其中,THI为环境效应指数,RH为观测点的相对湿度,T为观测点的温度。
步骤三,以环境效应指数为基础,构建养殖环境效应场模型;根据构建的养殖环境效应场模型,调整养殖环境配置情况,对养殖生产过程中的系统环境效应和随机环境效应进行管理,并根据实际生产情况对模型变量进行调整。
步骤四,性状育种值标准化:通过BLUP算法计算得到每个养殖个体或家系的育种值后,对育种值进行标准化;所述性状育种值的标准化公式为:
Figure BDA0002601175740000041
其中,vij表示第i个个体或家系j个性状标准化育种值,aij表示第i个个体或家系j个性状育种值,
Figure BDA0002601175740000042
表示第j个性状的平均育种值,σ·j表示第j个性状的育种值标准差。
步骤五,管理相关选择指数表达式,根据测定值获取测试个体的个体或家系的选择指数;同时根据实际情况,对指数进行新增、编辑,调整各项影响因素的权重占比,对应性状指数各因子权重系数进行划分,并完善表达式;
所述选择指数表达式为:
Figure BDA0002601175740000043
p′=[p1 p2 … pn],v′i=[vi1 vi2 … vin];
其中,i表示个体或家系,j表示性状的编号,n表示性状的个数,Ii表示第i个个体或家系的选择指数,p表示性状在育种目标中所占百分比向量,vi表示第i个个体或家系性状标准化育种值向量,r控制选择指数间的变异程度大小。
步骤六,调用相关计算数据,选择待计算的牲畜类型、对应的养殖主体以及计算模型;核对调用的所有影响因子数据源是否准确,并通过execel导入的方式提交运算数据。
步骤七,基于运算数据进行计算,数值最大者为性能遗传育种的最优对象,通过BLUP计算模块获得育种值计算值,并输出计算结果。
进一步,步骤五中,所述根据测定值获取测试个体的个体或家系的选择指数的方法,包括:
(1)根据测试方案中的测试家系数量和测试个体数量及留种方案中的留种家系数量和留种个体数量计算每个育种目标性状的留种率;
(2)根据留种率计算每个育种目标性状的期望选择强度;
(3)根据育种目标性状的测定值及测试个体的系谱信息,通过约束最大似然法计算每个育种目标性状的测定值。
本发明的另一目的在于提供一种存储在计算机可读介质上的计算机程序产品,包括计算机可读程序,供于电子装置上执行时,提供用户输入接口以实施所述的基于BLUP算法的遗传育种信息处理方法。
本发明的另一目的在于提供一种计算机可读存储介质,储存有指令,当所述指令在计算机上运行时,使得计算机执行所述的基于BLUP算法的遗传育种信息处理方法。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明基于BLUP算法的遗传育种信息处理系统以“互联网+”的形式集合自治区大量核心育种场、良繁场、保种场、保护区等的种质资源,在大数据平台上形成相对大的核心群,进行统一遗传评定。
本发明持续地对自治区种畜资源数据库进行丰富,对这些遗传评估数据进行深入应用,将之与BLUP育种值估算法相结合,研究并开发适用于自治区畜牧养殖行业的BLUP应用模型,最终形成基于互联网的服务工具,向整个行业提供“互联网+选配”服务。
本发明对传统联合育种形式的提升,不仅可以提高联合育种的效率,降低所有参与单位的资本投入,在大数据服务的支持下更能提高选择强度,充分发挥BLUP方法选择准确的优点,同时还可有效地避免各生产单位场内群体太小而导致的被迫近交,提高选育的效果和育种效率。
本发明对个体每个性状的育种值进行了标准化,消除了由于各个性状表型值度量单位以及标准差的不同对选择指数的影响,提高了选择的准确度,能够快速、准确、有效的进行家系或者个体的选育。
附图说明
图1是本发明实施例提供的基于BLUP算法的遗传育种信息处理系统结构示意图。
图中:1、计算性状管理模块;2、模型变量管理模块;3、模型表达式管理模块;4、指数管理模块;5、BLUP计算模块。
图2是本发明实施例提供的系统管理员工作流程图。
图3是本发明实施例提供的养殖场管理员工作流程图。
图4是本发明实施例提供的养殖场技术员工作流程图。
图5是本发明实施例提供的基于BLUP算法的遗传育种信息处理方法流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
现有传统育种评估方法评估结果并不准确,且没有考虑环境效应,不精确,导致联合育种效率低。
为解决上述技术问题,下面结合附图对本发明的技术方案与技术效果做详细说明。
如图1所示,本发明实施例提供的基于BLUP算法的遗传育种信息处理系统具体包括:
计算性状管理模块1,与BLUP计算模块连接,用于根据养殖类型对主要关注的性状选择方向进行管理,同时用于管理在养殖过程中突出或具有更高优先级的生产性能的各项性能数据。
模型变量管理模块2,与BLUP计算模块连接,用于管理养殖生产过程中的系统环境效应和随机环境效应。
模型表达式管理模块3,与BLUP计算模块连接,用于根据实际生产情况对模型变量进行调整。
指数管理模块4,与BLUP计算模块连接,用于管理相关选择指数表达式,同时根据实际情况,对指数进行新增、编辑,调整各项影响因素的权重占比,对应性状指数各因子权重系数进行划分,完善表达式。
BLUP计算模块5,与BLUP计算模块连接,用于调用计算性状管理模块、模型变量管理模块、模型表达式管理模块的相关数据,进行个体计算,并输出计算结果。
本发明实施例提供的计算性状管理模块1具体包括:
计算性状管理模块用于进行新计算性状的添加或对已有性状选项进行编辑,完成源数据的选择对接、相关性状的数据维护及其他相关处理。
所述已有性状的编辑包括对已有性状进行维护、管理,具体包括更新已有性状的关联因子数据、对性状属性重新排序或对该性状重新定义。
本发明实施例中,提供的模型变量管理模块2具体包括:
系统环境效应子模块和随机环境效应子模块;其中系统环境效应子模块是在一定时间内以固定的相同的方式影响该环境下的所有个体的因子;随机环境效应子模块则是以随机方式影响家畜个体的因子,又分为永久性的随机环境效应和暂时性环境效应。
所述模型变量模块用于新增、编辑模型变量。
所述模型变量的新增包括:当有新的环境变量对性状计算产生影响,新增一个变量到系统中,加入到运算序列。
所述模型变量的编辑包括:对已有模型变量进行管理和维护,当数据源更新、调整等变化时即需对该变量进行相应调整,用于保证模型变量的数据准确性和时效性。
本发明实施例中,提供的模型表达式管理模块3具体包括:
所述模型表达式用于管理系统中预先存储的部分主要性状的运算模型;同时用于根据实际情况进行模型变量进行新增、适应性调整。
本发明实施例中,提供的BLUP计算模块5具体包括用于获得育种值计算值。
具体包括:
(1)选择待计算的牲畜类型、对应的养殖主体以及计算模型。
(2)核对调用的所有影响因子数据源是否准确,或通过execel导入的方式提交运算数据。
(3)基于运算数据进行计算,数值最大者即为性能遗传育种的最优对象。
如图2至图4所示,本发明实施例提供的基于BLUP算法的遗传育种信息处理系统的角色进一步包括:
系统管理员:用于对整体系统的后台维护、权限分配、角色设定、功能展现进行管理。
养殖场管理员:用于对养殖场所有种畜的单证进行数据管理、单证审核、记录查询及相关操作。
育种技术员:用于根据种畜个体历史繁殖记录、个体信息、性能测定信息、系谱信息及相关数据进行个体育种估算值的科学运算;同时根据种畜个体号自动生成种畜三证,并进行打印。
如图5所示,本发明实施例提供的基于BLUP算法的遗传育种信息处理方法具体包括:
S101,根据养殖类型对主要关注的性状选择方向进行管理,管理在养殖过程中突出或具有更高优先级的生产性能的各项性能数据。
S102,管理养殖生产过程中的系统环境效应和随机环境效应。
S103,根据实际生产情况对模型变量进行调整。
S104,管理相关选择指数表达式,同时根据实际情况,对指数进行新增、编辑,调整各项影响因素的权重占比,对应性状指数各因子权重系数进行划分,完善表达式。
S105,调用相关计算数据,进行个体计算,并输出计算结果。
步骤S101中,根据养殖类型对主要关注的性状选择方向进行管理,管理在养殖过程中突出或具有更高优先级的生产性能的各项性能数据;同时,根据测试方案,测量所有养殖个体的育种目标性状的测定值。
步骤S102中,设定环境效应的表征指数为温度和湿度,采用格栅法确定养殖环境效应的观测点;根据环境效应计算公式计算各观测点的环境效应指数;
所述环境效应计算公式为:
THI=T-(0.55-0.55RH)×(T-14.5);
其中,THI为环境效应指数,RH为观测点的相对湿度,T为观测点的温度。
步骤S103中,以环境效应指数为基础,构建养殖环境效应场模型;根据构建的养殖环境效应场模型,调整养殖环境配置情况,对养殖生产过程中的系统环境效应和随机环境效应进行管理,并根据实际生产情况对模型变量进行调整。
步骤S103后,还需进行性状育种值标准化:通过BLUP算法计算得到每个养殖个体或家系的育种值后,对育种值进行标准化;所述性状育种值的标准化公式为:
Figure BDA0002601175740000101
其中,vij表示第i个个体或家系j个性状标准化育种值,aij表示第i个个体或家系j个性状育种值,
Figure BDA0002601175740000102
表示第j个性状的平均育种值,σ·j表示第j个性状的育种值标准差。
步骤S104中,管理相关选择指数表达式,根据测定值获取测试个体的个体或家系的选择指数;同时根据实际情况,对指数进行新增、编辑,调整各项影响因素的权重占比,对应性状指数各因子权重系数进行划分,并完善表达式;
所述选择指数表达式为:
Figure BDA0002601175740000103
p′=[p1 p2 … pn],v′i=[vi1 vi2 … vin];
其中,i表示个体或家系,j表示性状的编号,n表示性状的个数,Ii表示第i个个体或家系的选择指数,p表示性状在育种目标中所占百分比向量,vi表示第i个个体或家系性状标准化育种值向量,r控制选择指数间的变异程度大小。
步骤S105中,调用相关计算数据,选择待计算的牲畜类型、对应的养殖主体以及计算模型;核对调用的所有影响因子数据源是否准确,并通过execel导入的方式提交运算数据。
步骤S105后还进行基于运算数据进行计算,数值最大者为性能遗传育种的最优对象,通过BLUP计算模块获得育种值计算值,并输出计算结果。
下面结合具体实施例对本发明作进一步说明。
实施例1:
一、系统构成
1、系统构成
1.1硬件
服务器端
采用高性能弹性云计算服务器,可根据数据增量和用户量进行无缝升级,其配置如下:
CPU 内存 硬盘 带宽
8核 32G 1Tb 独立带宽10Mbps
客户端
主流台式电脑、笔记本电脑均能实现系统接入。
1.2软件
服务器:
操作系统 数据库
WindowsServer2003 Mysql Server 2008R2
客户端:
终端 操作系统
台式电脑、笔记本电脑 WindowsXP及以上,浏览器可接入互联网即可
智能手机或其他智能设备 IOS、Android等各系统均可接入
1.3系统特点
性能优化
软件性能高度优化,在运行速度、网络化操作、功能的灵活和全面、使用效率、程序界面等方面均有了大幅提高和改进。在网络多用户操作方面的锁定机制,确保了网络操作的数据安全。
专业性强
系统主要对场内动物的育种估计值进行预测性运算,需要对畜牧业育种专业有一定的知识积累,能理解系统中的业务术语。同时,系统设计充分考虑了用户的操作情况,用户只需记忆少量功能模块的使用方法就能完成全部工作,而且每个功能模块的操作方法基本相同,只要学会了一个功能,其他的功能就可以融会贯通。
操作方便
本软件是在Microsoft Windows操作环境下开发的,采用了图形界面显示,非常直观方便,并保留了浏览器操作快捷的特点。
系统安全可靠
繁殖育种数据是每个种畜场的核心数据,不能随意外泄,因此对系统的安全性有较高的要求。本系统具备强大的权限控制机制,可实现操作权限的集中化管理,强化了系统管理员对软件各模块操作的统一授权,严密的密码设定机制确保数据更具安全可靠。同时在服务器端有24小时云盾防护、内部数据加密算法、实时镜像等多重安全防护措施,满足种畜禽场对系统安全性的要求。
2.4主要涉及人员
序号角色名称说明
Figure BDA0002601175740000121
2.5业务流程
系统管理员:系统管理员作为本单位繁殖育种评估系统的整体技术管理人员,对系统进行后台维护、权限分配和角色设定等管理。同时负责系统的日常功能维护、疑难解答等工作。流程如图2所示。
养殖场管理员:养殖场管理员对其所管理养殖场的所有种畜的相应繁殖育种数据进行管理、记录查询等操作。流程如图3所示。
养殖场技术员:养殖场技术员可根据种畜个体历史繁殖记录、个体信息、性能测定信息、系谱信息等数据进行个体育种估算值的科学运算。流程如图4所示。
二.系统界面
系统采用B/S架构,基于web服务向用户提供科学遗传育种的服务。因此,用户通过浏览器输入系统地址即可跳转至系统登陆界面,输入用户名和密码后进入系统,系统主要界面概述如下:
1、登陆界面
1)本系统采用云服务模式,无需用户投入过多的硬件设施,用户通过目前市面上通用的浏览器即可接入系统。用户在浏览器网址栏输入系统服务地址:http://www.xjy0.cn/fy/login/blup即可跳转至登陆界面。
2)进入登陆界面,用户输入用户名和密码,即可进入系统进行相应操作,。
2、系统操作界面
进入系统后,可看到系统主操作界面分为两大部分,左边为功能选择树和右部的操作窗口,按照功能设计,系统主操作界面各部分功能如下:
操作界面主要分为6个要素,每个要素的讲解如下:
1)功能选择树:此窗口以树状结构展示了系统的五个功能节点,分别是“计算性状”、“模型变量”、“模型表达式”、“选择指数”和“BLUP计算”。鼠标点击某一个功能节点即进入该系统的操作界面;
2)内容单选框:单选框为下拉菜单选择器,通过点击选择相应内容。此内容在操作界面中是通用功能,下文不再赘诉;
3)“增删改”功能条:“新增”即增加一条新按钮;“删除”即删除一条或多条已有记录;“编辑”即对一条已有记录进行修改;“导出”即将查询结果导出并保存至电脑;
4)搜索栏:用户在搜索栏中输入希望搜索的条件信息,系统将根据该条件进行搜索,并将搜索结果展示在信息展示窗口中;
5)信息展示窗口:用的查询结果数据都显示在本窗口中,是系统的信息输出界面。
6)每页显示行数调整器:当查询结果数量较大时,用户可控制页面展示的结果数目,通过点击倒三角符号进行调整。
三、操作
本系统主要作为专业育种评估系统,对操作人员的专业知识储备有一定要求,需了解家畜育种的基础知识,理解养殖家畜的性能性状指标,明确本场家畜育种的各阶段目标。系统的操作分为5个阶段:计算性状管理、模型变量管理、模型表达式管理、指数管理和blup运算。各阶段操作的内容及含义如下:
1)计算性状管理操作:根据本场养殖类型对主要关注的性状选择方向进行管理,是为后续计算提供基础数据源的关键步骤。该流程主要管理我们在养殖过程中希望突出或具有更高优先级的生产性能的各项性能数据。以毛用羊为例,其生产性能的参数主要包括:初生重、断奶重、断奶毛长、周岁体重、周岁毛长、羊毛细度、毛长、剪毛前体重、剪毛重等性能参数。
2)模型变量管理操作:BLUP法的重要特征是,在同一个估计方程中,既能估计固定的环境效应和固定的遗传效应,又能预测随机的遗传效应。同时,由于混合模型的灵活性,BLUP法可用于各种动物育种数据的育种值估计。因此本阶段操作的主要内容是尽可能全面、详尽地管理本场养殖生产过程中的系统环境效应和随机环境效应,以此获得更精确的计算结果。
3)模型表达式管理操作:我们可以将模型理解为描述观测值与影响观测值变异性的个因子之间的关系的数学方程式。模型既表达了数据的特性,又反映了生物学问题的规律,同时直接影响着数据统计分析的效果。系统已对某些主要生产性能的模型表达式进行了定义,为获得更精确的计算结果,用户可根据实际生产情况对模型变量进行重新调整。因此,用户在此过程中要考虑所有可能的影响因素。
4)综合选择指数管理操作:此阶段即对相关选择指数表达式的管理操作,根据实际情况,调整各项影响因素的权重占比,完善表达式。
5)BLUP计算操作:此阶段为育种分析的最终阶段,通过直接调用前四个阶段的数据,系统自动完成本场相关个体运算,并形成运算结果表作为科学选种参考供用户采用。系统界面的要素如下:
1、计算性状管理
如上所述,此模块内容是种畜单位在进行新计算性状的添加或对已有性状选项进行编辑,以此完成源数据的选择对接、相关性状的数据维护等操作。
1.1新增性状操作
新增性状操作按下图中序号标记进行,具体如下:
1)在“性状管理”页面点击“新增”功能按钮,弹出新增功能页面。
2)点击下拉菜单,选择目标养殖场。
3)创建“性状名称”,如“产奶量”、“毛长”、“日增重”等。
4)选择数据源,即与该性状相关的各要素因子的数据来源。
5)对性状的显示顺序以数字进行描述,其显示顺序与描述数字相关,数字越大显示顺序越靠前。
6)点击“提交”完成操作。
1.2编辑性状操作
编辑性状是对已有性状进行维护、管理的操作,主要用于更新已有性状的关联因子数据、对性状属性重新排序或对该性状重新定义等。具体操作如下图标记:
1)在已有性状显示栏点击空白处选中该行数据,被选中的数据行呈蓝色。
2)点击“编辑”功能按钮,弹出“编辑”功能页面。
进入“编辑”功能页面后,继续进行如下操作:
1)选择所属公司或主体单位。
2)对性状名称进行管理,可以对已有名称进行修改。
3)可查看现有数据源,同时可对数据源进行更新,通过更新保证性状计算的时效性,提高准确率。
4)调整显示顺序,通过修改相应数字大小调整性状在窗口中的排序位置。
5)点击“提交”完成操作。
2、模型变量管理
模型变量包括系统环境效应和随机环境效应,其中,系统环境效应是在一定时间内以固定的相同的方式影响该环境下的所有个体的因子,如畜群、性别、季节、年龄等;随机环境效应则是以随机方式影响家畜个体的因子,又分为永久性的随机环境效应和暂时性环境效应。本模块的操作同样分为新增和编辑两种操作模式,下面分别对两种操作方式进行详细描述。
2.1新增模型变量操作
系统已对部分主要性状进行了设定,但这些设定不能覆盖所有养殖主体的实际生产情况。因此,当有新的环境变量对性状计算产生影响,此时就需要新增一个变量到系统中,加入到运算序列。
该操作具体如下:
1)点击“新增”功能按钮,弹出“新增”功能页面。
2)点击选择养殖主体,对新的模型变量添加到该主体下。
3)填写变量名称,据实填写该模型变量的名称,便于后续查找、管理。
4)选择模型变量类型,分为系统环境效应和随机环境效应两种,根据新增变量的属性进行选择。
5)选择数据源,选择并对接该模型变量的数据源,保证该变量的数据真实有效性。
6)填写显示顺序的数字编号。
7)点击“提交”完成操作。
2.2模型变量编辑操作
模型变量编辑操作主要针对已有模型变量进行管理和维护,当数据源更新、调整等变化时即需对该变量进行相应调整,保证该模型变量的数据准确性和时效性。具体操作如下图标记所示:
1)点击需要进行管理的数据行空白处选中该数据行,选中后该该数据行呈蓝色。
2)点击“编辑”按钮,弹出“编辑”功能页面。
3)选择所属养殖主体。
4)编辑修改变量名称(如需要)。
5)调整该变量类型(如需要)。
6)修改或更新数据源。
7)调整显示顺序的数字大小。
8)点击“提交”完成操作
3、模型管理
一些主要性状的的运算模型已初始化到了系统中,可直接调用。但这些模型不足以涵盖所有的养殖主体的实际生产场景,因此,需要养殖主体的育种管理员对本场相应模型进行因地制宜的“定制”,即本发明中的“新增”。具体操作如下图标记顺序所示:
1)进入“模型管理”功能页面后,点击“新增”功能按钮,弹出“新增”功能页面。
2)选择所属养殖主体。
3)定义模型名称。
4)添加相应计算性状、固定即随机效应变量,选择遗传参数类型,分为“方差”和“遗传力”两种类型,根据实际情况选择。
5)如果选择遗传参数类型为“方差”则需填写相应的方差值;如选择遗传参数类型为“遗传力”,则需填写响应的遗传力数据。根据实际数据填写,需根据情况填写,此数据一般由育种专家填写。
6)点击提交完成操作。
当已有模型需要变更时,需对现有相关模型进行“编辑”处理,具体操作按下图标记顺序进行:
1)点击需要进行管理的数据行空白处选中该数据行,选中后该该数据行呈蓝色。
2)点击“编辑”功能按钮,弹出编辑功能页面。
3)选择所属养殖主体。
4)修改模型名称(如需要)。
5)选择计算性状内容,即本模型计算的性状方向。
6)选择固定效应内容。
7)选择随机效应变量内容。
8)选择遗传参数类型。
9)填写更新的各项方差数据或遗传力数据。
10)点击提交完成编辑。
4、综合选择指数管理
综合选择指数是根据实际情况、相关行业要求等对相应性状指数各因子权重系数的划分,以确保该指数在育种值计算中更接近实际,从而保证计算结果的准确性。该模块操作分为“新增”和“编辑”两个类型,具体操作如下:
在本发明实施例中,新增综合指数操作如下图标记顺序所示:
1)点击“新增”功能按钮,弹出新增功能页面。
2)点击选择所属养殖主体。
3)填写指数名称。
4)填写性状名称、分配指数权重系数。
5)填写平均值、标准差系数。此系数主要用于提高数据的可查看性,保证计算结果更直观。因此,此数据一般不修改。
6)点击“提交”完成操作。
在本发明实施例中,编辑编辑指数操作如下图标记顺序所示:
1)点击需要进行管理的数据行空白处选中该数据行,选中后该该数据行呈蓝色;
2)点击“编辑”功能按钮,弹出编辑功能页面。
3)选择所属养殖主体。
4)修改指数名称(如需要)。
5)修改性状名称(如需要)。
6)调整权重系数。
7)修改平均值与标准差(不推荐)。
8)点击“提交”完成操作。
5、BLUP计算
BLUP计算是所有运算流程的最后一步,是对前文所述各项内容的综合应用。通过此步骤最终获得育种值计算值,可以为养殖主体提供有力的科学育种指导。其具体操作分为3步:选择个体、数据浏览和计算结果,详细的操作介绍如下图所示:
1)第一步:选择个体
1.1)进入“BLUP”计算页面后,点击“畜种”单选框选择需要计算的牲畜类型;
1.2)选择相应养殖主体;
1.3)选择需要计算的模型,此处可选多个模型同时运算,提高运算效率;
1.4)最后点击“查询”按钮,进入数据浏览功能界面。
2)第二步:数据浏览
2.1)在“第一步”的操作流程中,用户点击查询按钮后,系统即转入此界面。本页面主要向用户在标记“3”的窗口中展示自动调用的所有影响因子数据源,确认无误后即可提交展开运算;
2.2)同时系统支持用户通过execel导入的方式提交运算数据;
2.3)系统亦可将这些相关的影响因子数据以execel的形式导出到电脑桌面,方面查看;
2.4)数据确认无误后,点击“计算”展开运算;
3)第三步:计算结果
3.1)用户在第二步中点击“计算”后,系统即展开运算,根据数据量的多寡系统运行时间有所区别;
3.2)计算结果可以excel的形式导出到用户电脑,方·便查看;
3.3)如无特殊说明,一般均以数值最大者为该性能遗传育种的最优对象。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidState Disk(SSD))等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于BLUP算法的遗传育种信息处理系统,其特征在于,所述基于BLUP算法的遗传育种信息处理系统包括:
计算性状管理模块,与BLUP计算模块连接,用于根据养殖类型对关注的性状选择方向进行管理,同时管理在养殖过程中突出或具有更高优先级的生产性能的各项性能数据;
模型变量管理模块,与BLUP计算模块连接,用于管理养殖生产过程中的系统环境效应和随机环境效应;
模型表达式管理模块,与BLUP计算模块连接,用于根据实际生产情况对模型变量进行调整;
指数管理模块,与BLUP计算模块连接,用于管理相关选择指数表达式,同时根据实际情况,对指数进行新增、编辑,调整各项影响因素的权重占比,对应性状指数各因子权重系数进行划分,完善表达式;
BLUP计算模块,与BLUP计算模块连接,用于调用计算性状管理模块、模型变量管理模块、模型表达式管理模块的相关数据,进行个体计算,并输出计算结果。
2.如权利要求1所述的基于BLUP算法的遗传育种信息处理系统,其特征在于,所述计算性状管理模块包括:
计算性状管理模块还用于进行新计算性状的添加或对已有性状选项进行编辑,完成源数据的选择对接、相关性状的数据维护及其他相关处理;
所述已有性状的编辑包括对已有性状进行维护、管理,具体包括更新已有性状的关联因子数据、对性状属性重新排序或对该性状重新定义。
3.如权利要求1所述的基于BLUP算法的遗传育种信息处理系统,其特征在于,所述模型变量管理模块包括系统环境效应子模块和随机环境效应子模块;系统环境效应子模块用于在一定时间内以固定的相同的方式影响该环境下的所有个体的因子;
随机环境效应子模块,用于以随机方式影响家畜个体的因子;
所述模型变量模块还用于新增、编辑模型变量;所述模型变量的新增中,当有新的环境变量对性状计算产生影响,新增一个变量到系统中,加入到运算序列;
所述模型变量的编辑中,对已有模型变量进行管理和维护,当数据源更新、调整等变化时即需对该变量进行相应调整,用于保证模型变量的数据准确性和时效性。
4.如权利要求1所述的基于BLUP算法的遗传育种信息处理系统,其特征在于,所述模型表达式管理模块还用于管理系统中预先存储的性状的运算模型,同时用于根据实际情况进行模型变量进行新增、适应性调整。
5.如权利要求1所述的基于BLUP算法的遗传育种信息处理系统,其特征在于,所述BLUP计算模块还用于获得育种值计算值。
6.如权利要求1所述的基于BLUP算法的遗传育种信息处理系统,其特征在于,所述基于BLUP算法的遗传育种信息处理系统进一步包括:
系统管理员模块,用于对整体系统的后台维护、权限分配、角色设定、功能展现进行管理;
养殖场管理员模块,用于对养殖场所有种畜的单证进行数据管理、单证审核、记录查询及相关操作;
育种技术员模块,用于根据种畜个体历史繁殖记录、个体信息、性能测定信息、系谱信息及相关数据进行个体育种估算值的科学运算;同时根据种畜个体号自动生成种畜三证,并进行打印。
7.一种应用权利要求1所述基于BLUP算法的遗传育种信息处理系统的基于BLUP算法的遗传育种信息处理方法,其特征在于,所述基于BLUP算法的遗传育种信息处理方法包括以下步骤:
步骤一,根据养殖类型对主要关注的性状选择方向进行管理,管理在养殖过程中突出或具有更高优先级的生产性能的各项性能数据;同时,根据测试方案,测量所有养殖个体的育种目标性状的测定值;
步骤二,设定环境效应的表征指数为温度和湿度,采用格栅法确定养殖环境效应的观测点;根据环境效应计算公式计算各观测点的环境效应指数;
所述环境效应计算公式为:
THI=T-(0.55-0.55RH)×(T-14.5);
其中,THI为环境效应指数,RH为观测点的相对湿度,T为观测点的温度;
步骤三,以环境效应指数为基础,构建养殖环境效应场模型;根据构建的养殖环境效应场模型,调整养殖环境配置情况,对养殖生产过程中的系统环境效应和随机环境效应进行管理,并根据实际生产情况对模型变量进行调整;
步骤四,性状育种值标准化:通过BLUP算法计算得到每个养殖个体或家系的育种值后,对育种值进行标准化;所述性状育种值的标准化公式为:
Figure FDA0002601175730000031
其中,vij表示第i个个体或家系j个性状标准化育种值,aij表示第i个个体或家系j个性状育种值,
Figure FDA0002601175730000032
表示第j个性状的平均育种值,σj表示第j个性状的育种值标准差;
步骤五,管理相关选择指数表达式,根据测定值获取测试个体的个体或家系的选择指数;同时根据实际情况,对指数进行新增、编辑,调整各项影响因素的权重占比,对应性状指数各因子权重系数进行划分,并完善表达式;
所述选择指数表达式为:
Figure FDA0002601175730000033
p′=[p1 p2 … pn],v′i=[vi1 vi2 … vin];
其中,i表示个体或家系,j表示性状的编号,n表示性状的个数,Ii表示第i个个体或家系的选择指数,p表示性状在育种目标中所占百分比向量,vi表示第i个个体或家系性状标准化育种值向量,r控制选择指数间的变异程度大小;
步骤六,调用相关计算数据,选择待计算的牲畜类型、对应的养殖主体以及计算模型;核对调用的所有影响因子数据源是否准确,并通过execel导入的方式提交运算数据;
步骤七,基于运算数据进行计算,数值最大者为性能遗传育种的最优对象,通过BLUP计算模块获得育种值计算值,并输出计算结果。
8.如权利要求7所述的基于BLUP算法的遗传育种信息处理方法,其特征在于,步骤五中,所述根据测定值获取测试个体的个体或家系的选择指数的方法,包括:
(1)根据测试方案中的测试家系数量和测试个体数量及留种方案中的留种家系数量和留种个体数量计算每个育种目标性状的留种率;
(2)根据留种率计算每个育种目标性状的期望选择强度;
(3)根据育种目标性状的测定值及测试个体的系谱信息,通过约束最大似然法计算每个育种目标性状的测定值。
9.一种存储在计算机可读介质上的计算机程序产品,包括计算机可读程序,供于电子装置上执行时,提供用户输入接口以实施如权利要求7~8任意一项所述的基于BLUP算法的遗传育种信息处理方法。
10.一种计算机可读存储介质,储存有指令,当所述指令在计算机上运行时,使得计算机执行如权利要求7~8任意一项所述的基于BLUP算法的遗传育种信息处理方法。
CN202010724507.7A 2020-07-24 2020-07-24 基于blup算法的遗传育种信息处理系统及处理方法 Active CN111797544B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010724507.7A CN111797544B (zh) 2020-07-24 2020-07-24 基于blup算法的遗传育种信息处理系统及处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010724507.7A CN111797544B (zh) 2020-07-24 2020-07-24 基于blup算法的遗传育种信息处理系统及处理方法

Publications (2)

Publication Number Publication Date
CN111797544A true CN111797544A (zh) 2020-10-20
CN111797544B CN111797544B (zh) 2024-05-31

Family

ID=72828740

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010724507.7A Active CN111797544B (zh) 2020-07-24 2020-07-24 基于blup算法的遗传育种信息处理系统及处理方法

Country Status (1)

Country Link
CN (1) CN111797544B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115281145A (zh) * 2022-07-08 2022-11-04 河南省种牛遗传性能测定中心 一种基于测定日模型和动物模型blup筛选优质高产奶牛的育种方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1957684A (zh) * 2006-11-14 2007-05-09 中国水产科学研究院黄海水产研究所 中国对虾多性状育种制定选择指数方法
CN102823528A (zh) * 2012-09-14 2012-12-19 中国水产科学研究院黄海水产研究所 一种鱼虾多个性状选择育种方法
CN110211635A (zh) * 2019-06-12 2019-09-06 北京康普森农业科技有限公司 用于畜禽基因组选择分析的方法及畜禽育种方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1957684A (zh) * 2006-11-14 2007-05-09 中国水产科学研究院黄海水产研究所 中国对虾多性状育种制定选择指数方法
CN102823528A (zh) * 2012-09-14 2012-12-19 中国水产科学研究院黄海水产研究所 一种鱼虾多个性状选择育种方法
CN110211635A (zh) * 2019-06-12 2019-09-06 北京康普森农业科技有限公司 用于畜禽基因组选择分析的方法及畜禽育种方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
景旭;昝林森;黄敬伟;张茜茜;李冰冰;: "基于B/S模式的肉牛选育评估系统的研究与实现", 中国牛业科学, no. 02, 15 March 2011 (2011-03-15) *
栾生;孔杰;王清印;张晓明;张兆明;胡红浪;孙喜模;: "水产动物育种分析与管理系统的开发和应用", 海洋水产研究, no. 03, 15 June 2008 (2008-06-15) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115281145A (zh) * 2022-07-08 2022-11-04 河南省种牛遗传性能测定中心 一种基于测定日模型和动物模型blup筛选优质高产奶牛的育种方法

Also Published As

Publication number Publication date
CN111797544B (zh) 2024-05-31

Similar Documents

Publication Publication Date Title
Huang Mean-parametrized Conway–Maxwell–Poisson regression models for dispersed counts
US11176154B1 (en) Collaborative dataset management system for machine learning data
US9390378B2 (en) System and method for high accuracy product classification with limited supervision
US7747641B2 (en) Modeling sequence and time series data in predictive analytics
US10380265B2 (en) Statistical process control and analytics for translation supply chain operational management
Yu-Wei Machine learning with R cookbook
WO2021057318A1 (zh) 一种业务进度监控方法、装置、系统及计算机可读存储介质
EP4029020A1 (en) Methods and systems for determining and displaying pedigrees
CN108287857B (zh) 表情图片推荐方法及装置
CN105894183B (zh) 项目评价方法及装置
US20030208284A1 (en) Modular architecture for optimizing a configuration of a computer system
US8386396B2 (en) Systems and methods for bidirectional matching
WO2013009710A1 (en) Automated presentation of information using infographics
Zhang et al. A projection method for multiple attribute group decision making with probabilistic linguistic term sets
US8326868B2 (en) Web-enabled database access tools
US20080140430A1 (en) Systems and methods for recruiter rating
Fung et al. A fuzzy expected value-based goal programing model for product planning using quality function deployment
Kläs et al. Quality evaluation for big data: a scalable assessment approach and first evaluation results
CN111582394B (zh) 一种群体评估方法、装置、设备及介质
TW201407526A (zh) 用於藝術指數之自動發展之方法
CN111797544B (zh) 基于blup算法的遗传育种信息处理系统及处理方法
US20130304547A1 (en) Investment valuation projections in an on-demand system
JP2002149959A (ja) 複数のビジネスプロセスに渡るコミュニケーションおよび意志決定のためのフレキシブルなシステムおよび方法
Beneventano et al. Semantic annotation of the CEREALAB database by the AGROVOC linked dataset
Hürland et al. The use of machine learning methods to predict sperm quality in Holstein bulls

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant