CN107967321A - 一种基于层级式支持向量机的作物育种评价方法 - Google Patents
一种基于层级式支持向量机的作物育种评价方法 Download PDFInfo
- Publication number
- CN107967321A CN107967321A CN201711182051.0A CN201711182051A CN107967321A CN 107967321 A CN107967321 A CN 107967321A CN 201711182051 A CN201711182051 A CN 201711182051A CN 107967321 A CN107967321 A CN 107967321A
- Authority
- CN
- China
- Prior art keywords
- support vector
- data
- vector machine
- parameter
- yield
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012706 support-vector machine Methods 0.000 title claims abstract description 88
- 230000001488 breeding effect Effects 0.000 title claims abstract description 66
- 238000009395 breeding Methods 0.000 title claims abstract description 65
- 238000011156 evaluation Methods 0.000 title claims abstract description 60
- 208000035240 Disease Resistance Diseases 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 31
- 238000012549 training Methods 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 8
- 230000002068 genetic effect Effects 0.000 claims description 5
- 238000002790 cross-validation Methods 0.000 claims description 3
- 238000007667 floating Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 39
- 240000008042 Zea mays Species 0.000 description 10
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 10
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 6
- 235000005822 corn Nutrition 0.000 description 6
- 238000013145 classification model Methods 0.000 description 5
- 241000196324 Embryophyta Species 0.000 description 4
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- 235000009973 maize Nutrition 0.000 description 4
- 238000013210 evaluation model Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012854 evaluation process Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003976 plant breeding Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Agronomy & Crop Science (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于层级式支持向量机的作物育种评价方法,该方法包括如下步骤:步骤1,将待评价的品种的性状数据进行划分,从而得到丰产性、稳产性及抗病性相关数据;步骤2,利用决策支持层支持向量机分别对丰产性、稳产性及抗病性相关数据进行处理,从而生成待评价品种的丰产性、稳产性及抗病性的预测数据;步骤3,利用目标层支持向量机分别对丰产性、稳产性及抗病性的预测数据进行处理,从而得到待评价的品种的评价结果。本发明创新地将育种品种的多种性状特征考虑在内,通过优化后的层级式支持向量机实现对育种品种进行全面、客观、准确的评价,提高育种人员的工作效率;另外,本发明具有可靠性强、使用方便、成本低廉等突出优点。
Description
技术领域
本发明涉及作物育种技术领域,更为具体来说,本发明为一种基于层级式支持向量机的作物育种评价方法。
背景技术
目前,作物育种评价是作物育种技术的重要环节,即:从培育品种中评价、选择满足育种目标的优良品种;客观且全面的评价是对育种效果的有效保证。随着我国粮食生产形势的转变,作物育种评价技术已经从依靠育种家的经验为主的阶段向数据化、信息化的育种评价阶段转变。现有的作物育种评价方法包括基于决策树的育种评价方法,构建相应的评价模型,将育种家在历史试验中的选育评价结果引入评价模型的构建中,利用决策树方法来辅助育种家完成部分育种评价工作。但是这种育种评价方法仍然存在如下问题。
(1)主观性过强:现有的方法必须依靠育种家的经验作为评价育种品种的等级依据,而不同的育种人员对同一植株很可能会有不同的评价,所以现有方法存在主观性太强、无法客观评价育种品种的问题。
(2)全面性不足:现有的方法仅能够针对一个植株的某个性状进行评价,无法将品种性状特征的多样性考虑在内,从而得出的评价结果必然是片面的、不合理的。
(3)工作量繁重:现有的方法对评价模型的参数调整往往依靠专家经验进行反复调试,直至获得相对满意的解为止,而这个过程耗时耗力、投入人力和资金成本非常大。
因此,在尽可能地减少人力、物力投入的情况下,如何准确、客观、全面地完成作物育种评价工作,已成为了本领域技术人员亟待解决的技术问题和始终研究的重点。
发明内容
为解决现有作物育种评价方法存在的主观性强、全面性差、工作量大、准确率低等问题,本发明创新提出了一种基于层级式支持向量机的作物育种评价方法,将品种的多种性状特征考虑在内,进行全方面、多角度地分析作物育种的性状数据,并给出客观、准确的评价结果,以有效地解决现有技术存在的诸多问题。
为实现上述技术目的,本发明公开了一种基于层级式支持向量机的作物育种评价方法,该方法包括如下步骤;
步骤1,将待评价的品种的性状数据进行划分,从而得到丰产性相关数据、稳产性相关数据及抗病性相关数据;
步骤2,利用决策支持层支持向量机分别对丰产性相关数据、稳产性相关数据及抗病性相关数据进行处理,从而生成待评价品种的丰产性的预测数据、稳产性的预测数据及抗病性的预测数据,共三维数据;
步骤3,利用目标层支持向量机分别对丰产性的预测数据、稳产性的预测数据及抗病性的预测数据进行处理,从而得到待评价的品种的评价结果,且所述评价结果包括优质和劣质。
本发明创新地采用层级式支持向量机处理相关数据,从丰产性、稳产性及抗病性三个角度分析育种品种的性状数据,从而能够实现全面、客观地对品种进行合理评价。
进一步地,步骤2中,所述决策支持层支持向量机按照如下的方式进行数据处理:将是否达到丰产性作为分类依据,通过对所述丰产性相关数据进行分类和判断的方式得到丰产性的预测数据;将是否达到稳产性作为分类依据,通过对所述稳产性相关数据进行分类和判断的方式得到稳产性的预测数据;将是否达到抗病性作为分类依据,通过对所述抗病性相关数据进行分类和判断的方式得到抗病性的预测数据。
进一步地,步骤3中,所述目标层支持向量机按照如下的方式进行数据处理:将是否达到优质的标准作为分类依据,对待评价品种的丰产性的预测数据、稳产性的预测数据及抗病性的预测数据进行分类和判断,从而确定各待评价的品种的评价结果为优质或劣质。
进一步地,还包括对决策支持层支持向量机和目标层支持向量机进行训练的过程,该过程包括如下步骤:
S1,通过待训练的支持向量机对输入的训练集数据进行测试,以获得分类错误率和支持向量数;
S2,基于遗传算法模型的方法,利用所述分类错误率、所述支持向量数及训练集中数据的数目计算适应度函数值;
S3,判断所述适应度函数值是否达到预设阈值;如果是,则将当前的误差惩罚参数和核函数参数分配给待训练的支持向量机使用;如果否,则更新误差惩罚参数和核函数参数、返回步骤S1。
进一步地,步骤S1中,为待训练的支持向量机设置初始误差惩罚参数和初始核函数参数,再通过待训练的支持向量机对输入的训练集数据进行10折交叉验证,以获得分类错误率和支持向量数;其中,所述分类错误率为预测错误的品种数目与训练时使用的品种数目的比值。
进一步地,步骤S2中,通过如下方式计算适应度函数值:
其中,表示适应度函数,表示核函数参数,C表示误差惩罚参数,E表示分类错误率,C1、C2均表示分类面的复杂程度系数,N1、N2均表示支持向量数,n1、n2表示对应类别训练时使用的品种数目。
进一步地,步骤S3中,通过如下方式更新误差惩罚参数和核函数参数;
步骤S31,通过浮点数编码的方式为当前的误差惩罚参数和核函数参数进行编码,将误差惩罚参数的范围和核函数参数的范围作为初始种群;
步骤S32,进行选择、交叉、变异操作,以得到新的误差惩罚参数和新的核函数参数;
步骤S33,将新的误差惩罚参数和新的核函数参数分别作为待训练的支持向量机的误差惩罚参数和核函数参数,然后返回步骤S1。
基于上述改进的技术方案,本发明采用遗传算法优化支持向量机中的参数,以达到在全局范围内搜寻较优的内部参数的目的,在此基础上进行分类,能够使分类结果更为的准确和合理。
进一步地,在步骤2之前对决策支持层支持向量机、目标层支持向量机进行训练。
进一步地,在步骤1之前对决策支持层支持向量机、目标层支持向量机进行训练。
进一步地,步骤1中,还包括通过如下的方式对待评价品种的性状数据进行归一化的步骤:
其中,X*表示归一化之后的性状数据,X表示原始的性状数据,min表示样本数据中的最小值,max表示样本数据中的最大值。
本发明的有益效果为:本发明创新地将育种品种的多种性状特征考虑在内,通过优化后的层级式支持向量机实现对育种品种进行全面、客观、准确的评价,提高育种人员的工作效率,从而实现了商业化大规模作物育种评价;另外,本发明具有可靠性强、使用方便、成本低廉、便于推广应用等突出优点。
附图说明
图1为基于层级式支持向量机的作物育种评价方法的流程示意图。
图2为基于本发明生成的育种评价分类模型的工作流程示意图。
图3为对层级式支持向量机进行训练和使用的流程示意图。
具体实施方式
下面结合说明书附图对本发明基于层级式支持向量机的作物育种评价方法进行详细的解释和说明。
为了满足商业化大规模育种的数据分析需求,结合育种家对作物育种性状选择的经验和机器学习算法,本发明创新提出基于遗传算法优化支持向量机参数选取的层级式分类模型。如图1、2、3所示,本发明公开了一种基于层级式支持向量机的作物育种评价方法,该方法具体包括如下步骤。
步骤1,将待评价的品种的性状数据进行划分,从而得到三类数据:丰产性相关数据、稳产性相关数据及抗病性相关数据;本步骤中,还包括通过如下的方式对待评价品种的性状数据进行归一化和规范化的步骤:
归一化:
其中,X*表示归一化之后的性状数据,X表示原始的性状数据,min表示样本数据中的最小值,max表示样本数据中的最大值。
育种家对育种品种的评价结果通常为离散型的描述语言,本发明还对性状特征集合中每种性状特征进行规范化处理,包括统一量化方式、统一计量单位以及统一表现形式等。
比如,以玉米品种为例,待评价的玉米品种的性状数据作为原始数据,丰产性是指品种的产量表现,稳产性是指品种产量的稳定性,原始数据中包含玉米品种的田间植株性状数据、产量数据及抗病性数据;其中丰产性相关数据可包括亩产、增产点数、生育期等,稳产性相关数据可包括倒折率、倒伏率、株高、空杆率、百粒重等,抗病性相关数据可包括大斑病、丝黑穗病、镰苞茎腐病、穗腐病等。
步骤2,如图2所示,利用决策支持层支持向量机分别对丰产性相关数据、稳产性相关数据及抗病性相关数据进行处理,从而生成待评价品种的丰产性的预测数据、稳产性的预测数据及抗病性的预测数据,共三维数据;具体来说,本实施例中,决策支持层支持向量机按照如下的方式进行数据处理:将是否达到丰产性作为分类依据,通过对丰产性相关数据进行分类和判断的方式得到丰产性的预测数据;将是否达到稳产性作为分类依据,通过对稳产性相关数据进行分类和判断的方式得到稳产性的预测数据;将是否达到抗病性作为分类依据,通过对抗病性相关数据进行分类和判断的方式得到抗病性的预测数据。
比如,将玉米的丰产性相关数据、稳产性相关数据及抗病性相关数据作为特征属性,是否达到丰产性、稳产性及抗病性作为分类依据,对玉米品种进行分类,再通过决策支持层支持向量机进行分类后输出分类结果,得到玉米的丰产性的预测数据、稳产性的预测数据及抗病性的预测数据。
步骤3,如图2所示,利用目标层支持向量机分别对丰产性的预测数据、稳产性的预测数据及抗病性的预测数据进行处理,以得到待评价的品种的评价结果,且评价结果包括优质和劣质。具体来说,本实施例中,目标层支持向量机按照如下的方式进行数据处理:将是否达到优质的标准作为分类依据,对待评价品种的丰产性的预测数据、稳产性的预测数据及抗病性的预测数据进行分类和判断,从而确定各待评价的品种的评价结果为优质或劣质。
比如,本步骤将得到的玉米品种的丰产性的预测数据、稳产性的预测数据及抗病性的预测数据作为特征属性,玉米品种的优劣作为目标属性,将特征属性输入至目标层支持向量机中,以对玉米品种进行第二次分类,从而获得最终的分类结果,即玉米品种的评价结果。
需要特殊说明的是,本发明还包括对决策支持层支持向量机和目标层支持向量机进行训练的过程;可在步骤1之后、步骤2之前对决策支持层支持向量机、目标层支持向量机进行训练,即向支持向量机输入测试集数据时同时输入训练集数据;当然,也可实现将支持向量机训练完成,即在步骤1之前对决策支持层支持向量机、目标层支持向量机进行训练。在本实施例中,如图3所示,在向支持向量机输入测试集数据时同时输入训练集数据;其中,训练集数据为有类别标签的数据,其用于对支持向量机进行训练,比如:数据表形式为品种性状数据-是否达到丰产性;测试集数据为不包含类别标签的数据,数据表中只包含品种性状数据,是本发明待处理的对象。上述的训练过程具体包括如下步骤。
S1,通过待训练的支持向量机对输入的训练集数据进行测试,以获得分类错误率和支持向量数;具体来说,本步骤中,为待训练的支持向量机设置初始误差惩罚参数和初始核函数参数,将初始核函数参数的范围设定为{min(||xi-xj||2)×10-3,max(||xi-xj||2)×103};其中,xi、xj表示品种性状数据;而初始误差惩罚参数C设置一个足够大的值(比如10000),用其训练支持向量机得出一组ai,其中i=1,…,L,L为训练样本总数。令C*=max(ai),如果C*<C,则以C*作为C的取值上限;否则,表明C仍对ai的取值构成约束,换取另一个更大的C训练SVM,直至得到的C*远小于C为止。这样就可以确定C的搜索空间为(0,C*)。在参数C和中随机获取一组数据,代入SVM分类器中,通过待训练的支持向量机对输入的训练集数据进行10折交叉验证,以获得分类错误率E、支持向量数N1、N2及对应类别的测试数据数目n1、n2;其中,分类错误率为预测错误的品种数目与训练时使用的品种数目的比值。
需要特别强调的是,由于品种性状数据与品种类别之间不是线性关系,对于这种情况,本发明的支持向量机(SVM)引入核函数,以将品种数据通过非线性变化映射到高维特征空间,在高维空间中求最优分类面。在本实施例中,选择径向基函数(Radial BasisFunction,RBF)作为核函数,RBF核函数定义如下:
其中,表示核函数参数,其影响品种数据在高维特征空间中分布的复杂程度,合适的可以将品种性状数据映射到较为合适的特征空间中,xi表示品种性状数据,x表示xi向特征空间中映射的点。
本发明中的支持向量机通过构造最优分类面对样本数据进行分类,而最优分类面的构造问题的实质就是求解下述决策函数的最优解。
其中,sgn()表示符号函数,l表示训练样本的数目,b表示常数项,而系数ai为下面二次优化问题的解:
yTa=0
0≤ai≤C,i=1,…,l
其中,C表示误差惩罚参数,合适的C可有效地预防支持向量机分类器的过拟合问题出现。由上述内容可看出,参数C和可以决定品种评价的结果。因此,如何合理的选择这两个参数,成为影响品种评价结果的关键。
S2,基于遗传算法模型的方法,利用分类错误率、支持向量数及训练集中数据的数目计算适应度函数值;本实施例中,通过如下方式计算适应度函数值:
其中,表示适应度函数,表示核函数参数,C表示误差惩罚参数,E表示分类错误率,C1、C2均表示分类面的复杂程度系数,为0~1的常数,N1、N2均表示支持向量数,n1、n2表示对应类别训练时使用的品种数目。
S3,判断适应度函数值是否达到预设阈值;如果是,则将当前的误差惩罚参数和核函数参数分配给待训练的支持向量机使用;如果否,则更新误差惩罚参数和核函数参数、返回步骤S1;其中,在本发明公开的方案的基础上,预设阈值根据实际情况进行合理的设定。本实施例中,通过如下方式更新误差惩罚参数和核函数参数。具体实施时,更新过程可能会执行多次,直至适应度函数值大于或等于预设阈值为止。
步骤S31,通过浮点数编码的方式为当前的误差惩罚参数和核函数参数进行编码,将误差惩罚参数的范围和核函数参数的范围作为初始种群;
步骤S32,以初始种群作为对象,进行选择、交叉、变异操作,以得到新的误差惩罚参数和新的核函数参数;
步骤S33,将新的误差惩罚参数和新的核函数参数分别作为待训练的支持向量机的误差惩罚参数和核函数参数,然后返回步骤S1。
另外,在本发明公开的的方案的基础上,可结合农作物品种审定标准合理确定育种品种评价等级,比如,依据《主要农作物品种审定标准》等文献,从而进一步降低育种过程中的主观性。
可利用本发明的基于层级式支持向量机的作物育种评价方法生成育种评价分类模型,结合行业标准,对数据进行预处理,之后给出相关的分类评价结果;以此作为育种决策的一个依据,可代替或辅助育种人员的进行决策。
综上,本发明具有如下优点。降低了育种评价过程中的主观性:传统的育种评价过程大都依据过往育种经验进行评估,育种过程太过主观;本方法结合育种行业的指标评价,提出较为合理的育种评价依据;并在此基础上结合SVM分类模型,获得更为合理的育种评价结果;提高了算法的健壮性:本方法提出的分类模型从育种评价的实际需求出发,将育种数据中涉及到的多个性状属性划分为三部分进行有针对性的分类,并使用SVM作为分类器,降低了噪声数据对于分类结果的影响,所得到的分类结果更加有效,有效地推动了后续育种工作的进行;降低了人工成本:通过本方法学习了专家经验、掌握了历史数据规律,在商业化育种时,可以大大降低人工成本,通过机器计算即可完成多位专家需要进行的工作;提高了工作效率:从获取数据到分析数据,现有技术需要多方面的查阅文献资料并进行繁杂的计算工作,现可通过本方法,从输入数据到分析数据,极大地缩短了育种分析的时间,提高了育种工作人员的工作效率,因此本发明更加适应大规模育种数据分析的需求。
此外,在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。在本说明书的描述中,参考术语“本实施例”、“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明实质内容上所作的任何修改、等同替换和简单改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于层级式支持向量机的作物育种评价方法,其特征在于:该方法包括如下步骤;
步骤1,将待评价的品种的性状数据进行划分,从而得到丰产性相关数据、稳产性相关数据及抗病性相关数据;
步骤2,利用决策支持层支持向量机分别对丰产性相关数据、稳产性相关数据及抗病性相关数据进行处理,从而生成待评价品种的丰产性的预测数据、稳产性的预测数据及抗病性的预测数据;
步骤3,利用目标层支持向量机分别对丰产性的预测数据、稳产性的预测数据及抗病性的预测数据进行处理,从而得到待评价的品种的评价结果,且所述评价结果包括优质和劣质。
2.根据权利要求1所述的基于层级式支持向量机的作物育种评价方法,其特征在于:步骤2中,所述决策支持层支持向量机按照如下的方式进行数据处理:将是否达到丰产性作为分类依据,通过对所述丰产性相关数据进行分类和判断的方式得到丰产性的预测数据;将是否达到稳产性作为分类依据,通过对所述稳产性相关数据进行分类和判断的方式得到稳产性的预测数据;将是否达到抗病性作为分类依据,通过对所述抗病性相关数据进行分类和判断的方式得到抗病性的预测数据。
3.根据权利要求2所述的基于层级式支持向量机的作物育种评价方法,其特征在于:步骤3中,所述目标层支持向量机按照如下的方式进行数据处理:将是否达到优质的标准作为分类依据,对待评价品种的丰产性的预测数据、稳产性的预测数据及抗病性的预测数据进行分类和判断,从而确定各待评价的品种的评价结果为优质或劣质。
4.根据权利要求1至3中任一权利要求所述的基于层级式支持向量机的作物育种评价方法,其特征在于:还包括对决策支持层支持向量机和目标层支持向量机进行训练的过程,该过程包括如下步骤:
S1,通过待训练的支持向量机对输入的训练集数据进行测试,以获得分类错误率和支持向量数;
S2,基于遗传算法模型的方法,利用所述分类错误率、所述支持向量数及训练集中数据的数目计算适应度函数值;
S3,判断所述适应度函数值是否达到预设阈值;如果是,则将当前的误差惩罚参数和核函数参数分配给待训练的支持向量机使用;如果否,则更新误差惩罚参数和核函数参数、返回步骤S1。
5.根据权利要求4所述的基于层级式支持向量机的作物育种评价方法,其特征在于:步骤S1中,为待训练的支持向量机设置初始误差惩罚参数和初始核函数参数,再通过待训练的支持向量机对输入的训练集数据进行10折交叉验证,以获得分类错误率和支持向量数;其中,所述分类错误率为预测错误的品种数目与训练时使用的品种数目的比值。
6.根据权利要求5所述的基于层级式支持向量机的作物育种评价方法,其特征在于:步骤S2中,通过如下方式计算适应度函数值:
<mrow>
<mi>F</mi>
<mi>i</mi>
<mi>t</mi>
<mrow>
<mo>(</mo>
<msup>
<mo>&part;</mo>
<mn>2</mn>
</msup>
<mo>,</mo>
<mi>C</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mrow>
<mn>1</mn>
<mo>+</mo>
<mi>E</mi>
<mo>+</mo>
<msub>
<mi>C</mi>
<mn>1</mn>
</msub>
<msub>
<mi>N</mi>
<mn>1</mn>
</msub>
<mo>/</mo>
<msub>
<mi>n</mi>
<mn>1</mn>
</msub>
<mo>+</mo>
<msub>
<mi>C</mi>
<mn>2</mn>
</msub>
<msub>
<mi>N</mi>
<mn>2</mn>
</msub>
<mo>/</mo>
<msub>
<mi>n</mi>
<mn>2</mn>
</msub>
</mrow>
</mfrac>
</mrow>
其中,表示适应度函数,表示核函数参数,C表示误差惩罚参数,E表示分类错误率,C1、C2均表示分类面的复杂程度系数,N1、N2均表示支持向量数,n1、n2表示对应类别训练时使用的品种数目。
7.根据权利要求6所述的基于层级式支持向量机的作物育种评价方法,其特征在于:步骤S3中,通过如下方式更新误差惩罚参数和核函数参数;
步骤S31,通过浮点数编码的方式为当前的误差惩罚参数和核函数参数进行编码,将误差惩罚参数的范围和核函数参数的范围作为初始种群;
步骤S32,进行选择、交叉、变异操作,以得到新的误差惩罚参数和新的核函数参数;
步骤S33,将新的误差惩罚参数和新的核函数参数分别作为待训练的支持向量机的误差惩罚参数和核函数参数,然后返回步骤S1。
8.根据权利要求7所述的基于层级式支持向量机的作物育种评价方法,其特征在于:在步骤2之前对决策支持层支持向量机、目标层支持向量机进行训练。
9.根据权利要求8所述的基于层级式支持向量机的作物育种评价方法,其特征在于:在步骤1之前对决策支持层支持向量机、目标层支持向量机进行训练。
10.根据权利要求1所述的基于层级式支持向量机的作物育种评价方法,其特征在于:步骤1中,还包括通过如下的方式对待评价品种的性状数据进行归一化的步骤:
<mrow>
<msup>
<mi>X</mi>
<mo>*</mo>
</msup>
<mo>=</mo>
<mfrac>
<mrow>
<mi>X</mi>
<mo>-</mo>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
<mo>-</mo>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
</mfrac>
</mrow>
其中,X*表示归一化之后的性状数据,X表示原始的性状数据,min表示样本数据中的最小值,max表示样本数据中的最大值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711182051.0A CN107967321A (zh) | 2017-11-23 | 2017-11-23 | 一种基于层级式支持向量机的作物育种评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711182051.0A CN107967321A (zh) | 2017-11-23 | 2017-11-23 | 一种基于层级式支持向量机的作物育种评价方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107967321A true CN107967321A (zh) | 2018-04-27 |
Family
ID=62000280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711182051.0A Pending CN107967321A (zh) | 2017-11-23 | 2017-11-23 | 一种基于层级式支持向量机的作物育种评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107967321A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109685174A (zh) * | 2018-12-26 | 2019-04-26 | 天津市农业科学院信息研究所 | 一种黄瓜丰产性自动分析装置及方法 |
CN110378591A (zh) * | 2019-07-11 | 2019-10-25 | 仲恺农业工程学院 | 一种基于决策树的作物育种信息测定系统及方法 |
CN117933580A (zh) * | 2024-03-25 | 2024-04-26 | 河北省农林科学院农业信息与经济研究所 | 用于小麦育种管理系统的育种材料优化评估方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103793850A (zh) * | 2014-01-22 | 2014-05-14 | 北京农业信息技术研究中心 | 一种作物育种材料筛选方法和系统 |
CN104636635A (zh) * | 2015-01-29 | 2015-05-20 | 南京理工大学 | 基于两层svm学习机制的蛋白质结晶预测方法 |
CN104951987A (zh) * | 2015-06-19 | 2015-09-30 | 北京农业信息技术研究中心 | 基于决策树的作物育种评价方法 |
-
2017
- 2017-11-23 CN CN201711182051.0A patent/CN107967321A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103793850A (zh) * | 2014-01-22 | 2014-05-14 | 北京农业信息技术研究中心 | 一种作物育种材料筛选方法和系统 |
CN104636635A (zh) * | 2015-01-29 | 2015-05-20 | 南京理工大学 | 基于两层svm学习机制的蛋白质结晶预测方法 |
CN104951987A (zh) * | 2015-06-19 | 2015-09-30 | 北京农业信息技术研究中心 | 基于决策树的作物育种评价方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109685174A (zh) * | 2018-12-26 | 2019-04-26 | 天津市农业科学院信息研究所 | 一种黄瓜丰产性自动分析装置及方法 |
CN109685174B (zh) * | 2018-12-26 | 2021-09-21 | 天津市农业科学院信息研究所 | 一种黄瓜丰产性自动分析装置及方法 |
CN110378591A (zh) * | 2019-07-11 | 2019-10-25 | 仲恺农业工程学院 | 一种基于决策树的作物育种信息测定系统及方法 |
CN117933580A (zh) * | 2024-03-25 | 2024-04-26 | 河北省农林科学院农业信息与经济研究所 | 用于小麦育种管理系统的育种材料优化评估方法 |
CN117933580B (zh) * | 2024-03-25 | 2024-05-31 | 河北省农林科学院农业信息与经济研究所 | 用于小麦育种管理系统的育种材料优化评估方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106709754A (zh) | 一种用基于文本挖掘的电力用户分群方法 | |
CN108805743A (zh) | 一种电网企业售电公司运营效益评价方法 | |
CN104951987B (zh) | 基于决策树的作物育种评价方法 | |
CN103745273A (zh) | 一种半导体制造过程的多性能预测方法 | |
US20220327398A1 (en) | Technology maturity judgment method and system based on science and technology data | |
CN110717654B (zh) | 基于用户评论的产品质量评价方法和系统 | |
CN107967321A (zh) | 一种基于层级式支持向量机的作物育种评价方法 | |
CN107609771A (zh) | 一种供应商价值评价方法 | |
CN110310012B (zh) | 数据分析方法、装置、设备及计算机可读存储介质 | |
CN117290462B (zh) | 一种数据大模型的智能决策系统及方法 | |
CN107067033A (zh) | 机器学习模型的局部修复方法 | |
CN112819322A (zh) | 基于改进模糊层次分析法的输电线路路径方案评估方法 | |
CN109345381A (zh) | 一种风险识别方法和系统 | |
CN103353895A (zh) | 一种配电网线损数据的预处理方法 | |
CN103942604A (zh) | 基于森林区分度模型的预测方法及系统 | |
CN111275485A (zh) | 基于大数据分析的电网客户等级划分方法、系统、计算机设备及存储介质 | |
CN110738565A (zh) | 基于数据集合的房产金融人工智能复合风控模型 | |
CN112785156B (zh) | 一种基于聚类与综合评价的产业领袖识别方法 | |
CN104572900B (zh) | 一种作物育种评价的性状特征选择方法 | |
CN117314643A (zh) | 基于金融风洞数据的数据分析方法、装置及存储介质 | |
CN109472320B (zh) | 不确定条件下作物生育期模型品种参数自动校正方法 | |
Maksimović et al. | Multi-attribute analysis of orchard according to the integrated production concept | |
Noviana et al. | Decision Support System for Selection of the Superior Mango Seeds Using Web-based Analytical Hierarchy Process (AHP) Hybrid Simple Additive Weighting (SAW) Method | |
Pauwels et al. | A decision support system to simulate and compare silvicultural scenarios for pure even-aged larch stands | |
Dalimunthe et al. | Study of C45 Algorithm In Predicting New Employee Acception |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180427 |
|
RJ01 | Rejection of invention patent application after publication |