CN112232387A - 基于lselm-rfe的粮食作物病害症状的有效特征识别方法 - Google Patents
基于lselm-rfe的粮食作物病害症状的有效特征识别方法 Download PDFInfo
- Publication number
- CN112232387A CN112232387A CN202011046610.7A CN202011046610A CN112232387A CN 112232387 A CN112232387 A CN 112232387A CN 202011046610 A CN202011046610 A CN 202011046610A CN 112232387 A CN112232387 A CN 112232387A
- Authority
- CN
- China
- Prior art keywords
- rfe
- effective
- lselm
- disease symptoms
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 62
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 62
- 238000000034 method Methods 0.000 title claims abstract description 53
- 208000024891 symptom Diseases 0.000 title claims abstract description 32
- 238000012549 training Methods 0.000 claims abstract description 37
- 230000006870 function Effects 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 235000013305 food Nutrition 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 5
- 238000009826 distribution Methods 0.000 claims description 3
- 238000012512 characterization method Methods 0.000 claims 1
- 244000068988 Glycine max Species 0.000 abstract description 32
- 235000010469 Glycine max Nutrition 0.000 abstract description 31
- 238000012360 testing method Methods 0.000 abstract description 13
- 238000004364 calculation method Methods 0.000 abstract description 3
- 230000008030 elimination Effects 0.000 abstract description 2
- 238000003379 elimination reaction Methods 0.000 abstract description 2
- 238000002474 experimental method Methods 0.000 abstract 1
- 238000001514 detection method Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 238000010187 selection method Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 3
- 241000607479 Yersinia pestis Species 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 238000003912 environmental pollution Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000035784 germination Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 1
- 241000223218 Fusarium Species 0.000 description 1
- 206010027146 Melanoderma Diseases 0.000 description 1
- 206010037549 Purpura Diseases 0.000 description 1
- 241001672981 Purpura Species 0.000 description 1
- 206010039509 Scab Diseases 0.000 description 1
- 241000576755 Sclerotia Species 0.000 description 1
- 235000019764 Soybean Meal Nutrition 0.000 description 1
- 238000003915 air pollution Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000003967 crop rotation Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008635 plant growth Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000003900 soil pollution Methods 0.000 description 1
- 239000004455 soybean meal Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/68—Food, e.g. fruit or vegetables
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Agronomy & Crop Science (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了一种基于LSELM‑RFE的粮食作物病害症状的有效特征识别方法,该方法首先初始化有效特征排序表和当前特征子集表,并获取当前训练样本集,接着训练最小二乘超限学习机分类器并计算特征的排序系数,找出排序得分最小的因素特征,然后更新有效特征排序表和当前特征子集表,并重复以上步骤直至当前特征子集表为空。本发明的方法相比于传统的递归特征消除类方法,只需调节学习模型参数C,能快速识别粮食作物病害症状的有效特征。通过在UCI标准数据库中的Soybean数据集上的实验表明,相比传统SVM‑RFE方法,本发明方法仅需3%的计算时间,而且仅需1个有效特征在测试集上得到最高的测试精度,识别出的特征更有效。
Description
技术领域
本发明属于粮食作物病害症状的有效特征识别领域,特别涉及一种基于LSELM-RFE的粮食作物病害症状的有效特征识别方法。
背景技术
大豆是作为我国乃至世界的经济作物之一,对人们的日常生活起着举足轻重的作用。由于经济发展所带来的环境污染问题越来越严重,空气污染和土壤污染,以及昆虫传播等诸多原因都可能引发大豆病害,造成大豆品质的下降。随着轮作周期不断减少,病虫害预防不及时致使大豆产量降低,大豆的价格不断提升。
在大豆的种植生产过程中,病虫害危害不仅会降低其产量及质量,而且对其生产效益可产生不可逆转的影响。大豆病虫害种类繁多,其中危害大豆粒荚的病害主要有大豆炭疽病(Soybean Anthracnose)、大豆紫斑病(Soybean Purple Speck)、大豆赤霉病(Soybean Fusarium Head Blight,又称大豆粉霉病)、大豆荚枯病(Soybean Pod Blight)、大豆轮纹病(Soybean Zonate Spot)、大豆黑痘病(Soybean Scab)、大豆灰斑病(frog-eye-leaf-spot)、大豆兰格苞叶斑病(alternaria leaf spot)等数十种。针对大豆各种病害的诊断监测一直以来都是一项重要且紧迫的工作。
针对粮食作物病害的传统检测方法是靠人类感官判断,不仅效率低、准确率差且难度大,需要检测人员具备较强的专业知识或经验,难以大范围推广。生物学和化学的检测方法在病害检测中的应用也较多,但是这种检测方法对检测样品的精度以及检测者的操作技术要求都很高,且成本高、耗时长、对样品产生破坏较多,还容易造成环境污染。随着科技的发展,计算机智能识别机器学习技术逐渐被应用于粮食作物病害的自动诊断与防治领域,为粮食作物病害的无损检测及快速诊断奠定了理论基础。但是大豆病害症状表现具有复杂性和模糊性,病害种类与表现特征之间存在着较强的潜在规律,难以用精确数学模型表示。不同的病害种类呈现出的病斑区域的形状特征、颜色特征及纹理特征存在较强独立性又相互关联。找出最能代表某种病害种类的表现特征,是识别病害和对病害进行防治的关键手段。
识别影响粮食作物发生病害的有效特征在机器学习领域可以看作是一种特征选择问题,即收集到的发生某种病害的粮食作物数据的多个表现特征中选取最能体现病害症状的有效特征。目前的特征选择方法主要有:过滤法(Filter):按照发散性或者相关性对各个特征进行评分,设定阈值或者待选择阈值的个数,选择特征。封装法(Wrapper):根据目标函数(通常是预测效果评分),每次选择若干特征,或者排除若干特征。相对于过滤法方法,封装法方法找到的特征子集分类性能通常更好。
支持向量机递归特征消除(SVM-RFE)是Guyon等人提出的包装器算法。它使用从SVM模型中支持向量的权重得出的得分函数访问特征,并递归地消除得分最低的特征。重复此过程,直到模型中剩下少量变量为止。由于其在微阵列分类中的成功应用,SVM-RFE获得了极大的欢迎,并被公认为最有效的特征选择方法之一。尽管SVM-RFE在分类率上表现更好,但是它通常需要大量的计算,尤其是针对于非线性SVM的应用。由于非线性SVM中的映射函数是未知的,因此无法显式计算权重向量。尽管可以通过特殊策略将线性SVM-RFE扩展到非线性情况,但它将花费额外的计算成本。虽然目前有很多研究从各种角度提升SVM-RFE的效率,但是SVM固有的模型选择问题还是会为SVM-RFE引入大量额外的计算代价。
发明内容
本发明的目的在于针对上述现有技术存在的问题,提供一种基于LSELM-RFE的粮食作物病害症状的有效特征识别方法。
实现本发明目的的技术解决方案为:一种基于LSELM-RFE的粮食作物病害症状的有效特征识别方法,所述方法包括以下步骤:
步骤1,构建粮食作物病害症状的数据样本集X,空的有效特征排序表r,以及初始化的有效特征子集指标表s=[1,2,…,d],其中d表示特征的总数;
步骤2,构建当前训练样本集X0;
步骤3,训练分类器LSELMtrain,分类器的输入为从训练样本集X0中删除表s中第i个指标对应的有效特征后的集合;
步骤4、基于训练后的分类器,计算训练样本集X0中表s中第i个指标对应的有效特征的排序系数;
步骤5,获取当前排序系数最小的有效特征f;
步骤6,更新关键因素特征排序表r,具体为:在有效特征排序表r的第一个元素之前加入有效特征f在表s中对应的s(f);
步骤7,更新因素特征子集指标表s,具体为:从表s中消除s(f);
步骤8,判断表s是否为空,若是,则终止上述LSELM-RFE方法的过程,返回有效特征排序表r,否则返回步骤2继续执行。
进一步地,步骤1中所述数据样本集X为:
式中,xi∈Rd表示第i个数据样本包括d个特征,ti∈{-1,1}为类别,1表示该粮食作物样本存在病害,-1表示粮食作物样本不存在病害,N为数据样本的个数。
进一步地,步骤2所述构建当前训练样本集X0,具体为:
从数据样本集X的所有因素特征中选取集合s中的有效特征构成训练样本集X0,表示为X0=X(:,s)。
进一步地,步骤3所述训练分类器ELMtrain,分类器的输入为从训练样本集X0中删除表s中第i个指标对应的因素特征后的集合,具体过程包括:
步骤3-1,选取最小二乘超限学习机模型参数,包括隐节点个数L和惩罚因子C;
步骤3-2,随机赋值输入权值a和隐藏层偏置b,其中a∈RN×L,b∈RL;
步骤3-3,选取激活函数G(a,b,x),其中x为从训练样本集X0中删除表s中第i个指标对应的有效特征后的集合,表示为X0(:,s(-i));
步骤3-4,构建隐藏层输出矩阵H:
步骤3-5,计算超限学习机核矩阵KELM:
KELM=HHT
进一步地,步骤4中计算训练样本集X0中表s中第i个指标对应的有效特征的排序系数,计算公式为:
rank(i)=||β(-i)||
式中,rank(i)表示表s中第i个指标对应的有效特征的排序系数。
本发明与现有技术相比,其显著优点为:1)本发明只需调节一个参数,即惩罚因子C,其它的模型参数从均匀分布中随机产生;2)本发明能够快速识别粮食作物病害症状的有效特征,并得到所有特征对粮食作物病害症状影响的排名;相比于传统的特征选择方法,本发明识别的有效特征,不仅能够提升粮食作物病害症状的识别精度,还能节省大量学习模型的训练时间,适合粮食作物病害症状识别的应用,以便针对症状及时消除病害,提高粮食产量。
下面结合附图对本发明作进一步详细描述。
附图说明
图1为本发明基于LSELM-RFE的粮食作物病害症状的有效特征识别方法流程图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本发明LSELM-RFE方法利用LSELM学习模型在数据集上训练得到的权重向量对特征进行排序。在每一次循环中,具有最小排序系数的特征将被移除,然后LSELM对剩余的特征重新训练以获取新的排序系数。LSELM-RFE方法通过迭代执行这一过程,最后得到一个特征排序表。利用该排序列表,可以定义若干个嵌套的特征子集在SVM-RFE方法中,一般使用SVM算法的预测精度来评估这些特征子集的优劣。为了方便比较,本发明提出的LSELM-RFE方法训练得到的特征排序表也使用SVM的预测精度来选择最佳特征子集。
为了能便于理解本发明,下面先对SVM方法进行介绍。SVM模型分类过程如下:
步骤A,给定训练样本集(xi,ti),i=1,...,N,其中xi∈Rd,ti∈{-1,1}。根据经验风险最小化原则,同时最大化分类间隔和最小化训练错误,求解SVM的优化问题:
ξi≥0,i=1,…,N
步骤B,将SVM的优化问题转化为对偶问题求解:
参数C和核函数的参数的选取使用网格选取法,在下面的参数范围里选取最优参数组合:{0.001,0.01,0.05,0.1,0.2,0.5,1,2,5,10,20,50,100,1000,10000}×{0.001,0.01,0.1,0.2,0.4,0.8,1,2,5,10,20,50,100,1000,10000}。
步骤D、根据步骤C得到的法向量w*和偏置b*,得到支持向量机分类模型f(x):
步骤E、利用支持向量机分类模型f(x)对测试样本进行预测。
为了克服传统SVM-RFE在识别影响用户购物意图的关键因素应用中存在的识别速度慢和需要耗费大量时间进行模型选择的问题,本发明提出的基于LSELM-RFE的粮食作物病害症状的有效特征识别方法,首先收集粮食作物病害数据样本集,包括训练样本集测试样本集其中xi∈Rd为粮食作物病害的相关特征,主要有日期、植物生长是否规范,发芽率,损坏的区域,是否受过冰雹,温度,叶子是否异常,种子是否变色,种子大小,种子是否异常,菌核是否存在,根部是否腐烂等等。ti∈{-1,1}为类别,包括正类和负类。
综上述分析,在一个实施例中,结合图1,提供了一种基于LSELM-RFE的粮食作物病害症状的有效特征识别方法,所述方法包括以下步骤:
步骤1,构建粮食作物病害症状的数据样本集X,空的有效特征排序表r,以及初始化的有效特征子集指标表s=[1,2,…,d],其中d表示特征的总数;
步骤2,构建当前训练样本集X0;
步骤3,训练分类器LSELMtrain,分类器的输入为从训练样本集X0中删除表s中第i个指标对应的有效特征后的集合;
步骤4、基于训练后的分类器,计算训练样本集X0中表s中第i个指标对应的有效特征的排序系数;
步骤5,获取当前排序系数最小的有效特征f;
步骤6,更新关键因素特征排序表r,具体为:在有效特征排序表r的第一个元素之前加入有效特征f在表s中对应的s(f);
步骤7,更新因素特征子集指标表s,具体为:从表s中消除s(f);
步骤8,判断表s是否为空,若是,则终止上述LSELM-RFE方法的过程,返回有效特征排序表r,否则返回步骤2继续执行;
步骤9,利用SVM算法在测试样本集V上由因素特征排序表的若干嵌套子集组成的测试集上测试数据的预测精确率。取测试精度(TA)作为预测指标,另外将ELM-RFE算法的运行时间(TS)也作为指标。
进一步地,在其中一个实施例中,步骤1中所述数据样本集X为:
式中,xi∈Rd表示第i个数据样本包括d个特征,ti∈{-1,1}为类别,1表示该粮食作物样本存在病害,-1表示粮食作物样本不存在病害,N为数据样本的个数。
进一步地,在其中一个实施例中,步骤2所述构建当前训练样本集X0,具体为:
从数据样本集X的所有因素特征中选取集合s中的有效特征构成训练样本集X0,表示为X0=X(:,s)。
进一步地,在其中一个实施例中,步骤3所述训练分类器ELMtrain,分类器的输入为从训练样本集X0中删除表s中第i个指标对应的因素特征后的集合,具体过程包括:
步骤3-1,选取最小二乘超限学习机模型参数,包括隐节点个数L和惩罚因子C;
步骤3-2,随机赋值输入权值a和隐藏层偏置b,其中a∈RN×L,b∈RL;
步骤3-3,选取激活函数G(a,b,x),其中x为从训练样本集X0中删除表s中第i个指标对应的有效特征后的集合,表示为X0(:,s(-i));
步骤3-4,构建隐藏层输出矩阵H:
步骤3-5,计算超限学习机核矩阵KELM:
KELM=HHT
进一步地,在其中一个实施例中,步骤3-1中隐节点个数L的取值大于1000,惩罚因子C选取大于0的正数。
进一步地,在其中一个实施例中,步骤3-2中所述输入权值a和隐藏层偏置b分别从均匀概率分布(-1,1)N×L和(0,1)L中随机产生。
进一步地,在其中一个实施例中,步骤3-3中所述激活函数为非线性分段连续函数。
进一步地,在其中一个实施例中,步骤4中计算训练样本集X0中表s中第i个指标对应的有效特征的排序系数,计算公式为:
rank(i)=||β(-i)||
式中,rank(i)表示表s中第i个指标对应的有效特征的排序系数。
作为一种具体示例,在其中一个实施例中,对本发明基于LSELM-RFE的粮食作物病害症状的有效特征识别方法进行进一步验证说明。下面通过UCI标准数据库中的大豆病害数据集Soybean(large),对传统的SVM-RFE和本发明的LSELM-RFE两种算法进行实验,并对它们的结果进行比较。参数设置如下:传统的SVM-RFE的参数C和核函数σ使用网格选取法,在下面的参数范围里选取最优参数组合:{0.001,0.01,0.05,0.1,0.2,0.5,1,2,5,10,20,50,100,1000,10000}×{0.001,0.01,0.1,0.2,0.4,0.8,1,2,5,10,20,50,100,1000,10000}。LSELM-RFE的参数C在下面的参数范围里选取最优参数:{0.001,0.01,0.05,0.1,0.2,0.5,1,2,5,10,20,50,100,1000,10000},LSELM-RFE的输入权值a和隐藏层偏置b分别从均匀概率分布(-1,1)N×L和(0,1)L中随机产生。
大豆病害数据集Soybean(large)的目的是通过大豆数据判断疾病信息。从该数据集中抽取frog-eye-leaf-spot病害类型数据,共40条,设为正类。另外抽取alternarialeaf-spot病害类型数据,共40条,设为负类。每条数据由35个特征组成,包括date,plant-stand,precip,hail,crop-hist,area-damaged,severity,seed-tmt,germination,plant-growth,leaves,leafspots-halo,leafspots-marg,leafspot-size,leaf-shread,leaf-malf,leaf-mild,stem,lodging,stem-cankers,canker-lesion,fruiting-bodies,external decay,mycelium,int-discolor,sclerotia,fruit-pods,fruit spots,seed,mold-growth,seed-discolor,seed-size,shriveling,roots。为了实施本发明的方法,将该数据集的前20个划为训练样本集X,其余的60个样本划为测试样本集V。分别选取特征排序表的前5,10,15,20,15个特征作为嵌套子集来预测测试样本集的精度。
对传统的SVM-RFE和本发明的LSELM-RFE两种算法的对比结果如下表1和表2所示。
表1算法计算代价比较
模型参数 | 参数选取时间(s) | 算法执行时间(s) | |
SVM-RFE | (10,5) | 3.8410 | 0.234727 |
LSELM-RFE | 0.1 | 0.1260 | 0.273961 |
表2不同的嵌套子集测试精度比较(%)
嵌套子集 | 5 | 10 | 20 | 30 | 35 | 最佳 |
SVM-RFE | 80.00 | 80.00 | 80.00 | 80.00 | 80.00 | 81.67(1) |
LSELM-RFE | 80.00 | 80.00 | 80.00 | 80.00 | 80.00 | 83.33(1) |
从表1可以看出,在Soybean(large)数据集上,在参数选取时间的指标上,LSELM-RFE方法的参数选取时间只有SVM-RFE方法的3%。而算法的执行时间LSELM-RFE和SVM-RFE两者相差不大。在粮食作物病害症状的有效特征识别应用中,本发明的算法可以节省大量的计算代价。
从表2可以看出,SVM-RFE在嵌套子集的特征为1时首先达到最高的测试精度81.67%,而LSELM-RFE在嵌套子集的特征为1时也达到最高的测试精度83.33%,相比SVM-RFE要高出1个百分点。这表明,本发明的方法识别出的特征更有效。
以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (8)
1.一种基于LSELM-RFE的粮食作物病害症状的有效特征识别方法,其特征在于,所述方法包括以下步骤:
步骤1,构建粮食作物病害症状的数据样本集X,空的有效特征排序表r,以及初始化的有效特征子集指标表s=[1,2,…,d],其中d表示特征的总数;
步骤2,构建当前训练样本集X0;
步骤3,训练分类器LSELMtrain,分类器的输入为从训练样本集X0中删除表s中第i个指标对应的有效特征后的集合;
步骤4、基于训练后的分类器,计算训练样本集X0中表s中第i个指标对应的有效特征的排序系数;
步骤5,获取当前排序系数最小的有效特征f;
步骤6,更新关键因素特征排序表r,具体为:在有效特征排序表r的第一个元素之前加入有效特征f在表s中对应的s(f);
步骤7,更新因素特征子集指标表s,具体为:从表s中消除s(f);
步骤8,判断表s是否为空,若是,则终止上述LSELM-RFE方法的过程,返回有效特征排序表r,否则返回步骤2继续执行。
3.根据权利要求2所述的基于LSELM-RFE的粮食作物病害症状的有效特征识别方法,其特征在于,步骤2所述构建当前训练样本集X0,具体为:
从数据样本集X的所有因素特征中选取集合s中的有效特征构成训练样本集X0,表示为X0=X(:,s)。
4.根据权利要求3所述的基于LSELM-RFE的粮食作物病害症状的有效特征识别方法,其特征在于,步骤3所述训练分类器ELMtrain,分类器的输入为从训练样本集X0中删除表s中第i个指标对应的因素特征后的集合,具体过程包括:
步骤3-1,选取最小二乘超限学习机模型参数,包括隐节点个数L和惩罚因子C;
步骤3-2,随机赋值输入权值a和隐藏层偏置b,其中a∈RN×L,b∈RL;
步骤3-3,选取激活函数G(a,b,x),其中x为从训练样本集X0中删除表s中第i个指标对应的有效特征后的集合,表示为X0(:,s(-i));
步骤3-4,构建隐藏层输出矩阵H:
步骤3-5,计算超限学习机核矩阵KELM:
KELM=HHT
5.根据权利要求4所述的基于LSELM-RFE的粮食作物病害症状的有效特征识别方法,其特征在于,步骤3-1中隐节点个数L的取值大于1000,惩罚因子C选取大于0的正数。
6.根据权利要求5所述的基于LSELM-RFE的粮食作物病害症状的有效特征识别方法,其特征在于,步骤3-2中所述输入权值a和隐藏层偏置b分别从均匀概率分布(-1,1)N×L和(0,1)L中随机产生。
7.根据权利要求6所述的基于LSELM-RFE的粮食作物病害症状的有效特征识别方法,其特征在于,步骤3-3中所述激活函数为非线性分段连续函数。
8.根据权利要求7所述的基于LSELM-RFE的粮食作物病害症状的有效特征识别方法,其特征在于,步骤4中计算训练样本集X0中表s中第i个指标对应的有效特征的排序系数,计算公式为:
rank(i)=||β(-i)||
式中,rank(i)表示表s中第i个指标对应的有效特征的排序系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011046610.7A CN112232387B (zh) | 2020-09-29 | 2020-09-29 | 基于lselm-rfe的粮食作物病害症状的有效特征识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011046610.7A CN112232387B (zh) | 2020-09-29 | 2020-09-29 | 基于lselm-rfe的粮食作物病害症状的有效特征识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112232387A true CN112232387A (zh) | 2021-01-15 |
CN112232387B CN112232387B (zh) | 2024-02-06 |
Family
ID=74120773
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011046610.7A Active CN112232387B (zh) | 2020-09-29 | 2020-09-29 | 基于lselm-rfe的粮食作物病害症状的有效特征识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112232387B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113592379A (zh) * | 2021-06-25 | 2021-11-02 | 南京财经大学 | 散粮集装箱物流运输环境异常检测的关键特征识别方法 |
CN113591911A (zh) * | 2021-06-25 | 2021-11-02 | 南京财经大学 | 散粮集装箱物流运输过程的级联多类异常识别方法 |
CN116468962A (zh) * | 2023-06-20 | 2023-07-21 | 浙江天演维真网络科技股份有限公司 | 害虫识别方法、装置、设备及介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006002240A2 (en) * | 2004-06-19 | 2006-01-05 | Chondrogene, Inc. | Computer systems and methods for constructing biological classifiers and uses thereof |
CN106560701A (zh) * | 2016-10-20 | 2017-04-12 | 中国计量大学 | 基于五隐藏层的武夷岩茶产地深度学习系统 |
CN106560700A (zh) * | 2016-10-20 | 2017-04-12 | 中国计量大学 | 能自动鉴别武夷岩茶产地的机器学习方法 |
CN106991132A (zh) * | 2017-03-08 | 2017-07-28 | 南京信息工程大学 | 一种基于图集重构与图核降维的图分类方法 |
WO2018099574A1 (en) * | 2016-12-02 | 2018-06-07 | Fleetmatics Ireland Limited | System and method for determining a vehicle classification from gps tracks. |
CN110008905A (zh) * | 2019-04-09 | 2019-07-12 | 安徽大学 | 基于遥感影像红边波段的区域尺度小麦条锈病监测方法 |
CN110135494A (zh) * | 2019-05-10 | 2019-08-16 | 南京工业大学 | 基于最大信息系数和基尼指标的特征选择方法 |
CN110929888A (zh) * | 2019-11-06 | 2020-03-27 | 南京财经大学 | 一种基于随机紧凑高斯核函数的粮食作物病害预测方法 |
CN111008504A (zh) * | 2019-12-18 | 2020-04-14 | 武汉大学 | 一种基于气象模式识别的风电功率预测误差建模方法 |
CN111210846A (zh) * | 2020-01-07 | 2020-05-29 | 重庆大学 | 基于集成流形降维的帕金森语音识别系统 |
AU2020101854A4 (en) * | 2020-08-17 | 2020-09-24 | China Communications Construction Co., Ltd. | A method for predicting concrete durability based on data mining and artificial intelligence algorithm |
-
2020
- 2020-09-29 CN CN202011046610.7A patent/CN112232387B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006002240A2 (en) * | 2004-06-19 | 2006-01-05 | Chondrogene, Inc. | Computer systems and methods for constructing biological classifiers and uses thereof |
CN106560701A (zh) * | 2016-10-20 | 2017-04-12 | 中国计量大学 | 基于五隐藏层的武夷岩茶产地深度学习系统 |
CN106560700A (zh) * | 2016-10-20 | 2017-04-12 | 中国计量大学 | 能自动鉴别武夷岩茶产地的机器学习方法 |
WO2018099574A1 (en) * | 2016-12-02 | 2018-06-07 | Fleetmatics Ireland Limited | System and method for determining a vehicle classification from gps tracks. |
CN106991132A (zh) * | 2017-03-08 | 2017-07-28 | 南京信息工程大学 | 一种基于图集重构与图核降维的图分类方法 |
CN110008905A (zh) * | 2019-04-09 | 2019-07-12 | 安徽大学 | 基于遥感影像红边波段的区域尺度小麦条锈病监测方法 |
CN110135494A (zh) * | 2019-05-10 | 2019-08-16 | 南京工业大学 | 基于最大信息系数和基尼指标的特征选择方法 |
CN110929888A (zh) * | 2019-11-06 | 2020-03-27 | 南京财经大学 | 一种基于随机紧凑高斯核函数的粮食作物病害预测方法 |
CN111008504A (zh) * | 2019-12-18 | 2020-04-14 | 武汉大学 | 一种基于气象模式识别的风电功率预测误差建模方法 |
CN111210846A (zh) * | 2020-01-07 | 2020-05-29 | 重庆大学 | 基于集成流形降维的帕金森语音识别系统 |
AU2020101854A4 (en) * | 2020-08-17 | 2020-09-24 | China Communications Construction Co., Ltd. | A method for predicting concrete durability based on data mining and artificial intelligence algorithm |
Non-Patent Citations (4)
Title |
---|
丁晓剑 等: "基于SVR-RFE的作战方案评估指标选择方法", 《广西师范大学学报(自然科学版)》, vol. 33, no. 4, pages 43 - 48 * |
伍之昂 等: "基于特征选择的推荐系统托攻击检测算法", 《电子学报》, vol. 40, no. 8, pages 1687 - 1693 * |
姚志凤: "小麦条锈病早期检测与预测预报关键技术研究", 《中国博士学位论文全文数据库 农业科技辑》, no. 2, pages 046 - 9 * |
落痕的寒假: "[机器学习] 特征选择笔记3-递归式特征消除", pages 1 - 5, Retrieved from the Internet <URL:https://blog.csdn.net/LuohenYJ/article/details/107239001> * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113592379A (zh) * | 2021-06-25 | 2021-11-02 | 南京财经大学 | 散粮集装箱物流运输环境异常检测的关键特征识别方法 |
CN113591911A (zh) * | 2021-06-25 | 2021-11-02 | 南京财经大学 | 散粮集装箱物流运输过程的级联多类异常识别方法 |
CN113592379B (zh) * | 2021-06-25 | 2024-05-14 | 南京财经大学 | 散粮集装箱物流运输环境异常检测的关键特征识别方法 |
CN116468962A (zh) * | 2023-06-20 | 2023-07-21 | 浙江天演维真网络科技股份有限公司 | 害虫识别方法、装置、设备及介质 |
CN116468962B (zh) * | 2023-06-20 | 2023-10-24 | 浙江天演维真网络科技股份有限公司 | 害虫识别方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112232387B (zh) | 2024-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhong et al. | Research on deep learning in apple leaf disease recognition | |
CN112232387B (zh) | 基于lselm-rfe的粮食作物病害症状的有效特征识别方法 | |
Panigrahi et al. | A cnn approach for corn leaves disease detection to support digital agricultural system | |
Mishra et al. | A Deep Learning-Based Novel Approach for Weed Growth Estimation. | |
CN112434662B (zh) | 一种基于多尺度卷积神经网络的茶叶病斑自动识别算法 | |
CN110929888B (zh) | 一种基于随机紧凑高斯核函数的粮食作物病害预测方法 | |
Yu et al. | A recognition method of soybean leaf diseases based on an improved deep learning model | |
Yu et al. | Recognition method of soybean leaf diseases using residual neural network based on transfer learning | |
Kumar et al. | Apple Sweetness Measurement and Fruit Disease Prediction Using Image Processing Techniques Based on Human‐Computer Interaction for Industry 4.0 | |
Wenxia et al. | Identification of maize leaf diseases using improved convolutional neural network. | |
CN114693616A (zh) | 一种基于改进目标检测模型与卷积神经网络的水稻病害检测方法、设备和介质 | |
Bhartiya et al. | Rice leaf disease prediction using machine learning | |
Singh et al. | Performance Analysis of CNN Models with Data Augmentation in Rice Diseases | |
Miao et al. | Crop weed identification system based on convolutional neural network | |
Muthaiah et al. | Mango Pest Detection Using Entropy-ELM with Whale Optimization Algorithm. | |
Wang et al. | Research on identification of corn disease occurrence degree based on improved ResNeXt network | |
Akbar et al. | Wheat Disease Detection for Yield Management Using IoT and Deep Learning Techniques | |
Bishwas et al. | Relative comparison of k-means clustering segmented rice leaves image based nitrogen, phosphorus, and potassium nutrient deficiency classification using convolutional neural network | |
Gupta et al. | Inferring Agronomical Insights for Wheat Canopy Using Image‐Based Curve Fit K‐Means Segmentation Algorithm and Statistical Analysis | |
AU2021101682A4 (en) | Automatic plant leaf disease diagnosis with machine learning and deep convolutional neural networks | |
Roy et al. | Disease Detection in Paddy Crop using Machine Learning Techniques | |
Chanda | Plant diseases classification using feature reduction, BPNN and PSO | |
Shakil et al. | Addressing agricultural challenges: An identification of best feature selection technique for dragon fruit disease recognition | |
Ibrahimi et al. | A review on plant diseases detection using artificial intelligence techniques | |
Goyal et al. | Disease Detection in Potato Leaves Using an Efficient Deep Learning Model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |