CN111105045A - 一种基于改进的蝗虫优化算法构建预测模型的方法 - Google Patents

一种基于改进的蝗虫优化算法构建预测模型的方法 Download PDF

Info

Publication number
CN111105045A
CN111105045A CN201911106483.2A CN201911106483A CN111105045A CN 111105045 A CN111105045 A CN 111105045A CN 201911106483 A CN201911106483 A CN 201911106483A CN 111105045 A CN111105045 A CN 111105045A
Authority
CN
China
Prior art keywords
locust
fitness
locusts
formula
optimal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911106483.2A
Other languages
English (en)
Inventor
陈慧灵
丁泽威
周汉峰
彭鸿鑫
李志红
谷至阳
孙诚
赵学华
汪鹏君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wenzhou University
Original Assignee
Wenzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wenzhou University filed Critical Wenzhou University
Priority to CN201911106483.2A priority Critical patent/CN111105045A/zh
Publication of CN111105045A publication Critical patent/CN111105045A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于改进的蝗虫优化算法构建预测模型的方法,包括以下步骤:步骤S1、取样本数据并对所获取到的样本数据进行归一化处理;步骤S2、利用基于改进的蝗虫优化算法优化支持向量机的惩罚因子C和核宽γ;步骤S2、基于所获得的惩罚因子C和核宽γ,利用所归一化处理后的数据来构建预测模型,并基于所构建的预测模型对待分类样本进行分类和预测。本发明具有下有益效果,可有效提升算法的收敛速度和收敛精度,提升算法逃脱局部最优解的能力,找到更优的全局近似最优解以获得分类精度更高的支持向量机。

Description

一种基于改进的蝗虫优化算法构建预测模型的方法
技术领域
本发明涉及计算机技术领域,特别涉及一种基于改进的蝗虫优化算法构建预测模型的方法。
背景技术
众所周知,科学技术的进步,特别是计算机科学技术的创新和发展,改变了人类生产与生活方式。大数据应用的领域也越来越广,因此对大数据的分类及预测等处理提出了新的挑战,尤其是群智能优化算法在大数据分类及预测的应用中。
其中,群体智能优化算法通过模拟自然界的各种生物和非生命系统的所表现出的群体智能行为,利用群体中个体之间的协作、交流等模拟行为来达到寻优的目的。这些群体智能算法较为著名有:蚁群算法,灰狼算法,混合蛙跳算法,鱼群算法等等。
然而,对于群体智能优化算法,Saremi,S等人提出了蝗虫优化算法 (GOA)。蝗虫是一种影响农作物生产和农业的害虫,它们的生命周期包括三个阶段:卵、若虫和成虫。此算法从蝗虫在若虫期和成虫期的习性进行仿真模拟。在若虫期,蝗虫运动的主要特征是在滚动的圆柱体中跳跃和移动(步长小,动作慢),它们吃沿途发现的植物;在成虫期,蝗虫会成群结队地远距离迁徙(步长大,动作快)。蝗虫算法是一种新型的群体智能算法,该算法模拟蝗虫群的行为来搜索最优解,具有较强的搜索能力。但是,该算法在处理存在大量局部最优的问题时,容易陷入局部最优,很难找到全局最优解,使得数据分类及预测出现偏差。因此,针对上述问题,需进一步改进该算法,从而提高数据分类及预测的准确性。
发明内容
本发明实施例所要解决的技术问题在于,提供一种基于改进的蝗虫优化算法构建预测模型的方法,可有效提升算法的收敛速度和收敛精度,提升算法逃脱局部最优解的能力,找到更优的全局近似最优解以获得分类精度更高的支持向量机。
为了达到上述目的,本发明提供了一种基于改进的蝗虫优化算法构建预测模型的方法,包括以下步骤:
步骤S1、取样本数据并对所获取到的样本数据进行归一化处理;
步骤S2、利用基于改进的蝗虫优化算法优化支持向量机的惩罚因子C和核宽γ,具体为:
步骤S2.1、参数初始化;其中,初始化的参数至少包括:最大迭代次数 Max_iter、当前迭代次数l、蝗虫个数N、搜索空间上边界ub、搜索空间下边界lb、最优蝗虫Sorted_grasshopper、惩罚因子C的搜索空间[Cmin,Cmax] 和核宽γ的搜索空间[γmin,γmax];
步骤S2.2、随机初始化N只蝗虫的位置,采用如下公式(1)和公式(2) 将每一只蝗虫的位置映射到设定的搜索范围内,得到n只蝗虫的位置 Xi=(Xi,1,Xi,2);
Xi,1=(Cmax-Cmin)×r+Cmin,i=1,2,3,…,n (1)
Xi,2=(γmaxmin)×r+γmin,i=1,2,3,…,n (2)
其中,r为[0,1]之间的随机小数;Ci表示蝗虫i在当前位置时的惩罚因子C值,γi表示蝗虫i在当前位置时的核宽γ值;
步骤S2.3、判断是否为第一次迭代,若是则直接对每只蝗虫Mi均计算其适应度fi,否则将最新的蝗虫位置M与历史最优蝗虫位置F作比较,取其中更优值计算其适应度fi,并将每只蝗虫i的适应度fi由大到小排序,选取其中前N只蝗虫位置作为历史最优位置F;
步骤S2.4、筛选出N只蝗虫中适应度大于最优蝗虫的适应度、且适应度最大的蝗虫,将最优蝗虫Sorted_grasshopper替换为当前所筛选出适应度最大的蝗虫,且进一步将当前蝗虫位置赋值给最佳蝗虫位置TargetPositions;
其中,每只蝗虫i的适应度fi是基于蝗虫i当前位置的惩罚因子C和核宽γ值,其根据公式(3)以内部K折交叉验证策略计算出支持向量机的准确度 ACC;
Figure BDA0002271464100000031
其中,acck表示每一折数据上计算获得的准确度;
步骤S2.5、根据公式(4)算出其中第i只蝗虫的位置为:
Xi=Si+Gi+Ai,(i=1,2,...,n) (4)
其中,Si表示社会交互作用,Gi表示第i只蝗虫的重力,Ai表示第i只蝗虫的重力风平流;
步骤S2.6、判断是否超过最大迭代次数T;若否,则跳转至步骤S2.3;若是,则执行下一步骤S2.7;
步骤S2.7、输出最优蝗虫Sorted_grasshopper的位置TargetPositions及其对应的适应度TargetFitness,即最优的惩罚因子C和核宽γ值;
步骤S3、基于所获得的惩罚因子C和核宽γ,利用所归一化处理后的数据来构建下述公式(5)所示的预测模型,并基于所构建的预测模型对待分类样本进行分类和预测;
Figure BDA0002271464100000041
其中,K(xi,xj)=exp(-r||xi-xj||2);xi(i=1...l)表示训练样本;xj表示第j个归一化处理后的样本数据;yi(i=1...l)表示训练样本对应的标签,yi=1 代表正类样本,yi=-1代表负类样本;b为设定的阈值;αi是拉格朗日系数。
进一步设置是,所述的步骤S2.5中公式(4)具体包括,
公式(4)中的S分量计算如公式(6):
Figure 100002_1
其中,dij为第i只蝗虫到第j只蝗虫之间的距离,利用dij=|xj-xi|计算;
Figure 100002_2
是从第i只蝗虫到第j只蝗虫的单位向量;
定义种群力量强度的函数s(r)计算如公式(7):
Figure BDA0002271464100000044
其中,f代表吸引强度,l代表吸引长度;
公式(4)中的G分量计算如公式(8):
Figure BDA0002271464100000045
其中,g是引力常数,而
Figure BDA0002271464100000046
为指向原点的单位矢量;
公式(4)中的A分量计算如公式(9):
Figure BDA0002271464100000047
其中,u和
Figure BDA0002271464100000051
代表一个常数漂移和风向的单位向量。
进一步设置是,所述的步骤S2.5进一步包括以下步骤:
引入基于遗传算法和非线性规划的变异机制以及柯西变异机制,通过概率选择的方式,提高蝗虫搜索深度,扩大蝗虫位置更新范围,具体包括:
判断本次迭代是否为5的倍数;若是,则使用基于遗传算法和非线性规划的变异机制,并根据公式(10)和公式(11)进行变异:
Figure BDA0002271464100000052
Figure BDA0002271464100000053
其中,amax是基因aij的上界,amin是基因aij的下界;l是当前迭代次数, N是最大进化次数,r为[0,1]区间的随机数。
若否,则使用柯西变异机制,根据公式(12)进行变异:
Figure BDA0002271464100000054
其中,标准的柯西分布函数Cauchy(0,1)如下:
Cauchy(0,1)=tan[(ξ-0.5)π],ξ∈U[0,1] (13)
引入正交机制,通过强化蝗虫群的有效因素,来提高算法的收敛速度,具体包括:
首先遍历各个种群,计当前种群为i,在剩余种群中随机群三个种群进行随机拟合得到种群t,再将种群i和t进行正交;先获取水平为Q,维数F 的正交表L和正交表行数M,然后用公式(14)从正交表获取position:
Figure BDA0002271464100000061
并计算得出适应度值Fitness,从正交表L得到强化后的因素矩阵Z,通过公式(15)计算出强化因素后的平均适应度S:
S=(Fitness×Z)÷sum(Z) (15)
再找出平均适应度S中每个水平的最佳适应值的位置得到行向量I,利用公式(16),得到强化后的Position;
Figure BDA0002271464100000062
并计算得出适应度值Fitness,最后遍历两次得到Position和Fitness并返回BestPosition和BeatFitness。
实施本发明实施例,具有如下有益效果:
本发明在蝗虫优化算法(MOLGOA)优化过程中的合适位置加入基于遗传算法和非线性规划的变异机制以及柯西变异机制来实现支持向量机的惩罚因子C和核宽γ编码为个体位置优化,再通过构建正交表来加快算法的收敛速度,能够快速高效地建立起精准的智能模型,不仅增加种群多样性,增强算法的搜索能力,还能防止算法陷入局部最优,快速找到全局最优解,从而能得到更准确的预测效果并更有效地辅助决策者进行科学合理的决策。
附图说明
图1为本发明实施例提供的基于改进的蝗虫优化算法构建预测模型的方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,为本发明实施例中,提出的一种基于改进的蝗虫优化算法构建预测模型的方法,所述方法包括以下步骤:
步骤S1:获取样本数据并对所获取到的样本数据进行归一化处理;
具体过程为,样本数据来源于多种不同领域,可根据实际需要进行设计,如医疗领域、金融领域等,数据属性类别分为数据属性和类别属性。如针对胸腔积液疾病的数据单个样本属性,该数据属性值分为两大类即数据属性 X1-X29表示了针对胸腔积液疾病的相关医学病理方面的属性,X30表示了该数据样本的类别:即患结核型胸腔积液或非结核型胸腔积液,若患结核型胸腔积液:值为1,患非结核型胸腔积液:值为-1;又如,针对企业破产风险预测数据单个样本属性分布,会有X1-Xn个这样的相关金融指标如负债率、资产总额等属性指标,则Xn+1也是类别标签:即该企业在两年内是否有破产风险的存在,若有破产风险标签为1,没有破产风险标签为-1。
为了便于数据处理,会对所获取到的样本数据进行归一化处理。
步骤S2、利用基于改进的蝗虫优化算法优化支持向量机的惩罚因子C和核宽γ,具体为:
步骤S2.1、参数初始化;其中,初始化的参数至少包括:最大迭代次数 Max_iter、当前迭代次数l、蝗虫个数N、搜索空间上边界ub、搜索空间下边界lb、最优蝗虫Sorted_grasshopper、惩罚因子C的搜索空间[Cmin,Cmax] 和核宽γ的搜索空间[γmin,γmax]。
步骤S2.2、随机初始化N只蝗虫的位置,采用如下公式(1)和公式(2) 将每一只蝗虫的位置映射到设定的搜索范围内,得到n只蝗虫的位置 Xi=(Xi,1,Xi,2);
Xi,1=(Cmax-Cmin)×r+Cmin,i=1,2,3,…,n (1)
Xi,2=(γmaxmin)×r+γmin,i=1,2,3,…,n (2)
其中,r为[0,1]之间的随机小数;Ci表示蝗虫i在当前位置时的惩罚因子C值,γi表示蝗虫i在当前位置时的核宽γ值。
步骤S2.3、判断是否为第一次迭代,若是则直接对每只蝗虫Mi均计算其适应度fi,否则将最新的蝗虫位置M与历史最优蝗虫位置F作比较,取其中更优值计算其适应度fi,并将每只蝗虫i的适应度fi由大到小排序,选取其中前N只蝗虫位置作为历史最优位置F。
步骤S2.4、筛选出N只蝗虫中适应度大于最优蝗虫的适应度、且适应度最大的蝗虫,将最优蝗虫Sorted_grasshopper替换为当前所筛选出适应度最大的蝗虫,且进一步将当前蝗虫位置赋值给最佳蝗虫位置TargetPositions;
其中,每只蝗虫i的适应度fi是基于蝗虫i当前位置的惩罚因子C和核宽γ值,其根据公式(3)以内部K折交叉验证策略计算出支持向量机的准确度 ACC;
Figure BDA0002271464100000081
其中,acck表示每一折数据上计算获得的准确度。
步骤S2.5、根据公式(4)算出其中第i只蝗虫的位置为
Xi=Si+Gi+Ai,(i=1,2,…,n) (4)
其中,Si表示社会交互作用,Gi表示第i只蝗虫的重力,Ai表示第i只蝗虫的重力风平流。
步骤S2.6、判断是否超过最大迭代次数T;若否,则跳转至步骤S2.3;若是,则执行下一步骤S2.7;
步骤S2.7、输出最优蝗虫Sorted_grasshopper的位置TargetPositions及其对应的适应度TargetFitness,即最优的惩罚因子C和核宽γ值;
步骤S3、基于所获得的惩罚因子C和核宽γ,利用所归一化处理后的数据来构建下述公式(5)所示的预测模型,并基于所构建的预测模型对待分类样本进行分类和预测;
Figure BDA0002271464100000091
其中,K(xi,xj)=exp(-r||xi-xj||2);xi(i=1...l)表示训练样本;xj表示第j个归一化处理后的样本数据;yi(i=1...l)表示训练样本对应的标签,yi=1 代表正类样本,yi=-1代表负类样本;b为设定的阈值;αi是拉格朗日系数。
进一步的,所述的步骤S2.5中公式(4)具体包括,
公式(4)中的S分量计算如公式(6):
Figure 3
其中,dij为第i只蝗虫到第j只蝗虫之间的距离,利用dij=|xj-xi|计算;
Figure 4
是从第i只蝗虫到第j只蝗虫的单位向量;
定义种群力量强度的函数s(r)计算如公式(7):
Figure BDA0002271464100000102
其中,f代表吸引强度,l代表吸引长度;
公式(4)中的G分量计算如公式(8):
Figure BDA0002271464100000103
其中,g是引力常数,而
Figure BDA0002271464100000104
为指向原点的单位矢量;
公式(4)中的A分量计算如公式(9):
Figure BDA0002271464100000105
其中,u和
Figure BDA0002271464100000106
代表一个常数漂移和风向的单位向量。
进一步的,所述的步骤S2.5进一步包括以下步骤:
引入基于遗传算法和非线性规划的变异机制以及柯西变异机制,通过概率选择的方式,提高蝗虫搜索深度,扩大蝗虫位置更新范围,具体包括:
判断本次迭代是否为5的倍数;若是,则使用基于遗传算法和非线性规划的变异机制,并根据公式(10)和公式(11)进行变异:
Figure BDA0002271464100000107
Figure BDA0002271464100000108
其中,amax是基因aij的上界,amin是基因aij的下界;l是当前迭代次数,N是最大进化次数,r为[0,1]区间的随机数。
若否,则使用柯西变异机制,根据公式(12)进行变异:
Figure BDA0002271464100000112
其中,标准的柯西分布函数Cauchy(0,1)如下:
Cauchy(0,1)=tan[(ξ-0.5)π],ξ∈U[0,1] (13)
引入正交机制,通过强化蝗虫群的有效因素,来提高算法的收敛速度,具体包括:
首先遍历各个种群,计当前种群为i,在剩余种群中随机群三个种群进行随机拟合得到种群t,再将种群i和t进行正交;先获取水平为Q,维数F 的正交表L和正交表行数M,然后用公式(14)从正交表获取position:
Figure BDA0002271464100000111
并计算得出适应度值Fitness,从正交表L得到强化后的因素矩阵Z,通过公式(15)计算出强化因素后的平均适应度S:
S=(Fitness×Z)÷sum(Z) (15)
再找出平均适应度S中每个水平的最佳适应值的位置得到行向量I,利用公式(16),得到强化后的Position;
Figure BDA0002271464100000121
并计算得出适应度值Fitness,最后遍历两次得到Position和Fitness并返回BestPosition和BeatFitness。
应用实施例
在本发明实施例中,对基于改进的蝗虫优化算法构建预测模型的方法的应用场景做进一步说明:
采用胸腔积液数据作为样本数据,样本集合这样表示:(xi,yi), i=1......140,其中‘xi’表示29维的特征向量,y是值为1或-1的样本标签,‘1’代表该样本是患结核性胸腔积液,‘-1’代表该患者患非结核性胸腔积液。
首先,将待实验样本数据各个特征属性值进行标准化,利用公式
Figure BDA0002271464100000122
对样本数据进行标准化,其中Si代表样本中的属性的特征原始值,S′i是Si由公式所得到的标准化后的值,Smin表示对应的样本数据中的最小值,Smax表示对应的样本数据中的最大值;
随后,利用基于改进的蝗虫优化算法优化支持向量机的惩罚系数C和核宽γ,简而言之,就是针对不同的智能分类决策问题,我们需要采用具有全局搜索能力的改进的蝗虫优化算法去实现构造出针对此类问题最佳的解决模型,当然如之前论述:惩罚系数C和核宽γ是对该模型的性能具有重要的影响,也就是说,这两个参数的好坏将直接影响决策模型的性能的好坏,所以在此我们提出改进的蝗虫优化算法去完成对这两个参数的选择,不仅改善了传统算法,跳出了局部极值点,也在一定程度上提高了算法的收敛速度和精度。
输入训练样本(xi,yi),且依据Largrange对偶问题优化的问题变为:
Figure BDA0002271464100000131
Figure BDA0002271464100000132
然后对于以上的优化问题采用改进的蝗虫优化算法对C和γ(是径向基核函数参数核宽K(xi,xj)=exp(-γ||xi-xj||2))进行优化,并求解出最优解的值。
Figure BDA0002271464100000133
则有如下解:
Figure BDA0002271464100000134
那么最终的最优分类超平面函数为:
Figure BDA0002271464100000135
实施本发明实施例,具有如下有益效果:
本发明在蝗虫优化算法(MOLGOA)优化过程中的合适位置加入基于遗传算法和非线性规划的变异机制以及柯西变异机制来实现支持向量机的惩罚因子C和核宽γ编码为个体位置优化,再通过构建正交表来加快算法的收敛速度,能够快速高效地建立起精准的智能模型,不仅增加种群多样性,增强算法的搜索能力,还能防止算法陷入局部最优,快速找到全局最优解,从而能得到更准确的预测效果并更有效地辅助决策者进行科学合理的决策。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如磁盘、光盘、ROM/RAM等。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (3)

1.一种基于改进的蝗虫优化算法构建预测模型的方法,其特征在于,包括以下步骤:
步骤S1、取样本数据并对所获取到的样本数据进行归一化处理;
步骤S2、利用基于改进的蝗虫优化算法优化支持向量机的惩罚因子C和核宽γ,具体为:
步骤S2.1、参数初始化;其中,初始化的参数至少包括:最大迭代次数Max_iter、当前迭代次数l、蝗虫个数N、搜索空间上边界ub、搜索空间下边界lb、最优蝗虫Sorted_grasshopper、惩罚因子C的搜索空间[Cmin,Cmax]和核宽γ的搜索空间[γmin,γmax];
步骤S2.2、随机初始化N只蝗虫的位置,采用如下公式(1)和公式(2)将每一只蝗虫的位置映射到设定的搜索范围内,得到n只蝗虫的位置Xi=(Xi,1,Xi,2);
Xi,1=(Cmax-Cmin)×r+Cmin,i=1,2,3,…,n (1)
Xi,2=(γmaxmin)×r+γmin,i=1,2,3,…,n (2)
其中,r为[0,1]之间的随机小数;Ci表示蝗虫i在当前位置时的惩罚因子C值,γi表示蝗虫i在当前位置时的核宽γ值;
步骤S2.3、判断是否为第一次迭代,若是则直接对每只蝗虫Mi均计算其适应度fi,否则将最新的蝗虫位置M与历史最优蝗虫位置F作比较,取其中更优值计算其适应度fi,并将每只蝗虫i的适应度fi由大到小排序,选取其中前N只蝗虫位置作为历史最优位置F;
步骤S2.4、筛选出N只蝗虫中适应度大于最优蝗虫的适应度、且适应度最大的蝗虫,将最优蝗虫Sorted_grasshopper替换为当前所筛选出适应度最大的蝗虫,且进一步将当前蝗虫位置赋值给最佳蝗虫位置TargetPositions;
其中,每只蝗虫i的适应度fi是基于蝗虫i当前位置的惩罚因子C和核宽γ值,其根据公式(3)以内部K折交叉验证策略计算出支持向量机的准确度ACC;
Figure FDA0002271464090000021
其中,acck表示每一折数据上计算获得的准确度;
步骤S2.5、根据公式(4)算出其中第i只蝗虫的位置为:
Xi=Si+Gi+Ai,(i=1,2,...,n) (4)
其中,Si表示社会交互作用,Gi表示第i只蝗虫的重力,Ai表示第i只蝗虫的重力风平流;
步骤S2.6、判断是否超过最大迭代次数T;若否,则跳转至步骤S2.3;若是,则执行下一步骤S2.7;
步骤S2.7、输出最优蝗虫Sorted_grasshopper的位置TargetPositions及其对应的适应度TargetFitness,即最优的惩罚因子C和核宽γ值;
步骤S3、基于所获得的惩罚因子C和核宽γ,利用所归一化处理后的数据来构建下述公式(5)所示的预测模型,并基于所构建的预测模型对待分类样本进行分类和预测;
Figure FDA0002271464090000022
其中,K(xi,xj)=exp(-r||xi-xj||2);xi(i=1...l)表示训练样本;xj表示第j个归一化处理后的样本数据;yi(i=1...l)表示训练样本对应的标签,yi=1代表正类样本,yi=-1代表负类样本;b为设定的阈值;αi是拉格朗日系数。
2.根据权利要求1所述的一种基于改进的蝗虫优化算法构建预测模型的方法,其特征在于,所述的步骤S2.5中公式(4)具体包括,
公式(4)中的S分量计算如公式(6):
Figure 1
其中,dij为第i只蝗虫到第j只蝗虫之间的距离,利用dij=|xj-xi|计算;
Figure 2
是从第i只蝗虫到第j只蝗虫的单位向量;
定义种群力量强度的函数s(r)计算如公式(7):
Figure FDA0002271464090000033
其中,f代表吸引强度,l代表吸引长度;
公式(4)中的G分量计算如公式(8):
Figure FDA0002271464090000034
其中,g是引力常数,而
Figure FDA0002271464090000035
为指向原点的单位矢量;
公式(4)中的A分量计算如公式(9):
Figure FDA0002271464090000036
其中,u和
Figure FDA0002271464090000037
代表一个常数漂移和风向的单位向量。
3.根据权利要求1或2所述的一种基于改进的蝗虫优化算法构建预测模型的方法,其特征在于,所述的步骤S2.5进一步包括以下步骤:
引入基于遗传算法和非线性规划的变异机制以及柯西变异机制,通过概率选择的方式,提高蝗虫搜索深度,扩大蝗虫位置更新范围,具体包括:
判断本次迭代是否为5的倍数;若是,则使用基于遗传算法和非线性规划的变异机制,并根据公式(10)和公式(11)进行变异:
Figure FDA0002271464090000041
Figure FDA0002271464090000042
其中,amax是基因aij的上界,amin是基因aij的下界;l是当前迭代次数,N是最大进化次数,r为[0,1]区间的随机数。
若否,则使用柯西变异机制,根据公式(12)进行变异:
Figure FDA0002271464090000043
其中,标准的柯西分布函数Cauchy(0,1)如下:
Cauchy(0,1)=tan[(ξ-0.5)π],ξ∈U[0,1] (13)
引入正交机制,通过强化蝗虫群的有效因素,来提高算法的收敛速度,具体包括:
首先遍历各个种群,计当前种群为i,在剩余种群中随机群三个种群进行随机拟合得到种群t,再将种群i和t进行正交;先获取水平为Q,维数F的正交表L和正交表行数M,然后用公式(14)从正交表获取position:
Figure FDA0002271464090000051
并计算得出适应度值Fitness,从正交表L得到强化后的因素矩阵Z,通过公式(15)计算出强化因素后的平均适应度S:
S=(Fitness×Z)÷sum(Z) (15)
再找出平均适应度S中每个水平的最佳适应值的位置得到行向量I,利用公式(16),得到强化后的Position;
Figure FDA0002271464090000052
并计算得出适应度值Fitness,最后遍历两次得到Position和Fitness并返回BestPosition和BeatFitness。
CN201911106483.2A 2019-11-13 2019-11-13 一种基于改进的蝗虫优化算法构建预测模型的方法 Pending CN111105045A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911106483.2A CN111105045A (zh) 2019-11-13 2019-11-13 一种基于改进的蝗虫优化算法构建预测模型的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911106483.2A CN111105045A (zh) 2019-11-13 2019-11-13 一种基于改进的蝗虫优化算法构建预测模型的方法

Publications (1)

Publication Number Publication Date
CN111105045A true CN111105045A (zh) 2020-05-05

Family

ID=70420726

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911106483.2A Pending CN111105045A (zh) 2019-11-13 2019-11-13 一种基于改进的蝗虫优化算法构建预测模型的方法

Country Status (1)

Country Link
CN (1) CN111105045A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111814989A (zh) * 2020-06-02 2020-10-23 西安工程大学 基于蝗虫算法优化孪生支持向量机的变压器故障诊断方法
CN112396096A (zh) * 2020-11-07 2021-02-23 山东派蒙机电技术有限公司 基于svm的行车风险辨识模型的建立方法、系统及介质
CN112766865A (zh) * 2021-03-02 2021-05-07 河南科技学院 一种考虑实时订单的互联网电商仓储动态调度方法
CN113449464A (zh) * 2021-06-11 2021-09-28 淮阴工学院 一种基于改进深度极限学习机的风功率预测方法
CN113468817A (zh) * 2021-07-13 2021-10-01 淮阴工学院 一种基于igoa优化elm的超短期风电功率预测方法
CN114723217A (zh) * 2022-02-15 2022-07-08 石河子大学 碳中和目标下的综合能源供给侧配置方法和系统
CN116465215A (zh) * 2023-04-20 2023-07-21 淮阴工学院 一种多功能竖窑废气降温循环利用调节系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111814989A (zh) * 2020-06-02 2020-10-23 西安工程大学 基于蝗虫算法优化孪生支持向量机的变压器故障诊断方法
CN112396096A (zh) * 2020-11-07 2021-02-23 山东派蒙机电技术有限公司 基于svm的行车风险辨识模型的建立方法、系统及介质
CN112766865A (zh) * 2021-03-02 2021-05-07 河南科技学院 一种考虑实时订单的互联网电商仓储动态调度方法
CN112766865B (zh) * 2021-03-02 2023-09-22 河南科技学院 一种考虑实时订单的互联网电商仓储动态调度方法
CN113449464A (zh) * 2021-06-11 2021-09-28 淮阴工学院 一种基于改进深度极限学习机的风功率预测方法
CN113449464B (zh) * 2021-06-11 2023-09-22 淮阴工学院 一种基于改进深度极限学习机的风功率预测方法
CN113468817A (zh) * 2021-07-13 2021-10-01 淮阴工学院 一种基于igoa优化elm的超短期风电功率预测方法
CN113468817B (zh) * 2021-07-13 2023-08-22 淮阴工学院 一种基于igoa优化elm的超短期风电功率预测方法
CN114723217A (zh) * 2022-02-15 2022-07-08 石河子大学 碳中和目标下的综合能源供给侧配置方法和系统
CN116465215A (zh) * 2023-04-20 2023-07-21 淮阴工学院 一种多功能竖窑废气降温循环利用调节系统
CN116465215B (zh) * 2023-04-20 2023-12-22 淮阴工学院 一种多功能竖窑废气降温循环利用调节系统

Similar Documents

Publication Publication Date Title
CN111105045A (zh) 一种基于改进的蝗虫优化算法构建预测模型的方法
Dokeroglu et al. A comprehensive survey on recent metaheuristics for feature selection
Han et al. A survey on metaheuristic optimization for random single-hidden layer feedforward neural network
Gharehchopogh An improved Harris Hawks optimization algorithm with multi-strategy for community detection in social network
Jia et al. A new hybrid seagull optimization algorithm for feature selection
US20220301658A1 (en) Machine learning driven gene discovery and gene editing in plants
CN111061959B (zh) 一种基于开发者特征的群智化软件任务推荐方法
CN109816087B (zh) 基于人工鱼群与蛙群混合算法的粗糙集属性约简的强对流天气判别方法
CN110738362A (zh) 一种基于改进的多元宇宙算法构建预测模型的方法
CN115115389A (zh) 一种基于价值细分和集成预测的快递客户流失预测方法
CN114330659A (zh) 一种基于改进aso算法的bp神经网络参数优化方法
Zawbaa et al. A wrapper approach for feature selection based on swarm optimization algorithm inspired from the behavior of social-spiders
CN111639695A (zh) 一种基于改进果蝇优化算法对数据进行分类的方法及系统
Rahmani et al. Plant competition optimization: A novel metaheuristic algorithm
Czajkowski et al. Steering the interpretability of decision trees using lasso regression-an evolutionary perspective
CN112329906A (zh) 一种基于粒子群算法的人工智能金融风险度量方法
Li et al. Hybrid improved capuchin search algorithm for plant image thresholding
Mousavirad et al. How effective are current population-based metaheuristic algorithms for variance-based multi-level image thresholding?
Toghraee et al. The impact of feature selection on meta-heuristic algorithms to data mining methods
CN110796198A (zh) 基于混合蚁群优化算法的高维特征筛选方法
CN115472291A (zh) 基于改进樽海鞘优化bp神经网络的食管鳞癌生存预测方法
CN114120367A (zh) 元学习框架下基于圆损失度量的行人重识别方法及系统
Galván et al. Evolutionary Multi-objective Optimisation in Neurotrajectory Prediction
CN114357869A (zh) 一种基于数据关系学习和预测的多目标优化代理模型设计方法及系统
Toghraee et al. Evaluation neural networks on selected feature by meta heuristic algorithms

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination