CN115114838B - 基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法 - Google Patents

基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法 Download PDF

Info

Publication number
CN115114838B
CN115114838B CN202210867437.XA CN202210867437A CN115114838B CN 115114838 B CN115114838 B CN 115114838B CN 202210867437 A CN202210867437 A CN 202210867437A CN 115114838 B CN115114838 B CN 115114838B
Authority
CN
China
Prior art keywords
particle
value
optimal
binary
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210867437.XA
Other languages
English (en)
Other versions
CN115114838A (zh
Inventor
刘金明
许晶
纪玉玲
曾昌浩
张东杰
孙勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Heilongjiang Bayi Agricultural University
Original Assignee
Heilongjiang Bayi Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Heilongjiang Bayi Agricultural University filed Critical Heilongjiang Bayi Agricultural University
Priority to CN202210867437.XA priority Critical patent/CN115114838B/zh
Publication of CN115114838A publication Critical patent/CN115114838A/zh
Application granted granted Critical
Publication of CN115114838B publication Critical patent/CN115114838B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/25Design optimisation, verification or simulation using particle-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/06Multi-objective optimisation, e.g. Pareto optimisation using simulated annealing [SA], ant colony algorithms or genetic algorithms [GA]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法,以光谱数据波长变量个数为码长进行粒子群初始化和温度初始化,使用粒子中值为“1”二进制位对应的光谱波长变量建立偏最小二乘回归模型,以交叉验证均方根误差为适应度函数,选出每个粒子的个体历史最优和整个种群的群体历史最优,计算每个粒子中值为“1”二进制位的移动速度并更新位置,对更新位置的粒子生成扰动解,最终采用交叉验证均方根误差最小的粒子作为群体历史最优位置,该粒子值为“1”二进制位的编号即为优选的光谱特征波长变量。本发明实现了粒子值为“1”二进制位的指导性寻优,融合了模拟退火策略,具有高效的特征波长选择能力。

Description

基于粒子群算法思想和模拟退火策略的光谱特征波长选择 方法
技术领域
本发明涉及光谱分析领域,尤其涉及一种基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法。
背景技术
光谱分析技术具有无损、快速、低成本等优势,通过快速获取大量、准确的光谱数据结合已经建立的定量校正模型即可实现样品理化指标的快速检测。但是在采集光谱数据时,由于采集的光谱数据量很大,光谱数据中含有的样品背景、高频噪声等无关信息很难使用预处理方法完全消除,以采集的光谱全部波长变量建模时,计算量大,波长冗余严重,不仅增加了模型的复杂程度,还严重影响了模型的预测精度。因此,有必要通过特征波长优选,有效消除光谱中不相干和共线性的波长变量对建模精度和效率的影响。
目前国内外常用的特征波长选择方法有区间偏最小二乘法、反向区间偏最小二乘法、连续投影算法、竞争性自适应重加权采样算法等,同时遗传算法、模拟退火算法、随机蛙跳算法等智能优化算法在光谱特征波长选择方面得到了有效应用。相比于其它智能优化算法,粒子群算法具有实现简单、收敛迅速、参数调整少、稳定性高等优点,在特征波长选择方面应用越来越广泛。然而用于求解波长选择问题的二进制粒子群算法虽然具有很强的搜索能力,但随着算法迭代搜索次数的增加粒子将迅速失去多样性,导致算法丧失全局搜索能力,不能收敛于全局最优解。因此,亟待对二进制粒子群算法进行改进,并研究改进后的算法在光谱特征波长选择方面的应用效果具有重要意义。
发明内容
为了克服现有二进制粒子群算法在光谱波长选择过程中容易出现早熟收敛的问题,本发明提出了一种基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法,基于粒子群算法思想实现了粒子值为“1”二进制位的指导性进化,融合了模拟退火策略进行扰动解的Metropolis选择复制,充分利用算法强大搜索能力的同时有效避免早熟收敛,进而实现光谱特征波长的高效优选。
本发明采用的技术方案包括以下步骤:
(1)输入光谱数据集和化学浓度数据,以Savitzky-Golay平滑、标准正态变量变换、多元散射校正、一阶导数及其组合对光谱数据进行预处理,以校正集样本光谱数据建立全谱下的偏最小二乘回归模型,通过对比交叉验证均方根误差最小确定光谱数据的最佳预处理方法;
(2)以预处理后的光谱数据为波长选择对象,依据光谱数据特点进行粒子种群的初始化和温度初始化。随机产生N个M长的二进制序列,N为种群规模,M为预处理后的光谱波长变量个数。一个二进制序列为一个粒子,序列内所有值为“1”二进制位的组合作为该粒子所选中的特征波长。初始化每个粒子的初始整体惯性移动速度、个体历史最优适应度函数值以及群体历史最优适应度函数值;
(3)对每一代种群中的每个粒子,将其二进制序列中值为“1”二进制位对应的波长选中参与建模运算,使用K折交叉验证计算其偏最小二乘回归模型的交叉验证均方根误差,并将其作为本算法的适应度函数值;
(4)每个粒子各自将该次计算得到的适应度函数值和个体历史最优值比较,将数值较小值更新为该粒子的个体历史最优适应度函数值,将该值所对应的粒子位置记录为个体历史最优位置。将每个粒子的个体历史最优适应度函数值和群体历史最优适应度函数值进行比较,将数值最小值更新为群体历史最优适应度函数值,将该值所对应的粒子位置记录为群体历史最优位置;
(5)每个粒子根据个体历史最优位置和群体历史最优位置进行指导性进化,变换各粒子中所有值为“1”二进制位的当前位置,使粒子二进制位逐渐向具有较好适应度函数值的方向移动;
(6)对移动二进制位“1”后的每一个粒子随机选取W位进行二进制“位变异”生成扰动解,并采用Metropolis判别准则接受扰动解。若接受扰动解,需要对扰动解中的“1”变“0”位速度置零、“0”变“1”位速度重新初始化。最后,计算种群中每一个粒子的整体惯性移动速度,并执行降温操作和运行次数递增操作;
(7)重复步骤(3)~(6),若此时已达到了算法运行的最大运行次数,则结束循环,输出此时的群体历史最优适应度函数值和群体历史最优位置,该群体历史最优位置对应粒子中值为“1”二进制位的编号即为优选的光谱特征波长变量;
作为本发明的进一步改进,所述步骤(2)中每个粒子的初始整体惯性移动速度为V0,其计算公式为:
V0=round(r1×9+1)×sign(r2×3-1)
其中,round()函数为四舍五入取整函数,sign()函数为归一函数,即正数归为1,负数归为-1;r1和r2为区间(0,1)内的随机数。
作为本发明的进一步改进,所述步骤(5)中粒子的移动遵循以下规律:
①粒子的移动即为粒子中的每一个值为“1”二进制位的移动;
②第i代进化时种群中某个粒子的第j个值为“1”二进制位的移动速度为
Figure BDA0003759333100000021
其计算公式为:
Figure BDA0003759333100000031
Figure BDA0003759333100000032
其中,
Figure BDA0003759333100000033
的符号表示左右,数值表示距离,规定左为负,右为正;
Figure BDA0003759333100000034
为计算的值为“1”二进制位的临时移动速度;S为移动速度限制数,且S=round(100-0.95×Tn),Tn为循环的次数;round()函数为四舍五入取整函数;w为惯性权重,设定为0.6;Vi-1为该粒子上一代的整体惯性移动速度;c1和c2为自我学习因子和群体学习因子,设定为1.6;r3和r4为区间(0,1)内的随机扰动数;V1p为该“1”趋向于个体历史最优的速度;V1g为该“1”趋向于群体历史最优的速度;
③关于V1p和V1g,其计算公式为:
V1p=V1pl+V1pr
Figure BDA0003759333100000035
Figure BDA0003759333100000036
V1g=V1gl+V1gr
Figure BDA0003759333100000037
Figure BDA0003759333100000038
其中,V1pl和V1pr为该粒子个体历史最优中左侧和右侧对该“1”的吸引速度;R1pl和R1pr为该粒子个体历史最优位置中位于该“1”左侧和右侧最近的“1”的距离;V1gl和V1gr为群体历史最优中左侧和右侧对该“1”的吸引速度;R1gl和R1gr为群体历史最优位置中位于该“1”左侧和右侧最近的“1”的距离;在计算V1pl、V1pr、V1gr和V1gr时,基于万有引力的思想设计计算公式以实现距离越远吸引速度越小。
作为本发明的进一步改进,所述步骤(6)中对扰动解“0”变“1”位速度重新初始化,并计算粒子的整体惯性移动速度。设第i代进化时扰动解第j个“0”变“1”位的初始化速度为
Figure BDA0003759333100000041
粒子的整体惯性移动速度为Vi
Figure BDA0003759333100000042
和Vi的计算公式分别为:
Figure BDA0003759333100000043
Figure BDA0003759333100000044
其中,round()函数为四舍五入取整函数,sign()函数为归一函数,即正数归为1,负数归为-1;r5和r6为区间(0,1)内的随机数,
Figure BDA0003759333100000045
为粒子每一个值为“1”二进制位的移动速度,n为粒子值为“1”二进制位的数量。
与现有技术相比,本发明的有益效果在于:
相比于传统二进制粒子群算法在更新粒子的速度位置时需要对粒子内所有二进制位进行操作(判定该位是否为“1”),本发明将每个粒子中的值为“1”二进制位看作一个独立个体,仅对值为“1”二进制位进行指导性移位操作,基于粒子群算法思想使其朝着适应度更好的区段移动,算法运行更简便、高效。通过融合模拟退火策略对移位后的粒子二进制位进行扰动,有效解决了二进制粒子群算法迭代搜索后期因种群多样性丧失易导致早熟收敛的问题。本发明通过构建粒子群算法思想与模拟退火策略有机结合的光谱特征波长选择方法,充分发挥了粒子群算法的高效搜索能力,解决了二进制粒子群算法早熟收敛和模拟退火算法搜索效率低的问题,能够有效实现光谱数据的特征波长优选。
附图说明
图1为本发明的流程示意图;
图2为实施例的土壤样本原始光谱图;
图3为个体历史最优位置示意图;
图4为个体历史最优位置左侧无“1”情况示意图;
图5为个体历史最优位置“1”重叠情况示意图;
图6为群体历史最优位置示意图;
图7为粒子二进制位“1”的位移示意图;
图8为不同波长选择方法进化过程对比图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步详细说明。
本发明实施例取自网站Quality&Technology土壤开源数据集,由可见近红外光谱数据和化学指标数据构成,共计108个样本。样本光谱波长范围为400~2500nm,采样间隔为2nm,波长变量个数为1050个,样品光谱数据如图2所示。本发明采用土壤有机质含量为因变量进行特征波长选择和光谱建模分析以证明本发明方法的有效性。具体实施步骤如下:
S1:输入光谱数据集和化学浓度数据,采用随机选择法按3:1的比例划分校正集和验证集,得到81个校正集样本和27个验证集样本。以Savitzky-Golay平滑(SG)、标准正态变量变换(SNV)、多元散射校正(MSC)、一阶导数(FD)其组合对光谱数据进行预处理,以校正集样本光谱数据建立全谱下的偏最小二乘回归模型,通过对比10折交叉验证均方根误差最小确定光谱数据的最佳预处理方法为Savitzky-Golay平滑。本实施例光谱数据不同预处理方法对比结果如表1所示。
表1不同预处理方法对比结果
预处理方法 最佳主成分个数 交叉验证决定系数 交叉验证均方根误差
-- 28 0.913 2.063
SG 21 0.939 1.723
SNV 13 0.883 2.547
MSC 13 0.883 2.466
FD 10 0.882 2.421
SG+SNV 16 0.903 2.385
SG+MSC 18 0.906 2.289
SG+FD 9 0.903 2.265
SNV+MSC 12 0.878 2.485
SNV+FD 15 0.874 2.511
MSC+FD 15 0.872 2.528
S2:以预处理后的光谱数据为对象,进行光谱波长变量优选,初始化粒子种群和各项参数。随机产生N个M长的二进制序列作为初始种群,其中N为粒子种群规模,取待优化波长变量个数的五分之一上取整数,M为预处理后的光谱波长变量个数。本实施例设定N为210,M为1050。依据公式(1)将每个粒子的初始整体惯性移动速度初始化为[-10,-1]∪[1,10]区间内的随机整数:
V0=round(r1×9+1)×sign(r2×2-1) (1)
其中,round()函数为四舍五入取整函数,sign()函数为归一函数,即正数归为1,负数归为-1;r1和r2为区间(0,1)内的随机数;
以初始种群每个粒子所有值为“1”二进制位的组合作为选中的特征波长,使用10折交叉验证计算偏最小二乘回归模型的交叉验证均方根误差作为初始种群每个粒子的适应度函数,按t0=100(fmax-fmin)进行温度初始化,其中fmax和fmin分别为初始种群的最大和最小适应度函数值。设定每个粒子的个体历史最优值和群体历史最优值为100,最大运行次数Tmax为100。
S3:对每一代种群中的每个粒子,将其二进制序列中值为“1”二进制位对应的波长选中参与建模运算,使用10折交叉验证计算其偏最小二乘回归模型的交叉验证均方根误差,并将其作为当前粒子的适应度函数值。
S4:将当前粒子的适应度函数值与其个体历史最优值和群体历史最优值比较,取较小者为新的最优值,并记录此时该粒子的个体历史最优位置和种群的群体历史最优位置。
S5:每个粒子根据粒子的当前位置与速度和个体历史最优位置与群体历史最优位置的差距,通过粒子内每个值为“1”二进制位的移动来计算并更新各粒子的速度和位置。具体步骤如下:
第一步,计算粒子趋向于个体历史最优的速度时,对该粒子内每个“1”,计算其距离个体历史最优位置中该“1”的位编号左右最近的“1”的距离R1pl和R1rp。如图3所示,计算粒子中第65位的“1”的距离R1pl和R1pr时,以个体历史最优位置编码的第65位为基准,分别向左右寻找到第62位和第70位的最接近的“1”,计算其距二者的距离R1pl和R1pr分别为3和5;
在搜寻最接近的“1”的时候,若其中某一个方向直至编码尽头也没有“1”,则第二步在计算该“1”向该方向的吸引速度时,设定该方向的吸引速度为0,如图4所示。若该粒子的“1”处于个体历史最优位置编码中的位数正好有“1”,则在第三步中计算该“1”的速度时,设定该速度为0,如图5所示;
第二步,根据R1pl和R1pr距离的远近,根据公式(2)、公式(3)计算该“1”对左侧和右侧的吸引速度V1pl和V1pr(设定以右侧为正方向,左侧为负方向):
Figure BDA0003759333100000061
Figure BDA0003759333100000071
第三步,根据已计算出的V1pl和V1pr,根据公式(4)二者相加计算该“1”对个体最优的吸引速度V1p。至此,该“1”对个体历史最优的吸引速度计算完成;
V1p=V1pl+V1pr (4)
第四步,计算粒子趋向于群体历史最优的速度时,对该粒子内每个“1”,计算其距离群体历史最优位置中该“1”的位编号左右最近的“1”的距离R1gl和R1gr。如图6所示,计算粒子中第65位的“1”,以群体历史最优位置的编码的第65位为基准,分别向左右寻找到第59位和第68位的最接近的“1”,计算其距二者的距离R1gl和R1gr分别为6和3;
在搜寻最接近的“1”的时候,若其中某一个方向直至编码尽头也没有“1”或者若该粒子的“1”处于群体历史最优位置编码中的位数正好有“1”,则处理办法同理第一步,分别为在第五步设定该“1”对该方向的吸引速度为0和在第六步设定该“1”的速度为0;
第五步,根据R1gl和R1gr距离的远近,根据公式(5)、公式(6)计算该“1”对左侧和右侧的吸引速度V1gl和V1gr(设定以右侧为正方向,左侧为负方向);
Figure BDA0003759333100000072
Figure BDA0003759333100000073
第六步,根据已计算出的V1gl和V1gr,根据公式(7)二者相加计算该“1”对群体最优的吸引速度V1g。至此,该“1”对群体历史最优的吸引速度计算完成;
V1g=V1gl+V1gr (7)
第七步,根据公式(8)计算出该“1”的临时移动速度
Figure BDA0003759333100000074
若该轮循环为第一轮循环,则采用粒子的初始整体惯性移动速度V0作为该粒子上一次的整体惯性移动速度;
Figure BDA0003759333100000081
第八步,对该二进制位“1”的移动速度
Figure BDA0003759333100000082
进行限制,使
Figure BDA0003759333100000083
的绝对值不大于限制数S,如公式(9)。S=round(100-0.95×Tn),Tn为循环的次数,S的值随着算法迭代次数的增加逐渐减小。该操作的目的是对“1”的移动速度进行限制,不让其移动太快而略过适应度高的位数,这样能够在保证算法前期全局搜索能力的同时,有效提高进化后期的收敛速度;
Figure BDA0003759333100000084
第九步,根据计算出的
Figure BDA0003759333100000085
对“1”进行位移。该“1”新的位数X1为现在的位数X-1加上
Figure BDA0003759333100000086
若X1超出了光谱区间,即小于1或者大于M,则将X1设定为1或M。如图7所示,若该粒子第65位的“1”的
Figure BDA0003759333100000087
计算结果为-10,则该粒子的新的编码中第55位上的数字设置为“1”,第65位上的数字设置为“0”;
第十步,对该粒子内的每个值为“1”二进制位重复第一至第九步,直至所有“1”移动完毕,得到该粒子的新位置编码,并将新位置编码作为该粒子更新位置后的位置编码。
S6:对移动二进制位“1”后的每一个粒子,构建邻域扰动解,基于Metropolis判别准则接受扰动解。在完成扰动解二进制位速度更新后,计算种群中每一个粒子的整体惯性移动速度,并执行降温操作和运行次数递增操作。具体步骤如下:
第一步,对二进制位“1”移位后的粒子X随机选取W位进行二进制“位变异”,即对随机选取的W位二进制位执行原“0”变“1”、原“1”变“0”操作,进而生成扰动解X′,其中W取码长的二十分之一上取整,本实施例W取53;
第二步,对X的扰动解X′,令Δf=f(X)-f(X′),若Δf≥0,则接受邻域解X′到下一代种群;若Δf<0,则生成随机数r∈[0,1],当r<exp(Δf/tn)时,仍接受邻域解X′到下一代种群,其中tn为当前代温度参数;否则,将原染色体X复制到下一代种群中;
第三步,若接受扰动解X′,需要更新扰动解中变异位的速度,将扰动解中的“1”变“0”位速度置零,根据公式(10)计算公式将“0”变“1”位速度重新初始化,其他值为“1”的二进制位移动速度保持不变;
Figure BDA0003759333100000091
第四步,更新完所有粒子的位置并执行Metropolis选择复制后,按根据公式(11)计算种群中每一个粒子的整体惯性移动速度,并按公式tn+1=αtn执行降温操作,其中α为降温系数,且0<α<1,本实施例α取0.9。再按Tn+1=Tn+1执行运行次数递增操作;
Figure BDA0003759333100000092
S7:重复S3~S6进行历史最优位置的迭代更新。若达到了算法运行的最大运行次数,则结束循环,输出此时的群体历史最优适应度函数值以及群体历史最优位置作为该算法优选的光谱特征波长。
为了评测本发明提出方法的寻优性能,将其与标准二进制粒子群算法、模拟退火算法、标准二进制粒子群算法联合模拟退火算法的波长选择性能进行对比。为了消除智能优化算法光谱波长选择的随机性对评测结果的影响,每种算法均运行5次,取5次优选结果的适应度函数平均值作为评价参数对算法的寻优性能进行评测。图8为本发明提出的基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法(本方法)与标准二进制粒子群算法(BPSO)、模拟退火算法(SA)、标准二进制粒子群算法联合模拟退火算法(BPSO-SA)的波长选择进化过程对比图。图8中横坐标为波长选择算法运行次数,纵坐标为交叉验证均方根误差,实线为本发明提出的基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法进化过程中得到的每一代群体历史最优适应度函数的平均值,虚线为标准二进制粒子群算法波长选择过程中得到的每一代群体历史最优适应度函数值的平均值,点划线为模拟退火算法波长选择过程中得到的每一代群体历史最优适应度函数的平均值,点虚线为标准二进制粒子群算法联合模拟退火算法波长选择过程中得到的每一代群体历史最优适应度函数的平均值。从图8可以看出,本发明提出的基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法要优于标准二进制粒子群算法、模拟退火算法和标准二进制粒子群算法联合模拟退火算法特征波长选择的寻优性能。
为了评测本发明提出方法的建模精度和效率,将其与标准二进制粒子群算法、模拟退火算法、标准二进制粒子群算法联合模拟退火算法优选特征波长的建模性能进行对比,以5次运行的波长优选结果分别建立偏最小二乘回归模型,使用校正决定系数
Figure BDA0003759333100000093
预测决定系数
Figure BDA0003759333100000101
校正均方根误差(RMSEC)、预测均方根误差(RMSEP)和残余预测偏差(RPD)对模型的性能进行评价,并选定5次优选结果中的最佳回归模型为每种算法建立的土壤有机质含量快速检测模型。其中,
Figure BDA0003759333100000102
Figure BDA0003759333100000103
越接近于1,RMSEC和RMSEP越接近于0,RPD越大,模型的拟合能力越强,预测精度越高。表2为本发明提出的基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法(本方法)与标准二进制粒子群算法(BPSO)、模拟退火算法(SA)、标准二进制粒子群算法联合模拟退火算法(BPSO-SA)优选波长建立偏最小二乘回归模型的最佳性能对比结果。
表2不同方法建立的偏最小二乘回归模型性能指标
Figure BDA0003759333100000104
从表2可以看出,本方法得到的校正模型预测精度优于全谱和标准二进制粒子群算法、模拟退火算法、标准二进制粒子群算法联合模拟退火算法优选波长的建模精度,其验证集的
Figure BDA0003759333100000105
RMSEP和RPD分别为0.983、1.459%和6.970,且RMSEC与RMSEP更接近,说明本方法优选特征波长建立的偏最小二乘回归模型能够满足土壤有机质含量的快速检测需求。同时,本方法实现了粒子中值为“1”二进制位的指导性进化,通过值为“1”二进制位的移位重叠效应能够实现无信息波长变量的高效剔除,相比于标准二进制粒子群算法、模拟退火算法、标准二进制粒子群算法联合模拟退火算法能够获取数量更少的高相关性特征波长变量,所建模型的运行效率更高。
本实施例公布的是较佳的实施例,但并不局限于此,本领域的普通技术人员,极易根据上述实施例,领会本发明的精神,并做出不同的引申和变化,但只要不脱离本发明的精神,都在本发明的保护范围内。

Claims (4)

1.一种基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法,其特征在于,包含如下所述步骤:
(1)输入光谱数据集和化学浓度数据,以Savitzky-Golay平滑、标准正态变量变换、多元散射校正、一阶导数及其组合对光谱数据进行预处理,以校正集样本光谱数据建立全谱下的偏最小二乘回归模型,通过对比交叉验证均方根误差最小确定光谱数据的最佳预处理方法;
(2)以预处理后的光谱数据为波长选择对象,依据光谱数据特点进行粒子种群的初始化和温度初始化,随机产生N个M长的二进制序列,N为种群规模,M为预处理后的光谱波长变量个数;一个二进制序列为一个粒子,序列内所有值为“1”二进制位的组合作为该粒子所选中的特征波长;初始化每个粒子的初始整体惯性移动速度、个体历史最优适应度函数值以及群体历史最优适应度函数值;
(3)对每一代种群中的每个粒子,将其二进制序列中值为“1”二进制位对应的波长选中参与建模运算,使用K折交叉验证计算其偏最小二乘回归模型的交叉验证均方根误差,并将其作为本算法的适应度函数值;
(4)每个粒子各自将该次计算得到的适应度函数值和个体历史最优值比较,将数值较小值更新为该粒子的个体历史最优适应度函数值,将该值所对应的粒子位置记录为个体历史最优位置;将每个粒子的个体历史最优适应度函数值和群体历史最优适应度函数值进行比较,将数值最小值更新为群体历史最优适应度函数值,将该值所对应的粒子位置记录为群体历史最优位置;
(5)每个粒子根据个体历史最优位置和群体历史最优位置进行指导性进化,变换各粒子中所有值为“1”二进制位的当前位置,使粒子二进制位逐渐向具有较好适应度函数值的方向移动;
(6)对移动二进制位“1”后的每一个粒子随机选取W位进行二进制“位变异”生成扰动解,并采用Metropolis判别准则接受扰动解;若接受扰动解,需要对扰动解中的“1”变“0”位速度置零、“0”变“1”位速度重新初始化;最后,计算种群中每一个粒子的整体惯性移动速度,并执行降温操作和运行次数递增操作;
(7)重复步骤(3)~(6),若此时已达到了算法运行的最大运行次数,则结束循环,输出此时的群体历史最优适应度函数值和群体历史最优位置,该群体历史最优位置对应粒子中值为“1”二进制位的编号即为优选的光谱特征波长变量。
2.根据权利要求1所述的基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法,其特征在于,所述步骤(2)中产生的粒子种群中,每个粒子的初始整体惯性移动速度为V0,其计算公式为:
V0=round(r1×9+1)×sign(r2×2-1)
其中,round()函数为四舍五入取整函数,sign()函数为归一函数,即正数归为1,负数归为-1;r1和r2为区间(0,1)内的随机数。
3.根据权利要求1所述的基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法,其特征在于,所述步骤(5)中粒子的移动遵循以下规律:
(1)粒子的移动即为粒子中的每一个值为“1”二进制位的移动;
(2)第i代进化时种群中某个粒子的第j个值为“1”二进制位的移动速度为
Figure FDA0003759333090000027
其计算公式为:
Figure FDA0003759333090000021
Figure FDA0003759333090000022
其中,
Figure FDA0003759333090000023
的符号表示左右,数值表示距离,规定左为负,右为正;
Figure FDA0003759333090000024
为计算的值为“1”二进制位的临时移动速度;S为移动速度限制数,且S=round(100-0.95×Tn),Tn为循环的次数;round()函数为四舍五入取整函数;w为惯性权重,设定为0.6;Vi-1为该粒子上一代的整体惯性移动速度;c1和c2为自我学习因子和群体学习因子,设定为1.6;r3和r4为区间(0,1)内的随机扰动数;V1p为该“1”趋向于个体历史最优的速度;V1g为该“1”趋向于群体历史最优的速度;
(3)关于V1p和V1g,其计算公式为:
V1p=V1pl+V1pr
Figure FDA0003759333090000025
Figure FDA0003759333090000026
V1g=V1gl+V1gr
Figure FDA0003759333090000031
Figure FDA0003759333090000032
其中,V1pl和V1pr为该粒子个体历史最优中左侧和右侧对该“1”的吸引速度;R1pl和R1pr为该粒子个体历史最优位置中位于该“1”左侧和右侧最近的“1”的距离;V1gl和V1gr为群体历史最优中左侧和右侧对该“1”的吸引速度;R1gl和R1gr为群体历史最优位置中位于该“1”左侧和右侧最近的“1”的距离;在计算V1pl、V1pr、V1gl和V1gr时,基于万有引力的思想设计计算公式以实现距离越远吸引速度越小。
4.根据权利要求1所述的基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法,其特征在于,所述步骤(6)中对扰动解“0”变“1”位速度重新初始化,并计算粒子的整体惯性移动速度,设第i代进化时扰动解第j个“0”变“1”位的初始化速度为
Figure FDA0003759333090000033
粒子的整体惯性移动速度为Vi
Figure FDA0003759333090000034
和Vi的计算公式分别为:
Figure FDA0003759333090000035
Figure FDA0003759333090000036
其中,round()函数为四舍五入取整函数,sign()函数为归一函数,即正数归为1,负数归为-1;r5和r6为区间(0,1)内的随机数,
Figure FDA0003759333090000037
为粒子每一个值为“1”二进制位的移动速度,n为粒子值为“1”二进制位的数量。
CN202210867437.XA 2022-07-22 2022-07-22 基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法 Active CN115114838B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210867437.XA CN115114838B (zh) 2022-07-22 2022-07-22 基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210867437.XA CN115114838B (zh) 2022-07-22 2022-07-22 基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法

Publications (2)

Publication Number Publication Date
CN115114838A CN115114838A (zh) 2022-09-27
CN115114838B true CN115114838B (zh) 2023-02-07

Family

ID=83333858

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210867437.XA Active CN115114838B (zh) 2022-07-22 2022-07-22 基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法

Country Status (1)

Country Link
CN (1) CN115114838B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115639160A (zh) * 2022-12-23 2023-01-24 东北农业大学 一种无人值守的沼液指标在线同步速测装置及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103913432A (zh) * 2014-03-25 2014-07-09 西安交通大学 基于粒子群算法的近红外光谱波长选择方法
WO2018060967A1 (en) * 2016-09-29 2018-04-05 Inesc Tec - Instituto De Engenharia De Sistemas E Computadores, Tecnologia E Ciência Big data self-learning methodology for the accurate quantification and classification of spectral information under complex varlability and multi-scale interference
CN111007040A (zh) * 2019-12-27 2020-04-14 黑龙江八一农垦大学 大米食味品质近红外光谱快速评价方法
CN111898237A (zh) * 2020-06-01 2020-11-06 哈尔滨工业大学 材料多热物性参数反演测量用并行模拟退火快速优化方法
CN112613391A (zh) * 2020-12-18 2021-04-06 湖北工业大学 一种基于反向学习二进制水稻育种算法的高光谱图像波段选择方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103913432A (zh) * 2014-03-25 2014-07-09 西安交通大学 基于粒子群算法的近红外光谱波长选择方法
WO2018060967A1 (en) * 2016-09-29 2018-04-05 Inesc Tec - Instituto De Engenharia De Sistemas E Computadores, Tecnologia E Ciência Big data self-learning methodology for the accurate quantification and classification of spectral information under complex varlability and multi-scale interference
CN111007040A (zh) * 2019-12-27 2020-04-14 黑龙江八一农垦大学 大米食味品质近红外光谱快速评价方法
CN111898237A (zh) * 2020-06-01 2020-11-06 哈尔滨工业大学 材料多热物性参数反演测量用并行模拟退火快速优化方法
CN112613391A (zh) * 2020-12-18 2021-04-06 湖北工业大学 一种基于反向学习二进制水稻育种算法的高光谱图像波段选择方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Rapid detection of carbon-nitrogen ratio for anaerobic fermentation feedstocks using near-infrared spectroscopy combined with BiPLS and GSA;Jinming Liu 等;《Applied Optics》;20190620;第58卷(第18期);4823-5135 *
Rapid detection of talc content in flour based on near-infrared spectroscopy combined with feature wavelength selection;Changhao Bao 等;《Applied Optics》;20220701;第61卷(第19期);5790-5798 *
玉米秸秆纤维素和半纤维素NIRS特征波长优选;刘金明 等;《光谱学与光谱分析》;20190331;第39卷(第3期);743-750 *

Also Published As

Publication number Publication date
CN115114838A (zh) 2022-09-27

Similar Documents

Publication Publication Date Title
CN102323906B (zh) 一种基于遗传算法的mc/dc测试数据自动生成方法
CN115114838B (zh) 基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法
CN113987033B (zh) 主变在线监测数据群体偏差识别与校准方法
WO2011109922A1 (zh) 基于模拟退火-遗传算法近红外光谱特征子区间选择方法
CN110119558B (zh) 一种基于差分优化算法的电路参数优化方法
CN110598929B (zh) 一种风电功率非参数概率区间超短期预测方法
CN111738477A (zh) 基于深层特征组合的电网新能源消纳能力预测方法
CN106779384B (zh) 一种基于信息粒度最优分配的钢铁工业高炉煤气长期区间预测方法
CN107868979A (zh) 一种基于恒拉速控制结构的硅单晶直径控制方法
CN112749840A (zh) 一种火电机组能效特征指标基准值的获取方法
CN114169434A (zh) 一种负荷预测方法
CN103903060B (zh) 一种关于装配公差的优化设计方法
US10553304B2 (en) Method and apparatus for reducing chemical reaction mechanisms
CN109492816B (zh) 一种基于混合智能的煤与瓦斯突出动态预测方法
CN110851959A (zh) 一种融合深度学习和分位数回归的风速区间预测方法
CN114595624A (zh) 基于XGBoost算法的伴热带装置寿命状态预测方法
Garg et al. Genetically evolved radial basis function network based prediction of drill flank wear
CN117007974A (zh) 一种基于模型融合的固态电池soc估计方法
CN117171713A (zh) 一种基于轴承寿命的交叉自适应深度迁移学习方法及系统
CN109101683B (zh) 燃煤分质利用与清洁预处理系统热解釜的模型更新方法
CN111310974A (zh) 一种基于ga-elm的短期需水预测方法
CN116318773A (zh) 基于ae模型优化的对抗训练式无监督入侵检测系统及方法
CN112749211B (zh) 一种基于电力大数据的茶叶产量预测新方法
CN109345274B (zh) 基于bp神经网络评分预测误差的近邻用户选择方法
CN113343589B (zh) 一种基于遗传-随机常数的基因表达式编程的酸性天然气水合物生成条件预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant