CN115114838A - 基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法 - Google Patents
基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法 Download PDFInfo
- Publication number
- CN115114838A CN115114838A CN202210867437.XA CN202210867437A CN115114838A CN 115114838 A CN115114838 A CN 115114838A CN 202210867437 A CN202210867437 A CN 202210867437A CN 115114838 A CN115114838 A CN 115114838A
- Authority
- CN
- China
- Prior art keywords
- particle
- value
- binary
- optimal
- speed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000002245 particle Substances 0.000 title claims abstract description 146
- 230000003595 spectral effect Effects 0.000 title claims abstract description 42
- 238000002922 simulated annealing Methods 0.000 title claims abstract description 35
- 238000010187 selection method Methods 0.000 title claims abstract description 14
- 238000005457 optimization Methods 0.000 claims abstract description 27
- 238000002790 cross-validation Methods 0.000 claims abstract description 17
- 230000036961 partial effect Effects 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 56
- 238000000034 method Methods 0.000 claims description 29
- 238000001228 spectrum Methods 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000012937 correction Methods 0.000 claims description 9
- 238000009499 grossing Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000001816 cooling Methods 0.000 claims description 5
- 239000000126 substance Substances 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 3
- YZCKVEUIGOORGS-NJFSPNSNSA-N Tritium Chemical compound [3H] YZCKVEUIGOORGS-NJFSPNSNSA-N 0.000 claims 1
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000010238 partial least squares regression Methods 0.000 description 5
- 230000002028 premature Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000002203 pretreatment Methods 0.000 description 3
- 239000002689 soil Substances 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000004016 soil organic matter Substances 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- YZCKVEUIGOORGS-IGMARMGPSA-N Protium Chemical compound [1H] YZCKVEUIGOORGS-IGMARMGPSA-N 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000002329 infrared spectrum Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/25—Design optimisation, verification or simulation using particle-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/06—Multi-objective optimisation, e.g. Pareto optimisation using simulated annealing [SA], ant colony algorithms or genetic algorithms [GA]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Computer Hardware Design (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Computation (AREA)
- Algebra (AREA)
- Geometry (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法,以光谱数据波长变量个数为码长进行粒子群初始化和温度初始化,使用粒子中值为“1”二进制位对应的光谱波长变量建立偏最小二乘回归模型,以交叉验证均方根误差为适应度函数,选出每个粒子的个体历史最优和整个种群的群体历史最优,计算每个粒子中值为“1”二进制位的移动速度并更新位置,对更新位置的粒子生成扰动解,最终采用交叉验证均方根误差最小的粒子作为群体历史最优位置,该粒子值为“1”二进制位的编号即为优选的光谱特征波长变量。本发明实现了粒子值为“1”二进制位的指导性寻优,融合了模拟退火策略,具有高效的特征波长选择能力。
Description
技术领域
本发明涉及光谱分析领域,尤其涉及一种基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法。
背景技术
光谱分析技术具有无损、快速、低成本等优势,通过快速获取大量、准确的光谱数据结合已经建立的定量校正模型即可实现样品理化指标的快速检测。但是在采集光谱数据时,由于采集的光谱数据量很大,光谱数据中含有的样品背景、高频噪声等无关信息很难使用预处理方法完全消除,以采集的光谱全部波长变量建模时,计算量大,波长冗余严重,不仅增加了模型的复杂程度,还严重影响了模型的预测精度。因此,有必要通过特征波长优选,有效消除光谱中不相干和共线性的波长变量对建模精度和效率的影响。
目前国内外常用的特征波长选择方法有区间偏最小二乘法、反向区间偏最小二乘法、连续投影算法、竞争性自适应重加权采样算法等,同时遗传算法、模拟退火算法、随机蛙跳算法等智能优化算法在光谱特征波长选择方面得到了有效应用。相比于其它智能优化算法,粒子群算法具有实现简单、收敛迅速、参数调整少、稳定性高等优点,在特征波长选择方面应用越来越广泛。然而用于求解波长选择问题的二进制粒子群算法虽然具有很强的搜索能力,但随着算法迭代搜索次数的增加粒子将迅速失去多样性,导致算法丧失全局搜索能力,不能收敛于全局最优解。因此,亟待对二进制粒子群算法进行改进,并研究改进后的算法在光谱特征波长选择方面的应用效果具有重要意义。
发明内容
为了克服现有二进制粒子群算法在光谱波长选择过程中容易出现早熟收敛的问题,本发明提出了一种基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法,基于粒子群算法思想实现了粒子值为“1”二进制位的指导性进化,融合了模拟退火策略进行扰动解的Metropolis选择复制,充分利用算法强大搜索能力的同时有效避免早熟收敛,进而实现光谱特征波长的高效优选。
本发明采用的技术方案包括以下步骤:
(1)输入光谱数据集和化学浓度数据,以Savitzky-Golay平滑、标准正态变量变换、多元散射校正、一阶导数及其组合对光谱数据进行预处理,以校正集样本光谱数据建立全谱下的偏最小二乘回归模型,通过对比交叉验证均方根误差最小确定光谱数据的最佳预处理方法;
(2)以预处理后的光谱数据为波长选择对象,依据光谱数据特点进行粒子种群的初始化和温度初始化。随机产生N个M长的二进制序列,N为种群规模,M为预处理后的光谱波长变量个数。一个二进制序列为一个粒子,序列内所有值为“1”二进制位的组合作为该粒子所选中的特征波长。初始化每个粒子的初始整体惯性移动速度、个体历史最优适应度函数值以及群体历史最优适应度函数值;
(3)对每一代种群中的每个粒子,将其二进制序列中值为“1”二进制位对应的波长选中参与建模运算,使用K折交叉验证计算其偏最小二乘回归模型的交叉验证均方根误差,并将其作为本算法的适应度函数值;
(4)每个粒子各自将该次计算得到的适应度函数值和个体历史最优值比较,将数值较小值更新为该粒子的个体历史最优适应度函数值,将该值所对应的粒子位置记录为个体历史最优位置。将每个粒子的个体历史最优适应度函数值和群体历史最优适应度函数值进行比较,将数值最小值更新为群体历史最优适应度函数值,将该值所对应的粒子位置记录为群体历史最优位置;
(5)每个粒子根据个体历史最优位置和群体历史最优位置进行指导性进化,变换各粒子中所有值为“1”二进制位的当前位置,使粒子二进制位逐渐向具有较好适应度函数值的方向移动;
(6)对移动二进制位“1”后的每一个粒子随机选取W位进行二进制“位变异”生成扰动解,并采用Metropolis判别准则接受扰动解。若接受扰动解,需要对扰动解中的“1”变“0”位速度置零、“0”变“1”位速度重新初始化。最后,计算种群中每一个粒子的整体惯性移动速度,并执行降温操作和运行次数递增操作;
(7)重复步骤(3)~(6),若此时已达到了算法运行的最大运行次数,则结束循环,输出此时的群体历史最优适应度函数值和群体历史最优位置,该群体历史最优位置对应粒子中值为“1”二进制位的编号即为优选的光谱特征波长变量;
作为本发明的进一步改进,所述步骤(2)中每个粒子的初始整体惯性移动速度为V0,其计算公式为:
V0=round(r1×9+1)×sign(r2×3-1)
其中,round()函数为四舍五入取整函数,sign()函数为归一函数,即正数归为1,负数归为-1;r1和r2为区间(0,1)内的随机数。
作为本发明的进一步改进,所述步骤(5)中粒子的移动遵循以下规律:
①粒子的移动即为粒子中的每一个值为“1”二进制位的移动;
其中,的符号表示左右,数值表示距离,规定左为负,右为正;为计算的值为“1”二进制位的临时移动速度;S为移动速度限制数,且S=round(100-0.95×Tn),Tn为循环的次数;round()函数为四舍五入取整函数;w为惯性权重,设定为0.6;Vi-1为该粒子上一代的整体惯性移动速度;c1和c2为自我学习因子和群体学习因子,设定为1.6;r3和r4为区间(0,1)内的随机扰动数;V1p为该“1”趋向于个体历史最优的速度;V1g为该“1”趋向于群体历史最优的速度;
③关于V1p和V1g,其计算公式为:
V1p=V1pl+V1pr
V1g=V1gl+V1gr
其中,V1pl和V1pr为该粒子个体历史最优中左侧和右侧对该“1”的吸引速度;R1pl和R1pr为该粒子个体历史最优位置中位于该“1”左侧和右侧最近的“1”的距离;V1gl和V1gr为群体历史最优中左侧和右侧对该“1”的吸引速度;R1gl和R1gr为群体历史最优位置中位于该“1”左侧和右侧最近的“1”的距离;在计算V1pl、V1pr、V1gr和V1gr时,基于万有引力的思想设计计算公式以实现距离越远吸引速度越小。
作为本发明的进一步改进,所述步骤(6)中对扰动解“0”变“1”位速度重新初始化,并计算粒子的整体惯性移动速度。设第i代进化时扰动解第j个“0”变“1”位的初始化速度为粒子的整体惯性移动速度为Vi,和Vi的计算公式分别为:
其中,round()函数为四舍五入取整函数,sign()函数为归一函数,即正数归为1,负数归为-1;r5和r6为区间(0,1)内的随机数,为粒子每一个值为“1”二进制位的移动速度,n为粒子值为“1”二进制位的数量。
与现有技术相比,本发明的有益效果在于:
相比于传统二进制粒子群算法在更新粒子的速度位置时需要对粒子内所有二进制位进行操作(判定该位是否为“1”),本发明将每个粒子中的值为“1”二进制位看作一个独立个体,仅对值为“1”二进制位进行指导性移位操作,基于粒子群算法思想使其朝着适应度更好的区段移动,算法运行更简便、高效。通过融合模拟退火策略对移位后的粒子二进制位进行扰动,有效解决了二进制粒子群算法迭代搜索后期因种群多样性丧失易导致早熟收敛的问题。本发明通过构建粒子群算法思想与模拟退火策略有机结合的光谱特征波长选择方法,充分发挥了粒子群算法的高效搜索能力,解决了二进制粒子群算法早熟收敛和模拟退火算法搜索效率低的问题,能够有效实现光谱数据的特征波长优选。
附图说明
图1为本发明的流程示意图;
图2为实施例的土壤样本原始光谱图;
图3为个体历史最优位置示意图;
图4为个体历史最优位置左侧无“1”情况示意图;
图5为个体历史最优位置“1”重叠情况示意图;
图6为群体历史最优位置示意图;
图7为粒子二进制位“1”的位移示意图;
图8为不同波长选择方法进化过程对比图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步详细说明。
本发明实施例取自网站Quality&Technology土壤开源数据集,由可见近红外光谱数据和化学指标数据构成,共计108个样本。样本光谱波长范围为400~2500nm,采样间隔为2nm,波长变量个数为1050个,样品光谱数据如图2所示。本发明采用土壤有机质含量为因变量进行特征波长选择和光谱建模分析以证明本发明方法的有效性。具体实施步骤如下:
S1:输入光谱数据集和化学浓度数据,采用随机选择法按3:1的比例划分校正集和验证集,得到81个校正集样本和27个验证集样本。以Savitzky-Golay平滑(SG)、标准正态变量变换(SNV)、多元散射校正(MSC)、一阶导数(FD)其组合对光谱数据进行预处理,以校正集样本光谱数据建立全谱下的偏最小二乘回归模型,通过对比10折交叉验证均方根误差最小确定光谱数据的最佳预处理方法为Savitzky-Golay平滑。本实施例光谱数据不同预处理方法对比结果如表1所示。
表1不同预处理方法对比结果
预处理方法 | 最佳主成分个数 | 交叉验证决定系数 | 交叉验证均方根误差 |
-- | 28 | 0.913 | 2.063 |
SG | 21 | 0.939 | 1.723 |
SNV | 13 | 0.883 | 2.547 |
MSC | 13 | 0.883 | 2.466 |
FD | 10 | 0.882 | 2.421 |
SG+SNV | 16 | 0.903 | 2.385 |
SG+MSC | 18 | 0.906 | 2.289 |
SG+FD | 9 | 0.903 | 2.265 |
SNV+MSC | 12 | 0.878 | 2.485 |
SNV+FD | 15 | 0.874 | 2.511 |
MSC+FD | 15 | 0.872 | 2.528 |
S2:以预处理后的光谱数据为对象,进行光谱波长变量优选,初始化粒子种群和各项参数。随机产生N个M长的二进制序列作为初始种群,其中N为粒子种群规模,取待优化波长变量个数的五分之一上取整数,M为预处理后的光谱波长变量个数。本实施例设定N为210,M为1050。依据公式(1)将每个粒子的初始整体惯性移动速度初始化为[-10,-1]∪[1,10]区间内的随机整数:
V0=round(r1×9+1)×sign(r2×2-1) (1)
其中,round()函数为四舍五入取整函数,sign()函数为归一函数,即正数归为1,负数归为-1;r1和r2为区间(0,1)内的随机数;
以初始种群每个粒子所有值为“1”二进制位的组合作为选中的特征波长,使用10折交叉验证计算偏最小二乘回归模型的交叉验证均方根误差作为初始种群每个粒子的适应度函数,按t0=100(fmax-fmin)进行温度初始化,其中fmax和fmin分别为初始种群的最大和最小适应度函数值。设定每个粒子的个体历史最优值和群体历史最优值为100,最大运行次数Tmax为100。
S3:对每一代种群中的每个粒子,将其二进制序列中值为“1”二进制位对应的波长选中参与建模运算,使用10折交叉验证计算其偏最小二乘回归模型的交叉验证均方根误差,并将其作为当前粒子的适应度函数值。
S4:将当前粒子的适应度函数值与其个体历史最优值和群体历史最优值比较,取较小者为新的最优值,并记录此时该粒子的个体历史最优位置和种群的群体历史最优位置。
S5:每个粒子根据粒子的当前位置与速度和个体历史最优位置与群体历史最优位置的差距,通过粒子内每个值为“1”二进制位的移动来计算并更新各粒子的速度和位置。具体步骤如下:
第一步,计算粒子趋向于个体历史最优的速度时,对该粒子内每个“1”,计算其距离个体历史最优位置中该“1”的位编号左右最近的“1”的距离R1pl和R1rp。如图3所示,计算粒子中第65位的“1”的距离R1pl和R1pr时,以个体历史最优位置编码的第65位为基准,分别向左右寻找到第62位和第70位的最接近的“1”,计算其距二者的距离R1pl和R1pr分别为3和5;
在搜寻最接近的“1”的时候,若其中某一个方向直至编码尽头也没有“1”,则第二步在计算该“1”向该方向的吸引速度时,设定该方向的吸引速度为0,如图4所示。若该粒子的“1”处于个体历史最优位置编码中的位数正好有“1”,则在第三步中计算该“1”的速度时,设定该速度为0,如图5所示;
第二步,根据R1pl和R1pr距离的远近,根据公式(2)、公式(3)计算该“1”对左侧和右侧的吸引速度V1pl和V1pr(设定以右侧为正方向,左侧为负方向):
第三步,根据已计算出的V1pl和V1pr,根据公式(4)二者相加计算该“1”对个体最优的吸引速度V1p。至此,该“1”对个体历史最优的吸引速度计算完成;
V1p=V1pl+V1pr (4)
第四步,计算粒子趋向于群体历史最优的速度时,对该粒子内每个“1”,计算其距离群体历史最优位置中该“1”的位编号左右最近的“1”的距离R1gl和R1gr。如图6所示,计算粒子中第65位的“1”,以群体历史最优位置的编码的第65位为基准,分别向左右寻找到第59位和第68位的最接近的“1”,计算其距二者的距离R1gl和R1gr分别为6和3;
在搜寻最接近的“1”的时候,若其中某一个方向直至编码尽头也没有“1”或者若该粒子的“1”处于群体历史最优位置编码中的位数正好有“1”,则处理办法同理第一步,分别为在第五步设定该“1”对该方向的吸引速度为0和在第六步设定该“1”的速度为0;
第五步,根据R1gl和R1gr距离的远近,根据公式(5)、公式(6)计算该“1”对左侧和右侧的吸引速度V1gl和V1gr(设定以右侧为正方向,左侧为负方向);
第六步,根据已计算出的V1gl和V1gr,根据公式(7)二者相加计算该“1”对群体最优的吸引速度V1g。至此,该“1”对群体历史最优的吸引速度计算完成;
V1g=V1gl+V1gr (7)
第八步,对该二进制位“1”的移动速度进行限制,使的绝对值不大于限制数S,如公式(9)。S=round(100-0.95×Tn),Tn为循环的次数,S的值随着算法迭代次数的增加逐渐减小。该操作的目的是对“1”的移动速度进行限制,不让其移动太快而略过适应度高的位数,这样能够在保证算法前期全局搜索能力的同时,有效提高进化后期的收敛速度;
第九步,根据计算出的对“1”进行位移。该“1”新的位数X1为现在的位数X-1加上若X1超出了光谱区间,即小于1或者大于M,则将X1设定为1或M。如图7所示,若该粒子第65位的“1”的计算结果为-10,则该粒子的新的编码中第55位上的数字设置为“1”,第65位上的数字设置为“0”;
第十步,对该粒子内的每个值为“1”二进制位重复第一至第九步,直至所有“1”移动完毕,得到该粒子的新位置编码,并将新位置编码作为该粒子更新位置后的位置编码。
S6:对移动二进制位“1”后的每一个粒子,构建邻域扰动解,基于Metropolis判别准则接受扰动解。在完成扰动解二进制位速度更新后,计算种群中每一个粒子的整体惯性移动速度,并执行降温操作和运行次数递增操作。具体步骤如下:
第一步,对二进制位“1”移位后的粒子X随机选取W位进行二进制“位变异”,即对随机选取的W位二进制位执行原“0”变“1”、原“1”变“0”操作,进而生成扰动解X′,其中W取码长的二十分之一上取整,本实施例W取53;
第二步,对X的扰动解X′,令Δf=f(X)-f(X′),若Δf≥0,则接受邻域解X′到下一代种群;若Δf<0,则生成随机数r∈[0,1],当r<exp(Δf/tn)时,仍接受邻域解X′到下一代种群,其中tn为当前代温度参数;否则,将原染色体X复制到下一代种群中;
第三步,若接受扰动解X′,需要更新扰动解中变异位的速度,将扰动解中的“1”变“0”位速度置零,根据公式(10)计算公式将“0”变“1”位速度重新初始化,其他值为“1”的二进制位移动速度保持不变;
第四步,更新完所有粒子的位置并执行Metropolis选择复制后,按根据公式(11)计算种群中每一个粒子的整体惯性移动速度,并按公式tn+1=αtn执行降温操作,其中α为降温系数,且0<α<1,本实施例α取0.9。再按Tn+1=Tn+1执行运行次数递增操作;
S7:重复S3~S6进行历史最优位置的迭代更新。若达到了算法运行的最大运行次数,则结束循环,输出此时的群体历史最优适应度函数值以及群体历史最优位置作为该算法优选的光谱特征波长。
为了评测本发明提出方法的寻优性能,将其与标准二进制粒子群算法、模拟退火算法、标准二进制粒子群算法联合模拟退火算法的波长选择性能进行对比。为了消除智能优化算法光谱波长选择的随机性对评测结果的影响,每种算法均运行5次,取5次优选结果的适应度函数平均值作为评价参数对算法的寻优性能进行评测。图8为本发明提出的基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法(本方法)与标准二进制粒子群算法(BPSO)、模拟退火算法(SA)、标准二进制粒子群算法联合模拟退火算法(BPSO-SA)的波长选择进化过程对比图。图8中横坐标为波长选择算法运行次数,纵坐标为交叉验证均方根误差,实线为本发明提出的基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法进化过程中得到的每一代群体历史最优适应度函数的平均值,虚线为标准二进制粒子群算法波长选择过程中得到的每一代群体历史最优适应度函数值的平均值,点划线为模拟退火算法波长选择过程中得到的每一代群体历史最优适应度函数的平均值,点虚线为标准二进制粒子群算法联合模拟退火算法波长选择过程中得到的每一代群体历史最优适应度函数的平均值。从图8可以看出,本发明提出的基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法要优于标准二进制粒子群算法、模拟退火算法和标准二进制粒子群算法联合模拟退火算法特征波长选择的寻优性能。
为了评测本发明提出方法的建模精度和效率,将其与标准二进制粒子群算法、模拟退火算法、标准二进制粒子群算法联合模拟退火算法优选特征波长的建模性能进行对比,以5次运行的波长优选结果分别建立偏最小二乘回归模型,使用校正决定系数预测决定系数校正均方根误差(RMSEC)、预测均方根误差(RMSEP)和残余预测偏差(RPD)对模型的性能进行评价,并选定5次优选结果中的最佳回归模型为每种算法建立的土壤有机质含量快速检测模型。其中,和越接近于1,RMSEC和RMSEP越接近于0,RPD越大,模型的拟合能力越强,预测精度越高。表2为本发明提出的基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法(本方法)与标准二进制粒子群算法(BPSO)、模拟退火算法(SA)、标准二进制粒子群算法联合模拟退火算法(BPSO-SA)优选波长建立偏最小二乘回归模型的最佳性能对比结果。
表2不同方法建立的偏最小二乘回归模型性能指标
从表2可以看出,本方法得到的校正模型预测精度优于全谱和标准二进制粒子群算法、模拟退火算法、标准二进制粒子群算法联合模拟退火算法优选波长的建模精度,其验证集的RMSEP和RPD分别为0.983、1.459%和6.970,且RMSEC与RMSEP更接近,说明本方法优选特征波长建立的偏最小二乘回归模型能够满足土壤有机质含量的快速检测需求。同时,本方法实现了粒子中值为“1”二进制位的指导性进化,通过值为“1”二进制位的移位重叠效应能够实现无信息波长变量的高效剔除,相比于标准二进制粒子群算法、模拟退火算法、标准二进制粒子群算法联合模拟退火算法能够获取数量更少的高相关性特征波长变量,所建模型的运行效率更高。
本实施例公布的是较佳的实施例,但并不局限于此,本领域的普通技术人员,极易根据上述实施例,领会本发明的精神,并做出不同的引申和变化,但只要不脱离本发明的精神,都在本发明的保护范围内。
Claims (4)
1.一种基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法,其特征在于,包含如下所述步骤:
(1)输入光谱数据集和化学浓度数据,以Savitzky-Golay平滑、标准正态变量变换、多元散射校正、一阶导数及其组合对光谱数据进行预处理,以校正集样本光谱数据建立全谱下的偏最小二乘回归模型,通过对比交叉验证均方根误差最小确定光谱数据的最佳预处理方法;
(2)以预处理后的光谱数据为波长选择对象,依据光谱数据特点进行粒子种群的初始化和温度初始化,随机产生N个M长的二进制序列,N为种群规模,M为预处理后的光谱波长变量个数;一个二进制序列为一个粒子,序列内所有值为“1”二进制位的组合作为该粒子所选中的特征波长;初始化每个粒子的初始整体惯性移动速度、个体历史最优适应度函数值以及群体历史最优适应度函数值;
(3)对每一代种群中的每个粒子,将其二进制序列中值为“1”二进制位对应的波长选中参与建模运算,使用K折交叉验证计算其偏最小二乘回归模型的交叉验证均方根误差,并将其作为本算法的适应度函数值;
(4)每个粒子各自将该次计算得到的适应度函数值和个体历史最优值比较,将数值较小值更新为该粒子的个体历史最优适应度函数值,将该值所对应的粒子位置记录为个体历史最优位置;将每个粒子的个体历史最优适应度函数值和群体历史最优适应度函数值进行比较,将数值最小值更新为群体历史最优适应度函数值,将该值所对应的粒子位置记录为群体历史最优位置;
(5)每个粒子根据个体历史最优位置和群体历史最优位置进行指导性进化,变换各粒子中所有值为“1”二进制位的当前位置,使粒子二进制位逐渐向具有较好适应度函数值的方向移动;
(6)对移动二进制位“1”后的每一个粒子随机选取W位进行二进制“位变异”生成扰动解,并采用Metropolis判别准则接受扰动解;若接受扰动解,需要对扰动解中的“1”变“0”位速度置零、“0”变“1”位速度重新初始化;最后,计算种群中每一个粒子的整体惯性移动速度,并执行降温操作和运行次数递增操作;
(7)重复步骤(3)~(6),若此时已达到了算法运行的最大运行次数,则结束循环,输出此时的群体历史最优适应度函数值和群体历史最优位置,该群体历史最优位置对应粒子中值为“1”二进制位的编号即为优选的光谱特征波长变量。
2.根据权利要求1所述的基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法,其特征在于,所述步骤(2)中产生的粒子种群中,每个粒子的初始整体惯性移动速度为V0,其计算公式为:
V0=round(r1×9+1)×sign(r2×2-1)
其中,round()函数为四舍五入取整函数,sign()函数为归一函数,即正数归为1,负数归为-1;r1和r2为区间(0,1)内的随机数。
3.根据权利要求1所述的基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法,其特征在于,所述步骤(5)中粒子的移动遵循以下规律:
(1)粒子的移动即为粒子中的每一个值为“1”二进制位的移动;
其中,的符号表示左右,数值表示距离,规定左为负,右为正;为计算的值为“1”二进制位的临时移动速度;S为移动速度限制数,且S=round(100-0.95×Tn),Tn为循环的次数;round()函数为四舍五入取整函数;w为惯性权重,设定为0.6;Vi-1为该粒子上一代的整体惯性移动速度;c1和c2为自我学习因子和群体学习因子,设定为1.6;r3和r4为区间(0,1)内的随机扰动数;V1p为该“1”趋向于个体历史最优的速度;V1g为该“1”趋向于群体历史最优的速度;
(3)关于V1p和V1g,其计算公式为:
V1p=V1pl+V1pr
V1g=V1gl+V1gr
其中,V1pl和V1pr为该粒子个体历史最优中左侧和右侧对该“1”的吸引速度;R1pl和R1pr为该粒子个体历史最优位置中位于该“1”左侧和右侧最近的“1”的距离;V1gl和V1gr为群体历史最优中左侧和右侧对该“1”的吸引速度;R1gl和R1gr为群体历史最优位置中位于该“1”左侧和右侧最近的“1”的距离;在计算V1pl、V1pr、V1gl和V1gr时,基于万有引力的思想设计计算公式以实现距离越远吸引速度越小。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210867437.XA CN115114838B (zh) | 2022-07-22 | 2022-07-22 | 基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210867437.XA CN115114838B (zh) | 2022-07-22 | 2022-07-22 | 基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115114838A true CN115114838A (zh) | 2022-09-27 |
CN115114838B CN115114838B (zh) | 2023-02-07 |
Family
ID=83333858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210867437.XA Active CN115114838B (zh) | 2022-07-22 | 2022-07-22 | 基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115114838B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115639160A (zh) * | 2022-12-23 | 2023-01-24 | 东北农业大学 | 一种无人值守的沼液指标在线同步速测装置及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103913432A (zh) * | 2014-03-25 | 2014-07-09 | 西安交通大学 | 基于粒子群算法的近红外光谱波长选择方法 |
WO2018060967A1 (en) * | 2016-09-29 | 2018-04-05 | Inesc Tec - Instituto De Engenharia De Sistemas E Computadores, Tecnologia E Ciência | Big data self-learning methodology for the accurate quantification and classification of spectral information under complex varlability and multi-scale interference |
CN111007040A (zh) * | 2019-12-27 | 2020-04-14 | 黑龙江八一农垦大学 | 大米食味品质近红外光谱快速评价方法 |
CN111898237A (zh) * | 2020-06-01 | 2020-11-06 | 哈尔滨工业大学 | 材料多热物性参数反演测量用并行模拟退火快速优化方法 |
CN112613391A (zh) * | 2020-12-18 | 2021-04-06 | 湖北工业大学 | 一种基于反向学习二进制水稻育种算法的高光谱图像波段选择方法 |
-
2022
- 2022-07-22 CN CN202210867437.XA patent/CN115114838B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103913432A (zh) * | 2014-03-25 | 2014-07-09 | 西安交通大学 | 基于粒子群算法的近红外光谱波长选择方法 |
WO2018060967A1 (en) * | 2016-09-29 | 2018-04-05 | Inesc Tec - Instituto De Engenharia De Sistemas E Computadores, Tecnologia E Ciência | Big data self-learning methodology for the accurate quantification and classification of spectral information under complex varlability and multi-scale interference |
CN111007040A (zh) * | 2019-12-27 | 2020-04-14 | 黑龙江八一农垦大学 | 大米食味品质近红外光谱快速评价方法 |
CN111898237A (zh) * | 2020-06-01 | 2020-11-06 | 哈尔滨工业大学 | 材料多热物性参数反演测量用并行模拟退火快速优化方法 |
CN112613391A (zh) * | 2020-12-18 | 2021-04-06 | 湖北工业大学 | 一种基于反向学习二进制水稻育种算法的高光谱图像波段选择方法 |
Non-Patent Citations (3)
Title |
---|
CHANGHAO BAO 等: "Rapid detection of talc content in flour based on near-infrared spectroscopy combined with feature wavelength selection", 《APPLIED OPTICS》 * |
JINMING LIU 等: "Rapid detection of carbon-nitrogen ratio for anaerobic fermentation feedstocks using near-infrared spectroscopy combined with BiPLS and GSA", 《APPLIED OPTICS》 * |
刘金明 等: "玉米秸秆纤维素和半纤维素NIRS特征波长优选", 《光谱学与光谱分析》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115639160A (zh) * | 2022-12-23 | 2023-01-24 | 东北农业大学 | 一种无人值守的沼液指标在线同步速测装置及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115114838B (zh) | 2023-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102323906B (zh) | 一种基于遗传算法的mc/dc测试数据自动生成方法 | |
CN110083125B (zh) | 一种基于深度学习的机床热误差建模方法 | |
CN105243255A (zh) | 一种软基处理方案的评价方法 | |
CN113987033B (zh) | 主变在线监测数据群体偏差识别与校准方法 | |
CN115114838B (zh) | 基于粒子群算法思想和模拟退火策略的光谱特征波长选择方法 | |
CN103488561B (zh) | 一种在线升级主样本模型的kNN故障检测方法 | |
CN110598929B (zh) | 一种风电功率非参数概率区间超短期预测方法 | |
CN112749840B (zh) | 一种火电机组能效特征指标基准值的获取方法 | |
CN106779384B (zh) | 一种基于信息粒度最优分配的钢铁工业高炉煤气长期区间预测方法 | |
CN114169434A (zh) | 一种负荷预测方法 | |
CN114254915B (zh) | 轴类零件全流程加工质量合格状态决策及优化方法 | |
US10553304B2 (en) | Method and apparatus for reducing chemical reaction mechanisms | |
CN109754122A (zh) | 一种基于随机森林特征提取的bp神经网络的数值预测方法 | |
CN103969412B (zh) | 一种基于群决策案例推理的溶解氧浓度软测量方法 | |
WO2015145978A1 (ja) | エネルギー量推定装置、エネルギー量推定方法、及び、記録媒体 | |
CN109940458A (zh) | 一种刀具未来磨损量在线预测方法 | |
CN116578551A (zh) | 一种基于gru-gan的电网数据修复方法 | |
CN116307149A (zh) | 基于注意力LSTM和KbNSGA的高炉性能优化方法 | |
CN113206756B (zh) | 基于组合模型的网络流量预测方法 | |
CN110851959A (zh) | 一种融合深度学习和分位数回归的风速区间预测方法 | |
CN117933497A (zh) | 一种基于tsa-arima-cnn的企业碳排放预测方法 | |
CN114595624A (zh) | 基于XGBoost算法的伴热带装置寿命状态预测方法 | |
CN117494428A (zh) | 一种改进ABC-Kriging的机械系统可靠性优化设计方法 | |
CN117007974A (zh) | 一种基于模型融合的固态电池soc估计方法 | |
CN113343589B (zh) | 一种基于遗传-随机常数的基因表达式编程的酸性天然气水合物生成条件预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |