CN116429721B - 一种基于mpa框架的松子近红外光谱波段选择方法 - Google Patents
一种基于mpa框架的松子近红外光谱波段选择方法 Download PDFInfo
- Publication number
- CN116429721B CN116429721B CN202310248730.2A CN202310248730A CN116429721B CN 116429721 B CN116429721 B CN 116429721B CN 202310248730 A CN202310248730 A CN 202310248730A CN 116429721 B CN116429721 B CN 116429721B
- Authority
- CN
- China
- Prior art keywords
- vector
- sampling
- band
- near infrared
- bald
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 235000008331 Pinus X rigitaeda Nutrition 0.000 title claims abstract description 29
- 235000011613 Pinus brutia Nutrition 0.000 title claims abstract description 29
- 241000018646 Pinus brutia Species 0.000 title claims abstract description 29
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 28
- 238000010187 selection method Methods 0.000 title claims abstract description 7
- 239000013598 vector Substances 0.000 claims abstract description 76
- 238000005070 sampling Methods 0.000 claims abstract description 65
- 238000000034 method Methods 0.000 claims abstract description 37
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 25
- 238000005457 optimization Methods 0.000 claims abstract description 12
- 238000001228 spectrum Methods 0.000 claims abstract description 12
- 238000011156 evaluation Methods 0.000 claims abstract description 10
- 238000012216 screening Methods 0.000 claims abstract description 6
- 241000511338 Haliaeetus leucocephalus Species 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 17
- 239000011159 matrix material Substances 0.000 claims description 8
- 230000009189 diving Effects 0.000 claims description 6
- 230000003595 spectral effect Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000012546 transfer Methods 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 3
- 101100083446 Danio rerio plekhh1 gene Proteins 0.000 claims description 2
- 230000008859 change Effects 0.000 claims description 2
- 238000013178 mathematical model Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims 1
- 238000012614 Monte-Carlo sampling Methods 0.000 abstract description 8
- 230000008030 elimination Effects 0.000 abstract description 8
- 238000003379 elimination reaction Methods 0.000 abstract description 8
- 230000008685 targeting Effects 0.000 abstract description 5
- 238000010845 search algorithm Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 16
- 238000001514 detection method Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000007621 cluster analysis Methods 0.000 description 3
- 238000010238 partial least squares regression Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000009659 non-destructive testing Methods 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000002834 transmittance Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Theoretical Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
一种基于MPA框架的松子近红外光谱波段选择方法,它属于光谱波段选择技术领域。本发明解决了蒙特卡洛采样优化的无信息变量消除算法存在的目标性弱、迭代次数多、算法时间复杂度高,以及当输入为共线性高的松子样本光谱数据时无法根据稳定性输出进行波段选择的问题。首先,本发明采用秃鹰搜索算法对二进制采样向量进行优化处理即可进行波段选择,因此本发明方法的目标性较强;其次,本发明在达到设置的最大迭代次数时就可以停止迭代,即通过较少的迭代次数就可以实现目的,算法时间复杂度低。而且,本发明通过引入方差膨胀系数建立了一个新的波段筛选评价指标来进行波段选择。本发明方法可以应用于对松子近红外光谱波段进行选择。
Description
技术领域
本发明属于光谱波段选择技术领域,具体涉及一种基于MPA框架的松子近红外光谱波段选择方法。
背景技术
由于松子中包含着多种营养素,因此近年来越来越得到研究人员的关注。近红外光谱技术作为一种无损检测技术手段已经被应用于松子的研究方面,这种技术利用被测物在近红外波段范围内的一系列漫反射率、吸光度、透射率,利用被测物的理化性质、物质含量等信息,并结合化学计量学进行非侵入式检测。目前,因其检测结果快速准确的优势,已经被广泛应用于农业、材料与食品等领域,逐渐取代传统检测手段。随着统计机器学习、数据科学领域的发展,近红外光谱检测模型研究也向着更加成熟、稳健且智能的方向发展。
模型集群分析(Model population analysis,MPA)有别于传统机器学习建模一次性将全部训练集数据训练完毕的固有模式,为了多角度获取建模数据集蕴含的样本理化性质,以期将样本数据集的信息利用率达到最高,以随机采样的方式为核心,目的是获取多个子数据集,为每一个独立的子数据集分别建立一个子模型,针对所有的集群子模型进行全面的参数输出,并对选取的重要参数进行统计分析,进而获取更加有价值的信息。
目前,常见的模型集群分析算法有蒙特卡洛采样(Monte Carlo sampling)优化的无信息变量消除算法,竞争性自适应重加权算法(CARS)以及变量组合总体分析(Variablecombination population analysis,VCPA)等算法。其中,蒙特卡洛采样(Monte Carlosampling)优化的无信息变量消除算法,广泛应用于近红外光谱的特征选择中。蒙特卡洛采样是一种无放回的采样方式,具有随机性强的特点,从训练集中随机选取一定占比的样本数据构成子训练集,其余的样本数据为独立测试集。特征数据最终是否被选择取决于稳定性公式计算输出的结果,这一重要参数是由光谱数据相关系数矩阵平均值与标准差的比值得出。蒙特卡洛采样实现了多角度随机优化特征数据,但算法存在目标性较弱迭代次数多,算法时间复杂度高的问题。另外,当输入为共线性较高的松子样本光谱数据时,无信息变量消除算法无法凭借较高的均值和标准差得到的稳定性输出来判断此波段是否予以保留。
发明内容
本发明的目的是为解决蒙特卡洛采样优化的无信息变量消除算法存在的目标性弱、迭代次数多、算法时间复杂度高,以及当输入为共线性高的松子样本光谱数据时无法根据稳定性输出进行波段选择的问题,而提出了一种基于MPA框架的松子近红外光谱波段选择方法。
本发明为解决上述技术问题所采取的技术方案是:
一种基于MPA框架的松子近红外光谱波段选择方法,所述方法具体包括以下步骤:
步骤一、根据长度为N×Q的松子近红外光谱Xnir生成M个采样向量,将生成的M个采样向量表示为P1,P2,…,PM;
步骤二、将每个采样向量分别作为秃鹰搜索算法的一只秃鹰,通过引入方差膨胀系数对采样向量和偏最小二乘回归模型的目标函数进行优化,得到优化后的采样向量所对应的目标函数值;
步骤三、根据步骤二中得到的目标函数值确定最佳搜寻位置,再利用最佳搜寻位置对优化后的采样向量进行处理,得到处理结果;
步骤四、秃鹰在局部搜索空间内根据螺旋形状以不同的方向移动,采用极坐标方程对步骤三的处理结果进行更新,获得更新后的结果,即搜索出最佳采样向量;
步骤五、秃鹰从搜索空间的最佳采样向量位置俯冲飞向目标位置,搜索结束后得到秃鹰的空间位置;
步骤六、将步骤五中得到的秃鹰空间位置重新作为采样向量,并返回步骤二;
步骤七、重复迭代步骤二至步骤六的过程,直至达到设置的最大迭代次数时停止迭代,根据最后一次迭代所获得的M个秃鹰空间位置分别建立偏最小二乘回归模型,即建立M个偏最小二乘回归模型,再根据具有最大目标函数值的偏最小二乘回归模型所对应的秃鹰空间位置进行波段选择。
本发明的有益效果是:
本发明采用二进制采样和秃鹰搜索算法替代蒙特卡洛随机采样,通过对采样向量进行优化处理即可进行波段选择,因此,本发明方法的目标性强。而且,本发明方法在达到设置的最大迭代次数时就可以停止迭代,所以,通过较少的迭代次数就可以实现目的,算法时间复杂度低。通过引入方差膨胀系数建立一个新的波段筛选评价指标,以对无信息变量消除算法提出的稳定性判别标准进行优化,解决了当输入为共线性高的松子样本光谱数据时,无信息变量消除算法无法根据稳定性输出进行波段选择的问题,当输入为共线性高的松子样本光谱数据时,本发明方法仍然可以进行波段选择。
附图说明
图1是本发明方法的流程图;
图2是原始的松子近红外光谱图;
图3是进行波段选择后的松子近红外光谱图。
具体实施方式
具体实施方式一、结合图1说明本实施方式。本实施方式所述的一种基于MPA框架的松子近红外光谱波段选择方法,所述方法具体包括以下步骤:
步骤一、根据长度为N×Q的松子近红外光谱Xnir生成M个采样向量,将生成的M个采样向量表示为P1,P2,…,PM;
步骤二、将每个采样向量分别作为秃鹰搜索算法的一只秃鹰,通过引入方差膨胀系数对采样向量和偏最小二乘回归模型的目标函数进行优化,得到优化后的采样向量所对应的目标函数值;
步骤三、根据步骤二中得到的目标函数值确定最佳搜寻位置,再利用最佳搜寻位置对优化后的采样向量进行处理,得到处理结果;
步骤四、秃鹰在局部搜索空间内根据螺旋形状以不同的方向移动,采用极坐标方程对步骤三的处理结果进行更新,获得更新后的结果,即搜索出最佳采样向量;
步骤五、秃鹰从搜索空间的最佳采样向量位置快速俯冲飞向目标位置,搜索结束后得到秃鹰的空间位置;
步骤六、将步骤五中得到的秃鹰空间位置重新作为采样向量,并返回步骤二;
步骤七、重复迭代步骤二至步骤六的过程,直至达到设置的最大迭代次数时停止迭代,根据最后一次迭代所获得的M个秃鹰空间位置分别建立偏最小二乘回归模型,即建立M个偏最小二乘回归模型,再根据具有最大目标函数值的偏最小二乘回归模型所对应的秃鹰空间位置进行波段选择。
二进制采样是一种新型的模型集群采样方法,基于生成的二进制矩阵,行与列分别为采样次数和对应光谱数据变量,矩阵只由0,1两种元素组成,0表示该变量被选中,1为未被选中。对每列选中数目的比例进行统一设置,随后每一列自行乱序,根据每行有1的位置选取变量,由于每列1的占比不变,即数目一定,故二进制采样在根据每行元素进行变量提取时,每个变量拥有相同的被选机率。
秃鹰搜索(bald eagle search,BES)优化算法是一种新型元启发式算法,该算法具有较强的全局搜索能力,能够有效解决各类复杂数值优化问题。作为定性定量分析检测的重要依据,被测物的光谱数据质量与维数随近红外光谱采集设备的不断更新换代不断提高,庞大的信息量可以将被测物质的信息近乎完整呈现,但高维数势必造成维数灾难,数据蕴含信息量过大反而容易造成所建立的预测模型出现过拟合现象。BES算法以秃鹰捕食猎物的行为进行模拟,将其分为选择搜索空间、搜索空间猎物和俯冲捕获猎物3个阶段。在特征选择过程中将某种评价准则作为依据,从原始特征空间中选择特征子集,剔除不相关特征、大幅缩短运行时间,并且提升数据挖掘能力。
由于本发明根据最后一次迭代所获得的M个秃鹰空间位置分别建立偏最小二乘回归模型,因此,本发明是基于模型集群分析(Model population analysis,MPA)框架的。步骤二中将每个采样向量分别作为秃鹰搜索算法的一只秃鹰,即采样向量就代表秃鹰的位置,后续优化、处理、更新采样向量是对秃鹰位置的优化、处理、更新。
采用本发明的方法对图2所示的原始松子近红外光谱图进行处理后,得到如图3所示的处理结果图。
具体实施方式二:本实施方式与具体实施方式一不同的是,所述采样向量为元素中仅包含1和0,且维度为Q的二进制向量。
数字“1”代表选择建模的光谱变量,而数字“0”代表未被选择的光谱变量。
其它步骤及参数与具体实施方式一相同。
具体实施方式三:本实施方式与具体实施方式一或二不同的是,所述步骤二的具体过程为:
步骤二一、设为基于采样向量Pi的矩阵算子,则利用筛选后的光谱特征向量Xselection为:
其中,i=1,2,…,M,代表利用矩阵算子对近红外光谱Xnir进行采样;矩阵算子执行的操作为:当向量Pi的第k个元素为1时,近红外光谱Xnir的第k个波段被筛选到光谱子集Xselection中;
步骤二二、利用光谱特征向量Xselection建立偏最小二乘回归(Partial leastsquares regression,PLS)模型,得到回归系数向量b;则Xselection的第j个波段的评价指标Jj为:
Jj=|bj|+VIFj
其中,bj为回归系数向量b中的第j个回归系数,|·|代表取绝对值,VIFj为第j个波段的方差膨胀系数;
其中,为Xselection的第j个波段的复测定系数;
步骤二三、从Xselection中筛选出评价指标最大的n个波段,根据筛选出的n个波段为采样向量Pi赋值(即,将筛选出的波段在采样向量中对应的位置赋值为1,将未被筛选出的波段在采样向量中对应的位置赋值为0),赋值后即获得优化后的采样向量
将筛选出的n个波段的评价指标依次表示为Jmax1、Jmax2…Jmaxn,则优化后的采样向量对应的目标函数值F为:
F=Jmax1+Jmax2+...+Jmaxn
其它步骤及参数与具体实施方式一或二相同。
分别对每只秃鹰进行本实施方式的处理,得到每只秃鹰对应的目标函数值与每只秃鹰的方位(即得到M个采样向量)。
本实施方式通过引入方差膨胀系数建立新的波段筛选评价指标,这样当输入为共线性高的松子样本光谱数据时,本发明方法仍然可以进行波段选择,克服了传统无信息变量消除算法利用稳定性判别指标无法进行波段选择的问题。
具体实施方式四:本实施方式与具体实施方式一至三之一不同的是,所述步骤三的具体过程为:
将目标函数值最大的秃鹰所对应的位置作为最佳搜寻位置Pbest,则对优化后的采样向量的处理结果为:
其中,Pi,new为优化后的第i个采样向量的处理结果,α为控制位置变化参数,r为(0,1)间随机数,Pmean为优化后的M个采样向量的平均结果,bin(·)是转换函数。
其它步骤及参数与具体实施方式一至三之一相同。
具体实施方式五:本实施方式与具体实施方式一至四之一不同的是,所述参数α的取值范围为(0.1,0.3)。
其它步骤及参数与具体实施方式一至四之一相同。
具体实施方式六:本实施方式与具体实施方式一至五之一不同的是,所述转换函数bin(·)为:
其中,trans是转换函数的自变量,V(trans)为S型传递函数;
其中,e是自然对数的底数。
因为秃鹰搜索算法无法直接应用于二进制向量空间,因此,本发明提出一种秃鹰算法的二值化改进方法,转换函数bin(·)能够接收经过归一化的实数值与实数向量作为输入,将其转化为二元数值或向量。
其它步骤及参数与具体实施方式一至五之一相同。
具体实施方式七:本实施方式与具体实施方式一至六之一不同的是,所述步骤四的具体过程为:
步骤四一、在局部搜索空间内建立螺旋飞行数学模型,搜索局部最优解;
θ(i)=a·π·rand
r(i)=θ(i)+R·rand
xr(i)=r(i)·sin(θ(i)),yr(i)=r(i)·cos(θ(i))
x(i)=xr(i)/max(|xr(i)|),y(i)=yr(i)/max(|yr(i)|)
其中,θ(i)为螺旋方程的极角,r(i)为螺旋方程的极径,a和R为控制螺旋轨迹的参数,a的变化范围为(0,5),R的变化范围为(0.1,1),rand为(0,1)内随机数,x(i)和y(i)为极坐标中秃鹰位置,x(i)和y(i)的取值范围均为(-1,1);
步骤四二、采用极坐标方程进行采样向量Pi,new的更新:
其中,P′i,new代表对采样向量Pi,new进行更新得到的向量,Pi *为第i只秃鹰按照螺旋方程行进时下一次更新位置。
其它步骤及参数与具体实施方式一至六之一相同。
具体实施方式八:本实施方式与具体实施方式一至七之一不同的是,所述步骤五的具体过程为:
步骤五一、使用极坐标方程描述秃鹰俯冲时的运动状态:
r1(i)=θ(i)
x1r1(i)=r1(i)·sinh(θ(i))
y1r1(i)=r1(i)·cosh(θ(i))
x1(i)=x1r1(i)/max(|x1r1(i)|),y1(i)=y1r1(i)/max(|y1r1(i)|)
步骤五二、秃鹰以步骤五一的运动状态从搜索空间的最佳采样向量位置开始俯冲飞向目标位置。
其它步骤及参数与具体实施方式一至七之一相同。
具体实施方式九:本实施方式与具体实施方式一至八之一不同的是,所述步骤五二的具体过程为:
俯冲过程中第i只秃鹰的位置更新公式为:
P″i,new=bin(rand·P′best+δx+δy)
其中:P″i,new是搜索结束得到的秃鹰空间位置,P′best代表步骤四更新结果中的最佳搜寻位置,P′mean代表步骤四更新结果的平均位置,c1为秃鹰向位置P′best的运动强度,c2为秃鹰向位置P″ean的运动强度,c1和c2的取值范围均为(0,1)。
其它步骤及参数与具体实施方式一至八之一相同。
具体实施方式十:本实施方式与具体实施方式一至九之一不同的是,所述第j个波段的复测定系数的计算方式为:
其中,Xj,selection为Xselection的第j个波段,为Xselection中第j个波段对其他波段的回归,为第j个波段的均值。
其它步骤及参数与具体实施方式一至九之一相同。
本发明的上述算例仅为详细地说明本发明的计算模型和计算流程,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。
Claims (7)
1.一种基于MPA框架的松子近红外光谱波段选择方法,其特征在于,所述方法具体包括以下步骤:
步骤一、根据长度为N×Q的松子近红外光谱Xnir生成M个采样向量,将生成的M个采样向量表示为P1,P2,…,PM;
步骤二、将每个采样向量分别作为秃鹰搜索算法的一只秃鹰,通过引入方差膨胀系数对采样向量和偏最小二乘回归模型的目标函数进行优化,得到优化后的采样向量所对应的目标函数值;
所述步骤二的具体过程为:
步骤二一、设为基于采样向量Pi的矩阵算子,则利用筛选后的光谱特征向量Xselection为:
其中,i=1,2,…,M,代表利用矩阵算子对近红外光谱Xnir进行采样;
步骤二二、利用光谱特征向量Xselection建立偏最小二乘回归模型,得到回归系数向量b;则Xselection的第j个波段的评价指标Jj为:
Jj=|bj|+VIFj
其中,bj为回归系数向量b中的第j个回归系数,|·|代表取绝对值,VIFj为第j个波段的方差膨胀系数;
其中,为Xselection的第j个波段的复测定系数;
其中,Xj,selection为Xselection的第j个波段,为Xselection中第j个波段对其他波段的回归,为第j个波段的均值;
步骤二三、从Xselection中筛选出评价指标最大的n个波段,根据筛选出的n个波段为采样向量Pi赋值,赋值后即获得优化后的采样向量
将筛选出的n个波段的评价指标依次表示为Jmax1、Jmax2…Jmaxn,则优化后的采样向量对应的目标函数值F为:
F=Jmax1+Jmax2+...+Jmaxn
步骤三、根据步骤二中得到的目标函数值确定最佳搜寻位置,再利用最佳搜寻位置对优化后的采样向量进行处理,得到处理结果;
步骤四、秃鹰在局部搜索空间内根据螺旋形状以不同的方向移动,采用极坐标方程对步骤三的处理结果进行更新,获得更新后的结果,即搜索出最佳采样向量;
所述步骤四的具体过程为:
步骤四一、在局部搜索空间内建立螺旋飞行数学模型,搜索局部最优解;
θ(i)=a·π·rand
r(i)=θ(i)+R·rand
xr(i)=r(i)·sin(θ(i)),yr(i)=r(i)·cos(θ(i))
x(i)=xr(i)/max(xr(i)),y(i)=yr(i)/max(yr(i))
其中,θ(i)为螺旋方程的极角,r(i)为螺旋方程的极径,a和R为控制螺旋轨迹的参数,a的变化范围为(0,5),R的变化范围为(0.1,1),rand为(0,1)内随机数,x(i)和y(i)为极坐标中秃鹰位置,x(i)和y(i)的取值范围均为(-1,1);
步骤四二、采用极坐标方程进行采样向量Pi,new的更新:
其中,Pi,′new代表对采样向量Pi,new进行更新得到的向量,Pi *为第i只秃鹰按照螺旋方程行进时下一次更新位置,bin(·)是转换函数,Pi,new为优化后的第i个采样向量的处理结果,Pmean为优化后的M个采样向量的平均结果;
步骤五、秃鹰从搜索空间的最佳采样向量位置俯冲飞向目标位置,搜索结束后得到秃鹰的空间位置;
步骤六、将步骤五中得到的秃鹰空间位置重新作为采样向量,并返回步骤二;
步骤七、重复迭代步骤二至步骤六的过程,直至达到设置的最大迭代次数时停止迭代,根据最后一次迭代所获得的M个秃鹰空间位置分别建立偏最小二乘回归模型,即建立M个偏最小二乘回归模型,再根据具有最大目标函数值的偏最小二乘回归模型所对应的秃鹰空间位置进行波段选择。
2.根据权利要求1所述的一种基于MPA框架的松子近红外光谱波段选择方法,其特征在于,所述采样向量为元素中仅包含1和0,且维度为Q的二进制向量。
3.根据权利要求2所述的一种基于MPA框架的松子近红外光谱波段选择方法,其特征在于,所述步骤三的具体过程为:
将目标函数值最大的秃鹰所对应的位置作为最佳搜寻位置Pbest,则对优化后的采样向量的处理结果为:
其中,Pi,new为优化后的第i个采样向量的处理结果,α为控制位置变化参数,r为(0,1)间随机数,Pmean为优化后的M个采样向量的平均结果,bin(·)是转换函数。
4.根据权利要求3所述的一种基于MPA框架的松子近红外光谱波段选择方法,其特征在于,所述参数α的取值范围为(0.1,0.3)。
5.根据权利要求4所述的一种基于MPA框架的松子近红外光谱波段选择方法,其特征在于,所述转换函数bin(·)为:
其中,trans是转换函数的自变量,V(trans)为S型传递函数;
其中,e是自然对数的底数。
6.根据权利要求5所述的一种基于MPA框架的松子近红外光谱波段选择方法,其特征在于,所述步骤五的具体过程为:
步骤五一、使用极坐标方程描述秃鹰俯冲时的运动状态:
r1(i)=θ(i)
x1r1(i)=r1(i)·sinh(θ(i))
y1r1(i)=r1(i)·cosh(θ(i))
x1(i)=x1r1(i)/max(x1r1(i)),y1(i)=y1r1(i)/max(y1r1(i))
步骤五二、秃鹰以步骤五一的运动状态从搜索空间的最佳采样向量位置开始俯冲飞向目标位置。
7.根据权利要求6所述的一种基于MPA框架的松子近红外光谱波段选择方法,其特征在于,所述步骤五二的具体过程为:
俯冲过程中第i只秃鹰的位置更新公式为:
Pi,″new=bin(rand·Pb′est+δx+δy)
其中:Pi,″new是搜索结束得到的秃鹰空间位置,Pb′est代表步骤四更新结果中的最佳搜寻位置,Pm′ean代表步骤四更新结果的平均位置,c1为秃鹰向位置Pb′est的运动强度,c2为秃鹰向位置Pm′ean的运动强度,c1和c2的取值范围均为(0,1)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310248730.2A CN116429721B (zh) | 2023-03-15 | 2023-03-15 | 一种基于mpa框架的松子近红外光谱波段选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310248730.2A CN116429721B (zh) | 2023-03-15 | 2023-03-15 | 一种基于mpa框架的松子近红外光谱波段选择方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116429721A CN116429721A (zh) | 2023-07-14 |
CN116429721B true CN116429721B (zh) | 2024-08-23 |
Family
ID=87084615
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310248730.2A Active CN116429721B (zh) | 2023-03-15 | 2023-03-15 | 一种基于mpa框架的松子近红外光谱波段选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116429721B (zh) |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8095329B2 (en) * | 2002-02-19 | 2012-01-10 | Mark Howard L | Testing linearity of methods of chemical analysis with various statistical tests |
US9818193B2 (en) * | 2012-01-30 | 2017-11-14 | Scanadu, Inc. | Spatial resolution enhancement in hyperspectral imaging |
US10712326B2 (en) * | 2016-11-26 | 2020-07-14 | The Regents Of The University Of California | Nondestructive method of identifying concealed damage in nuts |
CN106596465A (zh) * | 2017-03-03 | 2017-04-26 | 东北农业大学 | 一种近红外光谱分析中的异常样本识别方法 |
CN108896492B (zh) * | 2018-08-07 | 2020-12-29 | 华南农业大学 | Pso-bp神经网络模型的训练方法、存储介质及终端 |
US20210311011A1 (en) * | 2018-10-30 | 2021-10-07 | Teakorigin Inc. | Techniques for scoring food specimens, and related methods and apparatus |
CN111578690B (zh) * | 2020-04-26 | 2020-12-18 | 东北林业大学 | 基于隐马尔科夫模型与粒子群优化的木材含水率控制方法 |
CN111795944B (zh) * | 2020-06-30 | 2021-06-25 | 江南大学 | 一种改进团队进步算法的近红外光谱波长筛选方法 |
CN112002377B (zh) * | 2020-08-24 | 2021-04-27 | 东北林业大学 | 基于集成学习校准模型的松子蛋白质含量预测方法 |
CN113241780B (zh) * | 2021-06-11 | 2023-01-20 | 云南电网有限责任公司电力科学研究院 | 一种基于秃鹰搜索算法的电网二次调频控制方法与系统 |
CN113360854B (zh) * | 2021-08-10 | 2021-11-05 | 中国人民解放军国防科技大学 | 基于自适应协方差膨胀的资料同化方法 |
CN114173359B (zh) * | 2021-12-09 | 2023-07-14 | 重庆邮电大学 | 一种用于工业物联网环境下的异构网络资源调度方法 |
CN114861531B (zh) * | 2022-04-25 | 2024-06-21 | 湖北工业大学 | 针对用户重复购买预测的模型参数优化方法及设备 |
CN115603398A (zh) * | 2022-05-11 | 2023-01-13 | 新源智储能源发展(北京)有限公司(Cn) | 一种基于秃鹰搜索算法的容量不一致储能阵列重构方法 |
-
2023
- 2023-03-15 CN CN202310248730.2A patent/CN116429721B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN116429721A (zh) | 2023-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kukreja et al. | A Deep Neural Network based disease detection scheme for Citrus fruits | |
CN109493287B (zh) | 一种基于深度学习的定量光谱数据分析处理方法 | |
Alajas et al. | Prediction of grape leaf black rot damaged surface percentage using hybrid linear discriminant analysis and decision tree | |
CN111855591A (zh) | 水稻地上部碳氮比遥感反演模型和方法 | |
CN109299501A (zh) | 一种基于工作流的振动光谱分析模型优化方法 | |
CN111855593A (zh) | 水稻叶片淀粉含量遥感反演模型和方法 | |
Zheng et al. | Effective band selection of hyperspectral image by an attention mechanism-based convolutional network | |
CN110826552A (zh) | 基于深度学习的葡萄无损自动检测装置及其方法 | |
Kalim et al. | Citrus leaf disease detection using hybrid cnn-rf model | |
Jiang et al. | Quantitative analysis of aflatoxin B1 in moldy peanuts based on near-infrared spectra with two-dimensional convolutional neural network | |
CN118298301A (zh) | 基于差分进化和多尺度神经网络的湖泊叶绿素反演方法 | |
Yang et al. | Classification of sugar beets based on hyperspectral and extreme learning machine methods | |
CN116429721B (zh) | 一种基于mpa框架的松子近红外光谱波段选择方法 | |
Sun et al. | Discrimination of maturity of Camellia oleifera fruit on-site based on generative adversarial network and hyperspectral imaging technique | |
Gerdan et al. | Diagnosis of tomato plant diseases using pre-trained architectures and a proposed convolutional neural network model | |
Yang et al. | A quality detection method of corn based on spectral technology and deep learning model | |
Suwarningsih et al. | Ide-cabe: chili varieties identification and classification system based leaf | |
Song et al. | Apple disease recognition based on small-scale data sets | |
CN112069911A (zh) | 一种多光谱图像信息和tlmd-woa-sift的果蔬品质检测方法 | |
CN114062306B (zh) | 一种近红外光谱数据分段预处理方法 | |
Gao et al. | Study on deep learning model for online estimation of chlorophyll content based on near ground multispectral feature bands | |
Kai et al. | Bayberry maturity estimation algorithm based on multi-feature fusion | |
CN110658156B (zh) | 一种近红外光谱特征提取方法及装置 | |
CN113761790A (zh) | 一种基于Stacking集成学习的果树叶片氮含量估算方法 | |
He et al. | Pyramid feature fusion through shifted window self-attention for tobacco leaf classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |