CN116429721A - 一种基于mpa框架的松子近红外光谱波段选择方法 - Google Patents

一种基于mpa框架的松子近红外光谱波段选择方法 Download PDF

Info

Publication number
CN116429721A
CN116429721A CN202310248730.2A CN202310248730A CN116429721A CN 116429721 A CN116429721 A CN 116429721A CN 202310248730 A CN202310248730 A CN 202310248730A CN 116429721 A CN116429721 A CN 116429721A
Authority
CN
China
Prior art keywords
near infrared
vector
band
infrared spectrum
sampling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310248730.2A
Other languages
English (en)
Other versions
CN116429721B (zh
Inventor
李鸿博
蒋大鹏
庄煜
魏东辉
董婉婧
潘屾
葛奕麟
张子芳
陈泽瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeast Agricultural University
Original Assignee
Northeast Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeast Agricultural University filed Critical Northeast Agricultural University
Priority to CN202310248730.2A priority Critical patent/CN116429721B/zh
Publication of CN116429721A publication Critical patent/CN116429721A/zh
Application granted granted Critical
Publication of CN116429721B publication Critical patent/CN116429721B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3563Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

一种基于MPA框架的松子近红外光谱波段选择方法,它属于光谱波段选择技术领域。本发明解决了蒙特卡洛采样优化的无信息变量消除算法存在的目标性弱、迭代次数多、算法时间复杂度高,以及当输入为共线性高的松子样本光谱数据时无法根据稳定性输出进行波段选择的问题。首先,本发明采用秃鹰搜索算法对二进制采样向量进行优化处理即可进行波段选择,因此本发明方法的目标性较强;其次,本发明在达到设置的最大迭代次数时就可以停止迭代,即通过较少的迭代次数就可以实现目的,算法时间复杂度低。而且,本发明通过引入方差膨胀系数建立了一个新的波段筛选评价指标来进行波段选择。本发明方法可以应用于对松子近红外光谱波段进行选择。

Description

一种基于MPA框架的松子近红外光谱波段选择方法
技术领域
本发明属于光谱波段选择技术领域,具体涉及一种基于MPA框架的松子近红外光谱波段选择方法。
背景技术
由于松子中包含着多种营养素,因此近年来越来越得到研究人员的关注。近红外光谱技术作为一种无损检测技术手段已经被应用于松子的研究方面,这种技术利用被测物在近红外波段范围内的一系列漫反射率、吸光度、透射率,利用被测物的理化性质、物质含量等信息,并结合化学计量学进行非侵入式检测。目前,因其检测结果快速准确的优势,已经被广泛应用于农业、材料与食品等领域,逐渐取代传统检测手段。随着统计机器学习、数据科学领域的发展,近红外光谱检测模型研究也向着更加成熟、稳健且智能的方向发展。
模型集群分析(Model population analysis,MPA)有别于传统机器学习建模一次性将全部训练集数据训练完毕的固有模式,为了多角度获取建模数据集蕴含的样本理化性质,以期将样本数据集的信息利用率达到最高,以随机采样的方式为核心,目的是获取多个子数据集,为每一个独立的子数据集分别建立一个子模型,针对所有的集群子模型进行全面的参数输出,并对选取的重要参数进行统计分析,进而获取更加有价值的信息。
目前,常见的模型集群分析算法有蒙特卡洛采样(Monte Carlo sampling)优化的无信息变量消除算法,竞争性自适应重加权算法(CARS)以及变量组合总体分析(Variablecombination population analysis,VCPA)等算法。其中,蒙特卡洛采样(Monte Carlosampling)优化的无信息变量消除算法,广泛应用于近红外光谱的特征选择中。蒙特卡洛采样是一种无放回的采样方式,具有随机性强的特点,从训练集中随机选取一定占比的样本数据构成子训练集,其余的样本数据为独立测试集。特征数据最终是否被选择取决于稳定性公式计算输出的结果,这一重要参数是由光谱数据相关系数矩阵平均值与标准差的比值得出。蒙特卡洛采样实现了多角度随机优化特征数据,但算法存在目标性较弱迭代次数多,算法时间复杂度高的问题。另外,当输入为共线性较高的松子样本光谱数据时,无信息变量消除算法无法凭借较高的均值和标准差得到的稳定性输出来判断此波段是否予以保留。
发明内容
本发明的目的是为解决蒙特卡洛采样优化的无信息变量消除算法存在的目标性弱、迭代次数多、算法时间复杂度高,以及当输入为共线性高的松子样本光谱数据时无法根据稳定性输出进行波段选择的问题,而提出了一种基于MPA框架的松子近红外光谱波段选择方法。
本发明为解决上述技术问题所采取的技术方案是:
一种基于MPA框架的松子近红外光谱波段选择方法,所述方法具体包括以下步骤:
步骤一、根据长度为N×Q的松子近红外光谱Xnir生成M个采样向量,将生成的M个采样向量表示为P1,P2,…,PM
步骤二、将每个采样向量分别作为秃鹰搜索算法的一只秃鹰,通过引入方差膨胀系数对采样向量和偏最小二乘回归模型的目标函数进行优化,得到优化后的采样向量所对应的目标函数值;
步骤三、根据步骤二中得到的目标函数值确定最佳搜寻位置,再利用最佳搜寻位置对优化后的采样向量进行处理,得到处理结果;
步骤四、秃鹰在局部搜索空间内根据螺旋形状以不同的方向移动,采用极坐标方程对步骤三的处理结果进行更新,获得更新后的结果,即搜索出最佳采样向量;
步骤五、秃鹰从搜索空间的最佳采样向量位置俯冲飞向目标位置,搜索结束后得到秃鹰的空间位置;
步骤六、将步骤五中得到的秃鹰空间位置重新作为采样向量,并返回步骤二;
步骤七、重复迭代步骤二至步骤六的过程,直至达到设置的最大迭代次数时停止迭代,根据最后一次迭代所获得的M个秃鹰空间位置分别建立偏最小二乘回归模型,即建立M个偏最小二乘回归模型,再根据具有最大目标函数值的偏最小二乘回归模型所对应的秃鹰空间位置进行波段选择。
本发明的有益效果是:
本发明采用二进制采样和秃鹰搜索算法替代蒙特卡洛随机采样,通过对采样向量进行优化处理即可进行波段选择,因此,本发明方法的目标性强。而且,本发明方法在达到设置的最大迭代次数时就可以停止迭代,所以,通过较少的迭代次数就可以实现目的,算法时间复杂度低。通过引入方差膨胀系数建立一个新的波段筛选评价指标,以对无信息变量消除算法提出的稳定性判别标准进行优化,解决了当输入为共线性高的松子样本光谱数据时,无信息变量消除算法无法根据稳定性输出进行波段选择的问题,当输入为共线性高的松子样本光谱数据时,本发明方法仍然可以进行波段选择。
附图说明
图1是本发明方法的流程图;
图2是原始的松子近红外光谱图;
图3是进行波段选择后的松子近红外光谱图。
具体实施方式
具体实施方式一、结合图1说明本实施方式。本实施方式所述的一种基于MPA框架的松子近红外光谱波段选择方法,所述方法具体包括以下步骤:
步骤一、根据长度为N×Q的松子近红外光谱Xnir生成M个采样向量,将生成的M个采样向量表示为P1,P2,…,PM
步骤二、将每个采样向量分别作为秃鹰搜索算法的一只秃鹰,通过引入方差膨胀系数对采样向量和偏最小二乘回归模型的目标函数进行优化,得到优化后的采样向量所对应的目标函数值;
步骤三、根据步骤二中得到的目标函数值确定最佳搜寻位置,再利用最佳搜寻位置对优化后的采样向量进行处理,得到处理结果;
步骤四、秃鹰在局部搜索空间内根据螺旋形状以不同的方向移动,采用极坐标方程对步骤三的处理结果进行更新,获得更新后的结果,即搜索出最佳采样向量;
步骤五、秃鹰从搜索空间的最佳采样向量位置快速俯冲飞向目标位置,搜索结束后得到秃鹰的空间位置;
步骤六、将步骤五中得到的秃鹰空间位置重新作为采样向量,并返回步骤二;
步骤七、重复迭代步骤二至步骤六的过程,直至达到设置的最大迭代次数时停止迭代,根据最后一次迭代所获得的M个秃鹰空间位置分别建立偏最小二乘回归模型,即建立M个偏最小二乘回归模型,再根据具有最大目标函数值的偏最小二乘回归模型所对应的秃鹰空间位置进行波段选择。
二进制采样是一种新型的模型集群采样方法,基于生成的二进制矩阵,行与列分别为采样次数和对应光谱数据变量,矩阵只由0,1两种元素组成,0表示该变量被选中,1为未被选中。对每列选中数目的比例进行统一设置,随后每一列自行乱序,根据每行有1的位置选取变量,由于每列1的占比不变,即数目一定,故二进制采样在根据每行元素进行变量提取时,每个变量拥有相同的被选机率。
秃鹰搜索(bald eagle search,BES)优化算法是一种新型元启发式算法,该算法具有较强的全局搜索能力,能够有效解决各类复杂数值优化问题。作为定性定量分析检测的重要依据,被测物的光谱数据质量与维数随近红外光谱采集设备的不断更新换代不断提高,庞大的信息量可以将被测物质的信息近乎完整呈现,但高维数势必造成维数灾难,数据蕴含信息量过大反而容易造成所建立的预测模型出现过拟合现象。BES算法以秃鹰捕食猎物的行为进行模拟,将其分为选择搜索空间、搜索空间猎物和俯冲捕获猎物3个阶段。在特征选择过程中将某种评价准则作为依据,从原始特征空间中选择特征子集,剔除不相关特征、大幅缩短运行时间,并且提升数据挖掘能力。
由于本发明根据最后一次迭代所获得的M个秃鹰空间位置分别建立偏最小二乘回归模型,因此,本发明是基于模型集群分析(Model population analysis,MPA)框架的。步骤二中将每个采样向量分别作为秃鹰搜索算法的一只秃鹰,即采样向量就代表秃鹰的位置,后续优化、处理、更新采样向量是对秃鹰位置的优化、处理、更新。
采用本发明的方法对图2所示的原始松子近红外光谱图进行处理后,得到如图3所示的处理结果图。
具体实施方式二:本实施方式与具体实施方式一不同的是,所述采样向量为元素中仅包含1和0,且维度为Q的二进制向量。
数字“1”代表选择建模的光谱变量,而数字“0”代表未被选择的光谱变量。
其它步骤及参数与具体实施方式一相同。
具体实施方式三:本实施方式与具体实施方式一或二不同的是,所述步骤二的具体过程为:
步骤二一、设
Figure BDA0004126954840000041
为基于采样向量Pi的矩阵算子,则利用/>
Figure BDA0004126954840000042
筛选后的光谱特征向量Xselection为:
Figure BDA0004126954840000043
其中,i=1,2,…,M,
Figure BDA0004126954840000044
代表利用矩阵算子/>
Figure BDA0004126954840000045
对近红外光谱Xnir进行采样;矩阵算子/>
Figure BDA0004126954840000046
执行的操作为:当向量Pi的第k个元素为1时,近红外光谱Xnir的第k个波段被筛选到光谱子集Xselection中;
步骤二二、利用光谱特征向量Xselection建立偏最小二乘回归(Partial leastsquares regression,PLS)模型,得到回归系数向量b;则Xselection的第j个波段的评价指标Jj为:
Jj=|bj|+VIFj
其中,bj为回归系数向量b中的第j个回归系数,|·|代表取绝对值,VIFj为第j个波段的方差膨胀系数;
Figure BDA0004126954840000051
其中,
Figure BDA0004126954840000052
为Xselection的第j个波段的复测定系数;
步骤二三、从Xselection中筛选出评价指标最大的n个波段,根据筛选出的n个波段为采样向量Pi赋值(即,将筛选出的波段在采样向量中对应的位置赋值为1,将未被筛选出的波段在采样向量中对应的位置赋值为0),赋值后即获得优化后的采样向量
Figure BDA0004126954840000053
将筛选出的n个波段的评价指标依次表示为Jmax1、Jmax2…Jmaxn,则优化后的采样向量对应的目标函数值F为:
F=Jmax1+Jmax2+...+Jmaxn
其它步骤及参数与具体实施方式一或二相同。
分别对每只秃鹰进行本实施方式的处理,得到每只秃鹰对应的目标函数值与每只秃鹰的方位(即得到M个采样向量
Figure BDA0004126954840000054
)。
本实施方式通过引入方差膨胀系数建立新的波段筛选评价指标,这样当输入为共线性高的松子样本光谱数据时,本发明方法仍然可以进行波段选择,克服了传统无信息变量消除算法利用稳定性判别指标无法进行波段选择的问题。
具体实施方式四:本实施方式与具体实施方式一至三之一不同的是,所述步骤三的具体过程为:
将目标函数值最大的秃鹰所对应的位置作为最佳搜寻位置Pbest,则对优化后的采样向量的处理结果为:
Figure BDA0004126954840000055
其中,Pi,new为优化后的第i个采样向量的处理结果,α为控制位置变化参数,r为(0,1)间随机数,Pmean为优化后的M个采样向量的平均结果,bin(·)是转换函数。
其它步骤及参数与具体实施方式一至三之一相同。
具体实施方式五:本实施方式与具体实施方式一至四之一不同的是,所述参数α的取值范围为(0.1,0.3)。
其它步骤及参数与具体实施方式一至四之一相同。
具体实施方式六:本实施方式与具体实施方式一至五之一不同的是,所述转换函数bin(·)为:
Figure BDA0004126954840000061
其中,trans是转换函数的自变量,V(trans)为S型传递函数;
Figure BDA0004126954840000062
其中,e是自然对数的底数。
因为秃鹰搜索算法无法直接应用于二进制向量空间,因此,本发明提出一种秃鹰算法的二值化改进方法,转换函数bin(·)能够接收经过归一化的实数值与实数向量作为输入,将其转化为二元数值或向量。
其它步骤及参数与具体实施方式一至五之一相同。
具体实施方式七:本实施方式与具体实施方式一至六之一不同的是,所述步骤四的具体过程为:
步骤四一、在局部搜索空间内建立螺旋飞行数学模型,搜索局部最优解;
θ(i)=a·π·rand
r(i)=θ(i)+R·rand
xr(i)=r(i)·sin(θ(i)),yr(i)=r(i)·cos(θ(i))
x(i)=xr(i)/max(|xr(i)|),y(i)=yr(i)/max(|yr(i)|)
其中,θ(i)为螺旋方程的极角,r(i)为螺旋方程的极径,a和R为控制螺旋轨迹的参数,a的变化范围为(0,5),R的变化范围为(0.1,1),rand为(0,1)内随机数,x(i)和y(i)为极坐标中秃鹰位置,x(i)和y(i)的取值范围均为(-1,1);
步骤四二、采用极坐标方程进行采样向量Pi,new的更新:
Figure BDA0004126954840000063
其中,P′i,new代表对采样向量Pi,new进行更新得到的向量,Pi *为第i只秃鹰按照螺旋方程行进时下一次更新位置。
其它步骤及参数与具体实施方式一至六之一相同。
具体实施方式八:本实施方式与具体实施方式一至七之一不同的是,所述步骤五的具体过程为:
步骤五一、使用极坐标方程描述秃鹰俯冲时的运动状态:
r1(i)=θ(i)
x1r1(i)=r1(i)·sinh(θ(i))
y1r1(i)=r1(i)·cosh(θ(i))
x1(i)=x1r1(i)/max(|x1r1(i)|),y1(i)=y1r1(i)/max(|y1r1(i)|)
步骤五二、秃鹰以步骤五一的运动状态从搜索空间的最佳采样向量位置开始俯冲飞向目标位置。
其它步骤及参数与具体实施方式一至七之一相同。
具体实施方式九:本实施方式与具体实施方式一至八之一不同的是,所述步骤五二的具体过程为:
俯冲过程中第i只秃鹰的位置更新公式为:
Figure BDA0004126954840000071
P″i,new=bin(rand·P′bestxy)
其中:P″i,new是搜索结束得到的秃鹰空间位置,P′best代表步骤四更新结果中的最佳搜寻位置,P′mean代表步骤四更新结果的平均位置,c1为秃鹰向位置P′best的运动强度,c2为秃鹰向位置P″ean的运动强度,c1和c2的取值范围均为(0,1)。
其它步骤及参数与具体实施方式一至八之一相同。
具体实施方式十:本实施方式与具体实施方式一至九之一不同的是,所述第j个波段的复测定系数的计算方式为:
Figure BDA0004126954840000072
其中,Xj,selection为Xselection的第j个波段,
Figure BDA0004126954840000073
为Xselection中第j个波段对其他波段的回归,/>
Figure BDA0004126954840000081
为第j个波段的均值。
其它步骤及参数与具体实施方式一至九之一相同。
本发明的上述算例仅为详细地说明本发明的计算模型和计算流程,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

Claims (10)

1.一种基于MPA框架的松子近红外光谱波段选择方法,其特征在于,所述方法具体包括以下步骤:
步骤一、根据长度为N×Q的松子近红外光谱Xnir生成M个采样向量,将生成的M个采样向量表示为P1,P2,…,PM
步骤二、将每个采样向量分别作为秃鹰搜索算法的一只秃鹰,通过引入方差膨胀系数对采样向量和偏最小二乘回归模型的目标函数进行优化,得到优化后的采样向量所对应的目标函数值;
步骤三、根据步骤二中得到的目标函数值确定最佳搜寻位置,再利用最佳搜寻位置对优化后的采样向量进行处理,得到处理结果;
步骤四、秃鹰在局部搜索空间内根据螺旋形状以不同的方向移动,采用极坐标方程对步骤三的处理结果进行更新,获得更新后的结果,即搜索出最佳采样向量;
步骤五、秃鹰从搜索空间的最佳采样向量位置俯冲飞向目标位置,搜索结束后得到秃鹰的空间位置;
步骤六、将步骤五中得到的秃鹰空间位置重新作为采样向量,并返回步骤二;
步骤七、重复迭代步骤二至步骤六的过程,直至达到设置的最大迭代次数时停止迭代,根据最后一次迭代所获得的M个秃鹰空间位置分别建立偏最小二乘回归模型,即建立M个偏最小二乘回归模型,再根据具有最大目标函数值的偏最小二乘回归模型所对应的秃鹰空间位置进行波段选择。
2.根据权利要求1所述的一种基于MPA框架的松子近红外光谱波段选择方法,其特征在于,所述采样向量为元素中仅包含1和0,且维度为Q的二进制向量。
3.根据权利要求2所述的一种基于MPA框架的松子近红外光谱波段选择方法,其特征在于,所述步骤二的具体过程为:
步骤二一、设
Figure FDA0004126954830000011
为基于采样向量Pi的矩阵算子,则利用/>
Figure FDA0004126954830000012
筛选后的光谱特征向量Xselection为:
Figure FDA0004126954830000013
其中,i=1,2,…,M,
Figure FDA0004126954830000014
代表利用矩阵算子/>
Figure FDA0004126954830000015
对近红外光谱Xnir进行采样;
步骤二二、利用光谱特征向量Xselection建立偏最小二乘回归模型,得到回归系数向量b;则Xselection的第j个波段的评价指标Jj为:
Jj=|bj|+VIFj
其中,bj为回归系数向量b中的第j个回归系数,|·|代表取绝对值,VIFj为第j个波段的方差膨胀系数;
Figure FDA0004126954830000021
其中,
Figure FDA0004126954830000022
为Xselection的第j个波段的复测定系数;
步骤二三、从Xselection中筛选出评价指标最大的n个波段,根据筛选出的n个波段为采样向量Pi赋值,赋值后即获得优化后的采样向量
Figure FDA0004126954830000023
将筛选出的n个波段的评价指标依次表示为Jmax1、Jmax2…Jmaxn,则优化后的采样向量对应的目标函数值F为:
F=Jmax1+Jmax2+...+Jmaxn
4.根据权利要求3所述的一种基于MPA框架的松子近红外光谱波段选择方法,其特征在于,所述步骤三的具体过程为:
将目标函数值最大的秃鹰所对应的位置作为最佳搜寻位置Pbest,则对优化后的采样向量的处理结果为:
Figure FDA0004126954830000024
其中,Pi,new为优化后的第i个采样向量的处理结果,α为控制位置变化参数,r为(0,1)间随机数,Pmean为优化后的M个采样向量的平均结果,bin(·)是转换函数。
5.根据权利要求4所述的一种基于MPA框架的松子近红外光谱波段选择方法,其特征在于,所述参数α的取值范围为(0.1,0.3)。
6.根据权利要求5所述的一种基于MPA框架的松子近红外光谱波段选择方法,其特征在于,所述转换函数bin(·)为:
Figure FDA0004126954830000025
其中,trans是转换函数的自变量,V(trans)为S型传递函数;
Figure FDA0004126954830000031
其中,e是自然对数的底数。
7.根据权利要求6所述的一种基于MPA框架的松子近红外光谱波段选择方法,其特征在于,所述步骤四的具体过程为:
步骤四一、在局部搜索空间内建立螺旋飞行数学模型,搜索局部最优解;
θ(i)=a·π·rand
r(i)=θ(i)+R·rand
xr(i)=r(i)·sin(θ(i)),yr(i)=r(i)·cos(θ(i))
x(i)=xr(i)/max(|xr(i)|),y(i)=yr(i)/max(|yr(i)|)
其中,θ(i)为螺旋方程的极角,r(i)为螺旋方程的极径,a和R为控制螺旋轨迹的参数,a的变化范围为(0,5),R的变化范围为(0.1,1),rand为(0,1)内随机数,x(i)和y(i)为极坐标中秃鹰位置,x(i)和y(i)的取值范围均为(-1,1);
步骤四二、采用极坐标方程进行采样向量Pi,new的更新:
Figure FDA0004126954830000032
其中,P′i,new代表对采样向量Pi,new进行更新得到的向量,Pi *为第i只秃鹰按照螺旋方程行进时下一次更新位置。
8.根据权利要求7所述的一种基于MPA框架的松子近红外光谱波段选择方法,其特征在于,所述步骤五的具体过程为:
步骤五一、使用极坐标方程描述秃鹰俯冲时的运动状态:
r1(i)=θ(i)
x1r1(i)=r1(i)·sinh(θ(i))
y1r1(i)=r1(i)·cosh(θ(i))
x1(i)=x1r1(i)/max(|x1r1(i)|),y1(i)=y1r1(i)/max(|y1r1(i)|)
步骤五二、秃鹰以步骤五一的运动状态从搜索空间的最佳采样向量位置开始俯冲飞向目标位置。
9.根据权利要求8所述的一种基于MPA框架的松子近红外光谱波段选择方法,其特征在于,所述步骤五二的具体过程为:
俯冲过程中第i只秃鹰的位置更新公式为:
Figure FDA0004126954830000041
P″i,new=bin(rand·P′bestxy)
其中:P″i,new是搜索结束得到的秃鹰空间位置,P′best代表步骤四更新结果中的最佳搜寻位置,P′mean代表步骤四更新结果的平均位置,c1为秃鹰向位置P′best的运动强度,c2为秃鹰向位置P′mean的运动强度,c1和c2的取值范围均为(0,1)。
10.根据权利要求9所述的一种基于MPA框架的松子近红外光谱波段选择方法,其特征在于,所述第j个波段的复测定系数的计算方式为:
Figure FDA0004126954830000042
其中,Xj,selection为Xselection的第j个波段,为Xselection中第j个波段对其他波段的回归,/>
Figure FDA0004126954830000044
为第j个波段的均值。
CN202310248730.2A 2023-03-15 2023-03-15 一种基于mpa框架的松子近红外光谱波段选择方法 Active CN116429721B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310248730.2A CN116429721B (zh) 2023-03-15 2023-03-15 一种基于mpa框架的松子近红外光谱波段选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310248730.2A CN116429721B (zh) 2023-03-15 2023-03-15 一种基于mpa框架的松子近红外光谱波段选择方法

Publications (2)

Publication Number Publication Date
CN116429721A true CN116429721A (zh) 2023-07-14
CN116429721B CN116429721B (zh) 2024-08-23

Family

ID=87084615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310248730.2A Active CN116429721B (zh) 2023-03-15 2023-03-15 一种基于mpa框架的松子近红外光谱波段选择方法

Country Status (1)

Country Link
CN (1) CN116429721B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110125459A1 (en) * 2002-02-19 2011-05-26 Mark Howard L Testing linearity of methods of chemical analysis with various statistical tests
US20150015692A1 (en) * 2012-01-30 2015-01-15 Scanadu Incorporated Spatial resolution enhancement in hyperspectral imaging
CN106596465A (zh) * 2017-03-03 2017-04-26 东北农业大学 一种近红外光谱分析中的异常样本识别方法
US20180313804A1 (en) * 2016-11-26 2018-11-01 The Regents Of The University Of California Nondestructive method of identifying concealed damage in nuts
CN108896492A (zh) * 2018-08-07 2018-11-27 华南农业大学 Pso-bp神经网络模型的训练方法、存储介质及终端
CN111578690A (zh) * 2020-04-26 2020-08-25 东北林业大学 基于隐马尔科夫模型与粒子群优化的木材含水率控制方法
CN112002377A (zh) * 2020-08-24 2020-11-27 东北林业大学 基于集成学习校准模型的松子蛋白质含量预测方法
CN113241780A (zh) * 2021-06-11 2021-08-10 云南电网有限责任公司电力科学研究院 一种基于秃鹰搜索算法的电网二次调频控制技术
CN113360854A (zh) * 2021-08-10 2021-09-07 中国人民解放军国防科技大学 基于自适应协方差膨胀的资料同化方法
US20210311011A1 (en) * 2018-10-30 2021-10-07 Teakorigin Inc. Techniques for scoring food specimens, and related methods and apparatus
CN114173359A (zh) * 2021-12-09 2022-03-11 重庆邮电大学 一种用于工业物联网环境下的异构网络资源调度方法
US20220113250A1 (en) * 2020-06-30 2022-04-14 Jiangnan University Method for Near-Infrared Spectral Wavelength Selection Based on Improved Team Progress Algorithm
CN114861531A (zh) * 2022-04-25 2022-08-05 湖北工业大学 针对用户重复购买预测的模型参数优化方法及设备
CN115603398A (zh) * 2022-05-11 2023-01-13 新源智储能源发展(北京)有限公司(Cn) 一种基于秃鹰搜索算法的容量不一致储能阵列重构方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110125459A1 (en) * 2002-02-19 2011-05-26 Mark Howard L Testing linearity of methods of chemical analysis with various statistical tests
US20150015692A1 (en) * 2012-01-30 2015-01-15 Scanadu Incorporated Spatial resolution enhancement in hyperspectral imaging
US20180313804A1 (en) * 2016-11-26 2018-11-01 The Regents Of The University Of California Nondestructive method of identifying concealed damage in nuts
CN106596465A (zh) * 2017-03-03 2017-04-26 东北农业大学 一种近红外光谱分析中的异常样本识别方法
CN108896492A (zh) * 2018-08-07 2018-11-27 华南农业大学 Pso-bp神经网络模型的训练方法、存储介质及终端
US20210311011A1 (en) * 2018-10-30 2021-10-07 Teakorigin Inc. Techniques for scoring food specimens, and related methods and apparatus
CN111578690A (zh) * 2020-04-26 2020-08-25 东北林业大学 基于隐马尔科夫模型与粒子群优化的木材含水率控制方法
US20220113250A1 (en) * 2020-06-30 2022-04-14 Jiangnan University Method for Near-Infrared Spectral Wavelength Selection Based on Improved Team Progress Algorithm
CN112002377A (zh) * 2020-08-24 2020-11-27 东北林业大学 基于集成学习校准模型的松子蛋白质含量预测方法
CN113241780A (zh) * 2021-06-11 2021-08-10 云南电网有限责任公司电力科学研究院 一种基于秃鹰搜索算法的电网二次调频控制技术
CN113360854A (zh) * 2021-08-10 2021-09-07 中国人民解放军国防科技大学 基于自适应协方差膨胀的资料同化方法
CN114173359A (zh) * 2021-12-09 2022-03-11 重庆邮电大学 一种用于工业物联网环境下的异构网络资源调度方法
CN114861531A (zh) * 2022-04-25 2022-08-05 湖北工业大学 针对用户重复购买预测的模型参数优化方法及设备
CN115603398A (zh) * 2022-05-11 2023-01-13 新源智储能源发展(北京)有限公司(Cn) 一种基于秃鹰搜索算法的容量不一致储能阵列重构方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
李鸿博 等: "t-SNE降维的红松籽新旧品性近红外光谱鉴别", 《光谱学与光谱分析》, vol. 40, no. 09, 30 September 2020 (2020-09-30) *
蒋大鹏 等: "基于近红外的松子蛋白质品质分类处理", 《计算技术与自动化》, vol. 37, no. 03, 30 September 2018 (2018-09-30) *
蒋大鹏 等: "运用近红外光谱技术对松子霉变的快速检测", 《东北林业大学学报》, vol. 47, no. 05, 30 April 2019 (2019-04-30) *

Also Published As

Publication number Publication date
CN116429721B (zh) 2024-08-23

Similar Documents

Publication Publication Date Title
Altaheri et al. Date fruit classification for robotic harvesting in a natural environment using deep learning
Alajas et al. Prediction of grape leaf black rot damaged surface percentage using hybrid linear discriminant analysis and decision tree
CN111855591A (zh) 水稻地上部碳氮比遥感反演模型和方法
CN109299501A (zh) 一种基于工作流的振动光谱分析模型优化方法
CN109376805A (zh) 一种基于白酒基酒指纹图谱特征的分类方法
CN110826552A (zh) 基于深度学习的葡萄无损自动检测装置及其方法
Zheng et al. Effective band selection of hyperspectral image by an attention mechanism-based convolutional network
CN111855593A (zh) 水稻叶片淀粉含量遥感反演模型和方法
Kalim et al. Citrus leaf disease detection using hybrid cnn-rf model
Jiang et al. Quantitative analysis of aflatoxin B1 in moldy peanuts based on near-infrared spectra with two-dimensional convolutional neural network
Antony et al. A comparative study on predicting food quality using machine learning techniques
Yang et al. Classification of sugar beets based on hyperspectral and extreme learning machine methods
Sun et al. Discrimination of maturity of Camellia oleifera fruit on-site based on generative adversarial network and hyperspectral imaging technique
Yang et al. A quality detection method of corn based on spectral technology and deep learning model
CN116429721B (zh) 一种基于mpa框架的松子近红外光谱波段选择方法
Song et al. Apple disease recognition based on small-scale data sets
Suwarningsih et al. Ide-cabe: chili varieties identification and classification system based leaf
CN114062306B (zh) 一种近红外光谱数据分段预处理方法
Yu et al. Identification of Nanguo pear maturity based on information fusion
CN112881333B (zh) 一种基于改进免疫遗传算法的近红外光谱波长筛选方法
Kai et al. Bayberry maturity estimation algorithm based on multi-feature fusion
Li et al. Early drought plant stress detection with bi-directional long-term memory networks
CN110658156B (zh) 一种近红外光谱特征提取方法及装置
CN114511850A (zh) 一种阳光玫瑰葡萄果实大小粒图像识别方法
He et al. Pyramid feature fusion through shifted window self-attention for tobacco leaf classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant