CN112016624A - 一种基于麻雀搜索算法优化核独立分量的光谱数据降维方法 - Google Patents

一种基于麻雀搜索算法优化核独立分量的光谱数据降维方法 Download PDF

Info

Publication number
CN112016624A
CN112016624A CN202010889158.4A CN202010889158A CN112016624A CN 112016624 A CN112016624 A CN 112016624A CN 202010889158 A CN202010889158 A CN 202010889158A CN 112016624 A CN112016624 A CN 112016624A
Authority
CN
China
Prior art keywords
sparrow
kernel
matrix
spectral data
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010889158.4A
Other languages
English (en)
Inventor
何东健
高强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwest A&F University
Original Assignee
Northwest A&F University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwest A&F University filed Critical Northwest A&F University
Priority to CN202010889158.4A priority Critical patent/CN112016624A/zh
Publication of CN112016624A publication Critical patent/CN112016624A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2134Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种基于麻雀搜索算法优化核独立分量的光谱数据降维方法,包括:获取被测样本的近红外光谱数据;选择核函数,确定核参数优化问题并构建适应度函数;设置麻雀种群的初始参数,生成麻雀种群初始位置矩阵和适应度矩阵;根据麻雀的捕食与反捕食行为,更新麻雀种群的最优位置和最优适应度值;将达到收敛条件的最优核参数矩阵应用于核函数;对光谱数据进行球化分解预处理;求解独立分量分析中的解混矩阵,实现光谱数据有效降维。本发明避免了应用核独立分量分析方法进行光谱数据降维过程中,核函数参数选择的盲目性,而且实现了近红外光谱高维非线性数据的有效降维,其性能优越,实用性强,计算过程稳定,且易于实现。

Description

一种基于麻雀搜索算法优化核独立分量的光谱数据降维方法
技术领域
本发明属于近红外光谱数据技术领域,特别涉及一种基于麻雀搜索算法优化核独立分量的光谱数据降维方法。
背景技术
近年来,近红外光谱分析技术凭借其快速、非接触、非损伤、无二次污染的优点被广泛应用于水果品质检测领域。近红外光谱分析是根据物质的吸收、反射或散射的光谱来鉴别物质及确定物质化学组成和相对含量的方法。由于近红外光谱中包含大量光谱波段、各组分间的谱带重叠严重,仅采用单一波长光谱数据建立预测或判别模型会产生较大的误差,而采用全光谱波段数据进行建模耗时费力且精度较低,因此通常采用降维后的数据作为特征波段进行建模分析。
光谱数据降维分析中,特定的问题通常可以通过主观经验或建立目标函数进行分析,但大多数情况下由于光谱数据的特征峰重叠严重、信号噪声混合且无法人工识别。因此,有效的光谱数据降维方法显得至关重要。传统的数据处理方法有主成分分析、均匀采样、线性判别式分析、连续投影、最优求解、随机蛙跳、独立分量分析、随机森林、决策树、遗传算法和蚁群算法等。
上述算法可以完成数据降维和特征提取,但是针对稀疏和多变量复杂数据集往往只能体现总体的关联,忽视了局部之间的联系。现有方法实现数据降维的主要思路是:(1)通过坐标轴的线性变化实现数据主要信息提取,摒弃冗余信息;(2)在原有特征基础之上去创造凝练出一些新的特征,将尽可能多的数据点由其近邻点的线性加权组合构成。现有方法的缺点是只考虑了数据的全局性特征信息,从而忽视了数据在局部范围内特征信息,因此会导致分析实际问题时,建模预测或建模判别的结果误差很大。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种基于麻雀搜索算法优化核独立分量的光谱数据降维方法,通过引入核函数和最优化思想,对核独立分量分析方法中的核函数的随机参数进行优化,既能较好的去除冗余信息和噪音信息,又可以保留数据内部本质结构特征,从而提高光谱数据特征提取精度和核独立分量分析效率,解决了近红外光谱由于高维、谱带重叠、光谱分布结构未知等缺点所引起的数据关键特征提取难的问题。该方法可用于水果成分估计和品质检测模型设计、光谱分析仪器开发与优化等技术中。
为了实现上述目的,本发明采用的技术方案是:
一种基于麻雀搜索算法优化核独立分量的光谱数据降维方法,使用麻雀搜索算法优化核独立分量分析方法中核参数矩阵,从而实现光谱数据的有效降维。具体包括以下步骤:
步骤(1),获取被测样本的近红外光谱数据,获得q个样本在n个波段下的近红外光谱数据,记原始光谱数据
Figure BDA0002656403050000021
其中yq,n表示第q个样本在第n个波段的光谱数据;
步骤(2),为核独立分量分析方法选择核函数,确定核参数优化问题并构建
Figure BDA0002656403050000022
其中ω为待优化参数,Sa(ω)表示光谱数据的类内离散度,Sb(ω)表示光谱数据的类间离散度;
步骤(3),采用麻雀搜索算法,初始化麻雀种群,包括:设置麻雀种群的初始参数,生成麻雀种群初始位置矩阵和适应度矩阵;
步骤(4),根据麻雀的捕食与反捕食行为,更新麻雀种群的最优位置和最优适应度值;
步骤(5),将达到收敛条件的最优核参数矩阵δ=ω应用于核函数;
步骤(6),对光谱数据进行球化分解预处理,使输入向量之间相互正交;
步骤(7),求解独立分量分析中的解混矩阵,分离出相互独立的特征信息,实现光谱数据的有效降维。
优选地,所述步骤(2)包括:
步骤(2a),选择满足Mercer定理的半正定核函数,使得核矩阵只有非负特征值,确保构建的优化问题是凸的和解决方案是唯一的;本方法中使用高斯径向基核函数
Figure BDA0002656403050000031
x表示输入的光谱数据,z表示特征提取后的光谱数据;
步骤(2b),将高斯径向基核函数参数δ记为待优化参数ω,根据费舍尔极小判别准则,建立适应度函数F(ω),适应度函数F(ω)需随着ω由小变大过程,快速下降并稳定收敛到一个全局最小值F(ω*)。
优选地,所述步骤(3)包括:
步骤(3a),对应步骤(1)中的n个波段和q个样本,设置n维空间,空间中麻雀的数量为q;设置最大迭代次数为itermax;设置麻雀种群中探索者和跟随者的比例分别为Pprod=20%和Pscro=80%;设置种群的安全阈值为ST,ST的取值范围为[0,1],优选取ST=0.8;
步骤(3b),随机生成麻雀的初始位置矩阵X,计算适应度矩阵Fx,其中
Figure BDA0002656403050000032
即,初始位置矩阵X与原始光谱数据Y一一对应,xq,n代表第q个麻雀在第n维空间中的位置,一一映射为原始光谱数据Y中第q个样本在第n个波段的数据,函数f([xq,1xq,2… …x1,n])表示第q只麻雀在n维空间中的适应度值。
优选地,所述步骤(4)包括:
步骤(4a),在麻雀搜索算法中,探索者提供觅食区域和种群移动方向,所以它们具有较大的搜索范围。其位置更新算法描述为:
Figure BDA0002656403050000041
其中,RS为麻雀个体发出的预警值,其值为[0,1]的随机数;α是(0,1]随机数;
Figure BDA0002656403050000042
表示第t+1次迭代时,第i个麻雀在第j维空间中的位置;
Figure BDA0002656403050000043
表示第t次迭代时,第i个麻雀在第j维空间中的位置;Q为服从正态分布的随机数;L为麻雀搜索步长控制因子,它是一个1×m的矩阵,矩阵内每个元素全部为1;
当RS<ST时,即没有发现外来捕食者,此时探索者进行广阔的搜索,当预警值等于或高于安全阈值时,探索者带领种群中所有的麻雀迅速飞到安全区域;
步骤(4b),麻雀种群中的跟随者则围绕在探索者周围,并利用探索者获取食物。种群中剩余能量较低的跟随者需要飞到其他区域进行觅食以提高捕食概率。一部分剩余能量相对较高的跟随者会随时监控探索者,一旦探索者发现了较好的食物,它们就会立即飞过去竞争食物。因此,种群中麻雀的两种角色可以随着适应度排名互换,但是种群中探索者的比例不变。种群中跟随者的位置更新算法描述为:
Figure BDA0002656403050000044
其中,
Figure BDA0002656403050000045
为第t次迭代时,麻雀的全局最差位置;
Figure BDA0002656403050000046
为第t+1次迭代时,麻雀的全局最优位置;A是1×d向量,所有元素都由1和-1随机组成;L是一个1×d的矩阵,矩阵内每个元素全部为1;
步骤(4c),每次迭代,种群中固定比例的麻雀(即当前的探索者)可以感知到危险并发出预警信息,当危险发生时,麻雀种群会做出反捕食行为,即种群边缘的麻雀会迅速飞到安全区域,中心的麻雀随机飞到附件邻居位置,其数学表达式可以描述为:
Figure BDA0002656403050000051
其中,β为步长控制因子,其服从正态分布的随机数,且满足均值为0方差为1;K为方向和步长的控制因子,其值取[-1,1]的随机数;fi为第i只麻雀的适应度值;fg为全局最优适应度值;fw为全局最差的适应度值;ε为极小的常数,以避免分母出现零;
Figure BDA0002656403050000052
表示第t次迭代时,麻雀种群中全局最优的位置。
步骤(4d),重复步骤(4a)—(4c)进行迭代运算,当达到设定的最大迭代次数或适应度值稳定收敛于期望值时,停止迭代,最终得到种群中麻雀的全局最优位置,即核函数中最优核参数的最佳解,即为待优化参数ω;
优选地,所述对光谱数据进行球化分解预处理包括:
(1)去均值:求Y的协方差矩阵C=Y*YT,对C进行奇异值分解C=U*D*UT,其中,D为特征值的对角阵,U为C的奇异值分解中的左奇异阵,U的各个分量u1,u2,u3,…,un为C的特征向量;
(2)白化:对Y白化采用公式Z=Μ*Y,其中,M为白化矩阵,M=inv(sqrt(D))*UT,inv是矩阵求逆,其中D极为Y的协方差矩阵C的奇异值分解中的特征根对角阵,Z即为白化后的数据矩阵,将白化后的Z赋值给Y,实现球化处理,使得输入向量之间相互正交。
优选地,利用优化后的核函数K(x,z)实现核独立分量分析算法,算法运行并达到收敛性条件时得到解混矩阵Wm×n,m<n,再根据z=Wx分离出相互独立的特征信息,即实现n维光谱数据到m维的有效特征提取。
本发明还提供了利用所述基于麻雀搜索算法优化核独立分量的光谱数据降维方法进行水果品质检测的方法,以水果作为被测样本,通过所述基于麻雀搜索算法优化核独立分量的光谱数据降维方法提取得到的特征信息数据建立判别SVM模型,利用该模型进行水果品质预测。
本发明的原理如下:
基于核独立分量分析算法实现对光谱数据降维中,设待降维的数据矢量为x1,x2,…,xn,核函数为K(x,z)。对数据矢量进行球化分解预处理,使得向量之间相互正交。
利用平方根法分解求出原始独立数据z1,z2,…,zn的格拉姆矩阵G1,G2,…,Gm,其中zj=Wxj,W为核独立分量分析中的独立解混矩阵。
构建
Figure BDA0002656403050000061
上式的最大特征值可以定义为λH(G1,G2,…,Gm)。
通过迭代求解对W求
Figure BDA0002656403050000062
的最小化,达到收敛条件后,即可得到混解矩阵W,其中W为m×n的矩阵,且m<n。因此,对于待降维数据x1,x2,…,xn,根据z=Wx既可以的到独立信息,实现数据从n维降到m维。
与现有技术相比,本发明麻雀搜索算法在优化分析算法中具有收敛速度快、计算结果稳定和收敛精度高等优点,这也是光谱数据分析所必须的条件,可以在较好的去除冗余信息和噪音信息的同时,又保留了数据内部本质的结构特征,较好地解决了“大维度、小样本”带来的数据灾难问题。避免了应用核独立分量分析方法进行光谱数据降维过程中,核函数参数选择的盲目性,而且实现了近红外光谱高维非线性数据的有效降维,其性能优越,实用性强,计算过程稳定,且易于实现。
附图说明
图1为本发明实施例的原理图。
图2为本发明实施例的麻雀种群搜索优化具体流程示意图。
具体实施方式
下面结合附图和实施例详细说明本发明的实施方式。
如图1所示,本实施例提供了一种基于麻雀搜索算法优化核独立分量的光谱数据降维方法,具体包括以下步骤:
1、实验样本数据收集
供试样品采摘自陕西省榆林市经济林示范基地,5名有丰富采摘经验的果农于2019年7月-10月间,按照当地企业现行的西府海棠成熟度分级标准,从中选取果实饱满、外表光泽、形状规则、无病虫害、无损伤、外径在21mm-37mm之间,三种不同成熟度的海红果(青熟果、转色果、完熟果)各110个共330个作为实验样本。330个样品的近红外光谱数据由美国海洋光学公司生产的近红外光谱仪采集,该光谱仪的有效扫描范围为200nm-1100nm,分辨率为0.43nm,共有2068个波长点。
2、选择核函数并确定核参数优化问题
本发明采用核独立分量分析方法对光谱数据降维处理,并选用高斯径向基核函数进行分析计算,由此可以明确待优化的参数为高斯径向基核函数的核参数,并确定使用
Figure BDA0002656403050000071
作为适应度函数。该优化问题转换为,求解最优的ω,使得F(ω)值最优。
3、麻雀搜索优化算法优化核参数
参考图2,其具体过程如下:
3a、设置n=2068维空间中麻雀的数量为q=330;设置最大迭代次数为itermax=10000;设置麻雀种群中探索者和跟随者的比例分别为Pprod=20%和Pscro=80%;设置种群的安全阈值为ST=0.8,其值还可以取[0,1]的随机数。
3b、随机生成麻雀种群的初始位置矩阵X330×2068,计算适应度矩阵Fx。
3c、随机生成麻雀报警值RS,当RS<ST时,麻雀种群出于安全环境,此时探索者(种群中适应度值排名前20%的麻雀)带领种群在较为广泛的区域进行搜索食物。否则探索者将立即放弃搜索,带领种群飞到安全区域。探索者位置更新公式如下:
Figure BDA0002656403050000081
式中,α是(0,1]随机数;
Figure BDA0002656403050000082
表示第t+1次迭代时,第i个麻雀在第j维空间中的位置;
Figure BDA0002656403050000083
表示第t次迭代时,第i个麻雀在第j维空间中的位置;Q为服从正态分布的随机数;L为麻雀搜索步长控制因子,它是一个1×m的矩阵,矩阵内每个元素全部为1。
3d、种群中适应度值排名处于后80%的麻雀为跟随者,其中适应度值排名为后50%的麻雀,由于其剩余能力较低,且不适应当前位置,因此,它们会飞到其他区间进行搜索食物,已提高它们的觅食概率。其他跟随者会随时监控探索者,一旦探索者发现了较好的食物,它们将迅速飞到探索者位置进行竞争。一旦竞争成功则可以获得该位置,否则将继续监控探索者行为。跟随者的位置更新公式为:
Figure BDA0002656403050000084
其中,
Figure BDA0002656403050000085
为第t次迭代时,麻雀的全局最差位置;
Figure BDA0002656403050000086
为第t+1次迭代时,麻雀的全局最优位置;A是1×d向量所有元素都由1和-1随机组成;L是一个1×d的矩阵,矩阵内每个元素全部为1。
3e、在整个位置更新的过程中,麻雀会发现天敌并发出叽叽喳喳的警报,一旦发生危险,种群中处于边缘的麻雀会迅速飞到种群中心的安全位置,而处于种群中心的麻雀会随机飞到周围邻居位置。它们的位置更新公式如下:
Figure BDA0002656403050000087
其中,β为步长控制因子,其服从正态分布的随机数,且满足均值为0方差为1;K为方向和步长的控制因子,其值可取[-1,1]的随机数;fi为第i只麻雀的适应度值;fg为全局最优适应度值;fw为全局最差的适应度值;ε为极小的常数,以避免分母出现零。
根据上述麻雀位置更新公式进行迭代,如果没有达到最大循环次数或者适应度函数F(ω)没有稳定收敛于目标值,则重复步骤(3c)-(3e)进行迭代运算。当达到设定的最大迭代次数或适应度值稳定收敛于期望值时,停止迭代,最终得到种群中麻雀的全局最优位置,即核函数中核参数的最优解ω。
将达到收敛条件的最优核参数矩阵应用于核函数。
利用优化后的核函数K(x,z)实现核独立分量分析算法,算法运行并达到收敛性条件时便可以得到解混矩阵Wm×n,再根据z=Wx分离出相互独立的光谱,即实现西府海棠近红外光谱n维数据到m维的有效特征提取。
将通过上述方法提取到的特征数据记为D_SSA,将使用连续投影算法提取的特征数据记为D_SPA,将使用随机蛙跳算法提取的特征数据记为D_RF,将全光谱数据记为D_FS。依次建立西府海棠成熟度判别SVM模型,并分别表示为D_SSA-SVM、D_SPA-SVM、D_RF-SVM和D_FS-SVM,实验时,模型分别执行200次后的对比结果如下表:
表1、西府海棠成熟度模型预测结果对比
Figure BDA0002656403050000091
实验结果表明,本发明提出的一种基于麻雀搜索算法优化核独立分量的光谱数据降维方法,相比于连续投影算法和随机蛙跳算法具有一定优越性。本发明避免了应用核独立分量分析方法进行光谱数据降维过程中,核函数参数选择的盲目性,而且实现了近红外光谱高维非线性数据的有效降维,其性能优越,实用性强,计算过程稳定,且易于实现。

Claims (9)

1.一种基于麻雀搜索算法优化核独立分量的光谱数据降维方法,其特征在于,包括如下步骤:
步骤(1),获取被测样本的近红外光谱数据,获得q个样本在n个波段下的近红外光谱数据,记原始光谱数据
Figure FDA0002656403040000011
其中yq,n表示第q个样本在第n个波段的光谱数据;
步骤(2),为核独立分量分析方法选择核函数,确定核参数优化问题并构建适应度函数
Figure FDA0002656403040000012
其中ω为待优化参数,Sa(ω)表示光谱数据的类内离散度,Sb(ω)表示光谱数据的类间离散度;
步骤(3),采用麻雀搜索算法,初始化麻雀种群,包括:设置麻雀种群的初始参数,生成麻雀种群初始位置矩阵和适应度矩阵;
步骤(4),根据麻雀的捕食与反捕食行为,更新麻雀种群的最优位置和最优适应度值;
步骤(5),取ω等于达到收敛条件的最优核参数矩阵δ,并将其应用于核函数;
步骤(6),对光谱数据进行球化分解预处理,使输入向量之间相互正交;
步骤(7),求解独立分量分析中的解混矩阵,分离出相互独立的特征信息,实现光谱数据的有效降维。
2.根据权利要求1所述基于麻雀搜索算法优化核独立分量的光谱数据降维方法,其特征在于,所述步骤(2)包括:
步骤(2a),选择满足Mercer定理的半正定核函数,使得核矩阵只有非负特征值,确保构建的优化问题是凸的和解决方案是唯一的;
步骤(2b),将高斯径向基核函数参数δ记为待优化参数ω,根据费舍尔极小判别准则,建立适应度函数F(ω),适应度函数F(ω)需随着ω由小变大过程,快速下降并稳定收敛到一个全局最小值F(ω*)。
3.根据权利要求2所述基于麻雀搜索算法优化核独立分量的光谱数据降维方法,其特征在于,所述核函数为高斯径向基核函数
Figure FDA0002656403040000021
x表示输入的光谱数据,z表示特征提取后的光谱数据。
4.根据权利要求1所述基于麻雀搜索算法优化核独立分量的光谱数据降维方法,其特征在于,所述步骤(3)包括:
步骤(3a),对应步骤(1)中的n个波段和q个样本,设置n维空间,空间中麻雀的数量为q;设置最大迭代次数为itermax;设置麻雀种群中探索者和跟随者的比例分别为Pprod和Pscro;设置种群的安全阈值为ST,ST的取值范围为[0,1];
步骤(3b),随机生成麻雀的初始位置矩阵X,计算适应度矩阵Fx,其中
Figure FDA0002656403040000022
即,初始位置矩阵X与原始光谱数据Y一一对应,xq,n代表第q个麻雀在第n维空间中的位置,一一映射为原始光谱数据Y中第q个样本在第n个波段的数据,函数f([xq,1 xq,2… …x1,n])表示第q只麻雀在n维空间中的适应度值。
5.根据权利要求4所述基于麻雀搜索算法优化核独立分量的光谱数据降维方法,其特征在于,所述Pprod=20%,Pscro=80%,ST=0.8。
6.根据权利要求4或5所述基于麻雀搜索算法优化核独立分量的光谱数据降维方法,其特征在于,所述步骤(4)包括:
步骤(4a),麻雀种群中探索者位置更新算法为:
Figure FDA0002656403040000031
其中,RS为麻雀个体发出的预警值,其值为[0,1]的随机数;α是(0,1]随机数;
Figure FDA0002656403040000032
表示第t+1次迭代时,第i个麻雀在第j维空间中的位置;
Figure FDA0002656403040000033
表示第t次迭代时,第i个麻雀在第j维空间中的位置;Q为服从正态分布的随机数;L为麻雀搜索步长控制因子,它是一个1×m的矩阵,矩阵内每个元素全部为1;
当RS<ST时,即没有发现外来捕食者,此时探索者进行广阔的搜索,当预警值等于或高于安全阈值时,探索者带领种群中所有的麻雀迅速飞到安全区域;
步骤(4b),麻雀种群中跟随者的位置更新算法为:
Figure FDA0002656403040000034
其中,
Figure FDA0002656403040000035
为第t次迭代时,麻雀的全局最差位置;
Figure FDA0002656403040000036
为第t+1次迭代时,麻雀的全局最优位置;A是1×d向量,所有元素都由1和-1随机组成;L是一个1×d的矩阵,矩阵内每个元素全部为1;
步骤(4c),每次迭代的数学表达式为:
Figure FDA0002656403040000037
其中,β为步长控制因子,其服从正态分布的随机数,且满足均值为0方差为1;K为方向和步长的控制因子,其值取[-1,1]的随机数;fi为第i只麻雀的适应度值;fg为全局最优适应度值;fw为全局最差的适应度值;ε为极小的常数,以避免分母出现零,
Figure FDA0002656403040000038
表示第t次迭代时,麻雀种群中全局最优的位置;
步骤(4d),重复步骤(4a)—(4c)进行迭代运算,当达到设定的最大迭代次数或适应度值稳定收敛于期望值时,停止迭代,最终得到种群中麻雀的全局最优位置,即核函数中最优核参数的最佳解,即为待优化参数ω。
7.根据权利要求6所述基于麻雀搜索算法优化核独立分量的光谱数据降维方法,其特征在于,所述对光谱数据进行球化分解预处理包括:
(1)去均值:求Y的协方差矩阵C=Y*YT,对C进行奇异值分解C=U*D*UT,其中,D为特征值的对角阵,U为C的奇异值分解中的左奇异阵,U的各个分量u1,u2,u3,…,un为C的特征向量;
(2)白化:对Y白化采用公式Z=Μ*Y,其中,M为白化矩阵,M=inv(sqrt(D))*UT,inv是矩阵求逆,其中D极为Y的协方差矩阵C的奇异值分解中的特征根对角阵,Z即为白化后的数据矩阵,将白化后的Z赋值给Y,实现球化处理,使得输入向量之间相互正交。
8.根据权利要求6所述基于麻雀搜索算法优化核独立分量的光谱数据降维方法,其特征在于,利用优化后的核函数K(x,z)实现核独立分量分析算法,算法运行并达到收敛性条件时得到解混矩阵Wm×n,m<n,再根据z=Wx分离出相互独立的特征信息,即实现n维光谱数据到m维的有效特征提取。
9.利用权利要求1所述基于麻雀搜索算法优化核独立分量的光谱数据降维方法进行水果品质检测的方法,其特征在于,以水果作为被测样本,通过所述基于麻雀搜索算法优化核独立分量的光谱数据降维方法提取得到的特征信息数据建立判别SVM模型,利用该模型进行水果品质预测。
CN202010889158.4A 2020-08-28 2020-08-28 一种基于麻雀搜索算法优化核独立分量的光谱数据降维方法 Pending CN112016624A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010889158.4A CN112016624A (zh) 2020-08-28 2020-08-28 一种基于麻雀搜索算法优化核独立分量的光谱数据降维方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010889158.4A CN112016624A (zh) 2020-08-28 2020-08-28 一种基于麻雀搜索算法优化核独立分量的光谱数据降维方法

Publications (1)

Publication Number Publication Date
CN112016624A true CN112016624A (zh) 2020-12-01

Family

ID=73503212

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010889158.4A Pending CN112016624A (zh) 2020-08-28 2020-08-28 一种基于麻雀搜索算法优化核独立分量的光谱数据降维方法

Country Status (1)

Country Link
CN (1) CN112016624A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112465119A (zh) * 2020-12-08 2021-03-09 武汉理工光科股份有限公司 一种基于深度学习的消防险情预警方法及装置
CN112488401A (zh) * 2020-12-08 2021-03-12 武汉理工光科股份有限公司 一种火灾逃生路线指引方法及系统
CN112654050A (zh) * 2020-12-21 2021-04-13 江西理工大学 一种增强型麻雀搜索算法的无线传感器网络优化覆盖方案
CN113124552A (zh) * 2021-04-29 2021-07-16 苏州科技大学 冷冻水系统的优化控制算法
CN113221998A (zh) * 2021-05-06 2021-08-06 桂林电子科技大学 一种基于ssa-svm的稀土萃取搅拌轴故障诊断方法及系统
CN113259325A (zh) * 2021-04-21 2021-08-13 桂林电子科技大学 基于麻雀搜索算法优化Bi-LSTM的网络安全态势预测方法
CN113326817A (zh) * 2021-07-30 2021-08-31 南京天朗防务科技有限公司 一种混沌小信号的检测方法及装置
CN113805060A (zh) * 2021-05-21 2021-12-17 电子科技大学 基于相关向量回归的锂电池剩余寿命检测方法
CN117740727A (zh) * 2024-02-19 2024-03-22 南京信息工程大学 一种基于红外高光谱的纺织品成分定量反演方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714354A (zh) * 2014-01-16 2014-04-09 西安电子科技大学 基于量子粒子群算法的高光谱图像波段选择方法
CN107065843A (zh) * 2017-06-09 2017-08-18 东北大学 基于独立子空间的多方向kica间歇过程故障监测方法
CN109829420A (zh) * 2019-01-18 2019-05-31 湖北工业大学 一种基于改进蚁狮优化算法的高光谱图像的特征选择方法
CN110599430A (zh) * 2019-09-29 2019-12-20 河北工业大学 基于交叉双粒子群优化的高光谱图像解混方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714354A (zh) * 2014-01-16 2014-04-09 西安电子科技大学 基于量子粒子群算法的高光谱图像波段选择方法
CN107065843A (zh) * 2017-06-09 2017-08-18 东北大学 基于独立子空间的多方向kica间歇过程故障监测方法
CN109829420A (zh) * 2019-01-18 2019-05-31 湖北工业大学 一种基于改进蚁狮优化算法的高光谱图像的特征选择方法
CN110599430A (zh) * 2019-09-29 2019-12-20 河北工业大学 基于交叉双粒子群优化的高光谱图像解混方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JIANKAI XUE 、BO CHEN: "A novel swarm intelligence optimization approach:sparrow search algorithm", 《SYSTEMS SCIENCE & CONTROL ENGINEERING》 *
于宁锋等: "一种用于高光谱遥感影像分类的改进多类支持向量机", 《遥感信息》 *
孙磊等: "基于粒子群优化核独立分量的特征降维及其应用研究", 《河北科技大学学报》 *
王和勇著: "《面向大数据的高维数据挖掘技术》", 31 March 2018, 西安电子科技大学出版社 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112488401A (zh) * 2020-12-08 2021-03-12 武汉理工光科股份有限公司 一种火灾逃生路线指引方法及系统
CN112488401B (zh) * 2020-12-08 2022-12-02 武汉理工光科股份有限公司 一种火灾逃生路线指引方法及系统
CN112465119A (zh) * 2020-12-08 2021-03-09 武汉理工光科股份有限公司 一种基于深度学习的消防险情预警方法及装置
CN112654050B (zh) * 2020-12-21 2022-07-05 江西理工大学 一种增强型麻雀搜索算法的无线传感器网络优化覆盖方法
CN112654050A (zh) * 2020-12-21 2021-04-13 江西理工大学 一种增强型麻雀搜索算法的无线传感器网络优化覆盖方案
CN113259325A (zh) * 2021-04-21 2021-08-13 桂林电子科技大学 基于麻雀搜索算法优化Bi-LSTM的网络安全态势预测方法
CN113124552A (zh) * 2021-04-29 2021-07-16 苏州科技大学 冷冻水系统的优化控制算法
CN113221998A (zh) * 2021-05-06 2021-08-06 桂林电子科技大学 一种基于ssa-svm的稀土萃取搅拌轴故障诊断方法及系统
CN113805060B (zh) * 2021-05-21 2022-11-04 电子科技大学 基于相关向量回归的锂电池剩余寿命检测方法
CN113805060A (zh) * 2021-05-21 2021-12-17 电子科技大学 基于相关向量回归的锂电池剩余寿命检测方法
CN113326817A (zh) * 2021-07-30 2021-08-31 南京天朗防务科技有限公司 一种混沌小信号的检测方法及装置
CN117740727A (zh) * 2024-02-19 2024-03-22 南京信息工程大学 一种基于红外高光谱的纺织品成分定量反演方法
CN117740727B (zh) * 2024-02-19 2024-05-14 南京信息工程大学 一种基于红外高光谱的纺织品成分定量反演方法

Similar Documents

Publication Publication Date Title
CN112016624A (zh) 一种基于麻雀搜索算法优化核独立分量的光谱数据降维方法
Lines et al. Hive-cote: The hierarchical vote collective of transformation-based ensembles for time series classification
Kumar et al. Disease detection in coffee plants using convolutional neural network
CN107491784A (zh) 基于深度学习算法的烟叶近红外光谱定量建模方法及应用
Zhang et al. A cloud computing-based approach using the visible near-infrared spectrum to classify greenhouse tomato plants under water stress
Ninomiya High-throughput field crop phenotyping: current status and challenges
CN113159264B (zh) 一种入侵检测方法、系统、设备及可读存储介质
CN111832507A (zh) 基于麦穗顶部光谱信息的小麦赤霉病遥感识别方法
Jiang et al. Rapid identification of fermentation stages of bioethanol solid-state fermentation (SSF) using FT-NIR spectroscopy: comparisons of linear and non-linear algorithms for multiple classification issues
Sowmiya et al. Deep learning techniques to detect crop disease and nutrient deficiency-a survey
CN107290299B (zh) 一种实时无损检测桃的糖度和酸度的方法
Arwatchananukul et al. Fast and Efficient Cavendish Banana Grade Classification using Random Forest Classifier with Synthetic Minority Oversampling Technique.
CN112069911A (zh) 一种多光谱图像信息和tlmd-woa-sift的果蔬品质检测方法
CN111398238A (zh) 一种食用油掺杂蓖麻油的激光诱导荧光光谱识别方法
Ali et al. Quality inspection of food and agricultural products using artificial intelligence
Ahmed et al. Sound event classification using neural networks and feature selection based methods
CN114062306B (zh) 一种近红外光谱数据分段预处理方法
Huang et al. Robust and Accurate Classification of Mutton Adulteration Under Food Additives Effect Based on Multi-Part Depth Fusion Features and Optimized Support Vector Machine
Li et al. Genetic algorithms (GAs) and evolutionary strategy to optimize electronic nose sensor selection
Işık et al. Consensus rule for wheat cultivar classification on VL, VNIR and SWIR imaging
Dhivya et al. An Automated Plant Leaf Diseases Classification using AKMC and AKNN Machine Learning Techniques
CN112229816A (zh) 基于opls-spa-mix-pls的木材弹性模量预测方法
Si et al. Crop Disease Recognition Based on Improved Model-Agnostic Meta-Learning.
CN113553896B (zh) 一种基于多特征深度森林的脑电情绪识别方法
Feng et al. Maturity classification of rapeseed using hyperspectral image combined with machine learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201201

RJ01 Rejection of invention patent application after publication