CN115909324A - 一种广陈皮陈化年份高光谱鉴别方法及系统 - Google Patents
一种广陈皮陈化年份高光谱鉴别方法及系统 Download PDFInfo
- Publication number
- CN115909324A CN115909324A CN202211353185.5A CN202211353185A CN115909324A CN 115909324 A CN115909324 A CN 115909324A CN 202211353185 A CN202211353185 A CN 202211353185A CN 115909324 A CN115909324 A CN 115909324A
- Authority
- CN
- China
- Prior art keywords
- hyperspectral
- hyperspectral data
- identification
- data
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000002431 foraging effect Effects 0.000 title description 2
- 238000012549 training Methods 0.000 claims abstract description 22
- 238000007781 pre-processing Methods 0.000 claims abstract description 17
- 241001672694 Citrus reticulata Species 0.000 claims abstract description 16
- 230000032683 aging Effects 0.000 claims abstract description 16
- 238000004422 calculation algorithm Methods 0.000 claims description 43
- 241000238866 Latrodectus mactans Species 0.000 claims description 30
- 239000000877 Sex Attractant Substances 0.000 claims description 16
- 238000005070 sampling Methods 0.000 claims description 14
- 238000012360 testing method Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 12
- 244000276331 Citrus maxima Species 0.000 claims description 11
- 235000001759 Citrus maxima Nutrition 0.000 claims description 11
- 241000207199 Citrus Species 0.000 claims description 10
- 235000020971 citrus fruits Nutrition 0.000 claims description 10
- 238000009499 grossing Methods 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 8
- 230000003044 adaptive effect Effects 0.000 claims description 7
- 238000002790 cross-validation Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000002860 competitive effect Effects 0.000 claims description 6
- 230000036961 partial effect Effects 0.000 claims description 6
- 238000012614 Monte-Carlo sampling Methods 0.000 claims description 5
- 230000002829 reductive effect Effects 0.000 claims description 5
- 238000012706 support-vector machine Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 125000004122 cyclic group Chemical group 0.000 claims description 2
- 230000000717 retained effect Effects 0.000 claims description 2
- 230000001502 supplementing effect Effects 0.000 claims description 2
- 238000001514 detection method Methods 0.000 abstract description 3
- 239000000463 material Substances 0.000 abstract description 3
- 238000005457 optimization Methods 0.000 description 10
- 241000239290 Araneae Species 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000010238 partial least squares regression Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000002310 reflectometry Methods 0.000 description 5
- 229910052736 halogen Inorganic materials 0.000 description 4
- 150000002367 halogens Chemical class 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 241000145313 Gymnocorymbus ternetzi Species 0.000 description 3
- 238000000701 chemical imaging Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000004611 spectroscopical analysis Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 241000675108 Citrus tangerina Species 0.000 description 1
- 238000011497 Univariate linear regression Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000010224 classification analysis Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 210000000232 gallbladder Anatomy 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Landscapes
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种广陈皮陈化年份高光谱鉴别方法及系统,该方法包括:获取广陈皮的原始高光谱数据并进行预处理,得到高光谱数据;对高光谱数据进行降维处理,得到降维后的高光谱数据;利用降维后的高光谱数据训练BWO‑SVM模型,得到高光谱鉴别模型;将待测广陈皮输入高光谱鉴别模型中,得到鉴别结果。该系统包括:预处理模块、降维模块、训练模块和鉴别模块。通过使用本发明,能够实现对广陈皮陈化年份的实时和无损检测。本发明作为一种广陈皮陈化年份高光谱鉴别方法及系统,可广泛应用于药材年份鉴别技术领域。
Description
技术领域
本发明涉及药材年份鉴别技术领域,尤其涉及一种广陈皮陈化年份高光谱鉴别方法及系统。
背景技术
广陈皮是我国岭南地区著名的道地药材,被列为广东三宝之首,源于茶枝柑的广陈皮相比于普通陈皮,具有疏肝利胆、理气健脾等独特功效,具有“越陈越香”的特征,这也造成不同陈化年份的广陈皮在售价上有巨大的区别,针对广陈皮缺少陈化程度评定标准,市场存在年份造假、以次充好等问题。
国内外研究人员相继探索研究了多种解决方案,在当前广陈皮陈化年份鉴别的工作中,被广泛采用的方法是性状鉴别法、化学检验法和光谱学鉴别法;性状鉴别法容易受到个人主观因素影响,没有可靠统一的标准;而化学检验法需要对广陈皮样本进行损耗,会造成经济上的损失,还需要对样品进行前置处理,检测时间较长,实时性较差,效率较低;因此很多研究人员也运用光谱学的知识来鉴别广陈皮的陈化年份,但由于广陈皮成分复杂,各光谱波段间的信息关联度较差。
发明内容
为了解决上述技术问题,本发明的目的是提供一种广陈皮陈化年份高光谱鉴别方法及系统,能够实现对广陈皮陈化年份的实时和无损检测。
本发明所采用的第一技术方案是:一种广陈皮陈化年份高光谱鉴别方法,包括以下步骤:
获取广陈皮的原始高光谱数据并进行预处理,得到高光谱数据;
对高光谱数据进行降维处理,得到降维后的高光谱数据;
利用降维后的高光谱数据训练BWO-SVM模型,得到高光谱鉴别模型;
将待测广陈皮输入高光谱鉴别模型中,得到鉴别结果。
进一步,所述获取广陈皮的原始高光谱数据并进行预处理,得到高光谱数据这一步骤,具体包括:
获取广陈皮的原始高光谱数据;
对原始高光谱数据进行平滑处理,得到平滑的高光谱数据;
对平滑的高光谱数据进行去趋势处理,得到高光谱数据。
进一步,所述对高光谱数据进行降维处理,得到降维后的高光谱数据这一步骤,具体包括:
利用竞争性自适应重加权算法对高光谱数据进行特征提取,得到特征波长;
利用逐步回归算法对特征波长进行筛选,得到降维后的高光谱数据。
进一步,所述利用竞争性自适应重加权算法对高光谱数据进行特征提取,得到特征波长这一步骤,具体包括:
利用蒙特卡洛采样法对高光谱数据进行随机采样,并将采样的高光谱数据作为训练集,剩余的高光谱数据作为预测集;
利用训练集构建偏最小二乘法回归,并基于权重公式计算偏最小二乘法回归中波长的权重;
利用衰减指数法计算保留的波长点的比例,并按照保留的波长点的比例对训练集进行筛选,得到剩余波长作为特征波长子集;
采用自适应加权算法从剩余波长中提取变量子集,并基于变量子集计算交叉验证均方根误差;
利用蒙特卡洛采样法从剩余波长中进行随机采样执行循环提取,直至剩余两波长停止循环,得到每次采样后的特征波长子集及其对应的交叉验证均方根误差;
选取交叉验证均方根误差最小对应的特征波长子集作为特征波长。
进一步,所述利用逐步回归算法对特征波长进行筛选,得到降维后的高光谱数据这一步骤,具体包括:
对特征波长中每个波长分别构建一元回归模型;
计算每个波长对应的回归系数检验统计量;
选取最大的检验统计量与预定值进行比较,判断到最大的检验统计量大于预定值,选取最大的检验统计量对应的波长;
将选取的波长分别与剩余波长构建二元回归模型执行循环构建,直至判断到最大的检验统计量小于等于预定值停止循环,得到降维后的高光谱数据。
进一步,所述利用降维后的高光谱数据训练BWO-SVM模型,得到高光谱鉴别模型这一步骤,具体包括:
从降维后的高光谱数据中选取部分高光谱数据作为黑寡妇蜘蛛;
基于适应度函数计算黑寡妇蜘蛛的适应度值;
根据适应度值计算黑寡妇蜘蛛的性信息素值;
基于黑寡妇蜘蛛不同运动方式更新黑寡妇蜘蛛位置;
计算更新位置后的黑寡妇蜘蛛的性信息素值;
剔除性信息素值小于等于预设值的黑寡妇蜘蛛,并补充新的黑寡妇蜘蛛;
将新的黑寡妇蜘蛛与留存的黑寡妇蜘蛛作为一个群体执行循环评估,直至判断到达到迭代次数停止循环,得到黑寡妇蜘蛛最优位置和高光谱鉴别模型。
进一步,所述适应度函数的计算公式,具体如下:
fitness=arg min(RMSESVMpredict);
上式中,SVMpredict表示支持向量机模型预测值,RMSE表示均方根误差。
本发明所采用的第二技术方案是:一种广陈皮陈化年份高光谱鉴别系统,包括:
预处理模块,用于获取广陈皮的原始高光谱数据并进行预处理,得到高光谱数据;
降维模块,用于对高光谱数据进行降维处理,得到降维后的高光谱数据;
训练模块,用于利用降维后的高光谱数据训练BWO-SVM模型,得到高光谱鉴别模型;
鉴别模块,用于将待测广陈皮输入高光谱鉴别模型中,得到鉴别结果。
本发明方法及系统的有益效果是:本发明首先对原始高光谱数据进行预处理,预处理包括平滑处理与去趋势处理,通过平滑处理,减少噪音对有用信息的影响,同时提高光谱数据的平滑性,通过去趋势处理,减少相关性分析中数据畸变的概率,防止低频成分上翘掩盖主频成分,影响模型鉴别精度;其次对高光谱数据进行降维处理,有效的消除冗余波段,保留有限波段,加快了鉴别速度;最后通过训练BWO-SVM模型,得到高光谱鉴别模型,提高了对广陈皮陈化年份的鉴别准确率。
附图说明
图1是本发明一种广陈皮陈化年份高光谱鉴别方法的步骤流程图;
图2是本发明一种广陈皮陈化年份高光谱鉴别系统的结构框图;
图3是本发明具体实施例广陈皮陈化年份高光谱鉴别方法的过程示意图;
图4是本发明具体实施例高光谱成像系统的结构示意图;
图5是本发明具体实施例广陈皮样本ROI取样的示意图;
图6是本发明具体实施例原始高光谱数据示意图;
图7是本发明具体实施例高光谱数据示意图。
附图标记如下:
1、广陈皮;2、卤素灯;3、高光谱照相机;4、光谱仪;5、计算机。
具体实施方式
下面结合附图和具体实施例对本发明做进一步的详细说明。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
参照图1和图3,本发明提供了一种广陈皮陈化年份高光谱鉴别方法,该方法包括以下步骤:
S1、获取广陈皮的原始高光谱数据并进行预处理,得到高光谱数据;
S1.1、获取广陈皮的原始高光谱数据;
具体的,首先在正式进行广陈皮高光谱数据采集之前要先采集遮挡镜头的黑板图像以及白板反射图像,作为反射率校正的工具,采集时要对样本进行擦拭去除表面灰尘。
然后,使用SpecVIEW软件对广陈皮的高光谱样本进行镜头校准和反射率校准,利用自带的镜头校准修复失真和透视;利用标准反射板的反射率校正数据,得到更准确的样本高光谱反射图像,高光谱图像反射率校正计算公式,具体如下:
R=(R0-RB)/(RW-RB);
上式中,R为校正后高光谱图像,R0为原始图像,RB为遮挡镜头得到的黑板图像,RW为白板反射图像。
最后,如图5所示,使用ENVI5.3软件对采集到的广陈皮高光谱数据进行处理,在每个样本上手动选取5个ROI(Region Of Interest,感兴趣区域),每个ROI选择的范围是20×20Pix,因此每个样本可得到2000条光谱数据,将数据导入到Matlab2016a中进行均值化处理,得到广陈皮的原始高光谱数据如图6所示。
进一步作为本方法优选实施例,如图4所示,广陈皮样本均为茶枝柑的干燥成熟果皮,使用的高光谱采集设备是北京卓立汉光仪器有限公司的GaiaField便携式高光谱成像系统(分辨率696×256Pix,波长范围385~1014nm,共256个波段),该系统包括卤素灯(2)、高光谱照相机(3)、光谱仪(4)和计算机(5),光谱仪(4)与计算机(5)通过RS485 USB电连接,采样时间都在常温环境下进行,高光谱成像系统的高光谱照相机(3)曝光时间为27ms,镜头到样本广陈皮(1)的距离为42cm,平台移动速度为1.38mm·s-1,在黑暗密闭的环境中进行采集,因此采集背景为反射率接近于0的黑色绒布,使用100W卤素灯(2)模拟太阳光,调整卤素灯(2)方位角为45°且距离样本区垂直高度为40cm;最终获取5年广陈皮样本86个,10年广陈皮样本87个,15年广陈皮样本82个,20年广陈皮样本86个;总计训练集和测试机分别为258个和83个。
S1.2、对原始高光谱数据进行平滑处理,得到平滑的高光谱数据;
具体的,作为本方法优选实施例,平滑处理采用的是SG(多项式平滑算法),多项式平滑算法是基于最小二乘原理的平滑算法,其原理是利用中心点以及周边若干点进行最小二乘拟合,尽可能减少噪音对有用信息的影响,同时提高光谱数据的平滑性。
首先把原始高光谱数据一段区间的等波长间隔的5个点记为X集合,多项式平滑就是利用在波长点为Xm-2,Xm-1,Xm,Xm+1,Xm+2的数据的多项式拟合值来取代Xm,然后依次移动,直到把原始高光谱数据遍历完,其中X集合包含2m+1个点,采用k-1次多项式对窗口内的数据进行拟合,拟合函数如下:
y=a0+a1x+a2x2+...+ak-1xk-1;
由此有2m+1个方程,组成了k元线性方程组,要使方程有解,则2m+1>k,通过最小二乘法拟合确定参数A。
Y(2m+1)×1=X(2m+1)×1·AK×1+E(2m+1)×1;
A的最小二乘解A*为:
A*=(XT·X)-1·XT·Y;
Y的预测值为Y*为:
Y*=X·A=X·(XT·X)-1·XT·Y。
S1.3、对平滑的高光谱数据进行去趋势处理,得到高光谱数据。
具体的,作为本方法优选实施例,如图7所示,针对高光谱采集广陈皮图像过程中难以避免噪音干扰,需要使用Detrend(去趋势算法)进行光谱预处理,去趋势算法将光谱图像分解成静态稳定分量和非线性趋势项,并消减非线性趋势项,从而得到静态稳定分量,其优势是减少相关性分析中数据畸变的概率,防止低频成分上翘掩盖主频成分,影响模型鉴别精度。
去趋势算法首先在区间内部使用最小二乘法拟合该段曲线,作为该数据的趋势函数yn(t),反映数据本身所含有的趋势,具体如下:
yn(t)=θ0+θ1t+θ2t2+…+θntn;
之后在对每个点减去该点为趋势函数在该点的趋势值,得到该点的波动值F(t),具体如下:
F(t)=y(t)-yn(t)。
S2、对高光谱数据进行降维处理,得到降维后的高光谱数据,有效的消除冗余波段,保留有限波段,加快了鉴别速度;
S2.1、利用竞争性自适应重加权算法对高光谱数据进行特征提取,得到特征波长;
具体的,CARS(竞争性自适应重加权算法)以波段变量回归系数的绝对值当参考指标,选取数值大的变量,筛除数值小的变量,其中变量个数由EDF(衰减指数法)确定;在未被选取的波段变量中,采用ARS(自适应加权算法)再次选取回归系数绝对值相对较大的波段。
首先采用蒙特卡洛采样法(MC)随机从数据集中选择m个样本进入训练集,剩余的样本作为预测集建立PLS(偏最小二乘法回归)模型Vsel_old,MC的采样次数需要提前设定。
其次,基于权重公式计算偏最小二乘法回归中波长的权重,权重公式具体如下:
上式中,bi为第i个变量回归系数的值,wi为波长的权重。
然后,利用EDF强行去除bi较小的波长,在第i次基于MC采样建立PLS模型时,根据EDF得到保留的波长点的比例Ri,具体如下:
Ri=μe-k;
其中,μ和k需要按照下列情况计算:
在一次采样时,所有的波长都参与了建模分析,所以此时保留的波长点的比例R1为1。
在第N次完成并进行相应计算时,仅两变量参与建模,Rn为2/n,其中n是原始波长点数。
因此μ和k的计算公式具体如下:
在每次采样时,从上一次采样时的变量数中采用ARS选择数量为Ri*n个的变量,提取Vsel_new。
再然后,进行PLS建模,计算RMSECV(交叉验证均方根误差),具体如下:
其中,需要保持Vsel_old与Vsel_new的数量一样。
最后,在N次采样完成之后,CARS算法得到了N组候选的特征波长子集,以及对应的RMSECV值,选择RMSECV最小值所对应的特征波长子集为特征波长。
S2.2、利用逐步回归算法对特征波长进行筛选,得到降维后的高光谱数据。
具体的,SR(逐步回归算法)通过逐个引入贡献相对大的显著自变量来建立模型,同时将模型之外的变量逐个引入模型,每引入一个变量,就对模型中所有变量进行显著性检验,排除非显著变量,减少冗余信息干扰,最终得到最优的回归模型。
对n个自变量x1,x2,x3,…,xn和因变量y建立一元回归模型,具体如下:
y=β0+βixi+ε;
分别将自变量组(x1,x2),(x1,x3),...,(x1,xn)与因变量建立二元回归方程(此时x1是上一步骤中的xi1,xi1为选取的波长,x2,x3,…,xn为剩余波长),计算方程中x2,x3,…,xn的回归系数检验统计量F,取若则停止筛选,否则将xi2选入变量集,此时将xi2看做x2,如此迭代直到自变量的最大的F值小于临界值,此时回归方程就是最优的回归方程,对n个自变量x1,x2,x3,…,xn和因变量y建立多元回归模型,从而得到降维后的高光谱数据,数据维度从256降低到26个。
S3、利用降维后的高光谱数据训练BWO-SVM模型,得到高光谱鉴别模型;
具体的,黑寡妇蜘蛛对能够表现个体状态的性信息素较为敏感,高性信息素的配偶能够提供足够的生育能力,低性信息素的个体因倾向于吞噬同类而被种群集体排斥和遗弃,BWO是基于黑寡妇蜘蛛独特行为启发的一种新型元启发式算法,具有收敛速度快、寻优效率高等优势,在BWO算法中,黑寡妇蜘蛛能够根据上一次迭代过程中最优解所对应的位置和本次迭代过程中其他黑寡妇蜘蛛所在的位置来调整自身的下一个寻优位置。
SVM模型指的是支持向量机模型,是常见的一种判别方法。在机器学习领域,是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析。
首先,设置BWO算法参数:种群规模为m,迭代次数为n,独立运行次数为k,将黑寡妇蜘蛛的性信息素警戒值设为e,个体螺旋式移动决定阈值设为l。
采用均方根误差作为适应度函数fitness,具体如下:
fitness=arg min(RMSESVMpredict);
上式中,SVMpredict表示支持向量机模型预测值,RMSE表示均方根误差。
对所有的黑寡妇蜘蛛对应的适应度值进行排序,得到当前最优的SVM模型参数。
计算并更新当前迭代过程中所有黑寡妇蜘蛛对应的性信息素值,其中fitness(i)是当前黑寡妇蜘蛛的适应度,phermone(i)是当前黑寡妇蜘蛛的性信息素值,具体如下:
黑寡妇蜘蛛的移动策略分为线性移动和螺旋式移动,在[0,1]范围内随机生成的变量u,并通过判断其是否小于决定阈值l来确定本次迭代过程中的移动策略,其中是当前的黑寡妇蜘蛛位置,是黑寡妇蜘蛛移动到的新位置,表示前一次迭代中搜索到的最佳黑寡妇蜘蛛,变量m是位于区间[0.4,0.9]中随机产生的浮点数,r1是从1到当前黑寡妇蜘蛛序号之间随机产生的整数,是在本次迭代过程中第r1只黑寡妇蜘蛛,β是定义在[-1,1]区间内随机生成的浮点数,具体如下:
低性信息素的黑寡妇蜘蛛往往是非常饥饿需要吞噬同类的雌性黑寡妇蜘蛛,这类黑寡妇蜘蛛会受到种群集体排斥,会被种群遗弃,在迭代过程中,低性信息素的黑寡妇个体被遗弃后,需要及时补充种群数量,其中r1、r2是从1到当前搜索代理黑寡妇蜘蛛范围内随机产生的不同整数,是第r1、r2个黑寡妇蜘蛛,σ是一个随机数是定义在[0,1]区间内随机生成的浮点数,具体如下:
计算并更新黑寡妇群体适应度值,若达到算法停止条件则输出最优解,得到高光谱鉴别模型,否则重复上述步骤。
进一步作为本方法优选实施例,在模型中设置BWO算法种群规模为20,迭代次数为100,独立运行次数为20,将作为个体的性信息素警戒值设为0.3,个体螺旋式移动决定阈值设为0.7;SVM模型参数:错误惩罚系数c和核系数g的取值范围设为[0.0001,1000],经过优化后找到的最优参数c=80.2701,g=0.1595。
S4、将待测广陈皮输入高光谱鉴别模型中,得到鉴别结果,解决了广陈皮陈化年份识别实时性差、需要损坏样本的问题,有助于基于实时的广陈皮陈化年份鉴别,且提高了对广陈皮陈化年份的鉴别准确率。
进一步作为本方法优选实施例,还公开了不同建模方法所构建的高光谱鉴别模型鉴别准确率的对比,具体如下:
为综合分析不同分类鉴别模型性能,本方法设计了包含偏最小二乘判别模型(PLS)、粒子群算法(PSO)算法优化SVM、蝗虫算法优化(GOA)算法优化SVM和BWO-SVM四种算法的广陈皮陈化年份鉴别实验。其中,输入样本数据均采用了SG_detrend预处理算法,特征波段分别采用了未经降维算法处理的全波段(FULL)、连续投影算法(SPA)特征波段集合和CARS_SR特征波段集合,结果对比发现如下表:
从上表可知,首先,从降维算法的角度看,与全波段相比,SPA算法和CARS_SR算法均能够在一定程度上剔除冗余信息,进而提升鉴别模型的各项性能;其次,从分类鉴别模型的角度看,与PLS模型相比,SVM模型能够得到更好的鉴别结果,尤其是基于全波段的FULL-BWO-SVM模型对广陈皮年份鉴别的准确率(95.18%)高于基于CARS_SR降维算法处理后的SPA-PLS模型(91.57%);最后,从优化算法的角度看,与PSO算法和GOA算法相比,BWO算法优化SVM模型的实验结果具有明显优势,也验证了BWO算法寻优效率高、不易于陷入局部最优等特点。
综上,SG_detrend-CARS_SR-BWO-SVM模型性能最好,对广陈皮陈化年份的鉴别准确率达到97.59%,RMSE为0.0602,R2为0.9529,该误差主要来自高陈化年份的广陈皮的样本数据,该模型比次优模型SG_detrend-SPA-BWO-SVM提升了1.20个百分点,比对照模型CARS_SR-PSO-SVM提升了4.82个百分点。
如图2所示,一种广陈皮陈化年份高光谱鉴别系统,包括:
预处理模块,用于获取广陈皮的原始高光谱数据并进行预处理,得到高光谱数据;
降维模块,用于对高光谱数据进行降维处理,得到降维后的高光谱数据;
训练模块,用于利用降维后的高光谱数据训练BWO-SVM模型,得到高光谱鉴别模型;
鉴别模块,用于将待测广陈皮输入高光谱鉴别模型中,得到鉴别结果。
上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (8)
1.一种广陈皮陈化年份高光谱鉴别方法,其特征在于,包括以下步骤:
获取广陈皮的原始高光谱数据并进行预处理,得到高光谱数据;
对高光谱数据进行降维处理,得到降维后的高光谱数据;
利用降维后的高光谱数据训练BWO-SVM模型,得到高光谱鉴别模型;
将待测广陈皮输入高光谱鉴别模型中,得到鉴别结果。
2.根据权利要求1所述一种广陈皮陈化年份高光谱鉴别方法,其特征在于,所述获取广陈皮的原始高光谱数据并进行预处理,得到高光谱数据这一步骤,具体包括:
获取广陈皮的原始高光谱数据;
对原始高光谱数据进行平滑处理,得到平滑的高光谱数据;
对平滑的高光谱数据进行去趋势处理,得到高光谱数据。
3.根据权利要求1所述一种广陈皮陈化年份高光谱鉴别方法,其特征在于,所述对高光谱数据进行降维处理,得到降维后的高光谱数据这一步骤,具体包括:
利用竞争性自适应重加权算法对高光谱数据进行特征提取,得到特征波长;
利用逐步回归算法对特征波长进行筛选,得到降维后的高光谱数据。
4.根据权利要求3所述一种广陈皮陈化年份高光谱鉴别方法,其特征在于,所述利用竞争性自适应重加权算法对高光谱数据进行特征提取,得到特征波长这一步骤,具体包括:
利用蒙特卡洛采样法对高光谱数据进行随机采样,并将采样的高光谱数据作为训练集,剩余的高光谱数据作为预测集;
利用训练集构建偏最小二乘法回归,并基于权重公式计算偏最小二乘法回归中波长的权重;
利用衰减指数法计算保留的波长点的比例,并按照保留的波长点的比例对训练集进行筛选,得到剩余波长作为特征波长子集;
采用自适应加权算法从剩余波长中提取变量子集,并基于变量子集计算交叉验证均方根误差;
利用蒙特卡洛采样法从剩余波长中进行随机采样执行循环提取,直至剩余两波长停止循环,得到每次采样后的特征波长子集及其对应的交叉验证均方根误差;
选取交叉验证均方根误差最小对应的特征波长子集作为特征波长。
5.根据权利要求3所述一种广陈皮陈化年份高光谱鉴别方法,其特征在于,所述利用逐步回归算法对特征波长进行筛选,得到降维后的高光谱数据这一步骤,具体包括:
对特征波长中每个波长分别构建一元回归模型;
计算每个波长对应的回归系数检验统计量;
选取最大的检验统计量与预定值进行比较,判断到最大的检验统计量大于预定值,选取最大的检验统计量对应的波长;
将选取的波长分别与剩余波长构建二元回归模型执行循环构建,直至判断到最大的检验统计量小于等于预定值停止循环,得到降维后的高光谱数据。
6.根据权利要求1所述一种广陈皮陈化年份高光谱鉴别方法,其特征在于,所述利用降维后的高光谱数据训练BWO-SVM模型,得到高光谱鉴别模型这一步骤,具体包括:
从降维后的高光谱数据中选取部分高光谱数据作为黑寡妇蜘蛛;
基于适应度函数计算黑寡妇蜘蛛的适应度值;
根据适应度值计算黑寡妇蜘蛛的性信息素值;
基于黑寡妇蜘蛛不同运动方式更新黑寡妇蜘蛛位置;
计算更新位置后的黑寡妇蜘蛛的性信息素值;
剔除性信息素值小于等于预设值的黑寡妇蜘蛛,并补充新的黑寡妇蜘蛛;
将新的黑寡妇蜘蛛与留存的黑寡妇蜘蛛作为一个群体执行循环评估,直至判断到达到迭代次数停止循环,得到黑寡妇蜘蛛最优位置和高光谱鉴别模型。
7.根据权利要求6所述一种广陈皮陈化年份高光谱鉴别方法,其特征在于,所述适应度函数的计算公式,具体如下:
fitness=argmin(RMSESVMpredict);
上式中,SVMpredict表示支持向量机模型预测值,RMSE表示均方根误差。
8.一种广陈皮陈化年份高光谱鉴别系统,其特征在于,包括:
预处理模块,用于获取广陈皮的原始高光谱数据并进行预处理,得到高光谱数据;
降维模块,用于对高光谱数据进行降维处理,得到降维后的高光谱数据;
训练模块,用于利用降维后的高光谱数据训练BWO-SVM模型,得到高光谱鉴别模型;
鉴别模块,用于将待测广陈皮输入高光谱鉴别模型中,得到鉴别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211353185.5A CN115909324A (zh) | 2022-11-01 | 2022-11-01 | 一种广陈皮陈化年份高光谱鉴别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211353185.5A CN115909324A (zh) | 2022-11-01 | 2022-11-01 | 一种广陈皮陈化年份高光谱鉴别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115909324A true CN115909324A (zh) | 2023-04-04 |
Family
ID=86480647
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211353185.5A Pending CN115909324A (zh) | 2022-11-01 | 2022-11-01 | 一种广陈皮陈化年份高光谱鉴别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115909324A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116465840A (zh) * | 2023-05-17 | 2023-07-21 | 广州光信科技有限公司 | 一种陈皮年份快速鉴别的装置及方法 |
-
2022
- 2022-11-01 CN CN202211353185.5A patent/CN115909324A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116465840A (zh) * | 2023-05-17 | 2023-07-21 | 广州光信科技有限公司 | 一种陈皮年份快速鉴别的装置及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105928901B (zh) | 一种定性定量相结合的近红外定量模型构建方法 | |
US7899625B2 (en) | Method and system for robust classification strategy for cancer detection from mass spectrometry data | |
CN110717368A (zh) | 一种纺织品定性分类方法 | |
Mallik et al. | Classification of wood micrographs by image segmentation | |
CN111089856B (zh) | 一种拉曼光谱弱信号提取的后处理方法 | |
Tripathi et al. | Optimized deep learning model for mango grading: Hybridizing lion plus firefly algorithm | |
CN110987866A (zh) | 一种汽油性质评价方法及装置 | |
CN115909324A (zh) | 一种广陈皮陈化年份高光谱鉴别方法及系统 | |
CN117893537B (zh) | 托盘表面材质的脱色检测方法及系统 | |
CN115436343A (zh) | 异源激光诱导击穿光谱之间的迁移和标准化方法及系统 | |
JP2021092467A (ja) | データ解析システム及びデータ解析方法 | |
CN118190859A (zh) | 一种羊毛羊绒纤维的快速鉴别方法 | |
CN108120694B (zh) | 用于晒红烟化学成分分析的多元校正方法及系统 | |
CN117538287A (zh) | 一种无损检测黄冠梨果磷含量的方法及装置 | |
CN116026780B (zh) | 基于串联策略波长选择的包衣吸湿率在线检测方法及系统 | |
CN114062306B (zh) | 一种近红外光谱数据分段预处理方法 | |
CN117312968A (zh) | 一种盐碱农田土壤有机质含量的预测方法 | |
CN115015120B (zh) | 一种傅里叶红外光谱仪及其温漂在线校正方法 | |
Nie et al. | Machine vision-based apple external quality grading | |
CN115541531A (zh) | 基于二维相关光谱预测饲料中蛋白质含量的方法 | |
JP7203252B2 (ja) | 紙巻きタバコの主流煙のスペクトルデータの官能評価方法 | |
Niu et al. | Tobacco shred varieties classification using Multi-Scale-X-ResNet network and machine vision | |
CN111693488B (zh) | 基于ds证据理论融合的水果等级分类方法及系统 | |
CN114863286A (zh) | 一种基于多算法协同选优的混合废塑料分类方法 | |
CN112733775A (zh) | 基于深度学习的高光谱影像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |