CN116008225A - 高光谱成像叶用银杏叶总黄酮含量检测方法 - Google Patents
高光谱成像叶用银杏叶总黄酮含量检测方法 Download PDFInfo
- Publication number
- CN116008225A CN116008225A CN202210661961.1A CN202210661961A CN116008225A CN 116008225 A CN116008225 A CN 116008225A CN 202210661961 A CN202210661961 A CN 202210661961A CN 116008225 A CN116008225 A CN 116008225A
- Authority
- CN
- China
- Prior art keywords
- model
- plsr
- prediction model
- rmse
- leaves
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
Landscapes
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
一种高光谱成像叶用银杏叶总黄酮含量检测方法,步骤包括:1)先采集银杏叶片的光谱图像;2)然后对光谱图像进行处理;3)最后采用叶总黄酮含量预测模型通过叶片的光谱图像,对叶片进行总黄酮含量检测;预测模型是采用偏最小二乘回归法PLSR和支持向量回归法SVR,分别基于全波段和特征波段建立的预测模型。本发明能够满足实际生产需要,从而为叶用银杏的精确生产与管理提供技术支持和理论依据。本发明为叶用银杏快速、无损及随机检测提供了一个全新的方法,从而为叶用银杏的精准生产、管理与抚育等提供了技术支持和理论依据。
Description
技术领域
本发明属于无损检测技术领域,具体是一种高光谱成像叶用银杏叶总黄酮含量检测方法。
背景技术
现有技术中,银杏叶片具有重要的药用价值,其中总黄酮含量是其重要指标。传统的银杏叶黄酮类化合物检测方法,是将银杏叶的叶片进行破坏,在通过理化实验以及中国药典的总黄酮含量计算方法对实验数据进行计算得到。该检测方法耗时、耗力,且需要对叶片进行破坏。
发明内容
为了解决现有技术中存在的上述问题,本发明研究了基于高光谱成像的检测方法,提出一种高光谱成像叶用银杏叶总黄酮含量检测方法,步骤包括:
1)先采集银杏叶片的光谱图像;
2)然后对光谱图像进行处理;
3)最后采用叶总黄酮含量预测模型通过叶片的光谱图像,对叶片进行总黄酮含量检测;
预测模型是采用偏最小二乘回归法PLSR和支持向量回归法SVR,分别基于全波段和特征波段建立的预测模型。
本方法的预测模型建立过程中,把银杏叶片样本的光谱图像、理化检测得到的总黄酮含量作为数据集,并划分为测试集和训练集。使用数据集分别建立基于全波段和特征波段的偏最小二乘回归法(Partial least square regression,PLSR)和支持向量回归法(Support vector regression,SVR)预测模型。并对模型进行分析,最终得到最优的基于GA算法提取特征波长的PLSR预测模型作为本检测方法是用的基于特征波长筛选的光谱特征预测模型。
在模型分析过程中:
相比较可见近红外波段(Visual Near Infrared),短波近红外(Short-wave NearInfrared)更适合预测银杏叶总黄酮含量;
相较于SVR模型,PLSR模型预测叶用银杏黄酮含量精度更高;
基于SPA选取特征波长,能够有效改善预测模型的预测性能,其中特征波长数为40的SPA-PLSR模型性能最好;
相比较SPA算法,基于GA的特征提取方法建立的预测模型精度更高,其训练集的和RMSEc分别为0.8532和0.5403mg/g,训练集的和RMSEp分别为0.8482和0.2967mg/g,是最为理想的叶用银杏黄酮含量预测的方法。
相较于全波段预测模型,基于特征波长建立模型能较好预测银杏叶总黄酮含量,其中特征波长在1100~1200nm和1400~1500nm范围内提取较为理想;
本发明能够满足实际生产需要,从而为叶用银杏的精确生产与管理提供技术支持和理论依据。
本发明为叶用银杏快速、无损及随机检测提供了一个全新的方法,从而为叶用银杏的精准生产、管理与抚育等提供了技术支持和理论依据。
附图说明
图1是本检测方法的流程示意图;
图2是标准反射率板图像平均灰度值;
图3a~图3d是光谱图像与感兴趣区域图像;其中:
图3a是可见近红外波段均值光谱曲线;
图3b是近红外第50通道光谱图像;
图3c是可见近红外感兴趣区域模板图像;
图3d是近红外感兴趣区域模板图像;
图4a是可见近红外波段均值光谱曲线;
图4b是短波近红外波段均值光谱曲线;
图5a和图5b是最优GA-PLSR预测模型性能及选取的特征波段;其中:
图5a表示均方根误差变化;
图5b表示特征波长。
具体实施方式
本发明在搭建包含可见近红外(Visual near-infrared,VIS/NIR)和短波近红外(Short-wave near-infrared,SWNIR)波段的高光谱检测系统的基础上,采集400~1700nm光谱范围的光谱图像,建立光谱信息与叶用银杏黄酮含量的预测模型,比较研究适合叶用银杏黄铜含量预测的模型;对特征波长选取的方法进行研究,以优化改善模型的预测性能,从而建立适合实际需要的叶用银杏黄酮含量的检测新方法,同时为叶用银杏的精确生产与管理提供技术支持和理论依据。
下面结合符合于具体实施方式对本检测方法进一步说明。
1.材料与方法
1.1高光谱成像系统
本实施例中,图像采集平台参照中国专利“2020217166768,多光源环境的食品高光谱无损检测的图像采集平台”搭建。
图像采集平台的相机采用推扫式成像的可见近红外高光谱相机(GaiaField-V10E-AZ4)和近红外高光谱相机(GaiaField-N17E)各一台、两套穹顶光源系统。另外还用到采集电脑(T570,Lenovo,中国)、不间断电源(C3k,山特,中国)和传送台。每台相机都配备了一套相同的光源系统,其中包含了12个卤素等(Philips,50w halogen 12V),由UPS提供稳定电源。
将叶片置于黑底橡胶材质的载物台上,在样本通过相机线扫描区域时进行图像采集。光源系统采用反射式穹顶照明,将卤素灯的光源直射在穹顶上给予样本一个柔和、均匀的漫反射照明,从而减少外界干扰,减少光源直射产生的因高温而导致的样本水分丢失。该系统能够获取被测对象在400~1700nm范围的反射光谱图像。
另外,本实施例的数据处理及模型建立等均采用Matlab R2017b(The MathWorksInc.,美国)软件完成。
1.2材料
本实施例采用的银杏叶采摘于江苏省邳州市某叶用银杏圃,均为2至5年的原生苗叶片。叶片保存在温度为4摄氏度的保温箱中,运送至无损检测实验室,分别进行图像采集及总黄酮含量检测。
1.3叶片总黄酮含量测定
将银杏叶叶片称重后,放入烘箱内至叶片恒重;将干叶片碾碎成粉末状,置于圆底烧瓶内,加入25%的盐酸5ml、甲醇30ml,于80℃中水浴回流1.5个小时;过滤掉残渣,取滤液于容量瓶中,待恒温后加甲醇至50ml待测。
本实施例采用的标准品为槲皮素、山奈酚、异鼠李素。采用万分天平分别称取5.7mg的槲皮素、5.7mg的山奈酚、2.1mg的异鼠李素溶于100ml的甲醇溶液中,分别取50ml、20ml、10ml、5ml、2ml、1ml稀释至50ml后过过滤膜,装于色谱瓶中待测。标准品的配制共三份,以实现三次重复实验,保证实验数据的可靠性。
采用高效液相色谱仪(alliance e2695,waters,美国)测定标准品和实验样品的总黄酮含量,柱温为30℃,检测波长为254nm,流动相为甲醇-0.1%甲酸溶液(1:1),流速1ml/min,进样量为10ul。
根据中国药典的总黄酮含量计算方法,银杏叶的总黄酮含量由叶片中的槲皮素、山柰酚和异鼠李素的含量相加,再乘以2.51来表示[24]。
1.4光谱数据获取与处理
1.4.1光谱图像获取
打开光源系统进行预热并将照度计(tes-1339,泰仕,中国)置于相机视场区域内,待照度计数值稳定后进行图像采集。可见近红外高光谱相机采集的高光谱图像分辨率为669×800,光谱范围为336.20~1092.50nm,光谱间隔为5.5nm,每次扫描生成一个150通道的光谱图像;短波近红外高光谱相机采集的光谱图像的分辨率550×640nm,光谱范围为874.00~1731.00nm,光谱间隔为1.70nm,每次扫描生成512个波段的光谱图像。
1.4.2光谱曲线提取
采用高光谱成像建立预测模型,主要是从光谱图像中提取出有用的光谱信息,即兴趣区域(Region of Interest,ROI)进行建模。兴趣区域的获取是从最初的局部区域转变成全局区域,本发明根据叶片与背景区域反射率不同,通过阈值分割的方法获取完整的叶片兴趣区域[25-27]。对兴趣区域内像素点的反射率值取均值,获得一个包含每个样本所有通道的平均光谱曲线,计算公式如下:
式中Speci代表第i个通道的平均反射率光谱,代表第i个通道内像素点的反射率光谱,Ni代表第i个通道兴趣区域内的像素点个数。
1.4.3光谱图像反射率校正
在采集样本光谱图像的同时,分别采集2%、5%、10%、20%、50%、75%、99%的标准反射率板(Labspere,美国)以及黑帧图像,用于样本图像的反射率校正,以消除光照及相机暗电流对图像的影响,校正公式如下:
式中Ic代表校正后的反射率光谱图像,Iraw代表采集的原始光谱图像,Idark代表采集的低标准反射率板的光谱图像,Icalib代表采集的高标准反射率板的光谱图像,C代表对应标准反射率板的标准校正系数。
1.5特征波长提取
高光谱图像在相邻波段间存在高度关联性,因此光谱数据存在共线性和数据冗余的问题[28,29]。为能够缩短建立预测模型的时间、降低光谱数据维度和提升模型预测性能,本发明采用遗传算法(Genetic algorithm,GA)和连续投影法(Successive projectionsalgorithm,SPA)进行特征波长筛选,以获取较为理想的特征波长,寻找到适合叶用银杏黄酮含量检测特征波长。SPA算法是一种前向循环的特征变量筛选方法,能够分析各个波段之间的共线性,从而找出最具代表性的特征波长[30]。GA算法是一种通过模拟自然进化过程搜索最优解的方法。该方法对各个通道进行编码后,建立相应的适应度函数,通过选择、交叉和变异得出适应度最好的波段[31]。
1.6模型与评价
1.6.1模型
本发明采用偏最小二乘回归法(Partial least square regression,PLSR)和支持向量回归法(Support vector regression,SVR),分别基于全波段、特征波段,建立预测模型。通过比较,研究出适合叶用银杏黄酮含量的理想预测模型。PLSR是广泛应用于光谱分析的线性回归模型,可以同时实现提取变量特征、分析变量间相关性和回归建模,是光谱分析领域应用最广泛的方法之一[31]。SVR是一种采用核函数将非线性问题转化为线性问题的回归方法,通过最小化支持向量间隔来求解问题,该方法可以应用于线性问题和非线性问题的研究[32]。
1.6.2模型评价
本发明使用均方根误差(Root mean square error,RMSE)和决定系数(Coefficient of determination,R2)作为评价模型性能的指标,使用训练集的均方根误差作为模型损失函数。一般来说,RMSE越小,预测值和实际值的总体偏差越小;R2越大,预测值和实际值的拟合程度越高[33,34]。
2结果与分析
2.1理化检测与数据集划分
本实施例总计采集银杏叶样本140个,有效样本138个。四种年份的叶片总黄酮含量如表1所示。四种年份的叶片均值变化范围在2.0652~2.8128mg/g,数据跨度在银杏叶总黄酮含量正常范围内。采用留出法将四种年份的银杏叶数据划分为训练集和测试集两部分,其中104个为训练集,34个为测试集,如表2所示。训练集和测试集的均值与标准差保持在相似的数值水平和分布状况。
表1不同年份银杏叶样本总黄酮含量统计结果
表2银杏叶样本训练集与测试集总黄酮含量统计结果
2.2光谱数据分析
2.2.1系统反射率标定
本方法采集了多种标准反射率板的光谱图像。在采集图像时,使标准反射率板充满整个视场,以保证采集到的数据不被其他因素干扰。通过计算短波近红外波段相机的标准反射率板图像与黑帧的平均灰度值(如图2所示)可以发现,在光照一致的情况下,图像平均灰度值随标准反射率板反射率值的增大保持稳定的递增状态。但是头尾部波段并不遵循这一递增规律,黑帧的灰度值明显高于反射率板图像灰度值。为能够使用更标准的数据对图像进行反射率校正,本实施方式选取2%和75%的反射率板作为标准数据用于反射率校正。
2.2.2银杏叶光谱分析
在对样本光谱图像进行反射率校正后,考虑到样本背景区域与兴趣区域在特定波长处的光谱反射特性存在较大差异的特点,本文采用阈值分割算法提取图片中叶片兴趣区域。如图3a所示,可见近红外波段的背景区域和兴趣区域的光谱图像在第70到150波段的差异性较大,背景区域光谱反射率小于0.1,兴趣区域光谱反射率在0.2到0.4内。因此在第90通道,以阈值0.2进行兴趣区域提取。同理,如图3b所示,在短波近红外波段,第1到第150通道背景与兴趣区域差异较大。因此选择第50通道,以阈值0.2进行兴趣区域提取。图3c和图3d分别为可见近红外和短波近红外波段提取的兴趣区域模板图像。
通过制作的兴趣区域模板,将三维的高光谱图像转化为均值光谱曲线,去除短波近红外波段噪声较大的头尾光谱后剩余的1058~1599nm,其均值光谱曲线如图4所示。由图可看出,叶片整体均值光谱变化趋势基本保持一致,说明采集的光谱图像具备良好的一致性。并且各个样本的光谱均值表现出一定的差异性,表明采集的样本间存在差异性,数据具有较强的泛化性。
2.3银杏叶总黄酮含量预测模型建立
2.3.1全波段预测模型
采用偏最小二乘回归法和支持向量回归法,分别在可见近红外和短波近红外的光谱数据上建立总黄酮含量预测模型,最佳回归模型性能如表3所示。
表3全波段预测模型性能
在建模过程中,偏最小二乘回归法采用k折交叉验证的方式对训练集进行验证,为降低训练过程中的过拟合,设置交叉验证次数为5[33][33]。建立主成分数从1到50的PLSR预测模型,通过对比不同主成分数模型的性能,选取最佳结果。由表3可见,在可见近红外波段下,随主成分数增大,模型的训练集拟合效果逐渐提升,在测试集上RMSEp先提高再降低,在主成分数为4时,模型的性能提到最高。因此在可见近红外波段选择的最优模型主成分数是4,训练集的和RMSEc分别为0.4329和0.6771mg/g,测试集的和RMSEp分别为0.3013和0.8758mg/g。在短波近红外波段下,采用相同的方法选取最佳主成分数,最优模型的主成分数是10,训练集的和RMSEc分别为0.6180和0.6371mg/g,测试集的和RMSEp分别为0.5496和0.6384mg/g。从中可以发现,在可见近红外波段上,模型在主成分数为4达到最佳,当主成分数进一步增加时,模型逐渐开始趋于过拟合,PLSR模型在初始阶段便进入过拟合状态表明该模型在可见近红外波段较难预测出总黄酮含量(在可见近红外波段预测黄酮含量的准确性较低);在短波近红外波段上,模型在主成分数为13时达到最佳,相比于前者,该方法能够提取出更多的主成分,建立模型时能够应用更多的光谱信息;因此,短波近红外波段的光谱数据更加适合建立总黄酮含量的PLSR模型。
在基于支持向量回归法建立预测模型的过程中,采用网格搜索的方式获得最佳性能模型参数。在可见近红外波段下,训练集的和RMEc分别为0.5322和0.5879mg/g,测试集的和RMSEp分别为0.2312和0.9354mg/g。在短波近红外波段下,训练集的和RMSEc分别为0.5567和0.5063mg/g,训练集的和RMSEp分别为0.3113和0.6836mg/g。由此可见,基于此方法建立的短波近红外波段预测模型具有更高的精度。
综上所述,无论是在可见近红外还是在短波近红外波段,PLSR模型性能均优于SVR模型,采PLSR模型更加适合总黄酮含量的预测。比较研究表明,短波近红外波段预测叶用银杏的黄酮含量性能优于可见近红外波段。
2.3.2基于特征波长的预测模型
为提高预测模型的运行速度,进一步提高预测精度,本发明基于最小二乘法,建立基于特征波长的预测模型,研究特征波长提取方法对预测精度的影响。本发明在短波近红外波段,设定指定波长为60,基于GA和SPA方法筛选特征波长,分别选取特征波长数为20、30、40、50、60时建模,模型性能如表4所示。
表4特征波段预测模型性能
SPA算法是一种用于消除波段间冗余信息的方法。由表可见,在无论是训练集,还是测试集,5种SPA-PLSR模型的性能相较于PLSR模型均有一定提升,通过SPA提取特征波长,能够降低数据间的冗余并且提升预测模型的性能。其中采用特征波长数为40的SPA-PLSR模型性能最好,其训练集的和RMSEc分别为0.6533和0.5857mg/g,测试集的和RMSEp分别为0.6286和0.6944mg/g。
相比于SPA,GA算法是一种有监督学习的算法,该方法是通过最小化预测模型的RMSE来提取特征波长。本发明采用GA算法选取特征波长并建立PLSR模型,在每次迭代过程中选取最佳主成分的PLSR模型的RMSE作为代价函数,迭代次数为2000次。由表中数据可以发现,当特征波长数为20时模型性能最差,随着特征波长数增加,模型性能逐渐提升,特征波长数为50时达到最佳,其训练集的和RMSEc分别为0.8532和0.5403mg/g,测试集的和RMSEp分别为0.8482和0.2967mg/g。由此可见,在采用GA-PLSR预测银杏叶总黄酮含量时,特征波长数不宜太少。对比PLSR建立的预测模型,GA-PLSR模型性能大幅度提升。图5a为GA-PLSR随遗传进化的测试集的RMSE的变化情况,模型的精度随迭代次数的增加不断提升,直到1700次时保持稳定。图5b为最终的GA-PLSR预测模型所选取的特征波段,从中可以看出,选取的特征波段主要集中在1100~1200nm和1400~1500nm范围内,采用该波段范围的光谱数据可以较好预测出银杏叶总黄酮含量。
尽管GA是一种非常耗时、耗费计算力的算法,本试验总计花费7天才完成5种特征波长数的运算,但相较于基于PLSR的全波段预测,以及基于SPA提取的特征波长预测,基于GA的特征波长预测模型精度大幅度提高,是预测叶用银杏总黄酮含量的最为理想的模型。
3结论
本发明提出来基于高光谱成像的叶用银杏叶总黄酮含量无损检测新方法,得出以下结论:
1)相比较可见近红外波段,短波近红外波段预测叶用银杏黄酮含量性能更好;
2)相较于SVR模型,PLSR模型预测叶用银杏黄酮含量精度更高。在短波近红外波段光谱数据上,PLSR模型训练集的和RMSEc分别为0.7683和0.5563mg/g,训练集的和RMSEp分别为0.5496和0.6384mg/g。
3)相较于全波段预测模型,基于特征波长建立模型能较好预测银杏叶总黄酮含量,其中特征波长在1100~1200nm和1400~1500nm范围内提取较为理想。
4)基于SPA选取特征波长,能够有效改善预测模型的预测性能,其中特征波长数为40的SPA-PLSR模型性能最好,其训练集的和RMSEc分别为0.6533和0.5857mg/g,测试集的和RMSEp分别为0.6286和0.6944mg/g。
5)相比较SPA算法,基于GA的特征提取方法建立的预测模型精度更高,其训练集的和RMSEc分别为0.8532和0.5403mg/g,训练集的和RMSEp分别为0.8482和0.2967mg/g,是最为理想的叶用银杏黄酮含量预测的方法。
本发明为叶用银杏快速、无损及随机检测提供了一个全新的方法,从而为叶用银杏的精准生产、管理与抚育等提供了技术支持和理论依据。
参考文献
[24]药店[J].
.(in Chinese with English abstract)
[25]Mikko,Geladi Paul,Rissanen Marja,et al.Hyperspectral nearinfrared image calibration and regression[J].Analytica Chimica Acta,2020,1105:56-63.
[26]Ma Ji,Sun Da-Wen.Prediction of monounsaturated andpolyunsaturated fatty acids of various processed pork meats using improvedhyperspectral imaging technique[J].Food Chemistry,2020,321:126695.
[27]LancelotCourcoux Philippe,Chevallier Sylvie,et al.Predictionof water content in biscuits using near infrared hyperspectral imagingspectroscopy and chemometrics[J].Journal of Near Infrared Spectroscopy,2020,28(3):140-147.
[28]Tang Yuweiyi,Wang Xiwei,Xing Xiaoyang,et al.Prediction andevaluation method of TVB-N values distribution in pork by hyperspectralimaging[J].International journal of agricultural and biological engineering,2021,14(3):270-276.
[29]唐海涛,孟祥添,苏循新,等.基于CARS算法的不同类型土壤有机质高光谱预测[J].农业工程学报,2021,37(02):105-113.
Haitao Tang,Xiangtian Meng,Xunxin Su,et al.2021,37(02):105-113.(inChinese with English abstract)
[30]邵园园,王永贤,玄冠涛,等.基于高光谱成像的肥城桃品质可视化分析与成熟度检测[J].农业机械学报,2020,51(08):344-350.
Yuanyuan Shao,Yongxian Wang,Guantao Xuan,et al.2020,51(08):344-350.(in Chinese with English abstract)
[31]白宗秀,朱荣光,王世昌,等.高光谱图像结合特征变量筛选定量检测羊肉中狐狸肉掺假[J].农业工程学报,2021,37(17):276-284.
Zongxiu Bai,Rongguang Zhu,Shichang Wang,et al.2021,37(17):276-284.(inChinese with English abstract)
[32]邓永鹏,朱洪芬,丁皓希,等.基于高光谱技术的退耕还林地年限判别[J].农业工程学报,2022,38(03):66-74.
Yongpeng Deng,Hongfen Zhu,Haoxi Ding,et al.2022,38(03):66-74.(inChinese with English abstract)
[33]赵茂程,吴泽本,汪希伟,等.基于光谱成像的猪肉新鲜度空间分布预测评价方法[J].农业机械学报,2022,53(03):412-422.
Maocheng Zhao,Zeben Wu,Xiwei Wang,et al.2022,53(03):412-422.(inChinese with English abstract)
[34]赵茂程,陈加新,邢晓阳,等.叶片含水率推扫式高光谱成像去条纹标定法优化[J].农业机械学报,2022,53(02):212-220.
Maocheng Zhao,Jiaxin Chen,Xiaoyang Xing,et al.2022,53(02):212-220.(inChinese with English abstract)。
Claims (6)
1.一种高光谱成像叶用银杏叶总黄酮含量检测方法,其特征是步骤包括:
1)先采集银杏叶片的光谱图像;
2)然后对光谱图像进行处理;
3)最后采用叶总黄酮含量预测模型通过叶片的光谱图像,对叶片进行总黄酮含量检测;
预测模型是采用偏最小二乘回归法PLSR和支持向量回归法SVR,分别基于全波段和特征波段建立的预测模型;
在预测模型的建立过程中,模型评价是使用均方根误差RMSE和决定系数R2作为评价模型性能的指标,使用训练集的均方根误差作为模型损失函数;RMSE越小,预测值和实际值的总体偏差越小;R2越大,预测值和实际值的拟合程度越高;
预测模型的建立和评价步骤包括:
3.1)全波段预测模型以及评价
采用偏最小二乘回归法PLSR和支持向量回归法SVR,分别在可见近红外和短波近红外的光谱数据上建立总黄酮含量预测模型;
a、PLSR预测模型
在建模过程中,采用k折交叉验证的方式对训练集进行验证,设置交叉验证次数为5;建立主成分数从1到50的PLSR预测模型,通过对比不同主成分数模型的性能,选取最佳结果;
在可见近红外波段下,随主成分数增大,PLSR预测模型的训练集拟合效果逐渐提升,在测试集上RMSEp先提高再降低;在主成分数为4时,PLSR模型的性能提到最高,则在可见近红外波段选择的最优模型主成分数是4,获得训练集的和RMSEc以及测试集的和RMSEp;
在短波近红外波段下,采用与可见近红外波段下相同的方法选取最佳主成分数,最优模型的主成分数是10,获得训练集的和RMSEc以及测试集的和RMSEp;
经分析比较:
在可见近红外波段上,PLSR预测模型在主成分数为4达到最佳,当主成分数进一步增加时,PLSR预测模型逐渐开始趋于过拟合,PLSR预测模型在初始阶段便进入过拟合状态表明该模型在可见近红外波段较难预测出总黄酮含量;
在短波近红外波段上,PLSR预测模型在主成分数为13时达到最佳,相对来说,PLSR预测模型提取出更多的主成分,建立模型时得以应用更多的光谱信息;
结论为:短波近红外波段的光谱数据更适合建立总黄酮含量的PLSR模型;
b、SVR预测模型
在建模过程中,采用网格搜索的方式获得最佳性能模型参数;
在可见近红外波段下,获得训练集的和RMSEc以及测试集的和RMSEp;
在短波近红外波段下,获得训练集的和RMSEc以及测试集的和RMSEp;
经分析比较:SVR预测模型在短波近红外波段预测模型具有更高的精度;
而在可见近红外和短波近红外波段,PLSR预测模型性能均优于SVR预测模型,采PLSR预测模型更适合总黄酮含量的预测;同时,短波近红外波段预测叶用银杏的黄酮含量性能优于可见近红外波段;
3.2)基于特征波长的预测模型
由步骤3.1)选择基于最小二乘法PLSR,建立基于特征波长的预测模型;
在短波近红外波段,设定指定波长为60,基于GA和SPA方法分别筛选特征波长,分别选取特征波长数为20、30、40、50、60时建立PLSR预测模型,基于GA和SPA方法筛选特征波长建立的PLSR和SVR预测模型分别定义为SPA-PLSR预测模型和GA-PLSR预测模型;获得各个预测模型的训练集的和RMSEc,测试集的和RMSEp;
经分析比较:5种特征波长数下的SPA-PLSR模型的性能优于PLSR模型;而采用特征波长数为40的SPA-PLSR模型性能最优;
采用GA算法选取特征波长并建立PLSR模型得到GA-PLSR预测模型,在每次迭代过程中选取步骤2.3.1)中最佳主成分的PLSR模型的RMSE作为代价函数;
经比较分析:当特征波长数为20时GA-PLSR预测模型性能最差,随着特征波长数增加,模型性能逐渐提升,特征波长数为50时达到最佳;相比较来说GA-PLSR模型性能大幅度提升;GA-PLSR预测模型随遗传进化的测试集RMSEp的变化,模型的精度随迭代次数的增加不断提升,直至稳定;对于GA-PLSR预测模型所选取的特征波段在1100~1200nm和1400~1500nm范围内光谱数据,预测银杏叶总黄酮的效果最优。
2.根据权利要求1所述的高光谱成像叶用银杏叶总黄酮含量检测方法,其特征是所述步骤1)中,采集图像时,先标定光谱图像反射率,方法为:在采集样本光谱图像的同时,分别采集2%、5%、10%、20%、50%、75%、99%的标准反射率板以及黑帧图像,用于样本图像的反射率校正,以消除光照及相机暗电流对图像的影响,校正公式如下:
式中Ic代表校正后的反射率光谱图像,Iraw代表采集的原始光谱图像,Idark代表采集的低标准反射率板的光谱图像,Icalib代表采集的高标准反射率板的光谱图像,C代表对应标准反射率板的标准校正系数。
3.根据权利要求1所述的高光谱成像叶用银杏叶总黄酮含量检测方法,其特征是所述步骤3)中,建立预测模型所需训练集c和测试集p数据的选取方法为:
对银杏叶片样本进行理化检测获得样本的总黄酮含量;同时采用步骤1)、步骤2)对银杏叶片样本进行图像采集获得样本的光谱图像;
把银杏叶样本分为训练集c和测试集p两部分,用于步骤3)中预测模型的建立。
4.根据权利要求1所述的高光谱成像叶用银杏叶总黄酮含量检测方法,其特征是所述步骤2)中,光谱图像进行处理包括:获取兴趣区域ROI,方法为:根据叶片与背景区域反射率不同,通过阈值分割的方法获取完整的叶片兴趣区域;
对兴趣区域内像素点的反射率值取均值,获得一个包含每个样本所有通道的平均光谱曲线Speci,
式中Speci代表第i个通道的平均反射率光谱,代表第i个通道内像素点的反射率光谱,Ni代表第i个通道兴趣区域内的像素点个数。
5.根据权利要求1所述的高光谱成像叶用银杏叶总黄酮含量检测方法,其特征是所述步骤1)中:可见近红外波段光谱图像是由近红外高光谱相机采集得到,光谱范围为336.20~1092.50nm;短波近红外波段光谱图像是由短波近红外高光谱相机采集得到,光谱范围为874.00~1731.00nm。
6.根据权利要求1所述的高光谱成像叶用银杏叶总黄酮含量检测方法,其特征是所述步骤3)中,基于特征波长筛选的光谱特征预测模型优选为基于GA算法提取特征波长的PLSR预测模型,定义为GA-PLSR模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210661961.1A CN116008225A (zh) | 2022-06-13 | 2022-06-13 | 高光谱成像叶用银杏叶总黄酮含量检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210661961.1A CN116008225A (zh) | 2022-06-13 | 2022-06-13 | 高光谱成像叶用银杏叶总黄酮含量检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116008225A true CN116008225A (zh) | 2023-04-25 |
Family
ID=86017932
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210661961.1A Pending CN116008225A (zh) | 2022-06-13 | 2022-06-13 | 高光谱成像叶用银杏叶总黄酮含量检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116008225A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117074353A (zh) * | 2023-08-18 | 2023-11-17 | 广东省农业科学院设施农业研究所 | 一种荔枝果实蒂蛀虫无损检测方法和系统 |
-
2022
- 2022-06-13 CN CN202210661961.1A patent/CN116008225A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117074353A (zh) * | 2023-08-18 | 2023-11-17 | 广东省农业科学院设施农业研究所 | 一种荔枝果实蒂蛀虫无损检测方法和系统 |
CN117074353B (zh) * | 2023-08-18 | 2024-05-03 | 广东省农业科学院设施农业研究所 | 一种荔枝果实蒂蛀虫无损检测方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Nondestructive measurement of soluble solids content in apple using near infrared hyperspectral imaging coupled with wavelength selection algorithm | |
Hu et al. | Estimating blueberry mechanical properties based on random frog selected hyperspectral data | |
Wei et al. | Modeling for SSC and firmness detection of persimmon based on NIR hyperspectral imaging by sample partitioning and variables selection | |
Wang et al. | Application of long-wave near infrared hyperspectral imaging for determination of moisture content of single maize seed | |
CN108663339B (zh) | 基于光谱和图像信息融合的霉变玉米在线检测方法 | |
Jiang et al. | Nondestructive visualization and quantification of total acid and reducing sugar contents in fermented grains by combining spectral and color data through hyperspectral imaging | |
Lin et al. | Freshness measurement of eggs using near infrared (NIR) spectroscopy and multivariate data analysis | |
Wang et al. | Model fusion for prediction of apple firmness using hyperspectral scattering image | |
CN102495005B (zh) | 高光谱图像技术诊断作物水分亏缺的方法 | |
CN106596416A (zh) | 一种基于高光谱成像技术的冷鲜肉品质无损检测方法 | |
Yao et al. | Nondestructive detection for egg freshness grade based on hyperspectral imaging technology | |
Hu et al. | Prediction of mechanical properties of blueberry using hyperspectral interactance imaging | |
Li et al. | Optical sensing system for detection of the internal and external quality attributes of apples | |
Wang et al. | Rapid detection of protein content in rice based on Raman and near-infrared spectroscopy fusion strategy combined with characteristic wavelength selection | |
CN110398473A (zh) | 一种农产品产地检测方法及系统 | |
CN107907500A (zh) | 一种羊肉产地的检测方法 | |
CN116008225A (zh) | 高光谱成像叶用银杏叶总黄酮含量检测方法 | |
Yu et al. | Rapid and visual measurement of fat content in peanuts by using the hyperspectral imaging technique with chemometrics | |
CN111445469A (zh) | 一种基于高光谱的苹果冲击后损伤参数的无损预测方法 | |
Zhao et al. | Hyperspectral imaging coupled with random frog and calibration models for assessment of total soluble solids in mulberries | |
Bai et al. | Model robustness in estimation of blueberry SSC using NIRS | |
CN116026795A (zh) | 一种基于反射透射光谱的水稻籽粒品质性状无损预测方法 | |
Guo et al. | Method and system for nondestructive detection of freshness in Penaeus vannamei based on hyperspectral technology | |
Verdú et al. | Laser scattering imaging combined with CNNs to model the textural variability in a vegetable food tissue | |
Weng et al. | Reflectance spectroscopy with operator difference for determination of behenic acid in edible vegetable oils by using convolutional neural network and polynomial correction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |