CN115728278B - 枸杞子储存年份鉴别方法、终端设备及存储介质 - Google Patents
枸杞子储存年份鉴别方法、终端设备及存储介质 Download PDFInfo
- Publication number
- CN115728278B CN115728278B CN202211466006.9A CN202211466006A CN115728278B CN 115728278 B CN115728278 B CN 115728278B CN 202211466006 A CN202211466006 A CN 202211466006A CN 115728278 B CN115728278 B CN 115728278B
- Authority
- CN
- China
- Prior art keywords
- front surface
- eemnet
- storage
- fluorescence
- year
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003860 storage Methods 0.000 title claims abstract description 84
- 238000000034 method Methods 0.000 title claims abstract description 50
- 244000241838 Lycium barbarum Species 0.000 title claims description 97
- 235000015459 Lycium barbarum Nutrition 0.000 title claims description 97
- 235000015468 Lycium chinense Nutrition 0.000 title claims description 94
- 235000013399 edible fruits Nutrition 0.000 title claims description 65
- 238000012549 training Methods 0.000 claims abstract description 49
- 235000017784 Mespilus germanica Nutrition 0.000 claims abstract description 30
- 235000000560 Mimusops elengi Nutrition 0.000 claims abstract description 30
- 235000007837 Vangueria infausta Nutrition 0.000 claims abstract description 30
- 238000012360 testing method Methods 0.000 claims abstract description 27
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 19
- 230000035945 sensitivity Effects 0.000 claims abstract description 16
- 244000182216 Mimusops elengi Species 0.000 claims description 27
- 238000002189 fluorescence spectrum Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 18
- 230000005284 excitation Effects 0.000 claims description 15
- 239000000843 powder Substances 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 15
- 238000011176 pooling Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 8
- 230000009467 reduction Effects 0.000 claims description 7
- 239000007787 solid Substances 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 14
- 240000002624 Mespilus germanica Species 0.000 abstract 3
- 238000010586 diagram Methods 0.000 description 18
- 238000001228 spectrum Methods 0.000 description 9
- 238000013145 classification model Methods 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 239000000463 material Substances 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000001069 Raman spectroscopy Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 229930003935 flavonoid Natural products 0.000 description 2
- 150000002215 flavonoids Chemical class 0.000 description 2
- 235000017173 flavonoids Nutrition 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 150000007965 phenolic acids Chemical class 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- RODXRVNMMDRFIK-UHFFFAOYSA-N scopoletin Chemical compound C1=CC(=O)OC2=C1C=C(OC)C(O)=C2 RODXRVNMMDRFIK-UHFFFAOYSA-N 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- XEHFSYYAGCUKEN-UHFFFAOYSA-N Dihydroscopoletin Natural products C1CC(=O)OC2=C1C=C(OC)C(O)=C2 XEHFSYYAGCUKEN-UHFFFAOYSA-N 0.000 description 1
- 244000241872 Lycium chinense Species 0.000 description 1
- 241000208292 Solanaceae Species 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- GAMYVSCDDLXAQW-AOIWZFSPSA-N Thermopsosid Natural products O(C)c1c(O)ccc(C=2Oc3c(c(O)cc(O[C@H]4[C@H](O)[C@@H](O)[C@H](O)[C@H](CO)O4)c3)C(=O)C=2)c1 GAMYVSCDDLXAQW-AOIWZFSPSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 229930013930 alkaloid Natural products 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000021466 carotenoid Nutrition 0.000 description 1
- 150000001747 carotenoids Chemical class 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013211 curve analysis Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- 229930003944 flavone Natural products 0.000 description 1
- 150000002212 flavone derivatives Chemical class 0.000 description 1
- 235000011949 flavones Nutrition 0.000 description 1
- 238000001506 fluorescence spectroscopy Methods 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 235000009048 phenolic acids Nutrition 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- FWYIBGHGBOVPNL-UHFFFAOYSA-N scopoletin Natural products COC=1C=C2C=CC(OC2=C(C1)O)=O FWYIBGHGBOVPNL-UHFFFAOYSA-N 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007873 sieving Methods 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- VHBFFQKBGNRLFZ-UHFFFAOYSA-N vitamin p Natural products O1C2=CC=CC=C2C(=O)C=C1C1=CC=CC=C1 VHBFFQKBGNRLFZ-UHFFFAOYSA-N 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Landscapes
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本发明公开了一种枸杞子储存年份鉴别方法、终端设备及存储介质,基于前表面荧光技术鉴别宁夏枸杞子储存年份的方法,通过基于卷积神经网络的EEMnet模型很好地实现了不同储存年份枸杞子的分类,其中训练集、测试集以及预测集的分类准确度均为98%以上,此外各储存年份的灵敏度和特异性也均在94%以上,充分证明本发明提出的基于前表面荧光技术结合深度卷积神经网络建立的EEMnet模型可以快速且可靠地鉴别宁夏枸杞子样本的储存年份。
Description
技术领域
本发明涉及利用深度学习进行储存年份鉴别的技术,特别是一种枸杞子储存年份鉴别方法、终端设备及存储介质。
背景技术
随着人们生活水平的提高和保健意识的增强,近些年的枸杞子需求量增大,带动了枸杞的种植和扩张,但由于市场需求的有限,枸杞子出现产能过剩的情况,一些不良商家为了谋求利益,将陈旧的枸杞子进行熏硫冒充当季枸杞子,严重损害消费者的权益。根据相关研究表明枸杞子在储存时间的增加,其内部的活性成分,如枸杞多糖,黄酮类成分、类胡萝卜素含量呈下降趋势,严重影响枸杞子的品质。因此,实现不同储藏储存年份枸杞子的快速鉴别十分重要。
目前,枸杞子储藏储存年份的鉴别主要依据枸杞子的颜色、气味和触感等感观的传统经验进行区分,这些方法通常受到主观因素的影响,很大程度上依赖操作人员的先验知识,在实际的生产应用过程中需要具有高技术的专业人员。前表面荧光光谱法是一项新型的检测技术,是基于分子被光子激发而产生荧光的特性,对非透明液体或固体样品进行检测。其避免了复杂的样本预处理过程,具有快速、灵敏的特点,同时对样本可以进行回收而被广泛地应用于食品质量的检测分析领域。
CN115186980A提供了一种陈皮年份鉴定方法和系统,该方案采用GC-MS方法,需要繁杂的实验处理及优化步骤和使用大量的有机溶剂,鉴定过程复杂,成本高昂,鉴定后的样品不可回收利用。
发明内容
本发明所要解决的技术问题是,针对现有技术不足,提供一种枸杞子储存年份鉴别方法、终端设备及存储介质,快速且准确鉴别不同储藏储存年份枸杞子。
为解决上述技术问题,本发明所采用的技术方案是:一种枸杞子储存年份鉴别方法,包括以下步骤:
S1、采集不同储存年份、不同批次的若干枸杞子样品,获得枸杞子的前表面荧光三维数据阵列;
S2、利用前表面荧光三维数据阵列获得训练集。
S3、利用所述训练集训练卷积神经网络的EEMnet模型,得到年份鉴别模型。
本发明获取枸杞子的前表面三维荧光光谱构建数据集,基于该数据集获得训练集,进而训练获得年份鉴别模型,巧妙地结合了前表面荧光光谱法和深度学习方法,避免了复杂的样本预处理过程,提高了枸杞子储存年份鉴别的效率和准确性。同时,采用本发明的方法,鉴定后的样品可以回收,节省样本资源,环保。
本发明中,为了得到合适的荧光强度,以及在短时间内获得比较完整的光谱,步骤S1的具体实现过程包括:
设置荧光分光光度计激发波长范围为200~500nm,发射波长范围为220~650nm,波长间隔均为5nm,狭缝宽度为5nm,电压为550V,扫描速度为30000nm·min-1,将装有枸杞子粉末的样本粉末池置于荧光分光光度计的固体支架中,入射角度为60°进行扫描,获得前表面三维荧光光谱;
将所有样本对应的前表面三维荧光光谱沿着样本维度排列,构建激发-发射-样本(激发样本数×发射波长数×样本数)的前表面荧光三维数据阵列。
本发明中,为了进一步提高枸杞子储存年份鉴别的效率和准确性,步骤S1之后,步骤S2之前,还包括:对所述前表面荧光三维数据阵列进行预处理,获得前表面三维荧光光谱数据集(即预处理后的前表面荧光三维数据阵列),具体实现过程包括:
选择设定的激发波长和发射波长范围,剔除散射数据,然后将得到的数据进行归一化处理,使得前表面荧光三维数据阵列中的每个数值范围在-1到1之间,得到前表面三维荧光光谱数据集
为了训练和评估枸杞子年份鉴别模型,上述步骤S2中,将所述的前表面三维荧光光谱数据集分为训练集、测试集和预测集;
步骤S3之后,还包括:
S4、利用所述训练集,测试集和预测集评估EEMnet模型的分类性能。
步骤S4的具体实现过程包括:
将所述训练集、测试集和预测集载入EEMnet模型,计算枸杞子样本分类的准确率、特异性和灵敏度;
将所述训练集作为年份鉴别模型的输入,获得得分数据,利用所述得分数据和所述训练集的真实标签,绘制ROC曲线;
利用训练集、测试集和预测集获得的EEMnet模型的第二层全连接层数据,绘制tSNE降维分析图。
准确度、特异性和灵敏度是常规的评价分类的指标,数值的大小可以分析模型的分类的好坏;ROC曲线将灵敏度和特异度以图示的方法结合在一起,可准确地反映某分析方法灵敏度和特异度的关系,同时ROC曲线可以很容易地查出一个分类器在某个阈值时对样本的识别能力;tSNE降维分析图是将模型获得的数据进行降维处理并可视化,主要是提供一种可视化的方式说明EEMnet模型的分类性能。
本发明中,所述EEMnet模型包括依次连接的第一卷积层、第一池化层、第二卷积层、第二池化层、串联的三个全连接层、Softmax层。
作为一个发明构思,本发明还提供了一种终端设备,包括存储器、处理器及存储在存储器上的计算机程序;所述处理器执行所述计算机程序,以实现本发明上述方法的步骤。
作为一个发明构思,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序/指令;所述计算机程序/指令被处理器执行时实现本发明上述方法的步骤。
与现有技术相比,本发明所具有的有益效果为:本发明基于前表面荧光技术鉴别宁夏枸杞子储存年份的方法,通过基于卷积神经网络的EEMnet模型很好地实现了不同储存年份枸杞子的分类,其中训练集、测试集以及预测集的分类准确度均为98%以上,此外各储存年份的灵敏度和特异性也均在94%以上,充分证明本发明提出的基于前表面荧光技术结合深度卷积神经网络建立的EEMnet模型可以快速且可靠地鉴别宁夏枸杞子样本的储存年份,为中药材储存年份鉴别提供了新的思路,为准确、快速、可靠地检测枸杞子的药用价值和品质提供依据。
附图说明
图1为前表面荧光技术结合深度学习鉴别宁夏枸杞子年份的流程图;
图2(a)~图2(c)为2018年宁夏枸杞子前表面三维荧光光谱的等高线图,其中图2(a)为原始光谱图,图2(b)为剔除散射后的光谱图,图2(c)为通过插值法处理后的光谱图;
图3为宁夏枸杞子分类模型EEMnet的结构图;
图4(a)~图4(d)为不同储存年份的宁夏枸杞子通过插值法处理后的光谱图,其中图4(a)为2018年的枸杞子光谱图,图4(b)为2019年的枸杞子光谱图,图4(c)为2020年的枸杞子光谱图,图4(d)为2021年的枸杞子光谱图;
图5为利用EEMnet模型获得的训练集得分数据以及训练集的真实标签,绘制的ROC曲线图;
图6为利用训练集、测试集和预测集获得的EEMnet模型的第二层全连接层数据,绘制的tSNE降维分析图,其中圆形为训练集,五角星为测试集,正方形为预测集;
图7(a)~图7(h)为不同储存年份枸杞子的EEMnet模型的两个卷积层通道图,其中图7(a)~图7(d)分别为2018年,2019年,2020年以及2021年枸杞子第一层卷积层的通道图,图7(e)~图7(h)分别为2018年,2019年,2020年以及2021年枸杞子第二层卷积层的通道图;
图8(a)~图8(d)为采用梯度积分算法后不同储存年份枸杞子的模型特征重要性图,其中图8(a)为2018年枸杞子的特征重要性图,图8(b)为2019年枸杞子的特征重要性图,图8(c)为2020年枸杞子的特征重要性图,图8(d)为2021年枸杞子的特征重要性图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
前表面荧光技术因具有避免复杂的样品预处理过程以及可实现样品的回收等优点,已经被广泛地应用于环境以及食品领域中,其中在中药材的鉴别和质量评价方面发挥着重要的作用,枸杞子内部含有多种内源性荧光物质,例如黄酮类、生物碱类、酚酸类、氨基酸与蛋白质等,这些内源性荧光物质为评价枸杞子质量提供依据,目前对于枸杞子储存年份鉴别的相关研究较少。本发明实施例1基于前表面荧光技术结合深度卷积神经网络模型对不同储存年份的宁夏枸杞子进行识别,本实施例的基于前表面荧光技术鉴别宁夏枸杞子鉴别方法,包括采集宁夏枸杞子的前表面三维荧光光谱,利用训练集构建基于卷积神经网络的宁夏枸杞子分类模型EEMnet,并通过训练集、测试集和预测集评估模型分类的性能,进而鉴定枸杞子样本的储存年份。
以下将更详细地描述本发明的示例性实施方法,提供这些实施方式目的是能够更透彻地理解本发明,并且可以将本发明的范围完整地传达给本领域的技术人员。
本实施例提供的基于前表面荧光技术鉴别宁夏枸杞子储存年份的方法,通过前表面荧光技术结合深度卷积神经网络鉴别不同储存年份的宁夏枸杞子,过程包括:
S1、预先获取不同储存年份枸杞子的前表面荧光光谱
采集不同储存年份的若干宁夏枸杞子样品,分别称取枸杞子粉末0.5000g,置于样品粉末池中,设置荧光分光光度计激发波长范围为200~500nm,发射波长范围设置为220~650nm、波长间隔均为5nm,狭缝宽度为5nm,电压为550V,扫描速度为30000nm·min-1,将装有枸杞子粉末的样本粉末池置于荧光分光光度计的固体支架中,入射角度为60°进行扫描,获得前表面三维荧光光谱,所有样本均使用同一规格的样品粉末池进行扫描;
S2、训练集、测试集和预测集的获取
将所有的样本获得的前表面三维荧光光谱沿着样本维度进行排列,构建激发-发射-样本的三维数据阵列,选择合适的激发波长和发射波长范围,剔除散射数据,并将获得的数据进行归一化处理,得到前表面三维荧光光谱数据集。将获得的前表面三维荧光光谱数据集沿着样本的维度进行采集,得到训练集、测试集和预测集。
S3、利用训练集训练分类模型,获得宁夏枸杞子储存年份鉴别模型,并利用训练集、测试集和预测集评估模型的分类性能。
本实施例基于卷积神经网络设计了一种用于宁夏枸杞子储存年份鉴别的端到端分类模型,实现对不同储存年份的枸杞子样本进行判别,具体为:
所述EEMnet模型是一种基于卷积神经网络的模型,包括依次连接的第一卷积层、第一池化层、第二卷积层、第二池化层、串联的三个全连接层、Softmax层;根据训练集的准确度结果优化模型参数,最终获得宁夏枸杞子分类模型,称为EEMnet。
经试验证明样本批处理大小为16,损失函数选择交叉熵损失函数,优化器选择Adam,学习率为0.001,卷积核的大小为4×4,epoch次数为80时,其训练集、测试集以及预测集的准确度结果均达到98%以上,且其灵敏度和特异性均达到94%以上,可以充分证明本发明提出的基于前表面荧光技术结合深度卷积神经网络建立的EEMnet模型可以快速且可靠地鉴别宁夏枸杞子样本的储存年份。
S4、研究宁夏枸杞子分类模型EEMnet的可解释性
提取经过年份鉴别模型处理后的数据并进行可视化,为分类结果进一步解释。
用梯度积分算法分析模型的敏感属性,查看分类结果相关的变量。
以下是通过具体实施例详细说明本发明实施例1的基于前表面荧光技术结合深度卷积神经网络建立的EEMnet模型可以快速且可靠地鉴别宁夏枸杞子样本储存年份的过程。
1、实验仪器与材料
仪器:荧光分光光度计;固体支架;样品粉末池;数据分析及所用程序在MATLAB2009b和pytorch 1.8.0环境下运行的。
材料:实验所用宁夏枸杞子样品均为宁杞1号,分别于2018年、2019年、2020年、2021年采自宁夏回族自治区银川市枸杞有机种植专业合作社基地,采集时间均为当年的7月份,所有样品均被常温储存,所有样品经过鉴定为茄科植物宁夏枸杞Lycium barbarumL.的干燥成熟果实。
采集2018年、2019年、2020年、2021年枸杞子样品共29批(99件),2018年采集8批,每批3件,共24件,2019年采集6批,每批4件,共24件,2020年采集9批,每批3件,共27件,2021年采集6批,每批24件,具体信息见表1。将每件枸杞子包件的上、中、下部位重复取三次样,共获得297份不同储存年份的宁夏枸杞子样品,2018年72份、2019年72份,2020年81份,2021年72份,将所有的样品经冷冻干燥后粉碎过100目筛备用。
表1不同储存年份宁夏枸杞子样品表
2、实验方法
2.1参数设置
设置荧光分光光度计激发波长(Excitation wavelength,Ex)范围为200~500nm,发射波长(Emission wavelength,Em)范围设置为220~650nm,波长间隔均为5nm;狭缝宽度为5nm,电压为550V,扫描速度为30000nm·min-1,将装有枸杞子粉末的样本粉末池置于荧光分光光度计的固体支架配件中,入射角度为60°进行扫描,获得前表面三维荧光光谱,所有样本均使用同一规格的样品粉末池进行扫描;
2.2数据处理
1)获取前表面三维荧光光谱数据集
每个枸杞子样品经过荧光扫描后均得到一个大小为87×61(发射波长数×激发波长数)的二维矩阵,将各个样本获得的荧光矩阵转置后沿着样本维度进行堆叠即可获得一个大小为61×87×297(激发波长数×发射波长数×样本数)的三维数据阵列。选择发射光谱的范围为305~615nm,选择激发波长范围为295~500nm以剔除光谱中的非必要性信息,三维数据的维度变为42×63×297(激发波长数×发射波长数×样本数)。同时原始荧光光谱中包含许多散射干扰,例如一级瑞利散射、二级瑞利散射和拉曼散射,这些散射会破坏三线性结构。本实施例采用M.Bahram等提出的插值法(Bahram M,Journal of Chemometrics,2006,20(3-4):99-105),即先剔除散射数据,再使用插值法将缺失的数据补齐。在本实施例中,分别选择-15~+15,-5~+5,-30~+20为一级瑞利散射、拉曼散射和二级瑞利散射的宽度,具体的效果如图2(a)~图2(c)所示。最后,对获得的数据进行归一化处理,使得前表面荧光三维数据阵列中的每个数值范围在-1到1之间,得到前表面三维荧光光谱数据集。
2)训练集、测试集和预测集的获取
对获得的前表面三维荧光光谱数据集沿着样本的维度进行采集,得到训练集、测试集和预测集。首先在2018年、2019年、2020年和2021年样品数据中各取一个批次的样本数据作为预测集,共42个样本数据,然后将其余批次的枸杞子样本数据按照3:1的比例随机划分为训练集和测试集,获得训练集为189个样本数据,测试集为66个样本数据,宁夏枸杞子不同储存年份数据集的详细划分情况见表2。同时将四种储存年份的枸杞子样品数据给予标签,2018年、2019年、2020年以及2021年的枸杞子样本数据的标签分别为0、1、2、3,以便后续的样本分类。
表2宁夏枸杞子不同储存年份数据集
2.3宁夏枸杞子储存年份鉴别模型EEMnet的建立。
卷积神经网络(CNN)作为一种深度神经网络模型,可以自动从数据中学习和提取特征,避免复杂的图像预处理,被广泛地应用于模式分类、对象检测、对象识别等领域。本发明实施例1搭建的EEMnet模型是一种基于卷积神经网络的模型,包括依次连接的第一卷积层、第一池化层、第二卷积层、第二池化层、串联的三个全连接层、Softmax层。根据训练集的分类准确度结果优化模型参数,设置损失函数为交叉熵损失函数,优化器为Adam,学习率为0.001,优化样品的批处理大小为16,卷积层的卷积核大小均为4×4,池化层的卷积核大小均为2×2,卷积层和池化层的步长为1,三个全连接层输出维度分别为120、84、4,具体的结构如图3所示。EEMnet模型将维度为1×42×63的枸杞子荧光光谱作为输入,卷积层和池化层用以提取光谱特征信息,全连接层将提取的特征进行分类,softmax层用于概率分类,判别宁夏枸杞子样本的储存年份。
2.4模型评估
准确度、灵敏度和特异性常用于评价模型分类性能。其中,准确度是分类正确的样本数量占总样本数量的比例,用以评估模型的整体性能;灵敏度是指对某类样本,模型能将其正确识别为该类的能力,特异性是指对于某类样本,模型其拒绝他类样本的能力。准确度、灵敏度和特异性越接近于100%,说明模型的分类性能越好,准确度、灵敏度和特异性的计算公式如下:
其中,ngg代表属于g类并被正确判别到g类的样本数;G代表类别数;N代表总样本数;TP代表真阳性;TN代表真阴性;FN代表假阴性;FP代表假阳性。
ROC曲线全称为Receiver Operating Characteristic,即“受试者工作特征曲线”,常用以评估一个模型在某个阈值时对样本的识别能力,ROC曲线的横坐标为假阳性率(False Positive Rate,FPR),纵坐标为真阳性率(True Positive Rate,TPR)。Auc(AreaUnder Curve)被定义为ROC曲线下的面积,Auc值范围在0至1之间,越接近1,分类器性能越好,FPR和TPR的计算公式如下:
3、实验结果
虽然不同储存年份的宁夏枸杞子的前表面三维荧光光谱具有一定的差异,如图4所示,这是由于枸杞子中的化学成分在储存的过程中发生变化,导致不同储存年份的枸杞子光谱荧光强度有所区别,但这些差异较小不足以肉眼的形式进行区分,仍需要更加客观的数理统计进行分析。本发明实施例1提出的EEMnet模型即可实现准确且快速地鉴定宁夏枸杞子储存年份,利用训练集建立EEMnet模型,训练集的分类准确率在一定程度上随着epoch次数的增加而逐渐增加,early-stopping策略,当epoch次数为80时,训练集的准确分类率为98%,然后再利用训练集、测试集和预测集对模型的分类性能进行验证,实现不同储存年份的枸杞子样本的鉴定。相应数据集的准确分类率以及各样本的灵敏度和特异性如表3所示。由表3可以看出,训练集、测试集以及预测集准确度均达到98%以上,且表现出优异的灵敏度和特异性,尤其测试集和预测集的灵敏度和特异性均为100%。此外,训练集、测试集以及预测集的混淆矩阵见表4,从该表可以看出多数的宁夏枸杞子样本通过EEMnet模型被正确地判定为相应的储存年份。
当数据存在不平衡的情况时,传统的分类准确率难以评判分类器的性能,ROC曲线对样本类别分布不敏感,可以有效的解决数据不平衡的问题。采用ROC曲线分析法以训练集对EEMnet模型的预测能力进行验证,得到EEMnet模型的ROC曲线图如图5所示。从图中可以看出,2018年、2019年、2020年以及2021年的宁夏枸杞子在EEMnet模型上预测的AUC值分别为0.9955、0.9975、1.0000和1.0000,该结果说明EEMnet模型的预测性能较高。将EEMnet模型获得的第二层全连接层数据降维绘制tSNE降维分析图进行可视化,如图6所示,从图6可以看出同一储存年份的宁夏枸杞子样本明显地聚集在一起,表明EEMnet分类模型能够很好地预测宁夏枸杞子的储存年份。
表3EEMnet模型的分类结果
表4EEMnet模型获得的训练集、测试集和预测集的混淆矩阵
4、EEMnet模型的可解释性研究
CNN作为一种包含卷积计算且具有深度结构的深度学习算法,虽然具有高精度预测性能,但是由于直接使用端到端得出结果使得网络的可解释性较差,出现“黑匣子”问题,EEMnet作为一种基于卷积神经网络的模型,需要进一步解释EEMnet模型如何实现宁夏枸杞子储存年份的鉴别,打破神经网络的“黑匣子”特征。在本发明实施例1中,以研究卷积核后提取的特征以及模型的敏感属性为主,分析EEMnet模型的可解释性,为宁夏枸杞子储存年份的识别提供更加清晰的依据,有助于更深入地了解和使用EEMnet模型。图7(a)~图7(h)为两个卷积层提取后的特征图,从图7(a)~图7(h)可以看出不同储存年份的枸杞子卷积核的特征图有明显差异,其中通过第二层卷积核提取后的特征在形状以及强度上的差异更加明显,能以肉眼区分不同储存年份的枸杞子。
梯度积分算法作为Captum模型解释库的一个解释性算法,为模型在决策过程中提供支持信息,帮助研究人员更好地理解模型预测的结果。在此,本发明实施例采用梯度积分算法对EEMnet模型的输出结果求输入数据的偏导,并将结果求绝对值,从而查看枸杞子光谱的哪些变量对模型的决策有重要影响,相应的结果如图8(a)~图8(d)所示。从图8(a)~图8(d)可以看出,四种储存年份枸杞子的模型特征重要性图较为相似,在激发波长为400~480nm,发射波长为320~580nm范围内四种储存年份的枸杞子光谱变量贡献均比较突出,此外从模型的特征重要性图中还可以看出在激发波长为345nm,发射波长为400nm处均对模型有些许贡献,该峰可能是枸杞子中的酚酸、黄酮以及东莨菪内酯等多种荧光成分综合作用的结果。将不同储存年份的枸杞子模型特征重要性图与其光谱图进行对比发现,枸杞子光谱中的特征峰对模型分类的贡献较低,而光谱的边缘信息为模型分类贡献较大,EEMnet模型根据枸杞子光谱的变量贡献性的不同即可实现对宁夏枸杞子储存年份的鉴定。
综上所述,本发明实施例1提出了一种基于前表面荧光技术鉴别宁夏枸杞子储存年份的方法,通过基于卷积神经网络的EEMnet模型很好地实现了不同储存年份枸杞子的分类,其中训练集、测试集以及预测集的分类准确度均为98%以上,此外各储存年份的灵敏度和特异性也均在94%以上,可以充分证明本发明提出的基于前表面荧光技术结合深度卷积神经网络建立的EEMnet模型可以快速且可靠地鉴别宁夏枸杞子样本的储存年份,为中药材储存年份鉴别提供新的思路。
实施例2
本发明实施例2提供一种对应上述实施例1的终端设备,终端设备可以是用于客户端的处理设备,例如手机、笔记本电脑、平板电脑、台式机电脑等,以执行上述实施例的方法。
本实施例的终端设备包括存储器、处理器及存储在存储器上的计算机程序;处理器执行存储器上的计算机程序,以实现上述实施例1方法的步骤。
在一些实现中,存储器可以是高速随机存取存储器(RAM:Random AccessMemory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。
在另一些实现中,处理器可以为中央处理器(CPU)、数字信号处理器(DSP)等各种类型通用处理器,在此不做限定。
实施例3
本发明实施例3提供了一种对应上述实施例1的计算机可读存储介质,其上存储有计算机程序/指令。计算机程序/指令被处理器执行时,实现上述实施例1方法的步骤。
计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意组合。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言Java和直译式脚本语言JavaScript等。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (5)
1.一种枸杞子储存年份鉴别方法,其特征在于,包括以下步骤:
S1、采集不同储存年份、不同批次的若干枸杞子样品,获得枸杞子的前表面荧光三维数据阵列;
S2、利用前表面荧光三维数据阵列获得训练集;将所述前表面荧光三维数据阵列分为训练集、测试集和预测集;
S3、利用所述训练集训练卷积神经网络的EEMnet模型,得到年份鉴别模型;
S4、利用所述训练集,测试集和预测集评估EEMnet模型的分类性能;
步骤S4的具体实现过程包括:
将所述训练集、测试集和预测集载入EEMnet模型,计算枸杞子样本分类的准确率、特异性和灵敏度;
将所述训练集作为年份鉴别模型的输入,获得得分数据,利用所述得分数据和所述训练集的真实标签,绘制ROC曲线;
利用训练集、测试集和预测集获得的EEMnet模型的第二层全连接层数据,绘制tSNE降维分析图;
所述EEMnet模型包括依次连接的第一卷积层、第一池化层、第二卷积层、第二池化层、串联的三个全连接层、Softmax层。
2.根据权利要求1所述的枸杞子储存年份鉴别方法,其特征在于,步骤S1的具体实现过程包括:
设置荧光分光光度计激发波长范围为200 ~ 500 nm,发射波长范围为220 ~ 650 nm,波长间隔均为5 nm,狭缝宽度为5 nm,电压为550 V,扫描速度为30000 nm·min-1,将装有枸杞子粉末的样本粉末池置于荧光分光光度计的固体支架中,入射角度为60°进行扫描,获得前表面三维荧光光谱;
将所有样本对应的前表面三维荧光光谱沿着样本维度排列,构建前表面荧光三维数据阵列。
3.根据权利要求1所述的枸杞子储存年份鉴别方法,其特征在于,步骤S1之后,步骤S2之前,还包括:对所述前表面三维数据阵列进行预处理的具体实现过程包括:
选择设定的激发波长和发射波长范围,剔除散射数据,然后将得到的数据进行归一化处理,使得前表面荧光三维数据阵列中的每个数值范围在-1到1之间,得到预处理后的前表面荧光三维数据阵列。
4.一种终端设备,包括存储器、处理器及存储在存储器上的计算机程序;其特征在于,所述处理器执行所述计算机程序,以实现权利要求1~3之一所述方法的步骤。
5.一种计算机可读存储介质,其上存储有计算机程序/指令;其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1~3之一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211466006.9A CN115728278B (zh) | 2022-11-22 | 2022-11-22 | 枸杞子储存年份鉴别方法、终端设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211466006.9A CN115728278B (zh) | 2022-11-22 | 2022-11-22 | 枸杞子储存年份鉴别方法、终端设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115728278A CN115728278A (zh) | 2023-03-03 |
CN115728278B true CN115728278B (zh) | 2024-06-14 |
Family
ID=85297323
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211466006.9A Active CN115728278B (zh) | 2022-11-22 | 2022-11-22 | 枸杞子储存年份鉴别方法、终端设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115728278B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105866291A (zh) * | 2016-05-17 | 2016-08-17 | 江南大学 | 一种利用1,1-二乙氧基甲烷和甲硫醇浓度鉴别芝麻香型原酒贮存时间的方法 |
CN115060695A (zh) * | 2022-06-02 | 2022-09-16 | 中国中医科学院中药研究所 | 基于三维荧光光谱的枸杞子储藏年份鉴别方法 |
-
2022
- 2022-11-22 CN CN202211466006.9A patent/CN115728278B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105866291A (zh) * | 2016-05-17 | 2016-08-17 | 江南大学 | 一种利用1,1-二乙氧基甲烷和甲硫醇浓度鉴别芝麻香型原酒贮存时间的方法 |
CN115060695A (zh) * | 2022-06-02 | 2022-09-16 | 中国中医科学院中药研究所 | 基于三维荧光光谱的枸杞子储藏年份鉴别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115728278A (zh) | 2023-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jiang et al. | Fusion of machine vision technology and AlexNet-CNNs deep learning network for the detection of postharvest apple pesticide residues | |
Feilhauer et al. | Multi-method ensemble selection of spectral bands related to leaf biochemistry | |
Kumar et al. | N-CNN based transfer learning method for classification of powdery mildew wheat disease | |
Safdar et al. | Intelligent microscopic approach for identification and recognition of citrus deformities | |
CN107679569A (zh) | 基于自适应超图算法的拉曼光谱物质自动识别方法 | |
Cai et al. | Rapid identification of ore minerals using multi-scale dilated convolutional attention network associated with portable Raman spectroscopy | |
Gill et al. | A review of automatic fruit classification using soft computing techniques | |
Raj et al. | Classification of oil palm fresh fruit maturity based on carotene content from Raman spectra | |
CN113095188A (zh) | 一种基于深度学习的拉曼光谱数据分析方法与装置 | |
Tugnolo et al. | A diagnostic visible/near infrared tool for a fully automated olive ripeness evaluation in a view of a simplified optical system | |
Zhang et al. | Automatic classification of marine plankton with digital holography using convolutional neural network | |
CN113408616B (zh) | 基于pca-uve-elm的光谱分类方法 | |
CN108344701A (zh) | 基于高光谱技术的石蜡等级定性分类与定量回归方法 | |
Silva et al. | Automatic detection of Flavescense Dorée grapevine disease in hyperspectral images using machine learning | |
Qi et al. | SAM-GAN: An improved DCGAN for rice seed viability determination using near-infrared hyperspectral imaging | |
CN115728278B (zh) | 枸杞子储存年份鉴别方法、终端设备及存储介质 | |
CN116858822A (zh) | 一种基于机器学习和拉曼光谱的水体中磺胺嘧啶定量分析方法 | |
Hong et al. | Classification of Oil Palm fruit Ripeness Using Artificial Neural Network | |
Liu et al. | Visual discrimination of citrus HLB based on image features | |
Yan et al. | Front-face excitation-emission matrix fluorescence spectroscopy combined with interpretable deep learning for the rapid identification of the storage year of Ningxia wolfberry | |
CN113642629B (zh) | 一种基于随机森林提高谱学分析可信度的可视化方法及装置 | |
CN112782148B (zh) | 阿拉比卡和罗伯斯塔两种咖啡豆的快速鉴别方法 | |
CN114062306B (zh) | 一种近红外光谱数据分段预处理方法 | |
CN113138181B (zh) | 一种对清香型原酒品质分级的方法 | |
CN104297205A (zh) | 一种快速、无损的食用油鉴别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |