CN113008817A - 一种基于高光谱成像技术快速鉴别苦杏仁真伪优劣的方法 - Google Patents
一种基于高光谱成像技术快速鉴别苦杏仁真伪优劣的方法 Download PDFInfo
- Publication number
- CN113008817A CN113008817A CN202110209020.XA CN202110209020A CN113008817A CN 113008817 A CN113008817 A CN 113008817A CN 202110209020 A CN202110209020 A CN 202110209020A CN 113008817 A CN113008817 A CN 113008817A
- Authority
- CN
- China
- Prior art keywords
- amygdalin
- sample
- samples
- model
- authenticity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 244000018633 Prunus armeniaca Species 0.000 title claims abstract description 34
- 235000009827 Prunus armeniaca Nutrition 0.000 title claims abstract description 33
- 238000000701 chemical imaging Methods 0.000 title claims abstract description 18
- 238000005516 engineering process Methods 0.000 title claims abstract description 18
- XUCIJNAGGSZNQT-JHSLDZJXSA-N (R)-amygdalin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC[C@@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@H](O[C@@H](C#N)C=2C=CC=CC=2)O1 XUCIJNAGGSZNQT-JHSLDZJXSA-N 0.000 claims abstract description 52
- 229940089837 amygdalin Drugs 0.000 claims abstract description 52
- YZLOSXFCSIDECK-UHFFFAOYSA-N amygdalin Natural products OCC1OC(OCC2OC(O)C(O)C(O)C2O)C(O)C(O)C1OC(C#N)c3ccccc3 YZLOSXFCSIDECK-UHFFFAOYSA-N 0.000 claims abstract description 52
- YGHHWSRCTPQFFC-UHFFFAOYSA-N eucalyptosin A Natural products OC1C(O)C(O)C(CO)OC1OC1C(OC(C#N)C=2C=CC=CC=2)OC(CO)C(O)C1O YGHHWSRCTPQFFC-UHFFFAOYSA-N 0.000 claims abstract description 52
- 239000000463 material Substances 0.000 claims abstract description 24
- 238000013145 classification model Methods 0.000 claims abstract description 16
- 238000004519 manufacturing process Methods 0.000 claims abstract description 16
- 244000144730 Amygdalus persica Species 0.000 claims abstract description 14
- 235000006040 Prunus persica var persica Nutrition 0.000 claims abstract description 14
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 238000004458 analytical method Methods 0.000 claims abstract description 7
- 238000002203 pretreatment Methods 0.000 claims abstract description 7
- 244000144725 Amygdalus communis Species 0.000 claims description 32
- 235000003893 Prunus dulcis var amara Nutrition 0.000 claims description 30
- 238000007781 pre-processing Methods 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 16
- 230000003595 spectral effect Effects 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000001228 spectrum Methods 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000012937 correction Methods 0.000 claims description 8
- 238000012706 support-vector machine Methods 0.000 claims description 8
- 238000009499 grossing Methods 0.000 claims description 7
- 238000007637 random forest analysis Methods 0.000 claims description 7
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 claims description 6
- 238000004128 high performance liquid chromatography Methods 0.000 claims description 6
- 238000002360 preparation method Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 5
- 239000000243 solution Substances 0.000 claims description 5
- 238000010987 Kennard-Stone algorithm Methods 0.000 claims description 4
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 claims description 3
- 239000004809 Teflon Substances 0.000 claims description 3
- 229920006362 Teflon® Polymers 0.000 claims description 3
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 229910000147 aluminium phosphate Inorganic materials 0.000 claims description 3
- 230000002860 competitive effect Effects 0.000 claims description 3
- 230000002068 genetic effect Effects 0.000 claims description 3
- 239000008187 granular material Substances 0.000 claims description 3
- 238000002347 injection Methods 0.000 claims description 3
- 239000007924 injection Substances 0.000 claims description 3
- 239000012071 phase Substances 0.000 claims description 3
- 238000011002 quantification Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 229930182470 glycoside Natural products 0.000 claims description 2
- 150000002338 glycosides Chemical class 0.000 claims description 2
- 239000007791 liquid phase Substances 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 238000012216 screening Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 230000000873 masking effect Effects 0.000 claims 1
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 12
- 238000010239 partial least squares discriminant analysis Methods 0.000 description 8
- 238000005303 weighing Methods 0.000 description 5
- 238000002310 reflectometry Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 239000003814 drug Substances 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- KWGRBVOPPLSCSI-WPRPVWTQSA-N (-)-ephedrine Chemical compound CN[C@@H](C)[C@H](O)C1=CC=CC=C1 KWGRBVOPPLSCSI-WPRPVWTQSA-N 0.000 description 2
- 235000011437 Amygdalus communis Nutrition 0.000 description 2
- 235000020224 almond Nutrition 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000000706 filtrate Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000011895 specific detection Methods 0.000 description 2
- 229940126680 traditional chinese medicines Drugs 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 244000141006 Armeniaca sibirica Species 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 206010011224 Cough Diseases 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 241000535630 Prunus mandshurica Species 0.000 description 1
- 235000004789 Rosa xanthina Nutrition 0.000 description 1
- 241000220222 Rosaceae Species 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- KWGRBVOPPLSCSI-UHFFFAOYSA-N d-ephedrine Natural products CNC(C)C(O)C1=CC=CC=C1 KWGRBVOPPLSCSI-UHFFFAOYSA-N 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 229960002179 ephedrine Drugs 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000002329 infrared spectrum Methods 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000009659 non-destructive testing Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 239000013558 reference substance Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 235000014347 soups Nutrition 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 239000012085 test solution Substances 0.000 description 1
- 238000009210 therapy by ultrasound Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/04—Preparation or injection of sample to be analysed
- G01N30/06—Preparation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/62—Detectors specially adapted therefor
- G01N30/74—Optical detectors
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明提供了一种基于高光谱成像技术快速鉴别苦杏仁真伪优劣的方法,通过采集不同产地苦杏仁样本及易混淆品种桃仁样本的高光谱图像,基于不同预处理方法和分类模型成对组合比较,实现了苦杏仁药材不同产地分类及真伪鉴别;进一步基于苦杏仁苷含量的特征波段提取方法,建立了苦杏仁药材中苦杏仁苷含量的预测模型,实现了苦杏仁药材的品质优劣鉴别;本发明基于高光谱成像技术由内到外全面评价苦杏仁品质,为优质苦杏仁药材的挑选和鉴别提供了一种快速无损的分析方法,为中药材质量的工业化智能控制提供技术支撑。
Description
技术领域
本发明涉及一种基于高光谱成像技术快速无损鉴别苦杏仁真伪优劣的方法,属于中药质量控制领域。
背景技术
苦杏仁是蔷薇科植物山杏Prunus armeniaca L.var.ansu Maxim.、西伯利亚杏P.sibirica L.、东北杏P.mandshurica(Maxim.)Koehne或杏P.armeniaca L.的干燥成熟种子,经典名方麻黄汤等的重要组成成分,是一种天然中药材,有效成分为苦杏仁苷,具有降气止咳平喘,降血脂血糖,抗肿瘤等药理作用。2020版《中国药典》规定苦杏仁药材中苦杏仁苷的含量不能低于3.0%。优质中药材是保障中成药成品质量的第一步。目前,中药质量存在中药原料产地不明、品种不清、化学成分含量不达标等问题,实际生产中优质苦杏仁分拣及真伪鉴别主要依靠人为性状鉴别和传统质量分析方法,存在主观性强,周期长,操作复杂、成本高的缺点,无法满足现场快速检测和工业上实时监测的要求。因此,需要开发一种快速无损全面评价苦杏仁品质及真伪的检测方法以满足实际工业生产的需要。
高光谱成像技术是一种将光谱学和数字成像信息相集成的新型无损检测技术,它可以对分析样品的每个像素点提供完整的光谱信息,从而为不同图像中每个像元赋予类别标签并通过特定波长下的光谱信息反应样品的内部结构,因此,根据高光谱成像能判断样品内外部的物理结构和化学成分,对样品进行定性或定量分析。但尚未发现基于高光谱成像技术由内到外全面评价苦杏仁药材品质进行真伪鉴别的研究。
发明内容
本发明目的是解决中医药工业实际大规模生产过程中苦杏仁药材传统检测方法耗时耗力,具有破坏性,内部品质难以分辨等问题,开发一种基于高光谱成像技术快速鉴别苦杏仁真伪优劣的方法。
本发明通过采集不同产地苦杏仁样本及易混淆品种桃仁样本的高光谱图像,基于不同预处理方法和分类模型成对组合比较,实现了苦杏仁药材的真伪鉴别。进一步基于苦杏仁苷含量的特征波段提取方法,建立了苦杏仁药材中苦杏仁苷含量的预测模型,实现了苦杏仁药材的品质优劣鉴别。
本发明从产地分类、苦杏仁桃仁真伪鉴别和苦杏仁苷含量测定三个方面全面评价苦杏仁品质,建立相应模型,实现快速无损精确鉴别苦杏仁真伪优劣。
本发明的技术方案如下:
一种基于高光谱成像技术快速鉴别苦杏仁真伪优劣的方法,所述方法包括以下步骤:
(1)样品准备
准备不同产地的若干苦杏仁样品作为产地分类样本集;准备若干苦杏仁样品和若干桃仁样品作为真伪鉴别样本集;抽取不同批次的苦杏仁样品作为苦杏仁苷定量样本集;
具体的,所述产地分类样本集包括陕西、内蒙、甘肃、朝鲜、内蒙5个产地,分别有6批次、18批次、6批次、11批次、14批次,每批次随机选取30粒,总共随机抽取了1650个苦杏仁样品;
所述真伪鉴别样本集为随机选取的720个苦杏仁样品和随机选取的600个桃仁样品;
所述苦杏仁苷定量样本集包括56批次苦杏仁样品,每批次随机选取2份,每份30粒,总共选取112份苦杏仁样品;
(2)高光谱采集过程
利用高光谱仪在898~1751nm范围内采集样品高光谱图像信息;
所述高光谱仪采集样品光谱信息的具体参数为:苦杏仁样品平台的移动速度为2.3mm.s-1,相机曝光时间为26ms;桃仁样品平台的移动速度为2.5mm.s-1,相机曝光时间为25ms;其宽为640像素,长为1200像素,共包括512个波长带;
(3)图像处理过程
采集得到的高光谱图像进行黑白板校正,校正公式为:
其中,D是校正后反射率图像,Draw是原始反射率图像,Dwhite是白板参考图像,通过Teflon白板获取(反射率接近1),Ddark是黑板参考图像,通过盖上镜头盖获取(反射率接近0);
(4)感兴趣区域(ROI)获取过程
通过掩膜操作提取样品建立模型所需区域范围内的光谱信息;
所述掩膜操作过程是通过选取反射强度最高的数值减去反射强度最低的数值生成新的灰度图像,然后将新的灰度图像进行二进制阈值分割,进一步去除背景并获得二进制图像,其中背景值为0,样品对应的像素为1;
(5)苦杏仁苷含量液相分析过程
利用高效液相色谱法测定苦杏仁药材中苦杏仁苷含量实际值;
所述高效液相色谱条件为:色谱柱为Agilent ZorBax SB C18(4.6mm×250mm,5.0μm);乙腈-0.1%磷酸溶液(8:92,体积比)为流动相;进样体积10μl;检测波长207nm,流速1.0mL·min-1;柱温30℃;
(6)模型的建立
以不同产地、不同品种光谱信息和产地分类标号、易混淆品种标号为输入项,分别建立产地分类、真伪鉴别样本集模型,比较不同光谱预处理方法和三种分类模型组合对产地分类、真伪鉴别模型建立的影响;以不同样本光谱信息与其相对应苦杏仁苷实测值为输入项,建立苦杏仁苷定量样本集模型,研究基于苦杏仁苷的不同特征波段提取方法对模型建立的影响;采用预测集对不同模型进行性能评估,筛选出预测能力最佳的模型;
样本集均按照Kennard-Stone算法以2:1的比例划分成训练集和预测集;其中:产地分类样本集训练集1105个样本,预测集545个样本;真伪鉴别样本集训练集884个样本,预测集436个样本;苦杏仁苷定量样本集训练集78份,预测集34份;
光谱预处理方法包括:无预处理,Savitzky-Golay平滑(SG)、一阶导数、二阶导数、多元散射校正(MSC)、标准正态变换(SNV);
特征波长提取方法包括:竞争性自适应重加权算法(CARS)、连续投影算法(SPA)、联合区间(Si)、向后区间(Bi)、遗传算法(GA);
建立的模型:产地分类和真伪鉴别模型包括偏最小二乘判别分析(PLS-DA)、随机森林(RF)、支持向量机(SVM);苦杏仁苷定量模型包括偏最小二乘法(PLS);
评估模型性能:产地分类和真伪鉴别模型包括分类准确率、混淆矩阵、ROC曲线三个指标,三个指标值越高,模型预测能力越好;苦杏仁苷定量模型包括训练集相关系数(R2 c)、训练集均方根误差(RMSEC)、预测集相关系数(R2 P)、预测集均方根误差(RMSEP)四个指标,R2 c、R2 P越高,RMSEC、RMSEP越低,模型预测能力越好;
(7)实际样品的检测
采集待测样品的高光谱图像信息,代入步骤(6)所建立的产地分类、真伪鉴别、苦杏仁苷定量模型中,鉴定样品的产地、真伪,以及获得样品中苦杏仁苷的含量。
与现有技术相比,本发明具有以下优点:
1、本发明与人工分拣相比,能更好把握苦杏仁药材内部化学成分信息,检测速度快,准确率高。
2、本发明与人工检测相比,无需前处理,无需化学试剂,能实现样品的快速无损检测。
3、本发明为苦杏仁中药材工业实际大规模在线数据采集系统设计提供了理论发展基础。
附图说明
图1为苦杏仁和桃仁药材图。
图2为产地分类样本集苦杏仁样品二阶导数预处理后光谱曲线图。
图3为真伪鉴别样本集二阶导数预处理后平均光谱曲线图。
图4为产地分类样本集PLS-DA(a)、RF(b)和SVM(c)模型预测结果的混淆矩阵。
图5为真伪鉴别样本集PLS-DA(a)、RF(b)和SVM(c)模型预测结果的混淆矩阵。
图6为产地分类样本集(a)和真伪鉴别样本集(b)ROC曲线图。
图7为苦杏仁苷定量样本集苦杏仁样品原始光谱曲线图。
图8为苦杏仁苷CARS-PLS定量模型的预测值与实测值相关性图。
具体实施方式
下面通过具体实施例进一步描述本发明,但本发明的保护范围并不仅限于此。
实施例1
本实施例涉及一种基于高光谱成像技术对不同产地苦杏仁药材和桃仁药材的鉴别方法,具体检测步骤如下:
1.样品准备
产地分类样本集包括陕西、内蒙、甘肃、朝鲜、内蒙5个产地,分别有6批次、18批次、6批次、11批次和14批次,每批次随机选取30粒,总共随机抽取了1650个苦杏仁样品;真伪鉴别样本集包括随机选取的720个苦杏仁样品和随机选取的600个桃仁样品。
2.高光谱图像采集
(1)样品高光谱图像采集:启动高光谱仪器,预热30min后,进行多次相机调焦和移动平台速度测试以使采集到的样品图像清晰完整,最终确定苦杏仁样品高光谱仪具体参数为:平台移动速度为2.3mm.s-1,相机曝光时间为26ms;桃仁样品高光谱仪具体参数为:平台移动速度为2.5mm.s-1,相机曝光时间为25ms。其宽为640像素,长为1200像素,并且在898nm到1751nm范围内以1.67nm的间隔选择512个波长带。
(2)图像预处理:对采集到的高光谱图像进行黑白板校正以减弱不均匀照明和暗电流的影响,校正按公式(1)进行:
其中D是校正后反射率图像,Draw是原始反射率图像,Dwhite是白板参考图像,通过Teflon白板获取(反射率接近1),Ddark是黑板参考图像,通过盖上镜头盖获取(反射率接近0)。
3.感兴趣区域获取
通过选取反射强度最高的数值减去反射强度最低的数值以生成新的灰度图像,然后将新的灰度图像进行二进制阈值分割,进一步去除背景并获得二进制图像,其中背景值为0,与样品对应的像素为1,为了得到单个样品的平均光谱,从未识别为背景的像素中提取样品的所有光谱取平均值。
4.光谱预处理
按照Kennard-Stone算法以2:1的比例划分成训练集和预测集,其中产地分类训练集1105个样本,预测集545个样本;真伪鉴别样本集训练集884个样本,预测集436个样本。同时为了进一步去除极端波长区域的噪声,将近红外光谱范围缩减至900-1601nm和421个波长带。采用无预处理、Savitzky-Golay平滑(SG),一阶导数,二阶导数,多元散射校正(MSC)和标准正态变换(SNV)六种预处理方法与三种分类模型一一组合,选出不同分类模型最佳组合的预处理方法,结果见表1和表2。结果显示二阶导数(图2)无论是对不同产地分类,还是易混淆品种的鉴别,都能提升模型性能,所以选取二阶导数作为三种分类模型最佳组合的预处理方法。
表1产地分类样本集预处理方法和分类模型成对组合的分类准确率(%)
表2真伪鉴别样本集预处理方法和分类模型成对组合的分类准确率(%)
5.产地分类模型和真伪鉴别模型的建立
为了选择合适的分类模型,以二阶导数预处理方法结合PLS-DA、RF和SVM三种分类模型,并使用分类准确率(包括训练集、验证集、测试集)及不同产地的分类准确率结果来评估。其结果见表1、表2、表3。结果显示三种分类模型都表现出了理想的预测结果,其中PLS-DA模型对5个产地的单独分类能表现出更好的稳定性,结果均在85%以上。
表3不同产地苦杏仁及与桃仁真伪辨别的分类准确率(%)
6.分类模型评估
(1)混淆矩阵
混淆矩阵是一种用特定矩阵来呈现算法性能的可视化效果,其每一列代表预测值,每一行代表真实的类别。图4为产地分类样本集PLS-DA(a)、RF(b)和SVM(c)模型预测结果的混淆矩阵。结果显示PLS-DA模型表现出最好性能,全部产地预测准确率都达到0.8以上,SVM次之,RF模型最差,其对陕西、甘肃产地的预测准确率分别只有0.48和0.61。图5为真伪鉴别样本集PLS-DA(a)、RF(b)和SVM(c)模型预测结果的混淆矩阵。结果显示三种分类模型均表现出最好结果,PLS-DA、SVM模型分别为1.00、1.00,RF模型分别为0.97、0.98。
(2)ROC曲线
ROC曲线能准确反映某分析方法特异性和敏感性的关系,是试验准确性的综合代表,一般以ROC曲线下面积(AUC)作为模型评价指标,其值最大为1,分类器性能与AUC值成正比。图6为产地分类样本集(a)和真伪鉴别样本集(b)ROC曲线图,两个样本集中,PLS-DA模型的AUC均表现出最高值(0.9923、1.0000),RF模型(0.9897、0.9980)次之,与分类准确率结果一致。但SVM模型的AUC值分别只有0.7546、0.8749,与分类准确率结果差别较大,且SVM模型训练速度过慢,综合考虑,选择二阶导数和PLS-DA模型组合作为判别苦杏仁药材不同产地及易混淆品种真伪辨别的分类模型。
实施例2
本实施例涉及一种基于高光谱可视化图像结合CARS-PLS模型快速检测苦杏仁药材中苦杏仁苷含量的方法,其中苦杏仁样品高光谱图像采集和感兴趣区域选取按实施例1中2-3得到,具体检测步骤如下:
1.样品准备
收集56批次苦杏仁药材,每批次随机选择2份,每份30粒,总共选取112份。
2.高效液相色谱分析
对照品溶液的制备:取苦杏仁苷对照品适量,精密称定,加甲醇制成每1ml含40μg的溶液,即得。
供试品溶液的制备:取本品粉末(过二号筛)约0.25g,精密称定,置具塞锥形瓶中,精密加入甲醇25ml,密塞,称定重量,超声处理(功率250W,频率50kHz)30分钟,放冷,再称定重量,用甲醇补足减失的重量,摇匀,过滤,精密量取续滤液5ml,置50ml量瓶中,加50%甲醇稀释至刻度,摇匀,滤过,取续滤液,即得。
高效液相色谱条件为:色谱柱为Agilent ZorBax SB C18(4.6mm×250mm,5.0μm);乙腈-0.1%磷酸溶液(8:92,体积比)为流动相;进样体积10μl;检测波长207nm,流速1.0mL·min-1;柱温30℃。
3.光谱预处理
将112个光谱信息分别与苦杏仁苷含量实测值一一对应,按照Kennard-Stone算法以2:1的比例划分训练集与预测集,其中训练集78个样本,预测集34个样本。探讨无预处理、Savitzky-Golay平滑(SG),一阶导数,二阶导数,多元散射校正(MSC)和标准正态变换(SNV)预处理方法对PLS模型预测能力的影响。图7为其原始光谱曲线图。
4.特征波长的选择
选择特征波长不仅可以提高计算速度,减少模型中权重较低波长的冗余效应,而且可以提高已开发模型的可预测性,满足工业实际生产的需要。运用六种预处理方法和五种特征波长提取方法一一组合,构建PLS模型,六种预处理方法见3,五种特征波长提取方法包括竞争性自适应重加权算法(CARS)、连续投影算法(SPA)、联合区间(Si)、向后区间(Bi)和遗传算法(GA),结果见表4。表4结果显示CARS与无预处理方法的组合在所有组合中表现最优,能明显提升PLS模型的预测能力。
表4基于不同预处理方法和特征波长选择方法的PLS模型优化结果
5.苦杏仁苷定量模型的建立
对不同PLS模型进行了比较,结果见表5。结果显示不同模型对苦杏仁苷预测能力的排序为CARS-PLS>SPA-PLS>Si-PLS>GA-PLS>Bi-PLS>PLS,这也表明了准确使用特征波长能够更好的预测苦杏仁苷的含量,CARS-PLS模型表现出最佳的预测结果,仅用33个波长,训练集的R2 C和RMSEC达到0.9452、1.2726,测试集的R2 P和RMSEP达到0.8385、2.2564。图8为苦杏仁苷CARS-PLS定量模型的预测值与实测值相关性图,所获结果表明了,基于高光谱成像技术可以有效预测完整苦杏仁药材中苦杏仁苷的含量,实现了苦杏仁药材的品质优劣鉴别。
表5基于不同特征波长提取方法对PLS模型优化能力的比较
以上实施例仅仅是为清楚地说明所作的举例,并非仅限于本发明的保护范围,所有基于本发明的基本思想而进行的修改或变动都属于本发明的保护范围。
Claims (6)
1.一种基于高光谱成像技术快速鉴别苦杏仁真伪优劣的方法,其特征在于,所述方法包括以下步骤:
(1)样品准备
准备不同产地的若干苦杏仁样品作为产地分类样本集;准备若干苦杏仁样品和若干桃仁样品作为真伪鉴别样本集;抽取不同批次的苦杏仁样品作为苦杏仁苷定量样本集;
(2)高光谱采集过程
利用高光谱仪在898~1751nm范围内采集样品高光谱图像信息;
(3)图像处理过程
采集得到的高光谱图像进行黑白板校正,校正公式为:
其中,D是校正后反射率图像,Draw是原始反射率图像,Dwhite是白板参考图像,通过Teflon白板获取,Ddark是黑板参考图像,通过盖上镜头盖获取;
(4)感兴趣区域获取过程
通过掩膜操作提取样品建立模型所需区域范围内的光谱信息;
(5)苦杏仁苷含量液相分析过程
利用高效液相色谱法测定苦杏仁药材中苦杏仁苷含量实际值;
(6)模型的建立
以不同产地、不同品种光谱信息和产地分类标号、易混淆品种标号为输入项,分别建立产地分类、真伪鉴别样本集模型,比较不同光谱预处理方法和三种分类模型组合对产地分类、真伪鉴别模型建立的影响;以不同样本光谱信息与其相对应苦杏仁苷实测值为输入项,建立苦杏仁苷定量样本集模型,研究基于苦杏仁苷的不同特征波段提取方法对模型建立的影响;采用预测集对不同模型进行性能评估,筛选出预测能力最佳的模型;
样本集均按照Kennard-Stone算法以2:1的比例划分成训练集和预测集;
光谱预处理方法包括:无预处理,Savitzky-Golay平滑、一阶导数、二阶导数、多元散射校正、标准正态变换;
特征波长提取方法包括:竞争性自适应重加权算法、连续投影算法、联合区间、向后区间、遗传算法;
建立的模型:产地分类和真伪鉴别模型包括偏最小二乘判别分析、随机森林、支持向量机;苦杏仁苷定量模型包括偏最小二乘法;
评估模型性能:产地分类和真伪鉴别模型包括分类准确率、混淆矩阵、ROC曲线三个指标,三个指标值越高,模型预测能力越好;苦杏仁苷定量模型包括训练集相关系数R2 c、训练集均方根误差RMSEC、预测集相关系数R2 P、预测集均方根误差RMSEP四个指标,R2 c、R2 P越高,RMSEC、RMSEP越低,模型预测能力越好;
(7)实际样品的检测
采集待测样品的高光谱图像信息,代入步骤(6)所建立的产地分类、真伪鉴别、苦杏仁苷定量模型中,鉴定样品的产地、真伪,以及获得样品中苦杏仁苷的含量。
2.如权利要求1所述基于高光谱成像技术快速鉴别苦杏仁真伪优劣的方法,其特征在于,步骤(1)中,所述产地分类样本集包括陕西、内蒙、甘肃、朝鲜、内蒙5个产地,分别有6批次、18批次、6批次、11批次、14批次,每批次随机选取30粒,总共随机抽取了1650个苦杏仁样品;所述真伪鉴别样本集为随机选取的720个苦杏仁样品和随机选取的600个桃仁样品;所述苦杏仁苷定量样本集包括56批次苦杏仁样品,每批次随机选取2份,每份30粒,总共选取112份苦杏仁样品。
3.如权利要求1所述基于高光谱成像技术快速鉴别苦杏仁真伪优劣的方法,其特征在于,步骤(2)中,所述高光谱仪采集样品光谱信息的参数为:苦杏仁样品平台的移动速度为2.3mm.s-1,相机曝光时间为26ms;桃仁样品平台的移动速度为2.5mm.s-1,相机曝光时间为25ms;其宽为640像素,长为1200像素,共包括512个波长带。
4.如权利要求1所述基于高光谱成像技术快速鉴别苦杏仁真伪优劣的方法,其特征在于,步骤(4)中,所述掩膜操作过程是通过选取反射强度最高的数值减去反射强度最低的数值生成新的灰度图像,然后将新的灰度图像进行二进制阈值分割,进一步去除背景并获得二进制图像,其中背景值为0,样品对应的像素为1。
5.如权利要求1所述基于高光谱成像技术快速鉴别苦杏仁真伪优劣的方法,其特征在于,步骤(5)中,所述高效液相色谱条件为:色谱柱为Agilent ZorBax SB C18;乙腈-0.1%磷酸溶液体积比8:92为流动相;进样体积10μl;检测波长207nm,流速1.0mL·min-1;柱温30℃。
6.如权利要求1所述基于高光谱成像技术快速鉴别苦杏仁真伪优劣的方法,其特征在于,步骤(5)中,产地分类样本集训练集1105个样本,预测集545个样本;真伪鉴别样本集训练集884个样本,预测集436个样本;苦杏仁苷定量样本集训练集78份,预测集34份。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110209020.XA CN113008817A (zh) | 2021-02-24 | 2021-02-24 | 一种基于高光谱成像技术快速鉴别苦杏仁真伪优劣的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110209020.XA CN113008817A (zh) | 2021-02-24 | 2021-02-24 | 一种基于高光谱成像技术快速鉴别苦杏仁真伪优劣的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113008817A true CN113008817A (zh) | 2021-06-22 |
Family
ID=76387375
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110209020.XA Pending CN113008817A (zh) | 2021-02-24 | 2021-02-24 | 一种基于高光谱成像技术快速鉴别苦杏仁真伪优劣的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113008817A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113610768A (zh) * | 2021-07-14 | 2021-11-05 | 南方电网科学研究院有限责任公司 | 绝缘子表面藻类覆盖率测算方法、装置及存储介质 |
CN113917003A (zh) * | 2021-08-30 | 2022-01-11 | 浙江工业大学 | 一种白芷饮片中欧前胡素含量的检测方法 |
CN113959961A (zh) * | 2021-12-22 | 2022-01-21 | 广东省农业科学院动物科学研究所 | 一种基于高光谱图像的单宁添加剂防伪检测方法及系统 |
CN114112951A (zh) * | 2021-11-17 | 2022-03-01 | 广东省科学院动物研究所 | 一种高光谱鉴别虫漏沉香的方法 |
CN114295580A (zh) * | 2021-12-29 | 2022-04-08 | 四川启睿克科技有限公司 | 一种基于近红外光谱快速判别花椒品质的方法 |
WO2023115682A1 (zh) * | 2021-12-24 | 2023-06-29 | 湖南大学 | 自适应随机块卷积核网络的高光谱中药材鉴别方法 |
CN117330655A (zh) * | 2023-08-29 | 2024-01-02 | 杭州胡庆余堂药业有限公司 | 一种基于高光谱的胃复春制粒过程质量分析方法 |
-
2021
- 2021-02-24 CN CN202110209020.XA patent/CN113008817A/zh active Pending
Non-Patent Citations (3)
Title |
---|
刘广昊等: "基于近红外光谱的胡椒产地鉴别方法研究", 《中国调味品》, vol. 2014, no. 5, pages 381 - 95 * |
吉海彦等: "基于高光谱成像技术的不同产地小米判别分析", 《光谱学与光谱分析》, vol. 39, no. 7, pages 1 - 2 * |
崔莹莹等: "高光谱成像技术在红肉食用品质检测中的应用研究进展", 《肉类研究》, vol. 33, no. 5, pages 2 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113610768A (zh) * | 2021-07-14 | 2021-11-05 | 南方电网科学研究院有限责任公司 | 绝缘子表面藻类覆盖率测算方法、装置及存储介质 |
CN113917003A (zh) * | 2021-08-30 | 2022-01-11 | 浙江工业大学 | 一种白芷饮片中欧前胡素含量的检测方法 |
CN114112951A (zh) * | 2021-11-17 | 2022-03-01 | 广东省科学院动物研究所 | 一种高光谱鉴别虫漏沉香的方法 |
CN113959961A (zh) * | 2021-12-22 | 2022-01-21 | 广东省农业科学院动物科学研究所 | 一种基于高光谱图像的单宁添加剂防伪检测方法及系统 |
WO2023115682A1 (zh) * | 2021-12-24 | 2023-06-29 | 湖南大学 | 自适应随机块卷积核网络的高光谱中药材鉴别方法 |
CN114295580A (zh) * | 2021-12-29 | 2022-04-08 | 四川启睿克科技有限公司 | 一种基于近红外光谱快速判别花椒品质的方法 |
CN117330655A (zh) * | 2023-08-29 | 2024-01-02 | 杭州胡庆余堂药业有限公司 | 一种基于高光谱的胃复春制粒过程质量分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113008817A (zh) | 一种基于高光谱成像技术快速鉴别苦杏仁真伪优劣的方法 | |
Chandrasekaran et al. | Potential of near-infrared (NIR) spectroscopy and hyperspectral imaging for quality and safety assessment of fruits: An overview | |
Rong et al. | Peach variety detection using VIS-NIR spectroscopy and deep learning | |
Weng et al. | Hyperspectral imaging for accurate determination of rice variety using a deep learning network with multi-feature fusion | |
Liu et al. | Research on moisture content detection method during green tea processing based on machine vision and near-infrared spectroscopy technology | |
Yang et al. | Quantitative prediction and visualization of key physical and chemical components in black tea fermentation using hyperspectral imaging | |
Li et al. | Potential of smartphone-coupled micro NIR spectroscopy for quality control of green tea | |
Yao et al. | Geographic identification of Boletus mushrooms by data fusion of FT-IR and UV spectroscopies combined with multivariate statistical analysis | |
Oliveri et al. | An innovative multivariate strategy for HSI-NIR images to automatically detect defects in green coffee | |
Gao et al. | Hyperspectral image information fusion-based detection of soluble solids content in red globe grapes | |
Pan et al. | Rapid On-site identification of geographical origin and storage age of tangerine peel by Near-infrared spectroscopy | |
Liu et al. | Discrimination of Pericarpium Citri Reticulatae in different years using Terahertz Time-Domain spectroscopy combined with convolutional neural network | |
Vermeulen et al. | Authentication and traceability of agricultural and food products using vibrational spectroscopy | |
Zhao et al. | Integration of spectra and image features of Vis/NIR hyperspectral imaging for prediction of deoxynivalenol contamination in whole wheat flour | |
CN113008815A (zh) | 一种基于高光谱图像信息无损检测酸枣仁中总黄酮的方法 | |
Jiang et al. | Rapid nondestructive detecting of wheat varieties and mixing ratio by combining hyperspectral imaging and ensemble learning | |
CN106940292A (zh) | 基于多光谱成像技术的虫蛀巴旦木原料快速无损鉴别方法 | |
Gao et al. | Differentiation of storage time of wheat seed based on near infrared hyperspectral imaging | |
Zhou et al. | Research on hyperspectral regression method of soluble solids in green plum based on one-dimensional deep convolution network | |
CN113324940A (zh) | 特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的光谱分级方法 | |
CN103076300A (zh) | 专属性模式识别模型判别分析中药材资源指纹信息的方法 | |
CN108760679A (zh) | 一种基于近红外光谱技术的乌天麻鉴别方 | |
Zhang et al. | Analysis of moisture and total sugar content of Huizao based on surface images | |
Ning et al. | Construction of a ginsenoside content-predicting model based on hyperspectral imaging | |
Ren et al. | Description of tea quality using deep learning and multi-sensor feature fusion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |