CN111398211A - 一种苍术颗粒剂的信息区分处理方法 - Google Patents

一种苍术颗粒剂的信息区分处理方法 Download PDF

Info

Publication number
CN111398211A
CN111398211A CN202010155476.8A CN202010155476A CN111398211A CN 111398211 A CN111398211 A CN 111398211A CN 202010155476 A CN202010155476 A CN 202010155476A CN 111398211 A CN111398211 A CN 111398211A
Authority
CN
China
Prior art keywords
wavelengths
rhizoma atractylodis
algorithm
model
granule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010155476.8A
Other languages
English (en)
Inventor
徐宁
刘丽
刘毅
娄维尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202010155476.8A priority Critical patent/CN111398211A/zh
Publication of CN111398211A publication Critical patent/CN111398211A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/04Preparation or injection of sample to be analysed
    • G01N30/06Preparation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/90Plate chromatography, e.g. thin layer or paper chromatography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/04Preparation or injection of sample to be analysed
    • G01N30/06Preparation
    • G01N2030/062Preparation extracting sample from raw material

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种苍术颗粒剂的信息区分处理方法包括以下步骤:将近红外高光谱874nm‑1734nm波段范围内多个苍术颗粒剂高光谱图像提取感兴趣区域的光谱反射率值作为鉴别模型的输入变量,建立判别模型;通过对模型的预测集总体判别率以及kappa系数判别不同苍术颗粒剂的区分效果;通过四种算法初步选择特征波长;经相关性分析获取四组最优波长,建立了判别模型并选择出最优模型;获取待测样本的最优波长范围的多个高光谱图像,将筛选出的最优波长变量的每个像素点光谱数据输入到相应的最好效果判别模型中,判别结果用不同颜色显示。本发明为简单、快速无损进行苍术颗粒剂产品溯源提供了有效的方法,为开发苍术颗粒剂的综合质量实时监测系统提供了技术支撑。

Description

一种苍术颗粒剂的信息区分处理方法
技术领域
本发明涉及药材检测领域,尤其涉及一种苍术颗粒剂的信息区分处理方法。
背景技术
随着市场发展与技术进步,中药配方颗粒因便于服用、保存和携带的优点,已经广泛流通于各大国内医院,甚至远销国际市场。目前已获得各类中药配方颗粒企业遍布各地。然而颗粒剂的生产工艺及质量控制还没有建立统一的国家标准,各生产企业均以内控标准为准则。造成了同一品种因生产企业不同仍存在较大差异。苍术为菊科植物茅苍术或北苍术的干燥根茎,具有燥湿健脾、祛风散寒、明目等功效,是一味历史悠久的中药材。由不同生产商生产的苍术颗粒剂肉眼外观没什么差别,目前无法像饮片一样通过性状、显微鉴别区分品种和产地信息,亦无法使用苍术药材的质量标准,通过高效液相色谱法(highperformance liquid chromatography,HPLC)对苍术素成分进行定量。目前苍术颗粒剂主要采用薄层色谱法(thin layer chromatography,TLC)、水分测定法、浸出物测定法等对其有效成分与含量进行初步的质量检测,因此开拓新的有效的质量控制方法具有重要意义。
高光谱成像技术具有不破坏样品、无污染且能实现大规模信息获取的优点。由于同时获得每个像素点的连续光谱信息和每个光谱波段的连续图像,对样本的化学信息进行了二维空间的可视化表达,使试验结果更为直观。将高光谱成像技术应用于苍术颗粒剂的质量控制,优选对应产品的光谱特征波段,建立快速准确、预测效果好的模型进行产地溯源,是亟需解决的问题。
发明内容
本发明的目的是针对现有技术的缺陷,提供了一种苍术颗粒剂的信息区分处理方法。
为了实现以上目的,本发明采用以下技术方案:
一种苍术颗粒剂的信息区分处理方法,包括以下步骤:
步骤一、获取多个苍术颗粒剂近红外波段高光谱图像提取感兴趣区域的光谱反射率值,利用所述光谱反射率值建立多种有监督的分类器判别模型;
步骤二、通过对所述分类判别模型的预测集总体判别正确率以及kappa系数判断模型对不同苍术颗粒剂的区分效果;
步骤三、通过所述多种波长选择算法初步选择特征波长;
步骤四、通过相关性分析获取所述四组最优波长,重新建立对应的判别模型,选择最佳性能的判别模型;
步骤五、待测苍术颗粒剂生产厂商的判别及可视化:将待测苍术颗粒剂样本取筛选出波长变量的每个像素点光谱数据输入到最佳性能的判别模型中,将判别结果在图像中用不同颜色显示。
进一步的,步骤一中的判别模型为多种有监督的分类器算法模型,包括采用邻近算法建立的判别模型、误差反向传输神经网络建立的判别模型、偏最小二乘法判别分析建立的判别模型及最小二乘支持向量机建立的判别模型。
进一步的,步骤二中选取正确率为90%以上及kappa系数为0.8-1之间。选取值越大越好,达到90%以上代表正确率很高,kappa系数是评价分类结果一致性和信度的一种重要指标,值越大越好,0.8-1之间表明有极好的一致性;根据上述两个指标优选好的判别模型。
进一步的,所述步骤三的中采用CARS算法、随机蛙跳算法、连续投影算法和序列前向选择算法初步选择特征波长,选取波长CARS算法组为975nm,1122nm,1220nm,1237nm,1294nm,1368nm,1372nm,1402nm,1409nm,1415nm,1419nm,1439nm,1442nm,1446nm,1476nm,1540nm,1561nm,1611nm,1669nm;随机蛙跳算法组为1005nm,1368nm,1409nm,1415nm,1442nm;连续投影算法组为924nm,975nm,1005nm,1294nm,1348nm,1365nm,1419nm,1442nm,1584nm,1645nm;序列前向选择算法组为941nm,948nm,954nm,1126nm,1146nm,1274nm,1412nm,1483nm。
进一步的,所述步骤四的中具体的,采用步骤三所得的初步选择的特征波长,经相关性分析,取得了4组最优波长,其中CARS算法得到4个波长,波长分别为975nm,1220nm,1419nm,1476nm;RF算法得到2个波长,波长分别为1005nm,1442nm;SFS算法得到4个波长,波长分别为924nm,1005nm,1419nm,1584nm,SPA算法得到3个波长,波长分别为948nm,1146nm,1412nm,并分别建立了KNN判别模型、BPNN判别模型、PLS-DA判别模型及LS-SVM判别模型;四组初选特征波长内的相关性分析做法如下:每组内的波长分别计算两两波长之间的皮尔森相关系数,并做热图。原则是相邻两个波长中尽量保留与其他波长相关系数小的波长。首先选出与其他波长相关系数均小于0.9的波长,如果初选波长中相邻两个波长的相关系数值高于0.9,认为这两个波长之间具有高相关性,则把与组内其他波长尽量相关性更多更高的那个波长去掉一个。
进一步的,所述步骤五的中具体的,将CARS-CA筛选出波长变量的每个像素点光谱数据输入到LS-SVM模型中,将判别结果在图像中用不同颜色显示。
进一步的,步骤一中苍术颗粒剂高光谱图像提取包括将苍术配方颗粒剂样本每份一孔,放入96孔板,使每个样本的表面在同一高度,苍术颗粒剂样本区域作为感兴趣区域,具体提取步骤如下:首先对获取的高光谱数据进行黑白校正,最大范围选择苍术颗粒剂样本,计算出每个样本ROI范围内的平均光谱,基于Kennard-Stone方法将样本2/3作为建模集,余下的1/3作为预测集。进一步的,步骤一中的获取多个苍术颗粒剂波段范围为874-1734nm的高光谱图像。
进一步的,步骤一中的采集在975,1220,1419,1476nm处的单波段图像。
采用本发明技术方案,本发明的有益效果为:本发明能通过对苍术颗粒近红外高光谱图像的提取计算后,将判别结果用不同颜色直观显示,能快速、高效的提升了苍术颗粒剂生产商的判别,普通人就可胜任,不需要技术人员在场,该研究为快速无损进行苍术颗粒剂产品溯源提供了有效的技术方法。同时本发明选取了多个适用于苍术颗粒剂产品溯源的最优波长,为今后开发更低成本的苍术颗粒剂的综合质量实时监测系统提供了技术支撑。
附图说明
图1是本发明提供的苍术颗粒剂薄层色谱鉴定结果图;
图2是本发明提供的不同厂家的苍术颗粒剂的原始高光谱图及平均高光谱图;
图3是本发明提供的三个厂家的苍术颗粒剂PCA分析得分图;
图4为CARS算法及RF算法选择特征波长优化图;
图5为不同波长数目下不同模型的总体判别率和Kappa系数示意图;
图6为基于CARS选择的敏感波长之间的相关性分析示意图;
图7为苍术颗粒剂厂家区分研究中初步筛选特征波长及CA筛选波长选择结果;
图8为基于CARS-CA-LS-SVM模型的不同厂家苍术颗粒剂区分结果图。
具体实施方式
结合附图对本发明具体方案具体实施例作进一步的阐述。
一种苍术颗粒剂的信息区分处理方法,包括以下步骤:
步骤一、获取多个苍术颗粒剂近红外波段高光谱图像提取感兴趣区域的光谱反射率值,利用所述光谱反射率值建立多种有监督的分类器判别模型;
步骤二、通过对所述分类判别模型的预测集总体判别正确率以及kappa系数判别不同苍术颗粒剂的区分效果;
步骤三、通过所述多种波长选择算法初步选择特征波长;
步骤四、通过相关性分析获取所述四组最优波长,重新建立对应的判别模型,选择最佳性能的判别模型;
步骤五、待测苍术颗粒剂生产厂商的判别及可视化:将待测苍术颗粒剂样本按照步骤一获得高光谱信息,将单个样本感兴趣区域取筛选出波长变量的每个像素点光谱数据输入到最佳性能的判别模型中,将判别结果在图像中用不同颜色显示。
步骤一中的判别模型为多种有监督的分类器算法模型,包括采用邻近算法建立的判别模型、误差反向传输神经网络建立的判别模型、偏最小二乘法判别分析建立的判别模型及最小二乘支持向量机建立的判别模型。
步骤二中选取正确率为90%以上及kappa系数为0.8-1之间。选取值越大越好,达到90%以上代表正确率很高,kappa系数是评价分类结果一致性和信度的一种重要指标,值越大越好,0.8-1之间表明有极好的一致性;根据上述两个指标优选好的判别模型。
表1为在不同厂家苍术颗粒剂区分研究中基于全波段建立的不同判别模型结果:
Figure BDA0002403852840000051
表1
如表1所示,基于全波段建立的判别模型除了KNN模型外,其它三种模型结果都为100%,Kappa系数为1。为了保证判别效果在100%的前提下加快模型的运算速率,对高光谱数据进行了特征波段的初步提取。
所述步骤三的中采用竞争性自适应重加权采样法(competitive adaptivereweighted sampling,CARS)算法、随机蛙跳算法(random frog,RF)、连续投影算法(successive projections algorithm,SPA)和序列前向选择算法(sequential forwardselection,SFS)初步选择特征波长。具体选择结果如下:
CARS算法选择特征波长(nm)为:975,1122,1220,1237,1294,1368,1你372,1402,1409,1415,1419,1439,1442,1446,1476,1540,1561,1611,1669,
RF算法选择特征波长(nm)为:1005,1368,1409,1415,1442;
SFS算法选择特征波长(nm)为:
924,975,1005,1294,1348,1365,1419,1442,1584,1645;
SPA算法选择特征波长(nm)为:
941,948,954,1126,1146,1274,1412,1483。
所述步骤四的中具体的,采用步骤三所得的初步选择的特征波长,经相关性分析进一步选择,取得了4组最优波长,其中CARS算法得到4个波长,波长分别为975nm,1220nm,1419nm,1476nm;RF算法得到2个波长,波长分别为1005nm,1442nm;SFS算法得到4个波长,波长分别为924nm,1005nm,1419nm,1584nm,SPA算法得到3个波长,波长分别为948nm,1146nm,1412nm,并分别建立了KNN判别模型、BPNN判别模型、PLS-DA判别模型及LS-SVM判别模型;四组初选特征波长内的相关性分析做法如下:每组内的波长分别计算两两波长之间的皮尔森相关系数,并做热图。原则是相邻两个波长中尽量保留与其他波长相关系数小的波长。首先选出与其他波长相关系数均小于0.9的波长,如果初选波长中相邻两个波长的相关系数值高于0.9,认为这两个波长之间具有高相关性,则把与组内其他波长尽量相关性更多更高的那个波长去掉一个。
步骤一中苍术颗粒剂高光谱图像提取包括将苍术配方颗粒剂样本每份一孔,放入96孔板,使每个样本的表面在同一高度,苍术颗粒剂样本区域作为感兴趣区域,具体提取步骤如下:首先对获取的高光谱数据进行黑白校正,最大范围选择苍术颗粒剂样本,计算出每个样本ROI范围内的平均光谱,基于Kennard-Stone方法将样本2/3作为建模集,余下的1/3作为预测集。
步骤一中的获取多个苍术颗粒剂波段范围为874-1734nm的高光谱图像。
步骤一中的优选采集在975,1220,1419,1476nm处的单波段图像。该四个波长为所筛选出的适用于苍术颗粒剂信息处理的最优波长。
实施例一、本发明对150个苍术颗粒剂进行以下处理分析。
采用高光谱成像系统采集图像,系统主要包括分辨率为672×512的CCD相机、分辨率为2.8nm的光谱仪、线光源、计算机、暗箱和电控移动平台。高光谱图像采集前,首先获取暗电流和参考板的高光谱图像数据,用于数据处理前对原始高光谱图像的校正。电控移动平台移动速度为17mm/s,工作距离为20.5cm,曝光时间2.4ms,采集在874-1734nm范围样本的高光谱信息。
步骤一、将874-1734nm波段范围内三个厂家的150个苍术颗粒剂高光谱图像提取感兴趣区域(ROI)的光谱反射率值作为鉴别模型的输入变量,建立判别模型;具体采用邻近算法(k-nearest neighbor,KNN)建立的判别模型、误差反向传输神经网络(backpropagation neural networks,BPNN)建立的判别模型、偏最小二乘法判别分析(partialleast squares-discrimination analysis,PLS-DA)建立的判别模型及最小二乘支持向量机(least square support vector machine,LS-SVM)建立的判别模型。
其中,苍术颗粒剂样本分别置于96孔板中,保证每个样本在同一高度。黑白矫正后设置样本区域作为感兴趣区域(region of interest,ROI),计算出每个样本ROI范围内874-1734nm的平均光谱。
具体提取步骤如下:首先对获取的高光谱数据进行黑白校正,最大范围选择苍术颗粒剂样本,并去除头尾各15个波数的光谱,计算出每个样本ROI范围内的平均光谱。
步骤二、通过对模型的预测集总体判别率以及kappa系数判别不同苍术颗粒剂的区分效果;除KNN判别模型外,预测集的判别率都是100%,kappa系数均为1。
步骤三、通过四种算法初步选择特征波长;为了加快运算速度;通过CARS算法、随机蛙跳算法(random frog,RF)、连续投影算法(successive projections algorithm,SPA)和序列前向选择(sequential forward selection,SFS)算法初步选择特征波长;采用竞争性自适应重加权采样法算法(competitive adaptive reweighted sampling,CARS)、随机蛙跳算法(random frog,RF)、序列前向选择算法(sequential forward selection,SFS)、连续投影算法(successive projections algorithm,SPA)结合相关性分析(correlationanalysis,CA)取得了4组最优波长。采用Matlab R2018a(The Math Works,Natick,USA)处理。获取多个苍术颗粒剂波段,CARS算法组为975nm,1122nm,1220nm,1237nm,1294nm,1368nm,1372nm,1402nm,1409nm,1415nm,1419nm,1439nm,1442nm,1446nm,1476nm,1540nm,1561nm,1611nm,1669nm;随机蛙跳算法组为1005nm,1368nm,1409nm,1415nm,1442nm;连续投影算法组为924nm,975nm,1005nm,1294nm,1348nm,1365nm,1419nm,1442nm,1584nm,1645nm;序列前向选择算法组为941nm,948nm,954nm,1126nm,1146nm,1274nm,1412nm,1483nm。
步骤四、采用CARS算法、RF算法、SFS算法、SPA算法结合相关性分析CA取得了4组最优波长,其中CARS-CA组得到975nm,1220nm,1419nm,1476nm 4个波长,RF-CA组得到1005nm,1442nm 2个波长、SFS—CA组得到924nm,1005nm,1419nm,1584nm 4个波长,SPA-CA组得到948nm,1146nm,1412nm 3个波长,并分别建立了KNN判别模型、BPNN判别模型、PLS-DA判别模型及LS-SVM判别模型。
能够以较少的特征波长个数获得的最好建模效果为:CARS-CA-LS-SVM模型中预测集总体判别率是100%,kappa系数为1。对应的,进一步优选的波长为975nm,1220nm,1419nm,1476nm。
步骤五、待测苍术颗粒剂生产厂商的判别及可视化:将待测苍术颗粒剂样本取经CARS-CA筛选出波长变量的,即975nm,1220nm,1419nm,1476nm波长处高光谱图像的每个像素点光谱数据输入到LS-SVM模型中,将判别结果在图像中用不同颜色直观显示。
其中步骤二、所述N个波数处的平均光谱反射率值,取N个波数处的平均光谱反射率值特征作为一个样本的特征输入,基于LS-SVM多标签分类算法框架的判别分为训练和测试2个阶段:
训练阶段如下:
(1)选取RBF核函数,运用SMO算法计算参数,首先初始化α,令初始的αi全部为0;选取优化变量α1和α2,执行相关的优化计算,得到更新后的α12;开始新的一轮迭代,重复执行上面的步骤,直到全部的αi满足公式的KKT条件以及初始约束条件。
(2)使用十折交叉验证法为核函数寻找最佳参数γ和δ2:在103-1010范围内,通过网格搜索法寻找出最优的参数,一次交叉验证得到一个参数对所对应的模型精度,目的就是找到使得模型精度达到高的参数。γ参数是正则化参数,越高会对训练数据点有更好的拟合,δ2是核宽度参数,较大的δ2可以得到较强的训练效果。进行优化,以RMSECV最小值确定相应的最佳γ值和最佳δ2值。在RBF核函数公式中δ2和γ关系如下为:
Figure BDA0002403852840000091
经过实验计算,将正确率最大的参数作为最佳参数我们选取γ=1200,δ2=0.289。
(3)最终得到LS-SVM分类表达式为:
Figure BDA0002403852840000101
使用上述参数对训练数据进行训练,训练得到一个3分类器。
(4)三分类器的最终决策阈值划分:输出结果小于1.5属于第1类即为A厂,输出结果处于1.5和2.5之间属于第二类即为B厂,大于2.5属于第3类即为C厂。利用不同的颜色划分三个厂家,将输出结果整合进行图像可视化。
测试阶段
(1)应用每个分类器对输入测试数据进行预测,得到测试决策函数集合Ypre依据得到的分类器决策值空间,对Ypre进行分类决策,得到决策结果集合。
(2)依据投票阈值T,确定各测试样本的最终分类结果,并可视化输出。
(3)将输出结果与原始标签进行对比得出精度,用RMSE衡量测试误差:
Figure BDA0002403852840000102
最后得到总体测试精度为100%。
其中步骤四中通过对所述分类判别模型的总体判别正确率以及kappa系数判别训练集和预测集不同苍术颗粒剂的区分效果;
判别分析模型的评价指标是总体判别率以及卡帕(Kappa)系数。总体判别率是预测集中判断正确的个数和整个样本集个数的比值。
Kappa系数是一种判断分类精度的指标,计算公式如下:
Figure BDA0002403852840000103
Figure BDA0002403852840000104
式中po是总体分类的正确率即每一类分类正确的样本数量之和除以总体样本的比值;n为总体样本个数,a1、a2、ac为每一类真实的样本数量;b1、b2、bc为预测出来的每一类样本数量。
实施例二、
图1为苍术颗粒剂薄层色谱鉴定结果,供试品(样品1、2、3)、苍术对照药材溶液点间的分离度理想。具体操作如下:
供试品溶液的制备:精密称定苍术颗粒剂样品5g,研磨至细,加15mL蒸馏水,加入25mL乙酸乙酯,置于超声仪器中超声处理20分钟,过滤,将滤液转移至分液漏斗中静置分层,分取乙酸乙酯液。往水液中加入15mL乙酸乙酯,时时振摇,提取,将两次的乙酸乙酯液合并,放置于蒸发皿中蒸干,残渣加2mL甲醇使其溶解,溶解后的溶液作为供试品溶液。
对照药材溶液:称取1g苍术的对照药材,加入50mL水,煮沸30分钟。过滤,将滤液浓缩至20mL,于室温下静置放冷。加入25mL乙酸乙酯,超声处理20分钟,过滤,将滤液转移至分液漏斗中静置分层,分取乙酸乙酯液。往水液中加入15mL乙酸乙酯,时时振摇,提取,将两次的乙酸乙酯液合并,放置于蒸发皿中蒸干,残渣加2mL甲醇使其溶解,溶解后的溶液作为对照药材溶液。
用移液枪吸取供试品溶液5μL,对照药材溶液3μL,分别将供试品溶液和对照药材溶液点在同一块硅胶G薄层板上,以正己烷-乙酸乙酯(1:1)为展开剂,待其展开,将硅胶G薄层板取出,晾干后,将硅胶G薄层板放置于365nm紫外灯下观察。
对应于苍术对照药材薄层色谱的相同位置,各样品的荧光斑点颜色一致。薄层色谱只能确定样品1、2以及3均为苍术颗粒剂,虽然三个苍术颗粒剂样品的薄层色谱是有些许差别,但并不知道每个样品具体的类别信息。
实施例三、
图2为不同厂家的苍术颗粒剂的原始高光谱图(a)及平均高光谱图(b)。
具体操作如下:
高光谱图像采集前,首先获取暗电流和参考板的高光谱图像数据,用于数据处理前对原始高光谱图像的校正。电控移动平台移动速度为17mm/s,工作距离为20.5cm,曝光时间2.4ms,采集在874-1734nm范围内苍术颗粒剂样本的高光谱信息。
将厂家A、厂家B、厂家C的苍术配方颗粒剂样本均匀放在96孔板中,保证每个样本在同一高度。苍术颗粒剂样本区域作为感兴趣区域(region of interest,ROI)。具体提取步骤如下:首先对获取的高光谱数据进行黑白校正,最大范围选择苍术颗粒剂样本,计算出每个样本ROI范围内874-1734nm的平均光谱。
结果如图2(a)所示,高光谱的开端以及末尾噪声很大,因此去掉了前后各15个波长下的光谱信息用于后续的数据分析。苍术颗粒剂高光谱的总体趋势是先上升后下降,敏感波段大都集中在1100nm-1650nm附近。1100nm-1300nm归属于C-H伸缩振动的二级倍频,1300nm-1400nm归属于C-H伸缩振动的组合带,1450nm归属于O-H伸缩振动的一级倍频,和苍术颗粒剂中存在的水分有关,1480nm附近归属于O-H伸缩振动的二级倍频。1250nm-1680nm含有的信息和苍术颗粒剂中的氨基酸有关。
三个不同厂家的苍术颗粒剂平均高光谱比较接近,尤其是厂家A和厂家C的高光谱图在925nm-950nm以及980nm-1130nm几乎完全重合。三个厂家的苍术颗粒剂的高光谱在1170nm-1320nm以及1440nm-1650nm明显分开,差距较大,这可能和不同厂家苍术颗粒剂主要成分以及水分含量的差异有关。
实施例四、
图3为基于主成分分析的三种苍术颗粒剂鉴别结果。如图所示的三个厂家的苍术颗粒剂PCA分析得分图,PC-1、PC-2以及PC-3的得分加和为99%,说明PC-1、PC-2以及PC-3这三个主成分所包含的光谱信息可以代表苍术颗粒剂样本高光谱主要的信息。图中每两个样本点之间的距离代表了每两个样本之间的差异性大小,距离越远,差异性越大,有可能来源于不同的厂家。厂家B和厂家C的样本距离稍微大一些,但也有两个厂家的部分样本融合在了一起。整体来看可以分为三类,但厂家A与厂家B以及厂家C的样本都互相有融合。每个厂家的样本相对来说都比较分散,并不集中,说明同一厂家的苍术颗粒剂本身差异度也较大。通过PCA方法不能将三个厂家的苍术颗粒剂区分出来,需要进一步建立不同的判别模型。
实施例五、
图4为应用CARS算法及RF算法对不同厂家苍术颗粒剂特征波长选择时的优化图,其中(a)为CARS算法采样变量数量的变化趋势,(b)为RMSECV值(交叉验证均方根误差值),(c)为随着采样运行的增加每个变量的回归系数,(d)为通过RF算法选择特征波长的结果。
随着样本运行次数的增加,选择的特征波长数量迅速减少,然后趋于缓慢,这表明在CARS中已经实现了快速选择,双阶段选择以及精选选择(图4(a))。消除了一些冗余信息之后,RMSECV的值缓慢减少。图4(c)的星号标记线代表当样本运行25次时,RMSECV达到最低值的最佳点,此时获得了19个特征波长。
RF方法可以检测每个波长下的高光谱信息对于不同厂家苍术颗粒剂区分的重要性。波长被选择概率越大,说明该波长下的高光谱信息与不同厂家的苍术颗粒剂样本区分相关性可能较大(图4(d))。
实施例六、
通过CARS算法、RF算法、SPA算法、和SFS算法初步选择特征波长后,图5为不同波长数目下不同模型的总体判别率(a)和Kappa系数(b)示意图。在不同算法优选出的波长与对应模型结合的组别中,随着波长数目的增加,LS-SVM以及KNN模型的总体判别率以及kappa系数总体均呈现上升的趋势。当波长数目为5的数据作为变量输入4种模型后,PLS-DA、BPNN以及LS-SVM模型总体判别率达到了100%,kappa系数的值也均为1。当波长数目再次增加之后,3种模型的总体判别率以及kappa系数的值都达到了最高且保持恒定。
实施例七、
图6为基于CARS选择的敏感波长之间相关性分析的热图,基于CARS算法选择的19个敏感波长的两两相关系数中,975nm与相邻的1122nm相关性高于0.9,与剩余的17个波长相关性均低于0.9,所以975nm需保留。1220nm与相邻的1237nm的相关性系列高于0.9,所以这两个波长中只保留一个相关性较低的1220nm。以此类推,CARS-CA法筛选留下了975nm,1220nm,1419nm和1476nm共四个最佳波长。RF-CA、SFS-CA以及SPA-CA均采用相同的方法,分别筛选得到了2个、4个以及3个最佳波长,具体见表2。
表2为为苍术颗粒剂厂家区分优化的特征波段选择:
Figure BDA0002403852840000141
表2
954nm归属于C-H、N-H、O-H伸缩振动的三级倍频,975nm归属于O-H伸缩振动的二级倍频,1005nm归属于N-H伸缩振动的二级倍频,1122nm归属于C-H伸缩振动,1220nm归属于C-H伸缩振动的二级倍频,1126nm,1146nm,1237nm,1294nm,1348nm,1365nm,1368nm为C-H的伸缩振动的二级倍频,1372nm归属于1412nm,1415nm归属于芳香烃的C-H拉伸振动,1419nm归属于O-H伸缩振动的一级倍频,1446nm归属于O-H伸缩振动的一级倍频。1476nm,1483nm归属于O-H伸缩振动的二级倍频,1584nm归属于C-H伸缩振动的一级倍频,1645nm归属于芳香基团的C-H键。
图7为苍术颗粒剂厂家区分研究中初步筛选特征波长(a)及CA筛选波长选择结果(b)。
4种方法初步筛选得到的特征波长在整条光谱上的分布主要集中在950-1010nm,1200-1300nm,1360-1410nm以及1550-1670nm(图7),与高光谱图2(b)所示的三个厂家苍术颗粒剂平均光谱差异明显的波段相一致。CARS选择的特征波长,在1100nm-1300nm、1360nm-1420nm以及1430nm-1480nm位置接近,和相关性分析结果一致。结合图7(b)和图2(b)可知,CARS-CA、RF-CA、SFS-CA、SPA-CA得到的最优波长分别有2个(1220nm,1476nm),1个(1442nm),1个(1584nm)、1个(1146nm),均分布对应的平均光谱差异度较大的区域。其中1476nm、1442nm以及1584nm的信息都和苍术颗粒剂中的氨基酸有关。与原始数据的256个波长变量相比,优化后分别减少了98.44%、99.22%、98.44%、98.83%的变量。
为了进一步减小变量的数量,加快模型的运算速度,快速区分不同厂家的苍术颗粒剂样本,分别将CARS-CA、RF-CA、SFS-CA和SPA-CA选择的最佳波长用作分类器的输入值以构建不同的判别模型。基于CARS-CA、RF-CA、SFS-CA、SPA-CA选择的最优波长,和原始数据的256个波长变量相比,分别减小了98.44%、99.22%、98.44%、98.83%的变量,大大增加了模型的运算效率。
Figure BDA0002403852840000161
表3
表3为基于最优波长建立的区分不同厂家苍术颗粒剂的模型判别,比较四种模型的总体判别效以及kappa系数可以发现,基于四组最佳波段建立的KNN以及BPNN模型的总体判别率均没有达到100%,kappa系数也没有达到1。基于四组最佳特征波长建立的PLS-DA以及LS-SVM模型的总体判别率为100%以及kappa系数为1的占比分别为25%以及50%,可以得出LS-SVM模型判别效果优于其他三种。基于CARS-CA所建立的四种模型,总体判别率为100%以及kappa系数为1的占比为50%,优于其他三组最佳特征波长。综上所述,CARS-CA-LS-SVM模型在总体判别率为100%以及kappa系数为1的情况下,大大减小了模型的输入变量,加快了运算效率,为当前适合区分不同厂家苍术颗粒剂的最优模型。
实施例八、
基于最优模型建立的判别模型结果可视化:
使用已确定的对模型的运算效率提高效果最好的最佳模型LS-SVM以及最佳波长CARS-CA,用于预测按照实例一步骤一要求已获得高光谱图像的待测样品。厂家A、B、C的分类标签分别为1、2和3(图6)。将待测苍术颗粒剂样本取975nm,1220nm,1419nm,1476nm波长变量的高光谱图像中每个像素点光谱数据输入到LS-SVM模型中,判别结果在图像中用不同颜色直观显示。
图8为基于CARS-CA-LS-SVM模型的不同厂家苍术颗粒剂区分结果图,首先,所有的苍术颗粒剂样本都能被正确识别,并且很容易地与其他厂家区分。可将结果图设为彩色显示,例如厂家B的苍术颗粒剂样本有4个样本的一些像素点被预测成了厂家C,本来应该被预测为黄色的一些像素点被预测成了红色。其原因可能是该像素点的光谱携带了超出厂家C范围的苍术颗粒剂信息,当使用基于样本平均谱的模型来预测相应的像素谱时,这些光谱特征会偏离样本平均谱的预测集。整体来看,4个样本所有像素点的颜色,还是预测为厂家B黄色的像素点较多,是准确的。
不同厂家苍术颗粒剂的区分可视化是基于最优模型和特征波长建立的鲁棒性和代表性的判别模型。可视化的满意性能验证利用高光谱成像技术对不同厂家苍术颗粒剂进行区分的可视化的可行性,为苍术颗粒剂的质量监控提供一种有效的方法,为今后开发苍术颗粒剂和其他中药的综合质量实时监测系统提供了可能。
高光谱技术结合CARS和CA法进行二次特征波长选择,可有效实现不同厂家的苍术颗粒剂可视化判别,为解决苍术颗粒剂的无损质量控制和产品溯源问题提供了参考。
本发明剔除不相关或非线性变量的输入变量,降低了计算量,提高了运算效率,为开发基于特征波长的中药制剂产品溯源多光谱检测系统提供了科学支持。以近红外高光谱图像中光谱反射率信息作为输入变量建立的分类模型可用于不同厂家苍术颗粒剂的区分,为苍术颗粒剂的质量检测提供了一种有效的方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (9)

1.一种苍术颗粒剂的信息区分处理方法,其特征在于,包括以下步骤:
步骤一、获取多个苍术颗粒剂近红外波段高光谱图像提取感兴趣区域的光谱反射率值,利用所述光谱反射率值建立多种有监督的分类器判别模型;
步骤二、通过对所述分类判别模型的预测集总体判别正确率以及kappa系数判断不同模型对不同苍术颗粒剂的区分效果;
步骤三、通过所述多种波长选择算法初步选择特征波长;
步骤四、通过相关性分析获取所述四组最优波长,重新建立对应的判别模型,选择最佳性能的判别模型;
步骤五、待测苍术颗粒剂的生产厂商判别及可视化:将待测苍术颗粒剂样本取按步骤四筛选出的最优波长变量,高光谱图像中每个像素点光谱数据输入到最佳性能的判别模型中,将判别结果在图像中用不同颜色显示。
2.如权利要求1所述的所述一种苍术颗粒剂的信息区分处理方法,其特征在于,步骤一中的判别模型为多种有监督的分类器算法模型,包括采用邻近算法建立的判别模型、误差反向传输神经网络建立的判别模型、偏最小二乘法判别分析建立的判别模型及最小二乘支持向量机建立的判别模型。
3.如权利要求1所述的所述一种苍术颗粒剂的信息区分处理方法,其特征在于,步骤二中选取正确率为90%以上及kappa系数为0.8-1之间。
4.如权利要求1所述的所述一种苍术颗粒剂的信息区分处理方法,其特征在于,所述步骤三的中采用竞争性自适应重加权采样算法、随机蛙跳算法、连续投影算法和序列前向选择算法初步选择特征波长,选取波长CARS算法组为975nm,1122nm,1220nm,1237nm,1294nm,1368nm,1372nm,1402nm,1409nm,1415nm,1419nm,1439nm,1442nm,1446nm,1476nm,1540nm,1561nm,1611nm,1669nm;随机蛙跳算法组为1005nm,1368nm,1409nm,1415nm,1442nm;连续投影算法组为924nm,975nm,1005nm,1294nm,1348nm,1365nm,1419nm,1442nm,1584nm,1645nm;序列前向选择算法组为941nm,948nm,954nm,1126nm,1146nm,1274nm,1412nm,1483nm。
5.如权利要求4所述的所述一种苍术颗粒剂的信息区分处理方法,其特征在于,所述步骤四的中具体的,采用步骤三所得的初步选择的特征波长,经相关性分析,取得了4组最优波长,其中CARS算法得到4个波长,波长分别为975nm,1220nm,1419nm,1476nm;RF算法得到2个波长,波长分别为1005nm,1442nm;SFS算法得到4个波长,波长分别为924nm,1005nm,1419nm,1584nm,SPA算法得到3个波长,波长分别为948nm,1146nm,1412nm,并分别建立了KNN判别模型、BPNN判别模型、PLS-DA判别模型及LS-SVM判别模型;四组初选特征波长内的相关性分析做法如下:每组内的波长分别计算两两波长之间的皮尔森相关系数,并做热图。原则是相邻两个波长中尽量保留与其他波长相关系数小的波长。首先选出与其他波长相关系数均小于0.9的波长,如果初选波长中相邻两个波长的相关系数值高于0.9,认为这两个波长之间具有高相关性,则把与组内其他波长尽量相关性更多更高的那个波长去掉一个。
6.如权利要求5所述的所述一种苍术颗粒剂的信息区分处理方法,其特征在于,所述步骤五中具体的,将CARS-CA筛选出波长变量的每个像素点光谱数据输入到LS-SVM模型中,将判别结果在图像中用不同颜色显示。
7.如权利要求1所述的所述一种苍术颗粒剂的信息区分处理方法,其特征在于,步骤一中苍术颗粒剂高光谱图像提取包括将苍术配方颗粒剂样本每份一孔,放入96孔板,使每个样本的表面在同一高度,苍术颗粒剂样本区域作为感兴趣区域。
8.如权利要求1所述的所述一种苍术颗粒剂的信息区分处理方法,其特征在于,步骤一中的获取多个苍术颗粒剂波段范围为874-1734nm的高光谱图像。
9.如权利要求1或4所述的所述一种苍术颗粒剂的信息区分处理方法,其特征在于,步骤一中的采集在975nm,1220nm,1419nm,1476nm处的单波段图像。
CN202010155476.8A 2020-03-09 2020-03-09 一种苍术颗粒剂的信息区分处理方法 Pending CN111398211A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010155476.8A CN111398211A (zh) 2020-03-09 2020-03-09 一种苍术颗粒剂的信息区分处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010155476.8A CN111398211A (zh) 2020-03-09 2020-03-09 一种苍术颗粒剂的信息区分处理方法

Publications (1)

Publication Number Publication Date
CN111398211A true CN111398211A (zh) 2020-07-10

Family

ID=71432250

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010155476.8A Pending CN111398211A (zh) 2020-03-09 2020-03-09 一种苍术颗粒剂的信息区分处理方法

Country Status (1)

Country Link
CN (1) CN111398211A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113008805A (zh) * 2021-02-07 2021-06-22 浙江工业大学 基于高光谱成像深度分析的白芷饮片质量预测方法
CN113917003A (zh) * 2021-08-30 2022-01-11 浙江工业大学 一种白芷饮片中欧前胡素含量的检测方法
CN114092710A (zh) * 2021-11-23 2022-02-25 沈阳农业大学 一种基于融合特征的dcnn叶瘟病分级模型的构建方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105021529A (zh) * 2015-06-11 2015-11-04 浙江水利水电学院 融合光谱和图像信息的作物病虫害识别和区分方法
WO2017194308A1 (de) * 2016-05-11 2017-11-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur bestimmung der erreichten qualität bei der herstellung von granulaten oder pellets oder von beschichtungen auf granulen oder pellets
CN109540831A (zh) * 2019-01-25 2019-03-29 中国中医科学院中药研究所 基于高光谱成像技术的枸杞子品种识别方法
CN110849828A (zh) * 2019-12-13 2020-02-28 嘉兴职业技术学院 一种基于高光谱图像技术的藏红花分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105021529A (zh) * 2015-06-11 2015-11-04 浙江水利水电学院 融合光谱和图像信息的作物病虫害识别和区分方法
WO2017194308A1 (de) * 2016-05-11 2017-11-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur bestimmung der erreichten qualität bei der herstellung von granulaten oder pellets oder von beschichtungen auf granulen oder pellets
CN109540831A (zh) * 2019-01-25 2019-03-29 中国中医科学院中药研究所 基于高光谱成像技术的枸杞子品种识别方法
CN110849828A (zh) * 2019-12-13 2020-02-28 嘉兴职业技术学院 一种基于高光谱图像技术的藏红花分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
何娟等: "近红外光谱结合偏最小二乘判别对硫熏浙贝母的无损鉴别", 《光谱学与光谱分析》 *
姜微: "高光谱技术在马铃薯品种鉴别及品质无损检测中的应用研究", 《中国博士学位论文全文数据库》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113008805A (zh) * 2021-02-07 2021-06-22 浙江工业大学 基于高光谱成像深度分析的白芷饮片质量预测方法
CN113008805B (zh) * 2021-02-07 2024-03-26 浙江工业大学 基于高光谱成像深度分析的白芷饮片质量预测方法
CN113917003A (zh) * 2021-08-30 2022-01-11 浙江工业大学 一种白芷饮片中欧前胡素含量的检测方法
CN114092710A (zh) * 2021-11-23 2022-02-25 沈阳农业大学 一种基于融合特征的dcnn叶瘟病分级模型的构建方法

Similar Documents

Publication Publication Date Title
Jiang et al. Fusion of machine vision technology and AlexNet-CNNs deep learning network for the detection of postharvest apple pesticide residues
Yu et al. Identification of crack features in fresh jujube using Vis/NIR hyperspectral imaging combined with image processing
Zhang et al. Principles, developments and applications of computer vision for external quality inspection of fruits and vegetables: A review
Zhang et al. Hyperspectral imaging combined with multivariate analysis and band math for detection of common defects on peaches (Prunus persica)
CN111398211A (zh) 一种苍术颗粒剂的信息区分处理方法
Liu et al. Using convolution neural network and hyperspectral image to identify moldy peanut kernels
Zhang et al. Integrating spectral and image data to detect Fusarium head blight of wheat
Guzmán et al. Infrared machine vision system for the automatic detection of olive fruit quality
Zheng et al. AFFU-Net: Attention feature fusion U-Net with hybrid loss for winter jujube crack detection
Zhang et al. Non-destructive identification of slightly sprouted wheat kernels using hyperspectral data on both sides of wheat kernels
Weng et al. Reflectance images of effective wavelengths from hyperspectral imaging for identification of Fusarium head blight-infected wheat kernels combined with a residual attention convolution neural network
KR102448123B1 (ko) 농산물 신선도 예측 방법 및 장치
Almoujahed et al. Detection of fusarium head blight in wheat under field conditions using a hyperspectral camera and machine learning
Jiang et al. Feasibility of identifying the authenticity of fresh and cooked mutton kebabs using visible and near-infrared hyperspectral imaging
Barbedo A review on the combination of deep learning techniques with proximal hyperspectral images in agriculture
CN109883967A (zh) 一种基于信息融合的中华绒螯蟹品质等级判别方法
CN114663821A (zh) 基于视频高光谱成像技术的产品质量实时无损检测方法
Wang et al. Soluble Solids Content prediction for Korla fragrant pears using hyperspectral imaging and GsMIA
Yu et al. Three-channel infrared imaging for object detection in haze
Sheng et al. Data fusion strategy for rapid prediction of moisture content during drying of black tea based on micro-NIR spectroscopy and machine vision
Li et al. Online small-object anti-fringe sorting of tobacco stem impurities based on hyperspectral superpixels
CN114689539A (zh) 基于近红外高光谱图像的大豆种子病变粒识别方法及系统
Rößle et al. Efficient Noninvasive FHB Estimation using RGB Images from a Novel Multiyear, Multirater Dataset
Zhu et al. Detection of fungal infection in apple using hyperspectral transformation of RGB images with kernel regression
Guan et al. A corn canopy organs detection method based on improved DBi-YOLOv8 network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination