CN107703095A - 一种基于近红外光谱及化学计量学的二元掺伪三七定量分析方法 - Google Patents
一种基于近红外光谱及化学计量学的二元掺伪三七定量分析方法 Download PDFInfo
- Publication number
- CN107703095A CN107703095A CN201710927380.7A CN201710927380A CN107703095A CN 107703095 A CN107703095 A CN 107703095A CN 201710927380 A CN201710927380 A CN 201710927380A CN 107703095 A CN107703095 A CN 107703095A
- Authority
- CN
- China
- Prior art keywords
- pseudo
- ginseng
- sample
- near infrared
- infrared spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 244000131316 Panax pseudoginseng Species 0.000 title claims abstract description 82
- 235000003181 Panax pseudoginseng Nutrition 0.000 title claims abstract description 81
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 33
- 238000004445 quantitative analysis Methods 0.000 title claims abstract description 18
- 238000005259 measurement Methods 0.000 title claims abstract description 14
- 239000000126 substance Substances 0.000 title claims abstract description 11
- 238000001228 spectrum Methods 0.000 claims abstract description 23
- 230000008859 change Effects 0.000 claims abstract description 16
- 230000000694 effects Effects 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims abstract description 9
- 238000012937 correction Methods 0.000 claims abstract description 7
- 238000002203 pretreatment Methods 0.000 claims description 12
- 239000000203 mixture Substances 0.000 claims description 9
- 239000000463 material Substances 0.000 claims description 7
- 238000002156 mixing Methods 0.000 claims description 2
- 239000000523 sample Substances 0.000 claims 5
- 239000006101 laboratory sample Substances 0.000 claims 2
- 238000009472 formulation Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 6
- 238000009499 grossing Methods 0.000 abstract description 6
- 238000002474 experimental method Methods 0.000 abstract description 5
- 238000002360 preparation method Methods 0.000 abstract description 5
- 244000163122 Curcuma domestica Species 0.000 description 33
- 238000000354 decomposition reaction Methods 0.000 description 31
- 235000014375 Curcuma Nutrition 0.000 description 18
- 240000009138 Curcuma zedoaria Species 0.000 description 18
- 235000003405 Curcuma zedoaria Nutrition 0.000 description 18
- 239000001812 curcuma zedoaria berg. rosc. Substances 0.000 description 18
- VFLDPWHFBUODDF-FCXRPNKRSA-N curcumin Chemical compound C1=C(O)C(OC)=CC(\C=C\C(=O)CC(=O)\C=C\C=2C=C(OC)C(O)=CC=2)=C1 VFLDPWHFBUODDF-FCXRPNKRSA-N 0.000 description 18
- 235000019509 white turmeric Nutrition 0.000 description 18
- 235000003392 Curcuma domestica Nutrition 0.000 description 15
- 244000062241 Kaempferia galanga Species 0.000 description 15
- 235000013421 Kaempferia galanga Nutrition 0.000 description 15
- 235000003373 curcuma longa Nutrition 0.000 description 15
- 235000013976 turmeric Nutrition 0.000 description 15
- 238000010238 partial least squares regression Methods 0.000 description 9
- 238000002790 cross-validation Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 238000013461 design Methods 0.000 description 6
- 239000010453 quartz Substances 0.000 description 6
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 5
- 229940126678 chinese medicines Drugs 0.000 description 4
- 238000009795 derivation Methods 0.000 description 4
- 101150065184 sym-2 gene Proteins 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000003556 assay Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000001035 drying Methods 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000004497 NIR spectroscopy Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000004817 gas chromatography Methods 0.000 description 2
- 238000005220 pharmaceutical analysis Methods 0.000 description 2
- 238000012628 principal component regression Methods 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 206010002383 Angina Pectoris Diseases 0.000 description 1
- 241000272827 Anser caerulescens Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002460 anti-migrenic effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000004313 glare Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000031169 hemorrhagic disease Diseases 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 208000019423 liver disease Diseases 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000001028 reflection method Methods 0.000 description 1
- 230000008736 traumatic injury Effects 0.000 description 1
- 238000000870 ultraviolet spectroscopy Methods 0.000 description 1
- 238000002211 ultraviolet spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
- G01N2201/129—Using chemometrical methods
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及一种基于近红外光谱及化学计量学的二元掺伪三七定量分析方法。具体步骤为配制实验样品并采集样品的近红外光谱;采用整体顺序局部随机的分组方式,将数据集划分为训练集和预测集;根据RMSECV随因子数的变化确定最佳因子数;考察SG平滑法、多元散射校正、标准正态变量、一阶导数、二阶导数、连续小波变换及其组合的预处理效果,得到最佳预处理方法;采用最佳预处理方法对光谱预处理后,建立PLSR模型,对未知样品预测。本发明基于近红外光谱及化学计量学,高效无损,检测迅速,准确度高。本发明适用于二元掺伪三七样品的定量分析。
Description
技术领域
本发明属于药物分析领域,具体涉及一种基于近红外光谱及化学计量学的二元掺伪三七定量分析方法。
背景技术
中药材三七药用价值极高,广泛应用于各种出血性疾病、瘀血阻滞、跌打损伤、冠心病、心绞痛、慢性肝病、偏头痛等,但是三七从种植到采收至少需要三年,因此造成了三七资源紧缺、价格昂贵。市场上常有一些形态相似的伪品出现,如莪术、姜黄、高良姜等。这些伪品与三七混用,降低了三七的疗效,甚至会对人体健康产生极大威胁。因此,提供高效、准确的中药三七掺伪定量分析方法具有重要意义(谢绍鹏,杨杰,杨添钧,一种三七真伪优劣的快速鉴别方法,中国发明专利,2014,ZL201410784877.4)。
目前三七的检测方法有气相色谱法、高效液相色谱法、紫外光谱法、近红外光谱法等。尽管这些方法都能得到较好的预测效果,但是也存在一些局限,如气相色谱法和高效液相色谱法操作费时费力且样品预处理复杂;紫外光谱区分度不高等。近红外光谱技术由于其快速、无损、无需样品预处理等优点成为药物分析的首选方法(白雁,龚海燕,陈志红,王星,利用近红外光谱技术评价中药药材综合质量的方法,中国发明专利,2008,ZL200810050097.1)。但是近红外光谱信号较弱,谱峰重叠严重,需要借助化学计量学中的多元校正方法才能进行定量分析。多元校正方法主要有主成分回归法(PCR)、人工神经网络法(ANN)和偏最小二乘回归(PLSR)等方法,其中PLSR因其参数少、简单、快速等优点成为应用最为广泛的多元校正方法。
三七等复杂样品的近红外光谱容易受到测试条件如温度、噪声和杂散光等的影响,这些因素会导致多元校正方法的预测准确度降低。因此,需要采用合适的预处理方法对光谱进行处理。预处理方法主要包括SG平滑,一阶导数,二阶导数,连续小波变换,多元散射校正,标准正态变量等。SG平滑、一阶导数和二阶导数三种预处理方法都需要确定窗口参数,因为窗口数太低,平滑滤噪效果不理想;窗口数太高,平滑效果变好,但是会丢失较多的信息,造成光谱信号的失真。小波变换有两个重要的参数需要确定,即分解尺度和小波函数,这两个参数直接关系到光谱预处理结果的好坏。但是,对于具体体系,哪种预处理方法处理效果最好,需要结合实际情况选取。
发明内容
发明的目的是针对上述存在的问题,以近红外光谱作为测试手段,通过合适的预处理方法对光谱进行预处理,再建立PLSR模型,提供一种准确、快速的二元掺伪三七定量分析方法。
为实现本发明所提供的技术方案包括以下步骤:
1)配制实验样品并采集样品的近红外光谱
在多家中药店分别购买三七及与三七类似的中药材样品若干个。按照0-100%的质量百分比范围配制三七掺伪样品若干个,其中同一浓度下用不同的三七配制3个三七掺伪样品,保证样品的多样性。将每份药材分别干燥、粉碎,过120目筛。将样品放入密封玻璃瓶中待测。设置近红外光谱仪器的参数,以积分球漫反射法采集样品的近红外光谱。
2)数据分组
采用整体顺序局部随机的分组方式,将数据集划分为训练集和预测集。
3)确定偏最小二乘回归模型的因子数
根据蒙特卡罗交叉验证的交叉验证均方根误差(RMSECV)随因子数(LV)的变化确定偏最小二乘回归模型的因子数,RMSECV最小值对应的因子数为最佳因子数。
4)使用不同预处理方法及其组合对光谱信号进行预处理,选取最佳预处理方法
根据预测均方根误差(RMSEP)随着窗口的变化确定SG平滑及求导的最佳窗口,窗口大小取值范围3-59,间隔为2,计算不同窗口对应的RMSEP值。RMSEP最小值对应的窗口为最佳窗口。
根据RMSEP随着小波函数及分解尺度的变化确定CWT的最佳小波函数及分解尺度。小波函数包括Haar,db2、db3…db20等19个函数,coif1、coif2…cofi5等5个函数,sym2、sym3…sym8等7个函数,bior1.1、bior1.3、bior1.5、bior2.2、bior2.4、bior2.6、bior2.8、bior3.1等8个函数,共40个函数,分解尺度范围1-40,计算不同小波函数及分解尺度对应的RMSEP值。RMSEP最小值对应的小波函数及分解尺度为最佳小波函数及分解尺度。
在最佳参数下,考察SG平滑法、标准正态变量(SNV)、多元散射校正(MSC)、一阶导数(1st Der)、二阶导数(2nd Der)、小波变换(CWT)等预处理方法及其组合SNV-1st Der、MSC-1st Der、SNV-2nd Der、MSC-2nd Der、SNV-CWT、MSC-CWT对光谱进行预处理的效果,RMSEP最小值对应的预处理方法为最佳预处理方法。
5)最佳预处理方法结合PLSR建模并预测
采用最佳预处理方法对光谱预处理后,建立PLSR模型,对未知样品预测。
本发明优势在于使用不同预处理方法及其组合方法对数据进行预处理,然后再建立偏最小二乘回归模型,从而提高了对二元掺伪三七中各组分含量检测的准确度。
附图说明
图1是75个三七莪术二元掺伪样品的近红外光谱图
图2是三七莪术二元掺伪数据的RMSEP随着窗口尺度的变化图(a)SG平滑(b)一阶导数(c)二阶导数
图3是三七莪术二元掺伪数据的RMSEP随着分解尺度和小波函数的变化图
图4是三七莪术二元掺伪数据最优预处理结合PLSR建模对预测集预测的预测值与真实值的关系图(a)三七组分SG平滑-PLSR建模;(b)莪术组分CWT-SNV-PLSR建模
图5是75个三七姜黄二元掺伪样品的近红外光谱图
图6是三七姜黄二元掺伪数据最优预处理结合PLSR建模对预测集预测的预测值与真实值的关系图(a)三七组分MSC-PLSR建模;(b)姜黄组分MSC-PLSR建模
图7是75个三七高良姜二元掺伪样品的近红外光谱图
图8是三七高良姜二元掺伪数据最优预处理结合PLSR建模对预测集预测的预测值与真实值的关系图(a)三七组分SNV-PLSR建模;(b)高良姜组分SG平滑-PLSR建模
具体实施方式
为更好理解本发明,下面结合实施例对本发明做进一步地详细说明,但是本发明要求保护的范围并不局限于实施例所表示的范围。
实施例1:
本实施例是应用于三七莪术二元掺伪样品的检测,采用近红外光谱和最佳预处理结合PLSR建模方法对样品中三七和莪术进行定量分析。具体的步骤如下:
1)配制实验样品并采集样品的近红外光谱
在天津多家中药店购买三七样品25个、莪术样品28个。使用烘箱对样品在60℃下干燥3小时后取出。对干燥后的药材进行磨粉,过120目筛,储存在干燥器内备用。将25个三七样品按价格高低归为高中低三个等级。三七、莪术浓度范围0-100%,间隔为5%,其中每个浓度比配制3个样品,共75个样品。设计每个样品总质量为4g,根据总质量计算出每个组分理论质量,根据理论质量采用分析天平称量,记录每个样品各组分的实际质量,组分实际质量除以总质量得到样品中各组分的质量百分比,作为每个组分的目标值。
采用VERTEX70近红外光谱仪测量样品的近红外光谱,设置采样波数范围12000-4000cm-1,分辨率为4cm-1,背景扫描次数64次,样品扫描次数64次,仪器预热1小时,待仪器参数Amplitude等相关值稳定后开始测样。首先将未装样品的石英瓶置于光点的中心处,作为背景保存,然后进行待测样品扫描,将样品装在石英瓶中高2cm处左右(避免光透过),在垫有擦净纸的桌面上旋转上下振动20次左右,保证粉末样品表面平整。将装样石英瓶置于光点的中心处,每个样品采集光谱3次,每采集1次,旋转石英瓶1次,取3次光谱的平均值作为该样品的光谱。图1显示了该实施例75个样品的近红外光谱。
2)数据分组
在75个样品中,每个设计浓度对应3个样品,3个样品使用的三七为高、中、低3档。采用整体顺序局部随机的分组方式,即每3个样品中,随机选取2个样品到训练集,剩余样品到预测集。75个样品全部分组后得到50个样品的训练集,25个样品的预测集。
3)确定偏最小二乘回归模型的因子数
根据蒙特卡罗交叉验证的交叉验证均方根误差(RMSECV)随因子数(LV)的变化确定偏最小二乘回归模型的因子数,RMSECV最小值对应的因子数为最佳因子数。本实施例中三七和莪术组分的最佳因子数都为10。
4)使用不同预处理方法及其组合对光谱信号进行预处理,选取最佳预处理方法
根据预测均方根误差(RMSEP)随着窗口的变化确定SG平滑及求导的窗口大小,窗口大小取值范围3-59,间隔为2,计算不同窗口对应的RMSEP值。RMSEP最小值对应的窗口为最佳窗口。图2显示了本实施例三七和莪术组分的RMSEP随着窗口尺度的变化。从中可以看出,三七组分SG平滑、一阶导数、二阶导数图最佳窗口分别为51、59、59,莪术组分SG平滑、一阶导数、二阶导数图最佳窗口分别为59、59、45。
根据RMSEP随着小波函数及分解尺度的变化确定CWT的最佳小波函数及分解尺度。小波函数包括Haar,db2、db3…db20等19个函数,coif1、coif2…cofi5等5个函数,sym2、sym3…sym8等7个函数,bior1.1、bior1.3、bior1.5、bior2.2、bior2.4、bior2.6、bior2.8、bior3.1等8个函数,共40个函数,分解尺度范围1-40,计算不同小波函数及分解尺度对应的RMSEP值。RMSEP最小值对应的小波函数及分解尺度为最佳小波函数及分解尺度。图3显示了本实施例三七组分的RMSEP随着分解尺度和小波函数的变化。从图中可以得出三七组分最佳小波函数和分解尺度分别为db19和39。类似的,可以得到莪术组分的最佳小波函数和分解尺度分别为db19和60。
在最佳参数下,考察SG平滑法、标准正态变量(SNV)、多元散射校正(MSC)、一阶导数(1st Der)、二阶导数(2nd Der)、小波变换(CWT)等预处理方法及其组合SNV-1st Der、MSC-1st Der、SNV-2nd Der、MSC-2nd Der、SNV-CWT、MSC-CWT对光谱进行预处理的效果,RMSEP最小值对应的预处理方法为最佳预处理方法。表1显示了不同预处理方法的RMSEP值。从表中可以看出,该实施例三七和莪术组分RMSEP最小值对应的预处理方法为CWT-SNV和SG平滑,因此最佳预处理方分别为CWT-SNV和SG平滑。
表1三七莪术二元掺伪数据不同预处理方法结合PLSR预测的RMSEP
5)最佳预处理方法结合PLSR建模并预测
采用最佳预处理方法对光谱预处理后,建立PLSR模型,对未知样品预测。图4显示了本实施例最佳预处理方法结合PLSR建模对三七和莪术组分预测的预测值与真实值的关系图。从图可以看出,在结合最佳预处理方法后,PLSR模型对两种组分预测的相关系数都在0.99以上。因此,本发明可以实现三七莪术二元掺伪样品的准确定量。
实施例2:
本实施例是应用于三七姜黄二元掺伪数据的检测,采用近红外光谱和最佳预处理结合PLSR建模方法对三七和姜黄组分进行定量分析。具体的步骤如下:
1)配制实验样品并采集样品的近红外光谱
在天津多家中药店购买三七样品25个、姜黄样品28个。使用烘箱对样品在60℃下干燥3小时后取出。对干燥后的药材进行磨粉,过120目筛,储存在干燥器内备用。将25个三七样品按价格高低归为高中低三个等级。三七、姜黄浓度范围0-100%,间隔为5%,其中每个浓度比配制3个样品,共75个样品。设计每个样品总质量为4g,根据总质量计算出每个组分理论质量,根据理论质量采用分析天平称量,记录每个样品各组分的实际质量,组分实际质量除以总质量得到样品中各组分的质量百分比,作为每个组分的目标值。
采用VERTEX70近红外光谱仪测量样品的近红外光谱,设置采样波数范围12000-4000cm-1,分辨率为4cm-1,背景扫描次数64次,样品扫描次数64次,仪器预热1小时,待仪器Amplitude等参数稳定后开始测样。首先将未装样品的石英瓶置于光点的中心处,作为背景保存,然后进行待测样品扫描,将样品装在石英瓶中高2cm处左右(避免光透过),在垫有擦净纸的桌面上旋转上下振动20次左右,保证粉末样品表面平整。将装样石英瓶置于光点的中心处,每个样品采集光谱3次,每采集1次,旋转石英瓶1次,取3次光谱的平均值作为该样品的光谱。图5显示了该实施例75个样品的近红外光谱。
2)数据分组
在75个样品中,每个设计浓度对应3个样品,3个样品使用的三七为高、中、低3档。采用整体顺序局部随机的分组方式,即每3个样品中,随机选取2个样品到训练集,剩余样品到预测集。75个样品全部分组后得到50个样品的训练集,25个样品的预测集。
3)确定偏最小二乘回归模型的因子数
根据蒙特卡罗交叉验证的交叉验证均方根误差(RMSECV)随因子数(LV)的变化确定偏最小二乘回归模型的因子数,RMSECV最小值对应的因子数为最佳因子数。本实施例中三七和姜黄组分的最佳因子数都为8。
4)使用不同预处理方法及其组合对光谱信号进行预处理,选取最佳预处理方法
根据预测均方根误差(RMSEP)随着窗口的变化确定SG平滑及求导的窗口大小,窗口大小取值范围3-59,间隔为2,计算不同窗口对应的RMSEP值。RMSEP最小值对应的窗口为最佳窗口。本实施例中三七和姜黄组分的SG平滑、一阶导数和二阶导数的最佳窗口数分别为11、23、55和55、51、59。
表2三七姜黄二元掺伪数据不同预处理方法结合PLSR预测的RMSEP
根据RMSEP随着小波函数及分解尺度的变化确定CWT的最佳小波函数及分解尺度。小波函数包括Haar,db2、db3…db20等19个函数,coif1、coif2…cofi5等5个函数,sym2、sym3…sym8等7个函数,bior1.1、bior1.3、bior1.5、bior2.2、bior2.4、bior2.6、bior2.8、bior3.1等8个函数,共40个函数,分解尺度范围1-40,计算不同小波函数及分解尺度对应的RMSEP值。RMSEP最小值对应的小波函数及分解尺度为最佳小波函数及分解尺度。本实施例中三七组分最佳小波函数及分解尺度分别为39和Haar,姜黄组分最佳小波函数及分解尺度分别为60和Haar。
在最佳参数下,考察SG平滑法、标准正态变量(SNV)、多元散射校正(MSC)、一阶导数(1st Der)、二阶导数(2nd Der)、小波变换(CWT)等预处理方法及其组合SNV-1st Der、MSC-1st Der、SNV-2nd Der、MSC-2nd Der、SNV-CWT、MSC-CWT对光谱进行预处理的效果,RMSEP最小值对应的预处理方法为最佳预处理方法。表2显示了不同预处理方法的RMSEP值。从表中可以看出,该实施例三七和姜黄组分RMSEP最小值对应的预处理方法都为MSC,因此最佳预处理方法都为MSC。
5)最佳预处理方法结合PLSR建模并预测
采用最佳预处理方法对光谱预处理后,建立PLSR模型,对未知样品预测。图6显示了本实施例最佳预处理方法MSC结合PLSR建模对三七和姜黄组分预测的预测值与真实值的关系图。从图可以看出,在结合最佳预处理方法后,PLSR模型对两种组分预测的相关系数都在0.99以上。因此,本发明可以实现三七姜黄二元掺伪样品的准确定量。
实施例3:
本实施例是应用于三七高良姜二元掺伪样品的检测,采用近红外光谱和最佳预处理结合PLSR建模方法对三七和高良姜组分进行定量分析。具体的步骤如下:
1)配制实验样品并采集样品的近红外光谱
在天津多家中药店购买三七样品25个、高良姜样品28个。使用烘箱对样品在60℃下干燥3小时后取出。对干燥后的药材进行磨粉,过120目筛,储存在干燥器内备用。将25个三七样品按价格高低归为高中低三个等级。三七、高良姜浓度范围0-100%,间隔为5%,其中每个浓度比配制3个样品,共75个样品。设计每个样品总质量为4g,根据总质量计算出每个组分理论质量,根据理论质量采用分析天平称量,得到样品中各组分的实际质量,组分实际质量除以总质量得到样品中各组分的质量百分比,作为每个组分的目标值。
采用VERTEX70近红外光谱仪测量样品的近红外光谱,设置采样波数范围12000-4000cm-1,分辨率为4em-1,背景扫描次数64次,样品扫描次数64次,仪器预热1小时,待仪器参数Amplitude等相关值稳定后开始测样。首先将未装样品的石英瓶置于光点的中心处,作为背景保存,然后进行待测样品扫描,将样品装在石英瓶中高2cm处左右(避免光透过),在垫有擦净纸的桌面上旋转上下振动20次左右,保证粉末样品表面平整。将装样石英瓶置于光点的中心处,每个样品采集光谱3次,每采集1次,旋转石英瓶1次,取3次光谱的平均值作为该样品的光谱。图7显示了该实施例75个样品的近红外光谱。
2)数据分组
在75个样品中,每个设计浓度对应3个样品,3个样品使用的三七为高、中、低3档。采用整体顺序局部随机的分组方式,即每3个样品中,随机选取2个样品到训练集,剩余样品到预测集。75个样品全部分组后得到50个样品的训练集,25个样品的预测集。
3)确定偏最小二乘回归模型的因子数
根据蒙特卡罗交叉验证的交叉验证均方根误差(RMSECV)随因子数(LV)的变化确定偏最小二乘回归模型的因子数,RMSECV最小值对应的因子数为最佳因子数。本实施例中三七和高良姜组分的最佳因子数都为7。
4)使用不同预处理方法及其组合对光谱信号进行预处理,选取最佳预处理方法
根据预测均方根误差(RMSEP)随着窗口的变化确定SG平滑及求导的窗口大小,窗口大小取值范围3-59,间隔为2,计算不同窗口对应的RMSEP值。RMSEP最小值对应的窗口为最佳窗口。本实施例中三七和高良姜组分的SG平滑、一阶导数和二阶导数的最佳窗口数分别为33、59、49和59、59、49。
根据RMSEP随着小波函数及分解尺度的变化确定CWT的最佳小波函数及分解尺度。小波函数包括Haar,db2、db3…db20等19个函数,coif1、coif2…cofi5等5个函数,sym2、sym3…sym8等7个函数,bior1.1、bior1.3、bior1.5、bior2.2、bior2.4、bior2.6、bior2.8、bior3.1等8个函数,共40个函数,分解尺度范围1-40,计算不同小波函数及分解尺度对应的RMSEP值。RMSEP最小值对应的小波函数及分解尺度为最佳小波函数及分解尺度。本实施例中三七组分最佳小波函数及分解尺度分别为60和Haar,高良姜组分最佳小波函数及分解尺度分别为44和Haar。
在最佳参数下,考察SG平滑法、标准正态变量(SNV)、多元散射校正(MSC)、一阶导数(1st Der)、二阶导数(2nd Der)、CWT等预处理方法及其组合SNV-1st Der、MSC-1st Der、SNV-2nd Der、MSC-2nd Der、SNV-CWT、MSC-CWT对光谱进行预处理的效果,RMSEP最小值对应的预处理方法为最佳预处理方法。表3显示了实施例不同预处理方法的RMSEP值。从表中可以看出,三七和高良姜组分RMSEP最小值对应的预处理方法为SNV和SG平滑,因此最佳预处理方分别为SNV和SG平滑。
表3三七高良姜二元掺伪数据不同预处理方法结合PLSR预测的RMSEP
5)最佳预处理方法结合PLSR建模并预测
采用最佳预处理方法对光谱预处理后,建立PLSR模型,对未知样品预测。图8显示了本实施例最佳预处理方法结合PLSR建模对三七和高良姜组分预测的预测值与真实值的关系图。从图中可以看出,在结合最佳预处理方法后,PLSR模型对两种组分预测的相关系数都在0.99以上。因此,本发明可以实现三七高良姜二元掺伪样品的准确定量。
Claims (5)
1.一种基于近红外光谱及化学计量学的二元掺伪三七定量分析方法,其特征在于:配制实验样品并采集样品的近红外光谱;将数据集划分为训练集和预测集;根据RMSECV随因子数的变化确定最佳因子数;考察不同预处理方法及其组合的预处理效果,得到最佳预处理方法;采用最佳预处理方法对光谱预处理后,建立PLSR模型,对未知样品预测。
2.根据权利要求1所述的一种基于近红外光谱及化学计量学的二元掺伪三七定量分析方法,其特征在于:所述的实验样品配制方式为按照0-100%的质量百分比范围配制三七掺伪样品若干个,其中同一浓度下用不同的三七配制3个三七掺伪样品,保证样品的多样性;将每份药材分别干燥、粉碎,过120目筛。
3.根据权利要求1所述的一种基于近红外光谱及化学计量学的二元掺伪三七定量分析方法,其特征在于:所述的数据分组方式为整体顺序局部随机。
4.根据权利要求1所述的一种基于近红外光谱及化学计量学的二元掺伪三七定量分析方法,其特征在于:所述的预处理方法及其组合包括SG平滑、多元散射校正、标准正态变量、一阶导数、二阶导数、连续小波变换及其组合SNV-1stDer、MSC-1stDer、SNV-2ndDer、MSC-2ndDer、SNV-CWT、MSC-CWT。
5.根据权利要求1所述的一种基于近红外光谱及化学计量学的二元掺伪三七定量分析方法,其特征在于:对三七伪品没有限制,任意一种三七的类似物进行掺伪都可以定量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710927380.7A CN107703095A (zh) | 2017-09-27 | 2017-09-27 | 一种基于近红外光谱及化学计量学的二元掺伪三七定量分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710927380.7A CN107703095A (zh) | 2017-09-27 | 2017-09-27 | 一种基于近红外光谱及化学计量学的二元掺伪三七定量分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107703095A true CN107703095A (zh) | 2018-02-16 |
Family
ID=61184593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710927380.7A Pending CN107703095A (zh) | 2017-09-27 | 2017-09-27 | 一种基于近红外光谱及化学计量学的二元掺伪三七定量分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107703095A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109342359A (zh) * | 2018-10-25 | 2019-02-15 | 中国科学院上海技术物理研究所 | 一种对农药中掺入的其他微量成分浓度的快速检测方法 |
CN109374556A (zh) * | 2018-12-14 | 2019-02-22 | 中国科学院合肥物质科学研究院 | 基于可见-近红外光谱的复合肥中水分含量快速检测方法 |
CN109507123A (zh) * | 2018-11-22 | 2019-03-22 | 天津工业大学 | 一种基于紫外可见漫反射光谱及化学模式识别的当归及其相似品的鉴别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101961360A (zh) * | 2009-07-24 | 2011-02-02 | 天津天士力现代中药资源有限公司 | 三七的近红外光谱鉴别方法 |
CN102914596A (zh) * | 2011-08-01 | 2013-02-06 | 漳州片仔癀药业股份有限公司 | 一种利用近红外光谱快速测定片仔癀质量的方法 |
CN104502299A (zh) * | 2014-12-12 | 2015-04-08 | 深圳市计量质量检测研究院 | 一种利用近红外光谱技术鉴别五常稻花香大米的方法 |
CN105136713A (zh) * | 2015-09-30 | 2015-12-09 | 天津工业大学 | 大豆油掺伪芝麻油中各组分油的快速定量分析方法 |
CN105548063A (zh) * | 2015-01-14 | 2016-05-04 | 青海春天药用资源科技利用有限公司 | 无损检测冬虫夏草纯粉/粉片真伪的方法 |
-
2017
- 2017-09-27 CN CN201710927380.7A patent/CN107703095A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101961360A (zh) * | 2009-07-24 | 2011-02-02 | 天津天士力现代中药资源有限公司 | 三七的近红外光谱鉴别方法 |
CN102914596A (zh) * | 2011-08-01 | 2013-02-06 | 漳州片仔癀药业股份有限公司 | 一种利用近红外光谱快速测定片仔癀质量的方法 |
CN104502299A (zh) * | 2014-12-12 | 2015-04-08 | 深圳市计量质量检测研究院 | 一种利用近红外光谱技术鉴别五常稻花香大米的方法 |
CN105548063A (zh) * | 2015-01-14 | 2016-05-04 | 青海春天药用资源科技利用有限公司 | 无损检测冬虫夏草纯粉/粉片真伪的方法 |
CN105136713A (zh) * | 2015-09-30 | 2015-12-09 | 天津工业大学 | 大豆油掺伪芝麻油中各组分油的快速定量分析方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109342359A (zh) * | 2018-10-25 | 2019-02-15 | 中国科学院上海技术物理研究所 | 一种对农药中掺入的其他微量成分浓度的快速检测方法 |
CN109507123A (zh) * | 2018-11-22 | 2019-03-22 | 天津工业大学 | 一种基于紫外可见漫反射光谱及化学模式识别的当归及其相似品的鉴别方法 |
CN109374556A (zh) * | 2018-12-14 | 2019-02-22 | 中国科学院合肥物质科学研究院 | 基于可见-近红外光谱的复合肥中水分含量快速检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhao et al. | Near infrared reflectance spectroscopy for determination of the geographical origin of wheat | |
Chen et al. | Quantification of total polysaccharides and triterpenoids in Ganoderma lucidum and Ganoderma atrum by near infrared spectroscopy and chemometrics | |
Manley | Near-infrared spectroscopy and hyperspectral imaging: non-destructive analysis of biological materials | |
Urbano-Cuadrado et al. | Near infrared reflectance spectroscopy and multivariate analysis in enology: Determination or screening of fifteen parameters in different types of wines | |
Wiedemair et al. | Evaluation of the performance of three hand-held near-infrared spectrometer through investigation of total antioxidant capacity in gluten-free grains | |
Manley et al. | Tracking diffusion of conditioning water in single wheat kernels of different hardnesses by near infrared hyperspectral imaging | |
Chen et al. | Determination of protein, total carbohydrates and crude fat contents of foxtail millet using effective wavelengths in NIR spectroscopy | |
CN107703095A (zh) | 一种基于近红外光谱及化学计量学的二元掺伪三七定量分析方法 | |
CN104568822B (zh) | 一种连翘药材多指标同时快速检测方法 | |
CN102914596B (zh) | 一种利用近红外光谱快速测定片仔癀质量的方法 | |
CN103411895B (zh) | 珍珠粉掺伪的近红外光谱鉴别方法 | |
Dong et al. | Gum Arabic authentication and mixture quantification by near infrared spectroscopy | |
CN107449753A (zh) | 近红外光谱快速测定槐花炮制品中芦丁含量的方法 | |
Ke et al. | Non-destructive determination of volatile oil and moisture content and discrimination of geographical origins of Zanthoxylum bungeanum Maxim. by hyperspectral imaging | |
Chen et al. | Rapid identification of three varieties of Chrysanthemum with near infrared spectroscopy | |
CN109374548A (zh) | 一种利用近红外快速测定大米中营养成分的方法 | |
CN106950192A (zh) | 一种基于近红外光谱分析技术的植物蛋白饮料中主要成分含量快速检测的方法 | |
CN112595692A (zh) | 一种水果总糖含量预测模型的建立方法及水果总糖含量的预测方法 | |
Fan et al. | Rapid and Nondestructive Determination of origin, volatile oil, sanshoamides and crack rate in the ‘Sichuan Pepper’Based on a Novel Portable Near Infrared Spectrometer | |
Gao et al. | Differentiation of storage time of wheat seed based on near infrared hyperspectral imaging | |
Bin et al. | Detection of adulteration of kudzu powder by terahertz time-domain spectroscopy | |
CN108226091A (zh) | 一种用于预测甜玉米中蔗糖含量的nirs模型构建方法 | |
CN108593596A (zh) | 基于近红外光谱技术快速检测椰汁中原汁含量的方法 | |
CN108693140A (zh) | 一种快速检测醒脑静口服制剂中麝香酮含量的方法 | |
CN108760679A (zh) | 一种基于近红外光谱技术的乌天麻鉴别方 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180216 |