CN113376116A - 一种地黄的近红外在线质量检测方法 - Google Patents
一种地黄的近红外在线质量检测方法 Download PDFInfo
- Publication number
- CN113376116A CN113376116A CN202110221853.8A CN202110221853A CN113376116A CN 113376116 A CN113376116 A CN 113376116A CN 202110221853 A CN202110221853 A CN 202110221853A CN 113376116 A CN113376116 A CN 113376116A
- Authority
- CN
- China
- Prior art keywords
- rehmannia
- dimensional
- convolution
- sample
- infrared
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000405414 Rehmannia Species 0.000 title claims abstract description 54
- 238000001514 detection method Methods 0.000 title claims abstract description 21
- 238000007781 pre-processing Methods 0.000 claims abstract description 55
- 238000012937 correction Methods 0.000 claims abstract description 34
- 238000009499 grossing Methods 0.000 claims abstract description 28
- 238000010238 partial least squares regression Methods 0.000 claims abstract description 27
- 238000001228 spectrum Methods 0.000 claims abstract description 21
- 238000002329 infrared spectrum Methods 0.000 claims abstract description 16
- 238000010606 normalization Methods 0.000 claims abstract description 14
- 241000405911 Rehmannia glutinosa Species 0.000 claims abstract description 11
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 8
- 238000000227 grinding Methods 0.000 claims abstract description 8
- 230000003595 spectral effect Effects 0.000 claims abstract description 8
- 238000002360 preparation method Methods 0.000 claims abstract description 7
- 238000012216 screening Methods 0.000 claims abstract description 4
- 238000009795 derivation Methods 0.000 claims abstract 4
- 238000000034 method Methods 0.000 claims description 67
- 238000011176 pooling Methods 0.000 claims description 24
- 238000012360 testing method Methods 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 8
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000011049 filling Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 239000010453 quartz Substances 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 230000002238 attenuated effect Effects 0.000 claims description 2
- 238000009826 distribution Methods 0.000 claims description 2
- 230000007246 mechanism Effects 0.000 claims description 2
- 210000002569 neuron Anatomy 0.000 claims description 2
- 230000003287 optical effect Effects 0.000 claims 1
- QIIDATRCGITYRZ-UHFFFAOYSA-N Catalpol Natural products OCC1OC(OC2OC=CC3C(O)C(=C(CO)C23)O)C(O)C(O)C1O QIIDATRCGITYRZ-UHFFFAOYSA-N 0.000 abstract description 14
- LHDWRKICQLTVDL-PZYDOOQISA-N catalpol Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@H]1[C@@H]2[C@@]3(CO)O[C@H]3[C@@H](O)[C@@H]2C=CO1 LHDWRKICQLTVDL-PZYDOOQISA-N 0.000 abstract description 14
- UXSACQOOWZMGSE-UHFFFAOYSA-N catalposide Natural products OC1C(O)C(O)C(CO)OC1OC1C2C3(CO)OC3C(OC(=O)C=3C=CC(O)=CC=3)C2C=CO1 UXSACQOOWZMGSE-UHFFFAOYSA-N 0.000 abstract description 14
- LHDWRKICQLTVDL-UHFFFAOYSA-N methyl iridoid glycoside Natural products OC1C(O)C(O)C(CO)OC1OC1C2C3(CO)OC3C(O)C2C=CO1 LHDWRKICQLTVDL-UHFFFAOYSA-N 0.000 abstract description 14
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 abstract description 6
- 239000000523 sample Substances 0.000 description 23
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 12
- 238000002203 pretreatment Methods 0.000 description 9
- 238000001914 filtration Methods 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 238000005303 weighing Methods 0.000 description 5
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 239000000843 powder Substances 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 239000003814 drug Substances 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000004445 quantitative analysis Methods 0.000 description 3
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 2
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 2
- 239000003610 charcoal Substances 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000706 filtrate Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 239000013558 reference substance Substances 0.000 description 2
- 239000012085 test solution Substances 0.000 description 2
- 239000003643 water by type Substances 0.000 description 2
- 241000208011 Digitalis Species 0.000 description 1
- 241000013557 Plantaginaceae Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- SIHHLZPXQLFPMC-UHFFFAOYSA-N chloroform;methanol;hydrate Chemical compound O.OC.ClC(Cl)Cl SIHHLZPXQLFPMC-UHFFFAOYSA-N 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- BNMXDQXGFBXOQQ-UHFFFAOYSA-N ethyl acetate;formic acid;methanol Chemical compound OC.OC=O.CCOC(C)=O BNMXDQXGFBXOQQ-UHFFFAOYSA-N 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- YTJSFYQNRXLOIC-UHFFFAOYSA-N octadecylsilane Chemical compound CCCCCCCCCCCCCCCCCC[SiH3] YTJSFYQNRXLOIC-UHFFFAOYSA-N 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000010298 pulverizing process Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000010992 reflux Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 229910021642 ultra pure water Inorganic materials 0.000 description 1
- 239000012498 ultrapure water Substances 0.000 description 1
- KDSWDGKIENPKLB-QJDQKFITSA-N verbascoside Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](OC(=O)CCC=2C=C(O)C(O)=CC=2)[C@@H](CO)O[C@@H](OCCC=2C=C(O)C(O)=CC=2)[C@@H]1O KDSWDGKIENPKLB-QJDQKFITSA-N 0.000 description 1
- QFRYQWYZSQDFOS-UHFFFAOYSA-N verbascoside Natural products CC1OC(COC2C(O)C(COC3OC(C(O)C(O)C3O)C(=O)O)OC(Oc4cc(O)cc5OC(=CC(=O)c45)c6ccc(O)c(O)c6)C2O)C(O)C(O)C1O QFRYQWYZSQDFOS-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N1/00—Sampling; Preparing specimens for investigation
- G01N1/28—Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本发明公开了一种地黄的近红外在线质量检测方法,包括以下步骤:(1)样品制备:取不同产地、不同批次的地黄饮片样品;(2)同时采集并记录地黄样品的近红外光谱图和地黄打粉后的近红外光谱图;(3)对光谱数据进行预处理:分别采用原始光谱、一阶求导、二阶求导、多元散射校正、矢量归一化、卷积平滑滤波、多元散射校正+矢量归一化、卷积平滑滤波+多元散射校正、卷积平滑滤波+矢量归一化,对打粉前后的地黄样品的近红外光谱数据进行预处理;(4)采用卷积神经网络、PLSR和分段PLSR进行模型筛选,建立地黄定量校正模型。本发明所建立的模型准确可靠,操作快速、简单,可无损直接测定地黄饮片中梓醇和水分的含量。
Description
技术领域
本发明属于药材检测技术领域;具体涉及一种基于偏最小二乘回归方法(PLSR)的地黄的近红外质量检测方法。
背景技术
地黄为玄参科植物地黄Rehmannia glutinosa Libosch.的新鲜或干燥块根,为我国四大怀药之一。地黄在我国具有悠久的药用历史,始载于《神农本草经》,列为上品,具有清热养血、养阴生津等功效。地黄悠久的历史和显著的滋补作用使其历史沿革相当丰富,地黄在临床应用上分别出现了鲜地黄、生地黄、熟地黄、生地炭、熟地炭等炮制品,并且许多经方中都用到地黄。因此完善地黄的质量检测是当前的迫切问题。
目前,地黄的质量检测主要包括性状鉴别、显微鉴别、TLC定性研究、浸出物测定和基于HPLC的含量测定方法。TLC法是地黄进行定性鉴别的主要检测方法,采用甲醇、正丁醇等溶剂进行提取,选择三氯甲烷-甲醇-水或者乙酸乙酯-甲醇-甲酸为展开系统。采用HPLC法对地黄中的梓醇、毛蕊花糖苷进行含量测定。存在检测程序复杂、无法在总体上进行质量评价等缺点。
本发明采用基于偏最小二乘回归方法(PLSR)的近红外质量检测方法,通过原材料质量检测、提取过程检测等环节,建立提取物生产在线检测体系,可有效解决生产检测中存在的取样不便、效率低下、污染环境等诸多弊端,提高产品质量;同时为反应终止提供指导,减少能源消耗,实现提取物绿色生产。
发明内容
为解决以上技术问题,本发明提供了一种基于偏最小二乘回归方法(PLSR)的地黄的近红外质量检测方法。该方法操作快速、简单,所建立的模型准确可靠,可用于地黄饮片中梓醇和水分含量的定量分析。
为实现以上目的,本发明提供的技术方案如下:
一种地黄的近红外在线质量检测方法,包括以下步骤:
(1)样品制备:取不同产地、不同批次的地黄饮片样品;
(2)近红外光谱数据采集:同时采集并记录地黄样品的近红外光谱图和地黄打粉后的近红外光谱图;
(3)对光谱数据进行预处理:分别采用原始光谱(Spectrum)、一阶求导(Firstderivative, 1stD)、二阶求导(Second derivative, 2stD)、多元散射校正(MSC)、矢量归一化(SNV)、卷积平滑滤波(Savitzky-Golay filter, S-G)、多元散射校正+矢量归一化、卷积平滑滤波+多元散射校正、卷积平滑滤波+矢量归一化,对打粉前后的地黄样品的近红外光谱数据进行预处理;
(4)采用卷积神经网络(CNN,模型面向全体光谱波段)、第二种为PLSR(模型面向全体光谱波段)和第三种为分段PLSR(模型可选择全体光谱波段的部分波段信息)进行模型筛选,建立地黄定量校正模型。
作为优选方案,以上所述的一种地黄的近红外在线质量检测方法,步骤(4)采用卷积神经网络建立地黄定量校正模型时,卷积神经网络模型包括一层一维卷积池化层、一层二维卷积池化层和一层全连接层;一维卷积池化层将输入的一维向量转化成二维矩阵;一维卷积池化层包括一维卷积操作、激活操作与池化操作,其中一维卷积操作卷积核的数目为32个,大小为10*1,卷积的步长为6,并由修正线性单元完成激活操作,使神经网络中的神经元具有稀疏激活性;池化操作使用平均池化模型,每次取10*1的池化窗口,步长设为2;之后,将经过一维卷积池化层得到的二维矩阵输入至二维卷积池化层,并经过二维卷积操作、激活操作与二维池化操作,将其转化成多个二维矩阵;二维卷积操作中卷积核数目为64个,大小为10*32;将二维卷积池化层得到的二维矩阵输入至全连接层,输出一维高阶向量;
并采用学习率衰减机制,学习率初始值设为0.03,衰减指数为1/e,在网络训练的过程中随时间逐步衰减学习率进行动态调整,每层权重初始值服从标准差为0.1的零均值高斯分布。
作为优选方案,以上所述的地黄的近红外在线质量检测方法,步骤(2)中近红外光谱采集的方法为:打粉后的样品取约10 g加入石英样品管中,填实压平样品;未打粉的样品选取平整的样品,使之与近红外漫反射光纤探头能够充分接触。测试环境温度为25 ℃,相对湿度为45 %~60 %;以仪器内置背景为参比,扣除背景,采集方式为积分球漫反射,波数区间12000~4000 cm-1,分辨率为8 cm-1,扫描次数64次,每份样品扫描2次,取其平均光谱作为样品的近红外光谱。
作为优选方案,以上所述的地黄的近红外在线质量检测方法,步骤(4)中,采用偏最小二乘回归方法(PLSR)建立地黄定量校正模型。
PLSR模型建立
本发明中近红外光谱的定量模型设计采用Python编程语言,集成开发环境为PyCharm Coummunity,操作系统为Windows 10。
在建立定量校正模型之前,对原始光谱进行预处理,从而避免在测定过程中存在高频噪音、散射光、杂散光、样品状态和仪器响应等诸多因素的影响。光谱的预处理可以去除不必要信息,提高模型的预测精度。本模型采用的光谱预处理方法包括:原始光谱(Spectrum)、一阶求导(First derivative, 1stD)、二阶求导(Second derivative,2stD)、多元散射校正(MSC)、矢量归一化(SNV)、卷积平滑滤波(Savitzky-Golay filter,S-G)、多元散射校正+矢量归一化、卷积平滑滤波+多元散射校正、卷积平滑滤波+矢量归一化。
选择合适的光谱波段,可以减少光谱中多余的信息,提高模型的预测精度。同时,利用PLSR方法建模时,不同的主成分数会对模型预测结果产生较大的影响。若主成分数过高,会产生“过拟合”的现象,但若主成分数过少,则利用的光谱信息过少。以R值,均方根误差(RMSE)和校正均方差(RMSEC)为指标,粉末-梓醇的最优预处理方法为卷积平滑滤波+多元散射校正,最佳光谱波段为4470.873~4281.855cm-1 ,选择的主成分数为1;粉末-水分的最优预处理方法为卷积平滑滤波+矢量归一化,最佳光谱波段为4277.997~3996.398cm-1 ,选择的主成分数为3;饮片-梓醇的最优预处理方法为卷积平滑滤波,最佳光谱波段为5628.131~3996.398cm-1 ,选择的主成分数为9;饮片-水分的最优预处理方法为矢量归一化,最佳光谱波段为6206.760~4281.855cm-1 ,选择的主成分数为1。校正模型及评价参数如表1所示。
表1 PLSR模型及评价参数
有益效果:本发明与现有技术相比,本发明的优点有:
本发明采用傅里叶变换近红外(NIR)分析技术采集地黄饮片近红外光谱图,并筛选出原始光谱的最佳预处理方法,优化主因子数并选择最佳波段,以偏最小二乘回归(PLSR)法建立NIR定量分析模型。验证结果表明,本发明提供的方法操作快速、简单,不需要提取、无损地评判地黄的品质,可准确检测梓醇和水分含量的定量分析。
附图说明
图1为地黄饮片打粉后所采集近红外光谱图;
图2为地黄饮片未打粉所采集近红外光谱图;
图3为对照品(A)和地黄样品(B)HPLC色谱图(1.梓醇)。
具体实施方式
下面通过具体实施例对本发明进行说明,以使本发明技术方案更易于理解、掌握,但本发明并不局限于此。下述实施例中所述实验方法,如无特殊说明,均为常规方法;所述试剂和材料,如无特殊说明,均可从商业途径获得。
实施例1
1.实验材料
1.1试验药材
地黄饮片共100批,全部来自南京海源中药饮片有限公司,具体如表1所示。
表1 100批地黄饮片的来源
产地 | 河北 | 河南 | 山东 | 山西 | 陕西 |
数量 | 36 | 5 | 17 | 33 | 9 |
1.1实验仪器与试剂
Bruker-Tensor37傅里叶变换中、近红外光谱仪,包括OPUS5.0软件、Pbs检测器(德国Bruker公司);Waters e2695高效液相色谱仪(美国Waters公司)Waters2998紫外检测器;万分之一天平BSA2245-CW(北京赛多利斯科学仪器有限公司);AG-285型十万分之一天平(瑞士METTLER TOLEDO公司);KY-500E型超声波清洗器(昆山市超声仪器有限公司);HH-6数显恒温水浴锅(常州国华电器有限公司);Milli-Q超纯水仪(美国Millipore公司);GeneSpeed X1微量离心机(基因生物技术国际贸易上海有限公司)。
梓醇对照品(批号:110808-201711,含量≥99.6 %)购自中国食品药品检定研究所。磷酸为色谱纯(上海阿拉丁科技股份有限公司),甲醇为色谱纯(美国TEDIA有限公司)。
2.实验方法与结果
2.1近红外光谱的采集
将100批地黄饮片全部打粉过5号筛,分别测100批地黄饮片打粉和未打粉的近红外光谱图。打粉后的样品取约10 g加入石英样品管中,填实压平样品;未打粉的样品选取平整的样品,使之与近红外漫反射光纤探头能够充分接触。测试环境温度为25 ℃,相对湿度为45 %~60 %。以仪器内置背景为参比,扣除背景。采集方式为积分球漫反射,波数区间12000~4000 cm-1,分辨率为8 cm-1,扫描次数64次,每份样品扫描2次,取其平均光谱作为样品的近红外光谱。地黄饮片打粉与未打粉的近红外光谱图分别如图1与图2所示。
2.2地黄梓醇的含量测定
2.2.1 供试品溶液的制备
参照中国药典2020年版一部地黄含量测定项下要求进行供试品溶液制备:
取本品(生地黄)切成约5mm的小块,经80℃减压干燥24小时后,磨成粗粉,取约0.8g,精密称定,置具塞锥形瓶中,精密加入甲醇50ml,称定重量,加热回流提取1.5小时,放冷,再称定重量,用甲醇补足减失的重量,摇匀,滤过,精密量取续滤液10ml,浓缩至近干,残渣用流动相溶解,转移至10ml量瓶中,并用流动相稀释至刻度,摇匀,滤过,取续滤液,即得。
2.2.2对照品溶液的制备
对照品溶液的制备:取梓醇对照品适量,精密称定,加流动相制成每1ml含50μg的溶液,即得。
2.2.3色谱条件
色谱条件与系统适用性试验 以十八烷基硅烷键合硅胶为填充剂;以甲醇-0.1%磷酸溶液(1∶99)为流动相;检测波长为210nm。理论板数按梓醇峰计算应不低于5000。进样量10 μL。色谱图见图3。
2.3 地黄饮片的水分测定
按照中国药典2020版四部水分测定法(通则0832)第二法烘干法测定100批地黄饮片的水分。
3. 地黄近红外光谱定量模型的建立
3.1 加入SPXY算法后的建模结果
PLSR:确定主成分数目与最优预处理方法(采用spxy算法取校正集与验证集,校正集占比80%,验证集占比20%)。求不同主成分数目与不同预处理方法下的预测集R2值、校正集R2值、RMSEP值与RMSEC值。预测集R2值越高,RMSEP值越低模型越好。
3.1.1 地黄打粉与地黄梓醇含量建模
参数取主成分=3,预处理为MSC+SNV,取整个光谱。80%训练,20%测试。测试集20个样本的平均绝对误差为0.0076,相对误差绝对值的平均值为1.3104。预测集R2值、校正集R2值、RMSEP值与RMSEC值分别为-0.1822、0.3972、0.0021与0.0025。
3.1.2 地黄打粉与水分建模
参数取主成分=4,预处理为卷积平滑,取整个光谱。80%训练,20%测试。测试集20个样本的平均绝对误差为0.0018,相对误差绝对值的平均值为0.0393。预测集R2值、校正集R2值、RMSEP值与RMSEC值分别为0.3258、0.2815、0.0071与0.0137。
3.1.3 地黄未打粉与地黄梓醇含量建模
参数取主成分=2,预处理为MSC+卷积平滑,取整个光谱。80%训练,20%测试。测试集20个样本的平均绝对误差为-0.00018,相对误差绝对值的平均值为0.563926。预测集R2值、校正集R2值、RMSEP值与RMSEC值分别为0.017867、0.039834、0.002387与0.003174。
3.2 加入SPXY分段算法后的建模结果
PLSR:确定最优波段、最优主成分数目与最优预处理方法(采用spxy算法取校正集与验证集,校正集占比80%,验证集占比20%)。比较不同波段、不同主成分数目与不同预处理方法下的预测集R2值。越接近1,结果越好。
3.2.1 地黄打粉-含量
波段长度为50时的建模结果,当波段为1950-1999,主成分数目为1,预处理方法为MSC+SG时,结果最优,预测集R2值为0.2276。
波段长度为100时的建模结果,当波段为1400-1499,主成分数目为1,预处理方法为MSC时,结果最优,预测集R2值为0.0599。
波段长度为150时的建模结果,当波段为750-899,主成分数目为1,预处理方法为MSC+SG时,结果最优,预测集R2值为0.0313。
波段长度为200时的建模结果,当波段为1200-1399,主成分数目为2,预处理方法为MSC时,结果最优,预测集R2值为0.0902。
波段长度为250时的建模结果,当波段为750-999,主成分数目为2,预处理方法为MSC时,结果最优,预测集R2值为0.0276。
波段长度为300时的建模结果,当波段为1200-1499,主成分数目为2,预处理方法为MSC时,结果最优,预测集R2值为0.1421。
波段长度为350时的建模结果,当波段为1750-2047,主成分数目为2,预处理方法为MSC+SG时,结果最优,预测集R2值为0.0178。
波段长度为400时的建模结果,当波段为1600-1999,主成分数目为1,预处理方法为MSC时,结果最优,预测集R2值为0.0610。
波段长度为450时的建模结果,当波段为1800-2074,主成分数目为3,预处理方法为MSC+SG时,结果最优,预测集R2值为-0.1088。
波段长度为500时的建模结果,当波段为1000-1499,主成分数目为4,预处理方法为MSC时,结果最优,预测集R2值为0.1092。
波段长度为550时的建模结果,当波段为1650-2074,主成分数目为2,预处理方法为MSC+SG时,结果最优,预测集R2值为0.0155。
波段长度为600时的建模结果,当波段为1200-1799,主成分数目为2,预处理方法为MSC时,结果最优,预测集R2值为-0.0149。
综上可见波段长度为50时,筛选1950-1999波段最优,主成分数目为1,预处理方法为MSC+SG时,80%训练,20%测试。测试集20个样本的误差,平均绝对误差为0.0004,相对误差绝对值的平均值为1.0931。预测集R2值、校正集R2值、RMSEP值与RMSEC值分别为0.2276、0.0291、0.0017与0.0032。
3.2.2 地黄打粉-水分
波段长度为50时的建模结果,当波段为2000-2049,主成分数目为3,预处理方法为SNV+SG时,结果最优,预测集R2值为0.5297。
波段长度为100时的建模结果,当波段为2000-2074,主成分数目为3,预处理方法为SNV+SG时,结果最优,预测集R2值为0.5379。
波段长度为150时的建模结果,当波段为1950-2074,主成分数目为4,预处理方法为SNV+SG时,结果最优,预测集R2值为0.5254。
波段长度为200时的建模结果,当波段为2000-2074,主成分数目为3,预处理方法为SNV+SG时,结果最优,预测集R2值为0.5379。
波段长度为250时的建模结果,当波段为2000-2074,主成分数目为3,预处理方法为SNV+SG时,结果最优,预测集R2值为0.5379。
波段长度为300时的建模结果,当波段为1800-2074,主成分数目为1,预处理方法为二阶时,结果最优,预测集R2值为0.3488。
波段长度为350时的建模结果,当波段为1750-2074,主成分数目为1,预处理方法为二阶时,结果最优,预测集R2值为0.4550。
波段长度为400时的建模结果,当波段为2000-2074,主成分数目为3,预处理方法为SNV+SG时,结果最优,预测集R2值为0.5379。
波段长度为450时的建模结果,当波段为1800-2074,主成分数目为1,预处理方法为二阶时,结果最优,预测集R2值为0.3488。
波段长度为500时的建模结果,当波段为2000-2074,主成分数目为3,预处理方法为SNV+SG时,结果最优,预测集R2值为0.5379。
波段长度为550时的建模结果,当波段为1650-2074,主成分数目为1,预处理方法为二阶时,结果最优,预测集R2值为0.3268。
波段长度为600时的建模结果,当波段为1800-2074,主成分数目为1,预处理方法为二阶时,结果最优,预测集R2值为0.3488。
波段长度为650时的建模结果,当波段为1950-2074,主成分数目为4,预处理方法为SNV+SG时,结果最优,预测集R2值为0.5254。
波段长度为700时的建模结果,当波段为1400-2074,主成分数目为1,预处理方法为二阶时,结果最优,预测集R2值为0.2884。
波段长度为750时的建模结果,当波段为0-749,主成分数目为3,预处理方法为SG时,结果最优,预测集R2值为0.2541。
波段长度为800时的建模结果,当波段为1600-2074,主成分数目为1,预处理方法为二阶时,结果最优,预测集R2值为0.3217。
综上可见波段长度为100时,筛选2000-2074波段最优,主成分数目为3,预处理方法为SNV+SG时,80%训练,20%测试。测试集20个样本的误差,平均绝对误差为0.0008,相对误差绝对值的平均值为0.0334。预测集R2值、校正集R2值、RMSEP值与RMSEC值分别为0.5379、0.1914、0.0059与0.0144。
3.2.3 地黄未打粉-含量
波段长度为50时的建模结果,当波段为850-899,主成分数目为5,预处理方法为二阶时,结果最优,预测集R2值为0.2636。
波段长度为100时的建模结果,当波段为700-799,主成分数目为1,预处理方法为一阶差分时,结果最优,预测集R2值为0.1813。
波段长度为150时的建模结果,当波段为2050-2074,主成分数目为1,预处理方法为SNV时,结果最优,预测集R2值为0.1006。
波段长度为200时的建模结果,当波段为2000-2074,主成分数目为5,预处理方法为卷积平滑时,结果最优,预测集R2值为0.0367。
波段长度为250时的建模结果,当波段为1750-1999,主成分数目为7,预处理方法为卷积平滑时,结果最优,预测集R2值为0.1800。
波段长度为300时的建模结果,当波段为1800-2074,主成分数目为9,预处理方法为卷积平滑时,结果最优,预测集R2值为0.2963
波段长度为350时的建模结果,当波段为1750-2074,主成分数目为8,预处理方法为卷积平滑时,结果最优,预测集R2值为0.3241。
波段长度为400时的建模结果,当波段为1600-1999,主成分数目为8,预处理方法为卷积平滑时,结果最优,预测集R2值为0.2445。
波段长度为450时的建模结果,当波段为1800-2074,主成分数目为9,预处理方法为卷积平滑时,结果最优,预测集R2值为0.2963。
波段长度为500时的建模结果,当波段为1500-1999,主成分数目为9,预处理方法为卷积平滑时,结果最优,预测集R2值为0.2526。
波段长度为550时的建模结果,当波段为1650-2074,主成分数目为9,预处理方法为卷积平滑时,结果最优,预测集R2值为0.3613。
波段长度为600时的建模结果,当波段为1800-2074,主成分数目为9,预处理方法为卷积平滑时,结果最优,预测集R2值为0.2963。
综上可见波段长度为550时,筛选1650-2074波段最优。主成分数目为9,预处理方法为卷积平滑时,80%训练,20%测试。测试集20个样本的误差,平均绝对误差为0.0003,相对误差绝对值的平均值为0.9097。预测集R2值、校正集R2值、RMSEP值与RMSEC值分别为0.3613、0.3086、0.0019与0.0028。
3.2.4 未打粉-水分
波段长度为50时的建模结果,当波段为950-999,主成分数目为1,预处理方法为MSC+卷积平滑时,结果最优,预测集R2值为0.1772。
波段长度为100时的建模结果,当波段为200-299,主成分数目为10,预处理方法为MSC+卷积平滑时,结果最优,预测集R2值为0.1524。
波段长度为150时的建模结果,当波段为1800-1949,主成分数2,预处理方法为SNV时,结果最优,预测集R2值为0.0868。
波段长度为200时的建模结果,当波段为800-999,主成分数目为5,预处理方法为卷积平滑时,结果最优,预测集R2值为0.1410。
波段长度为250时的建模结果,当波段为1250-1499,主成分数目为4,预处理方法为卷积平滑时,结果最优,预测集R2值为0.0891。
波段长度为300时的建模结果,当波段为1800-2099,主成分数目为2,预处理方法为SNV时,结果最优,预测集R2值为0.2024。
波段长度为350时的建模结果,当波段为1750-2099,主成分数目为4,预处理方法为MSC+SNV时,结果最优,预测集R2值为0.1167。
波段长度为400时的建模结果,当波段为1200-1599,主成分数目为4,预处理方法为卷积平滑时,结果最优,预测集R2值为0.1578。
波段长度为450时的建模结果,当波段为1800-2199,主成分数目为2,预处理方法为SNV时,结果最优,预测集R2值为0.2024。
波段长度为500时的建模结果,当波段为1500-1999,主成分数目为1,预处理方法为SNV时,结果最优,预测集R2值为0.2516。
波段长度为550时的建模结果,当波段为1650-2199,主成分数目为2,预处理方法为MSC+卷积平滑时,结果最优,预测集R2值为0.2156。
波段长度为600时的建模结果,当波段为1800-2399,主成分数目为2,预处理方法为SNV时,结果最优,预测集R2值为0.2024。
综上可见波段长度为500时,筛选1500-1999波段最优。主成分数目为1,预处理方法为SNV时,80%训练,20%测试。测试集20个样本的误差,平均绝对误差为0.0037,相对误差绝对值的平均值为0.0308。预测集R2值、校正集R2值、RMSEP值与RMSEC值分别为0.0508、0.0970、0.0084与0.0148。
PLSR模型检验
将未参加建模的测试集样品进行外部验证。将样品输入定量模型中,得到预测值,通过预测值与常规方法所得到的真实值的相对偏差来考察模型的预测能力。检验结果如表2所示。通过地黄粉末建立的水分模型预测值和真实值的相对误差绝对值的平均值为3.34%;通过地黄饮片建立的水分模型预测值和真实值的相对误差绝对值的平均值3.08%;通过地黄粉末建立的梓醇含量模型预测值和真实值的相对误差绝对值的平均值为0.91;通过地黄饮片建立的梓醇模型预测值和真实值的相对误差绝对值的平均值为1.09。上述结果表明,水分的预测值与真实值的相对误差小,预测结果准确,模型建立成功。
表2 测试集样品预测结果
上述详细说明是针对本发明其中之一可行实施例的具体说明,该实施例并非用以限制本发明的专利范围,凡未脱离本发明所为的等效实施或变更,均应包含于本发明技术方案的范围内。
Claims (5)
1.一种地黄的近红外在线质量检测方法,其特征在于,包括以下步骤:
(1)样品制备:取不同产地、不同批次的地黄饮片样品;
(2)近红外光谱数据采集:同时采集并记录地黄样品的近红外光谱图和地黄打粉后的近红外光谱图;
(3)对光谱数据进行预处理:分别采用原始光谱、一阶求导、二阶求导、多元散射校正、矢量归一化、卷积平滑滤波、多元散射校正+矢量归一化、卷积平滑滤波+多元散射校正、卷积平滑滤波+矢量归一化,对打粉前后的地黄样品的近红外光谱数据进行预处理;
(4)采用卷积神经网络、偏最小二乘回归和分段PLSR进行模型筛选,建立地黄定量校正模型。
2.根据权利要求1所述的一种地黄的近红外在线质量检测方法,其特征在于,步骤(4)采用卷积神经网络建立地黄定量校正模型时,卷积神经网络模型包括一层一维卷积池化层、一层二维卷积池化层和一层全连接层;一维卷积池化层将输入的一维向量转化成二维矩阵;一维卷积池化层包括一维卷积操作、激活操作与池化操作,其中一维卷积操作卷积核的数目为32个,大小为10*1,卷积的步长为6,并由修正线性单元完成激活操作,使神经网络中的神经元具有稀疏激活性;池化操作使用平均池化模型,每次取10*1的池化窗口,步长设为2;之后,将经过一维卷积池化层得到的二维矩阵输入至二维卷积池化层,并经过二维卷积操作、激活操作与二维池化操作,将其转化成多个二维矩阵;二维卷积操作中卷积核数目为64个,大小为10*32;将二维卷积池化层得到的二维矩阵输入至全连接层,输出一维高阶向量;
并采用学习率衰减机制,学习率初始值设为0.03,衰减指数为1/e,在网络训练的过程中随时间逐步衰减学习率进行动态调整,每层权重初始值服从标准差为0.1的零均值高斯分布。
3.根据权利要求1所述的地黄的近红外在线质量检测方法,其特征在于,步骤(2)中近红外光谱采集的方法为:打粉后的样品取约10g加入石英样品管中,填实压平样品;未打粉的样品选取平整的样品,使之与近红外漫反射光纤探头能够充分接触。测试环境温度为25℃,相对湿度为45%~60%;以仪器内置背景为参比,扣除背景,采集方式为积分球漫反射,波数区间12000~4000cm-1,分辨率为8cm-1,扫描次数64次,每份样品扫描2次,取其平均光谱作为样品的近红外光谱。
4.根据权利要求1所述的地黄的近红外在线质量检测方法,其特征在于,步骤(4)中,采用偏最小二乘回归方法建立地黄定量校正模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110221853.8A CN113376116A (zh) | 2021-02-27 | 2021-02-27 | 一种地黄的近红外在线质量检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110221853.8A CN113376116A (zh) | 2021-02-27 | 2021-02-27 | 一种地黄的近红外在线质量检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113376116A true CN113376116A (zh) | 2021-09-10 |
Family
ID=77569633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110221853.8A Pending CN113376116A (zh) | 2021-02-27 | 2021-02-27 | 一种地黄的近红外在线质量检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113376116A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115015126A (zh) * | 2022-04-26 | 2022-09-06 | 中国人民解放军国防科技大学 | 一种粉末状生物粒子材料活性判定方法和系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112414967A (zh) * | 2020-11-17 | 2021-02-26 | 南京中医药大学 | 一种快速实时检测蒲黄炭炮制的近红外质控方法 |
-
2021
- 2021-02-27 CN CN202110221853.8A patent/CN113376116A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112414967A (zh) * | 2020-11-17 | 2021-02-26 | 南京中医药大学 | 一种快速实时检测蒲黄炭炮制的近红外质控方法 |
Non-Patent Citations (2)
Title |
---|
白雁等: "近红外光谱法测定不同品种鲜地黄中水分含量", 《第十届全国中药和天然药物学术研讨会》 * |
薛淑娟等: "基于近红外光谱法对不同商品规格地黄进行定性及定量研究", 《中华中医药杂志(原中国医药学报)》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115015126A (zh) * | 2022-04-26 | 2022-09-06 | 中国人民解放军国防科技大学 | 一种粉末状生物粒子材料活性判定方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108519348A (zh) | 甘草药材近红外定量分析模型及检测方法和标准 | |
CN101231274B (zh) | 近红外光谱快速测定山药中尿囊素含量的方法 | |
CN103776777B (zh) | 一种用近红外光谱技术识别不同生长方式人参及对人参中组分含量测定的方法 | |
CN101299022A (zh) | 利用近红外光谱技术评价中药药材综合质量的方法 | |
CN102288572A (zh) | 利用近红外光谱技术快速检测中药药材指标性成分含量的方法 | |
CN110031570B (zh) | 抗感冒颗粒的指纹图谱检测方法 | |
CN108241033B (zh) | 一种快速检测麦冬醇提取液中6个质量指标物质含量的方法及应用 | |
CN107102015B (zh) | 七叶一枝花的鉴定方法 | |
CN104237060A (zh) | 一种金银花药材多指标快速检测方法 | |
CN102636449A (zh) | 一种近红外光谱测定白芍提取过程中芍药苷含量的方法 | |
CN106074695B (zh) | 一种丹参颗粒及其中药制剂 | |
CN108051396B (zh) | 一种心可舒片有效成分含量的快速检测方法 | |
CN107024447B (zh) | 一种生药粉在线检测装置和检测方法 | |
CN108663337B (zh) | 一种测定丹参酮类成分的方法及其应用 | |
CN113376116A (zh) | 一种地黄的近红外在线质量检测方法 | |
CN113655027A (zh) | 一种近红外快速检测植物中单宁含量的方法 | |
CN110346323B (zh) | 一种基于近红外光谱技术在线检测华盖散浓缩液的方法 | |
CN113376117A (zh) | 一种当归的近红外在线质量检测方法 | |
CN109030410B (zh) | 蜂王浆近红外定量校正模型的构建方法及蜂王浆的检测方法 | |
CN102119997A (zh) | 川麦冬hplc指纹图谱的建立方法及其标准指纹图谱 | |
CN113376118A (zh) | 一种基于偏最小二乘回归法的黄芩近红外在线质量检测方法 | |
CN107907612A (zh) | 复方丹参片中丹酚酸b和冰片含量的测定方法和应用 | |
CN112834456A (zh) | 一种白芍的近红外在线质量检测方法 | |
CN110320286B (zh) | 小柴胡颗粒有效成分的含量测定方法 | |
CN109030408A (zh) | 一种快速的儿茶药材检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210910 |