CN110220863A - 一种基于atr-ftir的金银花和山银花中药制剂的鉴别方法 - Google Patents
一种基于atr-ftir的金银花和山银花中药制剂的鉴别方法 Download PDFInfo
- Publication number
- CN110220863A CN110220863A CN201910552945.7A CN201910552945A CN110220863A CN 110220863 A CN110220863 A CN 110220863A CN 201910552945 A CN201910552945 A CN 201910552945A CN 110220863 A CN110220863 A CN 110220863A
- Authority
- CN
- China
- Prior art keywords
- honeysuckle
- atr
- ftir
- spectroscopic data
- honeysuckle flower
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004483 ATR-FTIR spectroscopy Methods 0.000 title claims abstract description 71
- 238000002360 preparation method Methods 0.000 title claims abstract description 44
- 239000002398 materia medica Substances 0.000 title claims abstract description 30
- 238000012850 discrimination method Methods 0.000 title claims abstract description 19
- 241000205585 Aquilegia canadensis Species 0.000 title claims abstract 24
- 238000004611 spectroscopical analysis Methods 0.000 claims abstract description 73
- 238000000034 method Methods 0.000 claims abstract description 36
- 238000007637 random forest analysis Methods 0.000 claims description 37
- 238000001228 spectrum Methods 0.000 claims description 21
- 238000001514 detection method Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 2
- 241001570521 Lonicera periclymenum Species 0.000 description 189
- 238000010606 normalization Methods 0.000 description 15
- 239000003814 drug Substances 0.000 description 14
- 239000000463 material Substances 0.000 description 13
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 8
- 238000002790 cross-validation Methods 0.000 description 8
- 238000010987 Kennard-Stone algorithm Methods 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 241000245240 Lonicera Species 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 238000001157 Fourier transform infrared spectrum Methods 0.000 description 4
- 238000010521 absorption reaction Methods 0.000 description 4
- 229910002092 carbon dioxide Inorganic materials 0.000 description 4
- 239000001569 carbon dioxide Substances 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000005033 Fourier transform infrared spectroscopy Methods 0.000 description 3
- 238000002835 absorbance Methods 0.000 description 3
- 150000001408 amides Chemical class 0.000 description 3
- 150000001720 carbohydrates Chemical class 0.000 description 3
- 235000014633 carbohydrates Nutrition 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 229930003935 flavonoid Natural products 0.000 description 3
- 150000002215 flavonoids Chemical class 0.000 description 3
- 235000017173 flavonoids Nutrition 0.000 description 3
- PEFNSGRTCBGNAN-QNDFHXLGSA-N luteolin 7-O-beta-D-glucoside Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1=CC(O)=C2C(=O)C=C(C=3C=C(O)C(O)=CC=3)OC2=C1 PEFNSGRTCBGNAN-QNDFHXLGSA-N 0.000 description 3
- KBGKQZVCLWKUDQ-UHFFFAOYSA-N luteolin-glucoside Natural products OC1C(O)C(O)C(CO)OC1OC1=CC(O)=CC2=C1C(=O)C=C(C=1C=C(O)C(O)=CC=1)O2 KBGKQZVCLWKUDQ-UHFFFAOYSA-N 0.000 description 3
- 239000001397 quillaja saponaria molina bark Substances 0.000 description 3
- 229930182490 saponin Natural products 0.000 description 3
- 150000007949 saponins Chemical class 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 229920000832 Cutin Polymers 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 241000628997 Flos Species 0.000 description 2
- 241001170080 Lonicera hypoglauca Species 0.000 description 2
- 244000167230 Lonicera japonica Species 0.000 description 2
- 235000017617 Lonicera japonica Nutrition 0.000 description 2
- 238000001237 Raman spectrum Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 229930194605 dipsacoside Natural products 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 239000004570 mortar (masonry) Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 150000007524 organic acids Chemical class 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 229910001220 stainless steel Inorganic materials 0.000 description 2
- 239000010935 stainless steel Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- CWVRJTMFETXNAD-FWCWNIRPSA-N 3-O-Caffeoylquinic acid Natural products O[C@H]1[C@@H](O)C[C@@](O)(C(O)=O)C[C@H]1OC(=O)\C=C\C1=CC=C(O)C(O)=C1 CWVRJTMFETXNAD-FWCWNIRPSA-N 0.000 description 1
- PZIRUHCJZBGLDY-UHFFFAOYSA-N Caffeoylquinic acid Natural products CC(CCC(=O)C(C)C1C(=O)CC2C3CC(O)C4CC(O)CCC4(C)C3CCC12C)C(=O)O PZIRUHCJZBGLDY-UHFFFAOYSA-N 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 238000004566 IR spectroscopy Methods 0.000 description 1
- 241000100289 Lonicera confusa Species 0.000 description 1
- 241001500894 Lonicera fulvotomentosa Species 0.000 description 1
- 241001170076 Lonicera macranthoides Species 0.000 description 1
- CWVRJTMFETXNAD-KLZCAUPSSA-N Neochlorogenin-saeure Natural products O[C@H]1C[C@@](O)(C[C@@H](OC(=O)C=Cc2ccc(O)c(O)c2)[C@@H]1O)C(=O)O CWVRJTMFETXNAD-KLZCAUPSSA-N 0.000 description 1
- 238000001069 Raman spectroscopy Methods 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000001335 aliphatic alkanes Chemical class 0.000 description 1
- 150000001491 aromatic compounds Chemical class 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 229940126678 chinese medicines Drugs 0.000 description 1
- CWVRJTMFETXNAD-JUHZACGLSA-N chlorogenic acid Chemical compound O[C@@H]1[C@H](O)C[C@@](O)(C(O)=O)C[C@H]1OC(=O)\C=C\C1=CC=C(O)C(O)=C1 CWVRJTMFETXNAD-JUHZACGLSA-N 0.000 description 1
- 229940074393 chlorogenic acid Drugs 0.000 description 1
- FFQSDFBBSXGVKF-KHSQJDLVSA-N chlorogenic acid Natural products O[C@@H]1C[C@](O)(C[C@@H](CC(=O)C=Cc2ccc(O)c(O)c2)[C@@H]1O)C(=O)O FFQSDFBBSXGVKF-KHSQJDLVSA-N 0.000 description 1
- 235000001368 chlorogenic acid Nutrition 0.000 description 1
- -1 cholesteryl ester Chemical class 0.000 description 1
- BMRSEYFENKXDIS-KLZCAUPSSA-N cis-3-O-p-coumaroylquinic acid Natural products O[C@H]1C[C@@](O)(C[C@@H](OC(=O)C=Cc2ccc(O)cc2)[C@@H]1O)C(=O)O BMRSEYFENKXDIS-KLZCAUPSSA-N 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 230000000857 drug effect Effects 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000004817 gas chromatography Methods 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 238000001225 nuclear magnetic resonance method Methods 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 150000007965 phenolic acids Chemical class 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229940126532 prescription medicine Drugs 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 239000000700 radioactive tracer Substances 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000011265 semifinished product Substances 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 229940126672 traditional medicines Drugs 0.000 description 1
- DCXXMTOCNZCJGO-UHFFFAOYSA-N tristearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(OC(=O)CCCCCCCCCCCCCCCCC)COC(=O)CCCCCCCCCCCCCCCCC DCXXMTOCNZCJGO-UHFFFAOYSA-N 0.000 description 1
- 229930182493 triterpene saponin Natural products 0.000 description 1
- 150000008130 triterpenoid saponins Chemical class 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000000341 volatile oil Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3577—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Medicines Containing Plant Substances (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明实施例通过提供一种基于ATR‑FTIR的金银花和山银花中药制剂的鉴别方法,该方法先检测金银花和山银花样品,获得金银花的ATR‑FTIR光谱数据和山银花的ATR‑FTIR光谱数据,再对所述金银花的ATR‑FTIR光谱数据和山银花的ATR‑FTIR光谱数据进行预处理,获得光谱数据集,然后将光谱数据集分为校准集和验证集,建立金银花和山银花中药制剂的判别模型,用判别模型对待测样品进行鉴别。解决了现有技术中,金银花和山银花中药制剂鉴别难的问题。
Description
技术领域
本发明属于中药光谱鉴定技术领域,具体涉及一种基于ATR-FTIR的金银花和山银花中药制剂的鉴别方法。
背景技术
金银花(Lonicera japonica Thumb.)和山银花都是常用的中药材,自古便被誉为清热解毒、疏风散热的良药。《药典》规定,忍冬的花称为金银花(Lonicera japonica),而忍冬科植物灰毡毛忍冬(Lonicera macranthoides Hand.-Mazz.)、红腺忍冬(Lonicerahypoglauca Miq.)、华南忍冬(Lonicara confuse DC.)和黄褐毛忍冬(Lonicerafulvotomentosa Hsu et S.C.Cheng)的花成为山银花。
金银花和山银花的化学成分主要有有机酸类、黄酮类、三萜皂苷类、环烯醚萜类、挥发油类以及微量元素等,但是他们在化学成分的组成和含量上有一定的差异。金银花和山银花均含有绿原酸,它们化学成分种类的主要差异表现在黄酮类的木犀草苷和三萜皂苷类的灰毡毛忍冬皂苷乙和川续断皂苷乙。金银花含有木犀草苷,但是山银花木犀草苷含量较少或几乎不含;灰毡毛忍冬皂苷乙和川续断皂苷乙在山银花中含量较多,而再金银花中含量较少或几乎不含。由于二者原植物种属相近、药材外观形态相似,难以区分,因此市场上金银花和山银花药材品种混乱、来源不清、质量良莠不齐的现象极为突出,进而直接影响到药材及其制剂的疗效。
现有的金银花、山银花鉴别方法均存在不足之处。如经验鉴别方法,需要鉴定人员具有丰富的药材知识以及多年的实际鉴别经验,即使知识和技能达到要求,鉴别结果也存在着极大的偶然性和人为因素。而化学成分分析法,是对几种主要化学成分进行检测,难以体现药材的整体质量。DNA分子鉴定法技术复杂、成本高,结果重复性差。这些方法虽然可以在一定程度上对近缘品种进行区分,但无法对药效的优劣进行评价。同时,金银花是许多中药方剂的原料药材,现有方法很难对中药制剂中原料的投料情况进行考察。
发明内容
本发明实施例通过提供一种基于ATR-FTIR的金银花和山银花中药制剂的鉴别方法,该方法先检测金银花和山银花样品,获得金银花的ATR-FTIR光谱数据和山银花的ATR-FTIR光谱数据,再对所述金银花的ATR-FTIR光谱数据和山银花的ATR-FTIR光谱数据进行预处理,获得光谱数据集,然后将光谱数据集分为校准集和验证集,建立金银花和山银花中药制剂的判别模型,用判别模型对待测样品进行鉴别。解决了现有技术中,金银花和山银花中药制剂鉴别难的问题。
一种基于ATR-FTIR的金银花和山银花中药制剂的鉴别方法,步骤包括:
检测金银花和山银花样品,获得金银花的ATR-FTIR光谱数据和山银花的ATR-FTIR光谱数据;
对所述金银花的ATR-FTIR光谱数据和山银花的ATR-FTIR光谱数据进行预处理,获得光谱数据集;
将所述光谱数据集分为校准集和验证集;
建立金银花和山银花中药制剂的判别模型;
采集待测样品的ATR-FTIR光谱数据,用所述判别模型对待测样品进行鉴别。
其中,利用Kennard-Stone算法将光谱数据集划分为校准集和验证集。
校准集为所有金银花和山银花药材样品的4/5。
优选地,上述方法还包括在建立金银花和山银花中药制剂的判别模型之后,用验证集对所述判别模型进行验证。
验证的方法为5倍交叉验证。5倍交叉验证即将数据分为5个部分,每次取其中一个部分,剩余部分用来做测试,共需要进行5次。
优选地,所述ATR-FTIR光谱数据的检测范围是4000~600cm-1。
优选地,所述ATR-FTIR光谱数据的检测器的分辨率为4cm-1。
优选地,所述预处理为一阶导数化与矢量归一化处理。
归一化处理包括面积归一化、最小-最大归一化和矢量归一化,其中矢量归一化包括一阶导数化与矢量归一化和二阶导数化与矢量归一化。一阶导数化与矢量归一化处理后的数据建立出的随机森林模型参数值高,即模型预测结果更准确。
进一步优选地,所述一阶导数化的平滑点数为9个。
进一步优选地,所述一阶导数化采用的导数为Savitzky-Golay导数。
优选地,所述校准集的波数区域包括4000-600cm-1、2000-600cm-1、4000-2000cm-1和4000-600cm-1。
进一步优选地,所述校准集的波数区域为4000-600cm-1。
优选地,所述判别模型为随机森林模型,所述随机森林模型的树的数目包括100、200、300、500、800和1000。
进一步优选地,所述随机森林模型的树的数目为300。
优选地,所述随机森林模型的节点数目包括82、84、86、88、90、92、94和96。
进一步优选地,所述随机森林模型的节点数目为86。
优选地,所述随机森林模型的VIP值包括0.05、0.01、0.015和0.020。
进一步优选地,所述随机森林模型的VIP值为0.01。
随机森林模型的操作过程可以分为以下几个步骤:
首先,利用Kennard-stone(KS)算法将光谱数据集分为校准集(bootstrapsamples)和验证集(out-of-bag samples)。利用校准集获得最优分类树,利用验证集评价随机森林模型的能力;
其次,选取树数量ntree的值和节点变量mtry个数的平方根,根据最小OOB分类误差值获得最优ntree和mtry;
再次,利用最优ntree和mtry构造了一个新的重要变量矩阵;
第四,在生产者中插入新的矩阵,根据变量的重要性对原始光谱变量进行重新排列,通过交叉验证错误率选择最重要的变量;
最后利用优化后的ntree和mtry参数建立最终的识别模型。重新运行前两个步骤来计算最终的分类精度。
中药指纹图谱是基于对中药或中药制剂一定认识的基础上,适当处理药材或制剂后借用光谱或色谱等分析仪器,主要用于评价中药材以及中药制剂半成品的鉴定。中药指纹图谱的一般方法有:光谱法,包括UV法、IR法、FT-IR法和NIR法等;色谱法,包括HPLC法、TLC法和GC法等;此外还有质谱法、核磁共振法、X射线法和免疫测定法等。光谱法中,将衰减全反射(Attenuated Tltal Refraction,简称ATR)红外附件应用到傅里叶变换红外光谱仪上,产生了傅里叶变换衰减全反射红外光谱仪(Attenuated Total Internal ReflectanceFourier Transform Infrared Spectroscopy,简称ATR-FTIR),极大地简化了一些特殊样品的测试,使微区成分的分析变得方便而快捷,检测灵敏度可达10-9g数量级,测量显微区直径达数微米。然而,由于ATR-FTIR光谱的数据数据信息量大,目前尚无高效的处理方法。
本发明实施例通过提供一种基于ATR-FTIR的金银花和山银花中药制剂的鉴别方法,该方法先检测金银花和山银花样品,获得金银花的ATR-FTIR光谱数据和山银花的ATR-FTIR光谱数据,再对所述金银花的ATR-FTIR光谱数据和山银花的ATR-FTIR光谱数据进行预处理,获得光谱数据集,然后将光谱数据集分为校准集和验证集,建立金银花和山银花中药制剂的判别模型,用判别模型对待测样品进行鉴别。解决了现有技术中,金银花和山银花中药制剂鉴别难的问题。
除了使用ATR-FTIR光谱外,还可以使用拉曼光谱,拉曼光谱是一种非破坏性分析工具,可以很容易地集成到工艺中,并通过最少的样品制备提供增强的化学信息,然而拉曼光谱仪器成本高、检测费用贵。
二阶导数红外光谱法(SD-IR)和二维相关红外光谱法(2D-IR)也是可行的,可用于解决重叠带,增强相似草药样品的光谱差异,得到更准确的数据,建立分类模型,然而同样存在的问题是仪器成本高、检测费用贵。
本发明实施例的有益效果
1、本发明实施例提供了一种基于ATR-FTIR的金银花和山银花中药制剂的鉴别方法,该方法先检测金银花和山银花样品,获得金银花的ATR-FTIR光谱数据和山银花的ATR-FTIR光谱数据,再对所述金银花的ATR-FTIR光谱数据和山银花的ATR-FTIR光谱数据进行预处理,获得光谱数据集,然后将光谱数据集分为校准集和验证集,建立金银花和山银花中药制剂的判别模型,用判别模型对待测样品进行鉴别,解决了现有技术中,金银花和山银花中药制剂鉴别难的问题;
2、本发明实施例提供的方法,与现有技术相比,样本无需复杂的前处理,具有检测速度快、操作简单方便和预测结果准确的优点;
3、本发明实施例建立的金银花与山银花中药制剂判别模型,相对于其他化学计量学方法建立的模型,能够更快的获得鉴别结果,且鉴别结果可靠。
附图说明
图1为金银花和山银花的ATR-FTIR光谱,其中,曲线1为金银花光谱数据,2为山银花光谱数据。
图2为金银花和山银花中药制剂的ATR-FTIR光谱,其中,曲线1为金银花中药制剂光谱数据,2为山银花中药制剂光谱数据。
具体实施方式
本发明实施例通过提供一种基于ATR-FTIR的金银花和山银花中药制剂的鉴别方法,该方法先检测金银花和山银花样品,获得金银花的ATR-FTIR光谱数据和山银花的ATR-FTIR光谱数据,再对所述金银花的ATR-FTIR光谱数据和山银花的ATR-FTIR光谱数据进行预处理,获得光谱数据集,然后将光谱数据集分为校准集和验证集,建立金银花和山银花中药制剂的判别模型,用判别模型对待测样品进行鉴别。解决了现有技术中,金银花和山银花中药制剂鉴别难的问题。
为了更好的理解上述技术方案,下面将结合具体的实施方式对上述技术方案进行详细地说明。
实施例1
本例提供了一种基于ATR-FTIR的金银花和山银花中药制剂的鉴别方法,步骤包括:
检测金银花和山银花样品,获得金银花的ATR-FTIR光谱数据和山银花的ATR-FTIR光谱数据;
对所述金银花的ATR-FTIR光谱数据和山银花的ATR-FTIR光谱数据进行预处理,获得光谱数据集;
将所述光谱数据集分为校准集和验证集;
建立金银花和山银花中药制剂的判别模型;
采集待测样品的ATR-FTIR光谱数据,用所述判别模型对待测样品进行鉴别。
其中,利用Kennard-Stone算法将光谱数据集划分为校准集和验证集。
校准集为所有金银花和山银花药材样品的4/5。
上述方法还包括在建立金银花和山银花中药制剂的判别模型之后,用验证集对所述判别模型进行验证。
验证的方法为5倍交叉验证。5倍交叉验证即将数据分为5个部分,每次取其中一个部分,剩余部分用来做测试,共需要进行5次。
ATR-FTIR光谱数据的检测范围是4000~600cm-1。ATR-FTIR光谱数据的检测器的分辨率为4cm-1。
预处理为一阶导数化与矢量归一化处理。归一化处理包括面积归一化、最小-最大归一化和矢量归一化,其中矢量归一化包括一阶导数化与矢量归一化和二阶导数化与矢量归一化。一阶导数化与矢量归一化处理后的数据建立出的随机森林模型参数值高,即模型预测结果更准确。一阶导数化的平滑点数为9个。一阶导数化采用的导数为Savitzky-Golay导数。
校准集的波数区域为4000-600cm-1。判别模型为随机森林模型,所述随机森林模型的树的数目为300。随机森林模型的节点数目为86。VIP值为0.01。
随机森林模型的操作过程可以分为以下几个步骤:
首先,利用Kennard-stone(KS)算法将光谱数据集分为校准集(bootstrapsamples)和验证集(out-of-bag samples)。利用校准集获得最优分类树,利用验证集评价随机森林模型的能力;
其次,选取树数量ntree的值和节点变量mtry个数的平方根,根据最小OOB分类误差值获得最优ntree和mtry;
再次,利用最优ntree和mtry构造了一个新的重要变量矩阵;
第四,在生产者中插入新的矩阵,根据变量的重要性对原始光谱变量进行重新排列,通过交叉验证错误率选择最重要的变量;
最后利用优化后的ntree和mtry参数建立最终的识别模型。重新运行前两个步骤来计算最终的分类精度。
实施例2
本例提供了一种基于ATR-FTIR的金银花和山银花中药制剂的鉴别方法,步骤包括:
检测金银花和山银花样品,获得金银花的ATR-FTIR光谱数据和山银花的ATR-FTIR光谱数据;
对所述金银花的ATR-FTIR光谱数据和山银花的ATR-FTIR光谱数据进行预处理,获得光谱数据集;
将所述光谱数据集分为校准集和验证集;
建立金银花和山银花中药制剂的判别模型;
采集待测样品的ATR-FTIR光谱数据,用所述判别模型对待测样品进行鉴别。
其中:
样本收集
金银花和山银花的干燥花蕾样本购自中国湖南、山东两省主产地。金银花和山银花成分的中药制剂购自权威药店。
样本处理
所有金银花与山银花药材样品磨成粉末,在60℃的电动恒温干燥箱中干燥至恒重(体重变化小于0.1%),每个样品用乳钵细磨成粉末,用200目不锈钢筛网进行筛分。金银花与山银花的相关处方药同样磨成粉末,每个样品用乳钵细磨成粉末,用200目不锈钢筛网进行筛分。所有的样本储存在相对干燥的环境中。
采集ATR-FTIR光谱
红外光谱仪为Nicolet iS5,Thermo Scientific,USA,该光谱仪配有一个衰减全反射(ATR)附件,OMNIC程序(版本8.2.0.387,Thermo Scientific,Waltham,Massachusetts,USA)用于获取所有ATR-FTIR光谱。记录信号累计64次,检测范围在4000-600cm–1之间,检测器分辨率为4cm–1。
检测所得金银花和山银花ATR-FTIR谱如图1所示。对光谱进行了分析,并观察到几个明显的峰。主要吸收峰的分配也总结在表1中。
4000-3500cm-1归属于水的O-H伸缩振动峰。2442-2208cm-1归属于二氧化碳的O-C-O伸缩振动峰。O-H在3350cm-1附近的伸缩振动峰和C-O在1200-950cm-1区域的伸缩振动峰表明金银花和山银花中存在糖类。金银花和山银花光谱在这一区域显示出不同的模式,这意味着金银花和山银花中的糖类是不同的。2920cm-1和2851cm-1处的峰值归因于CH2的不对称和对称伸缩振动峰[,以及1729cm-1附近C=O的伸缩振动峰,表明存在脂质。金银花和山银花被角质层覆盖,角质层是一层连续的脂质膜,包括角质、蜡、肉和多糖。2920、2851和1729cm-1附近的吸收峰来自角质和蜡,由酸、醇、酯、烷烃等组成。1630cm-1附近的吸收峰是由于C-O和C-N蛋白伸缩振动峰。这被称为酰胺I带,是主要的酰胺带。1440和1374cm-1处的峰值归因于有机酸OH振动模式。1321和1259cm-1处的峰值是由C–O伸缩振动峰造成的。1150cm-1附近的峰值被分配到胆固醇酯的C-O-O-C不对称拉伸和低聚糖和三酰甘油的C-O伸缩振动峰。一个在1051cm-1由于C-O伸缩振动峰淀粉。
金银花在1545cm-1处显示酰胺II带,而山银花在1528cm-1附近显示芳香骨带。这表明金银花含有更多的蛋白质,而山银花含有更多的芳香化合物(酚酸、类黄酮等)。此外,金银花在1400cm-1处出现峰值,在930cm-1处出现弱峰,这两个峰在山银花中都不存在。1400cm-1处的峰可分配给O-C-H的弯曲模式,而930cm-1处的峰可对应于糖的骨架模式。这两个峰表明金银花和山银花中的糖类不同。另一个鉴别峰在780cm-1附近,存在于山银花中,但不存在于金银花中。这种差异可能是由于山银花中的皂苷含量高造成的。
表1金银花与山银花ATR-FTIR光谱中峰位归属
表1中,v表示伸缩振动;νs表示对称伸缩振动;νas表示不对称伸缩振动;δ表示弯曲振动;skeletal表示骨架;δoop表示面外弯曲振动。
综上,金银花和山银花可通过1545、1400、930和780cm-1附近的四个峰来区分。
图2为金银花和山银花中药制剂的ATR-FTIR光谱,其中,曲线1为金银花中药制剂光谱数据,2为山银花中药制剂光谱数据。3000-2800cm-1、1700-1500cm-1、1000-700cm-1波数区域中,明显显示出金银花和山银花中药制剂的差异,而且,在这三个波数区域中,包含了可用于识别金银花和山银花的吸收峰。
光谱数据处理
对于得到的光谱数据进行一阶导数化与矢量归一化。利用OMNIC软件将所有光谱由透射率转换为吸光度,采用Savitzky-Golay导数和9个平滑点将ATR-FTIR吸光度光谱转换为一阶导数。矢量归一化采用欧氏范数计算吸光度值,得到光谱的归一化值。
选择校正样品集和验证样品集
在MATLAB编程环境下对金银花和山银花药材样本进行分类预测,建立随机森林模型。
在本发明的实施例中,利用Kennard-Stone算法将光谱数据集划分为校准集和验证集。校准集为所有金银花和山银花药材样品的4/5,并使用5倍交叉验证来证明方法。
金银花与山银花药材判别模型的建立与验证
在校准集中,对ATR-FTIR波数区域4000-600cm–1(不用去除水与二氧化碳)的光谱数据进行一阶导数矢量归一化处理,建立随机森林模型。选择300棵树,86节点,VIP(variable influence on projection)值为0.01。
计算真阴性(TN)、真阳性(TP)、假阴性(FN)和假阳性(FP)的值。
式(1)为灵敏度(Sensitivity,简称SENS);
式(2)为特异性(Specificity,简称SPEC);
式(3)为准确度(Accuracy,简称ACC);
式(4)为马修相关系数(Matthew’s correlation coefficient,简称MCC)。
式(1)~(4)为每类的四个参数,这四个参数值越大,表示每个类的识别能力越好。
本例采用随机森林、支持向量机和PLS-DA模型,在MATLAB编程环境下对金银花和山银花样本进行分类预测。利用Kennard-Stone算法将光谱数据集划分为校准集和验证集。校准集为所有金银花和山银花样品的4/5。在这三个模型的训练过程中,本研究使用了5倍交叉验证来证明方法的性能。
在建立随机森林模型时,首先通过训练过程选择树的数目作为最优分类树模型。在此步骤之前,首先用300棵树计算原始数据集和归一化数据集,以选择哪个数据集更适合建立随机森林模型。在原始数据集和规范化数据集的基础上,建立了支持向量机和PLS-DA模型。
如表2所示,在校准集中进行第一次微分后,通过应用适当的向量归一化,随机森林模型显示了性能。随机森林模型的SENS、SPEC、ACC、MCC分别为0.9706、1、0.9844和0.9692,优于其他预处理方法。在精确度方面,随机森林模型在总体精确度方面也优于PLS-DA和SVM模型。与分类器相比,随机森林模型的最高精度分别比PLS-DA高0.0071和SVM高0.0071。
表2.通过对金银花与山银花样本之间的归一化和光谱滤波变换预处理,建立的RF、PLS-DA、SVM模型的参数比较
此外,表3列出了评估三种模型性能的验证集,可以看出,一阶导数向量归一化的随机森林模型是识别金银花和山银花的最佳预测模型,ACC为0.9744。
利用树的数目、波数区域和VIP截止值来获得最佳的预测随机森林模型模型。根据最小的OOB分类误差值,得到最优树数。
表3.RF、PLS-DA、SVM模型结合一阶导数矢量归一化对金银花与山银花的分类结果及参数比较
如表4所示,这些误差最小的树的数目为100、200、300、500、800、1000。这些树精度最高的是300棵树。然后,选择300棵树作为分支节点选择(mtry值)。利用这300棵树,得到了表4中的节点计算结果。在校准集中,输入最优树数、OOB误差最小,共选取86个分支节点,此时精度最高为0.9886。结果表明,该模型采用300个树和86分支节点进行进一步的训练和预测。
表4.随机森林模型中参数筛选的精度值比较
由于ATR-FTIR光谱可能受到水蒸气、二氧化碳等环境因素的影响,将利用不同波数区域建立的随机森林模型进行了比较,以确定最佳预测模型。目前的红外光谱都采用波数等距,为了防止吸收曲线在高波数(短波)区过分扩张,一般采用两种比例尺,多以2000cm-1(5μm)为界。如表5所示,筛选区域分别为:4000-600cm-1(除去水和二氧化碳)、4000-600cm-1、4000-2000cm-1、2000-600cm-1。、在4000-600cm–1之间的ATR-FTIR光谱区域是识别金银花和山银花的最佳预测模型,因为它具有最高的ACC(=0.9844)。
表5.结合一阶导数矢量归一化法及300棵树对于随机森林模型的波数区域筛选的参数比较
如表6所示,根据VIP值的变化影响,重新排列原始光谱变量。在4000-600cm–1之间的ATR-FTIR光谱区域中建立识别金银花和山银花的随机森林预测模型,当VIP值为0.01时,具有最高的ACC(=0.9886)。
表6.对于金银花和山银花在4000-600cm-1波数区域中结合VIP值的参数比较
金银花和山银花相关处方分别由金银花和山银花作为主要组成的复方制剂。因此,本例利用上述分类和预测模型,进一步将该模型应用于识别金银花和山银花相关处方。如前所述,本研究认为识别金银花和山银花的最佳预测随机森林模型能够在识别金银花和山银花相关处方上显示出适当的性能。用随机森林模型计算了金银花和山银花两种传统药物的ATR-FTIR光谱数据,四个评价参数(SENS、SPEC、ACC、MCC)均为1。结果表明,建立的随机森林模型是区分金银花和山银花相关处方的最佳预测模型。
Claims (10)
1.一种基于ATR-FTIR的金银花和山银花中药制剂的鉴别方法,其特征在于,步骤包括:
检测金银花和山银花样品,获得金银花的ATR-FTIR光谱数据和山银花的ATR-FTIR光谱数据;
对所述金银花的ATR-FTIR光谱数据和山银花的ATR-FTIR光谱数据进行预处理,获得光谱数据集;
将所述光谱数据集分为校准集和验证集;
建立金银花和山银花中药制剂的判别模型;
采集待测样品的ATR-FTIR光谱数据,用所述判别模型对待测样品进行鉴别。
2.根据权利要求1所述的鉴别方法,其特征在于,所述ATR-FTIR光谱数据的检测范围是4000~600cm-1。
3.根据权利要求1所述的鉴别方法,其特征在于,所述ATR-FTIR光谱数据的检测器的分辨率为4cm-1。
4.根据权利要求1所述的鉴别方法,其特征在于,所述预处理为一阶导数化与矢量归一化处理。
5.根据权利要求4所述的鉴别方法,其特征在于,所述一阶导数化的平滑点数为9个。
6.根据权利要求4所述的鉴别方法,其特征在于,所述一阶导数化采用的导数为Savitzky-Golay导数。
7.根据权利要求1所述的鉴别方法,其特征在于,所述校准集的波数区域包括4000-600cm-1、2000-600cm-1、4000-2000cm-1和4000-600cm-1。
8.根据权利要求1所述的鉴别方法,其特征在于,所述判别模型为随机森林模型,所述随机森林模型的树的数目包括100、200、300、500、800和1000。
9.根据权利要求8所述的鉴别方法,其特征在于,所述随机森林模型的节点数目包括82、84、86、88、90、92、94和96。
10.根据权利要求8所述的鉴别方法,其特征在于,所述随机森林模型的VIP值包括0.05、0.01、0.015和0.020。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910552945.7A CN110220863A (zh) | 2019-06-25 | 2019-06-25 | 一种基于atr-ftir的金银花和山银花中药制剂的鉴别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910552945.7A CN110220863A (zh) | 2019-06-25 | 2019-06-25 | 一种基于atr-ftir的金银花和山银花中药制剂的鉴别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110220863A true CN110220863A (zh) | 2019-09-10 |
Family
ID=67814723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910552945.7A Pending CN110220863A (zh) | 2019-06-25 | 2019-06-25 | 一种基于atr-ftir的金银花和山银花中药制剂的鉴别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110220863A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112816433A (zh) * | 2020-12-31 | 2021-05-18 | 中国医学科学院药用植物研究所 | 一种基于红外光谱的山银花鉴别方法、设备和介质 |
CN115561198A (zh) * | 2022-09-22 | 2023-01-03 | 广西医科大学 | 基于atr-ftir同时检测牡蛎产地及糖原含量的方法 |
WO2023024288A1 (zh) * | 2021-08-27 | 2023-03-02 | 深圳市药品检验研究院(深圳市医疗器械检测中心) | 一种结合抗新冠病毒效应的金银花和山银花鉴别模型及其构建方法和应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004088274A2 (en) * | 2003-03-26 | 2004-10-14 | Curagen Corporation | Psychoactive compound associated markers and method of use thereof |
CN103487411A (zh) * | 2013-09-01 | 2014-01-01 | 西北大学 | 一种随机森林算法结合激光诱导击穿光谱识别钢材牌号的方法 |
CN108509997A (zh) * | 2018-04-03 | 2018-09-07 | 深圳市药品检验研究院(深圳市医疗器械检测中心) | 一种基于近红外光谱技术对中药皂角刺的真伪进行化学模式识别的方法 |
CN109001143A (zh) * | 2018-08-01 | 2018-12-14 | 重庆医科大学 | 一种灵敏预测麻黄品质特性的中红外光谱法 |
-
2019
- 2019-06-25 CN CN201910552945.7A patent/CN110220863A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004088274A2 (en) * | 2003-03-26 | 2004-10-14 | Curagen Corporation | Psychoactive compound associated markers and method of use thereof |
CN103487411A (zh) * | 2013-09-01 | 2014-01-01 | 西北大学 | 一种随机森林算法结合激光诱导击穿光谱识别钢材牌号的方法 |
CN108509997A (zh) * | 2018-04-03 | 2018-09-07 | 深圳市药品检验研究院(深圳市医疗器械检测中心) | 一种基于近红外光谱技术对中药皂角刺的真伪进行化学模式识别的方法 |
CN109001143A (zh) * | 2018-08-01 | 2018-12-14 | 重庆医科大学 | 一种灵敏预测麻黄品质特性的中红外光谱法 |
Non-Patent Citations (2)
Title |
---|
RUI YAN 等: "Rapid identification of Lonicerae japonicae Flos and Lonicerae Flos by Fourier transform infrared (FT-IR) spectroscopy and two-dimensional correlation analysis", 《JOURNAL OF MOLECULAR STRUCTURE》 * |
李冠稳: "基于可见-近红外光谱与回归技术的土壤有机质含量估算研究", 《中国优秀硕士学位论文全文数据库 农业科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112816433A (zh) * | 2020-12-31 | 2021-05-18 | 中国医学科学院药用植物研究所 | 一种基于红外光谱的山银花鉴别方法、设备和介质 |
CN112816433B (zh) * | 2020-12-31 | 2023-09-22 | 中国医学科学院药用植物研究所 | 一种基于红外光谱的山银花鉴别方法、设备和介质 |
WO2023024288A1 (zh) * | 2021-08-27 | 2023-03-02 | 深圳市药品检验研究院(深圳市医疗器械检测中心) | 一种结合抗新冠病毒效应的金银花和山银花鉴别模型及其构建方法和应用 |
CN115561198A (zh) * | 2022-09-22 | 2023-01-03 | 广西医科大学 | 基于atr-ftir同时检测牡蛎产地及糖原含量的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yin et al. | A review of the application of near-infrared spectroscopy to rare traditional Chinese medicine | |
Ren et al. | Using near-infrared hyperspectral imaging with multiple decision tree methods to delineate black tea quality | |
Tingting et al. | Determination geographical origin and flavonoids content of goji berry using near-infrared spectroscopy and chemometrics | |
Cai et al. | Using FTIR spectra and pattern recognition for discrimination of tea varieties | |
CN104792652B (zh) | 一种黄芪药材多指标快速检测方法 | |
CN110220863A (zh) | 一种基于atr-ftir的金银花和山银花中药制剂的鉴别方法 | |
Chen et al. | Nondestructive differentiation of panax species using visible and shortwave near-infrared spectroscopy | |
Rohman et al. | Application of near-and mid-infrared spectroscopy combined with chemometrics for discrimination and authentication of herbal products: A review | |
CN104237060A (zh) | 一种金银花药材多指标快速检测方法 | |
CN110376153B (zh) | 一种atr-ftir结合rbf神经网络对市售西红花产地溯源的方法 | |
CN106525759A (zh) | 一种基于衰减全反射太赫兹介电谱鉴别蜂蜜品种的方法 | |
D’Archivio et al. | Geographical discrimination of saffron (Crocus sativus L.) using ICP-MS elemental data and class modeling of PDO Zafferano dell’Aquila produced in Abruzzo (Italy) | |
Evans et al. | Determination of the authenticity of orange juice by discriminant analysis of near infrared spectra | |
CN108072626A (zh) | 一种沥青品牌识别方法 | |
Pan et al. | Rapid On-site identification of geographical origin and storage age of tangerine peel by Near-infrared spectroscopy | |
Wang et al. | Potential of near infrared spectroscopy and pattern recognition for rapid discrimination and quantification of Gleditsia sinensis thorn powder with adulterants | |
Wang et al. | Original plant traceability of Dendrobium species using multi-spectroscopy fusion and mathematical models | |
Zhang et al. | Use of ATR‐FTIR Spectroscopy and Chemometrics for the Variation of Active Components in Different Harvesting Periods of Lonicera japonica | |
Zhao et al. | Identification of Gentiana rigescens from different geographical origins based on HPLC and FTIR fingerprints | |
Fan et al. | Geographical-origin discrimination and volatile oil quantitative analysis of Zanthoxylum bungeanum Maxim. with a portable near-infrared spectrometer | |
Liu et al. | Main components determination and rapid geographical origins identification in Gentiana rigescens Franch. based on HPLC, 2DCOS images combined to ResNet | |
Chen et al. | Two-dimensional correlation spectroscopy reveals the underlying compositions for FT-NIR identification of the medicinal bulbs of the genus Fritillaria | |
Angeline et al. | Rapid authentication of turmeric powder adulterated with Curcuma zedoaria and Curcuma xanthorrhiza using FTIR-ATR spectroscopy and chemometrics | |
CN109685099A (zh) | 一种光谱波段优选模糊聚类的苹果品种辨别方法 | |
CN108760679A (zh) | 一种基于近红外光谱技术的乌天麻鉴别方 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190910 |