CN114550843A - 中药多糖中单糖组成及含量的预测模型及其构建方法和应用 - Google Patents
中药多糖中单糖组成及含量的预测模型及其构建方法和应用 Download PDFInfo
- Publication number
- CN114550843A CN114550843A CN202210073669.8A CN202210073669A CN114550843A CN 114550843 A CN114550843 A CN 114550843A CN 202210073669 A CN202210073669 A CN 202210073669A CN 114550843 A CN114550843 A CN 114550843A
- Authority
- CN
- China
- Prior art keywords
- model
- traditional chinese
- chinese medicine
- atr
- polysaccharide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 150000004676 glycans Chemical class 0.000 title claims abstract description 61
- 229920001282 polysaccharide Polymers 0.000 title claims abstract description 61
- 239000005017 polysaccharide Substances 0.000 title claims abstract description 61
- 150000002772 monosaccharides Chemical class 0.000 title claims abstract description 41
- 239000003814 drug Substances 0.000 title claims abstract description 38
- 239000000203 mixture Substances 0.000 title claims abstract description 28
- 238000010276 construction Methods 0.000 title claims abstract description 9
- 238000000034 method Methods 0.000 claims abstract description 20
- 238000002329 infrared spectrum Methods 0.000 claims abstract description 19
- 238000005102 attenuated total reflection Methods 0.000 claims abstract description 18
- 238000001514 detection method Methods 0.000 claims abstract description 11
- 238000005516 engineering process Methods 0.000 claims abstract description 10
- 238000011282 treatment Methods 0.000 claims abstract description 9
- 238000001157 Fourier transform infrared spectrum Methods 0.000 claims abstract description 6
- 238000003672 processing method Methods 0.000 claims abstract description 6
- 238000004483 ATR-FTIR spectroscopy Methods 0.000 claims description 25
- 238000009499 grossing Methods 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 9
- 238000012937 correction Methods 0.000 claims description 7
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 7
- 238000001228 spectrum Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 241000132012 Atractylodes Species 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims description 5
- 238000002790 cross-validation Methods 0.000 claims description 4
- 230000036961 partial effect Effects 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000005033 Fourier transform infrared spectroscopy Methods 0.000 claims description 2
- 238000005903 acid hydrolysis reaction Methods 0.000 claims description 2
- 238000001212 derivatisation Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 238000004108 freeze drying Methods 0.000 claims description 2
- 238000000589 high-performance liquid chromatography-mass spectrometry Methods 0.000 claims description 2
- 239000000463 material Substances 0.000 claims description 2
- 238000000874 microwave-assisted extraction Methods 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000010992 reflux Methods 0.000 claims description 2
- 238000012958 reprocessing Methods 0.000 claims description 2
- 238000002137 ultrasound extraction Methods 0.000 claims description 2
- 238000010200 validation analysis Methods 0.000 claims 1
- 238000004949 mass spectrometry Methods 0.000 abstract 2
- 230000007613 environmental effect Effects 0.000 abstract 1
- 230000004907 flux Effects 0.000 abstract 1
- 239000007791 liquid phase Substances 0.000 abstract 1
- 239000012071 phase Substances 0.000 abstract 1
- 238000007619 statistical method Methods 0.000 abstract 1
- AEMOLEFTQBMNLQ-UHFFFAOYSA-N beta-D-galactopyranuronic acid Natural products OC1OC(C(O)=O)C(O)C(O)C1O AEMOLEFTQBMNLQ-UHFFFAOYSA-N 0.000 description 8
- LKDRXBCSQODPBY-VRPWFDPXSA-N D-fructopyranose Chemical compound OCC1(O)OC[C@@H](O)[C@@H](O)[C@@H]1O LKDRXBCSQODPBY-VRPWFDPXSA-N 0.000 description 4
- AEMOLEFTQBMNLQ-YMDCURPLSA-N D-galactopyranuronic acid Chemical compound OC1O[C@H](C(O)=O)[C@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-YMDCURPLSA-N 0.000 description 4
- AEMOLEFTQBMNLQ-AQKNRBDQSA-N D-glucopyranuronic acid Chemical compound OC1O[C@H](C(O)=O)[C@@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-AQKNRBDQSA-N 0.000 description 4
- 241000132011 Atractylodes lancea Species 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 229940126680 traditional chinese medicines Drugs 0.000 description 3
- 238000004566 IR spectroscopy Methods 0.000 description 2
- 241001072909 Salvia Species 0.000 description 2
- 235000017276 Salvia Nutrition 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000013441 quality evaluation Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 244000215068 Acacia senegal Species 0.000 description 1
- 206010067484 Adverse reaction Diseases 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- 229920000084 Gum arabic Polymers 0.000 description 1
- 229920000869 Homopolysaccharide Polymers 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 229930194542 Keto Natural products 0.000 description 1
- 208000003351 Melanosis Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 239000000205 acacia gum Substances 0.000 description 1
- 235000010489 acacia gum Nutrition 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 230000001093 anti-cancer Effects 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- IZEKFCXSFNUWAM-UHFFFAOYSA-N dipyridamole Chemical compound C=12N=C(N(CCO)CCO)N=C(N3CCCCC3)C2=NC(N(CCO)CCO)=NC=1N1CCCCC1 IZEKFCXSFNUWAM-UHFFFAOYSA-N 0.000 description 1
- 229960002768 dipyridamole Drugs 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 1
- 229940096919 glycogen Drugs 0.000 description 1
- 235000008216 herbs Nutrition 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000002519 immonomodulatory effect Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 208000017169 kidney disease Diseases 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 208000019423 liver disease Diseases 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008099 melanin synthesis Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 238000010238 partial least squares regression Methods 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 239000000106 platelet aggregation inhibitor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 230000006340 racemization Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 238000004808 supercritical fluid chromatography Methods 0.000 description 1
- 235000019605 sweet taste sensations Nutrition 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000000870 ultraviolet spectroscopy Methods 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/141—Discrete Fourier transforms
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N2021/3595—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using FTIR
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Pure & Applied Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Data Mining & Analysis (AREA)
- Crystallography & Structural Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Immunology (AREA)
- Discrete Mathematics (AREA)
- Pharmacology & Pharmacy (AREA)
- Medicinal Chemistry (AREA)
- Pathology (AREA)
- Biochemistry (AREA)
- Algebra (AREA)
- Analytical Chemistry (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了中药多糖中单糖组成及含量的预测模型及其构建方法和应用。本发明以不同产地、不同批次、不同品种以及不同炮制方法的中药多糖样品,使用衰减全反射傅里叶变换红外光谱技术,采集所有原始红外光谱且进行不同的处理,并结合多元统计学分析建立单糖组成及含量测定的最优预测模型。采用本发明所构建的最优预测模型能够快速的检测所建立模型对应中药中多糖的单糖组成及含量,可以快速评估中药中多糖的质量,进而评价中药的质量。与液相质谱、气相质谱等现有检测方法相比,具有高效,安全,环保,高通量,设备简单,花费少等优点。
Description
技术领域
本发明涉及单糖组成及含量的预测模型及其构建方法,尤其涉及中药粗多糖中单糖组成及含量的预测模型及其构建方法,本发明进一步涉及该预测模型应用于中药粗多糖中单糖组成及含量的预测,属于中药粗多糖中单糖组成及含量的预测领域。
背景技术
多糖(polysaccharide)广泛存在与植物,动物和微生物中,由糖苷键结合的糖链,至少要超过10个的单糖组成的聚合糖高分子碳水化合物,可用通式(C6H10O5)n表示。由相同的单糖组成的多糖称为同多糖,如淀粉、纤维素和糖原;以不同的单糖组成的多糖称为杂多糖,如阿拉伯胶是由戊糖和半乳糖等组成。多糖不是一种纯粹的化学物质,而是聚合程度不同的物质的混合物。多糖类一般不溶于水,无甜味,不能形成结晶,无还原性和变旋现象。多糖可以水解,在水解过程中,往往产生一系列的中间产物,最终完全水解得到单糖。在临床中,多糖已经被用于免疫调节,抗病毒及抗癌,降血压等。中药中含有大量的多糖类物质,但以往的研究中常常被当做杂质去除,只关注小分子化合物。随着科技技术的发展,中药中多糖类物质得到了越来越多的关注,如从丹参中分离出的丹参多糖能够抑制尿蛋白的分泌,缓解肝肾疾病症状,可制成口服或肌注制剂,减少由于长期服用双嘧达莫等类固醇或血小板抑制剂造成的不良反应;从石菖蒲的根茎中分离得到的多糖可抑制黑色素的产生,具有抗炎、抗氧化作用,可用于黑变病的治疗,且因其具有良好的保湿作用,故又可作为化妆品的有效成分。但因为中药多糖的复杂性,传统的多糖检测方法包括紫外-可见分光光度法、高效液相色谱法、液相色谱质谱联用法、气相色谱质谱联用法、超临界流体色谱法及核磁共振法等。但这些方法都很难实现简单、快速且高通量的检测。故在《中华人民共和国药典》中,只采用小分子化合物作为评价中药质量的标志物。因此需要一种简单且高通量检测中药多糖中单糖组成和含量的方法。
衰减全反射傅里叶傅里叶变换红外光谱法是一种常用的结构分析技术,具有灵敏度高,特征性强,可实现快速无损检测等特点。多元回归是一种研究多个因变量对自变量影响的分析手段,其中PLS是近些年常用的回归方法,而OPLS是在PLS的基础上发展而来。它正成为中药快速鉴别及质量评价的一种有效手段,但还未应用于中药多糖提取物的鉴别与质量评价领域。
发明内容
本发明的目的之一是提供一种中药多糖中单糖组成及含量的预测模型及其构建方法;
本发明的目的之二是将所构建的预测模型应用于快速检测中药多糖中单糖组成及含量;
本发明的上述目的是通过以下技术方案来实现的:
一种中药多糖中单糖组成及含量的预测模型,其构建方法包括:
(1)提取中药多糖,将中药多糖冻干后等量分为两份样品,一份样品为ATR-FTIR组,另一份样品为LC-MS组;
(2)将ATR-FTIR组样品采用衰减全反射傅里叶变换红外光谱技术,在恒定的ATR温度下采集中药多糖一维红外光谱,使用OMNIC软件进行大气背景去除,基线矫正和归一化后标记作为初级红外光谱(FOS):将LC-MS组样品进行酸水解和衍生化后,利用高效液相-质谱联用技术测定样品的单糖组成及含量,并记录其检测值:
(3)将ATR-FTIR组与LC-MS组中的中药多糖样品一一对应,随机抽取2/3样品为作为校准集,1/3样品作为测试集;
(4)用OMNIC软件对FOS进行9点平滑(SG9)、13点平滑(SG13)、17点平滑(SG17)、Savitsky-Golay一阶导数(FD)和Savitsky-Golay二阶导数(SD)处理后的傅里叶变换衰减全反射红外光谱进行再次处理;
(5)采用多元回归的方法通过连续投影算法提取处理后的ATR-FTIR全波段中的特征波段,进而对应地提取出处理后的ATR-FTIR强度,以提取出的处理后的ATR-FTIR强度为自变量,以对应的单糖的检测值为因变量建立模型;
(6)模型的定量预测结果,通过测试集的决定系数(Rp 2)和均方根误差(RMSEP),校准集的决定系数(Rc 2)和均方根误差(RMSEC)以及交互验证均方根误差(RMSECV)为评判标准,挑选出一级最优模型的傅里叶变换衰减全反射红外光谱数据处理方法;
(7)将步骤(6)中一级最优模型对应的ATR-FTIR分别进行标准正态化(SNV)或多元散射矫正(MSC)处理;
(8)将步骤(7)中处理后的ATR-FTIR进行连续投影算法建立PLS模型,将步骤(6)中的一级最优模型对应的ATR-FTIR进行连续投影算法建立OPLS模型,将建立的PLS模型、OPLS模型以及一级最优模型按步骤(6)的评判标准评判,得到二级最优模型;
(9)将二级最优模型VIP得分图导出,选取VIP得分值大于1的波数进行再次建模,建立PLS模型或OPLS模型,得到三级最优模型,为最终的预测模型。
作为本发明一种优选的具体实施方案,步骤(1)中可以采用本领域的常规技术手段从中药中提取多糖,这些常规的提取方法包括但不限于回流提取、超声辅助提取或微波辅助提取等。
作为本发明一种优选的具体实施方案,步骤(2)中所述的恒定的ATR温度是30℃。
作为本发明一种优选的具体实施方案,步骤(2)将ATR-FTIR组样品采用衰减全反射傅里叶变换红外光谱技术,在恒定的ATR温度下采集中药多糖一维红外光谱的参数包括:扫描次数16次,扫描波段700-4000cm-1,采集时间23.86秒,分辨率4.000,扫描点数16672,激光频率15798.67cm-1,干涉图峰位8192;
作为本发明一种优选的具体实施方案,步骤(4)中以处理后的傅里叶变换衰减全反射红外光谱为自变量,以与每条光谱对应的单糖组成及含量的检测值为因变量,分别采取基线校正、归一化、SG9、SG13、SG17、FD、SD、SNV和MSC九种预处理方法对原始傅里叶变换衰减全反射红外光谱进行处理,建立处理后模型,采用全交互验证方法对处理后PLS或OPLS进行交叉验证。
作为本发明一种优选的具体实施方案,步骤(5)中所述的多元回归的方法包括偏最小二乘法(PLS)或正交偏最小二乘法(OPLS)等。
作为本发明一种优选的具体实施方案,步骤(6)中通过测试集的决定系数(Rp 2)和均方根误差(RMSEP),校准集的决定系数(Rc 2)和均方根误差(RMSEC)以及交互验证均方根误差(RMSECV)为评判标准,挑选出最优的傅里叶变换衰减全反射红外光谱数据处理方法;Rp2和Rc2越大,RMSEP、RMSEC和RMSECV越小,回归模型的性能越好。挑选VIP值大于1的波段,减少模型的计算量以及优化模型,得到最优的中药粗多糖中单糖组成及含量的预测模型,并计算其决定系数(R2),相对百分比偏差(RPD)以及伪变量检测限(LODpu)和定量限(LOQ),用来说明模型的定量预测能力。
作为本发明一种优选的具体实施方案,步骤(6)中所述的均方根误差(RMSEP),均方根误差(RMSEC)以及交互验证均方根误差(RMSECV)的计算公式分别如下:
本发明进一步提供了所构建的预测模型在检测中药多糖中单糖组成及含量中的应用,包括;测出待测中药多糖的ATR-FTIR,筛选出每个模型对应的VIP值大于1的波段,代入模型中,由软件计算出待测多糖的单糖含量。若含量为0或者负数,则待测样品中不含有模型对应的单糖。由此得到单糖组成。所述的软件只要能做PLS回归和OPLS回归都能适用于这种方法测定中药中多糖的单糖组成及含量。
本发明以不同产地、不同批次、不同品种以及不同炮制方法的中药多糖样品,使用衰减全反射傅里叶变换红外光谱技术,采集中药多糖一维红外光谱,建立单糖组成及含量测定的最优预测模型。采用本发明所构建的最优预测模型能够快速的检测所建立模型对应中药中多糖的单糖组成及含量,可以快速评估中药中多糖的质量,进而评价中药的质量,该方法已经成功应用于中药苍术多糖的单糖组成及含量的快速检测中,与液相质谱、气相质谱等现有检测方法相比,具有高效,安全,环保,高通量,设备简单,花费少等优点。
附图说明
图1本发明中药粗多糖中单糖组成及含量的预测模型的构建流程图。
图2苍术多糖中单糖的最优多元回归预测模型和VIP得分图。
具体实施方式
以下结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。
实施例1苍术多糖的单糖组成及含量的预测模型的构建以及在不同产地、不同来源以及不同炮制的苍术多糖单糖组成及含量的快速测定中的应用
1.仪器与试药
傅立叶红外光谱仪(Thermo Fisher Scientific),选用来自蒙古的北苍术,大兴安岭地区的茅苍术以及该地区的茅苍术的炮制品共63批。
2.方法与结果
2.1红外光谱指纹图谱
恒定的ATR温度(30℃)下采用衰减全反射傅里叶变换红外光谱技术,采集苍术多糖红外光谱并进行谱图处理,包括:大气背景扣除+自动基线校正+纵坐标归一化,并记为FOS。
2.2初步处理后最优光谱的筛选
将苍术多糖的FOS进行SG9,SG13,SG17平滑处理,以及不同平滑点处理后的FD和SD处理。将处理后的模型进行PLS建模,并记录不同模型的Rc 2,RMSEC,Rp 2,RMSEP和RMSECV,作为筛选最优光谱的指标(表1),得到一级最优模型。
表1苍术多糖第一步处理后的ATR-FTIR中的Xyl,Ara,Glc,Gal,Man,Fru,GlcA及GalA的PLS模型性能
2.3再次处理后最优模型的筛选
将初步处理后的最优光谱进行SNV和MSC处理,并建立相应的PLS模型与基于最优光谱建立OPLS模型以及一级最优模型进行比较,筛选出二级最优模型(表2)。
表2苍术多糖第二步处理后的ATR-FTIR中的Xyl,Ara,Glc,Gal,Man,Fru,GlcA及GalA的PLS或OPLS模型性能
2.4VIP得分图简化模型
最优模型的自变量(nv)为2066,将VIP得分大于1的波段筛选出,并使用二级最优模型的方法建立单糖回归模型,得到三级最优模型及最终的预测模型。模型的决定系数(R2),相对百分比偏差(RPD)以及伪变量检测限(LODpu)和定量限(LOQ),用来说明模型的定量预测能力(图2)。
表3苍术多糖前两步处理后最优光谱经VIP值优化后的ATR-FTIR中的Xyl,Ara,Glc,Gal,Man,Fru,GlcA及GalA的PLS或OPLS模型性能
苍术的五碳糖中,Xyl模型的nv=771,R2=0.97,RPD=4.98,LODpu=2.97μg/mg和LOQ=16.40μg/mg;Ara模型的nv=938,R2=0.97,RPD=4.53,LODpu=31.33μg/mg和LOQ=94.88μg/mg。在六碳醛糖中,Glc模型的nv=751,R2=0.90,RPD=3.03,LODpu=24.60μg/mg和LOQ=102.79μg/mg;Gal模型的nv=678,R2=0.94,RPD=3.26,LODpu=2.11μg/mg和LOQ=19.46μg/mg;Man模型的nv=932,R2=0.94,RPD=4.74,LODpu=0.27μg/mg和LOQ=2.69μg/mg。在六碳酮糖中,Fru模型的nv=869,R2=0.97,RPD=4.70,LODpu=19.11μg/mg和LOQ=159.93μg/mg。在酸性糖中,GlcA模型的nv=714,R2=0.92,RPD=4.36,LODpu=0.67μg/mg和LOQ=5.90μg/mg;GalA模型的nv=713,R2=0.95,RPD=3.42,LODpu=21.91μg/mg和LOQ=225.27μg/mg。
试验结果证明8个单糖的多元回归模型均有很好的预测能力,可以应用于苍术多糖成分的检验。
Claims (10)
1.中药多糖中单糖组成及含量的预测模型,其特征在于,其构建方法包括:
(1)提取中药多糖,将中药多糖冻干后等量分为两份样品,一份样品为ATR-FTIR组,另一份样品为LC-MS组;
(2)将ATR-FTIR组样品采用衰减全反射傅里叶变换红外光谱技术,在恒定的ATR温度下采集中药多糖一维红外光谱,使用OMNIC软件进行大气背景去除,基线矫正和归一化后标记作为初级红外光谱:将LC-MS组样品进行酸水解和衍生化后,利用高效液相-质谱联用技术测定样品的单糖组成及含量,并记录其检测值:
(3)将ATR-FTIR组与LC-MS组中的中药多糖样品一一对应,随机抽取2/3样品为作为校准集,1/3样品作为测试集;
(4)用OMNIC软件对FOS进行9点平滑、13点平滑、17点平滑、Savitsky-Golay一阶导数和Savitsky-Golay二阶导数处理后的傅里叶变换衰减全反射红外光谱进行再次处理;
(5)采用多元回归的方法通过连续投影算法提取处理后的ATR-FTIR全波段中的特征波段,进而对应地提取出处理后的ATR-FTIR强度,以提取出的处理后的ATR-FTIR强度为自变量,以对应的单糖的检测值为因变量建立模型;
(6)模型的定量预测结果,通过测试集的决定系数和RMSEP,校准集的决定系数和均方根误差以及RMSECV为评判标准,挑选出一级最优模型的傅里叶变换衰减全反射红外光谱数据处理方法;
(7)将步骤(6)中一级最优模型对应的ATR-FTIR分别进行标准正态化或多元散射矫正处理;
(8)将步骤(7)中处理后的ATR-FTIR进行连续投影算法建立PLS模型,将步骤(6)中的一级最优模型对应的ATR-FTIR进行连续投影算法建立OPLS模型,将建立的PLS模型、OPLS模型以及一级最优模型按步骤(6)的评判标准评判,得到二级最优模型;
(9)将二级最优模型VIP得分图导出,选取VIP得分值大于1的波数进行再次建模,建立PLS模型或OPLS模型,得到三级最优模型为最终的预测模型。
2.根据权利要求1所述的预测模型,其特征在于,步骤(1)中提取中药多糖的方法包括但不限于回流提取、超声辅助提取或微波辅助提取。
3.根据权利要求1所述的预测模型,其特征在于,步骤(2)中所述的恒定的ATR温度是30℃。
4.根据权利要求1所述的预测模型,其特征在于,步骤(2)中将ATR-FTIR组样品采用衰减全反射傅里叶变换红外光谱技术,在恒定的ATR温度下采集中药多糖一维红外光谱的参数包括:扫描次数16次,扫描波段700-4000cm-1,采集时间23.86秒,分辨率4.000,扫描点数16672,激光频率15798.67cm-1,干涉图峰位8192;
步骤(2)中使用OMNIC软件进行大气背景去除,基线矫正和归一化后标记作为初级红外光谱。
5.根据权利要求1所述的预测模型,其特征在于,步骤(4)中以处理后的傅里叶变换衰减全反射红外光谱为自变量,以与每条光谱对应的单糖组成及含量的检测值为因变量,分别采取基线校正、归一化、SG9、SG13、SG17、FD、SD、SNV和MSC九种预处理方法对原始傅里叶变换衰减全反射红外光谱进行处理,建立处理后模型,采用全交互验证方法对处理后PLS或OPLS进行交叉验证。
6.根据权利要求1所述的预测模型,其特征在于,步骤(5)中所述的多元回归的方法包括偏最小二乘法或正交偏最小二乘法。
7.根据权利要求1所述的预测模型,其特征在于,步骤(6)中通过校准集的决定系数和RMSEP,测试集的决定系数和RMSEC以及RMSECV为评判标准,挑选出最优的傅里叶变换衰减全反射红外光谱数据处理方法。
9.权利要求1-8任何一项所述的预测模型在检测中药多糖的单糖组成及含量中的应用,包括:测出待测中药多糖的ATR-FTIR,筛选出每个模型对应的VIP值大于1的波段,代入预测模型中计算出待测多糖的单糖含量或单糖组成。
10.按照权利要求9所述的应用,其特征在于,所述的中药是苍术。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210073669.8A CN114550843B (zh) | 2022-01-21 | 中药多糖中单糖组成及含量的预测模型及其构建方法和应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210073669.8A CN114550843B (zh) | 2022-01-21 | 中药多糖中单糖组成及含量的预测模型及其构建方法和应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114550843A true CN114550843A (zh) | 2022-05-27 |
CN114550843B CN114550843B (zh) | 2024-07-12 |
Family
ID=
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116337800A (zh) * | 2023-02-08 | 2023-06-27 | 中国科学院西北高原生物研究所 | 基于atr-ftir的马蔺籽油质量评价方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009155755A1 (zh) * | 2008-06-26 | 2009-12-30 | 北京同仁堂股份有限公司 | 巴戟天寡糖的含量测定方法 |
CN110749575A (zh) * | 2019-10-17 | 2020-02-04 | 夏永刚 | 一种中药多糖二维红外光谱鉴别预测模型及其构建方法和应用 |
CN111323407A (zh) * | 2020-02-20 | 2020-06-23 | 浙江大学 | 一种快速测定中药多糖含量的拉曼光谱检测方法 |
CN112595692A (zh) * | 2020-11-24 | 2021-04-02 | 南宁国拓生物科技有限公司 | 一种水果总糖含量预测模型的建立方法及水果总糖含量的预测方法 |
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009155755A1 (zh) * | 2008-06-26 | 2009-12-30 | 北京同仁堂股份有限公司 | 巴戟天寡糖的含量测定方法 |
CN110749575A (zh) * | 2019-10-17 | 2020-02-04 | 夏永刚 | 一种中药多糖二维红外光谱鉴别预测模型及其构建方法和应用 |
CN111323407A (zh) * | 2020-02-20 | 2020-06-23 | 浙江大学 | 一种快速测定中药多糖含量的拉曼光谱检测方法 |
CN112595692A (zh) * | 2020-11-24 | 2021-04-02 | 南宁国拓生物科技有限公司 | 一种水果总糖含量预测模型的建立方法及水果总糖含量的预测方法 |
Non-Patent Citations (1)
Title |
---|
曾贞;孙恒;陈骏飞;徐天才;王宇萍;李坤;康平德;胡强;: "FTIR结合化学计量学快速预测铁皮石斛中总多糖含量", 江西农业学报, no. 01, 15 January 2018 (2018-01-15) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116337800A (zh) * | 2023-02-08 | 2023-06-27 | 中国科学院西北高原生物研究所 | 基于atr-ftir的马蔺籽油质量评价方法 |
CN116337800B (zh) * | 2023-02-08 | 2023-11-28 | 中国科学院西北高原生物研究所 | 基于atr-ftir的马蔺籽油质量评价方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yin et al. | A review of the application of near-infrared spectroscopy to rare traditional Chinese medicine | |
Li et al. | Quality control of Lonicerae Japonicae Flos using near infrared spectroscopy and chemometrics | |
CN1403822A (zh) | 中药生产工艺中产品质量指标在线检测 | |
Wu et al. | Rapid determination and origin identification of total polysaccharides contents in Schisandra chinensis by near-infrared spectroscopy | |
CN109297929B (zh) | 一种利用近红外技术建立丹参饮片质量分级的方法 | |
CN104048941A (zh) | 采用近红外光谱快速测定麦冬中多指标性成分含量的方法 | |
Meng et al. | Discrimination and content analysis of fritillaria using near infrared spectroscopy | |
CN113029999B (zh) | 一种姜科中药配方颗粒的近红外光谱鉴别模型构建方法和鉴别方法 | |
Chen et al. | Rapid and automatic chemical identification of the medicinal flower buds of Lonicera plants by the benchtop and hand-held Fourier transform infrared spectroscopy | |
CN108051396B (zh) | 一种心可舒片有效成分含量的快速检测方法 | |
CN112595692A (zh) | 一种水果总糖含量预测模型的建立方法及水果总糖含量的预测方法 | |
Li et al. | Manufacturer identification and storage time determination of “Dong’e Ejiao” using near infrared spectroscopy and chemometrics | |
CN112414967A (zh) | 一种快速实时检测蒲黄炭炮制的近红外质控方法 | |
CN112666119A (zh) | 基于太赫兹时域光谱技术的人参道地性检测方法及系统 | |
Yang et al. | Determination of sugar content in Lingwu jujube by NIR–hyperspectral imaging | |
Fan et al. | Quality assessment of Fritillariae cirrhosae using portable NIR spectrometer | |
Zhao et al. | Geographic origin identification and rapid determination of four constituents of Gentiana rigescens by FTIR combined with chemometrics | |
CN107271396A (zh) | 一种茶叶中总黄酮含量的快速检测方法 | |
CN113324940A (zh) | 特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的光谱分级方法 | |
CN110726695A (zh) | 小鼠脑组织不同部位天麻素近红外光谱特异性识别方法 | |
CN102106888B (zh) | 一种中药杏香兔耳风提取过程质量控制方法 | |
CN114550843A (zh) | 中药多糖中单糖组成及含量的预测模型及其构建方法和应用 | |
CN114486798B (zh) | 一种快速预测蕨菜中总黄酮含量的方法 | |
CN114550843B (zh) | 中药多糖中单糖组成及含量的预测模型及其构建方法和应用 | |
WO2023123329A1 (zh) | 近红外光谱的净信号提取方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |