CN102313714B - 一种红花提取液测定方法 - Google Patents
一种红花提取液测定方法 Download PDFInfo
- Publication number
- CN102313714B CN102313714B CN 201110216270 CN201110216270A CN102313714B CN 102313714 B CN102313714 B CN 102313714B CN 201110216270 CN201110216270 CN 201110216270 CN 201110216270 A CN201110216270 A CN 201110216270A CN 102313714 B CN102313714 B CN 102313714B
- Authority
- CN
- China
- Prior art keywords
- model
- extract
- safflower
- sample
- solid content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 244000020518 Carthamus tinctorius Species 0.000 title claims abstract description 38
- 235000003255 Carthamus tinctorius Nutrition 0.000 title claims abstract description 38
- 239000007787 solid Substances 0.000 claims abstract description 32
- 239000002245 particle Substances 0.000 claims abstract description 30
- 238000002329 infrared spectrum Methods 0.000 claims abstract description 21
- 238000005457 optimization Methods 0.000 claims abstract description 14
- 238000003908 quality control method Methods 0.000 claims abstract description 12
- 238000005516 engineering process Methods 0.000 claims abstract description 10
- WLYGSPLCNKYESI-RSUQVHIMSA-N Carthamin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1[C@@]1(O)C(O)=C(C(=O)\C=C\C=2C=CC(O)=CC=2)C(=O)C(\C=C\2C([C@](O)([C@H]3[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O)C(O)=C(C(=O)\C=C\C=3C=CC(O)=CC=3)C/2=O)=O)=C1O WLYGSPLCNKYESI-RSUQVHIMSA-N 0.000 claims description 62
- 239000000523 sample Substances 0.000 claims description 36
- DYQVDISPPLTLLR-HJQYTNQXSA-N Carthamin Natural products CC[C@H]1O[C@H]([C@H](O)[C@@H](O)[C@@H]1O)[C@]2(O)C(=C(C=C/3C(=O)C(=C(O)[C@](O)([C@@H]4O[C@H](CO)[C@@H](O)[C@H](O)[C@H]4O)C3=O)C(=O)C=Cc5ccc(O)cc5)C(=O)C(=C2O)C(=O)C=Cc6ccc(O)cc6)O DYQVDISPPLTLLR-HJQYTNQXSA-N 0.000 claims description 31
- 241000208809 Carthamus Species 0.000 claims description 31
- TUJKJAMUKRIRHC-UHFFFAOYSA-N hydroxyl Chemical compound [OH] TUJKJAMUKRIRHC-UHFFFAOYSA-N 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 24
- 238000002386 leaching Methods 0.000 claims description 20
- 241000628997 Flos Species 0.000 claims description 18
- 238000005259 measurement Methods 0.000 claims description 14
- 238000001228 spectrum Methods 0.000 claims description 14
- 238000011156 evaluation Methods 0.000 claims description 13
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 12
- 101150061025 rseP gene Proteins 0.000 claims description 9
- 238000012937 correction Methods 0.000 claims description 8
- 238000000513 principal component analysis Methods 0.000 claims description 8
- 238000004611 spectroscopical analysis Methods 0.000 claims description 6
- 239000008213 purified water Substances 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims description 3
- 238000013210 evaluation model Methods 0.000 claims description 3
- 238000004128 high performance liquid chromatography Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 2
- 238000011835 investigation Methods 0.000 claims description 2
- 230000003287 optical effect Effects 0.000 claims description 2
- 239000013307 optical fiber Substances 0.000 claims description 2
- 238000000605 extraction Methods 0.000 abstract description 10
- 238000004458 analytical method Methods 0.000 abstract description 9
- 238000012706 support-vector machine Methods 0.000 abstract description 7
- 238000013213 extrapolation Methods 0.000 abstract description 3
- 125000002887 hydroxy group Chemical group [H]O* 0.000 abstract 3
- 230000006870 function Effects 0.000 description 18
- 239000000243 solution Substances 0.000 description 13
- 239000003814 drug Substances 0.000 description 7
- 238000010521 absorption reaction Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000003556 assay Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- IAVUBSCVWHLRGE-UXEKTNMQSA-N (6e)-2,5-dihydroxy-6-[(e)-1-hydroxy-3-(4-hydroxyphenyl)prop-2-enylidene]-2,4-bis[(2s,3r,4r,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]cyclohex-4-ene-1,3-dione Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1C(C(C(O)([C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)C1=O)=O)=C(O)\C1=C(/O)\C=C\C1=CC=C(O)C=C1 IAVUBSCVWHLRGE-UXEKTNMQSA-N 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- ZZMASNSDVDSYKO-UHFFFAOYSA-N hydroxysafflor yellow A Natural products OCC1OC(C(O)C(O)C1O)C2=C(O)C(O)(C3OC(CO)C(O)C(O)C3O)C(=O)C(=C2O)C(=O)C=Cc4ccc(O)cc4 ZZMASNSDVDSYKO-UHFFFAOYSA-N 0.000 description 3
- 238000010238 partial least squares regression Methods 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000005303 weighing Methods 0.000 description 2
- 206010002660 Anoxia Diseases 0.000 description 1
- 241000976983 Anoxia Species 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 208000035126 Facies Diseases 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 230000007953 anoxia Effects 0.000 description 1
- 208000026106 cerebrovascular disease Diseases 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 244000144992 flock Species 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012113 quantitative test Methods 0.000 description 1
- 239000013558 reference substance Substances 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 229940119485 safflower extract Drugs 0.000 description 1
- 239000002195 soluble material Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 208000010110 spontaneous platelet aggregation Diseases 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000003809 water extraction Methods 0.000 description 1
Images
Landscapes
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明提供一种红花提取液测定方法,将最小二乘支持向量机理论与近红外光谱技术相结合,利用粒子群优化算法对LS-SVM进行参数寻优,建立红花提取过程中含固量和羟基红花黄色素A的定量分析模型,实现对红花提取过程中含固量和羟基红花黄色素A浓度关键指标的快速测定。本发明基于粒子群优化的最小二乘支持向量机建立的模型具有稳定性好、预测准确度高、外推能力强等优点。与传统的分析方法相比,所建立的分析方法快速、有效,能用于红花提取过程中含固量和羟基红花黄色素A浓度的快速测定。本发明有利于提高红花提取过程的质量控制水平,保证产品质量稳定、可靠。本发明方法操作简单,模型预测能力强,稳定性高,具有很强的外推、泛化能力。
Description
技术领域
本发明属于近红外检测领域,具体涉及一种基于粒子群优化和最小二乘支持向量机算法的红花提取液快速测定方法。
背景技术
红花注射液主要成分为红花提取物(Carthamus tinctorius L.),具有抗凝、防栓、扩张血管和有效防治心脑血管疾病的作用。羟基红花黄色素A(Hydroxysafflor yellow A)是红花的主要活性成分,药理实验证明HSYA能明显提高缺氧耐受力,使冠脉扩张,增加冠脉流量,并有明显抑制血小板聚集作用。提取工艺是红花注射液生产过程的起点,直接关系到红花药材的利用率。目前,提取工艺的质量控制主要依靠经验和传统质量分析方法(HPLC等),耗时费力,故研究发展红花提取过程中关键质控指标的快速无损测定方法,有助于解决红花提取过程中关键控制指标的质量控制问题,对于中药工业技术进步和产品质量升级具有重大现实意义。
近红外(NIR)光谱技术作为一种快速无损的绿色分析技术,具有快速分析、样品处理简单、无需消耗试剂等特点。近年来,近红外光谱技术已经越来越多的被应用于中药研究,包括药材产地鉴别、有效组分含量测定和制药过程的在线检测和监控。使用近红外进行定量分析时必须建立定量校正模型。目前比较常用的近红外定量分析建模方法有偏最小二乘回归(PLSR)、人工神经网络(ANN)和支持向量机(SVM)等。SVM是建立在统计学习理论(SLT)基础上的一种机器学习算法,已在NIR光谱分析中得到广泛应用。最小二乘支持向量机(LS-SVM)是经典SVM的一种改进,两者的算法原理基本相同。给定训练数据集S={(xi,yi),xi∈Rn,yi∈R}l i=1,其中xi被称为第i个输入向量,yi被称为相应于xi的目标值,l为样本数目。回归问题的目标是确定最优函数f(x),使得f(x)能够以尽可能高的概率正确回归未知的输入向量。在SVM的理论中,回归函数f(x)具有如下的形式:
其中,C为正则化参数(惩罚因子),用于控制误差样本的惩罚程度,ξ为松弛因子。用拉格朗日法求解这个优化问题:
式中αi(i=1,2,...,l)为拉格朗日乘子。对应的KKT条件如下:
用最小二乘法求出回归系数αi和偏差b,得非线性预测模型:
影响LS-SVM模型性能的因素通常有两个,即核函数的参数取值和惩罚因子C的取值。本发明中使用的核函数为径向基(RBF)函数:
,其中: (σ为核宽度)(8)
粒子群优化算法(PSO),最早是由Eberhart和Kennedy于1995年提出的全局随机优化技术。受到人工生命的研究结果启发,粒子群算法的基本概念源于对鸟群捕食行为的研究。PSO中,每个优化问题的潜在解都是搜索空间中的一只鸟,称之为“粒子”。每个粒子都有自己的位置和速度(决定他们飞行的方向和距离)以及一个由被优化的函数决定的适应值。PSO初始化为一群随机粒子(随机解),在每一次迭代中,粒子通过跟踪两个极值更新自己。第一个就是粒子本身所找到的最优解,这个解称为个体极值(pbest)。另一个极值是整个种群目前找到的最优解,这个极值是全局极值(gbest)。本研究中,设定粒子群中包含l个粒子,粒子i(i∈{1,2,...,l})的信息可以用D维向量(即算法所优化的参数个数)表示,空间位置为xi=(xi l,...,xi d,...,xi D),速度为vi=(vi l,...,vi d,...,vi D),在找到pbest和gbest这两个最优解后,粒子根据式9和式10来更新自己的速度和位置。
其中,vi d(t)表示t时刻粒子i在d维空间的速度,xi d(t)表示t时刻粒子i在d维的空间位置。pi best,d(t)为单个粒子i在所优化的第d个参数中的历史最优解,gi best,d(t)是所有粒子在所优化的第d个参数中的历史最优解。c1和c2为加速因子,通常取值范围为(0,2)。r1和r2为两个(0,1)之间变化的相对独立的随机函数。ω为权重因子,其值非负,值的大小影响整体寻优能力。
在每一次迭代过程中,每个粒子都需要根据目标函数来计算其适应值大小,然后根据适应值来确定当前粒子最优位置pi best,d(t)及群体最优位置gi best,d(t),再通过式9和10调整各个粒子的速度及位置。其结束条件为迭代次数达到设定值或者群体迄今为止搜索到的最优位置满足预设最小适应值。设定最大迭代次数为100代,预设适应值为零。利用粒子群算法对LS-SVM模型的参数寻优,并以均方误差(MSE)作为目标函数。
在中药质量控制及生产应用领域,将近红外光谱技术应用于原药材、成品以及提取、浓缩、醇沉、层析等过程中关键指标的检测已有相关专利文献,如专利(专利申请号:200510130631.6,200810050095.2,201010125515.6,200910228468.5,201010577454.7)等,文献“丹参多酚酸盐柱层析过程的近红外光谱在线检测及质量控制”,“红花醇沉液浓缩除醇过程中多元质控指标的近红外快速检测”等。但是这些专利、文献采用的建模算法均为偏最小二乘回归,将基于粒子群优化的最小二乘支持向量机(PSO-LS-SVM)算法用于中药生产过程中关键指标的测定仍未见相关报道。
发明内容
本发明的目的在于提供一种基于粒子群优化和最小二乘支持向量机算法的红花提取液测定方法。应用该算法建立的模型能够快速准确的测定红花提取液中含固量和羟基红花黄色素A浓度。
本发明的目的是通过以下技术方案实现:(在以下步骤中,要求将用到的)
(1)红花提取液样品收集
红花药材(Carthamus tinctorius L.)加15倍量的水,提取时间为1小时,收集不同批次红花提取过程中的提取液样品,样品数目不少于80份。随机选择其中1~2批数据作为验证集,其余样品作为校正集参与建模;
(2)关键指标的测定
分别用高效液相色谱法(HPLC)或烘干称重法,测定红花提取液样品中的羟基红花黄色素A浓度和含固量;
(3)近红外光谱数据采集
采用透射法采集近红外光谱,扫描次数为32,分辨率为4cm-1,光纤透射式探头光程2mm,以空气为参比,扫描光谱范围为4500~12000cm-1;
(4)定量模型的建立
在建立校正模型之前,需要先对光谱进行波段选择和预处理,再通过主成分分析技术对光谱数据进行降维处理,得到红花提取液的特征光谱信息,采用PSO-LS-SVM算法建立近红外数据与含固量和羟基红花黄色素A浓度这两个质控指标的定量校正模型,并通过各模型评价指标考察模型性能,将验证集数据导入已建的校正模型,通过模型性能评价指标判断模型的稳定性和预测能力。
所述的预处理方法选择一阶导数法和Norris平滑法,分别用于消除基线漂移及噪音等。排除掉以下波段:4500~5400cm-1和6500~7500cm-1波段(“水峰”)、7500~12000cm-1波段(噪声较大,且没有显著的特征吸收)以及吸收度大于1.5的饱和吸收波段。最后采用5400~6500cm-1波段建立含固量和羟基红花黄色素A浓度的定量校正模型。初始化粒子数设置为100,PSO最大循环迭代数为100。对于PSO-LS-SVM建模算法,选择径向基(RBF)作为核函数。利用粒子群优化(PSO)算法对径向基核函数的正则化参数C和核函数宽度σ进行寻优,并选择均方误差(MSE)作为目标函数,其他参数设置:加速因子c1=c2=2,权重因子ω=0.5。模型性能评价指标包括:相关系数(R)、校正集均方差(RMSEC)、预测均方差(RMSEP)、相对偏差(RSEP)和相对分析误差(RPD)。当R值接近于1,RMSEC和RMSEP值较小而且互相接近时,说明模型的稳定性好、预测精准度高。此外,当RSEP值小于10%、RPD值大于3时认为模型具有较好的预测能力,可用于指标的定量控制。以下为模型性能评价指标的具体计算公式:
各式中Ci——传统分析方法测量值;
Cm——Ci均值;
n——建立模型用的校正集样本数;
m——用于检验模型的验证集样本数;
S.D.——校正集或验证集数据的标准偏差。
(5)未知样品中关键指标的快速测定
取未知含固量和羟基红花黄色素A浓度的红花提取液样品,按校正集样品相同近红外光谱采集参数采集样品的近红外光谱数据,选择相同的建模波段和光谱预处理方法,把特征光谱输入校正模型,便可快速计算得到提取液中含固量和羟基红花黄色素A浓度。
本发明将最小二乘支持向量机(LS-SVM)理论与近红外光谱技术相结合,利用粒子群优化(PSO)算法对LS-SVM进行参数寻优,建立红花提取过程中含固量和羟基红花黄色素A的定量分析模型。基于粒子群优化的最小二乘支持向量机(PSO-LS-SVM)模型具有稳定性好、预测准确度高、外推能力强等优点。与传统的分析方法相比,所建立的分析方法快速、有效,能用于红花提取过程中含固量和羟基红花黄色素A浓度的快速测定。
本发明将近红外光谱技术引入到中药提取过程,以中药材红花提取过程为例,采用PSO-LS-SVM算法,实现对红花提取过程中含固量和羟基红花黄色素A浓度关键指标的快速测定。本发明有利于提高红花提取过程的质量控制水平,保证产品质量稳定、可靠。本发明方法操作简单,模型预测能力强,稳定性高,具有很强的外推、泛化能力。
附图说明
附图1是红花提取过程中含固量的变化趋势。
附图2是红花提取过程中羟基红花黄色素A浓度的变化趋势。
附图3是红花提取过程中采集的原始近红外光谱。
附图4是近红外光谱和羟基红花黄色素A浓度的相关系数图。
附图5是含固量近红外预测值和实际测定值之间的相关图。
附图6是羟基红花黄色素A浓度近红外预测值和实际测定值之间的相关图。
附图7是红花提取过程含固量预测值与实际测定趋势对照图。
附图8是红花提取过程羟基红花黄色素A浓度预测值与实际测定趋势对。
具体实施方式
本发明结合附图和实施例作进一步的说明。
实施例1
1.红花提取液样品收集
称取红花药材200g,倒入三颈烧瓶内,加入15倍量(3000mL)纯化水,煎煮时间为1小时。煎煮前30min每隔2.5min收集一次提取液8mL,并补8mL纯化水。后30min每隔5min收集一次提取液8mL,并补8mL纯化水。重复7次不同批次红花药材的提取实验,共获得126个样品。随机选择其中一批数据作为验证集,其余6批样品作为校正集参与建模。
2.关键指标的测定
(1)含固量测定
称定烘干至恒重的扁形瓶(两次烘干后重量小于5mg)(X0),量取4mL提取液至扁形瓶,称重(X1),水浴蒸干,105℃烘5h,取出置干燥器内冷却30min,迅速称重(X2),
含固量(%)=(X2-X0)/(X1-X0)
红花提取过程中含固量的变化趋势见图1。
(2)羟基红花黄色素A的浓度测定
红花提取液样品于1500r/min高速离心机中离心10分钟后取上清液用于分析HSYA浓度。色谱条件:Agilent eclipse C18分析柱(250×4.6mm,5μm);甲醇-乙腈-0.7%磷酸溶液(v/v,26∶2∶72)为流动相;流速1mL/min;检测波长403nm;柱温40℃;进样量5μL。标准曲线绘制:精密称取羟基红花黄色素A对照品5.8mg,置10mL容量瓶中,使用流动相定容至刻度,梯度稀释后,分别进样分析。以浓度为横坐标,峰面积为纵坐标,绘制标准曲线。
红花提取过程中羟基红花黄色素A浓度的变化趋势见图2。
3.近红外光谱数据采集
使用ANTARIS傅立叶变换近红外光谱仪(美国Thermo Nicolet公司)采集红花提取液样品的近红外透射光谱图,波段范围为4500~12000cm-1,扫描次数为32次,分辨率为4cm-1。以空气为参比。
红花提取过程中采集到的原始近红外光谱见图3。
4.定量模型的建立
(1)建模波段选择和光谱预处理
由于红花采用水提法,水含有OH基,极性很强,在近红外谱区的1440nm(6944cm-1)和1940nm(5155cm-1)附近有很强的合频与倍频吸收谱带,形成两大“水峰”,即4500~5400cm-1和6500~7500cm-1光谱区间。在这两个波段内,其它各种物质分子的倍频与合频吸收相对较弱,因此对水溶液物质体系进行近红外吸收光谱分析时,应尽可能减少来自溶剂吸收的干扰。此外,吸收度大于1.5的波长区域属于饱和吸收,建模时不建议采用该区域内的信息,因此可用的波段只剩下5400~6500cm-1和7500~12000cm-1。而7500~12000cm-1区间的光谱存在较大的噪声,且没有显著的特征吸收。因此,本发明选择5400~6500cm-1波段用于含固量和羟基红花黄色素A浓度定量模型的建立。
将近红外光谱进行一阶导数处理能有效消除基线偏移,减少峰与峰之间的重叠并使有效信息显现出来,但与此同时导数的计算会引进噪音,降低信噪比,而平滑可以降低高频随机噪声。因此,本发明将一阶导数法和Norris平滑滤波结合使用对光谱数据进行预处理。为了保证光谱选择区域的准确性,本发明还对光谱和质控指标的相关系数进行了考察。以羟基红花黄色素A为例,其相关系数见图4,从图中可以看到相关系数大于0.6的光谱主要集中在所选择的光谱区域内。此外,对于含固量指标也有类似的相关结果。
(2)光谱数据降维处理
建立定量校正模型时,为减少计算量提高运算效率,本文采用主成分分析技术对光谱数据进行降维处理。使用留一交叉验证法,计算交叉验证均方差(RMSECV)和预测残差平方和(PRESS),以考察主成分数对模型性能的影响。结果表明,含固量和羟基红花黄色素A浓度模型的最佳主成分数分别为4和8,其累计总贡献率分别达到99.57%和99.75%,能够较好的反映原有光谱信息。因此,对于含固量和羟基红花黄色素A浓度模型,分别选择贡献率较大的前4和8个主成分数作为新变量输入模型。
(3)定量模型的建立
在5400~6500cm-1波段范围内,对校正集样品的光谱数据进行一阶导数和Norris平滑滤波预处理,再通过主成分分析技术进行降维,得到的特征光谱信息用于建立PSO-LS-SVM模型。其中,一阶导数、Norris平滑滤波、主成分降维和PSO-LS-SVM算法均通过Matlab(版本7.5,The MathWorks,Inc.,Natick,MA,USA)软件实现。
初始化粒子数设置为100,PSO最大循环迭代数为100。对于采用径向基核的最小二乘支持向量机,PSO需要的优化的参数是正则化参数C和核函数宽度σ,这两个参数在很大程度上决定了最小二乘支持向量机的学习和泛化能力,选择均方误差(MSE)作为目标函数。其他参数设置:c1=c2=2,ω=0.5。因此粒子更新自己速度和位置的公式变为:
利用粒子群算法搜索到的最优的LS-SVM参数:C=2636861.4,σ=348.7(含固量模型);C=7127948.6,σ=118.2(羟基红花黄色素A浓度模型)。将验证集数据导入已建的校正模型,通过各模型评价指标评价模型的预测能力。模型评价指标包括:相关系数(R)、校正集均方差(RMSEC)、预测均方差(RMSEP)、相对偏差(RSEP)和相对分析误差(RPD)。模型性能评价指标的具体计算公式:
各式中Ci——传统分析方法测量值;
Cm——Ci均值;
n——建立模型用的校正集样本数;
m——用于检验模型的验证集样本数;
S.D.——校正集或验证集数据的标准偏差。
表1为参数优化后PSO-LS-SVM模型的校正和验证结果比较。从表1中可以看出,PSO-LS-SVM模型的校正集和验证集相关系数均大于0.993,RMSEC和RMSEP值相近且小于0.074,RPD值均大于6.26,RSEP值也都能控制在5.7%以内。PSO-LS-SVM模型的校正和验证结果相近,泛化能力强,具有较好的预测能力和模型稳定性。图5是含固量近红外预测值和实际测定值之间的相关图,图6是羟基红花黄色素A近红外预测值和实际测定值之间的相关图。
表1优化后PSO-LS-SVM模型的校正和验证结果比较
5.未知样品中关键指标的快速测定
将所建模型用于预测红花提取过程中的未知样品,预测结果如表2所示。通过对比校正集、验证集和未知样品集的各模型评价指标值可以看出,PSO-LS-SVM模型具有较高的预测准确度。含固量和羟基红花黄色素A模型的RMSEP值和RPD值均与校正集和验证集结果相似,并且RMSEP值小于2倍RMSEC,RPD值大于8.06,RSEP值也都控制在5.84%以内。采用PSO-LS-SVM模型预测未知样品集中含固量和羟基红花黄色素A浓度,参见图7和图8,含固量和羟基红花黄色素A的近红外预测趋势与实际测定值的变化趋势基本一致。
表2未知样品集PSO-LS-SVM模型的评价指标
本发明提出的基于粒子群优化和最小二乘支持向量机算法的红花提取液快速测定方法。结果表明,运用PSO-LS-SVM算法建立定量模型,近红外光谱分析技术可以对提取过程中各关键指标进行快速分析。本方法省时、无损,提高生产效率,反映提取过程成分变化,为中药制药过程的质量控制提供新的方法。
Claims (3)
1.一种红花提取液测定方法,其特征在于,通过以下步骤实现:
(1)红花提取液样品收集
取红花加15倍量的水,煎煮时间为1小时,煎煮前30 分钟每隔2.5分钟收集一次提取液8 mL,并补8 mL纯化水,后30 分钟每隔5 分钟收集一次提取液8 mL,并补8 mL纯化水,收集不同批次红花提取过程中的提取液样品,样品数目不少于80份,随机选择其中1~2批数据作为验证集,其余样品作为校正集参与建模;
(2)关键指标的测定
用高效液相色谱法和烘干称重法,分别测定红花提取液样品中的羟基红花黄色素A浓度和含固量;
(3)近红外光谱数据采集
采用透射法采集近红外光谱,扫描次数为32,分辨率为4 cm-1,光纤透射式探头光程2 mm,以空气为参比,扫描光谱范围为4500~12000 cm-1;
(4)定量模型的建立
选择合适的光谱预处理方法,并选择5400~6500 cm-1光谱区域作为建模波段,再通过主成分分析技术对光谱数据进行降维处理,得到红花提取液的特征光谱信息,采用PSO-LS-SVM算法建立近红外光谱数据与含固量和羟基红花黄色素A浓度这两个质控指标的定量校正模型,并通过各模型性能评价指标考察模型性能,将验证集数据导入已建的校正模型,通过模型性能评价指标判断模型的稳定性和预测能力;其中模型性能评价指标为:相关系数R、校正集均方差RMSEC、预测均方差RMSEP、相对偏差RSEP和相对分析误差RPD,当R值接近于1,RMSEC和RMSEP值较小而且互相接近时,评价模型稳定性好、预测精准度高;当RSEP 值小于10%、RPD值大于3时评价模型具有较好的预测能力,可用于指标的定量控制;
(5)未知样品中关键指标的快速测定
取未知含固量和羟基红花黄色素A浓度的红花提取液样品,按校正集样品相同近红外光谱采集参数采集样品的近红外光谱数据,选择相同的建模波段和光谱预处理方法,把特征光谱输入校正模型,便可快速计算得到提取液中含固量和羟基红花黄色素A浓度。
2.根据权利要求1所述的一种红花提取液测定方法,其特征在于,步骤(4)所述的预处理方法选择一阶导数法和Norris平滑法,分别用于消除基线漂移及噪音。
3.根据权利要求1所述的一种红花提取液测定方法,其特征在于,步骤(4)初始化粒子数设置为100,PSO最大循环迭代数为100,对于PSO-LS-SVM建模算法,选择径向基作为核函数,利用粒子群优化算法对径向基核函数的正则化参数C和核函数宽度σ进行寻优,选择均方误差作为目标函数,确定含固量模型和羟基红花黄色素A浓度模型的最佳C、σ值;其他参数设置为:加速因子c 1 =c 2 =2,权重因子ω=0.5。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110216270 CN102313714B (zh) | 2011-09-21 | 2011-09-21 | 一种红花提取液测定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110216270 CN102313714B (zh) | 2011-09-21 | 2011-09-21 | 一种红花提取液测定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102313714A CN102313714A (zh) | 2012-01-11 |
CN102313714B true CN102313714B (zh) | 2013-04-03 |
Family
ID=45427071
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110216270 Expired - Fee Related CN102313714B (zh) | 2011-09-21 | 2011-09-21 | 一种红花提取液测定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102313714B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104977271B (zh) * | 2014-04-08 | 2018-07-03 | 天津红日药业股份有限公司 | 一种红花醇沉过程有效成分近红外在线检测方法 |
US10101269B2 (en) * | 2014-07-30 | 2018-10-16 | Smiths Detection Inc. | Estimation of water interference for spectral correction |
CN104537228B (zh) * | 2014-12-23 | 2017-08-11 | 清华大学 | 基于残差熵和分层双支持向量机的玻璃窑炉温度预报方法 |
CN104819955B (zh) * | 2015-05-15 | 2017-06-16 | 华润三九医药股份有限公司 | 基于粒子群最小二乘支持向量机算法检测川芎方法及应用 |
CN110988153B (zh) * | 2019-11-13 | 2022-09-16 | 浙江中医药大学 | 基于ls-svm模型的丹参有效成分超声提取工艺优化方法 |
CN112067577A (zh) * | 2020-08-18 | 2020-12-11 | 武汉工程大学 | 基于支持向量机的奶油色素超标鉴别方法、装置及设备 |
CN112414962B (zh) * | 2020-12-14 | 2023-10-13 | 华润三九(雅安)药业有限公司 | 一种测定羟基红花黄色素a含量的方法 |
CN113588590B (zh) * | 2021-08-11 | 2024-04-16 | 苏州泽达兴邦医药科技有限公司 | 一种基于数据挖掘的中药提取过程质量控制方法 |
CN116793991B (zh) * | 2023-08-22 | 2023-11-10 | 青岛理工大学 | 一种基于近红外光谱和混合损失的谷氨酸浓度测量方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101780141A (zh) * | 2010-03-16 | 2010-07-21 | 浙江大学 | 一种近红外光谱测定丹参提取液中鞣质含量的方法 |
CN102028710A (zh) * | 2010-12-03 | 2011-04-27 | 浙江大学 | 一种测定华蟾素醇沉液中吲哚类生物碱含量的方法 |
CN102058682A (zh) * | 2009-11-17 | 2011-05-18 | 天津天士力现代中药资源有限公司 | 一种白芍提取液中的芍药苷含量的nir在线检测方法 |
-
2011
- 2011-09-21 CN CN 201110216270 patent/CN102313714B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102058682A (zh) * | 2009-11-17 | 2011-05-18 | 天津天士力现代中药资源有限公司 | 一种白芍提取液中的芍药苷含量的nir在线检测方法 |
CN101780141A (zh) * | 2010-03-16 | 2010-07-21 | 浙江大学 | 一种近红外光谱测定丹参提取液中鞣质含量的方法 |
CN102028710A (zh) * | 2010-12-03 | 2011-04-27 | 浙江大学 | 一种测定华蟾素醇沉液中吲哚类生物碱含量的方法 |
Non-Patent Citations (6)
Title |
---|
CONTENT DETERMINATION BY PSO-BASED LS-SVM REGRESSION;X.C.Guo et. al.;《Proceedings of the Eighth International Conference on Machine Learning and Cybernetics》;20090715;第1043-1047页 * |
Dan Peng et. al..Least Squares-Support Vector Machine-Based Analysis of Near-Infrared Spectra with Techniques of Dimension Reduction and Parameter Optimization.《photonics and optoelectronic(SOPO)》.2010,第1-4页. |
Least Squares-Support Vector Machine-Based Analysis of Near-Infrared Spectra with Techniques of Dimension Reduction and Parameter Optimization;Dan Peng et. al.;《photonics and optoelectronic(SOPO)》;20100621;第1-4页 * |
X.C.Guo et. al..CONTENT DETERMINATION BY PSO-BASED LS-SVM REGRESSION.《Proceedings of the Eighth International Conference on Machine Learning and Cybernetics》.2009,第1043-1047页. |
近红外光谱快速测定红花逆流提取过程中羟基红花黄色素A的含量;陈雪英等;《分析化学》;20091031;第37卷(第10期);第1451-1456页 * |
陈雪英等.近红外光谱快速测定红花逆流提取过程中羟基红花黄色素A的含量.《分析化学》.2009,第37卷(第10期),第1451-1456页. |
Also Published As
Publication number | Publication date |
---|---|
CN102313714A (zh) | 2012-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102313714B (zh) | 一种红花提取液测定方法 | |
Zhu et al. | Rapid on-site identification of pesticide residues in tea by one-dimensional convolutional neural network coupled with surface-enhanced Raman scattering | |
CN102252992B (zh) | 一种对中药提取过程进行近红外在线检测方法 | |
CN101231274B (zh) | 近红外光谱快速测定山药中尿囊素含量的方法 | |
CN102621092B (zh) | 一种丹红注射液醇沉过程在线检测方法 | |
CN104792652A (zh) | 一种黄芪药材多指标快速检测方法 | |
CN104062256A (zh) | 一种基于近红外光谱的软测量方法 | |
CN109799207A (zh) | 基于近红外光谱分析的白芷中掺滑石粉的定量检测方法 | |
Zhu et al. | Wavelength selection of hyperspectral scattering image using new semi-supervised affinity propagation for prediction of firmness and soluble solid content in apples | |
Hu et al. | Optimization of quantitative detection model for benzoic acid in wheat flour based on CARS variable selection and THz spectroscopy | |
CN103293118A (zh) | 一种基于近红外光谱分析技术的潲水油鉴别方法 | |
Li et al. | Nondestructive detection of frying times for soybean oil by NIR-spectroscopy technology with Adaboost-SVM (RBF) | |
CN103969211A (zh) | 一种采用近红外光谱检测复方丹参片水分含量的方法 | |
Chen et al. | A hybrid optimization method for sample partitioning in near-infrared analysis | |
Pian et al. | A shallow convolutional neural network with elastic nets for blood glucose quantitative analysis using Raman spectroscopy | |
CN105758819A (zh) | 一种利用近红外光谱检测土壤的有机组分的方法 | |
CN106053384A (zh) | 一种青蒿金银花醇沉浓缩过程快速定量检测方法 | |
Haijun et al. | Predicting sandy soil moisture content with hyperspectral imaging | |
Zhao et al. | Determination of residual levels of procymidone in rapeseed oil using near-infrared spectroscopy combined with multivariate analysis | |
Dumancas et al. | A stacked regression ensemble approach for the quantitative determination of biomass feedstock compositions using near infrared spectroscopy | |
CN103760130B (zh) | 近红外光谱测定复方麝香注射液中吐温-80含量的方法 | |
CN104865322A (zh) | 一种栀子萃取液浓缩过程快速检测方法 | |
Sui et al. | A deep learning model designed for Raman spectroscopy with a novel hyperparameter optimization method | |
Sa et al. | Mid-infrared spectroscopy with an effective variable selection method based on mpa for glucose detection | |
Qiao et al. | Research on simultaneous detection of SSC and FI of blueberry based on hyperspectral imaging combined MS-SPA |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20120111 Assignee: LIAONING GOOD NURSE PHARMACEUT Assignor: Zhejiang University Contract record no.: 2014210000054 Denomination of invention: Determination method of carthamus tinctorius extract Granted publication date: 20130403 License type: Exclusive License Record date: 20140709 |
|
LICC | Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130403 |