发明内容
本发明提出一种基于激光诱导击穿光谱的中药重金属定量检测方法及系统,有效减少其他因素对光谱数据定量建模的干扰,高效实现了对重金属元素的定量检测。
为达到上述目的,本发明的技术方案是这样实现的:
一种基于激光诱导击穿光谱的中药重金属定量检测方法,包括:
S1、将中药粉末压制成压片,作为待测样品;
S2、利用激光诱导击穿光谱系统进行所述压片的光谱数据采集,建立样品的原始光谱数据;
S3、将原始光谱数据进行预处理以及变量筛选,完成光谱处理;
S4、将处理后的光谱数据作为校正集光谱数据,结合样品的真实重金属元素含量,采用偏最小二乘回归法建立校正模型,获取中药重金属元素含量的最优预测模型。
进一步的,步骤S2所述原始光谱数据包括:每个压片采集80个光谱,计算得到的80个数据的平均值作为此压片的原始光谱数据。
进一步的,步骤S3的具体过程包括:
S301、对原始光谱数据通过多元散射校正、标准正态变量预处理方法进行处理;
S302、通过建立偏最小二乘回归模型确立最优预处理方法后,再分别采用连续投影算法、最小收缩和选择算子、投影变量重要性以及竞争自适应重加权法四种变量选择算法进行变量筛选,筛选出与被测元素密切相关的变量,完成光谱处理。
进一步的,步骤S4中,所述样品的真实重金属元素含量的获取方法为:通过电感耦合等离子体质谱法测定样品中的重金属元素,得到样品重金属元素含量真实值。
本发明另一方面还提出了一种基于激光诱导击穿光谱的中药重金属定量检测系统,包括:
样品模块,用于将中药粉末压制成压片,作为待测样品;
原始光谱数据模块,用于利用激光诱导击穿光谱系统进行所述压片的光谱数据采集,建立样品的原始光谱数据;
预处理及筛选模块,用于将原始光谱数据进行预处理以及变量筛选,完成光谱处理;
模型模块,用于将处理后的光谱数据作为校正集光谱数据,结合样品的真实重金属元素含量,采用偏最小二乘回归法建立校正模型,获取中药重金属元素含量的最优预测模型。
进一步的,所述原始光谱数据模块包括:每个压片采集80个光谱,计算得到的80个数据的平均值作为此压片的原始光谱数据。
进一步的,所述预处理及筛选模块包括:
预处理单元,用于对原始光谱数据通过多元散射校正、标准正态变量预处理方法进行处理;
筛选单元,通过建立偏最小二乘回归模型确立最优预处理方法后,再分别采用连续投影算法、最小收缩和选择算子、投影变量重要性以及竞争自适应重加权法四种变量选择算法进行变量筛选,筛选出与被测元素密切相关的变量,完成光谱处理。
进一步的,所述模型模块包括真实含量单元;
所述真实含量单元通过电感耦合等离子体质谱法测定样品中的重金属元素,得到样品重金属元素含量真实值。
与现有技术相比,本发明具有如下的有益效果:
1、本发明提出一种基于激光诱导击穿光谱的中药重金属定量检测技术,结合了预处理法、变量选择方法和偏最小二乘法,从高维多变量的激光诱导击穿光谱数据中选择最佳变量,有效减少其他因素对光谱数据定量建模的干扰,高效实现了对重金属元素的定量检测;
2、本发明可以避免重金属元素检测中现有的方法需要复杂的前处理,昂贵的化学与分析试剂,耗时长,实验操作繁琐等缺点,实现快速、操作简便、对样品破坏性小的检测中药中重金属元素的含量。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
为使本发明专利的目的、特征更明显易懂,下面结合附图对本发明专利的具体实施方式作进一步的说明。需说明的是,附图均采用非常简化的形式且均使用非精准的比率,仅用以方便、明晰地辅助说明本发明专利实施例的目的。
下面所述实施例中,基于激光诱导击穿光谱(Laser-Induced BreakdownSpectroscopy,以下简称LIBS)采集待测中药样品的光谱信息数据。
LIBS系统通过使用高能量激光聚焦照射到待测样品表面,形成等离子体原子发射光谱,利用高灵敏度光谱仪采集到的光谱可以对样品中包含的元素进行定性与定量分析。此仪器快速,操作简便,对样品破坏性小。因此适用于检测中药重金属元素含量。
如图1所示,本发明实施例中使用的LIBS系统包括:放置中药样品的三维移动工作台5;通过反射镜3和透镜4使用高能量激光聚焦照射到待测样品表面的激光器2;与激光器2连接的光谱仪8;所述光谱仪8通过光纤7连接信号采集器6;所述光谱仪8还连接计算机1。
其中,所述激光器2可以为YAG脉冲激光器(Nano SG150-10.,Litron lasersLtd.,UK);信号采集器6可以为线性电荷耦合器件(CCD)探测器(SonyIL511B,OceanOptics,USA);光谱仪8可以为多通道光谱仪(MX2500+,Ocean Optics,USA);三维移动工作台5可以为三维(X-Y-Z)运动平台(Ocean Optics,USA);计算机1为一台装有MaxLIBS软件(版本1.6.7,海洋光学)的计算机来控制硬件并获取LIBS数据;激光波长为1064nm,激光能量为100mJ,延迟时间为2us,脉冲重复频率为10Hz。
本发明提出的基于激光诱导击穿光谱的中药重金属定量检测方法如图2所示,包括以下步骤:
101:制作待测样品:
取待测中药粉末样品0.4g,经过压片机在1000MPa下压制5min制成直径13mm,高2mm的样品圆形压片。
102:样品光谱的建立:
利用如图1所示的LIBS(激光诱导击穿光谱)系统进行中药压片的光谱数据采集,其中,激光器的激光波长为1064nm,激光能量为100-150mJ;延迟时间为2us,光纤光谱仪的波长响应范围为180~1100nm。所制压片每个片剂采集80个光谱,计算得到的80个数据的平均值作为此片剂的光谱信息数据。
103:样品真实重金属元素含量的测定:
采用2020版《中国药典》四部通则中电感耦合等离子体质谱法测定中药中的重金属元素,得到样品重金属元素含量真实值。
104:数据预处理及变量筛选:
LIBS光谱技术虽然具有快速、操作简便、对样品破坏性小等优点,但由于其原理是检测基于激光和样品产生的等离子体的光谱信息,因此其存在一定的基体效应、背景噪声等其他外界因素的影响。这些光谱干扰可能会使LIBS光谱的谱峰变宽,故而由于中心偏移造成点与点之间谱峰波长的偏移,从而影响LIBS的校正性能,使LIBS光谱难以应用在定量检测当中。
本发明实施例针对LIBS光谱存在的这种问题,引入不同光谱预处理方法用于减弱这些外界因素造成的光谱影响,进而增强光谱信号。通过针对每个元素找出最优的预处理方法后,针对全谱图采用不同的特征变量选择方法进行变量筛选,以筛选出与检测元素密切相关的波长变量来建立校准模型。
具体为将原始光谱数据分别经过多元散射校正、标准正态变量方法处理得到预处理后的数据(目的是为了分别执行建模,对比这两种不同预处理方法建模的好坏。选出最优的处理方法),其中多元散射校正算法主要是先通过计算出原始LIBS光谱数据的平均光谱,再将原始LIBS光谱与所求得的平均光谱之间进行线性回归,根据线性回归参数进行光谱校正计算;而标准正态变量算法通过单个样本光谱的标准偏差来修正光谱的变化,具体为从原始光谱中减去该条光谱的平均值再除以标准偏差,将原始每条LIBS光谱标准为零均值、单位方差的量;
将经上述两种预处理后的数据分别作为输入变量,各自建立定量模型,模型由偏最小二乘回归法进行建立;偏最小二乘回归法为一种统计学方法,通过多元线性模型将预测变量和观测变量关联起来,在多重线性的情况下对数据进行建模;建模前采用分层随机抽样法按校正集:预测集=2:1的比例划分数据集,将校正集输入模型中采用蒙特卡洛交叉验证法确定潜变量个数,偏最小二乘回归建模中校正过程进行了1000次,每次校正抽取80%校正集做测试,剩余做验证,得到校正模型。最终将预测集输入校正模型中,通过所获得评价指标值(预测值与实际值的均方根误差RMSEP和决定系数R2)确立两种方法中的最优预处理方法。
再将经所述最优预处理方法处理后的数据作为变量,分别采用连续投影算法(利用向量投影分析的方法寻找含最低限度的冗余信息变量组,使得向量间的共线性达到最小)、最小收缩和选择算子(通过生成一个惩罚函数对变量系数进行压缩,在约束条件下使残差平方和最小化,选出残差平方和最小变量组)、投影变量重要性(根据偏最小二乘回归算法评估各个变量的重要性,选取VIP值大于等于1的变量组)以及竞争自适应重加权法(主要选取偏最小二乘模型中回归系数绝对值较大的波长点。采用交叉验证的方法,选取均方根误差最小的子集作为变量组)四种变量选择算法进行变量筛选,筛选出与被测元素密切相关的变量,完成光谱处理;将已经经过上述光谱处理的所有样品数据进行随机分配,从而建立校正集和预测集,为后续建立预测模型做准备。
105:检测元素特征谱线确定:
针对测量不同元素,根据National InstituteofStandards and Technology(NIST)的原子光谱数据库(ASD)找到中药检测谱图中待测元素的特征谱线,确定样品中待测元素存在的真实性,便于与特征变量筛选出的波段进行对比参考,通常待测元素特征谱线对于其含量预测具有较大贡献。
106:建立校正模型:
将处理后的校正集光谱数据,结合已知的重金属元素含量,采用偏最小二乘回归法(PLSR)建立校正模型,再将预测集样本数据输入校正模型中,利用校正集和预测集样本,分别计算校正集和预测集的均方根误差(RMSEP)和决定系数(R2)评估模型效果。一个优秀的重金属的定量预测模型应满足RMSEP应尽量小和R2应尽量大的原则。具体采用PLSR建立最优预测模型的步骤为:建模前样本数据集划分、数据处理,样本数据集输入,建立回归模型,估计主成分个数,通过蒙特卡洛交叉验证法确定提取主成分数量,最后基于提取的主成分个数进行回归分析,得出RMSEP、R2等其他模型指标值,进行模型优劣评价。
107:选择最优预测模型:
以最小均方根误差和最优决定系数原则,通过对比基于不同变量选择方法建立的PLSR模型的结果,确定每种元素的最优预测模型。
108:未知样品的中药重金属元素含量测定:
如上述步骤101和102所述,采集到待测中药样品的光谱数据后,使用步骤104进行光谱处理后输入到最优预测模型中,进行快速测定,即得到中药样品中的重金属元素含量。
其中,上述光谱数据预处理、建模及预测均在Matlab软件上操作。
综上所述,本发明实施例通过上述步骤可以避免重金属元素检测中现有的方法需要大量样本,检测前处理时间长,实验复杂等缺点,实现快速、大量、操作简便的检测中药中重金属元素的含量。
实施例1:
实施例1是应用本发明所述方法对中药百合进行重金属定量检测。
201:对待测百合样品进行取样,压片制样,获得待测百合片状样品;
具体地,获取待测百合样本,从制药公司购买百合300g,其中每100g百合饮片模拟一种重金属进行污染,最终得到每种重金属元素具有五种不同浓度的百合饮片。百合饮片在90℃的干燥箱中干燥10小时后使用粉碎机粉碎。每个压片取65目筛的待测样品粉末0.4g,经过压片机在1000MPa压制5min而成。为增大样本数据集,减小误差,每种浓度制得片剂15片。最后获得225个直径13mm,高2mm的百合样品压片。
202:采集待测百合样品的LIBS光谱信息数据;
具体的,基于激光诱导击穿光谱(Laser-Induced Breakdown Spectroscopy,以下简称LIBS)采集待测百合样品的光谱信息数据。
LIBS系统激光波长为1064nm,激光能量为100mJ,延迟时间为2us,脉冲重复频率为10Hz。系统中的光谱仪8波长响应范围为180~1100nm,所制每个百合片剂采集80个点,计算得到的80个数据的平均值作为所述光谱信息数据。
203:待测样品真实重金属含量测定;
采用2020版《中国药典》四部通则中电感耦合等离子体质谱法测定百合待测样品中的重金属元素,得到样品重金属元素含量真实值。
204:根据本发明所述方法中的步骤104的具体技术方案,进行数据预处理,并挑选相关变量,删除无关变量;
具体地,分别采用多元散射校正、标准正态变量两种方法进行光谱数据预处理,经过对比选出最优的预处理方法后,再分别采用连续投影算法、最小收缩和选择算子、投影变量重要性以及竞争自适应重加权法四种变量选择算法分别进行变量筛选,筛选出与被测的三种重金属元素密切相关的变量。
将已经过上述光谱预处理的样品数据进行分组。其中,每个重金属元素挑选55个样品作校正集,用来建立校正模型。剩余25个样品作为预测集,用于检验校正模型优劣。
205:根据ASD数据库确认检测元素的特征波段;
具体地,参考National Institute of Standards and Technology(NIST)的原子发射光谱数据库(Atomic Spectra Database,ASD),图3的光谱图中可见样品中可以被检测出的相应地百合的铜、铅、锌元素的原子发射谱峰。
206:根据处理后光谱建立校正模型;
具体地,将经过204步骤获得的校正集样品数据与对应的重金属元素的含量相结合,采用偏最小二乘回归法(PLSR)建立校正模型。利用预测集检验校正模型的优劣;
具体地,校正模型建立好之后,使用经过204步骤获得的预测集样品数据,输入206获得的校正模型,从而得到模型预测值。通过计算预测值与真实值的均方根误差(RMSEP)和决定系数(R2)进行模型评估。
207:建立最优预测模型;
以最小均方根误差和最大决定系数原则,在经过最优预处理方法处理过后,通过对比基于不同变量选择方法建立的PLSR模型的结果,确定每种元素的最优预测模型。最终经过比较,百合样品中三种重金属元素的最优检测模型均为经标准正态变量预处理和最小收缩和选择算子变量筛选后建立的PLSR预测模型。
208:获得未知百合样品的三种重金属铜、铅、锌元素含量。
具体地,将未知样品按照201-204步骤进行处理后,将其处理后光谱输入207的最优预测模型,进行快速测定,即得到百合样品中重金属元素含量。
其中,上述光谱数据预处理、建模及预测均在Matlab软件上操作。
综上所述,本发明实施例通过上述步骤201-步骤208可以避免中药重金属元素检测中需要大量样本、前处理复杂、耗时久等缺点,实现了快速、绿色、操作简便、对样品破坏小的检测百合中重金属元素的含量。
图3是本实施例1中使用激光诱导击穿光谱获得的百合中三种重金属元素的平均谱图以及对应检测出的特征谱线。
图4为本实施例1中利用不同变量选择方法建立的百合中三种不同重金属元素的PLSR定量预测模型中选择出的最佳预测模型的结果(其中Rc2为校正集的决定系数,RMSEC为校正集均方根误差;Rp2为预测集决定系数,RMSEP为预测集均方根误差,RPD为剩余预测偏差)。基于标准正态变量和最小收缩和选择算子处理后建立的PLSR定量模型预测效果最佳。该最优预测模型可以很好的分别预测百合中这三种重金属元素的含量。
实施例2:
实施例2是应用本发明所述方法对中药赤芍进行重金属定量检测。
301:对待测赤芍样品进行取样,压片制样,获得待测赤芍片状样品;
具体地,获取待测赤芍样本,从制药公司购买赤芍600g。其中每200g赤芍饮片模拟一种重金属污染。最终得到每种重金属元素具有五种不同浓度的赤芍饮片。赤芍饮片在90℃的干燥箱中干燥8小时后使用粉碎机粉碎。每个压片取65目筛的待测样品粉末0.4g,经过压片机在1000MPa压制5min而成。为增大样本数据集,减小误差,每种浓度制得片剂15片。最后赤芍获得225个直径13mm,高2mm的样品压片。
302:采集待测赤芍样品的LIBS光谱信息数据;
具体的,基于激光诱导击穿光谱(Laser-Induced Breakdown Spectroscopy,以下简称LIBS)采集待测赤芍样品的光谱信息数据。
LIBS系统激光波长为1064nm,激光能量为100mJ,延迟时间为2us,脉冲重复频率为10Hz。系统中的光谱仪8波长响应范围为180~1100nm,所制每个赤芍片剂采集80个点,计算得到的80个数据的平均值作为所述光谱信息数据。
303:待测赤芍样品真实重金属含量测定;
采用2020版《中国药典》四部通则中电感耦合等离子体质谱法测定赤芍待测样品中的重金属元素,得到样品重金属元素含量真实值。
304:利用算法进行数据预处理,并挑选相关变量,删除无关变量;
算法方案参见本发明所述方法的步骤104;具体地,分别采用多元散射校正、标准正态变量两种方法进行光谱数据预处理,经过对比选出最优的预处理方法后,再分别采用连续投影算法、最小收缩和选择算子、投影变量重要性以及竞争自适应重加权法四种变量选择算法分别进行变量筛选,筛选出与被测的三种重金属元素密切相关的变量。
将已经过上述光谱预处理的样品数据进行分组。其中,每个重金属元素挑选55个样品作校正集,用来建立校正模型。剩余25个样品作为预测集,用于检验校正模型优劣。
305:根据ASD数据库确认检测元素的特征波段;
具体地,参考National Institute of Standards and Technology(NIST)的原子发射光谱数据库(Atomic Spectra Database,ASD),图5的光谱图中可见样品中可以被检测出的赤芍中含有的铜、铅、锌元素的原子发射谱峰。
306:根据处理后光谱建立校正模型;
具体地,将经过304步骤获得的校正集样品数据与对应的重金属元素的含量相结合,采用偏最小二乘回归法(PLSR)建立校正模型。利用预测集检验校正模型的优劣;
具体地,校正模型建立好之后,使用经过304步骤获得的预测集样品数据,输入306获得的校正模型,从而得到模型预测值。通过计算预测值与真实值的均方根误差(RMSEP)和决定系数(R2)进行模型评估。
307:建立最优预测模型;
以最小均方根误差和最大决定系数原则,在经过最优预处理方法处理过后,通过对比基于不同变量选择方法建立的PLSR模型的结果,确定每种元素的最优预测模型。最终经过比较,赤芍样品中三种重金属元素的最优检测模型均为经标准正态变量预处理和最小收缩和选择算子变量筛选后建立的PLSR预测模型。
308:获得未知赤芍样品的三种重金属铜、铅、锌元素含量。
具体地,将未知样品按照301-304步骤进行处理后,将其处理后光谱输入307的最优预测模型,进行快速测定,即得到赤芍样品中重金属元素含量。
其中,上述光谱数据预处理、建模及预测均在Matlab软件上操作。
综上所述,本发明实施例通过上述步骤301-步骤308可以避免中药重金属元素检测中需要大量样本、前处理复杂、耗时久等缺点,实现了快速、绿色、操作简便、对样品破坏小的检测赤芍中重金属元素的含量。
图5是本实施例2中使用激光诱导击穿光谱获得的赤芍中三种重金属元素的平均谱图以及对应检测出的特征谱线。
图6为本实施例2中利用不同变量选择方法建立的赤芍中三种不同重金属元素的PLSR定量预测模型中选择出的最佳预测模型的结果(其中Rc2为校正集的决定系数,RMSEC为校正集均方根误差;Rp2为预测集决定系数,RMSEP为预测集均方根误差,RPD为剩余预测偏差)。基于标准正态变量和最小收缩和选择算子处理后建立的PLSR定量模型预测效果最佳。该最优预测模型可以很好的分别预测赤芍中这三种重金属元素的含量。
本发明实施例1和实施例2详细的说明了使用基于激光诱导击穿光谱检测百合和赤芍中三种重金属元素含量的方法。此方法不仅可以应用于百合和赤芍,也可以应用于其他类植物中药以及其他重金属元素等等。
本发明实施例对各器件的型号除做特殊说明的以外,其他器件的型号不做限制,只要能完成上述功能的器件均可。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。