CN107290297A - 一种基于自步学习的红外光谱定量分析方法及系统 - Google Patents
一种基于自步学习的红外光谱定量分析方法及系统 Download PDFInfo
- Publication number
- CN107290297A CN107290297A CN201710597983.5A CN201710597983A CN107290297A CN 107290297 A CN107290297 A CN 107290297A CN 201710597983 A CN201710597983 A CN 201710597983A CN 107290297 A CN107290297 A CN 107290297A
- Authority
- CN
- China
- Prior art keywords
- mrow
- sample
- msub
- minimum binary
- offset minimum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 100
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000004445 quantitative analysis Methods 0.000 title claims abstract description 23
- 239000013598 vector Substances 0.000 claims abstract description 220
- 239000011159 matrix material Substances 0.000 claims abstract description 90
- 238000012360 testing method Methods 0.000 claims abstract description 56
- 238000010606 normalization Methods 0.000 claims description 17
- 230000003595 spectral effect Effects 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 11
- 230000001351 cycling effect Effects 0.000 claims description 9
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 6
- 238000005303 weighing Methods 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000006467 substitution reaction Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 239000000126 substance Substances 0.000 description 5
- 238000005259 measurement Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 206010068052 Mosaicism Diseases 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004313 glare Effects 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 210000003739 neck Anatomy 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 210000003765 sex chromosome Anatomy 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种基于自步学习的红外光谱定量分析方法及系统,方法包括:S1、分别从标准样品的红外光谱数据和待测样品的红外光谱数据中提取出标准样品的红外光谱矩阵和待测样品的红外光谱矩阵,获取标准样品的浓度数据;S2、根据标准样品的红外光谱矩阵和标准样品的浓度数据,获取用于表示红外光谱矩阵与浓度数据之间关系的偏最小二乘权重向量;S3、根据偏最小二乘权重向量构建偏最小二乘预测模型,将待测样品的红外光谱矩阵输入偏最小二乘预测模型,计算得到待测样品的浓度数据。本发明的有益效果是:相对于现有的传统偏最小二乘算法,该方法具有更好的稳定性和泛化能力,具有较强的抗噪声能力。
Description
技术领域
本发明涉及红外光谱定量分析和化学计量学领域,特别涉及一种基于自步学习的红外光谱定量分析方法及系统。
背景技术
红外光谱技术是一种高效快速的现代分析技术,综合运用了计算机技术、光谱技术和化学计量学等多个学科的研究成果,以其独特的优势在农业、石油化工、医药等多个领域得到了日益广泛的作用。红外光谱具有丰富的结构和组成信息,能够准确反映不同分子结构对红外光的吸收程度,非常适合用于碳氢有机物质的组成性质(如物质的组分浓度)测量。随着化学计量学以及化学分析技术的飞速发展,偏最小二乘回归算法是红外光谱定量分析中最常用的方法,它是由S.Wold等人于1983年提出,主要用来解决化学计量学中变量共线性问题和高维小样本回归问题。在实际应用中,传统的偏最小二乘回归算法采用NIPALS算法实现,关键在于求解偏最小二乘权重向量。在模型训练阶段,NIPALS算法采用最小二乘法来求解偏最小二乘权重向量,求解得到的权重向量可在物质浓度向量和红外光谱矩阵之间建立定量关联关系。最小二乘法通常易受噪声和异常样本的影响,而红外光谱矩阵由红外光谱数据组成,红外光谱数据往往包含一些与待测样品性质无关的因素带来的干扰,如样品的状态、光的散射、杂散光及仪器响应等的影响,从而包含数据噪声或异常样本点。因此,基于最小二乘法的偏最小二乘权重向量的求解过程常常不稳定,从而导致红外光谱定量分析结果也不稳定。
发明内容
本发明提供了一种基于自步学习的红外光谱定量分析方法及系统,解决了现有技术的技术问题。
本发明解决上述技术问题的技术方案如下:
一种基于自步学习的红外光谱定量分析方法,包括:
S1、分别从标准样品的红外光谱数据和待测样品的红外光谱数据中提取出所述标准样品的红外光谱矩阵和所述待测样品的红外光谱矩阵,获取所述标准样品的浓度数据;
S2、根据所述标准样品的红外光谱矩阵和所述标准样品的浓度数据,获取用于表示红外光谱矩阵与浓度数据之间关系的偏最小二乘权重向量;
S3、根据所述偏最小二乘权重向量构建偏最小二乘预测模型,将所述待测样品的红外光谱矩阵输入所述偏最小二乘预测模型,计算得到所述待测样品的浓度数据。
本发明的有益效果是:本技术方案的输入为标准样品和预测样品的红外光谱数据,以及标准样品的浓度数据,输出为偏最小二乘预测模型和待测样品的浓度数据;在模型训练阶段中采用自步学习方法替代现有的最小二乘法,基于自步学习的偏最小二乘权重向量也能够有效地在浓度向量和红外光谱矩阵之间建立关联关系,能够很好的避免模型陷入局部最优;当红外光谱数据中含有噪声或异常样本点时,采用自步学习求解偏最小二乘权重向量,构建偏最小二乘预测模型,从而用于红外光谱定量分析,相对于现有的传统偏最小二乘算法,该方法具有更好的稳定性和泛化能力,能够更好的处理含有噪声和/或异常样本点的样本,具有较强的抗噪声能力。
在上述技术方案的基础上,本发明还可以做如下改进。
优选地,步骤S2包括:
S21、通过最小二乘法对所述标准样品的红外光谱矩阵和所述标准样品的浓度数据进行训练,构建偏最小二乘权重向量优化模型;
所述偏最小二乘权重向量优化模型的表达式为:
其中,X为标准样品的红外光谱矩阵X=[x1,x2,…xi…,xn]T,其中,n为标准样品的个数i∈{1,2,3…n},xi为第i个标准样品的光谱向量;y为标准样品的浓度数据对应的浓度向量y=[y1,y2,…yi…,yn]T,其中,yi为第i个标准样品对应的浓度值;w为偏最小二乘权重向量w=[w1,w2,…wj…,wd]T,d为光谱向量的特征维数,其中j∈{1,2,3…d};
S22、通过自步学习方法对所述偏最小二乘权重向量优化模型进行更新,得到基于自步学习的偏最小二乘权重向量优化模型,即自步学习模型;
所述自步学习模型的表达式为:
其中,L(yi,f(xi,w))为真实浓度值yi和估计浓度值f(xi,w)之间的平方损失,w为偏最小二乘权重向量;v为当前模型的样本权重向量v=[v1,v2,…vi…,vn]T,其中,vi∈[0,1]为第i个样本的权重值,用于衡量第i个样本的学习难易程度;R(v,λ)为当前模型的自步正则项,其中,λ为步长参数,用于改变参与当前模型学习的样本数目;
S23、根据所述自步学习模型获取偏最小二乘权重向量。
优选地,步骤S23包括:
S231、令自步正则项为线性软权重,则基于线性软权重的偏最小二乘权重向量优化模型的等价模型,即等价模型的表达式为:
其中,λ>0;
S232、将所述偏最小二乘权重向量w初始化为单位向量,并代入平方损失函数,得到样本损失的初始向量,将所述等价模型的步长参数λ初始化为所述样本损失的初始向量的中位数值;
S233、将所述偏最小二乘权重向量w代入等价模型Jlinear(w,v),优化样本权重向量v,得到如下公式(1),更新所述等价模型的样本权重向量v:
其中,vi∈[0,1];
S234,固定所述等价模型的样本权重向量v,并代入等价模型Jlinear(w,v),根据公式(2)更新所述偏最小二乘权重向量w;
w=(XTVX)-1XTVy (2)
其中,V为对角矩阵,其主对角线上的元素为Vii=vi;
S235,将更新后的所述偏最小二乘权重向量w代入平方损失函数,更新所述等价模型的样本损失向量,根据公式(3)更新所述自步正则项的步长参数λ;
λ=λ/μ (3)
其中,μ∈[0,1]为第一预设数值,用于表示初始学习的样本数量;
S236,将更新后的所述样本损失向量和所述步长参数作为输入,循环执行步骤S233至S236;
S237、当所述样本权重向量的元素均大于零或步骤S236执行的次数达到预设次数时,退出循环,输出最终的所述偏最小二乘权重向量。
优选地,步骤S3包括:
S31、将所述偏最小二乘权重向量代入公式(4)计算所述标准样品的主成分,并根据公式(5)对所述主成分进行归一化处理,根据公式(6)计算所述标准样品的浓度向量与归一化后的主成分的乘积;
t=Xw (4)
tG=t/(tTt) (5)
q=tG Ty (6)
其中,t为所述主成分,tG为所述归一化后的主成分,q为所述乘积;
S32、将所述归一化后的主成分代入公式(7)计算主成分向量对应的载荷向量;
p=XTtG (7)
其中,p为所述载荷向量;
S33、判断公式(8)是否成立,如是,则执行步骤S34,否则则根据公式(9)更新所述标准样品的红外光谱矩阵,并循环执行步骤S2和S3;
||X-tGpT||F<e (8)
X'=X-tGpT (9)
其中,||·||F为矩阵的弗罗贝尼乌斯范数,e为预设值,X'为更新后的所述标准样品的红外光谱矩阵;
S34、根据公式(10)构建偏最小二乘预测模型,将所述待测样品的红外光谱矩阵输入所述偏最小二乘预测模型,得到所述待测样品的浓度数据;
ynew=XnewW(PTW)-1Q (10)
其中,Xnew为所述待测样品的红外光谱矩阵,ynew为所述待测样品的浓度向量,W=[w1,w2,…,wr],P=[p1,p2,…,pr],Q=[q1,q2,…,qr],其中,r为执行步骤S2和S3的次数,w1,w2,…,wr分别为依次执行步骤S2输出的偏最小二乘权重向量,p1,p2,…,pr分别为依次执行步骤S31所获取的所述载荷向量,q1,q2,…,qr分别为依次执行步骤31所获取的所述乘积。
一种基于自步学习的红外光谱定量分析系统,包括:
提取模块,用于分别从标准样品的红外光谱数据和待测样品的红外光谱数据中提取出所述标准样品的红外光谱矩阵和所述待测样品的红外光谱矩阵,获取所述标准样品的浓度数据;
获取模块,用于根据所述标准样品的红外光谱矩阵和所述标准样品的浓度数据,获取用于表示红外光谱矩阵与浓度数据之间关系的偏最小二乘权重向量;
计算模块,用于根据所述偏最小二乘权重向量构建偏最小二乘预测模型,将所述待测样品的红外光谱矩阵输入所述偏最小二乘预测模型,计算得到所述待测样品的浓度数据。
优选地,所述获取模块包括:
构建子模块,用于通过最小二乘法对所述标准样品的红外光谱矩阵和所述标准样品的浓度数据进行训练,构建偏最小二乘权重向量优化模型;
所述偏最小二乘权重向量优化模型的表达式为:
其中,X为标准样品的红外光谱矩阵X=[x1,x2,…xi…,xn]T,其中,n为标准样品的个数i∈{1,2,3…n},xi为第i个标准样品的光谱向量;y为标准样品的浓度数据对应的浓度向量y=[y1,y2,…yi…,yn]T,其中,yi为第i个标准样品对应的浓度值;w为偏最小二乘权重向量w=[w1,w2,…wj…,wd]T,d为光谱向量的特征维数,其中j∈{1,2,3…d};
第一更新子模块,用于通过自步学习方法对所述偏最小二乘权重向量优化模型进行更新,得到基于自步学习的偏最小二乘权重向量优化模型,即自步学习模型;
所述自步学习模型的表达式为:
其中,L(yi,f(xi,w))为真实浓度值yi和估计浓度值f(xi,w)之间的平方损失,w为偏最小二乘权重向量;v为当前模型的样本权重向量v=[v1,v2,…vi…,vn]T,其中,vi∈[0,1]为第i个样本的权重值,用于衡量第i个样本的学习难易程度;R(v,λ)为当前模型的自步正则项,其中,λ为步长参数,用于改变参与当前模型学习的样本数目;
获取子模块,用于根据所述自步学习模型获取偏最小二乘权重向量。
优选地,所述获取子模块包括:
赋值单元,用于令自步正则项为线性软权重,则基于线性软权重的偏最小二乘权重向量优化模型的等价模型,即等价模型的表达式为:
其中,λ>0;
初始化单元,用于将所述偏最小二乘权重向量w初始化为单位向量,并代入平方损失函数,得到样本损失的初始向量,将所述等价模型的步长参数λ初始化为所述样本损失的初始向量的中位数值;
第一更新单元,用于将所述偏最小二乘权重向量w代入等价模型优化样本权重向量v,得到如下公式(1),更新所述等价模型的样本权重向量v:
其中,vi∈[0,1];
第二更新单元,用于固定所述等价模型的样本权重向量v,并代入等价模型Jlinear(w,v),根据公式(2)更新所述偏最小二乘权重向量w;
w=(XTVX)-1XTVy (2)
其中,V为对角矩阵,其主对角线上的元素为Vii=vi;
第三更新单元,用于将更新后的所述偏最小二乘权重向量w代入平方损失函数,更新所述等价模型的样本损失向量,根据公式(3)更新所述自步正则项的步长参数λ;
λ=λ/μ (3)
其中,μ∈[0,1]为第一预设数值,用于表示初始学习的样本数量;
循环单元,用于将更新后的所述样本损失向量和所述步长参数作为输入,循环调用所述第一更新单元至循环单元;
输出单元,用于当所述样本权重向量的元素均大于零或所述循环单元调用的次数达到预设次数时,退出循环,输出最终的所述偏最小二乘权重向量。
优选地,所述计算模块包括:
第一计算子模块,用于将所述偏最小二乘权重向量代入公式(4)计算所述标准样品的主成分,并根据公式(5)对所述主成分进行归一化处理;
t=Xw (4)
tG=t/(tTt) (5)
其中,t为所述主成分,tG为归一化后的主成分;
第二计算子模块,用于根据公式(6)计算所述标准样品的浓度向量与所述归一化后的主成分的乘积,将所述归一化后的主成分代入公式(7)计算主成分向量对应的载荷向量;
q=tG Ty (6)
p=XTtG (7)
其中,q为所述乘积,p为所述载荷向量;
判断子模块,用于判断公式(8)是否成立,如是,则执行步骤S34,否则则根据公式(9)更新所述标准样品的红外光谱矩阵,并循环调用所述获取模块和所述计算模块;
||X-tGpT||F<e (8)
X'=X-tGpT (9)
其中,||·||F为矩阵的弗罗贝尼乌斯范数,e为预设值,X'为更新后的所述标准样品的红外光谱矩阵;
第三计算子模块,用于根据公式(10)构建偏最小二乘预测模型,将所述待测样品的红外光谱矩阵输入所述偏最小二乘预测模型,计算得到所述待测样品的浓度数据;
ynew=XnewW(PTW)-1Q (10)
其中,Xnew为所述待测样品的红外光谱矩阵,ynew为所述待测样品的浓度向量,W=[w1,w2,…,wr],P=[p1,p2,…,pr],Q=[q1,q2,…,qr],其中,r为调用所述获取模块和所述计算模块的次数,w1,w2,…,wr分别为依次调用所述第一计算子模块输出的偏最小二乘权重向量,p1,p2,…,pr分别为依次调用所述第二计算子模块所获取的所述载荷向量,q1,q2,…,qr分别为依次调用所述第二计算子模块所获取的所述乘积。
附图说明
图1为本发明实施例提供的一种基于自步学习的红外光谱定量分析方法的流程示意图;
图2为本发明另一实施例提供的一种基于自步学习的红外光谱定量分析系统的结构示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,一种基于自步学习的红外光谱定量分析方法,包括:
S1、分别从标准样品的红外光谱数据和待测样品的红外光谱数据中提取出标准样品的红外光谱矩阵和待测样品的红外光谱矩阵,获取标准样品的浓度数据;
具体地,分别对标准样品和待测样品的红外光谱数据进行维数约减或波段选择,提取标准样品的红外光谱矩阵和待测样品的红外光谱矩阵,并获取标准样品的浓度数据。其中,对红外光谱数据进行维数约减或波段选择,有助于选择重要的变量,剔除无信息变量,降低红外光谱矩阵的维数,简化算法。
S2、根据标准样品的红外光谱矩阵和标准样品的浓度数据,获取用于表示红外光谱矩阵与浓度数据之间关系的偏最小二乘权重向量;
S3、根据偏最小二乘权重向量构建偏最小二乘预测模型,将待测样品的红外光谱矩阵输入偏最小二乘预测模型,计算得到待测样品的浓度数据。
应理解,该方法的输入为标准样品和预测样品的红外光谱数据,以及标准样品的浓度数据,输出为偏最小二乘预测模型和待测样品的浓度数据;在模型训练阶段中采用自步学习方法替代现有的最小二乘法,基于自步学习的偏最小二乘权重向量也能够有效地在浓度向量和红外光谱矩阵之间建立关联关系,能够很好的避免模型陷入局部最优;当红外光谱数据中含有噪声或异常样本点时,采用自步学习求解偏最小二乘权重向量,构建偏最小二乘预测模型,从而用于红外光谱定量分析,相对于现有的传统偏最小二乘算法,该方法具有更好的稳定性和泛化能力,能够更好的处理含有噪声和/或异常样本点的样本,具有较强的抗噪声能力。
具体地,步骤S2包括:
S21、通过最小二乘法对标准样品的红外光谱矩阵和标准样品的浓度数据进行训练,构建偏最小二乘权重向量优化模型;
偏最小二乘权重向量优化模型的表达式为:
其中,X为标准样品的红外光谱矩阵X=[x1,x2,…xi…,xn]T,其中,n为标准样品的个数i∈{1,2,3…n},xi为第i个标准样品的光谱向量;y为标准样品的浓度数据对应的浓度向量y=[y1,y2,…yi…,yn]T,其中,yi为第i个标准样品对应的浓度值;w为偏最小二乘权重向量w=[w1,w2,…wj…,wd]T,d为光谱向量的特征维数,其中j∈{1,2,3…d};
S22、通过自步学习方法对偏最小二乘权重向量优化模型进行更新,得到基于自步学习的偏最小二乘权重向量优化模型,即自步学习模型;
自步学习模型的表达式为:
其中,L(yi,f(xi,w))为真实浓度值yi和估计浓度值f(xi,w)之间的平方损失,w为偏最小二乘权重向量;v为当前模型的样本权重向量v=[v1,v2,…vi…,vn]T,其中,vi∈[0,1]为第i个样本的权重值,用于衡量第i个样本的学习难易程度;R(v,λ)为当前模型的自步正则项,其中,λ为步长参数,用于改变参与当前模型学习的样本数目;
S23、根据自步学习模型获取偏最小二乘权重向量。
应理解,在偏最小二乘权重向量优化模型中,采用自步学习方法替代现有的最小二乘法,即对传统的损失项赋予权重并引入自步正则项,能够迫使偏最小二乘权重向量自适应的在浓度向量和红外光谱矩阵之间的建立定量关联关系,有助于更准确的获取偏最小二乘权重向量。
根据不同的研究问题和不同特性的数据,采用的自步正则项形式,具体的公式和主要涉及参数如下:
硬权重:
线性软权重:
对数软权重:
混合权重:
具体地,步骤S23包括:
S231、令自步正则项为线性软权重,则基于线性软权重的偏最小二乘权重向量优化模型的等价模型,即等价模型的表达式为:
其中,λ>0;
S232、将偏最小二乘权重向量w初始化为单位向量,并代入平方损失函数,得到样本损失的初始向量,将等价模型的步长参数λ初始化为样本损失的初始向量的中位数值;
S233、将所述偏最小二乘权重向量w代入等价模型Jlinear(w,v),优化样本权重向量v,得到如下公式(1),更新所述等价模型的样本权重向量v:
其中,vi∈[0,1];
S234,固定所述等价模型的样本权重向量v,并代入等价模型Jlinear(w,v),根据公式(2)更新所述偏最小二乘权重向量w;
w=(XTVX)-1XTVy (2)
其中,V为对角矩阵,其主对角线上的元素为Vii=vi;
S235,将更新后的偏最小二乘权重向量w代入平方损失函数,更新等价模型的样本损失向量,根据公式(3)更新自步正则项的步长参数λ;
λ=λ/μ (3)
其中,μ∈[0,1]为第一预设数值,用于表示初始学习的样本数量;
S236,将更新后的样本损失向量和步长参数作为输入,循环执行步骤S233至S236;
S237、当样本权重向量的元素均大于零或步骤S236执行的次数达到预设次数时,退出循环,输出最终的偏最小二乘权重向量。
具体地,步骤S3包括:
S31、将偏最小二乘权重向量代入公式(4)计算标准样品的主成分,并根据公式(5)对主成分进行归一化处理,根据公式(6)计算标准样品的浓度向量与归一化后的主成分的乘积;
t=Xw (4)
tG=t/(tTt) (5)
q=tG Ty (6)
其中,t为主成分,tG为归一化后的主成分,q为乘积;
S32、将归一化后的主成分代入公式(7)计算主成分向量对应的载荷向量;
p=XTtG (7)
其中,p为载荷向量;
S33、判断公式(8)是否成立,如是,则执行步骤S34,否则则根据公式(9)更新标准样品的红外光谱矩阵,并循环执行步骤S2和S3;
||X-tGpT||F<e (8)
X'=X-tGpT (9)
其中,||·||F为矩阵的弗罗贝尼乌斯范数,e为预设值,X'为更新后的标准样品的红外光谱矩阵;
S34、根据公式(10)构建偏最小二乘预测模型,将待测样品的红外光谱矩阵输入偏最小二乘预测模型,得到待测样品的浓度数据;
ynew=XnewW(PTW)-1Q (10)
其中,Xnew为待测样品的红外光谱矩阵,ynew为待测样品的浓度向量,W=[w1,w2,…,wr],P=[p1,p2,…,pr],Q=[q1,q2,…,qr],其中,r为执行步骤S2和S3的次数,w1,w2,…,wr分别为依次执行步骤S2输出的偏最小二乘权重向量,p1,p2,…,pr分别为依次执行步骤S31所获取的载荷向量,q1,q2,…,qr分别为依次执行步骤31所获取的乘积。
如图2所示,一种基于自步学习的红外光谱定量分析系统,包括:
提取模块1,用于分别从标准样品的红外光谱数据和待测样品的红外光谱数据中提取出标准样品的红外光谱矩阵和待测样品的红外光谱矩阵,获取标准样品的浓度数据;
获取模块2,用于根据标准样品的红外光谱矩阵和标准样品的浓度数据,获取用于表示红外光谱矩阵与浓度数据之间关系的偏最小二乘权重向量;
计算模块3,用于根据偏最小二乘权重向量构建偏最小二乘预测模型,将待测样品的红外光谱矩阵输入偏最小二乘预测模型,计算得到待测样品的浓度数据。
具体地,获取模块2包括:
构建子模块21,用于通过最小二乘法对标准样品的红外光谱矩阵和标准样品的浓度数据进行训练,构建偏最小二乘权重向量优化模型;
偏最小二乘权重向量优化模型的表达式为:
其中,X为标准样品的红外光谱矩阵X=[x1,x2,…xi…,xn]T,其中,n为标准样品的个数i∈{1,2,3…n},xi为第i个标准样品的光谱向量;y为标准样品的浓度数据对应的浓度向量y=[y1,y2,…yi…,yn]T,其中,yi为第i个标准样品对应的浓度值;w为偏最小二乘权重向量w=[w1,w2,…wj…,wd]T,d为光谱向量的特征维数,其中j∈{1,2,3…d};
第一更新子模块22,用于通过自步学习方法对偏最小二乘权重向量优化模型进行更新,得到基于自步学习的偏最小二乘权重向量优化模型,即自步学习模型;
自步学习模型的表达式为:
其中,L(yi,f(xi,w))为真实浓度值yi和估计浓度值f(xi,w)之间的平方损失,w为偏最小二乘权重向量;v为当前模型的样本权重向量v=[v1,v2,…vi…,vn]T,其中,vi∈[0,1]为第i个样本的权重值,用于衡量第i个样本的学习难易程度;R(v,λ)为当前模型的自步正则项,其中,λ为步长参数,用于改变参与当前模型学习的样本数目;
获取子模块23,用于根据自步学习模型获取偏最小二乘权重向量。
具体地,获取子模块23包括:
赋值单元231,用于令自步正则项为线性软权重基于线性软权重的偏最小二乘权重向量优化模型的等价模型,即等价模型的表达式为:
其中,λ>0;
初始化单元232,用于将偏最小二乘权重向量w初始化为单位向量,并代入平方损失函数,得到样本损失的初始向量,将等价模型的步长参数λ初始化为样本损失的初始向量的中位数值;
第一更新单元233,用于将所述偏最小二乘权重向量w代入等价模型Jlinear(w,v),优化样本权重向量v,得到如下公式(1),更新所述等价模型的样本权重向量v:
其中,vi∈[0,1];
第二更新单元233,用于固定所述等价模型的样本权重向量v,并代入等价模型Jlinear(w,v),根据公式(2)更新所述偏最小二乘权重向量w;
w=(XTVX)-1XTVy (2)
其中,V为对角矩阵,其主对角线上的元素为Vii=vi;
第三更新单元235,用于将更新后的偏最小二乘权重向量w代入平方损失函数,更新等价模型的样本损失向量,根据公式(3)更新自步正则项的步长参数λ;
λ=λ/μ (3)
其中,μ∈[0,1]为第一预设数值,用于表示初始学习的样本数量;
循环单元236,用于将更新后的样本损失向量和步长参数作为输入,循环调用第一更新单元至循环单元;
输出单元237,用于当样本权重向量的元素均大于零或循环单元调用的次数达到预设次数时,退出循环,输出最终的偏最小二乘权重向量。
具体地,计算模块3包括:
第一计算子模块31,用于将偏最小二乘权重向量代入公式(4)计算标准样品的主成分,并根据公式(5)对主成分进行归一化处理;
t=Xw (4)
tG=t/(tTt) (5)
其中,t为主成分,tG为归一化后的主成分;
第二计算子模块32,用于根据公式(6)计算标准样品的浓度向量与归一化后的主成分的乘积,将归一化后的主成分代入公式(7)计算主成分向量对应的载荷向量;
q=tG Ty (6)
p=XTtG (7)
其中,q为乘积,p为载荷向量;
判断子模块33,用于判断公式(8)是否成立,如是,则执行步骤S34,否则则根据公式(9)更新标准样品的红外光谱矩阵,并循环调用获取模块和计算模块;
||X-tGpT||F<e (8)
X'=X-tGpT (9)
其中,||·||F为矩阵的弗罗贝尼乌斯范数,e为预设值,X'为更新后的标准样品的红外光谱矩阵;
第三计算子模块34,用于根据公式(10)构建偏最小二乘预测模型,将待测样品的红外光谱矩阵输入偏最小二乘预测模型,计算得到待测样品的浓度数据;
ynew=XnewW(PTW)-1Q (10)
其中,Xnew为待测样品的红外光谱矩阵,ynew为待测样品的浓度向量,W=[w1,w2,…,wr],P=[p1,p2,…,pr],Q=[q1,q2,…,qr],其中,r为调用获取模块和计算模块的次数,w1,w2,…,wr分别为依次调用第一计算子模块输出的偏最小二乘权重向量,p1,p2,…,pr分别为依次调用第二计算子模块所获取的载荷向量,q1,q2,…,qr分别为依次调用第二计算子模块所获取的乘积。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于自步学习的红外光谱定量分析方法,其特征在于,包括:
S1、分别从标准样品的红外光谱数据和待测样品的红外光谱数据中提取出所述标准样品的红外光谱矩阵和所述待测样品的红外光谱矩阵,获取所述标准样品的浓度数据;
S2、根据所述标准样品的红外光谱矩阵和所述标准样品的浓度数据,获取用于表示红外光谱矩阵与浓度数据之间关系的偏最小二乘权重向量;
S3、根据所述偏最小二乘权重向量构建偏最小二乘预测模型,将所述待测样品的红外光谱矩阵输入所述偏最小二乘预测模型,计算得到所述待测样品的浓度数据。
2.根据权利要求1所述的一种基于自步学习的红外光谱定量分析方法,其特征在于,步骤S2包括:
S21、通过最小二乘法对所述标准样品的红外光谱矩阵和所述标准样品的浓度数据进行训练,构建偏最小二乘权重向量优化模型;
所述偏最小二乘权重向量优化模型的表达式为:
<mrow>
<mi>J</mi>
<mrow>
<mo>(</mo>
<mi>w</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>arg</mi>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mi>w</mi>
</munder>
<mo>|</mo>
<mo>|</mo>
<mi>y</mi>
<mo>-</mo>
<mi>X</mi>
<mi>w</mi>
<mo>|</mo>
<mo>|</mo>
<mo>=</mo>
<mi>arg</mi>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mi>w</mi>
</munder>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mi>w</mi>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
其中,X为标准样品的红外光谱矩阵X=[x1,x2,…xi…,xn]T,其中,n为标准样品的个数i∈{1,2,3…n},xi为第i个标准样品的光谱向量;y为标准样品的浓度数据对应的浓度向量y=[y1,y2,…yi…,yn]T,其中,yi为第i个标准样品对应的浓度值;w为偏最小二乘权重向量w=[w1,w2,…wj…,wd]T,d为光谱向量的特征维数,其中j∈{1,2,3…d};
S22、通过自步学习方法对所述偏最小二乘权重向量优化模型进行更新,得到基于自步学习的偏最小二乘权重向量优化模型,即自步学习模型;
所述自步学习模型的表达式为:
<mrow>
<mi>J</mi>
<mrow>
<mo>(</mo>
<mi>w</mi>
<mo>,</mo>
<mi>v</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>arg</mi>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mrow>
<mi>w</mi>
<mo>,</mo>
<mi>v</mi>
</mrow>
</munder>
<mo>{</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mi>L</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<mi>f</mi>
<mo>(</mo>
<mrow>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<mi>w</mi>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>R</mi>
<mrow>
<mo>(</mo>
<mi>v</mi>
<mo>,</mo>
<mi>&lambda;</mi>
<mo>)</mo>
</mrow>
<mo>}</mo>
</mrow>
其中,L(yi,f(xi,w))为真实浓度值yi和估计浓度值f(xi,w)之间的平方损失,w为偏最小二乘权重向量;v为当前模型的样本权重向量v=[v1,v2,…vi…,vn]T,其中,vi∈[0,1]为第i个样本的权重值,用于衡量第i个样本的学习难易程度;R(v,λ)为当前模型的自步正则项,其中,λ为步长参数,用于改变参与当前模型学习的样本数目;
S23、根据所述自步学习模型获取偏最小二乘权重向量。
3.根据权利要求2所述的一种基于自步学习的红外光谱定量分析方法,其特征在于,步骤S23包括:
S231、令自步正则项为线性软权重,则基于线性软权重的偏最小二乘权重向量优化模型的等价模型,即等价模型的表达式为:
<mrow>
<msup>
<mi>J</mi>
<mrow>
<mi>l</mi>
<mi>i</mi>
<mi>n</mi>
<mi>e</mi>
<mi>a</mi>
<mi>r</mi>
</mrow>
</msup>
<mrow>
<mo>(</mo>
<mi>w</mi>
<mo>,</mo>
<mi>v</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>arg</mi>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mi>w</mi>
</munder>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mi>w</mi>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
<mo>+</mo>
<mi>&lambda;</mi>
<mrow>
<mo>(</mo>
<mfrac>
<mn>1</mn>
<mn>2</mn>
</mfrac>
<mo>|</mo>
<mo>|</mo>
<mi>v</mi>
<mo>|</mo>
<msubsup>
<mo>|</mo>
<mn>2</mn>
<mn>2</mn>
</msubsup>
<mo>-</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
其中,λ>0;
S232、将所述偏最小二乘权重向量w初始化为单位向量,并代入平方损失函数,得到样本损失的初始向量,将所述等价模型的步长参数λ初始化为所述样本损失的初始向量的中位数值;
S233、将所述偏最小二乘权重向量w代入等价模型Jlinear(w,v),优化样本权重向量v,得到如下公式(1),更新所述等价模型的样本权重向量v:
<mrow>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mn>1</mn>
<mo>-</mo>
<mfrac>
<mrow>
<mi>L</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<mi>f</mi>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<mi>w</mi>
<mo>)</mo>
</mrow>
<mo>)</mo>
</mrow>
<mi>&lambda;</mi>
</mfrac>
</mrow>
</mtd>
<mtd>
<mrow>
<msub>
<mi>l</mi>
<mi>i</mi>
</msub>
<mo><</mo>
<mi>&lambda;</mi>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mrow>
<msub>
<mi>l</mi>
<mi>i</mi>
</msub>
<mo><</mo>
<mi>&lambda;</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,vi∈[0,1];
S234,固定所述等价模型的样本权重向量v,并代入等价模型Jlinear(w,v),根据公式(2)更新所述偏最小二乘权重向量w;
w=(XTVX)-1XTVy (2)
其中,V为对角矩阵,其主对角线上的元素为Vii=vi;
S235,将更新后的所述偏最小二乘权重向量w代入平方损失函数,更新所述等价模型的样本损失向量,根据公式(3)更新所述自步正则项的步长参数λ;
λ=λ/μ (3)
其中,μ∈[0,1]为第一预设数值,用于表示初始学习的样本数量;
S236,将更新后的所述样本损失向量和所述步长参数作为输入,循环执行步骤S233至S236;
S237、当所述样本权重向量的元素均大于零或步骤S236执行的次数达到预设次数时,退出循环,输出最终的所述偏最小二乘权重向量。
4.根据权利要求3所述的一种基于自步学习的红外光谱定量分析方法,其特征在于,步骤S3包括:
S31、将所述偏最小二乘权重向量代入公式(4)计算所述标准样品的主成分,并根据公式(5)对所述主成分进行归一化处理,根据公式(6)计算所述标准样品的浓度向量与归一化后的主成分的乘积;
t=Xw (4)
tG=t/(tTt) (5)
q=tG Ty (6)
其中,t为所述主成分,tG为所述归一化后的主成分,q为所述乘积;
S32、将所述归一化后的主成分代入公式(7)计算主成分向量对应的载荷向量;
p=XTtG (7)
其中,p为所述载荷向量;
S33、判断公式(8)是否成立,如是,则执行步骤S34,否则则根据公式(9)更新所述标准样品的红外光谱矩阵,并循环执行步骤S2和S3;
||X-tGpT||F<e (8)
X'=X-tGpT (9)
其中,||·||F为矩阵的弗罗贝尼乌斯范数,e为预设值,X'为更新后的所述标准样品的红外光谱矩阵;
S34、根据公式(10)构建偏最小二乘预测模型,将所述待测样品的红外光谱矩阵输入所述偏最小二乘预测模型,得到所述待测样品的浓度数据;
ynew=XnewW(PTW)-1Q (10)
其中,Xnew为所述待测样品的红外光谱矩阵,ynew为所述待测样品的浓度向量,W=[w1,w2,…,wr],P=[p1,p2,…,pr],Q=[q1,q2,…,qr],其中,r为执行步骤S2和S3的次数,w1,w2,…,wr分别为依次执行步骤S2输出的偏最小二乘权重向量,p1,p2,…,pr分别为依次执行步骤S31所获取的所述载荷向量,q1,q2,…,qr分别为依次执行步骤31所获取的所述乘积。
5.一种基于自步学习的红外光谱定量分析系统,其特征在于,包括:
提取模块,用于分别从标准样品的红外光谱数据和待测样品的红外光谱数据中提取出所述标准样品的红外光谱矩阵和所述待测样品的红外光谱矩阵,获取所述标准样品的浓度数据;
获取模块,用于根据所述标准样品的红外光谱矩阵和所述标准样品的浓度数据,获取用于表示红外光谱矩阵与浓度数据之间关系的偏最小二乘权重向量;
计算模块,用于根据所述偏最小二乘权重向量构建偏最小二乘预测模型,将所述待测样品的红外光谱矩阵输入所述偏最小二乘预测模型,计算得到所述待测样品的浓度数据。
6.根据权利要求5所述的一种基于自步学习的红外光谱定量分析系统,其特征在于,所述获取模块包括:
构建子模块,用于通过最小二乘法对所述标准样品的红外光谱矩阵和所述标准样品的浓度数据进行训练,构建偏最小二乘权重向量优化模型;
所述偏最小二乘权重向量优化模型的表达式为:
<mrow>
<mi>J</mi>
<mrow>
<mo>(</mo>
<mi>w</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>arg</mi>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mi>w</mi>
</munder>
<mo>|</mo>
<mo>|</mo>
<mi>y</mi>
<mo>-</mo>
<mi>X</mi>
<mi>w</mi>
<mo>|</mo>
<mo>|</mo>
<mo>=</mo>
<mi>arg</mi>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mi>w</mi>
</munder>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mi>w</mi>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
其中,X为标准样品的红外光谱矩阵X=[x1,x2,…xi…,xn]T,其中,n为标准样品的个数i∈{1,2,3…n},xi为第i个标准样品的光谱向量;y为标准样品的浓度数据对应的浓度向量y=[y1,y2,…yi…,yn]T,其中,yi为第i个标准样品对应的浓度值;w为偏最小二乘权重向量w=[w1,w2,…wj…,wd]T,d为光谱向量的特征维数,其中j∈{1,2,3…d};
第一更新子模块,用于通过自步学习方法对所述偏最小二乘权重向量优化模型进行更新,得到基于自步学习的偏最小二乘权重向量优化模型,即自步学习模型;
所述自步学习模型的表达式为:
<mrow>
<mi>J</mi>
<mrow>
<mo>(</mo>
<mi>w</mi>
<mo>,</mo>
<mi>v</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>arg</mi>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mrow>
<mi>w</mi>
<mo>,</mo>
<mi>v</mi>
</mrow>
</munder>
<mo>{</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mi>L</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<mi>f</mi>
<mo>(</mo>
<mrow>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<mi>w</mi>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>R</mi>
<mrow>
<mo>(</mo>
<mi>v</mi>
<mo>,</mo>
<mi>&lambda;</mi>
<mo>)</mo>
</mrow>
<mo>}</mo>
</mrow>
其中,L(yi,f(xi,w))为真实浓度值yi和估计浓度值f(xi,w)之间的平方损失,w为偏最小二乘权重向量;v为当前模型的样本权重向量v=[v1,v2,…vi…,vn]T,其中,vi∈[0,1]为第i个样本的权重值,用于衡量第i个样本的学习难易程度;R(v,λ)为当前模型的自步正则项,其中,λ为步长参数,用于改变参与当前模型学习的样本数目;
获取子模块,用于根据所述自步学习模型获取偏最小二乘权重向量。
7.根据权利要求6所述的一种基于自步学习的红外光谱定量分析系统,其特征在于,所述获取子模块包括:
赋值单元,用于令自步正则项为线性软权重,则基于线性软权重的偏最小二乘权重向量优化模型的等价模型,即等价模型的表达式为:
<mrow>
<msup>
<mi>J</mi>
<mrow>
<mi>l</mi>
<mi>i</mi>
<mi>n</mi>
<mi>e</mi>
<mi>a</mi>
<mi>r</mi>
</mrow>
</msup>
<mrow>
<mo>(</mo>
<mi>w</mi>
<mo>,</mo>
<mi>v</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>arg</mi>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mi>w</mi>
</munder>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mi>w</mi>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
<mo>+</mo>
<mi>&lambda;</mi>
<mrow>
<mo>(</mo>
<mfrac>
<mn>1</mn>
<mn>2</mn>
</mfrac>
<mo>|</mo>
<mo>|</mo>
<mi>v</mi>
<mo>|</mo>
<msubsup>
<mo>|</mo>
<mn>2</mn>
<mn>2</mn>
</msubsup>
<mo>-</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
其中,λ>0;
初始化单元,用于将所述偏最小二乘权重向量w初始化为单位向量,并代入平方损失函数,得到样本损失的初始向量,将所述等价模型的步长参数λ初始化为所述样本损失的初始向量的中位数值;
第一更新单元,用于将所述偏最小二乘权重向量w代入等价模型Jlinear(w,v),优化样本权重向量v,得到如下公式(1),更新所述等价模型的样本权重向量v:
<mrow>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mn>1</mn>
<mo>-</mo>
<mfrac>
<mrow>
<mi>L</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<mi>f</mi>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<mi>w</mi>
<mo>)</mo>
</mrow>
<mo>)</mo>
</mrow>
<mi>&lambda;</mi>
</mfrac>
</mrow>
</mtd>
<mtd>
<mrow>
<msub>
<mi>l</mi>
<mi>i</mi>
</msub>
<mo><</mo>
<mi>&lambda;</mi>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mrow>
<msub>
<mi>l</mi>
<mi>i</mi>
</msub>
<mo><</mo>
<mi>&lambda;</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,vi∈[0,1];
第二更新单元,用于固定所述等价模型的样本权重向量v,并代入等价模型Jlinear(w,v),根据公式(2)更新所述偏最小二乘权重向量w;
w=(XTVX)-1XTVy (2)
其中,V为对角矩阵,其主对角线上的元素为Vii=vi;
第三更新单元,用于将更新后的所述偏最小二乘权重向量w代入平方损失函数,更新所述等价模型的样本损失向量,根据公式(3)更新所述自步正则项的步长参数λ;
λ=λ/μ (3)
其中,μ∈[0,1]为第一预设数值,用于表示初始学习的样本数量;
循环单元,用于将更新后的所述样本损失向量和所述步长参数作为输入,循环调用所述第一更新单元至循环单元;
输出单元,用于当所述样本权重向量的元素均大于零或所述循环单元调用的次数达到预设次数时,退出循环,输出最终的所述偏最小二乘权重向量。
8.根据权利要求7所述的一种基于自步学习的红外光谱定量分析系统,其特征在于,所述计算模块包括:
第一计算子模块,用于将所述偏最小二乘权重向量代入公式(4)计算所述标准样品的主成分,并根据公式(5)对所述主成分进行归一化处理;
t=Xw (4)
tG=t/(tTt) (5)
其中,t为所述主成分,tG为归一化后的主成分;
第二计算子模块,用于根据公式(6)计算所述标准样品的浓度向量与所述归一化后的主成分的乘积,将所述归一化后的主成分代入公式(7)计算主成分向量对应的载荷向量;
q=tG Ty (6)
p=XTtG (7)
其中,q为所述乘积,p为所述载荷向量;
判断子模块,用于判断公式(8)是否成立,如是,则执行步骤S34,否则则根据公式(9)更新所述标准样品的红外光谱矩阵,并循环调用所述获取模块和所述计算模块;
||X-tGpT||F<e (8)
X'=X-tGpT (9)
其中,||·||F为矩阵的弗罗贝尼乌斯范数,e为预设值,X'为更新后的所述标准样品的红外光谱矩阵;
第三计算子模块,用于根据公式(10)构建偏最小二乘预测模型,将所述待测样品的红外光谱矩阵输入所述偏最小二乘预测模型,计算得到所述待测样品的浓度数据;
ynew=XnewW(PTW)-1Q (10)
其中,Xnew为所述待测样品的红外光谱矩阵,ynew为所述待测样品的浓度向量,W=[w1,w2,…,wr],P=[p1,p2,…,pr],Q=[q1,q2,…,qr],其中,r为调用所述获取模块和所述计算模块的次数,w1,w2,…,wr分别为依次调用所述第一计算子模块输出的偏最小二乘权重向量,p1,p2,…,pr分别为依次调用所述第二计算子模块所获取的所述载荷向量,q1,q2,…,qr分别为依次调用所述第二计算子模块所获取的所述乘积。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710597983.5A CN107290297B (zh) | 2017-07-20 | 2017-07-20 | 一种基于自步学习的红外光谱定量分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710597983.5A CN107290297B (zh) | 2017-07-20 | 2017-07-20 | 一种基于自步学习的红外光谱定量分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107290297A true CN107290297A (zh) | 2017-10-24 |
CN107290297B CN107290297B (zh) | 2019-10-22 |
Family
ID=60103100
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710597983.5A Active CN107290297B (zh) | 2017-07-20 | 2017-07-20 | 一种基于自步学习的红外光谱定量分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107290297B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109781652A (zh) * | 2018-12-06 | 2019-05-21 | 宁波泰甬汽车零部件有限公司 | Abs材料混合物各组份ftir光谱定量分析方法 |
CN112233721A (zh) * | 2020-09-30 | 2021-01-15 | 吾征智能技术(北京)有限公司 | 一种基于血红蛋白浓度分析预测系统及其设备 |
CN114486821A (zh) * | 2022-04-06 | 2022-05-13 | 合肥金星智控科技股份有限公司 | 冶金光谱特征回归方法、装置、电子设备和存储介质 |
CN115096835A (zh) * | 2022-07-13 | 2022-09-23 | 天津同阳科技发展有限公司 | 气体浓度检测方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040090449A1 (en) * | 2002-11-13 | 2004-05-13 | Ge Medical Systems Global Technology Company, L.L C. | Method and program for increassing field engineer performance and providing self-paced training |
CN106203521A (zh) * | 2016-07-15 | 2016-12-07 | 西安电子科技大学 | 基于差异图自步学习的sar图像变化检测方法 |
CN105973828B (zh) * | 2016-04-27 | 2018-06-15 | 湖北大学 | 一种红外光谱定量分析方法及系统 |
-
2017
- 2017-07-20 CN CN201710597983.5A patent/CN107290297B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040090449A1 (en) * | 2002-11-13 | 2004-05-13 | Ge Medical Systems Global Technology Company, L.L C. | Method and program for increassing field engineer performance and providing self-paced training |
CN105973828B (zh) * | 2016-04-27 | 2018-06-15 | 湖北大学 | 一种红外光谱定量分析方法及系统 |
CN106203521A (zh) * | 2016-07-15 | 2016-12-07 | 西安电子科技大学 | 基于差异图自步学习的sar图像变化检测方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109781652A (zh) * | 2018-12-06 | 2019-05-21 | 宁波泰甬汽车零部件有限公司 | Abs材料混合物各组份ftir光谱定量分析方法 |
CN112233721A (zh) * | 2020-09-30 | 2021-01-15 | 吾征智能技术(北京)有限公司 | 一种基于血红蛋白浓度分析预测系统及其设备 |
CN114486821A (zh) * | 2022-04-06 | 2022-05-13 | 合肥金星智控科技股份有限公司 | 冶金光谱特征回归方法、装置、电子设备和存储介质 |
CN114486821B (zh) * | 2022-04-06 | 2022-08-12 | 合肥金星智控科技股份有限公司 | 冶金光谱特征回归方法、装置、电子设备和存储介质 |
CN115096835A (zh) * | 2022-07-13 | 2022-09-23 | 天津同阳科技发展有限公司 | 气体浓度检测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107290297B (zh) | 2019-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107290297A (zh) | 一种基于自步学习的红外光谱定量分析方法及系统 | |
Bai et al. | Accurate prediction of soluble solid content of apples from multiple geographical regions by combining deep learning with spectral fingerprint features | |
CN105740984A (zh) | 一种基于性能预测的产品概念性能评价方法 | |
CN112989711B (zh) | 基于半监督集成学习的金霉素发酵过程软测量建模方法 | |
CN105431854B (zh) | 用于分析生物样品的方法和设备 | |
US20220113250A1 (en) | Method for Near-Infrared Spectral Wavelength Selection Based on Improved Team Progress Algorithm | |
CN105973828B (zh) | 一种红外光谱定量分析方法及系统 | |
Wang et al. | Identification and severity determination of wheat stripe rust and wheat leaf rust based on hyperspectral data acquired using a black-paper-based measuring method | |
CN108693139A (zh) | 电子烟油理化指标的近红外光谱预测模型建立方法及应用 | |
Liu et al. | Estimating leaf chlorophyll contents by combining multiple spectral indices with an artificial neural network | |
Sun et al. | Research of moldy tea identification based on RF-RFE-Softmax model and hyperspectra | |
Yang et al. | Assessment of the vigor of rice seeds by near-infrared hyperspectral imaging combined with transfer learning | |
Cheng et al. | Study on the echinococcosis blood serum detection based on Raman spectroscopy combined with neural network | |
CN110555054B (zh) | 一种基于模糊双超球分类模型的数据分类方法及系统 | |
CN112651173B (zh) | 一种基于跨域光谱信息的农产品品质无损检测方法及可泛化系统 | |
CN111125629B (zh) | 一种域自适应的pls回归模型建模方法 | |
Chen et al. | Prediction of soil salinity using near-infrared reflectance spectroscopy with nonnegative matrix factorization | |
Reis | Applications of a new empirical modelling framework for balancing model interpretation and prediction accuracy through the incorporation of clusters of functionally related variables | |
Yang et al. | Recognition of the hardness of licorice seeds using a semi-supervised learning method and near-infrared spectral data | |
CN107644285A (zh) | 售电市场盈利能力评估指标的筛选与权重确定方法及系统 | |
Nummi et al. | A semiparametric mixture regression model for longitudinal data | |
He et al. | Quantitative analysis of the varieties of apple using near infrared spectroscopy by principal component analysis and BP model | |
Bi et al. | Apple grading method based on ordered partition neural network | |
CN111220565B (zh) | 一种基于cpls的红外光谱测量仪器标定迁移方法 | |
Olivos-Trujillo et al. | Assessing the stability of parameters estimation and prediction accuracy in regression methods for estimating seed oil content in Brassica napus L. using NIR spectroscopy |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220622 Address after: 511300 self compiled No. 3, 6th floor, Da Long (plant C7), tangmei village, Xintang Town, Zengcheng District, Guangzhou City, Guangdong Province Patentee after: Baichuan experimental science and Technology Research Institute (Guangzhou) Co.,Ltd. Address before: 430062 368 Friendship Avenue, Wuchang District, Wuhan, Hubei. Patentee before: Hubei University |
|
TR01 | Transfer of patent right |