CN105823751A - 基于λ-SPXY算法的红外光谱多元校正回归建模方法 - Google Patents
基于λ-SPXY算法的红外光谱多元校正回归建模方法 Download PDFInfo
- Publication number
- CN105823751A CN105823751A CN201610165166.8A CN201610165166A CN105823751A CN 105823751 A CN105823751 A CN 105823751A CN 201610165166 A CN201610165166 A CN 201610165166A CN 105823751 A CN105823751 A CN 105823751A
- Authority
- CN
- China
- Prior art keywords
- sample
- space
- spxy
- calibration set
- infrared spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 39
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 25
- 230000001419 dependent effect Effects 0.000 claims abstract description 19
- 238000001228 spectrum Methods 0.000 claims abstract description 15
- 238000012937 correction Methods 0.000 claims description 28
- 235000013405 beer Nutrition 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 13
- 238000009826 distribution Methods 0.000 claims description 12
- 238000004064 recycling Methods 0.000 claims description 7
- 239000012141 concentrate Substances 0.000 claims description 6
- 238000002790 cross-validation Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 5
- 238000005192 partition Methods 0.000 abstract description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- 238000004445 quantitative analysis Methods 0.000 description 4
- 238000004611 spectroscopical analysis Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 206010008190 Cerebrovascular accident Diseases 0.000 description 1
- 208000006011 Stroke Diseases 0.000 description 1
- 235000009392 Vitis Nutrition 0.000 description 1
- 241000219095 Vitis Species 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000007872 degassing Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 235000011389 fruit/vegetable juice Nutrition 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 239000010453 quartz Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000002235 transmission spectroscopy Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3577—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种基于λ‑SPXY算法的红外光谱多元校正回归建模方法,包括以下步骤:根据待测样品光谱的样本集特征,设定最优权重调整参数λ,给样本集仪器响应矢量空间X和因变量空间Y分配不同的权重;再利用λ‑SPXY算法选定校正集并建立回归模型。本发明提供了一种可以充分考虑X和Y空间各自贡献的数据集划分方法,可以更有效的覆盖多维空间;在多元校正的数据集划分方面,此方法可以获得比传统的SPXY方法更合理的结果,并大幅度改善建立模型的预测性能。
Description
技术领域
本发明涉及一种基于λ-SPXY算法的红外光谱多元校正回归建模方法,属于多元校正回归建模领域。
背景技术
多元校正回归建模方法已经应用在各类定量分析领域,应用最广泛的是偏最小二乘法(PLS)。在多元校正回归建模的过程中,所建模型的性能在很大程度上取决于所使用的校正集。因此,如何从大量样本中选取具有代表性的样本构建高质量的、有利于提升模型性能的校正集极为重要。目前,选取样本构建校正集的方法主要有两种方式:聚类划分原则和均衡化划分原则。聚类划分原则主要针对样本集进行聚类分析,然后依据聚类分析的相应结果选取代表性的样本构建校正集;而均衡化原则的核心思想是选择代表性样本使其尽可能的按照空间距离均匀的覆盖整个样本空间。
目前,均衡化设计原则的样本选择方法主要有随机法RS(Randomsampling)、基于仪器响应矢量空间X的空间距离选取原则的KS(Kennard–Stone)法,基于仪器响应矢量空间X和因变量空间Y的联合空间距离选取原则的SPXY(SamplesetportioningbasedonjointX-Ydistances)法。RS操作简便,随机性大,不能保证所选样本具有代表性和外推能力。KS方法的目标是通过计算样本数据间的欧氏距离使所选出的样本能够均匀地覆盖整个样本集区域。距离样本集的均值最近的样本视为最具有代表性的样本,作为第一样本入选校正集。然后,根据样本与已分配到校正集的样本之间的欧式距离,按顺序连续选出样本。重复这样的过程直到获得指定数量的样本。缺陷是只考虑了仪器响应矢量空间X的特征,没有考虑样本的因变量空间Y的影响。故此也存在这局限性和不合理性,难以获取性能稳定且适用性较强的模型。
基于X-Y联合距离选择原则的SPXY划分方法与基于X空间距离选择原则的KS划分方法最大的不同是既充分考虑仪器响应矢量空间X又考虑因变量空间Y的影响。此时的欧氏距离改写为:
其中,i=1,2…N,j=1,2…N且i≠j。dx,y(m,n)为样本m和n之间的联合距离,λ为权重调整参数,dx(m,n)为样本m和n在X空间的空间欧氏距离,dy(m,n)为样本m和n在Y空间的空间欧氏距离,maxdx(i,j)为所有样本中在X空间的最大欧氏空间距离,maxdy(i,j)为所有样本中在Y空间的最大欧氏空间距离。
此类方法比起KS方法,改进了数据集划分的距离选择判据,考虑了因变量空间的因素;但是此方法并没有考虑样本集的具体特征,只是为仪器响应空间X和因变量空间Y赋予了相等的权重,认为对于所有的样本集来说,X空间和Y空间的影响都是相同权重的,这显然对于具体的样本集来说是不符合实际的,因而导致最终建立的模型的预测准确性及稳定性受限,无法满足实际需求。
发明内容
本发明的目的在于,提供一种基于λ-SPXY算法的红外光谱多元校正回归建模方法,它能够兼顾待测样本集的光谱(仪器响应矢量空间X)距离分布特征和样品因变量(Y)空间距离分布特征,并且依据样本的具体特征和所设计的优化原则,分配给仪器响应矢量空间X和因变量空间Y不同的权重,以解决现有技术数据集划分方法中存在的缺点,提高回归建模的预测性能及稳定性。
为解决上述技术问题,本发明采用如下的技术方案:一种基于λ-SPXY算法的红外光谱多元校正回归建模方法,包括以下步骤:根据待测样品光谱的样本集特征,设定最优权重调整参数λ,给样本集仪器响应矢量空间X和因变量空间Y分配不同的权重;再利用λ-SPXY算法选定校正集并建立回归模型。
如前述的基于λ-SPXY算法的红外光谱多元校正回归建模方法,具体步骤包括:
S1.计算待测样本集中样本m和n之间的X空间的空间距离dx(m,n)和Y空间的空间距离dy(m,n),其中,m,n∈[1,N],N为总样本数;
S2.根据待测样品光谱的样本集特征,设定最优权重调整参数λ;给样本集仪器响应矢量空间X和因变量空间Y分配不同的权重;再利用λ-SPXY算法得到样本m和n之间的联合空间距离dx,y(m,n);选择联合空间距离最大的两个样本加入校正集;
S3.在未入选所述校正集的剩余样本中,根据剩余样本与已入选校正集的各个样本之间的联合空间距离再次进行样本选择,并将其加入校正集;
S4.判断所述校正集中样本是否达到指定的数量,若是则得出最终的校正集,并转至S5,否则重复步骤S2;
S5.利用最终的校正集建立回归模型。
因而可以保证最终所建模型的性能,使其预测精度较高,同时稳定性较好。
如前述的基于λ-SPXY算法的红外光谱多元校正回归建模方法,所述根据待测样品光谱的样本集特征,设定最优权重调整参数λ具体通过以下方式获得:
Sa.设定权重调整参数λ的初始值为零;
Sb.利用λ-SPXY算法选定λ值所对应的校正集,并建立回归模型,求取预测均方根误差RMSEP和交叉验证均方根误差RMSECV之和F(λ),F(λ)=RMSEP(λ)+RMSECV(λ);
Sc.判断λ是否等于1,是则转至Sd,不是则将λ在0-1范围内以μ间隔为步长递增,并转至Sb;
Sd.利用参数优化选取原则,选取最小的F(λ)值所对应的λ,作为最优权重调整参数λ;
因而能有效减少计算量,提高参数的选择效率。
如前述的基于λ-SPXY算法的红外光谱多元校正回归建模方法,步骤S4中所述的利用λ-SPXY算法计算相应λ值得到样本m和n之间的联合空间距离dx,y(m,n)具体通过以下方式获得:
从而可以获得更加科学合理的校正集,使得最终所建模型的预测精度更高,稳定性更好。
如前述的基于λ-SPXY算法的红外光谱多元校正回归建模方法,步骤S5中所述的根据剩余样本与已入选校正集的各个样本之间的距离再次进行样本的选择,并加入校正集具体包括:计算剩余样本中的每个样本与已入选校正集的各个样本之间的最短联合距离,然后选择所述最短联合距离中的最长联合距离所对应的样本加入校正集,从而可以得到样本空间分布最均匀的校正集,并且因此能够提高所建模型的预测精度和稳定性。
如前述的基于λ-SPXY算法的红外光谱多元校正回归建模方法,权重调整参数λ的步长递增的间隔μ为0.1,从而能够减少模型所需时间,并能提高所建模型的预测精度和稳定性。
如前述的基于λ-SPXY算法的红外光谱多元校正回归建模方法,所述回归建模的模型为PLS模型。
如前述的基于λ-SPXY算法的红外光谱多元校正回归建模方法,所述的待测样品包括啤酒、葡萄酒。经验证,本发明的方法可以在所有光谱分析中得以应用,尤其是对于酒类等复杂混合液体定量分析的应用具有良好的前景,所建模型的预测精度和稳定性均较好;酒类中特别是对于啤酒、葡萄酒的定量分析,所建模型的预测精度和稳定性更好。
与现有技术相比,本发明通过根据待测样品光谱的样本集特征(光谱距离特征和样品因变量空间分布特征),设定最优权重调整参数λ,给样本集仪器响应矢量空间X和因变量空间Y分配不同的权重;再利用λ-SPXY算法选定校正集并建立回归模型,同时考虑了仪器响应矢量空间X和因变量空间Y,并且依据样本的具体特征,分配给仪器响应矢量空间X和因变量空间Y不同的权重(即提供了一种可以充分考虑X和Y空间各自贡献的数据集划分方法),从而可以更有效的覆盖多维空间;在多元校正的数据集划分方面,此方法可以获得比传统的SPXY方法更合理的结果,并大幅度改善建立模型的预测性能。据大量数据统计表明,采用本发明后,回归建模的模型校正集和验证集的预测准确率分别提高了15.6%和30.8%。
附图说明
图1所示是本发明的一种实施例的方法流程图;
图2所示是本发明的另一种实施例的方法流程图;
图3是本发明实验例1中λ-SPXY方法啤酒数据集建模的RMSEP与RMSECV的数值图;
图4是本发明实验例1中λ-SPXY方法葡萄酒数据集建模的RMSEP与RMSECV的数值图;
图5是本发明实验例1中以啤酒光谱数据集和葡萄酒光谱数据集分别采用PLS-RS、PLS-KS、PLS-SPXY、PLS-YR和PLS-λ-SPXY方法进行处理的RPD值对比图。
下面结合附图和具体实施方式对本发明作进一步的说明。
具体实施方式
本发明的实施例1,如图1所示:一种基于λ-SPXY算法的红外光谱多元校正回归建模方法,包括以下步骤:根据待测样品光谱的样本集特征,设定最优权重调整参数λ,给样本集仪器响应矢量空间X和因变量空间Y分配不同的权重;再利用λ-SPXY算法选定校正集并建立回归模型;具体步骤包括:
S1.计算待测样本集中样本m和n之间的X空间的空间欧式距离dx(m,n)和Y空间的空间欧式距离dy(m,n),其中,m,n∈[1,N],N为总样本数;
S2.根据待测样品光谱的样本集特征,设定最优权重调整参数λ;给样本集仪器响应矢量空间X和因变量空间Y分配不同的权重;再利用λ-SPXY算法得到样本m和n之间的联合空间距离dx,y(m,n);选择联合空间距离最大的两个样本加入校正集;
S3.在未入选所述校正集的剩余样本中,根据剩余样本与已入选校正集的各个样本之间的联合空间距离再次进行样本选择,并将其加入校正集;
S4.判断所述校正集中样本是否达到指定的数量,若是则得出最终的校正集,并转至S5,否则重复步骤S2;
S5.利用最终的校正集建立回归模型。
本发明的实施例2,如图2所示:一种基于λ-SPXY算法的红外光谱多元校正回归建模方法,具体步骤包括:
a.设定权重调整参数λ的初始值为零;
b.计算待测样本集中样本m和n之间的X空间的空间距离dx(m,n)和Y空间的空间距离dy(m,n),其中,m,n∈[1,N],N为总样本数;
c.利用权重调整参数λ给样本集仪器响应矢量空间X和因变量空间Y分配不同的权重,并利用λ-SPXY算法计算相应λ值得到样本m和n之间的联合空间距离dx,y(m,n),选择联合空间距离最大的两个样本加入校正集;
d.在未入选所述校正集的剩余样本中,根据剩余样本与已入选校正集的各个样本之间的联合距离再次进行样本选择,并将其加入校正集;
e.判断所述校正集中样本是否达到指定的数量,若是则得出相应λ所对应的校正集,并转至S6,否则重复步骤S2;
f.利用相应λ值所对应的校正集建立回归模型,并求取预测均方根误差RMSEP和交叉验证均方根误差RMSECV之和F(λ),F(λ)=RMSEP(λ)+RMSECV(λ);
g.判断λ是否等于1,是则转至S8,不是则将λ在0-1范围内以0.1间隔(或以其他间隔)为步长递增,并转至S3;
h.利用参数优化选取原则,选取最小的F(λ)值所对应的λ,作为最优λ;
i.利用最优λ所对应的校正集进行建模预测。
其中,预测均方根误差RMSEP(RootMeanSquareErrorofPrediction)和交叉验证均方根误差RMSECV(RootMeanSquareErrorofCrossValidation)、以及相对分析误差RPD(RatioofPerformancetoStandardDeviate)作为模型的主要评价指标。RMSECV和RMSEP的值越低,RPD的值越高,则说明模型的稳定性和预测能力越好。RMSECV,RMSEP和RPD计算公式如下:
nv是验证集样本数,yi,ref样本参考值,yi,prei样本PLS预测值,
nc是校正集样本数目yi,ref第i个样本参考值,yi,pre是PLS模型的交叉验证过程中第i个样本预测值。
其中SD是分析样本的标准差。这个指标用来验证模型的稳定性性和预测能力。
其中,是校正集或者验证集中所有样品参考值的平均值;,yi,ref为校正集或验证集第i个样本的参考值,yi,pre是验证集或者校正集预测过程中第i个样本的预测值。
所述回归建模的模型可以为PLS模型。
所述待测样品可以为酒水,优选为啤酒、葡萄酒。
实验例:以啤酒光谱数据集和葡萄酒光谱数据集为例,进行了发明策略的验证实验。
数据集1:啤酒样本数据集。该数据集是由等人提供的,包括60个已知原麦汁浓度的啤酒样本。原麦汁浓度是由嘉士伯啤酒厂的A/S测定的,其浓度范围为4.23%~18.76%柏拉图,用来间接测定啤酒生产过程中酵母发酵生产酒精的能力。利用30mm的石英样品池采集未稀释的脱气啤酒的光谱信息。光谱波长范围为400nm~2250nm,间隔2nm,每个样本波长数为926。可见光/近红外透射光谱两端包含大量变量。在400nm~700nm区间内,从低浓度啤酒到黑啤酒由于颜色的变化,存在大量变量;在波长高于1350nm的范围内,主要是水的吸收峰,较高的吸收水平会引起噪音测量;在波长大约为970nm处主要是水的O-H键的二级倍频,剩余部分的光谱主要是C-H键和N-H键的伸缩倍频。在光谱的两端呈现了大量变量。
数据集2:葡萄酒样本数据集。该数据集由Prof.MarcMeurens提供,该样本的酒精浓度由中红外MIR法测定,其酒精含量范围是7.48%~15.5%vol。它包括123个样本,每个样本包含256个吸光度光谱,波数范围是950cm-1到1920cm-1。现利用红外光谱估计葡萄酒样本中的酒精含量。
实施方法:
利用PLS-RS、PLS-KS、PLS-SPXY及本发明提出的λ-SPXY算法的红外光谱多元校正回归建模方法(即PLS-λ-SPXY)四种方法分别进行数据集的的划分与建模,然后对所建模型的预测能力进行评估和对比。啤酒数据集中40个样本分别作为RS、KS、SPXY、λ-SPXY相应的校正集,剩余的20个样本作为各自相应的验证集。同理,按上述方法,将葡萄酒数据集中93个样本分别作为相应的校正集,剩余的30个样本作为的验证集。具体数据集划分及建模过程如下:
a.设定权重调整参数λ的初始值为零;
b.计算待测样本集中样本m和n之间的光谱空间欧氏距离dx(m,n)和dy(m,n),其中,m,n∈[1,N],N为总样本数;
c.利用权重调整参数λ给样本集仪器响应矢量空间X和因变量空间Y分配不同的权重,并利用λ-SPXY算法计算相应λ值得到样本m和n之间的联合空间距离dx,y(m,n),选择联合空间距离最大的两个样本加入校正集;
d.在未入选所述校正集的剩余样本中,根据剩余样本与已入选校正集的各个样本之间依据λ-SPXY计算的联合距离再次进行样本选择,并将其加入校正集;
e.判断所述校正集中样本是否达到指定的数量,若是则得出相应λ所对应的校正集,并转至S6,否则重复步骤S2;
f.利用相应λ值所对应的校正集建立回归模型,并求取预测均方根误差RMSEP和交叉验证均方根误差RMSECV之和F(λ),F(λ)=RMSEP(λ)+RMSECV(λ);
g.判断λ是否等于1,是则转至S8,不是则将λ在0-1范围内以μ间隔为步长递增,并转至S3;
h.利用参数优化选取原则,选取最小的F(λ)值所对应的λ,作为最优λ;
i.利用最优λ所对应的校正集进行建模预测。
根据不同λ值,所建模型对应于λ的RMSEP(λ)和RMSECV(λ)的变化如附图3和附图4所示。对于啤酒和葡萄酒数据集,依据如前所诉的选取原则,λ的值分别为0.9和0.3。通过RS、KS、SPXY和本发明中所述的λ-SPXY算法分别所得校正集和验证集相应数据的统计结果如表1所示:
表1样本校正集与验证集Y值特征统计结果
表1表明:除RS方法外,其他几种数据集划分方法所得的样本特性(如范围、均值及标准差)相等或相近。RS方法是一种广泛应用的简单技术,但不能保证样本集的代表性,也不能保证样本集的边界值都包含在校正集中。对于啤酒数据集,校正集的范围是4.23%~16.17%柏拉图,而验证集的范围是6.02%~18.76%柏拉图。很明显,RS因其较低的标准差,所得的校正集并不适合建模。
如上所述,就校正集和验证集的指标而言,模型建模成功与否可通过以下的指标进行判定:预测均方根误差(RMSEP)、交叉验证均方根误差(RMSECV)、决定系数(R2)和相对分析误差(RPD)。实验中,运用F检验结合PRESS的方法确定最佳主成分数。较低的RMSEP、RMSECV值和较高的R2、RPD值表明模型具有良好的性能。几种数据集划分策略所建模型性能的对比如表2所示:
表2几种数据集划分策略所得的预测结果
注:表中括号内的值代表主成分数目
根据表2中PLS-RS、PLS-KS、PLS-SPXY和PLS-λ-SPXY之间的对比可以看出:利用PLS-λ-SPXY建模所得的RMSEP、RMSECV值相比其他四种方法所得相应的值最小。除此之外,RPD也是一个检测回归模型的鲁棒性能和预测性能的常用指标。通常,一个相对较高的RPD值(>3.0)表明模型可以可靠地预测化学成分;RPD值高于5.0时,认为模型利于质量控制;RPD值高于8.0时,认为模型可以用于定量分析领域。作为表明校正模型性能的主要参数,RPD的值如图5所示。综上所述,说明本发明的数据集划分策略明显改善了建模效果。
Claims (8)
1.一种基于λ-SPXY算法的红外光谱多元校正回归建模方法,其特征在于,包括以下步骤:根据待测样品光谱的样本集特征,设定最优权重调整参数λ,给样本集仪器响应矢量空间X和因变量空间Y分配不同的权重;再利用λ-SPXY算法选定校正集并建立回归模型。
2.根据权利要求1所述的基于改进SPXY算法的红外光谱多元校正回归建模方法,其特征在于,具体步骤包括:
S1.计算待测样本集中样本m和n之间的X空间的空间欧式距离dx(m,n)和Y空间的空间欧式距离dy(m,n),其中,m,n∈[1,N],N为总样本数;
S2.根据待测样品光谱的样本集特征,设定最优权重调整参数λ;给样本集仪器响应矢量空间X和因变量空间Y分配不同的权重;再利用λ-SPXY算法得到样本m和n之间的联合空间距离dx,y(m,n);选择联合空间距离最大的两个样本加入校正集;
S3.在未入选所述校正集的剩余样本中,根据剩余样本与已入选校正集的各个样本之间的联合空间距离再次进行样本选择,并将其加入校正集;
S4.判断所述校正集中样本是否达到指定的数量,若是则得出最终的校正集,并转至S5,否则重复步骤S2;
S5.利用最终的校正集建立回归模型。
3.根据权利要求2所述的基于λ-SPXY算法的红外光谱多元校正回归建模方法,其特征在于,所述根据待测样品光谱的样本集特征,设定最优权重调整参数λ具体通过以下方式获得:
Sa.设定权重调整参数λ的初始值为零;
Sb.利用λ-SPXY算法选定λ值所对应的校正集,并建立回归模型,求取预测均方根误差RMSEP和交叉验证均方根误差RMSECV之和F(λ),F(λ)=RMSEP(λ)+RMSECV(λ);
Sc.判断λ是否等于1,是则转至Sd,不是则将λ在0-1范围内以μ间隔为步长递增,并转至Sb;
Sd.利用参数优化选取原则,选取最小的F(λ)值所对应的λ,作为最优权重调整参数λ。
4.根据权利要求2所述的基于λ-SPXY算法的红外光谱多元校正回归建模方法,其特征在于,步骤S2中所述的利用λ-SPXY算法计算相应λ值得到样本m和n之间的联合空间距离dx,y(m,n)具体通过以下方式获得:
5.根据权利要求2所述的基于λ-SPXY算法的红外光谱多元校正回归建模方法,其特征在于,步骤S4中所述的根据剩余样本与已入选校正集的各个样本之间的距离再次进行样本的选择,并加入校正集具体包括:计算剩余样本中的每个样本与已入选校正集的各个样本之间的最短联合距离,然后选择所述最短联合距离中的最长联合距离所对应的样本加入校正集。
6.根据权利要求3所述的基于λ-SPXY算法的红外光谱多元校正回归建模方法,其特征在于,权重调整参数λ的步长递增的间隔μ为0.1。
7.根据权利要求1所述的基于λ-SPXY算法的红外光谱多元校正回归建模方法,其特征在于,所述回归建模的模型为PLS模型。
8.根据权利要求1所述的基于λ-SPXY算法的红外光谱多元校正回归建模方法,其特征在于,所述的待测样品包括啤酒、葡萄酒。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610165166.8A CN105823751B (zh) | 2016-03-22 | 2016-03-22 | 基于λ-SPXY算法的红外光谱多元校正回归建模方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610165166.8A CN105823751B (zh) | 2016-03-22 | 2016-03-22 | 基于λ-SPXY算法的红外光谱多元校正回归建模方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105823751A true CN105823751A (zh) | 2016-08-03 |
CN105823751B CN105823751B (zh) | 2018-10-02 |
Family
ID=56524335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610165166.8A Expired - Fee Related CN105823751B (zh) | 2016-03-22 | 2016-03-22 | 基于λ-SPXY算法的红外光谱多元校正回归建模方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105823751B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106778893A (zh) * | 2016-12-28 | 2017-05-31 | 东北大学 | 一种基于降维与聚类的高光谱样本选择方法 |
CN109187392A (zh) * | 2018-09-26 | 2019-01-11 | 中南大学 | 一种基于分区建模的锌液痕量金属离子浓度预测方法 |
CN113533238A (zh) * | 2021-09-15 | 2021-10-22 | 武汉敢为科技有限公司 | 一种基于吸收光谱的六氟化硫分解气体的检测方法及系统 |
CN116843998A (zh) * | 2023-08-29 | 2023-10-03 | 四川省分析测试服务中心 | 一种光谱样本加权方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101915744A (zh) * | 2010-07-05 | 2010-12-15 | 北京航空航天大学 | 物质成分含量的近红外光谱无损检测方法及装置 |
CN103528990A (zh) * | 2013-10-31 | 2014-01-22 | 天津工业大学 | 一种近红外光谱的多模型建模方法 |
CN104020135A (zh) * | 2014-06-18 | 2014-09-03 | 中国科学院重庆绿色智能技术研究院 | 基于近红外光谱的校正模型建模方法 |
CN104062257A (zh) * | 2013-04-15 | 2014-09-24 | 山东东阿阿胶股份有限公司 | 一种基于近红外光谱测定溶液中总黄酮含量的方法 |
CN104062256A (zh) * | 2013-04-15 | 2014-09-24 | 山东东阿阿胶股份有限公司 | 一种基于近红外光谱的软测量方法 |
-
2016
- 2016-03-22 CN CN201610165166.8A patent/CN105823751B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101915744A (zh) * | 2010-07-05 | 2010-12-15 | 北京航空航天大学 | 物质成分含量的近红外光谱无损检测方法及装置 |
CN104062257A (zh) * | 2013-04-15 | 2014-09-24 | 山东东阿阿胶股份有限公司 | 一种基于近红外光谱测定溶液中总黄酮含量的方法 |
CN104062256A (zh) * | 2013-04-15 | 2014-09-24 | 山东东阿阿胶股份有限公司 | 一种基于近红外光谱的软测量方法 |
CN103528990A (zh) * | 2013-10-31 | 2014-01-22 | 天津工业大学 | 一种近红外光谱的多模型建模方法 |
CN104020135A (zh) * | 2014-06-18 | 2014-09-03 | 中国科学院重庆绿色智能技术研究院 | 基于近红外光谱的校正模型建模方法 |
Non-Patent Citations (3)
Title |
---|
HE ZHONGHAI 等: "Design of a reference value-based sample-selection method and evaluation of its prediction capability", 《CHEMOMETRICS AND INTELLIGENT LABORATORY SYSTEMS》 * |
刘伟 等: "光谱多元分析校正集和验证集样本分布优选方法研究", 《光谱学与光谱分析》 * |
詹雪艳 等: "校正集选择方法对于积雪草总苷中积雪草苷NIR定量模型的影响", 《光谱学与光谱分析》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106778893A (zh) * | 2016-12-28 | 2017-05-31 | 东北大学 | 一种基于降维与聚类的高光谱样本选择方法 |
CN106778893B (zh) * | 2016-12-28 | 2019-05-07 | 东北大学 | 一种基于降维与聚类的高光谱样本选择方法 |
CN109187392A (zh) * | 2018-09-26 | 2019-01-11 | 中南大学 | 一种基于分区建模的锌液痕量金属离子浓度预测方法 |
CN113533238A (zh) * | 2021-09-15 | 2021-10-22 | 武汉敢为科技有限公司 | 一种基于吸收光谱的六氟化硫分解气体的检测方法及系统 |
CN116843998A (zh) * | 2023-08-29 | 2023-10-03 | 四川省分析测试服务中心 | 一种光谱样本加权方法及系统 |
CN116843998B (zh) * | 2023-08-29 | 2023-11-14 | 四川省分析测试服务中心 | 一种光谱样本加权方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105823751B (zh) | 2018-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105823751A (zh) | 基于λ-SPXY算法的红外光谱多元校正回归建模方法 | |
Košir et al. | Use of SNIF-NMR and IRMS in combination with chemometric methods for the determination of chaptalisation and geographical origin of wines (the example of Slovenian wines) | |
CN104062256B (zh) | 一种基于近红外光谱的软测量方法 | |
CN104089911A (zh) | 基于一元线性回归的光谱模型传递方法 | |
CN101750404B (zh) | 校正等离子体发射谱线自吸收效应的方法 | |
CN103134767B (zh) | 一种红外光谱校正鉴定白酒品质的方法 | |
CN104990894B (zh) | 一种基于加权吸光度及相似样本的汽油性质检测方法 | |
CN106815643A (zh) | 基于随机森林迁移学习的红外光谱模型传递方法 | |
CN105630743A (zh) | 一种光谱波数的选择方法 | |
CN106680238B (zh) | 基于红外光谱分析物质成分含量的方法 | |
CN105092519B (zh) | 基于增量偏最小二乘法的样品成份测定方法 | |
CN101216419A (zh) | 一种快速检测黄酒品质指标的方法 | |
CN110726694A (zh) | 光谱变量梯度集成遗传算法的特征波长选择方法和系统 | |
Berg et al. | Point and density forecasts for the euro area using Bayesian VARs | |
CN105044198A (zh) | 一种基于矿质元素指纹鉴别葡萄酒原产地的方法 | |
CN101726451A (zh) | 一种测定内燃机油粘度指数的方法 | |
CN105203498A (zh) | 一种基于lasso的近红外光谱变量选择方法 | |
CN106951720A (zh) | 基于典型相关性分析及线性插值的土壤养分模型转移方法 | |
CN103134763B (zh) | 由红外光谱预测原油密度的方法 | |
CN104881718A (zh) | 基于多尺度经济先行指标的区域电力景气指数构建方法 | |
CN104809235A (zh) | 一种节目评价系统及方法 | |
CN102954946B (zh) | 由红外光谱测定原油硫含量的方法 | |
CN102998276B (zh) | 由红外光谱测定原油实沸点蒸馏曲线的方法 | |
Manzardo et al. | Combination of product environmental footprint method and eco-design process according to ISO 14006: The case of an Italian vinery | |
CN108564248A (zh) | 一种中药生产过程质量控制的模型建立方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20181002 |
|
CF01 | Termination of patent right due to non-payment of annual fee |