CN106596450A - 基于红外光谱分析物质成分含量的增量式方法 - Google Patents
基于红外光谱分析物质成分含量的增量式方法 Download PDFInfo
- Publication number
- CN106596450A CN106596450A CN201710009517.0A CN201710009517A CN106596450A CN 106596450 A CN106596450 A CN 106596450A CN 201710009517 A CN201710009517 A CN 201710009517A CN 106596450 A CN106596450 A CN 106596450A
- Authority
- CN
- China
- Prior art keywords
- data
- aiming field
- infrared spectrum
- component content
- material component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 106
- 239000000463 material Substances 0.000 title claims abstract description 104
- 238000004458 analytical method Methods 0.000 title claims abstract description 39
- 238000004566 IR spectroscopy Methods 0.000 title abstract 2
- 238000012546 transfer Methods 0.000 claims abstract description 98
- 230000003595 spectral effect Effects 0.000 claims abstract description 88
- 238000012360 testing method Methods 0.000 claims abstract description 22
- 238000002329 infrared spectrum Methods 0.000 claims description 129
- 239000011159 matrix material Substances 0.000 claims description 78
- 238000001228 spectrum Methods 0.000 claims description 55
- 230000008569 process Effects 0.000 claims description 49
- 206010027476 Metastases Diseases 0.000 claims description 26
- 230000009401 metastasis Effects 0.000 claims description 26
- 238000000605 extraction Methods 0.000 claims description 22
- 230000008859 change Effects 0.000 claims description 17
- 239000000126 substance Substances 0.000 claims description 15
- 238000010238 partial least squares regression Methods 0.000 claims description 12
- 230000008901 benefit Effects 0.000 claims description 9
- 230000000717 retained effect Effects 0.000 claims description 8
- 239000004576 sand Substances 0.000 claims description 8
- 238000012512 characterization method Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 5
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 2
- 235000008434 ginseng Nutrition 0.000 claims description 2
- 240000002853 Nelumbo nucifera Species 0.000 claims 1
- 235000006508 Nelumbo nucifera Nutrition 0.000 claims 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 claims 1
- 244000131316 Panax pseudoginseng Species 0.000 claims 1
- 239000012925 reference material Substances 0.000 claims 1
- 238000012549 training Methods 0.000 description 13
- 240000008042 Zea mays Species 0.000 description 10
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 10
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 10
- 235000005822 corn Nutrition 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000013508 migration Methods 0.000 description 6
- 230000005012 migration Effects 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 229920002472 Starch Polymers 0.000 description 3
- 238000009415 formwork Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000004611 spectroscopical analysis Methods 0.000 description 3
- 235000019698 starch Nutrition 0.000 description 3
- 239000008107 starch Substances 0.000 description 3
- 238000013526 transfer learning Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000001373 regressive effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 241000282461 Canis lupus Species 0.000 description 1
- 238000010987 Kennard-Stone algorithm Methods 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 229940125904 compound 1 Drugs 0.000 description 1
- 229940125782 compound 2 Drugs 0.000 description 1
- 229940126214 compound 3 Drugs 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及一种基于红外光谱分析物质成分含量的增量式方法,包括以下步骤:根据源域红外光谱数据和源域物质成分含量建立第一回归模型;获取目标域标准样本,建立目标域红外光谱标准数据与源域红外光谱数据之间的转移模型;根据所述第一回归模型和所述转移模型建立第二回归模型;获取目标域红外光谱增量数据和目标域物质成分含量增量数据,利用第二回归模型对所述目标域红外光谱增量数据进行筛选,如果满足要求则保留;直至被保留的数量达到阈值,利用所述新目标域标准样本,获取新转移模型和新第二回归模型;获取目标域红外光谱测试数据,根据所述目标域红外光谱测试数据和所述新第二回归模型获取目标域物质成分含量。效率高。
Description
技术领域
本发明涉及红外光谱分析领域,具体而言,涉及一种基于红外光谱分析物质成分含量的增量式方法。
背景技术
通过红外光谱分析可获知物质成分含量。通过测量红外光谱,对其进行分析,从而获知物质成分含量,不仅可以定性分析,也可定量分析。但是在实际的工业生产过程中,数据以数据流的形式不定时到达,当有新的样本到来时,需要对模型进行实时的更新。然而,传统的标定迁移方法均以批处理模型建立模型,只能通过结合新旧数据重复建模的方法来更新模型,这种方法往往需要占用大量的时间和存储空间,不适合实际生产中的应用。
发明内容
本发明为了解决现有的重新建模效率低的问题,提出了一种基于红外光谱分析物质成分含量的增量式方法,包括以下步骤:
S1,根据源域红外光谱数据和与所述源域红外光谱数据对应的源域物质成分含量建立第一回归模型,求取所述第一回归模型中的参数;
S2,获取目标域标准样本,所述目标域标准样本包括目标域红外光谱标准数据和目标域物质浓度标准数据,建立目标域红外光谱标准数据与源域红外光谱数据之间的转移模型,求取所述转移模型中的参数;
S3,根据所述第一回归模型和所述转移模型建立第二回归模型;
S4,获取目标域红外光谱增量数据和目标域物质成分含量增量数据,利用第二回归模型对所述目标域红外光谱增量数据进行筛选,如果满足要求则保留所述目标域红外光谱增量数据和与所述目标域红外光谱增量数据对应的目标域物质成分含量增量数据;
S5,重复执行步骤S4直至被保留的目标域红外光谱增量数据的数量达到阈值,然后形成新目标域标准样本,所述新目标域标准样本包含上述被保留的目标域物质成分含量增量数据和目标域红外光谱增量数据;将所述新目标域标准样本设定为所述目标域标准样本,利用步骤S2和步骤S3获取新转移模型和新第二回归模型;
S6.获取目标域红外光谱测试数据,根据所述目标域红外光谱测试数据和所述新第二回归模型获取目标域物质成分含量。
进一步地,所述利用第二回归模型对所述目标域红外光谱增量数据进行筛选的步骤包括:根据所述目标域红外光谱增量数据和所述第二回归模型获取目标域物质成分含量增量预测数据,比较所述目标域物质成分含量增量数据和所述目标域物质成分含量增量预测数据,如果二者差值大于阈值则满足要求。
进一步地,所述根据所述目标域红外光谱增量数据和所述第二回归模型获取目标域物质成分含量增量预测数据的步骤包括:利用所述目标域标准样本的均值对所述目标域红外光谱增量数据坐中心化处理,利用下式依次递推求取与所述目标域红外光谱增量数据对应的增量光谱特征,其中,i大于等于1且小于等于k,TT_incre为第三光谱特征,k为第三光谱特征的个数,为第二标准投影数据的第i个分量,为中心化处理后的目标域红外光谱增量数据的第i个残差项,为第二标准载荷数据的第i个分狼。;利用下式求取出所述目标域物质成分含量增量预测数据,其中M为转移模型中的参数,B为第一回归模型中的参数,mean(yS_cal)为源域物质成分含量的均值,为目标域物质成分含量增量预测数据。
进一步地,所述第一回归模型为偏最小二乘回归模型,所述步骤S1包括,对所述源域红外光谱数据进行特征提取获取第一光谱特征,根据所述第一光谱特征和源域物质成分含量建立所述偏最小二乘回归模型,求出回归系数。
进一步地,所述目标域红外光谱数据包括目标域红外光谱标准数据和目标域红外光谱测试数据,所述步骤S2包括根据所述目标域红外光谱标准数据进行特征提取获取第二标准光谱特征;根据所述第一标准光谱特征和所述第二标准光谱特征建立所述转移模型,求出转移矩阵。
进一步地,所述步骤S6包括,根据所述目标域红外光谱测试数据获取第三光谱特征,将所述第三光谱特征和所述转移模型带入到所述最小偏二乘回归模型中获取所述目标域物质成分含量。
进一步地,所述对所述源域红外光谱数据进行特征提取获取第一光谱特征的步骤包括,对所述源域红外光谱数据和源域物质成分含量进行中心化处理,根据中心化处理后的源域红外光谱数据和源域物质成分含量建立最小二乘回归模型获取所述第一光谱特征。
进一步地,还包括目标域标准物质成分含量,所述根据所述目标域红外光谱标准数据进行特征提取获取第二标准光谱特征的步骤包括:对所述目标域红外光谱标准数据和所述目标域标准物质成分含量进行中心化处理,根据中心化处理后的目标域红外光谱标准数据和目标域标准物质成分含量建立偏最小二乘回归模型获取第二标准光谱特征。
进一步地,所述步骤S2中,获取第二标准光谱特征的同时,还获取了第二标准投影数据和第二标准载荷数据;所述步骤S6中根据所述目标域红外光谱测试数据获取第三光谱特征的步骤包括,利用所述目标域红外光谱标准数据的均值对所述目标域红外光谱测试数据进行中心化处理,利用中心化处理后的目标域红外光谱测试数据按照下式依次递推获取第三光谱特征:其中,i大于等于1且小于等于k,TT_test为第三光谱特征,k为第三光谱特征的个数,为第二标准投影数据的第i个分量,为中心化处理后的目标域红外光谱测试数据的第i个残差项,为第二标准载荷数据的第i个分量。
进一步地,通过求解下式的最优化问题,其中,B表示基于源域特征回归模型的系数,M表示目标域特征到源域特征的转移矩阵,WS和WT分别表示源域和目标域的投影矩阵。通过TS=XS*WS求解第一光谱特征,其中第一光谱特征为i大于等于1且小于等于k,k为第一光谱特征的个数;通过计算回归系数ΒT=[b1,b2,...,bk],y表示源域物质成分含量。
进一步地,通过下式求取第二标准光谱特征,TT=XT*WT,其中第二标准光谱特征为i大于等于1且小于等于k,k为第二光谱特征的个数。利用第二标准光谱特征和第一光谱特征通过下式获取转移矩阵Μ=[m1,m2,...,mk],其中从中选取。
通过上述实施例的技术方案,本发明的基于红外光谱分析物质成分含量的增量式方法建立源域和目标域样本特征之间的转移关系,一方面可以去除冗余信息,获得更加准确简单的转移关系,因此可以获得较好的预测效果,另一方面对于高维小样本数据集可以很大程度上减少运算量。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1为本发明实施例基于红外光谱分析物质成分含量的方法的流程示意图;
图2为本发明实施例基于红外光谱分析物质成分含量的方法的流程示意图;
图3为本发明实施例基于红外光谱分析物质成分含量的增量式方法的流程示意图;
图4为本发明实施例基于红外光谱分析物质成分含量的增量式方法的流程示意图;
图5为本发明实施例水份含量的CT_ipls模型更新前后预测值与真实值的比较示意图;
图6为本发明油份含量的CT_ipls模型更新前后预测值与真实值的比较示意图;
图7为本发明蛋白质含量的CT_ipls模型更新前后预测值与真实值的比较示意图;
图8为本发明淀粉含量的CT_ipls模型更新前后预测值与真实值的比较示意图;
图9为本发明活性成分1含量的CT_ipls模型更新前后预测值与真实值的比较示意图;
图10为本发明活性成分2含量的CT_ipls模型更新前后预测值与真实值的比较示意图;
图11为本发明活性成分3含量的CT_ipls模型更新前后预测值与真实值的比较示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
实施例一
如图1所示,本发明提供了一种基于红外光谱分析物质成分含量的方法,包括以下步骤:
S101,根据源域红外光谱数据和与所述源域红外光谱数据对应的源域物质成分含量建立第一回归模型,求取所述第一回归模型中的参数;所述第一回归模型例如为偏最小二乘回归模型,对所述源域红外光谱数据进行特征提取获取第一光谱特征,根据所述第一光谱特征和源域物质成分含量建立所述偏最小二乘回归模型,求出回归系数;具体地,所述对所述源域红外光谱数据进行特征提取获取第一光谱特征的步骤包括,对所述源域红外光谱数据和源域物质成分含量进行中心化处理,根据中心化处理后的源域红外光谱数据和源域物质成分含量建立最小二乘回归模型获取所述第一光谱特征。中心化处理的操作为,用源域红外光谱数据减去源域红外光谱数据的均值,用源域物质成分含量减去源域物质成分含量的均值,减少误差对建立模型的影响。
具体地,通过求解下式的最优化问题,其中,B表示基于源域特征回归模型的系数,M表示目标域特征到源域特征的转移矩阵,WS和WT分别表示源域和目标域的投影。通过TS=XS*WS求解第一光谱特征,其中第一光谱特征为i大于等于1且小于等于k,k为第一光谱特征的个数;通过计算回归系数ΒT=[b1,b2,...,bk],y表示源域物质成分含量。
S102,获取目标域红外光谱数据,建立目标域红外光谱数据与源域红外光谱数据之间的转移模型,求取所述转移模型中的参数;所述目标域红外光谱数据包括目标域红外光谱标准数据和目标域红外光谱测试数据,根据所述目标域红外光谱标准数据进行特征提取获取第二标准光谱特征;根据所述第一光谱特征和所述第二标准光谱特征建立所述转移模型,求出转移矩阵,为了提高准确性,可从所述第一光谱特征中选取部分光谱特征与所述第二标准光谱特征建立转移模型,选取时对应按照物质浓度相对应选取,如可采取,源域物质成分含量与目标域标准物质浓度相同的数据集来进行运算。
具体地,通过下式求取第二标准光谱特征,TT=XT*WT,其中第二标准光谱特征为i大于等于1且小于等于k,k为第二光谱特征的个数。利用第二标准光谱特征和第一光谱特征通过下式获取转移矩阵Μ=[m1,m2,...,mk],i大于等于1且小于等于k,k为第二标准光谱特征的个数,其中从中选取。
S103,根据所述目标域红外光谱数据、所述转移模型,利用所述第一回归模型获取与所述目标域红外光谱数据对应的目标域物质成分含量;具体地,将所述转移模型带入到所述第一回归模型中,形成第二回归模型,然后将所述目标域红外光谱数据带入到所述第二回归模型中,最终获得目标域物质成分含量;具体地,根据所述目标域红外光谱测试数据获取第三光谱特征,将所述第三光谱特征和所述转移模型带入到所述最小偏二乘回归模型中获取所述目标域物质成分含量。
本发明实施例还包括获取目标域标准物质成分含量,所述根据所述目标域红外光谱标准数据进行特征提取获取第二标准光谱特征的步骤包括:对所述目标域红外光谱标准数据和所述目标域标准物质成分含量进行中心化处理,根据中心化处理后的目标域红外光谱标准数据和目标域标准物质成分含量建立偏最小二乘回归模型获取第二标准光谱特征。中心化处理的步骤与上述对源于红外光谱数据的处理步骤类似。
本发明实施例中所述步骤S102获取第二标准光谱特征的同时,还获取了第二标准投影数据和第二标准载荷数据;所述步骤S103中根据所述目标域红外光谱测试数据获取第三光谱特征的步骤包括,利用所述目标域红外光谱标准数据的均值对所述目标域红外光谱测试数据进行中心化处理,利用中心化处理后的目标域红外光谱测试数据按照下式依次递推获取第三光谱特征:其中,i大于等于1且小于等于k,TT_test为第三光谱特征,k为第三光谱特征的个数,为第二标准投影数据的第i个分量,为中心化处理后的目标域红外光谱测试数据的第i个残差项,为第二标准载荷数据的第i个分量。
本发明的基于红外光谱分析物质成分含量的方法建立源域和目标域样本特征之间的转移关系,一方面可以去除冗余信息,获得更加准确简单的转移关系,因此可以获得较好的预测效果,另一方面对于高维小样本数据集可以很大程度上减少运算量。此外,仅有偏最小二乘算法(PLS算法)的潜变量一个参数需要设置,实现过程十分简单。需要说明的是,本发明中采用了“红外光谱”一词,可理解成包括了近红外光谱,也可包括中红外光谱、远红外光谱。
实施例二
本发明的基于红外光谱分析物质成分含量的方法结合迁移学习和PLS算法,形成了一种迁移标定算法(CT_pls算法),其基础思想来源于基于特征的迁移学习方法,将目标域特征映射至源域特征空间,进而可以利用源域的模型对目标域的数据进行处理。该方法首先利用PLS算法对源域样本和目标样本进行特征提取,然后建立基于源域特征的多元标定模型以及源域和目标域特征之间的线性转移模型,最后在以相同的方式对未知的目标域样本进行特征提取后转移后,利用源域标定模型对转移后的特征进行预测。
假设分别存在源域数据集{XS,y}和目标域数据集{XT,y},其中XS和XT分别由主光谱仪和从光谱仪测得,建立源域和目标域之间的标定迁移模型,实际上是求解公式(3.1)的最优化问题。
在公式(3.1)中,B表示基于源域特征回归模型的系数,M表示目标域特征到源域特征的转移矩阵,WS和WT分别表示源域和目标域的投影空间。本文选择偏最小二乘算法作为主体算法,WS和WT分别通过建立{XS,y}和{XT,y}的PLS模型求得,源域的特征TS和目标域的特征TT通过公式(3.2)求得。
在获得源域特征TS后,利用源域特征数据{TS,yS}建立多元标定模型,其中计算回归系数ΒT=[b1,b2,...,bk],k表示提取的主特征个数。
为了实现源域模型对目标域数据的有效预测,需要利用标准集进行光谱空间进行变换,公式(3.4)(3.5)表明光谱特征从目标域变换到源域的实现方法。
Τ'S←——ΤTΜ (3.4)
其中,Τ'S和TT分别是源域和目标域样本集的特征,Τ'S从中获得TS,用于计算转移矩阵Μ=[m1,m2,...,mk]。
在建立源域的标定模型以及源域和目标域之间的转移模型后,即可实现对目标域样本的有效预测,如公式(3.6)所示。
yT=TT*M*B (3.6)
具体地,如图2所示,本发明的基于红外光谱分析物质成分含量的方法包括获取源域训练集,即获取源域红外光谱数据和源域物质成分含量;获取目标域标准集,即获取目标域红外光谱标准数据和目标域标准物质成分含量;获取目标域测试集,即获取目标域红外光谱测试数据和目标域物质浓度度测试数据;对源域数据进行中心化处理,对目标域数据进行中心化处理;对源域数据利用Pls模型进行第一光谱特征提取,形成组合特征数据集,从中抽取与标准集对应的特征(即物质成分含量对应),利用组合特征数据集和pls算法建立第一回归模型,目标域标准集利用Pls进行特征提取获取第二标准光谱特征,通过pls模型求取挑选后的第一光谱特征和第二标准光谱特征之间的转移矩阵,对目标域测试数据利用目标域标准数据的投影和载荷求取第三光谱特征,将第三光谱特征和转移矩阵带入到第一回归模型中,从而获取与目标域测试数据相对应的物质成分含量。具体实现过程,包括数据预处理、特征提取、建立源域标定模型、计算转移关系、对未知目标域数据进行预测等步骤。
具体地,可通过载有计算机程序的处理器电路来实现,计算机程序流程如下:
本发明实施例的基于红外光谱分析物质成分含量的方法采用了偏最小二乘回归分析,偏最小二乘回归分析(PLS)提供一种多对多线性回归建模的方法,特别当两组变量的很多,且都存在多重相关性,而观测数据的数量(样本量)有较少时,用偏最小二乘回归分析建立的模型具有传统的经典回归分析等方法所没有的优点。当同一物品的两组测量样本来自不同测量仪器或测量状态时,两组样本不相同却相关,所以可以将来自新空间的样本迁移至参考空间,进而可以直接利用参考空间的模型对新样本进行预测。重新利用了原有模型,减小了建模成本。
1.建立基于光谱特征的PLS回归模型
首先对红外光谱数据及其对应的成分浓度建立偏最小二乘回归模型,用于获取光谱特征,光谱特征的个数通过交叉验证方法进行选取。然后对光谱特征及其对应的成分浓度重新建立PLS模型,用于计算模型的回归系数,此时的主特征(光谱特征)个数依然通过交叉验证方法进行选择。对红外光谱数据两次建立PLS模型与一次直接建立PLS模型在预测精度上基本没有影响,使用光谱特征计算的回归系数可直接对转移后目标域的光谱特征进行预测。
2.实现光谱特征间的迁移学习
不同光谱仪测得红外光谱数据的条件概率或边缘概率分布可能不同,使得原有的多元标定模型无法对目标域的红外光谱数据进行准确的预测,往往会存在很大的预测偏差,由于重新建模成本很高,因此需要将目标域的光谱特征迁移至源域,进而缩小源域和目标域在分布上差异。首先对源域和目标域中的标准光谱样本进行特征提取,然后建立特征对特征的PLS模型,计算转移矩阵。使目标域特征与转移矩阵相乘,即可实现特征的迁移。
3.对目标域光谱数据进行预测
将目标域的特征迁移至源域的特征空间后,即可直接利用源域基于特征的回归模型,对目标域的特征进行预测。从而避免了对目标域样本重新建立模型,很大程度上减小了建模成本。
实施例三
如图3所示,本发明参考实施例一和实施例二的提供了一种基于红外光谱分析物质成分含量的增量式方法的实施例,具体包括以下步骤:
S201,根据源域红外光谱数据和与所述源域红外光谱数据对应的源域物质成分含量建立第一回归模型,求取所述第一回归模型中的参数;具体地,例如,所述第一回归模型为偏最小二乘回归模型,对所述源域红外光谱数据进行特征提取获取第一光谱特征,对所述源域红外光谱数据和源域物质成分含量进行中心化处理,根据中心化处理后的源域红外光谱数据和源域物质成分含量建立最小二乘回归模型获取所述第一光谱特征,根据所述第一光谱特征和源域物质成分含量建立所述偏最小二乘回归模型,求出回归系数
S202,获取目标域标准样本,所述目标域标准样本包括目标域红外光谱标准数据和目标域物质浓度标准数据,建立目标域红外光谱标准数据与源域红外光谱数据之间的转移模型,求取所述转移模型中的参数;
S203,根据所述第一回归模型和所述转移模型建立第二回归模型;具体地,可将所述转移模型代入到所述第一回归模型中,从而形成第二回归模型;建立第二回归模型的过程与实施例一和实施例二中过程类似。
S204,获取目标域红外光谱增量数据和目标域物质成分含量增量数据,利用第二回归模型对所述目标域红外光谱增量数据进行筛选,如果满足要求则保留所述目标域红外光谱增量数据和与所述目标域红外光谱增量数据对应的目标域物质成分含量增量数据;具体地,根据所述目标域红外光谱增量数据和所述第二回归模型获取目标域物质成分含量增量预测数据,比较所述目标域物质成分含量增量数据和所述目标域物质成分含量增量预测数据,如果二者差值大于阈值则满足要求。
S205,重复执行步骤S4直至被保留的目标域红外光谱增量数据的数量达到阈值,然后形成新目标域标准样本,所述新目标域标准样本包含上述被保留的目标域红外光谱增量数据和目标域物质成分含量增量数据;将所述新目标域标准样本设定为所述目标域标准样本,利用步骤S202和步骤S203获取新转移模型和新第二回归模型;利用所述目标域标准样本的均值对所述目标域红外光谱增量数据做中心化处理,利用下式依次递推求取与所述目标域红外光谱增量数据对应的增量光谱特征,其中,i大于等于1且小于等于k,TT_incre为第三光谱特征,k为第三光谱特征的个数,为第二标准投影数据的第i个分量,为中心化处理后的目标域红外光谱增量数据的第i个残差项,为第二标准载荷数据的第i个分量;利用下式求取出所述目标域物质成分含量增量预测数据,其中M为转移模型中的参数,B为第一回归模型中的参数,mean(yS_cal)为源域物质成分含量的均值,为目标域物质成分含量增量预测数据。
S206.获取目标域红外光谱测试数据,根据所述目标域红外光谱测试数据、所述新第二回归模型获取目标域物质成分含量;具体地,根据所述目标域红外光谱测试数据获取第三光谱特征,将所述第三光谱特征和所述转移模型带入到所述最小偏二乘回归模型中获取所述目标域物质成分含量。上述形成新转移模型和新第二回归模型的过程与上述形成转移模型和第二回归模型的过程类似。
本发明的本实施例中,所述目标域红外光谱数据包括目标域红外光谱标准数据和目标域红外光谱测试数据,所述步骤S202包括根据所述目标域红外光谱标准数据进行特征提取获取第二标准光谱特征;根据所述第一标准光谱特征和所述第二标准光谱特征建立所述转移模型,求出转移矩阵。
本发明的本实施例还包括目标域标准物质成分含量,所述根据所述目标域红外光谱标准数据进行特征提取获取第二标准光谱特征的步骤包括:对所述目标域红外光谱标准数据和所述目标域标准物质成分含量进行中心化处理,根据中心化处理后的目标域红外光谱标准数据和目标域标准物质成分含量建立偏最小二乘回归模型获取第二标准光谱特征。本发明的基于红外光谱分析物质成分含量的增量式方法的实施例中,所述步骤S202中,获取第二标准光谱特征的同时,还获取了第二标准投影数据和第二标准载荷数据;所述步骤S206中根据所述目标域红外光谱测试数据获取第三光谱特征的步骤包括,利用所述目标域红外光谱标准数据的均值对所述目标域红外光谱测试数据进行中心化处理,利用中心化处理后的目标域红外光谱测试数据按照下式依次递推获取第三光谱特征:其中,i大于等于1且小于等于k,TT_test为第三光谱特征,k为第三光谱特征的个数,为第二标准投影数据的第i个分量,为中心化处理后的目标域红外光谱测试数据的第i个残差项,为第二标准载荷数据的第i个分量。
本发明的本实施例中,通过求解下式的最优化问题,其中,B表示基于源域特征回归模型的系数,M表示目标域特征到源域特征的转移矩阵,WS和WT分别表示源域和目标域的投影。通过TS=XS*WS求解第一光谱特征,其中第一光谱特征为i大于等于1且小于等于k,k为第一光谱特征的个数;通过计算回归系数ΒT=[b1,b2,...,bk],y表示源域物质成分含量。
进一步地,通过下式求取第二标准光谱特征,TT=XT*WT,其中第二标准光谱特征为i大于等于1且小于等于k,k为第二光谱特征的个数。利用第二标准光谱特征和第一光谱特征通过下式获取转移矩阵Μ=[m1,m2,...,mk],其中从中选取,选取时,根据对应物质成分含量相对应即可,例如,源域红外光谱数据对应的源域物质成分含量与目标域标准物质成分含量对应或者相等时,可选取与此源域红外光谱数据对应的第一光谱特征。
与传统的批处理方式相比,本发明中的基于红外光谱分析物质浓度的增量式方法利用增量式学习可以更好地满足工业生产的需求。由数据以数据流的形式不定时的到来,一次建立模型无法跟随数据的变化,因此批处理方式需要反复的丢弃已有模型,结合新的数据重新建立模型,这需要占用大量空间存储已有数据,并花费大量的时间重新训练模型。而增量学习方式可以利用新的数据对原有模型进行调整或样本选择,很大程度上减少建模次数,并且不需要存储原有数据。采用增量学习的方式更新转移矩阵,可以利用原有模型对新样本进行筛选,当有意义的新样本累积到一定数量时,即可更新转移矩阵。
1.筛选新样本
在计算初始转移矩阵时,使用的仅是少量的源域和目标域的标准样本,这些样本往往无法充分的表示转移关系或者跟随转移关系的变化,因此可能对一些目标域的红外光谱无法进行合理准确的转移,进而导致很大的预测偏差。为了避免这种现象,当有新的标准样本到来时,需要对转移矩阵进行更新。然而,并非所有新的标准样本都对转移矩阵起作用,因此需要进行样本筛选,去除与已有标准样本相似的样本,保留变异较大的样本作为新的标准样本,用于更新转移矩阵。
2.更新转移矩阵
若对每一个有意义的新样本都更新一次转移矩阵,一方面会增加大量的工作,另一方面,增加一个样本并不会引起转移矩阵大的改变,所以逐个样本更新转移矩阵的方法意义并不大。因此,选用累积数据块的方法更新转移矩阵,每当有意义的新样本积累到一定数量时,才重新计算一次转移矩阵。更新转移矩阵可以及时地调整转移关系,减少因初始标准样本数量少或选择不当以及目标域光谱发生变化引起的转移偏差,进而减小目标域样本的预测误差。
实施例四
在红外光谱的测量过程中,测量仪器老化和维修等,都将导致光谱变异。这些变异使已有的转移关系失效,无法将目标域样本准确的变换到源域空间,进而利用源域模型对转移后的目标域样本进行预测会出现很大的偏差。因此,为了适应光谱测量过程中的一些变化,需要对转移矩阵进行适时的更新。本发明提出一种基于红外光谱分析物质成分含量的增量式方法,其可理解为基于CT_pls的增量方法,可称为CT_ipls算法。该算法首先利用原有转移矩阵以及源域模型对新的标准样本进行预测,计算预测值与真实值的偏差,利用已设定的阈值进行筛选。若偏差大于阈值,说明此样本变异较大,携带着更多的新信息,进行保留,否则去除此样本。直到保留的样本达到一定数量时,重新计算转移矩阵。
在利用源域数据{xS,yS}和目标域数据{xT,yT}建立CT_pls模型后,获得源域PLS模型的回归系数B以及源域和目标域的转移关系矩阵Μ。当有增量样本{xT_incre,yT_incre}到来时,首先以与目标域标准集样本相同的方式对其进行中心化和特征提取。计算目标域标准样本均值如公式(4.1),对新样本进行中心化处理,如公式(4.2)。
利用目标域标准集的投影WT、特征TT、载荷PT提取xT_incre的特征TT_incre,如公式(4.3)和(4.4)。在这个公式中,表示提取前i-1个主成分后的残差。
然后,对新的样本特征TT_incre进行特征变换,将其映射到源域空间,得到变换特征T'T_incre,如公式(4.5),并利用源域模型B对T'T_incre进行预测,进而得到新样本的预测值如公式(4.6)。
T'T_incre=ΤT_incre*M (4.5)
在公式(4.6)中,表示源域中用于训练模型的样本的浓度均值。
最后,计算新样本的预测偏差Δ,公式如(4.7),并根据设定的阈值δ,进行样本筛选。若Δ≥δ,则说明此样本{xT_incre,yT_incre}携带了较多的变异信息,可以作为新的标准样本,用于更新转移矩阵。当新的标准样本积累到一定数量时,重新计算转移矩阵。
图4给出了CT_ipls算法筛选新的标准样本的流程图,包括中心处理、提取特征、特征转移、预测、选择等步骤。在中心化处理过程中,新的增量标准样本减去初始标准集均值或上一次更新转移矩阵的目标域样本均值。同样,在进行增量样本特征转移时,使用的转移矩阵为初始转移矩阵或上一次更新的转移矩阵。本流程图假定源域多元标定模型B以及源于和目标域之间的转移矩阵M已经获得,仅展示了筛选新的标准样本的过程。当积累足够的新标准样本时,重新计算转移矩阵的过程如图2所示。
本发明的基于红外光谱分析物质成分含量的增量式方法的实施例可运行在载有基于本发明分析方法编写的程序的处理器或者计算机上,其运行步骤如下:
本发明对本实施例中的分析方法进行验证,验证包括玉米数据验证和药片数据验证。
1.玉米数据集
玉米数据集的源域和目标域训练集分别包含64个样本,源域训练集用于建立参考模型,实现对转移后的目标域样本进行预测,目标域训练样本用于建立标准模型,作为标定迁移模型的迁移能力的衡量标准。为了实现对转移矩阵的增量更新,通过KS(Kennard-Stone)算法从源域和目标域训练集中分别选取30%的样本作为初始标准样本,分别为20个,用于建立初始转移关系,两个训练集中剩余的样本作为增量标准样本集,用于更新转移矩阵。玉米数据集的源域和目标域测试样本分别为16个,其中目标域测试样本,用于测试转移矩阵更新前后模型预测能力的变化以及增量式标定迁移模型的预测性能。
2.药片数据集
药片数据集的源域和目标域训练集分别包含155个样本,通过KS算法分别从两个训练集中选取30%作为初始标准集,分别为47个,两个训练集剩余的样本作为增量标准样本。药片数据集的源域和目标域测试集分别包含460个样本,其中目标域的测试样本用于测试标定迁移模型的预测性能。
具体验证过程如下:
1.数据预处理方法
本发明实施例中,在使用源域的训练集数据建立参考模型和使用源域和目标域标准集样本计算转移关系过程中,均采用中心化的方法对数据进行预处理。因而,在CT_ipls模型对增量样本进行筛选时,也要对增量样本进行相同的中心化处理,即仍减去初始标准样本的均值或上一次更新的标准样本的均值。
2.参数选择(数据块中的样本数)
CT_ipls算法(基于红外光谱分析物质成分含量的增量式方法)以数据块的形式对转移矩阵进行更新,每当筛选的新样本数与初始标准样本数相同时,便重新计算一次转移矩阵。为了保证转移矩阵至少执行一次更新以及模型的预测性能,本发明实施例选取训练样本的30%作为初始样本。因此,对于玉米数据集和药片数据集,新的标准样本数分别达到20和30个时,更新转移矩阵。对于其他参数的选择,都采用交叉验证的方法,与CT_pls方法相同。
3.模型评估
本发明实施例使用预测误差来评价CT_ipls算法的预测性能,通过转移矩阵更新前后模型预测误差的变化,可以评估CT_ipls模型是否有效。预测误差的计算方法如公式(3.1)。
本发明实施例采用玉米数据集和药片数据集进行实验。实验结果包含两部分:(1)转移矩阵更新前后的RMSEP(测试集的预测误差)以及更新次数。(2)转移矩阵更新前后,CT_ipls模型预测值与真实值的对比图。
表4.1给出了玉米数据集中对应于水份、油份、蛋白质、脂肪含量的CT_ipls模型转移矩阵更新前后的RMSEP以及转移矩阵的更新次数。
表4.1玉米各个组分含量的CT_ipls模型更新前后的RMSEP及更新次数
从表4.1中可以看出,玉米数据集关于水份、油份、淀粉含量的CT_ipls模型的转移矩阵更新了1次,而关于蛋白质含量的CT_ipls模型的转移矩阵没有进行更新。并且根据转移矩阵更新前后的RMSEP可以看出,更新后模型的RMSEP小于更新签的RMSEP,说明新的标准样本集包含了更多的有效信息,进而使得转移关系更加准确,CT_ipls模型获得更好的预测性能。图5-图8展示了玉米数据集关于水份、油份、淀粉含量的CT_ipls模型的在转移矩阵更新前后真实值和预测值的关系图。
在图5-图8中,五角星形标注点表示转移矩阵更新后的图形,圆形标注点表示转移矩阵未更新的图形,且越接近直线y=x表示预测值与真实越接近,RMSEP越小,预测效果越好。可以看出五角星形标注点比圆形标注点更加集中于直线y=x附近,说明使用CT_ipls算法更新转移矩阵后,获得了更好的预测效果。
表4.2给出了药片数据集中对应于两种活性成分含量的CT_ipls模型转移矩阵更新前后的RMSEP以及转移矩阵的更新次数。
表4.2药片中两种活性成分含量的CT_ipls模型更新前后的RMSEP及更新次数
从表4.2中可以看出,关于第一种活性成分含量和第三种活性成分含量的CT_ipls模型在转移矩阵更新后,RMSEP变小了,由于转移矩阵更新前后,源域模型没有发生改变,说明新的标准样本集中包含了更有效的信息,使得源域和目标域的准换关系更准确、全面。然而,关于第二种活性成分含量的CT_ipls模型在转移矩阵更新后,RMSEP却稍有增加,由于在转移矩阵更新前后,测试集的样本没有发生改变,说明初始的转移矩阵更适合表征源域和目标域之间的关系。
图9、图10、图11分别展示了药片数据集中对应于三种活性成分含量的CT_ipls模型的在转移矩阵更新前后真实值和预测值的关系图。
从图9中可以看出,五角星形的标注点比圆形标注点更加接近直线y=x,说明在更新转移矩阵后,CT_ipls模型获得更好的预测精度。图10中的存在个别星形标注点比圆形标注点稍偏离直线y=x,说明CT_ipls模型在转移矩阵更新后,预测能力稍有降低。从图10中可以看出五角星形的标注点比圆形标注点更加集中于直线y=x附近,说明更新转移矩阵,获得了更加准确的转移关系,使得目标域数据更加准确地被预测。因此图9、图10、图11展示的结果与表4.2展示的结果一致。
CT_ipls算法(基于红外光谱分析物质成分含量的增量式方法)从增量数据集选取新的标准样本更新转移矩阵,可能出现RMSEP变小、不变、变大三种情况。其中,第一种是预期情况,原有标准样本集中包含有限的信息,而新的标准样本集包含更多有效信息,更新转移矩阵后获得更加准确的转移关系;第二种属于正常情况,原有标准集中已包含充足的信息,无法再增量集中提取更多的有限信息,因此不需要对转移矩阵进行更新;第三种情况是由于测试样本固定引起的,虽然新的标准样本集包含了与原有标准样本集之间存在着差异,但是原有标准样本集对应的准换关系更适合测试样本。在大体上,CT_ipls算法的增量式更新转移矩阵的方法可以获得更好的预测效果,并且与批处理模式更新模型的方法相比,在很大程度上减少更新模型的次数,节约了大量的成本和时间。
在本发明中,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。术语“多个”指两个或两个以上,除非另有明确的限定。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于红外光谱分析物质成分含量的增量式方法,其特征在于,包括以下步骤:
S1,根据源域红外光谱数据和与所述源域红外光谱数据对应的源域物质成分含量建立第一回归模型,求取所述第一回归模型中的参数;
S2,获取目标域标准样本,所述目标域标准样本包括目标域红外光谱标准数据和目标域物质浓度标准数据,建立目标域红外光谱标准数据与源域红外光谱数据之间的转移模型,求取所述转移模型中的参数;
S3,根据所述第一回归模型和所述转移模型建立第二回归模型;
S4,获取目标域红外光谱增量数据和目标域物质成分含量增量数据,利用第二回归模型对所述目标域红外光谱增量数据进行筛选,如果满足要求则保留所述目标域红外光谱增量数据和与所述目标域红外光谱增量数据对应的目标域物质成分含量增量数据;
S5,重复执行步骤S4直至被保留的目标域红外光谱增量数据的数量达到阈值,然后形成新目标域标准样本,所述新目标域标准样本包含上述被保留的目标域红外光谱增量数据和目标域物质成分含量增量数据;将所述新目标域标准样本设定为所述目标域标准样本,利用步骤S2和步骤S3获取新转移模型和新第二回归模型;
S6.获取目标域红外光谱测试数据,根据所述目标域红外光谱测试数据,所述新第二回归模型获取目标域物质成分含量。
2.根据权利要求1所述的基于红外光谱分析物质成分含量的增量式方法,其特征在于,所述利用第二回归模型对所述目标域红外光谱增量数据进行筛选的步骤包括:根据所述目标域红外光谱增量数据和所述第二回归模型获取目标域物质成分含量增量预测数据,比较所述目标域物质成分含量增量数据和所述目标域物质成分含量增量预测数据,如果二者差值大于阈值则满足要求。
3.根据权利要求2所述的基于红外光谱分析物质成分含量的增量式方法,其特征在于,所述根据所述目标域红外光谱增量数据和所述第二回归模型获取目标域物质成分含量增量预测数据的步骤包括:利用所述目标域标准样本的均值对所述目标域红外光谱增量数据做中心化处理,利用下式依次递推求取与所述目标域红外光谱增量数据对应的增量光谱特征,其中,i大于等于1且小于等于k,TT_incre为第三光谱特征,k为第三光谱特征的个数,为第二标准投影数据的第i个分量,为中心化处理后的目标域红外光谱增量数据的第i个残差项,为第二标准载荷数据的第i个分量;利用下式求取出所述目标域物质成分含量增量预测数据,其中M为转移模型中的参数,B为第一回归模型中的参数,mean(yS_cal)为源域物质成分含量的均值,为目标域物质成分含量增量预测数据。
4.根据权利要求1所述的基于红外光谱分析物质成分含量的增量式方法,其特征在于,所述第一回归模型为偏最小二乘回归模型,所述步骤S1包括,对所述源域红外光谱数据进行特征提取获取第一光谱特征,根据所述第一光谱特征和源域物质成分含量建立所述偏最小二乘回归模型,求出回归系数。
5.根据权利要求4所述的基于红外光谱分析物质成分含量的增量式方法,其特征在于,所述目标域红外光谱数据包括目标域红外光谱标准数据和目标域红外光谱测试数据,所述步骤S2包括根据所述目标域红外光谱标准数据进行特征提取获取第二标准光谱特征;根据所述第一标准光谱特征和所述第二标准光谱特征建立所述转移模型,求出转移矩阵。
6.根据权利要求5所述的基于红外光谱分析物质成分含量的增量式方法,其特征在于,所述步骤S6包括,根据所述目标域红外光谱测试数据获取第三光谱特征,将所述第三光谱特征和所述转移模型带入到所述最小偏二乘回归模型中获取所述目标域物质成分含量。
7.根据权利要求4所述的基于红外光谱分析物质成分含量的增量式方法,其特征在于,所述对所述源域红外光谱数据进行特征提取获取第一光谱特征的步骤包括,对所述源域红外光谱数据和源域物质成分含量进行中心化处理,根据中心化处理后的源域红外光谱数据和源域物质成分含量建立最小二乘回归模型获取所述第一光谱特征。
8.根据权利要求5所述的基于红外光谱分析物质成分含量的增量式方法,其特征在于,还包括目标域标准物质成分含量,所述根据所述目标域红外光谱标准数据进行特征提取获取第二标准光谱特征的步骤包括:对所述目标域红外光谱标准数据和所述目标域标准物质成分含量进行中心化处理,根据中心化处理后的目标域红外光谱标准数据和目标域标准物质成分含量建立偏最小二乘回归模型获取第二标准光谱特征。
9.根据权利要求6所述的基于红外光谱分析物质成分含量的增量式方法,其特征在于,所述步骤S2中,获取第二标准光谱特征的同时,还获取了第二标准投影数据和第二标准载荷数据;所述步骤S6中根据所述目标域红外光谱测试数据获取第三光谱特征的步骤包括,利用所述目标域红外光谱标准数据的均值对所述目标域红外光谱测试数据进行中心化处理,利用中心化处理后的目标域红外光谱测试数据按照下式依次递推获取第三光谱特征:其中,i大于等于1且小于等于k,TT_test为第三光谱特征,k为第三光谱特征的个数,为第二标准投影数据的第i个分量,为中心化处理后的目标域红外光谱测试数据的第i个残差项,为第二标准载荷数据的第i个分量。
10.根据权利要求2所述的基于红外光谱分析物质成分含量的增量式方法,其特征在于,求解下式的最优化问题,其中,B表示基于源域特征回归模型的系数,M表示目标域特征到源域特征的转移矩阵,WS和WT分别表示源域和目标域的投影,通过TS=XS*WS求解第一光谱特征,其中第一光谱特征为TS=[tS1,tS2,...,tSk],i大于等于1且小于等于k,k为第一光谱特征的个数;通过计算回归系数ΒT=[b1,b2,...,bk],y表示源域物质成分含量;通过下式求取第二标准光谱特征,TT=XT*WT,其中第二标准光谱特征为i大于等于1且小于等于k,k为第二光谱特征的个数;利用第二标准光谱特征和第一光谱特征通过下式获取转移矩阵Μ=[m1,m2,...,mk],其中从中选取。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710009517.0A CN106596450B (zh) | 2017-01-06 | 2017-01-06 | 基于红外光谱分析物质成分含量的增量式方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710009517.0A CN106596450B (zh) | 2017-01-06 | 2017-01-06 | 基于红外光谱分析物质成分含量的增量式方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106596450A true CN106596450A (zh) | 2017-04-26 |
CN106596450B CN106596450B (zh) | 2019-04-05 |
Family
ID=58582894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710009517.0A Active CN106596450B (zh) | 2017-01-06 | 2017-01-06 | 基于红外光谱分析物质成分含量的增量式方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106596450B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107918718A (zh) * | 2017-11-03 | 2018-04-17 | 东北大学秦皇岛分校 | 基于在线顺序极限学习机的样品成分含量测定方法 |
CN109580413A (zh) * | 2017-09-28 | 2019-04-05 | 宁海德宝立新材料有限公司 | 一种二元混合物的红外光谱分析方法及其应用 |
CN109389162B (zh) * | 2018-09-28 | 2019-11-19 | 北京达佳互联信息技术有限公司 | 样本图像筛选方法和装置、电子设备及存储介质 |
CN111220565A (zh) * | 2020-01-16 | 2020-06-02 | 东北大学秦皇岛分校 | 一种基于cpls的红外光谱测量仪器标定迁移方法 |
CN111220566A (zh) * | 2020-01-16 | 2020-06-02 | 东北大学秦皇岛分校 | 基于opls和pds的红外光谱测量仪器标定迁移方法 |
CN111563436A (zh) * | 2020-04-28 | 2020-08-21 | 东北大学秦皇岛分校 | 一种基于ct-cdd的红外光谱测量仪器标定迁移方法 |
CN113552091A (zh) * | 2021-08-24 | 2021-10-26 | 江南大学 | 一种高纯度2,6-二甲酚近红外光谱在线检测方法 |
WO2024066762A1 (zh) * | 2022-09-30 | 2024-04-04 | 上海立迪生物技术股份有限公司 | 一种成像质谱流式的信号校准方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62107355A (ja) * | 1985-11-05 | 1987-05-18 | Nec Corp | デ−タ処理装置 |
GB9605670D0 (en) * | 1996-03-18 | 1996-05-22 | Ibm | Inital program load in data processing network |
CN101118214A (zh) * | 2007-09-04 | 2008-02-06 | 厦门中药厂有限公司 | 一种利用aotf近红外光谱仪检测中药中微生物的方法 |
CN101915744A (zh) * | 2010-07-05 | 2010-12-15 | 北京航空航天大学 | 物质成分含量的近红外光谱无损检测方法及装置 |
-
2017
- 2017-01-06 CN CN201710009517.0A patent/CN106596450B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62107355A (ja) * | 1985-11-05 | 1987-05-18 | Nec Corp | デ−タ処理装置 |
GB9605670D0 (en) * | 1996-03-18 | 1996-05-22 | Ibm | Inital program load in data processing network |
CN101118214A (zh) * | 2007-09-04 | 2008-02-06 | 厦门中药厂有限公司 | 一种利用aotf近红外光谱仪检测中药中微生物的方法 |
CN101915744A (zh) * | 2010-07-05 | 2010-12-15 | 北京航空航天大学 | 物质成分含量的近红外光谱无损检测方法及装置 |
Non-Patent Citations (4)
Title |
---|
GARMARUDI A B,ET AL.: "Near infraredspectrometric analysis of titanium dioxide nano particles for size classification", 《NANOTECHNOLOGY (IEEE-NANO)》 * |
GOMBAS A ET AL.: "Quantitativedeterminationof crystallinityofalpha-lactosemonohydratebyNearInfraredSpectroscopy (NIRS) ", 《INTJPHARM,》 * |
刘月: "基于NIR光谱的半监督在线序列ELM回归算法研究", 《中国优秀硕士学位论文全文数据库 基础科学辑》 * |
华正宇: "基于SLT的偏最小二乘分类算法及其优化方法研究", 《中国优秀硕士论文全文数据库 信息科技辑》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109580413A (zh) * | 2017-09-28 | 2019-04-05 | 宁海德宝立新材料有限公司 | 一种二元混合物的红外光谱分析方法及其应用 |
CN107918718A (zh) * | 2017-11-03 | 2018-04-17 | 东北大学秦皇岛分校 | 基于在线顺序极限学习机的样品成分含量测定方法 |
CN107918718B (zh) * | 2017-11-03 | 2020-05-22 | 东北大学秦皇岛分校 | 基于在线顺序极限学习机的样品成分含量测定方法 |
CN109389162B (zh) * | 2018-09-28 | 2019-11-19 | 北京达佳互联信息技术有限公司 | 样本图像筛选方法和装置、电子设备及存储介质 |
CN111220565A (zh) * | 2020-01-16 | 2020-06-02 | 东北大学秦皇岛分校 | 一种基于cpls的红外光谱测量仪器标定迁移方法 |
CN111220566A (zh) * | 2020-01-16 | 2020-06-02 | 东北大学秦皇岛分校 | 基于opls和pds的红外光谱测量仪器标定迁移方法 |
CN111220565B (zh) * | 2020-01-16 | 2022-07-29 | 东北大学秦皇岛分校 | 一种基于cpls的红外光谱测量仪器标定迁移方法 |
CN111563436A (zh) * | 2020-04-28 | 2020-08-21 | 东北大学秦皇岛分校 | 一种基于ct-cdd的红外光谱测量仪器标定迁移方法 |
CN111563436B (zh) * | 2020-04-28 | 2022-04-08 | 东北大学秦皇岛分校 | 一种基于ct-cdd的红外光谱测量仪器标定迁移方法 |
CN113552091A (zh) * | 2021-08-24 | 2021-10-26 | 江南大学 | 一种高纯度2,6-二甲酚近红外光谱在线检测方法 |
WO2024066762A1 (zh) * | 2022-09-30 | 2024-04-04 | 上海立迪生物技术股份有限公司 | 一种成像质谱流式的信号校准方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106596450B (zh) | 2019-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106596450B (zh) | 基于红外光谱分析物质成分含量的增量式方法 | |
CN106680238B (zh) | 基于红外光谱分析物质成分含量的方法 | |
Meuwly et al. | A guideline for the validation of likelihood ratio methods used for forensic evidence evaluation | |
US11144576B2 (en) | Target class feature model | |
WO2016000088A1 (zh) | 一种基于最佳指数-相关系数法的高光谱波段提取方法 | |
CN104949936B (zh) | 基于优化偏最小二乘回归模型的样品成份测定方法 | |
CN105630743B (zh) | 一种光谱波数的选择方法 | |
Sandquist et al. | CCD photometry of the globular cluster M5. I. The Color-Magnitude Diagram and luminosity functions | |
CN110657890B (zh) | 对光谱模型的基于交叉验证的校准 | |
CN104615977B (zh) | 综合关键季相特征和模糊分类技术的冬小麦遥感识别方法 | |
CN107230113A (zh) | 一种多模型融合的房产评估方法 | |
US20210404952A1 (en) | Method for selection of calibration set and validation set based on spectral similarity and modeling | |
CN110110754B (zh) | 基于代价局部泛化误差的不平衡问题的分类方法 | |
CN104581644B (zh) | 基于径向基插值的室内wlan指纹数据库多点自适应更新方法 | |
Navarro et al. | Automatic spectral classification of stellar spectra with low signal-to-noise ratio using artificial neural networks | |
CN108152239A (zh) | 基于特征迁移的样品成分含量测定方法 | |
Xu et al. | Applying convolutional neural networks (CNN) for end-to-end soil analysis based on laser-induced breakdown spectroscopy (LIBS) with less spectral preprocessing | |
CN108956583A (zh) | 用于激光诱导击穿光谱分析的特征谱线自动选择方法 | |
CN107563448B (zh) | 基于近红外光谱分析的样本空间聚类划分法 | |
CN106560704A (zh) | 联合同位素和微量元素检验的武夷岩茶产地鉴别方法 | |
CN107655850A (zh) | 基于近红外光谱的非线性建模方法及系统 | |
CN116150678B (zh) | 一种基于色度坐标的黄玉颜色分类分级方法及装置 | |
CN104677853B (zh) | 一种基于近红外高光谱的壁画起甲病害评估方法 | |
CN111125629B (zh) | 一种域自适应的pls回归模型建模方法 | |
Garland‐Campbell | Errors in statistical decision making |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |