CN107064054A - 一种基于cc‑pls‑rbfnn优化模型的近红外光谱分析方法 - Google Patents
一种基于cc‑pls‑rbfnn优化模型的近红外光谱分析方法 Download PDFInfo
- Publication number
- CN107064054A CN107064054A CN201710113438.4A CN201710113438A CN107064054A CN 107064054 A CN107064054 A CN 107064054A CN 201710113438 A CN201710113438 A CN 201710113438A CN 107064054 A CN107064054 A CN 107064054A
- Authority
- CN
- China
- Prior art keywords
- pls
- matrix
- rbfnn
- models
- principal component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 27
- 230000003595 spectral effect Effects 0.000 title claims abstract description 22
- 239000011159 matrix material Substances 0.000 claims abstract description 71
- 238000001228 spectrum Methods 0.000 claims abstract description 54
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000013528 artificial neural network Methods 0.000 claims abstract description 11
- 238000001914 filtration Methods 0.000 claims abstract description 11
- 238000005457 optimization Methods 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims abstract description 11
- 238000012937 correction Methods 0.000 claims abstract description 7
- 238000000605 extraction Methods 0.000 claims abstract description 6
- 230000001537 neural effect Effects 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 7
- 108010003272 Hyaluronate lyase Proteins 0.000 claims description 6
- 238000002790 cross-validation Methods 0.000 claims description 6
- 238000009795 derivation Methods 0.000 claims description 5
- 238000010238 partial least squares regression Methods 0.000 claims description 4
- 238000010219 correlation analysis Methods 0.000 claims description 3
- 210000004218 nerve net Anatomy 0.000 claims description 2
- 238000002329 infrared spectrum Methods 0.000 abstract description 13
- 230000008569 process Effects 0.000 abstract description 11
- 238000010183 spectrum analysis Methods 0.000 abstract description 3
- 240000008042 Zea mays Species 0.000 description 9
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 9
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 8
- 235000005822 corn Nutrition 0.000 description 8
- 229920002472 Starch Polymers 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 235000019698 starch Nutrition 0.000 description 6
- 239000008107 starch Substances 0.000 description 6
- 238000013459 approach Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 238000004611 spectroscopical analysis Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000001351 cycling effect Effects 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 210000005036 nerve Anatomy 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 238000012628 principal component regression Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000002834 transmittance Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明属于光谱分析领域,尤其是涉及一种基于CC‑PLS‑RBFNN优化模型的近红外光谱分析方法。所述方法结合了相关系数法(CC)、偏最小二乘法(PLS)与径向基函数神经网络(RBFNN),并对重要参数进行了优化;包括:利用三阶Savitzky‑Golay卷积平滑滤波及一阶导数校正对原始光谱进行预处理;在全波长段建立PLS模型并优化选取窗口宽度和PLS提取的主成分个数;计算每个波长变量的相关系数,截取相关系数大于设定阈值的波长变量参与建模并优化选取阈值大小;利用优化选取的窗口宽度、主成分个数和波长变量得到优化PLS模型;用优化PLS模型提取的主成分得分和性质矩阵训练RBF神经网络,获得最终的CC‑PLS‑RBFNN优化模型。本方法能显著提高近红外光谱分析的鲁棒性与精度。
Description
技术领域
本发明涉及近红外光谱分析领域,尤其是涉及一种基于CC-PLS-RBFNN优化模型的近红外光谱分析方法。
背景技术
近红外光谱分析技术作为一种快速无损的定量分析方法,已成功应用于农业、食品、化工和生物科学等多个领域,创造了可观的经济、社会效益。近红外光谱中包含了丰富的样品基团信息,然而近红外谱区内光谱吸收带较宽并且存在严重的光谱重叠,对此通常引入统计学方法建立合适的多元校正模型,从而实现光谱数据与预测目标数据间的关联。
目前,关于近红外光谱分析中校正模型的研究,典型的线性建模方法有多元线性回归、主成分回归以及偏最小二乘法等,非线性校正方法主要包含支持向量机和神经网络。多元线性回归的局限性在于,建模过程中包含对光谱矩阵或样本性质矩阵求逆的步骤,该步骤在矩阵奇异时无法完成,同时多元线性回归模型自身不具备去除数据噪声的能力;主成分回归通过对光谱矩阵或样本性质矩阵进行分解从而确保矩阵非奇异,但进行分解时未考虑到光谱数据和样本性质数据间的关联性,因此不适用于分析目标信息在光谱信息中含量微弱的情况;偏最小二乘法在主成分回归的基础上考虑了光谱数据和样本性质数据的相关性,但作为一种线性校正方法,其建立的模型始终存在一定的非线性误差;基于支持向量机的回归模型有较好的非线性拟合能力,但在建模过程中借助二次规划来求解支持向量,涉及样本数量阶次的矩阵计算,在样本数量偏大时耗费大量的机器内存和计算时间;神经网络模型可以映射任意复杂的非线性关系,并且学习规则简单便于计算机实现,但对数据的充分性有很高的要求,当数据量不足时容易过拟合,降低模型鲁棒性,上述现有方法的局限性,影响了模型的鲁棒性和精度。
发明内容
本发明的目的在于,针对现有技术的不足,提出将相关系数法(correlationcoefficient method,简称CC)、偏最小二乘法(Partial Least Squares,简称PLS)、径向基函数神经网络(Radial Basis Function Neural Network,简称RBFNN)相结合并优化选取重要参数,提供一种基于CC-PLS-RBFNN优化模型的近红外光谱分析方法,以提升近红外光谱建模的鲁棒性和精度。
为此,本发明采用如下解决方案:
一种基于CC-PLS-RBFNN优化模型的近红外光谱分析方法,所述基于CC-PLS-RBFNN优化模型的近红外光谱分析方法包括:利用三阶Savitzky-Golay卷积平滑滤波及一阶导数校正对原始光谱进行预处理;在全波长段建立PLS模型并优化选取平滑滤波的窗口宽度和PLS提取的主成分个数;计算每个波长变量的相关系数,截取相关系数大于设定阈值的波长变量参与建模并优化选取阈值大小;利用优化选取的窗口宽度、主成分个数和波长变量得到优化PLS模型;用优化PLS模型提取的主成分得分和性质矩阵训练RBF神经网络,获得最终的CC-PLS-RBFNN优化模型;具体步骤包括:
步骤(1):参数初始化:将样本划分为校正集和预测集;校正集的光谱矩阵为Xs(s×p),具有s个样本,全波长点有p个,校正集的样本性质矩阵为Ys(s×1);预测集的光谱矩阵为Xt(t×p),具有t个样本,全波长点有p个,预测集的样本性质矩阵为Yt(t×1);定义n为平滑滤波的窗口宽度,q为主成分个数,TH为相关系数阈值;设定最大窗口宽度n_MAX,最大主成分个数q_MAX,相关系数阈值遍历间隔d_TH,最大相关系数阈值TH_MAX,以及设定RBF神经网络核函数扩展因子σ,网络神经元数量m;窗口宽度n初始化为5,主成分个数q初始化为5,相关系数阈值TH初始化为0;
步骤(2):光谱预处理:对校正集原始光谱矩阵Xs(s×p)逐行进行n点三阶Savitzky-Golay卷积平滑滤波,并进行一阶求导完成光谱预处理,得到校正集预处理后光谱矩阵Xs’(s×p);
步骤(3):PLS初始建模:对预处理后的s个校正集的样本利用PLS模型提取q个主成分,对预处理后光谱矩阵Xs’(s×p)及对应的样本性质矩阵Ys(s×1)进行回归建模并得到全波长PLS模型,并采取留一交叉验证的方法,得到相应的RMSECV值;
步骤(4):选择模型参数:依次遍历不同的n和q,重复步骤(2)到步骤(3),直至n=n_MAX,q=q_MAX,得到不同模型参数下的RMSECV值;n和q的遍历间隔分别为2和1,选取使得RMSECV最小的n和q作为优化选取下的模型参数;
步骤(5):筛选光谱矩阵:对校正集预处理后光谱矩阵Xs’(s×p)及对应样本性质矩阵Ys(s×1)展开相关分析,得到p个波长变量的相关系数,构成相关系数矩阵C(1×p);设相关系数大于设定的相关系数阈值TH的波长变量共有p’个,选取这部分波长变量对应的预处理后光谱矩阵Xs’(s×p)的子集,构成筛选后光谱矩阵Xs_selected(s×p’);
步骤(6):部分波长PLS建模:在步骤(4)优化选取的模型参数下,对筛选后光谱矩阵Xs_selected(s×p’)及对应样本性质矩阵Ys(s×1)进行预处理和PLS回归建模,得到部分波长下的PLS模型,并采取留一交叉验证的方法,得到相应的RMSECV值;
步骤(7):选择相关系数阈值TH:以d_TH为相关系数阈值遍历间隔,依次遍历不同的TH,重复步骤(5)至步骤(6),直至TH=TH_MAX,得到不同的RMSECV值;选取使得RMSECV最小的TH作为优化选取的相关系数阈值,建立部分波长下的优化PLS模型;
步骤(8):训练RBF神经网络:将步骤(7)所得的优化模型所提取的主成分得分矩阵Score(s×q)作为输入变量,对应的样本性质矩阵Ys(s×1)作为目标变量,进行RBF神经网络的训练,得到最终的CC-PLS-RBFNN优化模型。
在采用上述技术方案的同时,本发明还可以采用或者组合采用以下进一步的技术方案:
所述步骤(4)中,所述最大窗口宽度n_MAX的取值范围优选15到45之间。
所述步骤(4)中,所述最大主成分个数q_MAX的取值范围优选10到50之间。
所述步骤(7)中,所述相关系数阈值遍历间隔d_TH的取值范围优选0.001到0.1之间。
所述步骤(7)中,所述最大相关系数阈值TH_MAX的取值范围优选0.4到0.6之间。
所述步骤(8)中,所述步骤(8)中,所述RBF神经网络所用径向基函数为高斯核函数,形式为k(||x-xc||)=exp[-||x-xc||2/(2σ2)],式中xc是核函数中心;σ为扩展因子,优选为0.1至2之间;网络的神经元数量m优选s/3到s之间,其中s为训练网络的校正集样本数量。
本发明所提供的近红外光谱分析方法具有以下优点:
(1通过卷积平滑滤波和求导校正对原始光谱进行预处理,降低光谱中随机噪声对建模的不利影响;
(2)采用相关系数法对光谱进行波长筛选,最大化甄别出有益波长参与建模;
(3)通过PLS模型和RBFNN模型的结合,在保留PLS提取光谱有效信息能力的同时,利用RBFNN的任意非线性拟合能力,降低主成分得分的非线性回归残差,提升了模型精度;
(4)采用留一交互验证,最优化选择建模过程中的关键参数从而优化所建模型,提升了模型的鲁棒性和精度。
附图说明
图1为本发明基于CC-PLS-RBFNN优化模型的近红外光谱分析方法的流程图。
图2为玉米籽粒的原始近红外光谱图。
图3为滤波窗口宽度、PLS主成分个数与模型RMSECV的关系图,图中标出点为筛选出的最优参数点。
图4为经滤波并求导后的近红外光谱图。
图5为相关系数阈值与模型RMSECV的关系图,图中标出点是筛选出的最优阈值点。
图6为玉米籽粒淀粉含量预测值与真实值的比较图。
具体实施方式
本发明的具体实施方式,将结合附图和近红外光谱分析的具体实施例进行详述。
图1为本发明提出的基于CC-PLS-RBFNN优化模型的近红外光谱分析方法。
本具体实施例,采用玉米籽粒近红外光谱数据样本来验证本发明的方法。该数据集包含80个近红外光谱测量样本,淀粉的质量含量范围为0%~100%(w/w),考察近红外光谱与玉米籽粒中淀粉含量之间的关系。样本集中,光谱仪的扫描区间为1100~2498nm,扫描间隔为2nm,即每份光谱样本数据中包含700个采样波长。
针对玉米籽粒近红外光谱数据样本,实施本发明提出的基于CC-PLS-RBFNN优化模型的近红外光谱分析方法,步骤如下:
步骤(1):参数初始化:对于样本个数为80,波长个数为p=700,原波长集为V={x1,…,xp-1,xp}={1100,1102,…,2496,2498}的玉米籽粒近红外光谱样本集,按3:1随机划分校正集和预测集,得到校正集样本60个,光谱矩阵为Xs(60×700),表征玉米籽粒中淀粉含量的性质矩阵为Ys(60×1);得到预测集样本20个,光谱矩阵为Xt(20×700),表征玉米籽粒中淀粉含量的性质矩阵为Yt(20×1);所述最大窗口宽度n_MAX的取值范围优选15到45之间,所述最大主成分个数q_MAX的取值范围优选10到50之间,所述最大相关系数阈值TH_MAX的取值范围优选0.4到0.6之间,n_MAX、q_MAX和TH_MAX的值越大,参数寻优所需的时间越长,n_MAX、q_MAX和TH_MAX的值太小,则搜索范围可能不包含最优解,本具体实施例中设定n_MAX=39,q_MAX=40,TH_MAX=0.5;所述相关系数阈值遍历间隔d_TH的取值范围优选0.001到0.1之间,决定相关系数阈值的搜索密度,太大会使得求解的参数不够逼近最优值,太小则寻优耗时过长,本具体实施例中d_TH=0.02;所述扩展因子σ=1;所述神经元数量m=30;窗口宽度n初始化为5,主成分个数q初始化为5,相关系数阈值TH初始化为0。
步骤(2):光谱预处理:对校正样本集光谱矩阵Xs(60×700)逐行进行n点三阶Savitzky-Golay卷积平滑滤波,再求取一阶导数完成光谱的预处理,得到校正样本集预处理后的光谱矩阵Xs’(60×700);
步骤(3):PLS初始建模:对预处理后的校正集光谱矩阵Xs’(60×700)以及对应样本性质矩阵Ys(60×1),按公式(1)至公式(3)建立主成分个数为q的PLS模型;该模型的数学表达式如下:
Xs=TPT+E (1)
Ys=UQT+F (2)
T=XW(PTW)-1 (3)
其中校正光谱矩阵Xs的得分矩阵是T,载荷矩阵是P,权重矩阵是W,残差光谱是E;校正样本性质矩阵Ys的得分矩阵是U,载荷矩阵是Q,残差光谱是F。
采取留一交叉验证的方法,得到所建立PLS模型的交互验证均方根误差RMSECV。
步骤(4):选择模型参数:依次遍历不同的n和q,重复步骤(2)到步骤(3),直至n=n_MAX,q=q_MAX,得到不同模型参数n和q下的RMSECV值,n和q的遍历间隔分别为2和1。具体遍历过程为,先保持q值为初始值5,从n的初始值5开始,每次循环后若n<n_MAX,则执行n=n+2并继续循环过程;若n=n_MAX则再判断若q<q_MAX则令n回归初始值5,执行q=q+1并继续循环过程,当q=q_MAX时完成遍历终止循环。比较所有的RMSECV值,选取使得对应RMSECV最小的n和q作为优化选取的模型参数;
步骤(5):筛选光谱矩阵:对校正集预处理后光谱矩阵Xs’(60×700)及对应样本性质矩阵Ys(60×1)展开相关分析,得到700个波长变量的相关系数,构成相关系数矩阵C(1×700)。第p个波长变量上的相关系数计算公式如下
式中xi,p是预处理后光谱矩阵Xs’(60×700)中第i个样本在第p个波长变量上的值,yi,p为样本性质矩阵Ys(60×1)中第i个样本的值,其中
选取相关系数大于设定阈值TH的总计p’个波长变量,该p’个波长变量对应的预处理后光谱矩阵Xs’(60×700)的子集,构成筛选后光谱矩阵Xs_selected(60×p’);
步骤(6):部分波长PLS建模:在步骤(4)优化选取的模型参数n和q下,对筛选后光谱矩阵Xs_selected(60×p’)及对应样本性质矩阵Ys(60×1)进行预处理和PLS回归建模,得到部分波长下的PLS模型,采取留一交叉验证的方法,得到相应的RMSECV值;
步骤(7):选择相关系数阈值TH:以d_TH为相关系数阈值遍历间隔,依次遍历不同的TH,重复步骤(5)至步骤(6),直至TH=TH_MAX,得到不同的RMSECV值。具体遍历过程为,从TH的初始值0开始,每次循环后若TH<TH_MAX,则执行TH=TH+d_TH并继续循环过程;若TH=TH_MAX,则完成遍历终止循环。最后选取使得RMSECV最小的TH作为优化选取的相关系数阈值,建立部分波长下的优化PLS模型;
步骤(8):训练RBF神经网络:将步骤(7)所得的优化PLS模型所提取的主成分得分矩阵Score(60×q)作为输入变量,对应的样本性质矩阵Ys(60×1)作为目标变量,进行RBF神经网络的训练,得到最终的CC-PLS-RBFNN优化模型。相比于更常用的反向传播(backpropagation,简称BP)神经网络而言,RBF神经网络具有唯一最佳逼近,避免陷入局部最优的能力。此处RBF神经网络选用高斯核函数为径向基函数,形式为k(||x-xc||)=exp[-||x-xc||2/(2σ2)],式中σ为扩展因子,其值过大会引起大的网络逼近误差,过小则容易造成过拟合现象,此处取σ=1;网络的神经元数量根据样本数选择为30。
图2为校正样本集的原始近红外光谱谱图;
图3为滤波窗口宽度n、PLS主成分个数q与全波长PLS模型交互验证均方根误差RMSECV的关系图,图中标出RMSECV取得最小值的点,对应最优模型参数n=19,q=30;
图4为经19点三阶Savitzky-Golay卷积平滑滤波并一次求导后的预处理后校正样本集光谱谱图,对比图2显示原始光谱中的噪声和基线漂移得到显著改善;
图5为相关系数阈值TH与部分波长PLS模型交互验证均方根误差RMSECV的关系图,图中标出RMSECV取最小值的点,对应最优相关系数阈值TH=0.28;
结果验证:图6显示了采用上述方法得到的CC-PLS-RBFNN优化模型对20个预测集样本淀粉含量的预测情况,通过回归分析得到预测值与真实值的关系。
表1
表1以预测均方根误差RMSEP(Root Mean Square Error of Prediction)和回归相关系数作为评价指标,比较了本发明方法与基于PLS回归模型、基于反向传播神经网络(BPNN)模型、基于径向基函数神经网络(RBFNN)模型以及基于偏最小二乘-反向传播神经网络(PLS-BPNN)模型的建模分析方法的预测能力。比较结果显示本发明方法预测误差最小,回归相关系数最大。
表1的结果充分表明:本发明方法能够有效地加强模型的预测能力,提升近红外光谱分析的鲁棒性和精度。
本发明上述具体实施方式中所涉及的近红外光谱分析对象为玉米籽粒的淀粉含量,仅为优选实施例,具体实施时,也可以用于农业、食品、化工和生物科学等领域各种近红外光谱分析对象的分析过程中。
上述具体实施方式用来解释说明本发明,仅为本发明的优选实施例,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改、等同替换、改进等,都落入本发明的保护范围。
Claims (6)
1.一种基于CC-PLS-RBFNN优化模型的近红外光谱分析方法,其特征在于,所述基于CC-PLS-RBFNN优化模型的近红外光谱分析方法包括:利用三阶Savitzky-Golay卷积平滑滤波及一阶导数校正对原始光谱进行预处理;在全波长段建立PLS模型并优化选取平滑滤波的窗口宽度和PLS模型中提取的主成分个数;计算每个波长变量的相关系数,截取相关系数大于设定阈值的波长变量参与建模并优化选取阈值大小;利用优化选取的窗口宽度、主成分个数和波长变量得到优化PLS模型;用优化PLS模型提取的主成分得分矩阵和对应的样本性质矩阵训练RBF神经网络,获得最终的CC-PLS-RBFNN优化模型;具体步骤包括:
步骤(1):参数初始化:将样本划分为校正集和预测集;校正集的光谱矩阵为Xs(s×p),具有s个样本,全波长点有p个,校正集的样本性质矩阵为Ys(s×1);预测集的光谱矩阵为Xt(t×p),具有t个样本,全波长点有p个,预测集的样本性质矩阵为Yt(t×1);定义n为平滑滤波的窗口宽度,q为主成分个数,TH为相关系数阈值;设定最大窗口宽度n_MAX,最大主成分个数q_MAX,相关系数阈值遍历间隔d_TH,最大相关系数阈值TH_MAX,以及设定RBF神经网络核函数扩展因子σ,网络神经元数量m;窗口宽度n初始化为5,主成分个数q初始化为5,相关系数阈值TH初始化为0;
步骤(2):光谱预处理:对校正集原始光谱矩阵Xs(s×p)逐行进行n点三阶Savitzky-Golay卷积平滑滤波,并进行一阶求导完成光谱预处理,得到校正集预处理后光谱矩阵Xs’(s×p);
步骤(3):PLS初始建模:对预处理后的s个校正集的样本利用PLS模型提取q个主成分,对预处理后光谱矩阵Xs’(s×p)及对应的样本性质矩阵Ys(s×1)进行回归建模并得到全波长PLS模型,并采取留一交叉验证的方法,得到相应的RMSECV值;
步骤(4):选择模型参数:依次遍历不同的n和q,重复步骤(2)到步骤(3),直至n=n_MAX,q=q_MAX,得到不同模型参数下的RMSECV值;n和q的遍历间隔分别为2和1,选取使得RMSECV最小的n和q作为优化选取下的模型参数;
步骤(5):筛选光谱矩阵:对校正集预处理后光谱矩阵Xs’(s×p)及对应样本性质矩阵Ys(s×1)展开相关分析,得到p个波长变量的相关系数,构成相关系数矩阵C(1×p);设相关系数大于设定的相关系数阈值TH的波长变量共有p’个,选取这部分波长变量对应的预处理后光谱矩阵Xs’(s×p)的子集,构成筛选后光谱矩阵Xs_selected(s×p’);
步骤(6):部分波长PLS建模:在步骤(4)优化选取的模型参数下,对筛选后光谱矩阵Xs_selected(s×p’)及对应样本性质矩阵Ys(s×1)进行预处理和PLS回归建模,得到部分波长下的PLS模型,并采取留一交叉验证的方法,得到相应的RMSECV值;
步骤(7):选择相关系数阈值TH:以d_TH为相关系数阈值遍历间隔,依次遍历不同的TH,重复步骤(5)至步骤(6),直至TH=TH_MAX,得到不同的RMSECV值;选取使得RMSECV最小的TH作为优化选取的相关系数阈值,建立部分波长下的优化PLS模型;
步骤(8):训练RBF神经网络:将步骤(7)所得的优化模型所提取的主成分得分矩阵Score(s×q)作为输入变量,对应的样本性质矩阵Ys(s×1)作为目标变量,进行RBF神经网络的训练,得到最终的CC-PLS-RBFNN优化模型。
2.根据权利要求1所述的一种基于CC-PLS-RBFNN优化模型的近红外光谱分析方法,其特征在于,所述步骤(4)中,所述最大窗口宽度n_MAX的取值范围优选15到45之间。
3.根据权利要求1所述的一种基于CC-PLS-RBFNN优化模型的近红外光谱分析方法,其特征在于,所述步骤(4)中,所述最大主成分个数q_MAX的取值范围优选10到50之间。
4.根据权利要求1所述的一种基于CC-PLS-RBFNN优化模型的近红外光谱分析方法,其特征在于,所述步骤(7)中,所述相关系数阈值遍历间隔d_TH的取值范围优选0.001到0.1之间。
5.根据权利要求1所述的一种基于CC-PLS-RBFNN优化模型的近红外光谱分析方法,其特征在于,所述步骤(7)中,所述最大相关系数阈值TH的取值范围优选0.4到0.6之间。
6.根据权利要求1所述的一种基于CC-PLS-RBFNN优化模型的近红外光谱分析方法,其特征在于,所述步骤(8)中,所述RBF神经网络所用径向基函数为高斯核函数,形式为k(||x-xc||)=exp[-||x-xc||2/(2σ2)],式中xc是核函数中心;σ为扩展因子,优选为0.1至2之间;网络的神经元数量m优选s/3到s之间,其中s为训练网络的校正集样本数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710113438.4A CN107064054B (zh) | 2017-02-28 | 2017-02-28 | 一种基于cc-pls-rbfnn优化模型的近红外光谱分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710113438.4A CN107064054B (zh) | 2017-02-28 | 2017-02-28 | 一种基于cc-pls-rbfnn优化模型的近红外光谱分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107064054A true CN107064054A (zh) | 2017-08-18 |
CN107064054B CN107064054B (zh) | 2019-08-02 |
Family
ID=59621769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710113438.4A Active CN107064054B (zh) | 2017-02-28 | 2017-02-28 | 一种基于cc-pls-rbfnn优化模型的近红外光谱分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107064054B (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197380A (zh) * | 2017-12-29 | 2018-06-22 | 南京林业大学 | 基于偏最小二乘的高斯回归软测量建模方法 |
CN109117954A (zh) * | 2018-08-13 | 2019-01-01 | 北京理工大学 | 基于混合径向基神经网络的黑箱系统设计优化方法 |
CN109299501A (zh) * | 2018-08-08 | 2019-02-01 | 浙江大学 | 一种基于工作流的振动光谱分析模型优化方法 |
CN109406446A (zh) * | 2018-10-12 | 2019-03-01 | 四川长虹电器股份有限公司 | 对近红外数据的预处理方法及其调用方法 |
CN109992861A (zh) * | 2019-03-21 | 2019-07-09 | 温州大学 | 一种近红外光谱建模方法 |
CN110296955A (zh) * | 2019-06-24 | 2019-10-01 | 中国矿业大学 | 基于核函数优化的甘草近红外光谱分析模型构建方法及甘草质量评价方法 |
CN110376159A (zh) * | 2019-08-22 | 2019-10-25 | 华东交通大学 | 基于近红外漫透射光谱的鸭梨黑心病快速鉴别方法 |
CN110836878A (zh) * | 2019-11-01 | 2020-02-25 | 同济大学 | 一种卷积插值耦合高斯混合模型快速三维荧光寻峰方法 |
CN111125629A (zh) * | 2019-12-25 | 2020-05-08 | 温州大学 | 一种域自适应的pls回归模型建模方法 |
CN111220565A (zh) * | 2020-01-16 | 2020-06-02 | 东北大学秦皇岛分校 | 一种基于cpls的红外光谱测量仪器标定迁移方法 |
JP6725928B1 (ja) * | 2020-02-13 | 2020-07-22 | 東洋インキScホールディングス株式会社 | 回帰モデル作成方法、回帰モデル作成装置、及び、回帰モデル作成プログラム |
CN111999261A (zh) * | 2020-09-30 | 2020-11-27 | 海南电网有限责任公司电力科学研究院 | 一种用于绝缘纸老化评估的近红外光谱噪声数据处理方法 |
CN112098358A (zh) * | 2020-09-07 | 2020-12-18 | 燕山大学 | 基于四元数卷积神经网络的近红外光谱并行融合定量建模方法 |
CN112229816A (zh) * | 2020-09-04 | 2021-01-15 | 江苏东晟辉科技开发有限公司 | 基于opls-spa-mix-pls的木材弹性模量预测方法 |
CN112903625A (zh) * | 2021-01-25 | 2021-06-04 | 北京工业大学 | 基于偏最小二乘法分析药物中活性物质含量的集成参数优化建模方法 |
CN113686810A (zh) * | 2021-08-24 | 2021-11-23 | 重庆城市管理职业学院 | 一种基于卷积神经网络的近红外光谱波长选择方法 |
CN113993987A (zh) * | 2019-06-25 | 2022-01-28 | 思拓凡瑞典有限公司 | 用于通过光谱测定和训练模型控制生物过程的方法以及其控制器 |
CN114184576A (zh) * | 2021-10-19 | 2022-03-15 | 北京蓝星清洗有限公司 | 一种基于分子光谱流程工业在线测量方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101017373A (zh) * | 2006-12-28 | 2007-08-15 | 浙江大学 | 工业过程多分辨率软测量仪表及方法 |
CN101673096A (zh) * | 2009-10-26 | 2010-03-17 | 浙江大学 | 一种丹参注射液生产浓缩过程密度的软测量方法 |
-
2017
- 2017-02-28 CN CN201710113438.4A patent/CN107064054B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101017373A (zh) * | 2006-12-28 | 2007-08-15 | 浙江大学 | 工业过程多分辨率软测量仪表及方法 |
CN101673096A (zh) * | 2009-10-26 | 2010-03-17 | 浙江大学 | 一种丹参注射液生产浓缩过程密度的软测量方法 |
Non-Patent Citations (4)
Title |
---|
G. BAFFI等: "Non-linear projection to latent structures revisited (the neural network PLS algorithm)", 《COMPUTERS AND CHEMICAL ENGINEERING》 * |
JIE ZHANG等: "RETRIEVAL OF FUEL MOISTURE CONTENT FROM HYPERSPECTRAL DATA VIA PARTIAL LEAST SQUARE", 《IEEE INTERNATIONAL GEOSCIENCE AND REMOTE SENSING SYMPOSIUM》 * |
SHENGFENG WANG等: "Application of Improved RBFNN in Comprehensive Evaluation for Maintenance Quality", 《INTERNATIONAL CONFERENCE ON QUALITY, RELIABILITY, RISK, MAINTENANCE AND SAFETY ENGINEERING (ICQR2MSE) 》 * |
王昕: "软测量技术及其在工业聚丙烯生产过程中的应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197380A (zh) * | 2017-12-29 | 2018-06-22 | 南京林业大学 | 基于偏最小二乘的高斯回归软测量建模方法 |
CN109299501A (zh) * | 2018-08-08 | 2019-02-01 | 浙江大学 | 一种基于工作流的振动光谱分析模型优化方法 |
CN109299501B (zh) * | 2018-08-08 | 2022-03-11 | 浙江大学 | 一种基于工作流的振动光谱分析模型优化方法 |
CN109117954A (zh) * | 2018-08-13 | 2019-01-01 | 北京理工大学 | 基于混合径向基神经网络的黑箱系统设计优化方法 |
CN109406446A (zh) * | 2018-10-12 | 2019-03-01 | 四川长虹电器股份有限公司 | 对近红外数据的预处理方法及其调用方法 |
CN109992861A (zh) * | 2019-03-21 | 2019-07-09 | 温州大学 | 一种近红外光谱建模方法 |
CN109992861B (zh) * | 2019-03-21 | 2022-12-27 | 温州大学 | 一种近红外光谱建模方法 |
CN110296955A (zh) * | 2019-06-24 | 2019-10-01 | 中国矿业大学 | 基于核函数优化的甘草近红外光谱分析模型构建方法及甘草质量评价方法 |
CN113993987A (zh) * | 2019-06-25 | 2022-01-28 | 思拓凡瑞典有限公司 | 用于通过光谱测定和训练模型控制生物过程的方法以及其控制器 |
CN110376159A (zh) * | 2019-08-22 | 2019-10-25 | 华东交通大学 | 基于近红外漫透射光谱的鸭梨黑心病快速鉴别方法 |
CN110836878A (zh) * | 2019-11-01 | 2020-02-25 | 同济大学 | 一种卷积插值耦合高斯混合模型快速三维荧光寻峰方法 |
CN110836878B (zh) * | 2019-11-01 | 2021-09-07 | 同济大学 | 一种卷积插值耦合高斯混合模型快速三维荧光寻峰方法 |
CN111125629B (zh) * | 2019-12-25 | 2023-04-07 | 温州大学 | 一种域自适应的pls回归模型建模方法 |
CN111125629A (zh) * | 2019-12-25 | 2020-05-08 | 温州大学 | 一种域自适应的pls回归模型建模方法 |
CN111220565B (zh) * | 2020-01-16 | 2022-07-29 | 东北大学秦皇岛分校 | 一种基于cpls的红外光谱测量仪器标定迁移方法 |
CN111220565A (zh) * | 2020-01-16 | 2020-06-02 | 东北大学秦皇岛分校 | 一种基于cpls的红外光谱测量仪器标定迁移方法 |
JP6725928B1 (ja) * | 2020-02-13 | 2020-07-22 | 東洋インキScホールディングス株式会社 | 回帰モデル作成方法、回帰モデル作成装置、及び、回帰モデル作成プログラム |
WO2021162033A1 (ja) * | 2020-02-13 | 2021-08-19 | 東洋インキScホールディングス株式会社 | 回帰モデル作成方法、回帰モデル作成装置、及び、回帰モデル作成プログラム |
JP2021128042A (ja) * | 2020-02-13 | 2021-09-02 | 東洋インキScホールディングス株式会社 | 回帰モデル作成方法、回帰モデル作成装置、及び、回帰モデル作成プログラム |
CN112229816B (zh) * | 2020-09-04 | 2022-06-07 | 江苏东晟辉科技开发有限公司 | 基于opls-spa-mix-pls的木材弹性模量预测方法 |
CN112229816A (zh) * | 2020-09-04 | 2021-01-15 | 江苏东晟辉科技开发有限公司 | 基于opls-spa-mix-pls的木材弹性模量预测方法 |
CN112098358B (zh) * | 2020-09-07 | 2021-12-17 | 燕山大学 | 基于四元数卷积神经网络的近红外光谱并行融合定量检测方法 |
CN112098358A (zh) * | 2020-09-07 | 2020-12-18 | 燕山大学 | 基于四元数卷积神经网络的近红外光谱并行融合定量建模方法 |
CN111999261A (zh) * | 2020-09-30 | 2020-11-27 | 海南电网有限责任公司电力科学研究院 | 一种用于绝缘纸老化评估的近红外光谱噪声数据处理方法 |
CN112903625A (zh) * | 2021-01-25 | 2021-06-04 | 北京工业大学 | 基于偏最小二乘法分析药物中活性物质含量的集成参数优化建模方法 |
CN112903625B (zh) * | 2021-01-25 | 2024-01-19 | 北京工业大学 | 基于偏最小二乘法分析药物中活性物质含量的集成参数优化建模方法 |
CN113686810A (zh) * | 2021-08-24 | 2021-11-23 | 重庆城市管理职业学院 | 一种基于卷积神经网络的近红外光谱波长选择方法 |
CN113686810B (zh) * | 2021-08-24 | 2024-04-16 | 重庆城市管理职业学院 | 一种基于卷积神经网络的近红外光谱波长选择方法 |
CN114184576A (zh) * | 2021-10-19 | 2022-03-15 | 北京蓝星清洗有限公司 | 一种基于分子光谱流程工业在线测量方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107064054B (zh) | 2019-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107064054B (zh) | 一种基于cc-pls-rbfnn优化模型的近红外光谱分析方法 | |
Nie et al. | Classification of hybrid seeds using near-infrared hyperspectral imaging technology combined with deep learning | |
Anderson et al. | Achieving robustness across season, location and cultivar for a NIRS model for intact mango fruit dry matter content. II. Local PLS and nonlinear models | |
US20220051074A1 (en) | Quantitative spectral data analysis and processing method based on deep learning | |
Feng et al. | Investigation on data fusion of multisource spectral data for rice leaf diseases identification using machine learning methods | |
Lin et al. | Determination of grain protein content by near-infrared spectrometry and multivariate calibration in barley | |
An et al. | Advances in infrared spectroscopy and hyperspectral imaging combined with artificial intelligence for the detection of cereals quality | |
CN107491784A (zh) | 基于深度学习算法的烟叶近红外光谱定量建模方法及应用 | |
Zhang et al. | Prediction of oil content in single maize kernel based on hyperspectral imaging and attention convolution neural network | |
Wang et al. | Application of hyperspectral imaging assisted with integrated deep learning approaches in identifying geographical origins and predicting nutrient contents of Coix seeds | |
Munawar et al. | Near infrared spectroscopy as a fast and non-destructive technique for total acidity prediction of intact mango: Comparison among regression approaches | |
Liu et al. | Variety classification of coated maize seeds based on Raman hyperspectral imaging | |
CN110503156B (zh) | 一种基于最小相关系数的多变量校正特征波长选择方法 | |
CN110579186B (zh) | 基于逆高斯过程反演叶面积指数的农作物长势监测方法 | |
Delwiche et al. | A graphical method to evaluate spectral preprocessing in multivariate regression calibrations: Example with Savitzky–Golay filters and partial least squares regression | |
Yu et al. | Cross target attributes and sample types quantitative analysis modeling of near-infrared spectroscopy based on instance transfer learning | |
CN112098358A (zh) | 基于四元数卷积神经网络的近红外光谱并行融合定量建模方法 | |
Sun et al. | Determination of moisture content in barley seeds based on hyperspectral imaging technology | |
Sonobe et al. | Hyperspectral wavelength selection for estimating chlorophyll content of muskmelon leaves | |
Wang et al. | A Lightweight convolutional neural network for nicotine prediction in tobacco by near-infrared spectroscopy | |
Yang et al. | A recognition method of corn varieties based on spectral technology and deep learning model | |
Wang et al. | Origin identification of foxtail millet (Setaria italica) by using green spectral imaging coupled with chemometrics | |
Ong et al. | Visible and near-infrared spectroscopic determination of sugarcane chlorophyll content using a modified wavelength selection method for multivariate calibration | |
Zhang et al. | Hyperspectral model based on genetic algorithm and SA-1DCNN for predicting Chinese cabbage chlorophyll content | |
Zhang et al. | A hyperspectral band selection method based on sparse band attention network for maize seed variety identification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |