CN105095652B - 基于堆叠极限学习机的样品成份测定方法 - Google Patents

基于堆叠极限学习机的样品成份测定方法 Download PDF

Info

Publication number
CN105095652B
CN105095652B CN201510404882.2A CN201510404882A CN105095652B CN 105095652 B CN105095652 B CN 105095652B CN 201510404882 A CN201510404882 A CN 201510404882A CN 105095652 B CN105095652 B CN 105095652B
Authority
CN
China
Prior art keywords
sample
submodel
learning machine
elm
optimal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510404882.2A
Other languages
English (en)
Other versions
CN105095652A (zh
Inventor
赵煜辉
崔金铎
单鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201510404882.2A priority Critical patent/CN105095652B/zh
Publication of CN105095652A publication Critical patent/CN105095652A/zh
Application granted granted Critical
Publication of CN105095652B publication Critical patent/CN105095652B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种基于堆叠极限学习机的样品成份测定方法,包括以下步骤:S1,采集待测样品的近红外光谱数据;S2,通过堆叠极限学习机模型,获得该近红外光谱数据所对应的样品中各成分的含量。本发明通过利用堆叠极限学习机模型对待测样品的近红外光谱数据进行处理,从而即可获得该近红外光谱数据所对应的样品中各成分的含量,与采用传统模型进行数据处理相比,可以提高对样本量少、维度高的光谱数据的拟合精度,解决了扁平矩阵利用ELM求解时精度低且预测结果不稳定的问题;此外,本发明利用对数据列属性分块的思想,使得ELM能够满足近红外光谱等高维度小样本数据建模应用场景,提高了其预测精度,改进方法使ELM具有更好的鲁棒性。

Description

基于堆叠极限学习机的样品成份测定方法
技术领域
本发明涉及一种成分测定方法,尤其是一种基于堆叠极限学习机的样品成份测定方法。
背景技术
近红外光谱分析是利用计算机技术和化学计量学等手段对近红外光谱的信息特征进行定量定性分析的过程。由于监测方便、快捷、成本低,且不会破坏样品等优势,近红外光谱分析备受青睐,尤其是在食品工业、农业生产、药物制造等领域应用非常广泛。在食品、农业、工业等领域的实际应用中,NIR光谱检测技术依赖化学计量学的相关算法,在化学成分和光谱吸收之间建立一种定量的函数关系,依靠变量与自变量之间的函数关系,就能通过未知样品的NIR光谱获得样品的成分和含量,然后利用建立的数学模型预测未知样品品质。近红外光谱数据对应的物质的各种理化指标的获取费时且昂贵,一般采集的样本数量为数十或者数百,而样本维度通常较高,一般有数百或者上千维。可见,近红外光谱数据处理问题属于一类高维小样本数据分析问题。
极限学习机法(ELM)具有快速学习出泛化能力良好的学习器的特性,ELM在要求快速学习的相关领域得以应用,可以用于近红外光谱数据的建模和未知样本成分含量的预测。ELM是一种单隐层数据网络,如见图1所示,其单隐层的激活函数g需无限可微,单隐层神经元参数wi,bi可以随机赋值。对于输入向量x网络结构的隐含层输出为:
G(ai,bi,x)=g(ai·x+bi)
训练一个ELM,隐层节点参数在随机产生之后就保持固定,然后通过最小二乘法求解隐含层和输出层之间的权重。假设网络输入为包含n个样本的输入数据X,其中每个样本包含m个属性,也就是X是一个n×m维矩阵。一个隐层节点个数为激活函数为g(x)的ELM的数学模型可表示为:
其中,wi表示输入层和隐含层之间的权重,βi表示隐含层与输出层之间的权值,bi表示隐含层第i个隐层节点的阈值,ti为期望的输出。上式还可以用矩阵的形式简单的表示为:
Hβ=T
其中,H为隐含层输出矩阵:
T为网络输出矩阵:
用H+表示广义逆,通过范数最小二乘法解得隐层输出权值β为:
β=H+T
具体算法描述为:
1.随机确定隐层节点的参数(wi,bi),(为隐层节点数);
2.计算隐含层输出矩阵H;
3.计算隐层输出权值β:β=H+T。
光谱数据集中的光谱信息可用矩阵Xn×m表示,对应的理化指标用yn×1表示,其中,X样本的个数为n,每个样本包含m个属性,即X是一个n×m维矩阵。在光谱数据集中,通常光谱维度远大于样本数,即m>>n。由于ELM算法中用激活函数对矩阵X的映射是根据公式(4)将它用H的表示,在这个映射结果中,H的行数和样本量相同,H的列数和隐含节点数相同,也就是说,采用ELM算法对光谱数据进行处理时,其要求隐含节点数小于等于样本数,那么就相当于将一个高维数据随机降维到了一个低维数据,而且这个维度的差距可能是数倍,也可能是数十甚至百倍;那么进行这个映射的过程必然会造成信息损失,这时再用H与y进行回归时,预测结果就会变得不稳定,而且相对于ELM预测普通数据精确度也会大幅度下降。
发明内容
本发明的目的在于,提供一种基于堆叠极限学习机的样品成份测定方法,它可以有效解决现有技术中存在的问题,尤其是采用ELM处理光谱维度远大于样本数的光谱数据时,获得的预测结果不稳定且预测精度较低的问题。
为解决上述技术问题,本发明采用如下的技术方案:基于堆叠极限学习机的样品成份测定方法,包括以下步骤:
S1,采集待测样品的近红外光谱数据;
S2,通过堆叠极限学习机模型,获得该近红外光谱数据所对应的样品中各成分的含量。
步骤S2中,通过将近红外光谱数据的列属性划分为若干子段,然后对每个子段均进行独立的ELM模型训练,再对所有的子段模型进行加权集成,即得堆叠极限学习机模型。
优选的,步骤S2中所述的堆叠极限学习机模型具体通过以下方法建立:
a.采集n个样本X的近红外光谱数据及其对应的样本中各成分的含量数据作为训练样本,其中,每个样本包含m个属性,即X为一个n*m维矩阵;
b.将所述样本X的列属性划分为j个列属性子集,每个列属性子集为一个n*l维矩阵,其中,l=m/j;
c.通过ELM算法分别对所述的近红外光谱数据的各个列属性子集和样本中各成分的含量之间建模,得j个子模型;
d.计算每个子模型的最优隐层节点数L和隐层输出权值βk,分别获得j个子模型的预测值;
e.对所述的j个子模型的预测值进行加权整合,即得堆叠极限学习机模型。
上述方法中,步骤e所述的堆叠极限学习机模型为:
其中,为堆叠极限学习机模型的预测值,为第k个子模型的预测值,wk(k=1,2…j)为其权重,是第k个子模型对最终模型的影响因子,βk为第k个子模型的隐层输出权值,Hk为第k个子模型的隐含层输出矩阵,n为样本数。
前述的基于堆叠极限学习机的样品成份测定方法中,步骤b中,划分的列属性子集的最优个数interval通过交叉验证的方法确定;步骤d中,各个子模型的最优隐层节点数L通过交叉验证的方法确定。
优选的,具体通过以下方法确定划分的列属性子集的最优个数interval和最优隐层节点数L:
S21,将所述的n个样本X的近红外光谱数据及其对应的样本中各成分的含量数据分为K_fold份,将第i份作为测试集,剩余的K_fold-1份作为训练集进行交叉验证,其中,1≤i≤K_fold;K_fold一般可取10;
S22,进行交叉验证时,将所述的测试集和训练集的列属性划分为j份,分别得j个列属性子集,其中,1≤j≤top_interval;top_interval一般取m-1,m为样本变量数(也即样本属性的个数);
S23,设隐层节点数为k,其中,5≤k≤(K_fold-1)n/K_fold,计算所述的j个列属性子集的交叉验证误差;
S24,利用所述的j个列属性子集的交叉验证误差计算相应的权重wk
S25,计算j个列属性子集的ELM预测值,并利用该j个列属性子集的ELM预测值及其权重wk,获得总的预测值及均方根误差;将所述的均方根误差放入均方根误差矩阵中;
S26,令k=k+5,转至S23,直至k>(K_fold-1)n/K_fold时,令j=j+1,转至S22,直至j>top_interval时,令i=i+1,转至S21,直至i>K_fold,得K_fold个均方根误差矩阵,转至S27;
S27,计算所述的K_fold个均方根误差矩阵的均值,得均值矩阵;
S28,查找均值矩阵中的均方根误差最小值,该均方根误差最小值在矩阵中所对应的行号即为划分的列属性子集的最优个数interval,对应的列号即为最优隐层节点数L。
通过上述方法确定的最佳分段数interval能够使得分段数所对应的模型在精度更低的情况下,预测能力更稳定;通过这种方法确定的最优隐层节点数L,可以使模型避免过拟合的同时,保证良好的预测准确度。
本发明中,所述的权重wk通过以下方法确定:
其中,ek为第k个子模型的交叉验证误差。
本发明中,当隐层节点数为最优隐层节点数L时,计算得j个列属性子集的交叉验证误差;利用该交叉验证误差获得的即为最优权重。
前述的基于堆叠极限学习机的样品成份测定方法中,所述的待测样品为药品或食品。
优选的,所述的食品为啤酒或饼干。
本发明中,所述的ELM的隐含层权重随机确定,隐含层和输出层之间的权重通过最小二乘求解。
与现有技术相比,本发明具有以下优点:
1.通过利用堆叠极限学习机模型对待测样品的近红外光谱数据进行处理,从而即可获得该近红外光谱数据所对应的样品中各成分的含量,与采用传统模型进行数据处理相比,可以提高对样本量少、维度高的光谱数据的拟合精度,解决了扁平矩阵利用ELM求解时精度低且预测结果不稳定的问题;
2.本发明利用对数据列属性分块的思想,使得ELM能够满足近红外光谱等高维度小样本数据建模应用场景,提高了其预测精度;同时本发明的改进方法使ELM具有更好的鲁棒性;
3.本发明使用了双层交叉验证的方法确定模型的两个参数:最佳分段数和最佳隐层节点数,在外层,对分段数interval使用交叉验证,使分段的误差更具有稳定性;在内层,对每个子模型应用交叉验证,选取最佳隐层节点数,这样每个子模型产生的误差更稳定,使得计算得到的子模型权重更可靠,从而保证了整个模型更具有鲁棒性;
4.本发明的SELM测定方法的预测精度要比偏最小二乘(PLS)、堆叠偏最小二乘(SPLS)和ELM算法都高,同时也保持很好的模型解释能力;
5.本发明中的SELM测定方法对药片中活跃成分的预测非常有效,相对于SPLS的预测值的改善程度为12.7%;与改进前的普通ELM方法相比,预测值更是提高了28.3%;说明了SELM的提出,在药片数据集表现出了极强的预测能力,较其它方法的提高也是非常显著;
6.本发明中的SELM测定方法对啤酒数据非常有效,相对于SPLS的预测值的精度改善程度为47.9%,和改进前的普通ELM方法相比,预测值精度更是提高了90.0%;说明SELM的提出,针对啤酒数据集表现出了极强的预测能力,较其它方法的提高也是非常显著。
7.本发明中的SELM测定方法对饼干数据非常有效,其中,测定饼干中的脂肪含量时,相对于SPLS的预测值精度的改善程度为4.7%,和改进前的普通ELM方法相比,预测值的精度更是提高了63.3%。测定饼干中的蔗糖含量时,相对于SPLS的预测值的精度改善程度为41.6%。测定饼干中的面粉含量时,相对于SPLS的预测值的精度改善程度为5.9%,和改进前的普通ELM方法相比,预测值的精度更是提高了23.7%。测定饼干中的水分含量时,相对于SPLS的预测值的精度改善程度为17.0%,和改进前的普通ELM方法相比,预测值的精度更是提高了33.1%。
为了验证上述效果,发明人还做了以下试验研究:
实验例:对药品中的活跃成分、啤酒中的麦汁、饼干中的脂肪、蔗糖、面粉和水分进行含量测定
1.1实验数据
如图4为药片的NIRtablet数据集近红外光谱图,NIRtablet数据集是药片中放射性物质含量的吸光率。该数据集包含310个样本。NIR光谱被记录在700nm~2500nm范围内。每个药片的活跃成分含量是通过高效的液体层析法来测量的,并且以毫克为单位。光谱数据选取404个点,光谱图的纵坐标表示药片中药物活跃成分的含量的吸光率,可以用于预测该药物活跃成分的含量。
啤酒数据集包含60个近红外光谱样本以及相应的麦汁浓度(original extractconcentrations,OEC)。OEC的范围为4.23%~18.76%,由Carlsberg啤酒厂测得。采样方式为近红外透射,光谱采集范围为400~2250nm,采样间隔为2nm。该数据提供者划分为40个训练样本和20个测试样本,本试验将60个样本通过random,Ken-Stone方法重新划分成20%作为测试样本,剩余80%为训练样本。如图5为啤酒数据集的光谱图,其中,纵坐标表示啤酒样本吸光率,用于预测啤酒样本的麦汁的浓度。
饼干的近红外光谱数据集由Osborne提供。含有72个样本,采集范围为1100~2498nm,采集间隔为2nm。每个样本给出了四种成分的含量,包括脂肪、蔗糖、面粉和水分。本实验中采用了数据提供者的样本划分方式:40个样本作为训练集,32个样本作为测试集。在本试验中,72个样本被重新分配,通过random,Ken-Stone方法划分成20%做为测试样本,剩余80%为训练样本。图6为饼干数据集的光谱图。
1.2实验方法
利用matlab中函数对数据集做随机排列,然后选取数据集中80%的样本为训练样本,剩余20%的样本为测试样本。
采用本发明中的堆叠极限学习机模型(即SELM)进行含量预测,同时利用本发明中的方法确定模型的两个参数:最佳分段数和最佳隐层节点数。
对比方法:采用ELM、PLS和SPLS模型进行含量预测;其中ELM为SELM子模型用到的基础回归器,PLS是光谱分析领域成熟有效的、更具有代表性的算法,SPLS是在PLS的基础上成功的应用了堆叠策略的算法。
1.3实验结果分析
1.3.1药片光谱分析
i.利用双层的交叉验证误差选取最佳分段数和最佳隐含节点数。如图7所示(图7中代表RMSECV的Z轴是经过翻转的,所以图7中的最高点为交叉验证误差最小的点),对于药品数据集,随着分段数的增加,RMSECV先是小幅度波动,在第24段左右时达到最低,然后趋于平稳;另外,针对每个分段数,随着隐含节点数的增加,RMSECV先是降低,然后又升高。当光谱数据被分为24段、取100个隐含节点时取得了最小的RMSECV,因此在该数据集中,最佳分段数定为24段,隐含节点数定为100个。
ii.计算每个子模型在最终模型中所占的比重。采用本发明中的权重计算公式计算每个子模型在最终模型中所占的比重,结果如图8所示(图8中,柱状图的X轴对应的是第i个子模型(i=1,2,…,24),Y轴对应的是每个子模型在预测结果中所占的权重);对应的各个子模型的误差如图9所示(图9中,X轴对应的是第i个子模型(i=1,2,…,24),Y轴对应的是相应子模型的RMSE),由图9可知:模型的RMSE越小,对应的权重则越大,如第11个到第13个子模型的RMSE均较小,但这三个子模型所占的比重却为60%以上,从而保证了预测能力越好的子模型对最终预测结果的贡献越多。
iii.SELM模型与ELM、PLS和SPLS模型分别进行含量预测的效果比较。利用SELM模型及ELM、PLS和SPLS模型对药片光谱进行处理,获得的药片中活跃成分的含量预测值与真实值的对比效果如图10~图12所示。图10~图12中,连接两个图像顶点的直线为y=x,X轴代表真实值,Y轴代表预测值,若真实值和预测值相等,那么测试样本对应的点就会落在y=x这条直线上;当真实值与预测值的差距越大时,那么测试样本对应的点距离直线y=x也就越远。具体的说,由图10可知,ELM模型的预测结果虽然也都在直线y=x的周围,但是相对于SELM模型的预测结果而言,明显有很多点是远离直线y=x的,因此ELM模型的预测性能明显不如SELM模型;这也说明了相对于ELM模型,本发明的SELM模型可以更好的适应于样本少、高维度的近红外光谱数据的处理。由图11可知,虽然PLS模型的预测点都距离直线y=x较近,但是仍然有很多预测点的误差远远大于SELM模型的预测点误差,因此相对于PLS模型,本发明的SELM模型的预测误差更小,同时预测精度的稳定性更好。由图12可知,虽然SPLS模型的预测能力较好,真实值与预测值之间的差距较小,甚至有很多预测点落在了直线y=x上,但是相对于SPLS模型的预测结果,SELM模型却有更多的预测值比SPLS模型的预测值更接近真实值,因此相对于SPLS模型,本发明的SELM模型的预测结果更准确,且预测精度的稳定性更高。综上所述,与现有技术中的ELM、PLS和SPLS模型相比,本发明中的SELM模型的预测能力更好,预测精度更高、更稳定。
采用本发明的SELM模型及现有的ELM、PLS和SPLS模型的预测误差如表1所示:
表1采用不同定量模型对药片数据集进行处理的预测误差
Method stacked LV L RMSECV RMSEP
PLS / 4 / 0.3797 0.3572
ELM / / 20 0.4760 0.4351
SPLS 1 1 / 0.3834 0.3572
SELM 24 / 100 0.3395 0.3119
表1中,RMSECV为交叉验证均方根误差,由训练样本中的标定集得到,样本数量为训练样本的20%;RMSEP为预测均方根误差,由测试样本得到,样本数量为总样本的20%。
通过计算模型的均方根误差来衡量模型的预测精度,其计算公式为:
其中,为待测组分含量的预测值,ytrue为待测组分含量的真实值,N为测试样本数。
由表1可知,SELM算法通过利用本发明中的“列属性子集的最优划分个数interval和最优隐层节点数L”的确定方法后,将药片数据集划分为24段,同时将隐层节点数确定为100个,不仅相对于PLS、SPLS和ELM算法的预测精度更高,而且相对于其他的分段数目及隐层节点的设置数目对应的预测精度也更高(如图7所示),因此验证了SELM算法的有效性。另外,表1中,SELM和ELM的隐层节点数分别为100和20,说明了分段后和分段前的隐层节点数目的确定方法是不一样的。本发明通过利用交叉验证的方法确定列属性子集的最优个数interval和最优隐层节点数L,从而使得SELM模型获得了最小的RMSECV和RMSEP,相对于现有的PLS、SPLS和ELM模型具有更高的预测精度和更好的模型解释能力。
本发明的SELM模型相对于现有的ELM、PLS和SPLS模型的预测精度改进程度如表2所示:
表2 SELM模型相对于其他模型的预测精度改进程度
Method PLS ELM SPLS
h_improve 12.7% 28.3% 12.7%
表2中h_improve为SELM模型相对于其他模型的预测精度改进程度,计算公式为:
其中,RMSEPSELM、RMSEPother分别代表SELM模型和其它模型的预测均方根误差。
由表2可知:SELM算法对此实验中的药片数据非常有效,表现出了极强的预测能力。它的预测精度相对于SPLS算法和PLS算法均提高了12.7%;与改进前的普通ELM算法相比,预测精度更是提高了28.3%。
1.3.2啤酒光谱分析
i.利用双层的交叉验证误差选取最佳分段数和最佳隐含节点数。如图13所示(图13中代表RMSECV的Z轴是经过翻转的,所以图13中的最高点为交叉验证误差最小的点),对于啤酒数据集,随着分段数的增加,RMSECV先是大幅度降低,超过10段时开始变成波幅波动,在18段时取得最小的RMSECV,之后趋于平稳;另外,针对每个分段数,随着隐含节点数的增加,RMSECV先是降低,然后又升高。当光谱数据被分为18段、取15个隐含节点时取得了最小的RMSECV,因此该数据集中,最佳分段数定为18段,隐含节点数定为15个。
ii.计算每个子模型在最终模型中所占的比重。采用本发明中的权重计算公式计算每个子模型在最终模型中所占的比重,结果如图14所示(图14中,柱状图的X轴对应的是第i个子模型(i=1,2,…,18),Y轴对应的是每个子模型在预测结果中所占的权重);对应的各个子模型的误差如图15(图15中,X轴对应的是第i个子模型(i=1,2,…,18),Y轴对应的是相应子模型的RMSE)所示,由图15可知:模型的RMSE越小,对应的权重则越大,如第5个到第10个子模型的RMSE均较小,但这些子模型所占的比重却明显高于其它的子模型,尤其是第8段子模型的权重更是超过了40%,从而保证了预测能力越好的子模型对最终预测结果的贡献越多。
iii.SELM模型与ELM、PLS和SPLS模型分别进行含量预测的效果比较。利用SELM模型及ELM、PLS和SPLS模型对啤酒光谱进行处理,获得的啤酒中麦汁的含量预测值与真实值的对比效果如图16~图18所示。具体的说,由图16可知,ELM模型的预测结果虽然也都在直线y=x的周围,但是相对于SELM模型的预测结果而言,明显有很多点是远离直线y=x的,因此ELM模型的预测性能明显不如SELM模型;这也说明了相对于ELM模型,本发明的SELM模型可以更好的适应于样本少、高维度的近红外光谱数据的处理。由图17可知,虽然PLS模型的预测点都距离直线y=x较近,但是仍然有很多预测点的误差远远大于SELM模型的预测点误差,因此相对于PLS模型,本发明的SELM模型的预测误差更小,同时预测精度的稳定性更好。由图18可知,虽然SPLS模型的预测能力较好,真实值与预测值之间的差距较小,甚至有很多预测点落在了直线y=x上,但是相对于SPLS模型的预测结果,SELM模型却有更多的预测值比SPLS模型的预测值更接近真实值,因此相对于SPLS模型,本发明的SELM模型的预测结果更准确,且预测精度的稳定性更高。综上所述,与现有技术中的ELM、PLS和SPLS模型相比,本发明中的SELM模型的预测能力更好,预测精度更高、更稳定。
采用本发明的SELM模型及现有的ELM、PLS和SPLS模型的预测误差如表3所示:
表3采用不同定量模型对啤酒数据集进行处理的预测误差
Method stacked LV L RMSECV RMSEP
PLS / 3 / 0.7789 0.9820
ELM / / 10 1.7980 0.9767
SPLS 4 3 / 0.3302 0.1868
SELM 18 / 15 0.1373 0.0974
由表3可知,SELM算法通过利用本发明中的“列属性子集的最优划分个数interval和最优隐层节点数L”的确定方法后,将啤酒数据集划分为18段,同时将隐层节点数确定为15个,不仅相对于PLS、SPLS和ELM算法的预测精度更高,而且相对于其他的分段数目及隐层节点的设置数目对应的预测精度也更高(如图13所示),因此验证了SELM算法的有效性。另外,表1中,SELM和ELM的隐层节点数分别为15和10,说明了分段后和分段前的隐层节点数目的确定方法是不一样的。本发明通过利用交叉验证的方法确定列属性子集的最优个数interval和最优隐层节点数L,从而使得SELM模型获得了最小的RMSECV和RMSEP,相对于现有的PLS、SPLS和ELM模型具有更高的预测精度和更好的模型解释能力。
本发明的SELM模型相对于现有的ELM、PLS和SPLS模型的预测精度改进程度如表4所示:
表4 SELM模型相对于其他模型的预测精度改进程度
Method PLS ELM SPLS
h_improve 90.1% 90.0% 47.9%
由表4可知:SELM算法对此实验中的啤酒数据非常有效,表现出了极强的预测能力。它的预测精度相对于SPLS算法提高了47.9%,相对于PLS算法提高了90.1%,与改进前的普通ELM算法相比,预测精度提高了90.0%。
1.3.3饼干光谱分析
i.利用双层的交叉验证误差选取最佳分段数和最佳隐含节点数。如图19~图22所示(图19~图22分别代表的是饼干的四个成分——脂肪、蔗糖、面粉和水分对应的SELM模型在选取最佳分段数和最佳隐含节点时所产生的交叉验证误差的图形,其中代表RMSECV的Z轴是经过翻转的,所以图19~图22中的最高点为交叉验证误差最小的点),图19中,对于饼干数据集脂肪成分,随着分段数的增加,RMSECV先是大幅度降低,在5段时取得最小RMSECV,之后又开始升高;另外,针对每个分段数,随着隐含节点数的增加,RMSECV先是降低,然后又升高。当光谱数据被分为5段、取20个隐含节点时取得了最小的RMSECV,因此该数据集中,最佳分段数定为5段,隐含节点数定为20个。图20中,对于饼干数据集蔗糖成分,随着分段数的增加,RMSECV先是大幅度降低,在4段时取得最小RMSECV,之后又开始升高;另外,针对每个分段数,随着隐含节点数的增加,RMSECV先是降低,然后又升高。当光谱数据被分为4段、取25个隐含节点时取得了最小的RMSECV,因此该数据集中,最佳分段数定为4段,隐含节点数定为25个。图21中,对于饼干数据集面粉成分,随着分段数的增加,RMSECV先是大幅度降低,在16段时取得最小RMSECV,之后又开始升高;另外,针对每个分段数,随着隐含节点数的增加,RMSECV先是降低,然后又升高。当光谱数据被分为16段、取30个隐含节点时取得了最小的RMSECV,因此该数据集中,最佳分段数定为16段,隐含节点数定为30个。图22中,对于饼干数据集水分成分,随着分段数的增加,RMSECV先是大幅度降低,在38段时取得最小RMSECV,之后又开始升高;另外,针对每个分段数,随着隐含节点数的增加,RMSECV先是降低,然后又升高。当光谱数据被分为38段、取30个隐含节点时取得了最小的RMSECV,因此该数据集中,最佳分段数定为38段,隐含节点数定为30个。
ii.计算每个子模型在最终模型中所占的比重。采用本发明中的权重计算公式计算每个子模型在最终模型中所占的比重,结果如图23~图30所示。图23中,柱状图的X轴对应的是第i个子模型(i=1,2,…,5),Y轴对应的是每个子模型在预测结果中所占的权重;对应的各个子模型的误差如图24(图24中,X轴对应的是第i个子模型(i=1,2,…,5),Y轴对应的是相应子模型的RMSE)所示,由图24可知:模型的RMSE越小,对应的权重则越大,如第1个子模型的RMSE最小,但这个子模型却是所占比重最高的子模型,达到了50%,从而保证了预测能力越好的子模型对最终预测结果的贡献越多。图25中,柱状图的X轴对应的是第i个子模型(i=1,2,…,4),Y轴对应的是每个子模型在预测结果中所占的权重;对应的各个子模型的误差如图26(图26中,X轴对应的是第i个子模型(i=1,2,…,4),Y轴对应的是相应子模型的RMSE)所示,由图26可知:模型的RMSE越小,对应的权重则越大,如第1个子模型的RMSE最小,但这个子模型却是所占比重最高的子模型,达到了50%,从而保证了预测能力越好的子模型对最终预测结果的贡献越多。图27中,柱状图的X轴对应的是第i个子模型(i=1,2,…,16),Y轴对应的是每个子模型在预测结果中所占的权重;对应的各个子模型的误差如图28(图28中,X轴对应的是第i个子模型(i=1,2,…,16),Y轴对应的是相应子模型的RMSE)所示,由图28可知:模型的RMSE越小,对应的权重则越大,如第4个子模型的RMSE最小,但这个子模型却是所占比重最高的子模型,超过了20%,从而保证了预测能力越好的子模型对最终预测结果的贡献越多。图29中,柱状图的X轴对应的是第i个子模型(i=1,2,…,38),Y轴对应的是每个子模型在预测结果中所占的权重;对应的各个子模型的误差如图30(图30中,X轴对应的是第i个子模型(i=1,2,…,38),Y轴对应的是相应子模型的RMSE)所示,由图30可知:模型的RMSE越小,对应的权重则越大,如第6个子模型的RMSE最小,但这个子模型却是所占比重最高的子模型,达到了10%以上,从而保证了预测能力越好的子模型对最终预测结果的贡献越多。
iii.SELM模型与ELM、PLS和SPLS模型分别进行含量预测的效果比较。利用SELM模型及ELM、PLS和SPLS模型对饼干光谱进行处理,获得的饼干中脂肪、蔗糖、面粉和水分的含量预测值与真实值的对比效果如图31~图42所示。具体的说,由图31~图34可知,ELM模型的预测结果虽然也都在直线y=x的周围,但是相对于SELM模型的预测结果而言,明显有很多点是远离直线y=x的,因此ELM模型的预测性能明显不如SELM模型;这也说明了相对于ELM模型,本发明的SELM模型可以更好的适应于样本少、高维度的近红外光谱数据的处理。由图35~图38可知,虽然PLS模型的预测点都距离直线y=x较近,但是仍然有很多预测点的误差远远大于SELM模型的预测点误差,因此相对于PLS模型,本发明的SELM模型的预测误差更小,同时预测精度的稳定性更好。由图39~图42可知,虽然SPLS模型的预测能力较好,真实值与预测值之间的差距较小,甚至有很多预测点落在了直线y=x上,但是相对于SPLS模型的预测结果,SELM模型却有更多的预测值比SPLS模型的预测值更接近真实值,因此相对于SPLS模型,本发明的SELM模型的预测结果更准确,且预测精度的稳定性更高。综上所述,与现有技术中的ELM、PLS和SPLS模型相比,本发明中的SELM模型的预测能力更好,预测精度更高、更稳定。
采用本发明的SELM模型及现有的ELM、PLS和SPLS模型的预测误差如表5所示:
表5采用不同定量模型对饼干数据集进行处理的预测误差
由表5可知,SELM算法通过利用本发明中的“列属性子集的最优划分个数interval和最优隐层节点数L”的确定方法后,将饼干数据集脂肪成分划分为5段,同时将隐层节点数确定为20个,将饼干数据集蔗糖成分划分为4段,同时将隐层节点数确定为25个,将饼干数据集面粉成分划分为16段,同时将隐层节点数确定为30个,将饼干数据集水分成分划分为38段,这时,不但比PLS、SPLS和ELM算法的预测精度更高,而且比其他的分段数目及隐层节点的设置数目对应的预测精度也更高(如图19~图22所示),因此验证了SELM算法的有效性。另外,表5中,SELM和ELM的隐层节点数分别为20和10、30和15、30和20,说明了分段后和分段前的隐层节点数目的确定方法是不一样的。
可见,本发明通过利用交叉验证的方法确定列属性子集的最优个数interval和最优隐层节点数L,从而使得SELM模型获得了最小的RMSECV和RMSEP,相对于现有的PLS、SPLS和ELM模型具有更高的预测精度和更好的模型解释能力。
本发明的SELM模型相对于现有的ELM、PLS和SPLS模型的预测精度改进程度如表6所示:
表6 SELM模型相对于其他模型的预测精度改进程度
biscuit Method PLS ELM SPLS
Fat h_improve 42.2% 63.3% 4.7%
Sucrose h_improve 41.6% 31.2% 41.6%
Flour h_improve 19.7% 23.7% 5.9%
Water h_improve 25.4% 33.1% 17.0%
由表6可知:SELM算法对此实验中的饼干数据非常有效,表现出了极强的预测能力。对于饼干数据集中的脂肪成分,它的预测精度相对于SPLS算法提高了4.7%,相对于PLS算法提高了42.2%,与改进前的普通ELM算法相比,预测精度提高了63.3%;对于饼干数据集中的蔗糖成分,它的预测精度相对于SPLS算法提高了41.6%,相对于PLS算法提高了41.6%,与改进前的普通ELM算法相比,预测精度提高了31.2%;对于饼干数据集中的面粉成分,它的预测精度相对于SPLS算法提高了5.9%,相对于PLS算法提高了19.7%,与改进前的普通ELM算法相比,预测精度提高了23.7%;对于饼干数据集中的水分成分,它的预测精度相对于SPLS算法提高了17.0%,相对于PLS算法提高了25.4%,与改进前的普通ELM算法相比,预测精度提高了33.1%。
1.4结论
通过药片NIR光谱数据集、啤酒NIR光谱数据集和饼干NIR光谱数据集进行实验,验证了本发明中的SELM算法的有效性;并且相对于PLS、ELM和SPLS算法,其预测值的精度及预测稳定性均有较明显的改善。
附图说明
图1为ELM的单隐层前馈型神经网络结构示意图;
图2为堆叠极限学习机模型(SELM)的建模过程示意图;
图3为确定划分的列属性子集的最优个数interval和最优隐层节点数L的方法流程图;
图4为药片数据集的光谱图;
图5为啤酒数据集的光谱图;
图6为饼干数据集的光谱图;
图7为药片数据确定最佳分段数和最佳隐层节点数示意图;
图8为药片数据中子模型的权重示意图;
图9为药片数据中各个子模型的误差图;
图10为针对药片数据SELM算法和ELM算法的比较结果示意图;
图11为针对药片数据SELM算法和PLS算法的比较结果示意图;
图12为针对药片数据SELM算法和SPLS算法的比较结果示意图;
图13为啤酒数据确定最佳分段数和最佳隐含节点的示意图;
图14为啤酒数据中子模型的权重示意图;
图15为啤酒数据中各个子模型的误差图;
图16为针对啤酒数据SELM算法和ELM算法的预测结果比较示意图;
图17为针对啤酒数据SELM算法和PLS算法的预测结果比较示意图;
图18为针对啤酒数据SELM算法和SPLS算法的预测结果比较示意图;
图19为饼干中的脂肪对应的SELM模型在选取最佳分段数和最佳隐含节点时所产生的交叉验证误差的图形;
图20为饼干中的蔗糖对应的SELM模型在选取最佳分段数和最佳隐含节点时所产生的交叉验证误差的图形;
图21为饼干中的面粉对应的SELM模型在选取最佳分段数和最佳隐含节点时所产生的交叉验证误差的图形;
图22为饼干中的水分对应的SELM模型在选取最佳分段数和最佳隐含节点时所产生的交叉验证误差的图形;
图23为饼干中的脂肪数据中子模型的权重示意图;
图24为饼干中的脂肪数据中各个子模型的误差图;
图25为饼干中的蔗糖数据中子模型的权重示意图;
图26为饼干中的蔗糖数据中各个子模型的误差图;
图27为饼干中的面粉数据中子模型的权重示意图;
图28为饼干中的面粉数据中各个子模型的误差图;
图29为饼干中的水分数据中子模型的权重示意图;
图30为饼干中的水分数据中各个子模型的误差图;
图31为针对饼干中的脂肪数据SELM算法和ELM算法的预测结果比较示意图;
图32为针对饼干中的蔗糖数据SELM算法和ELM算法的预测结果比较示意图;
图33为针对饼干中的面粉数据SELM算法和ELM算法的预测结果比较示意图;
图34为针对饼干中的水分数据SELM算法和ELM算法的预测结果比较示意图;
图35为针对饼干中的脂肪数据SELM算法和PLS算法的预测结果比较示意图;
图36为针对饼干中的蔗糖数据SELM算法和PLS算法的预测结果比较示意图;
图37为针对饼干中的面粉数据SELM算法和PLS算法的预测结果比较示意图;
图38为针对饼干中的水分数据SELM算法和PLS算法的预测结果比较示意图;
图39为针对饼干中的脂肪数据SELM算法和SPLS算法的预测结果比较示意图;
图40为针对饼干中的蔗糖数据SELM算法和SPLS算法的预测结果比较示意图;
图41为针对饼干中的面粉数据SELM算法和SPLS算法的预测结果比较示意图;
图42为针对饼干中的水分数据SELM算法和SPLS算法的预测结果比较示意图。
下面结合附图和具体实施方式对本发明作进一步的说明。
具体实施方式
本发明的实施例:基于堆叠极限学习机的样品成份测定方法,包括以下步骤:
S1,采集待测样品的近红外光谱数据;
S2,通过堆叠极限学习机模型,获得该近红外光谱数据所对应的样品中各成分的含量。其中,通过将近红外光谱数据的列属性划分为若干子段,然后对每个子段均进行独立的ELM模型训练,再对所有的子段模型进行加权集成,即得堆叠极限学习机模型;具体的说,所述的堆叠极限学习机模型具体通过以下方法建立(如图2所示):
a.采集n个样本X的近红外光谱数据及其对应的样本中各成分的含量数据作为训练样本,其中,每个样本包含m个属性,即X为一个n*m维矩阵;
b.将所述样本X的列属性划分为j个列属性子集,每个列属性子集为一个n*l维矩阵,其中,l=m/j;划分的列属性子集的最优个数interval通过交叉验证的方法确定;
c.通过ELM算法分别对所述的近红外光谱数据的各个列属性子集和样本中各成分的含量之间建模,得j个子模型;
d.计算每个子模型的最优隐层节点数L和隐层输出权值βk,分别获得j个子模型的预测值;
各个子模型的最优隐层节点数L通过交叉验证的方法确定;具体通过以下方法确定划分的列属性子集的最优个数interval和最优隐层节点数L:
S21,将所述的n个样本X的近红外光谱数据及其对应的样本中各成分的含量数据分为K_fold份,将第i份作为测试集,剩余的K_fold-1份作为训练集进行交叉验证,其中,1≤i≤K_fold;K_fold一般可取10;
S22,进行交叉验证时,将所述的测试集和训练集的列属性划分为j份,分别得j个列属性子集,其中,1≤j≤top_interval;top_interval一般取m-1,m为样本变量数(也即样本属性的个数);
S23,设隐层节点数为k,其中,5≤k≤(K_fold-1)n/K_fold,计算所述的j个列属性子集的交叉验证误差;
S24,利用所述的j个列属性子集的交叉验证误差计算相应的权重wk;所述的权重wk通过以下方法确定:
其中,ek为第k个子模型的交叉验证误差;当隐层节点数为最优隐层节点数L时,计算得j个列属性子集的交叉验证误差;利用该交叉验证误差获得的即为最优权重;
S25,计算j个列属性子集的ELM预测值,并利用该j个列属性子集的ELM预测值及其权重wk,获得总的预测值及均方根误差;将所述的均方根误差放入均方根误差矩阵中;
S26,令k=k+5,转至S23,直至k>(K_fold-1)n/K_fold时,令j=j+1,转至S22,直至j>top_interval时,令i=i+1,转至S21,直至i>K_fold,得K_fold个均方根误差矩阵,转至S27;
S27,计算所述的K_fold个均方根误差矩阵的均值,得均值矩阵;
S28,查找均值矩阵中的均方根误差最小值,该均方根误差最小值在矩阵中所对应的行号即为划分的列属性子集的最优个数interval,对应的列号即为最优隐层节点数L。
e.对所述的j个子模型的预测值进行加权整合,即得堆叠极限学习机模型:
其中,为堆叠极限学习机模型的预测值,为第k个子模型的预测值,wk(k=1,2…j)为其权重,是第k个子模型对最终模型的影响因子,βk为第k个子模型的隐层输出权值,Hk为第k个子模型的隐含层输出矩阵,n为样本数。
所述的待测样品为药品或食品,且对于药片、啤酒和饼干的测定尤为精确。

Claims (8)

1.基于堆叠极限学习机的样品成份测定方法,其特征在于,包括以下步骤:
S1,采集待测样品的近红外光谱数据;
S2,通过堆叠极限学习机模型,获得该近红外光谱数据所对应的样品中各成分的含量;
其中,通过将近红外光谱数据的列属性划分为若干子段,然后对每个子段均进行独立的ELM模型训练,再对所有的子段模型进行加权集成,即得堆叠极限学习机模型;所述的堆叠极限学习机模型具体通过以下方法建立:
a.采集n个样本X的近红外光谱数据及其对应的样本中各成分的含量数据作为训练样本,其中,每个样本包含m个属性,即X为一个n*m维矩阵;
b.将所述样本X的列属性划分为j个列属性子集,每个列属性子集为一个n*l维矩阵,其中,l=m/j;
c.通过ELM算法分别对所述的近红外光谱数据的各个列属性子集和样本中各成分的含量之间建模,得j个子模型;
d.计算每个子模型的最优隐层节点数L和隐层输出权值βk,分别获得j个子模型的预测值;
e.对所述的j个子模型的预测值进行加权整合,即得堆叠极限学习机模型。
2.根据权利要求1所述的基于堆叠极限学习机的样品成份测定方法,其特征在于,步骤e中所述的堆叠极限学习机模型为:
其中,为堆叠极限学习机模型的预测值,k=1,2,…,j,为第k个子模型的预测值,wk,k=1,2,…,j,为其权重,是第k个子模型对最终模型的影响因子,βk为第k个子模型的隐层输出权值,Hk为第k个子模型的隐含层输出矩阵,n为样本数。
3.根据权利要求2所述的基于堆叠极限学习机的样品成份测定方法,其特征在于,步骤b中,划分的列属性子集的最优个数interval通过交叉验证的方法确定;步骤d中,各个子模型的最优隐层节点数L通过交叉验证的方法确定。
4.根据权利要求3所述的基于堆叠极限学习机的样品成份测定方法,其特征在于,具体通过以下方法确定划分的列属性子集的最优个数interval和最优隐层节点数L:
S21,将所述的n个样本X的近红外光谱数据及其对应的样本中各成分的含量数据分为K_fold份,将第i份作为测试集,剩余的K_fold-1份作为训练集进行交叉验证,其中,1≤i≤K_fold;
S22,进行交叉验证时,将所述的测试集和训练集的列属性划分为j份,分别得j个列属性子集,其中,1≤j≤top_interval;
S23,设隐层节点数为k,其中,5≤k≤(K_fold-1)n/K_fold,计算所述的j个列属性子集的交叉验证误差;
S24,利用所述的j个列属性子集的交叉验证误差计算相应的权重wk
S25,计算j个列属性子集的ELM预测值,并利用该j个列属性子集的ELM预测值及其权重wk,获得总的预测值及均方根误差;将所述的均方根误差放入均方根误差矩阵中;
S26,令k=k+5,转至S23,直至k>(K_fold-1)n/K_fold时,令j=j+1,转至S22,直至j>top_interval时,令i=i+1,转至S21,直至i>K_fold,得K_fold个均方根误差矩阵,转至S27;
S27,计算所述的K_fold个均方根误差矩阵的均值,得均值矩阵;
S28,查找均值矩阵中的均方根误差最小值,该均方根误差最小值在矩阵中所对应的行号即为划分的列属性子集的最优个数interval,对应的列号即为最优隐层节点数L。
5.根据权利要求2或4所述的基于堆叠极限学习机的样品成份测定方法,其特征在于,所述的权重wk通过以下方法确定:
其中,ek为第k个子模型的交叉验证误差。
6.根据权利要求5所述的基于堆叠极限学习机的样品成份测定方法,其特征在于,当隐层节点数为最优隐层节点数L时,计算得j个列属性子集的交叉验证误差;利用该交叉验证误差获得的即为最优权重。
7.根据权利要求1~4任一所述的基于堆叠极限学习机的样品成份测定方法,其特征在于,所述的待测样品为药品或食品。
8.根据权利要求7所述的基于堆叠极限学习机的样品成份测定方法,其特征在于,所述的食品为啤酒或饼干。
CN201510404882.2A 2015-07-10 2015-07-10 基于堆叠极限学习机的样品成份测定方法 Active CN105095652B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510404882.2A CN105095652B (zh) 2015-07-10 2015-07-10 基于堆叠极限学习机的样品成份测定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510404882.2A CN105095652B (zh) 2015-07-10 2015-07-10 基于堆叠极限学习机的样品成份测定方法

Publications (2)

Publication Number Publication Date
CN105095652A CN105095652A (zh) 2015-11-25
CN105095652B true CN105095652B (zh) 2017-10-03

Family

ID=54576070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510404882.2A Active CN105095652B (zh) 2015-07-10 2015-07-10 基于堆叠极限学习机的样品成份测定方法

Country Status (1)

Country Link
CN (1) CN105095652B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN204515353U (zh) * 2015-03-31 2015-07-29 深圳市长桑技术有限公司 一种智能手表
CN107918718B (zh) * 2017-11-03 2020-05-22 东北大学秦皇岛分校 基于在线顺序极限学习机的样品成分含量测定方法
CN109615082B (zh) * 2018-11-26 2023-05-12 北京工业大学 一种基于堆叠选择性集成学习器的空气中细颗粒物pm2.5浓度的预测方法
CN109900645A (zh) * 2019-04-17 2019-06-18 岭南师范学院 一种基于高光谱图像技术的牡蛎重金属含量测定方法
CN115345239B (zh) * 2022-08-17 2023-10-13 无锡迅杰光远科技有限公司 样品含量识别方法、装置和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005222445A (ja) * 2004-02-09 2005-08-18 Nifty Corp データマイニングにおける情報処理方法及び解析装置
CN103279679A (zh) * 2013-06-09 2013-09-04 浪潮电子信息产业股份有限公司 一种基于链式可重写窗口的数据流在线预测方法
CN103400052A (zh) * 2013-08-22 2013-11-20 武汉大学 一种风电场短期风速组合预测方法
CN103441934A (zh) * 2013-08-16 2013-12-11 福建星网锐捷网络有限公司 一种堆叠拓扑的学习方法及装置
CN103488887A (zh) * 2013-09-16 2014-01-01 北京理工大学 一种基于混合专家网络的产品可靠性评估方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7669171B2 (en) * 2007-09-05 2010-02-23 United Miceoelectronics Corp. Prediction model and prediction method for exposure dose

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005222445A (ja) * 2004-02-09 2005-08-18 Nifty Corp データマイニングにおける情報処理方法及び解析装置
CN103279679A (zh) * 2013-06-09 2013-09-04 浪潮电子信息产业股份有限公司 一种基于链式可重写窗口的数据流在线预测方法
CN103441934A (zh) * 2013-08-16 2013-12-11 福建星网锐捷网络有限公司 一种堆叠拓扑的学习方法及装置
CN103400052A (zh) * 2013-08-22 2013-11-20 武汉大学 一种风电场短期风速组合预测方法
CN103488887A (zh) * 2013-09-16 2014-01-01 北京理工大学 一种基于混合专家网络的产品可靠性评估方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"利用近红外高光谱图像技术快速鉴别西瓜种子品种";张初 等;《农业工程学报》;20131031;第29卷(第20期);第270-277页 *
"基于波形叠加极限学习机的近红外光谱药品鉴别";刘振丙 等;《光谱学与光谱分析》;20141031;第34卷(第10期);第2815-2820页 *

Also Published As

Publication number Publication date
CN105095652A (zh) 2015-11-25

Similar Documents

Publication Publication Date Title
CN105095652B (zh) 基于堆叠极限学习机的样品成份测定方法
CN111126575B (zh) 基于机器学习的气体传感器阵列混合气体检测方法及装置
Dong et al. Predictive analysis of beer quality by correlating sensory evaluation with higher alcohol and ester production using multivariate statistics methods
CN109635245A (zh) 一种鲁棒宽度学习系统
CN101216419A (zh) 一种快速检测黄酒品质指标的方法
CN105092519A (zh) 基于增量偏最小二乘法的样品成份测定方法
CN106918565A (zh) 基于室内标样高光谱特征的土壤重金属Cd含量反演建模及其光谱响应特征波段识别方法
CN110443419A (zh) 基于iceemdan与极限学习机的中长期径流预测方法
Oliveri et al. Chemometric brains for artificial tongues
CN110070004B (zh) 一种应用于深度学习的近地高光谱数据扩展方法
Jiang et al. Quantitative analysis of aflatoxin B1 in moldy peanuts based on near-infrared spectra with two-dimensional convolutional neural network
CN105092509B (zh) 一种基于pcr‑elm算法的样品成份测定方法
CN107504909A (zh) 基于贝叶斯正则化算法的白光反射率测量薄膜厚度自适应方法
CN107526294A (zh) 一种非线性时滞动态系统模型智能辨识方法
CN109063767B (zh) 一种基于样本和变量共识的近红外光谱建模方法
CN106529680A (zh) 一种基于经验模态分解的多尺度极限学习机集成建模方法
CN115186584A (zh) 一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法
CN104573816B (zh) 微波辐射计遥感大气参数的神经网络聚类方法
CN112509643B (zh) 一种定量分析模型构建方法、定量分析方法、装置及系统
CN111292006A (zh) 基于黄酒制品品质范围获取原料品质范围的方法及装置
Guan et al. The qualitative and quantitative analysis of aromatic vinegar produced during different seasons by near infrared spectroscopy
Dürauer et al. Monitoring product quantity, purity and potency of biopharmaceuticals in real-time by predictive chemometrics and soft sensors
Zhang et al. Application of artificial neural network and DS algorithm to calibration transfer of rice protein powder
Saidi et al. Spectrofluorimetric determination of ochratoxin A in wheat and rice products using an artificial neural network
CN117288903B (zh) 一种飞机复合材料积木式测试方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant