CN109783772A - 一种确定偏最小二乘回归潜变量数的方法 - Google Patents
一种确定偏最小二乘回归潜变量数的方法 Download PDFInfo
- Publication number
- CN109783772A CN109783772A CN201711122113.9A CN201711122113A CN109783772A CN 109783772 A CN109783772 A CN 109783772A CN 201711122113 A CN201711122113 A CN 201711122113A CN 109783772 A CN109783772 A CN 109783772A
- Authority
- CN
- China
- Prior art keywords
- variable number
- latent variable
- sub
- stability parameter
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000010238 partial least squares regression Methods 0.000 title claims abstract description 34
- 238000012360 testing method Methods 0.000 claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 25
- 238000012795 verification Methods 0.000 claims abstract description 15
- 238000004458 analytical method Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000002211 ultraviolet spectrum Methods 0.000 claims description 4
- 238000002329 infrared spectrum Methods 0.000 claims description 3
- 239000000523 sample Substances 0.000 description 19
- 230000008569 process Effects 0.000 description 16
- 239000000126 substance Substances 0.000 description 9
- 230000008859 change Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 239000000203 mixture Substances 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 3
- 230000000630 rising effect Effects 0.000 description 3
- 239000012488 sample solution Substances 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种确定偏最小二乘回归潜变量数的方法,包括:选择潜变量数,基于采集到的样品,采用交互验证法选择N个子训练集和与之一一对应的N个子测试集;利用N个所述子训练集建立N个子模型,并利用与所述子训练集对应的子模型对与所述子训练集对应的子测试集进行预测;记录每个所述子模型的回归系数,并根据每个所述子模型的回归系数计算得到所述潜变量数对应的稳定性参数;选择另一个潜变量数,继续进行基于所述样品采用所述交互验证法建立多个子模型的步骤;确定所述稳定性参数最大时对应的潜变量数为最优潜变量数。稳定性参数随潜变量数变化的曲线具有先上升后下降的特点,方便工作人选确定最优潜变量数,从而建立稳定性良好的模型。
Description
技术领域
本发明涉及数据分析与处理领域,特别是涉及一种确定偏最小二乘回归潜变量数的方法。
背景技术
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。
在某些特定的领域,如现代分析化学所要处理的化学数据往往是一些具有小样本数,但是却拥有很庞大的变量数的高维数据。这样的数据被称为“large p,small n”问题,对于统计学这是一个很有挑战的问题。
偏最小二乘回归(PLSR)是一种能够处理变量数多于样本数(p>n)问题的一种常用方法。潜变量(LV)数的确定决定着偏最小二乘回归模型的质量,用过少的潜变量数进行建模,会造成“欠拟合”(under-fitting),用过多的潜变量数进行建模又会造成“过拟合”(over-fitting)。
目前最为常用的确定偏最小二乘回归模型潜变量数的方法是交互验证(CV)法。这种方法是将通过交互验证得到的交互验证均方根误差或决定系数作为标准来选取偏最小二乘回归模型的潜变量数,并认为能够得到最小交互验证均方根误差或最接近1的决定系数的潜变量数所建立的偏最小二乘回归模型为最优。但是以这种标准来选取潜变量数时,经常会遇到交互验证均方根误差一直减小(或决定系数一直趋近于1),或者是不同的潜变量数所建立的偏最小二乘回归模型的预测能力差别微小(或决定系数间差别微小),从而难以确定潜变量数的情况。这个时候如果还是按照这种原则确定潜变量数,往往会造成选择了过多的潜变量数进而造成偏最小二乘回归模型的过拟合。
因此,如何避免在建立偏最小二乘回归模型时出现因选择了过多的潜变量数造成的过拟合的情况,是本领域技术人员需要解决的技术问题。
发明内容
本发明的目的是提供一种确定偏最小二乘回归潜变量数的方法,用于避免在建立偏最小二乘回归模型时出现因选择了过多的潜变量数造成的过拟合的情况。
为解决上述技术问题,本发明提供一种确定偏最小二乘回归潜变量数的方法,包括:
计算各潜变量数对应的稳定性参数;
确定所述稳定性参数最大时对应的潜变量数为最优潜变量数;
其中,计算潜变量数对应的稳定性参数具体包括:
基于采集到的样品,采用交互验证法选择N个子训练集和与之一一对应的N个子测试集;其中,所述N为正整数;
利用各所述子训练集建立当前潜变量数对应的子模型,并利用与所述子训练集对应的子模型对与所述子训练集对应的子测试集进行预测;
记录每个所述子模型的回归系数,并根据每个所述子模型的回归系数计算得到所述潜变量数对应的稳定性参数。
可选地,所述计算各潜变量数对应的稳定性参数具体包括:
按从小到大的顺序排列各所述潜变量数;
从最小的潜变量数开始,依次计算各所述潜变量数对应的稳定性参数并比较所述稳定性参数与上一次计算得到的稳定性参数的大小,直到稳定性参数连续减小的次数大于阈值为止。
可选地,还包括:
计算各所述潜变量数对应的决定系数;
相应的,结合所述稳定性参数与所述决定系数确定所述最优潜变量数;
其中,计算潜变量数对应的决定系数具体为根据测试得到的每个所述子测试集的预测值与每个所述子测试集的真值计算得到所述潜变量数对应的决定系数。
可选地,还包括:
计算各所述潜变量数对应的交互验证均方根误差;
相应的,结合所述稳定性参数与所述交互验证均方根误差确定所述最优潜变量数;
其中,计算潜变量数对应的交互验证均方根误差具体为根据测试得到的每个所述子测试集的预测值与每个所述子测试集的真值计算得到所述潜变量数对应的交互验证均方根误差。
可选地,所述交互验证法具体为蒙特卡洛交互验证法。
可选地,所述采集样品具体为:
采集所述样品的分析数据和成分含量数据。
可选地,所述分析数据具体为近红外光谱数据。
可选地,所述分析数据具体为紫外光谱数据。
本发明所提供的确定偏最小二乘回归潜变量数的方法,包括:选择潜变量数,基于采集到的样品,采用交互验证法选择N个子训练集和与之一一对应的N个子测试集;利用N个所述子训练集建立N个子模型,并利用与所述子训练集对应的子模型对与所述子训练集对应的子测试集进行预测;记录每个所述子模型的回归系数,并根据每个所述子模型的回归系数计算得到所述潜变量数对应的稳定性参数;选择另一个潜变量数,继续进行基于所述样品采用所述交互验证法建立多个子模型的步骤;确定所述稳定性参数最大时对应的潜变量数为最优潜变量数。
通过实验表明,若采用现有技术中的决定系数或交互验证均方根误差作为选择潜变量数的依据,前者随潜变量数的增加而增加直至趋于稳定,后者随潜变量数的增加而下降直至趋于稳定,虽然两者的曲线中都有转折点,但是转折点不是很明显,工作人员很容易选错最优潜变量数,从而可能造成过拟合。而稳定性参数的曲线一般随潜变量数的增加呈现先上升后下降的趋势,因此很容易从稳定性参数的曲线图中确定稳定性参数最大的点,选择对应的潜变量数作为最优潜变量数,即可获得稳定性最好的模型,从而避免在建立偏最小二乘回归模型时出现因选择了过多的潜变量数造成的过拟合的情况。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的第一种确定偏最小二乘回归潜变量数的方法的流程图;
图2为本发明实施例提供的稳定性参数随潜变量数变化的曲线示意图;
图3为本发明实施例提供的一种步骤S10对应的流程图;
图4为本发明实施例提供的第二种确定偏最小二乘回归潜变量数的方法的流程图;
图5为本发明实施例提供的一种稳定性参数及决定系数随潜变量数变化的曲线示意图;
图6为本发明实施例提供的第三种确定偏最小二乘回归潜变量数的方法的流程图;
图7为本发明实施例提供的一种稳定性参数及交互验证均方根误差随潜变量数变化的曲线示意图。
具体实施方式
本发明的核心是提供一种确定偏最小二乘回归潜变量数的方法,用于避免在建立偏最小二乘回归模型时出现因选择了过多的潜变量数造成的过拟合的情况。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的第一种确定偏最小二乘回归潜变量数的方法的流程图。图2为本发明实施例提供的稳定性参数随潜变量数变化的曲线示意图。
如图1所示,确定偏最小二乘回归潜变量数的方法包括:
S10:计算各潜变量数对应的稳定性参数。
S11:确定所述稳定性参数最大时对应的潜变量数为最优潜变量数。
其中,S10中计算潜变量数对应的稳定性参数具体包括:
基于采集到的样品,采用交互验证法选择N个子训练集和与之一一对应的N个子测试集;其中,N为正整数;
利用各子训练集建立当前潜变量数对应的子模型,并利用与子训练集对应的子模型对与子训练集对应的子测试集进行预测;
记录每个子模型的回归系数,并根据每个子模型的回归系数计算得到潜变量数对应的稳定性参数。
模型过拟合产生的原因是选择了过多的潜变量数。如在化学成分分析中分析光谱数据时,选择了过多的潜变量数意味着可能将噪声等干扰量加入了建模的过程,而在利用建好的模型进行预测时,因为这些干扰量是不稳定的值,所以预测结果很不理想,造成了过拟合现象。而通过稳定性参数确定的潜变量数,选择最优潜变量数时建立的模型具有最好的稳定性,说明排除了干扰量,因此有效避免了过拟合现象。
在具体实施中,对于步骤S10来说,在计算潜变量数对应的稳定性参数过程中,由回归系数矩阵进行主成分分析计算得到稳定性参数,计算公式如下:
其中,j表示本次计算中的潜变量数,Sj表示潜变量数为j时计算得到的稳定性参数,Varj,1表示在潜变量数为j时能够被主成分数是1解释的信息,Varj,all(Varj,all=Varj,1+Varj,2+Varj,3+Varj,4......)表示在潜变量数为j时能够被所有主成分解释的信息。
可选地,在选择子训练集和子测试集时,可采用蒙特卡洛交互验证法。蒙特卡洛交互验证法的基本思想是以较多样本作为子测试集为前提,随机地将样本分割为两部分,并重复这个过程。通过实验表明,采用蒙特卡洛交互验证法选择的子训练集和子测试集最后建立的模型是最好的,因此在采用蒙特卡洛交互验证法的基础上,再计算不同潜变量数对应的稳定性参数,能够更好地确定最优潜变量数。
对于步骤S11来说,如图2所示,以潜变量数为x轴,以稳定性参数为y轴建立坐标系,可以看到,随着潜变量数的增加,稳定性参数曲线呈现先上升后下降的趋势,可以很容易地找到稳定性参数的最大值,而此时模型的稳定性最好,因此稳定性参数的最大值对应的潜变量数即为最优潜变量数。
本发明实施例提供的确定偏最小二乘回归潜变量数的方法,包括:选择潜变量数,基于采集到的样品,采用交互验证法选择N个子训练集和与之一一对应的N个子测试集;利用N个所述子训练集建立N个子模型,并利用与所述子训练集对应的子模型对与所述子训练集对应的子测试集进行预测;记录每个所述子模型的回归系数,并根据每个所述子模型的回归系数计算得到所述潜变量数对应的稳定性参数;选择另一个潜变量数,继续进行基于所述样品采用所述交互验证法建立多个子模型的步骤;确定所述稳定性参数最大时对应的潜变量数为最优潜变量数。通过实验表明,若采用现有技术中的决定系数或交互验证均方根误差作为选择潜变量数的依据,前者随潜变量数的增加而增加直至趋于稳定,后者随潜变量数的增加而下降直至趋于稳定,虽然两者的曲线中都有转折点,但是转折点不是很明显,工作人员很容易选错最优潜变量数,从而可能造成过拟合。而稳定性参数的曲线一般随潜变量数的增加呈现先上升后下降的趋势,因此很容易从稳定性参数的曲线图中确定稳定性参数最大的点,选择对应的潜变量数作为最优潜变量数,即可获得稳定性最好的模型,从而避免在建立偏最小二乘回归模型时出现因选择了过多的潜变量数造成的过拟合的情况。
图3为本发明实施例提供的一种步骤S10对应的流程图。如图3所示,步骤S10具体包括:
S30:按从小到大的顺序排列各潜变量数。
S31:从最小的潜变量数开始,依次计算各潜变量数对应的稳定性参数并比较该稳定性参数与上一次计算得到的稳定性参数的大小,直到稳定性参数连续减小的次数大于阈值为止。
本发明实施例旨在说明何时结束计算各潜变量数对应的稳定性参数的过程。
在具体实施中,按从小到大的顺序排列各潜变量数,从最小的潜变量数开始,依次计算各潜变量数对应的稳定性参数,即依次计算潜变量数为1时对应的稳定性参数、潜变量数为2时对应的稳定性参数、潜变量数为3时对应的稳定性参数……
在每次计算完都比较该稳定性参数与上一次计算得到的稳定性参数的大小,可以将稳定性参数随潜变量数的变化体现坐标系中,如图2所示。
稳定性参数连续减小的次数大于阈值为止,如果阈值为2,即稳定性参数连续减小的次数为两次以上,则终止计算。
本发明实施例提供的确定偏最小二乘回归潜变量数的方法,说明了何时结束计算各潜变量数对应的稳定性参数的过程。可以避免过多的计算,节省时间与精力。
图4为本发明实施例提供的第二种确定偏最小二乘回归潜变量数的方法的流程图。图5为本发明实施例提供的一种稳定性参数及决定系数随潜变量数变化的曲线示意图。
如图4所示,在上述实施例的基础上,在另一实施例中,确定偏最小二乘回归潜变量数的方法还包括:
S40:计算各潜变量数对应的决定系数。
S41:结合稳定性参数与决定系数确定最优潜变量数。
其中,计算潜变量数对应的决定系数具体为根据测试得到的每个子测试集的预测值与每个子测试集的真值计算得到潜变量数对应的决定系数。
需要说明的是,在本发明实施例中,步骤S40与步骤S10没有顺序关系,用步骤S41代替原步骤S11。
由于模型不同,稳定性参数随潜变量数变化的趋势也是不同的,有时候可能不容易判断稳定性参数的最大值。因此可结合决定系数与稳定性参数一起确定最优潜变量数。
在具体实施中,对于步骤S40来说,计算各潜变量数对应的决定系数,计算公式如下:
其中,j表示本次计算中的潜变量数,表示在潜变量数为j时计算得到的决定系数,N表示样本个数,yj,n表示样品的实际值,表示样品的预测值,表示样品实际值的平均值。
如图5所示,结合稳定性参数及决定系数随潜变量数变化的曲线示意图,可以看到在潜变量数为4时对应的稳定性参数最大,而决定系数的变化曲线开始趋于平稳,因此最优潜变量数为4。
可以看到,决定系数的变化曲线在潜变量数为4开始就趋于平稳,但是在潜变量数为5时才完全趋于平稳,这会使大部分的工作人员选择曲线完全趋于平稳时对应的潜变量数5作为最优潜变量数,但这会造成过拟合。而结合稳定性参数和决定系数共同判断,易于得到最优潜变量数为4,拟合出的曲线具有最优的稳定性,避免过拟合现象的产生。
本发明实施例提供的确定偏最小二乘回归潜变量数的方法,结合稳定性参数及决定系数确定最优潜变量数,可以更方便工作人员确定最优潜变量数。
图6为本发明实施例提供的第三种确定偏最小二乘回归潜变量数的方法的流程图。图7为本发明实施例提供的一种稳定性参数及交互验证均方根误差随潜变量数变化的曲线示意图。
如图6所示,在上述实施例的基础上,在另一实施例中,确定偏最小二乘回归潜变量数的方法还包括:
S60:计算各潜变量数对应的交互验证均方根误差。
S61:结合稳定性参数与交互验证均方根误差确定最优潜变量数。
其中,计算潜变量数对应的交互验证均方根误差具体为根据测试得到的每个所述子测试集的预测值与每个所述子测试集的真值计算得到所述潜变量数对应的交互验证均方根误差。
需要说明的是,在本发明实施例中,步骤S60与步骤S10没有顺序关系,用步骤S61代替原步骤S11。
由于模型不同,稳定性参数随潜变量数变化的趋势也是不同的,有时候可能不容易判断稳定性参数的最大值。因此还可结合交互验证均方根误差与稳定性参数一起确定最优潜变量数。
在具体实施中,对于步骤S60来说,计算各潜变量数对应的交互验证均方根误差,计算公式如下:
其中,j表示本次计算中的潜变量数,RMSECV(Root Mean Square Error of CrossValidation)表示当潜变量数为j时对应的交互验证均方根误差,N表示样本个数,yj,n表示样品的实际值,表示样品的预测值。
如图7所示,结合稳定性参数及交互验证均方根误差随潜变量数变化的曲线示意图,可以看到在潜变量数为4时对应的稳定性参数最大,而交互验证均方根误差的变化曲线开始趋于平稳,因此最优潜变量数为4。
可以看到,交互验证均方根误差的变化曲线在潜变量数为4开始就趋于平稳,但是在潜变量数为5时才完全趋于平稳,这会使大部分的工作人员选择曲线完全趋于平稳时对应的潜变量数5作为最优潜变量数,但这会造成过拟合。而结合稳定性参数和交互验证均方根误差共同判断,易于得到最优潜变量数为4,拟合出的曲线具有最优的稳定性,避免过拟合现象的产生。
本发明实施例提供的确定偏最小二乘回归潜变量数的方法,结合稳定性参数及交互验证均方根误差确定最优潜变量数,可以更方便工作人员确定最优潜变量数。
在上述实施例的基础上,可以结合稳定性参数、决定系数、交互验证均方根误差和其他能够表示模型质量的量来确定最优潜变量数,但是由于计算较多,比较麻烦,所以基于能够得到最优潜变量数,选择计算最少最简便的方式即可。
在上述实施例的基础上,在另一实施例中,步骤S10中所述的基于采集到的样品,其中采集样品具体为:
采集所述样品的分析数据和成分含量数据。
上述具体实施方式可以应用于化学成分分析领域,那么在建模时,自变量为分析数据,因变量为成分含量数据。
例如,测定由A、B、C、D四种物质混合的水溶液中A物质的含量,由已知混合比例的样品溶液建立偏最小二乘校正集,选择最优潜变量数。在实验中,A、B、C、D四种物质以不同比例混合配置成22个样品溶液,配置过程中22个样品中各物质的浓度已知。在紫外光谱上采集样品溶液数据从而获得分析数据,波长范围为220—400nm,采样间隔为1nm,已知的各物质的浓度即为成分含量数据。
同样应用在化学成分分析领域,可选地,所述分析数据可以是近红外光谱数据,也可以是紫外光谱数据,视具体情况而定。
本发明实施例提供的确定偏最小二乘回归潜变量数的方法,提供了本发明提供的方法在实际应用中的一个实例,经实验表明,本发明提供的方法在化学成分分析领域,相对于现有技术,具有明显的优势。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法可以通过其它的方式实现。对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (8)
1.一种确定偏最小二乘回归潜变量数的方法,其特征在于,包括:
计算各潜变量数对应的稳定性参数;
确定所述稳定性参数最大时对应的潜变量数为最优潜变量数;
其中,计算潜变量数对应的稳定性参数具体包括:
基于采集到的样品,采用交互验证法选择N个子训练集和与之一一对应的N个子测试集;其中,所述N为正整数;
利用各所述子训练集建立当前潜变量数对应的子模型,并利用与所述子训练集对应的子模型对与所述子训练集对应的子测试集进行预测;
记录每个所述子模型的回归系数,并根据每个所述子模型的回归系数计算得到所述潜变量数对应的稳定性参数。
2.根据权利要求1所述的方法,其特征在于,所述计算各潜变量数对应的稳定性参数具体包括:
按从小到大的顺序排列各所述潜变量数;
从最小的潜变量数开始,依次计算各所述潜变量数对应的稳定性参数并比较所述稳定性参数与上一次计算得到的稳定性参数的大小,直到稳定性参数连续减小的次数大于阈值为止。
3.根据权利要求1所述的方法,其特征在于,还包括:
计算各所述潜变量数对应的决定系数;
相应的,结合所述稳定性参数与所述决定系数确定所述最优潜变量数;
其中,计算潜变量数对应的决定系数具体为根据测试得到的每个所述子测试集的预测值与每个所述子测试集的真值计算得到所述潜变量数对应的决定系数。
4.根据权利要求1所述的方法,其特征在于,还包括:
计算各所述潜变量数对应的交互验证均方根误差;
相应的,结合所述稳定性参数与所述交互验证均方根误差确定所述最优潜变量数;
其中,计算潜变量数对应的交互验证均方根误差具体为根据测试得到的每个所述子测试集的预测值与每个所述子测试集的真值计算得到所述潜变量数对应的交互验证均方根误差。
5.根据权利要求1所述的方法,其特征在于,所述交互验证法具体为蒙特卡洛交互验证法。
6.根据权利要求1所述的方法,其特征在于,所述采集样品具体为:
采集所述样品的分析数据和成分含量数据。
7.根据权利要求6所述的方法,其特征在于,所述分析数据具体为近红外光谱数据。
8.根据权利要求6所述的方法,其特征在于,所述分析数据具体为紫外光谱数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711122113.9A CN109783772B (zh) | 2017-11-14 | 2017-11-14 | 一种确定偏最小二乘回归潜变量数的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711122113.9A CN109783772B (zh) | 2017-11-14 | 2017-11-14 | 一种确定偏最小二乘回归潜变量数的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109783772A true CN109783772A (zh) | 2019-05-21 |
CN109783772B CN109783772B (zh) | 2023-12-22 |
Family
ID=66494538
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711122113.9A Active CN109783772B (zh) | 2017-11-14 | 2017-11-14 | 一种确定偏最小二乘回归潜变量数的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109783772B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111105628A (zh) * | 2019-12-23 | 2020-05-05 | 北京首钢自动化信息技术有限公司 | 一种停车场画像构建方法和装置 |
CN112506050A (zh) * | 2020-11-04 | 2021-03-16 | 中国矿业大学 | 一种基于潜变量过程迁移模型的间歇过程集成优化方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1030982A (ja) * | 1996-07-13 | 1998-02-03 | Horiba Ltd | 多成分水溶液の分析方法 |
JP2011085564A (ja) * | 2008-11-25 | 2011-04-28 | Mitsubishi Rayon Co Ltd | 共重合体の定量方法 |
CN104949936A (zh) * | 2015-07-13 | 2015-09-30 | 东北大学 | 基于优化偏最小二乘回归模型的样品成份测定方法 |
CN105092519A (zh) * | 2015-07-10 | 2015-11-25 | 东北大学 | 基于增量偏最小二乘法的样品成份测定方法 |
CN105630743A (zh) * | 2015-12-24 | 2016-06-01 | 浙江大学 | 一种光谱波数的选择方法 |
FR3039677A1 (fr) * | 2015-07-30 | 2017-02-03 | Snecma | Procede de conception de pieces mecaniques, notamment d'aubes de turbomachine |
-
2017
- 2017-11-14 CN CN201711122113.9A patent/CN109783772B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1030982A (ja) * | 1996-07-13 | 1998-02-03 | Horiba Ltd | 多成分水溶液の分析方法 |
JP2011085564A (ja) * | 2008-11-25 | 2011-04-28 | Mitsubishi Rayon Co Ltd | 共重合体の定量方法 |
CN105092519A (zh) * | 2015-07-10 | 2015-11-25 | 东北大学 | 基于增量偏最小二乘法的样品成份测定方法 |
CN104949936A (zh) * | 2015-07-13 | 2015-09-30 | 东北大学 | 基于优化偏最小二乘回归模型的样品成份测定方法 |
FR3039677A1 (fr) * | 2015-07-30 | 2017-02-03 | Snecma | Procede de conception de pieces mecaniques, notamment d'aubes de turbomachine |
CN105630743A (zh) * | 2015-12-24 | 2016-06-01 | 浙江大学 | 一种光谱波数的选择方法 |
Non-Patent Citations (2)
Title |
---|
ELISANGELA SERENATO MADALOZZO ET AL.: "Determination of fat, protein and moistrure in ricotta cheese by near infrared spectroscopy and multivariate calibration", 《JOURNAL OF FOOD SCIENCE AND TECHNOLOGY》 * |
蒋建平等: "偏最小二乘回归在地表沉陷预测中的应用", 《重庆大学学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111105628A (zh) * | 2019-12-23 | 2020-05-05 | 北京首钢自动化信息技术有限公司 | 一种停车场画像构建方法和装置 |
CN112506050A (zh) * | 2020-11-04 | 2021-03-16 | 中国矿业大学 | 一种基于潜变量过程迁移模型的间歇过程集成优化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109783772B (zh) | 2023-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104698273A (zh) | 谐波责任划分方法和系统 | |
CN109839358B (zh) | 农产品品质分析方法及装置 | |
CN106918567B (zh) | 一种测量痕量金属离子浓度的方法和装置 | |
CN109783772A (zh) | 一种确定偏最小二乘回归潜变量数的方法 | |
CN110567937A (zh) | 一种用于绝缘油拉曼光谱分析的竞争性自适应重加权关键数据提取方法 | |
Cederkvist et al. | A comparison of methods for testing differences in predictive ability | |
CN107729599A (zh) | 医疗器械核心部件加速退化试验数据处理方法 | |
CN106770005B (zh) | 一种用于近红外光谱分析的校正集和验证集的划分方法 | |
CN106557652A (zh) | 判断样品检测数据可疑值的方法 | |
JP6807319B2 (ja) | 自動定量的回帰 | |
US20060241904A1 (en) | Determination of standard deviation | |
CN106485049B (zh) | 一种基于蒙特卡洛交叉验证的nirs异常样本的检测方法 | |
CN103868882A (zh) | 测定沥青中各组分含量的方法 | |
CN104865228A (zh) | 基于融合熵优化求解的定量激光诱导击穿光谱检测方法 | |
Ross | Comparing linear regression and maximum likelihood methods to estimate Weibull distributions on limited data sets: systematic and random errors | |
Wendt et al. | Testing fractal connectivity in multivariate long memory processes | |
CN116008665A (zh) | 一种电力系统谐波阻抗估计方法 | |
Conny et al. | Standard test data for estimating peak parameter errors in x‐ray photoelectron spectroscopy: II. Peak intensities | |
Aryana | Proficiency testing for determination of pesticides residues in black tea: Comparison of three robust statistical approaches based on ISO 13528 to estimate the consensus values for small number of participants | |
CN108388965B (zh) | 油脂掺伪含量检测方法、终端设备及计算机可读存储介质 | |
Jiang | Estimation of effective concentrations from in vitro dose-response data using the log-logistic model | |
Yilmaz et al. | Fast and accurate DPPM computation using model based filtering | |
No et al. | Fitness for purpose: the key feature in analytical proficiency testing | |
CN114756823B (zh) | 提升花椒光谱模型预测能力的方法 | |
US20230417714A1 (en) | Data Processing Device, Data Processing Method, Data Processing Program, and Analysis Device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |