CN109783772B - 一种确定偏最小二乘回归潜变量数的方法 - Google Patents

一种确定偏最小二乘回归潜变量数的方法 Download PDF

Info

Publication number
CN109783772B
CN109783772B CN201711122113.9A CN201711122113A CN109783772B CN 109783772 B CN109783772 B CN 109783772B CN 201711122113 A CN201711122113 A CN 201711122113A CN 109783772 B CN109783772 B CN 109783772B
Authority
CN
China
Prior art keywords
latent variable
sub
variable number
latent
stability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711122113.9A
Other languages
English (en)
Other versions
CN109783772A (zh
Inventor
张辞海
彭黔荣
胡芸
刘娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Tobacco Guizhou Industrial Co Ltd
Original Assignee
China Tobacco Guizhou Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Tobacco Guizhou Industrial Co Ltd filed Critical China Tobacco Guizhou Industrial Co Ltd
Priority to CN201711122113.9A priority Critical patent/CN109783772B/zh
Publication of CN109783772A publication Critical patent/CN109783772A/zh
Application granted granted Critical
Publication of CN109783772B publication Critical patent/CN109783772B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种确定偏最小二乘回归潜变量数的方法,包括:选择潜变量数,基于采集到的样品,采用交互验证法选择N个子训练集和与之一一对应的N个子测试集;利用N个所述子训练集建立N个子模型,并利用与所述子训练集对应的子模型对与所述子训练集对应的子测试集进行预测;记录每个所述子模型的回归系数,并根据每个所述子模型的回归系数计算得到所述潜变量数对应的稳定性参数;选择另一个潜变量数,继续进行基于所述样品采用所述交互验证法建立多个子模型的步骤;确定所述稳定性参数最大时对应的潜变量数为最优潜变量数。稳定性参数随潜变量数变化的曲线具有先上升后下降的特点,方便工作人选确定最优潜变量数,从而建立稳定性良好的模型。

Description

一种确定偏最小二乘回归潜变量数的方法
技术领域
本发明涉及数据分析与处理领域,特别是涉及一种确定偏最小二乘回归潜变量数的方法。
背景技术
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。
在某些特定的领域,如现代分析化学所要处理的化学数据往往是一些具有小样本数,但是却拥有很庞大的变量数的高维数据。这样的数据被称为“large p,small n”问题,对于统计学这是一个很有挑战的问题。
偏最小二乘回归(PLSR)是一种能够处理变量数多于样本数(p>n)问题的一种常用方法。潜变量(LV)数的确定决定着偏最小二乘回归模型的质量,用过少的潜变量数进行建模,会造成“欠拟合”(under-fitting),用过多的潜变量数进行建模又会造成“过拟合”(over-fitting)。
目前最为常用的确定偏最小二乘回归模型潜变量数的方法是交互验证(CV)法。这种方法是将通过交互验证得到的交互验证均方根误差或决定系数作为标准来选取偏最小二乘回归模型的潜变量数,并认为能够得到最小交互验证均方根误差或最接近1的决定系数的潜变量数所建立的偏最小二乘回归模型为最优。但是以这种标准来选取潜变量数时,经常会遇到交互验证均方根误差一直减小(或决定系数一直趋近于1),或者是不同的潜变量数所建立的偏最小二乘回归模型的预测能力差别微小(或决定系数间差别微小),从而难以确定潜变量数的情况。这个时候如果还是按照这种原则确定潜变量数,往往会造成选择了过多的潜变量数进而造成偏最小二乘回归模型的过拟合。
因此,如何避免在建立偏最小二乘回归模型时出现因选择了过多的潜变量数造成的过拟合的情况,是本领域技术人员需要解决的技术问题。
发明内容
本发明的目的是提供一种确定偏最小二乘回归潜变量数的方法,用于避免在建立偏最小二乘回归模型时出现因选择了过多的潜变量数造成的过拟合的情况。
为解决上述技术问题,本发明提供一种确定偏最小二乘回归潜变量数的方法,包括:
计算各潜变量数对应的稳定性参数;
确定所述稳定性参数最大时对应的潜变量数为最优潜变量数;
其中,计算潜变量数对应的稳定性参数具体包括:
基于采集到的样品,采用交互验证法选择N个子训练集和与之一一对应的N个子测试集;其中,所述N为正整数;
利用各所述子训练集建立当前潜变量数对应的子模型,并利用与所述子训练集对应的子模型对与所述子训练集对应的子测试集进行预测;
记录每个所述子模型的回归系数,并根据每个所述子模型的回归系数计算得到所述潜变量数对应的稳定性参数。
可选地,所述计算各潜变量数对应的稳定性参数具体包括:
按从小到大的顺序排列各所述潜变量数;
从最小的潜变量数开始,依次计算各所述潜变量数对应的稳定性参数并比较所述稳定性参数与上一次计算得到的稳定性参数的大小,直到稳定性参数连续减小的次数大于阈值为止。
可选地,还包括:
计算各所述潜变量数对应的决定系数;
相应的,结合所述稳定性参数与所述决定系数确定所述最优潜变量数;
其中,计算潜变量数对应的决定系数具体为根据测试得到的每个所述子测试集的预测值与每个所述子测试集的真值计算得到所述潜变量数对应的决定系数。
可选地,还包括:
计算各所述潜变量数对应的交互验证均方根误差;
相应的,结合所述稳定性参数与所述交互验证均方根误差确定所述最优潜变量数;
其中,计算潜变量数对应的交互验证均方根误差具体为根据测试得到的每个所述子测试集的预测值与每个所述子测试集的真值计算得到所述潜变量数对应的交互验证均方根误差。
可选地,所述交互验证法具体为蒙特卡洛交互验证法。
可选地,所述采集样品具体为:
采集所述样品的分析数据和成分含量数据。
可选地,所述分析数据具体为近红外光谱数据。
可选地,所述分析数据具体为紫外光谱数据。
本发明所提供的确定偏最小二乘回归潜变量数的方法,包括:选择潜变量数,基于采集到的样品,采用交互验证法选择N个子训练集和与之一一对应的N个子测试集;利用N个所述子训练集建立N个子模型,并利用与所述子训练集对应的子模型对与所述子训练集对应的子测试集进行预测;记录每个所述子模型的回归系数,并根据每个所述子模型的回归系数计算得到所述潜变量数对应的稳定性参数;选择另一个潜变量数,继续进行基于所述样品采用所述交互验证法建立多个子模型的步骤;确定所述稳定性参数最大时对应的潜变量数为最优潜变量数。
通过实验表明,若采用现有技术中的决定系数或交互验证均方根误差作为选择潜变量数的依据,前者随潜变量数的增加而增加直至趋于稳定,后者随潜变量数的增加而下降直至趋于稳定,虽然两者的曲线中都有转折点,但是转折点不是很明显,工作人员很容易选错最优潜变量数,从而可能造成过拟合。而稳定性参数的曲线一般随潜变量数的增加呈现先上升后下降的趋势,因此很容易从稳定性参数的曲线图中确定稳定性参数最大的点,选择对应的潜变量数作为最优潜变量数,即可获得稳定性最好的模型,从而避免在建立偏最小二乘回归模型时出现因选择了过多的潜变量数造成的过拟合的情况。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的第一种确定偏最小二乘回归潜变量数的方法的流程图;
图2为本发明实施例提供的稳定性参数随潜变量数变化的曲线示意图;
图3为本发明实施例提供的一种步骤S10对应的流程图;
图4为本发明实施例提供的第二种确定偏最小二乘回归潜变量数的方法的流程图;
图5为本发明实施例提供的一种稳定性参数及决定系数随潜变量数变化的曲线示意图;
图6为本发明实施例提供的第三种确定偏最小二乘回归潜变量数的方法的流程图;
图7为本发明实施例提供的一种稳定性参数及交互验证均方根误差随潜变量数变化的曲线示意图。
具体实施方式
本发明的核心是提供一种确定偏最小二乘回归潜变量数的方法,用于避免在建立偏最小二乘回归模型时出现因选择了过多的潜变量数造成的过拟合的情况。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的第一种确定偏最小二乘回归潜变量数的方法的流程图。图2为本发明实施例提供的稳定性参数随潜变量数变化的曲线示意图。
如图1所示,确定偏最小二乘回归潜变量数的方法包括:
S10:计算各潜变量数对应的稳定性参数。
S11:确定所述稳定性参数最大时对应的潜变量数为最优潜变量数。
其中,S10中计算潜变量数对应的稳定性参数具体包括:
基于采集到的样品,采用交互验证法选择N个子训练集和与之一一对应的N个子测试集;其中,N为正整数;
利用各子训练集建立当前潜变量数对应的子模型,并利用与子训练集对应的子模型对与子训练集对应的子测试集进行预测;
记录每个子模型的回归系数,并根据每个子模型的回归系数计算得到潜变量数对应的稳定性参数。
模型过拟合产生的原因是选择了过多的潜变量数。如在化学成分分析中分析光谱数据时,选择了过多的潜变量数意味着可能将噪声等干扰量加入了建模的过程,而在利用建好的模型进行预测时,因为这些干扰量是不稳定的值,所以预测结果很不理想,造成了过拟合现象。而通过稳定性参数确定的潜变量数,选择最优潜变量数时建立的模型具有最好的稳定性,说明排除了干扰量,因此有效避免了过拟合现象。
在具体实施中,对于步骤S10来说,在计算潜变量数对应的稳定性参数过程中,由回归系数矩阵进行主成分分析计算得到稳定性参数,计算公式如下:
其中,j表示本次计算中的潜变量数,Sj表示潜变量数为j时计算得到的稳定性参数,Varj,1表示在潜变量数为j时能够被主成分数是1解释的信息,Varj,all(Varj,all=Varj,1+Varj,2+Varj,3+Varj,4......)表示在潜变量数为j时能够被所有主成分解释的信息。
可选地,在选择子训练集和子测试集时,可采用蒙特卡洛交互验证法。蒙特卡洛交互验证法的基本思想是以较多样本作为子测试集为前提,随机地将样本分割为两部分,并重复这个过程。通过实验表明,采用蒙特卡洛交互验证法选择的子训练集和子测试集最后建立的模型是最好的,因此在采用蒙特卡洛交互验证法的基础上,再计算不同潜变量数对应的稳定性参数,能够更好地确定最优潜变量数。
对于步骤S11来说,如图2所示,以潜变量数为x轴,以稳定性参数为y轴建立坐标系,可以看到,随着潜变量数的增加,稳定性参数曲线呈现先上升后下降的趋势,可以很容易地找到稳定性参数的最大值,而此时模型的稳定性最好,因此稳定性参数的最大值对应的潜变量数即为最优潜变量数。
本发明实施例提供的确定偏最小二乘回归潜变量数的方法,包括:选择潜变量数,基于采集到的样品,采用交互验证法选择N个子训练集和与之一一对应的N个子测试集;利用N个所述子训练集建立N个子模型,并利用与所述子训练集对应的子模型对与所述子训练集对应的子测试集进行预测;记录每个所述子模型的回归系数,并根据每个所述子模型的回归系数计算得到所述潜变量数对应的稳定性参数;选择另一个潜变量数,继续进行基于所述样品采用所述交互验证法建立多个子模型的步骤;确定所述稳定性参数最大时对应的潜变量数为最优潜变量数。通过实验表明,若采用现有技术中的决定系数或交互验证均方根误差作为选择潜变量数的依据,前者随潜变量数的增加而增加直至趋于稳定,后者随潜变量数的增加而下降直至趋于稳定,虽然两者的曲线中都有转折点,但是转折点不是很明显,工作人员很容易选错最优潜变量数,从而可能造成过拟合。而稳定性参数的曲线一般随潜变量数的增加呈现先上升后下降的趋势,因此很容易从稳定性参数的曲线图中确定稳定性参数最大的点,选择对应的潜变量数作为最优潜变量数,即可获得稳定性最好的模型,从而避免在建立偏最小二乘回归模型时出现因选择了过多的潜变量数造成的过拟合的情况。
图3为本发明实施例提供的一种步骤S10对应的流程图。如图3所示,步骤S10具体包括:
S30:按从小到大的顺序排列各潜变量数。
S31:从最小的潜变量数开始,依次计算各潜变量数对应的稳定性参数并比较该稳定性参数与上一次计算得到的稳定性参数的大小,直到稳定性参数连续减小的次数大于阈值为止。
本发明实施例旨在说明何时结束计算各潜变量数对应的稳定性参数的过程。
在具体实施中,按从小到大的顺序排列各潜变量数,从最小的潜变量数开始,依次计算各潜变量数对应的稳定性参数,即依次计算潜变量数为1时对应的稳定性参数、潜变量数为2时对应的稳定性参数、潜变量数为3时对应的稳定性参数……
在每次计算完都比较该稳定性参数与上一次计算得到的稳定性参数的大小,可以将稳定性参数随潜变量数的变化体现坐标系中,如图2所示。
稳定性参数连续减小的次数大于阈值为止,如果阈值为2,即稳定性参数连续减小的次数为两次以上,则终止计算。
本发明实施例提供的确定偏最小二乘回归潜变量数的方法,说明了何时结束计算各潜变量数对应的稳定性参数的过程。可以避免过多的计算,节省时间与精力。
图4为本发明实施例提供的第二种确定偏最小二乘回归潜变量数的方法的流程图。图5为本发明实施例提供的一种稳定性参数及决定系数随潜变量数变化的曲线示意图。
如图4所示,在上述实施例的基础上,在另一实施例中,确定偏最小二乘回归潜变量数的方法还包括:
S40:计算各潜变量数对应的决定系数。
S41:结合稳定性参数与决定系数确定最优潜变量数。
其中,计算潜变量数对应的决定系数具体为根据测试得到的每个子测试集的预测值与每个子测试集的真值计算得到潜变量数对应的决定系数。
需要说明的是,在本发明实施例中,步骤S40与步骤S10没有顺序关系,用步骤S41代替原步骤S11。
由于模型不同,稳定性参数随潜变量数变化的趋势也是不同的,有时候可能不容易判断稳定性参数的最大值。因此可结合决定系数与稳定性参数一起确定最优潜变量数。
在具体实施中,对于步骤S40来说,计算各潜变量数对应的决定系数,计算公式如下:
其中,j表示本次计算中的潜变量数,表示在潜变量数为j时计算得到的决定系数,N表示样本个数,yj,n表示样品的实际值,/>表示样品的预测值,/>表示样品实际值的平均值。
如图5所示,结合稳定性参数及决定系数随潜变量数变化的曲线示意图,可以看到在潜变量数为4时对应的稳定性参数最大,而决定系数的变化曲线开始趋于平稳,因此最优潜变量数为4。
可以看到,决定系数的变化曲线在潜变量数为4开始就趋于平稳,但是在潜变量数为5时才完全趋于平稳,这会使大部分的工作人员选择曲线完全趋于平稳时对应的潜变量数5作为最优潜变量数,但这会造成过拟合。而结合稳定性参数和决定系数共同判断,易于得到最优潜变量数为4,拟合出的曲线具有最优的稳定性,避免过拟合现象的产生。
本发明实施例提供的确定偏最小二乘回归潜变量数的方法,结合稳定性参数及决定系数确定最优潜变量数,可以更方便工作人员确定最优潜变量数。
图6为本发明实施例提供的第三种确定偏最小二乘回归潜变量数的方法的流程图。图7为本发明实施例提供的一种稳定性参数及交互验证均方根误差随潜变量数变化的曲线示意图。
如图6所示,在上述实施例的基础上,在另一实施例中,确定偏最小二乘回归潜变量数的方法还包括:
S60:计算各潜变量数对应的交互验证均方根误差。
S61:结合稳定性参数与交互验证均方根误差确定最优潜变量数。
其中,计算潜变量数对应的交互验证均方根误差具体为根据测试得到的每个所述子测试集的预测值与每个所述子测试集的真值计算得到所述潜变量数对应的交互验证均方根误差。
需要说明的是,在本发明实施例中,步骤S60与步骤S10没有顺序关系,用步骤S61代替原步骤S11。
由于模型不同,稳定性参数随潜变量数变化的趋势也是不同的,有时候可能不容易判断稳定性参数的最大值。因此还可结合交互验证均方根误差与稳定性参数一起确定最优潜变量数。
在具体实施中,对于步骤S60来说,计算各潜变量数对应的交互验证均方根误差,计算公式如下:
其中,j表示本次计算中的潜变量数,RMSECV(Root Mean Square Error of CrossValidation)表示当潜变量数为j时对应的交互验证均方根误差,N表示样本个数,yj,n表示样品的实际值,表示样品的预测值。
如图7所示,结合稳定性参数及交互验证均方根误差随潜变量数变化的曲线示意图,可以看到在潜变量数为4时对应的稳定性参数最大,而交互验证均方根误差的变化曲线开始趋于平稳,因此最优潜变量数为4。
可以看到,交互验证均方根误差的变化曲线在潜变量数为4开始就趋于平稳,但是在潜变量数为5时才完全趋于平稳,这会使大部分的工作人员选择曲线完全趋于平稳时对应的潜变量数5作为最优潜变量数,但这会造成过拟合。而结合稳定性参数和交互验证均方根误差共同判断,易于得到最优潜变量数为4,拟合出的曲线具有最优的稳定性,避免过拟合现象的产生。
本发明实施例提供的确定偏最小二乘回归潜变量数的方法,结合稳定性参数及交互验证均方根误差确定最优潜变量数,可以更方便工作人员确定最优潜变量数。
在上述实施例的基础上,可以结合稳定性参数、决定系数、交互验证均方根误差和其他能够表示模型质量的量来确定最优潜变量数,但是由于计算较多,比较麻烦,所以基于能够得到最优潜变量数,选择计算最少最简便的方式即可。
在上述实施例的基础上,在另一实施例中,步骤S10中所述的基于采集到的样品,其中采集样品具体为:
采集所述样品的分析数据和成分含量数据。
上述具体实施方式可以应用于化学成分分析领域,那么在建模时,自变量为分析数据,因变量为成分含量数据。
例如,测定由A、B、C、D四种物质混合的水溶液中A物质的含量,由已知混合比例的样品溶液建立偏最小二乘校正集,选择最优潜变量数。在实验中,A、B、C、D四种物质以不同比例混合配置成22个样品溶液,配置过程中22个样品中各物质的浓度已知。在紫外光谱上采集样品溶液数据从而获得分析数据,波长范围为220—400nm,采样间隔为1nm,已知的各物质的浓度即为成分含量数据。
同样应用在化学成分分析领域,可选地,所述分析数据可以是近红外光谱数据,也可以是紫外光谱数据,视具体情况而定。
本发明实施例提供的确定偏最小二乘回归潜变量数的方法,提供了本发明提供的方法在实际应用中的一个实例,经实验表明,本发明提供的方法在化学成分分析领域,相对于现有技术,具有明显的优势。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法可以通过其它的方式实现。对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (3)

1.一种确定偏最小二乘回归潜变量数的方法,应用于化学成分分析领域,分析数据为近红外光谱数据或紫外光谱数据,其特征在于,包括:
计算各潜变量数对应的稳定性参数;
计算各所述潜变量数对应的决定系数;
计算各所述潜变量数对应的交互验证均方根误差;
结合所述稳定性参数、所述决定系数、所述交互验证均方根误差得到最优潜变量数,确定所述稳定性参数最大时对应的潜变量数为所述最优潜变量数;
其中,所述计算各潜变量数对应的稳定性参数具体包括:
按从小到大的顺序排列各所述潜变量数;
从最小的潜变量数开始,依次计算各所述潜变量数对应的稳定性参数并比较所述稳定性参数与上一次计算得到的稳定性参数的大小,直到稳定性参数连续减小的次数大于阈值为止;
计算潜变量数对应的稳定性参数具体包括:
基于采集到的样品,采用交互验证法选择N个子训练集和与之一一对应的N个子测试集;其中,所述N为正整数;
利用各所述子训练集建立当前潜变量数对应的子模型,并利用与所述子训练集对应的子模型对与所述子训练集对应的子测试集进行预测;
记录每个所述子模型的回归系数,并根据每个所述子模型的回归系数计算得到所述潜变量数对应的稳定性参数;
所述稳定性参数的计算公式为:;其中,j表示本次计算中的潜变量数,S j 表示潜变量数为j时计算得到的稳定性参数,Var j,1 表示在潜变量数为j时能够被主成分数是1解释的信息,Var j,all Var j,all =Var j,1 +Var j,2 +Var j,3 +Var j,4 ......)表示在潜变量数为j时能够被所有主成分解释的信息;
计算潜变量数对应的决定系数具体为根据测试得到的每个所述子测试集的预测值与每个所述子测试集的真值计算得到所述潜变量数对应的决定系数;
所述决定系数的计算公式为;其中,j表示本次计算中的潜变量数,/>表示在潜变量数为j时计算得到的所述决定系数,N表示样本个数,/>表示样品的实际值,/>表示样品的预测值,/>表示样品实际值的平均值;
计算潜变量数对应的交互验证均方根误差具体为根据测试得到的每个所述子测试集的预测值与每个所述子测试集的真值计算得到所述潜变量数对应的交互验证均方根误差;
所述交互验证均方根误差的计算公式为:;其中,j表示本次计算中的潜变量数,/>表示当潜变量数为j时对应的交互验证均方根误差,N表示样本个数,/>表示样品的实际值,/>表示样品的预测值。
2.根据权利要求1所述的方法,其特征在于,所述交互验证法具体为蒙特卡洛交互验证法。
3.根据权利要求1所述的方法,其特征在于,所述采集到的样品具体为:
采集所述样品的分析数据和成分含量数据。
CN201711122113.9A 2017-11-14 2017-11-14 一种确定偏最小二乘回归潜变量数的方法 Active CN109783772B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711122113.9A CN109783772B (zh) 2017-11-14 2017-11-14 一种确定偏最小二乘回归潜变量数的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711122113.9A CN109783772B (zh) 2017-11-14 2017-11-14 一种确定偏最小二乘回归潜变量数的方法

Publications (2)

Publication Number Publication Date
CN109783772A CN109783772A (zh) 2019-05-21
CN109783772B true CN109783772B (zh) 2023-12-22

Family

ID=66494538

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711122113.9A Active CN109783772B (zh) 2017-11-14 2017-11-14 一种确定偏最小二乘回归潜变量数的方法

Country Status (1)

Country Link
CN (1) CN109783772B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111105628A (zh) * 2019-12-23 2020-05-05 北京首钢自动化信息技术有限公司 一种停车场画像构建方法和装置
CN112506050B (zh) * 2020-11-04 2021-12-03 中国矿业大学 一种基于潜变量过程迁移模型的间歇过程集成优化方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1030982A (ja) * 1996-07-13 1998-02-03 Horiba Ltd 多成分水溶液の分析方法
JP2011085564A (ja) * 2008-11-25 2011-04-28 Mitsubishi Rayon Co Ltd 共重合体の定量方法
CN104949936A (zh) * 2015-07-13 2015-09-30 东北大学 基于优化偏最小二乘回归模型的样品成份测定方法
CN105092519A (zh) * 2015-07-10 2015-11-25 东北大学 基于增量偏最小二乘法的样品成份测定方法
CN105630743A (zh) * 2015-12-24 2016-06-01 浙江大学 一种光谱波数的选择方法
FR3039677A1 (fr) * 2015-07-30 2017-02-03 Snecma Procede de conception de pieces mecaniques, notamment d'aubes de turbomachine

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1030982A (ja) * 1996-07-13 1998-02-03 Horiba Ltd 多成分水溶液の分析方法
JP2011085564A (ja) * 2008-11-25 2011-04-28 Mitsubishi Rayon Co Ltd 共重合体の定量方法
CN105092519A (zh) * 2015-07-10 2015-11-25 东北大学 基于增量偏最小二乘法的样品成份测定方法
CN104949936A (zh) * 2015-07-13 2015-09-30 东北大学 基于优化偏最小二乘回归模型的样品成份测定方法
FR3039677A1 (fr) * 2015-07-30 2017-02-03 Snecma Procede de conception de pieces mecaniques, notamment d'aubes de turbomachine
CN105630743A (zh) * 2015-12-24 2016-06-01 浙江大学 一种光谱波数的选择方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Elisangela Serenato Madalozzo et al..Determination of fat,protein and moistrure in ricotta cheese by near infrared spectroscopy and multivariate calibration.《Journal of Food Science and Technology》.2013,全文. *
偏最小二乘回归在地表沉陷预测中的应用;蒋建平等;《重庆大学学报》;全文 *

Also Published As

Publication number Publication date
CN109783772A (zh) 2019-05-21

Similar Documents

Publication Publication Date Title
Forina et al. Class-modeling techniques, classic and new, for old and new problems
Grabarnik et al. Correct testing of mark independence for marked point patterns
CN104949936A (zh) 基于优化偏最小二乘回归模型的样品成份测定方法
CN101825567A (zh) 一种近红外光谱和拉曼光谱波长的筛选方法
CN105630743A (zh) 一种光谱波数的选择方法
JP2013537307A5 (zh)
CN109783772B (zh) 一种确定偏最小二乘回归潜变量数的方法
CN103528990A (zh) 一种近红外光谱的多模型建模方法
WO2017045296A1 (zh) 在线近红外样本量确定方法
CN106248621A (zh) 一种评价方法与系统
CN101419207A (zh) 烤烟烟气主要指标的预测方法
CN107563448B (zh) 基于近红外光谱分析的样本空间聚类划分法
CN109298139B (zh) 烟叶质量评价方法及装置
JP2013101039A5 (zh)
Ke et al. Testing autocorrelation and partial autocorrelation: Asymptotic methods versus resampling techniques
CN117742279B (zh) 一种化妆品生产控制方法及系统
Kurdek Methodological issues in growth‐curve analyses with married couples
CN114611582A (zh) 一种基于近红外光谱技术分析物质浓度的方法及系统
CN116026780B (zh) 基于串联策略波长选择的包衣吸湿率在线检测方法及系统
CN109063767B (zh) 一种基于样本和变量共识的近红外光谱建模方法
CN110852322A (zh) 感兴趣区域的确定方法及装置
WO2020099269A1 (de) Verfahren und vorrichtung zur analyse von biologischem material
CN115271192A (zh) 一种工业生产指数预测方法及处理器
CN109145403A (zh) 一种基于样本共识的近红外光谱建模方法
de Paula et al. Parallelization of a modified firefly algorithm using GPU for variable selection in a multivariate calibration problem

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant