CN105334185A - 基于光谱投影判别的近红外模型维护方法 - Google Patents

基于光谱投影判别的近红外模型维护方法 Download PDF

Info

Publication number
CN105334185A
CN105334185A CN201510581939.6A CN201510581939A CN105334185A CN 105334185 A CN105334185 A CN 105334185A CN 201510581939 A CN201510581939 A CN 201510581939A CN 105334185 A CN105334185 A CN 105334185A
Authority
CN
China
Prior art keywords
model
spectrum
mahalanobis distance
sample
infrared
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510581939.6A
Other languages
English (en)
Other versions
CN105334185B (zh
Inventor
张军
薛庆逾
石超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Upper Seabird And Hundred Million Electronics Technology Development Co Ltds
Original Assignee
Upper Seabird And Hundred Million Electronics Technology Development Co Ltds
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Upper Seabird And Hundred Million Electronics Technology Development Co Ltds filed Critical Upper Seabird And Hundred Million Electronics Technology Development Co Ltds
Priority to CN201510581939.6A priority Critical patent/CN105334185B/zh
Publication of CN105334185A publication Critical patent/CN105334185A/zh
Application granted granted Critical
Publication of CN105334185B publication Critical patent/CN105334185B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明提供基于光谱投影判别的近红外模型维护方法,其特征在于,包括以下步骤:步骤一、近红外光谱模型构建完成后,对模型内的校正光谱做近红外光谱的主成分分析,利用主成分光谱来计算每个样本的马氏距离,步骤二、计算所有样本的平均马氏距离;步骤三、计算样本集的平均马氏距离,设定建模集里马氏距离的阈值;步骤四、计算预测样本与模型内样本的相似度;步骤五、根据相似度的值,判断近红外模型是否需要维护。本发明的基于光谱投影判别的近红外模型维护方法,避免了频繁的更新维护模型;使得近红外模型的更新管理更具科学性。

Description

基于光谱投影判别的近红外模型维护方法
技术领域
本发明涉及一种基于光谱投影判别的近红外模型维护方法,属于烟近红外模型分析评价领域。
背景技术
烟草近红外谱图中包含大量的烟叶常规化学值信息,物理信息,以及外观信息,因此近红外在常规化学值检测中,烟叶稳定性评价,以及烟叶质量评价领域发挥着很大的作用,对于在线近红外模型而言,近红外仪器所处的背景比较复杂,涉及到近红外谱图的温湿度变化,仪器震动,光源的衰弱等影响因素,近红外目前为止已经发展成用于烟叶快速评价,过程控制,指导生产企业加工等应用,如果在线近红外模型不准确,就有可能给企业加工带来误导,带来相应半成品片烟存储,及后续卷烟配方设计带来误导,影响产品配方质量,为卷烟企业带来不必要的损失;因此如何快速的判别近红外模型的对待检测产品是否适应就显得尤为重要。
对于常规的近红外模型维护判别方法一般有如下的方法:(1)根据近红外建模集里的标签与待测样本的标签属性进行对比,在近红外模型建立好后,对于待测样本,如果待测样本的标签属性与建模集里的标签属性不一致,则认为不适应检测样本,反之,则认为属于适应检测样本,样本的标签属性主要包括,产地,等级,品牌,品种,以及工艺,这种方法比较直观,操作简便易于执行,但同时也比较粗放,因为全国烟叶的标签属性比较繁杂,这将会大大限制了近红外烟叶模型的适用范围,对于在线近红外造成大量的误判;(2)根据建模集里面的光谱,剔除异常点,进行预处理后,对建模集样本的光谱进行PCA投影,计算平均马氏距离(MD),全局马氏距离,设定模型的阈值,对于待测样本,比对待测样本与建模集的马氏距离,然后与模型的阈值对比,大于模型阈值则判定为不适应近红外模型检测样本,小于模型阈值则判定为适应模型检测样本,反之不适应,但是,因为PCA本质上是属于一种线性的投影方法,PCA投影严重依赖于建模样本的量,当建模的样本量发生变化时,马氏距离的数值往往也会相应发生变化,另一方面,PCA投影仅仅依赖于样本对应光谱的最大变异方向进行的线性投影,其并不具备具体的烟叶待测物质的信息,时常会出现马氏距离过大,但是检测出来的值比较正常,马氏距离小也有可能检测出来的值比较异常,在实际的具体应用使用过程并不能满足在复杂背景体系下的快速红外检测;(3)定期抽样比对,由于在每次比对的过程中,首先样本要具有统计上的意义,这就要求比对样本一般比较多,而且还需要去做流动基础数据,比对的状况往往为,模型预测能力比较强时也进行比对,模型预测结果差时也进行比对,带来大量的模型持续维护更新工作。
发明内容
如何快捷并且准确的判定近红外模型对待测样本检测的适用性,确定并定位现场连续生产的过程中不能适应于近红外模型检测的样本,避免给打叶复烤企业以及卷烟企业带来误导,并迅速快速维护模型使之正常为本专利研究的内容。
本发明的目的在于提供一种快速判定近红外模型是否需要维护方法,这种方法在不误导加工生产的前提下,运用较少的样本,快速判定近红外模型的适用性,为近红外模型的维护更新,提供一定的快速判别依据。
本发明采用了如下技术方案:
一种基于光谱投影判别的近红外模型维护方法,其特征在于,包括以下步骤:
步骤一、近红外光谱模型构建完成后,对模型内的校正光谱做近红外光谱的主成分分析,利用主成分光谱来计算每个样本的马氏距离,
步骤二、计算所有样本的平均马氏距离;
步骤三、计算样本集的平均马氏距离,设定建模集里马氏距离的阈值;
步骤四、计算预测样本与模型内样本的相似度;
步骤五、根据相似度的值,判断近红外模型是否需要维护。
另外,本发明的基于光谱投影判别的近红外模型维护方法,还可以具有这样的特征:步骤一中,马氏距离的计算公式为,其中Di为第i个样本的马氏距离,si为第i个样本的主成分得分矩阵,V为主成分得分矩阵的协方差。
另外,本发明的基于光谱投影判别的近红外模型维护方法,还可以具有这样的特征:步骤二中,平均马氏距离的计算公式为,
D i 2 = ( n - 1 ) ( h i - 1 n ) .
另外,本发明的基于光谱投影判别的近红外模型维护方法,还可以具有这样的特征:步骤三中,设定建模集里马氏距离阈值的方法为,根据建模集里面的光谱,分别计算建模集每条光谱的马氏距离;求出其均值按照三倍的原则,即三倍AD设定为阈值。
另外,本发明的基于光谱投影判别的近红外模型维护方法,还可以具有这样的特征:步骤四中,相似度的计算公式为 ( S ) = ( 1 - R 2 ) * ( H 1 + H 2 ) .
发明的有益效果
根据本发明的基于光谱投影判别的近红外模型维护方法,以近红外信息中包含不同的样本的物理信息,化学信息,产地信息,以及烟叶部位信息为基础,以寻找计算近红外校正样本与预测样本的红外光谱的差异性与相似性为出发点,计算预测集与近红外建模集(校正集)建模样本的差异度与相似度,找出近红外常规化学成分模型维护的必要条件,为近红外模型快速应用于指导生产,避免近红外模型维护误导生产数据提出必要的充分条件。
对于在线近红外模型,因为其大都实行了高度自动化样本光谱,全体样本空间可以从近红外实时光谱中很容易获得;近红外模型固定后,其模型内的光谱因为已经固定,因此对于现场的实时光谱作为指导生产用的过程数据,对于预测光谱与模型的适用性的判断可以及时给出预测光谱是否适用于近红外模型的判断,避免了近红外数据误导生产。
按照本发明的分析方法,实时判断现场生产模型的适用性,在不超过模型阈值的前提下进行现场取样与基础流动数据进行对比,避免了频繁的更新维护模型;使得近红外模型的更新管理更具科学性。
附图说明
图1是样本与模型的相似度值的计算结果曲线;
图2是外部预测模型对比图。
具体实施方式
以下结合附图来说明本发明的具体实施方式。
近红外在建模完成后,根据预测样本光谱,计算模型需要维护的阈值,并直接计算预测光谱与建模校正光谱的差异性与相似性度量,判别近红外模型是否需要维护。
步骤一、对于近红外光谱模型构建完成后,对模型内的校正光谱做近红外光谱的主成分分析,利用主成分光谱来计算每个样本的马氏距离,根据马氏距离的大小来判断样本的异常情况;具体的做法为:首先计算马氏距离,其中Di为第i个样本的马氏距离,si为第i个样本的主成分得分矩阵,V为主成分得分矩阵的协方差;
D i 2 = ( s i - s i - ) T V - 1 ( s i - s i - ) - - - ( 1 )
步骤二、然后计算所有样本的平均马氏距离,根据3倍马氏距离原则,或者狄克松准则直接根据每个样本的马氏距离进行判别;当然也可以把每个样本的马氏距离转换成杠杆值,式2中hi代表杠杆值。
D i 2 = ( n - 1 ) ( h i - 1 n ) - - - ( 2 )
步骤三、计算样本集的平均马氏距离,设定建模集里马氏距离的阈值;设定建模集里马氏距离阈值的方法为,根据建模集里面的光谱,分别计算建模集每条光谱的马氏距离;求出其均值按照三倍的原则,即三倍AD设定为其阈值。
步骤四、计算预测样本与模型内样本的相似度,相似度的公式按照如下的公式进行计算:相似度(S)=相关系数+信息含量,的形式进行表征。
相关系数按照简单的相关系数进行计算
相关系数的计算公式为:
R = Σ i ( x i - x ‾ ) ( y i - y ‾ ) Σ i ( x i - x ‾ ) 2 ( y i - y ‾ ) 2 - - - ( 3 )
信息含量按照:信息熵的方式进行计算,信息熵的计算公式为,
H(P1,…,Pn-1,Q1,Q2)=H(P1,…,Pn-1)+PnH(4)
则有下列唯一表达形
式:H(P1,…,Pn)-CH(P1,…,Pn)=-CP(xi)*log(xi);(5)
计算两条光谱(i,j光谱为光谱的序列号,k为近红外光谱的波长点)的相似度为;
c1(i,k)=(x11(i,k))*log(x11(i,k)/x21(j,k));(6)
c2(j,k)=(x21(j,k))*log(x21(j,k)/x11(i,k));(7)
定义H值为:H=H(c1)+H(c2);(8)
计算相似度公式为 ( S ) = ( 1 - R 2 ) * ( H 1 + H 2 ) - - - ( 9 )
其中R为模型里面的第i条光谱与第m条光谱的相关系数;H1=c1(i,m),H2=c1(m,i);
步骤五、根据相似度的值,判断近红外模型是否需要维护。当在线样本与模型的相似程度已经偏离与模型里面光谱相似程度的3倍之上时,说明模型需要维护。
在云南A厂在线选取458个烟叶样本,进行近红外光谱扫描,以流动数据去做基础流动数据尼古丁,458个烟叶样本中,前面346个烟叶样本用作建模,后面30个样本作为独立验证样本,再后面取得的82个样本利用本实施方式中的方法,验证是否需要对近红外模型进行维护,近红外建模方法为PLS(偏最小二乘法),预处理方法为SG(一阶导平滑)一阶导,波长选择方法为UVE(消除无关信息变量法)。
模型内参数:
表1.在线近红外模型构建内部参数表
指标 R SEC 成分数 绝对误差 相对误差
0.85 0.25 8 0.22 8.54%
表2.独立验证样本30个外部验证表:
指标 R SEC 成分数 绝对误差 相对误差
0.78 0.29 8 0.28 9.19%
计算后续独立样本82个与模型的相似度值,见附图1和附图2,从相似度值熵可以看出,对于后续的验证样本,前30个,模型比较适应,30个之后的样本从相似指数上看出,模型并不适应,因为在线样本与模型的相似程度已经偏离与模型里面光谱相似程度的3倍之上。
表3.外部预测样本的外部验证误差表
指标 相似度指数 适应性判别 绝对误差 相对误差
前30 2.79 适应 0.288 9.13%
后续样本 80.40 不适应 1.35 49%
因此在后续样本的取样过程中,本方法可以指导在线近红外模型的更新维护;用于快速更新模型。

Claims (5)

1.一种基于光谱投影判别的近红外模型维护方法,其特征在于,包括以下步骤:
步骤一、近红外光谱模型构建完成后,对模型内的校正光谱做近红外光谱的主成分分析,利用主成分光谱来计算每个样本的马氏距离,
步骤二、计算所有样本的平均马氏距离;
步骤三、计算样本集的平均马氏距离,设定建模集里马氏距离的阈值;
步骤四、计算预测样本与模型内样本的相似度;
步骤五、根据相似度的值,判断近红外模型是否需要维护。
2.根据权利要求1所述的基于光谱投影判别的近红外模型维护方法,其特征在于:
步骤一中,马氏距离的计算公式为,其中Di为第i个样本的马氏距离,si为第i个样本的主成分得分矩阵,V为主成分得分矩阵的协方差。
3.根据权利要求1所述的基于光谱投影判别的近红外模型维护方法,其特征在于:
步骤二中,平均马氏距离的计算公式为,
D i 2 = ( n - 1 ) ( h i - 1 n ) .
4.根据权利要求1所述的基于光谱投影判别的近红外模型维护方法,其特征在于:
步骤三中,设定建模集里马氏距离阈值的方法为,根据建模集里面的光谱,分别计算建模集每条光谱的马氏距离;求出其均值按照三倍的原则,即三倍AD设定为阈值。
5.根据权利要求1所述的基于光谱投影判别的近红外模型维护方法,其特征在于:
步骤四中,相似度的计算公式为
CN201510581939.6A 2015-09-14 2015-09-14 基于光谱投影判别的近红外模型维护方法 Active CN105334185B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510581939.6A CN105334185B (zh) 2015-09-14 2015-09-14 基于光谱投影判别的近红外模型维护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510581939.6A CN105334185B (zh) 2015-09-14 2015-09-14 基于光谱投影判别的近红外模型维护方法

Publications (2)

Publication Number Publication Date
CN105334185A true CN105334185A (zh) 2016-02-17
CN105334185B CN105334185B (zh) 2018-04-03

Family

ID=55284838

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510581939.6A Active CN105334185B (zh) 2015-09-14 2015-09-14 基于光谱投影判别的近红外模型维护方法

Country Status (1)

Country Link
CN (1) CN105334185B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105928901A (zh) * 2016-07-11 2016-09-07 上海创和亿电子科技发展有限公司 一种定性定量相结合的近红外定量模型构建方法
CN106248621A (zh) * 2016-08-31 2016-12-21 上海创和亿电子科技发展有限公司 一种评价方法与系统
CN107655850A (zh) * 2016-07-25 2018-02-02 上海创和亿电子科技发展有限公司 基于近红外光谱的非线性建模方法及系统
CN108009569A (zh) * 2017-11-15 2018-05-08 中国海洋大学 一种近红外光谱设备的稳定性判别方法
CN108226092A (zh) * 2017-12-29 2018-06-29 广州讯动网络科技有限公司 基于近红外光谱相似度的模型界外样本识别方法
CN110108486A (zh) * 2018-01-31 2019-08-09 阿里巴巴集团控股有限公司 轴承故障预测方法、设备及系统
CN112748200A (zh) * 2020-12-25 2021-05-04 新疆医科大学 一种用于从孕马尿中获取结合雌激素成分的柱层析工艺的近红外质量监控方法
CN113984708A (zh) * 2021-10-22 2022-01-28 浙江中烟工业有限责任公司 一种化学指标检测模型的维护方法和装置
CN117643388A (zh) * 2024-01-30 2024-03-05 四川威斯派克科技有限公司 一种打叶复烤多点集成近红外监测系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104165861A (zh) * 2014-08-22 2014-11-26 云南中烟工业有限责任公司 一种基于主成分分析的近红外光谱定量模型精简方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104165861A (zh) * 2014-08-22 2014-11-26 云南中烟工业有限责任公司 一种基于主成分分析的近红外光谱定量模型精简方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘泽春 等: "烟草近红外光谱模型的适配性研究", 《烟草化学》 *
曾晓虹 等: "近红外光谱模型的适用性考察", 《烟草化学》 *
赵忠盖 等: "基于马氏距离统计监测指标的应用研究", 《自动化学报》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105928901A (zh) * 2016-07-11 2016-09-07 上海创和亿电子科技发展有限公司 一种定性定量相结合的近红外定量模型构建方法
CN105928901B (zh) * 2016-07-11 2019-06-07 上海创和亿电子科技发展有限公司 一种定性定量相结合的近红外定量模型构建方法
CN107655850A (zh) * 2016-07-25 2018-02-02 上海创和亿电子科技发展有限公司 基于近红外光谱的非线性建模方法及系统
CN106248621B (zh) * 2016-08-31 2019-04-02 上海创和亿电子科技发展有限公司 一种评价方法与系统
CN106248621A (zh) * 2016-08-31 2016-12-21 上海创和亿电子科技发展有限公司 一种评价方法与系统
CN108009569A (zh) * 2017-11-15 2018-05-08 中国海洋大学 一种近红外光谱设备的稳定性判别方法
CN108009569B (zh) * 2017-11-15 2021-04-30 中国海洋大学 一种近红外光谱设备的稳定性判别方法
CN108226092A (zh) * 2017-12-29 2018-06-29 广州讯动网络科技有限公司 基于近红外光谱相似度的模型界外样本识别方法
CN108226092B (zh) * 2017-12-29 2021-01-12 广州讯动网络科技有限公司 基于近红外光谱相似度的模型界外样本识别方法
CN110108486A (zh) * 2018-01-31 2019-08-09 阿里巴巴集团控股有限公司 轴承故障预测方法、设备及系统
CN112748200A (zh) * 2020-12-25 2021-05-04 新疆医科大学 一种用于从孕马尿中获取结合雌激素成分的柱层析工艺的近红外质量监控方法
CN113984708A (zh) * 2021-10-22 2022-01-28 浙江中烟工业有限责任公司 一种化学指标检测模型的维护方法和装置
CN113984708B (zh) * 2021-10-22 2024-03-19 浙江中烟工业有限责任公司 一种化学指标检测模型的维护方法和装置
CN117643388A (zh) * 2024-01-30 2024-03-05 四川威斯派克科技有限公司 一种打叶复烤多点集成近红外监测系统

Also Published As

Publication number Publication date
CN105334185B (zh) 2018-04-03

Similar Documents

Publication Publication Date Title
CN105334185A (zh) 基于光谱投影判别的近红外模型维护方法
TWI521360B (zh) 量測抽樣方法與其電腦程式產品
WO2017045296A1 (zh) 在线近红外样本量确定方法
Xie et al. Novel just-in-time learning-based soft sensor utilizing non-Gaussian information
CN109324013A (zh) 一种利用高斯过程回归模型构建原油性质近红外快速分析的方法
White et al. Methodological tools
US20210247367A1 (en) Workflow-based model optimization method for vibrational spectral analysis
CN105424641A (zh) 一种原油种类的近红外光谱识别方法
CN106248621A (zh) 一种评价方法与系统
CN106227910A (zh) 一种基于灰色系统理论的加速退化试验可靠性评估方法
CN109324014A (zh) 一种自适应的原油性质近红外快速预测方法
CN111143768A (zh) 一种基于arima-svm组合模型的空气质量预测算法
CN111339633B (zh) 基于数据变化特征模糊度量的热量表性能退化评估方法
CN109283153B (zh) 一种酱油定量分析模型的建立方法
CN114611582B (zh) 一种基于近红外光谱技术分析物质浓度的方法及系统
CN104568823A (zh) 基于近红外光谱的烟叶原料配比比例计算方法和装置
CN103389360B (zh) 基于概率主元回归模型的脱丁烷塔丁烷含量软测量方法
CN112651173B (zh) 一种基于跨域光谱信息的农产品品质无损检测方法及可泛化系统
CN108663334B (zh) 基于多分类器融合寻找土壤养分光谱特征波长的方法
CN106485049B (zh) 一种基于蒙特卡洛交叉验证的nirs异常样本的检测方法
CN113742248A (zh) 一种基于项目测量数据进行组织过程预测的方法及系统
CN115985411A (zh) 基于高斯过程回归模型的高分子熔融指数软测量方法
CN114139643B (zh) 一种基于机器视觉的单甘酯质量检测方法及系统
CN115828114A (zh) 一种铝型材挤压机能耗异常检测方法
Razak et al. ARIMA and VAR modeling to forecast Malaysian economic growth

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant