CN103837484B - 一种用于消除光谱乘性随机误差的角度化多变量分析方法 - Google Patents

一种用于消除光谱乘性随机误差的角度化多变量分析方法 Download PDF

Info

Publication number
CN103837484B
CN103837484B CN201410061616.XA CN201410061616A CN103837484B CN 103837484 B CN103837484 B CN 103837484B CN 201410061616 A CN201410061616 A CN 201410061616A CN 103837484 B CN103837484 B CN 103837484B
Authority
CN
China
Prior art keywords
value
vector
angle
modeling
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410061616.XA
Other languages
English (en)
Other versions
CN103837484A (zh
Inventor
姚志湘
粟晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi University of Science and Technology
Original Assignee
Guangxi University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi University of Science and Technology filed Critical Guangxi University of Science and Technology
Priority to CN201410061616.XA priority Critical patent/CN103837484B/zh
Publication of CN103837484A publication Critical patent/CN103837484A/zh
Application granted granted Critical
Publication of CN103837484B publication Critical patent/CN103837484B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Spectrometry And Color Measurement (AREA)

Abstract

本发明公开了一种用于消除光谱乘性随机误差的角度化多变量分析方法。本方法它包括以下步骤分为建模和预测两大部分。本发明利用角度化多变量转换方法,替代直接的采用光谱强度信号进行处理,以消除信号的乘性误差,避免体系信号强度扰动的干扰。

Description

一种用于消除光谱乘性随机误差的角度化多变量分析方法
技术领域:
本发明涉及的是一种用于消除光谱乘性随机误差的角度化多变量分析方法。
背景技术:
光谱分析中,获取的光谱信号受到多种随机误差的干扰,尤其是拉曼和近红外中常采用的反射测量方法,不仅受到常见的噪声和基线漂移等叠加误差,而且还受到散射和反射光程等乘性误差的干扰。
在被测量值(x)与响应信号(y)存在线性关系的体系中,加性(ea)和乘性(em)两类误差可以表示为:
y=em·a·x+ea (1)
加性误差导致整体信号起伏和偏转,但不影响信号的幅度,采用背景扣除或微分(差分)方法可以较好地消除。而乘性误差导致信号幅度的变化,在等方差分布的前提下,通常采用标准正态变量校正(SNV)和多元散射校正(MSC)方法校正;信号方差不同的情况下,可采用扩展多元散射校正(EMSC)方法校正,但是需要先验知识支持。
多数情况下信号方差随强度变化,无法满足SNV和MSC的限定条件,往往也由于缺乏足够或准确的先验知识,而使得EMSC方法不可行。在光谱的实时和现场测定中,强度扰动和颗粒散射扰动很常见,导致的乘性误差直接对定量的准确造成干扰。
发明内容:
本发明的目的在于克服现有技术的不足,提供一种用于消除光谱乘性随机误差的角度化多变量分析方法。
为了解决背景技术所存在的问题,本发明采用以下技术方案:
一种用于消除光谱乘性随机误差的角度化多变量分析方法,其特征在于,它包括以下步骤:
建模:确定空间描述所需的变量数,即确定空间维数ND后,从建模数据集中均匀挑选出ND个坐标向量CoV,依次计算每一个建模样本与坐标向量的夹角余弦值构成角度余弦值矩阵DOSp,并对角度矩阵线性化得到非线性调整参数t。建立包含ND、CoV、t以及经过线性化后的角度余弦值的多变量回归系数的角度余弦多变量校正模型。
预测:将被预测的原始光谱数据OSp中m组光谱与ND个坐标向量CoV逐一计算夹角向量值,存储为m×ND个元素的矩阵M;求矩阵M中的每个元素的t次幂得到非线性校正的测量数据;应用建立的多变量校正模型获取所需的预测值。
进一步的,在建模步骤中,包括以下步骤:
步骤一.确定空间描述所需的变量数,即空间维数:
按照现有的多元统计方法采用的潜在变量数判断方法确定空间维数ND,ND数可以从建模数据集中获得,也可以从包含建模数据集和预测集的样本整体中求取,而从整体样本中求取的ND会更具有代表性;
步骤二.选择描述空间的向量,即坐标向量:
根据含量的分布情况,从建模数据集中均匀挑选出ND个数据,作为坐标向量CoV,来描述样本构成的空间;
步骤三.强度描述转为角度描述,即角度化:
按照式将每一个建模样本作为向量,依次计算与挑选出来的ND个坐标向量CoV的夹角余弦值;
如果样本集中包含p个样本,则经过角度余弦化后,构成了p×ND个元素的角度余弦值矩阵DOSp;
步骤四.角度矩阵的线性化,即余弦值的指数调整
(1)定义步长st,逐步增加k,设定指数t=k*st,指数t值范围为[-2,2],t≠0,计算DOSp的t次幂PCDt
(2)将PCDt对样本中的系列含量C作多变量回归,得到回归值Ct;
(3)计算Ct和C的相关系数Cor;
(4)回到(1),不断调整t,找出Cor最大值所对应的t值,作为非线性调整参数
步骤五.输出模型
记录ND、CoV、t值,以及经过线性化后的角度余弦值的多变量回归系数,作为完整的角度余弦多变量校正模型。
进一步的,在预测步骤中,包括以下步骤:
步骤一.数据角度化
被预测的原始光谱数据OSp中如果含有m组光谱,将m组数据与建模部分选出的ND个坐标向量CoV逐一计算夹角向量值,存储为m×ND个元素的矩阵M;
步骤二.非线性校正
求矩阵M中的每个元素的t次幂,校正后的M可满足与建模步骤得到的多变量模型的近似线性响应;
步骤三.多变量校正
对经过角度化和非线性校正的测量数据应用多变量模型校正,获取所需的预测值。
本发明对比现有技术,有如下的有益效果:本发明利用角度化多变量转换方法,替代直接的采用光谱强度信号进行处理,以消除信号的乘性误差,避免体系信号强度扰动的干扰。
附图说明:
图1是本发明原理图。
图2是本发明建模流程图。
图3是本发明预测流程图。
图4是实施例中的系列样本的拉曼光谱信号。
图5是本发明方法与直接PLS建模的预测结果图。
具体实施方式:
下面结合附图和具体实施方式对本发明作进一步描述:
图1是本发明原理图。
多变量体系中的混合信号是各个源信号的叠加,多变量统计分析方法通常简化为线性加和关系,也就是将源信号看做空间中固定的向量,多变量混合信号对应的向量为不同强度源向量的和。
如图1所示,混合向量Y是源向量X1、X2、X3的和,其强度来自于各个源向量的和,而混合向量的方向则决定于源向量强度的比例关系。
如果仅考虑乘性误差,式(1)表示为:
Y=em·A·X (2)
其中Y是一个数组,或代表空间中的一个混合向量,X是一系列源信号数组或系列的源向量{X1,X2,X3,…},em是乘性扰动系数。
计算Y与X中任一向量Xi的夹角:
cos α = Y · X i | Y | · | X i | - - - ( 3 )
对于同一状态响应,Y是不受乘性干扰,而Y1受到乘性干扰,则有:
Y1=em·Y (4)
将(4)带入式(3)中,则有:
cos α = Y · X i | Y | · | X i | = e m · Y · X i e m · | Y | · | X i | = Y 1 · X i | Y 1 | · | X i | - - - ( 5 )
即:对于同一状态,混合向量与源向量的夹角不受乘性干扰的影响。
图1是一个三维示意,混合信号与3个源信号的夹角可以确定地描述混合信号的方向,而混合向量的方向只取决源信号组成的比例关系(相对强度关系),与源信号的绝对强度无关。也就是说,对于光谱信号而言,可用混合光谱与多个源光谱的夹角确定描述体系的混合组成,夹角的个数等于源信号的数量,或体系的秩。
进一步的,体系可用源光谱来确定描述,也可用同样个数的非线性相关的组合源信号确定描述;因此,只要从系列测量信号中选择出与体系秩数相等个数的测量信号作为“坐标向量”,计算混合信号与这些“坐标向量”的夹角,也能对体系的组成作确定的描述。
虽然夹角值与体系组成值存在确定的函数关系,但是函数关系是非线性的。如果要准确地实现预测,还需要进行非线性校准,本发明提出采用夹角余弦值的幂可以有效校正函数的非线性,得到近似线性,实现多变量线性回归模型,完成有效预测。
步骤分为建模和预测两大部分。方法所需数据与常规的多变量统计分析要求相同,即包括建模数据集和预测集,无额外要求,无需先验知识。
建模:
建模部分包括角度转化、非线性校正和多变量回归等步骤,所需数据为建模数据集,即用于建模的系列样本光谱和样本所对应被分析物的系列含量。图2是本发明建模流程图。
1.确定空间描述所需的变量数(空间维数):
按照现有的多元统计方法采用的潜在变量数判断方法确定空间维数(ND)。ND数可以从建模数据集中获得,也可以从包含建模数据集和预测集的样本整体中求取,而从整体样本中求取的ND会更具有代表性。
2.选择描述空间的向量(坐标向量):
根据含量的分布情况,从建模数据集中均匀挑选出ND个数据,作为坐标向量(CoV),来描述样本构成的空间。
3.强度描述转为角度描述(角度化):
按照式(3),将每一个建模样本作为向量,依次计算与挑选出来的ND个坐标向量(CoV)的夹角余弦值。
如果样本集中包含p个样本,则经过角度余弦化后,构成了p×ND个元素的角度(余弦值)矩阵DOSp。
4.角度矩阵的线性化(余弦值的指数调整)
直接得到的角度矩阵与体系含量存在不同程度的非线性关系,需要在多变量建模中消除,得到近似线性关系,以满足定量要求。
(1)定义步长st,逐步增加k,设定指数t=k*st,指数t值范围为[-2,2](t≠0),计算DOSp的t次幂(PCDt)。例如st=0.01,k从-200增加到200(注意,k值不能为0)。
(2)将PCDt对样本中的系列含量C作多变量回归,得到回归值Ct;
(3)计算Ct和C的相关系数Cor;
(4)回到(1),不断调整t,找出Cor最大值所对应的t值,作为非线性调整参数;
5.输出模型
记录ND、CoV、t值,以及经过线性化后的角度余弦值的多变量回归系数,作为完整的角度余弦多变量校正模型。
预测:
图3是本发明预测流程图。
1.数据角度化
被预测的原始光谱数据(OSp)中如果含有m组光谱,将m组数据与建模部分选出的ND个坐标向量(CoV)逐一计算夹角向量值,存储为m×ND个元素的矩阵M;
2.非线性校正
求矩阵M中的每个元素的t次幂,校正后的M可满足与建模步骤得到的多变量模型的近似线性响应。
3.多变量校正
对经过角度化和非线性校正的测量数据应用多变量模型校正,获取所需的预测值。
实施例一:
选取拉曼光谱仪测量混合物中的四氯化碳含量作为实施例。
1)光谱信号采集
在多组分混合物中按照含量2.5%~25%,十等分间隔添加四氯化碳,配制得5组共50个系列样本,其中每组包含10个样本,含量为2.5%~25%,样本中的其他组分浓度不相关。
通过不确定每个样品的测量距离和积分时间,来构成测量信号中的乘性扰动,采集到系列样本的拉曼光谱信号如图4所示。
2)直接PLS建模
从50个样本中,从每组随机选择3个浓度的样本共15个作为建模校正集,直接进行偏最小二乘建模。确定体系的隐含变量数为4,对50个样本整体预测,结果预测均方根差(RMSEP)为:6.57%,预测浓度与真实浓度相关系数为0.7289,预测效果不理想,无法有效准确预测。
3)角度化转换后PLS建模
从建模样本中选择2.5%、10%、17.5%、25%每个浓度中的1个光谱,共4个作为“坐标向量”,依次计算50个光谱与这4个光谱的夹角余弦值,构成了50×4的矩阵。按照建模流程,经过非线性校正,得到t值为1.71,并建立多变量校正模型。
经过角度化的数据,对50个样本的整体预测,结果表明预测均方根差(RMSEP)为0.26%,预测浓度与真实浓度相关系数为0.9994。
两种计算方法的结果如图5所示。从图5看出,光谱信号经过角度化转换后,可有效消除了乘性扰动的影响,实现了准确预测。也就是说,测量的预测值不受光谱积分时间和测量距离的影响。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种用于消除光谱乘性随机误差的角度化多变量分析方法,其特征在于,它包括以下步骤:
建模:确定空间描述所需的变量数,即确定空间维数ND后,从建模数据集中均匀挑选出ND个坐标向量CoV,依次计算每一个建模样本与坐标向量的夹角余弦值构成角度余弦值矩阵DOSp,并对角度矩阵线性化得到非线性调整参数t,建立包含ND、CoV、t以及经过线性化后的角度余弦值的多变量回归系数的角度余弦多变量校正模型;
预测:将被预测的原始光谱数据OSp中m组光谱与ND个坐标向量CoV逐一计算夹角向量值,存储为m×ND个元素的矩阵M;求矩阵M中的每个元素的t次幂得到非线性校正的测量数据;应用建立的多变量校正模型获取所需的预测值。
2.根据权利要求1所述的一种用于消除光谱乘性随机误差的角度化多变量分析方法,其特征在于,在建模步骤中,包括以下步骤:
步骤一.确定空间描述所需的变量数,即空间维数:
按照现有的多元统计方法采用的潜在变量数判断方法确定空间维数ND,ND数能够从建模数据集中获得,也能够从包含建模数据集和预测集的样本整体中求取,而从整体样本中求取的ND会更具有代表性;
步骤二.选择描述空间的向量,即坐标向量:
根据含量的分布情况,从建模数据集中均匀挑选出ND个数据,作为坐标向量CoV,来描述样本构成的空间;
步骤三.强度描述转为角度描述,即角度化:
按照式将每一个建模样本作为向量,依次计算与挑选出来的ND个坐标向量CoV的夹角余弦值;式中:Y是一个数组,或代表空间中的一个混合向量;X是一系列源信号数组或系列的源向量{X1,X2,X3,…};α为Y与X中任一向量Xi的夹角;
如果样本集中包含p个样本,则经过角度余弦化后,构成了p×ND个元素的角度余弦值矩阵DOSp;
步骤四.角度矩阵的线性化,即余弦值的指数调整
(1)定义步长st,逐步增加k,设定指数t=k*st,指数t值范围为[-2,2],t≠0,计算DOSp的t次幂PCDt;st=0.01,k从-200增加到200,k值不能为0;
(2)将PCDt对样本中的系列含量C作多变量回归,得到回归值Ct;
(3)计算Ct和C的相关系数Cor;
(4)回到(1),不断调整t,找出Cor最大值所对应的t值,作为非线性调整参数
步骤五.输出模型
记录ND、CoV、t值,以及经过线性化后的角度余弦值的多变量回归系数,作为完整的角度余弦多变量校正模型。
3.根据权利要求1所述的一种用于消除光谱乘性随机误差的角度化多变量分析方法,其特征在于,在预测步骤中,包括以下步骤:
步骤一.数据角度化
被预测的原始光谱数据OSp中如果含有m组光谱,将m组数据与建模部分选出的ND个坐标向量CoV逐一计算夹角向量值,存储为m×ND个元素的矩阵M;
步骤二.非线性校正
求矩阵M中的每个元素的t次幂,校正后的M可满足与建模步骤得到的多变量模型的近似线性响应;
步骤三.多变量校正
对经过角度化和非线性校正的测量数据应用多变量模型校正,获取所需的预测值。
CN201410061616.XA 2014-02-24 2014-02-24 一种用于消除光谱乘性随机误差的角度化多变量分析方法 Expired - Fee Related CN103837484B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410061616.XA CN103837484B (zh) 2014-02-24 2014-02-24 一种用于消除光谱乘性随机误差的角度化多变量分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410061616.XA CN103837484B (zh) 2014-02-24 2014-02-24 一种用于消除光谱乘性随机误差的角度化多变量分析方法

Publications (2)

Publication Number Publication Date
CN103837484A CN103837484A (zh) 2014-06-04
CN103837484B true CN103837484B (zh) 2016-08-17

Family

ID=50801201

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410061616.XA Expired - Fee Related CN103837484B (zh) 2014-02-24 2014-02-24 一种用于消除光谱乘性随机误差的角度化多变量分析方法

Country Status (1)

Country Link
CN (1) CN103837484B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106338503B (zh) * 2016-08-30 2019-03-29 广西科技大学 植物油的过氧化值快速检测方法
CN110162740B (zh) * 2019-05-14 2023-03-31 广西科技大学 一种用于光谱分辨增强的逆矩阵迭代反卷积方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1546959A (zh) * 2003-12-12 2004-11-17 上海交通大学 非线性光谱相似性度量方法
CN1880944A (zh) * 2005-09-27 2006-12-20 重庆大学 一种光谱的多组分分析方法
CN103018178A (zh) * 2012-12-06 2013-04-03 江苏省质量安全工程研究院 基于局部保持投影的红外光谱仪校准方法
CN103472028A (zh) * 2013-09-22 2013-12-25 广西科技大学 一种混纺纤维中组分含量的测定方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2308684C1 (ru) * 2006-06-20 2007-10-20 Общество с ограниченной ответственностью "ВИНТЕЛ" Способ создания многомерных градуировочных моделей, устойчивых к изменениям свойств, влияющих на результаты измерений прибора
US8519337B2 (en) * 2008-06-28 2013-08-27 The Boeing Company Thermal effect measurement with near-infrared spectroscopy

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1546959A (zh) * 2003-12-12 2004-11-17 上海交通大学 非线性光谱相似性度量方法
CN1880944A (zh) * 2005-09-27 2006-12-20 重庆大学 一种光谱的多组分分析方法
CN103018178A (zh) * 2012-12-06 2013-04-03 江苏省质量安全工程研究院 基于局部保持投影的红外光谱仪校准方法
CN103472028A (zh) * 2013-09-22 2013-12-25 广西科技大学 一种混纺纤维中组分含量的测定方法

Also Published As

Publication number Publication date
CN103837484A (zh) 2014-06-04

Similar Documents

Publication Publication Date Title
Velander et al. CFHTLenS: the relation between galaxy dark matter haloes and baryons from weak gravitational lensing
Jamali et al. Detecting changes in vegetation trends using time series segmentation
Rivera et al. On the semi-automatic retrieval of biophysical parameters based on spectral index optimization
Tinker et al. Cosmological constraints from galaxy clustering and the mass-to-number ratio of galaxy clusters
Zeaiter et al. Robustness of models developed by multivariate calibration. Part I: The assessment of robustness
Currie Nomenclature in evaluation of analytical methods including detection and quantification capabilities:(IUPAC Recommendations 1995)
Briday et al. Accuracy of environmental tracers and consequences for determining the Type Ia supernova magnitude step
Scott et al. Error and uncertainty in radiocarbon measurements
de Albano et al. Proficiency tests for laboratories: a systematic review
CN106990056A (zh) 一种土壤全氮光谱估算模型校正样本集构建方法
Boesch et al. Monitoring greenhouse gases from space
Dhawale et al. Evaluating the precision and accuracy of proximal soil vis–NIR sensors for estimating soil organic matter and texture
Shahzad et al. L-Moments Based Calibrated Variance Estimators Using Double Stratified Sampling.
Pechanec et al. Usage of airborne hyperspectral imaging data for identifying spatial variability of soil nitrogen content
Nash et al. Partial least square analyses of landscape and surface water biota associations in the Savannah River Basin
CN103837484B (zh) 一种用于消除光谱乘性随机误差的角度化多变量分析方法
Villa et al. IUGS–IUPAC recommendations and status reports on the half-lives of 87Rb, 146Sm, 147Sm, 234U, 235U, and 238U (IUPAC Technical Report)
Debaene et al. Use of VIS-NIRS for land management classification with a support vector machine and prediction of soil organic carbon and other soil properties
Chown et al. The mid-infrared Leavitt law for classical Cepheids in the Magellanic Clouds
Rafkin et al. On the problem of a variable Mars atmospheric composition in the determination of temperature and density from the adiabatic speed of sound
Burstyn et al. Hierarchical Dynamic Time Warping methodology for aggregating multiple geological time series
Li et al. Modelling gross primary production in the Heihe river basin and uncertainty analysis
CN110501294A (zh) 一种基于信息融合的多元校正方法
Gučević et al. Testing of Homogeneity of Coordinates of Various Permanent GNSS Reference Stations Networks of the Republic of Serbia According to the Common Requirements for Proving Competence
Svinolupov et al. A methodology for assessing the quality of measuring instruments (case study: Pressure sensors)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160817

Termination date: 20210224