CN109508440B - 光谱分析模型的构建方法、装置、设备及存储介质 - Google Patents

光谱分析模型的构建方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109508440B
CN109508440B CN201811440596.1A CN201811440596A CN109508440B CN 109508440 B CN109508440 B CN 109508440B CN 201811440596 A CN201811440596 A CN 201811440596A CN 109508440 B CN109508440 B CN 109508440B
Authority
CN
China
Prior art keywords
matrix
preset
sample
original model
analysis model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811440596.1A
Other languages
English (en)
Other versions
CN109508440A (zh
Inventor
牟怿
周龙
杨超
郭亦凡
陈浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Polytechnic University
Original Assignee
Wuhan Polytechnic University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Polytechnic University filed Critical Wuhan Polytechnic University
Priority to CN201811440596.1A priority Critical patent/CN109508440B/zh
Publication of CN109508440A publication Critical patent/CN109508440A/zh
Application granted granted Critical
Publication of CN109508440B publication Critical patent/CN109508440B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种光谱分析模型的构建方法、装置、设备及存储介质,所述方法包括:获取历史光谱的样本数据;提取所述样本数据中的样本信息以及特征信息,将所述样本信息和特征信息组成样本矩阵;根据所述样本矩阵建立预设原始模型,其中,所述预设原始模型包括若干未知预设参数;根据所述样本矩阵按照预设规则对所述预设原始模型进行训练,得到所述未知预设参数的已知值;将所述已知值代入所述预设原始模型中生成目标光谱分析模型。本发明将噪声样本预先加入训练模型中进行训练,从而提高建模的精度。

Description

光谱分析模型的构建方法、装置、设备及存储介质
技术领域
本发明涉及光谱分析技术领域,尤其涉及一种光谱分析模型的构建方法、装置、设备及存储介质。
背景技术
目前,红外光谱的分析是化学计量学、模式识别等相关领域的研究热点,通常的方法是利用偏最小二乘回归法建立定量分析模型,但是建立的最小二乘回归模型在样本中含有噪声和异常样本时,模型的参数会受到影响,从而降低建模精度。
发明内容
本发明的主要目的在于提出一种光谱分析模型的构建方法、装置、设备及存储介质,旨在提高建模精度。
为实现上述目的,本发明提供一种光谱分析模型的构建方法,所述光谱分析模型的构建方法包括以下步骤:
获取历史光谱的样本数据;
提取所述样本数据中的样本信息以及特征信息,将所述样本信息和特征信息组成样本矩阵;
根据所述样本矩阵建立预设原始模型,其中,所述预设原始模型包括若干未知预设参数;
根据所述样本矩阵按照预设规则对所述预设原始模型进行训练,得到所述未知预设参数的已知值;
将所述已知值代入所述预设原始模型中生成目标光谱分析模型。
优选地,所述提取所述样本数据中的样本信息以及特征信息,将所述样本信息和特征信息组成样本矩阵,包括:
提取所述样本数据中的每列样本信息以及对应的光谱长度,将所述样本信息以及对应的光谱长度组成所述光谱矩阵;
提取所述样本数据中的光谱对应的特征,将所述特征组成特征矩阵,将所述光谱矩阵和特征矩阵组成所述样本矩阵。
优选地,所述未知预设参数包括回归系数矩阵、未含噪声的光谱矩阵、未含噪声的字典、所述不含噪声的字典表示所述光谱矩阵的系数,所述光谱矩阵中的噪声、辅助变量、约束条件、所述预设原始模型的惩罚参数以及预设矩阵;
其中,所述预设矩阵对角线上的元素为第一预设值,包含的其他元素为第二预设值。
优选地,所述预设原始模型为:
Figure BDA0001883016440000021
其中,L表示建立的预设原始模型,T表示所述回归系数矩阵,
Figure BDA0001883016440000022
表示所述未含噪声的光谱矩阵,A表示所述未含噪声的字典,Z表示所述不含噪声的字典表示所述光谱矩阵的系数,E表示所述光谱矩阵中的噪声,J表示所述辅助变量,s.t.表示所述约束条件,η,λ1和λ2表示所述预设原始模型的惩罚参数,W表示预设矩阵。
优选地,所述根据所述样本矩阵按照预设规则对所述预设原始模型进行训练,得到所述未知预设参数的已知值,包括:
通过拉格朗日算法将所述预设原始模型变换为第一原始模型:
将所述
Figure BDA0001883016440000023
A,Z,J以及E固定,根据所述样本矩阵对所述第一原始模型进行训练,得到T的已知值;
将所述T,A,Z,J以及E固定,根据所述样本矩阵对所述第一原始模型进行训练,得到
Figure BDA0001883016440000024
的已知值;
将所述T,
Figure BDA0001883016440000025
Z以及J固定,根据所述样本矩阵对所述第一原始模型进行训练,得到A和E的已知值;
将所述T,
Figure BDA0001883016440000026
A以及E固定,根据所述样本矩阵对所述第一原始模型进行训练,得到Z和J的已知值。
优选地,所述将所述已知值代入所述预设原始模型中生成目标光谱分析模型之后,所述方法还包括:
将所述拉格朗日乘子矩阵和惩罚参数进行更新,根据更新后的拉格朗日乘子矩阵和惩罚参数对所述未知预设参数的已知值进行更新。
优选地,所述将所述已知值代入所述预设原始模型中生成目标光谱分析模型之后,所述方法还包括:
获取验证样本数据,将所述验证样本数据放入所述目标光谱分析模型进行预测,得到预测结果;
通过预设公式对所述预测结果进行分析,得到误差值;
根据所述误差值对所述目标光谱分析模型进行验证。
此外,为实现上述目的,本发明还提出一种光谱分析模型的构建装置,所述光谱分析模型的构建装置包括:
获取模块,用于获取历史光谱的样本数据;
组成模块,用于提取所述样本数据中的样本信息以及特征信息,将所述样本信息和特征信息组成样本矩阵;
建立模块,用于根据所述样本矩阵建立预设原始模型,其中,所述预设原始模型包括若干未知预设参数;
训练模块,用于根据所述样本矩阵按照预设规则对所述预设原始模型进行训练,得到所述未知预设参数的已知值;
生成模块,用于将所述已知值代入所述预设原始模型中生成目标光谱分析模型。
此外,为实现上述目的,本发明还提出一种光谱分析模型的构建设备,所述光谱分析模型的构建设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的光谱分析模型的构建程序,所述光谱分析模型的构建程序配置为实现如上所述的光谱分析模型的构建方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有光谱分析模型的构建程序,所述光谱分析模型的构建程序被处理器执行时实现如上文所述的光谱分析模型的构建方法的步骤。
本发明提出的光谱分析模型的构建方法,通过获取历史光谱的样本数据;提取所述样本数据中的样本信息以及特征信息,将所述样本信息和特征信息组成样本矩阵;根据所述样本矩阵建立预设原始模型,其中,所述预设原始模型包括若干未知预设参数;根据所述样本矩阵按照预设规则对所述预设原始模型进行训练,得到所述未知预设参数的已知值;将所述已知值代入所述预设原始模型中生成目标光谱分析模型,将噪声样本预先加入训练模型中进行训练,从而提高建模的精度。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的光谱分析模型的构建设备结构示意图;
图2为本发明光谱分析模型的构建方法第一实施例的流程示意图;
图3为本发明光谱分析模型的构建方法第二实施例的流程示意图;
图4为本发明光谱分析模型的构建方法第三实施例的流程示意图;
图5a为本发明光谱分析模型的构建方法可溶性固体分析实验结果示意图;
图5b为本发明光谱分析模型的构建方法蔗糖分析实验结果示意图;
图6为本发明光谱分析模型的构建方法石油光谱辛烷值分析实验结果示意图;
图7为本发明光谱分析模型的构建装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的光谱分析模型的构建设备结构示意图。
如图1所示,该光谱分析模型的构建设备可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如按键,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的设备结构并不构成对光谱分析模型的构建设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及光谱分析模型的构建程序。
在图1所示的光谱分析模型的构建设备中,网络接口1004主要用于连接外网,与其他网络设备进行数据通信;用户接口1003主要用于连接用户设备,与用户设备进行数据通信;本发明光谱分析模型的构建设备通过处理器1001调用存储器1005中存储的光谱分析模型的构建程序,并执行本发明实施例提供的光谱分析模型的构建的实施方法。
基于上述硬件结构,提出本发明光谱分析模型的构建方法实施例。
参照图2,图2为本发明光谱分析模型的构建方法第一实施例的流程示意图。
在第一实施例中,所述光谱分析模型的构建方法包括以下步骤:
步骤S10,获取历史光谱的样本数据。
需要说明的是,所述历史光谱为预先提供的各种光谱信息,例如红外光谱,在本实施例中,以红外光谱为例进行说明。
在具体实现中,可通过各种实验得到历史光谱数据,通过所述历史光谱数据建立光谱分析模型,实现对光谱数据的有效分析。
步骤S20,提取所述样本数据中的样本信息以及特征信息,将所述样本信息和特征信息组成样本矩阵。
需要说明的是,以X为光谱组成的矩阵,矩阵X的每一列是一个样本,光谱长度为n,则一共有m个样本,因此X是一个m*n的矩阵,在本实施例中将X作为所述样本信息,将所述光谱对应的特征作为所述特征信息,在本实施例中,可用Y进行表示,从而对样本数据进行定量分析。
步骤S30,根据所述样本矩阵建立预设原始模型,其中,所述预设原始模型包括若干未知预设参数。
在本实施例中,所述若干位置预设参包括回归系数矩阵、未含噪声的光谱矩阵、未含噪声的字典、所述不含噪声的字典表示所述光谱矩阵X的系数,所述光谱矩阵X中的噪声、辅助变量、约束条件以及所述预设原始模型的惩罚参数,还包括其他参数。
在具体实现中,所述预设原始模型为:
Figure BDA0001883016440000061
其中,L表示建立的预设原始模型,T表示所述回归系数矩阵,
Figure BDA0001883016440000062
表示所述未含噪声的光谱矩阵,A表示所述未含噪声的字典,Z表示所述不含噪声的字典表示所述光谱矩阵的系数,E表示所述光谱矩阵中的噪声,J表示所述辅助变量,s.t.表示所述约束条件,η,λ1和λ2表示所述预设原始模型的惩罚参数,W表示预设矩阵,所述预设矩阵对角线上的元素为第一预设值,包含的其他元素为第二预设值。min表示求最小值,符号||A||*表示求核范数,定义为矩阵A的奇异值之和,||J||1表示求1范数,定义为矩阵中所有元素绝对值之和,||·||F表示求F范数,定义为矩阵中所有元素平方和再开方。||·||1,2表示求矩阵的1,2范数,先按照行求1范数,再求2范数,上标T表示求转置。
步骤S40,根据所述样本矩阵按照预设规则对所述预设原始模型进行训练,得到所述未知预设参数的已知值。
在具体实现中,首先将获取的光谱的样本数据随机地取出一部分作为求解上述模型的训练样本,取出数据集中的一半组成样本矩阵X,矩阵对应的特征组成矩阵Y,在本实施例中,主要是指样本中的浓度信息,还可包括其他特征信息,本实施例对此不作限制。
在本实施例中,将所述预设原始模型利用拉格朗日将所述预设原始模型进行改写变换为:
Figure BDA0001883016440000071
其中,所述Y1,Y2和Y3分别表示拉格朗日乘子矩阵,μ1,μ2和μ3分别表示惩罚参数,然后通过预设规则得到所述未知预设参数的已知值。
可以理解的是,所述预设规则可为将其中的未知预设参数进行固定,计算其他未知预设参数的值,从而获取目标光谱分析模型。
步骤S50,将所述已知值代入所述预设原始模型中生成目标光谱分析模型。
在具体实现中,将计算得到的未知预设参数代入所述预设原始模型中,从而生成精度高的目标光谱分析模型。
本实施例通过上述方案,通过获取历史光谱的样本数据;提取所述样本数据中的样本信息以及特征信息,将所述样本信息和特征信息组成样本矩阵;根据所述样本矩阵建立预设原始模型,其中,所述预设原始模型包括若干未知预设参数;根据所述样本矩阵按照预设规则对所述预设原始模型进行训练,得到所述未知预设参数的已知值;将所述已知值代入所述预设原始模型中生成目标光谱分析模型,将噪声样本预先加入训练模型中进行训练,从而提高建模的精度。
进一步地,如图3所示,基于第一实施例提出本发明光谱分析模型的构建方法第二实施例,在本实施例中,所述步骤S20,包括:
步骤S201,提取所述样本数据中的每列样本信息以及对应的光谱长度,将所述样本信息以及对应的光谱长度组成所述光谱矩阵。
需要说明的是,以X为光谱组成的矩阵,矩阵X的每一列是一个样本,光谱长度为n,则一共有m个样本,因此X是一个m*n的矩阵,在本实施例中将X作为所述光谱矩阵。
步骤S202,提取所述样本数据中的光谱对应的特征,将所述特征组成特征矩阵,将所述光谱矩阵和特征矩阵组成所述样本矩阵。
可以理解的是,将所述光谱对应的特征作为所述特征信息,在本实施例中,可用Y进行表示,从而对样本数据进行定量分析,通过X和Y组成的样本矩阵实现对所述预设原始模型进行训练。
进一步地,所述步骤S40,包括:
通过拉格朗日算法将所述预设原始模型变换为第一原始模型,所述第一原始模型为变形后的公式二。
将所述
Figure BDA0001883016440000081
A,Z,J以及E固定,根据所述样本矩阵对所述第一原始模型进行训练,得到T的已知值。
在具体实现中,将所述
Figure BDA0001883016440000082
A,Z,J以及E固定,得到:
Figure BDA0001883016440000083
其中,γI表示调整值,γ表示正系数,I表示单位矩阵,在本实施例中通过加上γI避免不可逆的情况,从而提高模型的精确度。
将所述T,A,Z,J以及E固定,根据所述样本矩阵对所述第一原始模型进行训练,得到
Figure BDA0001883016440000084
的已知值。
在具体实现中,将所述T,A,Z,J以及E固定,得到:
Figure BDA0001883016440000085
其中,上标-1表示矩阵的逆矩阵;
将所述T,
Figure BDA0001883016440000086
Z以及J固定,根据所述样本矩阵对所述第一原始模型进行训练,得到A和E的已知值。
在具体实现中,将所述T,
Figure BDA0001883016440000087
Z以及J固定,得到:
Figure BDA0001883016440000088
其中,D表示奇异值阈值算子,βA=(μ12)/2,
Figure BDA0001883016440000089
Figure BDA00018830164400000810
其中,所述ξk表示矩阵Xk-AkZk-Y1 k1 k=[ξ12,…,ξn]的第k列;
将所述T,
Figure BDA00018830164400000811
A以及E固定,根据所述样本矩阵对所述第一原始模型进行训练,得到Z和J的已知值。
在具体实现中,将所述T,
Figure BDA0001883016440000091
A以及E固定,得到:
Figure BDA0001883016440000092
Jk+1=max(Qk+1,0)公式八;
其中,βZ=(μ123)/2,
Figure BDA0001883016440000093
Figure BDA0001883016440000094
所述S表示收缩算子。
进一步地,所述步骤S40之后,所述方法还包括:
步骤S401,将所述拉格朗日乘子矩阵和惩罚参数进行更新,根据更新后的拉格朗日乘子矩阵和惩罚参数对所述未知预设参数的已知值进行更新。
在具体实现中,将所述Y1,Y2和Y3分别表示拉格朗日乘子矩阵,μ1,μ2和μ3分别表示惩罚参数按照以下方式更新:
Figure BDA0001883016440000095
其中,所述ρ表示求谱范数。
本实施例提供的方案,通过固定其中的预设未知参数,求出其他参数的表达式,将所述表达式通过X和Y以及其他已知参数进行求解,从而实现模型的快速求解,提高系统的运行速率。
进一步地,如图4所示,基于第一实施例或第二实施例提出本发明光谱分析模型的构建方法第三实施例,在本实施例中,基于第一实施例进行说明,所述步骤S50之后,所述方法包括:
步骤S501,获取验证样本数据,将所述验证样本数据放入所述目标光谱分析模型进行预测,得到预测结果。
步骤S502,通过预设公式对所述预测结果进行分析,得到误差值。
需要说明的是,所述预设公式为:
Figure BDA0001883016440000101
其中,所述N表示验证样本数量,所述i表示当前样本,所述yi表示当前样本的实际值,所述
Figure BDA0001883016440000102
表示当前样本的预测值。
步骤S503,根据所述误差值对所述目标光谱分析模型进行验证。
在具体实现中,下面通过具体实施方式对本发明做进一步说明。
实施例1:糖光谱分析,光谱集包含1797个样本,从中随机选出898个作为训练样本,剩下的899个样本作为测试样本。分析的特征是可溶性固体和蔗糖含量,实验重复十次,原始的偏最小二乘回归的误差与本方法的误差如图5a,5b所示,如图5a表示可溶性固体分析结果,其中,横坐标表示实编号,纵坐标表示误差,如图5b表示蔗糖分析结果,其中,横坐标表示实编号,纵坐标表示误差,从而得出本实施例建立的光谱分析模型相比较偏最小二乘回归的分析结果精确度较高。
实施例2:石油光谱辛烷值分析,包含39个光谱,取19个作为训练样本,剩余20个作为测试样本,实验重复十次,将原始的偏最小二乘回归的误差与本方法的误差如图6所示,图6表示辛烷值分析结果,横坐标表示实编号,纵坐标表示误差,从而得出本实施例建立的光谱分析模型相比较偏最小二乘回归的分析结果精确度较高。
本实施例提供的方案,主要通过获取验证样本数据,将所述验证样本数据放入所述目标光谱分析模型进行预测,得到预测结果,通过预设公式对所述预测结果进行分析,得到误差值,根据所述误差值对所述目标光谱分析模型进行验证,并根据实验数据得出本实施例建立的光谱分析模型相比较偏最小二乘回归的分析结果精确度较高。
本发明进一步提供一种光谱分析模型的构建装置。
参照图7,图7为本发明光谱分析模型的构建装置第一实施例的功能模块示意图。
本发明光谱分析模型的构建装置第一实施例中,该光谱分析模型的构建装置包括:
获取模块10,用于获取历史光谱的样本数据。
需要说明的是,所述历史光谱为预先提供的各种光谱信息,例如红外光谱,在本实施例中,以红外光谱为例进行说明。
在具体实现中,可通过各种实验得到历史光谱数据,通过所述历史光谱数据建立光谱分析模型,实现对光谱数据的有效分析。
组成模块20,用于提取所述样本数据中的样本信息以及特征信息,将所述样本信息和特征信息组成样本矩阵。
需要说明的是,以X为光谱组成的矩阵,矩阵X的每一列是一个样本,光谱长度为n,则一共有m个样本,因此X是一个m*n的矩阵,在本实施例中将X作为所述样本信息,将所述光谱对应的特征作为所述特征信息,在本实施例中,可用Y进行表示,从而对样本数据进行定量分析。
建立模块30,用于根据所述样本矩阵建立预设原始模型,其中,所述预设原始模型包括若干未知预设参数。
在本实施例中,所述若干位置预设参包括回归系数矩阵、未含噪声的光谱矩阵、未含噪声的字典、所述不含噪声的字典表示所述光谱矩阵X的系数,所述光谱矩阵X中的噪声、辅助变量、约束条件以及所述预设原始模型的惩罚参数,还包括其他参数。
在具体实现中,所述预设原始模型为:
Figure BDA0001883016440000111
其中,L表示建立的预设原始模型,T表示所述回归系数矩阵,
Figure BDA0001883016440000112
表示所述未含噪声的光谱矩阵,A表示所述未含噪声的字典,Z表示所述不含噪声的字典表示所述光谱矩阵的系数,E表示所述光谱矩阵中的噪声,J表示所述辅助变量,s.t.表示所述约束条件,η,λ1和λ2表示所述预设原始模型的惩罚参数,W表示预设矩阵,所述预设矩阵对角线上的元素为第一预设值,包含的其他元素为第二预设值。min表示求最小值,符号||A||*表示求核范数,定义为矩阵A的奇异值之和,||J||1表示求1范数,定义为矩阵中所有元素绝对值之和,||·||F表示求F范数,定义为矩阵中所有元素平方和再开方。||·||1,2表示求矩阵的1,2范数,先按照行求1范数,再求2范数,上标T表示求转置。
训练模块40,用于根据所述样本矩阵按照预设规则对所述预设原始模型进行训练,得到所述未知预设参数的已知值。
在具体实现中,首先将获取的光谱的样本数据随机地取出一部分作为求解上述模型的训练样本,取出数据集中的一半组成样本矩阵X,矩阵对应的特征组成矩阵Y,在本实施例中,主要是指样本中的浓度信息,还可包括其他特征信息,本实施例对此不作限制。
在本实施例中,将所述预设原始模型利用拉格朗日将所述预设原始模型进行改写变换为:
Figure BDA0001883016440000121
其中,所述Y1,Y2和Y3分别表示拉格朗日乘子矩阵,μ1,μ2和μ3分别表示惩罚参数,然后通过预设规则得到所述未知预设参数的已知值。
可以理解的是,所述预设规则可为将其中的未知预设参数进行固定,计算其他未知预设参数的值,从而获取目标光谱分析模型。
生成模块50,用于将所述已知值代入所述预设原始模型中生成目标光谱分析模型。
在具体实现中,将计算得到的未知预设参数代入所述预设原始模型中,从而生成精度高的目标光谱分析模型。
本实施例通过上述方案,通过获取历史光谱的样本数据;提取所述样本数据中的样本信息以及特征信息,将所述样本信息和特征信息组成样本矩阵;根据所述样本矩阵建立预设原始模型,其中,所述预设原始模型包括若干未知预设参数;根据所述样本矩阵按照预设规则对所述预设原始模型进行训练,得到所述未知预设参数的已知值;将所述已知值代入所述预设原始模型中生成目标光谱分析模型,将噪声样本预先加入训练模型中进行训练,从而提高建模的精度。
此外,为实现上述目的,本发明还提出一种光谱分析模型的构建设备,所述光谱分析模型的构建设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的光谱分析模型的构建程序,所述光谱分析模型的构建程序配置为实现如上文所述的光谱分析模型的构建方法的步骤。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有光谱分析模型的构建程序,所述光谱分析模型的构建程序被处理器执行如上文所述的光谱分析模型的构建方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个计算机可读存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台智能终端设备(可以是手机,计算机,终端设备,空调器,或者网络终端设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种光谱分析模型的构建方法,其特征在于,所述光谱分析模型的构建方法包括:
获取历史光谱的样本数据;
提取所述样本数据中的样本信息以及特征信息,将所述样本信息和特征信息组成样本矩阵;
根据所述样本矩阵建立预设原始模型,其中,所述预设原始模型包括若干未知预设参数;
根据所述样本矩阵按照预设规则对所述预设原始模型进行训练,得到所述未知预设参数的已知值;
将所述已知值代入所述预设原始模型中生成目标光谱分析模型;
其中,所述预设原始模型为:
Figure FDA0003906619470000011
其中,L表示建立的预设原始模型,T表示回归系数矩阵,
Figure FDA0003906619470000012
表示未含噪声的光谱矩阵,A表示未含噪声的字典,Z表示未含噪声的字典的光谱矩阵的系数,E表示光谱矩阵中的噪声,J表示辅助变量,s.t.表示约束条件,η、λ1和λ2表示所述预设原始模型的惩罚参数,W表示预设矩阵;
所述根据所述样本矩阵按照预设规则对所述预设原始模型进行训练,得到所述未知预设参数的已知值,包括:
通过拉格朗日算法将所述预设原始模型变换为第一原始模型;
将所述
Figure FDA0003906619470000013
A,Z,J以及E固定,根据所述样本矩阵对所述第一原始模型进行训练,得到T的已知值;
将所述T,A,Z,J以及E固定,根据所述样本矩阵对所述第一原始模型进行训练,得到
Figure FDA0003906619470000014
的已知值;
将所述T,
Figure FDA0003906619470000015
Z以及J固定,根据所述样本矩阵对所述第一原始模型进行训练,得到A和E的已知值;
将所述T,
Figure FDA0003906619470000021
A以及E固定,根据所述样本矩阵对所述第一原始模型进行训练,得到Z和J的已知值。
2.如权利要求1所述的光谱分析模型的构建方法,其特征在于,所述提取所述样本数据中的样本信息以及特征信息,将所述样本信息和特征信息组成样本矩阵,包括:
提取所述样本数据中的每列样本信息以及对应的光谱长度,将所述样本信息以及对应的光谱长度组成光谱矩阵;
提取所述样本数据中的光谱对应的特征,将所述特征组成特征矩阵,将所述光谱矩阵和特征矩阵组成所述样本矩阵。
3.如权利要求1所述的光谱分析模型的构建方法,其特征在于,所述未知预设参数包括回归系数矩阵、未含噪声的光谱矩阵、未含噪声的字典、所述光谱矩阵的系数、所述光谱矩阵中的噪声、辅助变量、约束条件、所述预设原始模型的惩罚参数以及预设矩阵;
其中,所述预设矩阵的对角线上的元素为第一预设值,且其他元素为第二预设值。
4.如权利要求1所述的光谱分析模型的构建方法,其特征在于,所述将所述已知值代入所述预设原始模型中生成目标光谱分析模型之后,所述方法还包括:
将拉格朗日乘子矩阵和惩罚参数进行更新,根据更新后的拉格朗日乘子矩阵和惩罚参数对所述未知预设参数的已知值进行更新。
5.如权利要求1至4中任一项所述的光谱分析模型的构建方法,其特征在于,所述将所述已知值代入所述预设原始模型中生成目标光谱分析模型之后,所述方法还包括:
获取验证样本数据,将所述验证样本数据放入所述目标光谱分析模型进行预测,得到预测结果;
通过预设公式对所述预测结果进行分析,得到误差值;
根据所述误差值对所述目标光谱分析模型进行验证。
6.一种光谱分析模型的构建装置,其特征在于,所述光谱分析模型的构建装置包括:
获取模块,用于获取历史光谱的样本数据;
组成模块,用于提取所述样本数据中的样本信息以及特征信息,将所述样本信息和特征信息组成样本矩阵;
建立模块,用于根据所述样本矩阵建立预设原始模型,其中,所述预设原始模型包括若干未知预设参数;
训练模块,用于根据所述样本矩阵按照预设规则对所述预设原始模型进行训练,得到所述未知预设参数的已知值;
生成模块,用于将所述已知值代入所述预设原始模型中生成目标光谱分析模型;
其中,所述预设原始模型为:
Figure FDA0003906619470000031
其中,L表示建立的预设原始模型,T表示回归系数矩阵,
Figure FDA0003906619470000032
表示未含噪声的光谱矩阵,A表示未含噪声的字典,Z表示未含噪声的字典的光谱矩阵的系数,E表示光谱矩阵中的噪声,J表示辅助变量,s.t.表示约束条件,η、λ1和λ2表示所述预设原始模型的惩罚参数,W表示预设矩阵;
所述训练模块,还用于通过拉格朗日算法将所述预设原始模型变换为第一原始模型;
将所述
Figure FDA0003906619470000033
A,Z,J以及E固定,根据所述样本矩阵对所述第一原始模型进行训练,得到T的已知值;
将所述T,A,Z,J以及E固定,根据所述样本矩阵对所述第一原始模型进行训练,得到
Figure FDA0003906619470000034
的已知值;
将所述T,
Figure FDA0003906619470000041
Z以及J固定,根据所述样本矩阵对所述第一原始模型进行训练,得到A和E的已知值;
将所述T,
Figure FDA0003906619470000042
A以及E固定,根据所述样本矩阵对所述第一原始模型进行训练,得到Z和J的已知值。
7.一种光谱分析模型的构建设备,其特征在于,所述光谱分析模型的构建设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的光谱分析模型的构建程序,所述光谱分析模型的构建程序配置为实现如权利要求1至5中任一项所述的光谱分析模型的构建方法的步骤。
8.一种存储介质,其特征在于,所述存储介质上存储有光谱分析模型的构建程序,所述光谱分析模型的构建程序被处理器执行时实现如权利要求1至5中任一项所述的光谱分析模型的构建方法的步骤。
CN201811440596.1A 2018-11-28 2018-11-28 光谱分析模型的构建方法、装置、设备及存储介质 Active CN109508440B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811440596.1A CN109508440B (zh) 2018-11-28 2018-11-28 光谱分析模型的构建方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811440596.1A CN109508440B (zh) 2018-11-28 2018-11-28 光谱分析模型的构建方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109508440A CN109508440A (zh) 2019-03-22
CN109508440B true CN109508440B (zh) 2023-01-03

Family

ID=65751150

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811440596.1A Active CN109508440B (zh) 2018-11-28 2018-11-28 光谱分析模型的构建方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109508440B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115479905B (zh) * 2022-11-11 2023-03-14 季华实验室 光谱分析方法、装置、终端设备及介质
CN116429709B (zh) * 2023-06-09 2023-09-12 季华实验室 光谱检测方法、装置及计算机可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6280381B1 (en) * 1999-07-22 2001-08-28 Instrumentation Metrics, Inc. Intelligent system for noninvasive blood analyte prediction
CN101915744A (zh) * 2010-07-05 2010-12-15 北京航空航天大学 物质成分含量的近红外光谱无损检测方法及装置
CN104237158A (zh) * 2014-09-04 2014-12-24 浙江科技学院 一种具有普适性的近红外光谱定性分析方法
CN104376325A (zh) * 2014-10-30 2015-02-25 中国科学院半导体研究所 一种近红外定性分析模型的建立方法
CN105067558A (zh) * 2015-07-22 2015-11-18 中国科学院半导体研究所 近红外定性鉴别特征提取方法
CN107367467A (zh) * 2017-09-22 2017-11-21 武汉轻工大学 一种物质含量定量分析方法
CN108830253A (zh) * 2018-06-27 2018-11-16 中石化西南石油工程有限公司地质录井分公司 筛选模型建立方法、光谱筛选装置及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8108328B2 (en) * 2008-07-17 2012-01-31 Tokyo Electron Limited Neural network based hermite interpolator for scatterometry parameter estimation

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6280381B1 (en) * 1999-07-22 2001-08-28 Instrumentation Metrics, Inc. Intelligent system for noninvasive blood analyte prediction
CN101915744A (zh) * 2010-07-05 2010-12-15 北京航空航天大学 物质成分含量的近红外光谱无损检测方法及装置
CN104237158A (zh) * 2014-09-04 2014-12-24 浙江科技学院 一种具有普适性的近红外光谱定性分析方法
CN104376325A (zh) * 2014-10-30 2015-02-25 中国科学院半导体研究所 一种近红外定性分析模型的建立方法
CN105067558A (zh) * 2015-07-22 2015-11-18 中国科学院半导体研究所 近红外定性鉴别特征提取方法
CN107367467A (zh) * 2017-09-22 2017-11-21 武汉轻工大学 一种物质含量定量分析方法
CN108830253A (zh) * 2018-06-27 2018-11-16 中石化西南石油工程有限公司地质录井分公司 筛选模型建立方法、光谱筛选装置及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Spectral Analysis of Large Dimensional Random Matrices;Z.D.Bai;《ResearchGate》;20100101;全文 *
红外光谱定量分析关键算法研究与应用;牟怿;《中国博士学位论文全文数据库 基础利学辑》;20170815(第08期);全文 *

Also Published As

Publication number Publication date
CN109508440A (zh) 2019-03-22

Similar Documents

Publication Publication Date Title
EP3662271B1 (en) System for determining the presence of a substance of interest in a sample
CN111259625A (zh) 意图识别方法、装置、设备及计算机可读存储介质
CN109508440B (zh) 光谱分析模型的构建方法、装置、设备及存储介质
US20200257885A1 (en) High speed reference point independent database filtering for fingerprint identification
CN114266943A (zh) 图像风格迁移方法、装置、设备及存储介质
Tang et al. Training-free referenceless camera image blur assessment via hypercomplex singular value decomposition
CN116385819A (zh) 基于神经网络模型的水质评价方法、装置以及设备
CN109492707B (zh) 光谱分析模型的构建方法、装置、设备及存储介质
CN109253981B (zh) 基于红外光谱的定量分析模型建立方法及装置
CN111125629B (zh) 一种域自适应的pls回归模型建模方法
CN110852322B (zh) 感兴趣区域的确定方法及装置
CN114739980B (zh) 元素信息的预测方法、装置、设备及介质
Yang et al. Blind image quality assessment utilising local mean eigenvalues
CN113408571B (zh) 一种基于模型蒸馏的图像分类方法、装置、存储介质及终端
CN115265806A (zh) 红外热成像测温补偿方法、装置及设备
CN114821173A (zh) 图像分类方法、装置、设备及存储介质
CN114418097A (zh) 神经网络量化处理方法、装置、电子设备及存储介质
CN114141316A (zh) 一种基于谱图分析的有机物生物毒性预测方法及系统
Lakhno et al. Development of an intelligent subsystem for operating system incidents forecasting
CN112733775A (zh) 基于深度学习的高光谱影像分类方法
Chou-Chen et al. Indirect inference for locally stationary ARMA processes with stable innovations
CN111582430A (zh) 基于萤火虫算法的参数优化方法、装置、设备及存储介质
CN114295211B (zh) 色差测量方法、装置、设备及存储介质
Khademnoe et al. On properties of percentile bootstrap confidence intervals for prediction in functional linear regression
CN115479905B (zh) 光谱分析方法、装置、终端设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant