CN109508440B

CN109508440B - 光谱分析模型的构建方法、装置、设备及存储介质

Info

Publication number: CN109508440B
Application number: CN201811440596.1A
Authority: CN
Inventors: 牟怿; 周龙; 杨超; 郭亦凡; 陈浩
Original assignee: Wuhan Polytechnic University
Current assignee: Wuhan Polytechnic University
Priority date: 2018-11-28
Filing date: 2018-11-28
Publication date: 2023-01-03
Anticipated expiration: 2038-11-28
Also published as: CN109508440A

Abstract

本发明公开了一种光谱分析模型的构建方法、装置、设备及存储介质，所述方法包括：获取历史光谱的样本数据；提取所述样本数据中的样本信息以及特征信息，将所述样本信息和特征信息组成样本矩阵；根据所述样本矩阵建立预设原始模型，其中，所述预设原始模型包括若干未知预设参数；根据所述样本矩阵按照预设规则对所述预设原始模型进行训练，得到所述未知预设参数的已知值；将所述已知值代入所述预设原始模型中生成目标光谱分析模型。本发明将噪声样本预先加入训练模型中进行训练，从而提高建模的精度。

Description

光谱分析模型的构建方法、装置、设备及存储介质

技术领域

本发明涉及光谱分析技术领域，尤其涉及一种光谱分析模型的构建方法、装置、设备及存储介质。

背景技术

目前，红外光谱的分析是化学计量学、模式识别等相关领域的研究热点，通常的方法是利用偏最小二乘回归法建立定量分析模型，但是建立的最小二乘回归模型在样本中含有噪声和异常样本时，模型的参数会受到影响，从而降低建模精度。

发明内容

本发明的主要目的在于提出一种光谱分析模型的构建方法、装置、设备及存储介质，旨在提高建模精度。

为实现上述目的，本发明提供一种光谱分析模型的构建方法，所述光谱分析模型的构建方法包括以下步骤：

获取历史光谱的样本数据；

提取所述样本数据中的样本信息以及特征信息，将所述样本信息和特征信息组成样本矩阵；

根据所述样本矩阵建立预设原始模型，其中，所述预设原始模型包括若干未知预设参数；

根据所述样本矩阵按照预设规则对所述预设原始模型进行训练，得到所述未知预设参数的已知值；

将所述已知值代入所述预设原始模型中生成目标光谱分析模型。

优选地，所述提取所述样本数据中的样本信息以及特征信息，将所述样本信息和特征信息组成样本矩阵，包括：

提取所述样本数据中的每列样本信息以及对应的光谱长度，将所述样本信息以及对应的光谱长度组成所述光谱矩阵；

提取所述样本数据中的光谱对应的特征，将所述特征组成特征矩阵，将所述光谱矩阵和特征矩阵组成所述样本矩阵。

优选地，所述未知预设参数包括回归系数矩阵、未含噪声的光谱矩阵、未含噪声的字典、所述不含噪声的字典表示所述光谱矩阵的系数，所述光谱矩阵中的噪声、辅助变量、约束条件、所述预设原始模型的惩罚参数以及预设矩阵；

其中，所述预设矩阵对角线上的元素为第一预设值，包含的其他元素为第二预设值。

优选地，所述预设原始模型为：

其中，L表示建立的预设原始模型，T表示所述回归系数矩阵，

表示所述未含噪声的光谱矩阵，A表示所述未含噪声的字典，Z表示所述不含噪声的字典表示所述光谱矩阵的系数，E表示所述光谱矩阵中的噪声，J表示所述辅助变量，s.t.表示所述约束条件，η，λ₁和λ₂表示所述预设原始模型的惩罚参数，W表示预设矩阵。

优选地，所述根据所述样本矩阵按照预设规则对所述预设原始模型进行训练，得到所述未知预设参数的已知值，包括：

通过拉格朗日算法将所述预设原始模型变换为第一原始模型：

将所述

A，Z，J以及E固定，根据所述样本矩阵对所述第一原始模型进行训练，得到T的已知值；

将所述T，A，Z，J以及E固定，根据所述样本矩阵对所述第一原始模型进行训练，得到

的已知值；

将所述T，

Z以及J固定，根据所述样本矩阵对所述第一原始模型进行训练，得到A和E的已知值；

将所述T，

A以及E固定，根据所述样本矩阵对所述第一原始模型进行训练，得到Z和J的已知值。

优选地，所述将所述已知值代入所述预设原始模型中生成目标光谱分析模型之后，所述方法还包括：

将所述拉格朗日乘子矩阵和惩罚参数进行更新，根据更新后的拉格朗日乘子矩阵和惩罚参数对所述未知预设参数的已知值进行更新。

获取验证样本数据，将所述验证样本数据放入所述目标光谱分析模型进行预测，得到预测结果；

通过预设公式对所述预测结果进行分析，得到误差值；

根据所述误差值对所述目标光谱分析模型进行验证。

此外，为实现上述目的，本发明还提出一种光谱分析模型的构建装置，所述光谱分析模型的构建装置包括：

获取模块，用于获取历史光谱的样本数据；

组成模块，用于提取所述样本数据中的样本信息以及特征信息，将所述样本信息和特征信息组成样本矩阵；

建立模块，用于根据所述样本矩阵建立预设原始模型，其中，所述预设原始模型包括若干未知预设参数；

训练模块，用于根据所述样本矩阵按照预设规则对所述预设原始模型进行训练，得到所述未知预设参数的已知值；

生成模块，用于将所述已知值代入所述预设原始模型中生成目标光谱分析模型。

此外，为实现上述目的，本发明还提出一种光谱分析模型的构建设备，所述光谱分析模型的构建设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的光谱分析模型的构建程序，所述光谱分析模型的构建程序配置为实现如上所述的光谱分析模型的构建方法的步骤。

此外，为实现上述目的，本发明还提出一种存储介质，所述存储介质上存储有光谱分析模型的构建程序，所述光谱分析模型的构建程序被处理器执行时实现如上文所述的光谱分析模型的构建方法的步骤。

本发明提出的光谱分析模型的构建方法，通过获取历史光谱的样本数据；提取所述样本数据中的样本信息以及特征信息，将所述样本信息和特征信息组成样本矩阵；根据所述样本矩阵建立预设原始模型，其中，所述预设原始模型包括若干未知预设参数；根据所述样本矩阵按照预设规则对所述预设原始模型进行训练，得到所述未知预设参数的已知值；将所述已知值代入所述预设原始模型中生成目标光谱分析模型，将噪声样本预先加入训练模型中进行训练，从而提高建模的精度。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的光谱分析模型的构建设备结构示意图；

图2为本发明光谱分析模型的构建方法第一实施例的流程示意图；

图3为本发明光谱分析模型的构建方法第二实施例的流程示意图；

图4为本发明光谱分析模型的构建方法第三实施例的流程示意图；

图5a为本发明光谱分析模型的构建方法可溶性固体分析实验结果示意图；

图5b为本发明光谱分析模型的构建方法蔗糖分析实验结果示意图；

图6为本发明光谱分析模型的构建方法石油光谱辛烷值分析实验结果示意图；

图7为本发明光谱分析模型的构建装置第一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

参照图1，图1为本发明实施例方案涉及的硬件运行环境的光谱分析模型的构建设备结构示意图。

如图1所示，该光谱分析模型的构建设备可以包括：处理器1001，例如CPU，通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如按键，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的设备结构并不构成对光谱分析模型的构建设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及光谱分析模型的构建程序。

在图1所示的光谱分析模型的构建设备中，网络接口1004主要用于连接外网，与其他网络设备进行数据通信；用户接口1003主要用于连接用户设备，与用户设备进行数据通信；本发明光谱分析模型的构建设备通过处理器1001调用存储器1005中存储的光谱分析模型的构建程序，并执行本发明实施例提供的光谱分析模型的构建的实施方法。

基于上述硬件结构，提出本发明光谱分析模型的构建方法实施例。

参照图2，图2为本发明光谱分析模型的构建方法第一实施例的流程示意图。

在第一实施例中，所述光谱分析模型的构建方法包括以下步骤：

步骤S10，获取历史光谱的样本数据。

需要说明的是，所述历史光谱为预先提供的各种光谱信息，例如红外光谱，在本实施例中，以红外光谱为例进行说明。

在具体实现中，可通过各种实验得到历史光谱数据，通过所述历史光谱数据建立光谱分析模型，实现对光谱数据的有效分析。

步骤S20，提取所述样本数据中的样本信息以及特征信息，将所述样本信息和特征信息组成样本矩阵。

需要说明的是，以X为光谱组成的矩阵，矩阵X的每一列是一个样本，光谱长度为n，则一共有m个样本，因此X是一个m*n的矩阵，在本实施例中将X作为所述样本信息，将所述光谱对应的特征作为所述特征信息，在本实施例中，可用Y进行表示，从而对样本数据进行定量分析。

步骤S30，根据所述样本矩阵建立预设原始模型，其中，所述预设原始模型包括若干未知预设参数。

在本实施例中，所述若干位置预设参包括回归系数矩阵、未含噪声的光谱矩阵、未含噪声的字典、所述不含噪声的字典表示所述光谱矩阵X的系数，所述光谱矩阵X中的噪声、辅助变量、约束条件以及所述预设原始模型的惩罚参数，还包括其他参数。

在具体实现中，所述预设原始模型为：

表示所述未含噪声的光谱矩阵，A表示所述未含噪声的字典，Z表示所述不含噪声的字典表示所述光谱矩阵的系数，E表示所述光谱矩阵中的噪声，J表示所述辅助变量，s.t.表示所述约束条件，η，λ₁和λ₂表示所述预设原始模型的惩罚参数，W表示预设矩阵，所述预设矩阵对角线上的元素为第一预设值，包含的其他元素为第二预设值。min表示求最小值，符号||A||_*表示求核范数，定义为矩阵A的奇异值之和，||J||₁表示求1范数，定义为矩阵中所有元素绝对值之和，||·||_F表示求F范数，定义为矩阵中所有元素平方和再开方。||·||_1,2表示求矩阵的1，2范数，先按照行求1范数，再求2范数，上标T表示求转置。

步骤S40，根据所述样本矩阵按照预设规则对所述预设原始模型进行训练，得到所述未知预设参数的已知值。

在具体实现中，首先将获取的光谱的样本数据随机地取出一部分作为求解上述模型的训练样本，取出数据集中的一半组成样本矩阵X，矩阵对应的特征组成矩阵Y，在本实施例中，主要是指样本中的浓度信息，还可包括其他特征信息，本实施例对此不作限制。

在本实施例中，将所述预设原始模型利用拉格朗日将所述预设原始模型进行改写变换为：

其中，所述Y₁，Y₂和Y₃分别表示拉格朗日乘子矩阵，μ₁，μ₂和μ₃分别表示惩罚参数，然后通过预设规则得到所述未知预设参数的已知值。

可以理解的是，所述预设规则可为将其中的未知预设参数进行固定，计算其他未知预设参数的值，从而获取目标光谱分析模型。

步骤S50，将所述已知值代入所述预设原始模型中生成目标光谱分析模型。

在具体实现中，将计算得到的未知预设参数代入所述预设原始模型中，从而生成精度高的目标光谱分析模型。

本实施例通过上述方案，通过获取历史光谱的样本数据；提取所述样本数据中的样本信息以及特征信息，将所述样本信息和特征信息组成样本矩阵；根据所述样本矩阵建立预设原始模型，其中，所述预设原始模型包括若干未知预设参数；根据所述样本矩阵按照预设规则对所述预设原始模型进行训练，得到所述未知预设参数的已知值；将所述已知值代入所述预设原始模型中生成目标光谱分析模型，将噪声样本预先加入训练模型中进行训练，从而提高建模的精度。

进一步地，如图3所示，基于第一实施例提出本发明光谱分析模型的构建方法第二实施例，在本实施例中，所述步骤S20，包括：

步骤S201，提取所述样本数据中的每列样本信息以及对应的光谱长度，将所述样本信息以及对应的光谱长度组成所述光谱矩阵。

需要说明的是，以X为光谱组成的矩阵，矩阵X的每一列是一个样本，光谱长度为n，则一共有m个样本，因此X是一个m*n的矩阵，在本实施例中将X作为所述光谱矩阵。

步骤S202，提取所述样本数据中的光谱对应的特征，将所述特征组成特征矩阵，将所述光谱矩阵和特征矩阵组成所述样本矩阵。

可以理解的是，将所述光谱对应的特征作为所述特征信息，在本实施例中，可用Y进行表示，从而对样本数据进行定量分析，通过X和Y组成的样本矩阵实现对所述预设原始模型进行训练。

进一步地，所述步骤S40，包括：

通过拉格朗日算法将所述预设原始模型变换为第一原始模型，所述第一原始模型为变形后的公式二。

将所述

A，Z，J以及E固定，根据所述样本矩阵对所述第一原始模型进行训练，得到T的已知值。

在具体实现中，将所述

A，Z，J以及E固定，得到:

其中，γI表示调整值，γ表示正系数，I表示单位矩阵，在本实施例中通过加上γI避免不可逆的情况，从而提高模型的精确度。

的已知值。

在具体实现中，将所述T，A，Z，J以及E固定，得到:

其中，上标－1表示矩阵的逆矩阵；

将所述T，

Z以及J固定，根据所述样本矩阵对所述第一原始模型进行训练，得到A和E的已知值。

在具体实现中，将所述T，

Z以及J固定，得到:

其中，D表示奇异值阈值算子，β_A＝(μ₁+μ₂)/2，

其中，所述ξ_k表示矩阵X^k-A^kZ^k-Y₁ ^k/μ₁ ^k＝[ξ₁,ξ₂,…,ξ_n]的第k列；

将所述T，

在具体实现中，将所述T，

A以及E固定，得到:

J^k+1＝max(Q^k+1,0)公式八；

其中，β_Z＝(μ₁+μ₂+μ₃)/2，

所述S表示收缩算子。

进一步地，所述步骤S40之后，所述方法还包括：

步骤S401，将所述拉格朗日乘子矩阵和惩罚参数进行更新，根据更新后的拉格朗日乘子矩阵和惩罚参数对所述未知预设参数的已知值进行更新。

在具体实现中，将所述Y₁，Y₂和Y₃分别表示拉格朗日乘子矩阵，μ₁，μ₂和μ₃分别表示惩罚参数按照以下方式更新：

其中，所述ρ表示求谱范数。

本实施例提供的方案，通过固定其中的预设未知参数，求出其他参数的表达式，将所述表达式通过X和Y以及其他已知参数进行求解，从而实现模型的快速求解，提高系统的运行速率。

进一步地，如图4所示，基于第一实施例或第二实施例提出本发明光谱分析模型的构建方法第三实施例，在本实施例中，基于第一实施例进行说明，所述步骤S50之后，所述方法包括：

步骤S501，获取验证样本数据，将所述验证样本数据放入所述目标光谱分析模型进行预测，得到预测结果。

步骤S502，通过预设公式对所述预测结果进行分析，得到误差值。

需要说明的是，所述预设公式为：

其中，所述N表示验证样本数量，所述i表示当前样本，所述y_i表示当前样本的实际值，所述

表示当前样本的预测值。

步骤S503，根据所述误差值对所述目标光谱分析模型进行验证。

在具体实现中，下面通过具体实施方式对本发明做进一步说明。

实施例1：糖光谱分析，光谱集包含1797个样本，从中随机选出898个作为训练样本，剩下的899个样本作为测试样本。分析的特征是可溶性固体和蔗糖含量，实验重复十次，原始的偏最小二乘回归的误差与本方法的误差如图5a，5b所示，如图5a表示可溶性固体分析结果，其中，横坐标表示实编号，纵坐标表示误差，如图5b表示蔗糖分析结果，其中，横坐标表示实编号，纵坐标表示误差，从而得出本实施例建立的光谱分析模型相比较偏最小二乘回归的分析结果精确度较高。

实施例2：石油光谱辛烷值分析，包含39个光谱，取19个作为训练样本，剩余20个作为测试样本，实验重复十次，将原始的偏最小二乘回归的误差与本方法的误差如图6所示，图6表示辛烷值分析结果，横坐标表示实编号，纵坐标表示误差，从而得出本实施例建立的光谱分析模型相比较偏最小二乘回归的分析结果精确度较高。

本实施例提供的方案，主要通过获取验证样本数据，将所述验证样本数据放入所述目标光谱分析模型进行预测，得到预测结果，通过预设公式对所述预测结果进行分析，得到误差值，根据所述误差值对所述目标光谱分析模型进行验证，并根据实验数据得出本实施例建立的光谱分析模型相比较偏最小二乘回归的分析结果精确度较高。

本发明进一步提供一种光谱分析模型的构建装置。

参照图7，图7为本发明光谱分析模型的构建装置第一实施例的功能模块示意图。

本发明光谱分析模型的构建装置第一实施例中，该光谱分析模型的构建装置包括：

获取模块10，用于获取历史光谱的样本数据。

组成模块20，用于提取所述样本数据中的样本信息以及特征信息，将所述样本信息和特征信息组成样本矩阵。

建立模块30，用于根据所述样本矩阵建立预设原始模型，其中，所述预设原始模型包括若干未知预设参数。

在具体实现中，所述预设原始模型为：

训练模块40，用于根据所述样本矩阵按照预设规则对所述预设原始模型进行训练，得到所述未知预设参数的已知值。

生成模块50，用于将所述已知值代入所述预设原始模型中生成目标光谱分析模型。

此外，为实现上述目的，本发明还提出一种光谱分析模型的构建设备，所述光谱分析模型的构建设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的光谱分析模型的构建程序，所述光谱分析模型的构建程序配置为实现如上文所述的光谱分析模型的构建方法的步骤。

此外，本发明实施例还提出一种存储介质，所述存储介质上存储有光谱分析模型的构建程序，所述光谱分析模型的构建程序被处理器执行如上文所述的光谱分析模型的构建方法的步骤。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个计算机可读存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台智能终端设备(可以是手机，计算机，终端设备，空调器，或者网络终端设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。