CN109492707A - 光谱分析模型的构建方法、装置、设备及存储介质 - Google Patents
光谱分析模型的构建方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN109492707A CN109492707A CN201811440483.1A CN201811440483A CN109492707A CN 109492707 A CN109492707 A CN 109492707A CN 201811440483 A CN201811440483 A CN 201811440483A CN 109492707 A CN109492707 A CN 109492707A
- Authority
- CN
- China
- Prior art keywords
- data set
- default
- reference parameter
- set reference
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010183 spectrum analysis Methods 0.000 title claims abstract description 105
- 238000010276 construction Methods 0.000 title claims abstract description 54
- 230000003287 optical effect Effects 0.000 claims abstract description 35
- 238000001228 spectrum Methods 0.000 claims abstract description 26
- 239000000284 extract Substances 0.000 claims abstract description 14
- 238000000034 method Methods 0.000 claims description 36
- 230000017105 transposition Effects 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 6
- 241000208340 Araliaceae Species 0.000 claims description 5
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 5
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 5
- 235000008434 ginseng Nutrition 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 230000003595 spectral effect Effects 0.000 description 8
- 238000004566 IR spectroscopy Methods 0.000 description 7
- 238000004611 spectroscopical analysis Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000010238 partial least squares regression Methods 0.000 description 4
- 235000013339 cereals Nutrition 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 235000020095 red wine Nutrition 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Pathology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Artificial Intelligence (AREA)
- Immunology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种光谱分析模型的构建方法、装置、设备及存储介质,所述方法包括:获取历史光谱的样本数据中的样本信息以及特征信息中提取第一数据集参考参数和第二数据集参考参数;获取预设轴向量信息,根据所述预设轴向量信息、第一数据集参考参数以及第二数据集参考参数建立预设原始模型;根据拉格朗日算法对所述预设原始模型中的各个参数进行计算,得到对应的主成分信息;根据所述主成分信息建立预设回归模型,并进行计算,得到目标光谱分析模型。本发明通过预设模型获取样本数据中的主成分数据,通过主成分数据对所述预设回归模型进行计算,得到目标光谱分析模型,从而降低噪声和异常样本对模型的影响,达到提高模型精度的目的。
Description
技术领域
本发明涉及光谱分析技术领域,尤其涉及一种光谱分析模型的构建方法、装置、设备及存储介质。
背景技术
目前,红外光谱的分析是化学计量学、模式识别等相关领域的研究热点,通常的方法是利用偏最小二乘回归法建立定量分析模型,但是建立的最小二乘回归模型在样本中含有噪声和异常样本时,模型的参数会受到影响,从而降低建模精度。
发明内容
本发明的主要目的在于提出一种光谱分析模型的构建方法、装置、设备及存储介质,旨在提高建模精度。
为实现上述目的,本发明提供一种光谱分析模型的构建方法,所述光谱分析模型的构建方法包括以下步骤:
获取历史光谱的样本数据,提取所述样本数据中的样本信息以及特征信息;
从所述样本信息中提取第一数据集参考参数,且从所述特征信息中提取第二数据集参考参数;
获取预设轴向量信息,根据所述预设轴向量信息、第一数据集参考参数以及第二数据集参考参数建立预设原始模型;
根据拉格朗日算法对所述预设原始模型中的各个参数进行计算,得到所述第一数据集参考参数以及第二数据集参考参数对应的主成分信息;
根据所述主成分信息建立预设回归模型,将所述第一数据集参考参数以及第二数据集参考参数放入所述预设回归模型进行计算,得到目标光谱分析模型。
优选地,所述预设轴向量信息包括第一轴方向向量信息和第二轴方向向量信息;
所述获取预设轴向量信息,根据所述预设轴向量信息、第一数据集参考参数以及第二数据集参考参数建立预设原始模型,包括:
获取约束条件,其中,所述约束条件包括所述第一轴方向向量信息和第二轴方向向量信息的第一预设范数;
通过所述第一轴方向向量信息的转置、第一数据集参考参数的转置、第二数据集参考参数、第二轴方向向量信息以及约束条件建立预设原始模型。
优选地,所述根据拉格朗日算法对所述预设原始模型中的各个参数进行计算,得到所述第一数据集参考参数以及第二数据集参考参数对应的主成分信息之前,所述方法还包括:
获取惩罚参数,根据所述惩罚参数、第一轴方向向量信息的转置、第一数据集参考参数的转置、第二数据集参考参数、第二轴方向向量信息以及第二轴方向向量信息的转置将所述预设原始模型转换为拉格朗日函数模型;
通过所述拉格朗日函数模型对所述预设原始模型进行更新。
优选地,所述根据拉格朗日算法对所述预设原始模型中的各个参数进行计算,得到所述第一数据集参考参数以及第二数据集参考参数对应的主成分信息,包括:
根据拉格朗日算法对更新后的拉格朗日函数模型中的各个参数进行求偏导数处理;
对所述第一轴方向向量信息、第一数据集参考参数、第二数据集参考参数以及第二轴方向向量信息进行优化处理,得到惩罚参数与第一轴方向向量信息、第一数据集参考参数、第二数据集参考参数以及第二轴方向向量信息的对应关系;
根据所述对应关系得到第一轴方向向量信息的主成分信息以及第二轴方向向量信息的主成分信息。
优选地,所述根据所述主成分信息建立预设回归模型,将所述第一数据集参考参数以及第二数据集参考参数放入所述预设回归模型进行计算,得到目标光谱分析模型,包括:
获取第一回归系数向量,所述第一回归系数向量的第二预设范数以及调整参数;
根据所述第一回归系数向量,所述第一回归系数向量的第二预设范数、调整参数以及第一轴方向向量信息的主成分信息建立第一轴方向的预设回归模型;
获取第二回归系数向量,所述第二回归系数向量的第三预设范数;
根据所述第二回归系数向量,所述第二回归系数向量的第三预设范数、调整参数以及第二轴方向向量信息的主成分信息建立第二轴方向的预设回归模型;
将所述第一数据集参考参数以及第二数据集参考参数分别放入对应的第一轴方向的预设回归模型和第二轴方向的预设回归模型进行计算,得到目标光谱分析模型。
优选地,所述将所述第一数据集参考参数以及第二数据集参考参数分别放入对应的第一轴方向的预设回归模型和第二轴方向的预设回归模型进行计算,得到目标光谱分析模型,包括:
将所述第一数据集参考参数放入对应的第一轴方向的预设回归模型进行计算,通过第一预设公式得到所述第一回归系数向量的已知值;
将所述第二数据集参考参数放入对应的第二轴方向的预设回归模型进行计算,通过第二预设公式得到所述第二回归系数向量的已知值;
获取残差参数,通过所述残差参数和所述第一回归系数向量的已知值、第二回归系数向量的已知值进行计算,得到目标光谱分析模型。
优选地,所述根据所述主成分信息建立预设回归模型,将所述第一数据集参考参数以及第二数据集参考参数放入所述预设回归模型进行计算,得到目标光谱分析模型之后,所述方法还包括:
获取验证样本数据,将所述验证样本数据放入所述目标光谱分析模型进行预测,得到预测结果;
通过第三预设公式对所述预测结果进行分析,得到误差值;
根据所述误差值对所述目标光谱分析模型进行验证。
此外,为实现上述目的,本发明还提出一种光谱分析模型的构建装置,所述光谱分析模型的构建装置包括:
获取模块,用于获取历史光谱的样本数据,提取所述样本数据中的样本信息以及特征信息;
提取模块,用于从所述样本信息中提取第一数据集参考参数,且从所述特征信息中提取第二数据集参考参数;
建立模块,用于获取预设轴向量信息,根据所述预设轴向量信息、第一数据集参考参数以及第二数据集参考参数建立预设原始模型;
计算模块,用于根据拉格朗日算法对所述预设原始模型中的各个参数进行计算,得到所述第一数据集参考参数以及第二数据集参考参数对应的主成分信息;
生成模块,用于根据所述主成分信息建立预设回归模型,将所述第一数据集参考参数以及第二数据集参考参数放入所述预设回归模型进行计算,得到目标光谱分析模型。
此外,为实现上述目的,本发明还提出一种光谱分析模型的构建设备,所述光谱分析模型的构建设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的光谱分析模型的构建程序,所述光谱分析模型的构建程序配置为实现如上所述的光谱分析模型的构建方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有光谱分析模型的构建程序,所述光谱分析模型的构建程序被处理器执行时实现如上文所述的光谱分析模型的构建方法的步骤。
本发明提出的光谱分析模型的构建方法,通过获取历史光谱的样本数据,提取所述样本数据中的样本信息以及特征信息;从所述样本信息中提取第一数据集参考参数,且从所述特征信息中提取第二数据集参考参数;获取预设轴向量信息,根据所述预设轴向量信息、第一数据集参考参数以及第二数据集参考参数建立预设原始模型;根据拉格朗日算法对所述预设原始模型中的各个参数进行计算,得到所述第一数据集参考参数以及第二数据集参考参数对应的主成分信息;根据所述主成分信息建立预设回归模型,将所述第一数据集参考参数以及第二数据集参考参数放入所述预设回归模型进行计算,得到目标光谱分析模型,从而通过预设模型获取样本数据中的主成分数据,通过主成分数据对所述预设回归模型进行计算,得到目标光谱分析模型,从而降低噪声和异常样本对模型的影响,达到提高模型精度的目的。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的光谱分析模型的构建设备结构示意图;
图2为本发明光谱分析模型的构建方法第一实施例的流程示意图;
图3为本发明光谱分析模型的构建方法第二实施例的流程示意图;
图4为本发明光谱分析模型的构建方法第三实施例的流程示意图;
图5为本发明光谱分析模型的构建方法谷物光谱的分析实验结果对比示意图;
图6为本发明光谱分析模型的构建方法红酒光谱分析实验结果对比示意图;
图7为本发明光谱分析模型的构建装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的光谱分析模型的构建设备结构示意图。
如图1所示,该光谱分析模型的构建设备可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如按键,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的设备结构并不构成对光谱分析模型的构建设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及光谱分析模型的构建程序。
在图1所示的光谱分析模型的构建设备中,网络接口1004主要用于连接外网,与其他网络设备进行数据通信;用户接口1003主要用于连接用户设备,与用户设备进行数据通信;本发明设备通过处理器1001调用存储器1005中存储的光谱分析模型的构建程序,并执行本发明实施例提供的光谱分析模型的构建的实施方法。
基于上述硬件结构,提出本发明光谱分析模型的构建方法实施例。
参照图2,图2为本发明光谱分析模型的构建方法第一实施例的流程示意图。
在第一实施例中,所述光谱分析模型的构建方法包括以下步骤:
步骤S10,获取历史光谱的样本数据,提取所述样本数据中的样本信息以及特征信息。
需要说明的是,所述历史光谱为预先提供的各种光谱信息,例如红外光谱,在本实施例中,以红外光谱为例进行说明,在本实施例中,可通过各种实验得到历史光谱数据,通过所述历史光谱数据中的样本信息以及对应的特征信息建立光谱分析模型,实现对光谱数据的有效分析。
步骤S20,从所述样本信息中提取第一数据集参考参数,且从所述特征信息中提取第二数据集参考参数。
可以理解的是,所述第一数据集参考参数为数据集E0光谱数据,所述第二数据集参考参数为红外光谱对应的特征信息,即用F0表示。
在具体实现中,所述第一数据集参考参数E0和第二数据集参考参数F0为假设的两个数据集,作为未知参数进行引入,通过预设模型进行计算保证分别提取的两者的主成分并保证两者的主成分之间的相关性最大。
步骤S30,获取预设轴向量信息,根据所述预设轴向量信息、第一数据集参考参数以及第二数据集参考参数建立预设原始模型。
需要说明的是,所述预设原始模型为根据凸优化理论建立的模型,表示如下:
其中,w1表示第一轴方向向量信息,c1表示第二轴方向向量信息,max表示求最大值,和分别表示求向量w1和c1的2范数,数据集E0第一数集参考参数,F0表示第二数据集参考参数,s.t.表示约束条件,上标T表示求转置。
步骤S40,根据拉格朗日算法对所述预设原始模型中的各个参数进行计算,得到所述第一数据集参考参数以及第二数据集参考参数对应的主成分信息。
在具体实现中,在一般情况下,可通过拉格朗日算法进行求极值将所述原始模型转换为拉格朗日函数,然后将所述第一数据集参考参数以及第二数据集参考参数代入所述拉格朗日函数中计算,得到所述第一数据集参考参数以及第二数据集参考参数对应的主成分信息。
需要说明的是,首先从历史光谱信息中抽取一部分作为假设的第一数据集参考参数以及第二数据集参考参数,设为历史光谱信息中的主成分信息,然后通过拉格朗日函数进行求极值的方法,得到第一数据集参考参数以及第二数据集参考参数中的目标主成分信息,从而通过历史光谱信息中的有效数据进行模型的建立,从而提高光谱分析模型的精确度。
步骤S50,根据所述主成分信息建立预设回归模型,将所述第一数据集参考参数以及第二数据集参考参数放入所述预设回归模型进行计算,得到目标光谱分析模型。
本实施例通过上述方案,通过获取历史光谱的样本数据,提取所述样本数据中的样本信息以及特征信息;从所述样本信息中提取第一数据集参考参数,且从所述特征信息中提取第二数据集参考参数;获取预设轴向量信息,根据所述预设轴向量信息、第一数据集参考参数以及第二数据集参考参数建立预设原始模型;根据拉格朗日算法对所述预设原始模型中的各个参数进行计算,得到所述第一数据集参考参数以及第二数据集参考参数对应的主成分信息;根据所述主成分信息建立预设回归模型,将所述第一数据集参考参数以及第二数据集参考参数放入所述预设回归模型进行计算,得到目标光谱分析模型,从而通过预设模型获取样本数据中的主成分数据,通过主成分数据对所述预设回归模型进行计算,得到目标光谱分析模型,从而降低噪声和异常样本对模型的影响,达到提高模型精度的目的。
进一步地,如图3所示,基于第一实施例提出本发明光谱分析模型的构建方法第二实施例,在本实施例中,所述所述预设轴向量信息包括第一轴方向向量信息和第二轴方向向量信息;
所述步骤S30,包括:
步骤S301,获取约束条件,其中,所述约束条件包括所述第一轴方向向量信息和第二轴方向向量信息的第一预设范数。
需要说明的是,所述第一预设范数为2的范数,所述第一轴方向向量信息为w1,所述第二轴方向向量信息为c1,通过约束条件可对第一轴方向向量信息和第二轴方向向量信息进行限制,从而保证数据的准确性。
步骤S302,通过所述第一轴方向向量信息的转置、第一数据集参考参数的转置、第二数据集参考参数、第二轴方向向量信息以及约束条件建立预设原始模型。
需要说明的是,所述第一轴方向向量信息的转置可表示为第一数据集参考参数的转置可表示为以及第二数据集参考参数F0、第二轴方向向量信息c1,从而根据第一轴方向向量信息的转置、第一数据集参考参数的转置、第二数据集参考参数、第二轴方向向量信息以及约束条件建立预设原始模型。
进一步地,所述步骤S40之前,所述方法还包括:
步骤S401,获取惩罚参数,根据所述惩罚参数、第一轴方向向量信息的转置、第一数据集参考参数的转置、第二数据集参考参数、第二轴方向向量信息以及第二轴方向向量信息的转置将所述预设原始模型转换为拉格朗日函数模型。
需要说明的是,所述惩罚参数包括第一惩罚参数和第二惩罚参数,根据所述惩罚参数建立拉格朗日函数模型,所述第一惩罚参数可表示为λ1,所述第二惩罚参数可表示为λ2,根据所述惩罚参数、第一轴方向向量信息的转置、第一数据集参考参数的转置、第二数据集参考参数、第二轴方向向量信息以及第二轴方向向量信息的转置将所述预设原始模型转换为拉格朗日函数模型,其中,所述拉格朗日函数模型为:
步骤S402,通过所述拉格朗日函数模型对所述预设原始模型进行更新。
将所述预设原始模型转换为所述拉格朗日函数模型,从而通过所述拉格朗日函数模型对所述预设原始模型进行更新,根据更新后的拉格朗日函数模型计算出方向向量信息中的主成分信息。
在本实施例中,所述步骤S40,包括:
根据拉格朗日算法对更新后的拉格朗日函数模型中的各个参数进行求偏导数处理。
在具体实现中,分别对各个参数求偏导数得到:
对所述第一轴方向向量信息、第一数据集参考参数、第二数据集参考参数以及第二轴方向向量信息进行优化处理,得到惩罚参数与第一轴方向向量信息、第一数据集参考参数、第二数据集参考参数以及第二轴方向向量信息的对应关系。
根据上式可知,2λ1=2λ2=w′1E'0F0c1=<E0w1,F0c1>,可记为:
θ1=2λ1=2λ2=w′1E'0F0c1;则
E'0F0c1=θ1w1
E'0F0F′0E0w1=θ1 2w1
F′0E0w1=θ1c1
F′0E0E'0F0c1=θ1 2c1;
根据所述对应关系得到第一轴方向向量信息的主成分信息以及第二轴方向向量信息的主成分信息。
需要说明的是,所述主成分信息包括第一轴方向向量信息的主成分信息以及第二轴方向向量信息的主成分信息,在本实施例中,将第一轴方向向量信息的主成分信息表示为t1以及第二轴方向向量信息的主成分信息表示为u1,由线性代数中特征值和特征向量的定义式可知w1是矩阵的特征向量,c1是矩阵的特征向量,由w1和c1得到主成分:t1=E0w1,u1=F0c1。
本实施例提供的方案,通过所述拉格朗日函数模型对所述预设原始模型进行更新,从而通过拉格朗日函数模型进行极值计算,得到第一轴方向向量信息以及第二轴方向向量信息的主成分信息,从而通过主成分信息建立光谱分析模型,提高光谱分析模型的准确性。
进一步地,如图4所示,基于第二实施例提出本发明光谱分析模型的构建方法第三实施例,所述步骤S50,包括:
步骤S501,获取第一回归系数向量,所述第一回归系数向量的第二预设范数以及调整参数。
需要说明的是,所述第一回归系数向量包括第一轴方向上的回归系数向量p1,所述第二预设范围为0.5范数,所述调整参数为λ,在本实施例中,通过向量的0.5范数作为正则化项,从而可抑制小样本问题。
步骤S502,根据所述第一回归系数向量,所述第一回归系数向量的第二预设范数、调整参数以及第一轴方向向量信息的主成分信息建立第一轴方向的预设回归模型。
在具体实现中,根据所述第一回归系数向量表示为p1,p′1表示p1的导数,所述第一回归系数向量的第二预设范数表示为调整参数表示为λ以及第一轴方向向量信息的主成分信息表示为t1建立第一轴方向的预设回归模型为:
步骤S503,获取第二回归系数向量,所述第二回归系数向量的第三预设范数。
需要说明的是,所述第二轴方向上的回归系数向量表示为q1,所述第三预设范围为0.5范数。
步骤S504,根据所述第二回归系数向量,所述第二回归系数向量的第三预设范数、调整参数以及第二轴方向向量信息的主成分信息建立第二轴方向的预设回归模型。
在具体实现中,根据所述第二回归系数向量表示为q1,q′1表示q1的导数,所述第二回归系数向量的第二预设范数表示为调整参数表示为λ以及第二轴方向向量信息的主成分信息u1建立第二轴方向的预设回归模型为:
步骤S505,将所述第一数据集参考参数以及第二数据集参考参数分别放入对应的第一轴方向的预设回归模型和第二轴方向的预设回归模型进行计算,得到目标光谱分析模型。
可以理解的是,将所述第一数据集参考参数放入对应的第一轴方向的预设回归模型进行计算时,若则定义为:
对于上述的回归模型中的p1,其值按照下列方式进行计算:
p1=Hλμ,0.5(Bμ(p1)) 公式一;
其中的μ是一个正数,阈值函数Hλμ,0.5(·)定义为:
其中,
Bμ(p1)=p1+μtT(E0-tp1') 公式四;
q1的计算则重复上面的步骤进行,从而得到目标光谱分析模型。
在本实施例中,在进行计算求解时,由于通过阈值函数对回归模型的回归系数向量进行计算,从而通过阈值法可达到快速求解的目的,提高系统处理效率。
进一步地,步骤S505,包括:
将所述第一数据集参考参数放入对应的第一轴方向的预设回归模型进行计算,通过第一预设公式得到所述第一回归系数向量的已知值。
需要说明的是,所述第一预设公式为公式一、公式二、公式三以及公式四,通过所述公式一、公式二、公式三以及公式四得到所述第一回归系数向量p1的已知值。
将所述第二数据集参考参数放入对应的第二轴方向的预设回归模型进行计算,通过第二预设公式得到所述第二回归系数向量的已知值。
根据上述公式进行相应的计算,得到所述第二回归系数向量q1的已知值。
获取残差参数,通过所述残差参数和所述第一回归系数向量的已知值、第二回归系数向量的已知值进行计算,得到目标光谱分析模型。
需要说明的是,所述残差参数包括对应于E0的残差参数E1,以及对应于F0的残差参数F1。
在具体实现中,根据公式:
利用残差矩阵E1,F1分别取代E0,F0,求第二个轴w2,c2,得到第二个主成分t2,u2如此迭代下去,则:
由于t1,t2…tA可以表示为矩阵E0中列向量的线性组合,以上等式可以表示为关于的回归方程形式,即从而得到目标光谱分析模型。
进一步地,步骤S50之后,所述方法还包括:
获取验证样本数据,将所述验证样本数据放入所述目标光谱分析模型进行预测,得到预测结果。
通过第三预设公式对所述预测结果进行分析,得到误差值。
需要说明的是,所述第三预设公式为:
其中,所述N表示验证样本数量,所述i表示当前样本,所述yi表示当前样本的实际值,所述表示当前样本的预测值。
根据所述误差值对所述目标光谱分析模型进行验证。
在具体实现中,下面通过具体实施方式对本发明做进一步说明。
实施例1:对谷物光谱的分析,谷物光谱包含80个样本,从中随机选出40个作为训练样本,剩下的40个样本作为测试样本,通过所述第三预设公式进行误差的计算,实验重复十次,将原始的偏最小二乘回归的误差与本方法的误差结果如图5所示;
实施例2:红酒光谱分析,分析指标是pH值,包含44个光谱,取22个作为训练样本,剩余22个作为测试样本通过所述第三预设公式进行误差的计算,实验重复十次,将原始的偏最小二乘回归的误差与本方法的误差结果如图6所示。
本实施例提供的方案,主要通过获取验证样本数据,将所述验证样本数据放入所述目标光谱分析模型进行预测,得到预测结果,通过预设公式对所述预测结果进行分析,得到误差值,根据所述误差值对所述目标光谱分析模型进行验证,并根据实验数据得出本实施例建立的光谱分析模型相比较偏最小二乘回归的分析结果精确度较高。
本发明进一步提供一种光谱分析模型的构建装置。
参照图7,图7为本发明光谱分析模型的构建装置第一实施例的功能模块示意图。
本发明光谱分析模型的构建装置第一实施例中,该光谱分析模型的构建装置包括:
获取模块10,用于获取历史光谱的样本数据,提取所述样本数据中的样本信息以及特征信息。
需要说明的是,所述历史光谱为预先提供的各种光谱信息,例如红外光谱,在本实施例中,以红外光谱为例进行说明,在本实施例中,可通过各种实验得到历史光谱数据,通过所述历史光谱数据中的样本信息以及对应的特征信息建立光谱分析模型,实现对光谱数据的有效分析。
提取模块20,用于从所述样本信息中提取第一数据集参考参数,且从所述特征信息中提取第二数据集参考参数。
可以理解的是,所述第一数据集参考参数为数据集E0光谱数据,所述第二数据集参考参数为红外光谱对应的特征信息,即用F0表示。
在具体实现中,所述第一数据集参考参数E0和第二数据集参考参数F0为假设的两个数据集,作为未知参数进行引入,通过预设模型进行计算保证分别提取的两者的主成分并保证两者的主成分之间的相关性最大。
建立模块30,用于获取预设轴向量信息,根据所述预设轴向量信息、第一数据集参考参数以及第二数据集参考参数建立预设原始模型。
需要说明的是,所述预设原始模型为根据凸优化理论建立的模型,表示如下:
其中,w1表示第一轴方向向量信息,c1表示第二轴方向向量信息,max表示求最大值,和分别表示求向量w1和c1的2范数,数据集E0第一数集参考参数,F0表示第二数据集参考参数,s.t.表示约束条件,上标T表示求转置。
计算模块40,用于根据拉格朗日算法对所述预设原始模型中的各个参数进行计算,得到所述第一数据集参考参数以及第二数据集参考参数对应的主成分信息。
在具体实现中,在一般情况下,可通过拉格朗日算法进行求极值将所述原始模型转换为拉格朗日函数,然后将所述第一数据集参考参数以及第二数据集参考参数代入所述拉格朗日函数中计算,得到所述第一数据集参考参数以及第二数据集参考参数对应的主成分信息。
需要说明的是,首先从历史光谱信息中抽取一部分作为假设的第一数据集参考参数以及第二数据集参考参数,设为历史光谱信息中的主成分信息,然后通过拉格朗日函数进行求极值的方法,得到第一数据集参考参数以及第二数据集参考参数中的目标主成分信息,从而通过历史光谱信息中的有效数据进行模型的建立,从而提高光谱分析模型的精确度。
生成模块50,用于根据所述主成分信息建立预设回归模型,将所述第一数据集参考参数以及第二数据集参考参数放入所述预设回归模型进行计算,得到目标光谱分析模型。
本实施例通过上述方案,通过获取历史光谱的样本数据,提取所述样本数据中的样本信息以及特征信息;从所述样本信息中提取第一数据集参考参数,且从所述特征信息中提取第二数据集参考参数;获取预设轴向量信息,根据所述预设轴向量信息、第一数据集参考参数以及第二数据集参考参数建立预设原始模型;根据拉格朗日算法对所述预设原始模型中的各个参数进行计算,得到所述第一数据集参考参数以及第二数据集参考参数对应的主成分信息;根据所述主成分信息建立预设回归模型,将所述第一数据集参考参数以及第二数据集参考参数放入所述预设回归模型进行计算,得到目标光谱分析模型,从而通过预设模型获取样本数据中的主成分数据,通过主成分数据对所述预设回归模型进行计算,得到目标光谱分析模型,从而降低噪声和异常样本对模型的影响,达到提高模型精度的目的。
此外,为实现上述目的,本发明还提出一种光谱分析模型的构建设备,所述光谱分析模型的构建设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的光谱分析模型的构建程序,所述光谱分析模型的构建程序配置为实现如上文所述的光谱分析模型的构建方法的步骤。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有光谱分析模型的构建程序,所述光谱分析模型的构建程序被处理器执行如上文所述的光谱分析模型的构建方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个计算机可读存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台智能终端设备(可以是手机,计算机,终端设备,空调器,或者网络终端设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种光谱分析模型的构建方法,其特征在于,所述光谱分析模型的构建方法包括:
获取历史光谱的样本数据,提取所述样本数据中的样本信息以及特征信息;
从所述样本信息中提取第一数据集参考参数,且从所述特征信息中提取第二数据集参考参数;
获取预设轴向量信息,根据所述预设轴向量信息、第一数据集参考参数以及第二数据集参考参数建立预设原始模型;
根据拉格朗日算法对所述预设原始模型中的各个参数进行计算,得到所述第一数据集参考参数以及第二数据集参考参数对应的主成分信息;
根据所述主成分信息建立预设回归模型,将所述第一数据集参考参数以及第二数据集参考参数放入所述预设回归模型进行计算,得到目标光谱分析模型。
2.如权利要求1所述的光谱分析模型的构建方法,其特征在于,所述预设轴向量信息包括第一轴方向向量信息和第二轴方向向量信息;
所述获取预设轴向量信息,根据所述预设轴向量信息、第一数据集参考参数以及第二数据集参考参数建立预设原始模型,包括:
获取约束条件,其中,所述约束条件包括所述第一轴方向向量信息和第二轴方向向量信息的第一预设范数;
通过所述第一轴方向向量信息的转置、第一数据集参考参数的转置、第二数据集参考参数、第二轴方向向量信息以及约束条件建立预设原始模型。
3.如权利要求1所述的光谱分析模型的构建方法,其特征在于,所述根据拉格朗日算法对所述预设原始模型中的各个参数进行计算,得到所述第一数据集参考参数以及第二数据集参考参数对应的主成分信息之前,所述方法还包括:
获取惩罚参数,根据所述惩罚参数、第一轴方向向量信息的转置、第一数据集参考参数的转置、第二数据集参考参数、第二轴方向向量信息以及第二轴方向向量信息的转置将所述预设原始模型转换为拉格朗日函数模型;
通过所述拉格朗日函数模型对所述预设原始模型进行更新。
4.如权利要求3所述的光谱分析模型的构建方法,其特征在于,所述根据拉格朗日算法对所述预设原始模型中的各个参数进行计算,得到所述第一数据集参考参数以及第二数据集参考参数对应的主成分信息,包括:
根据拉格朗日算法对更新后的拉格朗日函数模型中的各个参数进行求偏导数处理;
对所述第一轴方向向量信息、第一数据集参考参数、第二数据集参考参数以及第二轴方向向量信息进行优化处理,得到惩罚参数与第一轴方向向量信息、第一数据集参考参数、第二数据集参考参数以及第二轴方向向量信息的对应关系;
根据所述对应关系得到第一轴方向向量信息的主成分信息以及第二轴方向向量信息的主成分信息。
5.如权利要求4所述的光谱分析模型的构建方法,其特征在于,所述根据所述主成分信息建立预设回归模型,将所述第一数据集参考参数以及第二数据集参考参数放入所述预设回归模型进行计算,得到目标光谱分析模型,包括:
获取第一回归系数向量,所述第一回归系数向量的第二预设范数以及调整参数;
根据所述第一回归系数向量,所述第一回归系数向量的第二预设范数、调整参数以及第一轴方向向量信息的主成分信息建立第一轴方向的预设回归模型;
获取第二回归系数向量,所述第二回归系数向量的第三预设范数;
根据所述第二回归系数向量,所述第二回归系数向量的第三预设范数、调整参数以及第二轴方向向量信息的主成分信息建立第二轴方向的预设回归模型;
将所述第一数据集参考参数以及第二数据集参考参数分别放入对应的第一轴方向的预设回归模型和第二轴方向的预设回归模型进行计算,得到目标光谱分析模型。
6.如权利要求5所述的光谱分析模型的构建方法,其特征在于,所述将所述第一数据集参考参数以及第二数据集参考参数分别放入对应的第一轴方向的预设回归模型和第二轴方向的预设回归模型进行计算,得到目标光谱分析模型,包括:
将所述第一数据集参考参数放入对应的第一轴方向的预设回归模型进行计算,通过第一预设公式得到所述第一回归系数向量的已知值;
将所述第二数据集参考参数放入对应的第二轴方向的预设回归模型进行计算,通过第二预设公式得到所述第二回归系数向量的已知值;
获取残差参数,通过所述残差参数和所述第一回归系数向量的已知值、第二回归系数向量的已知值进行计算,得到目标光谱分析模型。
7.如权利要求1至6中任一项所述的光谱分析模型的构建方法,其特征在于,所述根据所述主成分信息建立预设回归模型,将所述第一数据集参考参数以及第二数据集参考参数放入所述预设回归模型进行计算,得到目标光谱分析模型之后,所述方法还包括:
获取验证样本数据,将所述验证样本数据放入所述目标光谱分析模型进行预测,得到预测结果;
通过第三预设公式对所述预测结果进行分析,得到误差值;
根据所述误差值对所述目标光谱分析模型进行验证。
8.一种光谱分析模型的构建装置,其特征在于,所述光谱分析模型的构建装置包括:
获取模块,用于获取历史光谱的样本数据,提取所述样本数据中的样本信息以及特征信息;
提取模块,用于从所述样本信息中提取第一数据集参考参数,且从所述特征信息中提取第二数据集参考参数;
建立模块,用于获取预设轴向量信息,根据所述预设轴向量信息、第一数据集参考参数以及第二数据集参考参数建立预设原始模型;
计算模块,用于根据拉格朗日算法对所述预设原始模型中的各个参数进行计算,得到所述第一数据集参考参数以及第二数据集参考参数对应的主成分信息;
生成模块,用于根据所述主成分信息建立预设回归模型,将所述第一数据集参考参数以及第二数据集参考参数放入所述预设回归模型进行计算,得到目标光谱分析模型。
9.一种光谱分析模型的构建设备,其特征在于,所述光谱分析模型的构建设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的光谱分析模型的构建程序,所述光谱分析模型的构建程序配置为实现如权利要求1至7中任一项所述的光谱分析模型的构建方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有光谱分析模型的构建程序,所述光谱分析模型的构建程序被处理器执行时实现如权利要求1至7中任一项所述的光谱分析模型的构建方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811440483.1A CN109492707B (zh) | 2018-11-28 | 2018-11-28 | 光谱分析模型的构建方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811440483.1A CN109492707B (zh) | 2018-11-28 | 2018-11-28 | 光谱分析模型的构建方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109492707A true CN109492707A (zh) | 2019-03-19 |
CN109492707B CN109492707B (zh) | 2020-10-23 |
Family
ID=65698578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811440483.1A Active CN109492707B (zh) | 2018-11-28 | 2018-11-28 | 光谱分析模型的构建方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109492707B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109948107A (zh) * | 2019-03-26 | 2019-06-28 | 武汉轻工大学 | 面积曲面积分计算方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1997022296A1 (fr) * | 1995-12-18 | 1997-06-26 | Xiangsheng Wang | Systeme et procede pour le controle des fonctions du systeme nerveux autonome |
CN102135496A (zh) * | 2010-12-23 | 2011-07-27 | 华东交通大学 | 基于多尺度回归的红外光谱定量分析方法和装置 |
CN103105369A (zh) * | 2013-01-30 | 2013-05-15 | 华中科技大学 | 液态物质光谱基线校正定量分析方法 |
CN103134767A (zh) * | 2013-01-30 | 2013-06-05 | 华中科技大学 | 一种红外光谱校正鉴定白酒品质的方法 |
CN103971123A (zh) * | 2014-05-04 | 2014-08-06 | 南京师范大学 | 基于线性回归与Fisher判别字典学习的高光谱图像分类方法 |
CN105354644A (zh) * | 2015-11-29 | 2016-02-24 | 北京化工大学 | 一种基于集成经验模态分解和1-范数支持向量机分位数回归的金融时间序列预测方法 |
-
2018
- 2018-11-28 CN CN201811440483.1A patent/CN109492707B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1997022296A1 (fr) * | 1995-12-18 | 1997-06-26 | Xiangsheng Wang | Systeme et procede pour le controle des fonctions du systeme nerveux autonome |
CN102135496A (zh) * | 2010-12-23 | 2011-07-27 | 华东交通大学 | 基于多尺度回归的红外光谱定量分析方法和装置 |
CN103105369A (zh) * | 2013-01-30 | 2013-05-15 | 华中科技大学 | 液态物质光谱基线校正定量分析方法 |
CN103134767A (zh) * | 2013-01-30 | 2013-06-05 | 华中科技大学 | 一种红外光谱校正鉴定白酒品质的方法 |
CN103971123A (zh) * | 2014-05-04 | 2014-08-06 | 南京师范大学 | 基于线性回归与Fisher判别字典学习的高光谱图像分类方法 |
CN105354644A (zh) * | 2015-11-29 | 2016-02-24 | 北京化工大学 | 一种基于集成经验模态分解和1-范数支持向量机分位数回归的金融时间序列预测方法 |
Non-Patent Citations (1)
Title |
---|
牟怿: "红外光谱定量分析关键算法研究与应用", 《中国博士学位论文全文数据库 基础利学辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109948107A (zh) * | 2019-03-26 | 2019-06-28 | 武汉轻工大学 | 面积曲面积分计算方法、装置、设备及存储介质 |
CN109948107B (zh) * | 2019-03-26 | 2023-05-12 | 武汉轻工大学 | 面积曲面积分计算方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109492707B (zh) | 2020-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111259625B (zh) | 意图识别方法、装置、设备及计算机可读存储介质 | |
Nyamundanda et al. | MetSizeR: selecting the optimal sample size for metabolomic studies using an analysis based approach | |
CN107133202A (zh) | 基于人工智能的文本校验方法和装置 | |
CN109543829A (zh) | 在终端和云端上混合部署深度学习神经网络的方法和系统 | |
CN110909630B (zh) | 一种异常游戏视频检测方法和装置 | |
Hutchinson et al. | Models and machines: how deep learning will take clinical pharmacology to the next level | |
CN109615020A (zh) | 基于机器学习模型的特征分析方法、装置、设备及介质 | |
CN110084365A (zh) | 一种基于深度学习的服务提供系统及方法 | |
CN110046706A (zh) | 模型生成方法、装置及服务器 | |
CN110879993B (zh) | 神经网络训练方法、人脸识别任务的执行方法及装置 | |
CN112767303B (zh) | 一种图像检测方法、装置、设备及计算机可读存储介质 | |
CN107958247A (zh) | 用于人脸图像识别的方法和装置 | |
CN109886554A (zh) | 违规行为判别方法、装置、计算机设备和存储介质 | |
CN108171208A (zh) | 信息获取方法和装置 | |
CN111784665B (zh) | 基于傅里叶变换的oct图像质量评估方法、系统及装置 | |
CN109492707A (zh) | 光谱分析模型的构建方法、装置、设备及存储介质 | |
CN113255701B (zh) | 一种基于绝对-相对学习架构的小样本学习方法和系统 | |
CN114821178A (zh) | 一种基于深度学习的模块化图像识别分类系统的处理方法 | |
CN109508440A (zh) | 光谱分析模型的构建方法、装置、设备及存储介质 | |
CN109253981B (zh) | 基于红外光谱的定量分析模型建立方法及装置 | |
EP3971773A1 (en) | Visualization method and device for evaluating brain addiction traits, and medium | |
CN115691793A (zh) | 一种舌象数据处理方法、装置及相关设备 | |
CN113408571B (zh) | 一种基于模型蒸馏的图像分类方法、装置、存储介质及终端 | |
US11003825B1 (en) | System, method, and computer program product for optimization in an electronic design | |
Yang et al. | Predicting freshmen enrollment based on machine learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220706 Address after: 430013 c06-1, daijiashan science and technology entrepreneurship City, No. 888, Hanhuang Road, Jiang'an District, Wuhan City, Hubei Province Patentee after: WUHAN YT AUTOMATION EQUIPMENT CO.,LTD. Address before: 430023 No. 68, Xuefu Road, Changqing Garden, Dongxihu District, Wuhan, Hubei Patentee before: WUHAN POLYTECHNIC University |
|
TR01 | Transfer of patent right |