CN109992861B - 一种近红外光谱建模方法 - Google Patents

一种近红外光谱建模方法 Download PDF

Info

Publication number
CN109992861B
CN109992861B CN201910219745.XA CN201910219745A CN109992861B CN 109992861 B CN109992861 B CN 109992861B CN 201910219745 A CN201910219745 A CN 201910219745A CN 109992861 B CN109992861 B CN 109992861B
Authority
CN
China
Prior art keywords
sub
network
data
parameter
optimization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910219745.XA
Other languages
English (en)
Other versions
CN109992861A (zh
Inventor
陈孝敬
徐玲杰
黄光造
李理民
袁雷明
朱德华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wenzhou University
Original Assignee
Wenzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wenzhou University filed Critical Wenzhou University
Priority to CN201910219745.XA priority Critical patent/CN109992861B/zh
Publication of CN109992861A publication Critical patent/CN109992861A/zh
Application granted granted Critical
Publication of CN109992861B publication Critical patent/CN109992861B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3577Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Photometry And Measurement Of Optical Pulse Characteristics (AREA)
  • Spectrometry And Color Measurement (AREA)

Abstract

本发明公开了一种近红外光谱建模方法,通过创建若干相同的一维卷积神经网络作为负相关学习中的子网络,在每个子网络的误差函数后加上一个负相关性惩罚项,使用该复合误差函数反向传播这些子网络以进行每个子网络的参数迭代优化调整,通过对每个子网络的参数迭代优化调整实现每个子网络的收敛,最终优化收敛后的子网络即为构建得到的近红外光谱;优点是使用一维卷积神经网络作为基础模型,将一维卷积神经网络与负相关学习方法相结合,采用负相关学习方法对模型进行训练收敛,使模型具有较高的精度,且训练收敛更快,所需的建模时间和计算机资源少。

Description

一种近红外光谱建模方法
技术领域
本发明涉及一种建模方法,尤其是涉及一种近红外光谱建模方法。
背景技术
近红外光谱检测技术是一种简单、快速以及可靠的检测技术。它综合运用了光谱技术、计算机技术和模式识别等多个学科的研究成果,以其独特的优势在多个领域得到了日益广泛的应用,并已逐渐得到大众的普遍接受和官方的认可。
近红外光谱分析方法是一种间接的分析方法,往往需要构造反应近红外光谱数据和待分析样本属性关系的数学模型。对于一个属性未知的光谱样本,将其对应的近红外光谱数据带入已构建的数学模型,就可以对这个样本的属性进行定性或者定量的分析。已有的传统化学计量学的工作解释了校准模型的波长信道信息与材料的化学信息之间的相关性。多元线性回归直接建立一个模型来反映因变量(光谱信号)和自变量(属性信息)之间的线性关系。但是当样本量较小且信噪比(SNR)较大时,模型可能会失真。偏最小二乘法(PLS)使用主成分分析(PCA)的思想来提取自变量的主要成分,并考虑因变量的作用。通过妥协各自空间中的因子,PLS模型可以更好地同时描述独立变量和因变量。但是这个建模方法对数据集的规模不敏感,当建模集样本数量增多时,PLS的性能并不能得到提高,因此不能用在数据量比较大的样本集中。
人工神经网络在近红外光谱建模中有许多应用,其中大多数使用反向传播(BackPropogration,BP)神经网络和卷积神经网络(Convolutional Neural Network,即CNN)。它们都是根据误差反向传播训练的多层前馈神经网络。在前向传播过程中,输入数据从输入层通过隐藏层逐层处理并转向输出层。每层神经元的状态仅影响下一层神经元的状态;当无法获得所需的输出,输出层结果与真实值之间的误差沿原始连接路径返回,通过修改每个神经元的权重、偏执等参数最小化误差。两者的不同点在于,BP神经网络采用的是全连接神经元的结构,每层的权重与层的输入数据完全连接,这使得模型中所需训练的权重数量巨大,训练费时耗力;而CNN提出了权重共享的概念,即同一卷积层中所有神经元的权重是相同的,这意味着下一层上的所有节点都是由相同的卷积内核生成的,因此CNN与BP网络相比大大节省了回归成本。
在对近红外光谱建模时,如果使用二维卷积网络,必须将每个光谱样本的一维光谱数据转换为二维光谱信息矩阵以适应卷积核的大小。这可能导致数据丢失,并且实际上是不必要的。由于光谱样本单个样本是一维度的数据,用于处理序列数据的一维卷积神经网络,无需做任何预处理就能从原有光谱中提取信息。然而,经过实验证明,用单个一维度卷积网络建立光谱模型的效果不佳,建模精度较低。
发明内容
本发明所要解决的技术问题是提供一种建模精度较高的近红外光谱建模方法。
本发明解决上述技术问题所采用的技术方案为:一种近红外光谱建模方法,包括以下步骤:
(1)构建校准建模数据集,将该校准建模数据集记为Dcal
Figure BDA0002002414890000021
其中,
Figure BDA0002002414890000022
为校准建模数据集中第i个近红外光谱,
Figure BDA0002002414890000023
表示校准建模数据集中第i个近红外光谱对应的真实属性值,
Figure BDA0002002414890000024
Figure BDA0002002414890000025
构成校准建模数据集中第i个数据对,N1是校准建模数据集中数据对的数量,i=1,2,...,N1,N1为大于等于20的整数;
构建验证数据集,将该验证数据集记为Dver
Figure BDA0002002414890000026
Figure BDA0002002414890000027
表示验证数据集中第j个近红外光谱,
Figure BDA0002002414890000028
表示证数据集中第j个近红外光谱对应的真实属性值,
Figure BDA0002002414890000029
Figure BDA00020024148900000210
构成校准建模数据集中第j个数据对,N2是验证数据集中数据对的数量,j=1,2,...,N2,N2为大于等于20的整数;
(2)获取校准建模数据集中所有近红外光谱的维度,然后采用校准建模数据集中所有近红外光谱的维度设定一维度卷积网络中卷积核的大小以及卷积层数,构建M个结构相同的一维度卷积网络,其中M为大于等于2的整数,将每个一维度卷积网络中的权重参数和偏执参数分别采用均值为1,方差为0,参数数值大小范围为[-1,1]的高斯初始化方式进行初始化,初始化后的M个一维度卷积网络构成子网络集,其中,第m个一维度卷积网络为子网络集的第m个子网络,将第m个子网络记为fm,第m个子网络的权重参数记为wm,第m个子网络的偏执参数记为βm,m=1,2,...,M;
(3)设定优化轮次变量p、每个优化轮次中的迭代优化总次数T以及迭代优化次数变量t,T为大于等于20的整数;
(4)对p进行初始化赋值,令p=1;
(5)对子网络集进行第p轮次参数迭代优化,具体过程为:
S1、对t进行初始化赋值,令t=1;
S2、对子网络集进行第t次参数迭代优化,具体迭代优化过程为:
a、将校准建模数据集Dcal中的第i个光谱样本的近红外光谱数据
Figure BDA0002002414890000031
作为第m个子网络fm的输入数据输入到第m个子网络fm,将第m个子网络fm的输出数据记为
Figure BDA0002002414890000032
将第1个子网络的输出数据
Figure BDA0002002414890000033
至第M个子网络的输出数据
Figure BDA0002002414890000034
的集成输出数据记为
Figure BDA0002002414890000035
Figure BDA0002002414890000036
采用公式(1)表示为:
Figure BDA0002002414890000037
b、将第m个子网络在校准建模数据集Dcal上的误差函数lossm采用公式(2)表示为:
Figure BDA0002002414890000038
其中,pm(i)为第m个子网络的负相关性惩罚项,λ为负相关性惩罚系数,0≤λ≤1,pm(i)采用公式(3)表示:
Figure BDA0002002414890000039
c、根据误差函数lossm计算第m个子网络fm权重参数的反向传播梯度Δwm和偏执参数的反向传播梯度Δβm
Figure BDA00020024148900000310
Figure BDA00020024148900000311
其中,
Figure BDA00020024148900000312
为求导数符号,η为学习率,为大于0且小于1的小数。
d、用Adam优化器将Δwm和Δβm从第m个子网络的输出端反向传播到其输入端,实现对第m个子网络fm中的权重参数wm和偏执参数βm的第t次优化,得到第t次参数迭代优化后的第m个子网络fm
S3、根据公式(6)计算并记录第t次优化后的校准建模数据集的均方根误差RMSECt
Figure BDA0002002414890000041
S4、根据公式(7)计算并记录第t次优化后的验证数据集的均方根误差RMSEVt
Figure BDA0002002414890000042
其中,
Figure BDA0002002414890000043
为验证数据集中第j个近红外光谱
Figure BDA0002002414890000044
输入到第t次参数迭代优化后的第m个子网络fm后得到的输出;
S5、判断t是否等于T,如果不等于T,则采用t的当前值加1的和更新t,然后返回步骤S2进行当前轮次的下一次迭代优化,如果等于T,则第p轮次参数迭代优化结束,进入步骤(6);
(6)、对第p轮第t次参数迭代优化的结果进行分析:将第1次优化后的校准建模数据集的均方根误差RMSEC1至第T次优化后的校准建模数据集的均方根误差RMSECT这T个数据作为第一组数据,将第1次优化后的验证数据集的均方根误差RMSEV1至第T次优化后的验证数据集的均方根误差RMSEVT这T个数据作为第二组数据,分析第一组数据和第二组数据的变化趋势,如果两组数据中的至少一组数据中,从某一次参数迭代优化开始,后一数据与前一数据之差的绝对值大于等于0且小于等于0.05,则认为该组数据中从该次参数迭代优化开始,数据不随着参数迭代优化次数的增加而变化,此时认定为参数迭代优化条件形成,子网络集的参数迭代优化全部结束,将最后一个优化轮次中第T次优化得到的子网络集中的各个子网络作为近红外光谱模型;否则,采用p的当前值加1的和更新p的值后,返回步骤(5)进行下一个轮次的参数迭代优化,周而复始,直至满足参数迭代优化条件形成。
η的取值为0.01、0.001或者0.0001。
与现有技术相比,本发明的优点在于通过创建若干相同的一维卷积神经网络作为负相关学习中的子网络,在每个子网络的误差函数后加上一个负相关性惩罚项,使用该复合误差函数反向传播这些子网络以进行每个子网络的参数迭代优化调整,通过对每个子网络的参数迭代优化调整实现每个子网络的收敛,最终优化收敛后的子网络即为构建得到的近红外光谱,本发明建模方法使用一维卷积神经网络作为基础模型,将一维卷积神经网络与负相关学习方法相结合,采用负相关学习方法对模型进行训练收敛,使模型具有较高的精度,且训练收敛更快,所需的建模时间和计算机资源少。
附图说明
图1为本发明的近红外光谱建模方法中构建的一维卷积网络结构图;
图2为在分析柴油燃料近红外光谱数据集中柴油燃料在50%回收率下的沸点时,PLS模型、单个一维度卷积网络以及采用本发明的方法构建的模型随校准建模数据集和验证数据集的数据量增加时的沸点误差曲线图;
图3为在分析柴油燃料近红外光谱数据集中柴油燃料冷冻温度时,PLS模型、单个一维度卷积网络以及采用本发明的方法构建的模型随校准建模数据集和验证数据集的数据量增加时的冷冻温度误差曲线图。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
实施例:一种近红外光谱建模方法,包括以下步骤:
(1)构建校准建模数据集,将该校准建模数据集记为Dcal
Figure BDA0002002414890000051
其中,
Figure BDA0002002414890000052
为校准建模数据集中第i个近红外光谱,
Figure BDA0002002414890000053
表示校准建模数据集中第i个近红外光谱对应的真实属性值,
Figure BDA0002002414890000054
Figure BDA0002002414890000055
构成校准建模数据集中第i个数据对,N1是校准建模数据集中数据对的数量,i=1,2,...,N1,N1为大于等于20的整数;
构建验证数据集,将该验证数据集记为Dver
Figure BDA0002002414890000056
Figure BDA0002002414890000057
表示验证数据集中第j个近红外光谱,
Figure BDA0002002414890000058
表示证数据集中第j个近红外光谱对应的真实属性值,
Figure BDA0002002414890000059
Figure BDA00020024148900000510
构成校准建模数据集中第j个数据对,N2是验证数据集中数据对的数量,j=1,2,...,N2,N2为大于等于20的整数;
(2)获取校准建模数据集中所有近红外光谱的维度,然后采用校准建模数据集中所有近红外光谱的维度设定一维度卷积网络中卷积核的大小以及卷积层数,构建M个结构相同的一维度卷积网络,其中M为大于等于2的整数,将每个一维度卷积网络中的权重参数和偏执参数分别采用均值为1,方差为0,参数数值大小范围为[-1,1]的高斯初始化方式进行初始化,初始化后的M个一维度卷积网络构成子网络集,其中,第m个一维度卷积网络为子网络集的第m个子网络,将第m个子网络记为fm,第m个子网络的权重参数记为wm,第m个子网络的偏执参数记为βm,m=1,2,...,M;
(3)设定优化轮次变量p、每个优化轮次中的迭代优化总次数T以及迭代优化次数变量t,T为大于等于20的整数;
(4)对p进行初始化赋值,令p=1;
(5)对子网络集进行第p轮次参数迭代优化,具体过程为:
S1、对t进行初始化赋值,令t=1;
S2、对子网络集进行第t次参数迭代优化,具体迭代优化过程为:
a、将校准建模数据集Dcal中的第i个光谱样本的近红外光谱数据
Figure BDA0002002414890000061
作为第m个子网络fm的输入数据输入到第m个子网络fm,将第m个子网络fm的输出数据记为
Figure BDA0002002414890000062
将第1个子网络的输出数据
Figure BDA0002002414890000063
至第M个子网络的输出数据
Figure BDA0002002414890000064
的集成输出数据记为
Figure BDA0002002414890000065
Figure BDA0002002414890000066
采用公式(1)表示为:
Figure BDA0002002414890000067
b、将第m个子网络在校准建模数据集Dcal上的误差函数lossm采用公式(2)表示为:
Figure BDA0002002414890000068
其中,pm(i)为第m个子网络的负相关性惩罚项,λ为负相关性惩罚系数,0≤λ≤1,pm(i)采用公式(3)表示:
Figure BDA0002002414890000069
c、根据误差函数lossm计算第m个子网络fm权重参数的反向传播梯度Δwm和偏执参数的反向传播梯度Δβm
Figure BDA0002002414890000071
Figure BDA0002002414890000072
其中,
Figure BDA0002002414890000073
为求导数符号,η为学习率,为大于0且小于1的小数。
d、用Adam优化器将Δwm和Δβm从第m个子网络的输出端反向传播到其输入端,实现对第m个子网络fm中的权重参数wm和偏执参数βm的第t次优化,得到第t次参数迭代优化后的第m个子网络fm
S3、根据公式(6)计算并记录第t次优化后的校准建模数据集的均方根误差RMSECt
Figure BDA0002002414890000074
S4、根据公式(7)计算并记录第t次优化后的验证数据集的均方根误差RMSEVt
Figure BDA0002002414890000075
其中,
Figure BDA0002002414890000076
为验证数据集中第j个近红外光谱
Figure BDA0002002414890000077
输入到第t次参数迭代优化后的第m个子网络fm后得到的输出;
S5、判断t是否等于T,如果不等于T,则采用t的当前值加1的和更新t,然后返回步骤S2进行当前轮次的下一次迭代优化,如果等于T,则第p轮次参数迭代优化结束,进入步骤(6);
(6)、对第p轮第t次参数迭代优化的结果进行分析:将第1次优化后的校准建模数据集的均方根误差RMSEC1至第T次优化后的校准建模数据集的均方根误差RMSECT这T个数据作为第一组数据,将第1次优化后的验证数据集的均方根误差RMSEV1至第T次优化后的验证数据集的均方根误差RMSEVT这T个数据作为第二组数据,分析第一组数据和第二组数据的变化趋势,如果两组数据中的至少一组数据中,从某一次参数迭代优化开始,后一数据与前一数据之差的绝对值大于等于0且小于等于0.05,则认为该组数据中从该次参数迭代优化开始,数据不随着参数迭代优化次数的增加而变化,此时认定为参数迭代优化条件形成,子网络集的参数迭代优化全部结束,将最后一个优化轮次中第T次优化得到的子网络集中的各个子网络作为近红外光谱模型;否则,采用p的当前值加1的和更新p的值后,返回步骤(5)进行下一个轮次的参数迭代优化,周而复始,直至满足参数迭代优化条件形成。
本实施例中,η的取值为0.01、0.001或者0.0001。
本实施例中,校准建模数据集和验证数据集中使用的近红外光谱数据从常用的公共柴油燃料近红外光谱数据集中获取,其中,从柴油燃料近红外光谱数据集中取200个数据构校准建模数据集,16个数据构建验证数据集根据柴油燃料近红外光谱数据集的样本变量特点,构建得到的一维卷积网络的结构图如图1所示。
为了验证本发明的方法的优异性,分别采用偏最小二乘法模型(简称PLS)、单个一维度卷积网络模型(简称CNN)以及采用本发明的方法构建的模型(简称CNN_NCL)对柴油燃料近红外光谱数据集中柴油燃料的两种属性:在50%回收率下的沸点和冷冻温度进行分析验证。图2为在分析柴油燃料近红外光谱数据集中柴油燃料在50%回收率下的沸点时,PLS模型、单个一维度卷积网络以及采用本发明的方法构建的模型随校准建模数据集和验证数据集的数据量增加时的沸点误差曲线图;图3为在分析柴油燃料近红外光谱数据集中柴油燃料冷冻温度时,PLS模型、单个一维度卷积网络以及采用本发明的方法构建的模型随校准建模数据集和验证数据集的数据量增加时的冷冻温度误差曲线图。分析图2和图3可知,本发明的方法构建的模型相对于现有的两种模型,误差明显减小,精度明显提高。

Claims (2)

1.一种近红外光谱建模方法,其特征在于包括以下步骤:
(1)构建校准建模数据集,将该校准建模数据集记为Dcal
Figure FDA0002002414880000011
其中,
Figure FDA0002002414880000012
为校准建模数据集中第i个近红外光谱,
Figure FDA0002002414880000013
表示校准建模数据集中第i个近红外光谱对应的真实属性值,
Figure FDA0002002414880000014
Figure FDA0002002414880000015
构成校准建模数据集中第i个数据对,N1是校准建模数据集中数据对的数量,i=1,2,…,N1,N1为大于等于20的整数;
构建验证数据集,将该验证数据集记为Dver
Figure FDA0002002414880000016
Figure FDA0002002414880000017
表示验证数据集中第j个近红外光谱,
Figure FDA0002002414880000018
表示证数据集中第j个近红外光谱对应的真实属性值,
Figure FDA0002002414880000019
Figure FDA00020024148800000110
构成校准建模数据集中第j个数据对,N2是验证数据集中数据对的数量,j=1,2,…,N2,N2为大于等于20的整数;
(2)获取校准建模数据集中所有近红外光谱的维度,然后采用校准建模数据集中所有近红外光谱的维度设定一维度卷积网络中卷积核的大小以及卷积层数,构建M个结构相同的一维度卷积网络,其中M为大于等于2的整数,将每个一维度卷积网络中的权重参数和偏执参数分别采用均值为1,方差为0,参数数值大小范围为[-1,1]的高斯初始化方式进行初始化,初始化后的M个一维度卷积网络构成子网络集,其中,第m个一维度卷积网络为子网络集的第m个子网络,将第m个子网络记为fm,第m个子网络的权重参数记为wm,第m个子网络的偏执参数记为βm,m=1,2,…,M;
(3)设定优化轮次变量p、每个优化轮次中的迭代优化总次数T以及迭代优化次数变量t,T为大于等于20的整数;
(4)对p进行初始化赋值,令p=1;
(5)对子网络集进行第p轮次参数迭代优化,具体过程为:
S1、对t进行初始化赋值,令t=1;
S2、对子网络集进行第t次参数迭代优化,具体迭代优化过程为:
a、将校准建模数据集Dcal中的第i个光谱样本的近红外光谱数据
Figure FDA00020024148800000111
作为第m个子网络fm的输入数据输入到第m个子网络fm,将第m个子网络fm的输出数据记为
Figure FDA0002002414880000021
将第1个子网络的输出数据
Figure FDA0002002414880000022
至第M个子网络的输出数据
Figure FDA0002002414880000023
的集成输出数据记为
Figure FDA0002002414880000024
Figure FDA0002002414880000025
采用公式(1)表示为:
Figure FDA0002002414880000026
b、将第m个子网络在校准建模数据集Dcal上的误差函数lossm采用公式(2)表示为:
Figure FDA0002002414880000027
其中,pm(i)为第m个子网络的负相关性惩罚项,λ为负相关性惩罚系数,0≤λ≤1,pm(i)采用公式(3)表示:
Figure FDA0002002414880000028
c、根据误差函数lossm计算第m个子网络fm权重参数的反向传播梯度Δwm和偏执参数的反向传播梯度Δβm
Figure FDA0002002414880000029
Figure FDA00020024148800000210
其中,
Figure FDA00020024148800000211
为求导数符号,η为学习率,为大于0且小于1的小数,
d、用Adam优化器将Δwm和Δβm从第m个子网络的输出端反向传播到其输入端,实现对第m个子网络fm中的权重参数wm和偏执参数βm的第t次优化,得到第t次参数迭代优化后的第m个子网络fm
S3、根据公式(6)计算并记录第t次优化后的校准建模数据集的均方根误差RMSECt
Figure FDA00020024148800000212
S4、根据公式(7)计算并记录第t次优化后的验证数据集的均方根误差RMSEVt
Figure FDA00020024148800000213
其中,
Figure FDA00020024148800000214
为验证数据集中第j个近红外光谱
Figure FDA00020024148800000215
输入到第t次参数迭代优化后的第m个子网络fm后得到的输出;
S5、判断t是否等于T,如果不等于T,则采用t的当前值加1的和更新t,然后返回步骤S2进行当前轮次的下一次迭代优化,如果等于T,则第p轮次参数迭代优化结束,进入步骤(6);
(6)、对第p轮第t次参数迭代优化的结果进行分析:将第1次优化后的校准建模数据集的均方根误差RMSEC1至第T次优化后的校准建模数据集的均方根误差RMSECT这T个数据作为第一组数据,将第1次优化后的验证数据集的均方根误差RMSEV1至第T次优化后的验证数据集的均方根误差RMSEVT这T个数据作为第二组数据,分析第一组数据和第二组数据的变化趋势,如果两组数据中的至少一组数据中,从某一次参数迭代优化开始,后一数据与前一数据之差的绝对值大于等于0且小于等于0.05,则认为该组数据中从该次参数迭代优化开始,数据不随着参数迭代优化次数的增加而变化,此时认定为参数迭代优化条件形成,子网络集的参数迭代优化全部结束,将最后一个优化轮次中第T次优化得到的子网络集中的各个子网络作为近红外光谱模型;否则,采用p的当前值加1的和更新p的值后,返回步骤(5)进行下一个轮次的参数迭代优化,周而复始,直至满足参数迭代优化条件形成。
2.根据权利要求1所述的一种近红外光谱建模方法,其特征在于η的取值为0.01、0.001或者0.0001。
CN201910219745.XA 2019-03-21 2019-03-21 一种近红外光谱建模方法 Active CN109992861B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910219745.XA CN109992861B (zh) 2019-03-21 2019-03-21 一种近红外光谱建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910219745.XA CN109992861B (zh) 2019-03-21 2019-03-21 一种近红外光谱建模方法

Publications (2)

Publication Number Publication Date
CN109992861A CN109992861A (zh) 2019-07-09
CN109992861B true CN109992861B (zh) 2022-12-27

Family

ID=67129105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910219745.XA Active CN109992861B (zh) 2019-03-21 2019-03-21 一种近红外光谱建模方法

Country Status (1)

Country Link
CN (1) CN109992861B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110609971B (zh) * 2019-08-12 2023-12-12 广东石油化工学院 一种校准多元回归网络构建方法
CN112861414A (zh) * 2019-11-27 2021-05-28 国能生物发电集团有限公司 基于红外光谱主成分和神经网络的生物质碳含量测量与建模方法
CN112613536B (zh) * 2020-12-08 2024-07-05 燕山大学 一种基于smote和深度学习的近红外光谱柴油牌号识别方法
CN113702328B (zh) * 2021-08-20 2024-05-17 广东省惠州市石油产品质量监督检验中心 一种成品油的性质分析方法、装置、设备及存储介质
CN113945537A (zh) * 2021-09-27 2022-01-18 桂林电子科技大学 一种高准确度近红外光谱定量模型建立方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107014769A (zh) * 2017-03-20 2017-08-04 南京林业大学 一种基于THz光谱分析的鲜肉K值快速无损检测模型
CN107064054A (zh) * 2017-02-28 2017-08-18 浙江大学 一种基于cc‑pls‑rbfnn优化模型的近红外光谱分析方法
WO2018010352A1 (zh) * 2016-07-11 2018-01-18 上海创和亿电子科技发展有限公司 一种定性定量相结合的近红外定量模型构建方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018010352A1 (zh) * 2016-07-11 2018-01-18 上海创和亿电子科技发展有限公司 一种定性定量相结合的近红外定量模型构建方法
CN107064054A (zh) * 2017-02-28 2017-08-18 浙江大学 一种基于cc‑pls‑rbfnn优化模型的近红外光谱分析方法
CN107014769A (zh) * 2017-03-20 2017-08-04 南京林业大学 一种基于THz光谱分析的鲜肉K值快速无损检测模型

Also Published As

Publication number Publication date
CN109992861A (zh) 2019-07-09

Similar Documents

Publication Publication Date Title
CN109992861B (zh) 一种近红外光谱建模方法
CN111130839B (zh) 一种流量需求矩阵预测方法及其系统
Zhang et al. Classification modeling method for near‐infrared spectroscopy of tobacco based on multimodal convolution neural networks
CN111737535B (zh) 一种基于元结构和图神经网络的网络表征学习方法
Zhang et al. Gresnet: Graph residual network for reviving deep gnns from suspended animation
CN113919441A (zh) 一种基于超图变换网络的分类方法
CN108399428A (zh) 一种基于迹比准则的三元组损失函数设计方法
US11625614B2 (en) Small-world nets for fast neural network training and execution
CN112098358A (zh) 基于四元数卷积神经网络的近红外光谱并行融合定量建模方法
CN111222847A (zh) 基于深度学习与非监督聚类的开源社区开发者推荐方法
Zheng et al. Understanding the property of long term memory for the LSTM with attention mechanism
CN106248621A (zh) 一种评价方法与系统
Ji et al. Solving stochastic optimal control problem via stochastic maximum principle with deep learning method
CN112905894A (zh) 一种基于增强图学习的协同过滤推荐方法
CN115436343A (zh) 异源激光诱导击穿光谱之间的迁移和标准化方法及系统
Feng et al. Hyperspectral band selection based on ternary weight convolutional neural network
CN114970339A (zh) 数据驱动识别偏微分方程的序列奇异值过滤方法
Li et al. High-dimensional interaction detection with false sign rate control
CN113591997A (zh) 基于图学习卷积神经网络的装配特征图连接关系分类方法
CN105426962A (zh) 一种不完全递归支集动态神经网络构建及训练方法
CN116956993A (zh) 一种构建图集成模型的方法、装置及存储介质
CN111462817A (zh) 一种分类模型构建方法、装置、分类模型及分类方法
CN115796244A (zh) 一种超非线性输入输出系统基于cff的参数辨识方法
CN114897004B (zh) 一种基于深度学习Transformer模型的梯形堆积核脉冲识别方法
CN111222543A (zh) 物质识别方法和设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant