CN110782013B - 一种基于广义互熵自编码器的火电厂NOx排放量预测方法 - Google Patents

一种基于广义互熵自编码器的火电厂NOx排放量预测方法 Download PDF

Info

Publication number
CN110782013B
CN110782013B CN201911003001.0A CN201911003001A CN110782013B CN 110782013 B CN110782013 B CN 110782013B CN 201911003001 A CN201911003001 A CN 201911003001A CN 110782013 B CN110782013 B CN 110782013B
Authority
CN
China
Prior art keywords
value
hidden layer
encoder
input
self
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911003001.0A
Other languages
English (en)
Other versions
CN110782013A (zh
Inventor
任密蜂
齐慧月
巩明月
方茜茜
马建飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taiyuan University of Technology
Original Assignee
Taiyuan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taiyuan University of Technology filed Critical Taiyuan University of Technology
Priority to CN201911003001.0A priority Critical patent/CN110782013B/zh
Publication of CN110782013A publication Critical patent/CN110782013A/zh
Application granted granted Critical
Publication of CN110782013B publication Critical patent/CN110782013B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明为一种基于广义互熵自编码器的火电厂NOx排放量预测方法,具体是利用基于广义互熵的门控堆叠目标相关自编码器预测火电厂NOx排放量。该方法所包括的步骤如下:采集火电厂数据,包括NOx排放量和相关影响因素,对所有数据进行预处理,将影响NOx排放的相关因子作为输入通过自编码器进行非线性降维和特征提取,建立NOx排放影响因子与NOx排放量之间的模型。本发明对NOx排放量预测准确可靠,具有较高的实际工程应用价值。

Description

一种基于广义互熵自编码器的火电厂NOx 排放量预测方法
技术领域
本发明涉及NOx排放量的预测方法,具体是一种基于广义互熵自编码器的火电厂NOx排放量预测方法。
背景技术
面对国内日益严峻的环境问题,迫切需要一种能够降低电站锅炉的能耗与污染物的排放方法。锅炉燃烧优化技术一直以来是提高锅炉效率和降低污染物排放的有效手段。而建立准确的电站锅炉燃烧模型,并对模型的输入参数进行优化,对于电站来说具有非常重要的意义。然而,如何建立电站锅炉燃烧模型以实现对数据高效自动快速准确的预测就显得尤为重要。
一般来说,软测量建模方法有三种,分别是基于机理的模型、基于知识的模型和数据驱动的模型。随着计算机技术的飞速发展和信息采集、传输和存储技术的成熟,以及分布式控制系统(DCS)的广泛应用,工业过程每天都会产生和存储大量的测量数据。因此,数据驱动的建模方法越来越受到重视,软测量结构越来越受到人们的关注和应用。
对数据驱动的软测量建模方法可以分为线性回归方法、人工神经网络方法、支持向量机方法、模糊建模方法等。线性回归方法利用统计方法提取辅助变量和主导变量数据中的隐含信息,建立主导变量和辅助变量之间的数学模型,模型简单,但是并不适用于具有强非线性的对象。人工神经网络技术通过对样本数据的学习建立以辅助变量为输入、以主导变量为输出之间的模型。它具有良好的非线性映射能力、自学习适应能力与并行处理能力,在解决高度非线性和严重不确定性系统方面具有十分巨大的潜力。缺点是外推性能很差,神经网络的性能受到多种因素影响。支持向量机采用非线性映射(核函数)将问题转化为特征空间内凸集上的优化问题,从而避免问题出现局部极小值困难。与神经网络相比,支持向量机的优点是训练算法中不存在局部极小问题,可以自动设计模型复杂度,且不存在维数灾难问题,尤其是泛化能力强。模糊技术基于模糊数学理论,以人脑的近似推理和综合决策过程为模拟对象,多用于模型未知和不精确性的控制问题中,优点是提高了控制算法的可控性、适应性和合理性。
发明内容
本发明针对堆叠自编码器没有在训练阶段获取与目标值相关的信息,而且只是使用最后一个隐藏层中的特征表示进行最终预测以及非高斯噪声下基于均方误差的损失函数鲁棒性差的问题,提出了一种基于广义互熵自编码器的火电厂NOx排放量预测方法。
本发明采用如下技术方案实现,一种基于广义互熵自编码器的火电厂NOx排放量预测方法,其模型结构如图1所示,其特征提取步骤如下:
步骤一:根据电站实际测点数据,选取锅炉负荷、烟气含氧量、一次风风速、二次风量、排烟温度及煤质数据、磨煤机给粉量、燃尽风挡板开度参数作为模型的输入量,而以NOx排放量作为模型的真实输出量;
步骤二:对采集到的数据进行预处理;
步骤三:将输入量作为门控堆叠目标相关自编码器输入层的输入,利用门控堆叠目标相关自编码器对输入量进行非线性降维和回归;基于广义互熵的门控堆叠目标相关自编码器的非线性降维和回归过程描述如下:
1)将输入量输入到第一个自编码器中,进行第一次特征提取, h1=f(W11·x+b11),x是经预处理后的输入量,{W11、b11}是第一个自编码器编码部分的权重值和偏置值,f(·)是激活函数;
通过提取到的特征对输入进行重构,
Figure GDA0002279786570000021
其中,{W12、b12} 是第一个自编码器解码部分的权重值和偏置值,h1是第一个隐含层提取的特征值,
Figure GDA0002279786570000022
是重构输出;
2)根据第一个隐含层提取到的特征值对输出进行预测,
Figure GDA0002279786570000023
其中,{W13、b13}是进行预测的权重值和偏置值,
Figure GDA0002279786570000024
是根据第一个隐含层提取的特征值预测的输出值;
3)计算输入量x和重构输出
Figure GDA0002279786570000025
之间、预测的输出值
Figure GDA0002279786570000026
和预处理后的真实输出量之间基于广义互熵的损失函数,多次迭代训练,通过反向传播算法减小损失函数值更新该自编码器的权重值和偏置值;
4)第i个隐含层迭代训练提取到的特征值作为输入训练第i+1个自编码器,将第i个隐含层的特征值作为第i+1个自编码器的输入,进行第i+1次特征提取, hi+1=f(W(i+1)1·hi+b(i+1)1),其中,hi是第i个隐含层的特征提取值,{W(i+1)1、b(i+1)1} 是第i+1个自编码器编码部分的权重值和偏置值,i≥1;
根据提取到的特征对输入进行重构,
Figure GDA0002279786570000027
其中,{W(i+1)2、b(i+1)2}是第i+1个自编码器解码部分的权重值和偏置值,hi+1是第i+1个隐含层提取的特征值,
Figure GDA0002279786570000028
是第i个隐含层的特征提取值的重构输出;
5)根据第i+1个隐含层提取到的特征值对输出做预测,
Figure GDA0002279786570000029
其中,hi+1是第i+1个隐含层提取的特征值,{W(i+1)3、 b(i+1)3}是做预测时的权重值和偏置值,
Figure GDA00022797865700000210
是根据第i+1个隐含层提取的特征值预测的输出值;
6)计算输入量hi和重构输出
Figure GDA00022797865700000211
之间、预测的输出值
Figure GDA00022797865700000212
和预处理后的真实输出量的损失函数,多次迭代,通过反向传播算法减小损失函数值更新该自编码器的权重值和偏置值;
步骤四:待所有自编码器都结束一次迭代训练后,利用每个隐含层提取到的特征值生成门控值,并利用每一个隐含层提取的特征做预测,对每一个隐含层求出的门控值和预测值做点积运算,
Figure GDA00022797865700000213
其中,
Figure GDA00022797865700000214
是第k个隐含层经门控值控制之后求出的预测值,gk是由第k个隐含层提取的特征求出的门控值,yok是由第k个隐含层提取的特征求出的预测值,{Wgk、bgk}是第k个隐含层求门控值的权重和偏置,{Wyk、byk}是第k个隐含层预测时的权重和偏置;
步骤五:各隐含层所得到的预测值
Figure GDA0002279786570000031
相加作为最终预测值
Figure GDA0002279786570000032
计算最终预测值
Figure GDA0002279786570000033
和预处理后的真实输出量之间的损失函数,利用反向传播算法更新每个自编码器求门控值和预测时的权重和偏置,直至达到设定的迭代次数或者损失函数值足够小,此时便可利用训练好的门控堆叠目标相关自编码器对NOx排放量进行预测。
进一步的,对采集到的数据集进行预处理,预处理过程为
Figure GDA0002279786570000034
Figure GDA0002279786570000035
其中,xIN是输入量,yOUT是输出量,x是预处理后的输入量,y是预处理后的输出量,xIN.min是输入量中的最小值,xIN.max是输入量中的最大值,yOUT.min是输出量中的最小值,yOUT.max是输出量中的最大值,max 是期望范围的上限,min是期望范围的下限。
进一步的,按比例将处理后的输入量随机分成训练集和测试集,前者是用于模型训练的数据集,后者是用于性能测试的数据集,若经过性能测试后准确率没有达到要求,对门控堆叠目标相关自编码器中的参数继续进行更新,直到达到要求。
本发明的优点:目标相关自编码器将目标值的预测损失项引入到普通自动编码器的原始损失函数中,从而合理地考虑目标相关信息。然后,通过将目标相关自编码器叠加在一起获得堆叠目标相关自编码器,从而获得不同抽象级别的特征表示,利用门控神经元从不同的隐藏层中提取和控制信息流。通过这种方式,可以量化不同层对输出值的贡献。将原始重构损失函数替换为基于广义互熵的损失函数,以广义高斯密度(GeneralizedGaussian Density,GGD)函数为核心,可以提高系统对非高斯噪声的鲁棒性。本发明对NOx排放量预测准确可靠,具有较高的实际工程应用价值。
附图说明
图1为建立的软测量模型示意图。
图2为微调阶段训练集作为输入的损失函数曲线图。
图3为微调阶段测试集作为输入的损失函数曲线图。
具体实施方式
本发明以从国电集团旗下某电站的PI实时数据库系统中采集的真实数据为实验对象,对基于广义互熵的门控堆叠目标相关自编码器进行训练。
一种基于广义互熵自编码器的火电厂NOx排放量预测方法,其步骤如下:
步骤一:根据电站实际测点数据,选取锅炉负荷(x1)、烟气含氧量(x2~x6)、一次风风速(x7~x12)、二次风量(x13~x39)、排烟温度(x40)及煤质数据(x41~x43)、磨煤机给粉量(x44~x49)、燃尽风挡板开度参数(x50~x57)共计57维参数作为模型的输入量,而以NOx排放量作为模型的真实输出量y。
步骤二:对采集到的输入量和真实输出量进行预处理,预处理公式如下:
Figure GDA0002279786570000041
Figure GDA0002279786570000042
Figure GDA0002279786570000043
Figure GDA0002279786570000044
其中,xIN是输入量,yOUT是输出量,x是预处理后的输入量,y是预处理后的输出量,xIN.min是输入量中的最小值,xIN.max是输入量中的最大值,yOUT.min 是输出量中的最小值,yOUT.max是输出量中的最大值,max是期望范围的上限, min是期望范围的下限。
步骤三:按3:1的比例将处理后的输入量随机分成训练集和测试集,前者是用于模型训练的数据集,后者是用于性能测试的数据集,训练集中有3000组数据,测试集中有1000组数据。
步骤四:设置门控堆叠目标相关自编码器为四层构成。输入层有57个节点,第一个隐含层有40个节点,第二个隐含层有20个,第三个隐含层有10个节点,输出层有1个节点。参数设置为:ξ=0.005,l=0.3,ε=1。
步骤五:将训练集作为门控堆叠目标相关自编码器输入层的输入,利用门控堆叠目标相关自编码器对输入的57维参数x1~x57进行非线性降维和回归;基于广义互熵的门控堆叠目标相关自编码器的非线性降维和回归过程描述如下;
1)将训练集中的57维输入量输入到第一个自编码器中,进行第一次特征提取,h1=f(W11·x+b11),x是训练集中的57维输入量,{W11、b11}是第一个自编码器编码部分的权重值和偏置值,f(·)是激活函数;
通过提取到的特征对输入进行重构,
Figure GDA0002279786570000045
其中,{W12、b12} 是第一个自编码器解码部分的权重值和偏置值,h1是第一个隐含层提取的特征值,
Figure GDA0002279786570000046
是重构输出;
2)根据第一个隐含层提取到的特征值对输出进行预测,
Figure GDA0002279786570000047
其中,{W13、b13}是进行预测的权重值和偏置值,
Figure GDA0002279786570000051
是根据第一个隐含层提取的特征值预测的输出值;
3)计算输入量x和重构输出
Figure GDA0002279786570000052
之间、预测的输出值
Figure GDA0002279786570000053
和预处理后的真实输出量之间基于广义互熵的损失函数,
LGC-GSTAE(θ)=LGCloss(θ)+Lweight(θ)+LCloss(θ)+Lreg(θ)
其中,
Figure GDA0002279786570000054
是基于广义互熵的重构损失项;其中α>0是形状参数,Γ(.)是伽马函数,λ=1/βα是核参数,γα,β=α/(2βΓ(1/α))是归一化常数;θ={W11、b11、W12、b12、W13、b13}是需要优化的参数集;x是输入集,
Figure GDA0002279786570000055
是重构输出集;
Figure GDA0002279786570000056
是权重衰减项,用于防止过拟合;其中
Figure GDA0002279786570000057
是层l的节点i和层l+1中的节点j之间的权重,ξ是权重衰减项的系数,并且sl是层l中的节点数。
Figure GDA0002279786570000058
是基于互熵损失的稀疏惩罚项;其中,
Figure GDA0002279786570000059
是互熵定义,
Figure GDA00022797865700000510
是正比例常数,以保证 Closs(0)=1;
Figure GDA00022797865700000511
是预测误差项;其中,ε是在损失函数中平衡重构损失和预测损失权重的权衡系数,y是预处理后的真实输出量,
Figure GDA00022797865700000512
是通过第一层隐含层的特征预测的预测值;
多次迭代训练,通过反向传播算法减小损失函数值更新权重值和偏置值;
4)第一个隐含层经过迭代训练提取到的特征值作为输入训练第二个自编码器,将第一个隐含层的特征值作为第二个自编码器的输入,进行第二次特征提取,h2=f(W21·h1+b21),其中,h1是第一个隐含层的特征提取值,{W21、b21}是第二个自编码器编码部分的权重值和偏置值;
根据提取到的特征对输入进行重构,
Figure GDA0002279786570000061
其中,{W22、b22} 是第二个自编码器解码部分的权重值和偏置值,h2是第二个隐含层提取的特征值,
Figure GDA0002279786570000062
是第一个隐含层的特征提取值的重构输出;
5)根据第二个隐含层提取到的特征值对输出做预测,
Figure GDA0002279786570000063
其中,h2是第二个隐含层提取的特征值,{W23、b23}是做预测时的权重值和偏置值,
Figure GDA0002279786570000064
是根据第二个隐含层提取的特征值预测的输出值;
6)计算输入量h1和重构输出
Figure GDA0002279786570000065
之间、预测的输出值
Figure GDA0002279786570000066
和预处理后的真实输出量的损失函数,
LGC-GSTAE(θ)=LGCloss(θ)+Lweight(θ)+LCloss(θ)+Lreg(θ)
其中,
Figure GDA0002279786570000067
是基于广义互熵的重构损失项;N是样本总个数,h1是第一个隐含层提取的特征值,
Figure GDA0002279786570000068
是利用第二个隐含层提取的特征对第一个隐含层的重构;
Figure GDA0002279786570000069
是基于互熵损失的稀疏性惩罚项,其中,θ={W21、b21、W22、b22、W23、b23};
Figure GDA00022797865700000610
是预测误差项;其中,
Figure GDA00022797865700000611
是通过第二层隐含层的特征预测的预测值;
多次迭代,通过反向传播算法减小损失函数值更新权重值和偏置值;
7)第二个隐含层经过迭代训练提取到的特征值作为输入训练第三个自编码器,将第二个隐含层的特征值作为第三个自编码器的输入,进行第三次特征提取, h3=f(W31·h2+b31),其中,h2是第二个隐含层的特征提取值,{W31、b31}是第三个自编码器编码部分的权重值和偏置值;
根据提取到的特征对输入进行重构,
Figure GDA0002279786570000071
其中,{W32、b32} 是第三个自编码器解码部分的权重值和偏置值,h3是第三个隐含层提取的特征值,
Figure GDA0002279786570000072
是第二个隐含层的特征提取值的重构输出;
8)根据第三个隐含层提取到的特征值对输出做预测,
Figure GDA0002279786570000073
其中,h3是第三个隐含层提取的特征值,{W33、b33}是做预测时的权重值和偏置值,
Figure GDA0002279786570000074
是根据第三个隐含层提取的特征值预测的输出值;
9)计算输入量h2和重构输出
Figure GDA0002279786570000075
之间、预测的输出值
Figure GDA0002279786570000076
和真实输出量的损失函数,
LGC-GSTAE(θ)=LGCloss(θ)+Lweight(θ)+LCloss(θ)+Lreg(θ)
其中,
Figure GDA0002279786570000077
是基于广义互熵的重构损失项;N是样本总个数,h2是第二个隐含层提取的特征值,
Figure GDA0002279786570000078
是利用第三个隐含层提取的特征对第二个隐含层的重构;
Figure GDA0002279786570000079
是基于互熵损失的稀疏性惩罚项,其中,θ={W31、b31、W32、b32、W33、b33};
Figure GDA00022797865700000710
是预测误差项;其中,N 是样本总个数,ε是在损失函数中平衡重构损失和预测损失权重的权衡系数,y是真实值,
Figure GDA0002279786570000081
是通过第三层隐含层的特征预测的预测值;·多次迭代,通过反向传播算法减小损失函数值更新权重值和偏置值。
10)待3个隐含层都结束迭代训练后,利用每个隐含层提取到的特征值生成门控值,并利用每一个隐含层提取的特征做预测,对每一个隐含层求出的门控值和预测值做点积运算,
Figure GDA0002279786570000082
其中,
Figure GDA0002279786570000083
是第k个隐含层经门控值控制之后求出的预测值,gk是由第k个隐含层提取的特征求出的门控值,yok是由第k个隐含层提取的特征求出的预测值,{Wgk、 bgk}是第k个隐含层求门控值的权重和偏置,{Wyk、byk}是第k个隐含层预测时的权重和偏置;
11)求取最终预测值:
Figure GDA0002279786570000084
其中,
Figure GDA0002279786570000085
是各隐含层输出相加所得到的最终预测值;
12)计算预测值和真实值之间的损失函数,利用反向传播算法更新超参数值;
Figure GDA0002279786570000086
其中,
Figure GDA0002279786570000087
是最终预测值,y是预处理后的真实输出量。
13)将输入层、各隐含层及回归层作为一个整体一起进行训练,将训练集和测试集中的输入量输入组合好的自编码器,通过计算预测NOx排放量和真实NOx排放量之间的损失函数,对组合后的自编码器进行微调,每一次迭代之后都要计算训练集和测试集分别作为输入的损失函数。随迭代次数增加,训练集的损失函数变化曲线如图2所示,测试集的损失函数变化曲线如图3所示。

Claims (3)

1.一种基于广义互熵自编码器的火电厂NOx排放量预测方法,其特征在于包括以下步骤:
步骤一:根据电站实际测点数据,选取锅炉负荷、烟气含氧量、一次风风速、二次风量、排烟温度及煤质数据、磨煤机给粉量、燃尽风挡板开度参数作为模型的输入量,而以NOx排放量作为模型的真实输出量;
步骤二:对采集到的数据进行预处理;
步骤三:将输入量作为门控堆叠目标相关自编码器输入层的输入,利用门控堆叠目标相关自编码器对输入量进行非线性降维和回归;基于广义互熵的门控堆叠目标相关自编码器的非线性降维和回归过程描述如下:
1)将输入量输入到第一个自编码器中,进行第一次特征提取,h1=f(W11·x+b11),x是经预处理后的输入量,{W11、b11}是第一个自编码器编码部分的权重值和偏置值,f(·)是激活函数;
通过提取到的特征对输入进行重构,
Figure FDA0003586027470000011
其中,{W12、b12}是第一个自编码器解码部分的权重值和偏置值,h1是第一个隐含层提取的特征值,
Figure FDA0003586027470000012
是重构输出;
2)根据第一个隐含层提取到的特征值对输出进行预测,
Figure FDA0003586027470000013
其中,{W13、b13}是进行预测的权重值和偏置值,
Figure FDA0003586027470000014
是根据第一个隐含层提取的特征值预测的输出值;
3)计算输入量x和重构输出
Figure FDA0003586027470000015
之间、预测的输出值
Figure FDA0003586027470000016
和预处理后的真实输出量之间基于广义互熵的损失函数,
Figure FDA00035860274700000111
其中,
Figure FDA0003586027470000017
是基于广义互熵的重构损失项;其中α>0是形状参数,Γ(.)是伽马函数,λ=1/βα是核参数,γα,β=α/(2βΓ(1/α))是归一化常数;θ={W11、b11、W12、b12、W13、b13}是需要优化的参数集;x是输入集,
Figure FDA0003586027470000018
是重构输出集;
Figure FDA0003586027470000019
是权重衰减项,用于防止过拟合;其中
Figure FDA00035860274700000110
是层l的节点i和层l+1中的节点j之间的权重,ξ是权重衰减项的系数,并且sl是层l中的节点数,
Figure FDA0003586027470000021
是基于互熵损失的稀疏惩罚项;其中,
Figure FDA0003586027470000022
是互熵定义,
Figure FDA0003586027470000023
是正比例常数,以保证Closs(0)=1;
Figure FDA0003586027470000024
是预测误差项;其中,ε是在损失函数中平衡重构损失和预测损失权重的权衡系数,y是预处理后的真实输出量,
Figure FDA0003586027470000025
是通过第一层隐含层的特征预测的预测值;
多次迭代训练,通过反向传播算法减小损失函数值更新权重值和偏置值;
4)第i个隐含层经过迭代训练后提取到的特征值作为输入训练第i+1个自编码器,将第i个隐含层的特征值作为第i+1个自编码器的输入,进行第i+1次特征提取,hi+1=f(W(i+1)1·hi+b(i+1)1),其中,hi是第i个隐含层的特征提取值,{W(i+1)1、b(i+1)1}是第i+1个自编码器编码部分的权重值和偏置值,i≥1;
根据提取到的特征对输入进行重构,
Figure FDA0003586027470000026
其中,{W(i+1)2、b(i+1)2}是第i+1个自编码器解码部分的权重值和偏置值,hi+1是第i+1个隐含层提取的特征值,
Figure FDA0003586027470000027
是第i个隐含层的特征提取值的重构输出;
5)根据第i+1个隐含层提取到的特征值对输出做预测,
Figure FDA0003586027470000028
其中,hi+1是第i+1个隐含层提取的特征值,{W(i+1)3、b(i+1)3}是做预测时的权重值和偏置值,
Figure FDA0003586027470000029
是根据第i+1个隐含层提取的特征值预测的输出值;
6)计算输入量hi和重构输出
Figure FDA00035860274700000210
之间、预测的输出值
Figure FDA00035860274700000211
和预处理后的真实输出量的损失函数,
计算输入量h1和重构输出
Figure FDA00035860274700000212
之间、预测的输出值
Figure FDA00035860274700000213
和预处理后的真实输出量的损失函数,
Figure FDA00035860274700000214
其中,
Figure FDA0003586027470000031
是基于广义互熵的重构损失项;N是样本总个数,h1是第一个隐含层提取的特征值,
Figure FDA0003586027470000032
是利用第二个隐含层提取的特征对第一个隐含层的重构;
Figure FDA0003586027470000033
是基于互熵损失的稀疏性惩罚项,其中,θ={W21、b21、W22、b22、W23、b23};
Figure FDA0003586027470000034
是预测误差项;其中,
Figure FDA0003586027470000035
是通过第二层隐含层的特征预测的预测值;
多次迭代,通过反向传播算法减小损失函数值更新权重值和偏置值;
7)第二个隐含层经过迭代训练提取到的特征值作为输入训练第三个自编码器,将第二个隐含层的特征值作为第三个自编码器的输入,进行第三次特征提取,h3=f(W31·h2+b31),其中,h2是第二个隐含层的特征提取值,{W31、b31}是第三个自编码器编码部分的权重值和偏置值;
根据提取到的特征对输入进行重构,
Figure FDA0003586027470000036
其中,{W32、b32}是第三个自编码器解码部分的权重值和偏置值,h3是第三个隐含层提取的特征值,
Figure FDA0003586027470000037
是第二个隐含层的特征提取值的重构输出;
8)根据第三个隐含层提取到的特征值对输出做预测,
Figure FDA0003586027470000038
其中,h3是第三个隐含层提取的特征值,{W33、b33}是做预测时的权重值和偏置值,
Figure FDA0003586027470000039
是根据第三个隐含层提取的特征值预测的输出值;
9)计算输入量h2和重构输出
Figure FDA00035860274700000310
之间、预测的输出值
Figure FDA00035860274700000311
和真实输出量的损失
函数,
Figure FDA00035860274700000411
其中,
Figure FDA0003586027470000041
是基于广义互熵的重构损失项;N是样本总个数,h2是第二个隐含层提取的特征值,
Figure FDA0003586027470000042
是利用第三个隐含层提取的特征对第二个隐含层的重构;
Figure FDA0003586027470000043
是基于互熵损失的稀疏性惩罚项,其中,θ={W31、b31、W32、b32、W33、b33};
Figure FDA0003586027470000044
是预测误差项;其中,N是样本总个数,ε是在损失函数中平衡重构损失和预测损失权重的权衡系数,y是真实值,
Figure FDA0003586027470000045
是通过第三层隐含层的特征预测的预测值;
多次迭代,通过反向传播算法减小损失函数值更新权重值和偏置值;
步骤四:待所有自编码器都结束一次迭代训练后,利用每个隐含层提取到的特征值生成门控值,并利用每一个隐含层提取的特征做预测,对每一个隐含层求出的门控值和预测值做点积运算,
Figure FDA0003586027470000046
其中,
Figure FDA0003586027470000047
是第k个隐含层经门控值控制之后求出的预测值,gk是由第k个隐含层提取的特征求出的门控值,yok是由第k个隐含层提取的特征求出的预测值,{Wgk、bgk}是第k个隐含层求门控值的权重和偏置,{Wyk、byk}是第k个隐含层预测时的权重和偏置;
步骤五:各隐含层所得到的预测值
Figure FDA0003586027470000048
相加作为最终预测值
Figure FDA0003586027470000049
计算最终预测值
Figure FDA00035860274700000410
和预处理后的真实输出量之间的损失函数,
Figure FDA0003586027470000051
其中,
Figure FDA0003586027470000052
是最终预测值,y是预处理后的真实输出量,利用反向传播算法更新每个自编码器求门控值和预测时的权重和偏置,直至达到设定的迭代次数或者损失函数值足够小,此时便可利用训练好的门控堆叠目标相关自编码器对NOx排放量进行预测。
2.根据权利要求1所述的一种基于广义互熵自编码器的火电厂NOx排放量预测方法,其特征在于对采集到的数据集进行预处理,预处理过程为
Figure FDA0003586027470000053
Figure FDA0003586027470000054
其中,xIN是输入量,yOUT是输出量,x是预处理后的输入量,y是预处理后的输出量,xIN.min是输入量中的最小值,xIN.max是输入量中的最大值,yOUT.min是输出量中的最小值,yOUT.max是输出量中的最大值,max是期望范围的上限,min是期望范围的下限。
3.根据权利要求1或2所述的一种基于广义互熵自编码器的火电厂NOx排放量预测方法,其特征在于按比例将处理后的输入量随机分成训练集和测试集,前者是用于模型训练的数据集,后者是用于性能测试的数据集,若经过性能测试后准确率没有达到要求,对门控堆叠目标相关自编码器中的参数继续进行更新,直到达到要求。
CN201911003001.0A 2019-10-22 2019-10-22 一种基于广义互熵自编码器的火电厂NOx排放量预测方法 Active CN110782013B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911003001.0A CN110782013B (zh) 2019-10-22 2019-10-22 一种基于广义互熵自编码器的火电厂NOx排放量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911003001.0A CN110782013B (zh) 2019-10-22 2019-10-22 一种基于广义互熵自编码器的火电厂NOx排放量预测方法

Publications (2)

Publication Number Publication Date
CN110782013A CN110782013A (zh) 2020-02-11
CN110782013B true CN110782013B (zh) 2022-06-21

Family

ID=69386216

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911003001.0A Active CN110782013B (zh) 2019-10-22 2019-10-22 一种基于广义互熵自编码器的火电厂NOx排放量预测方法

Country Status (1)

Country Link
CN (1) CN110782013B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111680786B (zh) * 2020-06-10 2023-12-05 中国地质大学(武汉) 一种基于改进权重门控单元的时序预测方法
CN111985695A (zh) * 2020-07-29 2020-11-24 国网甘肃省电力公司 城市综合体用电量预测方法、装置、电子设备及存储介质
CN111985704A (zh) * 2020-08-11 2020-11-24 上海华力微电子有限公司 预测晶圆失效率的方法及其装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104992245A (zh) * 2015-07-09 2015-10-21 南京信息工程大学 一种基于广义熵理论的水环境风险管理动态智能综合分析方法
CN105912790A (zh) * 2016-04-15 2016-08-31 重庆大学 基于深度回归模型的遥感水质监测方法
CN108446529A (zh) * 2018-06-22 2018-08-24 太原理工大学 基于广义互熵—dpca算法的有机朗肯循环系统故障检测方法
CN108921343A (zh) * 2018-06-26 2018-11-30 浙江工业大学 基于堆栈自编码器-支持向量回归的交通流量预测方法
CN109242150A (zh) * 2018-08-15 2019-01-18 中国南方电网有限责任公司超高压输电公司南宁监控中心 一种电网可靠性预测方法
CN109583621A (zh) * 2018-10-12 2019-04-05 中国农业大学 一种基于改进变分模态分解的pso-lssvm短期负荷预测方法
CN110032747A (zh) * 2018-12-05 2019-07-19 太原理工大学 一种燃煤锅炉NOx排放在线测量方法
CN110118979A (zh) * 2018-11-26 2019-08-13 太原理工大学 基于广义互熵的改进差分进化算法估计多径参数的方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104992245A (zh) * 2015-07-09 2015-10-21 南京信息工程大学 一种基于广义熵理论的水环境风险管理动态智能综合分析方法
CN105912790A (zh) * 2016-04-15 2016-08-31 重庆大学 基于深度回归模型的遥感水质监测方法
CN108446529A (zh) * 2018-06-22 2018-08-24 太原理工大学 基于广义互熵—dpca算法的有机朗肯循环系统故障检测方法
CN108921343A (zh) * 2018-06-26 2018-11-30 浙江工业大学 基于堆栈自编码器-支持向量回归的交通流量预测方法
CN109242150A (zh) * 2018-08-15 2019-01-18 中国南方电网有限责任公司超高压输电公司南宁监控中心 一种电网可靠性预测方法
CN109583621A (zh) * 2018-10-12 2019-04-05 中国农业大学 一种基于改进变分模态分解的pso-lssvm短期负荷预测方法
CN110118979A (zh) * 2018-11-26 2019-08-13 太原理工大学 基于广义互熵的改进差分进化算法估计多径参数的方法
CN110032747A (zh) * 2018-12-05 2019-07-19 太原理工大学 一种燃煤锅炉NOx排放在线测量方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Short-Term Wind Speed Forecasting via Stacked Extreme Learning Machine With Generalized Correntropy;Xiong Luo 等;《IEEE Transactions on Industrial Informatics》;20180709;第14卷(第11期);4963-4971 *
基于广义互熵准则的非高斯随机系统故障诊断研究;张彦云;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20190815(第08期);I140-460 *
基于改进堆叠自编码器的火电厂NOx浓度预测方法研究;齐慧月;《万方数据知识服务平台在线公开》;20211217;1-65 *

Also Published As

Publication number Publication date
CN110782013A (zh) 2020-02-11

Similar Documents

Publication Publication Date Title
Ke et al. Short-term electrical load forecasting method based on stacked auto-encoding and GRU neural network
Shamshirband et al. A survey of deep learning techniques: application in wind and solar energy resources
CN110782013B (zh) 一种基于广义互熵自编码器的火电厂NOx排放量预测方法
Chen et al. Short-term wind speed forecasting with principle-subordinate predictor based on Conv-LSTM and improved BPNN
CN113688869B (zh) 一种基于生成对抗网络的光伏数据缺失重构方法
CN112861992B (zh) 基于独立稀疏堆叠自编码器的风电场超短期功率预测方法
CN113554466A (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN114119273A (zh) 一种园区综合能源系统非侵入式负荷分解方法及系统
CN116960978A (zh) 基于风速-功率组合分解重构的海上风电功率预测方法
CN116341717A (zh) 一种基于误差补偿的风速预测方法
CN117748495A (zh) 一种基于残差神经网络的光伏电站短期发电功率预测方法
Li et al. A multi-factor combination prediction model of carbon emissions based on improved CEEMDAN
CN117132132A (zh) 基于气象数据的光伏发电功率预测方法
Chen et al. Research on prediction methods of energy consumption data
CN117151770A (zh) 一种基于注意力机制的lstm碳价预测方法和系统
Wu et al. Combined IXGBoost-KELM short-term photovoltaic power prediction model based on multidimensional similar day clustering and dual decomposition
Qiu et al. Air traffic flow of genetic algorithm to optimize wavelet neural network prediction
Chen et al. Research of Short-Term Wind Speed Forecasting Based on the Hybrid Model of Optimized Quadratic Decomposition and Improved Monarch Butterfly.
CN116347504A (zh) 基于emd-mwoa-lstm的通信基站流量预测方法
CN115860232A (zh) 一种蒸汽负荷预测方法、系统、电子设备及介质
Zheng et al. Stock price prediction based on PCA-LSTM model
Zheng et al. Main steam temperature prediction modeling based on autoencoder and GRU
CN114386666A (zh) 一种基于时空相关性的风电场短期风速预测方法
Wang et al. Financial early warning of listed companies based on fireworks algorithm optimized back-propagation neural network
Zhang et al. A Novel Combined Model Based on Hybrid Data Decomposition, MSWOA and ENN for Short-Term Wind Speed Forecasting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant