CN116050643A - 一种基于集成模型的流程工业污染物排放浓度预测方法 - Google Patents

一种基于集成模型的流程工业污染物排放浓度预测方法 Download PDF

Info

Publication number
CN116050643A
CN116050643A CN202310112463.6A CN202310112463A CN116050643A CN 116050643 A CN116050643 A CN 116050643A CN 202310112463 A CN202310112463 A CN 202310112463A CN 116050643 A CN116050643 A CN 116050643A
Authority
CN
China
Prior art keywords
model
hpo
parameter
prey
svm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310112463.6A
Other languages
English (en)
Inventor
易辉
柴宇恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Tech University
Original Assignee
Nanjing Tech University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Tech University filed Critical Nanjing Tech University
Priority to CN202310112463.6A priority Critical patent/CN116050643A/zh
Publication of CN116050643A publication Critical patent/CN116050643A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/04Constraint-based CAD

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Mathematical Physics (AREA)
  • Human Resources & Organizations (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Geometry (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Hardware Design (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开一种基于集成模型的流程工业污染物排放浓度预测方法,将流程工业中涉及到的多个重要参数作为特征,采用猎人猎物优化算法(HPO)对支持向量机(SVM)模型的惩罚因子、核参数和长短期记忆神经网络(LSTM)模型的神经元个数、学习率进行优化,最后利用猎人猎物优化算法不断迭代寻找出的集成模型最优权重,建立HPO‑SVM‑LSTM集成预测模型。本发明相较于传统的流程工业污染物浓度预测方法,模型泛化能力更强,具有更高的预测精度,能够准确描述流程工业反应过程中相关污染物浓度变化,改善污染物含量测量实时获取的滞后问题,有助于提高喷氨量控制准确性,对减小氨逃逸,对降低入口污染物排放有现实意义。

Description

一种基于集成模型的流程工业污染物排放浓度预测方法
技术领域
本发明涉及流程工业中煤化工预测控制领域,具体是一种基于集成模型的流程工业污染物排放浓度预测方法。
背景技术
流程工业在国民经济中占据主导地位,其发展状况直接影响国家的经济基础,煤化工就属于典型的流程工业。一般的煤化工相关企业都会采用相应的拥有较高效率的脱污技术来进行污染物处理,例如煤电厂都会采用拥有较高脱硝效率的选择性催化还原法(Selective Catalytic Reduction,SCR)技术来进行烟气脱硝,其反应过程为煤粉在锅炉中燃烧会形成烟气,其中包含了氮氧化物(NOx)、SO2等污染物,烟气经过省煤器之后进入SCR脱硝反应器,然后来自氨供应系统的氨气,经稀释风稀释后通过喷氨格栅喷出,在催化剂的作用下有选择性地将NOx还原成无害的N2与H2O,主要反应方程式为:
Figure BDA0004077315540000011
实际反应过程中,由于流程工业现场复杂的工况变化,流程工业运作现场污染物含量会发生波动难以测量,并且实际生产过程中一般采用的分析仪测量污染物含量,时常会出现测量值与实际值有着一定时长的时滞。因此,现阶段大多数流程工业都难以实现污染物的精确测量。
发明内容
本发明针对流程工业中污染物(Nox)排放浓度模型预测精度不高的问题,提供了一种基于集成模型的流程工业污染物排放浓度预测方法。本发明采用猎人猎物优化算法对支持向量机(Support Vector Machine,SVM)模型的惩罚因子c、核参数g和长短期记忆神经网络(Long Short-Term Memory,LSTM)模型的神经元个数m、学习率lr进行优化,然后利用HPO算法不断迭代寻找出的组合模型的最优权重,建立HPO-SVM-LSTM组合预测模型。本发明针对流程工业中煤化工实际生产活动中,污染物(Nox)的排放进行预测,在满足当前污染物(Nox)排放限额的条件下,致力于优化脱硝系统的喷氨量,防止其过多或过少。所提方法兼具SVM模型提高泛化性能、解决高维问题的优势和LSTM模型具有长短期记忆功能和输入数据随时间自动更新的特点,充分提高了模型的拟合效果。与传统机器学习数据建模方法相比,HPO-SVM-LSTM模型泛化能力更强,具有更高的预测精度,能够准确描述SCR脱硝系统的反应过程,可以改善NOX含量测量实时获取的滞后问题,有助于提高喷氨量控制准确性,对减小氨逃逸,降低出口NOX排放有明确的现实意义。
一种基于集成模型的流程工业污染物排放浓度预测方法,包括如下步骤:
步骤S1:采集流程工业运作现场污染物浓度及影响污染物浓度的特征参数的样本数据;
步骤S2:对样本数据进行标准化处理;
步骤S3:以标准化后影响污染物浓度的特征参数的样本数据为模型输入,以标准化后流程工业污染物排放浓度为模型输出,建立支持向量机模型;
步骤S4:引入猎人猎物优化算法HPO,将支持向量机SVM模型的惩罚因子c和核参数g两个参数作为HPO的初始参数,训练返回误差决定惩罚因子和核参数的最终参数(c*、g*),即计算误差寻求最优参数来优化支持向量机模型;
步骤S5:重复步骤S1-S4,建立最终的HPO-SVM预测模型,并对样本测试集数据进行预测,输出HPO-SVM预测模型的预测值F1
步骤S6:以标准化后影响污染物浓度的特征参数的样本数据为模型输入,以标准化后流程工业污染物排放浓度为模型输出,确定长短期记忆神经网络模型网络结构并进行参数初始化,建立长短期记忆神经模型LSM;
步骤S7:将LSM的神经元个数m、学习率lr作为HPO算法初始参数,寻求神经元个数和学习率的最优参数(m*、lr*)来建立LSTM模型;
步骤S8:重复步骤S1-S2、S6-S7,利用最优的神经元个数m*和学习率lr*来建立最终的HPO-LSTM预测模型,并对样本测试集数据进行预测,输出HPO-LSTM预测模型的预测值F2
步骤S9:令HPO-SVM模型的权重参数为a,HPO-LSTM模型权重参数为(1-a),建立HPO-SVM-LSTM预测模型,根据模型表达式F=aF1+(1-a)F2,输出组合模型预测值F;
步骤S10:更新输入样本数据,预测流程工业污染物排放浓度,调整喷氨量。
进一步的,步骤S1中影响污染物浓度的特征参数包括发电机指令功率x1,负荷x2,总一次风量x3,锅炉炉膛总风量x4,一次风机动叶位置反馈x5,送风机动叶位置反馈x6,磨煤机A-D流量燃烧器x7-x10,A-F层右侧二次风流量x11-x16,炉膛前墙上层左侧过燃风流量x17,炉膛前墙左侧过燃风流量x18
进一步的,步骤S3包括如下步骤:
3-1构建SVM回归函数f(x)在高维特征空间的表达式,将标准化后的样本集
Figure BDA0004077315540000022
划分为训练集Z*1和测试集Z*2,则:
Figure BDA0004077315540000021
其中,i=1,2,…m,m表示特征的个数,n为一个相关特征所收集样本的个数,其中n>m,Z*1为输入矢量,表示样本训练集,y*1为SCR脱硝反应器入口的NOx浓度的真实值,
Figure BDA0004077315540000038
为转换到高维空间的映射,ω和b是待定的模型参数,ω是法向量,决定了超平面的方向,b是位移项,决定了超平面与原点间的距离;
3-2引入松弛变量ξi
Figure BDA0004077315540000031
构造下列目标函数,求解ω和b的最优解:
Figure BDA0004077315540000032
s.t.f(Z*1)-y*1≤ε+ξi   (3)
Figure BDA0004077315540000033
Figure BDA0004077315540000034
其中,‖ω‖表示法向量由线性范数空间到非负实数的映射,c是惩罚因子,s.t.表示在优化问题的求解中,目标函数的约束条件,f(Z*1)表示训练集通过目标函数得到的预测值,ε为允许存在的偏差,ξi表示初始松弛变量,
Figure BDA0004077315540000035
表示最优松弛变量;
3-3利用最优化理论将式(1)的二次规划问题转变为对偶问题,并求出ω和b的最优解,最终得到支持向量机的回归函数为:
Figure BDA0004077315540000036
其中,f(x)为支持向量机的最终回归函数,
Figure BDA0004077315540000037
为拉格朗日乘子,αi表示约束条件下的极值,k是支持向量机的核函数,xi表示ω和b的最优解下的变量值,v为模型的幅度参数。
进一步的,步骤3-3中核函数k选择径向基核函数,表达式为:
kg(|x-xi|)=exp(-g|x-xi|2)   (7)
式(4)中:kg为径向基核函数,g为核函数系数,exp为以自然常数e为底的指数函数,x表示初始变量。
进一步的,引入平衡参数,优化公式(7),提高模型预测流程工业污染物排放浓度预测的样本时序数据的准确性,表达式为:
k* g(|x-xi|)=exp(-g|x-xi|2)τ   (9)
其中,k* g表示引入平衡参数后的径向基核函数,τ是平衡参数,其值在迭代过程中从1减小到0.07。
平衡参数τ的计算公式为:
Figure BDA0004077315540000041
其中,it是当前迭代次数,MaxIt是最大迭代次数。
进一步的,步骤S4猎人猎物优化算法,通过引入递减机制,解决猎人猎物算法延迟收敛性的问题。
其中,递减机制,如下式所示:
kbest=round(Λ×N)   (18)
其中,kbest表示最佳搜索代理的数量,round表示狩猎场景的范围,Λ为度量参数,N是搜索代理的数量;
猎物的位置计算为式(17):
Figure BDA0004077315540000042
Figure BDA0004077315540000043
为猎食者根据猎物位置移动到的新位置,
Figure BDA0004077315540000044
是最初猎食的位置,Λ为度量参数,N是搜索代理的数量。
进一步的,猎物更新位置依据下述公式:
Figure BDA0004077315540000045
其中,
Figure BDA0004077315540000046
是猎物的当前位置;
Figure BDA0004077315540000047
是猎物的下一次迭代位置;
Figure BDA0004077315540000048
表示递减机制优化下的猎物当前位置;
Figure BDA0004077315540000049
是递减机制优化下的猎物下一次迭代位置;,Tpos是全局最优位置,Ppos(j)表示猎物的位置,R4是范围[-1,1]内的随机数,R5是[0,1]范围内的随机数,μ(j)表示所有位置的平均值,β是调节参数,Z是自适应参数。
优选的,步骤S9权重参数a选取平均绝对误差进行评价。
与现有技术相比,本发明的有益效果:
本发明针对流程工业中污染物(Nox)排放浓度模型预测精度不高的问题,提供了一种基于集成模型的流程工业污染物排放浓度预测方法。本发明采用猎人猎物优化算法对支持向量机(Support Vector Machine,SVM)模型的惩罚因子c、核参数g和长短期记忆神经网络(Long Short-Term Memory,LSTM)模型的神经元个数m、学习率lr进行优化,然后利用HPO算法不断迭代寻找出的组合模型的最优权重,建立HPO-SVM-LSTM组合预测模型。本发明针对流程工业中煤化工实际生产活动中,污染物(Nox)的排放进行预测,在满足当前污染物(Nox)排放限额的条件下,致力于优化脱硝系统的喷氨量,防止其过多或过少。所提方法兼具SVM模型提高泛化性能、解决高维问题的优势和LSTM模型具有长短期记忆功能和输入数据随时间自动更新的特点,充分提高了模型的拟合效果。与传统机器学习数据建模方法相比,HPO-SVM-LSTM模型泛化能力更强,具有更高的预测精度,能够准确描述SCR脱硝系统的反应过程,可以改善NOX含量测量实时获取的滞后问题,有助于提高喷氨量控制准确性,对减小氨逃逸,降低出口NOX排放有明确的现实意义。
1、本发明本发明采用SVM建立初步的算法模型,从本质上看,SVM避开了从归纳到演绎的传统过程,实现了高效的从训练样本到预报样本的“转导推理”,大大简化了通常的回归问题。
2、SVM的最终决策函数只由少数的支持向量所确定,计算的复杂性取决于支持向量的数目,而不是样本空间的维数,这在某种意义上避免了“维数灾难”。少数支持向量决定了最终结果,这不但可以帮助我们抓住关键样本、“剔除”大量冗余样本,而且注定了该方法不但算法简单,而且具有较好的“鲁棒”性。
3、本发明提出使用HPO算法优化支持向量机模型,HPO算法结构简单,参数较少,具有较强的全局寻优能力且寻优时间短,因此通过HPO算法寻得最优SVM参数来构建SVM模型可以有效提高模型精度。
4、本发明利用最新提出的具有较强的全局搜索与局部寻优能力的HPO搜索算法来对传统长短期记忆神经网络进行优化,克服其在预测时间序列数据方面的不足。将HPO中调整自适应度及超参数的方法替换原LSTM中反向传播中参数更新的梯度下降方法,可以有效地避免在迭代搜索过程中陷入局部极值的概率,从而大大提高模型预测的准确率。同时,利用算法结构简单的HPO替换原有复杂的LSTM模型中的参数更新,同样可以使得预测模型的效率提升。
5、本发明将支持向量机提高泛化性能、解决高维问题的优势和长短期记忆神经网络具有长短期记忆功能和输入数据随时间自动更新的特点相结合,充分提高了模型的拟合效果,具有更高的预测精度。
6、本专利建立的HPO-SVM-LSTM集成模型兼具SVM模型提高泛化性能、解决高维问题的优势和LSTM模型具有长短期记忆功能、输入数据随时间自动更新的特点,使得集成模型实际预测效果出众。与传统机器学习数据建模方法相比,HPO-SVM-LSTM集成模型泛化能力更强,具有更高的预测精度,可以应用于解决现场测量值与实际值有一定时长的时滞问题,为燃煤电厂NOx含量预估决策提供了有力的参考依据。
7、本发明引入平衡参数,使得算法在训练的初始阶段具备了较强的全局寻优能力,同时在大批量、高维度样本数据输入时,也有较优的局部寻优能力,提高了算法的寻优效率及求解精度。提高模型预测流程工业污染物排放浓度预测的样本时序数据的准确性。
8、本发明引入探索和开发之间的度量参数,其值在迭代过程中从1减小到0.02,计算如下:
Figure BDA0004077315540000061
其中P是R1<Λ的索引值,v是所有位置的平均值,α是敏感参数,定义了迭代过程中局部开发精度。
附图说明
图1是本发明的SCR脱硝反应系统;
图2是SCR脱硝系统A侧巡测柜;
图3是SCR脱硝系统B侧巡测柜;
图4是LSTM基本单元图;
图5是HPO算法流程图;
图6是HPO-SVM-LSTM算法流程图;
图7是精准喷氨项目主画面;
图8是HPO-SVM-LSTM全部数据训练效果;
图9是HPO-SVM-LSTM全部数据测试效果;
图10是HPO-SVM-LSTM部分数据测试效果;
图11是SVM与LSTM预测效果对比图;
图12是SVM与HPO-SVM预测效果对比图;
图13是LSTM与HPO-LSTM预测效果对比图;
图14是HPO-SVM-LSTM与单一模型预测效果对比图。
具体实施方式
下面结合附图以及具体实施方法对本发明一种基于集成模型的流程工业污染物排放浓度预测方法作进一步详细说明。
本发明所采用的技术方案是一种基于集成模型的流程工业污染物排放浓度预测方法,解决现有流程工业实际现场中难以实现喷氨量精确控制的问题。本发明采用猎人猎物优化算法对支持向量机模型和长短期记忆神经网络模型的相关参数进行优化,然后利用猎人猎物优化算法不断迭代寻找出的组合模型的最优权重,建立HPO-SVM-LSTM组合预测模型。本发明方法兼具SVM模型提高泛化性能、解决高维问题的优势和LSTM模型具有长短期记忆功能和输入数据随时间自动更新的特点,充分提高了模型的拟合效果。与传统机器学习数据建模方法相比,HPO-SVM-LSTM模型泛化能力更强,具有更高的预测精度,能够准确描述SCR脱硝系统的反应过程,可以改善NOx含量测量实时获取的滞后问题,有助于提高喷氨量控制准确性,对减小氨逃逸,降低出口NOX排放有明确的现实意义。
如图1-图7所示,煤粉在锅炉中燃烧会形成烟气,其中包含了氮氧化物(NOx)、SO2等有害气体,烟气经过省煤器之后进入SCR脱硝反应器,然后来自氨供应系统的氨气,经稀释风稀释后通过喷氨格栅喷出,在催化剂的作用下有选择性地将NOx还原成无害的N2与H2O。
反应方程式为:
4NH3+4NO+O2→4N2+6H2O
4NH3+2NO2+O2→3N2+6H2O
8NH3+6NO2→7N2+12H2O
由于典型烟气中NO占NOx的95%以上,所以NOx脱除主要是以NO的反应式为主。
实际反应过程中,由于现场复杂的工况变化,SCR脱硝反应器入口的NOx含量会发生波动难以测量,并且现阶段实际生产过程中一般采用烟气分析仪测量NOx含量,时常会出现测量值与实际值有着一定时长的时滞,造成喷氨量的过多或过少,而且未完全反应的NH3会以氨逃逸的形式排放到大气中。喷氨量是根据SCR脱硝反应器入口处的NOx浓度来确定的,通过建立脱硝反应器的预测模型,把发电机指令功率(x1),负荷(x2),总一次风量(x3),锅炉炉膛总风量(x4),一次风机动叶位置反馈(x5),送风机动叶位置反馈(x6),磨煤机A-D流量燃烧器(x7-x10),A-F层右侧二次风流量(x11-x16),炉膛前墙上层左侧过燃风流量(x17),炉膛前墙左侧过燃风流量(x18)总共18个对变量作为模型的输入,SCR入口处的NOx浓度作为模型的输出,根据预测值进而确定喷氨量。该脱硝系统预测模型可以为下一步脱硝系统运行以及喷氨量的精确控制奠定基础。
本发明具体按照如下步骤实施:
步骤S1:采集流程工业运作现场污染物浓度及影响污染物浓度的18个重要特征参数实时样本数据;
步骤S2:对S1采集到的原始样本数据进行标准化处理;
步骤S3:广泛应用于模式分类、回归分析和预测等领域的SVM模型,具有提高学习机的泛化能力、解决高维问题的优势,即使是由有限训练样本得到的解,在求解问题时仍能得到较小的误差。以步骤S1-S2挑选处理后的样本数据为模型输入,以流程工业污染物排放浓度为模型输出,建立支持向量机模型;
步骤S4:引入猎人猎物优化算法模型,将支持向量机模型的c、g两个参数作为猎人猎物优化算法的初始参数,训练返回误差决定最终参数(c*、g*),即计算误差寻求最优参数来优化支持向量机模型;
步骤S5:重复步骤S1-S4,建立最终的HPO-SVM预测模型,并对样本测试集数据进行预测,输出HPO-SVM预测模型的预测值F1
步骤S6:以步骤S1-S2挑选处理后的样本数据为模型输入,以流程工业污染物排放浓度为模型输出,确定长短期记忆神经网络模型网络结构并进行参数初始化,建立长短期记忆神经模型;
步骤S7:LSTM模型在挖掘长期历史数据中非线性特征时,具备长短期记忆功能、输入数据随时间自动更新的明显优势且易于实现,但是LSTM模型的不足之处在于计算过于复杂且冗长,另外在模型训练过程中传统的LSTM模型经常出现较强的不稳性,甚至出现梯度消失,所以引入HPO算法模型,将LSTM模型的神经元个数m、学习率lr作为HPO算法初始参数,寻求最优参数(m*、lr*)来建立LSTM模型;
步骤S8:重复步骤S1-S2、S6-S7,利用最优的神经元个数m*和学习率lr*来建立最终的HPO-LSTM预测模型,并对样本测试集数据进行预测,输出HPO-LSTM预测模型的预测值F2
步骤S9:令HPO-SVM模型的权重参数为a,HPO-LSTM模型权重参数为(1-a),建立HPO-SVM-LSTM预测模型,利用猎人猎物优化算法进行不断迭代寻求最优权重参数a,根据模型表达式F=aF1+(1-a)F2,输出组合模型预测值F;
步骤S10:更新输入样本数据,预测流程工业污染物排放浓度,调整喷氨量。
其中,步骤S1中相关指标包括发电机指令功率(x1),负荷(x2),总一次风量(x3),锅炉炉膛总风量(x4),一次风机动叶位置反馈(x5),送风机动叶位置反馈(x6),磨煤机A-D流量燃烧器(x7-x10),A-F层右侧二次风流量(x11-x16),炉膛前墙上层左侧过燃风流量(x17),炉膛前墙左侧过燃风流量(x18)。
进一步的,步骤S2包括如下步骤:
2-1采集流程工业中燃煤电厂运行数据Xm×n(x1,x2,…xm),m为相关特征的个数,n为一个相关特征所收集样本的个数,其中n>m,这里,实验残疾1000组数据,18个特征,每个特征作为1列且有1000行。
2-2对数据进行标准化处理,具体计算公式为:
Figure BDA0004077315540000091
式中:x为标准化前的数据,
Figure BDA0004077315540000092
表示标准化后的数据,μ为样本的均值,σ为样本的标准差。设经过处理后的样本矩阵为
Figure BDA0004077315540000093
Figure BDA0004077315540000094
进一步的,步骤S3包括如下步骤:
3-1构建SVM回归函数f(x)在高维特征空间的表达式,将样本集
Figure BDA0004077315540000095
划分为训练集Z*1和测试集Z*2,则:
Figure BDA0004077315540000096
其中,i=1,2,…m,m表示特征的个数,Z*1为输入矢量,表示样本训练集,y*1为SCR脱硝反应器入口的NOx浓度的真实值,
Figure BDA00040773155400000916
()为转换到高维空间的映射,ω和b是待定的模型参数,ω是法向量,决定了超平面的方向,b是位移项,决定了超平面与原点间的距离;
这里,将1000条样本
Figure BDA0004077315540000097
分成750条训练集
Figure BDA0004077315540000098
和250条测试集
Figure BDA0004077315540000099
3-2引入松弛变量ξi
Figure BDA00040773155400000910
构造下列目标函数,求解ω和b的最优解:
Figure BDA00040773155400000911
s.t.f(Z*1)-y*1≤ε+ξi   (3)
Figure BDA00040773155400000912
Figure BDA00040773155400000913
其中,‖ω‖表示法向量由线性范数空间到非负实数的映射,c是惩罚因子,s.t.表示在优化问题的求解中,目标函数的约束条件,f(Z*1)表示训练集通过目标函数得到的预测值,ε为允许存在的偏差,ξi表示初始松弛变量,
Figure BDA00040773155400000914
表示最优松弛变量;
3-3利用最优化理论将式(1)的二次规划问题转变为对偶问题,并求出ω和b的最优解,最终得到支持向量机的回归函数为:
Figure BDA00040773155400000915
其中,f(x)为支持向量机的最终回归函数,
Figure BDA0004077315540000101
为拉格朗日乘子,αi表示约束条件下的极值,k是支持向量机的核函数,xi表示ω和b的最优解下的变量值,v为模型的幅度参数。
其中,3-3中核函数k选择径向基核函数,表达式为:
kg(|x-xi|)=exp(-g|x-xi|2)   (7)
式(4)中:kg为径向基核函数,g为核函数系数,exp为以自然常数e为底的指数函数,x表示初始变量。
由于该发明应用于流程工业污染物排放浓度预测的样本数据属于时序信息,为了提高SVM模型预测该类信息时的准确性,给公式(7)增添一个平衡参数,τ是探索和开发之间的平衡参数,其值在迭代过程中从1减小到0.02,计算如下:
Figure BDA0004077315540000102
其中,it是当前迭代次数,MaxIt是最大迭代次数。
结合式(7)和式(8)提出了式(9):
k* g(|x-xi|)=exp(-g|x-xi|2)τ   (9)
k* g表示引入平衡参数后的径向基核函数。
进一步的,步骤S4和S7包括如下步骤:
4-1引入HPO算法,用于优化SVM、LSTM参数
参数初始化:在搜索范围内随机初始化位置。
Figure BDA0004077315540000103
其中,
Figure BDA0004077315540000104
是每次的猎食位置,rand表示狩猎场景的范围,l是最小值(下界),u是最大值(上界),d是问题变量的数量(维度),b表示敏感度参数
4-2猎食者搜索:猎食者搜索机制的计算公式如下。
Figure BDA0004077315540000105
其中,
Figure BDA0004077315540000106
是猎食者当前的位置,
Figure BDA0004077315540000107
是猎食者下一次的位置,Ppos是猎物的位置(Ppos(j)表示每次迭代后猎物的位置,j表示对应的迭代次数),μ是所有位置的平均值(μ(j)表示每次迭代所有位置的平均值),Λ为度量参数,Z是自适应参数,由公式(11)计算得到
Figure BDA0004077315540000111
Figure BDA0004077315540000112
其中,
Figure BDA0004077315540000113
Figure BDA0004077315540000114
是[0,1]内的随机向量,P是
Figure BDA0004077315540000115
的索引值,R2是[0,1]内的随机数,IDX表示满足条件(P==0)的向量
Figure BDA0004077315540000116
的索引值(P==0表示索引值恒为0)
Figure BDA00040773155400001114
表示两个任意大小的矩阵间的运算,Λ是探索和开发之间的度量参数,,计算如下:
Figure BDA0004077315540000117
4-3计算猎物的位置Ppos,以便首先根据式(13)计算所有位置的平均值(μ),然后计算每个搜索个体与该平均位置的距离。
Figure BDA0004077315540000118
其中,
Figure BDA0004077315540000119
表示不同的相关特征,n表示一个相关特征所收集样本的个数。
4-4根据式(14)计算欧几里得距离:
Figure BDA00040773155400001110
其中,Deuc(i)表示欧几里得距离,μj表示表示每次迭代所有位置的平均值(另外,需要确定下,这里的μj与下文的μ(j)不是一个含义吧,要是同样内容,需要完全一致),同样的内容
4-5根据式(15),距离位置平均值最大的搜索点被视为猎物的位置(Ppos):
Figure BDA00040773155400001111
Figure BDA00040773155400001112
为猎食者根据猎物位置移动到的新位置,
Figure BDA00040773155400001113
是最初猎食的位置,Λ为度量参数
4-6如果每次迭代都考虑到搜索代理与平均位置(μ)之间的最大距离,则该算法将具有延迟收敛性。根据狩猎场景,当猎食者捕获猎物时,猎物会死亡,而下一次,猎食者会移动到新的猎物位置。为了解决这个问题,考虑一种递减机制,如式(16)所示:
kbest=round(Λ×N)   (18)
其中,kbest表示最佳搜索代理的数量,round表示狩猎场景的范围,N是搜索代理的数量。
4-7改变式(17),将猎物的位置计算为式(19):
Figure BDA0004077315540000121
Figure BDA0004077315540000122
为猎食者根据猎物位置移动到的新位置,
Figure BDA0004077315540000123
是最初猎食的位置,C为度量参数,
4-8在算法开始时,kbest的值等于N。最后一个距离搜索个体的平均位置(μ)最远的搜索个体被选择为猎物,并被猎食者捕获。假设最佳安全位置是最佳全局位置,因为这将使猎物有更好的生存机会,猎食者可能会选择另一个猎物。式(18)用于更新猎物位置:
Figure BDA0004077315540000124
其中,
Figure BDA0004077315540000125
是猎物的当前位置;
Figure BDA0004077315540000126
是猎物的下一次迭代位置,
Figure BDA0004077315540000127
表示递减机制优化下的猎物当前位置;
Figure BDA0004077315540000128
是递减机制优化下的猎物下一次迭代位置;;Tpos是全局最优位置(Tpos(j)表示每次迭代后的全局最优位置);Z是由式(11)计算的自适应参数;R4是范围[-1,1]内的随机数;Λ是探索和开发之间的度量参数,其值在算法的迭代过程中减小,并由式(12)计算;cos函数及其输入参数允许下一个猎物位置在不同半径和角度的全局最优位置,并提高开发阶段的性能。
4-9为了选择猎食者和猎物,结合式(9)和(17)提出了式(19):
Figure BDA0004077315540000129
其中,μ(j)表示每次迭代所有位置的平均值,R5是[0,1]范围内的随机数,β是一个调节参数。
4-10.迭代停止后,将寻优得到的惩罚因子c*和核函数系数g*作为SVM的参数值,神经元个数m*、学习率lr*作为LSTM的参数值。将训练集数据Z*1分别输入SVM模型和LSTM模型进行训练,获得SCR脱硝反应器入口处的NOx浓度预测模型,再将测试集数据Z*2分别输入训练好的模型,对建立的模型的预测效果进行评价。迭代停止后,寻得最优参数惩罚因子c*=54.23和核函数系数g*=22.17作为支持向量机的参数值,最优参数神经元个数m*=23和学习率lr*=0.0026。模型在训练集和测试集结果如图8和图9所示。
优选的,步骤S4和S7中对模型的预测效果进行评价,选取平均绝对误差MAPE和均方根误差RMSE作为模型预测效果的评价指标,步骤S9权重参数a也选取RMSE进行评价
Figure BDA0004077315540000131
Figure BDA0004077315540000132
其中,MAPE表示平均百分比误差,RMSE表示均方根误差,yi表示Nox浓度真实值,
Figure BDA0004077315540000133
表示Nox浓度预测值。
对数据标准化处理后,将其中1500组数据作为训练样本进行模型训练,样本整体训练效果如图8所示;选取500组数据组成测试样本进行模型验证,HPO-SVM-LSTM集成模型对NOx浓度在测试集上的预测结果如图9、图10所示。从图屮可以看出,所提模型在训练集、测试集上的预测效果与实际值相比几近完全吻合,证明该模型在NOx含量预测方面具有较高的精度和泛化性能。图11为传统SVM模型、LSTM模型预测结果与实际值NOx含量的对比图,从图中可以看出两个模型在波峰点和线型上与实际NOx含量都有很大程度的偏差,且存在反向预测情况。图12和图13为经过HPO优化后的SVM模型和LSTM模型预测效果对比图。通过对比图可以看出,优化后的模型在预测精度上都要比原SVM和LSTM模型高且反向预测情况明显减少,同样可以看出HPO-SVM模型具有更高的泛化性能,HPO-LSTM模型也展现出较强的拟合效果。图14为HPO-SVM-LSTM集成模型与HPO-SVM、HPO-LSTM模型预测效果的对比图。不同预测方法利用的数据信息不尽相同,挖掘各方面有用信息的角度不同。从图中可以看出通过最优权重建立的集成模型相比单一的优化模型在预测精度上更具优势。
利用HPO算法分别对SVM的惩罚因子c、核参数g和LSTM的神经元个数m、学习率lr进行寻优,将RMSE作为目标函数,优化后各个模型的参数取值见表1。
表1各个模型的参数取值
Table1 Parameter values of each model
Figure BDA0004077315540000134
Figure BDA0004077315540000141
为更加具体、精确展现各种模型之间的性能对比,本发明将实验所得NOx浓度预测值的计算时长、平均绝对百分比误差、均方根误差作为评价标准,绘制出这四种模型的性能对比表,如表2。
表2各个模型的评价参数Table 2The evaluation parameters of each model
Figure BDA0004077315540000142
上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种基于集成模型的流程工业污染物排放浓度预测方法,其特征在于,包括如下步骤:
步骤S1:采集流程工业运作现场污染物浓度及影响污染物浓度的特征参数的样本数据;
步骤S2:对样本数据进行标准化处理;
步骤S3:以标准化后影响污染物浓度的特征参数的样本数据为模型输入,以标准化后流程工业污染物排放浓度为模型输出,建立支持向量机模型;
步骤S4:引入猎人猎物优化算法HPO,将支持向量机SVM模型的惩罚因子c和核参数g两个参数作为HPO的初始参数,训练返回误差决定惩罚因子和核参数的最终参数c*和g*,即计算误差寻求最优参数来优化支持向量机模型;
步骤S5:重复步骤S1-S4,建立最终的HPO-SVM预测模型,并对样本测试集数据进行预测,输出HPO-SVM预测模型的预测值F1
步骤S6:以标准化后影响污染物浓度的特征参数的样本数据为模型输入,以标准化后流程工业污染物排放浓度为模型输出,确定长短期记忆神经网络模型网络结构并进行参数初始化,建立长短期记忆神经模型LSM;
步骤S7:将LSM的神经元个数m、学习率lr作为HPO算法初始参数,寻求神经元个数和学习率的最优参数m*和lr*来建立LSTM模型;
步骤S8:重复步骤S1-S2、S6-S7,利用最优的神经元个数m*和学习率lr*来建立最终的HPO-LSTM预测模型,并对样本测试集数据进行预测,输出HPO-LSTM预测模型的预测值F2
步骤S9:令HPO-SVM模型的权重参数为a,HPO-LSTM模型权重参数为(1-a),建立HPO-SVM-LSTM预测模型,根据模型表达式F=aF1+(1-a)F2,输出组合模型预测值F;
步骤S10:更新输入样本数据,预测流程工业污染物排放浓度,调整喷氨量。
2.根据权利要求1所述的一种基于集成模型的流程工业污染物排放浓度预测方法,其特征在于:
步骤S1中影响污染物浓度的特征参数包括发电机指令功率x1,负荷x2,总一次风量x3,锅炉炉膛总风量x4,一次风机动叶位置反馈x5,送风机动叶位置反馈x6,磨煤机A-D流量燃烧器x7-x10,A-F层右侧二次风流量x11-x16,炉膛前墙上层左侧过燃风流量x17,炉膛前墙左侧过燃风流量x18
3.根据权利要求1所述的一种基于集成模型的流程工业污染物排放浓度预测方法,其特征在于,
步骤S3包括如下步骤:
3-1构建SVM回归函数f(x)在高维特征空间的表达式,将标准化后的样本集
Figure FDA0004077315530000021
划分为训练集Z*1和测试集Z*2,则:
Figure FDA0004077315530000022
其中,m表示特征的个数,n为一个相关特征所收集样本的个数,并且n>m,Z*1为输入矢量,表示样本训练集,y*1为SCR脱硝反应器入口的NOx浓度的真实值,
Figure FDA0004077315530000023
为转换到高维空间的映射,ω和b是待定的模型参数,ω是法向量,决定了超平面的方向,b是位移项,决定了超平面与原点间的距离;
3-2引入松弛变量ξi
Figure FDA0004077315530000024
构造下列目标函数,求解ω和b的最优解:
Figure FDA0004077315530000025
s.t.f(z*1)-y*1≤ε+ξi                (3)
Figure FDA0004077315530000026
Figure FDA0004077315530000027
其中,‖ω‖表示法向量由线性范数空间到非负实数的映射,c是惩罚因子,s.t.表示在优化问题的求解中,目标函数的约束条件,f(Z*1)表示训练集通过目标函数得到的预测值,ε为允许存在的偏差,ξi表示初始松弛变量,
Figure FDA0004077315530000028
表示最优松弛变量;
3-3利用最优化理论将式(1)的二次规划问题转变为对偶问题,并求出ω和b的最优解,最终得到支持向量机的回归函数为:
Figure FDA0004077315530000029
其中,f(x)为支持向量机的最终回归函数,
Figure FDA00040773155300000210
为拉格朗日乘子,αi表示约束条件下的极值,k是支持向量机的核函数,xi表示ω和b的最优解下的变量值,v为模型的幅度参数。
4.根据权利要求3所述的一种基于集成模型的流程工业污染物排放浓度预测方法,其特征在于,
步骤3-3中核函数k选择径向基核函数,表达式为:
kg(|x-xi|)=exp(-g|x-xi|2)                    (7)
式(4)中:kg为径向基核函数,g为核函数系数,exp为以自然常数e为底的指数函数,x表示初始变量。
5.根据权利要求4所述的一种基于集成模型的流程工业污染物排放浓度预测方法,其特征在于:
引入平衡参数,优化公式(7),提高模型预测流程工业污染物排放浓度预测的样本时序数据的准确性,表达式为:
k* g(|x-xi|)=exp(-g|x-xi|2)τ                (9)
其中,k* g表示引入平衡参数后的径向基核函数,τ是平衡参数,其值在迭代过程中从1减小到0.07。
6.根据权利要求5所述的一种基于集成模型的流程工业污染物排放浓度预测方法,其特征在于,平衡参数τ的计算公式为:
Figure FDA0004077315530000031
其中,it是当前迭代次数,MaxIt是最大迭代次数。
7.根据权利要求6所述的一种基于集成模型的流程工业污染物排放浓度预测方法,其特征在于,步骤S4猎人猎物优化算法,通过引入递减机制,解决猎人猎物算法延迟收敛性的问题。
8.根据权利要求7所述的一种基于集成模型的流程工业污染物排放浓度预测方法,其特征在于:
递减机制参照下述公式:
kbest=round(Λ×N)                     (18)
其中,kbest表示最佳搜索代理的数量,round表示狩猎场景的范围,N是搜索代理的数量;
猎物的位置计算为:
Figure FDA0004077315530000032
Figure FDA0004077315530000033
为猎食者根据猎物位置移动到的新位置,
Figure FDA0004077315530000034
是最初猎食的位置,Λ为度量参数。
9.根据权利要求8所述的一种基于集成模型的流程工业污染物排放浓度预测方法,其特征在于,猎物更新位置依据下述公式:
Figure FDA0004077315530000041
其中,
Figure FDA0004077315530000042
表示递减机制优化下的猎物当前位置;
Figure FDA0004077315530000043
是递减机制优化下的猎物下一次迭代位置,Tpos是全局最优位置,Ppos(j)表示猎物的位置,R4是范围[-1,1]内的随机数,R5是[0,1]范围内的随机数,μ(j)表示所有位置的平均值,β是调节参数,Z是自适应参数。
10.根据权利要求9所述的一种基于集成模型的流程工业污染物排放浓度预测方法,其特征在于:步骤S9权重参数a选取平均绝对误差进行评价。
CN202310112463.6A 2023-02-14 2023-02-14 一种基于集成模型的流程工业污染物排放浓度预测方法 Pending CN116050643A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310112463.6A CN116050643A (zh) 2023-02-14 2023-02-14 一种基于集成模型的流程工业污染物排放浓度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310112463.6A CN116050643A (zh) 2023-02-14 2023-02-14 一种基于集成模型的流程工业污染物排放浓度预测方法

Publications (1)

Publication Number Publication Date
CN116050643A true CN116050643A (zh) 2023-05-02

Family

ID=86119950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310112463.6A Pending CN116050643A (zh) 2023-02-14 2023-02-14 一种基于集成模型的流程工业污染物排放浓度预测方法

Country Status (1)

Country Link
CN (1) CN116050643A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116862079A (zh) * 2023-09-04 2023-10-10 应辉环境科技服务(烟台)有限公司 一种企业污染物排放预测方法及预测系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116862079A (zh) * 2023-09-04 2023-10-10 应辉环境科技服务(烟台)有限公司 一种企业污染物排放预测方法及预测系统
CN116862079B (zh) * 2023-09-04 2023-12-05 应辉环境科技服务(烟台)有限公司 一种企业污染物排放预测方法及预测系统

Similar Documents

Publication Publication Date Title
CN110368808B (zh) 一种scr烟气脱硝系统的喷氨量控制方法及系统
CN106873381B (zh) 喷氨控制系统
CN110263395A (zh) 基于数值模拟和数据分析的电厂脱硝运行优化方法及系统
CN112488145B (zh) 一种基于智能化方法的NOx在线预测方法及系统
CN111985796A (zh) 基于随机森林和智能算法预测混凝土结构耐久性的方法
Abonyi et al. Fuzzy modeling with multivariate membership functions: Gray-box identification and control design
CN112613237B (zh) 一种基于LSTM的CFB机组NOx排放浓度的预测方法
CN109670625A (zh) 基于无迹卡尔曼滤波最小二乘支持向量机的NOx排放浓度预测方法
Adams et al. Deep reinforcement learning optimization framework for a power generation plant considering performance and environmental issues
CN111460726B (zh) 一种煤泥流化床锅炉脱硝系统氨逃逸的优化方法
CN116050643A (zh) 一种基于集成模型的流程工业污染物排放浓度预测方法
CN113094988A (zh) 一种基于数据驱动的浆液循环泵运行优化方法及系统
CN109766666A (zh) 基于低氮燃烧与SNCR-SCR协同控制的锅炉烟气排放NOx浓度预测方法
Tang et al. Predictive control of SCR denitrification system in thermal power plants based on GA‐BP and PSO
CN115437245A (zh) 一种基于燃烧状态预测模型的锅炉优化控制方法
CN109933884B (zh) 一种面向燃煤机组scr脱硝系统神经网络逆控制的方法
CN116128136A (zh) 一种基于LSO-CatBoost的燃煤电厂锅炉NOX排放预测方法
CN115755624A (zh) 一种基于进化算法的燃煤锅炉多目标优化方法
CN115113519A (zh) 一种煤-煤气混烧锅炉脱硝系统出口NOx浓度预警方法
CN116312869A (zh) 催化裂化再生烟气氮氧化物预测方法、装置及系统
Liu et al. A novel robust dynamic method for NOx emissions prediction in a thermal power plant
CN113935230A (zh) 基于注意力机制LSTM模型实现NOx排放量预测方法
CN113435584A (zh) 一种基于lstm的scr出口氮氧化物浓度预测方法
CN113742989A (zh) 燃烧优化控制方法、装置、存储介质及电子设备
Tang et al. Dynamic prediction model for NOx emission at the outlet of SCR system based on extreme learning machine

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination