CN116151438A - 流程工业污染物排放浓度预测方法及系统 - Google Patents

流程工业污染物排放浓度预测方法及系统 Download PDF

Info

Publication number
CN116151438A
CN116151438A CN202310035441.4A CN202310035441A CN116151438A CN 116151438 A CN116151438 A CN 116151438A CN 202310035441 A CN202310035441 A CN 202310035441A CN 116151438 A CN116151438 A CN 116151438A
Authority
CN
China
Prior art keywords
determining
concentration
data
pollutant
process industry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310035441.4A
Other languages
English (en)
Inventor
易辉
董露
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Tech University
Original Assignee
Nanjing Tech University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Tech University filed Critical Nanjing Tech University
Priority to CN202310035441.4A priority Critical patent/CN116151438A/zh
Publication of CN116151438A publication Critical patent/CN116151438A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0633Workflow analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Manufacturing & Machinery (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种流程工业污染物排放浓度预测方法及系统,其中,方法包括:基于流程工业历史运行数据,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间;其中,流程工业历史运行数据包括:相关特征历史数据和对应时刻的污染物浓度历史数据;相关特征为流程工业中与污染物浓度相关度较高的特征;根据迟滞时间,采用滑动窗格求平均值重构样本数据,确定样本数据集;使用样本数据集训练支持向量机回归模型,确定目标污染物浓度预测模型;基于流程工业相关特征实际数据,根据目标污染物浓度预测模型,确定污染物排放浓度。能够有效地提高流程工业污染物的预测精度,减少环境污染。

Description

流程工业污染物排放浓度预测方法及系统
技术领域
本发明涉及流程工业预测控制技术领域,尤其涉及一种流程工业污染物排放浓度预测方法及系统。
背景技术
流程工业(Process industry),是指基于通过物理和/或化学变化进行生产的行业,流程工业会产生大量化学污染物,以废水、废气、废渣甚至危化品等形式排放到环境中。为了消除污染物对人和自然环境的不利影响,工厂通常会使用化学反应使有害物质转化为对人和自然无害的物质。然而充分的化学反应对物质浓度适配性要求很高,而往往传感器测得的污染物浓度具有滞后性。
以火力发电为列,火力发电属于典型的流程工业,煤炭在锅炉中燃烧这一过程会排放大量的NOx(氮氧化合物),目前多数燃煤电厂使用SCR(选择性催化还原技术,Selective Catalytic Reduction,SCR)脱硝系统实现NOx减排,该方法通过氨气和NOx化学反应生成无污染的氮气和水进而实现脱硝。在发电过程中,通常采取过量喷氨的方法来保证NOx排放达到规定要求,然而过量喷氨不仅会使发电成本升高还会引起大量的氨逃逸造成二次污染。
通过NOx浓度值可以计算出喷氨量的大小,然而在实际发电过程中,NOx浓度测量仪和喷氨执行机构存在明显的延时问题,很难实现喷氨量和NOx浓度高效匹配。因此现阶段大多数的火电厂都难以实现喷氨量的精确控制。
因此,如何提供一种流程工业污染物排放浓度预测方法及系统、电子设备和存储介质,提高流程工业污染物排放的预测精度,减少环境污染,成为亟待解决的问题。
发明内容
针对现有技术中的缺陷,本发明实施例提供一种流程工业污染物排放浓度预测方法及系统。
本发明提供一种流程工业污染物排放浓度预测方法,包括:
基于流程工业历史运行数据,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间;其中,流程工业历史运行数据包括:相关特征历史数据和对应时刻的污染物浓度历史数据;相关特征为流程工业中与污染物浓度相关度较高的特征;
根据迟滞时间,采用滑动窗格求平均值重构样本数据,确定样本数据集;
使用样本数据集训练支持向量机回归模型,确定目标污染物浓度预测模型;
基于流程工业相关特征实际数据,根据目标污染物浓度预测模型,确定污染物排放浓度。
根据本发明提供的流程工业污染物排放浓度预测方法,在基于流程工业历史运行数据,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间步骤之前,还包括:
机理分析流程工业工作原理,确定相关特征。
根据本发明提供的流程工业污染物排放浓度预测方法,基于流程工业历史运行数据,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间,具体包括:
对流程工业历史运行数据进行预处理,获得相关特征样本矩阵和污染物浓度样本矩阵;其中,预处理包括:缺失值填补、异常值处理和归一化;
基于相关特征样本矩阵和污染物浓度样本矩阵,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间。
根据本发明提供的流程工业污染物排放浓度预测方法,根据迟滞时间,采用滑动窗格求平均值重构样本数据,确定样本数据集,具体包括:
基于相关特征样本矩阵,根据迟滞时间,创建数据窗格矩阵;
根据数据窗格矩阵,采用滑动窗格求平均值重构相关特征样本矩阵的样本数据,确定重构后的相关特征样本矩阵;
基于重构后的相关特征样本矩阵和对应时刻的污染物浓度样本矩阵,确定样本数据集。根据本发明提供的流程工业污染物排放浓度预测方法,其特征在于,使用样本数据集训练支持向量机回归模型,确定目标污染物浓度预测模型,具体包括:
构建支持向量机回归函数在高维特征空间的表达式,确定支持向量机回归模型和目标函数;
使用样本数据集训练支持向量机回归模型,根据目标函数,确定模型参数最优解;
根据模型参数最优解,确定目标污染物浓度预测模型。
根据本发明提供的流程工业污染物排放浓度预测方法,使用样本数据集训练支持向量机回归模型,根据目标函数,确定模型参数最优解,具体包括:
使用样本数据集训练支持向量机回归模型;
根据目标函数,采用萤火虫优化算法优化模型参数,确定模型参数最优解。
根据本发明提供的流程工业污染物排放浓度预测方法,根据目标函数,采用萤火虫优化算法优化模型参数,确定模型参数最优解,具体包括:
根据目标函数,采用改进的萤火虫优化算法优化模型参数,确定模型参数最优解;
其中,改进的萤火虫优化算法中,根据萤火虫位置,引入萤火虫发光强度得分函数的公式为:
Figure BDA0004049121730000031
式中,
Figure BDA0004049121730000032
为第i只萤火虫位置下的预测值,yi为实际值,n为样本的个数。
本发明还提供一种流程工业污染物排放浓度预测系统,包括:迟滞时间计算单元、样本数据重构单元、预测模型确定单元和排放浓度预测单元;
迟滞时间计算单元,用于基于流程工业历史运行数据,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间;其中,流程工业历史运行数据包括:相关特征历史数据和对应时刻的污染物浓度历史数据;相关特征为流程工业中与污染物浓度相关度较高的特征;
样本数据重构单元,用于根据迟滞时间,采用滑动窗格求平均值重构样本数据,确定样本数据集;
预测模型确定单元,用于使用样本数据集训练支持向量机回归模型,确定目标污染物浓度预测模型;
排放浓度预测单元,用于基于流程工业相关特征实际数据,根据目标污染物浓度预测模型,确定污染物排放浓度。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如上述任一种流程工业污染物排放浓度预测方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种流程工业污染物排放浓度预测方法的步骤。
本发明提供的流程工业污染物排放浓度预测方法及系统,通过选取与污染物浓度相关度较高的特征作为相关特征,根据相关特征历史数据和对应时刻的污染物浓度历史数据,使用最大信息数计算迟滞时间,并利用滑动窗口的方法重构数据,有效提高了数据特征和污染物浓度的相关性,提高污染物浓度预测的准确性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的流程工业污染物排放浓度预测方法流程图;
图2为本现有技术提供的SCR脱硝系统示意图;
图3为本发明提供的流程工业污染物排放浓度预测方法流程示意图;
图4为本发明提供的部分特征MIC变化示意图;
图5为本发明提供的重构数据方法示意图;
图6为本发明提供的模型训练结果示意图;
图7为本发明提供的模型预测结果示意图;
图8为本发明提供的流程工业污染物排放浓度预测系统结构示意图;
图9为本发明提供的电子设备的实体结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
以火电厂NOx浓度预测为例,图2为本现有技术提供的SCR脱硝系统示意图,如图2所示,多数燃煤电厂使用SCR脱硝系统实现NOx减排,该方法通过氨气和NOx化学反应生成无污染的氮气和水进而实现脱硝。SCR脱硝系统已经成为大型火电机组实现超低排放的重要设备。
主要反应方程式为:
Figure BDA0004049121730000051
在发电过程中,通常采取过量喷氨的方法来保证NOx排放达到规定要求。然而过量喷氨不仅会使发电成本升高还会引起大量的氨逃逸造成二次污染。通过NOx浓度值可以计算出喷氨量的大小,然而在实际发电过程中,NOx浓度测量仪和喷氨执行机构存在明显的延时问题,很难实现喷氨量和NOx浓度高效匹配。因此,现阶段大多数的火电厂都难以实现喷氨量的精确控制。
为了解决现有技术存在的问题,本发明提供一种流程工业污染物排放浓度预测方法,以NOx作为流程工业中的污染物,能够实现电厂SCR脱硝反应器入口NOx浓度进行准确预测,为下一步脱硝系统的优化运行以及喷氨量的精确控制奠定了基础,有效减少污染。
图1为本发明提供的流程工业污染物排放浓度预测方法流程图,如图1所示,本发明提供一种流程工业污染物排放浓度预测方法,包括:
步骤S1,基于流程工业历史运行数据,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间;其中,流程工业历史运行数据包括:相关特征历史数据和对应时刻的污染物浓度历史数据;相关特征为流程工业中与污染物浓度相关度较高的特征;
步骤S2,根据迟滞时间,采用滑动窗格求平均值重构样本数据,确定样本数据集;
步骤S3,使用样本数据集训练支持向量机回归模型,确定目标污染物浓度预测模型;
步骤S4,基于流程工业相关特征实际数据,根据目标污染物浓度预测模型,确定污染物排放浓度。
具体的,在进行污染物排放浓度预测之前,需在目标流程工业中与污染物浓度相关度较高的特征中确定相关特征,相关特征可以是选取按相关度顺序排序中最靠前的预设数量的特征。可以理解的是,相关度的具体确定方法,以及相关特征的具体数量和类别可根据实际需求进行设置,本发明对此不作限定。
为了便于理解,以火电厂NOx浓度预测为例,将NOx作为流程工业中的污染物对本发明进行详细说明。可以理解的是,在本发明实际应用中,流程工业的具体生产方式,以及污染物的具体类型可根据实际需求进行确定,本发明对此不作限定。
在确定相关特征后,考虑到NOx(污染物)浓度测量仪和喷氨执行机构存在明显延时问题,在步骤S1中,基于火电厂历史运行数据中相关特征历史数据和对应时刻的NOx浓度历史数据,根据最大信息系数(Maximal Information Coefficient,MIC),确定NOx浓度相对于各相关特征的迟滞时间。
可以理解的是,火电厂历史运行数据按时刻记录,相关特征历史数据具有对应时刻的NOx浓度数据。若记录相关特征历史数据为Xm×n(x1,x2,L xm),m为相关特征的个数,n为一个相关特征所收集样本的个数,其中n>m,那么NOx浓度历史数据Yn×1(y1,y2,L yn)。
在步骤S2中,根据计算得到各相关系数的迟滞时间,采用滑动窗格求平均值重构样本数据,将滑动矩阵中的样本数据更新为与前后元素(连续三个元素)的平均值,确定样本数据集。
可以理解的是,在采用滑动窗格求平均值重构样本数据时,窗格矩阵边缘的元素无法计算平均值,保留原始值。
确定样本训练集后,在步骤S3中,使用样本数据集训练支持向量机(SupportVector Machine,SVM)回归模型,得到最优参数确定目标NOx浓度预测模型。
可以理解的是,训练模型时,确定支持向量机回归模型最优参数的具体算法,可根据实际需求进行选择,如粒子群算法、萤火虫优化算法和蚁群算法等,本发明对此不作限定。
确定好目标NOx浓度预测模型后,即可进行NOx排放浓度的预测,需获取预测时刻火电厂相关特征实际数据,在步骤S4中,将火电厂相关特征实际数据,输入目标NOx浓度预测模型,输出结果即为预测的NOx排放浓度。
本发明提供的流程工业污染物排放浓度预测方法,通过选取与污染物浓度相关度较高的特征作为相关特征,根据相关特征历史数据和对应时刻的污染物浓度历史数据,使用最大信息数计算迟滞时间,并利用滑动窗口的方法重构数据,有效提高了数据特征和污染物浓度的相关性,提高污染物浓度预测的准确性。
可选的,根据本发明提供的流程工业污染物排放浓度预测方法,在基于流程工业历史运行数据,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间步骤之前,还包括:
机理分析流程工业工作原理,确定相关特征。
具体的,以流程工业中火电厂为例,对火电厂工业工作原理进行机理分析,确定相关特征。在根据最大信息系数,确定NOx浓度相对于各相关特征的迟滞时间步骤之前,需要在目标SCR脱硝系统中与NOx浓度相关度较高的特征中确定相关特征。对采集到的SCR脱硝系统中的数据进行机理分析,确定与NOx浓度相关度较高的特征。
根据机理分析,确定的相关特征包括:负荷指令、一次风煤比、二次风煤比、给煤机A-F煤量、省煤器氧量、一次风总风量、二次风A风量和二次风B风量,共13个相关特征。
其中,负荷指令是依据实际需求电功率给发电厂所下发的指令;给煤机A-F煤量为标号A到F的给煤机所给燃烧锅炉煤的质量;一次风总风量为在一个燃烧周期第一次往锅炉中加入的空气流量;二次风A风量和二次风B风量为在一个燃烧周期第二次分别在A和B号口加入的空气流量;省煤器氧量是省煤器所含氧气的量;一次风煤比为锅炉一次风总风量和总煤量的比值;二次风煤比为锅炉二次风总风量和总煤量的比值。
本发明提供的流程工业污染物排放浓度预测方法,通过对采集到的选择性催化还原技术脱硝系统中的数据进行机理分析,确定与污染物浓度相关度较高的特征作为相关特征,根据相关特征历史数据和对应时刻的污染物浓度历史数据,使用最大信息数计算迟滞时间,并利用滑动窗口的方法重构数据。采用相关特征选取和迟滞时间计算两种方式,联合进一步提高了数据特征和污染物浓度的相关性,从而提高污染物浓度预测的准确性。
可选的,根据本发明提供的流程工业污染物排放浓度预测方法,基于流程工业历史运行数据,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间,具体包括:
对流程工业历史运行数据进行预处理,获得相关特征样本矩阵和污染物浓度样本矩阵;其中,预处理包括:缺失值填补、异常值处理和归一化;
基于相关特征样本矩阵和污染物浓度样本矩阵,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间。
具体的,图3为本发明提供的流程工业污染物排放浓度预测方法流程示意图,如图3所示,在获取流程工业历史运行数据后,由于数据可能存在缺失或异常等情况,直接使用会影响最终模型预测的精确度,在使用数据前,还需要对数据进行预处理,预处理包括:缺失值填补、异常值处理和归一化。
对流程工业(火电厂)历史运行数据进行预处理,获得相关特征样本矩阵和NOx(污染物)浓度样本矩阵。
以预处理相关特征历史数据Xm×n(x1,x2,L xm)为例,对本发明预处理步骤进行说明。
采用上下取均值的方法对缺失值进行填补。及第i个特征的j行为缺失值,其填补方式为:
Figure BDA0004049121730000081
使用3σ原则进行异常值处理,数值处于(μ-3σ,μ+3σ)之外的数据为异常值,其中μ为均值,σ为标准差。对于第i列特征:
Figure BDA0004049121730000091
Figure BDA0004049121730000092
对经过缺失值填补和异常值处理之后的数据进行归一化处理,对于第i列特征,其归一化后的值为:
Figure BDA0004049121730000093
其中
Figure BDA0004049121730000094
Figure BDA0004049121730000095
分别为第i列特征的最大值和最小值,为归一化后的值。设经过处理后的样本矩阵为
Figure BDA0004049121730000096
使用上述方法相同的步骤处理NOx浓度历史数据,即可得到经处理后的样本矩阵
Figure BDA0004049121730000097
具体步骤在此不做赘述。
基于预处理后的相关特征样本矩阵和NOx浓度样本矩阵,根据最大信息系数,确定NOx浓度相对于各相关特征的迟滞时间。
影响NOx浓度的相关特征样本矩阵
Figure BDA0004049121730000098
和NOx浓度样本矩阵
Figure BDA0004049121730000099
其中
Figure BDA00040491217300000910
m为相关特征的个数,n为一个相关特征所收集样本的个数,其中n>m。
选择样本矩阵
Figure BDA00040491217300000911
中的
Figure BDA00040491217300000912
列和NOx浓度实际值yt,其中yt时间序列长度和
Figure BDA00040491217300000913
相等。计算
Figure BDA00040491217300000914
和yt的互信息值:
Figure BDA00040491217300000915
式中,
Figure BDA00040491217300000916
为变量
Figure BDA00040491217300000917
和yt之间的联合概率,即
Figure BDA00040491217300000918
和yt两个事件同时发生的概率。
Figure BDA00040491217300000919
和p(yt)分别为
Figure BDA00040491217300000920
和yt的边缘概率,即
Figure BDA00040491217300000921
和yt单独发生的概率。
对求得的互信息值进行归一化,即得最大信息数(MIC):
Figure BDA00040491217300000922
例如,将NOx浓度实际值yt向后推q倍(q=1,2,3,…,60),设单位时间为T=5s得到yt+qT,按照上述方法计算
Figure BDA00040491217300000923
和yt+qT的MIC。从中得到最大的MIC对应的q倍单位时间qT即为NOx浓度值相对于特征
Figure BDA00040491217300000924
的最佳迟滞时间ti
按上述步骤求得NOx浓度值相对于m个特征的最佳迟滞时间t(t1,t2,L,tm)。
以本发明实际应用为例,图4为本发明提供的部分特征MIC变化示意图,(a)一次风煤比、(b)负荷指令、(c)给煤机B煤量和(d)省煤器氧量的MIC变化如图4所示。选择MIC值最大对应的q倍单位时间qT作为最佳迟滞时间ti
本发明提供的流程工业污染物排放浓度预测方法,通过选取与污染物浓度相关度较高的特征作为相关特征,根据相关特征历史数据和对应时刻的污染物浓度历史数据,基于数据分析,使用统计学中的最大信息数求出锅炉数据各特征相对于污染物浓度的迟滞时间,并利用滑动窗口的方法重构数据,有效提高了数据特征和污染物浓度的相关性,提高污染物浓度预测的准确性。以流程工业中火电厂为例,针对火电厂NOx浓度进行预测,在满足当前NOx排放限额的条件下,优化脱硝系统的喷氨量,防止其过多或过少,实现喷氨量的精确控制,有效减少环境污染。
可选的,根据本发明提供的流程工业污染物排放浓度预测方法,根据迟滞时间,采用滑动窗格求平均值重构样本数据,确定样本数据集,具体包括:
基于相关特征样本矩阵,根据迟滞时间,创建数据窗格矩阵;
根据数据窗格矩阵,采用滑动窗格求平均值重构相关特征样本矩阵的样本数据,确定重构后的相关特征样本矩阵;
基于重构后的相关特征样本矩阵和对应时刻的污染物浓度样本矩阵,确定样本数据集。
具体的,确定最佳迟滞时间t(t1,t2,L,tm)后,基于相关特征样本矩阵,根据迟滞时间,创建数据窗格矩阵。
数据窗格矩阵为:
Figure BDA0004049121730000101
式中,s为最佳迟滞时间的最大值。
图5为本发明提供的重构数据方法示意图,窗格矩阵滑动重构样本数据的方法如图5所示。依据最佳迟滞时间t(t1,t2,L,tm)从窗格矩阵D(s×m)中获取对应的最有相关度的列特征值,如a特征值:
Figure BDA0004049121730000111
通过上述方法从窗格矩阵中重构1条新样本数据:
x=(aj,bj,L,nj);
重构完所有数据后得到重构后的相关特征样本矩阵,基于重构后的相关特征样本矩阵和对应时刻的污染物浓度样本矩阵,确定样本数据集。
利用滑动窗口的方法重构数据能够优化数据特征,提高数据所含信息的质量,从而增加特征与污染物浓度的相关性,进一步提升所建模型的精度。并且采用求取均值的方式重构数据,可以提高模型的鲁棒性。
本发明提供的流程工业污染物排放浓度预测方法,通过选取与污染物浓度相关度较高的特征作为相关特征,根据相关特征历史数据和对应时刻的污染物浓度历史数据,基于数据分析,使用统计学中的最大信息数求出锅炉数据各特征相对于污染物浓度的迟滞时间,并利用滑动窗口的方法重构数据,有效提高了数据特征和污染物浓度的相关性,提高污染物浓度预测的准确性。
可选的,根据本发明提供的流程工业污染物排放浓度预测方法,其特征在于,使用样本数据集训练支持向量机回归模型,确定目标污染物浓度预测模型,具体包括:
构建支持向量机回归函数在高维特征空间的表达式,确定支持向量机回归模型和目标函数;
使用样本数据集训练支持向量机回归模型,根据目标函数,确定模型参数最优解;
根据模型参数最优解,确定目标污染物浓度预测模型。
具体的,在模型训练时可将样本数据集
Figure BDA0004049121730000112
划分为训练集Xtrain和测试集Xtest
构建SVM回归函数f(x)在高维特征空间的表达式:
ytrain=ωTφ(Xtrain)+β;式中,φ(Xtrain)为Xtrain转换到高维空间的映射,ω和β是待确定的模型参数。
引入松弛变量ξi
Figure BDA0004049121730000121
构造下列目标函数,求解ω和β的最优解:
Figure BDA0004049121730000122
s.t.f(Xtrain)-ytrain≤ε+ξi
ytrain-f(Xtrain)≤ε+ξi *
ξi≥0,
Figure BDA0004049121730000123
i=1,2,L,n。
式中,c是惩罚因子,ε为允许存在的偏差,ξi
Figure BDA0004049121730000124
为松弛变量。
使用样本数据集训练支持向量机回归模型,根据目标函数,确定模型参数最优解。
利用最优化理论将求解ω和β最优解这个二次规划问题转变为对偶问题,并求出ω和β的最优解,确定目标污染物浓度预测模型。
最终得到支持向量机的回归函数为:
Figure BDA0004049121730000125
其中,
Figure BDA0004049121730000126
和αi为拉格朗日乘子,k是支持向量机的核函数,β为模型参数。
核函数k选择径向基核函数:
Kg(|x-xi|)=exp(-g|x-xi|2);
式中,kg为径向基核函数,g为核函数系数,exp为以自然常数e为底的指数函数。
本发明提供的流程工业污染物排放浓度预测方法,通过选取与污染物浓度相关度较高的特征作为相关特征,根据相关特征历史数据和对应时刻的污染物浓度历史数据,使用最大信息数计算迟滞时间,并利用滑动窗口的方法重构数据,有效提高了数据特征和污染物浓度的相关性,提高污染物浓度预测的准确性。并采用支持向量机回归模型,根据求取模型最优参数确定目标污染物浓度预测模型,支持向量机回归模型相比于深度学习网络建模时间短,可以快速适应流程工业中工况改变(如火电厂中锅炉变工况和煤质改变等)导致的模型失配问题。
可选的,根据本发明提供的流程工业污染物排放浓度预测方法,使用样本数据集训练支持向量机回归模型,根据目标函数,确定模型参数最优解,具体包括:
使用样本数据集训练支持向量机回归模型;
根据目标函数,采用萤火虫优化算法优化模型参数,确定模型参数最优解。
具体的,在使用样本数据集训练支持向量机回归模型时,根据目标函数,采用萤火虫优化算法(Firefly Algorithm,FA)优化模型参数,确定模型参数最优解。将确定的模型参数最优解代入模型中,即可确定目标污染物浓度预测模型。
可以理解的是,采用萤火虫优化算法确定模型参数最优解的具体步骤在此不作赘述。
本发明提供的流程工业污染物排放浓度预测方法,通过选取与污染物浓度相关度较高的特征作为相关特征,根据相关特征历史数据和对应时刻的污染物浓度历史数据,使用最大信息数计算迟滞时间,并利用滑动窗口的方法重构数据,有效提高了数据特征和污染物浓度的相关性,提高污染物浓度预测的准确性。
采用支持向量机回归模型,根据萤火虫优化算法求取模型最优参数确定目标污染物浓度预测模型(MIC-FA-SVM预测模型),萤火虫优化算法结构简单,参数较少,寻优时间短且支持向量机回归模型相比于深度学习网络建模时间短,通过萤火虫优化算法确定支持向量机回归模型最优参数。以流程工业中火电厂为例,采用上述NOx浓度预测模型,能够有效解决现有火电厂难以实现喷氨量精确控制的问题以及煤质变化时需要模型快速在线更新(煤质改变导致的模型失配)的问题,快速适应锅炉变工况。
可选的,根据本发明提供的流程工业污染物排放浓度预测方法,根据目标函数,采用萤火虫优化算法优化模型参数,确定模型参数最优解,具体包括:
根据目标函数,采用改进的萤火虫优化算法优化模型参数,确定模型参数最优解;
其中,改进的萤火虫优化算法中,根据萤火虫位置,引入萤火虫发光强度得分函数的公式为:
Figure BDA0004049121730000141
式中,
Figure BDA0004049121730000142
为第i只萤火虫位置下的预测值,yi为实际值,n为样本的个数。
具体的,在本发明采用萤火虫优化算法确定模型参数最优解时,对萤火虫发光强度得分函数进行改进。改进的萤火虫优化算法步骤具体如下:
步骤一:初始化萤火虫群体大小和位置,引入萤火虫发光强度函数。用Pid(pi,1,pi,2,L pi,d)表示萤火虫的位置,i表示第i只萤火虫,d表示萤火虫位置的维度。
根据萤火虫位置,引入萤火虫发光强度得分函数:
Figure BDA0004049121730000143
式中,
Figure BDA0004049121730000144
为第i只萤火虫位置下的预测值,yi为实际值,n为样本的个数。
步骤二:计算两只萤火虫Pi2和Pj2之间的距离,和吸引力
Figure BDA0004049121730000145
Figure BDA0004049121730000146
其中rij为Pi2和Pj2之间的距离,β(r)为Pi2和Pj2之间的吸引力,β0为最大吸引力、γ为光吸收强度。
步骤三:更新萤火虫Pi2位置:
如果满足条件:f(Pi2)>f(Pj2)则更新萤火虫Pi2位置:
Figure BDA0004049121730000147
其中α为步长因子,rand为0到1之间的随机数。
步骤四:迭代更新萤火虫位置:重复步骤二和步骤三方法,利用萤火虫p(j+1)2一直到pk2更新萤火虫pi2的位置。
使用上述同样方法迭代更新其它萤火虫位置。
步骤五:迭代停止后,将萤火虫按照发光强度得分从高到低进行排序,选取得分最高的萤火虫即寻得最优参数惩罚因子c和核函数系数g作为支持向量机的参数值,将训练集数据Xtrain输入支持向量机模型进行训练。以火电厂为例,获得SCR脱硝反应器入口处的NOx浓度预测模型,再将测试集数据Xtest输入训练好的模型,对建立的模型的预测效果进行评价。
可以理解的是,得到的最优参数建立支持向量机回归模型后,用训练集训练好的模型预测测试集,得到SCR脱硝系统NOx浓度预测值,通过评价指标确定模型的预测能力。
选取Pearson系数、均方根误差RMSE和平均百分比误差MAPE作为评价指标:
Figure BDA0004049121730000151
Figure BDA0004049121730000152
Figure BDA0004049121730000153
式中,
Figure BDA0004049121730000154
为NOx浓度预测值,yi为NOx浓度真实值,n为测试集样本数量。
本发明提供的流程工业污染物排放浓度预测方法,通过选取与污染物浓度相关度较高的特征作为相关特征,根据相关特征历史数据和对应时刻的污染物浓度历史数据,使用最大信息数计算迟滞时间,并利用滑动窗口的方法重构数据,有效提高了数据特征和污染物浓度的相关性,提高污染物浓度预测的准确性。
采用支持向量机回归模型,根据优化的萤火虫优化算法求取模型最优参数确定目标污染物浓度预测模型(MIC-FA-SVM预测模型),相比于传统的萤火虫算法,优化的萤火虫算法,采用的萤火虫发光强度函数从预测值和实际值的差值以及预测值曲线趋势和实际值曲线趋势相似度两个方面来寻取支持向量机预测模型最优参数,符合对现场NOx值预测的要求,能够有效进一步提升电厂SCR脱硝反应器入口NOx浓度的预测精度,保证下一步脱硝系统的优化运行以及喷氨量的精确控制。
结合具体应用实例,对本发明进行说明:
采集电厂相关特征的运行数据2000组作为总体X2000×13,考虑到NOx排放在稳定工况下波动不大,选取启动工况下的数据进行仿真预测。设(x1,x2,L,x12)为总体X2000×13的13个特征,每个特征作为1列且有2000行,对应的,采集NOx浓度历史数据Y2000×1(y1,y2,Ly2000)。
采用上下取均值的方法对缺失值进行填补。
Figure BDA00040491217300001625
及第i个特征的j行为缺失值,其填补方式为:
Figure BDA0004049121730000161
使用3σ原则进行异常值处理,数值处于(μ-3σ,μ+3σ)之外的数据为异常值,其中μ为均值,σ为标准差。对于第i列特征
Figure BDA0004049121730000162
Figure BDA0004049121730000163
Figure BDA0004049121730000164
Figure BDA0004049121730000165
对经过缺失值填补和异常值处理之后的数据进行归一化处理,对于第i列特征,其归一化后的值为:
Figure BDA0004049121730000166
其中
Figure BDA0004049121730000167
Figure BDA0004049121730000168
分别为第i列特征的最大值和最小值,
Figure BDA0004049121730000169
为归一化后的值。设经过处理后的样本矩阵为
Figure BDA00040491217300001610
使用上述方法相同的步骤处理NOx浓度历史数据,即可得到经处理后的样本矩阵
Figure BDA00040491217300001611
选择样本矩阵
Figure BDA00040491217300001612
中的
Figure BDA00040491217300001613
列和NOx浓度实际值yt,其中yt时间序列长度和
Figure BDA00040491217300001614
相等。计算
Figure BDA00040491217300001615
和yt的互信息值:
Figure BDA00040491217300001616
式中,
Figure BDA00040491217300001617
为变量
Figure BDA00040491217300001618
和yt之间的联合概率,即
Figure BDA00040491217300001619
和yt两个事件同时发生的概率。
Figure BDA00040491217300001620
和p(yt)分别为
Figure BDA00040491217300001621
和yt的边缘概率,即
Figure BDA00040491217300001622
和yt单独发生的概率。
对求得的互信息值进行归一化,即得最大信息数:
Figure BDA00040491217300001623
将NOx浓度实际值yt向后推q倍(q=1,2,3,…,60)单位时间T=5s得到yt+qT,按照上述方法计算
Figure BDA00040491217300001624
和yt+qT的MIC。从中得到最大的MIC对应的倍单位时间qT即为NOx浓度值相对于特征
Figure BDA0004049121730000171
的最佳迟滞时间ti
求得NOx浓度值相对于13个特征的最佳迟滞时间t(t1,t2,L,t13)。
创建数据窗格矩阵:
Figure BDA0004049121730000172
依据最佳迟滞时间t(t1,t2,L,t13)确定需要的窗格索引为:index=[33,15,34,32,32,32,32,35,48,59,49,59,59].从窗格矩阵D(60×13)中获取对应的最有相关度的列特征值,如a特征值:
Figure BDA0004049121730000173
通过上述方法从窗格矩阵中重构1条新样本数据:
Figure BDA0004049121730000174
设重构数据矩阵为
Figure BDA0004049121730000175
将2000条样本
Figure BDA0004049121730000176
分成1500条训练集
Figure BDA0004049121730000177
和500条测试集
Figure BDA0004049121730000178
构建SVM回归函数f(x)在高维特征空间的表达式,则:
Figure BDA0004049121730000179
其中,
Figure BDA00040491217300001710
为SCR脱硝反应器入口的NOx浓度的真实值,
Figure BDA00040491217300001711
Figure BDA00040491217300001712
转换到高维空间的映射,ω和b是待确定的模型参数;
引入松弛变量ξi
Figure BDA00040491217300001713
构造下列目标函数,求解ω和b的最优解:
Figure BDA00040491217300001714
Figure BDA00040491217300001715
Figure BDA00040491217300001716
ξi≥0,
Figure BDA00040491217300001717
i=1,2,L,n。
其中,c是惩罚因子,ε为允许存在的偏差,ξi
Figure BDA00040491217300001718
为松弛变量;
利用最优化理论将利用最优理论将求解ω和β的最优解这个二次规划问题转变为对偶问题,并求出ω和β的最优解,最终得到支持向量机的回归函数为:
Figure BDA0004049121730000181
其中,
Figure BDA0004049121730000182
和αi为拉格朗日乘子,k是支持向量机的核函数,β为模型参数。
核函数k选择径向基核函数:
Kg(x-xi)=exp(-gx-xi 2);
式中,kg为径向基核函数,g为核函数系数,exp为以自然常数e为底的指数函数。
可以理解的是,根据改进的萤火虫优化算法,确定模型参数最优解的步骤与上文记载相同,在此不作赘述。
改进的萤火虫优化算法迭代停止后,将萤火虫按照发光强度得分从高到低进行排序,选取得分最高的萤火虫即寻得最优参数惩罚因子c=115.459和核函数系数g=23.752作为支持向量机的参数值,将训练集数据
Figure BDA0004049121730000183
输入支持向量机模型进行训练,获得SCR脱硝反应器入口处的NOx浓度预测模型,再将测试集数据
Figure BDA0004049121730000184
输入训练好的模型,对建立的模型的预测效果进行评价。
图6为本发明提供的模型训练结果示意图,图7为本发明提供的模型预测结果示意图,目标NOx浓度预测模型在训练集和测试集分别如图6和图7所示。从图中可以看出,无论是在训练集还是在测试集上,模型输出的NOx浓度的预测值与实际值非常接近,使用上述方法建立的模型能够精确预测到未来时间的NOx浓度值大小。
图8为本发明提供的流程工业污染物排放浓度预测系统结构示意图,如图8所示,本发明还提供一种流程工业污染物排放浓度预测系统,包括:迟滞时间计算单元801、样本数据重构单元802、预测模型确定单元803和排放浓度预测单元804;
迟滞时间计算单元801,用于基于流程工业历史运行数据,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间;其中,流程工业历史运行数据包括:相关特征历史数据和对应时刻的污染物浓度历史数据;相关特征为流程工业中与污染物浓度相关度较高的特征;
样本数据重构单元802,用于根据迟滞时间,采用滑动窗格求平均值重构样本数据,确定样本数据集;
预测模型确定单元803,用于使用样本数据集训练支持向量机回归模型,确定目标污染物浓度预测模型;
排放浓度预测单元804,用于基于流程工业相关特征实际数据,根据目标污染物浓度预测模型,确定污染物排放浓度。
具体的,在进行污染物排放浓度预测之前,需在目标流程工业中与污染物浓度相关度较高的特征中确定相关特征,相关特征可以是选取按相关度顺序排序中最靠前的预设数量的特征。可以理解的是,相关度的具体确定方法,以及相关特征的具体数量和类别可根据实际需求进行设置,本发明对此不作限定。
为了便于理解,以火电厂NOx浓度预测为例,将NOx作为流程工业中的污染物对本发明进行详细说明。可以理解的是,在本发明实际应用中,流程工业的具体生产方式,以及污染物的具体类型可根据实际需求进行确定,本发明对此不作限定。
在确定相关特征后,考虑到NOx(污染物)浓度测量仪和喷氨执行机构存在明显延时问题,迟滞时间计算单元801,用于基于火电厂历史运行数据中相关特征历史数据和对应时刻的NOx浓度历史数据,根据最大信息系数(Maximal Information Coefficient,MIC),确定NOx浓度相对于各相关特征的迟滞时间。
可以理解的是,火电厂历史运行数据按时刻记录,相关特征历史数据具有对应时刻的NOx浓度数据。若记录相关特征历史数据为Xm×n(x1,x2,L xm),m为相关特征的个数,n为一个相关特征所收集样本的个数,其中n>m,那么NOx浓度历史数据Yn×1(y1,y2,L yn)。
样本数据重构单元802,用于根据计算得到各相关系数的迟滞时间,采用滑动窗格求平均值重构样本数据,将滑动矩阵中的样本数据更新为与前后元素(连续三个元素)的平均值,确定样本数据集。
可以理解的是,在采用滑动窗格求平均值重构样本数据时,窗格矩阵边缘的元素无法计算平均值,保留原始值。
确定样本训练集后,预测模型确定单元803,用于使用样本数据集训练支持向量机(Support Vector Machine,SVM)回归模型,得到最优参数确定目标NOx浓度预测模型。
可以理解的是,训练模型时,确定支持向量机回归模型最优参数的具体算法,可根据实际需求进行选择,如粒子群算法、萤火虫优化算法和蚁群算法等,本发明对此不作限定。
确定好目标NOx浓度预测模型后,即可进行NOx排放浓度的预测,需获取预测时刻火电厂相关特征实际数据,排放浓度预测单元804,用于将火电厂相关特征实际数据,输入目标NOx浓度预测模型,输出结果即为预测的NOx排放浓度。
本发明提供的流程工业污染物排放浓度预测系统,通过选取与污染物浓度相关度较高的特征作为相关特征,根据相关特征历史数据和对应时刻的污染物浓度历史数据,使用最大信息数计算迟滞时间,并利用滑动窗口的方法重构数据,有效提高了数据特征和污染物浓度的相关性,提高污染物浓度预测的准确性。
需要说明的是,本发明提供的流程工业污染物排放浓度预测系统用于执行上述流程工业污染物排放浓度预测方法,其具体的实施方式与方法实施方式一致,在此不再赘述。
图9为本发明提供的电子设备的实体结构示意图,如图9所示,该电子设备可以包括:处理器(processor)901、通信接口(CommunicationsInterface)902、存储器(memory)903和通信总线904,其中,处理器901,通信接口902,存储器903通过通信总线904完成相互间的通信。处理器901可以调用存储器903中的逻辑指令,以执行流程工业污染物排放浓度预测方法,该方法包括:基于流程工业历史运行数据,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间;其中,流程工业历史运行数据包括:相关特征历史数据和对应时刻的污染物浓度历史数据;相关特征为流程工业中与污染物浓度相关度较高的特征;根据迟滞时间,采用滑动窗格求平均值重构样本数据,确定样本数据集;使用样本数据集训练支持向量机回归模型,确定目标污染物浓度预测模型;基于流程工业相关特征实际数据,根据目标污染物浓度预测模型,确定污染物排放浓度。
此外,上述的存储器903中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,计算机能够执行上述各方法所提供的流程工业污染物排放浓度预测方法,该方法包括:基于流程工业历史运行数据,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间;其中,流程工业历史运行数据包括:相关特征历史数据和对应时刻的污染物浓度历史数据;相关特征为流程工业中与污染物浓度相关度较高的特征;根据迟滞时间,采用滑动窗格求平均值重构样本数据,确定样本数据集;使用样本数据集训练支持向量机回归模型,确定目标污染物浓度预测模型;基于流程工业相关特征实际数据,根据目标污染物浓度预测模型,确定污染物排放浓度。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的流程工业污染物排放浓度预测方法,该方法包括:基于流程工业历史运行数据,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间;其中,流程工业历史运行数据包括:相关特征历史数据和对应时刻的污染物浓度历史数据;相关特征为流程工业中与污染物浓度相关度较高的特征;根据迟滞时间,采用滑动窗格求平均值重构样本数据,确定样本数据集;使用样本数据集训练支持向量机回归模型,确定目标污染物浓度预测模型;基于流程工业相关特征实际数据,根据目标污染物浓度预测模型,确定污染物排放浓度。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种流程工业污染物排放浓度预测方法,其特征在于,包括:
基于流程工业历史运行数据,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间;其中,所述流程工业历史运行数据包括:相关特征历史数据和对应时刻的污染物浓度历史数据;所述相关特征为流程工业中与污染物浓度相关度较高的特征;
根据所述迟滞时间,采用滑动窗格求平均值重构样本数据,确定样本数据集;
使用所述样本数据集训练支持向量机回归模型,确定目标污染物浓度预测模型;
基于流程工业相关特征实际数据,根据所述目标污染物浓度预测模型,确定污染物排放浓度。
2.根据权利要求1所述的流程工业污染物排放浓度预测方法,其特征在于,在所述基于流程工业历史运行数据,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间步骤之前,还包括:
机理分析流程工业工作原理,确定相关特征。
3.根据权利要求1所述的流程工业污染物排放浓度预测方法,其特征在于,所述基于流程工业历史运行数据,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间,具体包括:
对所述流程工业历史运行数据进行预处理,获得相关特征样本矩阵和污染物浓度样本矩阵;其中,所述预处理包括:缺失值填补、异常值处理和归一化;
基于相关特征样本矩阵和污染物浓度样本矩阵,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间。
4.根据权利要求3所述的流程工业污染物排放浓度预测方法,其特征在于,所述根据所述迟滞时间,采用滑动窗格求平均值重构样本数据,确定样本数据集,具体包括:
基于相关特征样本矩阵,根据所述迟滞时间,创建数据窗格矩阵;
根据数据窗格矩阵,采用滑动窗格求平均值重构所述相关特征样本矩阵的样本数据,确定重构后的相关特征样本矩阵;
基于重构后的相关特征样本矩阵和对应时刻的污染物浓度样本矩阵,确定样本数据集。
5.根据权利要求1-4任一项所述的流程工业污染物排放浓度预测方法,其特征在于,所述使用所述样本数据集训练支持向量机回归模型,确定目标污染物浓度预测模型,具体包括:
构建支持向量机回归函数在高维特征空间的表达式,确定支持向量机回归模型和目标函数;
使用所述样本数据集训练所述支持向量机回归模型,根据所述目标函数,确定模型参数最优解;
根据所述模型参数最优解,确定目标污染物浓度预测模型。
6.根据权利要求5所述的流程工业污染物排放浓度预测方法,其特征在于,所述使用所述样本数据集训练所述支持向量机回归模型,根据所述目标函数,确定模型参数最优解,具体包括:
使用所述样本数据集训练所述支持向量机回归模型;
根据所述目标函数,采用萤火虫优化算法优化模型参数,确定模型参数最优解。
7.根据权利要求6所述的流程工业污染物排放浓度预测方法,其特征在于,所述根据所述目标函数,采用萤火虫优化算法优化模型参数,确定模型参数最优解,具体包括:
根据所述目标函数,采用改进的萤火虫优化算法优化模型参数,确定模型参数最优解;
其中,所述改进的萤火虫优化算法中,根据萤火虫位置,引入萤火虫发光强度得分函数的公式为:
Figure FDA0004049121720000021
式中,
Figure FDA0004049121720000022
为第i只萤火虫位置下的预测值,yi为实际值,n为样本的个数。
8.一种流程工业污染物排放浓度预测系统,其特征在于,包括:迟滞时间计算单元、样本数据重构单元、预测模型确定单元和排放浓度预测单元;
所述迟滞时间计算单元,用于基于流程工业历史运行数据,根据最大信息系数,确定污染物浓度相对于各相关特征的迟滞时间;其中,所述流程工业历史运行数据包括:相关特征历史数据和对应时刻的污染物浓度历史数据;所述相关特征为流程工业中与污染物浓度相关度较高的特征;
所述样本数据重构单元,用于根据所述迟滞时间,采用滑动窗格求平均值重构样本数据,确定样本数据集;
所述预测模型确定单元,用于使用所述样本数据集训练支持向量机回归模型,确定目标污染物浓度预测模型;
所述排放浓度预测单元,用于基于流程工业相关特征实际数据,根据所述目标污染物浓度预测模型,确定污染物排放浓度。
9.一种电子设备,其特征在于,包括存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至7任一项所述的流程工业污染物排放浓度预测方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述的流程工业污染物排放浓度预测方法。
CN202310035441.4A 2023-01-10 2023-01-10 流程工业污染物排放浓度预测方法及系统 Pending CN116151438A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310035441.4A CN116151438A (zh) 2023-01-10 2023-01-10 流程工业污染物排放浓度预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310035441.4A CN116151438A (zh) 2023-01-10 2023-01-10 流程工业污染物排放浓度预测方法及系统

Publications (1)

Publication Number Publication Date
CN116151438A true CN116151438A (zh) 2023-05-23

Family

ID=86353808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310035441.4A Pending CN116151438A (zh) 2023-01-10 2023-01-10 流程工业污染物排放浓度预测方法及系统

Country Status (1)

Country Link
CN (1) CN116151438A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56164986A (en) * 1980-05-23 1981-12-18 Mitsubishi Petrochem Co Ltd Data processor
CN107085372A (zh) * 2017-05-10 2017-08-22 湖南工业大学 一种基于改进萤火虫算法和最小二乘支持向量机的污水节能处理优化控制方法
CN109190848A (zh) * 2018-10-17 2019-01-11 大唐环境产业集团股份有限公司 一种基于时延预估的SCR系统NOx排放浓度预测方法
CN115524976A (zh) * 2022-10-27 2022-12-27 东北电力大学 考虑锅炉燃烧状态的scr系统喷氨量调节方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56164986A (en) * 1980-05-23 1981-12-18 Mitsubishi Petrochem Co Ltd Data processor
CN107085372A (zh) * 2017-05-10 2017-08-22 湖南工业大学 一种基于改进萤火虫算法和最小二乘支持向量机的污水节能处理优化控制方法
CN109190848A (zh) * 2018-10-17 2019-01-11 大唐环境产业集团股份有限公司 一种基于时延预估的SCR系统NOx排放浓度预测方法
CN115524976A (zh) * 2022-10-27 2022-12-27 东北电力大学 考虑锅炉燃烧状态的scr系统喷氨量调节方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘方邻: "《基于机器学习的量化投资建模研究》", 合肥:中国科学技术大学出版社, pages: 149 - 150 *

Similar Documents

Publication Publication Date Title
Wang et al. A hybrid NOx emission prediction model based on CEEMDAN and AM-LSTM
CN108549792B (zh) 一种基于潜结构映射算法的固废焚烧过程二噁英排放浓度软测量方法
Nikula et al. Data-driven framework for boiler performance monitoring
Müller et al. Surrogate optimization of computationally expensive black-box problems with hidden constraints
US11976817B2 (en) Method for detecting a dioxin emission concentration of a municipal solid waste incineration process based on multi-level feature selection
Lv et al. Nonlinear PLS integrated with error-based LSSVM and its application to NO x modeling
Salvador et al. Automatic composition and optimization of multicomponent predictive systems with an extended auto-WEKA
Liu Adaptive just-in-time and relevant vector machine based soft-sensors with adaptive differential evolution algorithms for parameter optimization
Shinkevich et al. Synergy of digitalization within the framework of increasing energy efficiency in manufacturing industry
CN115034129B (zh) 一种面向火电厂脱硝装置的NOx排放浓度软测量方法
An et al. A new framework of global sensitivity analysis for the chemical kinetic model using PSO-BPNN
Behera et al. Performance prediction of a RPF‐fired boiler using artificial neural networks
Wu et al. Nonlinear dynamic soft-sensing modeling of NOx emission of a selective catalytic reduction denitration system
Qin et al. A flame imaging-based online deep learning model for predicting NOₓ emissions from an oxy-biomass combustion process
Chavoshi et al. A review of probabilistic structural integrity assessment in the nuclear sector and possible future directions
Qiao et al. A multitask learning model for the prediction of NOx emissions in municipal solid waste incineration processes
Gurgen et al. Development and assessment of a reactor system prognosis model with physics-guided machine learning
Pitel et al. Approximation of CO/lambda biomass combustion dependence by artificial intelligence techniques
Liu et al. A novel robust dynamic method for NOx emissions prediction in a thermal power plant
Chen et al. Dynamic prediction of SO2 emission based on hybrid modeling method for coal-fired circulating fluidized bed
CN117435877A (zh) 一种燃煤电厂碳排放在线预测方法
CN116151438A (zh) 流程工业污染物排放浓度预测方法及系统
Ziver et al. Genetic algorithms and artificial neural networks for loading pattern optimisation of advanced gas-cooled reactors
CN113947142B (zh) 一种酸性气体排放浓度预测方法、系统及存储介质
CN116050643A (zh) 一种基于集成模型的流程工业污染物排放浓度预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination