CN114169574A - 一种通过工业运行电力指数进行大气污染预测的方法 - Google Patents

一种通过工业运行电力指数进行大气污染预测的方法 Download PDF

Info

Publication number
CN114169574A
CN114169574A CN202111332302.5A CN202111332302A CN114169574A CN 114169574 A CN114169574 A CN 114169574A CN 202111332302 A CN202111332302 A CN 202111332302A CN 114169574 A CN114169574 A CN 114169574A
Authority
CN
China
Prior art keywords
emission
region
concentration
zone
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111332302.5A
Other languages
English (en)
Inventor
徐其春
宁亮
袁天梦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Tangshan Power Supply Co of State Grid Jibei Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Tangshan Power Supply Co of State Grid Jibei Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Tangshan Power Supply Co of State Grid Jibei Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202111332302.5A priority Critical patent/CN114169574A/zh
Publication of CN114169574A publication Critical patent/CN114169574A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C10/00Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures

Abstract

本发明涉及一种通过工业运行电力指数进行大气污染预测的方法,属于大气污染治理方法技术领域。本发明的技术方案是:进行重点工业行业用电水平同空气质量的相关性分析;进行高时间分辨率企业用电数据与污染物排放清单耦合;进行空气质量达标目标下成本最优情景设计。本发明的有益效果是:通过建立基于RF算法的关联模型,研究重点工业行业的用电水平、污染物排放水平与PM2.5浓度的响应关系,以电力指数为媒介,解决排放源难以实现全覆盖的动态监测问题;从综合效益最优的维度优化各行业的相关治理措施,根据工业企业生产活动变动,实现防控对象有序调整。

Description

一种通过工业运行电力指数进行大气污染预测的方法
技术领域
本发明涉及一种通过工业运行电力指数进行大气污染预测的方法,属于大气污染治理方法技术领域。
背景技术
随着社会经济的快速发展,我国在过去的20年间出现了快速的城镇化、工业化和机动化过程,煤炭和石油等化石能源消费量增长迅猛,造成了酸雨和灰霾等严重的区域环境问题。当前,居于高位的污染物排放量依旧是重污染频发的根本原因,其中钢铁等工业行业的污染物排放是影响空气质量的关键因素。在复杂的大气化学机制作用下,排放的气态污染物可能转化为PM2.5中的二次成分,因此,无论是直接排放还是化学转化,钢铁等工业行业排放对空气质量的影响都十分显著。研究表明,工业源对PM2.5的贡献在采暖季可达到38.1%,在各部门中位居首位。
工业部门的污染治理,离不开污染控制技术的进步和产能结构的升级,也离不开对企业生产状态的跟踪。目前工业部门的污染治理主要面临两方面的问题,一是排放清单主要基于污染源普查或者其他年鉴统计资料汇编整理,在线监测(CEMS)设备也仅布设在重点企业的个别烟气出口,无法做到排放源的全覆盖动态监测。此外,传统的大气污染治理措施更注重大气污染本身的提升效果,可能会在一定程度上缺乏对经济成本的考量。考虑到工业企业的生产状态同用电水平关系紧密,倘若能获取重点工业企业的用电量数据,便有可能支撑短时、动态的空气质量管理,同时根据工业企业生产活动的变动有序调整防控对象。本次项目综合研究重点工业行业的用电水平、污染物排放水平与PM2.5 浓度的响应关系,以电力指数为媒介,将环保部门、电网企业和污染排放企业三个方面紧密联系在了一起,将有助于从综合效益最优的维度优化各行业的相关治理措施,符合当前科学治污、精确治污的理念。
发明内容
本发明目的是提供一种通过工业运行电力指数进行大气污染预测的方法,通过建立基于RF算法的关联模型,研究重点工业行业的用电水平、污染物排放水平与PM2.5浓度的响应关系,以电力指数为媒介,解决排放源难以实现全覆盖的动态监测问题;从综合效益最优的维度优化各行业的相关治理措施,根据工业企业生产活动变动,实现防控对象有序调整,有效地解决了背景技术中存在的上述问题。
本发明的技术方案是:一种通过工业运行电力指数进行大气污染预测的方法,包含以下步骤:进行重点工业行业用电水平同空气质量的相关性分析;进行高时间分辨率企业用电数据与污染物排放清单耦合;进行空气质量达标目标下成本最优情景设计。
所述重点工业行业用电水平同空气质量的相关性分析包括:首先,收集历史年各月份各区县分行业用电量、大气指数及各县监测站监测数据,将企业的用电量作为其活动水平的表征;再与大气污染物排放数据相结合,基于各行业电量与年度大气指标数值,计算各行业电量与空气指数相关性。
所述高时间分辨率企业用电数据与污染物排放清单耦合包括不同影响因素与企业用电量模型的建立和企业用电量与空气质量模型的建立两个部分,将企业逐日用电量同大气污染物年排放清单相耦合,建立基于随机森林的数据驱动方法,根据典型工业企业用电量的时间序列变化对工业企业大气污染物排放进行预测;结合污染物排放的波动输入至曲面响应模型,输出不同排放情景下的PM2.5浓度值,建立“电力数据—排放数据—空气质量数据”链条,从而提高清单的时间分辨率。
所述空气质量达标目标下成本最优情景设计包括从重点行业用电水平变化入手,分析疫情管控措施对企业生产乃至空气质量的影响,提出“电量—污染物弹性贡献系数”这一概念,并利用RSM模拟减排情景下的PM2.5浓度,从而提出不同PM2.5浓度削减目标下,成本最优的重点行业限产路径。
所述不同影响因素与企业用电量模型的建立中,预测变量包括时间变量、气象变量、政策变量和价格变量,其中:
①时间变量包含year、day_julian和weekday三项,分别表征企业用电的年际、季节和周内规律;
②气象参数包含air_temp一项,主要表征供暖季限产对企业用电量的影响;
③政策参数包含两项,第一项是AQI,表征重污染天气下限产措施对企业的影响,该数据从中国环境监测中心获取;第二项为event,取值分别为0、1和 2,分别表示正常状况、假期以及重大活动对企业用电状况的影响;
④价格参数包含material和product两项或revenue一项,可用于表征成本和售价或利润对企业生产决策的影响,考虑到生产决策不大可能只参考当天的原料和产品价格进行,建模采用价格指数的滑动平均值;
四类不同影响因素与企业用电量模型参数的选取需要兼顾模型运算效率和结果准确性两个方面,采用随机森林法,决策树预测变量数确定为4,树木数量确定为200,最小节点数确定为3;在训练集和校验集划分上,取80%的历史数据作为训练集建立随机森林模型,其余20%用于检验模型效果。
所述企业用电量与空气质量模型采用利用多项式函数关系式表征的多区域多部门排放之间的响应表面模型,建立模型时,采用多项式拟合方法对响应关系进行更为明确的参数化,对基函数进行敏感性测试,经过与传统RSM结果对照差异来确定近似的方程形式,该模型建立过程如下所示:
①给定一个函数表达式的可能形式:
Figure BDA0003349234370000041
其中,ΔConc是PM2.5的浓度响应情况;ENOX、ESO2、ENH3、EVOCS和EPOA则是NOX、 SO2、NH3、VOCS和POA污染物排放量的变化情况,在基准状态下为0;ai、bi、 ci、di和ei是污染物排放量变化的非负整数次幂,Xi是第i项的系数;
②多项式阶数的确定
研究依次确定了几个前体物排放项式的最高次数。假设其余前提物的排放不变,单一自变量的计算公式如下所示:
Figure BDA0003349234370000042
其中,ΔConc是PM2.5浓度对某个单体物排放变化的浓度响应值;EP是某个单体物排放相对于基准情景的变化率;Ai是每个项式i的系数;a是前体物P 排放率的次数,用于决定多项式最佳拟合形式下最高次项的幂次;
通过设置多项式最高次数在1-5之间,用pf-ERSM模型预测该前体物排放从-1到0.2变化时的浓度,同传统RSM计算值对比来确定合适的最高次数,分析表明,PM2.5同SO2排放间线性关系较强,同其他前体物则主要呈非线性响应;
③多项式项数的确定
多项式项数过多,保留太多的未知数,既不利于后续响应曲面模型的建立,也会由于共线性的存在而造成过度拟合,为此,研究考察了各交叉项对结果的影响,并把其中不敏感的部分剔除,此外进一步考查了各交叉项之间的相互作用,这一步是通过对比有无交叉项计算式对污染物浓度的预测准确程度来确定的,如下所示:
Figure BDA0003349234370000051
Figure BDA0003349234370000052
倘若使用这两个计算时所得的PM2.5浓度响应结果相等或近似,这说明交叉项对污染物浓度影响可以被忽略;
④多项式方程系数的确定
系数值主要通过将一定量空气质量模型模拟结果参与拟合的方式来进行,为了减轻空气质量模拟的计算成本,研究采用哈默斯利序列采样方法和边缘加密策略,对样本点进行选取,具体公式如下:
Figure BDA0003349234370000053
其中,X表示在[a,b]部分使用HSS采样得到的均匀分布的样本点,TX表示边缘加密后的样本点;
基于这些样本,研究分别使用传统RSM和pf-ERSM的方法预测PM2.5浓度值,校验结果说明,使用较少的样本点,也能够保证pf-ERSM模型的准确性,而且大大节约了拟合时间;
⑤多区域响应曲面模型的搭建
为衡量各区域对目标区域的总影响,需要开发多个区域的RSM子系统,再将其进行数学组合,区域传输对PM2.5浓度的贡献主要体现在两个方面,第一个是PM2.5直接从来源区域传输至受体区域,第二个是前体物传输至受体区域形成二次污染物,在将两者叠加时,还需要考虑区域协同控制的相互影响,其他区域对目标区域PM2.5浓度计算式如下所示:
Figure BDA0003349234370000061
其中,ConciX表示受体区域i的污染物X的浓度;CMj→i表示区域j输送至区域i的前体物并在区域i形成二次污染物的部分;CM_INDi表示多区域排放变化对本地化学生成的间接影响所贡献的部分;TPj→i是污染物X从区域j直接传输至区域i的部分;TP_INDi是多区域排放对直接传输产生的间接影响所贡献的部分;
⑥区域传输前体物形成二次污染物的贡献
从区域j传输而来前体物在区域i生成污染物X的浓度值和区域i本地排放生成浓度值可用下式表示:
Figure BDA0003349234370000062
Figure BDA0003349234370000063
其中,emisj是来源于j区域的前体物排放;Concjprecursors是i区域的前体物浓度;rsmjX(Conciprecursors)是基于单一区域RSM模型计算得到的污染物浓度对前体物浓度变化的响应;rsmiprecursors(Emisj)是RSM系统基于单一区域RSM模型计算前体物浓度对前体物排放变化的响应;rsmiX(emisi)是基于本地RSM模型计算的污染物浓度对本地排放变化的响应;
⑦多区域排放变化对本地化学生成间接影响的贡献
从区域j到区域i的CM贡献取决于区域i中由所有区域传输的前体物浓度水平,其计算式如下所示:
Figure BDA0003349234370000064
来自每个单独区域的CM的总和可能不等于所有区域的总CM,上式表示这两个值之间的差异,即对CM的间接影响;
⑧污染物在来源区域生成后传输至受体区域的贡献
由污染物在来源区域生成,然后传输至受体区域的部分可表示为污染物浓度对区域j排放的响应减去从区域j传输到i的前体物生成的部分,其计算式如下所示:
Figure BDA0003349234370000071
其中,rsmiX(Emisj)表示基于单一区域RSM计算ConciX对Emisj的响应;
⑨多区域协同控制时,某区域前体物排放的变化可能会影响区域j中的污染物X,进而影响X到区域i的传输。区域整体变化预测值同以上过程叠加后影响的差异可通过TP_IND来表示,其计算式如下:
Figure BDA0003349234370000072
其中,
Figure BDA0003349234370000073
是利用每个区域贡献作为权重计算的所有来源区域排放的加权平均值,
Figure BDA0003349234370000074
是建立的关于区域i污染物X对于区域整体排放变化响应的 RSM系统。
本发明的有益效果是:通过建立基于RF算法的关联模型,研究重点工业行业的用电水平、污染物排放水平与PM2.5浓度的响应关系,以电力指数为媒介,解决排放源难以实现全覆盖的动态监测问题;从综合效益最优的维度优化各行业的相关治理措施,根据工业企业生产活动变动,实现防控对象有序调整。
附图说明
图1为本发明不同影响因素与企业用电量模型的建立中各预测变量对用电量影响图;
图2为本发明高时间分辨率企业用电数据与污染物排放清单耦合模型图;
图3为本发明随机森林法示意图;
图4为本发明随机森林模型校验结果图。
具体实施方式
下面结合附图与实施例对本发明技术方案作进一步详细的说明,这是本发明的较佳实施例。应当理解,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例;需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种通过工业运行电力指数进行大气污染预测的方法,包含以下步骤:进行重点工业行业用电水平同空气质量的相关性分析;进行高时间分辨率企业用电数据与污染物排放清单耦合;进行空气质量达标目标下成本最优情景设计。
所述重点工业行业用电水平同空气质量的相关性分析包括:首先,收集历史年各月份各区县分行业用电量、大气指数及各县监测站监测数据,将企业的用电量作为其活动水平的表征;再与大气污染物排放数据相结合,基于各行业电量与年度大气指标数值,计算各行业电量与空气指数相关性。
所述高时间分辨率企业用电数据与污染物排放清单耦合包括不同影响因素与企业用电量模型的建立和企业用电量与空气质量模型的建立两个部分,将企业逐日用电量同大气污染物年排放清单相耦合,建立基于随机森林的数据驱动方法,根据典型工业企业用电量的时间序列变化对工业企业大气污染物排放进行预测;结合污染物排放的波动输入至曲面响应模型,输出不同排放情景下的 PM2.5浓度值,建立“电力数据—排放数据—空气质量数据”链条,从而提高清单的时间分辨率。
所述空气质量达标目标下成本最优情景设计包括从重点行业用电水平变化入手,分析疫情管控措施对企业生产乃至空气质量的影响,提出“电量—污染物弹性贡献系数”这一概念,并利用RSM模拟减排情景下的PM2.5浓度,从而提出不同PM2.5浓度削减目标下,成本最优的重点行业限产路径。
所述不同影响因素与企业用电量模型的建立中,预测变量包括时间变量、气象变量、政策变量和价格变量,其中:
①时间变量包含year、day_julian和weekday三项,分别表征企业用电的年际、季节和周内规律;
②气象参数包含air_temp一项,主要表征供暖季限产对企业用电量的影响;
③政策参数包含两项,第一项是AQI,表征重污染天气下限产措施对企业的影响,该数据从中国环境监测中心获取;第二项为event,取值分别为0、1和 2,分别表示正常状况、假期以及重大活动对企业用电状况的影响;
④价格参数包含material和product两项或revenue一项,可用于表征成本和售价或利润对企业生产决策的影响,考虑到生产决策不大可能只参考当天的原料和产品价格进行,建模采用价格指数的滑动平均值;
四类不同影响因素与企业用电量模型参数的选取需要兼顾模型运算效率和结果准确性两个方面,采用随机森林法,决策树预测变量数确定为4,树木数量确定为200,最小节点数确定为3;在训练集和校验集划分上,取80%的历史数据作为训练集建立随机森林模型,其余20%用于检验模型效果。
所述企业用电量与空气质量模型采用利用多项式函数关系式表征的多区域多部门排放之间的响应表面模型,建立模型时,采用多项式拟合方法对响应关系进行更为明确的参数化,对基函数进行敏感性测试,经过与传统RSM结果对照差异来确定近似的方程形式,该模型建立过程如下所示:
①给定一个函数表达式的可能形式:
Figure BDA0003349234370000101
其中,ΔConc是PM2.5的浓度响应情况;ENOX等则是NOX等污染物排放量的变化情况,在基准状态下为0;ai等是污染物排放量变化的非负整数次幂,Xi 是第i项的系数;
②多项式阶数的确定
研究依次确定了几个前体物排放项式的最高次数。假设其余前提物的排放不变,单一自变量的计算公式如下所示:
Figure BDA0003349234370000102
其中,ΔConc是PM2.5浓度对某个单体物排放变化的浓度响应值;EP是某个单体物排放相对于基准情景的变化率;Ai是每个项式i的系数;a是前体物P 排放率的次数,用于决定多项式最佳拟合形式下最高次项的幂次;
通过设置多项式最高次数在1-5之间,用pf-ERSM模型预测该前体物排放从-1到0.2变化时的浓度,同传统RSM计算值对比来确定合适的最高次数,分析表明,PM2.5同SO2排放间线性关系较强,同其他前体物则主要呈非线性响应;
③多项式项数的确定
多项式项数过多,保留太多的未知数,既不利于后续响应曲面模型的建立,也会由于共线性的存在而造成过度拟合,为此,研究考察了各交叉项对结果的影响,并把其中不敏感的部分剔除,此外进一步考查了各交叉项之间的相互作用,这一步是通过对比有无交叉项计算式对污染物浓度的预测准确程度来确定的,如下所示:
Figure BDA0003349234370000103
Figure BDA0003349234370000111
倘若使用这两个计算时所得的PM2.5浓度响应结果相等或近似,这说明交叉项对污染物浓度影响可以被忽略;
④多项式方程系数的确定
系数值主要通过将一定量空气质量模型模拟结果参与拟合的方式来进行,为了减轻空气质量模拟的计算成本,研究采用哈默斯利序列采样方法和边缘加密策略,对样本点进行选取,具体公式如下:
Figure BDA0003349234370000112
其中,X表示在[a,b]部分使用HSS采样得到的均匀分布的样本点,TX表示边缘加密后的样本点;
基于这些样本,研究分别使用传统RSM和pf-ERSM的方法预测PM2.5浓度值,校验结果说明,使用较少的样本点,也能够保证pf-ERSM模型的准确性,而且大大节约了拟合时间;
⑤多区域响应曲面模型的搭建
为衡量各区域对目标区域的总影响,需要开发多个区域的RSM子系统,再将其进行数学组合,区域传输对PM2.5浓度的贡献主要体现在两个方面,第一个是PM2.5直接从来源区域传输至受体区域,第二个是前体物传输至受体区域形成二次污染物,在将两者叠加时,还需要考虑区域协同控制的相互影响,其他区域对目标区域PM2.5浓度计算式如下所示:
Figure BDA0003349234370000113
其中,ConciX表示受体区域i的污染物X的浓度;CMj→i表示区域j输送至区域i的前体物并在区域i形成二次污染物的部分;CM_INDi表示多区域排放变化对本地化学生成的间接影响所贡献的部分;TPj→i是污染物X从区域j直接传输至区域i的部分;TP_INDi是多区域排放对直接传输产生的间接影响所贡献的部分;
⑥区域传输前体物形成二次污染物的贡献
从区域j传输而来前体物在区域i生成污染物X的浓度值和区域i本地排放生成浓度值可用下式表示:
Figure BDA0003349234370000121
Figure BDA0003349234370000122
其中,emisj是来源于j区域的前体物排放;Concjprecursors是i区域的前体物浓度;rsmjX(Conciprecursors)是基于单一区域RSM模型计算得到的污染物浓度对前体物浓度变化的响应;rsmiprecursors(Emisj)是RSM系统基于单一区域RSM模型计算前体物浓度对前体物排放变化的响应;rsmiX(emisi)是基于本地RSM模型计算的污染物浓度对本地排放变化的响应;
⑦多区域排放变化对本地化学生成间接影响的贡献
从区域j到区域i的CM贡献取决于区域i中由所有区域传输的前体物浓度水平,其计算式如下所示:
Figure BDA0003349234370000123
来自每个单独区域的CM的总和可能不等于所有区域的总CM,上式表示这两个值之间的差异,即对CM的间接影响;
⑧污染物在来源区域生成后传输至受体区域的贡献
由污染物在来源区域生成,然后传输至受体区域的部分可表示为污染物浓度对区域j排放的响应减去从区域j传输到i的前体物生成的部分,其计算式如下所示:
Figure BDA0003349234370000131
其中,rsmiX(Emisj)表示基于单一区域RSM计算ConciX对Emisj的响应;
⑨多区域协同控制时,某区域前体物排放的变化可能会影响区域j中的污染物X,进而影响X到区域i的传输;区域整体变化预测值同以上过程叠加后影响的差异可通过TP_IND来表示,其计算式如下:
Figure BDA0003349234370000132
其中,
Figure BDA0003349234370000133
是利用每个区域贡献作为权重计算的所有来源区域排放的加权平均值,
Figure BDA0003349234370000134
是建立的关于区域i污染物X对于区域整体排放变化响应的 RSM系统。
在实际应用中,本发明包括重点工业行业用电水平同空气质量的相关性分析、高时间分辨率企业用电数据与污染物排放清单耦合、空气质量达标目标下成本最优情景设计三个部分。
重点工业行业用电水平同空气质量的相关性分析:首先,收集历史年各月份各区县分行业用电量、大气指数及各县监测站监测数据,利用将企业的用电量作为其活动水平的表征。再与大气污染物排放数据相结合,基于各行业电量与年度大气指标数值,计算各行业电量与空气指数相关性,如图1。对于SPSS 软件中置信度(双侧)小于0.05,则认为相关性显著。
高时间分辨率企业用电数据与污染物排放清单耦合包括不同影响因素与企业用电量模型的建立和企业用电量与空气质量模型的建立两个部分,模型整体框架思路如图2。
不同影响因素与企业用电量模型的建立采用随机森林法。随机森林(RandomForest,RF)是一种集成多棵决策树训练及预测结果的分类器,如图3,构建方法如下:
①从M个预测变量中选取m个作为一棵决策树的预测变量。
②在N个观测值中进行有放回的随机采样,选择数目同样本数相同的预测值作为一棵树的训练集,其余值则作为校验集,用于评判随机森林模型的准确性。
③每棵决策树完整分类不进行剪枝,通过确定最后一个节点分裂后的观测值数量来结束分类。所有决策树预测结果的平均值即为随机森林的预测结果。
不同影响因素与企业用电量模型预测变量包括时间变量、气象变量、政策变量、价格变量四类。其中:
①时间变量包含year(年份)、day_julian(取值为1-366)和weekday(取值为1-7)三项,分别表征企业用电的年际、季节和周内规律。
②气象参数包含air_temp(气温)一项,主要表征供暖季限产对企业用电量的影响。
③政策参数包含两项,第一项是AQI(空气质量指数),表征重污染天气下限产措施对企业的影响,该数据从中国环境监测中心获取。第二项为event,取值分别为0、1、2,分别表示正常状况、假期(春节、国庆等)以及重大活动对企业用电状况的影响。
④价格参数包含material、product两项或revenue一项,可用于表征成本、售价或利润对企业生产决策的影响。考虑到生产决策不大可能只参考当天的原料和产品价格进行,建模采用价格指数的滑动平均值。
不同影响因素与企业用电量模型参数的选取需要兼顾模型运算效率和结果准确性两个方面,通过多次尝试,决策树预测变量数(mtry)确定为4,树木数量(ntree)确定为200,最小节点数(min_node_size)则确定为3。而在训练集、校验集划分上,则取80%的历史数据作为训练集建立随机森林模型,其余20%用于检验模型效果。
不同影响因素与企业用电量模型建立完成后,还需要在校验集上运行该模型,并将模型预测值同实际观测值进行比对,从而确定模型效果的优劣,如图4。在校验时,常用的统计指标有皮尔逊相关指数(R)、FAC2(Factor of 2of the observation)和标准平均偏差(Normalized Mean Bias,NMB)等。其中,R可以用来衡量模型在相关性上的优劣,FAC2和RMSE则用于衡量模型在准确性上的优劣。这三个指标的数学意义如下所示:
Figure BDA0003349234370000151
Figure BDA0003349234370000152
Figure BDA0003349234370000153
其中,Oi为观测值,Pi为预测值,N为样本量。
企业用电量与空气质量模型采用了利用多项式函数关系式表征的多区域多部门排放之间的响应表面模型(pf-ERSM)。多项式回归模型可应用于非线性可分数据的处理,在保持了线性模型高速预算性能的同时,在总体上也更为灵活。建立模型时,采用多项式拟合方法对响应关系进行更为明确的参数化,对基函数进行敏感性测试,经过与传统RSM结果对照差异来确定近似的方程形式。该模型建立过程如下所示:
①给定一个函数表达式的可能形式:
Figure BDA0003349234370000154
其中,ΔConc是PM2.5的浓度响应情况;ENOX等则是NOX等污染物排放量的变化情况,在基准状态下为0;ai等是污染物排放量变化的非负整数次幂,Xi 是第i项的系数;
②多项式阶数的确定
研究依次确定了几个前体物排放项式的最高次数。假设其余前提物的排放不变,单一自变量的计算公式如下所示:
Figure BDA0003349234370000161
其中,ΔConc是PM2.5浓度对某个单体物排放变化的浓度响应值;EP是某个单体物排放相对于基准情景的变化率;Ai是每个项式i的系数;a是前体物P 排放率的次数,用于决定多项式最佳拟合形式下最高次项的幂次;
通过设置多项式最高次数在1-5之间,用pf-ERSM模型预测该前体物排放从-1到0.2变化时的浓度,同传统RSM计算值对比来确定合适的最高次数,分析表明,PM2.5同SO2排放间线性关系较强,同其他前体物则主要呈非线性响应;
③多项式项数的确定
多项式项数过多,保留太多的未知数,既不利于后续响应曲面模型的建立,也会由于共线性的存在而造成过度拟合,为此,研究考察了各交叉项对结果的影响,并把其中不敏感的部分剔除,此外进一步考查了各交叉项之间的相互作用,这一步是通过对比有无交叉项计算式对污染物浓度的预测准确程度来确定的,如下所示:
Figure BDA0003349234370000162
Figure BDA0003349234370000163
倘若使用这两个计算时所得的PM2.5浓度响应结果相等或近似,这说明交叉项对污染物浓度影响可以被忽略;
④多项式方程系数的确定
系数值主要通过将一定量空气质量模型模拟结果参与拟合的方式来进行,为了减轻空气质量模拟的计算成本,研究采用哈默斯利序列采样方法和边缘加密策略,对样本点进行选取,具体公式如下:
Figure BDA0003349234370000171
其中,X表示在[a,b]部分使用HSS采样得到的均匀分布的样本点,TX表示边缘加密后的样本点;
基于这些样本,研究分别使用传统RSM和pf-ERSM的方法预测PM2.5浓度值,校验结果说明,使用较少的样本点,也能够保证pf-ERSM模型的准确性,而且大大节约了拟合时间;
⑤多区域响应曲面模型的搭建
为衡量各区域对目标区域的总影响,需要开发多个区域的RSM子系统,再将其进行数学组合,区域传输对PM2.5浓度的贡献主要体现在两个方面,第一个是PM2.5直接从来源区域传输至受体区域,第二个是前体物传输至受体区域形成二次污染物,在将两者叠加时,还需要考虑区域协同控制的相互影响,其他区域对目标区域PM2.5浓度计算式如下所示:
Figure BDA0003349234370000172
其中,ConciX表示受体区域i的污染物X的浓度;CMj→i表示区域j输送至区域i的前体物并在区域i形成二次污染物的部分;CM_INDi表示多区域排放变化对本地化学生成的间接影响所贡献的部分;TPj→i是污染物X从区域j直接传输至区域i的部分;TP_INDi是多区域排放对直接传输产生的间接影响所贡献的部分;
⑥区域传输前体物形成二次污染物的贡献
从区域j传输而来前体物在区域i生成污染物X的浓度值和区域i本地排放生成浓度值可用下式表示:
Figure BDA0003349234370000181
Figure BDA0003349234370000182
其中,emisj是来源于j区域的前体物排放;Concjprecursors是i区域的前体物浓度;rsmjX(Conciprecursors)是基于单一区域RSM模型计算得到的污染物浓度对前体物浓度变化的响应;rsmiprecursors(Emisj)是RSM系统基于单一区域RSM模型计算前体物浓度对前体物排放变化的响应;rsmiX(emisi)是基于本地RSM模型计算的污染物浓度对本地排放变化的响应;
⑦多区域排放变化对本地化学生成间接影响的贡献
从区域j到区域i的CM贡献取决于区域i中由所有区域传输的前体物浓度水平,其计算式如下所示:
Figure BDA0003349234370000183
来自每个单独区域的CM的总和可能不等于所有区域的总CM,上式表示这两个值之间的差异,即对CM的间接影响;
⑧污染物在来源区域生成后传输至受体区域的贡献
由污染物在来源区域生成,然后传输至受体区域的部分可表示为污染物浓度对区域j排放的响应减去从区域j传输到i的前体物生成的部分,其计算式如下所示:
Figure BDA0003349234370000184
其中,rsmiX(Emisj)表示基于单一区域RSM计算ConciX对Emisj的响应;
⑨多区域协同控制时,某区域前体物排放的变化可能会影响区域j中的污染物X,进而影响X到区域i的传输。区域整体变化预测值同以上过程叠加后影响的差异可通过TP_IND来表示,其计算式如下:
Figure BDA0003349234370000191
其中,
Figure BDA0003349234370000192
是利用每个区域贡献作为权重计算的所有来源区域排放的加权平均值,
Figure BDA0003349234370000193
是建立的关于区域i污染物X对于区域整体排放变化响应的RSM 系统。
空气质量达标目标下成本最优情景设计进一步从五个部门的不同排放削减比例出发,设计了3000个减排情景,具体方案如表1所示。其中,“其他排放源”除唐山市本地的交通、民用等部门外,也将其他城市的排放量纳入考虑,这主要是顾及到了区域传输对本地PM2.5浓度的贡献。借助pf-ERSM模型得到各情景下的PM2.5浓度值,再通过EER指数计算各情景下的年化工业损失电量,由此即可选择既能满足浓度削减目标,又可尽量减少工业损失电量的最优情景。
表1减排情景设计思路
Figure BDA0003349234370000194
注:表格中的数值是指各情景下污染物排放量同基准排放量的比值。由于钢铁行业已实行超低排放改造,只设计了0.5~1之间的排放系数。

Claims (6)

1.一种通过工业运行电力指数进行大气污染预测的方法,其特征在于包含以下步骤:进行重点工业行业用电水平同空气质量的相关性分析;进行高时间分辨率企业用电数据与污染物排放清单耦合;进行空气质量达标目标下成本最优情景设计。
2.根据权利要求1所述的一种通过工业运行电力指数进行大气污染预测的方法,其特征在于:所述重点工业行业用电水平同空气质量的相关性分析包括:首先,收集历史年各月份各区县分行业用电量、大气指数及各县监测站监测数据,将企业的用电量作为其活动水平的表征;再与大气污染物排放数据相结合,基于各行业电量与年度大气指标数值,计算各行业电量与空气指数相关性。
3.根据权利要求1所述的一种通过工业运行电力指数进行大气污染预测的方法,其特征在于:所述高时间分辨率企业用电数据与污染物排放清单耦合包括不同影响因素与企业用电量模型的建立和企业用电量与空气质量模型的建立两个部分,将企业逐日用电量同大气污染物年排放清单相耦合,建立基于随机森林的数据驱动方法,根据典型工业企业用电量的时间序列变化对工业企业大气污染物排放进行预测;结合污染物排放的波动输入至曲面响应模型,输出不同排放情景下的PM2.5浓度值,建立电力数据—排放数据—空气质量数据链条,从而提高清单的时间分辨率。
4.根据权利要求1所述的一种通过工业运行电力指数进行大气污染预测的方法,其特征在于:所述空气质量达标目标下成本最优情景设计包括从重点行业用电水平变化入手,分析疫情管控措施对企业生产乃至空气质量的影响,提出电量—污染物弹性贡献系数这一概念,并利用RSM模拟减排情景下的PM2.5浓度,从而提出不同PM2.5浓度削减目标下,成本最优的重点行业限产路径。
5.根据权利要求3所述的一种通过工业运行电力指数进行大气污染预测的方法,其特征在于:所述不同影响因素与企业用电量模型的建立中,预测变量包括时间变量、气象变量、政策变量和价格变量,其中:
①时间变量包含year、day_julian和weekday三项,分别表征企业用电的年际、季节和周内规律;
②气象参数包含air_temp一项,主要表征供暖季限产对企业用电量的影响;
③政策参数包含两项,第一项是AQI,表征重污染天气下限产措施对企业的影响,该数据从中国环境监测中心获取;第二项为event,取值分别为0、1和2,分别表示正常状况、假期以及重大活动对企业用电状况的影响;
④价格参数包含material和product两项或revenue一项,可用于表征成本和售价或利润对企业生产决策的影响,考虑到生产决策不大可能只参考当天的原料和产品价格进行,建模采用价格指数的滑动平均值;
四类不同影响因素与企业用电量模型参数的选取需要兼顾模型运算效率和结果准确性两个方面,采用随机森林法,决策树预测变量数确定为4,树木数量确定为200,最小节点数确定为3;在训练集和校验集划分上,取80%的历史数据作为训练集建立随机森林模型,其余20%用于检验模型效果。
6.根据权利要求3所述的一种通过工业运行电力指数进行大气污染预测的方法,其特征在于:所述企业用电量与空气质量模型采用利用多项式函数关系式表征的多区域多部门排放之间的响应表面模型,建立模型时,采用多项式拟合方法对响应关系进行更为明确的参数化,对基函数进行敏感性测试,经过与传统RSM结果对照差异来确定近似的方程形式,该模型建立过程如下所示:
①给定一个函数表达式的可能形式:
Figure FDA0003349234360000031
其中,ΔConc是PM2.5的浓度响应情况;ENOX、ESO2、ENH3、EVOCS和EPOA则是NOX、SO2、NH3、VOCS和POA污染物排放量的变化情况,在基准状态下为0;ai、bi、ci、di和ei是污染物排放量变化的非负整数次幂,Xi是第i项的系数;
②多项式阶数的确定
研究依次确定了几个前体物排放项式的最高次数。假设其余前提物的排放不变,单一自变量的计算公式如下所示:
Figure FDA0003349234360000032
其中,ΔConc是PM2.5浓度对某个单体物排放变化的浓度响应值;EP是某个单体物排放相对于基准情景的变化率;Ai是每个项式i的系数;a是前体物P排放率的次数,用于决定多项式最佳拟合形式下最高次项的幂次;
通过设置多项式最高次数在1-5之间,用pf-ERSM模型预测该前体物排放从-1到0.2变化时的浓度,同传统RSM计算值对比来确定合适的最高次数,分析表明,PM2.5同SO2排放间线性关系较强,同其他前体物则主要呈非线性响应;
③多项式项数的确定
多项式项数过多,保留太多的未知数,既不利于后续响应曲面模型的建立,也会由于共线性的存在而造成过度拟合,为此,研究考察了各交叉项对结果的影响,并把其中不敏感的部分剔除,此外进一步考查了各交叉项之间的相互作用,这一步是通过对比有无交叉项计算式对污染物浓度的预测准确程度来确定的,如下所示:
Figure FDA0003349234360000041
Figure FDA0003349234360000042
倘若使用这两个计算时所得的PM2.5浓度响应结果相等或近似,这说明交叉项对污染物浓度影响可以被忽略;
④多项式方程系数的确定
系数值主要通过将一定量空气质量模型模拟结果参与拟合的方式来进行,为了减轻空气质量模拟的计算成本,研究采用哈默斯利序列采样方法和边缘加密策略,对样本点进行选取,具体公式如下:
Figure FDA0003349234360000043
其中,X表示在[a,b]部分使用HSS采样得到的均匀分布的样本点,TX表示边缘加密后的样本点;
基于这些样本,研究分别使用传统RSM和pf-ERSM的方法预测PM2.5浓度值,校验结果说明,使用较少的样本点,也能够保证pf-ERSM模型的准确性,而且大大节约了拟合时间;
⑤多区域响应曲面模型的搭建
为衡量各区域对目标区域的总影响,需要开发多个区域的RSM子系统,再将其进行数学组合,区域传输对PM2.5浓度的贡献主要体现在两个方面,第一个是PM2.5直接从来源区域传输至受体区域,第二个是前体物传输至受体区域形成二次污染物,在将两者叠加时,还需要考虑区域协同控制的相互影响,其他区域对目标区域PM2.5浓度计算式如下所示:
Figure FDA0003349234360000051
其中,ConciX表示受体区域i的污染物X的浓度;CMj→i表示区域j输送至区域i的前体物并在区域i形成二次污染物的部分;CM_INDi表示多区域排放变化对本地化学生成的间接影响所贡献的部分;TPj→i是污染物X从区域j直接传输至区域i的部分;TP_INDi是多区域排放对直接传输产生的间接影响所贡献的部分;
⑥区域传输前体物形成二次污染物的贡献
从区域j传输而来前体物在区域i生成污染物X的浓度值和区域i本地排放生成浓度值可用下式表示:
Figure FDA0003349234360000052
Figure FDA0003349234360000053
其中,emisj是来源于j区域的前体物排放;Concjprecursors是i区域的前体物浓度;rsmjX(Conciprecursors)是基于单一区域RSM模型计算得到的污染物浓度对前体物浓度变化的响应;rsmiprecursors(Emisj)是RSM系统基于单一区域RSM模型计算前体物浓度对前体物排放变化的响应;rsmiX(emisi)是基于本地RSM模型计算的污染物浓度对本地排放变化的响应;
⑦多区域排放变化对本地化学生成间接影响的贡献
从区域j到区域i的CM贡献取决于区域i中由所有区域传输的前体物浓度水平,其计算式如下所示:
Figure FDA0003349234360000061
来自每个单独区域的CM的总和可能不等于所有区域的总CM,上式表示这两个值之间的差异,即对CM的间接影响;
⑧污染物在来源区域生成后传输至受体区域的贡献
由污染物在来源区域生成,然后传输至受体区域的部分可表示为污染物浓度对区域j排放的响应减去从区域j传输到i的前体物生成的部分,其计算式如下所示:
Figure FDA0003349234360000062
其中,rsmiX(Emisj)表示基于单一区域RSM计算ConciX对Emisj的响应;
⑨多区域协同控制时,某区域前体物排放的变化可能会影响区域j中的污染物X,进而影响X到区域i的传输;区域整体变化预测值同以上过程叠加后影响的差异可通过TP_IND来表示,其计算式如下:
Figure FDA0003349234360000063
其中,
Figure FDA0003349234360000064
是利用每个区域贡献作为权重计算的所有来源区域排放的加权平均值,
Figure FDA0003349234360000065
是建立的关于区域i污染物X对于区域整体排放变化响应的RSM系统。
CN202111332302.5A 2021-11-11 2021-11-11 一种通过工业运行电力指数进行大气污染预测的方法 Pending CN114169574A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111332302.5A CN114169574A (zh) 2021-11-11 2021-11-11 一种通过工业运行电力指数进行大气污染预测的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111332302.5A CN114169574A (zh) 2021-11-11 2021-11-11 一种通过工业运行电力指数进行大气污染预测的方法

Publications (1)

Publication Number Publication Date
CN114169574A true CN114169574A (zh) 2022-03-11

Family

ID=80478835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111332302.5A Pending CN114169574A (zh) 2021-11-11 2021-11-11 一种通过工业运行电力指数进行大气污染预测的方法

Country Status (1)

Country Link
CN (1) CN114169574A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114819696A (zh) * 2022-05-12 2022-07-29 中科三清科技有限公司 确定污染物浓度影响因素的方法、装置及电子设备
CN114819371A (zh) * 2022-05-09 2022-07-29 成都大数据产业技术研究院有限公司 基于税务数据的产排污量预测模型构建方法和系统
CN115146537A (zh) * 2022-07-12 2022-10-04 四川大学 基于耗电量的大气污染物排放量估算模型构建方法及系统
CN115908082A (zh) * 2023-01-06 2023-04-04 佰聆数据股份有限公司 基于用电特征指标的企业排污监控方法及装置
CN116485191A (zh) * 2023-06-26 2023-07-25 安徽中科蓝壹信息科技有限公司 基于拉格朗日扩散模型的环境影响预警方法及系统
CN117291549A (zh) * 2023-11-16 2023-12-26 中交二公局东萌工程有限公司 一种工程项目施工环保监督管理系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114819371A (zh) * 2022-05-09 2022-07-29 成都大数据产业技术研究院有限公司 基于税务数据的产排污量预测模型构建方法和系统
CN114819696A (zh) * 2022-05-12 2022-07-29 中科三清科技有限公司 确定污染物浓度影响因素的方法、装置及电子设备
CN115146537A (zh) * 2022-07-12 2022-10-04 四川大学 基于耗电量的大气污染物排放量估算模型构建方法及系统
CN115908082A (zh) * 2023-01-06 2023-04-04 佰聆数据股份有限公司 基于用电特征指标的企业排污监控方法及装置
CN116485191A (zh) * 2023-06-26 2023-07-25 安徽中科蓝壹信息科技有限公司 基于拉格朗日扩散模型的环境影响预警方法及系统
CN117291549A (zh) * 2023-11-16 2023-12-26 中交二公局东萌工程有限公司 一种工程项目施工环保监督管理系统
CN117291549B (zh) * 2023-11-16 2024-03-01 中交二公局东萌工程有限公司 一种工程项目施工环保监督管理系统

Similar Documents

Publication Publication Date Title
CN114169574A (zh) 一种通过工业运行电力指数进行大气污染预测的方法
Jia et al. Rethinking the choice of carbon tax and carbon trading in China
Li et al. Prospective on energy related carbon emissions peak integrating optimized intelligent algorithm with dry process technique application for China's cement industry
Islam et al. Energy demand forecasting
CN106779165B (zh) 基于城市空气质量预测技术的电力系统环境调度方法
CN102057396A (zh) 用于节能减排的方法和装置
CN105160416A (zh) 一种结合主元分析与神经网络的台区合理线损预测方法
CN116128421B (zh) 一种耦合污染源排放和解析的大气污染管控方案生成方法
Saraji et al. Application of System Dynamics in Forecasting: A Systematic Review.
Shen et al. Interaction between international trade and logistics carbon emissions
CN114595861A (zh) 基于mstl和lstm模型的中长期电力负荷预测方法
CN115496627A (zh) 一种可调资源响应潜力的评估方法及系统
Liu et al. Planning mechanism design and benefit analysis of electric energy substitution: A case study of tobacco industry in Yunnan province, China
Dang et al. A novel multivariate grey model for forecasting periodic oscillation time series
CN103345662A (zh) 一种基于小波网络法的商业能效综合评价方法
CN115860797B (zh) 一种适应新电价改革形势的电量需求预测方法
Al-Ani et al. A study of load demand forecasting models in electricity using artificial neural networks and fuzzy logic model
CN116739368A (zh) 基于能源大数据的工业园区碳排放水平监测及评估方法
CN114140176B (zh) 一种负荷聚集平台的可调容量预测方法及装置
Safiyari et al. From traditional to modern methods: Comparing and introducing the most powerful model for forecasting the residential natural gas demand
Yang et al. Site selection decision framework for biomass pyrolysis project based on a mixed method under probabilistic linguistic environment and low carbon perspective: a case study in China
Song et al. 3Es System Optimization under Uncertainty Using Hybrid Intelligent Algorithm: A Fuzzy Chance-Constrained Programming Model
Xu et al. Short-term PM2. 5 prediction based on a data-driven heuristic approach
Salunkhe et al. Econometrics and Manufacturing Industries Retail Volumes Forecast
Wang et al. An Energy Consumption Prediction LSTM Model of Metallurgy Enterprises

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination