CN106529746A - 基于动力和热力因子的空气质量动态融合统计预报方法 - Google Patents
基于动力和热力因子的空气质量动态融合统计预报方法 Download PDFInfo
- Publication number
- CN106529746A CN106529746A CN201611241987.1A CN201611241987A CN106529746A CN 106529746 A CN106529746 A CN 106529746A CN 201611241987 A CN201611241987 A CN 201611241987A CN 106529746 A CN106529746 A CN 106529746A
- Authority
- CN
- China
- Prior art keywords
- data
- forecast
- pollutant
- regression equation
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Abstract
本发明公开一种基于动力和热力因子的空气质量动态融合统计预报方法,包括以下步骤:数据收集;引入动力和热力影响因子;对由显著性水平α=0.01的影响因子组成向量矩阵进行自然正交分解,选取累积方差贡献超过98%的主成分;使用主成分建立回归方程;利用反向传播神经网络算法,建立神经网络模型;对回归方程和神经网络模型的拟合结果和历史预报准确性进行评估检验;使用加权平均算法计算最终融合预报结果;对最终融合预报结果的准确性进行评估检验:实时将新生数据加入历史数据集,并根据检验评估结果动态更新预报模型。本发明相比于现有方法,各污染物浓度预报相对误差降低3%~11%,级别预报准确率提高4%~8%。
Description
技术领域
本发明涉及空气质量统计预报技术领域,特别是基于动力和热力因子的空气质量动态融合统计预报方法。
背景技术
环境空气质量统计预报以统计学方法为基础,利用现有数据,基于统计分析,研究大气环境的变化规律,建立大气污染浓度与气象参数之间的统计预报模型,预测大气污染物浓度。目前广泛使用的统计预报方法包括天气形势分类法、回归方程法、人工神经网络法等,但三种主要统计预报方法都具有一定的局限性。
天气形势分类法通过统计历史资料中各天气形势下不同污染物平均浓度,以此来确定高浓度天气形势和低浓度天气形势,同时统计各天气形势下污染物浓度的比值,利用该比值和前一天污染物实际浓度得出预报结果。天气形势分类法实用性最强,在空气质量变化原理研究和客观预报方法不完善的现状之下应用广泛;但有限的几种分类,预报精度较低,并且天气形势分类和各天气形势下污染特征分析、其他因素对污染物浓度变化的影响等需要人工分析和长期经验总结,主观性强而效率低。
污染物浓度的变化与多个气象或非气象影响因子有关,统计预报通常需要从气象条件和非气象条件中筛选出对大气污染物浓度变化具有显著影响的若干关键影响因子,筛选出的影响因子能否全面、恰当的反映污染物浓度变化对预报准确性至关重要,特别是神经网络使用的前提是已事先挑选出具有代表性的影响因子。现有统计预报方法通常选择前一日污染物浓度和当日基本气象要素如气温、风速风向、相对湿度、降水、云量等基本气象要素的日均值、日极值、累计值和特征时刻值作为影响因子。但相关性分析表明,基本气象要素和污染物浓度之间关系复杂,并非简单的线性关系,或表现为间接影响,基本气象要素不能准确反映气象条件对空气污染物浓度变化的影响。另外,为了全面反映气象条件对污染物浓度的影响,现有统计预报通常选择30-40个影响因子,且各因子之间并不独立,不仅增加预报计算量,还使预报系统稳定性降低。
统计预报中的回归分析一般采用多元线性回归方程法,从气象条件和非气象条件中筛选出对大气污染物浓度变化具有显著影响的若干关键影响因子。通过统计分析得到多元线性回归方程,以此回归方程为依据进行外推,从而获得未来某项大气污染物浓度的预报结果。多元线性回归方程的建立一般采用逐步回归算法,将所有考虑的影响因子逐个引入回归方程,按其对因变量(大气污染物预报浓度)影响的显著程度将不显著的因子从方程中剔除,以保证在众多预报因子中挑选出最佳的影响因子组合,建立最优预报方程。线性回归方程作为基础模型,是了解污染物浓度和气象因子之间关系的重要方法,预报模型稳定、合理;但研究表明污染物浓度和气象因子之间并非简单的线性关系,而污染物浓度的分布也不严格满足线性模型要求数据服从正太分布的要求。
神经网络模型有多种,反向传播(BP)神经网络是目前应用最广泛、成效显著、算法较成熟的一种。BP神经网络通过使用预测因子和预测对象(污染物浓度)以前的历史资料,求解预测因子与预测对象之间的关系,从而构建预报模型。BP神经网络的输入层接收来自外界的输入信息(污染物的影响因子),并传递给中间层各神经元;中间层负责信息变换;最后传递到输出层向外界输出信息处理结果(输出污染物浓度);当实际输出与期望输出(实际污染物浓度)不符时,进入误差的反向传播阶段,修正各层权值,逐层反传,此过程一直进行到网络输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。神经网络是非线性系统,具有自学习、容错性强等特点,适用于具有多因素性、不确定性、随机性特点的研究对象;但神经网络模型的预报准确性更加依赖于前期影响因子选择和网络结构构建。
另外,基于统计分析的统计预报方法准确率依赖于历史数据,并且统计预报假设污染源是不变的或者变化很小,污染水平受气象条件控制。但污染变化规律和污染源显然会发生变化,因此静态模型不能对动态变化的空气质量进行准确预报。
发明内容
针对现有统计预报方法的缺点和不足,本发明基于大气动力和热力因子,并对因子正交分解选取贡献最大的几个主分量,提供一种环境空气质量动态融合统计预报方法。
针对现有统计预报选择大量基本气象要素作为统计预报因子物理意义不明确、计算量大且预报稳定性差的缺点,本发明基于对历史环境空气质量变化特征及其和大气动力和热力因子的相关性分析,筛选物理意义明确的直接影响因子,并采用自然正交分解方法,从庞杂的因子中选取贡献最大的主分量,以达到提高预报准确率并简化计算、提高系统稳定性的目的。
针对单独使用各种统计预报方法的局限性,本发明将各种方法融合,在天气形势分类的基础上,通过线性回归和神经网络方法,对不同的天气形势类型分别建立统计预报模型,并根据历史预报效果对两种模型预报结果加权平均,形成最终预报结果,以达到对不同预报方法取长补短,提高预报准确率的目的。
针对现有静态模型不能对动态变化的空气质量进行准确预报的缺点,本发明实时将新生的污染样本及气象样本及时加入到预报数据集,使模式系统能够反映变化中的污染状况;同时通过对模式预报结果准确性的检验,优化预报模型,调整各模型权重,实现预报模型动态更新,以达到不断完善预报模型,提高预报准确率的目的。
这样,将逐日空气污染物浓度实况数据及数值天气预报数据实时代入预报模型,即可实现对环境空气污染物浓度及空气质量指数的逐日自动化客观业务预报,可为环境空气质量业务预报和研究提供支撑。
本发明的技术方案如下:基于动力和热力因子的空气质量动态融合统计预报方法,包括:数据收集,包括历史环境监测数据、历史气象观测数据、实时环境监测数据和实时气象观测数据;数据预处理,包括数据规整、异常值处理、数据格式转换、时空尺度转换,所述数据规整指将收集到的数据进行整理,以缺省值补全缺测时次;所述异常值处理指去除数据中的异常值,以缺省值代替;所述数据格式转换指将数据转换为统一格式;所述时空尺度转换指将数据计算到相应时空尺度;引入动力和热力影响因子;天气形势分类,根据气象条件将地面天气形势进行分类;选取显著性水平α=0.01的影响因子组成向量矩阵,对该向量矩阵进行自然正交分解,再选取累积方差贡献超过98%的主成分;使用所述主成分,分不同污染物、不同城市、不同季节、不同天气类型建立回归方程;利用反向传播神经网络算法,使用所述主成分从不同污染物、不同城市、不同季节、不同天气类型的角度分别建立神经网络模型;对所述回归方程和所述神经网络模型的拟合结果和历史预报准确性进行评估检验;将回归方程和神经网络模型的历史预报结果与实况进行对比,使用加权平均算法计算最终预报结果,并提供表示可能性大小的概率预报;对最终预报结果的准确性进行评估检验;预报模型动态更新。
其中,污染物通量指单位时间通过单位截面积的污染物质量,
式中为垂直于截面风矢量,单位m·s-1;q为某种污染物浓度,单位μg·m-z;为该中污染物质量通量散度矢量,单位μg·m-2·s-1;
污染物质量通量散度
式中为污染物质量通量的散度,单位μg·m-2·s-1;u、v分别为x、y方向的风速分量,单位m·s-1。
所述天气形势包括12类,分别是低压后、低压前、低压内、低压顶部、低压底部、高压前部弱梯度、高压前部、高压内、高压后部、均压区、辅合区和高压后低压前部。
所述回归方程的建立过程为:
4-1、建立增广相关方阵;假设样本容量为n,选择累积方差贡献超过98%的前P个主成分,从标准化回归方程出发,计算因子相关矩阵R和相关系数rxy,建立增广相关方阵R(0),
4-2、引进因子;假设在前l步中已经引入了l个因子,考虑P-l个未引入因子中的方差贡献时,计算第k个因子方差贡献的公式为
选取值最大的Vmax,进行F分布显著检验:若F>Fα,则k因子显著,消去第k列,得到R(1+1);
4-3、计算已引入因子的方差贡献,假设已经进行了l步,则第k个因子的方差贡献是选取值最小的Vmin,计算相应的F,若F<Fa,剔除k因子,消去第k列,得到R(1-1);
4-4、重复步骤4-2~4-3,直到既无因子剔除又无因子引入;
4-5、形成回归方程;引入l个因子的回归方程为其中因为求得距平形式的回归方程再由得出最优回归方程求出复相关系数和均方差无偏估计量进一步求得预报量的置信区间。
所述神经网络模型的建立过程为:
5-1、网络初始化;给网络的输入层与中间层的连接权值wih、隐含层与输出层的连接权值who赋值,取(-1,1)区间的随机数,设定误差函数e、计算精度值ε、最大学习次数M;
5-2、选取第k个输入层样本X及其对应的期望输出do,
x(k)=(x1(k),x2(k),...,xn(k))
do(k)=(d1(k),d2(k),...,dq(k));
5-3、计算隐含层的输入hi、输出ho以及输出层的输入yi、输出yo,
hoh(k)=f(hih(k))
yoo(k)=f(yio(k));
5-4、计算输出层的修正误差δo(k)以及隐含层的修正误差δh(k),
δo(k)=-(do(k)-yoo(k))f(yio(k))[1-f(yio(k))]
5-5、计算输出层与隐含层的修正连接权值who(k)、隐含层与输入层的修正连接权值wih(k)
5-6、计算全局误差,
5-7、判断网格误差是否满足要求,如果达到预设精度或学习次数大于设定的最大次数,则算法结束;否则选取下一个输入层学习样本及对应的期望输出,返回5-3,进入下一轮学习。
所述评估检验的检验指标有:标准化平均偏差、标准化平均误差、均方根误差和相关系数,所述标准化平均误差小于50%、所述相关系数大于0.3且通过显著性检验则认为检验合格。
所述表示可能性大小的概率预报:
P1为回归方程预报结果,P2为神经网络模型预报结果,w1和w2分别为回归方程和神经网络模型所占权重,由预报结果和实况进行拟合所得,加权平均值为最终融合预报结果;概率预报为该拟合方程历史预报准确率。
所述预报模型动态更新包括:收集逐日新生的污染样本及气象样本数据加入到历史数据集,收集变化中的污染和气象条件特征,实时更新回归方程和神经网络模型,使模式系统能够反映变化中的污染状况;通过对模型预报结果准确性的评估检验,对回归方程和神经网络模型做出调整;通过对最终预报结果准确性的评估检验,实时调整回归方程和神经网络模型预报结果所占权重。
本发明提供了一套完整的环境空气质量动态统计预报方法。为筛选出全面并且能恰当的反映气象条件对污染物浓度变化的重要影响因子,为建立回归方程和神经网络模型提供基础,本发明引入直接影响污染物传输扩散过程的大气动力和热力物理量作为影响因子,物理意义明确;同时采用自然正交分解方法,不仅使原来各因子变为正交的量便于回归分析,而且只要分析几个主要分量就能代替对全部分量分析,获得要素空间和时间基本特征信息,从而提高预报模型稳定性和计算效率。相比于现有影响因子筛选方法,各污染物浓度预报相对误差降低3%~11%,级别预报准确率提高4%~8%;
为了融合目前各种统计预报方法的优点同时弥补各方法的局限性,本发明在天气形势分类的基础上对不同的类型分别建立预报模型,通过评估历史拟合和预报结果,对多元线性回归方程和神经网络模型的预报结果进行动态加权平均,形成最终融合预报结果。实现了预报客观化、自动化运行,相比于单独使用一种预报方法,融合预报各污染物浓度预报相对误差降低2%~6%,级别预报准确率提高2%~4%;
采用动态的方法建立预报模型,实时动态更新预报数据集、回归方程和神经网络模型以及二者的融合权重,对预报系统进行调整,使模式系统能够动态反映变化中的污染状况。相比于静态预报方法,各污染物浓度预报相对误差降低1%~3%,级别预报准确率提高1%~2%。
相比于传统统计预报方法,本发明各污染物浓度预报相对误差降低4%~12%,级别预报准确率提高5%~9%。
附图说明
图1为本发明实施例基于动力和热力因子的空气质量动态融合统计预报方法流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以对某省进行空气质量统计预报为例,流程如图1所示,其中实线部分为预报模型建立主要流程,虚线部分为预报模型动态更新过程,具体步骤如下:
一、数据收集;
用来建立预报模型的数据包括历史环境监测数据资料、历史气象观测数据资料、历史NCEP再分析资料;业务预报制作数据包括实时环境监测数据资料和实时气象数值预报数据。
(1)环境监测数据
该省全部国控和省控环境监测站点监测数据,包括从当年1月1日起(包括实时监测)的PM2.5、PM10、SO2、O3、NO2和CO等6项污染物的逐小时浓度值。数据用于统计预报模式建立和动态更新,以及每日的业务预报。
(2)气象观测数据
该省全部气象地面站观测数据,包括从当年1月1日起(包括实时监测)的地面气压、气温、风速、风向、相对湿度、能见度、降水量等要素的逐小时观测值。该数据用于统计预报模式建立和动态更新。
(3)NCEP再分析数据
包括从当年1月1日起至今的云量、地表粗糙度、向下太阳辐射通量,及各等压面的气温、相对湿度、风场UV分量、垂直速度等变量的逐6小时再分析数据。该数据用以弥补高空气象观测数据及气象地面站观测数据变量的不足,用于统计预报模式建立和动态更新。
(4)WRF气象预报数据
该省实时WRF模式气象预报数据,包括10米风场UV分量、2米温度、2米相对湿度、降水量、海平面气压、边界层高度、地面向下太阳辐射,以及各高度层的风场UV分量、垂直速度、气温、气压、高度和相对湿度等变量的逐小时数据,预报时效为0-72小时。该数据用于每日的业务预报。
二、数据预处理
包括数据规整、异常值处理、数据格式转换、时空尺度转换等。数据规整是指将收集到的数据进行整理,以缺省值补全缺测时次;异常值处理指去除数据中的各类异常值,如浓度负值、异常大值等,以缺省值代替;数据格式转换指将所有环境监测数据和气象观测数据、历史数据和实况数据转换为统一格式;时空尺度转换指根据该省统计预报需要,将数据计算为城市日数据。
三、动力和热力影响因子
在传统影响因子(风速、风向、温度、露点、相对湿度、海平面气压、降水量、总云量、低云量、低云高、24小时变压、24小时变温)的基础上,引入直接影响污染物输送和扩散的动力和热力因子,包括:地面与850hPa温差、逆温层底高、逆温层厚度、逆温强度、大气稳定度、最大混合层高度、通风量、污染物通量、污染物物通量散度、静稳指数等。
地面和850hPa温差反映大气低空热力分布情况,影响大气垂直运动发展,进而影响大气污染物扩散。计算公式:ΔT=T2m-T850,其中ΔT为地面与850hPa温差,T2m为2米气温(代表地面气温),T850为850hPa气温。
逆温是决定大气稀释扩散能力的一个重要因子,当逆温存在时,大气十分稳定。当逆温出现在近地层时(贴地逆温)会抑制近地层湍流运动,当出现在对流层中某一高度时(脱地逆温),会阻碍其下方空气的垂直运动,污染物向下夹卷,造成近地层污染物的大量积累。表征逆温特征的因子包括逆温底高、逆温厚度和逆温强度。大气位温随高度升高的层次称为逆温层,逆温层底高是对扩散运动影响最显著的因子,逆温层厚度和逆温强度也和污染物浓度呈正相关关系。
大气稳定度反应大气垂直热力结构,也是决定大气稀释扩散能力的一个重要因子。在整层不稳定的情况下,污染物在向下游输送的过程中在垂直方向自由扩散;整层稳定度为中性时,污染物在向下游输送的过程中在垂直方向稳定扩散;整层稳定的层结大气中,污染物在向下游输送的过程中几乎无垂直扩散;在下层稳定而上层不稳定的大气中,污染物在向下游输送的过程中向上扩散,对排放源高度以下的区域影响不大;而在上层稳定而下层不稳定的大气中,污染物在向下游输送的过程中集中在污染源高度以下得不到有效扩散,是对近地面人类活动影响最为严重的一种情况。
大气稳定度等级的划分是使用帕斯奎尔稳定度分类法,分为强不稳定、不稳定、弱不稳定、中性、较稳定和稳定六级。它们分别由A、B、C、D、E和F表示。
首先从式(E1)算出太阳倾角:
式中:δ为太阳倾角,单位为°;θ0=360dn/365,单位为°,其中dn为一年中日期序数,取值范围为0,1,2,……,365。
以式(E2)算出太阳高度角h0:
h0=arcsin{sinφsinδ+cosφcosδcos(15t+λ-300)} (E2)
式中:h0为太阳高度角,单位为°;δ为太阳倾角,单位为°;φ为当地纬度,单位为°;λ为当地经度,单位为°;t为北京时间。
再从表1由太阳高度角h0和云量(全天空十分制)查出太阳辐射等级。
表1
最后从表2由地面风速(离地面10m高度处10分钟平均风速,单位m·s-1)和太阳辐射等级查出大气稳定度等级。
表2
最大混合层高度:污染气象学定义混合层为湍流特征不连续界面以下湍流较充分发展的大气层,其厚度就是混合层厚度。它表征了污染物在垂直方向被热力湍流稀释的范围,即低层空气热力对流与动力湍流所能达到的高度。大气混合层厚度是反映污染物在铅直方向扩散的重要参数,也是影响大气污染物扩散的主要气象因子之一。大气混合层厚度越大,就越有利于污染物的扩散和稀释。
在大气稳定度为A、B、C和D级时:
在大气稳定度为E和F级时:
式中:Lb为混合层厚度,单位为m;U10为10m高度上平均风速,单位为m·s-1,大于6m·s-1时取为6m·s-1;as和bs为混合层系数,见表3;f=2Ωsinφ,其中f为地转参数;Ω为地转角速度,取为7.29×10-5rad·s-1;φ为当地纬度,单位为°。
表3
其中区域编号对应关系见表4。
表4
序号 | 省(市)名 |
1 | 新疆,西藏,青海 |
2 | 黑龙江,吉林,辽宁,内蒙古(阴山以北) |
3 | 北京,天津,河北,河南,山东 |
4 | 内蒙古(阴山以南),山西,陕西(秦岭以北),宁夏,甘肃(渭河以北) |
5 | 上海,广东,广西,湖南,湖北,江苏,浙江,安徽,海南,台湾,福建,江西 |
6 | 云南,贵州,四川,甘肃,(渭河以南),陕西(秦岭以南) |
7 | 静风区(年平均风速小于1m/s) |
通风量:根据大气环境容量长时间平衡条件下的简单箱式模式,简单定义边界层内平均水平风速和混合层高度的乘积为通风量,用来表示边界层高度和风速对污染物的垂直和水平扩散和输送的综合效果。
以14点10m高度平均风速U10为起点,200m以下风速按指数律随高度增加,200m以上一直到混合层风速为常数,即:
式中:U10为10m高度上平均风速,单位为m·s-1;Z为地面高度,单位m;U为对应高度上平均风速,单位m·s-1。
则有
式中:VE为边界层通风量,单位m2·s-1;Z为地面高度,单位m;U(Z)为Z高度风速,单位m·s-1;Hi为第i层地面高度,单位m;U10为10m高度上平均风速,单位为m·s-1。
污染物通量、污染物物通量散度:参考水汽通量及通量散度计算方法,定义污染物通量及通量散度,表征某区域污染物的输入和输出。
污染物质量通量:单位时间通过单位截面积的污染物质量。
式中:为垂直于截面风矢量,单位m·s-1;q为某种污染物浓度,单位μg·m-2;为该中污染物质量通量散度矢量,单位μg·m-2·s-1。
污染物质量通量散度:
式中:为污染物质量通量的散度,单位μg·m-2·s-1;u、v分别为x、y方向的风速分量,单位m·s-1。
四、天气形势分类
根据天气实况资料图等显示的高压低压系统位置、地面风向、风速等将地面天气形势划
分为12种类型,如表5。
表5
统计不同污染物在各天气形势下的平均浓度分布,对于不同污染物,高浓度和低浓度的天气形势不一致。例如:按PM10浓度分布可将天气形势归为四大类:1)低压后、高压前和低压内,2)高压后低压前、低压底和低压顶,3)高压后、高压内、高压前部弱梯度区和低压前,4)辐合区和均压区;按NO2浓度分布可将天气形势归为三大类:1)低压后、高压前和低压内,2)高压后低压前、低压底、低压顶、低压前和辐合区,3)高压后、高压内、高压前部弱梯度区和均压区。
五、自然正交分解
基于影响因子和各污染物的相关性分析,选取达到显著性水平α=0.01的影响因子组成向量矩阵,包括日均总云量、日主导风向、日均风速、日均海平面气压、日低云量、日均露点、日均温度、日均相对湿度、日最大风向、日最大风速、日最大温度、日最低温度、日累计降水、08时总云量、08时风向、08时风速、08时海平面气压、08时3小时变压、08时低云量、08时露点温度、08时温度、08时相对湿度、08时温度露点差、08时24小时变压、08时24小时变温、14时总有能量、14时风向、14时风速、14时海平面气压、14时3小时变压、14时低云量、14时露点、14时温度、14时相对湿度、14时低云高、地面与850hPa温差、逆温层底高、逆温层厚度、逆温强度、大气稳定度、最大混合层高度、通风量、污染物通量、污染物物通量散度和静稳指数。然后对该向量矩阵进行自然正交分解,如PM2.5影响因子组成向量矩阵正交分解前15个主成分的方差贡献率合累积方差贡献如表6。
表6
主成分 | 方差贡献% | 累积方差贡献% |
1 | 35.1 | 35.1 |
2 | 20.2 | 55.3 |
3 | 12.5 | 67.8 |
4 | 8.8 | 76.6 |
5 | 5.3 | 81.9 |
6 | 4.4 | 86.3 |
7 | 3.2 | 89.5 |
8 | 2.9 | 92.4 |
9 | 2.4 | 94.8 |
10 | 1.6 | 96.4 |
11 | 1 | 97.4 |
12 | 0.5 | 97.9 |
13 | 0.5 | 98.4 |
14 | 0.3 | 98.7 |
15 | 0.1 | 98.8 |
PM2.5的前4个主成分的累积方差贡献超过75%,可见收敛较快。为了使正交分解后的气象要素场尽可能多的保留原始场的信息,同时又不会给建立模型带来太多困难,选取累积方差贡献超过98%的前13个主成分。
六、多元线性回归
使用逐步回归方法,采用自然正交分解主成分分析选取的P个主分量,对不同污染物、不同城市、不同季节、不同天气类型分别建立回归方程。
例如,某市冬半年PM2.5浓度的回归方程为:
式中PM2.5jn-win为预报日PM2.5浓度,PM2.5-1d为前一日PM2.5浓度,Tdif为温度日较差,Tmax为日最高温度,Td24为日变温,为日平均温度,为日平均风速,为日平均相对湿度。
某市夏半年O3日最大8小时滑动平均浓度的回归方程为:
O3jn-sum=0.2299+0.4015O3-1d-2.037DH08+7.3395Tmax+0.0075815Pd24-4.8211T08
式中O3in-sum为预报日O3日最大8小时滑动平均浓度,O3-1d为前一日O3日最大8小时滑动平均浓度,DH08为08时逆温层高度,Tmax为日最高温度,Pd24为日变压,T08为08时温度。
七、建立神经网络
使用反向传播神经网络算法,采用自然正交分解主成分分析选取的13个主分量,对不同污染物、不同城市、不同季节、不同天气类型分别建立神经网络模型。
预报模型的数据节点数为38,隐层节点数为10(使用公式α为0-10之间的常数),输出层节点数为1,传递函数使用S型非线性函数
八、模型检验评估
对回归方程和神经网络模型的拟合结果和历史预报准确性进行评估检验,检验指标包括:
其中P为预测值,O为观测值,n为总预报天数,m为污染物浓度或AQI实况值和预报值属于同一IAQI等级或AQI等级的天数。
回归方程和神经网络模型拟合结果的检验指标分别如表7和表8:
表7
预报量 | 平均绝对误差 | 平均相对误差(%) | 级别准确率(%) | 相关系数 |
PM2.5 | 26 | 44.56 | 66.35 | 0.45 |
PM10 | 50 | 35.05 | 76.45 | 0.44 |
O3 | 32 | 57.58 | 61.87 | 0.39 |
AQI | 25 | 28.65 | 82.81 | 0.45 |
表8
预报量 | 平均绝对误差 | 平均相对误差(%) | 级别准确率(%) | 相关系数 |
PM2.5 | 26 | 44.56 | 66.35 | 0.45 |
PM10 | 50 | 35.05 | 76.45 | 0.44 |
O3 | 32 | 57.58 | 61.87 | 0.39 |
AQI | 25 | 28.65 | 82.81 | 0.45 |
回归方程和神经网络拟合结果达到检验标准,可用于空气质量统计预报。
九、加权平均
将回归方程和神经网络模型的历史预报结果与实况进行对比,使用加权平均算法计算最终预报结果。
P1为回归方程预报结果,P2为神经网络模型预报结果,w1和w2分别为回归方程和神经网络模型所占权重,加权平均值作为最终预报结果。其中权重值w1和w2根据两种预报模型的历史预报结果与实况拟合确定分别为0.732和0.408。
十、预报检验评估
对融合预报结果的准确性进行评估检验。检验指标包括:
其中P为预测值,0为观测值,n为总预报天数,m为污染物浓度或AQI实况值和预报值属于同一IAQI等级或AQI等级的天数。
融合预报结果的检验指标如表9:
表9
预报量 | 平均绝对误差 | 平均相对误差(%) | 级别准确率(%) | 相关系数 |
PM2.5 | 26 | 44.56 | 66.35 | 0.45 |
PM10 | 50 | 35.05 | 76.45 | 0.44 |
O3 | 32 | 57.58 | 61.87 | 0.39 |
AQI | 25 | 28.65 | 82.81 | 0.45 |
融合预报结果达到检验标准,且优于单一方法预报结果,可用于空气质量统计预报。
十一、数据更新
收集逐日新生的污染样本及气象样本数据,通过数据预处理及时加入到历史数据集,收集变化中的污染和气象条件特征。
十二、模型更新
使用实时收集的历史数据,实时更新回归方程和神经网络模型,使模式系统能够反映变化中的污染状况;通过对模型预报结果准确性的评估检验,对回归方程和神经网络模型做出调整。
十三、模型权重更新
通过对最终预报结果准确性的评估检验,实时调整回归方程和神经网络模型预报结果所占权重。
Claims (6)
1.基于动力和热力因子的空气质量动态融合统计预报方法,其特征在于,包括:
数据收集,包括历史环境监测数据、历史气象观测数据、实时环境监测数据和实时气象观测数据;
数据预处理,包括数据规整、异常值处理、数据格式转换、时空尺度转换,所述数据规整指将收集到的数据进行整理,以缺省值补全缺测时次;所述异常值处理指去除数据中的异常值,以缺省值代替;所述数据格式转换指将数据转换为统一格式;所述时空尺度转换指将数据计算到相应时空尺度;
引入动力和热力影响因子;
天气形势分类,根据气象条件将地面天气形势进行分类;
选取显著性水平α=0.01的影响因子组成向量矩阵,对该向量矩阵进行自然正交分解,
再选取累积方差贡献超过98%的主成分;
使用所述主成分,分不同污染物、不同城市、不同季节、不同天气类型建立回归方程;
利用反向传播神经网络算法,使用所述主成分从不同污染物、不同城市、不同季节、不同天气类型的角度分别建立神经网络模型;
对所述回归方程和所述神经网络模型的拟合结果和历史预报准确性进行评估检验;
将回归方程和神经网络模型的历史预报结果与实况进行对比,使用加权平均算法计算最终预报结果,并提供表示可能性大小的概率预报;
对最终预报结果的准确性进行评估检验;
预报模型动态更新。
2.根据权利要求1所述的基于动力和热力因子的空气质量动态融合统计预报方法,其特征在于,所述动力和热力影响因子包括:地面与850hPa温差、逆温层底高、逆温层厚度、逆温强度、大气稳定度、最大混合层高度、通风量、污染物通量、污染物物通量散度、静稳指数,其中,污染物通量指单位时间通过单位截面积的污染物质量,
式中为垂直于截面风矢量,单位m·s-1;q为某种污染物浓度,单位 为该中污染物质量通量散度矢量,单位μg·m-2·s-1;
污染物质量通量散度
式中为污染物质量通量的散度,单位μg·m-2·s-1;u、v分别为x、y方向的风速分量,单位m·s-1。
3.根据权利要求1所述的基于动力和热力因子的空气质量动态融合统计预报方法,其特征在于,所述天气形势包括低压后、低压前、低压内、低压顶部、低压底部、高压前部弱梯度、高压前部、高压内、高压后部、均压区、辅合区和高压后低压前部。
4.根据权利要求1所述的基于动力和热力因子的空气质量动态融合统计预报方法,其特征在于,所述评估检验的检验指标有:标准化平均偏差、标准化平均误差、均方根误差和相关系数,所述标准化平均误差小于50%、所述相关系数大于0.3且通过显著性检验则认为检验合格。
5.根据权利要求1所述的基于动力和热力因子的空气质量动态融合统计预报方法,其特征在于,所述表示可能性大小的概率预报:
P1为回归方程预报结果,P2为神经网络模型预报结果,w1和w2分别为回归方程和神经网络模型所占权重,由预报结果和实况进行拟合所得,加权平均值为最终融合预报结果;概率预报为该拟合方程历史预报准确率。
6.根据权利要求1所述的基于动力和热力因子的空气质量动态融合统计预报方法,其特征在于,所述预报模型动态更新包括:收集逐日新生的污染样本及气象样本数据加入到历史数据集,收集变化中的污染和气象条件特征,实时更新回归方程和神经网络模型,使模式系统能够反映变化中的污染状况;通过对模型预报结果准确性的评估检验,对回归方程和神经网络模型做出调整;通过对最终预报结果准确性的评估检验,实时调整回归方程和神经网络模型预报结果所占权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611241987.1A CN106529746A (zh) | 2016-12-29 | 2016-12-29 | 基于动力和热力因子的空气质量动态融合统计预报方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611241987.1A CN106529746A (zh) | 2016-12-29 | 2016-12-29 | 基于动力和热力因子的空气质量动态融合统计预报方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106529746A true CN106529746A (zh) | 2017-03-22 |
Family
ID=58339126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611241987.1A Pending CN106529746A (zh) | 2016-12-29 | 2016-12-29 | 基于动力和热力因子的空气质量动态融合统计预报方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106529746A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107688878A (zh) * | 2017-09-12 | 2018-02-13 | 盐城工学院 | 空气质量预测方法及装置 |
CN107862415A (zh) * | 2017-11-30 | 2018-03-30 | 成都飞机工业(集团)有限责任公司 | 一种产量预测方法 |
CN108509601A (zh) * | 2018-04-02 | 2018-09-07 | 中山大学 | 一种基于大数据分析的食品风味评定方法 |
CN109342658A (zh) * | 2018-10-30 | 2019-02-15 | 河南省环境保护科学研究院 | 基于wrf模型的计算机程序化计算大气环境容量的方法 |
CN109900865A (zh) * | 2019-04-02 | 2019-06-18 | 西京学院 | 一种基于神经网络的空气污染检测系统 |
CN110457760A (zh) * | 2019-07-17 | 2019-11-15 | 浙江大学 | 一种基于空气污染传播模式的空气污染治理方法 |
CN110807567A (zh) * | 2019-09-11 | 2020-02-18 | 南开大学 | 一种基于周期分析和滤波技术的污染减排效果评估方法 |
CN110989044A (zh) * | 2019-12-25 | 2020-04-10 | 中科三清科技有限公司 | 空气质量分指数级别概率预报方法、装置、设备及存储介质 |
CN112132483A (zh) * | 2020-09-30 | 2020-12-25 | 中科三清科技有限公司 | 空气质量数值业务预报可信度评估方法、装置及存储介质 |
CN112948762A (zh) * | 2019-12-11 | 2021-06-11 | 国网湖南省电力有限公司 | 舞动预报的地面温度修正方法及其系统 |
CN113112556A (zh) * | 2021-03-16 | 2021-07-13 | 中国科学院海洋研究所 | 一种极地能量输送通量散度的计算方法 |
CN113514606A (zh) * | 2021-04-25 | 2021-10-19 | 中科三清科技有限公司 | 利用臭氧潜势指数预报臭氧浓度的方法及装置 |
CN115113301A (zh) * | 2022-08-23 | 2022-09-27 | 南京信息工程大学 | 一种基于多源数据融合的应急短临预报方法及系统 |
CN117668531A (zh) * | 2023-12-07 | 2024-03-08 | 无锡中科光电技术有限公司 | 一种基于主成分分析的emmd-bp神经网络大气污染物预报方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103955742A (zh) * | 2014-04-28 | 2014-07-30 | 淮阴工学院 | 一种基于集成学习的pm2.5预报方法 |
CN105069537A (zh) * | 2015-08-25 | 2015-11-18 | 中山大学 | 一种组合式空气质量预报模型的构建方法 |
CN105760970A (zh) * | 2016-03-21 | 2016-07-13 | 重庆灵狐科技股份有限公司 | 空气质量指数的预测方法 |
CN105956691A (zh) * | 2016-04-25 | 2016-09-21 | 北京市环境保护监测中心 | 预测区域不同方位、观测点pm2.5背景浓度计算方法 |
CN106056210A (zh) * | 2016-06-07 | 2016-10-26 | 浙江工业大学 | 一种基于混合神经网络的pm2.5浓度值预测方法 |
-
2016
- 2016-12-29 CN CN201611241987.1A patent/CN106529746A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103955742A (zh) * | 2014-04-28 | 2014-07-30 | 淮阴工学院 | 一种基于集成学习的pm2.5预报方法 |
CN105069537A (zh) * | 2015-08-25 | 2015-11-18 | 中山大学 | 一种组合式空气质量预报模型的构建方法 |
CN105760970A (zh) * | 2016-03-21 | 2016-07-13 | 重庆灵狐科技股份有限公司 | 空气质量指数的预测方法 |
CN105956691A (zh) * | 2016-04-25 | 2016-09-21 | 北京市环境保护监测中心 | 预测区域不同方位、观测点pm2.5背景浓度计算方法 |
CN106056210A (zh) * | 2016-06-07 | 2016-10-26 | 浙江工业大学 | 一种基于混合神经网络的pm2.5浓度值预测方法 |
Non-Patent Citations (7)
Title |
---|
DAHE JIANG等: "Progress in developing an ANN model for air pollution index forecast", 《ATMOSPHERIC ENVIRONMENT》 * |
JEONG-SOOK HEO等: "A new method of ozone using fuzzy expert and neural network systems", 《SCIENCE OF THE TOTAL ENVIRONMENT》 * |
刘闽等: "沈阳市冬季环境空气质量统计预报模型建立及应用", 《中国环境监测》 * |
张宏伟等: "最优化权值组合法用于大气质量中长期预测的研究", 《天津工业大学学报》 * |
张惠仪: "两种模型在广州市空气污染指数研究中的应用", 《科技与创新》 * |
王建鹏等: "西安城市空气质量预报统计方法及业务化应用", 《陕西气象》 * |
金龙等: "基于人工神经网络的集成预报方法研究和比较", 《气象学报》 * |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107688878A (zh) * | 2017-09-12 | 2018-02-13 | 盐城工学院 | 空气质量预测方法及装置 |
CN107688878B (zh) * | 2017-09-12 | 2019-10-11 | 盐城工学院 | 空气质量预测方法及装置 |
CN107862415A (zh) * | 2017-11-30 | 2018-03-30 | 成都飞机工业(集团)有限责任公司 | 一种产量预测方法 |
CN107862415B (zh) * | 2017-11-30 | 2021-11-30 | 成都飞机工业(集团)有限责任公司 | 一种产量预测方法 |
CN108509601A (zh) * | 2018-04-02 | 2018-09-07 | 中山大学 | 一种基于大数据分析的食品风味评定方法 |
CN109342658A (zh) * | 2018-10-30 | 2019-02-15 | 河南省环境保护科学研究院 | 基于wrf模型的计算机程序化计算大气环境容量的方法 |
CN109900865A (zh) * | 2019-04-02 | 2019-06-18 | 西京学院 | 一种基于神经网络的空气污染检测系统 |
CN110457760A (zh) * | 2019-07-17 | 2019-11-15 | 浙江大学 | 一种基于空气污染传播模式的空气污染治理方法 |
CN110457760B (zh) * | 2019-07-17 | 2021-02-02 | 浙江大学 | 一种基于空气污染传播模式的空气污染治理方法 |
CN110807567A (zh) * | 2019-09-11 | 2020-02-18 | 南开大学 | 一种基于周期分析和滤波技术的污染减排效果评估方法 |
CN112948762A (zh) * | 2019-12-11 | 2021-06-11 | 国网湖南省电力有限公司 | 舞动预报的地面温度修正方法及其系统 |
CN112948762B (zh) * | 2019-12-11 | 2023-07-18 | 国网湖南省电力有限公司 | 舞动预报的地面温度修正方法及其系统 |
CN110989044A (zh) * | 2019-12-25 | 2020-04-10 | 中科三清科技有限公司 | 空气质量分指数级别概率预报方法、装置、设备及存储介质 |
CN110989044B (zh) * | 2019-12-25 | 2020-07-31 | 中科三清科技有限公司 | 空气质量分指数级别概率预报方法、装置、设备及存储介质 |
CN112132483A (zh) * | 2020-09-30 | 2020-12-25 | 中科三清科技有限公司 | 空气质量数值业务预报可信度评估方法、装置及存储介质 |
CN112132483B (zh) * | 2020-09-30 | 2021-07-06 | 中科三清科技有限公司 | 空气质量数值业务预报可信度评估方法、装置及存储介质 |
CN113112556A (zh) * | 2021-03-16 | 2021-07-13 | 中国科学院海洋研究所 | 一种极地能量输送通量散度的计算方法 |
CN113112556B (zh) * | 2021-03-16 | 2023-04-25 | 中国科学院海洋研究所 | 一种极地能量输送通量散度的计算方法 |
CN113514606A (zh) * | 2021-04-25 | 2021-10-19 | 中科三清科技有限公司 | 利用臭氧潜势指数预报臭氧浓度的方法及装置 |
CN115113301A (zh) * | 2022-08-23 | 2022-09-27 | 南京信息工程大学 | 一种基于多源数据融合的应急短临预报方法及系统 |
CN115113301B (zh) * | 2022-08-23 | 2022-11-18 | 南京信息工程大学 | 一种基于多源数据融合的应急短临预报方法及系统 |
CN117668531A (zh) * | 2023-12-07 | 2024-03-08 | 无锡中科光电技术有限公司 | 一种基于主成分分析的emmd-bp神经网络大气污染物预报方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106529746A (zh) | 基于动力和热力因子的空气质量动态融合统计预报方法 | |
CN107390298B (zh) | 一种复杂山地下垫面大风的模拟方法及装置 | |
CN102393877B (zh) | 一种桥梁结构钢箱梁随机温度场的模拟方法 | |
CN102799772B (zh) | 面向空气质量预报的样本优化方法 | |
CN109709577A (zh) | 一种基于WRF-Chem模式的气溶胶激光雷达反演PM2.5的三维变分同化方法 | |
CN107341576A (zh) | 一种大数据可视化的空气污染溯源和走向预测方法 | |
CN106803129A (zh) | 一种基于多源数值天气预报的风电功率集合预测方法 | |
CN105631537A (zh) | 基于气象服务平台的空气质量预报业务系统 | |
Wang et al. | Identification of pedestrian-level ventilation corridors in downtown Beijing using large-eddy simulations | |
CN102945508A (zh) | 一种基于模型校正的风电功率预测预报系统及方法 | |
CN106682381A (zh) | 一种面向环境空气质量的动态数据模拟预报方法 | |
CN112036658B (zh) | 一种基于随差遗忘长短期记忆的风电功率实时预测方法 | |
CN109858700A (zh) | 基于相似样本筛选的bp神经网络供暖系统能耗预测方法 | |
CN110334404A (zh) | 一种流域尺度骤发干旱精准识别方法 | |
CN116485048B (zh) | 一种大气污染物排放清单的联合优化反演方法及系统 | |
CN110658307A (zh) | 评估污染源对环境空气质量影响的方法 | |
CN113108918B (zh) | 一种极轨气象卫星热红外遥感数据反演气温方法 | |
CN106446440A (zh) | 基于在线贯序极限学习机的短期光伏发电功率预测方法 | |
CN110119590A (zh) | 一种基于多源观测数据的水质模型粒子滤波同化方法 | |
CN107358006A (zh) | 一种基于主成分分析的Lorenz扰动风速预测方法 | |
CN104915982A (zh) | 树冠层光照分布预测模型构建方法及光照分布检测方法 | |
CN111160680A (zh) | 一种基于信息同化融合的农业干旱评估方法 | |
CN114186491A (zh) | 基于改进lur模型的细颗粒物浓度时空特征分布方法 | |
Zhang et al. | Spatial variability and possible cause analysis of regional precipitation complexity based on optimized sample entropy | |
CN106096246A (zh) | 基于pm2.5和pm10的气溶胶光学厚度估计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170322 |
|
WD01 | Invention patent application deemed withdrawn after publication |