CN106055904B - 基于varx模型的大气pm2.5浓度预测方法 - Google Patents
基于varx模型的大气pm2.5浓度预测方法 Download PDFInfo
- Publication number
- CN106055904B CN106055904B CN201610393256.2A CN201610393256A CN106055904B CN 106055904 B CN106055904 B CN 106055904B CN 201610393256 A CN201610393256 A CN 201610393256A CN 106055904 B CN106055904 B CN 106055904B
- Authority
- CN
- China
- Prior art keywords
- data
- model
- varx
- matrix
- concentration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Z—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
- G16Z99/00—Subject matter not provided for in other main groups of this subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2219/00—Indexing scheme relating to application aspects of data processing equipment or methods
- G06F2219/10—Environmental application, e.g. waste reduction, pollution control, compliance with environmental legislation
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于VARX模型的大气PM2.5浓度预测方法,其包括如下步骤:步骤一、收集目标城市的污染物浓度数据及气象数据;步骤二、从数据库中读出目标城市的污染数据和气象数据;步骤三、对除PM2.5以外的数据进行主成分分析;步骤四、对数据集进行根检验;步骤五、构造VARX方程模型;步骤六、使用AIC赤池信息量准则和SC施瓦兹准则来确定模型的滞后阶数;步骤七、修正并使用VARX模型来对PM2.5浓度进行预测。本发明具有较强的泛化能力、预测精度较高等特点。
Description
技术领域
本发明涉及一种基于VARX模型的大气PM2.5浓度预测方法,特别是基于VARX模型并结合目标城市气象数据和污染数据的大气PM2.5质量浓度的时间序列预测方法。根据模型设置不同,可进行短期和长期的预测。
背景技术
中国经济在保持高速发展的同时,粗放型经济发展方式带来的是能源的巨大消耗及污染物排放量的大幅增加,这种高浓度的PM2.5将影响公众身心健康和环境安全,降低大气能见度,影响区域气候,并导致中国经济发达地区如京津冀,长三角地区和珠三角地区的大气复合污染日益严重。对此,近几年的研究结果表明,传统的以SO2、TSP、PM10等煤烟型为代表的第一代大气污染得到了明显改善,但随着机动车数量的激增,导致大气污染的类型正逐渐向煤烟和汽车尾气混合型污染发展,以大气臭氧(O3)和细颗粒物(PM2.5)为代表的大气复合型空气污染已经开始成为影响人民生活质量的重大环境问题。因此对PM2.5浓度进行预测可为公众出行安排、自我健康防护提供参考。
同传统的SO2、TSP、PM10的污染物相比,PM2.5质量浓度中大部分为二次气溶胶,即由一次污染物在大气中二次反应形成的气溶胶,其形成机理和治理难度都比一次污染物更复杂。近年来的研究都表明PM2.5的形成和灰霾天气的发生是污染排放和气象条件共同作用的结果。
本发明通过对不同城市的PM2.5浓度及其他污染物浓度和气象因子进行相关性分析和主成分分析,在获得不同城市的PM2.5同其他数据的相关性质后,对模型的参数进行调整,使预测结果更准确。
发明内容
本发明的提供了一种基于VARX模型的PM2.5浓度预测方法,用以解决大气PM2.5浓度预测及其精度问题。
为了达到上述目的,本发明提供一种基于VARX模型的大气PM2.5浓度预测方法,其特征在于,所述基于VARX模型的大气PM2.5浓度预测方法包括如下步骤:
步骤一、收集目标城市的污染物浓度数据及气象数据,在对数据进行清洗之后,存入数据库;
步骤二、从数据库中读出目标城市的污染数据和气象数据,并进行一定的格式化处理;定义预测周期Tmin,作为时间序列中的最小预测时间间隔;
步骤三、对除PM2.5以外的数据进行主成分分析,选择累计贡献率达到90%的前n个主成分序列与PM2.5质量浓度共同构成数据集S;
步骤四、对数据集S的n+1列数据进行PP(Phillips-Perron)单根检验,检验每一列时间序列是否存在单位根,并对一阶差分不是平稳序列的时间序列进行差分处理;若存在单位根,则进一步差分处理,重复以上过程直到时间序列的一阶差分为平稳序列;
步骤五、以数据集S中的n个主成分序列作为向量自回归模型的内生变量及样本,构造 VARX方程模型:
式中Yt代表了第t期k个时间序列变量构成的k×1向量,Yt-i是Yt滞后i期的滞后变量构成的k×1列向量,μt是k×1的常数项向量,Ai为k×k的系数矩阵,X是n×1列向量, n是外生变量个数向量即主成分个数,B是k×n系数矩阵,εt是由随机误差扰动项构成的 n×1列向量,P为滞后阶数;
步骤六、使用AIC赤池信息量准则和SC施瓦兹准则来确定模型的滞后阶数,计算公式如下:
式中L为极大似然估计,T为样本容量;计算1到n阶的AICi和SCi的值,当二者都取到最小值时,该P值就是最大的滞后阶数;若二值不同时取到最小值,则再参考似然比法LR;
步骤七、对于VARX模型,由于E(εtε′t)=∑,且∑是正定矩阵,则存在唯一的主对角线为1的下三角阵Q使得∑=QΛQ′,其中Λ为对角矩阵,因此可以构造从而得到:
E(ξtξ′t)=(Q-1)(E(εtε′t)(Q-1)'=(Q-1)∑(Q-1)'=Λ
因此∑的cholesky分解式为:
且由于∑是正定矩阵,所以Λ对角线上元素全为整数,对其对角线元素进行平方根运算可得Q为下三角阵,则也为下三角阵,令得到:
E(μtμ′t)=(R-1)E(εtε′T)(R-1)′=(R-1)∑(R-1)′=(R-1)(RR′)(R-1)′=I
I为单位矩阵,对步骤五的公式左乘下三角矩阵R-1,使模型中的所有扰动项互相独立;在此基础上,修正并使用VARX模型来对PM2.5质量浓度进行预测。
优选地,所述基于VARX模型的大气PM2.5浓度预测方法首先对目标城市的PM2.5及其相关污染物的浓度数据和气象数据进行预处理;对除PM2.5以为的其他数据做主成分分析获得主成分序列矩阵;提取PM2.5浓度数据作为模型因变量y(预测值),将其他主成分Comp 的组合作为模型的自变量x1,x2,..,xn(预测特征);使用x矩阵和y向量构造时间序列数据集S、并将数据集S分为训练集Strain和验证集Svalidate;以训练集Strain通过计算机算法生成 VARX向量自回归模型,以验证集Svalidate数据来对模型结果的进行评价。
本发明的有益效果如下:
一、本发明结合环境监测站的污染数据和气象站的气象数据,通过相关分析和主成分分析,对目标城市的PM2.5影响因素进行分析。可以将对目标城市影响最大的气象和污染数据导出并构成训练集的外生变量。并可选择不同的预测周期来对PM2.5浓度进行短期和长期预测。
二、基于分析结果,构建目标城市VARX模型来对PM2.5污染浓度进行预测。
三、本专利具有较强的泛化能力,对多个城市和多种时间间隔的预测结果进行验证,模拟结果较好,说明本发明提出的方法预测精度较高。
附图说明
图1为本发明的方法流程示意图。
图2为PM2.5预测值与实际值对比示意图。
具体实施方式
如图1所示,本发明首先对目标城市的PM2.5及其相关污染物的浓度数据和气象数据进行预处理。对除PM2.5以为的其他数据做主成分分析获得主成分序列矩阵。提取PM2.5浓度数据作为模型因变量y(预测值),将其他主成分Comp的组合作为模型的自变量x1,x2,..,xn(预测特征)。使用x矩阵和y向量构造时间序列数据集S、并将数据集S分为训练集Strain和验证集Svalidate。以训练集Strain通过计算机算法生成VARX向量自回归模型,以验证集Svalidate数据来对模型结果的进行评价。本方法还可根据设置模型的最小预测间隔Tmin,对PM2.5浓度进行短期和长期的浓度预测。
本发明基于VARX模型的PM2.5浓度预测方法的具体步骤如下:
步骤一、收集目标城市的污染物浓度数据及气象数据,污染物主要包括PM2.5、SO2、CO、 NOX、PM10、O3,气象数据主要包括大气温度、露点温度、湿度、海平面气压、可见度、风向、风速、降雨等数据。在对数据进行清洗之后,存入数据库。
步骤二、从数据库中读出目标城市的污染数据和气象数据,并进行一定的格式化处理。定义预测周期Tmin,作为时间序列中的最小预测时间间隔。
步骤三、对除PM2.5以外的数据进行主成分分析,选择累计贡献率达到90%的前n个主成分序列与PM2.5质量浓度共同构成数据集S。
步骤四、对数据集S的n+1列数据进行PP(Phillips-Perron)单根检验,检验每一列时间序列是否存在单位根,并对一阶差分不是平稳序列的时间序列进行差分处理。若存在单位根,则进一步差分处理,重复以上过程直到时间序列的一阶差分为平稳序列。
步骤五、以数据集S中的n个主成分序列作为向量自回归模型的内生变量及样本,构造 VARX方程模型,如下式(1):
式中Yt代表了第t期k个时间序列变量构成的k×1向量,Yt-i是Yt滞后i期的滞后变量构成的k×1列向量,μt是k×1的常数项向量,Ai为k×k的系数矩阵,X是n×1列向量, n是外生变量个数向量即主成分个数,B是k×n系数矩阵,εt是由随机误差扰动项构成的 n×1列向量,P为滞后阶数。
并且有Cov(εjs,εjr)=0(j=1,2…k且s≠r)、Cov(Yt_i,εt)=0(i=1,2…P)。即εt相互之间可以同期相关,但不与自己的滞后值相关且不与等式右边的变量相关。
步骤六、使用AIC赤池信息量准则和SC施瓦兹准则来确定模型的滞后阶数,计算公式如下式(2)和(3):
式中L为极大似然估计,T为样本容量。计算1到n阶的AICi和SCi的值,当二者都取到最小值时,该P值就是最大的滞后阶数。若二值不同时取到最小值,则再参考似然比法LR。
步骤七、对于VARX模型,由于E(εtε′t)=Σ,且Σ是正定矩阵,则存在唯一的主对角线为1的下三角阵Q使得Σ=QΛQ′,其中Λ为对角矩阵,因此可以构造ξt=Q-1εt,从而得到如下式(4):
E(ξtξ′t)=(Q-1)(E(εtε′t)(Q-1)'=(Q-1)∑(Q-1)'=Λ……(4)
因此Σ的cholesky分解式为如下式(5):
且由于Σ是正定矩阵,所以Λ对角线上元素全为整数,对其对角线元素进行平方根运算可得Q为下三角阵,则也为下三角阵,令μt=R-1εt,可以得到如下式(6):
E(μtμ′t)=(R-1)E(εtε′T)(R-1)'=
(R-1)∑(R-1)'=(R-1)(RR')(R-1)'=I......(6)
I为单位矩阵,对步骤五的公式(1)左乘下三角矩阵R-1,可使模型中的所有扰动项互相独立。
在此基础上,可以修正和使用VARX模型来对PM2.5质量浓度进行预测,具体如下式(7):
式中yit是第t期第i个内生变量,μit是第t期第i个常数项,A1,…,Ap分别对应滞后1到p期的k×k维系数矩阵,yit-j是第t-j期第i个内生变量,其中j为落后期数,B为k×n 维系数矩阵,xit是第t期的第i个外生变量,εit为第t期第i个扰动项。
本发明采用国家公布的大气污染物浓度数据与气象站的气象数据,根据各城市不同的特点,构建时间序列的VARX模型,并可设置最小预测时间对PM2.5的质量浓度进行短期和长期的预测。
下面是一个具体实施的例子:如本发明可以设定预测周期Tmin为24小时,对某城市除 PM2.5以外的数据进行主成分分析来对变量进行降维,通过碎石图和主成分分析计算结果,将该城市30多种数据转换成4个主成分。将这4个主成分序列同PM2.5质量浓度共同构成数据集S。使用AIC赤池信息量准则和SC施瓦兹准则计算得到模型的的滞后阶数为4。通过PP检验和差分处理,将S数据集转换成平稳时间序列,以转换后的数据集S构建VARX向量自回归模型来对PM2.5浓度进行预测。预测结果与实际值对比示意图如图2所示。从图中可以看出该模型对于短期日均PM2.5浓度预测准确程度较高,若要进行长期预测则需要对模型实施滚动运行,并加入季节性扰动因素和循环变动因素,同时扩大训练集的训练数量。
Claims (2)
1.一种基于VARX模型的大气PM2.5浓度预测方法,其特征在于,所述基于VARX模型的大气PM2.5浓度预测方法包括如下步骤:
步骤一、收集目标城市的污染物浓度数据及气象数据,气象数据主要包括大气温度、露点温度、湿度、海平面气压、可见度、风向、风速、降雨数据,在对数据进行清洗之后,存入数据库;
步骤二、从数据库中读出目标城市的污染数据和气象数据,并进行一定的格式化处理;定义预测周期Tmin,作为时间序列中的最小预测时间间隔;
步骤三、对除PM2.5以外的数据进行主成分分析,选择累计贡献率达到90%的前n个主成分序列与PM2.5质量浓度共同构成数据集S;
步骤四、对数据集S的n+1列数据进行PP单根检验,检验每一列时间序列是否存在单位根,并对一阶差分不是平稳序列的时间序列进行差分处理;若存在单位根,则进一步差分处理,重复以上过程直到时间序列的一阶差分为平稳序列;
步骤五、以数据集S中的n个主成分序列作为向量自回归模型的内生变量及样本,构造VARX方程模型:
式中Yt代表了第t期k个时间序列变量构成的k×1向量,Yt-i是Yt滞后i期的滞后变量构成的k×1列向量,μt是k×1的常数项向量,Ai为k×k的系数矩阵,X是n×1列向量,n是外生变量个数向量即主成分个数,B是k×n系数矩阵,εt是由随机误差扰动项构成的k×1列向量,P为滞后阶数;并且有Cov(εs,εr)=0,s≠r;Cov(Yt-i,εt)=0,i=1,2…P;
步骤六、使用AIC赤池信息量准则和SC施瓦兹准则来确定模型的滞后阶数,计算公式如下:
式中L为极大似然估计,T为样本容量;计算1到n阶的AICi和SCi的值,当二者都取到最小值时,该P值就是最大的滞后阶数;若二值不同时取到最小值,则再参考似然比法LR;
步骤七、对于VARX模型,由于E(εtε′t)=∑,且∑是正定矩阵,则存在唯一的主对角线为1的下三角阵Q使得∑=QΛQ′,其中Λ为对角矩阵,因此可以构造ξt=Q-1εt,从而得到:
E(ξtξ′t)=(Q-1)(E(εtε′t)(Q-1)′=(Q-1)∑(Q-1)′=Λ
因此∑的cholesky分解式为:
且由于∑是正定矩阵,所以Λ对角线上元素全为整数,对其对角线元素进行平方根运算可得Q为下三角阵,则也为下三角阵,令μt=R-1εt,得到:
E(μtμ′t)=(R-1)E(εtε′T)(R-1)′=
(R-1)∑(R-1)′=(R-1)(RR′)(R-1)′=I
其中,I为单位矩阵,对步骤五的公式左乘下三角矩阵R-1,使模型中的所有扰动项互相独立;
在此基础上,修正并使用VARX模型来对PM2.5质量浓度进行预测;
具体如下式:
式中yit是第t期第i个内生变量,μit是第t期第i个常数项,A1,…,Ap分别对应滞后1到p期的k×k维系数矩阵,yit-j是第t-j期第i个内生变量,其中j为落后期数,B为k×n维系数矩阵,xit是第t期的第i个外生变量,εit为第t期第i个扰动项。
2.根据权利要求1所述的基于VARX模型的大气PM2.5浓度预测方法,其特征在于,所述基于VARX模型的大气PM2.5浓度预测方法首先对目标城市的PM2.5及其相关污染物的浓度数据和气象数据进行预处理;对除PM2.5以为的其他数据做主成分分析获得主成分序列矩阵;提取PM2.5浓度数据作为模型因变量y,将其他主成分Comp的组合作为模型的自变量x1,x2,..,xn;使用x矩阵和y向量构造时间序列数据集S、并将数据集S分为训练集Strain和验证集Svalidate;以训练集Strain通过计算机算法生成VARX向量自回归模型,以验证集Svalidate数据来对模型结果的进行评价。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610393256.2A CN106055904B (zh) | 2016-06-04 | 2016-06-04 | 基于varx模型的大气pm2.5浓度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610393256.2A CN106055904B (zh) | 2016-06-04 | 2016-06-04 | 基于varx模型的大气pm2.5浓度预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106055904A CN106055904A (zh) | 2016-10-26 |
CN106055904B true CN106055904B (zh) | 2019-02-01 |
Family
ID=57170207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610393256.2A Active CN106055904B (zh) | 2016-06-04 | 2016-06-04 | 基于varx模型的大气pm2.5浓度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106055904B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107464009A (zh) * | 2017-06-23 | 2017-12-12 | 南京航空航天大学 | 一种北京市冬季大气pm2.5浓度变化预测方法 |
CN107967242A (zh) * | 2017-10-09 | 2018-04-27 | 中国电子科技集团公司第二十八研究所 | 一种城市交通流量对空气质量影响的分析方法及系统 |
CN109116444B (zh) * | 2018-07-16 | 2021-01-12 | 汤静 | 基于PCA-kNN的空气质量模式PM2.5预报方法 |
CN109165246A (zh) * | 2018-09-30 | 2019-01-08 | 北京工业大学 | 一种挖掘大气污染传播路径的方法 |
CN109376953B (zh) * | 2018-11-21 | 2022-09-23 | 国网冀北电力有限公司 | 一种中长期电量预测方法及系统 |
CN110261272B (zh) * | 2019-07-05 | 2020-08-18 | 西南交通大学 | 基于地理探测和pca对pm2.5浓度分布的关键影响因子筛选方法 |
CN111256745A (zh) * | 2020-02-28 | 2020-06-09 | 芜湖职业技术学院 | 一种便携式空气质量监测仪数据校准方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104008278A (zh) * | 2014-05-14 | 2014-08-27 | 昆明理工大学 | 一种基于特征向量和最小二乘支持向量机的pm25浓度预测方法 |
CN104021430A (zh) * | 2014-06-12 | 2014-09-03 | 东南大学 | 一种城市轨道交通站点客流不确定性分析方法 |
CN105320843A (zh) * | 2015-10-30 | 2016-02-10 | 中山大学 | 一种大气污染物浓度影响要素定量分析的方法 |
-
2016
- 2016-06-04 CN CN201610393256.2A patent/CN106055904B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104008278A (zh) * | 2014-05-14 | 2014-08-27 | 昆明理工大学 | 一种基于特征向量和最小二乘支持向量机的pm25浓度预测方法 |
CN104021430A (zh) * | 2014-06-12 | 2014-09-03 | 东南大学 | 一种城市轨道交通站点客流不确定性分析方法 |
CN105320843A (zh) * | 2015-10-30 | 2016-02-10 | 中山大学 | 一种大气污染物浓度影响要素定量分析的方法 |
Non-Patent Citations (3)
Title |
---|
基于VAR模型的PM2.5与其它空气污染物的动态关系分析;汪管镇等;《大气与环境光学学报》;20160331;第11卷(第2期);正文第2-3节及第4.1节 |
基于整体经验模态分解和支持向量回归的北京市PM2.5预测;秦喜文等;《吉林大学学报(地球科学版)》;20160331;第46卷(第2期);第563-568页 |
采用正定距阵因子分解法对武汉市夏季某PM2.5样品的来源解析;肖经汗等;《环境污染与防治》;20130531;第35卷(第5期);第6-12页 |
Also Published As
Publication number | Publication date |
---|---|
CN106055904A (zh) | 2016-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106055904B (zh) | 基于varx模型的大气pm2.5浓度预测方法 | |
Luo et al. | Trans-boundary air pollution in a city under various atmospheric conditions | |
Dong et al. | Attribution of extreme precipitation with updated observations and CMIP6 simulations | |
Lu et al. | Intensification of East Asian summer rainfall interannual variability in the twenty-first century simulated by 12 CMIP3 coupled models | |
Robinson et al. | Trends in atmospheric evaporative demand in Great Britain using high-resolution meteorological data | |
Rasch et al. | A comparison of scavenging and deposition processes in global models: results from the WCRP Cambridge Workshop of 1995 | |
Tong et al. | Long-term NOx trends over large cities in the United States during the great recession: Comparison of satellite retrievals, ground observations, and emission inventories | |
Makra et al. | Monitoring the long-range transport effects on urban PM10 levels using 3D clusters of backward trajectories | |
Johanson et al. | Hadley cell widening: Model simulations versus observations | |
Makra et al. | Airborne pollen in three European cities: Detection of atmospheric circulation pathways by applying three‐dimensional clustering of backward trajectories | |
Sprenger et al. | Nowcasting foehn wind events using the adaboost machine learning algorithm | |
Treble et al. | Synoptic-scale climate patterns associated with rainfall δ18O in southern Australia | |
Pirovano et al. | Investigating impacts of chemistry and transport model formulation on model performance at European scale | |
Makra et al. | The effect of different transport modes on urban PM10 levels in two European cities | |
Zappa et al. | Improving climate change detection through optimal seasonal averaging: The case of the North Atlantic jet and European precipitation | |
Salimi et al. | Nocturnal new particle formation events in urban environments | |
Monteiro et al. | Long-term assessment of particulate matter using CHIMERE model | |
Apadula et al. | Localization of source and sink regions of carbon dioxide through the method of the synoptic air trajectory statistics | |
Sun et al. | The drivers and health risks of unexpected surface ozone enhancements over the Sichuan Basin, China, in 2020 | |
Cheng et al. | A synoptic weather-typing approach to project future daily rainfall and extremes at local scale in Ontario, Canada | |
Jeon et al. | Impact of varying wind patterns on PM 10 concentrations in the Seoul metropolitan area in South Korea from 2012 to 2016 | |
De Leeuw et al. | Physical factors influencing regional precipitation variability attributed using an airmass trajectory method | |
Yan et al. | Synoptic condition and boundary layer structure regulate PM2. 5 pollution in the Huaihe River Basin, China | |
Nauth et al. | The Influence of Synoptic-Scale Wind Patterns on Column-Integrated Nitrogen Dioxide, Ground-Level Ozone, and the Development of Sea-Breeze Circulations in the New York City Metropolitan Area | |
Cai et al. | Stable water isotope and surface heat flux simulation using ISOLSM: Evaluation against in-situ measurements |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |