CN105303051A - 一种空气污染物浓度预测方法 - Google Patents

一种空气污染物浓度预测方法 Download PDF

Info

Publication number
CN105303051A
CN105303051A CN201510767342.0A CN201510767342A CN105303051A CN 105303051 A CN105303051 A CN 105303051A CN 201510767342 A CN201510767342 A CN 201510767342A CN 105303051 A CN105303051 A CN 105303051A
Authority
CN
China
Prior art keywords
sequence
air pollutant
pollutant concentration
modeling
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510767342.0A
Other languages
English (en)
Inventor
彭玲
李祥
池天河
崔绍龙
徐逸之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Remote Sensing and Digital Earth of CAS
Original Assignee
Institute of Remote Sensing and Digital Earth of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Remote Sensing and Digital Earth of CAS filed Critical Institute of Remote Sensing and Digital Earth of CAS
Priority to CN201510767342.0A priority Critical patent/CN105303051A/zh
Publication of CN105303051A publication Critical patent/CN105303051A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种空气污染物浓度预测方法,本方法包括:对空气污染物浓度数据使用Mallat算法进行多尺度小波分解,对最后一级尺度的低频近似序列使用支持向量回归模型即SVR建模预测,对其它高频细节序列使用自回归移动平均模型即ARMA建模预测,使用Mallat算法对各级系数序列进行重构,得到空气污染物浓度的预测结果。本发明中针对不同模型的适用特点对小波分解后不同级别尺度的序列使用不同的模型,即利用ARMA更适用于平稳序列的预测以及SVR更适用于不平稳序列的预测的特点对最后一级尺度的相对较为不平稳的低频近似序列使用SVR建模预测并且对其它相对较为平稳的高频细节序列使用ARMA建模预测。该方法可以实现较高的预测精度。

Description

一种空气污染物浓度预测方法
技术领域
本发明涉及一种数据预测方法,尤其涉及一种空气污染物浓度预测方法。
背景技术
目前,常用的城市空气污染物浓度预报方法主要有数值预报、逐步线性回归模型、灰色预测、自回归移动平均模型(AutoRegressiveandMovingAverage,ARMA)、支持向量回归模型(SupportVectorMachine,SVR)、支持向量回归模型、人工神经网络模型等。其中,自回归移动平均模型是建模平稳时间序列的有效工具,在城市空气污染物浓度预报中得到了广泛的应用。
空气污染物浓度由于受多种气象条件和大气理化过程影响,会出现各种异常情况,而现有自回归移动平均模型无法反映短时事件和意外事件的影响,预测不是很理想。
发明内容
本发明的目的在于克服现有技术中存在的上述不足,而提供一种空气污染物浓度预测方法,解决现有技术中预测空气污染物浓度的精度不高的问题。
本发明提供了一种空气污染物浓度预测方法,包括:对空气污染物浓度数据使用Mallat算法进行多尺度小波分解,对最后一级尺度的低频近似序列使用支持向量回归模型即SVR建模预测,对其它高频细节序列使用自回归移动平均模型即ARMA建模预测,使用Mallat算法对各级系数序列进行重构,得到空气污染物浓度的预测结果。
上述方法还可以具有以下特点:所述方法中进行三级尺度的小波分解,并且对第一级高频细节序列、第二级高频细节序列、第三级高频细节序列均使用ARMA进行建模预测,对第三级低频近似序列使用SVR建模预测。
上述方法还可以具有以下特点:所述方法中重构时,先将第三级低频近似序列和第三级高频细节序列预测结果经过滤波器系数加权和得到第二级低频近似序列的预测值;结合第二级高频细节序列预测值得到第一级低频近似序列预测值;最后结合第一高频细节序列预测值,得到最终预测结果。
上述方法还可以具有以下特点:采用最小二乘法对ARMA模型的参数进行估计。
上述方法还可以具有以下特点:采用在SVR模型中采用交叉验证法确定惩罚系数C、带宽参数σ。
上述方法还可以具有以下特点:在ARMA模型中使用赤池信息量准则选择模型的阶数
本发明的预测方法中,使用了多尺度小波分解,并针对不同模型的适用特点对小波分解后不同级别尺度的序列使用不同的模型,即利用ARMA更适用于平稳序列的预测以及SVR更适用于不平稳序列的预测的特点对最后一级尺度的相对较为不平稳的低频近似序列使用SVR建模预测并且对其它相对较为平稳的高频细节序列使用ARMA建模预测。该方法可以实现较高的预测精度。
附图说明
图1是一种空气污染物浓度预测方法的流程图;
图2是具体实施例中空气污染物浓度预测方法的流程图。
具体实施例
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
图1是空气污染物浓度预测方法的流程图,此方法包括以下步骤:
步骤1,对空气污染物浓度数据使用Mallat算法进行多尺度小波分解。
步骤2,对最后一级尺度的低频近似序列使用SVR建模预测,对其它高频细节序列使用ARMA建模预测。
步骤3,使用Mallat算法对各级系数序列进行重构,得到空气污染物浓度的预测结果。
下面对上述方法进行详细说明。
本方法中步骤1中的多尺度小波分解采用Mallat算法实现。运用Mallat算法,可以将信号逐层分解,每一层分解的结果是将上次分解得到的低频信号再分解成低频和高频两部分。计算公式如下
A j + 1 , k = Σ m h 0 ( m - 2 k ) A j , m
D j + 1 , k = Σ m h 1 ( m - 2 k ) A j , m
其中,j为分解尺度,k、m为平移变量,Aj,m为近似系数,是低频部分;Dj,k为细节系数,是高频部分,h0、h1分别是低通和高通滤波器。
步骤3中,利用分解后的小波系数重构原来的序列,小波系数的重构公式为
A j - 1 , k = Σ k h 0 ( m - 2 k ) A j , k + Σ k h 1 ( m - 2 k ) D j , k
步骤2中使用的ARMA模型是建模平稳随机序列常用的一种模型。模型如下:
x t = Σ k = 1 p a k x t - k + ϵ t + Σ k = 1 q b k ϵ t - k
式中随机干扰εt为均值为零,方差为σ2的白噪声。a1,a2,…,ap;b1,b2…,bq不全为零,分别称为AR系数和MA系数。p,q分别称为自回归(AR)阶数和移动平均(MA)阶数。
ARMA建模及预测步骤如下:
a)数据预处理
数据的预处理包括去均值处理和差分平稳化处理。去均值采用下式进行:其中为原始序列x的均值。差分平稳化是指对x'依次采用一阶差分处理直到序列平稳。平稳性检验采用ADF检验方法。
b)模型识别
模型识别是基于自相关函数和偏相关函数的定阶方法。对于AR(p)或MA(q)型,可以利用其样本的自相关函数和样本偏自相关函数的截尾特性判定模型的阶数。对于ARMA(p,q)型,一般使用赤池信息量准则(AkaikeInformationCriterion,简称AIC)选择模型的阶数。
c)参数估计
采用最小二乘法对ARMA模型的参数进行估计,具有算法简单、估计精度高、收敛快、鲁棒性强的优点。
d)模型检验
对序列建立模型后需要检验模型的合理性,若检验不通过,则调整模型阶数,重新估计参数和检验,直到检验通过为止。一般采用自相关函数图检验和DW系数检验。
e)预测
根据建立的模型进行预测分析,并评估预测精度。
步骤3中使用的SVR模型中通过非线性函数φ(x)变换,把xi映射到高维特征空间,然后在高维特征空间里,找到一个能够准确地表明输出数据及输入数据存在关系的线性函数f即为SVR函数:f(x)=wTφ(x)+b,φ:Rn→F,w∈F。
为了最小化实际风险,根据结构风险最小化原理,优化的结构风险目标函数为: R r e g = 1 2 | | w | | 2 + C n Σ i = 1 n | y i - f ( x i ) |
其中,||w||2为描述函数;惩罚系数C为经验风险和模型复杂度之间取一折中的常数;|yi-f(xi)|为ε不敏感损失函数,即
| y i - f ( x i ) | ϵ = 0 , | y i - f ( x i ) | ≤ ϵ | y i - f ( x i ) | - ϵ , | y i - f ( x i ) | > ϵ
为了求解上述的优化问题,通过Lagrange函数,引入Lagrange乘子a、a*,将该问题转化为其对偶问题:
max z = Σ i = 1 n y i ( a i * - a i ) - Σ i = 1 n ( a i * + a i ) ϵ - Σ i = 1 n Σ j = 1 n ( a i - a i * ) ( a j - a j * ) K ( x i , x j )
s . t . Σ i = 1 n ( a i * - a i ) = 0 , 0 ≤ a i ≤ C ; 0 ≤ a i * ≤ C ; i = 1 , 2 , ... , n
其中,当非零时对应的训练样本为支持向量。求解此二次规划问题可求出a的值,同时求得w的值:
w = Σ i = 2 n ( a i - a i * ) φ ( x i )
利用KKT条件计算出偏差b:
b = y i - ϵ - Σ i = 1 n ( a i - a i * ) K ( x j , x i ) ,
a i , a i * ∈ [ 0 , C ]
最后得到回归函数f(x)的表达式:其中K(xj,xi)为一个满足Mercer条件的核函数。我们采用高斯径向基核函数,也即 K ( x i , x j ) = exp ( - 1 2 σ 2 ( x i - x j ) 2 ) , 其中σ为带宽参数。
采用交叉验证法确定惩罚系数C、带宽参数σ。交叉验证法的基本思想是把在某种意义下将原始数据进行分组,一部分作为训练集,另一部分作为验证集,先用训练集对分类器进行训练,再用验证集来测试训练得到的模型,选择分类准确率最高时的C、σ参数。
如图2所示,在典型实施例中,上述方法中进行三级尺度的小波分解。对第一级高频细节序列、第二级高频细节序列、第三级高频细节序列均使用ARMA模型进行建模预测,对第三级低频近似序列使用SVR模型建模预测。进行重构时,先将第三级低频近似序列和第三级高频细节序列预测结果经过滤波器系数加权和得到第二级低频近似序列的预测值;结合第二级高频细节序列预测值得到第一级低频近似序列预测值;最后结合第一高频细节序列预测值,得到最终预测结果。
本发明的预测方法中,使用了多尺度小波分解,并针对不同模型的适用特点对小波分解后不同级别尺度的序列使用不同的模型,即利用ARMA更适用于平稳序列的预测以及SVR更适用于不平稳序列的预测的特点对最后一级尺度的相对较为不平稳的低频近似序列使用SVR建模预测并且对其它相对较为平稳的高频细节序列使用ARMA建模预测。通过实验发现,相比现有技术中的许多方法,该方法实现了较高的预测精度。
此外,需要说明的是,本说明书中所描述的具体实施例,其零、部件的形状、所取名称等可以不同,本说明书中所描述的以上内容仅仅是对本发明结构所作的举例说明。
上面描述的内容可以单独地或者以各种方式组合起来实施,而这些变型方式都在本发明的保护范围之内。
在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案而非限制,仅仅参照较佳实施例对本发明进行了详细说明。本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。

Claims (6)

1.一种空气污染物浓度预测方法,其特征在于,所述方法包括:对空气污染物浓度数据使用Mallat算法进行多尺度小波分解,对最后一级尺度的低频近似序列使用支持向量回归模型即SVR建模预测,对其它高频细节序列使用自回归移动平均模型即ARMA建模预测,使用Mallat算法对各级系数序列进行重构,得到空气污染物浓度的预测结果。
2.如权利要求1所述的一种空气污染物浓度预测方法,其特征在于,所述方法中进行三级尺度的小波分解,并且对第一级高频细节序列、第二级高频细节序列、第三级高频细节序列均使用ARMA进行建模预测,对第三级低频近似序列使用SVR建模预测。
3.如权利要求2所述的一种空气污染物浓度预测方法,其特征在于,所述方法中重构时,先将第三级低频近似序列和第三级高频细节序列预测结果经过滤波器系数加权和得到第二级低频近似序列的预测值;结合第二级高频细节序列预测值得到第一级低频近似序列预测值;最后结合第一高频细节序列预测值,得到最终预测结果。
4.如权利要求1、2或3所述的一种空气污染物浓度预测方法,其特征在于,采用最小二乘法对ARMA模型的参数进行估计。
5.如权利要求1、2或3所述的一种空气污染物浓度预测方法,其特征在于,采用在SVR模型中采用交叉验证法确定惩罚系数C、带宽参数σ。
6.如权利要求1、2或3所述的一种空气污染物浓度预测方法,其特征在于,在ARMA模型中使用赤池信息量准则选择模型的阶数。
CN201510767342.0A 2015-11-11 2015-11-11 一种空气污染物浓度预测方法 Pending CN105303051A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510767342.0A CN105303051A (zh) 2015-11-11 2015-11-11 一种空气污染物浓度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510767342.0A CN105303051A (zh) 2015-11-11 2015-11-11 一种空气污染物浓度预测方法

Publications (1)

Publication Number Publication Date
CN105303051A true CN105303051A (zh) 2016-02-03

Family

ID=55200314

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510767342.0A Pending CN105303051A (zh) 2015-11-11 2015-11-11 一种空气污染物浓度预测方法

Country Status (1)

Country Link
CN (1) CN105303051A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106650825A (zh) * 2016-12-31 2017-05-10 中国科学技术大学 一种机动车尾气排放数据融合系统
CN108802282A (zh) * 2018-06-05 2018-11-13 中国联合网络通信集团有限公司 有害气体浓度预测的方法、装置、设备及可读存储介质
TWI662422B (zh) * 2018-04-23 2019-06-11 國家中山科學研究院 Air quality prediction method based on machine learning model
CN110991484A (zh) * 2019-11-04 2020-04-10 广东科创工程技术有限公司 一种预测生物池出水cod浓度的方法
CN112036075A (zh) * 2020-08-11 2020-12-04 中国环境监测总站 一种基于环境监测数据关联关系的异常数据判定方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880755A (zh) * 2012-09-25 2013-01-16 河海大学 一种极端降水的定量预测方法及系统
CN103699800A (zh) * 2013-12-31 2014-04-02 哈尔滨工业大学 基于频域多尺度风速信号可预报性的超短期风速预测方法
CN104200291A (zh) * 2014-09-28 2014-12-10 山东科技大学 一种基于小波变换和arma-svm的涌水量预测方法
CN104268408A (zh) * 2014-09-28 2015-01-07 江南大学 一种基于小波系数arma模型的能耗数据宏观预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880755A (zh) * 2012-09-25 2013-01-16 河海大学 一种极端降水的定量预测方法及系统
CN103699800A (zh) * 2013-12-31 2014-04-02 哈尔滨工业大学 基于频域多尺度风速信号可预报性的超短期风速预测方法
CN104200291A (zh) * 2014-09-28 2014-12-10 山东科技大学 一种基于小波变换和arma-svm的涌水量预测方法
CN104268408A (zh) * 2014-09-28 2015-01-07 江南大学 一种基于小波系数arma模型的能耗数据宏观预测方法

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
刘亮等: "基于小波分析的ARMA-SVR网络流量预测方法", 《计算机工程与设计》 *
曹明等: "Mallat小波分解在空气污染指数分析中的应用", 《建筑热能通风空调》 *
杨俊杰,安学利,刘力著: "《水电能源系统最优调控的先进理论与方法》", 30 April 2015, 中国水利水电出版社 *
柳春等: "最小二乘支持向量机在API预测中的应用", 《沈阳师范大学学报(自然科学版)》 *
王斌: "利用空气污染指数(API)分析我国空气污染的区域时空变化特征", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》 *
王晓兰等: "基于小波分解和最小二乘支持向量机的短期风速预测", 《电网技术》 *
胡文军等: "适合大样本的线性SVMs快速集成模型", 《计算机科学》 *
赵欢等: "电站锅炉热效率与NOx排放响应特性建模方法", 《中国电机工程学报》 *
陈伟等: "基于小波分解和SVM的城市大气污染浓度预测", 《现代电子技术》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106650825A (zh) * 2016-12-31 2017-05-10 中国科学技术大学 一种机动车尾气排放数据融合系统
CN106650825B (zh) * 2016-12-31 2020-05-12 中国科学技术大学 一种机动车尾气排放数据融合系统
TWI662422B (zh) * 2018-04-23 2019-06-11 國家中山科學研究院 Air quality prediction method based on machine learning model
CN108802282A (zh) * 2018-06-05 2018-11-13 中国联合网络通信集团有限公司 有害气体浓度预测的方法、装置、设备及可读存储介质
CN110991484A (zh) * 2019-11-04 2020-04-10 广东科创工程技术有限公司 一种预测生物池出水cod浓度的方法
CN112036075A (zh) * 2020-08-11 2020-12-04 中国环境监测总站 一种基于环境监测数据关联关系的异常数据判定方法

Similar Documents

Publication Publication Date Title
CN105303051A (zh) 一种空气污染物浓度预测方法
CN110334875A (zh) 计及评估指标冲突的风电功率组合概率预测方法
Wang et al. An improved ARIMA model for precipitation simulations
CN108241901B (zh) 一种基于预测数据的变压器预警评估方法及装置
CN109886464B (zh) 基于优化奇异值分解生成特征集的低信息损失短期风速预测方法
CN103617435B (zh) 一种主动学习图像分类方法和系统
Yang et al. A new hybrid optimization prediction model for PM2. 5 concentration considering other air pollutants and meteorological conditions
CN101739819A (zh) 预测交通流的方法和装置
CN106096646A (zh) 一种支持向量回归机模型选择方法
CN108491953B (zh) 一种基于非线性理论的pm2.5预测与预警方法及系统
CN107688863A (zh) 自适应迭代加强的短期风速高精度组合预测方法
Al-Jawarneh et al. Elastic net regression and empirical mode decomposition for enhancing the accuracy of the model selection
KR101703972B1 (ko) 공간정보를 이용한 지하수 부존 지역 예측시스템 및 지하수 부존 지역 예측방법
Darmawan et al. GRU and XGBoost Performance with Hyperparameter Tuning Using GridSearchCV and Bayesian Optimization on an IoT-Based Weather Prediction System.
Guo et al. Groundwater depth forecasting using configurational entropy spectral analyses with the optimal input
Lian Runoff forecasting model based on CEEMD and combination model: a case study in the Manasi River, China
CN111291481A (zh) 一种基于贝叶斯模型的结构预警分析方法
CN110516792A (zh) 基于小波分解和浅层神经网络的非平稳时间序列预测方法
Duan et al. AutoML-based drought forecast with meteorological variables
CN117892162A (zh) 一种基于非负矩阵分解和机器学习的流域径流预报方法
CN112084294B (zh) 一种基于人工智能的整车电磁兼容分级管理方法
CN116701875A (zh) 一种特高压交流输电线路可听噪声概率预测方法及系统
Chang et al. Real-time prediction of ocean observation data based on transformer model
CN114648060A (zh) 基于机器学习的故障信号规范化处理及分类方法
Gu et al. A High-Robust Displacement Prediction Model for Super-High Arch Dams Integrating Wavelet De-Noising and Improved Random Forest. Water 2023; 15 (7): 1271

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160203

RJ01 Rejection of invention patent application after publication