CN113283614A - 基于OcE的PM2.5浓度预测方法 - Google Patents

基于OcE的PM2.5浓度预测方法 Download PDF

Info

Publication number
CN113283614A
CN113283614A CN202110476514.4A CN202110476514A CN113283614A CN 113283614 A CN113283614 A CN 113283614A CN 202110476514 A CN202110476514 A CN 202110476514A CN 113283614 A CN113283614 A CN 113283614A
Authority
CN
China
Prior art keywords
model
elm
oce
generation
concentration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110476514.4A
Other languages
English (en)
Other versions
CN113283614B (zh
Inventor
王晓军
杨小明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongbei University Of Finance & Economics
Original Assignee
Dongbei University Of Finance & Economics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongbei University Of Finance & Economics filed Critical Dongbei University Of Finance & Economics
Priority to CN202110476514.4A priority Critical patent/CN113283614B/zh
Publication of CN113283614A publication Critical patent/CN113283614A/zh
Application granted granted Critical
Publication of CN113283614B publication Critical patent/CN113283614B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/06Investigating concentration of particle suspensions

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Dispersion Chemistry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于OcE的PM2.5浓度预测方法,属于计算机应用技术领域。本发明包括,第一步:使用ONAR模型来描述PM2.5数据流的动态特性,搭建在线PM2.5浓度预测模型框架。第二步:利用EnsMDOS‑ELM来递归学习每一代NAR模型的非线性函数。EnsMDOS‑ELM中的基学习机是MDOS‑ELM,使用GEM融合规则获得新一代MDOS‑ELM子模型的权重。第三步:综合执行第一步~第二步,即可获得基于OcE的PM2.5浓度预测模型。第四步:设计了OcE预测模型时间稳定性的检验方法,即任何当前NAR‑EnsMDOS‑ELM模型都可以稳定预测未来几年(e.g.一年和两年)的每小时PM2.5浓度。本发明以新颖且更合理的方式搭建基于OcE技术的PM2.5浓度预测模型,挖掘空气质量数据中的有用信息。实验结果表明所申请技术能够显著提高每小时PM2.5浓度预测的时间稳定性和泛化性。

Description

基于OcE的PM2.5浓度预测方法
技术领域
本发明本发明涉及在线学习、集成学习和神经网络技术,属于计算机应用技术领域,尤其涉及一种基于OcE的PM2.5浓度预测方法。
背景技术
本发明以最受关注的空气污染物——细颗粒物(即PM2.5)浓度为主要研究对象。中国快速的城市化和工业化带来了严重的空气污染。PM2.5是最有害的空气污染物之一,它由空气动力学直径小于2.5μm的空气传播颗粒组成。长期暴露于高浓度PM2.5中会严重危害人类健康,例如肺气肿,肺部疾病,肺癌和鼻癌的风险更高。此外,长期高浓度的PM2.5会逐渐降低城市的人才吸引力,侵蚀城市经济增长,降低区域竞争力等。改善空气质量和降低PM2.5的浓度是非常困难的,它们不可能在短时间内得到完全解决。时间稳定的且高精度的PM2.5浓度预测器不仅有助于政府做出正确的决策和采取措施(例如,限制交通以减少向大气排放的废气),还可以帮助人们计划出行。因此,迫切需要这样的PM2.5浓度预测模型。
迄今为止,PM2.5浓度预测模型大致分为两类。一类是基于大气扩散模拟的机理预报器。尽管具有良好的解释性,但机理预测因子总是过分简化PM2.5的形成过程和环境,因此在分析和预测PM2.5浓度方面存在局限性。另一类是数据驱动的模型,可以进一步分为线性和非线性PM2.5浓度预报器。线性函数近似拟合非线性函数,在建模PM2.5浓度的复杂非线性关系时面临着严峻的挑战。在非线性预报器方面,Zhou等人(2019)[Y.Zhou,F.-J.Chang,L.-C.Chang,I-F.K.,Y.-S.Wang.Explore a deep learning multi-output neuralnetwork for regional multi-step-ahead air quality forecasts.Journal ofCleaner Production,vol.209,pp.134-145,Feb.2019.],[Y.Zhou,F.-J.Chang,L.-C.Chang,I-F.Kao,Y.-S.Wang,C.-C.Kang.Multi-output support vector machine forregional multi-step-ahead PM2.5 forecasting,Science of the Total Environment,vol.651,pp.230-240,2019.]提出了两个PM2.5浓度多步超前预测模型,它们属于带有外源输入的非线性自回归(Nonlinear Auto-Regressive with eXogenous input,NARX)模型。Shang等人(2019)[Z.Shang,T.Deng,J.He,X.Duan.Anovel model for hourlyPM2.5concentration prediction based on CART and EELM.Science of the TotalEnvironment,vol.651,pp.3043-3052,2019.]提出了一个不完整的非线性时间序列模型。已发表的PM2.5浓度预测模型中,具有学习大规模数据的优势的是基于将非线性时间序列模型与机器学习算法相结合的混合方法。但是,PM2.5浓度会随着时间而变化,而这些预测模型大都利用离线学习策略,难以在持续增加的数据中进行更新。
发明内容
为了提高PM2.5浓度预测的时间稳定性和泛化性,本发明提出了基于OcE的PM2.5浓度预测方法,为面向大规模且持续增加的空气质量数据建立时间稳定性和泛化性更高的PM2.5预测模型提供一种新的思路和方法。
技术方案如下:
一种基于OcE的PM2.5浓度预测方法,步骤如下:
第一步:使用ONAR模型来描述PM2.5数据流的动态特性,搭建在线PM2.5浓度预测模型框架;基于ONAR的PM2.5浓度预测模型包括两部分:
一部分是NAR时间序列模型,其数学表达式如下:
PM2.5(t+1)=f(PM2.5(t),PM2.5(t-1),…,PM2.5(t-p)), (1)
其中PM2.5(t+1),PM2.5(t),PM2.5(t-1),…,PM2.5(t-p)表示PM2.5浓度时间序列,时间单位是小时;PM2.5·(t+1)表示下一小时的PM2.5浓度;PM2.5(t)表示当前PM2.5浓度;PM2.5(t-1),PM2.5(t-2),…,PM2.5(t-p)是前1,2,…,p个小时的PM2.5浓度,p+1表示自回归的阶数,选取若干个候选值p+1=1,2,3,4,…分别建立基于ONAR的PM2.5浓度预测模型,选取使得PM2.5浓度预测精度最高的p+1候选值最为p+1的最终值,f(·)表示非线性映射函数;
另外一部分是初代NAR模型的建立过程以及后代NAR模型的在线更新过程;
第二步:利用EnsMDOS-ELM递归学习每一代NAR模型的非线性函数,利用GEM融合规则获得每一代MDOS-ELM子模型的权重;
第三步:综合执行第一步~第二步,获得基于OcE的PM2.5浓度预测模型;
第四步:设计OcE预测模型时间稳定性的检测方法,即任何当前NAR-EnsMDOS-ELM模型预测未来几年的每小时PM2.5浓度。
进一步的,第一步的初代NAR模型的建立过程以及后代NAR模型的在线更新过程,实现过程为:PM2.5数据按时间顺序不断产生;
根据时间顺序,使用历史周期
Figure BDA0003047263760000031
内的PM2.5数据构造初代样本块
Figure BDA0003047263760000032
建立初代NARPM2.5浓度预测模型
Figure BDA0003047263760000033
令后代NAR模型的更新周期为
Figure BDA0003047263760000034
当累计了第1个更新周期
Figure BDA0003047263760000035
的样本后构造第1代样本块
Figure BDA0003047263760000036
更新
Figure BDA0003047263760000037
获得第一代NAR PM2.5浓度预测模型
Figure BDA0003047263760000038
当累计了第2个更新周期
Figure BDA0003047263760000039
的样本后构造第2代样本块
Figure BDA00030472637600000310
更新
Figure BDA00030472637600000311
获得第一代NAR PM2.5浓度预测模型
Figure BDA00030472637600000312
以此类推,不断获得新的样本块并更新模型;
分别准备
Figure BDA00030472637600000313
Figure BDA00030472637600000314
候选集,即
Figure BDA00030472637600000315
年,2年,3年;
Figure BDA00030472637600000316
年,1年,产生了6种组合:
Figure BDA00030472637600000317
Figure BDA00030472637600000318
分别在每种组合下建立并测试基于OcE的PM2.5浓度预测模型,挑选预测性能最好的组合。
进一步的,第二步的EnsMDOS-ELM是指以MDOS-ELM为基学习机的集成方法,获得EnsMDOS-ELM的过程,包括:EnsMDOS-ELM模型集成了一组具有递归学习能力的且各不相同的MDOS-ELM子模型,EnsMDOS-ELM模型主要包括两个环节:
第一个环节是训练各代MDOS-ELM子模型,每一个初代MDOS-ELM子模型都建立在初代样本块
Figure BDA00030472637600000319
上;令
Figure BDA00030472637600000320
表示初代EnsMDOS-ELM中的第i个子模型,其中M表示EnsMDOS-ELM中子模型的总数;当获得第1代样本块
Figure BDA00030472637600000321
后,第1代MDOS-ELM子模型
Figure BDA00030472637600000322
通过递归学习的方式从自其初代子模型
Figure BDA00030472637600000323
更新获得;当获得第2代样本块
Figure BDA00030472637600000324
后,第2代MDOS-ELM子模型
Figure BDA0003047263760000041
通过递归学习的方式从自第1初代子模型
Figure BDA0003047263760000042
更新获得;
第二个环节是使用Perrone和Cooper定义的GEM融合规则计算每一代MDOS-ELM子模型的权重;每一代子模型的权重都随着新样本块进行动态调整。4.根据权利要求3所述的基于OcE的PM2.5浓度预测方法,其特征在于:第四步的OcE预测模型时间稳定性的检验过程如下:任何当前NAR-EnsMDOS-ELM模型预测未来几年的每小时PM2.5浓度,其中NAR-EnsMDOS-ELM表示以EnsMDOS-ELM为非线性拟合函数的NAR模型;使用2010~2015年北京每小时PM2.5数据进行实验;当
Figure BDA0003047263760000043
Figure BDA0003047263760000044
时,OcE PM2.5浓度预测模型的测试集均方根误差及其标准差最低,即预测性能最好;此时,使用2010~2011年的每小时PM2.5数据构造
Figure BDA0003047263760000045
并建立
Figure BDA0003047263760000046
每年更新一次OcE PM2.5浓度预测模型;由2012年的每小时PM2.5数据构造
Figure BDA0003047263760000047
并建立
Figure BDA0003047263760000048
由2013年的每小时PM2.5数据构造
Figure BDA0003047263760000049
并建立
Figure BDA00030472637600000410
依次类推,当
Figure BDA00030472637600000411
Figure BDA00030472637600000412
时的OcE PM2.5浓度预测模型的具体的时间稳定性检验过程:
如果检验OcE模型对未来一年的预测效果,则以2012年的每小时PM2.5数据为
Figure BDA00030472637600000413
的测试集;以2013年的每小时PM2.5数据为
Figure BDA00030472637600000414
的测试集;以2014年的每小时PM2.5数据为
Figure BDA00030472637600000415
的测试集;依次类推,计算OcE模型在2012~2015测试集上RMSE的平均值
Figure BDA00030472637600000416
和标准差
Figure BDA00030472637600000417
如果检测OcE模型对未来两年的预测效果,则以2013年的每小时PM2.5数据为
Figure BDA00030472637600000418
的测试集;以2014年的每小时PM2.5数据为
Figure BDA00030472637600000419
的测试集;以2015年的每小时PM2.5数据为
Figure BDA00030472637600000420
的测试集;依次类推,计算OcE模型在2013~2015测试集上RMSE的平均值
Figure BDA00030472637600000421
和标准差
Figure BDA00030472637600000422
从理论上分析,
Figure BDA00030472637600000423
会大于等于
Figure BDA00030472637600000424
这是因为随着预测周期的延长,预测难度会加大,预测误差会随之增大;
Figure BDA00030472637600000425
小于等于或略大于
Figure BDA00030472637600000426
则表明OcE模型的时间稳定性好;实验结果证明基于OcE的PM2.5浓度预测模型具有好的时间稳定性。
本发明的有益效果是:
基于OcE的PM2.5浓度预测方法的思想是:第一步:使用ONAR模型来描述PM2.5数据流的动态特性,搭建在线PM2.5浓度预测模型框架。第二步:利用EnsMDOS-ELM来递归学习每一代NAR模型的非线性函数。EnsMDOS-ELM中的基学习机是MDOS-ELM,使用GEM融合规则获得新一代MDOS-ELM子模型的权重。第三步:综合执行第一步~第二步,即可获得基于OcE的PM2.5浓度预测模型。第四步:设计了OcE预测模型时间稳定性的检验方法,即任何当前NAR-EnsMDOS-ELM模型都可以稳定预测未来几年(e.g.,一年和两年)的每小时PM2.5浓度。
本发明以新颖且更合理的方式搭建基于OcE技术的PM2.5浓度预测模型,挖掘空气质量数据中的有用信息。期望其进一步提高每小时PM2.5浓度预测的时间稳定性和泛化性。
具体实施方式
本发明的具体实施方式如下:
基于OcE的PM2.5浓度预测方法,其特征在于:包括如下步骤,
第一步:使用ONAR模型来描述PM2.5数据流的动态特性,搭建在线PM2.5浓度预测模型框架。基于ONAR(在线非线性自回归,Online Nonlinear Auto-Regressive)的PM2.5浓度预测模型包括两部分。一部分是NAR时间序列模型,其数学表达式如下:
PM2.5(t+1)=f(PM2.5(t),PM2.5(t-1),…,PM2.5(t-p)),(1)其中PM2.5(t+1),PM2.5(t),PM2.5(t-1),…,PM2.5(t-p)表示PM2.5浓度时间序列。时间单位是小时。PM2.5(t+1)是下一小时的PM2.5浓度;PM2.5(t)是当前PM2.5浓度;PM2.5(t-1),PM2.5(t-2),…,PM2.5(t-p)是前1,2,…,p个小时的PM2.5浓度。p+1是自回归的阶数,由实验经验获得,即选取几个候选值p+1=1,2,3,4,…分别建立基于ONAR的PM2.5浓度预测模型,选取使得PM2.5浓度预测精度最高的p+1候选值最为p+1的最终值。f(·)表示非线性映射函数。
另外一部分是初代NAR模型的建立过程以及后代NAR模型的在线更新过程。
第二步:利用EnsMDOS-ELM来递归学习每一代NAR模型的非线性函数。EnsMDOS-ELM是指以MDOS-ELM为基学习机的集成方法,能够提高单个MDOS-ELM(记忆减退型在线极限学习机,Ensemble Memory Degradation based Online Sequential ELMs)模型的泛化性。利用GEM融合规则获得每一代MDOS-ELM子模型的权重。GEM是Perrone和Cooper定义的广义集成方法(General Ensemble Method),实际上是一种计算子模型权重(i.e.,融合规则)的方法。
第三步:综合执行第一步~第二步,即可获得基于OcE的PM2.5浓度预测模型。
第四步:设计了OcE预测模型时间稳定性的检测方法,即任何当前NAR-EnsMDOS-ELM模型预测未来几年(e.g.,一年和两年)的每小时PM2.5浓度。
优选地,第一步的初代NAR模型的建立过程以及后代NAR模型的在线更新过程,实现过程为:PM2.5数据是按时间顺序不断产生。根据时间顺序,我们使用历史周期
Figure BDA0003047263760000061
内的PM2.5数据构造初代样本块
Figure BDA0003047263760000062
建立初代NAR PM2.5浓度预测模型
Figure BDA0003047263760000063
令后代NAR模型的更新周期为
Figure BDA0003047263760000064
当累计了第1个更新周期
Figure BDA0003047263760000065
的样本后构造第1代样本块
Figure BDA0003047263760000066
更新
Figure BDA0003047263760000067
获得第一代NAR PM2.5浓度预测模型
Figure BDA0003047263760000068
当累计了第2个更新周期
Figure BDA0003047263760000069
的样本后构造第2代样本块
Figure BDA00030472637600000610
更新
Figure BDA00030472637600000611
获得第一代NAR PM2.5浓度预测模型
Figure BDA00030472637600000612
以此类推,不断获得新的样本块并更新模型。
另外,历史周期
Figure BDA00030472637600000613
和更新周期
Figure BDA00030472637600000614
是两个关键参数,需要通过实验确定。实验方案是,分别准备
Figure BDA00030472637600000615
Figure BDA00030472637600000616
候选集,即
Figure BDA00030472637600000617
年,2年,3年;
Figure BDA00030472637600000618
年(半年),1年。产生了6种组合:
Figure BDA00030472637600000619
Figure BDA00030472637600000620
分别在每种组合下建立并测试基于OcE的PM2.5浓度预测模型,挑选预测性能(均方根误差和训练时间)最好的组合。
优选地,第二步的EnsMDOS-ELM是指以MDOS-ELM为基学习机的集成方法,获得EnsMDOS-ELM的过程包括:EnsMDOS-ELM模型集成了一组具有递归学习能力的且各不相同的MDOS-ELM子模型。EnsMDOS-ELM模型主要包括两个环节。第一个环节是训练各代MDOS-ELM子模型。每一个初代MDOS-ELM子模型都建立在初代样本块
Figure BDA00030472637600000621
上,但是这些初代子模型具有不同的随机初始权重,因此彼此之间存在差异。令
Figure BDA00030472637600000622
表示初代EnsMDOS-ELM中的第i个子模型。M表示EnsMDOS-ELM中子模型的总数,在我们的OcE PM2.5浓度预测模型中M=6。当获得第1代样本块
Figure BDA0003047263760000071
后,第1代MDOS-ELM子模型
Figure BDA0003047263760000072
通过递归学习的方式从自其初代子模型
Figure BDA0003047263760000073
更新获得。当获得第2代样本块
Figure BDA0003047263760000074
后,第2代MDOS-ELM子模型
Figure BDA0003047263760000075
通过递归学习的方式从自第1初代子模型
Figure BDA0003047263760000076
更新获得。第二个环节是使用Perrone和Cooper定义的GEM融合规则计算每一代MDOS-ELM子模型的权重。特别地,每一代子模型的权重都是随着新样本块动态调整的。
优选地,第四步的OcE预测模型时间稳定性的检验方法。检验过程包括:任何当前NAR-EnsMDOS-ELM模型预测未来几年(e.g.,一年和两年)的每小时PM2.5浓度,其中NAR-EnsMDOS-ELM表示以EnsMDOS-ELM为非线性拟合函数的NAR模型。我们使用2010~2015年北京每小时PM2.5数据进行实验。实验发现,当
Figure BDA0003047263760000077
Figure BDA0003047263760000078
时,OcE PM2.5浓度预测模型的测试集均方根误差(Root Mean Square Error,RMSE)及其标准差最低,即预测性能最好。此时,使用2010~2011年的每小时PM2.5数据构造
Figure BDA0003047263760000079
并建立
Figure BDA00030472637600000710
每年更新一次OcE PM2.5浓度预测模型。那么,由2012年的每小时PM2.5数据构造
Figure BDA00030472637600000711
并建立
Figure BDA00030472637600000712
由2013年的每小时PM2.5数据构造
Figure BDA00030472637600000713
并建立
Figure BDA00030472637600000714
依次类推。我们以
Figure BDA00030472637600000715
Figure BDA00030472637600000716
时的OcE PM2.5浓度预测模型为例,介绍具体的时间稳定性检验过程:
如果检验OcE模型对未来一年的预测效果,则以2012年的每小时PM2.5数据为
Figure BDA00030472637600000717
的测试集;以2013年的每小时PM2.5数据为
Figure BDA00030472637600000718
的测试集;以2014年的每小时PM2.5数据为
Figure BDA00030472637600000719
的测试集;依次类推。计算OcE模型在2012~2015测试集上RMSE的平均值
Figure BDA00030472637600000720
和标准差
Figure BDA00030472637600000721
如果检测OcE模型对未来两年的预测效果,则以2013年的每小时PM2.5数据为
Figure BDA00030472637600000722
的测试集;以2014年的每小时PM2.5数据为
Figure BDA00030472637600000723
的测试集;以2015年的每小时PM2.5数据为
Figure BDA00030472637600000724
的测试集;依次类推。计算OcE模型在2013~2015测试集上RMSE的平均值
Figure BDA00030472637600000725
和标准差
Figure BDA00030472637600000726
从理论上分析,
Figure BDA00030472637600000727
会大于等于
Figure BDA00030472637600000728
这是因为随着预测周期的延长,预测难度会加大,预测误差会随之增大。
Figure BDA0003047263760000081
小于等于或略大于
Figure BDA0003047263760000082
则表明OcE模型的时间稳定性很好。实验结果证明基于OcE的PM2.5浓度预测模型具有很好的时间稳定性。
本节通过仿真实验,验证基于OcE的PM2.5浓度预测方法作为一种新的思路和方法,在面向大规模且持续增加的空气质量数据建立时间稳定性和泛化性更高的PM2.5预测模型时的有效性。
实验数据
使用2010~2015年北京地区每小时PM2.5浓度数据进行了实验分析。Liang等人已经分析和验证了该数据的可靠性和一致性。我们对数据进行了预处理,包括缺失值填补、对数转换、异常值检测和替换、以及数据归一化。MDOS-ELM子模型的激活函数是“Sigmoid”函数。子模型的数量适合设置为6个。采用RMSE度量模型的预测精度和泛化性,计算公式如下:
Figure BDA0003047263760000083
表1当
Figure BDA0003047263760000084
Figure BDA0003047263760000085
时OcE PM2.5浓度预测模型对未来一年的PM2.5浓度的预测结果
p+1 1 2 3 4
测试集平均RMSE 4.88 23.40 35.38 38.89
确定p+1的值。设置
Figure BDA0003047263760000086
Figure BDA0003047263760000087
此时,OcE PM2.5浓度预测模型对未来一年的PM2.5浓度的预测过程:2010年的PM2.5数据构成了初始样本块
Figure BDA0003047263760000088
以2011年的每小时PM2.5数据为
Figure BDA0003047263760000089
的测试集;以2011年的每小时PM2.5数据为第1代样本块
Figure BDA00030472637600000810
以2012年的每小时PM2.5数据为
Figure BDA00030472637600000811
的测试集;…;以2014年的每小时PM2.5数据为第3代样本块
Figure BDA00030472637600000812
以2015年的每小时PM2.5数据为
Figure BDA00030472637600000813
的测试集。预测结果见表1,结果表明,当p+1=1时,OcEPM2.5浓度预测模型的平均RMSE最低,表明当p+1=1时,OcE PM2.5浓度预测模型的泛化性最好,所以选取p+1=1。
表2当
Figure BDA0003047263760000091
Figure BDA0003047263760000092
或2时,OcE PM2.5浓度预测模型对未来一年的PM2.5浓度的预测结果
Figure BDA0003047263760000093
确定
Figure BDA0003047263760000094
的值。当
Figure BDA0003047263760000095
Figure BDA0003047263760000096
时,OcE PM2.5浓度预测模型对未来一年的PM2.5浓度的预测过程:2010~2011年的PM2.5数据构成了初始样本块
Figure BDA0003047263760000097
以2012年的每小时PM2.5数据为
Figure BDA0003047263760000098
的测试集;以2012年的每小时PM2.5数据为第1代样本块
Figure BDA0003047263760000099
以2013年的每小时PM2.5数据为
Figure BDA00030472637600000910
的测试集;…;以2014年的每小时PM2.5数据为第3代样本块
Figure BDA00030472637600000911
以2015年的每小时PM2.5数据为
Figure BDA00030472637600000912
的测试集。结果见表2,结果表明,
Figure BDA00030472637600000913
和2时,测试集平均RMSE几乎一样,但是
Figure BDA00030472637600000914
时测试集RMSE标准差要小的多,因此从时间稳定性和泛化性的角度,确定
Figure BDA00030472637600000915
表3当
Figure BDA00030472637600000916
Figure BDA00030472637600000917
时,基于OcE的PM2.5浓度预测对未来一年和两年的PM2.5浓度的预测结果
评价指标 预测未来一年 预测未来两年
测试集平均RMSE 4.87 5.37
测试集RMSE标准差 1.54 1.26
为进一步验证OcE PM2.5浓度预测模型的时间稳定性,我们对比了当
Figure BDA00030472637600000918
Figure BDA00030472637600000919
时,OcE PM2.5浓度预测模型对未来一年和两年的PM2.5浓度的预测效果,结果见表3。未来两年的PM2.5浓度的预测过程是:2010~2011年的PM2.5数据构成了初始样本块
Figure BDA00030472637600000920
以2013年的每小时PM2.5数据为
Figure BDA00030472637600000921
的测试集;以2012年的每小时PM2.5数据为第1代样本块
Figure BDA00030472637600000922
以2014年的每小时PM2.5数据为
Figure BDA00030472637600000923
的测试集;以2013年的每小时PM2.5数据为2代样本块
Figure BDA0003047263760000101
以2015年的每小时PM2.5数据为
Figure BDA0003047263760000102
的测试集。结果显示,预测未来两年的测试集平均RMSE大于预测未来一年的测试集平均RMSE,表明随着预测周期的延长预测难度加大。但是,预测未来两年的测试集RMSE标准差小于预测未来一年测试集RMSE标准差,说明OcE PM2.5浓度预测模型的时间稳定性很好。
综上,实验结果表明,所申请的基于OcE的PM2.5浓度预测方法能够显著提高PM2.5浓度预测的时间稳定性和泛化性。
使用ONAR(Online Nonlinear Auto-Regressiv,在线非线性自回归,)模型来描述PM2.5数据流的动态特性,搭建在线PM2.5浓度预测模型框架。利用EnsMDOS-ELM来递归学习每一代NAR模型的非线性函数。EnsMDOS-ELM能够提高单个MDOS-ELM(Ensemble MemoryDegradation based Online Sequential ELMs,记忆减退型在线极限学习机)模型的泛化性。利用GEM(General Ensemble Method)融合规则获得每一代MDOS-ELM子模型的权重。实验中任何当前NAR-EnsMDOS-ELM模型都预测未来几年(e.g.,一年和两年)的每小时PM2.5浓度。实验结果表明所申请技术能够显著提高PM2.5浓度预测的时间稳定性和泛化性。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (4)

1.一种基于OcE的PM2.5浓度预测方法,其特征在于,步骤如下:
第一步:使用ONAR模型来描述PM2.5数据流的动态特性,搭建在线PM2.5浓度预测模型框架;基于ONAR的PM2.5浓度预测模型包括两部分:
一部分是NAR时间序列模型,其数学表达式如下:
PM2.5(t+1)=f(PM2.5(t),PM2.5(t-1),…,PM2.5(t-p)), (1)
其中PM2.5(t+1),PM2.5(t),PM2.5(t-1),…,PM2.5(t-p)表示PM2.5浓度时间序列,时间单位是小时;PM2.5·(t+1)表示下一小时的PM2.5浓度;PM2.5(t)表示当前PM2.5浓度;PM2.5(t-1),PM2.5(t-2),…,PM2.5(t-p)是前1,2,…,p个小时的PM2.5浓度,p+1表示自回归的阶数,选取若干个候选值p+1=1,2,3,4,…分别建立基于ONAR的PM2.5浓度预测模型,选取使得PM2.5浓度预测精度最高的p+1候选值最为p+1的最终值,f(·)表示非线性映射函数;
另外一部分是初代NAR模型的建立过程以及后代NAR模型的在线更新过程;
第二步:利用EnsMDOS-ELM递归学习每一代NAR模型的非线性函数,利用GEM融合规则获得每一代MDOS-ELM子模型的权重;
第三步:综合执行第一步~第二步,获得基于OcE的PM2.5浓度预测模型;
第四步:设计OcE预测模型时间稳定性的检测方法,即任何当前NAR-EnsMDOS-ELM模型预测未来几年的每小时PM2.5浓度。
2.根据权利要求1所述的基于OcE的PM2.5浓度预测方法,其特征在于:第一步的初代NAR模型的建立过程以及后代NAR模型的在线更新过程,实现过程为:PM2.5数据按时间顺序不断产生;
根据时间顺序,使用历史周期
Figure FDA0003047263750000011
内的PM25数据构造初代样本块
Figure FDA0003047263750000012
建立初代NAR PM2.5浓度预测模型
Figure FDA0003047263750000013
令后代NAR模型的更新周期为
Figure FDA0003047263750000014
当累计了第1个更新周期
Figure FDA0003047263750000015
的样本后构造第1代样本块
Figure FDA0003047263750000016
更新
Figure FDA0003047263750000017
获得第一代NAR PM2.5浓度预测模型
Figure FDA0003047263750000018
当累计了第2个更新周期
Figure FDA0003047263750000019
的样本后构造第2代样本块
Figure FDA00030472637500000110
更新
Figure FDA00030472637500000111
获得第一代NAR PM2.5浓度预测模型
Figure FDA00030472637500000112
以此类推,不断获得新的样本块并更新模型;
分别准备
Figure FDA00030472637500000113
Figure FDA00030472637500000114
候选集,即
Figure FDA00030472637500000115
Figure FDA00030472637500000116
产生了6种组合:
Figure FDA00030472637500000117
Figure FDA00030472637500000118
分别在每种组合下建立并测试基于OcE的PM2.5浓度预测模型,挑选预测性能最好的组合。
3.根据权利要求2所述的基于OcE的PM2.5浓度预测方法,其特征在于:第二步的EnsMDOS-ELM是指以MDOS-ELM为基学习机的集成方法,获得EnsMDOS-ELM的过程,包括:EnsMDOS-ELM模型集成了一组具有递归学习能力的且各不相同的MDOS-ELM子模型,EnsMDOS-ELM模型主要包括两个环节:
第一个环节是训练各代MDOS-ELM子模型,每一个初代MDOS-ELM子模型都建立在初代样本块
Figure FDA0003047263750000021
上;令
Figure FDA0003047263750000022
表示初代EnsMDOS-ELM中的第i个子模型,其中M表示EnsMDOS-ELM中子模型的总数;当获得第1代样本块
Figure FDA0003047263750000023
后,第1代MDOS-ELM子模型
Figure FDA0003047263750000024
通过递归学习的方式从自其初代子模型
Figure FDA0003047263750000025
更新获得;当获得第2代样本块
Figure FDA0003047263750000026
后,第2代MDOS-ELM子模型
Figure FDA0003047263750000027
Figure FDA0003047263750000028
通过递归学习的方式从自第1初代子模型
Figure FDA0003047263750000029
更新获得;
第二个环节是使用Perrone和Cooper定义的GEM融合规则计算每一代MDOS-ELM子模型的权重;每一代子模型的权重都随着新样本块进行动态调整。
4.根据权利要求3所述的基于OcE的PM2.5浓度预测方法,其特征在于:第四步的OcE预测模型时间稳定性的检验过程如下:任何当前NAR-EnsMDOS-ELM模型预测未来几年的每小时PM2.5浓度,其中NAR-EnsMDOS-ELM表示以EnsMDOS-ELM为非线性拟合函数的NAR模型;使用2010~2015年北京每小时PM2.5数据进行实验;当
Figure FDA00030472637500000210
Figure FDA00030472637500000211
时,OcE PM2.5浓度预测模型的测试集均方根误差及其标准差最低,即预测性能最好;此时,使用2010~2011年的每小时PM2.5数据构造
Figure FDA00030472637500000212
并建立
Figure FDA00030472637500000213
每年更新一次OcE PM2.5浓度预测模型;由2012年的每小时PM2.5数据构造
Figure FDA00030472637500000214
并建立
Figure FDA00030472637500000215
由2013年的每小时PM25数据构造
Figure FDA00030472637500000216
并建立
Figure FDA00030472637500000217
依次类推,当
Figure FDA00030472637500000218
Figure FDA00030472637500000219
时的OcE PM2.5浓度预测模型的具体的时间稳定性检验过程:
如果检验OcE模型对未来一年的预测效果,则以2012年的每小时PM2.5数据为
Figure FDA00030472637500000220
的测试集;以2013年的每小时PM25数据为
Figure FDA00030472637500000221
的测试集;以2014年的每小时PM2.5数据为
Figure FDA00030472637500000222
的测试集;依次类推,计算OcE模型在2012~2015测试集上RMSE的平均值
Figure FDA00030472637500000223
和标准差
Figure FDA00030472637500000224
如果检测OcE模型对未来两年的预测效果,则以2013年的每小时PM2.5数据为
Figure FDA00030472637500000225
的测试集;以2014年的每小时PM2.5数据为
Figure FDA00030472637500000226
的测试集;以2015年的每小时PM2.5数据为
Figure FDA0003047263750000031
的测试集;依次类推,计算OcE模型在2013~2015测试集上RMSE的平均值
Figure FDA0003047263750000032
和标准差
Figure FDA0003047263750000033
从理论上分析,
Figure FDA0003047263750000034
会大于等于
Figure FDA0003047263750000035
这是因为随着预测周期的延长,预测难度会加大,预测误差会随之增大;
Figure FDA0003047263750000036
小于等于或略大于
Figure FDA0003047263750000037
则表明OcE模型的时间稳定性好;实验结果证明基于OcE的PM2.5浓度预测模型具有好的时间稳定性。
CN202110476514.4A 2021-04-29 2021-04-29 基于OcE的PM2.5浓度预测方法 Active CN113283614B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110476514.4A CN113283614B (zh) 2021-04-29 2021-04-29 基于OcE的PM2.5浓度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110476514.4A CN113283614B (zh) 2021-04-29 2021-04-29 基于OcE的PM2.5浓度预测方法

Publications (2)

Publication Number Publication Date
CN113283614A true CN113283614A (zh) 2021-08-20
CN113283614B CN113283614B (zh) 2023-09-12

Family

ID=77277707

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110476514.4A Active CN113283614B (zh) 2021-04-29 2021-04-29 基于OcE的PM2.5浓度预测方法

Country Status (1)

Country Link
CN (1) CN113283614B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014075108A2 (en) * 2012-11-09 2014-05-15 The Trustees Of Columbia University In The City Of New York Forecasting system using machine learning and ensemble methods
CN105528515A (zh) * 2015-11-27 2016-04-27 国家电网公司 燃煤电站锅炉烟气污染物排放的环保经济性评价分析方法
WO2016101182A1 (zh) * 2014-12-23 2016-06-30 清华大学 基于贝叶斯网络和极限学习机的区间型指标预报方法
CN107122526A (zh) * 2017-04-06 2017-09-01 大连大学 基于异态特征子集集成算法的试验段马赫数建模方法
US20180259677A1 (en) * 2017-03-07 2018-09-13 International Business Machines Corporation Post-processing air quality forecasts
US20180318746A1 (en) * 2017-05-03 2018-11-08 Ul Llc Method and system for predictive air filter maintenance for sustained indoor air quality
CN110362989A (zh) * 2019-04-22 2019-10-22 浙江师范大学 基于记忆减退型在线序列极限学习机的恶意网页检测方法
CN110598953A (zh) * 2019-09-23 2019-12-20 哈尔滨工程大学 一种时空相关的空气质量预测方法
CN111144286A (zh) * 2019-12-25 2020-05-12 北京工业大学 一种融合emd和lstm的城市pm2.5浓度预测方法
CN111369072A (zh) * 2020-03-19 2020-07-03 大连理工大学 一种基于稀疏化方法的核最小均方时间序列在线预测模型
CN111859800A (zh) * 2020-07-15 2020-10-30 河海大学 用于pm2.5浓度分布的时空估算和预测的方法
CN112378619A (zh) * 2020-11-06 2021-02-19 东北财经大学 具有ReMD-OSELM的FER-FSE在风洞试验冲压阶段总压实时建模中的应用

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014075108A2 (en) * 2012-11-09 2014-05-15 The Trustees Of Columbia University In The City Of New York Forecasting system using machine learning and ensemble methods
WO2016101182A1 (zh) * 2014-12-23 2016-06-30 清华大学 基于贝叶斯网络和极限学习机的区间型指标预报方法
CN105528515A (zh) * 2015-11-27 2016-04-27 国家电网公司 燃煤电站锅炉烟气污染物排放的环保经济性评价分析方法
US20180259677A1 (en) * 2017-03-07 2018-09-13 International Business Machines Corporation Post-processing air quality forecasts
CN107122526A (zh) * 2017-04-06 2017-09-01 大连大学 基于异态特征子集集成算法的试验段马赫数建模方法
US20180318746A1 (en) * 2017-05-03 2018-11-08 Ul Llc Method and system for predictive air filter maintenance for sustained indoor air quality
CN110362989A (zh) * 2019-04-22 2019-10-22 浙江师范大学 基于记忆减退型在线序列极限学习机的恶意网页检测方法
CN110598953A (zh) * 2019-09-23 2019-12-20 哈尔滨工程大学 一种时空相关的空气质量预测方法
CN111144286A (zh) * 2019-12-25 2020-05-12 北京工业大学 一种融合emd和lstm的城市pm2.5浓度预测方法
CN111369072A (zh) * 2020-03-19 2020-07-03 大连理工大学 一种基于稀疏化方法的核最小均方时间序列在线预测模型
CN111859800A (zh) * 2020-07-15 2020-10-30 河海大学 用于pm2.5浓度分布的时空估算和预测的方法
CN112378619A (zh) * 2020-11-06 2021-02-19 东北财经大学 具有ReMD-OSELM的FER-FSE在风洞试验冲压阶段总压实时建模中的应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHIGEN SHANG等: "A novel model for hourly PM2 .5 concentration prediction based on CART and EELM", vol. 651, pages 3043 - 3052, XP085533752, DOI: 10.1016/j.scitotenv.2018.10.193 *
张丹宁等: "基于NARX神经网络的PM2.5/10浓度值预测模型——以咸阳市两寺渡监测站为例", vol. 11, no. 2, pages 161 - 168 *

Also Published As

Publication number Publication date
CN113283614B (zh) 2023-09-12

Similar Documents

Publication Publication Date Title
CN109492830B (zh) 一种基于时空深度学习的移动污染源排放浓度预测方法
Huang et al. Air quality prediction using improved PSO-BP neural network
Wang et al. A novel hybrid air quality early-warning system based on phase-space reconstruction and multi-objective optimization: A case study in China
Kang et al. Application of BP neural network optimized by genetic simulated annealing algorithm to prediction of air quality index in Lanzhou
CN108009674A (zh) 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法
CN108257114A (zh) 一种基于深度学习的输电设备缺陷自动识别方法
Huang et al. A new air quality forecasting model using data mining and artificial neural network
CN110533239B (zh) 一种智慧城市空气品质高精度测量方法
WO2017071369A1 (zh) 一种预测用户离网的方法和设备
CN111179592B (zh) 基于时空数据流融合分析的城市交通预测方法和系统
CN112232483A (zh) 一种结合cnn和lstm的航班平均票价预测方法
CN108537336B (zh) 一种基于深度神经网络的空气质量预测方法
CN112991721A (zh) 基于图卷积网络节点关联度的城市路网交通速度预测方法
CN114694767B (zh) 基于时空图常微分方程网络的pm2.5浓度预测方法
CN113011660A (zh) 空气质量预测方法、系统及存储介质
CN114841073A (zh) 基于局部标签传播的即时学习半监督软测量建模方法
CN117171546A (zh) 一种结合污染扩散指数的城市空气质量预测方法
CN113281229B (zh) 一种基于小样本下多模型自适应大气pm2.5浓度预测方法
CN113283614A (zh) 基于OcE的PM2.5浓度预测方法
Kekulanadara et al. Machine learning approach for predicting air quality index
Mu et al. An improved effective approach for urban air quality forecast
CN115056829A (zh) 多车型连续学习的列车运动状态估计方法
Song et al. Calibration of agent-based model using reinforcement learning
Qu et al. Short-term mathematical prediction model of air quality based on CEEMD-ELM-PSO
Zhang et al. Intelligent air quality detection based on genetic algorithm and neural network: An urban China case study

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant