CN113281229B - 一种基于小样本下多模型自适应大气pm2.5浓度预测方法 - Google Patents

一种基于小样本下多模型自适应大气pm2.5浓度预测方法 Download PDF

Info

Publication number
CN113281229B
CN113281229B CN202110179054.9A CN202110179054A CN113281229B CN 113281229 B CN113281229 B CN 113281229B CN 202110179054 A CN202110179054 A CN 202110179054A CN 113281229 B CN113281229 B CN 113281229B
Authority
CN
China
Prior art keywords
concentration
prediction
data
model
atmosphere
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110179054.9A
Other languages
English (en)
Other versions
CN113281229A (zh
Inventor
李晓理
李济瀚
王康
王富强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202110179054.9A priority Critical patent/CN113281229B/zh
Publication of CN113281229A publication Critical patent/CN113281229A/zh
Application granted granted Critical
Publication of CN113281229B publication Critical patent/CN113281229B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/06Investigating concentration of particle suspensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Chemical & Material Sciences (AREA)
  • Pathology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • Dispersion Chemistry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于小样本下多模型自适应大气PM2.5浓度预测方法,通过自身的太阳能供电系统、户外监测探头和云端网络实时在线对校园一年四季的大气污染物浓度进行数据采集,对采集到的大气污染物等进行数据归一化处理,用最小二乘支持向量回归方法对采集的四季的大气污染物数据进行训练得到不同季节的大气PM2.5浓度预测模型,将采集的数据作为预测模型的输入变量,不同预测模型根据自身算法计算得到不同季节的大气PM2.5浓度预测值,将预测值与实际的采集的数据进行预测比较,所得误差性能指标在几种模型中最小者,采用误差小者的预测模型对当前的状态下大气污染物PM2.5浓度进行预测,满足单一模型不能应对当前状态下模型预测大气PM2.5浓度的能力。

Description

一种基于小样本下多模型自适应大气PM2.5浓度预测方法
技术领域
本发明涉及特征提取,机器学习,多模型自适应,PM2.5浓度预测。
背景技术
目前技术比较成熟且应用较为广泛的预测方法大致为时间序列方法,多元线性回归方法,神经网络等方法。这些方法大多通过建立当前状态下线性或者非线性大气PM2.5浓度预测模型,从而实现PM2.5浓度预测。但是在实际的大气环境中,PM2.5浓度很容易受到环境影响变化,往往建立的当前状态下的单个预测模型难以满足大气环境下PM2.5浓度变化,进而导致所建立的模型预测精度下降甚至失效。
而上述这些方法甚至在建立模型时需要大量的历史数据进行训练。因此,计算时间被增加,并且在实际中有时没有足够数据可采集。
目前大气监测大多都停留在混合模型及多模型融合。而针对不同环境下建立相应的预测模型进行自适应的切换达到对PM2.5浓度预测的方法还没被广泛应用。
发明内容
本发明提出一种基于小样本下多模型自适应大气PM2.5浓度预测方法,该方法以北京市某校园大气监测系统平台采集到的大气污染物浓度及气象条件的数据作为输入变量,利用主元成分分析提取贡献率较大的数据变量,通过所建立的多个不同季节的预测模型对大气中细颗粒物PM2.5浓度预测,然后通过误差的性能指标判断,从而实现多模型自适应大气PM2.5浓度预测。
描述下图1的结构组成以及连接关系。
该大气监测系统平台由软件及硬件两部分组成。软件包括上位机大气污染监测系统,客户端APP。客户可以通过上位机实时监测大气污染物及气象条件等因素的变化趋势。其中包括:污染物趋势图、空气质量情况及监测区域等。客户也可以通过手机APP实时任何地点监测周围空气质量情况及污染物趋势变化等。硬件包括室外监测探测器,该探测器由室外探头、太阳能供电板及配电箱组成。该大气监测系统利用室外监测设备采集到的污染物数据通过4/5G网络上传到云端服务器然后,客户端利用上位机及移动客户端上的APP等实时对周围空气质量的监测及查看。
包括以下步骤:
步骤1:大气监测系统在北京市某校园环境中,通过网络云端及硬件支持,对大气PM2.5浓度全年(四季)不间断实时监测和数据采集。
步骤2:通过主元成分分析方法对采集到的大气污染物进行贡献率分析得到 PM2.5浓度累积贡献率最高。并分析与大气PM2.5浓度有关系的因素,进而对大气 PM2.5浓度进行预测。
步骤3:将分析得到的与PM2.5有关系的一组变量作为预测模型的输入变量。
步骤4:对输入变量进行数据归一化处理,使量纲一致,从而达到预测更准确。
步骤5:将归一化的不同季节的数据分别进行训练建立相应季节的LS-SVR (最小二乘支持向量回归)预测模型。
步骤6:通过测试数据对预测模型进行PM2.5浓度进行验证。
步骤7:当采集新的数据输入当前预测模型时,预测模型预测与实际值进行比较。
步骤8:通过对预测误差性能指标的比较,判断当前预测模型是否适合当前的季节的采集数据,如果误差较大,切换相对应的误差较小的预测模型预测未来 PM2.5浓度值。
本发明实施例的基于小样本下多模型自适应大气PM2.5浓度预测方法,以北京市某校园大气图监测数据PM10,PM2.5,NO2,SO2,O3及气象条件(温度,湿度) 作为输入变量,利用输入变量建立多个季节的不同预测模型,对大气PM2.5浓度预测,再根据误差的性能指标判定,选择合适的预测模型进行自适应切换实现对 PM2.5浓度的预测。该方法使用小样本下多模型自适应大气PM2.5浓度预测方法很好地解决了不需要大量的历史数据,减小了计算量及时间,克服了单一模型无法满足当前系统状态的性能要求,实现了不同季节的预测模型切换,从而达到准确预测大气中细颗粒物PM2.5浓度。
另外,根据本实施例的基于小样本多模型自适应大气PM2.5浓度预测方法还具有如下附加的技术特征:
在步骤2中需要对数据进行标准化然后通过累积贡献率进行分析和提取,其中累积贡献率为85%-95%以上的前面的变量为主要变量。
在步骤4中需要对输入变量进行归一化,其公式如下所示:
Figure GDA0003163863120000021
Figure GDA0003163863120000031
在步骤5中预测模型为LS-SVR,其计算和推倒过程如下:
给定一组监测的当前季节的大气污染物的数据T={(x1,y1),…(xn,yn)},xn为输入,yn为输出。匹配函数公式为:
y=f(x)=(ω·Φ(x))+b (4)
式中,Φ(·)为匹配函数。ω为权矩阵,b为偏差。核函数可以根据实际情况选取。核函数公式如下:
K(xi,xj)=(Φ(xi)T·Φ(xj)) (5)
然后根据结构风险最小化原则转化为约束限制问题,其公式如下所示:
Figure GDA0003163863120000032
s.t.yi=ωTΦ(xi)+b+ψi
式中,ψi为随机误差。通过引入拉格朗日问题解决限制优化问题,其公式如下:
Figure GDA0003163863120000033
式中,αi为拉格朗日乘子。根据KKT条件可以推倒出ω,α,b,ψ偏微分方程为:
Figure GDA0003163863120000034
从公式(8)可以转化为线性方程公式为:
Figure GDA0003163863120000035
式中,α=[α12…,αn]T,y=[y1,y2,…yn]。由公式(9)可以得出决策函数如下所示:
Figure GDA0003163863120000036
选择高斯径向基函数为核函数,其计算公式如下所示:
Figure GDA0003163863120000037
Figure GDA0003163863120000041
在步骤8中通过误差的性能指标Ji(k)进行判断和多个模型的切换,其表达式如下所示:
Figure GDA0003163863120000042
式中:α+β=1,e(k)为预测误差。
附图说明
图1是某校园大气监测系统。
图2是基于小样本下多模型自适应大气PM2.5浓度预测方法的流程图。
图3预测模型流程图。
图2、3中的彩色填充请去掉,黑字白底的形式。
具体实施方式
下面详细说明本发明的实施例,本实施例在本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
步骤1:大气监测系统在北京市某校园环境中,通过云端网络及硬件支持,对大气PM2.5浓度全年(四季)不间断实时监测和数据采集。
步骤2:利用主元成分分析方法对采集到的大气污染物进行贡献率分析得到 PM2.5浓度累积贡献率最高。并分析与大气PM2.5浓度有关系的因素。因此,对大气PM2.5浓度进行预测。
步骤3:将分析与PM2.5有密切关系的变量作为预测模型的输入变量。
步骤4:对输入变量进行数据归一化处理,使量纲一致,从而达到预测更准确。
步骤5:将归一化不同季节的数据分别进行训练建立相应季节的LS-SVR预测模型。
步骤6:通过测试数据对预测模型进行PM2.5浓度进行验证。
步骤7:当采集新的数据输入当前预测模型时,预测模型输出预测值与实际值进行比较。
步骤8:通过预测PM2.5浓度值与当前状态下的PM2.5浓度比较,由最小误差性能指标判断当前预测模型是否适合当前的季节的采集数据,如果误差性能指标最小者,切换相对应的预测模型预测未来时刻PM2.5浓度。

Claims (5)

1.一种基于小样本下多模型自适应大气PM2.5浓度预测的方法,其特征在于,包括以下步骤:
步骤1:大气监测系统,通过云端网络及硬件支持,对大气PM2.5浓度全年不间断实时监测和数据采集;
步骤2:利用主元成分分析方法对采集到的大气污染物数据进行贡献率分析得到PM2.5浓度累积贡献率最高;并分析与大气PM2.5浓度有关系的因素,进而对大气PM2.5浓度进行预测;
步骤3:将分析与PM2.5有重要影响关系的一组变量作为预测模型的输入变量;
步骤4:对输入变量进行不同季节数据的归一化处理,使量纲一致;
步骤5:将归一化的不同季节的数据分别进行训练建立相应季节的LS-SVR最小二乘支持向量回归预测模型;
步骤6:通过测试数据对预测模型进行PM2.5浓度进行验证;
步骤7:当采集新的全年数据输入当前预测模型时,预测模型预测相对应的PM2.5浓度值与实际值进行比较;
步骤8:通过对预测误差性能指标函数的比较,判断当前预测模型是否适合当前的季节的采集数据,如果四种模型中误差性能指标为最小者,切换相对应的较小预测模型预测下一时刻PM2.5浓度值;其切换准则为:
Figure FDA0003892099130000011
式中,Ji(k)为指标函数;l=1,2,3,4,i=1,2,3,4;
该误差性能指标函数Ji(k)为:
Figure FDA0003892099130000012
式中,ei为预测误差,α,β>0,α+β=1;
将采集全年的四季大气污染物和气象条件数据进行划分四季数据,采集的数据为PM10、PM2.5、SO2、NO2、CO、O3、温度和湿度;
通过对预测误差性能指标的比较,判断模型是否符合当前情况下的状态,误差是所有预测模型中最小者,自适应切换到相应的预测模型进行大气PM2.5浓度预测;
利用主元成分分析的方法对采集的大气污染物浓度数据和气象数据进行特征提取;其观测数据矩阵为:
Figure FDA0003892099130000021
x11…xn1为样本数据中PM10,PM2.5,NO2,SO2,O3及气象条件的时间序列;然后将这些采集数据进行标准化处理,其公式如下:
Figure FDA0003892099130000022
式中,rij为相关系数,i=1,2,...,n,j=1,2,...,p,
Figure FDA0003892099130000023
为变量Xi,Xj的观测值的平均值;
通过分析得到主元成分的变量累积贡献率和累积贡献率,其公式为:
Figure FDA0003892099130000024
式中,Cr为贡献率,累计贡献率达到85%—95%以上,确定为所对应的主成分个数;λ为相关系数矩阵的特征值;利用主元成分分析方法提取不同季节的与PM2.5关系密切的污染物和气象数据,建立最小二乘支持向量回归预测模型;
预测模型为最小二乘支持向量回归,该方法通过构建决策函数实现非线性转化为线性问题的特征对PM2.5浓度进行预测;给定一组监测的当前季节的大气污染物的数据T={(x1,y1),…(xn,yn)},xn为输入,yn为输出;匹配函数公式为:
y=f(x)=(ω·Φ(x))+b (6)
式中,Φ(·)为匹配函数;ω为权矩阵,b为偏差;核函数根据实际情况选取;核函数K(xi,xj)公式计算如下:
K(xi,xj)=(Φ(xi)T·Φ(xj)) (7)
然后根据结构风险最小化原则转化为约束限制问题,其公式如下所示:
Figure FDA0003892099130000025
s.t.yi=ωTΦ(xi)+b+ψi
式中,ψi为随机误差;通过引入拉格朗日问题解决限制优化问题,其公式如下:
Figure FDA0003892099130000026
式中,αi为拉格朗日乘子;根据KKT条件特征推倒出ω,α,b,ψ偏微分方程为:
Figure FDA0003892099130000031
从公式(10)特征转化为线性方程公式为:
Figure FDA0003892099130000032
式中,α=[α12…,αn]T,y=[y1,y2,…yn];由公式(11)特征得出决策函数如下所示:
Figure FDA0003892099130000033
选择高斯径向基函数(RBF)为核函数,其计算公式如下所示:
Figure FDA0003892099130000034
式中,σ为样本间相似性的特征长度尺度。
2.根据权利要求1所述的一种基于小样本下多模型自适应大气PM2.5浓度预测的 方法,其特征在于:最后通过交叉验证方法对C和σ优化求解。
3.根据权利要求1所述的一种基于小样本下多模型自适应大气PM2.5浓度预测的 方法,其特征在于:利用最小二乘支持向量回归LS-SVR方法所建立的决策函数方程预测不同季节下大气PM2.5浓度;其预测输出为[y1,y2,…,yn],其中输入变量[x1,x2…,xn]与其一一对应。
4.根据权利要求1所述的一种基于小样本多模型自适应大气PM2.5浓度预测的 方法,其特征在于:建立不同季节模型对当前大气PM2.5浓度预测,预测值与实际值进行比较,误差性能指标中最小的预测模型作为下一时刻预测模型对PM2.5浓度进行预测,从而实现模型切换。
5.根据权利要求1所述的一种基于小样本多模型自适应大气PM2.5浓度预测的 方法,其特征在于:通过多个预测模型在不同的季节状态下进行切换,达到自适应预测PM2.5浓度。
CN202110179054.9A 2021-02-09 2021-02-09 一种基于小样本下多模型自适应大气pm2.5浓度预测方法 Active CN113281229B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110179054.9A CN113281229B (zh) 2021-02-09 2021-02-09 一种基于小样本下多模型自适应大气pm2.5浓度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110179054.9A CN113281229B (zh) 2021-02-09 2021-02-09 一种基于小样本下多模型自适应大气pm2.5浓度预测方法

Publications (2)

Publication Number Publication Date
CN113281229A CN113281229A (zh) 2021-08-20
CN113281229B true CN113281229B (zh) 2022-11-29

Family

ID=77275757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110179054.9A Active CN113281229B (zh) 2021-02-09 2021-02-09 一种基于小样本下多模型自适应大气pm2.5浓度预测方法

Country Status (1)

Country Link
CN (1) CN113281229B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114662389B (zh) * 2022-03-22 2023-02-03 河南大学 面向空气污染物的自相关误差Informer模型长时序预测方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003207579A (ja) * 2002-01-16 2003-07-25 Mitsubishi Heavy Ind Ltd 大気汚染物質の濃度予測方法及び装置
CN106056210A (zh) * 2016-06-07 2016-10-26 浙江工业大学 一种基于混合神经网络的pm2.5浓度值预测方法
CN109615082A (zh) * 2018-11-26 2019-04-12 北京工业大学 一种基于堆叠选择性集成学习器的空气中细颗粒物pm2.5浓度的预测方法
CN110619384A (zh) * 2019-08-13 2019-12-27 浙江工业大学 一种基于神经网络的pm2.5浓度值预测方法
CN111077048A (zh) * 2019-11-27 2020-04-28 华南师范大学 基于移动设备的机会式群体智能空气质量监测及评估方法
CN111859800A (zh) * 2020-07-15 2020-10-30 河海大学 用于pm2.5浓度分布的时空估算和预测的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003207579A (ja) * 2002-01-16 2003-07-25 Mitsubishi Heavy Ind Ltd 大気汚染物質の濃度予測方法及び装置
CN106056210A (zh) * 2016-06-07 2016-10-26 浙江工业大学 一种基于混合神经网络的pm2.5浓度值预测方法
CN109615082A (zh) * 2018-11-26 2019-04-12 北京工业大学 一种基于堆叠选择性集成学习器的空气中细颗粒物pm2.5浓度的预测方法
CN110619384A (zh) * 2019-08-13 2019-12-27 浙江工业大学 一种基于神经网络的pm2.5浓度值预测方法
CN111077048A (zh) * 2019-11-27 2020-04-28 华南师范大学 基于移动设备的机会式群体智能空气质量监测及评估方法
CN111859800A (zh) * 2020-07-15 2020-10-30 河海大学 用于pm2.5浓度分布的时空估算和预测的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Daily PM2.5 concentration prediction based on principal component analysis and LSSVM optimized by cuckoo search algorithm;Wei Sun;《Journal of Environmental Management》;20161215;第144-152页 *
基于支持向量机回归的城市PM_(2.5)浓度预测;谢永华等;《计算机工程与设计》;20151116(第11期);第3106-3111页 *

Also Published As

Publication number Publication date
CN113281229A (zh) 2021-08-20

Similar Documents

Publication Publication Date Title
CN113919448B (zh) 一种任意时空位置二氧化碳浓度预测影响因素分析方法
CN112101480B (zh) 一种多变量聚类与融合的时间序列组合预测方法
CN107505837A (zh) 一种半监督神经网络模型及基于该模型的软测量建模方法
CN109784552B (zh) 一种基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法
CN110210681B (zh) 一种基于距离的监测站点pm2.5值的预测方法
CN113108918B (zh) 一种极轨气象卫星热红外遥感数据反演气温方法
CN108334943A (zh) 基于主动学习神经网络模型的工业过程半监督软测量建模方法
CN112560270B (zh) 一种化学危害同化系统
CN109377440B (zh) 一种基于多任务集成学习器的pm2.5和o3浓度协同预测方法
CN113591215A (zh) 基于不确定性的异常卫星组件布局检测方法
CN113011660A (zh) 空气质量预测方法、系统及存储介质
CN114583767B (zh) 一种数据驱动的风电场调频响应特性建模方法及系统
CN115423594A (zh) 企业财务风险的评估方法、装置、设备及存储介质
CN113281229B (zh) 一种基于小样本下多模型自适应大气pm2.5浓度预测方法
CN117171546A (zh) 一种结合污染扩散指数的城市空气质量预测方法
CN115049026A (zh) 基于gsnnr的空间非平稳性关系的回归分析方法
CN101446828A (zh) 一种非线性过程质量预报方法
CN108830405B (zh) 基于多指标动态匹配的实时电力负荷预测系统及其方法
CN117521912A (zh) 一种碳排放测算模型及对比评价方法及其应用
CN112949680A (zh) 一种基于对应分析和多元线性回归的污染源识别方法
CN117332815A (zh) 一种工业园区大气污染的预测方法及预测预警系统
Xu et al. Multi-layer networks for ensemble precipitation forecasts postprocessing
CN115983329A (zh) 空气质量及气象条件的预测方法、装置、设备及存储介质
CN114970698A (zh) 一种基于改进lwpls的计量设备运行性能预测方法
CN114565186A (zh) 一种基于广义回归神经网络的预测风速校正方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant