CN112418560B - 一种pm2.5浓度预测方法及系统 - Google Patents
一种pm2.5浓度预测方法及系统 Download PDFInfo
- Publication number
- CN112418560B CN112418560B CN202011456583.0A CN202011456583A CN112418560B CN 112418560 B CN112418560 B CN 112418560B CN 202011456583 A CN202011456583 A CN 202011456583A CN 112418560 B CN112418560 B CN 112418560B
- Authority
- CN
- China
- Prior art keywords
- concentration
- input
- average value
- correlation sequence
- neuron
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000015654 memory Effects 0.000 claims abstract description 34
- 238000012549 training Methods 0.000 claims abstract description 22
- 210000002569 neuron Anatomy 0.000 claims description 136
- 239000011159 matrix material Substances 0.000 claims description 57
- 238000001556 precipitation Methods 0.000 claims description 29
- 239000003344 environmental pollutant Substances 0.000 claims description 16
- 231100000719 pollutant Toxicity 0.000 claims description 16
- 230000007787 long-term memory Effects 0.000 claims description 15
- 230000006403 short-term memory Effects 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 12
- 210000004027 cell Anatomy 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 9
- 238000005457 optimization Methods 0.000 abstract description 3
- 239000013598 vector Substances 0.000 description 25
- 230000000875 corresponding effect Effects 0.000 description 17
- 238000012360 testing method Methods 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000003915 air pollution Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000000356 contaminant Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 239000000809 air pollutant Substances 0.000 description 2
- 231100001243 air pollutant Toxicity 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000013618 particulate matter Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 238000003646 Spearman's rank correlation coefficient Methods 0.000 description 1
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 description 1
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 229910052797 bismuth Inorganic materials 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000009982 effect on human Effects 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 239000010419 fine particle Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000036561 sun exposure Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种PM2.5浓度预测方法及系统。所述方法包括:获取待预测的历史特征数据;将所述待预测的历史特征数据输入PM2.5浓度预测模型得到PM2.5的预测浓度,所述PM2.5浓度预测模型为以待训练的历史特征数据为输入对包括多个输入门的长短期记忆网络模型进行训练得到的。通过使用多输入长短期记忆模型,实现从多维度单输入序列的模型结构到三维度多输入序列的模型结构的优化,使得PM2.5的浓度预测效率更快,结果更准确。
Description
技术领域
本发明涉及空气质量预测技术领域,特别是涉及一种PM2.5浓度预测方法及系统。
背景技术
空气污染被认为是一个严重的环境问题,因为它对人类的健康有不利的影响,空气污染被认为是与环境条件有关的死亡的主要原因,典型的空气污染源包括交通和工业排放。主要污染物有颗粒物2.5(PM2.5)、颗粒物10(PM10)、NO2、SO2、O3等,其中PM2.5对人类危害最大。
PM2.5是指细颗粒或直径小于2.5微米的颗粒,通常由固体或液体颗粒组成。PM2.5严重危害儿童、老年人等敏感人群的健康。PM2.5浓度的预测有助于人们的出行决策和制定环境相关政策,但是PM2.5的形成和消失是一个复杂的过程。从大气科学研究的角度来看,其积累和消散主要受到当地气象条件、区域交通、污染物排放等因素的影响。例如,温度升高会导致PM2.5浓度增加,弱风会阻止PM2.5的扩散,导致PM2.5在大气循环系统中积累,而强风会降低PM2.5浓度。降雨对空气质量起到了积极的作用,可以大大降低PM2.5浓度。污染排放源中的矿物粉尘、气溶胶和微量金属也会对PM2.5的形成产生催化作用,所有这些因素使得PM2.5浓度的预测变得更加困难,现有采用回归模型和反向传播神经网络对PM2.5浓度进行预测,但是精度并不高。
发明内容
本发明的目的是提供一种PM2.5浓度预测方法及系统,提高PM2.5浓度的预测精度。
为实现上述目的,本发明提供了如下方案:
一种PM2.5浓度预测方法,包括:
获取待预测的历史特征数据;所述历史特征数据包括污染物历史浓度数据和气象资料历史数据;所述污染物历史浓度数据包括PM2.5浓度、PM10浓度、NO2浓度、CO浓度、O3浓度和SO2浓度,所述气象资料历史数据包括天气状况、湿度、温度、降水量、日照时数、气压、风速和风向;
将所述待预测的历史特征数据输入PM2.5浓度预测模型得到PM2.5的预测浓度,所述PM2.5浓度预测模型为以待训练的历史特征数据为输入对包括多个输入门的长短期记忆网络模型进行训练得到的。
可选的,所述PM2.5浓度预测模型的确定方法为:
获取所述待训练的历史特征数据;
将所述待训练的历史特征数据按照设定时间间隔进行划分,得到多组历史特征数据集合;
采用斯皮尔曼公式计算所述待训练的历史特征数据中的PM2.5浓度与各剩余特征之间的相关性;所述剩余特征为所述待训练的历史特征数据中除PM2.5浓度之外的特征数据;
对所有的相关性进行分组,得到正相关序列和负相关序列;
将第i组历史特征数据集合中的正相关序列对应的特征数据集、负相关序列对应的特征数据集、PM2.5浓度集和第i-1组历史特征数据集合对应的PM2.5的预测浓度分别通过不同的输入门输入到长短期记忆网络模型中进行训练,并将训练好的长短期记忆网络模型确定为PM2.5浓度预测模型,所述PM2.5浓度集为同组历史特征数据集合中所有PM2.5浓度的集合。
可选的,所述PM2.5浓度预测模型具体为:
ht=tanh(Ct)*Ot,Ct=Ct-1*ft+Lt,其中,ht为t时刻神经元的输出,tanh()为神经元状态使用的激活函数,Ct为t时刻神经元的状态,Ot为输出门,Ct-1为t-1时刻神经元的状态,ft为遗忘门,Lt为t时刻的最后单元状态输入;
其中,Wf为遗忘门的权重矩阵,bf为遗忘门的偏置,ht-1为t-1时刻神经元的输出,/>为当前时刻输入的PM2.5浓度,Wo为输出门的权重矩阵,bo是输出门的偏置;
Lt=αtIt+αptIpt+αntInt,其中,αt为pm2.5浓度集的注意力权重,It为输入pm2.5浓度集时神经元的输入状态与输入pm2.5浓度集的输入门值的乘积,αpt为正相关序列的注意力权重,Ipt为输入正相关序列时神经元的输入状态与输入正相关序列的输入门值的乘积,αnt为负相关序列的注意力权重,Int为输入负相关序列时神经元的输入状态与输入负相关序列的输入门值的乘积;
其中,其中,/>为输入pm2.5浓度集时神经元的输入状态,/>输入正相关序列时神经元的输入状态,/>输入负相关序列时神经元的输入状态,it为输入pm2.5浓度集的输入门,ipt输入正相关序列的输入门,int为输入负相关序列的输入门,
其中,
其中,Wi为输入pm2.5浓度集的输入门的权重矩阵,为pm2.5浓度集,bi是输入pm2.5浓度集的输入门的偏置,Wip为输入正相关序列的输入门的权重矩阵,/>为正相关序列的特征数据集,bip是输入正相关序列的输入门的偏置,Win为输入负相关序列的输入门的权重矩阵,bin是输入负相关序列的输入门的偏置,/>为负相关序列的特征数据集;
其中,Wc为输入pm2.5浓度集时神经元的输入状态的权重矩阵,bc是输入pm2.5浓度集时神经元的输入状态的偏置,Wcp为输入正相关序列的特征数据集时神经元的输入状态的权重矩阵,bcp是输入正相关序列的特征数据集时神经元的输入状态的偏置,Wcn为输入负相关序列的特征数据集时神经元的输入状态的权重矩阵,bcn是输入负相关序列的特征数据集时神经元的输入状态的偏置,
[αt,αpt,αnt]=Softmax([tanh(It TWaCt-1+ba),tanh(Ipt TWaCt-1+bap),tanh(Int TWaCt-1+ban)])
其中,It T为输入pm2.5浓度集时神经元的输入状态与输入pm2.5浓度集的输入门值的乘积的转置,Ipt T为输入正相关序列时神经元的输入状态与输入正相关序列的输入门值的乘积的转置,Int T为输入负相关序列时神经元的输入状态与输入负相关序列的输入门值的乘积的转置,Wa为输入门的参数矩阵,ba为pm2.5浓度集的输入偏置,bap为正相关序列的输入偏置,ban为负相关序列的输入偏置。
可选的,在所述采用斯皮尔曼公式计算所述待训练的历史特征数据中的PM2.5浓度与各剩余特征之间的相关性,具体包括:
计算所述待训练的历史特征数据中各所述历史特征数据集合中各特征的平均值,得到多个历史特征数据平均集合;所述历史特征数据平均集合包括PM2.5浓度平均值、PM10浓度平均值、NO2浓度平均值、CO浓度平均值、O3浓度平均值、SO2浓度平均值、天气状况平均值、湿度平均值、温度平均值、降水量平均值、日照时数平均值、气压平均值、风速平均值和风向平均值;
将所述历史特征数据平均集合中的同种特征提取出来,构成PM2.5浓度平均值集合、PM10浓度平均值集合、NO2浓度平均值集合、CO浓度平均值集合、O3浓度平均值集合、SO2浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合;
计算PM2.5浓度平均值集合分别与PM10浓度平均值集合、NO2浓度平均值集合、CO浓度平均值集合、O3浓度平均值集合、SO2浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合之间的相关性。
一种PM2.5浓度预测系统,包括:
第一数据获取模块,用于获取待预测的历史特征数据;所述历史特征数据包括污染物历史浓度数据和气象资料历史数据;所述污染物历史浓度数据包括PM2.5浓度、PM10浓度、NO2浓度、CO浓度、O3浓度和SO2浓度,所述气象资料历史数据包括天气状况、湿度、温度、降水量、日照时数、气压、风速和风向;
浓度预测模块,用于将所述待预测的历史特征数据输入PM2.5浓度预测模型得到PM2.5的预测浓度,所述PM2.5浓度预测模型为以待训练的历史特征数据为输入对包括多个输入门的长短期记忆网络模型进行训练得到的。
可选的,所述浓度预测模块包括:
第二数据获取单元,用于获取所述待训练的历史特征数据;
划分单元,用于将所述待训练的历史特征数据按照设定时间间隔进行划分,得到多组历史特征数据集合;
相关性计算单元,用于采用斯皮尔曼公式计算所述待训练的历史特征数据中的PM2.5浓度与各剩余特征之间的相关性;所述剩余特征为所述待训练的历史特征数据中除PM2.5浓度之外的特征数据;
分组单元,用于对所有的相关性进行分组,得到正相关序列和负相关序列;
训练单元,用于将第i组历史特征数据集合中的正相关序列对应的特征数据集、负相关序列对应的特征数据集、PM2.5浓度集和第i-1组历史特征数据集合对应的PM2.5的预测浓度分别通过不同的输入门输入到长短期记忆网络模型中进行训练,并将训练好的长短期记忆网络模型确定为PM2.5浓度预测模型,所述PM2.5浓度集为同组历史特征数据集合中所有PM2.5浓度的集合。
可选的,所述PM2.5浓度预测模型具体为:
ht=tanh(Ct)*Ot,Ct=Ct-1*ft+Lt,其中,ht为t时刻神经元的输出,tanh()为神经元状态使用的激活函数,Ct为t时刻神经元的状态,Ot为输出门,Ct-1为t-1时刻神经元的状态,ft为遗忘门,Lt为t时刻的最后单元状态输入;
其中,Wf为遗忘门的权重矩阵,bf为遗忘门的偏置,ht-1为t-1时刻神经元的输出,/>为当前时刻输入的PM2.5浓度,Wo为输出门的权重矩阵,bo是输出门的偏置;
Lt=αtIt+αptIpt+αntInt,其中,αt为pm2.5浓度集的注意力权重,It为输入pm2.5浓度集时神经元的输入状态与输入pm2.5浓度集的输入门值的乘积,αpt为正相关序列的注意力权重,Ipt为输入正相关序列时神经元的输入状态与输入正相关序列的输入门值的乘积,αnt为负相关序列的注意力权重,Int为输入负相关序列时神经元的输入状态与输入负相关序列的输入门值的乘积;
其中,其中,/>为输入pm2.5浓度集时神经元的输入状态,/>输入正相关序列时神经元的输入状态,/>输入负相关序列时神经元的输入状态,it为输入pm2.5浓度集的输入门,ipt输入正相关序列的输入门,int为输入负相关序列的输入门,
其中,
其中,Wi为输入pm2.5浓度集的输入门的权重矩阵,为pm2.5浓度集,bi是输入pm2.5浓度集的输入门的偏置,Wip为输入正相关序列的输入门的权重矩阵,/>为正相关序列的特征数据集,bip是输入正相关序列的输入门的偏置,Win为输入负相关序列的输入门的权重矩阵,bin是输入负相关序列的输入门的偏置,/>为负相关序列的特征数据集;
其中,Wc为输入pm2.5浓度集时神经元的输入状态的权重矩阵,bc是输入pm2.5浓度集时神经元的输入状态的偏置,Wcp为输入正相关序列的特征数据集时神经元的输入状态的权重矩阵,bcp是输入正相关序列的特征数据集时神经元的输入状态的偏置,Wcn为输入负相关序列的特征数据集时神经元的输入状态的权重矩阵,bcn是输入负相关序列的特征数据集时神经元的输入状态的偏置,
[αt,αpt,αnt]=Softmax([tanh(It TWaCt-1+ba),tanh(Ipt TWaCt-1+bap),tanh(Int TWaCt-1+ban)])
其中,It T为输入pm2.5浓度集时神经元的输入状态与输入pm2.5浓度集的输入门值的乘积的转置,Ipt T为输入正相关序列时神经元的输入状态与输入正相关序列的输入门值的乘积的转置,Int T为输入负相关序列时神经元的输入状态与输入负相关序列的输入门值的乘积的转置,Wa为输入门的参数矩阵,ba为pm2.5浓度集的输入偏置,bap为正相关序列的输入偏置,ban为负相关序列的输入偏置。
可选的,所述相关性计算单元具体包括:
平均值计算子单元,用于计算所述待训练的历史特征数据中各所述历史特征数据集合中各特征的平均值,得到多个历史特征数据平均集合;所述历史特征数据平均集合包括PM2.5浓度平均值、PM10浓度平均值、NO2浓度平均值、CO浓度平均值、O3浓度平均值、SO2浓度平均值、天气状况平均值、湿度平均值、温度平均值、降水量平均值、日照时数平均值、气压平均值、风速平均值和风向平均值;
平均值集合确定子单元,用于将所述历史特征数据平均集合中的同种特征提取出来,构成PM2.5浓度平均值集合、PM10浓度平均值集合、NO2浓度平均值集合、CO浓度平均值集合、O3浓度平均值集合、SO2浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合;
相关性确定子单元,用于计算PM2.5浓度平均值集合分别与PM10浓度平均值集合、NO2浓度平均值集合、CO浓度平均值集合、O3浓度平均值集合、SO2浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合之间的相关性。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明通过使用多输入长短期记忆模型,实现从多维度单输入序列的模型结构到三维度多输入序列的模型结构的优化,使得PM2.5的浓度预测效率更快,结果更准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的PM2.5浓度预测方法的流程图;
图2为本发明实施例提供的PM2.5浓度预测系统的框图;
图3为本发明实施例提供的包括多个输入门的长短期记忆网络模型的结构示意图;
图4为本发明实施例提供的PM2.5浓度预测模型的结构示意图;
图5为本发明实施例提供的更具体的PM2.5浓度预测方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本实施例提供了一种PM2.5浓度预测方法,所述方法包括:
101:获取待预测的历史特征数据;所述历史特征数据包括污染物历史浓度数据和气象资料历史数据;所述污染物历史浓度数据包括PM2.5浓度、PM10浓度、NO2浓度、CO浓度、O3浓度和SO2浓度,所述气象资料历史数据包括天气状况、湿度、温度、降水量、日照时数、气压、风速和风向。
102:将所述待预测的历史特征数据输入PM2.5浓度预测模型得到PM2.5的预测浓度,所述PM2.5浓度预测模型为以待训练的历史特征数据为输入对包括多个输入门的长短期记忆网络模型进行训练得到的。
在实际应用中,所述PM2.5浓度预测模型的确定方法为:
获取所述待训练的历史特征数据。
将所述待训练的历史特征数据按照设定时间间隔进行划分,得到多组历史特征数据集合。
采用斯皮尔曼公式计算所述待训练的历史特征数据中的PM2.5浓度与各剩余特征之间的相关性;所述剩余特征为所述待训练的历史特征数据中除PM2.5浓度之外的特征数据。
对所有的相关性进行分组,得到正相关序列和负相关序列。
将第i组历史特征数据集合中的正相关序列对应的特征数据集、负相关序列对应的特征数据集、PM2.5浓度集和第i-1组历史特征数据集合对应的PM2.5的预测浓度分别通过不同的输入门输入到长短期记忆网络模型中进行训练,并将训练好的长短期记忆网络模型确定为PM2.5浓度预测模型,所述PM2.5浓度集为同组历史特征数据集合中所有PM2.5浓度的集合。
在实际应用中,PM2.5浓度预测模型具体为:
ht=tanh(Ct)*Ot,Ct=Ct-1*ft+Lt,其中,ht为t时刻神经元的输出,即PM2.5的预测浓度,tanh()为神经元状态使用的激活函数,Ct为t时刻神经元的状态,Ot为输出门,Ct-1为t-1时刻神经元的状态,ft为遗忘门,Lt为t时刻的最后单元状态输入。
其中,Wf为遗忘门的权重矩阵,bf为遗忘门的偏置,ht-1为t-1时刻神经元的输出,/>为当前时刻输入的PM2.5浓度,Wo为输出门的权重矩阵,bo是输出门的偏置。
Lt=αtIt+αptIpt+αntInt,其中,αt为pm2.5浓度集的注意力权重,It为输入pm2.5浓度集时神经元的输入状态与输入pm2.5浓度集的输入门值的乘积,αpt为正相关序列的注意力权重,Ipt为输入正相关序列时神经元的输入状态与输入正相关序列的输入门值的乘积,αnt为负相关序列的注意力权重,Int为输入负相关序列时神经元的输入状态与输入负相关序列的输入门值的乘积;
其中,其中,/>为输入pm2.5浓度集时神经元的输入状态,/>输入正相关序列时神经元的输入状态,/>输入负相关序列时神经元的输入状态,it为输入pm2.5浓度集的输入门,ipt输入正相关序列的输入门,int为输入负相关序列的输入门,
其中,
其中,Wi为输入pm2.5浓度集的输入门的权重矩阵,为pm2.5浓度集,bi是输入pm2.5浓度集的输入门的偏置,Wip为输入正相关序列的输入门的权重矩阵,/>为正相关序列的特征数据集,bip是输入正相关序列的输入门的偏置,Win为输入负相关序列的输入门的权重矩阵,bin是输入负相关序列的输入门的偏置,/>为负相关序列的特征数据集。
其中,Wc为输入pm2.5浓度集时神经元的输入状态的权重矩阵,bc是输入pm2.5浓度集时神经元的输入状态的偏置,Wcp为输入正相关序列的特征数据集时神经元的输入状态的权重矩阵,bcp是输入正相关序列的特征数据集时神经元的输入状态的偏置,Wcn为输入负相关序列的特征数据集时神经元的输入状态的权重矩阵,bcn是输入负相关序列的特征数据集时神经元的输入状态的偏置,
[αt,αpt,αnt]=Softmax([tanh(It TWaCt-1+ba),tanh(Ipt TWaCt-1+bap),tanh(Int TWaCt-1+ban)])
其中,It T为输入pm2.5浓度集时神经元的输入状态与输入pm2.5浓度集的输入门值的乘积的转置,Ipt T为输入正相关序列时神经元的输入状态与输入正相关序列的输入门值的乘积的转置,Int T为输入负相关序列时神经元的输入状态与输入负相关序列的输入门值的乘积的转置,Wa为输入门的参数矩阵,ba为pm2.5浓度集的输入偏置,bap为正相关序列的输入偏置,ban为负相关序列的输入偏置。
在实际应用中,采用斯皮尔曼公式计算所述待训练的历史特征数据中的PM2.5浓度与各剩余特征之间的相关性,具体包括:
计算所述待训练的历史特征数据中各所述历史特征数据集合中各特征的平均值,得到多个历史特征数据平均集合;所述历史特征数据平均集合包括PM2.5浓度平均值、PM10浓度平均值、NO2浓度平均值、CO浓度平均值、O3浓度平均值、SO2浓度平均值、天气状况平均值、湿度平均值、温度平均值、降水量平均值、日照时数平均值、气压平均值、风速平均值和风向平均值。
将所述历史特征数据平均集合中的同种特征提取出来,构成PM2.5浓度平均值集合、PM10浓度平均值集合、NO2浓度平均值集合、CO浓度平均值集合、O3浓度平均值集合、SO2浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合。
计算PM2.5浓度平均值集合分别与PM10浓度平均值集合、NO2浓度平均值集合、CO浓度平均值集合、O3浓度平均值集合、SO2浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合之间的相关性。
对应上述方法,本实施例提供了一种PM2.5浓度预测系统,如图2所示,所述系统包括:
第一数据获取模块,用于获取待预测的历史特征数据;所述历史特征数据包括污染物历史浓度数据和气象资料历史数据;所述污染物历史浓度数据包括PM2.5浓度、PM10浓度、NO2浓度、CO浓度、O3浓度和SO2浓度,所述气象资料历史数据包括天气状况、湿度、温度、降水量、日照时数、气压、风速和风向。
浓度预测模块,用于将所述待预测的历史特征数据输入PM2.5浓度预测模型得到PM2.5的预测浓度,所述PM2.5浓度预测模型为以待训练的历史特征数据为输入对包括多个输入门的长短期记忆网络模型进行训练得到的。
作为一种可选的实施方式,所述浓度预测模块包括:
第二数据获取单元,用于获取所述待训练的历史特征数据。
划分单元,用于将所述待训练的历史特征数据按照设定时间间隔进行划分,得到多组历史特征数据集合。
相关性计算单元,用于采用斯皮尔曼公式计算所述待训练的历史特征数据中的PM2.5浓度与各剩余特征之间的相关性;所述剩余特征为所述待训练的历史特征数据中除PM2.5浓度之外的特征数据。
分组单元,用于对所有的相关性进行分组,得到正相关序列和负相关序列。
训练单元,用于将第i组历史特征数据集合中的正相关序列对应的特征数据集、负相关序列对应的特征数据集、PM2.5浓度集和第i-1组历史特征数据集合对应的PM2.5的预测浓度分别通过不同的输入门输入到长短期记忆网络模型中进行训练,并将训练好的长短期记忆网络模型确定为PM2.5浓度预测模型,所述PM2.5浓度集为同组历史特征数据集合中所有PM2.5浓度的集合。
所述PM2.5浓度预测模型可以为:
ht=tanh(Ct)*Ot,Ct=Ct-1*ft+Lt,其中,ht为t时刻神经元的输出,tanh()为神经元状态使用的激活函数,Ct为t时刻神经元的状态,Ot为输出门,Ct-1为t-1时刻神经元的状态,ft为遗忘门,Lt为t时刻的最后单元状态输入。
其中,Wf为遗忘门的权重矩阵,bf为遗忘门的偏置,ht-1为t-1时刻神经元的输出,/>为当前时刻输入的PM2.5浓度,Wo为输出门的权重矩阵,bo是输出门的偏置。
Lt=αtIt+αptIpt+αntInt,其中,αt为pm2.5浓度集的注意力权重,It为输入pm2.5浓度集时神经元的输入状态与输入pm2.5浓度集的输入门值的乘积,αpt为正相关序列的注意力权重,Ipt为输入正相关序列时神经元的输入状态与输入正相关序列的输入门值的乘积,αnt为负相关序列的注意力权重,Int为输入负相关序列时神经元的输入状态与输入负相关序列的输入门值的乘积;。
其中,其中,/>为输入pm2.5浓度集时神经元的输入状态,/>输入正相关序列时神经元的输入状态,/>输入负相关序列时神经元的输入状态,it为输入pm2.5浓度集的输入门,ipt输入正相关序列的输入门,int为输入负相关序列的输入门,
其中,
其中,Wi为输入pm2.5浓度集的输入门的权重矩阵,为pm2.5浓度集,bi是输入pm2.5浓度集的输入门的偏置,Wip为输入正相关序列的输入门的权重矩阵,/>为正相关序列的特征数据集,bip是输入正相关序列的输入门的偏置,Win为输入负相关序列的输入门的权重矩阵,bin是输入负相关序列的输入门的偏置,/>为负相关序列的特征数据集。
其中,Wc为输入pm2.5浓度集时神经元的输入状态的权重矩阵,bc是输入pm2.5浓度集时神经元的输入状态的偏置,Wcp为输入正相关序列的特征数据集时神经元的输入状态的权重矩阵,bcp是输入正相关序列的特征数据集时神经元的输入状态的偏置,Wcn为输入负相关序列的特征数据集时神经元的输入状态的权重矩阵,bcn是输入负相关序列的特征数据集时神经元的输入状态的偏置,
[αt,αpt,αnt]=Softmax([tanh(It TWaCt-1+ba),tanh(Ipt TWaCt-1+bap),tanh(Int TWaCt-1+ban)])
其中,It T为输入pm2.5浓度集时神经元的输入状态与输入pm2.5浓度集的输入门值的乘积的转置,Ipt T为输入正相关序列时神经元的输入状态与输入正相关序列的输入门值的乘积的转置,Int T为输入负相关序列时神经元的输入状态与输入负相关序列的输入门值的乘积的转置,Wa为输入门的参数矩阵,ba为pm2.5浓度集的输入偏置,bap为正相关序列的输入偏置,ban为负相关序列的输入偏置。
作为一种可选的实施方式,所述相关性计算单元具体包括:
平均值计算子单元,用于计算所述待训练的历史特征数据中各所述历史特征数据集合中各特征的平均值,得到多个历史特征数据平均集合;所述历史特征数据平均集合包括PM2.5浓度平均值、PM10浓度平均值、NO2浓度平均值、CO浓度平均值、O3浓度平均值、SO2浓度平均值、天气状况平均值、湿度平均值、温度平均值、降水量平均值、日照时数平均值、气压平均值、风速平均值和风向平均值。
平均值集合确定子单元,用于将所述历史特征数据平均集合中的同种特征提取出来,构成PM2.5浓度平均值集合、PM10浓度平均值集合、NO2浓度平均值集合、CO浓度平均值集合、O3浓度平均值集合、SO2浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合。
相关性确定子单元,用于计算PM2.5浓度平均值集合分别与PM10浓度平均值集合、NO2浓度平均值集合、CO浓度平均值集合、O3浓度平均值集合、SO2浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合之间的相关性。
如图5所示,本实施例又提供了一种更为具体的PM2.5浓度预测方法:
步骤1:获取空气污染物数据和气象资料数据,其中包括六种空气污染物即PM2.5、PM10、NO2、CO、O3、SO2的历史浓度数据、气象资料历史数据(天气状况、湿度、温度、降水量、日照时数、气压、风速、风向)构造出特征总集合S。
步骤2:使用斯皮尔曼秩相关系数对特征总集合S进行分组,得到正负相关序列X:
先将数据(特征总集合S)按照固定的时间间隔分组,得到T组数据,其数据集为RT ×n,其中n为总特征的长度。
从T组数据中取出历史PM2.5浓度向量Y∈RT,通过斯皮尔曼公式,计算历史PM2.5浓度向量Y∈RT与其他向量的相关性,其中与PM2.5浓度成正相关关系大的一部分特征构成正相关序列Xp∈RT×P,与PM2.5浓度成负相关关系大的一部分构成负相关序列XN∈RT×N,这里D=N+P;P和N分别代表正相关序列的长度和负相关序列的长度,两部分构成正负相关影响因素集X∈RT×D,这里D为正负相关因素的总长度。
使用斯皮尔曼秩来衡量不同因素之间的相关性,求出的值大小可以计算出其他因素与PM2.5浓度的相关性,公式如下:
/>
假设两个集合(因素)分别为A、B,它们的元素个数均为n,两个集合取的第i(1<=i<=n)个值分别用Ai、Bi表示。对A、B进行排序(同时为升序或降序),得到两个元素排序集合a、b。将集合a、b中的元素对应顺序位置相减得到一个排行差分集合d,其中di=ai-bi,1<=i<=n。其计算出的结果在-1到+1之间。
本发明中相当于每个特征历史数据集分别与PM2.5的历史浓度集进行运算,得出的数为最大的若干项和最小的若干项做正负相关因素序列。
对于每个序列Y∈R将经过相同的长短期记忆网络层
p=1,2,3,...,P n=1,2,3,...,N。
为了减少相关的输入数量提高效率,在相关性计算前还可以对提取的序列组内(即时间间隔内)每项特征求出平均值,这样一组向量可以平均成一个向量,
步骤3:对长短期记忆网络模型(Long Short-Term Memory,LSTM)进行改善,由多维单输入降为三维多输入处理,以便对其中正负相关序列进行学习,其三维输入就是正相关序列XP、负相关序列XN、以及历史PM2.5浓度向量Y。
1、首先把提取到的正负相关序列数据中的特征作为多输入长短期记忆网络模型的输入,此部分如果存在天气、风向这类无具体数值特征需要使用独热编码对特征处理后再作为输入。历史PM2.5浓度向量Y也作为长短期记忆网络模型的输入;从图3中可以看出,从左向右,三个输入分别对应历史PM2.5浓度向量、正相关序列、负相关序列。
2、长短期记忆网络模型处理的过程:
在原始长短期记忆网络模型的基础上,设计了多输入长短期记忆网络模型,以达到模型从高维度输入转化成为低维多输入的目的。把之前的总特征直接单输入转变成为多输入,本发明使用的是三维输入向量。
使用隐层单位大小为q的第一个长短期记忆网络层输入第一组正、负相关因素序列和PM2.5浓度序列,并且将初始的输出结果值设置为零向量h0,一起输入模型进行计算得到输出h1。之后每次的输入为当前的正、负相关序列和PM2.5浓度数据与上次一次输出结果进行的运算。
具体的:输入向量为通过斯皮尔满秩方法系数大小获得的输入向量正相关序列负相关序列/>历史PM2.5浓度序列Yt和与模型上一次的输出结果ht-1做运算,其中第一次输入的h0设置为零向量。
长短期记忆网络模型的输入门发生改变,但是遗忘门和输出门保持不变。其中在遗忘门部分,通过查看ht-1和Yt的信息来输出一个0-1之间的向量,表示此部分决定信息保留多少,0表示都不保留,1表示都保留如式(1)。在输入门部分,通过分别和ht-1来共同决定更新哪些信息如式(6)、式(7)和式(8),在输出门部分,根据ht-1和Yt来决定更新哪些信息如式(2)。
多输入长短期记忆网络模型的结构如图3所示,从中可以看出,和/>的单元格输入是由自身和之前的隐藏状态ht-1生成的,然而,它们对相应的输入门没有影响。与常规LSTM相比,多输入LSTM的遗忘门和输出门保持不变
式1)
式2)
这里ht-1是上一次输出结果,p是隐层单元的数量,Wf,Wo∈Rp×(p+q)分别为遗忘门和输出门的权重矩阵。bf,bo∈RP是对应的偏置,而遗忘门和输出门的输出为ft,Ot∈RP。
神经元状态使用的激活函数是tanh,其中是神经元的输入状态,Wc,Wcp,Wcn∈Rp×(p+q)是相关的权重矩阵,而bc,bcp,bcn∈Rp则是三个输入的偏置。具体公式如式3)、式4)和式5):
式3)
式4)
式5)
改进后的输入门的输入it,ipt,int∈Rp如下:
式6)
式7)
式8)
其中Wi,Wip,Win∈Rp×(p+q)是权重矩阵,而bi,bip,bin∈Rp分别是各式对应的偏差。
由模型可知时刻的最终单元格状态输入必须首先合并三个单元格的输入。为不同的单元输入分配注意权重。首先,我们将单元格输入与输入门相乘:
式9)
式10)
式11)
由于这些输入的影响不同,分别根据不同的因素使用加权求和的方式,如式12)所示:
式12)Lt=αtIt+αptIpt+αntInt
后面引入注意力机制,其中αt,αpt,αnt∈R是注意力权重,而Lt∈Rp是t时刻的最后单元状态输入。注意力权重是由单元输入本身和单元的前一时间状态Ct-1来决定的:
式13)ut=tanh(It TWaCt-1+ba)
式14)upt=tanh(Ipt TWaCt-1+bap)
式15)unt=tanh(Int TWaCt-1+ban)
式16)[αt,αpt,αnt]=Softmax([ut,upt,unt])
这里ut,upt,unt∈R是注意力权重的中间量。Ct-1∈Rp是t-1时刻的状态,中间量使用矢量Wa∈Rp×p,ba∈R来生成注意力权重通过Softmax逻辑回归层实现分类,多输入长短期记忆网络的后续部分与原始长短期记忆网络相同,如式17)和式18)所示:
式17)Ct=Ct-1*ft+Lt
式18)ht=tanh(Ct)*Ot
Ct,ht∈Rp、是t时刻神经元的状态和输出。基于多输入LSTM神经元,能得到如图4所示的多输入模型。
3、对未来PM2.5进行预测;将历史空气质量数据和气象数据输入至如图2的模型结构,预测未来PM2.5浓度。
对使用独热编码处理的过程进行描述:
首先把提取到的正负相关序列数据中的每个特征进行独热编码,作为多输入长短期记忆网络模型的输入:
独热编码是一种将分类数据转换为二值化编码的常见操作。例如,月度索引数据有12个独特的分类值,通过使用独热编码,每个月度索引可以转化到到12维向量中如表1所示,(例如,三月给出为[0、0、1、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0])。具体来说,将这些辅助数据连接到一个长短期记忆网络输入特征向量中,从而为模型提供输入特征进行学习。
表1独热编码表
分类特征名 | 独热编码长度 | 例如 |
小时 | 24 | [0、0、0、1、……、0](4:00) |
月份 | 12 | [0、0、1、0、0、0、0、0、0、0、0、0](三月) |
天气 | 6 | [0、1、0、0、0、0](多云) |
周 | 7 | [0、0、1、0、0、0、0](星期三) |
如表2所示,本实施例中需要进行独热编码的有天气(晴、多云、阴、大雾、雪、小雨、中雨、大雨)和风向(东、南、西、北、东北、西北、东南、西南)。
表2天气和风向的独热编码表
分类特征名 | 独热编码长度 | 例如 |
天气 | 8 | [0、0、0、1、0、0、0、0](大雾) |
风向 | 8 | [0、0、1、0、0、0、0、0](西) |
由于这些特征需要计算斯皮尔满秩大小确定相关性,在编码前按照其位置赋予一个对应值,再计算斯皮尔满秩。具体详见表3:
表3对天气和风向赋值的独热编码表
天气 | 晴、多云、阴、大雾、雪、小雨、中雨、大雨 | [1、2、3、4、5、6、7、8] |
风向 | 东、南、西、北、东北、西北、东南、西南 | [1、2、3、4、5、6、7、8] |
普通长短期记忆网络模型在每个时间间隔内只接收一个输入向量,但是我们总是可以通过维度扩展将多个因素连接到一个输入。如果仅仅通过连接扩展输入维数,扩展维数可能会成为严重的干扰项而不是补充。因此,设计一个多输入的长短期记忆网络来适应多输入序列非常有意义,使用三维的输入为t时刻对应的输入向量,其中t=1,2,…,T。
下面提供了本实施例在实际应用中的具体过程:
使用的数据为空气质量数据和气象数据。空气质量数据收集了日常空气污染数据和历史空气污染数据。每个空气污染物数据包括六种污染物的浓度:PM2.5、PM10、NO2、CO、O3和SO2。如表4所示,气象资料包括天气(晴、多云、多云、大雾、雪、小雨、中雨、大雨)、湿度、温度、降水量、日照时数、气压、风速、风向。按照前面所给出的方法输入模型,用斯皮尔满秩方法找出影响因素最大的正向量序列和最小的负向量序列,再通过多输入长短期记忆网络系统进行学习并且引入注意力机制对相关性比较大的进行筛选,最后通过激活层函数激活,反复训练更新参数直至找出最优解,达到了提高预测方法的客观性、准确性以及运行效率的目的。
表4所使用数据字段
数据字段 | 数据单位 |
天气 | 晴、多云、多云、大雾、雪、小雨、中雨、大雨 |
湿度 | 相对湿度(RH%) |
温度 | 摄氏度(℃) |
降水量 | 毫米(mm) |
日照时数 | 小时(h) |
气压 | 千帕(kpa) |
风速 | 公里每小时(km/h) |
风向 | 方位 |
测试使用的是哈尔滨市2015年3月1日至2018年10月1日的空气数据和气象数据,其中80%数据作为训练集,剩下的数据用作测试集,并且在训练的过程中分别按照4比1的关系交叉测试。测试时本多输入长短期记忆网络系统的时间间隔T设置为15天,其中正相关序列和负相关序列长度相等,其具体数值从数组{4,6,8,10,16,20}中选择。
测试中构造出特征的总集合,特征的总集合一共有:AQI(空气质量指数),六种空气污染物浓度(PM2.5、PM10、SO2、CO、NO2、O3)、平均气温、最高气温、最低气温、积温、降水、平均风速、最大风速、日照时数、平均地表温度、最高地表温度、最低地表温度、平均相对湿度、最高湿度、最低湿度、平均气压、最高气压、最低气压、蒸发量、日累计太阳辐射和露点温度。
上述的各种气象数据类型和空气污染物类型,根据设置好的时间间隔将历史数据进行分组,分别计算其它特征与PM2.5的斯皮尔满秩数值,得到正负相关序列。对正负相关序列进行独热编码,为了提高系统训练速度,对每组中的数据先求平均值再作为输入,第一次的输入为第一组正、负相关序列的第一组组内平均值和第一组历史PM2.5浓度值和h0(此时为零向量),本系统之后的输入分别正相关序列中每个特征的组内平均值、负相关序列中每个特征的组内平均值和PM2.5历史浓度序列中每个组内的平均值和上一次的输出结果ht-1。训练完成之后保存模型进行测试。如表5所示,是选择不同的特征长度测试完成之后其准确率和绝对误差的平均值。
表5特征长度选择
长度 | 4 | 6 | 8 | 10 | 16 | 20 |
平均准确率 | 94.7% | 95.3% | 97.3% | 96.8% | 96.1% | 93.2% |
平均绝对误差 | 19.5 | 19.1 | 16.5 | 15.7 | 18.7 | 22.4 |
本实施例中公开的PM2.5浓度预测方法及系统的数据是根据连续且相同时间间隔内空气中污染物浓度数据(六种污染物的浓度PM2.5、PM10、NO2、CO、O3和SO2)以及气象数据(天气、湿度、温度、降水量、日照时数、气压、风速、风向)来采样的。在预测浓度的过程中,不同的特征对PM2.5浓度的影响不同,如果输入所有数据特征会导致其特征维度太高,给预测带来额外的噪声并增加训练的复杂性。
因此,本发明先通过计算采集到的数据的斯皮尔曼秩相关系数,并将计算结果作为衡量不同因素与PM2.5浓度之间的相关性系数。
通过对计算结果的分析比对,将相关性较大系数的N个特征作为正相关影响序列、相关性较小系数的M个特征作为负相关影响序列来实现输入构建,从而减少输入特征维度,起到降噪的效果;为长短期记忆网络模型引入注意力筛选机制,通过对三个输入门中的数据赋予权重累加,来实现从多维度单输入序列的到三维度多输入序列的模型结构的优化,使得PM2.5的浓度预测效率更快、结果更准确。
本实施例的技术效果:
1、使用多输入长短期记忆神经网络预测大气中PM2.5浓度。测试结果表明,该方法比一般的长短期记忆网络具有更好的性能。PM2.5的形成、扩散和消化是非常复杂和非线性的。回归模型不能提取大气探测数据的深层特征。由于神经网络具有较强的学习能力和计算能力,并且能够对多变量、非线性等复杂问题进行建模,因此选择合适的神经网络模型对预测PM2.5的浓度至关重要。
2、通过多输入长短期记忆神经网络相结合,可以有效的对历史PM2.5浓度数据进行分析。排除掉因季节变化产生的误差,可以提高预测的准确性。
3、设计出三维度多输入长短期记忆网络系统的模型,输入的Y为PM2.5浓度历史数据,P,N则是通过斯皮尔满秩算出来对PM2.5浓度正相关性最大的因素集合和浓度负相关性最大的序列集合。将这些特征输入到设计好的模型中作为输入,其中输入数据第一次是PM2.5历史数据Y和计算出来的正、负相关序列P,N。
4、多输入长短期记忆网络模型第一步就是决定神经元状态需要丢弃的信息,这部分通过遗忘门单元的激活函数来处理。它通过查看ht-1和xt信息来输出一个0-1之间的向量,该向量里面的0-1值表示神经元状态Ct-1中哪些信息保留或丢弃多少。0表示不保留,1表示都保留。
5、此多输入长短期记忆网络模型第二步决定给神经元状态添加哪些新的信息。这一步分为两个步骤,首先,利用网络中上一次输出的结果和当前输入的PM2.5浓度数据通过输入门的操作来决定更新哪些信息。此处,通过3个输入还要经过一个注意力机制,对不同来源的结果赋值乘上不同的权重并且进行累加,从而得到相应的特征结果。然后用上一次的输出结果和本次的输入数据通过一个tanh激活层得到新的候选神经元信息Ct,这些信息可能会被更新到神经元信息中。
6、此多输入长短期记忆网络模型之后会更新之前的神经元信息,变成一个新的神经元信息。其中更新的规则就是通过遗忘门遗忘之前神经元的一部分信息,通过输入门添加候选神经元的信息,从的能够得到新的神经元信息。
7、多输入长短期记忆网络模型更新完神经元状态之后需要根据输入的上次一信息和输入的PM2.5历史数据来判断出神经元的哪些状态特征,这里需要将输入经过一个成为输入门的激活层得到判断条件,然后将神经元状态经过一个-1~1之间值的向量,该向量与输出门得到的判断条件相乘就得到最终的输出。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (4)
1.一种PM2.5浓度预测方法,其特征在于,包括:
获取待预测的历史特征数据;所述历史特征数据包括污染物历史浓度数据和气象资料历史数据;所述污染物历史浓度数据包括PM2.5浓度、PM10浓度、NO2浓度、CO浓度、O3浓度和SO2浓度,所述气象资料历史数据包括天气状况、湿度、温度、降水量、日照时数、气压、风速和风向;
将所述待预测的历史特征数据输入PM2.5浓度预测模型得到PM2.5的预测浓度,所述PM2.5浓度预测模型为以待训练的历史特征数据为输入对包括多个输入门的长短期记忆网络模型进行训练得到的;
所述PM2.5浓度预测模型的确定方法为:
获取所述待训练的历史特征数据;
将所述待训练的历史特征数据按照设定时间间隔进行划分,得到多组历史特征数据集合;
采用斯皮尔曼公式计算所述待训练的历史特征数据中的PM2.5浓度与各剩余特征之间的相关性;所述剩余特征为所述待训练的历史特征数据中除PM2.5浓度之外的特征数据;
对所有的相关性进行分组,得到正相关序列和负相关序列;
将第i组历史特征数据集合中的正相关序列对应的特征数据集、负相关序列对应的特征数据集、PM2.5浓度集和第i-1组历史特征数据集合对应的PM2.5的预测浓度分别通过不同的输入门输入到长短期记忆网络模型中进行训练,并将训练好的长短期记忆网络模型确定为PM2.5浓度预测模型,所述PM2.5浓度集为同组历史特征数据集合中所有PM2.5浓度的集合;
所述PM2.5浓度预测模型具体为:
ht=tanh(Ct)*Ot,Ct=Ct-1*ft+Lt,其中,ht为t时刻神经元的输出,tanh()为神经元状态使用的激活函数,Ct为t时刻神经元的状态,Ot为输出门,Ct-1为t-1时刻神经元的状态,ft为遗忘门,Lt为t时刻的最后单元状态输入;
其中,Wf为遗忘门的权重矩阵,bf为遗忘门的偏置,ht-1为t-1时刻神经元的输出,/>为当前时刻输入的PM2.5浓度,Wo为输出门的权重矩阵,bo是输出门的偏置;
Lt=αtIt+αptIpt+αntInt,其中,αt为PM2.5浓度集的注意力权重,It为输入PM2.5浓度集时神经元的输入状态与输入PM2.5浓度集的输入门值的乘积,αpt为正相关序列的注意力权重,Ipt为输入正相关序列时神经元的输入状态与输入正相关序列的输入门值的乘积,αnt为负相关序列的注意力权重,Int为输入负相关序列时神经元的输入状态与输入负相关序列的输入门值的乘积;
其中,其中,/>为输入PM2.5浓度集时神经元的输入状态,/>输入正相关序列时神经元的输入状态,/>输入负相关序列时神经元的输入状态,it为输入PM2.5浓度集的输入门,ipt输入正相关序列的输入门,int为输入负相关序列的输入门,
其中,
其中,Wi为输入PM2.5浓度集的输入门的权重矩阵,为PM2.5浓度集,bi为输入PM2.5浓度集的输入门的偏置,Wip为输入正相关序列的输入门的权重矩阵,/>为正相关序列的特征数据集,bip是输入正相关序列的输入门的偏置,Win为输入负相关序列的输入门的权重矩阵,bin是输入负相关序列的输入门的偏置,/>为负相关序列的特征数据集;
其中,Wc为输入PM2.5浓度集时神经元的输入状态的权重矩阵,bc是输入PM2.5浓度集时神经元的输入状态的偏置,Wcp为输入正相关序列的特征数据集时神经元的输入状态的权重矩阵,bcp是输入正相关序列的特征数据集时神经元的输入状态的偏置,Wcn为输入负相关序列的特征数据集时神经元的输入状态的权重矩阵,bcn是输入负相关序列的特征数据集时神经元的输入状态的偏置,
[αt,αpt,αnt]=Softmax([tanh(ItTWaCt-1+ba),tanh(IptTWaCt-1+bap),tanh(IntTWaCt-1+ban)])其中,It T为输入PM2.5浓度集时神经元的输入状态与输入PM2.5浓度集的输入门值的乘积的转置,Ipt T为输入正相关序列时神经元的输入状态与输入正相关序列的输入门值的乘积的转置,Int T为输入负相关序列时神经元的输入状态与输入负相关序列的输入门值的乘积的转置,Wa为输入门的参数矩阵,ba为PM2.5浓度集的输入偏置,bap为正相关序列的输入偏置,ban为负相关序列的输入偏置。
2.根据权利要求1所述的一种PM2.5浓度预测方法,其特征在于,在所述采用斯皮尔曼公式计算所述待训练的历史特征数据中的PM2.5浓度与各剩余特征之间的相关性,具体包括:
计算所述待训练的历史特征数据中各所述历史特征数据集合中各特征的平均值,得到多个历史特征数据平均集合;所述历史特征数据平均集合包括PM2.5浓度平均值、PM10浓度平均值、NO2浓度平均值、CO浓度平均值、O3浓度平均值、SO2浓度平均值、天气状况平均值、湿度平均值、温度平均值、降水量平均值、日照时数平均值、气压平均值、风速平均值和风向平均值;
将所述历史特征数据平均集合中的同种特征提取出来,构成PM2.5浓度平均值集合、PM10浓度平均值集合、NO2浓度平均值集合、CO浓度平均值集合、O3浓度平均值集合、SO2浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合;
计算PM2.5浓度平均值集合分别与PM10浓度平均值集合、NO2浓度平均值集合、CO浓度平均值集合、O3浓度平均值集合、SO2浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合之间的相关性。
3.一种PM2.5浓度预测系统,其特征在于,包括:
第一数据获取模块,用于获取待预测的历史特征数据;所述历史特征数据包括污染物历史浓度数据和气象资料历史数据;所述污染物历史浓度数据包括PM2.5浓度、PM10浓度、NO2浓度、CO浓度、O3浓度和SO2浓度,所述气象资料历史数据包括天气状况、湿度、温度、降水量、日照时数、气压、风速和风向;
浓度预测模块,用于将所述待预测的历史特征数据输入PM2.5浓度预测模型得到PM2.5的预测浓度,所述PM2.5浓度预测模型为以待训练的历史特征数据为输入对包括多个输入门的长短期记忆网络模型进行训练得到的;
所述浓度预测模块包括:
第二数据获取单元,用于获取所述待训练的历史特征数据;
划分单元,用于将所述待训练的历史特征数据按照设定时间间隔进行划分,得到多组历史特征数据集合;
相关性计算单元,用于采用斯皮尔曼公式计算所述待训练的历史特征数据中的PM2.5浓度与各剩余特征之间的相关性;所述剩余特征为所述待训练的历史特征数据中除PM2.5浓度之外的特征数据;
分组单元,用于对所有的相关性进行分组,得到正相关序列和负相关序列;
训练单元,用于将第i组历史特征数据集合中的正相关序列对应的特征数据集、负相关序列对应的特征数据集、PM2.5浓度集和第i-1组历史特征数据集合对应的PM2.5的预测浓度分别通过不同的输入门输入到长短期记忆网络模型中进行训练,并将训练好的长短期记忆网络模型确定为PM2.5浓度预测模型,所述PM2.5浓度集为同组历史特征数据集合中所有PM2.5浓度的集合;
所述PM2.5浓度预测模型具体为:
ht=tanh(Ct)*Ot,Ct=Ct-1*ft+Lt,其中,ht为t时刻神经元的输出,tanh()为神经元状态使用的激活函数,Ct为t时刻神经元的状态,Ot为输出门,Ct-1为t-1时刻神经元的状态,ft为遗忘门,Lt为t时刻的最后单元状态输入;
其中,Wf为遗忘门的权重矩阵,bf为遗忘门的偏置,ht-1为t-1时刻神经元的输出,/>为当前时刻输入的PM2.5浓度,Wo为输出门的权重矩阵,bo是输出门的偏置;
Lt=αtIt+αptIpt+αntInt,其中,αt为PM2.5浓度集的注意力权重,It为输入PM2.5浓度集时神经元的输入状态与输入PM2.5浓度集的输入门值的乘积,αpt为正相关序列的注意力权重,Ipt为输入正相关序列时神经元的输入状态与输入正相关序列的输入门值的乘积,αnt为负相关序列的注意力权重,Int为输入负相关序列时神经元的输入状态与输入负相关序列的输入门值的乘积;
其中,其中,/>为输入PM2.5浓度集时神经元的输入状态,/>输入正相关序列时神经元的输入状态,/>输入负相关序列时神经元的输入状态,it为输入PM2.5浓度集的输入门,ipt输入正相关序列的输入门,int为输入负相关序列的输入门,
其中,
其中,Wi为输入PM2.5浓度集的输入门的权重矩阵,为PM2.5浓度集,bi为输入PM2.5浓度集的输入门的偏置,Wip为输入正相关序列的输入门的权重矩阵,/>为正相关序列的特征数据集,bip是输入正相关序列的输入门的偏置,Win为输入负相关序列的输入门的权重矩阵,bin是输入负相关序列的输入门的偏置,/>为负相关序列的特征数据集;
其中,Wc为输入PM2.5浓度集时神经元的输入状态的权重矩阵,bc是输入PM2.5浓度集时神经元的输入状态的偏置,Wcp为输入正相关序列的特征数据集时神经元的输入状态的权重矩阵,bcp是输入正相关序列的特征数据集时神经元的输入状态的偏置,Wcn为输入负相关序列的特征数据集时神经元的输入状态的权重矩阵,bcn是输入负相关序列的特征数据集时神经元的输入状态的偏置,
[αt,αpt,αnt]=Softmax([tanh(ItTWaCt-1+ba),tanh(IptTWaCt-1+bap),tanh(IntTWaCt-1+ban)])其中,It T为输入PM2.5浓度集时神经元的输入状态与输入PM2.5浓度集的输入门值的乘积的转置,Ipt T为输入正相关序列时神经元的输入状态与输入正相关序列的输入门值的乘积的转置,Int T为输入负相关序列时神经元的输入状态与输入负相关序列的输入门值的乘积的转置,Wa为输入门的参数矩阵,ba为PM2.5浓度集的输入偏置,bap为正相关序列的输入偏置,ban为负相关序列的输入偏置。
4.根据权利要求3所述的一种PM2.5浓度预测系统,其特征在于,所述相关性计算单元具体包括:
平均值计算子单元,用于计算所述待训练的历史特征数据中各所述历史特征数据集合中各特征的平均值,得到多个历史特征数据平均集合;所述历史特征数据平均集合包括PM2.5浓度平均值、PM10浓度平均值、NO2浓度平均值、CO浓度平均值、O3浓度平均值、SO2浓度平均值、天气状况平均值、湿度平均值、温度平均值、降水量平均值、日照时数平均值、气压平均值、风速平均值和风向平均值;
平均值集合确定子单元,用于将所述历史特征数据平均集合中的同种特征提取出来,构成PM2.5浓度平均值集合、PM10浓度平均值集合、NO2浓度平均值集合、CO浓度平均值集合、O3浓度平均值集合、SO2浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合;
相关性确定子单元,用于计算PM2.5浓度平均值集合分别与PM10浓度平均值集合、NO2浓度平均值集合、CO浓度平均值集合、O3浓度平均值集合、SO2浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合之间的相关性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011456583.0A CN112418560B (zh) | 2020-12-10 | 2020-12-10 | 一种pm2.5浓度预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011456583.0A CN112418560B (zh) | 2020-12-10 | 2020-12-10 | 一种pm2.5浓度预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112418560A CN112418560A (zh) | 2021-02-26 |
CN112418560B true CN112418560B (zh) | 2024-05-14 |
Family
ID=74775568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011456583.0A Active CN112418560B (zh) | 2020-12-10 | 2020-12-10 | 一种pm2.5浓度预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112418560B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114609008B (zh) * | 2022-03-30 | 2023-09-01 | 中国科学院地理科学与资源研究所 | 一种气体浓度预测模型的训练方法和气体浓度预测方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107832897A (zh) * | 2017-11-30 | 2018-03-23 | 浙江工业大学 | 一种基于深度学习的股票市场预测方法 |
WO2018214060A1 (zh) * | 2017-05-24 | 2018-11-29 | 北京质享科技有限公司 | 一种城市小尺度空气质量指数预测方法与系统 |
CN109492822A (zh) * | 2018-11-24 | 2019-03-19 | 上海师范大学 | 空气污染物浓度时空域关联预测方法 |
AU2019100364A4 (en) * | 2019-04-05 | 2019-05-09 | Shenyuan Huang | A Method of Air Quality Prediction Using Long Short-Term Memory Neural Network |
CN110263479A (zh) * | 2019-06-28 | 2019-09-20 | 浙江航天恒嘉数据科技有限公司 | 一种大气污染因子浓度时空分布预测方法及系统 |
CN111160659A (zh) * | 2019-12-31 | 2020-05-15 | 国家电网公司西南分部 | 一种考虑温度模糊化的电力负荷预测方法 |
CA3065620A1 (en) * | 2018-12-21 | 2020-06-21 | Canvass Analytics Inc. | Predictive analysis of industrial processes |
CN111340292A (zh) * | 2020-02-26 | 2020-06-26 | 福州大学 | 一种基于聚类的集成神经网络pm2.5预测方法 |
CN111798051A (zh) * | 2020-07-02 | 2020-10-20 | 杭州电子科技大学 | 基于长短期记忆神经网络的空气质量时空预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10871594B2 (en) * | 2019-04-30 | 2020-12-22 | ClimateAI, Inc. | Methods and systems for climate forecasting using artificial neural networks |
-
2020
- 2020-12-10 CN CN202011456583.0A patent/CN112418560B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018214060A1 (zh) * | 2017-05-24 | 2018-11-29 | 北京质享科技有限公司 | 一种城市小尺度空气质量指数预测方法与系统 |
CN107832897A (zh) * | 2017-11-30 | 2018-03-23 | 浙江工业大学 | 一种基于深度学习的股票市场预测方法 |
CN109492822A (zh) * | 2018-11-24 | 2019-03-19 | 上海师范大学 | 空气污染物浓度时空域关联预测方法 |
CA3065620A1 (en) * | 2018-12-21 | 2020-06-21 | Canvass Analytics Inc. | Predictive analysis of industrial processes |
AU2019100364A4 (en) * | 2019-04-05 | 2019-05-09 | Shenyuan Huang | A Method of Air Quality Prediction Using Long Short-Term Memory Neural Network |
CN110263479A (zh) * | 2019-06-28 | 2019-09-20 | 浙江航天恒嘉数据科技有限公司 | 一种大气污染因子浓度时空分布预测方法及系统 |
CN111160659A (zh) * | 2019-12-31 | 2020-05-15 | 国家电网公司西南分部 | 一种考虑温度模糊化的电力负荷预测方法 |
CN111340292A (zh) * | 2020-02-26 | 2020-06-26 | 福州大学 | 一种基于聚类的集成神经网络pm2.5预测方法 |
CN111798051A (zh) * | 2020-07-02 | 2020-10-20 | 杭州电子科技大学 | 基于长短期记忆神经网络的空气质量时空预测方法 |
Non-Patent Citations (5)
Title |
---|
Multi-object Tracking with Neural Gating Using Bilinear LSTM;Chanho Kim.etc;ECCV 2018: Computer Vision;第208–224页 * |
基于LSTM神经网络的PM2.5浓度预测算法研究;邹艳芸;中国优秀硕士学位论文全文数据库;B027-355 * |
基于Prophet-LSTM模型的PM2.5浓度预测研究;王晓飞;王波;陆玉玉;张胜彬;;软件导刊(第03期);第133-136页 * |
基于聚类LSTM深度学习模型的主动配电网电能质量预测;翁国庆;龚阳光;舒俊鹏;黄飞腾;;高技术通讯(第07期);第687-697页 * |
应用CNN-Seq2seq的PM2.5未来一小时浓度预测模型;刘旭林;赵文芳;唐伟;;小型微型计算机系统(第05期);第1000-1006页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112418560A (zh) | 2021-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111798051B (zh) | 基于长短期记忆神经网络的空气质量时空预测方法 | |
CN111899510B (zh) | 基于发散卷积和gat的智能交通系统流量短期预测方法及系统 | |
CN108426812B (zh) | 一种基于记忆神经网络的pm2.5浓度值预测方法 | |
CN111613054B (zh) | 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法 | |
CN111340292B (zh) | 一种基于聚类的集成神经网络pm2.5预测方法 | |
Tokar et al. | Rainfall-runoff modeling using artificial neural networks | |
CN107909206B (zh) | 一种基于深层结构循环神经网络的pm2.5预测方法 | |
CN109711617B (zh) | 一种基于blstm深度学习的中长期径流预测方法 | |
CN111144286A (zh) | 一种融合emd和lstm的城市pm2.5浓度预测方法 | |
CN110866631A (zh) | 基于集成的门递归单元神经网络gru来预测大气污染情况的方法 | |
CN113632101A (zh) | 一种通过向量化分析预测大气污染的方法 | |
CN112418560B (zh) | 一种pm2.5浓度预测方法及系统 | |
CN111222706A (zh) | 一种基于粒子群优化与自编码器的混沌时间序列预测方法 | |
CN115860286A (zh) | 一种基于时序门机制的空气质量预测方法及系统 | |
CN114386686B (zh) | 一种基于改进lstm的流域水质短期预测方法 | |
CN116384565A (zh) | 一种基于缺失数据填补的层次式大气臭氧浓度预测方法 | |
CN116562414A (zh) | 一种基于多源水文气象数据的陆地水储量变化预测方法 | |
CN113985496B (zh) | 一种基于lstm-gm神经网络模型的风暴潮智能预报方法 | |
CN114219345A (zh) | 一种基于数据挖掘的二次空气质量预报优化方法 | |
CN111815051B (zh) | 考虑天气影响因素的grnn光伏发电预测方法 | |
CN116502539B (zh) | 一种VOCs气体浓度预测方法及系统 | |
CN117200223A (zh) | 日前电力负荷预测方法和装置 | |
CN116960962A (zh) | 一种跨区域数据融合的中长期区域负荷预测方法 | |
CN115099499A (zh) | 一种基于随机森林的emd-lstm对pm2.5浓度预测的方法 | |
Sohn et al. | Prediction of ozone formation based on neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |