CN111814956A - 一种基于多维度二次特征提取的多任务学习的空气质量预测方法 - Google Patents

一种基于多维度二次特征提取的多任务学习的空气质量预测方法 Download PDF

Info

Publication number
CN111814956A
CN111814956A CN202010581735.3A CN202010581735A CN111814956A CN 111814956 A CN111814956 A CN 111814956A CN 202010581735 A CN202010581735 A CN 202010581735A CN 111814956 A CN111814956 A CN 111814956A
Authority
CN
China
Prior art keywords
pollutant
predicted
network model
value
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010581735.3A
Other languages
English (en)
Other versions
CN111814956B (zh
Inventor
韩启龙
门瑞
陈睿
宋洪涛
张可佳
李洪坤
张育怀
李一豪
肖世桐
李佳航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN202010581735.3A priority Critical patent/CN111814956B/zh
Publication of CN111814956A publication Critical patent/CN111814956A/zh
Application granted granted Critical
Publication of CN111814956B publication Critical patent/CN111814956B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • G01N33/0009General constructional details of gas analysers, e.g. portable test equipment
    • G01N33/0062General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method, e.g. intermittent, or the display, e.g. digital
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Abstract

本发明提出一种基于多维度二次特征提取的多任务学习的空气质量预测方法,所述方法包括获取数据、数据预处理、选取污染物、建立多维度二次特征提取的卷积神经网络模型和长短期记忆网络模型、建立多维度二次特征提取的多任务学习模型和验证步骤。本发明针对传统时空数据建模时仅考虑时间内部相关性和空间内部相关性,未考虑到时空之间的相关性的问题。本发明从空间、时间和时空三个角度考虑与污染物值相关的影响信息,通过多任务学习对多个时间、空间任务间的相互影响的学习来降低预测偏差,使得时间、空间模型的预测精度更准确。

Description

一种基于多维度二次特征提取的多任务学习的空气质量预测 方法
技术领域
本发明属于空气质量预测技术领域,特别是涉及一种基于多维度二次特征提取的多任务学习的空气质量预测方法。
背景技术
近年来,由于能源消耗的增加,空气污染问题日益严重。空气质量预测是一项重要的建模任务,其对农业,水资源、运输等许多方面都具有重要影响,国家环保部门一直致力于解决空气质量问题。虽然在发现空气污染超标时,采取多种手段进行控制有一定的成效,但是目前的大气环境形势依然很严峻,污染物浓度预测对于严重污染事件的预警具有重要的意义和价值。
然而,由于空气中包含多种污染物气体,而且,这些气体会受到空间、时间相关性的影响。此外,空气质量还受到气象条件,如:是否刮风、是否下雨、当地温度等条件的影响。因此,结合多种因素对空气质量进行预测是一个十分值得研究的问题。
对空气质量预测已经提出了一些方法,可以将其分为三类,即确定性方法,统计学习方法和最近的深度学习方法。
确定性方法通常结合气象排放和化学模型,以建立空气质量预测的数值函数。但是,这些数值函数是由许多因素建立的,这些因素要么不完整,要么不准确,从而导致相对较差的预测准确性。另外,这些模型具有很高的复杂度,因此依赖于许多计算能力。
统计学习方法可分为参数方法和非参数方法。例如,基于分类、回归树(CART)和模糊逻辑提出了一些参数模型。尽管如此,问题仍然在于模型复杂性和计算可行性之间的权衡。
利用机器学习方法进行空气质量预测己成为研究领域的热点之一。由于空气中污染物数据演变过程的动态性和复杂性,这些数据又是训练预测模型非常重要的参数,不同污染物的浓度值变化存在着相似相关性,甚至相应变化趋势的相似相关性极大。目前都是将空间相关性和时间相关性作为分开独立的个体进行预测,并没有发现二者之间的相互联系同样影响着预测的准确性。
发明内容
本发明目的是为了解决在预测空气质量时,一般考虑的空间相关性维度较低,且时间与空间二者的相关性考虑的不充分的问题,提出了一种基于多维度二次特征提取的多任务学习的空气质量预测方法。
本发明是通过以下技术方案实现的,本发明提出一种基于多维度二次特征提取的多任务学习的空气质量预测方法,具体包括以下步骤:
步骤1、获取所有被预测站点Si的空气质量的数据集,其中,i=1,...,n,n表示站点个数;所述数据集包括气象数据集和污染物数据集;
步骤2、对获取到的数据集进行数据预处理,再按比例将预处理后的数据集分为训练集{TSi|i=1,...,n}和测试集{VSi|i=1,...,n};
步骤3、选取要预测的污染物P;
步骤4、依次对所有被预测站点Si建立多维度二次特征提取的卷积神经网络模型和长短期记忆网络模型,所述卷积神经网络模型和长短期记忆网络模型的输入均为训练集{TSi|i= 1,...,n},将污染物P在多维度二次特征提取的卷积神经网络模型上预测得到的预测值
Figure RE-GDA0002625598680000021
作为多维度二次特征提取的卷积神经网络模型的输出,将污染物P在长短期记忆网络模型上预测得到的预测值
Figure RE-GDA0002625598680000022
作为长短期记忆网络模型的输出;其中,t表示时间,H表示滑动窗口大小;
步骤5、构建基于多维度二次特征提取的多任务学习模型,将所有站点的所述污染物P 在多维度二次特征提取的卷积神经网络模型上预测得到的预测值和污染物P在长短期记忆网络模型上预测得到的预测值作为多任务学习模型的输入,输出即为污染物P的预测结果,从而得到了训练好的基于多维度二次特征提取的多任务学习模型;
步骤6、将测试集{VSi|i=1,...,n}输入到已经训练好的基于多维度二次特征提取的多任务学习模型中,输出为污染物P的预测值
Figure RE-GDA0002625598680000023
进一步地,所述对获取到的数据集进行数据预处理具体为:
步骤2.1:将所述数据集中含有取值为空或取值为非法值的行删除;
步骤2.2:在连续的三个时间点内,对于同一特征,将特征值连续缺失数量大于二个的行删除,将特征值仅缺失一个的行用均值法进行补齐,将特征值仅缺失二个的行用线性插值法进行补齐。
进一步地,在步骤4中,依次对所有被预测站点Si的污染物P进行污染物相关性分析,具体为:
步骤4.1:在横坐标为时间,纵坐标为污染物浓度值的同一平面直角坐标系中,对所述训练集{TSi|i=1,...,n}所对应的每个被预测站点{Si|i=1,...,n}中的每列污染物特征
Figure RE-GDA0002625598680000024
进行绘制折线图,通过分析不同折线的整体走势,初步排除掉与步骤3中选取的污染物P明显不相关的污染物特征,余下待判定具体相关性的污染物特征;
步骤4.2:计算步骤4.1中污染物特征与污染物P之间的皮尔逊相关系数,根据所求皮尔逊相关系数的值,对污染物特征与污染物P的相关性进行评级,得到对应六个等级{li|i= 1,2,...,6}的污染物特征集{Ui|i=1,2,...,6},相关性为:l1≥l2≥l3≥l4≥l5≥l6
进一步地,所述多维度二次特征提取的卷积神经网络模型的学习过程为:
步骤4.3:将t时刻,被预测站点Si的污染物P的浓度值
Figure RE-GDA0002625598680000031
置于第一层卷积神经网络的中心位置A;
步骤4.4:将步骤4.2中相关性评级为l1的污染物特征集U1在t时刻的浓度值,放在最靠近A的位置;将相关性评级为l2的污染物特征集U2在t时刻的浓度值,放在第二靠近A 的位置;以此类推,相关性评级为l6的污染物特征集U6在t时刻的浓度值,放在最远离A 的位置;
步骤4.5:对于第一层卷积神经网络的每个位置污染物特征的浓度值
Figure RE-GDA0002625598680000032
将其取出作为第二层卷积神经网络的中心位置B,将该污染物特征P′所在被预测站点Sj在t时刻的风速
Figure RE-GDA0002625598680000033
风向
Figure RE-GDA0002625598680000034
温度
Figure RE-GDA0002625598680000035
湿度
Figure RE-GDA0002625598680000036
和压强
Figure RE-GDA0002625598680000037
特征放在临近B的八个位置,空位补零,其中,j=1,...,n;
步骤4.6:根据B所在被预测站点的地理位置,获取离中心位置B所在被预测站点欧氏距离相对较小的八个被预测站点,所述八个被预测站点的各自的中心位置放置各自站点相同污染物特征P′的浓度值,将相同污染物特征P′在t时刻的风速
Figure RE-GDA0002625598680000038
风向
Figure RE-GDA0002625598680000039
温度
Figure RE-GDA00026255986800000310
湿度
Figure RE-GDA00026255986800000311
和压强
Figure RE-GDA00026255986800000312
特征置于相对应被预测站点的中心位置的周围,空位补零,其中0≤k≤8;
步骤4.7:训练第二层卷积神经网络,其中卷积核w=3x3,步长为3,进行二次卷积操作,得到位于中心位置的污染物特征浓度值
Figure RE-GDA00026255986800000313
的下一时刻的浓度预测值
Figure RE-GDA00026255986800000314
从而学习到不同站点浓度值
Figure RE-GDA00026255986800000315
相同污染物特征P′的气体流动相关性;
步骤4.8:将步骤4.7中训练得到的预测值
Figure RE-GDA00026255986800000316
返回到第一层卷积神经网络的对应位置上,这样逐步更新第一层卷积神经网络每个位置上的值;再用卷积神经网络训练,其中, w=3x3,步长为1,进行一次卷积操作后传入全连接层,得到位于中心位置的被预测站点Si的污染物P的浓度值
Figure RE-GDA0002625598680000041
的预测值
Figure RE-GDA0002625598680000042
从而能够提取不同站点不同气体与当前预测污染物的气体流动相关性;
步骤4.9:t后移一个时间单位,重复步骤4.3至步骤4.8共H次,得到被预测站点Si的污染物P的浓度值
Figure RE-GDA0002625598680000043
的预测值
Figure RE-GDA0002625598680000044
进一步地,在长短期记忆网络模型学习过程中,通过输入前H小时的污染物P的浓度值,计算得到被预测站点Si预测的第H+1小时的污染物P的浓度值的预测值。
进一步地,计算过程中使用的公式有:
计算长短期记忆网络模型LSTM的遗忘门:
ftσ(Wf·[ht-1,xt]+bf)
其中,ft为遗忘门,表示遗忘上一层细胞状态的概率;ht-1表示上一序列的隐藏状态, xt表示本序列数据,Wf表示遗忘门的权重,bf表示遗忘门的偏差;σ表示sigmoid激活函数;
计算长短期记忆网络模型LSTM的输入门:
it=σ(Wi·[ht-1,xt]+bi)
其中,it表示输入门,Wi表示输入门的权重,bi表示输入门的偏差;
计算长短期记忆网络模型LSTM当前输入的单元状态:
Figure RE-GDA0002625598680000045
Figure RE-GDA0002625598680000046
其中,Ct称为当前时刻细胞状态,
Figure RE-GDA0002625598680000047
表示经过tanh函数的输出,Wc表示细胞状态的权重,bc表示细胞状态的偏差;
计算长短期记忆网络模型LSTM的输出门:
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot·tanh(Ct)
其中,ot表示输出门,Wo表示输出门的权重,bo表示输出门的偏差,ht表示当前序列的隐藏状态;
通过以上公式的计算能够得到长短期记忆网络模型预测的预测值
Figure RE-GDA0002625598680000048
进一步地,所述基于多维度二次特征提取的多任务学习模型进行迭代训练过程中使用的损失函数为:
Figure RE-GDA0002625598680000051
其中,n表示站点个数,
Figure RE-GDA0002625598680000052
表示真实值,
Figure RE-GDA0002625598680000053
表示由多维度二次特征提取的卷积神经网络模型预测得到的预测值,
Figure RE-GDA0002625598680000054
表示由长短期记忆网络模型预测得到的预测值,λ表示多任务学习中的超参数。
本发明的有益效果为:
(1)本发明针对普通卷积神经网络没能多维度细化地考虑多维度气体流动相关性的问题,提出一种基于多维度二次特征提取的多任务学习的空气质量预测方法,相较于普通卷积神经网络,利用多维度二次特征提取卷积神经网络对空间气体的流动关系做出细致的建模,学习到的知识更多、更细化,可以提升预测精度。
(2)本发明针对传统时空数据建模时仅考虑时间内部相关性和空间内部相关性,未考虑到时空之间的相关性的问题。本发明从空间、时间和时空三个角度考虑与污染物值相关的影响信息,通过多任务学习对多个时间、空间任务间的相互影响的学习来降低预测偏差,使得时间、空间模型的预测精度更准确。
附图说明
图1是基于多维度二次特征提取的多任务学习的空气质量预测方法流程图。
图2是本发明的整体架构图。
图3是本发明关于污染物气体维度和时间维度的CNN单一特征提取示意图。
图4是本发明关于污染物气体维度和时间维度的CNN特征提取总体示意图。
图5是本发明单一站点关于气象数据维度、地理距离维度和污染物数据维度的CNN特征提取示意图。
图6是本发明多站点关于气象数据维度、地理距离维度和污染物数据维度的CNN特征提取示意图。
图7是本发明的LSTM的单元示意图。
具体实施方式
下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
结合图1-图2,本发明提出一种基于多维度二次特征提取的多任务学习的空气质量预测方法,具体包括以下步骤:
步骤1、获取所有被预测站点Si的空气质量的数据集,其中,i=1,...,n,n表示站点个数;所述数据集包括气象数据集和污染物数据集等;
步骤2、对获取到的数据集进行数据预处理,再按比例将预处理后的数据集分为训练集{TSi|i=1,...,n}和测试集{VSi|i=1,...,n};
步骤3、选取要预测的污染物P;
步骤4、依次对所有被预测站点Si建立多维度二次特征提取的卷积神经网络模型和长短期记忆网络模型,所述卷积神经网络模型和长短期记忆网络模型的输入均为训练集{TSi|i=1,...,n},将污染物P在多维度二次特征提取的卷积神经网络模型上预测得到的预测值
Figure RE-GDA0002625598680000061
作为多维度二次特征提取的卷积神经网络模型的输出,将污染物P在长短期记忆网络模型上预测得到的预测值
Figure RE-GDA0002625598680000062
作为长短期记忆网络模型的输出;其中,t表示时间,H表示滑动窗口大小;
步骤5、构建基于多维度二次特征提取的多任务学习模型,将所有站点的所述污染物P 在多维度二次特征提取的卷积神经网络模型上预测得到的预测值和污染物P在长短期记忆网络模型上预测得到的预测值作为多任务学习模型的输入,输出即为污染物P的预测结果,从而得到了训练好的基于多维度二次特征提取的多任务学习模型;
步骤6、将测试集{VSi|i=1,...,n}输入到已经训练好的基于多维度二次特征提取的多任务学习模型中,输出为污染物P的预测值
Figure RE-GDA0002625598680000063
所述对获取到的数据集进行数据预处理具体为:
步骤2.1:将所述数据集中含有取值为空或取值为非法值的行删除;
步骤2.2:在连续的三个时间点内,对于同一特征,将特征值连续缺失数量大于二个的行删除,将特征值仅缺失一个的行用均值法进行补齐,将特征值仅缺失二个的行用线性插值法进行补齐。
在步骤4中,依次对所有被预测站点Si的污染物P进行污染物相关性分析,具体为:
步骤4.1:在横坐标为时间,纵坐标为污染物浓度值的同一平面直角坐标系中,对所述训练集{TSi|i=1,...,n}所对应的每个被预测站点{Si|i=1,...,n}中的每列污染物特征
Figure RE-GDA0002625598680000064
进行绘制折线图,通过分析不同折线的整体走势,初步排除掉与步骤3中选取的污染物P明显不相关的污染物特征,余下待判定具体相关性的污染物特征;
步骤4.2:计算步骤4.1中污染物特征与污染物P之间的皮尔逊相关系数,根据所求皮尔逊相关系数的值,对污染物特征与污染物P的相关性进行评级,得到对应六个等级{li|i= 1,2,...,6}的污染物特征集{Ui|i=1,2,...,6},相关性为:l1≥l2≥l3≥l4≥l5≥l6
所述多维度二次特征提取的卷积神经网络模型的学习过程为:
步骤4.3:将t时刻,被预测站点Si的污染物P的浓度值
Figure RE-GDA0002625598680000071
置于第一层卷积神经网络的中心位置A;如图3所示,图中被预测的污染物P为PM2.5的值;
步骤4.4:将步骤4.2中相关性评级为l1的污染物特征集U1在t时刻的浓度值,放在最靠近A的位置;将相关性评级为l2的污染物特征集U2在t时刻的浓度值,放在第二靠近A 的位置;以此类推,相关性评级为l6的污染物特征集U6在t时刻的浓度值,放在最远离A 的位置;如图4所示;
步骤4.5:对于第一层卷积神经网络的每个位置污染物特征的浓度值
Figure RE-GDA0002625598680000072
将其取出作为第二层卷积神经网络的中心位置B,如图5所示,将该污染物特征P′所在被预测站点Sj在t时刻的风速
Figure RE-GDA0002625598680000073
风向
Figure RE-GDA0002625598680000074
温度
Figure RE-GDA0002625598680000075
湿度
Figure RE-GDA0002625598680000076
和压强
Figure RE-GDA0002625598680000077
特征放在临近 B的八个位置,空位补零,其中,j=1,...,n;
步骤4.6:根据B所在被预测站点的地理位置,获取离中心位置B所在被预测站点欧氏距离相对较小的八个被预测站点,所述八个被预测站点的各自的中心位置放置各自站点相同污染物特征P′的浓度值,将相同污染物特征P′在t时刻的风速
Figure RE-GDA0002625598680000078
风向
Figure RE-GDA0002625598680000079
温度
Figure RE-GDA00026255986800000710
湿度
Figure RE-GDA00026255986800000711
和压强
Figure RE-GDA00026255986800000712
特征置于相对应被预测站点的中心位置的周围,空位补零,其中0≤k≤8;如图6所示;
步骤4.7:训练第二层卷积神经网络,其中卷积核w=3x3,步长为3,进行二次卷积操作,得到位于中心位置的污染物特征浓度值
Figure RE-GDA00026255986800000713
的下一时刻的浓度预测值
Figure RE-GDA00026255986800000714
从而学习到不同站点浓度值
Figure RE-GDA00026255986800000715
相同污染物特征P′的气体流动相关性;
步骤4.8:将步骤4.7中训练得到的预测值
Figure RE-GDA00026255986800000716
返回到第一层卷积神经网络的对应位置上,这样逐步更新第一层卷积神经网络每个位置上的值;再用卷积神经网络训练,其中, w=3x3,步长为1,进行一次卷积操作后传入全连接层,得到位于中心位置的被预测站点 Si的污染物P的浓度值
Figure RE-GDA00026255986800000717
的预测值
Figure RE-GDA00026255986800000718
从而能够提取不同站点不同气体与当前预测污染物的气体流动相关性;
步骤4.9:t后移一个时间单位,重复步骤4.3至步骤4.8共H次,得到被预测站点Si的污染物P的浓度值
Figure RE-GDA0002625598680000081
的预测值
Figure RE-GDA0002625598680000082
结合图7,在长短期记忆网络模型学习过程中,通过输入前H小时的污染物P的浓度值,计算得到被预测站点Si预测的第H+1小时的污染物P的浓度值的预测值。
计算过程中使用的公式有:
计算长短期记忆网络模型LSTM的遗忘门:
ft=σ(Wf·[ht-1,xt]+bf)
其中,ft为遗忘门,表示遗忘上一层细胞状态的概率;ht-1表示上一序列的隐藏状态, xt表示本序列数据,Wf表示遗忘门的权重,bf表示遗忘门的偏差;σ表示sigmoid激活函数;
计算长短期记忆网络模型LSTM的输入门:
it=σ(Wi·[ht-1,xt]+bi)
其中,it表示输入门,Wi表示输入门的权重,bi表示输入门的偏差;
计算长短期记忆网络模型LSTM当前输入的单元状态:
Figure RE-GDA0002625598680000083
Figure RE-GDA0002625598680000084
其中,Ct称为当前时刻细胞状态,
Figure RE-GDA0002625598680000085
表示经过tanh函数的输出,Wc表示细胞状态的权重,bc表示细胞状态的偏差;
计算长短期记忆网络模型LSTM的输出门:
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot·tanh(Ct)
其中,ot表示输出门,Wo表示输出门的权重,bo表示输出门的偏差,ht表示当前序列的隐藏状态;
通过以上公式的计算能够得到长短期记忆网络模型预测的预测值
Figure RE-GDA0002625598680000086
所述基于多维度二次特征提取的多任务学习模型进行迭代训练过程中使用的损失函数为:
Figure RE-GDA0002625598680000091
其中,n表示站点个数,
Figure RE-GDA0002625598680000092
表示真实值,
Figure RE-GDA0002625598680000093
表示由多维度二次特征提取的卷积神经网络模型预测得到的预测值,
Figure RE-GDA0002625598680000094
表示由长短期记忆网络模型预测得到的预测值,λ表示多任务学习中的超参数。
以上对本发明所提出的一种基于多维度二次特征提取的多任务学习的空气质量预测方法,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (7)

1.一种基于多维度二次特征提取的多任务学习的空气质量预测方法,其特征在于:具体包括以下步骤:
步骤1、获取所有被预测站点Si的空气质量的数据集,其中,i=1,...,n,n表示站点个数;所述数据集包括气象数据集和污染物数据集;
步骤2、对获取到的数据集进行数据预处理,再按比例将预处理后的数据集分为训练集{TSi|i=1,...,n}和测试集{Vsi|i=1,...,n};
步骤3、选取要预测的污染物P;
步骤4、依次对所有被预测站点Si建立多维度二次特征提取的卷积神经网络模型和长短期记忆网络模型,所述卷积神经网络模型和长短期记忆网络模型的输入均为训练集{TSi|i=1,...,n},将污染物P在多维度二次特征提取的卷积神经网络模型上预测得到的预测值
Figure FDA0002553433820000011
作为多维度二次特征提取的卷积神经网络模型的输出,将污染物P在长短期记忆网络模型上预测得到的预测值
Figure FDA0002553433820000012
作为长短期记忆网络模型的输出;其中,t表示时间,H表示滑动窗口大小;
步骤5、构建基于多维度二次特征提取的多任务学习模型,将所有站点的所述污染物P在多维度二次特征提取的卷积神经网络模型上预测得到的预测值和污染物P在长短期记忆网络模型上预测得到的预测值作为多任务学习模型的输入,输出即为污染物P的预测结果,从而得到了训练好的基于多维度二次特征提取的多任务学习模型;
步骤6、将测试集{VSi|i=1,...,n}输入到已经训练好的基于多维度二次特征提取的多任务学习模型中,输出为污染物P的预测值
Figure FDA0002553433820000013
2.根据权利要求1所述的方法,其特征在于:所述对获取到的数据集进行数据预处理具体为:
步骤2.1:将所述数据集中含有取值为空或取值为非法值的行删除;
步骤2.2:在连续的三个时间点内,对于同一特征,将特征值连续缺失数量大于二个的行删除,将特征值仅缺失一个的行用均值法进行补齐,将特征值仅缺失二个的行用线性插值法进行补齐。
3.根据权利要求1所述的方法,其特征在于:在步骤4中,依次对所有被预测站点Si的污染物P进行污染物相关性分析,具体为:
步骤4.1:在横坐标为时间,纵坐标为污染物浓度值的同一平面直角坐标系中,对所述训练集{TSi|i=1,...,n}所对应的每个被预测站点{Si|i=1,...,n}中的每列污染物特征
Figure FDA0002553433820000014
进行绘制折线图,通过分析不同折线的整体走势,初步排除掉与步骤3中选取的污染物P明显不相关的污染物特征,余下待判定具体相关性的污染物特征;
步骤4.2:计算步骤4.1中污染物特征与污染物P之间的皮尔逊相关系数,根据所求皮尔逊相关系数的值,对污染物特征与污染物P的相关性进行评级,得到对应六个等级{li|i=1,2,...,6}的污染物特征集{Ui|i=1,2,...,6},相关性为:l1≥l2≥l3≥l4≥l5≥l6
4.根据权利要求3所述的方法,其特征在于:所述多维度二次特征提取的卷积神经网络模型的学习过程为:
步骤4.3:将t时刻,被预测站点Si的污染物P的浓度值
Figure FDA0002553433820000021
置于第一层卷积神经网络的中心位置A;
步骤4.4:将步骤4.2中相关性评级为l1的污染物特征集U1在t时刻的浓度值,放在最靠近A的位置;将相关性评级为l2的污染物特征集U2在t时刻的浓度值,放在第二靠近A的位置;以此类推,相关性评级为l6的污染物特征集U6在t时刻的浓度值,放在最远离A的位置;
步骤4.5:对于第一层卷积神经网络的每个位置污染物特征的浓度值
Figure FDA0002553433820000022
将其取出作为第二层卷积神经网络的中心位置B,将该污染物特征P′所在被预测站点Sj在t时刻的风速
Figure FDA0002553433820000023
风向
Figure FDA0002553433820000024
温度
Figure FDA0002553433820000025
湿度
Figure FDA0002553433820000026
和压强
Figure FDA0002553433820000027
特征放在临近B的八个位置,空位补零,其中,j=1,...,n;
步骤4.6:根据B所在被预测站点的地理位置,获取离中心位置B所在被预测站点欧氏距离相对较小的八个被预测站点,所述八个被预测站点的各自的中心位置放置各自站点相同污染物特征P′的浓度值,将相同污染物特征P′在t时刻的风速
Figure FDA0002553433820000028
风向
Figure FDA0002553433820000029
温度
Figure FDA00025534338200000210
湿度
Figure FDA00025534338200000211
和压强
Figure FDA00025534338200000212
特征置于相对应被预测站点的中心位置的周围,空位补零,其中0≤k≤8;
步骤4.7:训练第二层卷积神经网络,其中卷积核w=3x3,步长为3,进行二次卷积操作,得到位于中心位置的污染物特征浓度值
Figure FDA00025534338200000213
的下一时刻的浓度预测值
Figure FDA00025534338200000214
从而学习到不同站点浓度值
Figure FDA00025534338200000215
相同污染物特征P′的气体流动相关性;
步骤4.8:将步骤4.7中训练得到的预测值
Figure FDA00025534338200000216
返回到第一层卷积神经网络的对应位置上,这样逐步更新第一层卷积神经网络每个位置上的值;再用卷积神经网络训练,其中,w=3x3,步长为1,进行一次卷积操作后传入全连接层,得到位于中心位置的被预测站点Si的污染物P的浓度值
Figure FDA0002553433820000031
的预测值
Figure FDA0002553433820000032
从而能够提取不同站点不同气体与当前预测污染物的气体流动相关性;
步骤4.9:t后移一个时间单位,重复步骤4.3至步骤4.8共H次,得到被预测站点Si的污染物P的浓度值
Figure FDA0002553433820000033
的预测值
Figure FDA0002553433820000034
5.根据权利要求1所述的方法,其特征在于:在长短期记忆网络模型学习过程中,通过输入前H小时的污染物P的浓度值,计算得到被预测站点Si预测的第H+1小时的污染物P的浓度值的预测值。
6.根据权利要求5所述的方法,其特征在于:计算过程中使用的公式有:
计算长短期记忆网络模型LSTM的遗忘门:
ft=σ(Wf·[ht-1,xt]+bf)
其中,ft为遗忘口,表示遗忘上一层细胞状态的概率;ht-1表示上一序列的隐藏状态,xt表示本序列数据,Wf表示遗忘门的权重,bf表示遗忘门的偏差;σ表示sigmoid激活函数;
计算长短期记忆网络模型LSTM的输入门:
it=σ(Wi·[ht-1,xt]+bi)
其中,it表示输入门,Wi表示输入门的权重,bi表示输入门的偏差;
计算长短期记忆网络模型LSTM当前输入的单元状态:
Figure FDA0002553433820000035
Figure FDA0002553433820000036
其中,Ct称为当前时刻细胞状态,
Figure FDA0002553433820000037
表示经过tanh函数的输出,Wc表示细胞状态的权重,bc表示细胞状态的偏差;
计算长短期记忆网络模型LSTM的输出门:
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot·tanh(Ct)
其中,ot表示输出门,Wo表示输出门的权重,bo表示输出门的偏差,ht表示当前序列的隐藏状态;
通过以上公式的计算能够得到长短期记忆网络模型预测的预测值
Figure FDA0002553433820000041
7.根据权利要求1所述的方法,其特征在于:所述基于多维度二次特征提取的多任务学习模型进行迭代训练过程中使用的损失函数为:
Figure FDA0002553433820000042
其中,n表示站点个数,
Figure FDA0002553433820000043
表示真实值,
Figure FDA0002553433820000044
表示由多维度二次特征提取的卷积神经网络模型预测得到的预测值,
Figure FDA0002553433820000045
表示由长短期记忆网络模型预测得到的预测值,λ表示多任务学习中的超参数。
CN202010581735.3A 2020-06-23 2020-06-23 一种基于多维度二次特征提取的多任务学习的空气质量预测方法 Active CN111814956B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010581735.3A CN111814956B (zh) 2020-06-23 2020-06-23 一种基于多维度二次特征提取的多任务学习的空气质量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010581735.3A CN111814956B (zh) 2020-06-23 2020-06-23 一种基于多维度二次特征提取的多任务学习的空气质量预测方法

Publications (2)

Publication Number Publication Date
CN111814956A true CN111814956A (zh) 2020-10-23
CN111814956B CN111814956B (zh) 2022-04-08

Family

ID=72846437

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010581735.3A Active CN111814956B (zh) 2020-06-23 2020-06-23 一种基于多维度二次特征提取的多任务学习的空气质量预测方法

Country Status (1)

Country Link
CN (1) CN111814956B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112712169A (zh) * 2021-01-08 2021-04-27 中国科学院地理科学与资源研究所 基于图卷积的全残差深度网络的模型建立方法及应用
CN112946187A (zh) * 2021-01-22 2021-06-11 西安科技大学 一种基于神经网络的避难硐室实时状态监测方法
CN113159099A (zh) * 2021-02-09 2021-07-23 北京工业大学 一种基于多任务学习的大气污染物浓度预测方法
CN113255995A (zh) * 2021-05-24 2021-08-13 北京建筑大学 一种空气污染预测方法
WO2022265085A1 (ja) * 2021-06-17 2022-12-22 ダイキン工業株式会社 浄化機器の制御方法及び装置、浄化機器
CN115980281A (zh) * 2023-03-16 2023-04-18 深圳奥雅设计股份有限公司 一种基于碳中和的碳源检测方法及系统
CN116862079A (zh) * 2023-09-04 2023-10-10 应辉环境科技服务(烟台)有限公司 一种企业污染物排放预测方法及预测系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130269417A1 (en) * 2012-04-16 2013-10-17 International Business Machines Corporation Early Detection of Overheating Devices
US20140107941A1 (en) * 2005-09-01 2014-04-17 Kuwait University Method for measuring the properties of petroleum fuels by distillation
CN108009674A (zh) * 2017-11-27 2018-05-08 上海师范大学 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法
CN109492822A (zh) * 2018-11-24 2019-03-19 上海师范大学 空气污染物浓度时空域关联预测方法
CN109492830A (zh) * 2018-12-17 2019-03-19 杭州电子科技大学 一种基于时空深度学习的移动污染源排放浓度预测方法
CN109685252A (zh) * 2018-11-30 2019-04-26 西安工程大学 基于循环神经网络和多任务学习模型的建筑能耗预测方法
CN109886241A (zh) * 2019-03-05 2019-06-14 天津工业大学 基于长短期记忆网络的驾驶员疲劳检测
CN110147877A (zh) * 2019-05-24 2019-08-20 福州大学 基于卷积长短时网络的pm2.5预测方法
CN110598953A (zh) * 2019-09-23 2019-12-20 哈尔滨工程大学 一种时空相关的空气质量预测方法
CN110633871A (zh) * 2019-09-25 2019-12-31 大连理工大学 一种基于卷积长短期记忆网络的区域交通需求预测方法
CN111047012A (zh) * 2019-12-06 2020-04-21 重庆大学 基于深度双向长短期记忆网络的空气质量预测方法
CN111160628A (zh) * 2019-12-13 2020-05-15 重庆邮电大学 一种基于CNN和双注意力seq2seq的空气污染物浓度预测方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140107941A1 (en) * 2005-09-01 2014-04-17 Kuwait University Method for measuring the properties of petroleum fuels by distillation
US20130269417A1 (en) * 2012-04-16 2013-10-17 International Business Machines Corporation Early Detection of Overheating Devices
CN108009674A (zh) * 2017-11-27 2018-05-08 上海师范大学 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法
CN109492822A (zh) * 2018-11-24 2019-03-19 上海师范大学 空气污染物浓度时空域关联预测方法
CN109685252A (zh) * 2018-11-30 2019-04-26 西安工程大学 基于循环神经网络和多任务学习模型的建筑能耗预测方法
CN109492830A (zh) * 2018-12-17 2019-03-19 杭州电子科技大学 一种基于时空深度学习的移动污染源排放浓度预测方法
CN109886241A (zh) * 2019-03-05 2019-06-14 天津工业大学 基于长短期记忆网络的驾驶员疲劳检测
CN110147877A (zh) * 2019-05-24 2019-08-20 福州大学 基于卷积长短时网络的pm2.5预测方法
CN110598953A (zh) * 2019-09-23 2019-12-20 哈尔滨工程大学 一种时空相关的空气质量预测方法
CN110633871A (zh) * 2019-09-25 2019-12-31 大连理工大学 一种基于卷积长短期记忆网络的区域交通需求预测方法
CN111047012A (zh) * 2019-12-06 2020-04-21 重庆大学 基于深度双向长短期记忆网络的空气质量预测方法
CN111160628A (zh) * 2019-12-13 2020-05-15 重庆邮电大学 一种基于CNN和双注意力seq2seq的空气污染物浓度预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LING CHEN 等: "Deep Multi-Task Learning Based Urban Air Quality Index Modelling", 《PROCEEDINGS OF THE ACM ON INTERACTIVE》 *
QILONG HAN 等: "A Wireless Sensor Network for Monitoring Environmental Quality in the Manufacturing Industry", 《IEEE ACCESS》 *
康兵兵 等: "基于深度神经网络的空气质量预测系统", 《哈尔滨商业大学学报》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112712169A (zh) * 2021-01-08 2021-04-27 中国科学院地理科学与资源研究所 基于图卷积的全残差深度网络的模型建立方法及应用
CN112946187A (zh) * 2021-01-22 2021-06-11 西安科技大学 一种基于神经网络的避难硐室实时状态监测方法
CN113159099A (zh) * 2021-02-09 2021-07-23 北京工业大学 一种基于多任务学习的大气污染物浓度预测方法
CN113255995A (zh) * 2021-05-24 2021-08-13 北京建筑大学 一种空气污染预测方法
WO2022265085A1 (ja) * 2021-06-17 2022-12-22 ダイキン工業株式会社 浄化機器の制御方法及び装置、浄化機器
CN115980281A (zh) * 2023-03-16 2023-04-18 深圳奥雅设计股份有限公司 一种基于碳中和的碳源检测方法及系统
CN116862079A (zh) * 2023-09-04 2023-10-10 应辉环境科技服务(烟台)有限公司 一种企业污染物排放预测方法及预测系统
CN116862079B (zh) * 2023-09-04 2023-12-05 应辉环境科技服务(烟台)有限公司 一种企业污染物排放预测方法及预测系统

Also Published As

Publication number Publication date
CN111814956B (zh) 2022-04-08

Similar Documents

Publication Publication Date Title
CN111814956B (zh) 一种基于多维度二次特征提取的多任务学习的空气质量预测方法
Sun et al. Using Bayesian deep learning to capture uncertainty for residential net load forecasting
CN111899510B (zh) 基于发散卷积和gat的智能交通系统流量短期预测方法及系统
CN116448419A (zh) 基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法
CN115758290A (zh) 一种基于lstm的风机齿轮箱高速轴温度趋势预警方法
CN114462718A (zh) 基于时间滑动窗口的cnn-gru风电功率预测方法
CN113011660A (zh) 空气质量预测方法、系统及存储介质
Zaidan et al. Predicting atmospheric particle formation days by Bayesian classification of the time series features
CN111008726A (zh) 一种电力负荷预测中类图片转换方法
CN114662791A (zh) 一种基于时空注意力的长时序pm2.5预测方法及系统
CN113408659A (zh) 一种基于数据挖掘的建筑能耗集成分析方法
Girimurugan et al. Application of Deep Learning to the Prediction of Solar Irradiance through Missing Data
Wang et al. Research on air pollution gases recognition method based on lstm recurrent neural network and gas sensors array
CN113449919B (zh) 一种基于特征和趋势感知的用电量预测方法及系统
CN117113086A (zh) 一种储能机组负荷预测方法、系统、电子设备及介质
CN116861256A (zh) 一种固废焚烧过程的炉温预测方法、系统、设备及介质
CN116245259A (zh) 基于深度特征选择的光伏发电预测方法、装置和电子设备
Jiang et al. Prediction of sea temperature using temporal convolutional network and LSTM-GRU network
CN115330082A (zh) 一种基于注意力机制的lstm网络的pm2.5浓度预测方法
CN114139783A (zh) 基于非线性加权组合的风电短期功率预测方法及装置
CN113361768A (zh) 一种粮食库健康状况预测方法,存储设备及服务器
CN113762591A (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及系统
CN114625831A (zh) 一种面向智能电网负荷辨识的分类评价反馈方法
CN112580859A (zh) 一种基于全局注意力机制的雾霾预测方法
Li et al. Power data cleaning method based on isolation forest and LSTM neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant