CN112418560B

CN112418560B - 一种pm2.5浓度预测方法及系统

Info

Publication number: CN112418560B
Application number: CN202011456583.0A
Authority: CN
Inventors: 张昕; 周超然; 张莹; 赖斯莹; 刘婧娴; 何金龙; 王超伟; 何敏; 杨宏伟
Original assignee: Changchun University of Science and Technology
Current assignee: Changchun University of Science and Technology
Priority date: 2020-12-10
Filing date: 2020-12-10
Publication date: 2024-05-14
Anticipated expiration: 2040-12-10
Also published as: CN112418560A

Abstract

本发明涉及一种PM2.5浓度预测方法及系统。所述方法包括：获取待预测的历史特征数据；将所述待预测的历史特征数据输入PM2.5浓度预测模型得到PM2.5的预测浓度，所述PM2.5浓度预测模型为以待训练的历史特征数据为输入对包括多个输入门的长短期记忆网络模型进行训练得到的。通过使用多输入长短期记忆模型，实现从多维度单输入序列的模型结构到三维度多输入序列的模型结构的优化，使得PM2.5的浓度预测效率更快，结果更准确。

Description

一种PM2.5浓度预测方法及系统

技术领域

本发明涉及空气质量预测技术领域，特别是涉及一种PM2.5浓度预测方法及系统。

背景技术

空气污染被认为是一个严重的环境问题，因为它对人类的健康有不利的影响，空气污染被认为是与环境条件有关的死亡的主要原因，典型的空气污染源包括交通和工业排放。主要污染物有颗粒物2.5(PM2.5)、颗粒物10(PM10)、NO₂、SO₂、O₃等，其中PM2.5对人类危害最大。

PM2.5是指细颗粒或直径小于2.5微米的颗粒，通常由固体或液体颗粒组成。PM2.5严重危害儿童、老年人等敏感人群的健康。PM2.5浓度的预测有助于人们的出行决策和制定环境相关政策，但是PM2.5的形成和消失是一个复杂的过程。从大气科学研究的角度来看，其积累和消散主要受到当地气象条件、区域交通、污染物排放等因素的影响。例如，温度升高会导致PM2.5浓度增加，弱风会阻止PM2.5的扩散，导致PM2.5在大气循环系统中积累，而强风会降低PM2.5浓度。降雨对空气质量起到了积极的作用，可以大大降低PM2.5浓度。污染排放源中的矿物粉尘、气溶胶和微量金属也会对PM2.5的形成产生催化作用，所有这些因素使得PM2.5浓度的预测变得更加困难，现有采用回归模型和反向传播神经网络对PM2.5浓度进行预测，但是精度并不高。

发明内容

本发明的目的是提供一种PM2.5浓度预测方法及系统，提高PM2.5浓度的预测精度。

为实现上述目的，本发明提供了如下方案：

一种PM2.5浓度预测方法，包括：

获取待预测的历史特征数据；所述历史特征数据包括污染物历史浓度数据和气象资料历史数据；所述污染物历史浓度数据包括PM2.5浓度、PM10浓度、NO₂浓度、CO浓度、O₃浓度和SO₂浓度，所述气象资料历史数据包括天气状况、湿度、温度、降水量、日照时数、气压、风速和风向；

将所述待预测的历史特征数据输入PM2.5浓度预测模型得到PM2.5的预测浓度，所述PM2.5浓度预测模型为以待训练的历史特征数据为输入对包括多个输入门的长短期记忆网络模型进行训练得到的。

可选的，所述PM2.5浓度预测模型的确定方法为：

获取所述待训练的历史特征数据；

将所述待训练的历史特征数据按照设定时间间隔进行划分，得到多组历史特征数据集合；

采用斯皮尔曼公式计算所述待训练的历史特征数据中的PM2.5浓度与各剩余特征之间的相关性；所述剩余特征为所述待训练的历史特征数据中除PM2.5浓度之外的特征数据；

对所有的相关性进行分组，得到正相关序列和负相关序列；

将第i组历史特征数据集合中的正相关序列对应的特征数据集、负相关序列对应的特征数据集、PM2.5浓度集和第i-1组历史特征数据集合对应的PM2.5的预测浓度分别通过不同的输入门输入到长短期记忆网络模型中进行训练，并将训练好的长短期记忆网络模型确定为PM2.5浓度预测模型，所述PM2.5浓度集为同组历史特征数据集合中所有PM2.5浓度的集合。

可选的，所述PM2.5浓度预测模型具体为：

h_t＝tanh(C_t)*O_t，C_t＝C_t-1*f_t+L_t，其中，h_t为t时刻神经元的输出，tanh()为神经元状态使用的激活函数，C_t为t时刻神经元的状态，O_t为输出门，C_t-1为t-1时刻神经元的状态，f_t为遗忘门，L_t为t时刻的最后单元状态输入；

其中，W_f为遗忘门的权重矩阵，b_f为遗忘门的偏置，h_t-1为t-1时刻神经元的输出，/>为当前时刻输入的PM2.5浓度，W_o为输出门的权重矩阵，b_o是输出门的偏置；

L_t＝α_tI_t+α_ptI_pt+α_ntI_nt，其中，α_t为pm2.5浓度集的注意力权重，I_t为输入pm2.5浓度集时神经元的输入状态与输入pm2.5浓度集的输入门值的乘积，α_pt为正相关序列的注意力权重，I_pt为输入正相关序列时神经元的输入状态与输入正相关序列的输入门值的乘积，α_nt为负相关序列的注意力权重，I_nt为输入负相关序列时神经元的输入状态与输入负相关序列的输入门值的乘积；

其中，其中，/>为输入pm2.5浓度集时神经元的输入状态，/>输入正相关序列时神经元的输入状态，/>输入负相关序列时神经元的输入状态，it为输入pm2.5浓度集的输入门，ipt输入正相关序列的输入门，int为输入负相关序列的输入门，

其中，

其中，W_i为输入pm2.5浓度集的输入门的权重矩阵，为pm2.5浓度集，b_i是输入pm2.5浓度集的输入门的偏置，W_ip为输入正相关序列的输入门的权重矩阵，/>为正相关序列的特征数据集，b_ip是输入正相关序列的输入门的偏置，W_in为输入负相关序列的输入门的权重矩阵，b_in是输入负相关序列的输入门的偏置，/>为负相关序列的特征数据集；

其中，W_c为输入pm2.5浓度集时神经元的输入状态的权重矩阵，b_c是输入pm2.5浓度集时神经元的输入状态的偏置，W_cp为输入正相关序列的特征数据集时神经元的输入状态的权重矩阵，b_cp是输入正相关序列的特征数据集时神经元的输入状态的偏置，W_cn为输入负相关序列的特征数据集时神经元的输入状态的权重矩阵，b_cn是输入负相关序列的特征数据集时神经元的输入状态的偏置，

[α_t,α_pt,α_nt]＝Softmax([tanh(I_t ^TW_aC_t-1+b_a),tanh(I_pt ^TW_aC_t-1+b_ap),tanh(I_nt ^TW_aC_t-1+b_an)])

其中，I_t ^T为输入pm2.5浓度集时神经元的输入状态与输入pm2.5浓度集的输入门值的乘积的转置，I_pt ^T为输入正相关序列时神经元的输入状态与输入正相关序列的输入门值的乘积的转置，I_nt ^T为输入负相关序列时神经元的输入状态与输入负相关序列的输入门值的乘积的转置，W_a为输入门的参数矩阵，b_a为pm2.5浓度集的输入偏置，b_ap为正相关序列的输入偏置，b_an为负相关序列的输入偏置。

可选的，在所述采用斯皮尔曼公式计算所述待训练的历史特征数据中的PM2.5浓度与各剩余特征之间的相关性，具体包括：

计算所述待训练的历史特征数据中各所述历史特征数据集合中各特征的平均值，得到多个历史特征数据平均集合；所述历史特征数据平均集合包括PM2.5浓度平均值、PM10浓度平均值、NO₂浓度平均值、CO浓度平均值、O₃浓度平均值、SO₂浓度平均值、天气状况平均值、湿度平均值、温度平均值、降水量平均值、日照时数平均值、气压平均值、风速平均值和风向平均值；

将所述历史特征数据平均集合中的同种特征提取出来，构成PM2.5浓度平均值集合、PM10浓度平均值集合、NO₂浓度平均值集合、CO浓度平均值集合、O₃浓度平均值集合、SO₂浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合；

计算PM2.5浓度平均值集合分别与PM10浓度平均值集合、NO₂浓度平均值集合、CO浓度平均值集合、O₃浓度平均值集合、SO₂浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合之间的相关性。

一种PM2.5浓度预测系统，包括：

第一数据获取模块，用于获取待预测的历史特征数据；所述历史特征数据包括污染物历史浓度数据和气象资料历史数据；所述污染物历史浓度数据包括PM2.5浓度、PM10浓度、NO₂浓度、CO浓度、O₃浓度和SO₂浓度，所述气象资料历史数据包括天气状况、湿度、温度、降水量、日照时数、气压、风速和风向；

浓度预测模块，用于将所述待预测的历史特征数据输入PM2.5浓度预测模型得到PM2.5的预测浓度，所述PM2.5浓度预测模型为以待训练的历史特征数据为输入对包括多个输入门的长短期记忆网络模型进行训练得到的。

可选的，所述浓度预测模块包括：

第二数据获取单元，用于获取所述待训练的历史特征数据；

划分单元，用于将所述待训练的历史特征数据按照设定时间间隔进行划分，得到多组历史特征数据集合；

相关性计算单元，用于采用斯皮尔曼公式计算所述待训练的历史特征数据中的PM2.5浓度与各剩余特征之间的相关性；所述剩余特征为所述待训练的历史特征数据中除PM2.5浓度之外的特征数据；

分组单元，用于对所有的相关性进行分组，得到正相关序列和负相关序列；

训练单元，用于将第i组历史特征数据集合中的正相关序列对应的特征数据集、负相关序列对应的特征数据集、PM2.5浓度集和第i-1组历史特征数据集合对应的PM2.5的预测浓度分别通过不同的输入门输入到长短期记忆网络模型中进行训练，并将训练好的长短期记忆网络模型确定为PM2.5浓度预测模型，所述PM2.5浓度集为同组历史特征数据集合中所有PM2.5浓度的集合。

可选的，所述PM2.5浓度预测模型具体为：

其中，

可选的，所述相关性计算单元具体包括：

平均值计算子单元，用于计算所述待训练的历史特征数据中各所述历史特征数据集合中各特征的平均值，得到多个历史特征数据平均集合；所述历史特征数据平均集合包括PM2.5浓度平均值、PM10浓度平均值、NO₂浓度平均值、CO浓度平均值、O₃浓度平均值、SO₂浓度平均值、天气状况平均值、湿度平均值、温度平均值、降水量平均值、日照时数平均值、气压平均值、风速平均值和风向平均值；

平均值集合确定子单元，用于将所述历史特征数据平均集合中的同种特征提取出来，构成PM2.5浓度平均值集合、PM10浓度平均值集合、NO₂浓度平均值集合、CO浓度平均值集合、O₃浓度平均值集合、SO₂浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合；

相关性确定子单元，用于计算PM2.5浓度平均值集合分别与PM10浓度平均值集合、NO₂浓度平均值集合、CO浓度平均值集合、O₃浓度平均值集合、SO₂浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合之间的相关性。

根据本发明提供的具体实施例，本发明公开了以下技术效果：本发明通过使用多输入长短期记忆模型，实现从多维度单输入序列的模型结构到三维度多输入序列的模型结构的优化，使得PM2.5的浓度预测效率更快，结果更准确。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的PM2.5浓度预测方法的流程图；

图2为本发明实施例提供的PM2.5浓度预测系统的框图；

图3为本发明实施例提供的包括多个输入门的长短期记忆网络模型的结构示意图；

图4为本发明实施例提供的PM2.5浓度预测模型的结构示意图；

图5为本发明实施例提供的更具体的PM2.5浓度预测方法的流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

如图1所示，本实施例提供了一种PM2.5浓度预测方法，所述方法包括：

101：获取待预测的历史特征数据；所述历史特征数据包括污染物历史浓度数据和气象资料历史数据；所述污染物历史浓度数据包括PM2.5浓度、PM10浓度、NO₂浓度、CO浓度、O₃浓度和SO₂浓度，所述气象资料历史数据包括天气状况、湿度、温度、降水量、日照时数、气压、风速和风向。

102：将所述待预测的历史特征数据输入PM2.5浓度预测模型得到PM2.5的预测浓度，所述PM2.5浓度预测模型为以待训练的历史特征数据为输入对包括多个输入门的长短期记忆网络模型进行训练得到的。

在实际应用中，所述PM2.5浓度预测模型的确定方法为：

获取所述待训练的历史特征数据。

将所述待训练的历史特征数据按照设定时间间隔进行划分，得到多组历史特征数据集合。

采用斯皮尔曼公式计算所述待训练的历史特征数据中的PM2.5浓度与各剩余特征之间的相关性；所述剩余特征为所述待训练的历史特征数据中除PM2.5浓度之外的特征数据。

对所有的相关性进行分组，得到正相关序列和负相关序列。

在实际应用中，PM2.5浓度预测模型具体为：

h_t＝tanh(C_t)*O_t，C_t＝C_t-1*f_t+L_t，其中，h_t为t时刻神经元的输出，即PM2.5的预测浓度，tanh()为神经元状态使用的激活函数，C_t为t时刻神经元的状态，O_t为输出门，C_t-1为t-1时刻神经元的状态，f_t为遗忘门，L_t为t时刻的最后单元状态输入。

其中，W_f为遗忘门的权重矩阵，b_f为遗忘门的偏置，h_t-1为t-1时刻神经元的输出，/>为当前时刻输入的PM2.5浓度，W_o为输出门的权重矩阵，b_o是输出门的偏置。

其中，

其中，W_i为输入pm2.5浓度集的输入门的权重矩阵，为pm2.5浓度集，b_i是输入pm2.5浓度集的输入门的偏置，W_ip为输入正相关序列的输入门的权重矩阵，/>为正相关序列的特征数据集，b_ip是输入正相关序列的输入门的偏置，W_in为输入负相关序列的输入门的权重矩阵，b_in是输入负相关序列的输入门的偏置，/>为负相关序列的特征数据集。

在实际应用中，采用斯皮尔曼公式计算所述待训练的历史特征数据中的PM2.5浓度与各剩余特征之间的相关性，具体包括：

计算所述待训练的历史特征数据中各所述历史特征数据集合中各特征的平均值，得到多个历史特征数据平均集合；所述历史特征数据平均集合包括PM2.5浓度平均值、PM10浓度平均值、NO₂浓度平均值、CO浓度平均值、O₃浓度平均值、SO₂浓度平均值、天气状况平均值、湿度平均值、温度平均值、降水量平均值、日照时数平均值、气压平均值、风速平均值和风向平均值。

将所述历史特征数据平均集合中的同种特征提取出来，构成PM2.5浓度平均值集合、PM10浓度平均值集合、NO₂浓度平均值集合、CO浓度平均值集合、O₃浓度平均值集合、SO₂浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合。

对应上述方法，本实施例提供了一种PM2.5浓度预测系统，如图2所示，所述系统包括：

第一数据获取模块，用于获取待预测的历史特征数据；所述历史特征数据包括污染物历史浓度数据和气象资料历史数据；所述污染物历史浓度数据包括PM2.5浓度、PM10浓度、NO₂浓度、CO浓度、O₃浓度和SO₂浓度，所述气象资料历史数据包括天气状况、湿度、温度、降水量、日照时数、气压、风速和风向。

作为一种可选的实施方式，所述浓度预测模块包括：

第二数据获取单元，用于获取所述待训练的历史特征数据。

划分单元，用于将所述待训练的历史特征数据按照设定时间间隔进行划分，得到多组历史特征数据集合。

相关性计算单元，用于采用斯皮尔曼公式计算所述待训练的历史特征数据中的PM2.5浓度与各剩余特征之间的相关性；所述剩余特征为所述待训练的历史特征数据中除PM2.5浓度之外的特征数据。

分组单元，用于对所有的相关性进行分组，得到正相关序列和负相关序列。

所述PM2.5浓度预测模型可以为：

h_t＝tanh(C_t)*O_t，C_t＝C_t-1*f_t+L_t，其中，h_t为t时刻神经元的输出，tanh()为神经元状态使用的激活函数，C_t为t时刻神经元的状态，O_t为输出门，C_t-1为t-1时刻神经元的状态，f_t为遗忘门，L_t为t时刻的最后单元状态输入。

L_t＝α_tI_t+α_ptI_pt+α_ntI_nt，其中，α_t为pm2.5浓度集的注意力权重，I_t为输入pm2.5浓度集时神经元的输入状态与输入pm2.5浓度集的输入门值的乘积，α_pt为正相关序列的注意力权重，I_pt为输入正相关序列时神经元的输入状态与输入正相关序列的输入门值的乘积，α_nt为负相关序列的注意力权重，I_nt为输入负相关序列时神经元的输入状态与输入负相关序列的输入门值的乘积；。

其中，

作为一种可选的实施方式，所述相关性计算单元具体包括：

平均值计算子单元，用于计算所述待训练的历史特征数据中各所述历史特征数据集合中各特征的平均值，得到多个历史特征数据平均集合；所述历史特征数据平均集合包括PM2.5浓度平均值、PM10浓度平均值、NO₂浓度平均值、CO浓度平均值、O₃浓度平均值、SO₂浓度平均值、天气状况平均值、湿度平均值、温度平均值、降水量平均值、日照时数平均值、气压平均值、风速平均值和风向平均值。

平均值集合确定子单元，用于将所述历史特征数据平均集合中的同种特征提取出来，构成PM2.5浓度平均值集合、PM10浓度平均值集合、NO₂浓度平均值集合、CO浓度平均值集合、O₃浓度平均值集合、SO₂浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合。

如图5所示，本实施例又提供了一种更为具体的PM2.5浓度预测方法：

步骤1：获取空气污染物数据和气象资料数据，其中包括六种空气污染物即PM2.5、PM10、NO₂、CO、O₃、SO₂的历史浓度数据、气象资料历史数据(天气状况、湿度、温度、降水量、日照时数、气压、风速、风向)构造出特征总集合S。

步骤2：使用斯皮尔曼秩相关系数对特征总集合S进行分组，得到正负相关序列X：

先将数据(特征总集合S)按照固定的时间间隔分组，得到T组数据，其数据集为R^T ^×n，其中n为总特征的长度。

从T组数据中取出历史PM2.5浓度向量Y∈R^T，通过斯皮尔曼公式，计算历史PM2.5浓度向量Y∈R^T与其他向量的相关性，其中与PM2.5浓度成正相关关系大的一部分特征构成正相关序列X_p∈R^T×P，与PM2.5浓度成负相关关系大的一部分构成负相关序列X_N∈R^T×N，这里D＝N+P；P和N分别代表正相关序列的长度和负相关序列的长度，两部分构成正负相关影响因素集X∈R^T×D，这里D为正负相关因素的总长度。

使用斯皮尔曼秩来衡量不同因素之间的相关性，求出的值大小可以计算出其他因素与PM2.5浓度的相关性，公式如下：

/>

假设两个集合(因素)分别为A、B，它们的元素个数均为n，两个集合取的第i(1<＝i<＝n)个值分别用A_i、B_i表示。对A、B进行排序(同时为升序或降序)，得到两个元素排序集合a、b。将集合a、b中的元素对应顺序位置相减得到一个排行差分集合d，其中d_i＝a_i-b_i，1<＝i<＝n。其计算出的结果在-1到+1之间。

本发明中相当于每个特征历史数据集分别与PM2.5的历史浓度集进行运算，得出的数为最大的若干项和最小的若干项做正负相关因素序列。

对于每个序列Y∈R将经过相同的长短期记忆网络层

p＝1,2,3,...,P n＝1,2,3,...,N。

为了减少相关的输入数量提高效率，在相关性计算前还可以对提取的序列组内(即时间间隔内)每项特征求出平均值，这样一组向量可以平均成一个向量，

步骤3：对长短期记忆网络模型(Long Short-Term Memory，LSTM)进行改善，由多维单输入降为三维多输入处理，以便对其中正负相关序列进行学习，其三维输入就是正相关序列X_P、负相关序列X_N、以及历史PM2.5浓度向量Y。

1、首先把提取到的正负相关序列数据中的特征作为多输入长短期记忆网络模型的输入，此部分如果存在天气、风向这类无具体数值特征需要使用独热编码对特征处理后再作为输入。历史PM2.5浓度向量Y也作为长短期记忆网络模型的输入；从图3中可以看出，从左向右，三个输入分别对应历史PM2.5浓度向量、正相关序列、负相关序列。

2、长短期记忆网络模型处理的过程：

在原始长短期记忆网络模型的基础上，设计了多输入长短期记忆网络模型，以达到模型从高维度输入转化成为低维多输入的目的。把之前的总特征直接单输入转变成为多输入，本发明使用的是三维输入向量。

使用隐层单位大小为q的第一个长短期记忆网络层输入第一组正、负相关因素序列和PM2.5浓度序列，并且将初始的输出结果值设置为零向量h₀，一起输入模型进行计算得到输出h₁。之后每次的输入为当前的正、负相关序列和PM2.5浓度数据与上次一次输出结果进行的运算。

具体的：输入向量为通过斯皮尔满秩方法系数大小获得的输入向量正相关序列负相关序列/>历史PM2.5浓度序列Y_t和与模型上一次的输出结果h_t-1做运算，其中第一次输入的h₀设置为零向量。

长短期记忆网络模型的输入门发生改变，但是遗忘门和输出门保持不变。其中在遗忘门部分，通过查看h_t-1和Y_t的信息来输出一个0-1之间的向量，表示此部分决定信息保留多少，0表示都不保留，1表示都保留如式(1)。在输入门部分，通过分别和h_t-1来共同决定更新哪些信息如式(6)、式(7)和式(8)，在输出门部分，根据h_t-1和Y_t来决定更新哪些信息如式(2)。

多输入长短期记忆网络模型的结构如图3所示，从中可以看出，和/>的单元格输入是由自身和之前的隐藏状态h_t-1生成的，然而，它们对相应的输入门没有影响。与常规LSTM相比，多输入LSTM的遗忘门和输出门保持不变

式1)

式2)

这里h_t-1是上一次输出结果，p是隐层单元的数量，W_f，W_o∈R^p×(p+q)分别为遗忘门和输出门的权重矩阵。b_f，b_o∈R^P是对应的偏置，而遗忘门和输出门的输出为f_t,O_t∈R^P。

神经元状态使用的激活函数是tanh，其中是神经元的输入状态，W_c，W_cp，W_cn∈R^p×(p+q)是相关的权重矩阵，而b_c，b_cp，b_cn∈R^p则是三个输入的偏置。具体公式如式3)、式4)和式5)：

式3)

式4)

式5)

改进后的输入门的输入i_t，i_pt，i_nt∈R^p如下：

式6)

式7)

式8)

其中W_i，W_ip，W_in∈R^p×(p+q)是权重矩阵，而b_i，b_ip，b_in∈R^p分别是各式对应的偏差。

由模型可知时刻的最终单元格状态输入必须首先合并三个单元格的输入。为不同的单元输入分配注意权重。首先，我们将单元格输入与输入门相乘:

式9)

式10)

式11)

由于这些输入的影响不同，分别根据不同的因素使用加权求和的方式，如式12)所示：

式12)L_t＝α_tI_t+α_ptI_pt+α_ntI_nt

后面引入注意力机制，其中α_t，α_pt，α_nt∈R是注意力权重，而L_t∈R^p是t时刻的最后单元状态输入。注意力权重是由单元输入本身和单元的前一时间状态C_t-1来决定的：

式13)u_t＝tanh(I_t ^TW_aC_t-1+b_a)

式14)u_pt＝tanh(I_pt ^TW_aC_t-1+b_ap)

式15)u_nt＝tanh(I_nt ^TW_aC_t-1+b_an)

式16)[α_t，α_pt，α_nt]＝Softmax([u_t，u_pt，u_nt])

这里u_t，u_pt，u_nt∈R是注意力权重的中间量。C_t-1∈R^p是t-1时刻的状态，中间量使用矢量W_a∈R^p×p，b_a∈R来生成注意力权重通过Softmax逻辑回归层实现分类，多输入长短期记忆网络的后续部分与原始长短期记忆网络相同，如式17)和式18)所示：

式17)C_t＝C_t-1*f_t+L_t

式18)h_t＝tanh(C_t)*O_t

C_t，h_t∈R^p、是t时刻神经元的状态和输出。基于多输入LSTM神经元，能得到如图4所示的多输入模型。

3、对未来PM2.5进行预测；将历史空气质量数据和气象数据输入至如图2的模型结构，预测未来PM2.5浓度。

对使用独热编码处理的过程进行描述：

首先把提取到的正负相关序列数据中的每个特征进行独热编码，作为多输入长短期记忆网络模型的输入：

独热编码是一种将分类数据转换为二值化编码的常见操作。例如，月度索引数据有12个独特的分类值，通过使用独热编码，每个月度索引可以转化到到12维向量中如表1所示，(例如，三月给出为[0、0、1、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0])。具体来说，将这些辅助数据连接到一个长短期记忆网络输入特征向量中，从而为模型提供输入特征进行学习。

表1独热编码表

分类特征名	独热编码长度	例如
			小时	24	[0、0、0、1、……、0](4：00)
月份	12	[0、0、1、0、0、0、0、0、0、0、0、0](三月)
			天气	6	[0、1、0、0、0、0](多云)
周	7	[0、0、1、0、0、0、0](星期三)

如表2所示，本实施例中需要进行独热编码的有天气(晴、多云、阴、大雾、雪、小雨、中雨、大雨)和风向(东、南、西、北、东北、西北、东南、西南)。

表2天气和风向的独热编码表

分类特征名	独热编码长度	例如
			天气	8	[0、0、0、1、0、0、0、0](大雾)
风向	8	[0、0、1、0、0、0、0、0](西)

由于这些特征需要计算斯皮尔满秩大小确定相关性，在编码前按照其位置赋予一个对应值，再计算斯皮尔满秩。具体详见表3：

表3对天气和风向赋值的独热编码表

天气	晴、多云、阴、大雾、雪、小雨、中雨、大雨	[1、2、3、4、5、6、7、8]
			风向	东、南、西、北、东北、西北、东南、西南	[1、2、3、4、5、6、7、8]

普通长短期记忆网络模型在每个时间间隔内只接收一个输入向量，但是我们总是可以通过维度扩展将多个因素连接到一个输入。如果仅仅通过连接扩展输入维数，扩展维数可能会成为严重的干扰项而不是补充。因此，设计一个多输入的长短期记忆网络来适应多输入序列非常有意义，使用三维的输入为t时刻对应的输入向量，其中t＝1,2，…,T。

下面提供了本实施例在实际应用中的具体过程：

使用的数据为空气质量数据和气象数据。空气质量数据收集了日常空气污染数据和历史空气污染数据。每个空气污染物数据包括六种污染物的浓度：PM2.5、PM10、NO₂、CO、O₃和SO₂。如表4所示，气象资料包括天气(晴、多云、多云、大雾、雪、小雨、中雨、大雨)、湿度、温度、降水量、日照时数、气压、风速、风向。按照前面所给出的方法输入模型，用斯皮尔满秩方法找出影响因素最大的正向量序列和最小的负向量序列，再通过多输入长短期记忆网络系统进行学习并且引入注意力机制对相关性比较大的进行筛选，最后通过激活层函数激活，反复训练更新参数直至找出最优解，达到了提高预测方法的客观性、准确性以及运行效率的目的。

表4所使用数据字段

数据字段	数据单位
		天气	晴、多云、多云、大雾、雪、小雨、中雨、大雨
湿度	相对湿度(RH％)
		温度	摄氏度(℃)
降水量	毫米(mm)
		日照时数	小时(h)
气压	千帕(kpa)
		风速	公里每小时(km/h)
风向	方位

测试使用的是哈尔滨市2015年3月1日至2018年10月1日的空气数据和气象数据，其中80％数据作为训练集，剩下的数据用作测试集，并且在训练的过程中分别按照4比1的关系交叉测试。测试时本多输入长短期记忆网络系统的时间间隔T设置为15天，其中正相关序列和负相关序列长度相等，其具体数值从数组{4，6，8，10，16，20}中选择。

测试中构造出特征的总集合，特征的总集合一共有：AQI(空气质量指数)，六种空气污染物浓度(PM2.5、PM10、SO2、CO、NO2、O3)、平均气温、最高气温、最低气温、积温、降水、平均风速、最大风速、日照时数、平均地表温度、最高地表温度、最低地表温度、平均相对湿度、最高湿度、最低湿度、平均气压、最高气压、最低气压、蒸发量、日累计太阳辐射和露点温度。

上述的各种气象数据类型和空气污染物类型，根据设置好的时间间隔将历史数据进行分组，分别计算其它特征与PM2.5的斯皮尔满秩数值，得到正负相关序列。对正负相关序列进行独热编码，为了提高系统训练速度，对每组中的数据先求平均值再作为输入，第一次的输入为第一组正、负相关序列的第一组组内平均值和第一组历史PM2.5浓度值和h₀(此时为零向量)，本系统之后的输入分别正相关序列中每个特征的组内平均值、负相关序列中每个特征的组内平均值和PM2.5历史浓度序列中每个组内的平均值和上一次的输出结果h_t-1。训练完成之后保存模型进行测试。如表5所示，是选择不同的特征长度测试完成之后其准确率和绝对误差的平均值。

表5特征长度选择

长度	4	6	8	10	16	20
							平均准确率	94.7％	95.3％	97.3％	96.8％	96.1％	93.2％
平均绝对误差	19.5	19.1	16.5	15.7	18.7	22.4

本实施例中公开的PM2.5浓度预测方法及系统的数据是根据连续且相同时间间隔内空气中污染物浓度数据(六种污染物的浓度PM2.5、PM10、NO2、CO、O3和SO2)以及气象数据(天气、湿度、温度、降水量、日照时数、气压、风速、风向)来采样的。在预测浓度的过程中，不同的特征对PM2.5浓度的影响不同，如果输入所有数据特征会导致其特征维度太高，给预测带来额外的噪声并增加训练的复杂性。

因此，本发明先通过计算采集到的数据的斯皮尔曼秩相关系数，并将计算结果作为衡量不同因素与PM2.5浓度之间的相关性系数。

通过对计算结果的分析比对，将相关性较大系数的N个特征作为正相关影响序列、相关性较小系数的M个特征作为负相关影响序列来实现输入构建，从而减少输入特征维度，起到降噪的效果；为长短期记忆网络模型引入注意力筛选机制，通过对三个输入门中的数据赋予权重累加，来实现从多维度单输入序列的到三维度多输入序列的模型结构的优化，使得PM2.5的浓度预测效率更快、结果更准确。

本实施例的技术效果：

1、使用多输入长短期记忆神经网络预测大气中PM2.5浓度。测试结果表明，该方法比一般的长短期记忆网络具有更好的性能。PM2.5的形成、扩散和消化是非常复杂和非线性的。回归模型不能提取大气探测数据的深层特征。由于神经网络具有较强的学习能力和计算能力，并且能够对多变量、非线性等复杂问题进行建模，因此选择合适的神经网络模型对预测PM2.5的浓度至关重要。

2、通过多输入长短期记忆神经网络相结合，可以有效的对历史PM2.5浓度数据进行分析。排除掉因季节变化产生的误差，可以提高预测的准确性。

3、设计出三维度多输入长短期记忆网络系统的模型，输入的Y为PM2.5浓度历史数据，P，N则是通过斯皮尔满秩算出来对PM2.5浓度正相关性最大的因素集合和浓度负相关性最大的序列集合。将这些特征输入到设计好的模型中作为输入，其中输入数据第一次是PM2.5历史数据Y和计算出来的正、负相关序列P,N。

4、多输入长短期记忆网络模型第一步就是决定神经元状态需要丢弃的信息，这部分通过遗忘门单元的激活函数来处理。它通过查看h_t-1和x_t信息来输出一个0-1之间的向量，该向量里面的0-1值表示神经元状态C_t-1中哪些信息保留或丢弃多少。0表示不保留，1表示都保留。

5、此多输入长短期记忆网络模型第二步决定给神经元状态添加哪些新的信息。这一步分为两个步骤，首先，利用网络中上一次输出的结果和当前输入的PM2.5浓度数据通过输入门的操作来决定更新哪些信息。此处，通过3个输入还要经过一个注意力机制，对不同来源的结果赋值乘上不同的权重并且进行累加，从而得到相应的特征结果。然后用上一次的输出结果和本次的输入数据通过一个tanh激活层得到新的候选神经元信息C_t，这些信息可能会被更新到神经元信息中。

6、此多输入长短期记忆网络模型之后会更新之前的神经元信息，变成一个新的神经元信息。其中更新的规则就是通过遗忘门遗忘之前神经元的一部分信息，通过输入门添加候选神经元的信息，从的能够得到新的神经元信息。

7、多输入长短期记忆网络模型更新完神经元状态之后需要根据输入的上次一信息和输入的PM2.5历史数据来判断出神经元的哪些状态特征，这里需要将输入经过一个成为输入门的激活层得到判断条件，然后将神经元状态经过一个-1～1之间值的向量，该向量与输出门得到的判断条件相乘就得到最终的输出。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种PM2.5浓度预测方法，其特征在于，包括：

将所述待预测的历史特征数据输入PM2.5浓度预测模型得到PM2.5的预测浓度，所述PM2.5浓度预测模型为以待训练的历史特征数据为输入对包括多个输入门的长短期记忆网络模型进行训练得到的；

所述PM2.5浓度预测模型的确定方法为：

获取所述待训练的历史特征数据；

对所有的相关性进行分组，得到正相关序列和负相关序列；

将第i组历史特征数据集合中的正相关序列对应的特征数据集、负相关序列对应的特征数据集、PM2.5浓度集和第i-1组历史特征数据集合对应的PM2.5的预测浓度分别通过不同的输入门输入到长短期记忆网络模型中进行训练，并将训练好的长短期记忆网络模型确定为PM2.5浓度预测模型，所述PM2.5浓度集为同组历史特征数据集合中所有PM2.5浓度的集合；

所述PM2.5浓度预测模型具体为：

其中，W_f为遗忘门的权重矩阵，b_f为遗忘门的偏置，h_t-1为t-1时刻神经元的输出，/>为当前时刻输入的PM2.5浓度，W_o为输出门的权重矩阵，bo是输出门的偏置；

其中，

其中，W_i为输入PM2.5浓度集的输入门的权重矩阵，为PM2.5浓度集，b_i为输入PM2.5浓度集的输入门的偏置，W_ip为输入正相关序列的输入门的权重矩阵，/>为正相关序列的特征数据集，b_ip是输入正相关序列的输入门的偏置，W_in为输入负相关序列的输入门的权重矩阵，b_in是输入负相关序列的输入门的偏置，/>为负相关序列的特征数据集；

[αt,αpt,αnt]＝Softmax([tanh(It^TWaCt-1+ba),tanh(Ipt^TWaCt-₁+bap),tanh(Int^TWaCt-1+ban)])其中，I_t ^T为输入PM2.5浓度集时神经元的输入状态与输入PM2.5浓度集的输入门值的乘积的转置，I_pt ^T为输入正相关序列时神经元的输入状态与输入正相关序列的输入门值的乘积的转置，I_nt ^T为输入负相关序列时神经元的输入状态与输入负相关序列的输入门值的乘积的转置，W_a为输入门的参数矩阵，b_a为PM2.5浓度集的输入偏置，b_ap为正相关序列的输入偏置，b_an为负相关序列的输入偏置。

2.根据权利要求1所述的一种PM2.5浓度预测方法，其特征在于，在所述采用斯皮尔曼公式计算所述待训练的历史特征数据中的PM2.5浓度与各剩余特征之间的相关性，具体包括：

3.一种PM2.5浓度预测系统，其特征在于，包括：

浓度预测模块，用于将所述待预测的历史特征数据输入PM2.5浓度预测模型得到PM2.5的预测浓度，所述PM2.5浓度预测模型为以待训练的历史特征数据为输入对包括多个输入门的长短期记忆网络模型进行训练得到的；

所述浓度预测模块包括：

第二数据获取单元，用于获取所述待训练的历史特征数据；

训练单元，用于将第i组历史特征数据集合中的正相关序列对应的特征数据集、负相关序列对应的特征数据集、PM2.5浓度集和第i-1组历史特征数据集合对应的PM2.5的预测浓度分别通过不同的输入门输入到长短期记忆网络模型中进行训练，并将训练好的长短期记忆网络模型确定为PM2.5浓度预测模型，所述PM2.5浓度集为同组历史特征数据集合中所有PM2.5浓度的集合；

所述PM2.5浓度预测模型具体为：

其中，其中，/>为输入PM2.5浓度集时神经元的输入状态，/>输入正相关序列时神经元的输入状态，/>输入负相关序列时神经元的输入状态，i_t为输入PM2.5浓度集的输入门，i_pt输入正相关序列的输入门，i_nt为输入负相关序列的输入门，

其中，

[αt,αpt,αnt]＝Softmax([tanh(It^TWaCt-₁+ba),tanh(Ipt^TWaCt-₁+bap),tanh(Int^TWaCt-₁+ban)])其中，I_t ^T为输入PM2.5浓度集时神经元的输入状态与输入PM2.5浓度集的输入门值的乘积的转置，I_pt ^T为输入正相关序列时神经元的输入状态与输入正相关序列的输入门值的乘积的转置，I_nt ^T为输入负相关序列时神经元的输入状态与输入负相关序列的输入门值的乘积的转置，W_a为输入门的参数矩阵，b_a为PM2.5浓度集的输入偏置，b_ap为正相关序列的输入偏置，b_an为负相关序列的输入偏置。

4.根据权利要求3所述的一种PM2.5浓度预测系统，其特征在于，所述相关性计算单元具体包括：

相关性确定子单元，用于计算PM2.5浓度平均值集合分别与PM10浓度平均值集合、NO2浓度平均值集合、CO浓度平均值集合、O3浓度平均值集合、SO2浓度平均值集合、天气状况平均值集合、湿度平均值集合、温度平均值集合、降水量平均值集合、日照时数平均值集合、气压平均值集合、风速平均值集合和风向平均值集合之间的相关性。