CN114912707B

CN114912707B - 一种基于多模态融合的空气质量预测系统及预测方法

Info

Publication number: CN114912707B
Application number: CN202210619414.7A
Authority: CN
Inventors: 梅嘉容; 王煜炜; 刘敏; 刘庆祥; 付艳波; 王元卓; 陈文治
Original assignee: China Science And Technology Big Data Research Institute; Zhengzhou University
Current assignee: China Science And Technology Big Data Research Institute; Zhengzhou University
Priority date: 2022-06-01
Filing date: 2022-06-01
Publication date: 2023-06-30
Anticipated expiration: 2042-06-01
Also published as: CN114912707A

Abstract

本发明属于空气质量监测及预测技术领域，具体涉及一种基于多模态融合的空气质量预测系统及预测方法。该方法利用无人机‑监测站形成的空地模型，把无人机拍摄到的监测区域的图片信息通过无线通信传输给地面的监测站，地面监测站通过基于多模态融合的空气质量预测模型，输入本地收集的时间序列以及传输得到的无人机拍摄图片以及外部因素，最后得到模型的输出即预测结果。该方法可以使同一地区空中与地面的信息充分融合得到更加精确的预测结果，不仅解决了地面检测站由于数据量不足产生的模型精度问题，还充分利用无人机形成了空‑地3D全方位监测，实现空气质量指数的三维细粒度监测与预测，更好的实现空气质量监测及预测。

Description

一种基于多模态融合的空气质量预测系统及预测方法

技术领域

本发明属于空气质量监测及预测技术领域，具体涉及一种基于多模态融合的空气质量预测系统及预测方法。

背景技术

根据世界卫生组织的报告，每年有450万人因室外空气污染而过早死亡，空气污染增加了人类患严重疾病的概率，如呼吸系统和心血管疾病。为了量化空气污染的严重程度，通过空气中各种颗粒物(如PM2.5和PM10)的浓度来计算一个名为空气质量指数(AQI)的指标，在空气质量指数的帮助下，人类可以提前采取保护措施。因此，实现准确和及时的AQI监测和预测，找到有效的空气污染控制方法，对人类来说非常重要。

现有的AQI监测方法主要分为两类：基于传感器的监测和基于视觉的监测。其中，基于传感器的监测方法通常利用公共或私人机构在城市中的专门地点设立的传感器监测站来实现AQI监测。然而，由于两个监测站之间距离较远，这些方法只能提供粗粒度的二维监测，且存在成本高和缺乏流动性的问题。而基于视觉的监测方法一般用航拍图像推断整个区域内的空气质量指数，但是受限于飞行器的飞行距离以及一次性工作时长，往往不能持续工作来提供训练出精确的神经网络模型所需的大量的拍摄数据。现有研究没有从根本上实现空中与地面空气质量预测的完全结合。

发明内容

针对现有方法无法从根本上实现空中与地面空气质量预测完全结合的缺陷和问题，本发明提供一种基于多模态融合的空气质量预测系统及预测方法。

本发明解决其技术问题所采用的方案是：提供一种基于多模态融合的空气质量预测系统，该系统包括嵌入模块、LSTM模块、CNN模块和组合模块，其中嵌入模块用于捕捉学习影响空气质量的外部分类特征，将外部分类特征数据从源空间映射到目标空间并进行结构保留；所述LSTM模块用于监测站空气质量数据时间相关性的学习，并对空气质量数据进行处理后通过LSTM模型输出空气质量特征向量；所述CNN模块用于提取雾霾图像中的特征编码，通过CNN模型输出雾霾特征；所述组合模块用于将嵌入模块、LSTM模块和CNN模块得到的输出值进行归一化后使用加权和进行组合计算得到空气质量预测结果。

本发明还提供一种基于多模态融合的空气质量预测方法，该方法包括以下步骤：

步骤一、通过嵌入模块学习外部分类特征，利用one-hot编码表示外部分类特征，将one-hot编码向量作为全连接层的输入，然后用反向传播算法计算全连接层中每条边的权重，然后由全连接层输出层输出将外部分类数据从源空间映射到目标空间并进行结构保留：

式中：

表示嵌入模块输出值；/>

代表分类特征集合，i，/>

是这个集合中的分类特征；V_i表示i类嵌入特征；<V_i,V_j>是两个嵌入向量V_i和V_j的内积；ω_i,j代表内积值的权重；ω_i是嵌入向量的权重；

步骤二、将空气质量数据进行预处理，然后通过LSTM模块进行时间相关性学习，通过LSTM模型得到LSTM数据输出值；

式中：

为LSTM模块输出值；W_hy为当前隐藏状态信息的权重；h_t为t时刻的隐藏状态的信息；b_h为偏差值；

步骤三、将无人机采集的雾霾图像通过CNN模型进行处理得到雾霾图像特征图；所述CNN模型架构包括特征提取层、多个卷积层和全局平均汇集层，其中特征提取层提取雾霾图像中与雾霾估计相关的特征得到一个特征张量，将提取的特征编码作为卷积层的输入进行卷积运算，最后经全局平均汇集层输出特征张量，

式中：

表示CNN模块的输出向量；c为特征图；

步骤四、将嵌入模块、LSTM模块和CNN模块的输出值进行归一化后使用加权和作为隐藏特征进行组合，送入整流线性单元，输出空气质量预测结果，

式中：Y是预测值；W是上述模块的联合权重，b是偏置项。

上述的基于多模态融合的空气质量预测方法，步骤一中所述外部分类特征包括天气特征、POI数据和路网数据，其中天气特征数据包括温度、湿度、风速和风向；对于POI数据，将收集到的POI数据重新进行类别划分，计算出1kmaPOI特征内所有站点的每个类别中的POI数量作为特征向量。

上述的基于多模态融合的空气质量预测方法，步骤二中所述预处理包括以下内容：

(1)缺失值处理：遍历数据，找到缺失的数据，记录缺失值上一个数据和下一个数据，使用上下数据的平均值填充改缺失数据；

(2)异常值处理：对于影响空气质量的一个特征因素的所有数据首先按照从小到大的顺序排序，找数据中的下四分位数、中位数和上四分位数，按照上界和下界的计算公式得到数据上界和下界；然后再次遍历该特征的所有数据，将每个数据与上界和下界对比，如果当前值比下界小，则使用下界替换该值；如果当前值大于上界，则使用上界替换该值；将该特征的所有数据都进行异常值处理后，选择下一个特征的数据继续，直到所有的特征都处理完成；

(3)标准化处理：通过标准化公式将样本数据进行转换使所有的数据值处于[0,1]区间内，

其中，x′是经过Min-Max标准化转换函数处理后的结果，x是总体样本数据，x_max是样本数据中的最大值，而x_min是样本数据中的最小值。

上述的基于多模态融合的空气质量预测方法，对于进行标准化处理的模型输入数据，模型的输出结果需要通过转换函数的反函数进行逆运算处理，

x＝(x_max-x_min)*x′+x_min。

上述的基于多模态融合的空气质量预测方法，步骤二中LSTM步骤包括以下内容：

(1)决定要从cell state中选出需要丢弃的信息，然后由LSTM内部结构的“遗忘门进行信息丢弃，

f_t＝σ(W_f·[h_t-1,x_t]+b_f)

对前一时刻的输出h_t-1和当前时刻的输入x_t进行检查，sigmoid激活函数对上一时刻的单元格状态C_t-1进行筛选，输出一个[0,1]之间的数字来决定信息保留与否；

(2)由LSTM的“输入门”在cell状态选出存储信息，

i_t＝σ(W_i·[h_t-1,x_t]+b_i)

(3)将上一时刻的单元格状态C_t-1进行更新，

h_t＝o_t*tanh(C_t)

将C_t-1与“遗忘门”的输出f_t相乘得到希望忘记的部分，再加上“输入门”的输出i_t和

的乘积，得到新的单元格状态C_t；

(4)确定神经网络的输出，

其中

是LSTM模块输出值，W_hy是当前隐藏状态信息的权重，b_h是偏差值。

上述的基于多模态融合的空气质量预测方法，步骤三中使用CNN模型学习无人机图像特征，通过提取雾霾图像的特征编码提高模型的性能，包括以下内容：

(1)将无人机相机采集的雾霾图像转换为灰度图像，然后用Otsu法将其转换为二进制图像；

(2)从二进制图像中提取具有雾霾估计的特征，包括暗通道先验、蓝色通道、图像平滑度、深度图、RMS和图像熵；

(3)利用CNN模型学习提取出的与雾霾估计相关的特征，具体是：首先将每个输入的雾霾图像在空间上进行像素调整，将提取的与雾霾相关的特征归一化为灰度[0,1]；然后将与雾霾相关特征之外的像素被归一化为零均值得到一个特征张量，随后经过CNN模型的特征提取层、几个卷积层和一个全局平均池层输出CNN模型输出值。

本发明的有益效果：本发明基于深度学习预测模型，提出了一种融合了图片、时间序列等多个模态数据的空气质量预测方法，该方法考虑了导致空气质量变化的多种因素，通过一个空-地部署框架结合无人机在空中不同角度拍摄的图片信息以及地面监测站收集的时间序列，通过一个多模态的融合模型使同一地区空中与地面的信息充分融合得到更加精确的预测结果，不仅解决了地面检测站由于数据量不足产生的模型精度问题，还充分利用无人机形成了空-地3D全方位监测，实现空气质量指数的三维细粒度监测与预测，更好的实现空气质量监测及预测。

附图说明

图1为本发明空-地质量预测框架图。

图2为本发明多模态融合预测模型图。

图3为本发明网格卷积图。

具体实施方式

本发明提出了一种充分利用空中航拍所得图像特征的多模态融合的空-地空气质量预测模型及预测方法，其中预测模型由一个嵌入模块、一个卷积神经网络(CNN)模块、一个长短期记忆(LSTM)模块以及一个组合模块组成，组合模块将三个模型进行融合得到更加精确的预测结果，不仅解决了地面检测站由于数据量不足产生的模型精度问题，并且充分利用无人机形成了空-地3D全方位监测。下面结合附图和实施例对本发明进一步说明。

实施例1：本实施例提供一种基于多模态融合的空气质量预测系统，该系统包括嵌入模块、LSTM模块、CNN模块和组合模块，其中嵌入模块用于捕捉学习影响空气质量的外部分类特征，将外部分类特征数据从源空间映射到目标空间并进行结构保留；所述LSTM模块用于监测站空气质量数据时间相关性的学习，并对空气质量数据进行处理后通过LSTM模型输出空气质量特征向量；所述CNN模块用于提取雾霾图像中的特征编码，通过CNN模型输出雾霾特征图；所述组合模块用于将嵌入模块、LSTM模块和CNN模块得到的输出值进行归一化后组合计算得到空气质量预测结果。

实施例2：本实施例提供一种基于多模态融合的空气质量预测方法，该方法包括以下步骤：

步骤一、通过嵌入模块学习外部分类特征，外部分类特征包括天气特征、POI特征和路网数据，其中天气特征数据包括温度、湿度、风速和风向；对于POI数据，将收集到的POI数据重新进行类别划分，计算出1kmaPOI特征内所有站点的每个类别中的POI数量作为特征向量。

利用one-hot编码表示外部分类特征，将one-hot编码向量作为全连接层的输入，然后用反向传播算法计算全连接层中每条边的权重，然后由全连接层输出层输出将外部分类数据从源空间映射到目标空间并进行结构保留：

式中：

表示嵌入模块输出值；/>

代表分类特征集合，i，/>

是这个集合中的分类特征；V_i表示i类嵌入特征；<V_i,V_j>是两个嵌入向量V_i和V_j的内积；ω_i,j代表内积值的权重；ω_i是嵌入向量的权重。

步骤二、将空气质量数据进行预处理，其中预处理包括以下内容：

(2)异常值处理：对于影响空气质量的一个特征因素的所有数据首先按照从小到大的顺序排序，找数据中的下四分位数、中位数和上四分位数，按照上界和下界的计算公式得到数据上界和下界；

然后再次遍历该特征的所有数据，将每个数据与上界和下界对比，如果当前值比下界小，则使用下界替换该值；如果当前值大于上界，则使用上界替换该值；将该特征的所有数据都进行异常值处理后，选择下一个特征的数据继续，直到所有的特征都处理完成；

标准化处理是神经网络模型建模时非常重要的一个环节，标准化后可以加快模型的收敛，缩短模型训练时间。但是如果模型的输入数据经过标准化处理，那么模型的输出结果也需要经过转换公式逆运算处理。转换函数的逆运算即转换函数的反函数，其公式如下所示：

x＝(x_max-x_min)*x′+x_min。

然后通过LSTM模块进行时间相关性学习，通过LSTM模型得到LSTM数据输出值；

式中：

为LSTM模块输出值；W_hy为当前隐藏状态信息的权重；h_t为t时刻的隐藏状态的信息；b_h为偏差值。

式中：

表示CNN模块的输出向量；c为特征图；

式中：Y是预测值，

和/>

分别代表嵌入模块、CNN模块和LSTM模块的输出特征，W是联合权重，b是偏置项。

实施例3、本实施例以具体案例为例，并结合具体附图对本发明的基于多模态融合的空气质量预测方法进行进一步的详细说明。

如图1的空-地空气质量预测框架所示，空中选择大疆公司的MAVIC 2ZOOM无人机作为空中传感设备，这些无人机的最大行程是每次18公里，最大遥控距离是8公里，其可以利用GPS传感器来提供实时的三维位置监测，并使用4K相机来收集雾霾图像数据；MAVIC2ZOOM无人机的最大电池寿命约为30分钟，可以悬停在空中，以270°的视角收集数据，还可以通过无线网络与地面通信，最大通信距离为7～9Km。

在北京某地区收集了5298张雾霾图像形成图像数据集用于空气质量指数的估计，将图像数据集按照8:2的比例随机分为训练集和测试集。

地面则利用来自于政府设立的地面监测站的AQI历史观测数据。

具体包括以下内容。

1、外部特征学习

输入嵌入模块，它学习外部分类特征，如天气特征、地理特性和高程。外部分类特征如下所示：

(1)天气特征

本实施例使用了全球数据同化系统(GDAS)、美国国家环境预报中心(NCEP)全球预报系统(GFS)3提供的2格网天气资料。该系统是一个将来自监测站、卫星和雷达的多源观测与物理大气模式相结合的数据同化产品。栅格数据的空间分辨率为0.25°，有117个栅格覆盖北京地区。

本实施例选取的气象数据属性包括温度、湿度、风度和风向按风速和风向进行分解。

然后再以同样的方式提取历史天气数据和天气预报数据。

对于基于网格的气象数据，首先选择站点周围的k×k个网格，这些网格比最近的网格具有更好的空间覆盖性；

然后用卷积层学习k×k网格不同天气属性的核，将卷积结果作为该站的气象资料；如图3基于网格的天气数据的卷积实例。将3×3个不同权值的网格相乘，得到目标站的气象数据特征，并学习核函数中的权值。

(2)POI数据

在工厂多的地区，由于排放污染物，空气质量往往很差，而在公园周围的地区，空气更新鲜。POI能够捕捉这些地理特征。从Amap及其APIs4收集了北京的细粒度兴趣点数据，合并了一些相似的类别，将POI数据重新划分为12个类别，如下表1所示。

表1 POI分类表

标号	POI分类
		1	车辆服务(加油站、修车点)
2	交通站点
		3	工厂
4	装饰和家具市场
		5	餐厅和饮料点
6	商场和超市
		7	体育场
8	公园
		9	文化和教育
10	娱乐
		11	公司
12	酒店和房地产

提取描述的12个POI类别，并计算1kma POI特征内所有站点的每个类别中的POI数量作为特征向量。

(3)路网数据

从OpenStreetMap5收集北京的道路网数据。路网数据包括37个道路类别，但很多类别都有路口，所以合并了一些相似的类别，将路网数据重新划分为5类，如下表2所示。

表2路网道路分类表

对于这些分类特征，首先利用one-hot编码来表示分类特征，

然后，将one-hot编码向量作为全连接层的输入；

然后，用反向传播算法来计算全连接层中每条边的权重，经全连接层组成的输出层输出。

从而将数据从源空间映射到目标空间，并进行结构保留

式中：

表示嵌入模块输出值；/>

代表分类特征集合，i，/>

2、时间相关性学习

由于空气质量数据为时间序列数据，而LSTM具有保持历史数据的长期记忆的特点，因此在环境监测中，可以用来捕捉收集到的时间序列之间的时间相关性。本实施例以2021年前6个月的AQI历史观测数据来评估本方法，具体是选择前五个月的空气质量数据作为训练数据集，第六个月的数据作为测试数据集；由于空气质量数据是时间序列数据，需要使用它们在前一个时间区间，即x_t-1，x_t-2，...，x_t-r，来预测时间区间t的空气质量，其中r是历史数据窗口的长度，可以设置窗口的长度，以确定最好的模型性能。对空气质量数据进行预处理，预处理分别包括：缺失值处理、异常值处理、标准化处理。具体的：

(1)缺失值处理

对数据中的缺失值进行处理，查看数据发现缺失数据量较小，可以直接使用上下平均值填充。遍历数据，找到缺失的数据，记录缺失值上一个数据和下一个数据，使用上下数据的平均值填充改缺失数据。

(2)异常值处理

对影响空气质量的其中一个特征因素的数据进行异常值处理，对该特征的所有数据按照从小到大的顺序排序，找数据中的下四分位数、中位数和上四分位数，按照上界和下界的计算公式得到数据上界和下界；然后再次遍历该特征的所有数据，将每个数据与上界和下界对比，如果当前值比下界小，则使用下界替换该值；如果当前值大于上界，则使用上界替换该值。该特征的所有数据都进行异常值处理后，选择下一个特征的数据继续，直到所有的特征都处理完成。

(3)标准化处理

本实施例用Min-Max标准化进行举例，通过标准化公式将样本数据进行转换，使所有的数据值处于[0,1]区间内，其中转换函数如公式所示：

其中，x′是经过Min-Max标准化转换函数处理后的结果，x是总体样本数据，x_max是样本数据中的最大值，而x_min是样本数据中的最小值。标准化处理是神经网络模型建模时非常重要的一个环节，标准化后可以加快模型的收敛，缩短模型训练时间。但是如果模型的输入数据经过标准化处理，那么模型的输出结果也需要经过转换公式逆运算处理。转换函数的逆运算即转换函数的反函数，其公式如下所示：

x＝(x_max-x_min)*x′+x_min

LSTM步骤：

①决定要从cell state中丢弃哪些不需要的信息，决定信息丢弃的是由LSTM内部结构的“遗忘门”完成，其公式如下所示：

f_t＝σ(W_f·[h_t-1,x_t]+b_f)

对前一时刻的输出h_t-1和当前时刻的输入x_t进行检查，sigmoid激活函数会对上一时刻的单元格状态C_t-1进行筛选，输出一个[0,1]之间的数字来决定信息保留与否。

②决定在“cell状态”中存储什么信息。这部分由LSTM的“输入门”完成，其公式如下所示：

i_t＝σ(W_i·[h_t-1,x_t]+b_i)

③将上一时刻的单元格状态C_t-1进行更新，其公式如下所示：

h_t=o_t*tanh(C_t)

将C_t-1与“遗忘门”的输出f_t相乘，是希望忘记的部分，再加上“输入门”的输出i_t和

的乘积，得到新的单元格状态C_t。

④确定神经网络的输出，由于本发明LSTM模型在最后的组合模块进行组合，因此输出为：

式中：

3、无人机图像特征学习

使用CNN模型学习无人机图像特征。CNN模型架构包括特征提取层、几个卷积层、全局平均汇集层。特征提取层提取雾霾图像中与雾霾估计相关的特征，从而得到一个特征张量，提取的特征被编码卷积层的输入，卷积层来执行卷积运算，最后，全局平均池化层汇集特征张量输出。该方法通过使用特征编码而不是整个霾图像作为输入，可以提高模型的性能。具体包括以下内容：

(1)将无人机相机采集的雾霾图像转换为灰度图像，然后用Otsu法进一步将其转换为二值图像；

(2)从二进制图像中提取具有雾霾估计的特征：为了通过使用CNN模型实现从雾霾二元图像到AQI预测，需要在雾霾图像中找到与雾霾估计最相关的统计特征：暗通道先验、蓝色通道(RGB->HSV色调、饱和度、色度)、图像平滑度、深度图、RMS(对比度)和图像熵。

(3)利用CNN模型学习提取出的与雾霾估计相关的特征，包括以下步骤：

首先，将每个输入的雾霾图像在空间上调整为128×128像素，将提取的六个与雾霾相关的特征归一化为灰度[0,1]；

其次，将六个雾霾相关特征之外的像素被归一化为零均值，从而得到一个大小为128×128×6的特征张量；

经过CNN模型的特征提取层、几个卷积层和一个全局平均池层，模型输出如下：

式中：

表示CNN模块的输出向量；c是特征图，其作为最大池化的输入。

4、组合

将嵌入模块和深度学习模块归一化后使用加权和作为隐藏特征进行组合，特征被串联后送入整流线性单元；将嵌入模块、CNN模块和LSTM模块的输出的加权和放在一起，同时优化生成的参数，然后通过反向传播提升权重，输出预测结果：

式中：Y是预测值，

和/>

分别代表嵌入模块、CNN模块和LSTM模块的输出特征，W是上述模块的联合权重，b是偏置项。