CN109299401B

CN109299401B - 基于混合深度学习模型LSTM-ResNet的城域时空流预测方法

Info

Publication number: CN109299401B
Application number: CN201810762264.9A
Authority: CN
Inventors: 韩勇; 任沂斌; 陈戈; 王程; 周林; 王舒康
Original assignee: Ocean University of China
Current assignee: Ocean University of China
Priority date: 2018-07-12
Filing date: 2018-07-12
Publication date: 2022-02-08
Anticipated expiration: 2038-07-12
Also published as: CN109299401A

Abstract

本发明涉及一种基于混合深度学习模型LSTM‑ResNet的城域时空流预测方法。准确预测城市时空数据流的变化可为城市管理提供重要参考，这其中的关键是有效提取数据中的时空依赖特征。当前，已被应用到时空流预测的卷积神经网络侧重空间关联特征的提取，忽略了时间维度的依赖关系和时空关联特征。深度学习模型中，长短记忆网络(LSTM)适用于时间序列的动态建模，残差卷积网络(ResNet)适用于大范围空间关联特征提取。因此，我们融合LSTM和ResNet，构建时空流预测混合深度学习模型：利用LSTM考虑前后时间依赖，滤掉无效时间特征；将LSTM的输出输入到ResNet中，提取时空关联特征。该模型能够自动、准确地捕获时空关联特征，特别是考虑前后依赖的情况下保留有效时间特征。

Description

基于混合深度学习模型LSTM-ResNet的城域时空流预测方法

技术领域

本发明属于地理信息技术领域，具体涉及一种对城市规模的时空数据流预测方法。

背景技术

在我们的日常生活中，人们通过多种行为活动(如驾驶、骑车、步行等)与城市空间进行时空交互。近年来，由于传感器技术和互联网的快速进步，这些活动所产生的大量移动数据都可以被记录下来。通常情况下,一个典型的移动数据集由一组对象(如人、私家车或公交车)和他们在空间和时间上的轨迹构成,蕴含了丰富的时空信息。通过对这些移动数据集按时间和空间维度进行汇总统计，可以得到时空流数据，通常包括两种基本类型：输入流和输出流。对于给定空间单元，一定时间间隔内，从其他空间单元进入该空间单元的对象数量称为该空间单元的输入流。类似，从该空间单元出发进入其他空间单元的对象数量称为输出流。以输入流和输出流为基础，可计算得到其他类型时空流如总流量和净流量等。

显然，时空流数据定量地反映了移动对象的时空分布特征，可为城市管理提供重要的参考：如果能够对城市中的时空流分布做出准确地预测，就可以对交通拥堵、人流拥挤等城市问题做出针对性预案，从而改善城市安全、提升管理水平。因此，时空数据流预测是近几十年来的研究热点，具有重要意义。

目前，时空流预测模型总体可分为三类：统计学方法、机器学习方法和深度学习方法。统计模型和机器学习模型属于传统方法，人们需要从原始数据中提取有效的特征输入预测模型，称为特征工程。大数据时代，数据量的爆炸性增长使得传统预测算法的特征工程变得异常复杂，严重制约了大数据优势的发挥。深度学习的出现使得构建可接受原始数据输入的“端到端”模型成为可能，大大减少了特征工程的复杂度。因此，有学者将深度学习方法引入到时空流预测中，主要包括基于长短记忆网络(LSTM)和卷积神经网络(CNN)的预测方法。

(1)长短时记忆网络(LSTM)：LSTM是一种特殊的循环神经网络。对于序列中的每一个元素，它将当前步骤的输出输入到下一个步骤的输入层并循环进行这个过程。当前步骤的输出依赖于当前的输入和之前层提取到的特征，使得序列的依赖关系可以被捕获到。给定一个数据序列作为输入和一个输出目标，序列中与输出目标存在依赖关系的信息会被LSTM记住。

(2)卷积神经网络(CNN)：CNN专门设计用来提取网格数据的空间依赖关系。卷积单元通过卷积核与上一层和卷积核对应的输入进行局部连接。设X_i,j是输入数组第i列和第j行上的值，假设卷积核是以X_i,j为中心、有2M+1列和2N+1行的一个2维张量，那么相应的输出Y_i,j可通过(1)式计算，其中“*”为卷积算子，空间邻域(2M+1列，2N+1行)与中心单元的空开依赖关系可以被捕获。通过叠加多个CNN层可以检测到从近到远的空间特征。

残差网络(ResNet)能有效增加CNN的深度，从而扩大空间特征的提取范围。因此，ResNet也被应用到城市范围的时空流预测中，并取得了比传统CNN更好的效果。

目前，基于LSTM的时空流预测模型侧重于提取时空流数据中的时间特征，而基于ResNet的预测模型侧重于空间特征的提取。虽然时空残差网络(ST-ResNet)一定程度上同步考虑了时间和空间特征，然而，其忽略了时空单元在时间维度上的前后依赖关系，从而影响了时空特征捕获的准确性。因此，开发一种新型融合LSTM和CNN的混合深度学习预测模型，实现对时空特征的一体化提取对城域时空流的预测是很有必要的。

发明内容

本发明的技术效果能够克服上述缺陷，提供一种基于混合深度学习模型LSTM-ResNet的城域时空流预测方法。此方法将LSTM与ResNet集成，以更准确地捕捉时空特征，用于城域时空流预测。首先，利用LSTM考虑时间维度的前后依赖关系滤除无效的时间特征，然后，将LSTM保留的时空特征输入到多层ResNet模型中，以提取时空相关性。LSTM记忆的特征包含与预测目标相关的时间特征以及全部的空间特征。这些记忆的时间特征考虑了输入序列的在时间上前后依赖关系。因此，新模型能够自动、准确地捕获空间和时间特征，特别是基于时间维的前后依赖关系提取时间特征，从而提高时空特征的捕获精度。

为实现上述目的，本发明采用如下技术方案，具体步骤为：

(1)构造多模式输入数据集。根据人们活动的时空规律，将输入时空数据分为邻近时间模式、天周期模式和周周期模型，分别构造输入序列，用于不同模式的时空特征提取；

(2)无效时间特征滤除。将三种模式的输入数据集分别输入到三个相同结构的LSTM模型中，利用LSTM考虑前后依赖关系滤除无效的时间特征，保留有效的时间特征和空间特征，得到三个候选特征图；

(3)时空特征提取。将三个候选特征图分别输入到三个相同结构的ResNet模型中，利用ResNet的卷积操作提取时空相关特征，得到三个时空特征图；

(4)将三个时空特征图进行加权融合，形成一个总时空特征图，并进一步与天气、时间、节假日等外部因素融合，形成预测结果；

(5)计算损失，根据损失值反向传播优化整个模型，直至完成模型训练。

本发明的有益效果在于：基于混合深度学习模型LSTM-ResNet的城域时空流预测方法能够比现有的基于深度学习的时空流预测模型更准确地捕捉时空特征，从而获得更好的预测结果。

附图说明

图1基于混合深度学习模型LSTM-ResNet的城域时空流预测方法流程图。

具体实施方式

本发明的基于混合深度学习模型LSTM-ResNet的城域时空流预测方法(如图1所示)，包括以下步骤：

(1)将输入数据集处理为三种形式:以小时、日和周模式为间隔的时空流系列。假设预测目标的时间间隔为t_th，一天的时间间隔总数为m，时间缓冲区的半径为b，第i个时间间隔的时空流动数据为三维张量为X_i。输入数据

和

分别为：

(2)LSTM模型从输入的时空流序列中滤除无效时间特征。将原始时空流序列送入多层LSTM模型，通过

对数据进行变换，最终得到候选特征图C^O×M×N(O代表LSTM层的神经元的数量，M×N代表网格地图)；

(3)使用一个卷积层CNN₁，将候选特征映射转换为ResNet模型的输入。变换可记为式：

C^K×M×N＝F_conv(C^O×M×N,K)

F_conv表示卷积运算,C^K×M×N表示输入ResNet模型，C^O×M×N表示最后一次输出，O为隐藏层个数，M和N分别代表网格边长；

(4)利用多层ResNet模型对候选特征图进行分层卷积捕捉数据的时空特性。将上一步的变换输入到多层ResNet模型中进行卷积运算而不进行子采样和池化，使输出网格的维数与原始输入网格的维数相同。通过ST^K×M×N＝F_resnet(C^K×M×N)对数据进行变换得到候选特征图ST^K×M×N；

(5)将上一步ResNet的输出转换为时空特征图。将数据利用式

转换为(2,M,N)格式的张量；

(6)将以上步骤从STCM_H、STCM_D和STCM_W三个模式中得到的时空特征图进行融合。建立与时空特征图相同形状的三个参数矩阵：W_H、W_D和W_W。利用

对数据进行合并，同时融合气象、时间、假日等外部因素。使用tanh作为激活函数最终形成预测结果；

(7)计算损失，根据损失值反向传播优化整个模型，直至完成模型训练。

Claims

1.基于混合深度学习模型LSTM-ResNet的城域时空流预测方法，其特征在于，具体包括以下基本步骤：

步骤(1)将输入数据集进行预处理，将输入数据集处理为三种形式：以小时、日和周模式为间隔的时空流序列；

步骤(2)将时空流序列送入多层LSTM模型，利用LSTM模型从输入的时空流序列中获取时间相关性，使LSTM记住有效的时间和空间特征，形成候选特征图；

步骤(3)将候选特征映射到ResNet的输入，ResNet单元的短路连接要求输入元素和输出元素具有相同的张量形状，使用卷积层CNN₁对步骤(2)中结果进行处理，使其可以作为ResNet的输入；

步骤(4)将步骤(3)中的结果作为ResNet的输入，输入到多层ResNet模型当中进行变换，并利用ResNet捕捉时空特性；

步骤(5)将ResNet的输出转换为带有时空特征的地图，使用卷积层CNN₂将ResNet的输出转换为(2,M,N)格式的张量，使这个张量包括LSTM和ResNet共同捕捉的特征；

步骤(6)将上述步骤所得结果进行特征融合，通过之前步骤，将会得到以小时、天和周为时间间隔的时空数据流，可以从中获取时空特征图，将这些图以基于矩阵的方法进行合并，将合并后的数据与外部因素进行融合并用tanh作为激活函数，得到预测值；

步骤(7)计算损失函数值，并进行反向传播，将预测值与真实值进行比较，得到损失函数值，并进行反向传播不断减小损失函数值。

2.根据权利要求1所述的基于混合深度学习模型LSTM-ResNet的城域时空流预测方法，其特征在于，所述步骤(1)中，假设预测目标的时间间隔为t_th，一天的时间间隔总数为m，时间缓冲区的半径为b，第i个时间间隔的时空数据流为三维张量为X_i，输入数据

和

分别为：

3.根据权利要求1所述的基于混合深度学习模型LSTM-ResNet的城域时空流预测方法，其特征在于，所述步骤(2)中，将时空流序列送入多层LSTM模型，将最后一层的输出作为候选特征图返回，候选映射包含有效的时间依赖关系和空间特征，这样，使LSTM模型从输入的时空流序列中获取时间相关性，记住有效的时间和空间特征。

4.根据权利要求1所述的基于混合深度学习模型LSTM-ResNet的城域时空流预测方法，其特征在于，所述步骤(3)中，由于ResNet单元的短路连接要求输入元素和输出元素具有相同的张量形状，而对于第二个CNN层的输出元素，其形状由CNN层中卷积核数K决定，利用卷积层CNN₁及式C^K×M×N＝F_conv(C^O×M×N,K)进行变换，将候选特征映射转换为ResNet模型的输入，这里F_conv表示卷积运算，C^K×M×N表示ResNet模型的输入。

5.根据权利要求1所述的基于混合深度学习模型LSTM-ResNet的城域时空流预测方法，其特征在于，所述步骤(4)中，将步骤(3)变换后的候选特征图输入到一个多层ResNet模型中，为使输出网格的维数与原始输入网格的维数相同，这里只进行卷积运算，不进行子采样和池化，通过ResNet模型捕捉研究区域的时空特性。

6.根据权利要求1所述的基于混合深度学习模型LSTM-ResNet的城域时空流预测方法，其特征在于，所述步骤(5)中，使用ResNet后，所得结果为ST^K×M×N，由于张量预测目标的形状(2,M,N)，因此使用卷积层CNN₂将ResNet的输出变换成形状为(2,M,N)的张量，这个张量包含ResNet和LSTM捕捉到的时空特征。

7.根据权利要求1所述的基于混合深度学习模型LSTM-ResNet的城域时空流预测方法，其特征在于，所述步骤(6)中，将上述步骤所得到的从以小时、天和周为时间间隔的时空数据流中获取的时空特征图以基于参数矩阵的方法进行合并，创建与时空特征图具有相同形状的三个参数矩阵：W_H、W_D和W_W，合并结果为三种时空特征图与其权重乘积的累加，将合并结果与外部因素进行融合并使用tanh作为激活函数，得到预测值。

8.根据权利要求1所述的基于混合深度学习模型LSTM-ResNet的城域时空流预测方法，其特征在于，所述步骤(7)中，将预测值与真实值进行比较，得到损失函数值，损失函数值为预测值与真实值差值平方累加的均值，对神经网络进行反向传播不断减小损失函数值。