CN110633871B

CN110633871B - 一种基于卷积长短期记忆网络的区域交通需求预测方法

Info

Publication number: CN110633871B
Application number: CN201910913527.6A
Authority: CN
Inventors: 魏金泽; 尹宝才; 申彦明; 齐恒
Original assignee: Dalian University of Technology
Current assignee: Dalian University of Technology
Priority date: 2019-09-25
Filing date: 2019-09-25
Publication date: 2022-09-16
Anticipated expiration: 2039-09-25
Also published as: CN110633871A

Abstract

本发明涉及一种基于卷积长短期记忆网络的区域交通需求预测方法，属于计算机数据分析领域。本发明提出一个融合多任务的框架。对于交通流预测问题，添加多任务学习层。通过底层参数共享，同时完成多个预测目标，提高泛化能力。传统交通需求预测方法只处理单一预测任务，没有考虑到多个相关的任务能够并行的特点。本发明引入多任务学习的想法，将多个任务整合在模型的最顶层同时进行训练，代替分别训练每个任务。加入多任务层能够充分利用网络中的共享权重，提供更好的预测结果。

Description

一种基于卷积长短期记忆网络的区域交通需求预测方法

技术领域

本发明涉及计算机数据分析领域，尤其涉及基于深度学习的获取特定时间空间信息的方法。

背景技术

区域交通需求预测对于城市车辆管理十分重要，它能够帮助交通管理平台更好地完成车辆的空间调度，并减少乘客的等待时间。区域交通需求的预测需要考虑时间、空间及天气节假日等因素，因此具有挑战性。区域交通需求一般基于历史时间序列数据，通过数学算法预测特定位置交通需求，如利用时间序列熵计算、马尔科夫链模拟、分配平衡、泊松分布等算法。深度学习方法在区域交通需求预测领域也得到广泛应用，如使用长短期记忆网络(LSTM)进行长期需求预测，以及采用堆叠自编码器进行预测等。然而，以往的工作存在以下方面的问题：对数据中的时间或空间依赖性利用不足、没有考虑到天气，节假日等外部特征、需求变化较快时预测结果误差较大等。因此，一种能够提取数据时空特性，并融合外部特征的区域交通需求预测方法是当前待攻克的技术难关，也是本发明的发明动机。接下来详细介绍这一领域中相关的背景技术。

(1)时间序列预测

时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。时间序列数据的变动存在着规律性与不规律性。时序变量随着时间进展或自变量变化,呈现一种比较缓慢而长期的持续上升、下降、停留的同性质变动趋向，呈现出趋势性；并且由于外部影响，序列数值出现高峰低谷交替的周期性规律；除个别数值为随机变动外，整体序列呈统计规律。

时间序列预测就是利用统计技术与方法，从预测指标的时间序列中找出演变模式，建立数学模型，对预测指标的未来发展趋势做出定量估计。自回归移动平均模型(ARMA)是时间序列预测的经典模型。自回归过程(Auto Regression)通过自身前面部分的数据与后面部分的数据之间的相关关系(自相关)来建立回归方程，从而可以进行预测或者分析。移动平均过程(Moving Average)可以解决随机变动问题，即噪声问题。

另外，深度学习方法也被应用于时间序列预测问题。循环神经网络(RecurrentNeural Network)能够处理序列类型数据。长短期记忆网络(Long Short Term Memory)是一种特殊的循环神经网络，可以学习长期依赖的信息。长短期记忆网络包含一种“门”结构，能够去除或增加信息到细胞状态，以实现时序预测。根据长短期记忆网络的特点，本发明将引入该网络模块，根据已有的交通需求历史数据预测未来一定时段内的区域交通需求。

(2)时间空间预测

2014年，Huang等人提出一个两层的深度学习结构进行交通流的预测。方法中第一层是一个深度信念网络(Deep Belief Network,DBN)，顶部是一个多任务回归层。但该方法并没有考虑时间依赖关系。在交通预测领域，需要考虑时空依赖关系。利用不同地理位置之间的空间依赖性，能够有效提高区域交通需求预测精度。郑宇团队于2016年提出流量预测方法Deep-ST。该方法对目标区域进行网格划分。根据时间序列的趋势性、周期性及邻近性特点，分别以长期间隔数据、短时周期性数据以及邻近时刻数据作为网络输入，通过卷积神经网络获取目标区域内部空间依赖特性。该团队于2017年提出ST-ResNet，该方法在Deep-ST基础上引入残差思想，增加网络深度提升预测精度。Shi等人于2015年提出Conv-LSTM网络，将CNN与LSTM融合到一个网络结构中进行降雨量预测，其预测性能超过全连接LSTM方法。区域交通需求的预测十分具有挑战性，因为它与许多潜在信息相关。本发明同样基于时空预测思想进行扩展，提取时间空间依赖性，并加入外部影响因素，进一步提升模型预测性能。

(3)多任务学习

多任务学习是机器学习中一种非常先进的技术。其目标是利用多个学习任务中所包含的有用信息来帮助每个学习任务得到更为准确的学习器。我们假设所有任务(至少其中一部分任务)是相关的，在此基础上，我们在实验和理论上都发现，联合学习多个任务能比单独学习它们得到更好的性能。多任务学习可以看作是让机器模仿人类学习行为的一种方法，因为人类常常将一个任务的知识迁移到另一个相关的任务上。与人类学习类似，(机器)同时学习多个学习任务是很有用的，因为一个任务可以利用另一个相关任务的知识。本发明引入多任务学习思想，添加多任务学习层，利用网络中的共享权重提供更好的预测结果。

发明内容

本发明为了解决传统交通需求预测方法预测效率不高以及时空相关性、外部影响因素利用不充分的技术难题，设计了一个基于Conv-LSTM网络架构的交通需求预测方法，能够提取交通需求数据的时间空间依赖关系，融合天气等外部因素对交通需求的影响，并且对多个任务进行整合训练，完成对城市目标地区的交通需求预测。

本发明的技术方案：

一种基于卷积长短期记忆网络的区域交通需求预测方法，步骤如下：

S1交通需求数据预处理

S1.1数据筛选：交通订单数据包含上下车时间、地点及行车GPS轨迹；根据预测目标，从交通订单数据中提取上车时间及地理位置数据；

S1.2数据清洗：对于提取后的数据，清洗其中的缺失值、异常值及错误纪录；

S2交通需求数据时间空间划分

S2.1根据预测目标，以T分钟为间隔，统计交通需求量，统计得到的数据记为X；

S2.2对于需要预测的t时刻，从S2.1所统计的交通需求量数据中，分别获取其对应邻近性、周期性和趋势性数据。邻近性数据为X中的[X_t-lc，…，X_t-1]，其中l_c表示时间戳个数。周期性数据为X中的[X_t-lp·p，X_t-(lp-1)·p，…，X_t-p]，其中l_p表示时间戳个数，p表示1天。趋势性数据为X中的[X_t-ls·s，X_t-(ls-1)·s，…，X_t-s]，其中l_s表示时间戳个数，s表示1周；

S2.3根据经纬度，将城市区位划分为I*J个网格，统计每个网格内部交通需求量；

S3外部数据处理

S3.1天气数据：对不同天气指标进行编码，映射为不同数值；所述的天气指标包括空气质量、天气类型；

S3.2时间特性：对行车时刻所在的时间特征进行编码，映射为不同数值；所述的时间特征包括工作日、节假日；

S4区域交通需求模型构建

S4.1区域交通需求模型的结构

区域交通需求模型包括卷积长短期记忆网络模块、外部特征模块和多任务学习模块；

S4.1.1卷积长短期记忆网络模块(简称Conv-LSTM)包括三部分，每部分均由CNN与LSTM相结合得到，分别形成邻近性、周期性、趋势性通道；

S4.1.2外部特征模块包括两个全连接层，用于将输入的外部特征映射到与输出相同的维度；

S4.1.3多任务学习模块包括一个共享隐藏层，通过共享隐藏层，对于不同的交通需求预测任务，能够同时分别保留各任务的输出层的方式，实现多任务学习；

S4.2区域交通需求模型的数据处理

S4.2.1交通需求量处理：将步骤S2.2得到的邻近性、周期性、趋势性数据分别输入到卷积长短期记忆网络模块的三个通道中。三个通道对输入输入数据的处理方式相同，将卷积操作融入门控值及细胞状态的求解中，得到输出结果。

主要公式如下：

其中，*代表卷积操作，W_xi、W_xf、W_xc、W_xo、W_hi、W_hf、W_hc、W_ho代表卷积核，°代表哈达玛积，W_ci、W_cf、W_co代表网络参数矩阵，b_i、b_f、b_c、b_o代表偏执系数矩阵。对于第t个时刻，X_t代表输入张量，i_t代表LSTM输入门控张量，o_t代表LSTM输出门控张量，f_t代表遗忘门控张量，C_t代表细胞状态张量，H_t代表输出张量。通过T次迭代，每个长短期记忆记忆网络通道可以把一个输入的张量序列X＝(X₁,X₂,…,X_T)映射为对应的输出序列。对于t时刻，邻近性、周期性、趋势性通道的输出分别为X_tc，X_tp，X_ts；

S4.2.2外部特征处理

将S3得到的编码后的外部特征数据，输入到外部特征模块，通过两层特征映射过程，将特征维度映射到与S4.2.1中得到的X_tc，X_tp，X_ts相同的维度。其输出表示为X_ext；

S4.2.3输出结果融合

对输出结果的融合包括早期融合和后期融；

早期融合是基于参数矩阵的方法，对邻近性、周期性、趋势性三个部分输出的数据进行融合，融合方式如下：

其中，°代表哈达玛积，W_c,W_p,W_s表示为三个模块分配的不同权重；

后期融合是将邻近性、周期性、趋势性三个部分的输出和外部特征模块的输出进行融合，最后在第t个时刻时间段的融合后的输出表示为：

X_t＝tanh(X_tres+X_ext) (3)

其中，tanh为双曲正切函数，保证输出的值在-1到1之间；

S4.2.4融合后的输出结果X_t输入多任务学习模块。数据X_t经过共享隐层映射后，再分别经过每个独立任务的输出层进行特征映射，得到对应任务的预测结果；

S5基于区域交通需求模型进行预测与性能评估

S5.1将处理后的数据输入到待训练的交通需求预测模型中，根据预测误差进行梯度反向传播，经过参数调节，得到所需的交通需求预测模型；

S5.2基于训练得到的交通需求预测模型，输入处理后的数据，得到各区域交通需求量的预测结果；

S5.3基于S5.2得到的预测结果，利用均方误差MSE作为衡量指标，评估模型预测效果。

本发明的有益效果：

(1)卷积长短期记忆网络(Conv-LSTM)提取时空相关性

与传统的交通需求预测方法不同，本发明将Conv-LSTM用于区域交通需求预测过程，通过学习时空相关性来提高预测精度。传统交通需求预测方法多着重于时序预测问题，而忽略了不同地理位置之间的交通需求量存在相互影响。而近年来提出的基于时空关系预测区域交通需求的方法，对长期时间依赖性利用不足，只能进行短期预测。本发明在提取数据内部长期时间依赖关系的同时，利用卷积神经网络的特征提取能力，捕获数据不同位置间的空间相关性。因此Conv-LSTM结构能够学习到复杂的时空特性，其预测性能优于全连接LSTM。

(2)多任务同时学习

本发明的有益效果：与传统交通需求的单个任务预测相比，本发明提出一个融合多任务的框架。对于交通流预测问题，添加多任务学习层。通过底层参数共享，同时完成多个预测目标，提高泛化能力。传统交通需求预测方法只处理单一预测任务，没有考虑到多个相关的任务能够并行的特点。本发明引入多任务学习的想法，将多个任务整合在模型的最顶层同时进行训练，代替分别训练每个任务。加入多任务层能够充分利用网络中的共享权重，提供更好的预测结果。

附图说明

图1为网络架构图。图中外部特征为时间步t所对应的外部特征。输入历史数据并通过Conv-LSTM模块提取时空相关性，并与外部特征相融合，对4个交通需求任务进行同步预测。

图2为单任务与多任务预测结果对比图。加入多任务回归层后，模型泛化性能得到提高，多任务情况下4个预测任务的预测误差均小于各任务单独预测。

具体实施方式

下面结合具体实施方式对本发明作进一步详细说明，但本发明并不局限于具体实施方式。

一种基于卷积长短期记忆网络的区域交通需求预测方法，包括网络模型的训练以及交通需求预测部分。

(1)训练集和测试集：

我们使用纽约的出租车数据集(TaxiNY)评估我们提出的网络模型的性能。在纽约有两种出租车，分别为黄色出租车和绿色出租车。黄色出租车主要在曼哈顿区搭载乘客，绿色出租车的营运地点主要在郊区。数据集包含2009年1月到2016年6月黄色出租车和绿色出租车的GPS轨迹。每条轨迹都包含上车地点和时间。我们使用的是2015年1月到2015年6月的黄色出租车的打车数据，包含6000万条数据。我们选择最后一周的数据作为测试数据，那之前的数据作为训练数据。取样的时间间隔为5分钟，在我们的方法中，我们根据经纬度将城市的某块区域均匀地划分成10×10的网格，每个网格代表一块区域。所有网格内的交通需求定义为矩D_t，本发明可实现在给定历史观测值{D_s|s＝0，…，s＝t-1}的条件下，预测区域交通需求D_t。

对于外部影响因素，我们定义了是否为工作日、每日时段以及天气状况三种外部变量。定义系数w_t，系数值为0表示当前时间戳在工作日内，值为1表示时间戳属于周末；定义系数v_t，系数值为0、1、2分别表示当前时间戳位于一天中的00：00-07：00、07：00-17：00、17：00-24：00三个时段内；定义系数sc_t以及wt_t，分别用于表示阴晴程度及雨雪等天气状况。

(2)网络结构：

本发明提出一个创新的深度学习框架去捕捉影响区域交通预测结果的时空因素以及其他环境因素。

本发明使用的网络框架由邻近性模块，周期性模块，趋势性模块和外部变量模块四个模块构成。因为在一个时间戳内区域交通需求量是一个2维矩阵，因此应用转换函数

将输入的2维矩阵转为类似于图片的单通道3维张量。根据时间的性质，不同时间戳的数据被选择输入到网络中去模拟邻近性,周期性和趋势性。前三个模块共享相同的卷积LSTM网络结构。这样的网络结构能够捕捉到时间和空间的依赖关系。在环境模块，我们首先获得t时刻的原始数据例如天气状况，工作日，然后把原始数据转换为二进制向量，最后将数据输入到一个两层的全连接网络中。前三个模块的输出经过早期融合为X_res,然后X_res和外部模块的输出X_ext融合。因为随着时间的推移，区域交通请求是一个多任务的问题，不同的时间点对应不同的问题，因此将融合结果输入到多任务学习层进行结果预测。

①卷积长短期记忆网络(Convolutional LSTM，简称Conv-LSTM)：Conv-LSTM组合了CNN和LSTM，因此Conv-LSTM网络能够提取时间信息和空间信息，并且Conv-LSTM在降雨量预测上已经取得了非常好的效果。Conv-LSTM的核心思想是将所有的输入，细胞状态，隐状态和不同的门控值转化为3D张量。Conv-LSTM的主要公式如下：

其中，*代表卷积操作，°代表哈达玛积。输入张量,隐状态张量,细胞状态张量,输入门控张量,输出门控张量和遗忘门控张量分别表示为X_t，H_t，C_t，i_t，o_t，f_t∈R^M×N×L，M，N表示网格的行数和列数。

通过T次迭代，每个Conv-LSTM层可以把一个输入的张量序列X＝(X₁,X₂,…,X_T)映射为隐藏的状态序列H＝(H₁,H₂,…,H_t)。本发明中，每个Conv-LSTM单元可以表示成一个函数F:R^T×M×N×L→R^{T×M×N×L′},其中T代表时间序列长度，M和N表示网格的行数和列数，L代表通道数。我们通过堆叠多个Conv-LSTM单元构成一个深度Conv-LSTM网络。

Conv-LSTM对于不同数据具有可扩展性。非欧几里得形式的图数据(Graph Data)同样被应用于描述路网中的交通量。对于图结构数据输入，可采用图卷积(GCN)方法代替2D卷积，捕捉路网中节点之间的空间相关性，使得Conv-LSTM能够应用于图结构数据的时空预测。

②输入时间序列：

根据调研，时间序列一般具有下列三种性质：1)邻近性；2)周期性；3)趋势性。基于上述性质，我们从给定的历史记录中获得邻近、短期和长期时间戳的记录去模拟邻近性,周期性,趋势性三种性质。首先，邻近性部分被表示为[X_t-lc，…，X_t-1]，l_c代表时间戳的数量。周期性和趋势性部分被表示为[X_t-lp·p，X_t-(lp-1)·p，…，X_t-p]和[X_t-ls·s，X_t-(ls-1)·s，…，X_t-s]，其中p表示1天，s表示1周。将三组数据放入不同的模块，每个模块都由堆叠的Conv-LSTM层构成，其中L_d代表卷积层的数量，每个模块的输出分别表示为：

其中F代表Conv-LSTM操作，f表示relu激活函数，f(z)＝max(0,z)，X_tc，X_tp，X_ts分别为邻近性、周期性、趋势性模块的输出。

③输入外部特征：

区域交通请求数量受到许多复杂的外部因素的影响，例如，天气和时间。我们发现在一天之中，交通需求量大的主要有两个时间段，即7：00-17：00和下午19：00-24：00，其中7：00-17：00时段内交通需求较为常规，而19：00-24：00这个时间段属于下班时间，交通请求达到一个峰值。对于一周内的交通需求而言，工作日和周末的需求量区别很大。异常天气对交通需求同样具有很大影响，例如大雨的出现，会大幅提高交通需求量。因此，我们定义E_t表示在预测的时间戳t时的外部变量，我们主要考虑是否为工作日、每日时段,阴晴程度和天气状态。然而，预测的时段t的天气未知，因此我们用t-1时间段的天气代替t时段的天气。外部模块主要由两个全连接层构成，全连接层的作用是将输入由低维空间映射到高维空间使输出的形状和X_t相同，输出表示为X_ext。

④输出结果融合：

根据融合的先后顺序，我们的模型分为早期融合和后期融。早期融合时基于参数矩阵的方法对邻近性，周期性，趋势性三个模块进行融合，融合方式如下：

其中，°代表哈达玛积，W_c,W_p,W_s表示为三个模块分配的不同权重。

后期融合是将三个模块的输出和外部模块的输出进行融合，最后在t_th时间段的融合后的输出表示为：

X_t＝tanh(X_tres+X_ext) (4)

其中,tanh为双曲正切函数，保证输出的值在-1到1之间。

⑤多任务学习层：

多任务学习是基于共享表示，把多个任务放在一起学习的机器学习方法。多任务学习涉及多个相关的任务同时并行学习，梯度同时反向传播，多个任务通过底层的共享表示来互相帮助学习，提高泛化性能。随着时间的推移，未来交通状况的预测是一个多任务的问题，同理区域交通请求也是一个多任务预测问题，在不同的时间点对应不同的任务。在我们的深度学习结构中，我们把相关的多任务预测放在顶部的回归层。这些任务一起训练并通过后向传播调节参数，因此每个任务会得到一个好的结果。我们选择均方误差作为损失函数。

1、训练网络模型

本发明使用纽约出租车数据集(TaxiNY)进行网络模型的训练，具体为2015年01月至2015年06月黄色出租车数据。选择最后一周数据作为测试数据用以评估模型性能。数据取样时间间隔为5分钟，区域划分网格大小为10×10。按照图1来搭建网络模型。其中卷积长短期记忆网络Conv-LSTM1的卷积核尺寸为3×3，卷积核数量为64；卷积长短期记忆网络Conv-LSTM2的卷积核尺寸为3×3，卷积核数量为1。三个独立时间序列长度l_c、l_p、l_s分别取值为15、5、5。使用Min-Max方法对数据进行规范化处理，规范化后数据取值范围为(-1，1)。对于外部特征，使用One-hot编码转化为二进制向量。本发明预测未来5分钟、15分钟、30分钟和60分钟的交通需求作为4个不同输出任务。对于模型输出，选择tanh函数作为激活函数。依照反向传播的方法用梯度下降优化器迭代更新网络参数，直到迭代次数满足要求，完成网络的训练。

2、区域交通需求预测

对于一个待预测目标区域，将网络模块所需长度的历史交通时间序列观测值及外部特征序列输入网络模块，通过提出的卷积长短期记忆网络框架，得到未来5分钟、15分钟、30分钟及60分钟后的交通需求预测值。

Claims

1.一种基于卷积长短期记忆网络的区域交通需求预测方法，其特征在于，步骤如下：

S1交通需求数据预处理

S2交通需求数据时间空间划分

S2.2对于需要预测的t时刻，从S2.1所统计的交通需求量数据中，分别获取其对应邻近性、周期性和趋势性数据；邻近性数据为X中的[X_t-lc，…，X_t-1]，其中l_c表示时间戳个数；周期性数据为X中的[X_t-lp·p，X_t-(lp-1)·p，…，X_t-p]，其中l_p表示时间戳个数，p表示1天；趋势性数据为X中的[X_t-ls·s，X_t-(ls-1)·s，…，X_t-s]，其中l_s表示时间戳个数，s表示1周；

S3外部数据处理

S4区域交通需求模型构建

S4.1区域交通需求模型的结构

S4.1.1卷积长短期记忆网络模块包括三部分，每部分均由CNN与LSTM相结合得到，分别形成邻近性、周期性、趋势性通道；

S4.2区域交通需求模型的数据处理

S4.2.1交通需求量处理：将步骤S2.2得到的邻近性、周期性、趋势性数据分别输入到卷积长短期记忆网络模块的三个通道中；三个通道对输入数据的处理方式相同，将卷积操作融入门控值及细胞状态的求解中，得到输出结果；主要公式如下：

其中，*代表卷积操作，W_xi、W_xf、W_xc、W_xo、W_hi、W_hf、W_hc、W_ho代表卷积核，

代表哈达玛积，W_ci、W_cf、W_co代表网络参数矩阵，b_i、b_f、b_c、b_o代表偏执系数矩阵；对于第t个时刻，X_t代表输入张量，i_t代表LSTM输入门控张量，o_t代表LSTM输出门控张量，f_t代表遗忘门控张量，C_t代表细胞状态张量，H_t代表输出张量；通过T次迭代，每个长短期记忆网络通道可以把一个输入的张量序列X＝(X₁,X₂,…,X_T)映射为对应的输出序列；对于t时刻，邻近性、周期性、趋势性通道的输出分别为X_tc，X_tp，X_ts；

S4.2.2外部特征处理

将S3得到的编码后的外部特征数据，输入到外部特征模块，通过两层特征映射过程，将特征维度映射到与S4.2.1中得到的X_tc，X_tp，X_ts相同的维度；其输出表示为X_ext；

S4.2.3输出结果融合

对输出结果的融合包括早期融合和后期融；

其中，

代表哈达玛积，W_c,W_p,W_s表示为三个模块分配的不同权重；

X_t＝tanh(X_tres+X_ext) (3)

其中，tanh为双曲正切函数，保证输出的值在-1到1之间；

S4.2.4融合后的输出结果X_t输入多任务学习模块；数据X_t经过共享隐层映射后，再分别经过每个独立任务的输出层进行特征映射，得到对应任务的预测结果；

S5基于区域交通需求模型进行预测与性能评估