CN111598325A

CN111598325A - 基于层次聚类和分层注意力机制的交通速度预测方法

Info

Publication number: CN111598325A
Application number: CN202010393385.8A
Authority: CN
Inventors: 刘端阳; 徐鑫博; 唐龙峰; 范鑫烨; 陈雪; 沈国江
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2020-05-11
Filing date: 2020-05-11
Publication date: 2020-08-28

Abstract

基于层次聚类和分层注意力机制的交通速度预测方法，首先采用层次聚类方法将历史交通速度数据进行划分和聚类；然后，设计基于分层注意力机制的神经网络模型，该模型充分考虑了交通速度数据的时空关联性，有效利用分层注意力机制来捕捉时空特征，并对不同路段和不同历史时间段赋予不同的影响权重。最后，选择合适的簇数据来训练和测试神经网络模型，训练好的模型可以预测目标路段未来若干个时间段的平均交通速度。本发明方法采用了层次聚类方法对历史数据进行了划分和聚类，簇内数据具有较高相似度，更适合于神经网络模型的训练；同时，采用了分层注意力机制来设计神经网络模型，有效地捕捉了交通速度数据的时空特性，更好地提高了预测准确性。

Description

基于层次聚类和分层注意力机制的交通速度预测方法

技术领域

本发明涉及智能交通的交通速度预测，可以预测未来若干个时间段的路段平均速度，交通速度预测可以用于路径规划，也可以用于交通控制、交通诱导和交通管理。

背景技术

随着交通环境的日益复杂、道路交通车流量的急剧增加，城市道路交通拥堵问题愈加严重。在智能交通系统(Intelligent Transportation System，ITS)中，交通速度预测具有重要意义，如果能有效地预测未来一段时间内各个路段的交通速度，便可以提前进行有效的交通管控，能大大缓解甚至避免交通拥堵。在智能交通系统中，交通速度是描述交通流的基本参数，交通速度预测是指预测未来一段时间内通过某条路段的平均速度。交通速度预测方法的研究，不仅有利于旅行者进行路径规划，也有利于交通管理者进行交通信号控制、交通诱导和交通管理。

常用的交通速度预测方法主要有自回归差分移动平均模型(AutoregressiveIntegrated Moving Average Model,ARIMA)、卡尔曼滤波、贝叶斯模型(Bayesian)、支持向量机(Support Vector Machine,SVM)等。这些方法虽然易于实现，操作简单，但没有充分利用交通流的周期性和时序性，受数据扰动影响较大。

近些年，深度学习的迅速发展为交通速度预测提供了更多有效的方法。循环神经网络(Recurrent Neural Network,RNN)具有更优的序列数据处理能力，可以对交通速度的时间依赖性进行分析，获得较优的预测精度。卷积神经网络(Convolutional NeuralNetwork,CNN)和RNN综合使用，可以在考虑时序特性的同时，实现利用CNN来提取交通流的空间特性。另外，深度信念网络(Deep Belief Network,DBN)也在短时交通流预测中取得了不错的效果。虽然现有的深度学习方法在算法效率与预测精度上有所提高，但由于没有考虑历史数据对当前时间段的影响，这些基于深度学习的交通速度预测方法仍具有一定的局限性。交通速度预测作为序列预测任务，历史数据中不同时间段的速度对未来时间段的预测具有不同的影响效果，然而各种深度学习模型并未挖掘这种内在的特征，从而在一定程度上影响了预测精度。

目前，现有的交通速度预测方法主要存在以下问题：1)常用的各种预测方法，如ARIMA模型、卡尔曼滤波、贝叶斯模型和支持向量机等，没有充分利用交通流的周期性和时序性，受数据扰动影响较大，预测准确性有限；2)基于深度学习的预测方法，虽然在一定程度上提高了算法效率和预测精度，但忽略了历史数据的影响，影响了预测精度；

发明内容

本发明要克服现有技术的上述不足之处，提供基于层次聚类和分层注意力机制的交通速度预测方法。

本发明方法首先采用层次聚类方法将历史交通速度数据划分为若干个簇；然后，设计基于分层注意力机制的神经网络模型，该模型充分考虑了交通速度数据的时空关联性，分别利用空间注意力机制和时间注意力机制来捕捉空间特征和时间特征。最后，根据当前日期的数据，选择合适的簇数据，生成样本数据集，训练和测试神经网络模型，训练好的模型可以预测目标路段未来若干个时间段的平均交通速度。本发明方法采用了层次聚类方法，以时间为单位对历史数据进行了划分和聚类，簇内数据具有较高相似度，并以此为基础训练神经网络模型，提高了预测精度。同时，本发明方法设计的神经网络模型，采用了分层注意力机制，对上下游各个路段和不同的历史时间段分别赋予了不同的影响权重，有效地捕捉了交通速度数据的时空特性，更好地提高了预测准确性。

本发明是通过以下技术方案来达到上述目的，即基于层次聚类和分层注意力机制的交通速度预测方法，具体的实施步骤如下：

(1)获取目标路段及其上下游路段的历史交通速度数据。根据路段中安装的电警卡口装置，采集并记录过车数据。在过车数据的基础上，根据同一辆车在上下游出现的时间差和路段距离，计算各个时间段的路段平均速度。

(2)数据预处理。由于检测器故障或数据传输失败，采集的数据存在缺失或异常，所以需要进行数据预处理，修正这些异常数据。

(3)对目标路段的历史交通速度数据进行层次聚类。由于天气变化、节假日和突发事故，某一天或某几天的交通速度数据分布会不同于正常情况下的数据分布。如果直接把交通速度数据拆分为训练数据集和测试数据集，模型预测的准确性可能会很低。因此，为了考虑不同交通环境的影响，采用层次聚类方法对预处理数据进行处理，将分布相似的数据进行合并，从而把历史交通速度数据划分成若干个簇，簇内数据具有较高的相似度，聚类后的簇数据更适合模型的训练和测试，有效地提高了模型的预测精度。层次聚类方法的具体过程如下：

s31.按天划分目标路段的历史交通速度数据。将预处理后的交通速度数据按天进行划分，形成若干个初始簇，所述的初始簇就是层次聚类的底层节点；

s32.初始化阈值θ和最大相似度SIM_MAX。阈值θ用于判断算法是否结束，根据经验值设定阈值θ的初值。最大相似度SIM_MAX的初值为相对较大的值，远大于阈值θ。

s33.采用自下而上的聚合策略进行层次聚类。如果当前SIM_MAX大于或等于θ，则采用皮尔森相关系数计算任意两个簇的相似度，并比较这些相似度值，选取相似度最大的两个簇将其合并为一个簇，同时将SIM_MAX的值更新为当前的最大相似度；

s34.重复步骤s33，直至当前SIM_MAX小于阈值θ，最后获得M个簇的交通速度数据，其中M为簇的个数。

(4)设计基于分层注意力机制的神经网络模型。基于分层注意力机制的神经网络模型是以Seq2Seq模型为基础，包括Encoder层、Decoder层和全连接层。在Encoder层，将上下游路段的历史交通速度数据作为输入，利用空间注意力机制来捕捉交通速度数据的空间特征，并通过一个双向LSTM(Long Short-Term Memory：长短期记忆)网络来确定每条上下游路段的影响权重；在Decoder层，将Encoder层的输出和目标路段的历史交通速度数据作为输入，利用时间注意力机制来挖掘交通速度数据的时间特征，并通过另外一个双向LSTM网络来确定过去若干个时间段的影响权重；最后，由全连接层计算得到预测结果。由于注意力机制也称为Attention，所以Encoder层的空间注意力机制也称为空间Attention，Decoder层的时间注意力机制也称为时间Attention。

Encoder层主要用于提取上下游路段对目标路段未来交通速度的影响程度，Encoder层的输入为上下游路段的历史交通速度数据S。

其中，

i取值范围为[1,n]，n表示选取的上下游路段数，l表示时间段的个数，t表示某个时间段，而l与t表示过去的某个时间段，如t-l+1表示t时间段之前的第(l-1)个时间段。S表示所选取的n条上下游路段在过去l个时间段的平均交通速度矩阵，Sⁱ表示路段i在过去l个时间段的平均交通速度向量，

表示路段i在j时间段的平均交通速度，j取值范围为[t-l+1,t]。

Encoder层中的空间注意力机制的内部状态变化为：

其中，公式(1)用于计算各个上下游路段在l个时间段的空间权重，

表示路段i在t时间段的空间权重，i取值范围为[1,n]，t时间段的空间权重向量为

m是隐藏层尺寸，

是元状态，

是隐藏层状态，Sⁱ是输入的上下游路段i的历史交通速度数据，

是Encoder层中上一次迭代的隐藏层状态、元状态和路段i的交通速度数据的拼接，

和

是权重项，

和

是偏置项，且

tanh(·)函数是双曲正切函数，为激活函数；公式(2)是Softmax函数，即归一化指数函数，用于空间权重的归一化计算，

是路段i在t时间段的归一化空间权重，归一化t时间段的空间权重向量为

Encoder层在迭代运算的过程中生成l个时间段的空间权重向量，依次为e_t-l+1,e_t-l+2,…,e_t，相应的归一化空间权重向量为α_t-l+1,α_t-l+2,…,α_t，运算过程总共迭代l次，第一次生成e_t-l+1和α_t-l+1，第二次生成e_t-l+2和α_t-l+2，以此类推，第l次生成e_t和α_t。随后，根据t时间段的空间权重向量，输入的历史交通速度数据被加权转换为：

因此，向量

包含了各个上下游路段的空间特征信息，类似地计算出其它时间段加权转换后的历史交通速度数据，即

Encoder层中的双向LSTM网络的内部状态变化为：

h_e,t＝W_e,th_t+b_e,t (7)

其中，

和

分别表示前向LSTM网络的隐藏层状态和权重项，

和

分别表示反向LSTM网络的隐藏层状态和权重项，将两者拼接则得到了双向LSTM的隐藏层状态

是对h_t的线性变换，用于计算公式(1)的空间权重，

是权重项，

是偏置项。Encoder层中的双向LSTM网络的输入为加权转换后的历史交通速度数据，即

双向LSTM网络将进行l次迭代，每次迭代输出其隐藏层状态，分别为h_t-l+1,h_t-l+2,…,h_t，因此，Encoder层输出的隐藏层状态包含加权转换后的历史交通速度数据。

Decoder层的输入为Encoder层输出的l隐藏层状态和目标路段的历史交通速度数据，分别为h_t-l+1,h_t-l+2,…,h_t和y，其中，y＝(y_t-l+1,y_t-l+2,…,y_t)，y_j是目标路段在j时间段的平均交通速度，j取值范围为[t-l+1,t]。

Decoder层中的时间注意力机制的内部状态变化为：

其中，公式(8)用于计算Encoder层输出的隐藏层状态在不同时间段的时间权重，

表示Encoder层输出的隐藏层状态h_i在t时间段的时间权重，i取值范围为[t-l+1,t]，t时间段的时间权重向量为

k是隐藏层的尺寸，

是元状态，

是隐藏层状态，

是Encoder层输出的隐藏层状态，

是Decoder层中的上一轮迭代的隐藏层状态、元状态和Encoder层输出的隐藏层状态的拼接，

和

是权重项，

和

是偏置项，且

公式(9)是归一化指数函数，用于时间权重的归一化计算，

是隐藏层状态h_i在t时间段的归一化时间权重，归一化时间权重向量为

该时间权重向量表示Encoder层输出的l个隐藏层状态对t时间段的影响。Decoder层在迭代运算的过程中生成l个时间段的时间权重向量，依次为d_t-l+1,d_t-l+2,…,d_t，相应的归一化时间权重向量为β_t-l+1,β_t-l+2,…,β_t，运算过程总共迭代l次，第一次生成d_t-l+1和β_t-l+1，第二次生成d_t-l+2和β_t-l+2，以此类推，第l次生成d_t和β_t。随后，根据时间权重向量，获得t时间段的上下文向量(Context Vector)，具体如下：

同样，计算获得其它时间段的上下文向量，即V_t-l+1,V_t-l+2,…,V_t-1。将上下文向量与目标路段的历史交通速度数据进行拼接，获得加权转换后的目标路段历史交通速度数据，具体计算方法如下：

其中，

是加权转换后目标路段在t时间段的交通速度，y_t是输入的目标路段在t时间段的平均交通速度，

表示t时间段的上下文向量V_t与目标路段交通速度y_t的拼接，

是权重项，

是偏置项。类似地计算出其它时间段加权转换后的目标路段历史交通速度数据，即

Decoder层中的双向LSTM网络的内部状态变化为：

h_d,t＝W_d,th′_t+b_d,t (15)

其中，

和

分别表示前向LSTM网络的隐藏层状态和权重项,

和

分别表示反向LSTM网络的隐藏层状态和权重项，两者拼接可得到双向LSTM的隐状态

是对h′_t的线性变换，用于计算公式(8)的时间权重，

是权重项，

是偏置项。Decoder层中的双向LSTM网络的输入为加权转换后的目标路段历史交通速度数据，即

双向LSTM网络将进行l次迭代，并输出最后的隐藏层状态，即h′_t，因此，Decoder层输出的隐藏层状态不仅包含空间特征信息，也包含时间特征信息。

最后，由全连接层计算得到预测结果，具体计算如下：

其中，

是目标路段在t+1时间段的平均交通速度预测值，

是t时间段的上下文向量与Decoder层输出的隐藏层状态的拼接,

是权重项，

是偏置项。

损失函数采用均方误差(Mean Square Error,MSE)，具体如下：

其中，loss为损失函数，

为目标路段交通速度的预测值，

为目标路段交通速度的真实值，N表示训练样本个数。

(5)获取当前日期的交通速度数据，并作相应的数据预处理。当前日期的交通速度数据获取方法与步骤(1)相同，包括目标路段及其上下游路段的交通速度数据。随后，检查是否存在异常数据，并作相应的数据预处理。

(6)生成样本数据集，训练和测试基于分层注意力机制的神经网络模型。计算步骤(5)获取的目标路段交通速度数据与步骤(3)生成的M个簇数据的相似度，选择相似度最高的簇数据。以选择的簇数据和对应时间段的上下游路段交通速度数据为样本数据集，按一定比例拆分并生成训练数据集和测试数据集，训练和测试步骤(4)设计的神经网络模型，从而确定模型中所有的权重项和偏置项。

(7)预测目标路段未来时间段的平均交通速度。基于步骤(6)训练和测试所得的神经网络模型，采用步骤(5)获取的当前日期的交通速度数据，对目标路段未来若干个时间段的平均交通速度进行预测。

优选地，时间段的长度为5分钟。

优选地，步骤(2)中，采用过去一段时间的历史均值来修正异常数据。

优选地，步骤(4)中，l的取值为12。

优选地，步骤(6)中，按7:3的比例拆分并生成训练数据集和测试数据集。

优选地，步骤(7)中，预测的未来时间段包括未来0-5分钟、未来5-10分钟、未来10-15分钟、未来15-20分钟、未来20-25分钟和未来25-30分钟。

本发明的有益效果在于：(1)本发明充分考虑了历史交通速度数据的周期性和时序性，采用层次聚类方法对历史数据进行了划分和聚类，簇内数据拥有相似的分布，更适合于神经网络模型的训练；(2)本发明采用分层注意力机制设计了神经网络模型，有效地捕捉历史交通速度数据的空间特征和时间特征，并对不同路段和不同历史时间段赋予不同的影响权重，从而获得更准确的预测结果。

附图说明

图1是本发明方法的总体流程图。

图2是本发明方法的层次聚类流程图。

图3是本发明方法的基于分层注意力机制的神经网络模型。

具体实施方式

下面结合附图进一步说明本发明的技术方案。

本发明的基于层次聚类和分层注意力机制的交通速度预测方法，具体的实施步骤如下：

(1)获取目标路段及其上下游路段的历史交通速度数据。根据路段中安装的电警卡口装置，采集并记录过车数据。在过车数据的基础上，根据同一辆车在上下游出现的时间差和路段距离，计算各个时间段的路段平均速度，其中时间段的长度为5分钟。

(2)数据预处理。由于检测器故障或数据传输失败，采集的数据存在缺失或异常，所以需要进行数据预处理，采用过去一段时间的历史均值来修正这些异常数据。

s35.初始化阈值θ和最大相似度SIM_MAX。阈值θ用于判断算法是否结束，根据经验值设定阈值θ的初值。最大相似度SIM_MAX的初值为相对较大的值，远大于阈值θ。

s32.采用自下而上的聚合策略进行层次聚类。如果当前SIM_MAX大于或等于θ，则采用皮尔森相关系数计算任意两个簇的相似度，并比较这些相似度值，选取相似度最大的两个簇将其合并为一个簇，同时将SIM_MAX的值更新为当前的最大相似度；

s33.重复步骤s33，直至当前SIM_MAX小于阈值θ，最后获得M个簇的交通速度数据，其中M为簇的个数。

(4)设计基于分层注意力机制的神经网络模型。基于分层注意力机制的神经网络模型是以Seq2Seq模型为基础，包括Encoder层、Decoder层和全连接层。在Encoder层，将上下游路段的历史交通速度数据作为输入，利用空间注意力机制来捕捉交通速度数据的空间特征，并通过一个双向LSTM网络来确定每条上下游路段的影响权重；在Decoder层，将Encoder层的输出和目标路段的历史交通速度数据作为输入，利用时间注意力机制来挖掘交通速度数据的时间特征，并通过另外一个双向LSTM网络来确定过去若干个时间段的影响权重；最后，由全连接层计算得到预测结果。由于注意力机制也称为Attention，所以Encoder层的空间注意力机制也称为空间Attention，Decoder层的时间注意力机制也称为时间Attention。

其中，

i取值范围为[1,n]，n表示选取的上下游路段数，l表示时间段的个数，l的取值为12，t表示某个时间段，时间段的长度为5分钟，而l与t表示过去的某个时间段，如t-l+1表示t时间段之前的第(l-1)个时间段。S表示所选取的n条上下游路段在过去l个时间段的平均交通速度矩阵，Sⁱ表示路段i在过去l个时间段的平均交通速度向量，

表示路段i在j时间段的平均交通速度，j取值范围为[t-l+1,t]。

Encoder层中的空间注意力机制的内部状态变化为：

m是隐藏层尺寸，

是元状态，

和

是权重项，

和

是偏置项，且

因此，向量

Encoder层中的双向LSTM网络的内部状态变化为：

h_e,t＝W_e,th_t+b_e,t (7)

其中，

和

分别表示前向LSTM网络的隐藏层状态和权重项，

和

是对h_t的线性变换，用于计算公式(1)的空间权重，

是权重项，

Decoder层的输入为Encoder层输出的l隐藏层状态和目标路段的历史交通速度数据，分别为h_t-l+1,h_t-l+2,…,h_t和y，其中，y＝(y_t-l+1,y_t-l+2,…,y_t)，y_j是目标路段在j时间段的平均交通速度，j取值范围为[t-l+1,t]，时间段的长度为5分钟。

Decoder层中的时间注意力机制的内部状态变化为：

k是隐藏层的尺寸，

是元状态，

是隐藏层状态，

是Encoder层输出的隐藏层状态，

和

是权重项，

和

是偏置项，且

公式(9)是归一化指数函数，用于时间权重的归一化计算，

该时间权重向量表示Encoder层输出的l个隐藏层状态对t时间段的影响。Decoder层在迭代运算的过程中生成l个时间段的时间权重向量，依次为d_t-l+1,d_t-l+2,…,d_t，相应的归一化时间权重向量为β_t-l+1,β_t-l+2,…,β_t，运算过程总共迭代l次，第一次生成d_t-l+1和β_t-l+1，第二次生成d_t-l+2和β_t-l+2，以此类推，第l次生成d_t和β_t。随后，根据时间权重向量，获得t时间段的上下文向量，具体如下：

其中，

表示t时间段的上下文向量V_t与目标路段交通速度y_t的拼接，

是权重项，

Decoder层中的双向LSTM网络的内部状态变化为：

h_d,t＝W_d,th′_t+b_d,t (15)

其中，

和

分别表示前向LSTM网络的隐藏层状态和权重项,

和

是对h′_t的线性变换，用于计算公式(8)的时间权重，

是权重项，

最后，由全连接层计算得到预测结果，具体计算如下：

其中，

是目标路段在t+1时间段的平均交通速度预测值，

是t时间段的上下文向量与Decoder层输出的隐藏层状态的拼接,

是权重项，

是偏置项。

损失函数采用均方误差(Mean Square Error,MSE)，具体如下：

其中，loss为损失函数，

为目标路段交通速度的预测值，

为目标路段交通速度的真实值，N表示训练样本个数。

(6)生成样本数据集，训练和测试基于分层注意力机制的神经网络模型。计算步骤(5)获取的目标路段交通速度数据与步骤(3)生成的M个簇数据的相似度，选择相似度最高的簇数据。以选择的簇数据和对应时间段的上下游路段交通速度数据为样本数据集，按7:3的比例拆分并生成训练数据集和测试数据集，训练和测试步骤(4)设计的神经网络模型，从而确定模型中所有的权重项和偏置项。

(7)预测目标路段未来时间段的平均交通速度。基于步骤(6)训练和测试所得的神经网络模型，采用步骤(5)获取的当前日期的交通速度数据，对目标路段未来若干个时间段的平均交通速度进行预测，其中，预测的未来时间段包括未来0-5分钟、未来5-10分钟、未来10-15分钟、未来15-20分钟、未来20-25分钟和未来25-30分钟。

如附图1，本发明方法的总体流程图。首先，获取目标路段及其上下游路段的历史交通速度数据，并作相应的数据预处理；然后，采用层次聚类方法，对目标路段的历史交通速度数据进行聚类，获得若干个簇数据，簇内数据具有较高的相似度；接着，设计基于分层注意力机制的神经网络模型，模型Encoder层以上下游路段的历史交通速度数据作为输入，利用空间注意力机制来捕捉交通速度数据的空间特征，并通过双向LSTM网络来确定每条上下游路段的影响权重，模型的Decoder层，则以Encoder层的输出和目标路段的历史交通速度数据作为输入，利用时间注意力机制来挖掘交通速度数据的时间特征，并通过另外一个双向LSTM网络来确定过去若干个时间段的影响权重。随后，获取当前日期的交通速度数据，并作相应的数据预处理，包括目标路段及其上下游路段的交通速度数据，并在此基础上，选择相似度最高的簇数据和对应时间段的上下游路段交通速度数据为样本数据集，按比例拆分并生成训练数据集和测试数据集，训练和测试神经网络模型。最后，应用训练好的神经网络模型，预测目标路段未来若干个时间段的平均交通速度。

如附图2，本发明方法的层次聚类流程图。首先，按天划分目标路段的历史交通速度数据，获得若干个初始簇，也即层次聚类的底层节点；然后，初始化阈值θ和最大相似度SIM_MAX，其中，SIM_MAX的初值为相对较大的值，远大于阈值θ；接着，比较SIM_MAX和θ的大小，如果SIM_MAX≥θ，则采用皮尔森相关系数计算任意两个簇的相似度，并从中选取相似度最大的两个簇进行合并，同时更新SIM_MAX的值为当前的最大相似度；重复以上步骤，直至SIM_MAX<θ；最后，获得M个簇的历史交通速度数据。

如附图3，本发明方法的基于分层注意力机制的神经网络模型，模型包括Encoder层、Decoder层和全连接层。Encoder层的输入为上下游路段的历史交通速度数据，即S¹,S²,…,Sⁿ；经过空间Attention迭代运算获得l个时间段的空间权重向量，即e_t-l+1,e_t-l+2,…,e_t，再经过Softmax函数进行归一化计算，获得归一化的空间权重向量，即α_t-l+1,α_t-l+2,…,α_t；而不同时间段的空间权重向量对输入的上下游路段的历史交通速度数据进行加权转换，加权转换后的历史交通速度数据是Encoder层双向LSTM的输入，即

Encoder层的双向LSTM进行l次迭代运算，每次迭代运算，不仅输出其隐藏层状态至Decoder层，即h_t-l+1,h_t-l+2,…,h_t，而且隐藏层状态在进行线性变换后，即h_e,t-l+1,h_e,t-l+2,…,h_e,t，输出至空间Attention，用于计算各个上下游路段在不同时间段的空间权重。Decoder层的输入为Encoder层输出的隐藏层状态和目标路段的历史交通速度数据，即h_t-l+1,h_t-l+2,…,h_t和y，其中y＝(y_t-l+1,y_t-l+2,…,y_t)；经过时间Attention迭代运算获得l个时间段的时间权重向量，即d_t-l+1,d_t-l+2,…,d_t，再经过Softmax函数进行归一化计算，获得归一化的时间权重向量，即β_t-l+1,β_t-l+2,…,β_t；根据时间权重向量，获得不同时间段的上下文向量，即V_t-l+1,V_t-l+2,…,V_t，而不同时间段的上下文向量对输入的目标路段的历史交通速度数据进行加权转换，加权转换后的历史交通速度数据是Decoder层双向LSTM的输入，即

Decoder层的双向LSTM也进行l次迭代运算，每次迭代运算，其相应的隐藏层状态在进行线性变换后，即h_d,t-l+1,h_d,t-l+2,…,h_d,t，输出至时间Attention，用于计算各个隐藏层状态在不同时间段的时间权重，同时，双向LSTM最后一次运算的隐藏层状态，即h′_t，将输出至全连接层。全连接层的输入为t时间段的上下文向量V_t与Decoder层双向LSTM输出的隐藏层状态h′_t，输出为目标路段在t+1时间段的平均交通速度预测值

本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举，本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式，本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims

1.基于层次聚类和分层注意力机制的交通速度预测方法，包括如下步骤：

(1)获取目标路段及其上下游路段的历史交通速度数据；根据路段中安装的电警卡口装置，采集并记录过车数据；在过车数据的基础上，根据同一辆车在上下游出现的时间差和路段距离，计算各个时间段的路段平均速度；

(2)数据预处理；由于检测器故障或数据传输失败，采集的数据存在缺失或异常，所以需要进行数据预处理，修正这些异常数据；

(3)对目标路段的历史交通速度数据进行层次聚类；层次聚类方法的具体过程如下：

s31.按天划分目标路段的历史交通速度数据；将预处理后的交通速度数据按天进行划分，形成若干个初始簇，所述的初始簇就是层次聚类的底层节点；

s32.初始化阈值θ和最大相似度SIM_MAX；阈值θ用于判断算法是否结束，根据经验值设定阈值θ的初值；最大相似度SIM_MAX的初值为相对较大的值，远大于阈值θ；

s33.采用自下而上的聚合策略进行层次聚类；如果当前SIM_MAX大于或等于θ，则采用皮尔森相关系数计算任意两个簇的相似度，并比较这些相似度值，选取相似度最大的两个簇将其合并为一个簇，同时将SIM_MAX的值更新为当前的最大相似度；

s34.重复步骤s33，直至当前SIM_MAX小于阈值θ，最后获得M个簇的交通速度数据，其中M为簇的个数；

(4)设计基于分层注意力机制的神经网络模型；基于分层注意力机制的神经网络模型是以Seq2Seq模型为基础，包括Encoder层、Decoder层和全连接层；在Encoder层，将上下游路段的历史交通速度数据作为输入，利用空间注意力机制来捕捉交通速度数据的空间特征，并通过一个双向LSTM网络来确定每条上下游路段的影响权重；在Decoder层，将Encoder层的输出和目标路段的历史交通速度数据作为输入，利用时间注意力机制来挖掘交通速度数据的时间特征，并通过另外一个双向LSTM网络来确定过去若干个时间段的影响权重；最后，由全连接层计算得到预测结果；

Encoder层主要用于提取上下游路段对目标路段未来交通速度的影响程度，Encoder层的输入为上下游路段的历史交通速度数据S；

其中，

i取值范围为[1,n]，n表示选取的上下游路段数，l表示时间段的个数，t表示某个时间段，而l与t表示过去的某个时间段，如t-l+1表示t时间段之前的第(l-1)个时间段；S表示所选取的n条上下游路段在过去l个时间段的平均交通速度矩阵，Sⁱ表示路段i在过去l个时间段的平均交通速度向量，

表示路段i在j时间段的平均交通速度，j取值范围为[t-l+1,t]；

Encoder层中的空间注意力机制的内部状态变化为：

m是隐藏层尺寸，

是元状态，

和

是权重项，

和

是偏置项，且

Encoder层在迭代运算的过程中生成l个时间段的空间权重向量，依次为e_t-l+1,e_t-l+2,…,e_t，相应的归一化空间权重向量为α_t-l+1,α_t-l+2,…,α_t，运算过程总共迭代l次，第一次生成e_t-l+1和α_t-l+1，第二次生成e_t-l+2和α_t-l+2，以此类推，第l次生成e_t和α_t；随后，根据t时间段的空间权重向量，输入的历史交通速度数据被加权转换为：

因此，向量

Encoder层中的双向LSTM网络的内部状态变化为：

h_e,t＝W_e,th_t+b_e,t (7)

其中，

和

分别表示前向LSTM网络的隐藏层状态和权重项，

和

是对h_t的线性变换，用于计算公式(1)的空间权重，

是权重项，

是偏置项；Encoder层中的双向LSTM网络的输入为加权转换后的历史交通速度数据，即

双向LSTM网络将进行l次迭代，每次迭代输出其隐藏层状态，分别为h_t-l+1,h_t-l+2,…,h_t，因此，Encoder层输出的隐藏层状态包含加权转换后的历史交通速度数据；

Decoder层的输入为Encoder层输出的l隐藏层状态和目标路段的历史交通速度数据，分别为h_t-l+1,h_t-l+2,…,h_t和y，其中，y＝(y_t-l+1,y_t-l+2,…,y_t)，y_j是目标路段在j时间段的平均交通速度，j取值范围为[t-l+1,t]；

Decoder层中的时间注意力机制的内部状态变化为：

k是隐藏层的尺寸，

是元状态，

是隐藏层状态，

是Encoder层输出的隐藏层状态，

和

是权重项，

和

是偏置项，且

公式(9)是归一化指数函数，用于时间权重的归一化计算，

该时间权重向量表示Encoder层输出的l个隐藏层状态对t时间段的影响；Decoder层在迭代运算的过程中生成l个时间段的时间权重向量，依次为d_t-l+1,d_t-l+2,…,d_t，相应的归一化时间权重向量为β_t-l+1,β_t-l+2,…,β_t，运算过程总共迭代l次，第一次生成d_t-l+1和β_t-l+1，第二次生成d_t-l+2和β_t-l+2，以此类推，第l次生成d_t和β_t；随后，根据时间权重向量，获得t时间段的上下文向量，具体如下：

同样，计算获得其它时间段的上下文向量，即V_t-l+1,V_t-l+2,…,V_t-1；将上下文向量与目标路段的历史交通速度数据进行拼接，获得加权转换后的目标路段历史交通速度数据，具体计算方法如下：

其中，

表示t时间段的上下文向量V_t与目标路段交通速度y_t的拼接，

是权重项，

是偏置项；类似地计算出其它时间段加权转换后的目标路段历史交通速度数据，即

Decoder层中的双向LSTM网络的内部状态变化为：

h_d,t＝W_d,th′_t+b_d,t (15)

其中，

和

分别表示前向LSTM网络的隐藏层状态和权重项,

和

是对h′_t的线性变换，用于计算公式(8)的时间权重，

是权重项，

是偏置项；Decoder层中的双向LSTM网络的输入为加权转换后的目标路段历史交通速度数据，即

双向LSTM网络将进行l次迭代，并输出最后的隐藏层状态，即h′_t，因此，Decoder层输出的隐藏层状态不仅包含空间特征信息，也包含时间特征信息；

最后，由全连接层计算得到预测结果，具体计算如下：

其中，

是目标路段在t+1时间段的平均交通速度预测值，

是t时间段的上下文向量与Decoder层输出的隐藏层状态的拼接,

是权重项，

是偏置项；

损失函数采用均方误差(Mean Square Error,MSE)，具体如下：

其中，loss为损失函数，

为目标路段交通速度的预测值，

为目标路段交通速度的真实值，N表示训练样本个数；

(5)获取当前日期的交通速度数据，并作相应的数据预处理；当前日期的交通速度数据获取方法与步骤(1)相同，包括目标路段及其上下游路段的交通速度数据；随后，检查是否存在异常数据，并作相应的数据预处理；

(6)生成样本数据集，训练和测试基于分层注意力机制的神经网络模型；计算步骤(5)获取的目标路段交通速度数据与步骤(3)生成的M个簇数据的相似度，选择相似度最高的簇数据；以选择的簇数据和对应时间段的上下游路段交通速度数据为样本数据集，按一定比例拆分并生成训练数据集和测试数据集，训练和测试步骤(4)设计的神经网络模型，从而确定模型中所有的权重项和偏置项；

(7)预测目标路段未来时间段的平均交通速度；基于步骤(6)训练和测试所得的神经网络模型，采用步骤(5)获取的当前日期的交通速度数据，对目标路段未来若干个时间段的平均交通速度进行预测。

2.如权利要求1所述的基于层次聚类和分层注意力机制的交通速度预测方法，其特征在于：时间段的长度为5分钟。

3.如权利要求1所述的基于层次聚类和分层注意力机制的交通速度预测方法，其特征在于：步骤(2)中，采用过去一段时间的历史均值来修正异常数据。

4.如权利要求1所述的基于层次聚类和分层注意力机制的交通速度预测方法，其特征在于：步骤(4)中，l的取值为12。

5.如权利要求1所述的基于层次聚类和分层注意力机制的交通速度预测方法，其特征在于：步骤(6)中，按7:3的比例拆分并生成训练数据集和测试数据集。

6.如权利要求1所述的基于层次聚类和分层注意力机制的交通速度预测方法，其特征在于：步骤(7)中，预测的未来时间段包括未来0-5分钟、未来5-10分钟、未来10-15分钟、未来15-20分钟、未来20-25分钟和未来25-30分钟。