CN111063194A

CN111063194A - 一种交通流预测方法

Info

Publication number: CN111063194A
Application number: CN202010033545.8A
Authority: CN
Inventors: 张玺君; 张祺瑞
Original assignee: Lanzhou University of Technology
Current assignee: Lanzhou University of Technology
Priority date: 2020-01-13
Filing date: 2020-01-13
Publication date: 2020-04-24

Abstract

本发明公开了一种交通流预测方法，涉及交通流预测技术领域，方法包括：S1：根据时间特征，对交通数据进行分类，并对每类数据进行训练集和测试集的划分；S2：利用多层LSTM模型对所述训练集的数据进行训练，并将多层LSTM模型中隐藏层的输出作为XGBoost模型的输入，先利用预处理之后的训练集数据先使用增加Dropout层的LSTM模型进行训练，再将全连接层获取到的隐藏层特征作为XGBoost模型的输入项并对其进行再次训练。本发明通过构建多层LSTM网络实现对时间序列数据的训练，同时为避免LSTM模型中全连接层的过拟合现象，引入了XGBoost模型，利用XGBoost模型替换LSTM模型中的全连接层，并对其进行训练，以此来提高预测值的精度和模型的泛化能力。

Description

一种交通流预测方法

技术领域

本发明涉及交通流预测技术领域，具体涉及一种交通流预测方法。

背景技术

目前，在智能交通系统领域，准确的交通速度预测在交通控制和管理中起着重要的作用。随着城市智能化的发展，人们对于城市交通的规划逐渐重视起来，尤其是在交通速度预测方面的研究引起了这一领域众多研究者的极大关注。近年来，基于深度学习的交通流预测方法在时间序列分析方面表现出了较强的竞争力，而时间序列分析是交通流预测的重要组成部分。这些方法可用于模拟交通特征，如流量、占有率和速度，或出行时间，并产生预期的交通状况。交通流预测的应用场景十分广泛，例如，短期航空旅客预测、内河船舶交通流预测、智能交通系统的速度预测、占有率预测和交通流量预测等。以上种种现象说明了交通流预测是一项十分有意义的课题。

目前，对交通流预测方面的研究大多使用机器学习和深度学习相关的方法，如使用CNN、RNN、LSTM等模型可以很好的解决交通预测方面的问题。

随着研究的深入，现如今只对单一模型研究已经满足不了社会的需求，因此大量研究者将重点放在了组合模型的研究上并且取得了一定的成果。Rui， Fu 利用LSTM和GRU神经网络方法进行交通流预测，这是首次将GRU应用于交通流预测；Liu， Yipeng 将卷积和LSTM相结合，利用双向LSTM模块对预测点的历史交通流数据进行分析，此方法虽一定程度提高了预测精度，但对于数据的预处理未深入研究；Yao， Huaxiu 提出了一种深度多视点时空网络(DMVST-Net)框架来模拟时空关系。此方法虽分析了数据的时空特性，但却是利用三个方法进行分别研究，未体现组合模型的优势；王祥雪等人提出基于LSTM-RNN的短时交通流预测模型，此模型虽能根据预测精度进行自适应更新，但未解决模型的过拟合问题；王青松等人提出基于CNN-XGBoost混合模型的短时交通流预测模型，该模型虽然研究了交通流的时间和空间特征，但CNN预测模型相比LSTM模型的劣势在于难以对交通流进行多步预测。

综上所述，针对以上模型中存在的不足之处，本文提出了一种基于LSTM和XGBoost两种网络的组合模型。通过构建多层LSTM网络实现对时间序列数据的训练，同时为避免LSTM模型中全连接层的过拟合现象，引入了XGBoost模型，利用XGBoost模型替换LSTM模型中的全连接层。将多层LSTM模型中隐藏层的输出作为XGBoost模型的输入，并对其进行训练，以此来提高预测值的精度。

发明内容

本发明针对上述问题，提供一种交通流预测方法，所述方法包括：

S1：根据时间特征，对交通数据进行分类，并对每类数据进行训练集和测试集的划分；

S2：利用多层LSTM模型对所述训练集的数据进行训练，并将多层LSTM模型中隐藏层的输出作为XGBoost模型的输入，对其进行训练。

进一步地，根据时间特征，对交通数据进行分类，并对每类数据进行训练集和测试集的划分，包括：

根据时间特征，将交通数据划分为工作日、周末两类，并对每类数据进行训练集和测试集的划分，将所述训练集的数据按照时间顺序排列成矩阵A，将测试集的数据排列成矩阵B；

对应的输入矩阵如公式（1）所示：

（1）

其中，A为由前多个连续速度数据组成的多维矩阵，B为由下一时刻速度数据组成的一维矩阵，

为t时刻的交通速度，

为时间间隔长度。

更进一步地，在对工作日和周末两类数据划分出现异常和缺失时，工作日数据采用同一时刻的平均值代替，周末数据采用同一时刻数据填补。

更进一步地，所述多层LSTM预测模型通过对其引入三个不同功能的门结构对LSTM模型中的原始RNN中隐藏层进行改进，其中，

遗忘门

决定上一时刻的记忆单元

有多少保留到当前时刻

中，

表示把两个向量连接成一个更长的向量，遗忘门的输入为短期记忆

和当前输入

，经过遗忘门的权重矩阵

和偏置项

处理，最后引入

函数进行控制，其中

表示

函数，遗忘门的计算过程如公式（2）所示：

（2）

输入门

决定当前网络时刻的输入

有多少保存到单元状态

中，将输入门的输入值先经过输入门的权重矩阵

和偏置项

处理，由

层决定信息的保留程度，再将输入值经过计算单元状态的权重矩阵

和偏置项

处理，由

层输出的

作为当前记忆，最后将当前记忆

和长期记忆

组成新的状态

输入门的计算过程如公式（3）所示：

（3）

输出门

决定了控制单元状态

有多少输出到LSTM的当前输出值

中，将输出门的输入值由输出门的权重矩阵

和偏置值

处理，引入

函数进行控制，再用由

层输出的

按元素乘以输出门

，形成新的输出值

，输出门的计算过程如公式（4）所示：

（4）。

更进一步地，所述XGBoost模型选用二阶泰勒展开，并且增加正则化项，进行改进，如下：

将n个样本，m个特征形成数据集

，n指的是历史时间段，m指的是在这个时间段的历史速度数据，记

为样本

在第

轮的预测值，则样本

最终预测值如公式（5）所示：

（5）

其中，K为下标，

为前

轮的预测值，

为新加入的函数，为防止加入节点过多导致出现过拟合现象，因此引入惩罚项来降低过拟合的风险，惩罚函数

表示如公式（6）所示：

（6）

其中，

为惩罚力度，

为惩罚项，

为系数，

为叶子结点个数，

为样本数，

为权值。

更进一步地，对其进行训练时：先利用预处理之后的训练集数据先使用增加Dropout层的LSTM模型进行训练，再将全连接层获取到的隐藏层特征作为XGBoost模型的输入项并对其进行再次训练，在XGBoost模型训练结束后，整个LSTM-XGBoost组合预测模型的训练完成。

本发明的优点：通过完成数据预处理和时间序列重构、归一化操作，同时在LSTM模型中引入XGBoost模型，避免全连接层出现的过拟合现象，提高模型的泛化能力；不仅针对于短期交通流的预测，还可以应用到其它相关的多变量时间序列的预测领域，用于解决不同的实际问题，本文所采用的组合预测模型不仅可以提高预测的精度，还使得模型的实用性、实时性及扩展性均得到有效提高。

除了上面所描述的目的、特征和优点之外，本发明还有其它的目的、特征和优点。下面将参照图，对本发明作进一步详细的说明。

附图说明

构成本申请的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1是本发明的流程框图；

图2是本发明的预处理前的数据样本信息图；

图3是本发明的预处理后的数据样本信息图；

图4是本发明的构建多层LSTM模型图；

图5是本发明的LSTM-XGBoost组合预测模型结构图；

图6是本发明的LSTM-XGBoost组合模型训练框图；

图7是本发明的LSTM模型工作日预测对比图；

图8是本发明的XGBoost模型工作日预测对比图；

图9是本发明的LSTM-XGBoost模型工作日预测对比图；

图10是本发明的LSTM模型周末预测对比图；

图11是本发明的XGBoost模型周末预测对比图；

图12是本发明的LSTM-XGBoost模型周末预测对比图；

图13是本发明的不同模型下未来10min速度预测图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

参考图1至图13，如图1至图13所示，一种交通流预测方法，包括：

S2：利用多层LSTM模型对所述训练集的数据进行训练，并将多层LSTM模型中隐藏层的输出作为XGBoost模型的输入，对其进行训练，

通过完成数据预处理和时间序列重构、归一化操作，同时在LSTM模型中引入XGBoost模型，避免全连接层出现的过拟合现象，提高模型的泛化能力；不仅针对于短期交通流的预测，还可以应用到其它相关的多变量时间序列的预测领域，用于解决不同的实际问题，本文所采用的组合预测模型不仅可以提高预测的精度，还使得模型的实用性、实时性及扩展性均得到有效提高。

本发明的一个实施例中，根据时间特征，对交通数据进行分类，并对每类数据进行训练集和测试集的划分，包括：

对应的输入矩阵如公式（1）所示：

（1）

为t时刻的交通速度，

为时间间隔长度。

本发明的一个实施例中，在对工作日和周末两类数据划分出现异常和缺失时，工作日数据采用同一时刻的平均值代替，周末数据采用同一时刻数据填补。

本发明的一个实施例中，长短期记忆网络，是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件，LSTM区别于RNN的地方，主要就在于它在算法中加入了一个判断信息有用与否的“处理器”，这个处理器作用的结构被称为cell；一个cell当中被放置了三扇门，分别叫做输入门、遗忘门和输出门，一个信息进入LSTM的网络当中，可以根据规则来判断是否有用，只有符合算法认证的信息才会留下，不符的信息则通过遗忘门被遗忘；

根据上述表述，所述步骤S1中构建多层LSTM预测模型时，通过对其引入三个不同功能的门结构对LSTM模型中的原始RNN中隐藏层进行改进，其中，

遗忘门

决定上一时刻的记忆单元

有多少保留到当前时刻

中，

和当前输入

，经过遗忘门的权重矩阵

和偏置项

处理，最后引入

函数进行控制，其中

表示

函数，遗忘门的计算过程如公式（2）所示：

（2）

输入门

决定当前网络时刻的输入

有多少保存到单元状态

中，将输入门的输入值先经过输入门的权重矩阵

和偏置项

处理，由

和偏置项

处理，由

层输出的

作为当前记忆，最后将当前记忆

和长期记忆

组成新的状态

，输入门的计算过程如公式（3）所示：

（3）

输出门

决定了控制单元状态

有多少输出到LSTM的当前输出值

中，将输出门的输入值由输出门的权重矩阵

和偏置值

处理，引入

函数进行控制，再用由

层输出的

按元素乘以输出门

，形成新的输出值

，输出门的计算过程如公式（4）所示：

（4）。

本发明的一个实施例中，所述XGBoost模型选用二阶泰勒展开，并且增加正则化项，进行改进，如下：

将n个样本，m个特征形成数据集

为样本

在第

轮的预测值，则样本

最终预测值如公式（5）所示：

（5）

其中，K为下标，

为前

轮的预测值，

表示如公式（6）所示：

（6）

其中，

为惩罚力度，

为惩罚项，

为系数，

为叶子结点个数，

为样本数，

为权值，

目标函数

由损失函数

和正则化惩罚项

构成，定义如公式（7）所示：

（7）

其中，

为损失函数，

为惩罚项，

为常数项

XGBoost算法运用二阶泰勒展开对目标函数进行优化，展开公式如（8）所示：

（8）

然后去掉常数项，即真实值与前一轮的预测值之差，目标函数仅取决于各数据点误差函数的一阶和二阶导数，最终的简化形式如公式（9）所示：

（9）

不仅避免了过拟合问题，而且增强了模型的泛化能力。

本发明的一个实施例中，对其进行训练时：先利用预处理之后的训练集数据进行多层LSTM模型进行训练，再将全连接层获取到的隐藏层特征作为XGBoost模型的输入项并对其进行再次训练，在XGBoost模型训练结束后，整个LSTM-XGBoost组合预测模型的训练完成，降低误差，如：首先对预处理后的时序速度数据进行文本读取，将读取到的数据存入到数组A中，接着将数组内的数据通过归一化和重塑方式进行处理，然后通过前四层的神经单元的计算得到处理后的残差矩阵，最后将残差矩阵作为XGBoost层的输入，从而取代原始LSTM模型中的全连接层，得到最终的输出结果

。

训练时，首先对数据进行周末和工作日两个阶段的异常和缺失处理，得到准确的数据集；随后对数据进行训练集和测试集的划分，使用训练集的数据输入到LSTM模型中，得到训练模型，通过调用LSTM模型的前四层重新对训练数据进行处理，接着将四层LSTM模型的处理结果通过重塑和特征提取方式将数据输入到XGBoost模型中，对其进行深一步处理，最终完成组合模型的训练过程。

其中，上述进行多层LSTM模型进行训练，与前馈神经网络类似，LSTM网络的训练同样采用的是误差的反向传播算法，不过因为LSTM处理的是序列数据，所以在使用反向传播算法的时候需要将整个时间序列上的误差传播回来，LSTM本身又可以表示为带有循环的图结构，也就是说在这个带有循环的图上使用反向传播时我们称之为BPTT。

本发明的一个实施例中，所述步骤S3中，LSTM-XGBoost组合预测模型采用均方差、均方根误差、平均绝对误差、平均绝对误差百分比进行模型评价，其公式对应如公式（10）（11）（12）（13）所示：

（10）

（11）

（12）

（13）

其中，

表示真实值，

表示对应时间预测值，计算得到的MSE、RMSE、MAE、MAPE值越小，表明模型的拟合效果越好，预测准确率(1-MAPE)越高，其中，MSE、RMSE、MAE、MAPE回归算法的评价指标。

其中，XGBoost是boosting算法的其中一种，Boosting算法的思想是将许多弱分类器集成在一起形成一个强分类器，因为XGBoost是一种提升树模型，所以它是将许多树模型集成在一起，形成一个很强的分类器，而所用到的树模型则是CART回归树模型；

该算法思想就是不断地添加树，不断地进行特征分裂来生长一棵树，每次添加一个树，其实是学习一个新函数，去拟合上次预测的残差；

当我们训练完成得到k棵树，我们要预测一个样本的分数，其实就是根据这个样本的特征，在每棵树中会落到对应的一个叶子节点，每个叶子节点就对应一个分数，最后只需要将每棵树对应的分数加起来就是该样本的预测值；

目标函数由两部分构成，第一部分用来衡量预测分数和真实分数的差距，另一部分则是正则化项，正则化项同样包含两部分，T表示叶子结点的个数，w表示叶子节点的分数，γ可以控制叶子结点的个数，λ可以控制叶子节点的分数不会过大，防止过拟合；

XGBoost思想是对特征进行分桶，即找到l个划分点，将位于相邻分位点之间的样本分在一个桶中，在遍历该特征的时候，只需要遍历各个分位点，从而计算最优划分，从算法伪代码中该流程还可以分为两种，全局的近似是在新生成一棵树之前就对各个特征计算分位点并划分样本，之后在每次分裂过程中都采用近似划分，而局部近似就是在具体的某一次分裂节点的过程中采用近似算法。

LSTM是一种特定形式的RNN（Recurrent neural network，循环神经网络），而RNN是一系列能够处理序列数据的神经网络的总称，这里要注意循环神经网络和递归神经网络（Recursive neural network）的区别；

一般地，RNN包含如下三个特性：

a）循环神经网络能够在每个时间节点产生一个输出，且隐单元间的连接是循环的；

b）循环神经网络能够在每个时间节点产生一个输出，且该时间节点上的输出仅与下一时间节点的隐单元有循环连接；

c）循环神经网络包含带有循环连接的隐单元，且能够处理序列数据并输出单一的预测；

RNN还有许多变形，例如双向RNN（Bidirectional RNN）等，然而，RNN在处理长期依赖时会遇到巨大的困难，如：时间序列上距离较远的节点，因为计算距离较远的节点之间的联系时会涉及雅可比矩阵的多次相乘，这会带来梯度消失或者梯度膨胀的问题，这样的现象被许多学者观察到并独立研究，为了解决该问题，研究人员提出了许多解决办法，例如ESN（Echo State Network），增加有漏单元（Leaky Units）等等，其中最成功应用最广泛的就是门限RNN（Gated RNN），而LSTM就是门限RNN中最著名的一种，有漏单元通过设计连接间的权重系数，从而允许RNN累积距离较远节点间的长期联系；而门限RNN则泛化了这样的思想，允许在不同时刻改变该系数，且允许网络忘记当前已经累积的信息；

LSTM的巧妙之处在于通过增加输入门限，遗忘门限和输出门限，使得自循环的权重是变化的，这样一来在模型参数固定的情况下，不同时刻的积分尺度可以动态改变，从而避免了梯度消失或者梯度膨胀的问题。

实验例

数据集：

通过选取某路段一周的速度时间序列作为数据样本，该数据样本的时间间隔为2min；

根据数据特征，将数据划分为工作日，周末两类，其中训练集占67%，共计5040个数据。

模型参数设定：

LSTM-XGBoost模型的参数设定如下：LSTM模型layers设置为4，epoch设置为100，batch-size设置为10，dropout设置为0.2，activation设置为relu，optimizer设置为rmsprop，loss设置为mse；XGBoost模型learning_rate为0.1，max_depth为4，eval_metric为mse，其它参数设置为默认值。

实验结果：

为了验证组合模型的有效性，选取LSTM模型、XGBoost模型和LSTM-XGBoost模型三种模型分别对以上两类数据集进行了比较，三种模型的参数设定保持一致，测试集的预测性能指标结果如下表1-2所示，测试集预测结果如图7至12所示；

表1 工作日预测性能指标

表2 周末预测性能指标

最后，选用组合模型对未来10min内的速度进行预测，预测效果如图13所示。

实验结论：

由表1和表2，及图7至图12展示的结果可得出，所提出的LSTM-XGBoost模型要优于单独使用的LSTM模型和XGBoost模型，相比于LSTM模型，工作日阶段MSE减少2.98，RMSE减少0.5，MAE减少0.3，MAPE减少6.62%，相比于XGBoost模型，工作日阶段MSE减少2.91，RMSE减少0.48，MAE减少0.18，MAPE减少0.91%；

分析结果表明，所提出的LSTM-XGBoost组合预测模型方法不仅可以提高预测精度，同时还可以进行多步预测，是一种有效的交通流预测方法。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种交通流预测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的交通流预测方法，其特征在于，根据时间特征，对交通数据进行分类，并对每类数据进行训练集和测试集的划分，包括：

对应的输入矩阵如公式（1）所示：

（1）

为t时刻的交通速度，

为时间间隔长度。

3.根据权利要求1所述的交通流预测方法，其特征在于，在对工作日和周末两类数据划分出现异常和缺失时，工作日数据采用同一时刻的平均值代替，周末数据采用同一时刻数据填补。

4.根据权利要求1所述的交通流预测方法，其特征在于，所述所述多层LSTM预测模型通过对其引入三个不同功能的门结构对LSTM模型中的原始RNN中隐藏层进行改进，其中，

遗忘门

决定上一时刻的记忆单元

有多少保留到当前时刻

中，

和当前输入

，经过遗忘门的权重矩阵

和偏置项

处理，最后引入

函数进行控制，其中

表示

函数，遗忘门的计算过程如公式（2）所示：

（2）

输入门

决定当前网络时刻的输入

有多少保存到单元状态

中，将输入门的输入值先经过输入门的权重矩阵

和偏置项

处理，由

和偏置项

处理，由

层输出的

作为当前记忆，最后将当前记忆

和长期记忆

组成新的状态

，输入门的计算过程如公式（3）所示：

（3）

输出门

决定了控制单元状态

有多少输出到LSTM的当前输出值

中，将输出门的输入值由输出门的权重矩阵

和偏置值

处理，引入

函数进行控制，再用由

层输出的

按元素乘以输出门

，形成新的输出值

，输出门的计算过程如公式（4）所示：

（4）。

5.根据权利要求1所述的交通流预测方法，其特征在于，所述XGBoost模型选用二阶泰勒展开，并且增加正则化项，进行改进，如下：

将n个样本，m个特征形成数据集

为样本

在第

轮的预测值，则样本

最终预测值如公式（5）所示：

（5）

其中，K为下标，

为前

轮的预测值，

表示如公式（6）所示：

（6）

其中，

为惩罚力度，

为惩罚项，

为系数，

为叶子结点个数，

为样本数，

为权值。

6.根据权利要求1所述的交通流预测方法，其特征在于，对其进行训练时：先利用预处理之后的训练集数据先使用增加Dropout层的LSTM模型进行训练，再将全连接层获取到的隐藏层特征作为XGBoost模型的输入项并对其进行再次训练，在XGBoost模型训练结束后，整个LSTM-XGBoost组合预测模型的训练完成。