CN112766597B

CN112766597B - 公交客流预测方法及系统

Info

Publication number: CN112766597B
Application number: CN202110126791.2A
Authority: CN
Inventors: 朱凤华; 张伟; 吕宜生; 陈圆圆; 谭思敏; 熊刚; 王飞跃; 郑丽玲
Original assignee: Institute of Automation of Chinese Academy of Science; Cloud Computing Industry Technology Innovation and Incubation Center of CAS
Current assignee: Institute of Automation of Chinese Academy of Science; Cloud Computing Industry Technology Innovation and Incubation Center of CAS
Priority date: 2021-01-29
Filing date: 2021-01-29
Publication date: 2023-06-27
Anticipated expiration: 2041-01-29
Also published as: CN112766597A

Abstract

本发明涉及城市公交管理技术领域，具体涉及一种公交客流预测方法及系统，旨在提升公交客流量预测的准确性。本发明的公交客流预测方法包括：通过LSTM来提取历史公交客流数据的时间特征；并利用注意力机制对不同时间步上提取到的时间特征进行赋权；使用分时图卷积方法来分析不同时段下公交线路间的空间依赖性；根据预测时段选择不同的关系矩阵，根据赋权后的时间特征，通过谱图卷积方式提取相关公交线路的时空间特征；将时空间特征与天气、节假日信息等外部环境信息进行融合，得到预测结果。本发明可以有效提升公交客流预测精度，并加快学习速率。

Description

公交客流预测方法及系统

技术领域

本发明涉及城市公交管理技术领域，具体涉及一种公交客流预测方法及系统。

背景技术

公共交通是城市交通系统的基础，先进的公共交通系统是智能交通系统的重要组成部分。然而，车辆配置和公交线路的不合理、车次安排无法很好地契合人们出行需求的变化等都会极大地影响城市的公交服务水平。准确的公交客流量预测是解决上述问题的关键技术之一，对于城市交通系统的管理和规划具有十分重要的意义。

公交客流量预测旨在根据过去一段时间的客流量数据及其他信息(如天气、线路车次安排等)来预测未来一段时间内的客流量，可以认为是一种时空间序列预测问题。近年来，基于神经网络的深度学习算法逐渐成为这种问题的主流研究方法。根据预测目标的不同，客流量预测可分为区域流量预测、车站流量预测和线路流量预测。区域预测通过城市区域进行划分，来预测不同区域总的客流量分布；车站流量预测直接对公交车站在一段时间内的客流量进行预测；而线路流量预测旨在分析一段时间内某一条或多条路线总的客流量变化特征。其中，线路流量预测对公交车的线路优化具有重要意义，但目前对于多条公交线路客流量的时空间特征分析，国内外相关研究还相对较少。

公交路网结构可以看作是一种拓扑图G＝(V，A)，各线路构成图中的结点集合V，V的模等于公交线路的数量，即|V|＝N，而线路之间的连接及其强度则通过邻接矩阵集合A＝{A_k|k＝1，2，...，N_r}来描述。这里A_k∈R^N×N为第k个时段对应的邻接矩阵，N_r为划分时段的数量。取

为第t个时间步上各线路的测量数据，则X＝(X₁，X₂，...，X_τ)∈R^τ×N对应各公交线路在过去τ个时间段内的所有测量数据。公交线路客流量预测任务旨在利用这些历史测量数据，对未来一个时间步上各线路的上车客流量进行预测，如公式(1)所示：

其中，P_t：R^τ×N→R^N为预测函数，即为本发明要解决的方法。

发明内容

为了解决现有技术中的上述问题，本发明提出了一种公交客流预测方法及系统，有效提高了公交客流量预测的准确性。

本发明的一方面，提出了一种公交客流预测方法，所述方法包括：

提取历史公交客流数据的时间特征；

对不同时间步上提取到的所述时间特征进行赋权；

根据赋权后的所述时间特征，进行空间特征提取，得到相关公交线路的时空间特征；

将所述时空间特征与外部环境信息进行融合，得到预测结果。

优选地，“提取历史公交客流数据的时间特征”的步骤包括：

利用LSTM网络学习历史公交客流数据中的隐含时间特征，得到不同时间步上数据的高维特征表示；

根据所述高维特征表示，利用全连接网络提取所述历史公交客流数据在同维度下的时间特征。

优选地，“提取历史公交客流数据的时间特征”的步骤还包括：

利用残差结构融合所述历史公交客流数据与所述历史公交客流数据在同维度下的时间特征：

H＝X+δ(W·LSTM(X)+b)

其中，H∈R^τ×N为融合后的时间特征，且H＝(H₁，H₂，...H_τ)^T，X为所述历史公交客流数据，X＝(X₁，X₂，...，X_τ)，δ是ReLU激活函数，LSTM(X)为所述历史公交客流数据在同维度下的时间特征，W和b均为可训练参数。

优选地，“对不同时间步上提取到的所述时间特征进行赋权”的步骤包括：

使用平均池化的方式整合每个时间步上的总体信息：

其中，C＝1，2，...，τ；τ为时间步的大小；H_C为不同时间步上的隐藏特征；N_C为H_C的特征维度；

为H_C在第i维的隐藏特征；

通过两层没有偏置的全连接网络，捕捉不同时间步上总体信息的相互依赖关系，并计算出相应的权值向量：

s＝F_ex(z，W)＝σ(W₂δ(W₁z))

其中，s＝(s₁，s₂，...s_τ)∈R^τ，σ和δ分别为sigmoid和ReLU激活函数，W₁和W₂均为可训练参数，

α＞1为降维因子；

根据所述权值向量对每个时间步上提取到的时间特征赋予相应的权重：

其中，C＝1，2，...，τ。

优选地，“根据赋权后的所述时间特征，进行空间特征提取，得到相关公交线路的时空间特征”的步骤包括：

对于任意公交线路，通过谱图卷积聚合该公交线路及相关线路时间特征，从而实现对时空间特征的提取：

其中，H^(l)为第l层的输出，且

σ是激活函数，/>

是标准化后的对称邻接矩阵，/>

A为关系矩阵，I_N为单位矩阵，/>

为对角矩阵且满足/>

i和j的取值范围均为[0，N)，/>

是可训练参数，H⁽⁰⁾＝H，H为赋权后的所述时间特征，l为超参数。

优选地，在“对于任意公交线路，通过谱图卷积聚合该公交线路及相关线路时间特征，从而实现对时空间特征的提取”之前，还包括：

根据各自时段内的客流量分布，利用Spearman相关系数计算不同公交路线的相互联系：

其中，

表示线路R_i在第k个时段下、第t个时刻的客流量大小相对于该时段下所有时间序列的排名，/>

为/>

的均值，T_k为序列的长度，Th_k为预设的门槛值。

优选地，“对于任意公交线路，通过谱图卷积方法聚合该公交线路及相关线路时间特征，从而实现对时空间特征的提取”之前，还包括：

根据一天中的时段数，将输入数据所在时段编码为One-hot向量

并将所述One-hot向量/>

与关系矩阵集合/>

相乘，得到相应的邻接关系，进而得到关系矩阵A；

其中，

T_t∈R^q，

为T_t的第k个值，q为一天中的时间段个数；

所述关系矩阵集合

为一个多通道矩阵，且/>

优选地，在“对于任意公交线路，通过下式的谱图卷积方法聚合该公交线路及相关线路时间特征，从而实现对时空间特征的提取”之后，还包括：

利用残差结构融合上一网络层所提取到的隐藏特征以及通过谱图卷积方法提取的时空间特征：

其中，

为标准化后的邻接矩阵。

优选地，所述外部环境信息包括：节假日信息、天气信息和时段信息；

“将所述时空间特征与外部环境信息进行融合，得到预测结果”的步骤包括：

对所述外部环境信息分别进行独热编码，得到外部环境向量；

利用嵌入方法获得各类所述外部环境向量的局部特征表示：

H_E＝WE

其中，H_E∈R^O为所述局部特征表示，E∈R^I为编码后的所述外部环境向量，W∈R^O×I为可训练参数；

利用全连接网络整合所述局部特征，

将所述时空间特征与整合后的局部特征进行融合，得到预测结果。

本发明的另一方面，提出了一种公交客流预测系统，所述系统包括：

时间特征提取模块，配置为提取历史公交客流数据的时间特征；

注意力机制模块，配置为对不同时间步上提取到的所述时间特征进行赋权；

空间特征提取模块，配置为根据赋权后的所述时间特征进行空间特征的提取，得到相关公交线路的时空间特征；

外部特征融合模块，配置为将所述时空间特征与外部环境信息进行融合，得到预测结果。

优选地，所述时间特征提取模块包括：多个LSTM模块，以及全连接层；

所述LSTM模块配置为：利用LSTM网络学习历史公交客流数据中的隐含时间特征，得到不同时间步上数据的高维特征表示；

所述全连接层配置为：根据所述高维特征表示，利用全连接网络提取所述历史公交客流数据在同维度下的时间特征。

其中，

每个所述LSTM模块包含一个cell、一个输入门、一个遗忘门和一个输出门。

优选地，所述时间特征提取模块还包括：残差模块；

所述残差模块配置为：利用残差结构融合所述历史公交客流数据与所述历史公交客流数据在同维度下的时间特征：

H＝X+δ(W·LSTM(X)+b)

优选地，所述注意力机制模块包括：整合单元、权值计算单元和赋权单元；

所述整合单元配置为：使用平均池化的方式整合每个时间步上的总体信息：

为H_C在第i维的隐藏特征；

所述权值计算单元配置为：通过两层没有偏置的全连接网络，捕捉不同时间步上总体信息的相互依赖关系，并计算出相应的权值向量：

s＝F_ex(z，W)＝σ(W₂δ(W₁z))

α＞1为降维因子；

所述赋权单元配置为：根据所述权值向量对每个时间步上提取到的时间特征赋予相应的权重：

其中，C＝1，2，...，τ。

优选地，所述空间特征提取模块包括：谱图卷积单元；

所述谱图卷积单元配置为：对于任意公交线路，按照下式的方法通过谱图卷积聚合该公交线路及相关线路时间特征，从而实现对时空间特征的提取：

其中，H^(l)为第l层的输出，且

σ是激活函数，/>

是标准化后的对称邻接矩阵，/>

A为关系矩阵，I_N为单位矩阵，/>

为对角矩阵且满足/>

i和j的取值范围均为[0，N)，/>

优选地，所述空间特征提取模块还包括：相关关系计算单元；

所述相关关系计算单元配置为：根据各自时段内的客流量分布，利用Spearman相关系数计算不同公交路线的相互联系：

其中，

为/>

的均值，T_k为序列的长度，Th_k为预设的门槛值。

优选地，所述空间特征提取模块还包括：关系矩阵计算单元；

所述关系矩阵计算单元配置为：根据一天中的时段数，将输入数据所在时段编码为One-hot向量

并将所述One-hot向量/>

与关系矩阵集合/>

相乘，得到相应的邻接关系，进而得到关系矩阵A；

其中，

T_t∈R^q，

为T_t的第k个值，q为一天中的时间段个数；

所述关系矩阵集合

为一个多通道矩阵，且/>

优选地，所述空间特征提取模块还包括：残差单元；

所述残差单元配置为：利用残差结构融合上一网络层所提取到的隐藏特征以及通过谱图卷积方法提取的时空间特征：

其中，

为标准化后的邻接矩阵。

所述外部特征融合模块包括：编码单元、嵌入单元、全连接层和融合单元；

所述编码单元配置为：对所述外部环境信息分别进行独热编码，得到外部环境向量；

所述嵌入单元配置为：利用嵌入方法获得各类所述外部环境向量的局部特征表示：

H_E＝WE

所述全连接层配置为：利用全连接网络整合所述局部特征；

所述融合单元配置为：将所述时空间特征与整合后的局部特征进行融合，得到预测结果。

与最接近的现有技术相比，本发明具有如下有益效果：

本发明的提出的公交客流预测方法与系统，在时间特征提取后引入残差结构来融合数据原始特征，解决深度神经网络层数增加时带来的学习退化问题，并使网络更容易学习恒等映射函数；使用了Channel-wise注意力模块来对不同时间步上提取到时间特征进行赋权，使模型聚焦于对预测结果影响较大的几个时间步，并降低不相关特征(如噪声)对空间特征提取造成的负面影响；根据所在时段，使用分时谱图卷积的方式来提取公交客流量数据中的时空间特征，以充分考虑路网下各公交线路空间依赖关系在一天内的短期稳定性和长期时变性，从而提取出有效的时空间特征；在提取到数据中的时空间特征后，还要融合诸多外部因素(如天气、时间等)的特征表示，以充分考虑各种因素对客流变化趋势的影响，进一步提升公交客流量预测的准确性。

附图说明

图1是本发明的公交客流预测方法实施例的主要步骤示意图；

图2是本发明公交客流预测系统实施例的构成示意图。

具体实施方式

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅用于解释本发明的技术原理，并非旨在限制本发明的保护范围。

图1是本发明的公交客流预测方法实施例的主要步骤示意图。如图1所示，本实施例的预测方法包括步骤S100-S400：

步骤S100，提取历史公交客流数据的时间特征。该步骤可以具体包括步骤S110-S120：

步骤S110，利用LSTM网络学习历史公交客流数据中的隐含时间特征，得到不同时间步上数据的高维特征表示。

本实施例中，使用多个LSTM模块来提取历史公交客流数据的时间特征，每个LSTM模块包含一个cell、一个输入门、一个遗忘门和一个输出门，每个LSTM模块的计算过程如公式(2)-(7)所示：

i_t＝σ(W_iiX_t+b_ii+W_hih_t-1+b_hi) (2)

f_t＝σ(W_ifX_t+b_if+W_hfh_t-1+b_hf) (3)

g_t＝tanh(W_igX_t+b_ig+W_hgh_t-1+b_hg) (4)

o_t＝σ(W_ioX_t+b_io+W_hoh_t-1+b_ho) (5)

c_t＝f_t⊙c_t-1+i_t⊙g_t (6)

h_t＝o_t*tanh(c_t) (7)

其中，i_t，f_t，g_t，o_t分别对应输入门、遗忘门、cell、输出门。X_t为时刻t的输入，h_t-1指t-1时刻的隐藏层状态，c_t为时刻t的cell状态，σ为激活函数，其余都是可训练的参数。

步骤S120，根据高维特征表示，利用全连接网络提取历史公交客流数据在同维度下的时间特征。

在一种可选的实施例中，在步骤S120之后还可以进一步包括：

步骤S130，利用残差结构融合历史公交客流数据与历史公交客流数据在同维度下的时间特征，如公式(8)所示：

H＝X+δ(W·LSTM(X)+b) (8)

其中，H∈R^τ×N为融合后的时间特征，且H＝(H₁，H₂，...H_τ)^T，X为历史公交客流数据，X＝(X₁，X₂，...，X_τ)，δ是ReLU激活函数，LSTM(X)为历史公交客流数据在同维度下的时间特征，W和b均为可训练参数。

在本步骤中引入残差结构来融合数据原始特征，解决了深度神经网络层数增加时带来的学习退化问题，并使网络更容易学习恒等映射函数。

步骤S200，对不同时间步上提取到的时间特征进行赋权。

本实施例中，使用一种Channel-wise注意力模块来对不同时间步上提取到时间特征进行赋权，使模型聚焦于对预测结果影响较大的几个时间步，并降低不相关特征(如噪声)对空间特征提取造成的负面影响。该步骤可以具体包括步骤S210-S230：

步骤S210，使用平均池化的方式整合每个时间步上的总体信息，如公式(9)所示：

为H_C在第i维的隐藏特征；

步骤S220，通过两层没有偏置的全连接网络，捕捉不同时间步上总体信息的相互依赖关系，并计算出相应的权值向量，如公式(10)所示：

s＝F_ex(z，W)＝σ(W₂δ(W₁z)) (10)

α＞1为降维因子；

步骤S230，根据所述权值向量对每个时间步上提取到的时间特征赋予相应的权重，如公式(11)所示：

其中，C＝1，2，...，τ。

步骤S300，根据赋权后的时间特征，进行空间特征提取，得到相关公交线路的时空间特征。

本实施例中，通过谱图卷积聚合特定公交线路及相关线路时间特征，从而实现对时空间特征的提取。谱图卷积方法的定义如公式(12)所示：

其中，g_θ为卷积核，g_θ＝diag(θ)，θ为可训练参数；x为输入信息；

A为关系矩阵，I_N为单位矩阵；/>

为对角矩阵且满足/>

i和j的取值范围均为[0，N)。

具体地，本实施例中步骤S300可以包括步骤S310-S330：

步骤S310，根据各自时段内的客流量分布，利用Spearman相关系数计算不同公交路线的相互联系，如公式(13)-(14)所示：

其中，

为/>

的均值，T_k为序列的长度，Th_k为预设的门槛值。当公交线路客流间的相关性比较微弱时，考虑这样的联系往往会干扰神经网络对数据特征的提取并造成过拟合现象。因此，本发明通过对各时段下的关系设定门槛值，来减弱这种影响并提取出有效的空间关系。

步骤S320，为了让分时图卷积能够应用于神经网络的批训练过程，可以利用矩阵乘的方式来选择不同时段下的关系矩阵。

具体地，根据一天中的时段数，将输入数据所在时段编码为One-hot向量

并将One-hot向量/>

与关系矩阵集合/>

相乘，得到相应的邻接关系，进而得到关系矩阵A。

其中，

T_t∈R^q，

为T_t的第k个值，q为一天中的时间段个数；

关系矩阵集合

为一个多通道矩阵，且/>

步骤S330，对于任意公交线路，通过谱图卷积聚合该公交线路及相关线路时间特征，从而实现对时空间特征的提取，如公式(16)所示：

其中，H^(l)为第l层的输出，且

σ是激活函数，/>

是标准化后的对称邻接矩阵，/>

A为关系矩阵，I_N为单位矩阵，/>

为对角矩阵且满足/>

i和j的取值范围均为[0，N)，/>

在一种可选的实施例中，在步骤S330之后还可以包括：

步骤S340，利用残差结构融合上一网络层所提取到的隐藏特征(对于第一层来说，融合的是赋权后的时间特征)以及通过谱图卷积方法提取的时空间特征，如公式(17)所示：

其中，

为标准化后的邻接矩阵。

步骤S400，将时空间特征与外部环境信息进行融合，得到预测结果。该步骤可以具体包括步骤S410-S440：

步骤S410，对外部环境信息分别进行独热(One-Hot)编码，得到外部环境向量。

本实施例中的外部环境信息包括：节假日信息、天气信息和时段信息等能够影响到公交客流的外部条件。

步骤S420，利用嵌入(Embed)方法获得各类外部环境向量的局部特征表示，如公式(18)所示：

H_E＝WE (18)

步骤S430，利用全连接网络整合局部特征。

步骤S440，将时空间特征与整合后的局部特征进行融合(将时空间特征与整合后的局部特征拼接起来，通过1～2个全连接层)，得到预测结果。

上述实施例中虽然将各个步骤按照上述先后次序的方式进行了描述，但是本领域技术人员可以理解，为了实现本实施例的效果，不同的步骤之间不必按照这样的次序执行，其可以同时(并行)执行或以颠倒的次序执行，这些简单的变化都在本发明的保护范围之内。

基于与公交客流预测方法实施例相同的技术构思，本发明还提供了公交客流预测系统，下面进行具体说明。

图2是本发明公交客流预测系统实施例的构成示意图。如图2所示，本实施例的预测系统包括：时间特征提取模块100、注意力机制模块200、空间特征提取模块300和外部特征融合模块400。

其中，时间特征提取模块100配置为提取历史公交客流数据的时间特征；注意力机制模块200配置为对不同时间步上提取到的时间特征进行赋权；空间特征提取模块300，配置为根据赋权后的时间特征进行空间特征提取，得到相关公交线路的时空间特征；外部特征融合模块400，配置为将时空间特征与外部环境信息进行融合，得到预测结果。

具体地，本实施例中的时间特征提取模块100可以包括：多个LSTM模块、全连接层和残差模块。每个LSTM模块包含一个cell、一个输入门、一个遗忘门和一个输出门，每个LSTM模块的计算过程如公式(2)-(7)所示。LSTM模块配置为利用LSTM网络学习历史公交客流数据X＝(X₁，X₂，...，X_τ)中的隐含时间特征，得到不同时间步上数据的高维特征表示；全连接层配置为根据高维特征表示，利用全连接网络提取历史公交客流数据在同维度下的时间特征；残差模块配置为利用残差结构融合历史公交客流数据与历史公交客流数据在同维度下的时间特征，如公式(8)所示。

具体地，本实施例中的注意力机制模块200可以包括一个Channel-wiseAttention模块，该模块进一步包括：整合单元、权值计算单元和赋权单元。整合单元配置为使用平均池化的方式整合每个时间步上的总体信息，如公式(9)所示；权值计算单元配置为通过两层没有偏置的全连接网络，捕捉不同时间步上总体信息的相互依赖关系，并计算出相应的权值向量，如公式(10)所示；赋权单元配置为根据权值向量对每个时间步上提取到的时间特征赋予相应的权重，如公式(11)所示。通过上述注意力机制后的隐藏特征为

经过转置后变为/>

具体地，本实施例中的空间特征提取模块300可以包括：相关关系计算单元(图中未示出)、关系矩阵计算单元、谱图卷积单元(GCN)和残差单元。

其中，相关关系计算单元配置为：根据各自时段内的客流量分布，利用Spearman相关系数计算不同公交路线的相互联系，如公式(13)-(14)所示。关系矩阵计算单元配置为根据一天中的时段数(图中示例性地画出了三个连接关系图表示关系矩阵集合

每个连接关系图分别对应不同的时间段)，将输入数据所在时段编码为公式(15)所示的One-hot向量

并将One-hot向量/>

与关系矩阵集合/>

相乘，得到相应的邻接关系，进而得到关系矩阵A；谱图卷积单元配置为对于任意公交线路，采用如公式(16)所示的方法通过谱图卷积聚合该公交线路及相关线路时间特征，从而实现对时空间特征的提取；残差单元配置为利用残差结构融合上一网络层所提取到的隐藏特征以及通过谱图卷积方法提取的时空间特征，如公式(17)所示。

具体地，本实施例中的外部特征融合模块400包括：编码单元(图中未示出)、嵌入单元、全连接层和融合单元。

其中，编码单元配置为对外部环境信息分别进行独热编码，得到外部环境向量。外部环境信息包括：节假日信息、天气信息和时段信息。嵌入单元配置为利用公式(18)所示的嵌入(Embed)方法获得各类外部环境向量的局部特征表示；全连接层配置为利用全连接网络整合局部特征；融合单元配置为将时空间特征与整合后的局部特征进行融合，得到预测结果。

图2的实施例中在外部特征融合模块400之后还包括一个损失函数500(即图中的“Loss”)，右边输入的是实际值Y，模型输出的是预测值

损失函数可以采用均方误差函数(Mean Square Error,MSE)、L1损失函数等。

本申请中对公交客流预测系统进行模块、单元划分，仅仅是为了更好地理解本发明的技术方案所涉及的功能，在实践中，这些模块所对应的功能可以由单个或多个硬件加载程序并执行。

本领域技术人员应该能够意识到，结合本文中所公开的实施例描述的各示例的方法步骤、模块、单元，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明电子硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。