CN112766597B - 公交客流预测方法及系统 - Google Patents
公交客流预测方法及系统 Download PDFInfo
- Publication number
- CN112766597B CN112766597B CN202110126791.2A CN202110126791A CN112766597B CN 112766597 B CN112766597 B CN 112766597B CN 202110126791 A CN202110126791 A CN 202110126791A CN 112766597 B CN112766597 B CN 112766597B
- Authority
- CN
- China
- Prior art keywords
- time
- passenger flow
- bus
- features
- space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000007246 mechanism Effects 0.000 claims abstract description 8
- 239000011159 matrix material Substances 0.000 claims description 54
- 239000013598 vector Substances 0.000 claims description 41
- 238000000605 extraction Methods 0.000 claims description 28
- 230000006870 function Effects 0.000 claims description 25
- 230000004913 activation Effects 0.000 claims description 16
- 230000004927 fusion Effects 0.000 claims description 15
- 230000002123 temporal effect Effects 0.000 claims description 15
- 238000011176 pooling Methods 0.000 claims description 6
- 238000013459 approach Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 5
- 238000012512 characterization method Methods 0.000 claims 1
- 238000004364 calculation method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000010354 integration Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/53—Recognition of crowd images, e.g. recognition of crowd congestion
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Economics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- Multimedia (AREA)
- Bioinformatics & Computational Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Quality & Reliability (AREA)
- Evolutionary Biology (AREA)
- Development Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明涉及城市公交管理技术领域,具体涉及一种公交客流预测方法及系统,旨在提升公交客流量预测的准确性。本发明的公交客流预测方法包括:通过LSTM来提取历史公交客流数据的时间特征;并利用注意力机制对不同时间步上提取到的时间特征进行赋权;使用分时图卷积方法来分析不同时段下公交线路间的空间依赖性;根据预测时段选择不同的关系矩阵,根据赋权后的时间特征,通过谱图卷积方式提取相关公交线路的时空间特征;将时空间特征与天气、节假日信息等外部环境信息进行融合,得到预测结果。本发明可以有效提升公交客流预测精度,并加快学习速率。
Description
技术领域
本发明涉及城市公交管理技术领域,具体涉及一种公交客流预测方法及系统。
背景技术
公共交通是城市交通系统的基础,先进的公共交通系统是智能交通系统的重要组成部分。然而,车辆配置和公交线路的不合理、车次安排无法很好地契合人们出行需求的变化等都会极大地影响城市的公交服务水平。准确的公交客流量预测是解决上述问题的关键技术之一,对于城市交通系统的管理和规划具有十分重要的意义。
公交客流量预测旨在根据过去一段时间的客流量数据及其他信息(如天气、线路车次安排等)来预测未来一段时间内的客流量,可以认为是一种时空间序列预测问题。近年来,基于神经网络的深度学习算法逐渐成为这种问题的主流研究方法。根据预测目标的不同,客流量预测可分为区域流量预测、车站流量预测和线路流量预测。区域预测通过城市区域进行划分,来预测不同区域总的客流量分布;车站流量预测直接对公交车站在一段时间内的客流量进行预测;而线路流量预测旨在分析一段时间内某一条或多条路线总的客流量变化特征。其中,线路流量预测对公交车的线路优化具有重要意义,但目前对于多条公交线路客流量的时空间特征分析,国内外相关研究还相对较少。
公交路网结构可以看作是一种拓扑图G=(V,A),各线路构成图中的结点集合V,V的模等于公交线路的数量,即|V|=N,而线路之间的连接及其强度则通过邻接矩阵集合A={Ak|k=1,2,...,Nr}来描述。这里Ak∈RN×N为第k个时段对应的邻接矩阵,Nr为划分时段的数量。取为第t个时间步上各线路的测量数据,则X=(X1,X2,...,Xτ)∈Rτ×N对应各公交线路在过去τ个时间段内的所有测量数据。公交线路客流量预测任务旨在利用这些历史测量数据,对未来一个时间步上各线路的上车客流量进行预测,如公式(1)所示:
其中,Pt:Rτ×N→RN为预测函数,即为本发明要解决的方法。
发明内容
为了解决现有技术中的上述问题,本发明提出了一种公交客流预测方法及系统,有效提高了公交客流量预测的准确性。
本发明的一方面,提出了一种公交客流预测方法,所述方法包括:
提取历史公交客流数据的时间特征;
对不同时间步上提取到的所述时间特征进行赋权;
根据赋权后的所述时间特征,进行空间特征提取,得到相关公交线路的时空间特征;
将所述时空间特征与外部环境信息进行融合,得到预测结果。
优选地,“提取历史公交客流数据的时间特征”的步骤包括:
利用LSTM网络学习历史公交客流数据中的隐含时间特征,得到不同时间步上数据的高维特征表示;
根据所述高维特征表示,利用全连接网络提取所述历史公交客流数据在同维度下的时间特征。
优选地,“提取历史公交客流数据的时间特征”的步骤还包括:
利用残差结构融合所述历史公交客流数据与所述历史公交客流数据在同维度下的时间特征:
H=X+δ(W·LSTM(X)+b)
其中,H∈Rτ×N为融合后的时间特征,且H=(H1,H2,...Hτ)T,X为所述历史公交客流数据,X=(X1,X2,...,Xτ),δ是ReLU激活函数,LSTM(X)为所述历史公交客流数据在同维度下的时间特征,W和b均为可训练参数。
优选地,“对不同时间步上提取到的所述时间特征进行赋权”的步骤包括:
使用平均池化的方式整合每个时间步上的总体信息:
通过两层没有偏置的全连接网络,捕捉不同时间步上总体信息的相互依赖关系,并计算出相应的权值向量:
s=Fex(z,W)=σ(W2δ(W1z))
根据所述权值向量对每个时间步上提取到的时间特征赋予相应的权重:
其中,C=1,2,...,τ。
优选地,“根据赋权后的所述时间特征,进行空间特征提取,得到相关公交线路的时空间特征”的步骤包括:
对于任意公交线路,通过谱图卷积聚合该公交线路及相关线路时间特征,从而实现对时空间特征的提取:
其中,H(l)为第l层的输出,且σ是激活函数,/>是标准化后的对称邻接矩阵,/>A为关系矩阵,IN为单位矩阵,/>为对角矩阵且满足/>i和j的取值范围均为[0,N),/>是可训练参数,H(0)=H,H为赋权后的所述时间特征,l为超参数。
优选地,在“对于任意公交线路,通过谱图卷积聚合该公交线路及相关线路时间特征,从而实现对时空间特征的提取”之前,还包括:
根据各自时段内的客流量分布,利用Spearman相关系数计算不同公交路线的相互联系:
优选地,“对于任意公交线路,通过谱图卷积方法聚合该公交线路及相关线路时间特征,从而实现对时空间特征的提取”之前,还包括:
其中,
优选地,在“对于任意公交线路,通过下式的谱图卷积方法聚合该公交线路及相关线路时间特征,从而实现对时空间特征的提取”之后,还包括:
利用残差结构融合上一网络层所提取到的隐藏特征以及通过谱图卷积方法提取的时空间特征:
优选地,所述外部环境信息包括:节假日信息、天气信息和时段信息;
“将所述时空间特征与外部环境信息进行融合,得到预测结果”的步骤包括:
对所述外部环境信息分别进行独热编码,得到外部环境向量;
利用嵌入方法获得各类所述外部环境向量的局部特征表示:
HE=WE
其中,HE∈RO为所述局部特征表示,E∈RI为编码后的所述外部环境向量,W∈RO×I为可训练参数;
利用全连接网络整合所述局部特征,
将所述时空间特征与整合后的局部特征进行融合,得到预测结果。
本发明的另一方面,提出了一种公交客流预测系统,所述系统包括:
时间特征提取模块,配置为提取历史公交客流数据的时间特征;
注意力机制模块,配置为对不同时间步上提取到的所述时间特征进行赋权;
空间特征提取模块,配置为根据赋权后的所述时间特征进行空间特征的提取,得到相关公交线路的时空间特征;
外部特征融合模块,配置为将所述时空间特征与外部环境信息进行融合,得到预测结果。
优选地,所述时间特征提取模块包括:多个LSTM模块,以及全连接层;
所述LSTM模块配置为:利用LSTM网络学习历史公交客流数据中的隐含时间特征,得到不同时间步上数据的高维特征表示;
所述全连接层配置为:根据所述高维特征表示,利用全连接网络提取所述历史公交客流数据在同维度下的时间特征。
其中,
每个所述LSTM模块包含一个cell、一个输入门、一个遗忘门和一个输出门。
优选地,所述时间特征提取模块还包括:残差模块;
所述残差模块配置为:利用残差结构融合所述历史公交客流数据与所述历史公交客流数据在同维度下的时间特征:
H=X+δ(W·LSTM(X)+b)
其中,H∈Rτ×N为融合后的时间特征,且H=(H1,H2,...Hτ)T,X为所述历史公交客流数据,X=(X1,X2,...,Xτ),δ是ReLU激活函数,LSTM(X)为所述历史公交客流数据在同维度下的时间特征,W和b均为可训练参数。
优选地,所述注意力机制模块包括:整合单元、权值计算单元和赋权单元;
所述整合单元配置为:使用平均池化的方式整合每个时间步上的总体信息:
所述权值计算单元配置为:通过两层没有偏置的全连接网络,捕捉不同时间步上总体信息的相互依赖关系,并计算出相应的权值向量:
s=Fex(z,W)=σ(W2δ(W1z))
所述赋权单元配置为:根据所述权值向量对每个时间步上提取到的时间特征赋予相应的权重:
其中,C=1,2,...,τ。
优选地,所述空间特征提取模块包括:谱图卷积单元;
所述谱图卷积单元配置为:对于任意公交线路,按照下式的方法通过谱图卷积聚合该公交线路及相关线路时间特征,从而实现对时空间特征的提取:
其中,H(l)为第l层的输出,且σ是激活函数,/>是标准化后的对称邻接矩阵,/>A为关系矩阵,IN为单位矩阵,/>为对角矩阵且满足/>i和j的取值范围均为[0,N),/>是可训练参数,H(0)=H,H为赋权后的所述时间特征,l为超参数。
优选地,所述空间特征提取模块还包括:相关关系计算单元;
所述相关关系计算单元配置为:根据各自时段内的客流量分布,利用Spearman相关系数计算不同公交路线的相互联系:
优选地,所述空间特征提取模块还包括:关系矩阵计算单元;
其中,
优选地,所述空间特征提取模块还包括:残差单元;
所述残差单元配置为:利用残差结构融合上一网络层所提取到的隐藏特征以及通过谱图卷积方法提取的时空间特征:
优选地,所述外部环境信息包括:节假日信息、天气信息和时段信息;
所述外部特征融合模块包括:编码单元、嵌入单元、全连接层和融合单元;
所述编码单元配置为:对所述外部环境信息分别进行独热编码,得到外部环境向量;
所述嵌入单元配置为:利用嵌入方法获得各类所述外部环境向量的局部特征表示:
HE=WE
其中,HE∈RO为所述局部特征表示,E∈RI为编码后的所述外部环境向量,W∈RO×I为可训练参数;
所述全连接层配置为:利用全连接网络整合所述局部特征;
所述融合单元配置为:将所述时空间特征与整合后的局部特征进行融合,得到预测结果。
与最接近的现有技术相比,本发明具有如下有益效果:
本发明的提出的公交客流预测方法与系统,在时间特征提取后引入残差结构来融合数据原始特征,解决深度神经网络层数增加时带来的学习退化问题,并使网络更容易学习恒等映射函数;使用了Channel-wise注意力模块来对不同时间步上提取到时间特征进行赋权,使模型聚焦于对预测结果影响较大的几个时间步,并降低不相关特征(如噪声)对空间特征提取造成的负面影响;根据所在时段,使用分时谱图卷积的方式来提取公交客流量数据中的时空间特征,以充分考虑路网下各公交线路空间依赖关系在一天内的短期稳定性和长期时变性,从而提取出有效的时空间特征;在提取到数据中的时空间特征后,还要融合诸多外部因素(如天气、时间等)的特征表示,以充分考虑各种因素对客流变化趋势的影响,进一步提升公交客流量预测的准确性。
附图说明
图1是本发明的公交客流预测方法实施例的主要步骤示意图;
图2是本发明公交客流预测系统实施例的构成示意图。
具体实施方式
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。
图1是本发明的公交客流预测方法实施例的主要步骤示意图。如图1所示,本实施例的预测方法包括步骤S100-S400:
步骤S100,提取历史公交客流数据的时间特征。该步骤可以具体包括步骤S110-S120:
步骤S110,利用LSTM网络学习历史公交客流数据中的隐含时间特征,得到不同时间步上数据的高维特征表示。
本实施例中,使用多个LSTM模块来提取历史公交客流数据的时间特征,每个LSTM模块包含一个cell、一个输入门、一个遗忘门和一个输出门,每个LSTM模块的计算过程如公式(2)-(7)所示:
it=σ(WiiXt+bii+Whiht-1+bhi) (2)
ft=σ(WifXt+bif+Whfht-1+bhf) (3)
gt=tanh(WigXt+big+Whght-1+bhg) (4)
ot=σ(WioXt+bio+Whoht-1+bho) (5)
ct=ft⊙ct-1+it⊙gt (6)
ht=ot*tanh(ct) (7)
其中,it,ft,gt,ot分别对应输入门、遗忘门、cell、输出门。Xt为时刻t的输入,ht-1指t-1时刻的隐藏层状态,ct为时刻t的cell状态,σ为激活函数,其余都是可训练的参数。
步骤S120,根据高维特征表示,利用全连接网络提取历史公交客流数据在同维度下的时间特征。
在一种可选的实施例中,在步骤S120之后还可以进一步包括:
步骤S130,利用残差结构融合历史公交客流数据与历史公交客流数据在同维度下的时间特征,如公式(8)所示:
H=X+δ(W·LSTM(X)+b) (8)
其中,H∈Rτ×N为融合后的时间特征,且H=(H1,H2,...Hτ)T,X为历史公交客流数据,X=(X1,X2,...,Xτ),δ是ReLU激活函数,LSTM(X)为历史公交客流数据在同维度下的时间特征,W和b均为可训练参数。
在本步骤中引入残差结构来融合数据原始特征,解决了深度神经网络层数增加时带来的学习退化问题,并使网络更容易学习恒等映射函数。
步骤S200,对不同时间步上提取到的时间特征进行赋权。
本实施例中,使用一种Channel-wise注意力模块来对不同时间步上提取到时间特征进行赋权,使模型聚焦于对预测结果影响较大的几个时间步,并降低不相关特征(如噪声)对空间特征提取造成的负面影响。该步骤可以具体包括步骤S210-S230:
步骤S210,使用平均池化的方式整合每个时间步上的总体信息,如公式(9)所示:
步骤S220,通过两层没有偏置的全连接网络,捕捉不同时间步上总体信息的相互依赖关系,并计算出相应的权值向量,如公式(10)所示:
s=Fex(z,W)=σ(W2δ(W1z)) (10)
步骤S230,根据所述权值向量对每个时间步上提取到的时间特征赋予相应的权重,如公式(11)所示:
其中,C=1,2,...,τ。
步骤S300,根据赋权后的时间特征,进行空间特征提取,得到相关公交线路的时空间特征。
本实施例中,通过谱图卷积聚合特定公交线路及相关线路时间特征,从而实现对时空间特征的提取。谱图卷积方法的定义如公式(12)所示:
具体地,本实施例中步骤S300可以包括步骤S310-S330:
步骤S310,根据各自时段内的客流量分布,利用Spearman相关系数计算不同公交路线的相互联系,如公式(13)-(14)所示:
其中,表示线路Ri在第k个时段下、第t个时刻的客流量大小相对于该时段下所有时间序列的排名,/>为/>的均值,Tk为序列的长度,Thk为预设的门槛值。当公交线路客流间的相关性比较微弱时,考虑这样的联系往往会干扰神经网络对数据特征的提取并造成过拟合现象。因此,本发明通过对各时段下的关系设定门槛值,来减弱这种影响并提取出有效的空间关系。
步骤S320,为了让分时图卷积能够应用于神经网络的批训练过程,可以利用矩阵乘的方式来选择不同时段下的关系矩阵。
其中,
步骤S330,对于任意公交线路,通过谱图卷积聚合该公交线路及相关线路时间特征,从而实现对时空间特征的提取,如公式(16)所示:
其中,H(l)为第l层的输出,且σ是激活函数,/>是标准化后的对称邻接矩阵,/>A为关系矩阵,IN为单位矩阵,/>为对角矩阵且满足/>i和j的取值范围均为[0,N),/>是可训练参数,H(0)=H,H为赋权后的所述时间特征,l为超参数。
在一种可选的实施例中,在步骤S330之后还可以包括:
步骤S340,利用残差结构融合上一网络层所提取到的隐藏特征(对于第一层来说,融合的是赋权后的时间特征)以及通过谱图卷积方法提取的时空间特征,如公式(17)所示:
步骤S400,将时空间特征与外部环境信息进行融合,得到预测结果。该步骤可以具体包括步骤S410-S440:
步骤S410,对外部环境信息分别进行独热(One-Hot)编码,得到外部环境向量。
本实施例中的外部环境信息包括:节假日信息、天气信息和时段信息等能够影响到公交客流的外部条件。
步骤S420,利用嵌入(Embed)方法获得各类外部环境向量的局部特征表示,如公式(18)所示:
HE=WE (18)
其中,HE∈RO为所述局部特征表示,E∈RI为编码后的所述外部环境向量,W∈RO×I为可训练参数;
步骤S430,利用全连接网络整合局部特征。
步骤S440,将时空间特征与整合后的局部特征进行融合(将时空间特征与整合后的局部特征拼接起来,通过1~2个全连接层),得到预测结果。
上述实施例中虽然将各个步骤按照上述先后次序的方式进行了描述,但是本领域技术人员可以理解,为了实现本实施例的效果,不同的步骤之间不必按照这样的次序执行,其可以同时(并行)执行或以颠倒的次序执行,这些简单的变化都在本发明的保护范围之内。
基于与公交客流预测方法实施例相同的技术构思,本发明还提供了公交客流预测系统,下面进行具体说明。
图2是本发明公交客流预测系统实施例的构成示意图。如图2所示,本实施例的预测系统包括:时间特征提取模块100、注意力机制模块200、空间特征提取模块300和外部特征融合模块400。
其中,时间特征提取模块100配置为提取历史公交客流数据的时间特征;注意力机制模块200配置为对不同时间步上提取到的时间特征进行赋权;空间特征提取模块300,配置为根据赋权后的时间特征进行空间特征提取,得到相关公交线路的时空间特征;外部特征融合模块400,配置为将时空间特征与外部环境信息进行融合,得到预测结果。
具体地,本实施例中的时间特征提取模块100可以包括:多个LSTM模块、全连接层和残差模块。每个LSTM模块包含一个cell、一个输入门、一个遗忘门和一个输出门,每个LSTM模块的计算过程如公式(2)-(7)所示。LSTM模块配置为利用LSTM网络学习历史公交客流数据X=(X1,X2,...,Xτ)中的隐含时间特征,得到不同时间步上数据的高维特征表示;全连接层配置为根据高维特征表示,利用全连接网络提取历史公交客流数据在同维度下的时间特征;残差模块配置为利用残差结构融合历史公交客流数据与历史公交客流数据在同维度下的时间特征,如公式(8)所示。
具体地,本实施例中的注意力机制模块200可以包括一个Channel-wiseAttention模块,该模块进一步包括:整合单元、权值计算单元和赋权单元。整合单元配置为使用平均池化的方式整合每个时间步上的总体信息,如公式(9)所示;权值计算单元配置为通过两层没有偏置的全连接网络,捕捉不同时间步上总体信息的相互依赖关系,并计算出相应的权值向量,如公式(10)所示;赋权单元配置为根据权值向量对每个时间步上提取到的时间特征赋予相应的权重,如公式(11)所示。通过上述注意力机制后的隐藏特征为经过转置后变为/>
具体地,本实施例中的空间特征提取模块300可以包括:相关关系计算单元(图中未示出)、关系矩阵计算单元、谱图卷积单元(GCN)和残差单元。
其中,相关关系计算单元配置为:根据各自时段内的客流量分布,利用Spearman相关系数计算不同公交路线的相互联系,如公式(13)-(14)所示。关系矩阵计算单元配置为根据一天中的时段数(图中示例性地画出了三个连接关系图表示关系矩阵集合每个连接关系图分别对应不同的时间段),将输入数据所在时段编码为公式(15)所示的One-hot向量并将One-hot向量/>与关系矩阵集合/>相乘,得到相应的邻接关系,进而得到关系矩阵A;谱图卷积单元配置为对于任意公交线路,采用如公式(16)所示的方法通过谱图卷积聚合该公交线路及相关线路时间特征,从而实现对时空间特征的提取;残差单元配置为利用残差结构融合上一网络层所提取到的隐藏特征以及通过谱图卷积方法提取的时空间特征,如公式(17)所示。
具体地,本实施例中的外部特征融合模块400包括:编码单元(图中未示出)、嵌入单元、全连接层和融合单元。
其中,编码单元配置为对外部环境信息分别进行独热编码,得到外部环境向量。外部环境信息包括:节假日信息、天气信息和时段信息。嵌入单元配置为利用公式(18)所示的嵌入(Embed)方法获得各类外部环境向量的局部特征表示;全连接层配置为利用全连接网络整合局部特征;融合单元配置为将时空间特征与整合后的局部特征进行融合,得到预测结果。
图2的实施例中在外部特征融合模块400之后还包括一个损失函数500(即图中的“Loss”),右边输入的是实际值Y,模型输出的是预测值损失函数可以采用均方误差函数(Mean Square Error,MSE)、L1损失函数等。
本申请中对公交客流预测系统进行模块、单元划分,仅仅是为了更好地理解本发明的技术方案所涉及的功能,在实践中,这些模块所对应的功能可以由单个或多个硬件加载程序并执行。
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的方法步骤、模块、单元,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (4)
1.一种公交客流预测方法,其特征在于,所述方法包括:
提取历史公交客流数据的时间特征,包括:
利用LSTM网络学习历史公交客流数据中的隐含时间特征,得到不同时间步上数据的高维特征表示;
根据所述高维特征表示,利用全连接网络提取所述历史公交客流数据在同维度下的时间特征;
利用残差结构融合所述历史公交客流数据与所述历史公交客流数据在同维度下的时间特征:
H=X+δ(W·LSTM(X)+b)
其中,H∈Rτ×N为融合后的时间特征,且H=(H1,H2,…Hτ)T,X为所述历史公交客流数据,X=(X1,X2,…,Xτ),δ是ReLU激活函数,LSTM(X)为所述历史公交客流数据在同维度下的时间特征,W和b均为可训练参数;
对不同时间步上提取到的所述时间特征进行赋权,包括:
使用平均池化的方式整合每个时间步上的总体信息:
通过两层没有偏置的全连接网络,捕捉不同时间步上总体信息的相互依赖关系,并计算出相应的权值向量:
s=Fex(z,W)=σ(W2δ(W1z))
根据所述权值向量对每个时间步上提取到的时间特征赋予相应的权重:
其中,C=1,2,...,τ;
根据赋权后的所述时间特征,进行空间特征提取,得到相关公交线路的时空间特征,包括:
根据各自时段内的客流量分布,利用Spearman相关系数计算不同公交路线的相互联系:
其中,
对于任意公交线路,通过谱图卷积聚合该公交线路及相关线路时间特征,从而实现对时空间特征的提取:
其中,H(l)为第l层的输出,且σ是激活函数,/>是标准化后的对称邻接矩阵,/>A为关系矩阵,IN为单位矩阵,/>为对角矩阵且满足/>i和j的取值范围均为[0,N),/>是可训练参数,H(0)=H,H为赋权后的所述时间特征,l为超参数;
利用残差结构融合上一网络层所提取到的隐藏特征以及通过谱图卷积方法提取的时空间特征:
将所述时空间特征与外部环境信息进行融合,得到预测结果。
2.根据权利要求1所述的公交客流预测方法,其特征在于,
所述外部环境信息包括:节假日信息、天气信息和时段信息;
“将所述时空间特征与外部环境信息进行融合,得到预测结果”的步骤包括:
对所述外部环境信息分别进行独热编码,得到外部环境向量;
利用嵌入方法获得各类所述外部环境向量的局部特征表示:
HE=WE
其中,HE∈RO为所述局部特征表示,E∈RI为编码后的所述外部环境向量,W∈RO×I为可训练参数;
利用全连接网络整合所述局部特征,
将所述时空间特征与整合后的局部特征进行融合,得到预测结果。
3.一种公交客流预测系统,其特征在于,所述系统包括:
时间特征提取模块,配置为提取历史公交客流数据的时间特征,包括:
利用LSTM网络学习历史公交客流数据中的隐含时间特征,得到不同时间步上数据的高维特征表示;
根据所述高维特征表示,利用全连接网络提取所述历史公交客流数据在同维度下的时间特征;
利用残差结构融合所述历史公交客流数据与所述历史公交客流数据在同维度下的时间特征:
H=X+δ(W·LSTM(X)+b)
其中,H∈Rτ×N为融合后的时间特征,且H=(H1,H2,…Hτ)T,X为所述历史公交客流数据,X=(X1,X2,…,Xτ),δ是ReLU激活函数,LSTM(X)为所述历史公交客流数据在同维度下的时间特征,W和b均为可训练参数;
注意力机制模块,配置为对不同时间步上提取到的所述时间特征进行赋权,包括:
使用平均池化的方式整合每个时间步上的总体信息:
通过两层没有偏置的全连接网络,捕捉不同时间步上总体信息的相互依赖关系,并计算出相应的权值向量:
s=Fex(z,W)=σ(W2δ(W1z))
根据所述权值向量对每个时间步上提取到的时间特征赋予相应的权重:
其中,C=1,2,...,τ;
空间特征提取模块,配置为根据赋权后的所述时间特征进行空间特征提取,得到相关公交线路的时空间特征,包括:
根据各自时段内的客流量分布,利用Spearman相关系数计算不同公交路线的相互联系:
其中,
对于任意公交线路,通过谱图卷积聚合该公交线路及相关线路时间特征,从而实现对时空间特征的提取:
其中,H(l)为第l层的输出,且σ是激活函数,/>是标准化后的对称邻接矩阵,/>A为关系矩阵,IN为单位矩阵,/>为对角矩阵且满足/>i和j的取值范围均为[0,N),/>是可训练参数,H(0)=H,H为赋权后的所述时间特征,l为超参数;
利用残差结构融合上一网络层所提取到的隐藏特征以及通过谱图卷积方法提取的时空间特征:
外部特征融合模块,配置为将所述时空间特征与外部环境信息进行融合,得到预测结果。
4.根据权利要求3所述的公交客流预测系统,其特征在于,
所述外部环境信息包括:节假日信息、天气信息和时段信息;
所述外部特征融合模块包括:编码单元、嵌入单元、全连接层和融合单元;
所述编码单元配置为:对所述外部环境信息分别进行独热编码,得到外部环境向量;
所述嵌入单元配置为:利用嵌入方法获得各类所述外部环境向量的局部特征表示:
HE=WE
其中,HE∈RO为所述局部特征表示,E∈RI为编码后的所述外部环境向量,W∈RO×I为可训练参数;
所述全连接层配置为:利用全连接网络整合所述局部特征;
所述融合单元配置为:将所述时空间特征与整合后的局部特征进行融合,得到预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110126791.2A CN112766597B (zh) | 2021-01-29 | 2021-01-29 | 公交客流预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110126791.2A CN112766597B (zh) | 2021-01-29 | 2021-01-29 | 公交客流预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112766597A CN112766597A (zh) | 2021-05-07 |
CN112766597B true CN112766597B (zh) | 2023-06-27 |
Family
ID=75703747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110126791.2A Active CN112766597B (zh) | 2021-01-29 | 2021-01-29 | 公交客流预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112766597B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112949952B (zh) * | 2021-05-10 | 2021-08-17 | 北京人人云图信息技术有限公司 | 一种基于图神经网络的航班客座率的预测方法及系统 |
CN113283588B (zh) * | 2021-06-03 | 2022-04-19 | 青岛励图高科信息技术有限公司 | 一种基于深度学习的近岸单点海浪浪高预报方法 |
CN113298314B (zh) * | 2021-06-10 | 2023-09-01 | 重庆大学 | 一种考虑动态时空相关性的轨道交通客流预测方法 |
CN113537569B (zh) * | 2021-06-18 | 2023-11-28 | 华南理工大学 | 一种基于权重堆叠决策树的短时公交客流预测方法及系统 |
CN113537580B (zh) * | 2021-06-28 | 2024-04-09 | 中科领航智能科技(苏州)有限公司 | 一种基于自适应图学习的公共交通客流预测方法及系统 |
CN116050673B (zh) * | 2023-03-31 | 2023-08-01 | 深圳市城市交通规划设计研究中心股份有限公司 | 基于CNN-BiLSTM的城市公交客流短时预测方法 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108364023A (zh) * | 2018-02-11 | 2018-08-03 | 北京达佳互联信息技术有限公司 | 基于注意力模型的图像识别方法和系统 |
CN108564228A (zh) * | 2018-04-26 | 2018-09-21 | 重庆大学 | 一种基于时序特征预测轨道交通od客流量的方法 |
CN109242140A (zh) * | 2018-07-24 | 2019-01-18 | 浙江工业大学 | 一种基于LSTM_Attention网络的交通流预测方法 |
CN109583656A (zh) * | 2018-12-06 | 2019-04-05 | 重庆邮电大学 | 基于a-lstm的城市轨道交通客流量预测方法 |
CN109598935A (zh) * | 2018-12-14 | 2019-04-09 | 银江股份有限公司 | 一种基于超长时间序列的交通数据预测方法 |
CN110264709A (zh) * | 2019-05-06 | 2019-09-20 | 北京交通大学 | 基于图卷积网络的道路的交通流量的预测方法 |
CN110827543A (zh) * | 2019-11-11 | 2020-02-21 | 重庆邮电大学 | 一种基于深度学习和时空数据融合的短时交通流控制方法 |
CN111091225A (zh) * | 2019-11-08 | 2020-05-01 | 北京交通大学 | 一种基于深度学习的城市轨道交通短期客流预测方法 |
CN111161535A (zh) * | 2019-12-23 | 2020-05-15 | 山东大学 | 基于注意力机制的图神经网络交通流量预测方法及系统 |
CN111223301A (zh) * | 2020-03-11 | 2020-06-02 | 北京理工大学 | 一种基于图注意力卷积网络的交通流量预测方法 |
CN111651504A (zh) * | 2020-06-03 | 2020-09-11 | 湖南大学 | 基于深度学习的多元时间序列多层时空依赖建模方法 |
CN111738535A (zh) * | 2020-08-25 | 2020-10-02 | 北京交通大学 | 轨道交通时空短时客流预测方法、装置、设备及存储介质 |
CN111815046A (zh) * | 2020-07-06 | 2020-10-23 | 北京交通大学 | 基于深度学习的交通流量预测方法 |
CN111861027A (zh) * | 2020-07-29 | 2020-10-30 | 北京工商大学 | 一种基于深度学习融合模型的城市交通流量预测方法 |
CN112001548A (zh) * | 2020-08-25 | 2020-11-27 | 北京交通大学 | 一种基于深度学习的od客流预测方法 |
-
2021
- 2021-01-29 CN CN202110126791.2A patent/CN112766597B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108364023A (zh) * | 2018-02-11 | 2018-08-03 | 北京达佳互联信息技术有限公司 | 基于注意力模型的图像识别方法和系统 |
CN108564228A (zh) * | 2018-04-26 | 2018-09-21 | 重庆大学 | 一种基于时序特征预测轨道交通od客流量的方法 |
CN109242140A (zh) * | 2018-07-24 | 2019-01-18 | 浙江工业大学 | 一种基于LSTM_Attention网络的交通流预测方法 |
CN109583656A (zh) * | 2018-12-06 | 2019-04-05 | 重庆邮电大学 | 基于a-lstm的城市轨道交通客流量预测方法 |
CN109598935A (zh) * | 2018-12-14 | 2019-04-09 | 银江股份有限公司 | 一种基于超长时间序列的交通数据预测方法 |
CN110264709A (zh) * | 2019-05-06 | 2019-09-20 | 北京交通大学 | 基于图卷积网络的道路的交通流量的预测方法 |
CN111091225A (zh) * | 2019-11-08 | 2020-05-01 | 北京交通大学 | 一种基于深度学习的城市轨道交通短期客流预测方法 |
CN110827543A (zh) * | 2019-11-11 | 2020-02-21 | 重庆邮电大学 | 一种基于深度学习和时空数据融合的短时交通流控制方法 |
CN111161535A (zh) * | 2019-12-23 | 2020-05-15 | 山东大学 | 基于注意力机制的图神经网络交通流量预测方法及系统 |
CN111223301A (zh) * | 2020-03-11 | 2020-06-02 | 北京理工大学 | 一种基于图注意力卷积网络的交通流量预测方法 |
CN111651504A (zh) * | 2020-06-03 | 2020-09-11 | 湖南大学 | 基于深度学习的多元时间序列多层时空依赖建模方法 |
CN111815046A (zh) * | 2020-07-06 | 2020-10-23 | 北京交通大学 | 基于深度学习的交通流量预测方法 |
CN111861027A (zh) * | 2020-07-29 | 2020-10-30 | 北京工商大学 | 一种基于深度学习融合模型的城市交通流量预测方法 |
CN111738535A (zh) * | 2020-08-25 | 2020-10-02 | 北京交通大学 | 轨道交通时空短时客流预测方法、装置、设备及存储介质 |
CN112001548A (zh) * | 2020-08-25 | 2020-11-27 | 北京交通大学 | 一种基于深度学习的od客流预测方法 |
Non-Patent Citations (4)
Title |
---|
A hybrid deep learning approach with GCN and LSTM for traffic flow prediction;Li Z et al.;2019 IEEE intelligent transportation systems conference (ITSC);全文 * |
基于时空多图卷积网络的交通站点流量预测;荣斌等;计算机工程;第46卷(第5期);全文 * |
基于注意力机制和分时图卷积的公交客流预测;张伟等;《模式识别与人工智能》;第34卷(第2期);全文 * |
面向数据驱动的城市轨道交通短时客流预测模型;梁强升;许心越;刘利强;;中国铁道科学(第04期) * |
Also Published As
Publication number | Publication date |
---|---|
CN112766597A (zh) | 2021-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112766597B (zh) | 公交客流预测方法及系统 | |
CN109285346B (zh) | 一种基于关键路段的城市路网交通状态预测方法 | |
CN110223517B (zh) | 基于时空相关性的短时交通流量预测方法 | |
CN110991713B (zh) | 基于多图卷积和gru的不规则区域流量预测方法 | |
CN109658695B (zh) | 一种多因素的短时交通流预测方法 | |
Lin et al. | Quantifying uncertainty in short-term traffic prediction and its application to optimal staffing plan development | |
CN112418547A (zh) | 一种基于gcn-lstm组合模型的公交车站点客流量预测方法 | |
CN109583565B (zh) | 基于注意力模型长短时记忆网络的洪水预测方法 | |
CN111612281B (zh) | 一种地铁站人流量峰值的预测方法、装置和计算机设备 | |
CN112767682A (zh) | 一种基于图卷积神经网络的多尺度交通流量预测方法 | |
CN103632212A (zh) | 一种时变用户均衡动态网络演化客流预测系统和方法 | |
CN113762595B (zh) | 通行时间预测模型训练方法、通行时间预测方法及设备 | |
CN106910199A (zh) | 面向城市空间信息采集的车联网众包方法 | |
CN112733307B (zh) | 一种供暖季城市天然气负荷预测方法及装置 | |
CN114202122A (zh) | 基于马尔可夫聚类图注意力网络的城市交通流量预测方法 | |
CN113643532B (zh) | 一种区域交通的预测方法以及设备 | |
CN115206092A (zh) | 一种基于注意力机制的BiLSTM和LightGBM模型的交通预测方法 | |
CN112382081A (zh) | 一种基于多任务的交通流量预测方法 | |
CN112766603A (zh) | 一种交通流量预测方法、系统、计算机设备及存储介质 | |
CN115169714A (zh) | 城市地铁进出站客流量预测方法 | |
CN116011684A (zh) | 一种基于时空图卷积网络的交通流量预测方法 | |
Liao et al. | MFGCN: a multimodal fusion graph convolutional network for online car-hailing demand prediction | |
CN115565376B (zh) | 融合graph2vec、双层LSTM的车辆行程时间预测方法及系统 | |
CN115796030A (zh) | 一种基于图卷积的交通流量预测方法 | |
CN115423146A (zh) | 一种基于多因子最近邻抽样回归和支持向量机的自适应径流预报方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |