CN113077090A - 客流预测方法、系统及计算机可读存储介质 - Google Patents
客流预测方法、系统及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113077090A CN113077090A CN202110380561.9A CN202110380561A CN113077090A CN 113077090 A CN113077090 A CN 113077090A CN 202110380561 A CN202110380561 A CN 202110380561A CN 113077090 A CN113077090 A CN 113077090A
- Authority
- CN
- China
- Prior art keywords
- passenger flow
- data
- graph
- time
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000007774 longterm Effects 0.000 claims abstract description 25
- 238000013135 deep learning Methods 0.000 claims abstract description 14
- 238000003062 neural network model Methods 0.000 claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 238000013528 artificial neural network Methods 0.000 claims description 36
- 239000013598 vector Substances 0.000 claims description 32
- 238000013507 mapping Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 11
- 238000010586 diagram Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 239000006185 dispersion Substances 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 230000000306 recurrent effect Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- General Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Bioinformatics & Computational Biology (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Evolutionary Biology (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明提供了客流预测方法、系统及计算机可读存储介质,其中客流预测方法,包括以下步骤:S1、获取轨道交通客流数据和影响因素数据并进行预处理,得到客流信息;S2、根据轨道交通客流关系构造轨道网络图、站点属性图和客流趋势图,得到图的结构信息;S3、构建基于深度学习的混合神经网络模型,将客流信息和图的结构信息输入,得到客流预测结果。本客流预测方法、系统及计算机可读存储介质,考虑了包括实时天气条件,工作日状态等多种影响因素,在对轨道交通客流进行短时预测时能获得更高的精准度;考虑了轨道交通客流存在的多种时间依赖关系,通过三个并行的网络模型分别对临近时间客流,短时客流,长期客流进行建模,具有更好的预测性能。
Description
技术领域
本发明涉及客流预测技术领域,尤其涉及客流预测方法、系统及计算机可读存储介质。
背景技术
城市轨道交通凭借其运能大、经济高效、运行时间稳定等一系列优势,逐渐成为人们日常出行的最为重要的交通方式之一,城市居民提供了极大的便利。然而,随着城市化进程的快速推进,城市人口数量逐年增加,轨道交通客流压力不断增大,部分线路和车站经常发生客流拥堵,这些拥堵会对人们的日常出行产生不利的影响,甚至带来巨大的安全风险。因此,轨道交通客流的短时预测成为解决这一问题的重要方式。实时准确的客流预测信息不仅可以帮助乘客制定合适的出行计划,还可以帮助城市管理者进行调度资源,避免乘客拥挤,维护地铁系统的稳定运行。
然而,轨道交通短期客流预测是一项非常具有挑战性的任务。一方面,短时客流的不确定性强于日均客流,其客流变化受突发事件和气候因素等随机干扰因素的影响很大。另一方面,各个站点之间的客流也存在着复杂的时空关系,这使得建模变得困难。在过去的几十年里,人们提出了许多基于统计模型和机器学习算法的客流预测模型,如自回归综合移动平均(ARIMA)、支持向量机、卡尔曼滤波器等。这些模型虽然能一定程度上对客流进行预测,但是时效性较差,预测精度较低。主要原因在于它们大多只根据单个站点的客流中的时间依赖性进行建模,没有考虑到轨道交通网络中复杂的空间关系,忽略了站点与站点之间的客流相关性,通常也无法做到使用一个模型对所有地铁站点进行预测。
近年来发展火热的深度学习为解决这些问题提供了思路,循环神经网络中的长期短期记忆(LSTM)和门控递归单元(GRU)可以很好地捕捉序列任务中的时间依赖性,而卷积神经网络和图神经网络则被用来对轨道交通中的空间特征进行提取。其中,图卷积神经网络将地铁站点作为节点,站点之间的邻接关系作为边,有效地捕捉地铁站之间不规则时空依赖关系,提高了预测的准确性。然而,轨道交通的客流预测却不同于其他交通流量预测,地铁站间的距离相对较长,只通过轨道交通网络的拓扑关系可能无法提取出较强的空间依赖性。此外,虽然现有研究还存在一些缺陷,其忽略了外部影响因素对客流的影响,导致预测不够精准。
发明内容
有鉴于此,本发明要解决的技术问题是提供客流预测方法、系统及计算机可读存储介质,可以提高客流预测的精度。
本发明的技术方案是这样实现的:
一种客流预测方法,包括以下步骤:
S1、获取轨道交通客流数据和影响因素数据并进行预处理,得到客流信息;
S2、根据轨道交通客流关系构造轨道网络图、站点属性图和客流趋势图,得到图的结构信息;
S3、构建基于深度学习的混合神经网络模型,将客流信息和图的结构信息输入,得到客流预测结果。
优选的,所述客流数据包括邻近时间客流、短期客流和长期客流数据;
预处理包括:使用离差标准化对邻近时间客流、短期客流和长期客流进行处理,将客流值映射到[0-1]之间并作为模型的输入信息,表示为Xr,Xd和Xw。
优选的,所述影响因数数据包括:实时天气数据和工作节假日数据;
所述预处理包括:对于天气数据,以相同大小的间隔对时间进行离散化,将其映射到各个时间片,并与客流数据进行对齐,每个时间片下的天气情况用一维向量表示;对于工作节假日数据,采用one-hot方式对其进行编码,得到一维向量;将两个数据向量进行拼接,得到外部影响因素向量g。
优选的,所述轨道网络图、站点属性图和客流趋势图共享相同的节点,V代表节点的集合,每个节点代表轨道交通网络中的一个地铁站点;
轨道网络图表示为Gs=(V,Ws),边的权重Ws根据地铁站点是否邻接决定,其公式表示为:
站点属性图表示为Gp=(V,Wp),边的权重Wp根据两个地铁站之间的POI相似程度进行判断;
以地铁站为中心,构造POI向量P∈Rh×1;其中h表示POI类别的数量,每个类别下的数值表示该区域中该类POI的数量;POI相似程度的计算公式表示为:
客流趋势图表示为Gq=(V,Wq),边的权重Wq根据两个地铁站之间的长期客流趋势进行计算;
长期客流趋势通过平均工作日客流和平均周末客流进行表示,客流趋势相似程度通过动态时间归整算法进行计算,其公式表示为:
Wp,ij=exp(-DWT(Tvi,Tvj))∈(0,1)
优选的,构建基于深度学习的混合神经网络模型具体包括包括图卷积神经网络、循环神经网络和全连接神经网络;
图卷积神经网络用于在构造的三张功能图上提取轨道交通网络中站点之间的空间相关性;
循环神经网络用于捕捉客流在不同时间段内的时间依赖关系;
全连接神经网络用于将提取的时空特征以及各种外部影响因素进行整合,将高维特征映射到样本空间;
模型由三个结构相同的并行模块组成,分别对邻近时间段客流,短期客流和长期客流的时空关系进行建模。
优选的,将客流信息和图的结构信息输入,得到客流预测结果具体包括:
将客流信息X和图的结构信息输入到网络中,得到未来一个时间片内的客流预测结果:
Xτ+1=f(X,Gs,Gp,Gq)
某时间段内的客流数据表示为一个二维的张量X∈RN×T,其中N是地铁站点数量,T表示时间片数量,设置邻居节点的数目为k-1,进行规整化,图数据和客流数据集成到一个新的三维张量Z∈RN×k×T,当前时间片客流信息为一个二维的张量Zτ∈RN×k;使用大小为1×k的卷积核进行特征提取,第l层的卷积运算的定义如下:
其中,*表示卷积运算,σ表示激活函数。Wl和bl是第l层卷积核的权重和偏置在L个卷积层之后,使用一个1×1的卷积操作来减少特征的维数,得到图神经网络的输出,其定义为:
轨道网络图、站点属性图和客流趋势图通过图卷积操作之后,得到各自的高维隐藏特征,分别表示为空间特征通过一个两层全连接神经网络进行融合,融合结果表示为hτ;将外部特征向量与客流的隐藏特征相结合,其定义为:
模型通过LSTM网络对时间依赖性进行提取,并得到最终的预测结果:
邻近时间客流产生的预测结果为Yr,短期客流产生的预测结果为Yd,邻近时间客流产生的预测结果为Yw;
通过两层全连接神经网络分配权重,并产生最终的预测结果,这个过程表示为:
本发明还提出了一种客流预测系统,包括:
获取模块,用于获取轨道交通客流数据和影响因素数据并进行预处理,得到客流信息;
构图模块,用于根据轨道交通客流关系构造轨道网络图、站点属性图和客流趋势图,得到图的结构信息;
预测模块,用于构建基于深度学习的混合神经网络模型,将客流信息和图的结构信息输入,得到客流预测结果。
优选的,所述客流数据包括邻近时间客流、短期客流和长期客流数据;
预处理包括:使用离差标准化对邻近时间客流、短期客流和长期客流进行处理,将客流值映射到[0-1]之间并作为模型的输入信息,表示为Xr,Xd和Xw。
优选的,所述影响因数数据包括:实时天气数据和工作节假日数据;
所述预处理包括:对于天气数据,以相同大小的间隔对时间进行离散化,将其映射到各个时间片,并与客流数据进行对齐,每个时间片下的天气情况用一维向量表示;对于工作节假日数据,采用one-hot方式对其进行编码,得到一维向量;将两个数据向量进行拼接,得到外部影响因素向量g。
本发明还提出了计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如上述任一项所述的客流预测方法。
本发明提出的客流预测方法、系统及计算机可读存储介质,通过在预测时获取客流信息轨道交通客流数据和影响因素数据并进行预处理,得到客流信息,构建模型后在模型中输入客流信息,从而可以考虑到外部影响因素对客流的影响,提高预测的精度。
附图说明
图1为本发明实施例提出的客流预测方法流程图;
图2是本发明实施例提出的客流预测方法中的混合神经网络模型的框架示意图;
图3是本发明实施例提出的客流预测方法中的混合神经网络模型的细节图。
图4是本发明中图卷积神经网络结构示意图。
图5为本发明实施例提出的客流预测系统的结构框图
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1-4所示,本发明实施例提出了一种客流预测方法,包括以下步骤:
S101、获取轨道交通客流数据和影响因素数据并进行预处理,得到客流信息;
S102、根据轨道交通客流关系构造轨道网络图、站点属性图和客流趋势图,得到图的结构信息;
S103、构建基于深度学习的混合神经网络模型,将客流信息和图的结构信息输入,得到客流预测结果。
可见,本发明提出的客流预测方法、系统及计算机可读存储介质,通过在预测时获取客流信息轨道交通客流数据和影响因素数据并进行预处理,得到客流信息,构建模型后在模型中输入客流信息,从而可以考虑到外部影响因素对客流的影响,提高预测的精度。
具体的,本申请中:
客流数据。AFC系统提供的乘客记录包括乘车站点、费用、进出站状态等信息,本文将地铁站的进出站客流用一定时间内的进出站乘客数量来近似,并设置一个固定大小的时间间隔,通过AFC数据统计所有站点在各个时间段的客流情况。为了考虑客流的周期性,将输入的客流信息分为三段,即邻近时间客流,短期客流和长期客流。邻近时间客流指当前时刻前一段时间的客流,短期客流指前几天相同时间段的客流,长期客流指前几周相同工作日中相同时段的客流,使用离差标准化对三段客流进行处理,将客流值映射到[0-1]之间并作为模型的输入信息,表示为Xr,Xd和Xw。
影响因素数据,即其他因素数据主要包括实时天气数据和工作节假日情况。对于天气数据,和客流数据一样,以相同大小的间隔对时间进行离散化,将温度、风速、降雨情况等信息映射到各个时间片,并与客流数据进行对齐,每个时间片下的天气情况用一个一维向量表示;对于工作节假日情况,采用one-hot方式对其进行编码,同样得到一个一维的向量。将两个数据向量进行拼接,得到一个外部影响因素向量g。
步骤S102主要是针对城市轨道交通中存在的一些客流关系进行建模,便于后续进行特征提取,主要是构造了三幅拓扑图:轨道网络图、站点属性图和客流趋势图。这三幅图共享相同的节点,V代表节点的集合,每个节点代表轨道交通网络中的一个地铁站点,它们的边根据各自图的功能进行设置。轨道网络图主要用来描述现实世界中地铁站的相邻关系,表示为Gs=(V,Ws),边的权重Ws根据地铁站点是否邻接决定,其公式可以表示为:
站点属性图主要捕捉功能属性相似的站点之间的客流特征,表示为Gp=(V,Wp),边的权重Wp根据两个地铁站之间的POI相似程度进行判断。POI又称为“兴趣点”,可以理解为地图上的任何具有特殊功能的建筑,如购物中心、公园、体育场等。POI中所包含的信息可以反映某一区域的功能,这与地铁客流密切相关。以地铁站为中心,统计1.5km半径内的POI数量,构造POI向量P∈Rh×1。其中h表示POI类别的数量,每个类别下的数值表示该区域中该类POI的数量。我们使用TF-IDF算法对不同类别的POI分配权重,并使用余弦相似度来度量节点之间的属性差异,POI相似程度的计算公式可以表示为:
其中,和分别表示站点vi和站点vj的POI向量。客流趋势图主要考虑长期客流中不同站点的空间关系,表示为Gq=(V,Wq),边的权重Wq根据两个地铁站之间的长期客流趋势进行计算。长期客流趋势通过平均工作日客流和平均周末客流进行表示。客流趋势相似程度通过动态时间归整算法进行计算,其公式表示为:
构建基于深度学习的混合神经网络模型,该模型由三个结构相同的并行模块组成,分别对邻近时间段客流,短期客流和长期客流的时空关系进行建模。该模型将预处理得到的客流数据和图的结构信息作为输入,得到短时客流预测结果,这个过程可以表示为:
Xτ+1=f(X,Gs,Gp,Gq)
图3主要展示了构建的基于深度学习的混合神经网络模型细节,模型主要由多图卷积层,特征融合层,循环神经网络层和全连接层组成,共包含三种神经网络结构。
多图卷积层由图卷积神经网络构成,主要用于在构造的三张功能图上提取轨道交通网络中的空间相关性。参见图4,多图卷积层中的图卷积神经网络是一种改进的基于空域的图卷积神经网络。它通过一定方式将图结构信息与客流数据进行整合,转换成结构规整的适用于卷积神经网络的数据进行特征提取。具体来说,对于轨道网络图,它采用广度优先算法选择固定数目的相邻节点,对于站点属性图和客流趋势图,则根据边缘的权重从大到小选择固定数量的节点来构造规则的数据结构。
某时间段内的客流数据表示为一个二维的张量X∈RN×T,其中N是地铁站点数量,T表示时间片数量,设置邻居节点的数目为k-1,在进行规整化之后,图数据和客流数据集成到一个新的三维张量Z∈RN×k×T,那么当前时间片客流信息为一个二维的张量Zτ∈RN×k。使用大小为1×k的卷积核进行特征提取,第l层的卷积运算的定义如下:
其中,*表示卷积运算,σ表示激活函数。Wl和bl是第l层卷积核的权重和偏置。在L个卷积层之后,我们使用一个1×1的卷积操作来减少特征的维数,得到图神经网络的输出,其定义为:
特征融合层主要通过全连接层将提取的空间特征与外部影响因素结合,并将结果输入到循环神经网络层。构造的三张功能图通过图卷积操作之后,得到各自的高维隐藏特征,分别表示为这些提取到的空间特征在特征融合层通过一个两层全连接神经网络进行融合,融合结果表示为hτ。然后将外部特征向量与客流的隐藏特征相结合,其定义为:
循环神经网络主要用于捕捉客流在不同时间段内的时间依赖关系;最后一个全连接层则将高维特征映射到样本空间,产生预测结果。最后,三个并行的模块分别得出预测值,邻近时间客流产生的预测结果为Yr,短期客流产生的预测结果为Yd,邻近时间客流产生的预测结果为Yw。由于三个模块在不同时段的预测准确性有所不同,因此通过一个两层全连接神经网络分配权重,并产生最终的预测结果,这个过程可以表示为:
其中θ是此模型中所有可学习参数的集合。
对于本实例中的数据集,上海地铁数据集是基于2015年4月1日至4月30日内上海地铁系统的刷卡数据构建的,在此期间,上海地铁每天大约有900万张刷卡记录,覆盖全市14条线路,共计313个车站。由于地铁线路不在夜间运营,本发明只考虑从6:00到24:00的乘客记录,并以15分钟为间隔统计每个车站的出站客流。杭州轨道交通网络由分布在5条线路上的共80个地铁站组成,而杭州地铁数据集是基于杭州地铁系统2019年1月1日至1月25日的刷卡数据构建。与上海轨道交通数据集一样,以15分钟的时间间隔统计每个地铁站点的客流量。本实例中以80%的数据作为训练集,剩余20%作为测试集,在两个不同的数据集中,预测整个轨道交通网络下一个时间片的地铁出站客流。
表1 模型性能评估结果
为验证所提出方法的预测效果的优越性,本发明将与历史求平均(HA)、整合移动平均自回归模型(ARIMA)等基于统计学的方法,以及包括LSTM、STGCN在内的一些基于深度学习的神经网络方法进行性能比较,并使用均方误差(MAE)和均方根误差(RMSE)作为评估指标。
模型的评估结果如表1所示,可以发现,本发明提出的方法在这两个数据集上都取得了最好的性能。具体来说,HA和ARIMA表现不佳,它们在上海数据集的RMSE分别为112.6和180.1,这主要是因为这些基于统计学的模型性能有限,难以对非线性的复杂的城市交通数据进行建模。基于深度学习的方法通常会比传统的时间序列分析方法更能得到更好的预测结果。例如,LSTM和GRU在上海数据集的测试中RMSE分别为43.7和42.9,与HA模型相比,误差指标下降了约61.1%和61.9%。
如图5所示,本发明实施例还提出了一种客流预测系统,包括:
获取模块1,用于获取轨道交通客流数据和影响因素数据并进行预处理,得到客流信息;
构图模块2,用于根据轨道交通客流关系构造轨道网络图、站点属性图和客流趋势图,得到图的结构信息;
预测模块3,用于构建基于深度学习的混合神经网络模型,将客流信息和图的结构信息输入,得到客流预测结果。
在本发明的一个优选实施例中,所述客流数据包括邻近时间客流、短期客流和长期客流数据;
预处理包括:使用离差标准化对邻近时间客流、短期客流和长期客流进行处理,将客流值映射到[0-1]之间并作为模型的输入信息,表示为Xr,Xd和Xw。
在本发明的一个优选实施例中,所述影响因数数据包括:实时天气数据和工作节假日数据;
所述预处理包括:对于天气数据,以相同大小的间隔对时间进行离散化,将其映射到各个时间片,并与客流数据进行对齐,每个时间片下的天气情况用一维向量表示;对于工作节假日数据,采用one-hot方式对其进行编码,得到一维向量;将两个数据向量进行拼接,得到外部影响因素向量g。
本发明还提出了一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现上述所述的客流预测方法。
本发明的方法基于轨道交通站点的拓扑关系,属性相似性,以及长期的客流模式构建了三种功能图,对多种地铁网络中的多种客流相关性进行建模,并使用一种新颖的图卷积神经网络从多个角度捕捉客流的空间相关性。
本发明的方法考虑了包括实时天气条件,工作日状态等多种影响因素,在对轨道交通客流进行短时预测时能获得更高的精准度。
本发明充分考虑了轨道交通客流存在的多种时间依赖关系,通过三个并行的网络模型分别对临近时间客流,短时客流,长期客流进行建模,具有更好的预测性能。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘、U盘、移动硬盘、ROM、RAM、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solidstatedisk,SSD))等。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (10)
1.一种客流预测方法,其特征在于,包括以下步骤:
S1、获取轨道交通客流数据和影响因素数据并进行预处理,得到客流信息;
S2、根据轨道交通客流关系构造轨道网络图、站点属性图和客流趋势图,得到图的结构信息;
S3、构建基于深度学习的混合神经网络模型,将客流信息和图的结构信息输入,得到客流预测结果。
2.如权利要求1所述的客流预测方法,其特征在于,所述客流数据包括邻近时间客流、短期客流和长期客流数据;
预处理包括:使用离差标准化对邻近时间客流、短期客流和长期客流进行处理,将客流值映射到[0-1]之间并作为模型的输入信息,表示为Xr,Xd和Xw。
3.如权利要求1所述的客流预测方法,其特征在于,所述影响因数数据包括:实时天气数据和工作节假日数据;
所述预处理包括:对于天气数据,以相同大小的间隔对时间进行离散化,将其映射到各个时间片,并与客流数据进行对齐,每个时间片下的天气情况用一维向量表示;对于工作节假日数据,采用one-hot方式对其进行编码,得到一维向量;将两个数据向量进行拼接,得到外部影响因素向量g。
4.如权利要求1所述的客流预测方法,其特征在于,所述轨道网络图、站点属性图和客流趋势图共享相同的节点,V代表节点的集合,每个节点代表轨道交通网络中的一个地铁站点;
轨道网络图表示为Gs=(V,Ws),边的权重Ws根据地铁站点是否邻接决定,其公式表示为:
站点属性图表示为Gp=(V,Wp),边的权重Wp根据两个地铁站之间的POI相似程度进行判断;
以地铁站为中心,构造POI向量P∈Rh×1;其中h表示POI类别的数量,每个类别下的数值表示该区域中该类POI的数量;POI相似程度的计算公式表示为:
客流趋势图表示为Gq=(V,Wq),边的权重Wq根据两个地铁站之间的长期客流趋势进行计算;
长期客流趋势通过平均工作日客流和平均周末客流进行表示,客流趋势相似程度通过动态时间归整算法进行计算,其公式表示为:
5.如权利要求1所述的客流预测方法,其特征在于,构建基于深度学习的混合神经网络模型具体包括包括图卷积神经网络、循环神经网络和全连接神经网络;
图卷积神经网络用于在构造的三张功能图上提取轨道交通网络中站点之间的空间相关性;
循环神经网络用于捕捉客流在不同时间段内的时间依赖关系;
全连接神经网络用于将提取的时空特征以及各种外部影响因素进行整合,将高维特征映射到样本空间;
模型由三个结构相同的并行模块组成,分别对邻近时间段客流,短期客流和长期客流的时空关系进行建模。
6.如权利要求1所述的客流预测方法,其特征在于,将客流信息和图的结构信息输入,得到客流预测结果具体包括:
将客流信息X和图的结构信息输入到网络中,得到未来一个时间片内的客流预测结果:
Xτ+1=f(X,Gs,Gp,Gq)
某时间段内的客流数据表示为一个二维的张量X∈RN×T,其中N是地铁站点数量,T表示时间片数量,设置邻居节点的数目为k-1,进行规整化,图数据和客流数据集成到一个新的三维张量Z∈RN×k×T,当前时间片客流信息为一个二维的张量Zτ∈RN×k;使用大小为1×k的卷积核进行特征提取,第l层的卷积运算的定义如下:
其中,*表示卷积运算,σ表示激活函数。Wl和bl是第l层卷积核的权重和偏置在L个卷积层之后,使用一个1×1的卷积操作来减少特征的维数,得到图神经网络的输出,其定义为:
轨道网络图、站点属性图和客流趋势图通过图卷积操作之后,得到各自的高维隐藏特征,分别表示为空间特征通过一个两层全连接神经网络进行融合,融合结果表示为hτ;将外部特征向量与客流的隐藏特征相结合,其定义为:
模型通过LSTM网络对时间依赖性进行提取,并得到最终的预测结果:
邻近时间客流产生的预测结果为Yr,短期客流产生的预测结果为Yd,邻近时间客流产生的预测结果为Yw;
通过两层全连接神经网络分配权重,并产生最终的预测结果,这个过程表示为:
7.一种客流预测系统,其特征在于,包括:
获取模块,用于获取轨道交通客流数据和影响因素数据并进行预处理,得到客流信息;
构图模块,用于根据轨道交通客流关系构造轨道网络图、站点属性图和客流趋势图,得到图的结构信息;
预测模块,用于构建基于深度学习的混合神经网络模型,将客流信息和图的结构信息输入,得到客流预测结果。
8.如权利要求7所述的客流预测系统,其特征在于,所述客流数据包括邻近时间客流、短期客流和长期客流数据;
预处理包括:使用离差标准化对邻近时间客流、短期客流和长期客流进行处理,将客流值映射到[0-1]之间并作为模型的输入信息,表示为Xr,Xd和Xw。
9.如权利要求7所述的客流预测系统,其特征在于,所述影响因数数据包括:实时天气数据和工作节假日数据;
所述预处理包括:对于天气数据,以相同大小的间隔对时间进行离散化,将其映射到各个时间片,并与客流数据进行对齐,每个时间片下的天气情况用一维向量表示;对于工作节假日数据,采用one-hot方式对其进行编码,得到一维向量;将两个数据向量进行拼接,得到外部影响因素向量g。
10.计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求1-6任一项所述的客流预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110380561.9A CN113077090B (zh) | 2021-04-09 | 2021-04-09 | 客流预测方法、系统及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110380561.9A CN113077090B (zh) | 2021-04-09 | 2021-04-09 | 客流预测方法、系统及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113077090A true CN113077090A (zh) | 2021-07-06 |
CN113077090B CN113077090B (zh) | 2023-05-23 |
Family
ID=76615690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110380561.9A Active CN113077090B (zh) | 2021-04-09 | 2021-04-09 | 客流预测方法、系统及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113077090B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113221472A (zh) * | 2021-07-08 | 2021-08-06 | 北京航空航天大学 | 一种基于lstm的客流预测方法 |
CN113987944A (zh) * | 2021-10-29 | 2022-01-28 | 成都智元汇信息技术股份有限公司 | 基于Prophet模型的地铁进站客流预测方法及装置 |
CN115146844A (zh) * | 2022-06-27 | 2022-10-04 | 北京交通大学 | 一种基于多任务学习的多模式交通短时客流协同预测方法 |
CN115392752A (zh) * | 2022-09-01 | 2022-11-25 | 亿雅捷交通系统(北京)有限公司 | 一种地铁短时客流预测方法、系统、电子设备及存储介质 |
CN115392554A (zh) * | 2022-08-17 | 2022-11-25 | 北京建筑大学 | 基于深度图神经网络和环境融合的轨道客流预测方法 |
CN116128122A (zh) * | 2023-01-03 | 2023-05-16 | 北京交通大学 | 一种考虑突发因素的城市轨道交通短时客流预测方法 |
CN116523267A (zh) * | 2023-06-28 | 2023-08-01 | 深圳市海成智联科技有限公司 | 适用于轨道交通的车辆调度优化方法、系统及存储介质 |
CN116629460A (zh) * | 2023-07-24 | 2023-08-22 | 中国矿业大学(北京) | 一种基于ST-RANet模型的地铁客流预测方法 |
WO2024082848A1 (zh) * | 2022-10-19 | 2024-04-25 | 通号通信信息集团有限公司 | 客流预测方法、装置和系统 |
CN118134064A (zh) * | 2024-05-10 | 2024-06-04 | 南京禄口国际机场空港科技有限公司 | 一种航站客流量的预测方法、系统、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107529651A (zh) * | 2017-08-18 | 2018-01-02 | 北京航空航天大学 | 一种基于深度学习的城市交通客流预测方法和设备 |
CN109886444A (zh) * | 2018-12-03 | 2019-06-14 | 深圳市北斗智能科技有限公司 | 一种交通短时客流预测方法、装置、设备和存储介质 |
CN109919358A (zh) * | 2019-01-31 | 2019-06-21 | 中国科学院软件研究所 | 一种基于神经网络时空注意力机制的实时站点流量预测方法 |
CN111667092A (zh) * | 2020-04-21 | 2020-09-15 | 北京交通大学 | 基于图卷积神经网络的轨道交通短时客流预测方法和系统 |
CN111860951A (zh) * | 2020-06-12 | 2020-10-30 | 北京工业大学 | 一种基于动态超图卷积网络的轨道交通客流预测方法 |
CN111915073A (zh) * | 2020-04-28 | 2020-11-10 | 同济大学 | 一种考虑日期属性和天气因素的铁路城际客流短期预测方法 |
-
2021
- 2021-04-09 CN CN202110380561.9A patent/CN113077090B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107529651A (zh) * | 2017-08-18 | 2018-01-02 | 北京航空航天大学 | 一种基于深度学习的城市交通客流预测方法和设备 |
CN109886444A (zh) * | 2018-12-03 | 2019-06-14 | 深圳市北斗智能科技有限公司 | 一种交通短时客流预测方法、装置、设备和存储介质 |
CN109919358A (zh) * | 2019-01-31 | 2019-06-21 | 中国科学院软件研究所 | 一种基于神经网络时空注意力机制的实时站点流量预测方法 |
CN111667092A (zh) * | 2020-04-21 | 2020-09-15 | 北京交通大学 | 基于图卷积神经网络的轨道交通短时客流预测方法和系统 |
CN111915073A (zh) * | 2020-04-28 | 2020-11-10 | 同济大学 | 一种考虑日期属性和天气因素的铁路城际客流短期预测方法 |
CN111860951A (zh) * | 2020-06-12 | 2020-10-30 | 北京工业大学 | 一种基于动态超图卷积网络的轨道交通客流预测方法 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113221472A (zh) * | 2021-07-08 | 2021-08-06 | 北京航空航天大学 | 一种基于lstm的客流预测方法 |
CN113987944A (zh) * | 2021-10-29 | 2022-01-28 | 成都智元汇信息技术股份有限公司 | 基于Prophet模型的地铁进站客流预测方法及装置 |
CN115146844A (zh) * | 2022-06-27 | 2022-10-04 | 北京交通大学 | 一种基于多任务学习的多模式交通短时客流协同预测方法 |
CN115392554A (zh) * | 2022-08-17 | 2022-11-25 | 北京建筑大学 | 基于深度图神经网络和环境融合的轨道客流预测方法 |
CN115392752A (zh) * | 2022-09-01 | 2022-11-25 | 亿雅捷交通系统(北京)有限公司 | 一种地铁短时客流预测方法、系统、电子设备及存储介质 |
CN115392752B (zh) * | 2022-09-01 | 2023-11-28 | 亿雅捷交通系统(北京)有限公司 | 一种地铁短时客流预测方法、系统、电子设备及存储介质 |
WO2024082848A1 (zh) * | 2022-10-19 | 2024-04-25 | 通号通信信息集团有限公司 | 客流预测方法、装置和系统 |
CN116128122B (zh) * | 2023-01-03 | 2023-09-12 | 北京交通大学 | 一种考虑突发因素的城市轨道交通短时客流预测方法 |
CN116128122A (zh) * | 2023-01-03 | 2023-05-16 | 北京交通大学 | 一种考虑突发因素的城市轨道交通短时客流预测方法 |
CN116523267A (zh) * | 2023-06-28 | 2023-08-01 | 深圳市海成智联科技有限公司 | 适用于轨道交通的车辆调度优化方法、系统及存储介质 |
CN116523267B (zh) * | 2023-06-28 | 2024-01-12 | 深圳市海成智联科技有限公司 | 适用于轨道交通的车辆调度优化方法、系统及存储介质 |
CN116629460B (zh) * | 2023-07-24 | 2023-09-12 | 中国矿业大学(北京) | 一种基于ST-RANet模型的地铁客流预测方法 |
CN116629460A (zh) * | 2023-07-24 | 2023-08-22 | 中国矿业大学(北京) | 一种基于ST-RANet模型的地铁客流预测方法 |
CN118134064A (zh) * | 2024-05-10 | 2024-06-04 | 南京禄口国际机场空港科技有限公司 | 一种航站客流量的预测方法、系统、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113077090B (zh) | 2023-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113077090B (zh) | 客流预测方法、系统及计算机可读存储介质 | |
Ali et al. | Exploiting dynamic spatio-temporal graph convolutional neural networks for citywide traffic flows prediction | |
Du et al. | Deep irregular convolutional residual LSTM for urban traffic passenger flows prediction | |
CN103632212B (zh) | 一种时变用户均衡动态网络演化客流预测系统和方法 | |
He et al. | Multi-graph convolutional-recurrent neural network (MGC-RNN) for short-term forecasting of transit passenger flow | |
Chen et al. | Uncertainty in urban mobility: Predicting waiting times for shared bicycles and parking lots | |
CN112990976B (zh) | 基于开源数据挖掘的商业网点选址方法、系统、设备及介质 | |
CN108133611A (zh) | 车辆行驶轨迹监测方法及系统 | |
CN109872535A (zh) | 一种智慧交通通行预测方法、装置及服务器 | |
CN111242395B (zh) | 用于od数据的预测模型构建方法及装置 | |
CN114692984A (zh) | 基于多步耦合图卷积网络的交通预测方法 | |
CN111507762A (zh) | 基于多任务共预测神经网络的城市出租车需求预测方法 | |
CN109376906A (zh) | 基于多维度轨迹的出行时间预测方法、系统及电子设备 | |
CN115565369A (zh) | 一种基于超图的时空超图卷积交通流量预测方法及系统 | |
CN117076922A (zh) | 城际出行od需求量预测模型训练方法、预测方法及系统 | |
CN114372830A (zh) | 一种基于时空多图神经网络的网约车需求预测方法 | |
CN110021161A (zh) | 一种交通流向的预测方法及系统 | |
Luo et al. | Spatiotemporal hashing multigraph convolutional network for service-level passenger flow forecasting in bus transit systems | |
CN111985731B (zh) | 城市公共交通站点人数的预测方法及系统 | |
CN116629460B (zh) | 一种基于ST-RANet模型的地铁客流预测方法 | |
CN116343486B (zh) | 一种基于异常场的高速公路网络群体移动性识别方法 | |
CN117436653A (zh) | 一种网约车出行需求的预测模型构建方法和预测方法 | |
Wang et al. | MetroEye: A weather-aware system for real-time metro passenger flow prediction | |
Rodríguez-Rueda et al. | Origin–Destination matrix estimation and prediction from socioeconomic variables using automatic feature selection procedure-based machine learning model | |
CN115994787A (zh) | 一种基于神经网络的拼车需求预测匹配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |