CN112990555A - 基于时空并行栅格神经网络的地铁人流量预测方法及系统 - Google Patents
基于时空并行栅格神经网络的地铁人流量预测方法及系统 Download PDFInfo
- Publication number
- CN112990555A CN112990555A CN202110205756.XA CN202110205756A CN112990555A CN 112990555 A CN112990555 A CN 112990555A CN 202110205756 A CN202110205756 A CN 202110205756A CN 112990555 A CN112990555 A CN 112990555A
- Authority
- CN
- China
- Prior art keywords
- subway
- neural network
- pedestrian flow
- grid
- correlation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 147
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000007774 longterm Effects 0.000 claims abstract description 36
- 238000012546 transfer Methods 0.000 claims abstract description 19
- 238000010276 construction Methods 0.000 claims abstract description 8
- 230000008569 process Effects 0.000 claims abstract description 8
- 239000011159 matrix material Substances 0.000 claims description 20
- 230000000737 periodic effect Effects 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 15
- 230000004913 activation Effects 0.000 claims description 14
- 238000005259 measurement Methods 0.000 claims description 12
- 238000000354 decomposition reaction Methods 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 7
- 230000001364 causal effect Effects 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 230000007547 defect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于时空并行栅格神经网络的地铁人流量预测方法及系统,包括:提出一种栅格神经网络来学习地铁人流量的时间关系,捕捉地铁人流量短期时间相关性;进一步捕捉地铁人流量的长期时间相关性;通过基于转移流量的指标来度量地铁站间的空间相关性,并基于这种指标将地铁系统建模成加权有向图;基于地铁加权有向图的构建,将传播图神经网络与栅格神经网络组合,学习地铁人流量的动态空间相关性;并行执行长短期时间相关性和动态空间相关性的学习过程,并融合两者的结果得到最终的地铁人流量预测结果。本发明采用了一种时空并行学习的框架,它能够有效地学习到地铁人流量的长短期时间相关性和动态空间相关性,并将所学知识应用于预测。
Description
技术领域
本发明涉及时空数据挖掘和城市计算领域,具体地,涉及一种基于时空并行栅格神经网络的地铁人流量预测方法及系统。
背景技术
目前,中国的地铁系统建设仍处在蓬勃发展的阶段。上海市在2018年至2023年期间计划新建9条地铁线路;广州市2018年开工建设6条地铁线路,总长110公里,车站73座。对于地铁站人流量的精准预测,可起到辅助规划建站规模、辅助排定地铁班次、合理安排地铁工作人员等关键作用,对满足国人日常出行需求具有重要的实际意义。
迄今为止,已有诸多工作针对车速、车流量、人流量等交通情况的预测展开研究。这些工作或使用传统的时间序列分析的方法(如ARIMA及其衍生方法)、或使用基于深度学习的方法(如RNN、CNN、GNN)。然而由于下文所述的两点原因,上述方法并不能直接用于解决地铁站人流量的预测问题。
首先,虽然RNN可以很好的捕捉时间序列数据的短期非线性时间相关性,其通常由于梯度消失等问题在学习长期时间相关性上性能不佳。即使LSTM和MResRGMM可以一定程度上解决传统RNN存在的上述问题,这些模型仍然存在着门机制复杂、训练耗时长等缺陷。
其次,绝大多数现有交通预测方面的工作使用地理特性(如距离、连通性等)来表征不同城市区域或路段之间的空间相关性。然而地理特性往往不能恰当刻画地铁站之间转移流量,两地铁站之间的转移流量往往不由其间的距离决定,距离远的两站之间的转移流量往往可大可小,因此仅仅依靠地理特性无法表达地铁站之间的空间相关性。另外,地铁站之间空间相关性的动态特性更使得其难以用静态的空间特性来表征。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于时空并行栅格神经网络的地铁人流量预测方法及系统。
根据本发明提供的一种基于时空并行栅格神经网络的地铁人流量预测方法,包括如下步骤:
步骤A:通过栅格神经网络来学习地铁人流量的时间关系,并基于短期历史地铁人流量和近邻栅格神经网络捕捉地铁人流量的短期时间相关性;
步骤B:基于长期历史地铁人流量和周期栅格神经网络进一步捕捉地铁人流量的长期时间相关性;
步骤C:通过一种基于转移流量的指标来度量地铁站间的空间相关性,并基于所述指标将地铁系统建模成加权有向图;
步骤D:基于地铁加权有向图的构建,将传播图神经网络与栅格神经网络组合,学习地铁人流量的动态空间相关性;
步骤E:并行执行长短期时间相关性和动态空间相关性的学习过程,并融合两者的结果得到最终的地铁人流量预测结果。
优选地,所述步骤A包括:
步骤A1:对于整个地铁系统,在时间间隔t内,通过n维向量 来表示n个站点的地铁出站流量,提取过去T个时间间隔的地铁人流量数据作为短期历史输入数据,即X1:T=(xt-(T-1),xt-(T-2),…xt);
步骤A2:定义栅格神经网络来学习时间关系,栅格神经网络的基本单元由一维卷积神经网络和非线性激活函数组成;
步骤A3:将所述基本单元扩展到所有的时间步骤和不同卷积层,并共享相同的权重矩阵W,从而构成栅格神经网络的整体结构;给定输入的地铁出站流量数据序列X1:T,设定一个栅格神经网络在一个卷积层上的操作定义为:
式中,Γ(s)(·)表示具有s层的近邻栅格神经网络的整体运算操作。
优选地,所述步骤B包括:
步骤B1:基于地铁人流量的日周期特性,提取过去D天内与预测时段相同的时间间隔内的地铁人流量数据作为长期的日周期历史输入数据,即:
其中,m表示一天中的时间间隔数;
步骤B2:将日周期地铁历史人流量数据与近邻栅格神经网络的输出结果组合构成新的序列,并输入到另一个构建的周期栅格神经网络Γ(p)来进一步学习地铁人流量的长期时间相关性,即:
优选地,所述步骤C包括:
步骤C2:基于上述定义的空间相关性度量指标,将整个地铁系统建模为加权有向图Gt=(V,εt,Mt),其中V={1,2,…n}表示由所有地铁站组成的顶点集,εt表示边缘集,表示以作为边权重的邻接矩阵,即:
步骤C3:提出基于传播与空域分解的传播图卷积神经网络(DGCN),为预测在时间间隔t+1处的地铁出站流量,将地铁有向图Gt的输入节点特征定义为:
优选地,所述步骤D包括:
步骤D1:在过去s个时间间隔内构造s个地铁有向图,并使用s个DGCN分别处理这些地铁有向图,将输出结果按时间先后组成一个新的序列,并进一步输入到另一个构建的动态栅格神经网络中来学习地铁空间相关性的动态变化特性;
优选地,所述步骤E包括:
融合时间相关性和空间相关性的学习结果,得到最终的地铁人流量预测值:
式中wx和wy是可训练的参数,用于衡量时间相关性学习和动态空间相关性学习的结果对最终地铁人流量预测结果影响的权重,tanh表示激活函数。
根据本发明提供的一种基于时空并行栅格神经网络的地铁人流量预测系统,包括如下模块:
模块A:通过栅格神经网络来学习地铁人流量的时间关系,并基于短期历史地铁人流量和近邻栅格神经网络捕捉地铁人流量的短期时间相关性;
模块B:基于长期历史地铁人流量和周期栅格神经网络进一步捕捉地铁人流量的长期时间相关性;
模块C:通过一种基于转移流量的指标来度量地铁站间的空间相关性,并基于所述指标将地铁系统建模成加权有向图;
模块D:基于地铁加权有向图的构建,将传播图神经网络与栅格神经网络组合,学习地铁人流量的动态空间相关性;
模块E:并行执行长短期时间相关性和动态空间相关性的学习过程,并融合两者的结果得到最终的地铁人流量预测结果。
优选地,所述模块A包括:
模块A1:对于整个地铁系统,在时间间隔t内,通过n维向量 来表示n个站点的地铁出站流量,提取过去T个时间间隔的地铁人流量数据作为短期历史输入数据,即X1:T=(xt-(T-1),xt-(T-2),…xt);
模块A2:定义栅格神经网络来学习时间关系,栅格神经网络的基本单元由一维卷积神经网络和非线性激活函数组成;
模块A3:将所述基本单元扩展到所有的时间模块和不同卷积层,并共享相同的权重矩阵W,从而构成栅格神经网络的整体结构;给定输入的地铁出站流量数据序列X1:T,设定一个栅格神经网络在一个卷积层上的操作定义为:
式中,Γ(s)(·)表示具有s层的近邻栅格神经网络的整体运算操作。
优选地,所述模块B包括:
模块B1:基于地铁人流量的日周期特性,提取过去D天内与预测时段相同的时间间隔内的地铁人流量数据作为长期的日周期历史输入数据,即:
其中,m表示一天中的时间间隔数;
模块B2:将日周期地铁历史人流量数据与近邻栅格神经网络的输出结果组合构成新的序列,并输入到另一个构建的周期栅格神经网络Γ(p)来进一步学习地铁人流量的长期时间相关性,即:
优选地,所述模块C包括:
模块C2:基于上述定义的空间相关性度量指标,将整个地铁系统建模为加权有向图Gt=(V,εt,Mt),其中V={1,2,…n}表示由所有地铁站组成的顶点集,εt表示边缘集,表示以作为边权重的邻接矩阵,即:
模块C3:提出基于传播与空域分解的传播图卷积神经网络(DGCN),为预测在时间间隔t+1处的地铁出站流量,将地铁有向图Gt的输入节点特征定义为:
优选地,所述模块D包括:
模块D1:在过去s个时间间隔内构造s个地铁有向图,并使用s个DGCN分别处理这些地铁有向图,将输出结果按时间先后组成一个新的序列,并进一步输入到另一个构建的动态栅格神经网络中来学习地铁空间相关性的动态变化特性;
优选地,所述模块E包括:
融合时间相关性和空间相关性的学习结果,得到最终的地铁人流量预测值:
式中wx和wy是可训练的参数,用于衡量时间相关性学习和动态空间相关性学习的结果对最终地铁人流量预测结果影响的权重,tanh表示激活函数。
与现有技术相比,本发明具有如下的有益效果:
1、本发明采用了一种时空并行学习的框架,能够有效地学习到地铁人流量的长短期时间相关性和动态空间相关性,并将所学知识应用于预测。
2、本发明可以直接应用于拥有复杂地铁网络的城市AFC数据集上。
3、本发明构造合理,使用方便,能够克服现有技术的缺陷。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明实施例中的地铁人流量预测方法的示例图。
图2为本发明实施例中的栅格神经网络的示例图。
图3为本发明实施例中的基于转移流量的度量指标的示例图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
如图1-3所示,本发明提供了一种基于时空并行栅格神经网络的地铁人流量预测方法及系统。具体地,本实施例包括如下步骤:
步骤A:提出一种新型的栅格神经网络来学习地铁人流量的时间关系,并基于短期历史地铁人流量和近邻栅格神经网络捕捉地铁人流量短期时间相关性;
步骤B:基于长期历史地铁人流量和周期栅格神经网络进一步捕捉地铁人流量的长期时间相关性;
步骤C:提出一种基于转移流量的新型指标来度量地铁站间的空间相关性,并基于这种指标将地铁系统建模成加权有向图;
步骤D:基于地铁加权有向图的构建,将传播图神经网络与栅格神经网络组合,学习地铁人流量的动态空间相关性;
步骤E:并行执行长短期时间相关性和动态空间相关性的学习过程,并融合两者的结果得到最终的地铁人流量预测结果。
所述步骤A包括如下内容:
步骤A1:对于整个地铁系统,在时间间隔t内,我们使用n维向量 来表示n个站点的地铁人流量。为了预测在下一个时间间隔t+1中的地铁出站流量,我们将过去T个时间间隔内的地铁出站流量用作短期的历史输入数据。从而,我们得到一个长度为T的地铁人流量数据序列X1:T:X1:T=(xt-(T-1),xt-(T-2),…xt);
步骤A2:定义一种新型的栅格神经网络来学习时间关系,如图2右所示,栅格神经网络的基本单元由一维卷积神经网络和非线性激活函数组成,并通过在时间步长和网络层上堆叠其基本单元来构建一个类似于栅格形状的神经网络。具体来说,栅格神经网络的第k+1层中的第j个单元的输入由来自上一层k的隐藏输出和以及来自原始输入序列的Xj-1和Xj组成。第j个单位的变换表示为以下等式
步骤A3:如图2左所示,基于步骤A2定义的基本单元,扩展到所有的时间步骤和所有深度的卷积层,并且共享相同的内核权重矩阵W,得到栅格神经网络结构。给定输入的地铁出站流量数据序列X1:T,我们定义一个栅格神经网络在一个卷积层上的操作定义为
其中*表示零填充的一维因果卷积运算,它只对过去时间间隔中的数据进行卷积,从而保证特征学习的时间性,W表示在所有卷积层之间共享的内核权重矩阵参数;
式中,Γ(s)(·)表示具有s层的近邻栅格神经网络的整体运算操作。
所述步骤B包括如下内容:
步骤B1:构造日周期的长期地铁历史人流量数据。显然,地铁人流量的值在日周期时间间隔(即过去几天中的相同时间间隔)之间彼此非常接近。这种现象表明地铁人流量具有近似长期的周期性。为了捕获地铁人流量中的这种长期周期性,我们将日周期数据定义为过去D天中与预测目标间隔t+1相同的时间间隔内的地铁出站流量,如下所示:
其中,m表示一天中的时间间隔数。
步骤B2:构造近邻-周期栅格神经网络组来捕获长期时间相关性。鉴于相邻两天之间的地铁流在时间上不连续的现象,综合考虑地铁人流量的长短期时间相关性和不连续性,在近邻栅格神经网络之后进一步使用了一个周期栅格神经网络Γ(P),将步骤B2中定义的日周期数据与近邻栅格神经网络的输出结果组合成一个新的序列,并将其作为周期栅格神经网络的输入。即
所述步骤C包括如下步骤:
步骤C1:通过步骤A、B能够很好的学习到地铁出站流量的时间相关性,但是,仅考虑时间相关性通常不足以准确预测地铁出站流量。例如,当城市里某个地方将要举行特殊活动时,附近地铁站的乘客出站流量可能会急剧增加,这很难仅从历史流量的时间相关性中学习。因此使用图卷积-栅格神经网络的模型来学习动态的空间相关性。
显然,在过去的几个时间间隔内,一个站点的出站流量受到附近和远处站点的入站流量的影响,并且这种影响与两个站点之间的转移流量呈正相关。因此,我们提出一种新的基于转移流量的度量指标来表示地铁站之间的空间相关性。
定义1(基于转移流量的度量指标)给定时间间隔t和始发站-目的地站对(i,j),我们用表示在时间间隔t进入第i站在第j站出站的乘客集合。在第i站入站的乘客所经过的时间窗口表示为[et,lt]。基于以上表示,我们定义了基于转移流量的度量
步骤C2:基于步骤C1定义的空间相关性度量指标,将整个地铁系统建模为加权有向图Gt=(V,εt,Mt),其中V={1,2,…n}表示由所有地铁站组成的顶点集,εt表示边缘集,表示以作为边权重的邻接矩阵,即
步骤C3:基于步骤C2构建的地铁有向图,我们将其用作图卷积网络(GCN)的输入来捕获地铁人流量之间的空间相关性。GCN可以分为基于谱分解或基于空域分解的方法。由于拉普拉斯矩阵分解的对称性要求,基于谱分解的方法仅适用于无向图而无法用于这里的地铁有向图。因此,我们提出将传播过程集成到基于空间的图卷积中,并在地铁有向图上使用传播图卷积网络(DGCN)来捕获地铁流的空间相关性。为了预测在时间间隔t+1处的地铁出站流量,图卷积-栅格神经网络中的每个图神经网络都采用所有地铁站在时间间隔t内的地铁入站流量作为输入节点特征,给定如下
所述步骤D包括如下步骤:
步骤D1:为了捕捉动态的空间相关性,我们分别将过去几个时刻的邻接矩阵Mt-s,Mt-s+1,…,Mt输入到s+1个不同的传播神经网络,然后利用动态-栅格神经网络对各个传播神经网络的输出组成的序列进行时间学习,从而得到动态-栅格神经网络的输出结果,即
所述步骤E包括如下步骤:
步骤E1:提出的时空并行神经网络框架将融合时间相关性和空间相关性信息输出最终的地铁人流量预测结果,如图1(c)部分所示,我们将模型中时间模块的输出与空间模块的输出融合,并将融合后的值用作预测的地铁人流量值,即
式中wx和wy是可训练的参数,用于衡量时间相关性学习和动态空间相关性学习的结果对最终地铁人流量预测结果影响的权重,tanh表示激活函数。
本实施例主要关注地铁人流量预测的实际问题,并从时空维度提出了一种基于时空并行栅格神经网络的方法来进行人流量预测。一方面引入栅格神经网络来学习地铁历史人流量复杂的长期周期性特征和短期近邻性特征,另一方面创造性地提出了一种基于转移流量的地铁人流量空间相关性度量指标,并且将栅格神经网络与图卷积神经网络结合来学习地铁人流量的动态空间相关性。在深圳和杭州两个城市的地铁自动计费系统所获取的地铁乘客流量数据集上的实验充分证明了本实施例的有效性。从均方根误差和平均绝对误差指标来看,本实例的性能要显著优于目前最好的交通流量预测方法。尽管本实施例设计用于地铁流量预测场景,但是其提出的时空特征学习的方法同样可以应用于解决其它各种各样的交通预测任务。
本发明还提供的一种基于时空并行栅格神经网络的地铁人流量预测系统,包括如下模块:
模块A:通过栅格神经网络来学习地铁人流量的时间关系,并基于短期历史地铁人流量和近邻栅格神经网络捕捉地铁人流量的短期时间相关性;
模块B:基于长期历史地铁人流量和周期栅格神经网络进一步捕捉地铁人流量的长期时间相关性;
模块C:通过一种基于转移流量的指标来度量地铁站间的空间相关性,并基于所述指标将地铁系统建模成加权有向图;
模块D:基于地铁加权有向图的构建,将传播图神经网络与栅格神经网络组合,学习地铁人流量的动态空间相关性;
模块E:并行执行长短期时间相关性和动态空间相关性的学习过程,并融合两者的结果得到最终的地铁人流量预测结果。
所述模块A包括:
模块A1:对于整个地铁系统,在时间间隔t内,通过n维向量 来表示n个站点的地铁出站流量,提取过去T个时间间隔的地铁人流量数据作为短期历史输入数据,即X1:T=(xt-(T-1),xt-(T-2),…xt);
模块A2:定义栅格神经网络来学习时间关系,栅格神经网络的基本单元由一维卷积神经网络和非线性激活函数组成;
模块A3:将所述基本单元扩展到所有的时间模块和不同卷积层,并共享相同的权重矩阵W,从而构成栅格神经网络的整体结构;给定输入的地铁出站流量数据序列X1:T,设定一个栅格神经网络在一个卷积层上的操作定义为:
式中,Γ(s)(·)表示具有s层的近邻栅格神经网络的整体运算操作。
所述模块B包括:
模块B1:基于地铁人流量的日周期特性,提取过去D天内与预测时段相同的时间间隔内的地铁人流量数据作为长期的日周期历史输入数据,即:
其中,m表示一天中的时间间隔数;
模块B2:将日周期地铁历史人流量数据与近邻栅格神经网络的输出结果组合构成新的序列,并输入到另一个构建的周期栅格神经网络Γ(p)来进一步学习地铁人流量的长期时间相关性,即:
所述模块C包括:
模块C2:基于上述定义的空间相关性度量指标,将整个地铁系统建模为加权有向图Gt=(V,εt,Mt),其中V={1,2,…n}表示由所有地铁站组成的顶点集,εt表示边缘集,表示以作为边权重的邻接矩阵,即:
模块C3:提出基于传播与空域分解的传播图卷积神经网络(DGCN),为预测在时间间隔t+1处的地铁出站流量,将地铁有向图Gt的输入节点特征定义为:
所述模块D包括:
模块D1:在过去s个时间间隔内构造s个地铁有向图,并使用s个DGCN分别处理这些地铁有向图,将输出结果按时间先后组成一个新的序列,并进一步输入到另一个构建的动态栅格神经网络中来学习地铁空间相关性的动态变化特性;
所述模块E包括:
融合时间相关性和空间相关性的学习结果,得到最终的地铁人流量预测值:
式中wx和wy是可训练的参数,用于衡量时间相关性学习和动态空间相关性学习的结果对最终地铁人流量预测结果影响的权重,tanh表示激活函数。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置、模块、单元以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以,本发明提供的系统及其各项装置、模块、单元可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构;也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
Claims (12)
1.一种基于时空并行栅格神经网络的地铁人流量预测方法,其特征在于,包括如下步骤:
步骤A:通过栅格神经网络来学习地铁人流量的时间关系,并基于短期历史地铁人流量和近邻栅格神经网络捕捉地铁人流量的短期时间相关性;
步骤B:基于长期历史地铁人流量和周期栅格神经网络进一步捕捉地铁人流量的长期时间相关性;
步骤C:通过一种基于转移流量的指标来度量地铁站间的空间相关性,并基于所述指标将地铁系统建模成加权有向图;
步骤D:基于地铁加权有向图的构建,将传播图神经网络与栅格神经网络组合,学习地铁人流量的动态空间相关性;
步骤E:并行执行长短期时间相关性和动态空间相关性的学习过程,并融合两者的结果得到最终的地铁人流量预测结果。
2.根据权利要求1所述的基于时空并行栅格神经网络的地铁人流量预测方法,其特征在于,所述步骤A包括:
步骤A1:对于整个地铁系统,在时间间隔t内,通过n维向量 来表示n个站点的地铁出站流量,提取过去T个时间间隔的地铁人流量数据作为短期历史输入数据,即X1:T=(xt-(T-1),xt-(T-2),…xt);
步骤A2:定义栅格神经网络来学习时间关系,栅格神经网络的基本单元由一维卷积神经网络和非线性激活函数组成;
步骤A3:将所述基本单元扩展到所有的时间步骤和不同卷积层,并共享相同的权重矩阵W,从而构成栅格神经网络的整体结构;给定输入的地铁出站流量数据序列X1:T,设定一个栅格神经网络在一个卷积层上的操作定义为:
式中,Γ(s)(·)表示具有s层的近邻栅格神经网络的整体运算操作。
4.根据权利要求1所述的基于时空并行栅格神经网络的地铁人流量预测方法,其特征在于,所述步骤C包括:
步骤C2:基于上述定义的空间相关性度量指标,将整个地铁系统建模为加权有向图Gt=(V,εt,Mt),其中V={1,2,…n}表示由所有地铁站组成的顶点集,εt表示边缘集,表示以作为边权重的邻接矩阵,即:
步骤C3:提出基于传播与空域分解的传播图卷积神经网络(DGCN),为预测在时间间隔t+1处的地铁出站流量,将地铁有向图Gt的输入节点特征定义为:
7.一种基于时空并行栅格神经网络的地铁人流量预测系统,其特征在于,包括如下模块:
模块A:通过栅格神经网络来学习地铁人流量的时间关系,并基于短期历史地铁人流量和近邻栅格神经网络捕捉地铁人流量的短期时间相关性;
模块B:基于长期历史地铁人流量和周期栅格神经网络进一步捕捉地铁人流量的长期时间相关性;
模块C:通过一种基于转移流量的指标来度量地铁站间的空间相关性,并基于所述指标将地铁系统建模成加权有向图;
模块D:基于地铁加权有向图的构建,将传播图神经网络与栅格神经网络组合,学习地铁人流量的动态空间相关性;
模块E:并行执行长短期时间相关性和动态空间相关性的学习过程,并融合两者的结果得到最终的地铁人流量预测结果。
8.根据权利要求7所述的基于时空并行栅格神经网络的地铁人流量预测系统,其特征在于,所述模块A包括:
模块A1:对于整个地铁系统,在时间间隔t内,通过n维向量 来表示n个站点的地铁出站流量,提取过去T个时间间隔的地铁人流量数据作为短期历史输入数据,即X1:T=(xt-(T-1),xt-(T-2),…xt);
模块A2:定义栅格神经网络来学习时间关系,栅格神经网络的基本单元由一维卷积神经网络和非线性激活函数组成;
模块A3:将所述基本单元扩展到所有的时间模块和不同卷积层,并共享相同的权重矩阵W,从而构成栅格神经网络的整体结构;给定输入的地铁出站流量数据序列X1:T,设定一个栅格神经网络在一个卷积层上的操作定义为:
式中,Γ(s)(·)表示具有s层的近邻栅格神经网络的整体运算操作。
10.根据权利要求7所述的基于时空并行栅格神经网络的地铁人流量预测系统,其特征在于,所述模块C包括:
模块C2:基于上述定义的空间相关性度量指标,将整个地铁系统建模为加权有向图Gt=(V,εt,Mt),其中V={1,2,…n}表示由所有地铁站组成的顶点集,εt表示边缘集,表示以作为边权重的邻接矩阵,即:
模块C3:提出基于传播与空域分解的传播图卷积神经网络(DGCN),为预测在时间间隔t+1处的地铁出站流量,将地铁有向图Gt的输入节点特征定义为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110205756.XA CN112990555A (zh) | 2021-02-24 | 2021-02-24 | 基于时空并行栅格神经网络的地铁人流量预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110205756.XA CN112990555A (zh) | 2021-02-24 | 2021-02-24 | 基于时空并行栅格神经网络的地铁人流量预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112990555A true CN112990555A (zh) | 2021-06-18 |
Family
ID=76350133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110205756.XA Pending CN112990555A (zh) | 2021-02-24 | 2021-02-24 | 基于时空并行栅格神经网络的地铁人流量预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112990555A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170178044A1 (en) * | 2015-12-21 | 2017-06-22 | Sap Se | Data analysis using traceable identification data for forecasting transportation information |
CN110866649A (zh) * | 2019-11-19 | 2020-03-06 | 中国科学院深圳先进技术研究院 | 一种短期地铁客流预测方法、系统及电子设备 |
CN111489013A (zh) * | 2020-03-11 | 2020-08-04 | 北京交通大学 | 一种基于时空多图卷积网络的交通站点流量预测方法 |
CN111612281A (zh) * | 2020-06-23 | 2020-09-01 | 中国人民解放军国防科技大学 | 一种地铁站人流量峰值的预测方法、装置和计算机设备 |
CN111860951A (zh) * | 2020-06-12 | 2020-10-30 | 北京工业大学 | 一种基于动态超图卷积网络的轨道交通客流预测方法 |
-
2021
- 2021-02-24 CN CN202110205756.XA patent/CN112990555A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170178044A1 (en) * | 2015-12-21 | 2017-06-22 | Sap Se | Data analysis using traceable identification data for forecasting transportation information |
CN110866649A (zh) * | 2019-11-19 | 2020-03-06 | 中国科学院深圳先进技术研究院 | 一种短期地铁客流预测方法、系统及电子设备 |
CN111489013A (zh) * | 2020-03-11 | 2020-08-04 | 北京交通大学 | 一种基于时空多图卷积网络的交通站点流量预测方法 |
CN111860951A (zh) * | 2020-06-12 | 2020-10-30 | 北京工业大学 | 一种基于动态超图卷积网络的轨道交通客流预测方法 |
CN111612281A (zh) * | 2020-06-23 | 2020-09-01 | 中国人民解放军国防科技大学 | 一种地铁站人流量峰值的预测方法、装置和计算机设备 |
Non-Patent Citations (1)
Title |
---|
JUNJIE OU: ""STP-TrellisNets:Spatial-Temporal Parallel TrellisNets for Metro Station Pssenger Flow Prediction"", 《CIKM 20:PROCEEDINGS OF THE 29TH ACM INTERNATIONAL CONFERENCE ON INFORMATION & KNOWLEDGE MANAGEMENT》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11270579B2 (en) | Transportation network speed foreeasting method using deep capsule networks with nested LSTM models | |
CN110633871B (zh) | 一种基于卷积长短期记忆网络的区域交通需求预测方法 | |
CN109887282A (zh) | 一种基于层级时序图卷积网络的路网交通流预测方法 | |
CN110570651A (zh) | 一种基于深度学习的路网交通态势预测方法及系统 | |
Wang et al. | A multi-view bidirectional spatiotemporal graph network for urban traffic flow imputation | |
CN110717627B (zh) | 一种基于对偶图框架的全量交通预测方法 | |
CN108898838A (zh) | 一种基于lstm模型的机场交通拥堵预测方法及装置 | |
CN110766942A (zh) | 一种基于卷积长短期记忆网络的交通路网拥堵预测方法 | |
CN113313947A (zh) | 短期交通预测图卷积网络的路况评估方法 | |
Ye et al. | Attention-based spatio-temporal graph convolutional network considering external factors for multi-step traffic flow prediction | |
CN114299723B (zh) | 一种交通流量预测方法 | |
Zhang et al. | A Traffic Prediction Method of Bicycle-sharing based on Long and Short term Memory Network. | |
CN111242292B (zh) | 基于深度时空网络的od数据预测方法及系统 | |
EP4016412A1 (en) | Traffic prediction | |
CN113762595B (zh) | 通行时间预测模型训练方法、通行时间预测方法及设备 | |
CN114944053A (zh) | 一种基于时空超图神经网络的交通流预测方法 | |
CN111242395B (zh) | 用于od数据的预测模型构建方法及装置 | |
CN111815075B (zh) | 一种重大公共卫生事件下交通出行需求的预测方法 | |
CN115376317B (zh) | 一种基于动态图卷积和时序卷积网络的交通流预测方法 | |
CN113112791A (zh) | 一种基于滑动窗口长短时记忆网络的交通流量预测方法 | |
CN114529081A (zh) | 一种时空联合的交通流量预测方法及装置 | |
Haputhanthri et al. | Short-term traffic forecasting using LSTM-based deep learning models | |
CN112801386A (zh) | 一种基于三阶段模型的短时交通流预测方法 | |
CN114611814A (zh) | 聚合多尺度时空相似信息的城市交通流预测方法 | |
CN115080795A (zh) | 一种多充电站协同负荷预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210618 |
|
RJ01 | Rejection of invention patent application after publication |