CN111667092B - 基于图卷积神经网络的轨道交通短时客流预测方法和系统 - Google Patents
基于图卷积神经网络的轨道交通短时客流预测方法和系统 Download PDFInfo
- Publication number
- CN111667092B CN111667092B CN202010316862.0A CN202010316862A CN111667092B CN 111667092 B CN111667092 B CN 111667092B CN 202010316862 A CN202010316862 A CN 202010316862A CN 111667092 B CN111667092 B CN 111667092B
- Authority
- CN
- China
- Prior art keywords
- neural network
- time
- passenger flow
- stations
- rail transit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 53
- 238000000034 method Methods 0.000 title claims abstract description 36
- 239000011159 matrix material Substances 0.000 claims abstract description 48
- 238000013136 deep learning model Methods 0.000 claims abstract description 23
- 238000013507 mapping Methods 0.000 claims abstract description 12
- 238000013527 convolutional neural network Methods 0.000 claims description 26
- 238000003860 storage Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 13
- 238000013135 deep learning Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 230000003442 weekly effect Effects 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000005096 rolling process Methods 0.000 claims 6
- 238000012544 monitoring process Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 14
- 235000019580 granularity Nutrition 0.000 description 14
- 238000011161 development Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000005206 flow analysis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- General Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于图卷积神经网络的轨道交通短时客流预测方法和系统。该方法包括:以图结构G=(V,E,A)表征城市轨道交通网络,并以t时刻的特征矩阵F=(Xt,Xt‑1,Xt‑2,…Xt‑m+1)表示t时刻之前m个时间间隔的历史客流情况,其中V表示地铁车站的数目,车站与车站之间有E条边,A∈Rn×n是表征车站之间是否相邻的邻接矩阵,F的维度为n×m,n为车站数目;构建深度学习模型,学习t时刻的特征矩阵F和邻接矩阵A与预测的t+1时刻各车站客流情况之间的映射关系。本发明能够准确预测轨道交通的短时客流情况,对城市轨道交通运营管理部门进行全网水平的短时客流监测、实时管理和工程实践具有重要的指导意义。
Description
技术领域
本发明涉及轨道交通客流分析技术领域,更具体地,涉及基于图卷积神经网络的轨道交通短时客流预测方法和系统。
背景技术
随着城市轨道交通网络化的快速发展,乘客对城市轨道交通的运营管理和服务水平提出了更高的要求。要切实提高轨道交通运营管理的现代化智能化水平,准确把握全网客流发生前后的时空分布状态至关重要,因此全网水平的短时客流预测也成为智能交通系统的关键性基础工作。
纵观短时客流预测的发展历程,大致可分为三个阶段。第一个阶段是传统的基于数理统计的模型,第二个阶段是基于机器学习的模型,第三个阶段是基于深度学习的模型。
具体地,短时客流预测发展的第一个阶段是传统的基于数理统计的模型,例如历史平均模型HA、最小二乘法、时间序列模型、逻辑回归等。该阶段由于城市轨道交通并未迅速发展起来,所做的短时客流预测大多是针对道路交通的,因此,在城市轨道交通领域基本没有应用,而在道路交通领域,由于这些模型固有的一些弊端,例如“实时性”差,预测精度低,即不能满足短时客流预测的实时性要求和预测精度要求,因此该阶段发展起来的模型大多已不再应用。
短时客流预测发展的第二个阶段是基于机器学习的模型,例如利用决策树、随机森林、多层感知机、支持向量机模型等。在这个阶段,随着城市轨道交通的发展,其短时客流预测问题开始得到研究者的重视,因此基于机器学习的模型逐渐被应用到城市轨道交通领域,模型既包括单一模型,也包括一种或多种模型结合使用的混合模型。但是该阶段大多数模型没有考虑车站之间的时空相关性,只是针对一个或几个车站进行单独预测,因而预测精度也受到一定程度的限制。
随着近几年深度学习的快速发展,其良好的预测表现能力极大促进了交通预测领域的革新,短时客流预测也随之进入了第三个发展阶段,即以深度学习模型为代表的发展阶段,循环神经网络,卷积神经网络,图卷积神经网络等相继被挖掘应用到短时客流预测,大量深度学习框架也随即被开发出来。研究表明,深度学习框架比单一的RNN或CNN模型在多数情况下具有更好的模型表现能力。但现有模型不能有效地考虑网络的时空依赖以及网络的拓扑结构对预测精度的影响。
总之,目前所有的短时客流预测模型主要存在以下几个问题:传统的基于数理统计的模型存在实时性较差,预测精度较低等问题;基于机器学习的模型虽然一定程度上提高了短时客流预测精度,但是在预测过程中并没有考虑全网客流之间的时空特性对预测结果的影响,而且该类模型多数只针对一个或几个车站进行预测,无法做到使用一个模型对全网所有车站进行预测;基于深度学习的模型经历了长久的发展,能较好的考虑网络客流的时空特征,以及网络拓扑结构,但如何将进出站客流之间的时空依赖分布特征以及网络的拓扑结构有机结合起来进行短时客流预测,尚存在不足;现有的某些深度学习框架过于复杂,导致模型复杂度高、训练时间过长,因而如何简化模型,降低模型复杂度但不影响模型预测精度,仍是当前短时客流预测领域重要的研究方向。
发明内容
本发明的目的是克服上述现有技术的缺陷,提供基于图卷积神经网络的轨道交通短时客流预测方法和系统,利用基于图卷积神经网络和三维卷积神经网络的深度学习框架,能够有机地将全网客流的时空特性以及网络的拓扑结构结合考虑,进而提高模型的预测精度。
根据本发明的第一方面,提供一种基于图卷积神经网络的轨道交通短时客流预测方法。该方法包括以下步骤:
以图结构G=(V,E,A)表征城市轨道交通网络,并以t时刻的特征矩阵F=(Xt,Xt-1,Xt-2,…Xt-m+1)表示t时刻之前m个时间间隔的历史客流情况,其中V表示地铁车站的数目,车站与车站之间有E条边,A∈Rn×n是表征车站之间是否相邻的邻接矩阵,F的维度为n×m,n为车站数目;
构建深度学习模型,学习t时刻的特征矩阵F和邻接矩阵A与预测的t+1时刻各车站客流情况之间的映射关系,表示为:
Xt+1=f(A;Xt,Xt-1,Xt-2,…Xt-m+1)。
在一个实施例中,所述深度学习模型包括依次连接的图卷积神经网络、三维卷积神经网络和全连接神经网络,所述图卷积神经网络用于捕捉城市轨道交通网络的拓扑结构信息以及进出站客流的时空特征信息,所述三维卷积神经网络用于将所述图卷积神经网络提取到的进站流和出站流信息进行深度融合,所述全连接神经网络用于降维并捕捉高维特征与客流预测结果之间的非线性关系。
在一个实施例中,所述图卷积神经网络包括分别处理进站流图和出站流图的第一图卷积神经网络层和第二图卷积神经网络层。
在一个实施例中,所述进站流图和所述出站流图分别包括邻近客流模式,日客流模式和周客流模式,所述邻近客流模式表示预测时段邻近的前多个时段的客流,所述日客流模式表示前一天同时段的客流,所述周客流模式表示上一周同时段的客流。
在一个实施例中,对于所述邻近客流模式、日客流模式和周客流模式的每一种模式,使用相同的时间步数目。
在一个实施例中,所述图卷积神经网络使用的滤波器是:
其中,A∈Rn×n为邻接矩阵,I∈Rn×n为单位矩阵,为矩阵/>的对角度矩阵,Xl∈Rn×m为第l层的特征矩阵,n代表车站数目,m代表时间步。Wl∈Rm×k为第l层的特征矩阵,其中k为卷积核的数目,b∈Rk×1为偏置向量,σ为激活函数。
在一个实施例中,将所述时间间隔设置为10分钟、15分钟或30分钟。
在一个实施例中,所述全连接神经网络是一层全连接层,所述三维卷积神经网络的输出经压平层展平后,输出至该全连接层中进行降维。
根据本发明的第二方面,提供一种基于图卷积神经网络的轨道交通短时客流预测系统。该系统包括:
图结构构建模块:用于以图结构G=(V,E,A)表征城市轨道交通网络,并以t时刻的特征矩阵F=(Xt,Xt-1,Xt-2,…Xt-m+1)表示t时刻之前m个时间间隔的历史客流情况,其中V表示地铁车站的数目,车站与车站之间有E条边,A∈Rn×n是表征车站之间是否相邻的邻接矩阵,F的维度为n×m,n为车站数目;
深度学习模块:用于构建深度学习模型,学习t时刻的特征矩阵F和邻接矩阵A与预测的t+1时刻各车站客流情况之间的映射关系,表示为:
Xt+1=f(A;Xt,Xt-1,Xt-2,…Xt-m+1)。
与现有技术相比,本发明的优点在于,所构建的切实有效的深度学习框架,借助图卷积神经网络以及三维卷积神经网络,有机地将进站客流、出站客流、以及网络拓扑结构融合起来进行城市轨道交通短时客流预测,既能满足短时客流预测“实时性”的要求,又能提高预测精度,同时能够使用同一模型进行全网同步预测,模型中借助图卷积神经网络,能够降低模型训练时间,节省计算资源。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1是根据本发明一个实施例的基于图卷积神经网络的轨道交通短时客流预测方法的流程图;
图2是根据本发明一个实施例的基于图卷积神经网络的深度学习模型框架示意图;
图3是根据本发明一个实施例的单条地铁线路上的图卷积的示意图;
图4是根据本发明一个实施例的地铁网络上的图卷积的示意图;
图5是根据本发明一个实施例的三维卷积神经网络和二维卷积神经网络的示意图;
图6是根据本发明一个实施例的全连接层示意图;
图7是根据本发明一个实施例的超参数微调结果的示意图;
图8是根据本发明一个实施例的不同时间粒度下的模型表现结果的示意图;
附图中,input-输入;GCN-图卷积神经网络;First GCN layer-第一图卷积神经网络层;Second GCN layer-第二图卷积神经网络层;Weekly-周;Daily-日;Recent-最近;Spatial and Topological Correlation-时空特征和网络拓扑结构相关性;Time Step-时间步;Batch Size-批大小;Filter number-滤波器数目;Kernel number-核数目;TimeInterval时间间隔;Flatten Layer-压平层;Fully Connection Layer-全连接层;OutputLayer-输出层;Inflow-进站流;Outflow-出站流。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
参见图1所示,简言之,本发明实施例提供的基于图卷积神经网络的轨道交通预测方法包括以下步骤:
步骤S110,以图结构G=(V,E,A)表征城市轨道交通网络,并以t时刻的特征矩阵F=(Xt,Xt-1,Xt-2,…Xt-m+1)表示t时刻之前m个时间间隔的历史客流情况。
其中V表示地铁车站的数目,车站与车站之间有E条边,A∈Rn×n是表征车站之间是否相邻的邻接矩阵,F的维度为n×m,n为车站数目。
步骤S120,构建深度学习模型,学习t时刻的特征矩阵F和邻接矩阵A与预测的t+1时刻各车站客流情况之间的映射关系,表示为Xt+1=f(A;Xt,Xt-1,Xt-2,…Xt-m+1)。
利用所学习到的映射关系,可以预测城市轨道交通网络中不同时间间隔的进出站客流情况。
为进一步理解,在下文将从本发明的技术方案出发,分别介绍:所要解决的科学问题的详细定义;所提出的深度学习模型的整体框架,以及整体框架所涉及的图卷积神经网络和三维卷积神经网络等。
1)、本发明所解决的问题定义
本发明的目的是同时预测城市轨道交通全网所有车站某一时段的进站客流量。将城市轨道交通网络定义为一张图G=(V,E,A),图中有V个地铁车站,车站与车站之间有E条边,A∈Rn×n代表该网络的邻接矩阵,例如包括0,1两种元素,0代表两个车站不相邻,1代表两个车站相邻。本发明还定义特征矩阵F∈Rn×m=(Xt,Xt-1,Xt-2,…Xt-m+1),其维度为n×m,n为车站数目,根据地铁线路号进行排序,m代表时间间隔,即用过去m个时间间隔的客流去预测未来的客流,X∈Rn×1为每个特定时间间隔的客流向量,代表所有车站在该时段的进站客流。每一个时间间隔都有一个相同维度的特征矩阵,特征矩阵随着时间进行推移。本发明所要解决的问题是利用t时刻的特征矩阵F和邻接矩阵A预测未来t+1时刻所有车站的进站客流,例如,表示为:
Xt+1=f(A;Xt,Xt-1,Xt-2,…Xt-m+1)(1)
其中,f是本发明提出的深度学习模型框架将要学习的映射函数。
2)、关于深度学习模型的整体框架结构
本发明基于图卷积神经网络构建深度学习模型,在下文中,将本发明所提出的模型框架称为Conv-GCN。
如图2所示,在一个实施例中,本发明提出的深度学习模型包括三部分,第一部分为多图卷积神经网络GCN部分,包括进站流(Inflow)图和出站流(Outflow)图,该部分能够有效捕捉网络的拓扑结构信息以及进出站客流各自的时空特征信息。每一个图可包含多种客流模式,例如包括邻近客流、日客流和周客流三种客流模式,分别代表所要预测时段邻近的前几个时段的客流,前一天同时段的客流以及上一周同时段的客流。第二部分和第三部分分别为三维卷积神经网络(Conv3D)部分和全连接神经网络(FC,Fully connectedlayer)部分。三维卷积神经网络用于将GCN层提取到的进站流和出站流信息进行深度融合,全连接神经网络层用于降维以及捕捉高维特征与预测结果之间的非线性关系。
3)、关于多图卷积神经网络
GCN层具有强大的提取时空特征和网络拓扑结构信息的能力,对于本发明提出的深度学习模型框架具有举足轻重的作用。本文以分别处理进站流和出站流两张图为例进行介绍。GCN可使用现有技术中的谱图卷积滤波器或切比雪夫多项式滤波器或一阶近似滤波器等。例如,本发明实施例使用的GCN滤波器表示为:
其中A∈Rn×n为邻接矩阵,I∈Rn×n为单位矩阵,为矩阵/>的对角度矩阵,Xl∈Rn×m为第l层的特征矩阵,n代表车站数目,m代表时间步。Wl∈Rm×k为第l层的特征矩阵,其中k为卷积核的数目,即每个节点输出的特征数,b∈Rk×1为偏置向量,σ为激活函数。
本发明实施例所使用的GCN层如图3和图4所示。以车站E为例,如果仅有单条地铁线路,图3示意了单条线路的所有车站,对于车站E的短时客流预测,第一个GCN层将会捕捉到邻接车站D和F对车站E的影响,在第一个GCN层的基础上再叠加一个GCN层,车站C和G的影响也将被应用到车站E的预测过程当中。同样地,在整个地铁网络中,如果车站E为两条地铁线路的换乘车站,第一层GCN将会捕捉4个邻接车站的影响,第二层GCN将会捕捉与4个邻接车站所连接的车站对E的预测的影响,依次类推。在本发明实施例中,将第一层GCN分别用到进站流图和出站流图。
进一步地,对于两张图,分别考虑多种客流模式的影响,例如邻近客流、日客流和周客流等三种模式。在每一种模式中,可应用相同的时间步数目。这种组织方式具有以下优势:首先,能够捕捉不同客流模式之间的时间依赖关系。其次,邻近车站和距离较远车站之间的空间依赖关系也能够被很好地提取出来。最后,相邻车站之间的网络拓扑信息能够被充分利用。模型框架包含的两张图分别处理进站流和出站流,输出结果再被连接起来输入到三维卷积神经网络当中,以深度融合从进站流和出站流中提取到的高维特征信息。
4)、关于三维卷积神经网络
优选地,本发明提出的深度学习模型框架使用三维卷积神经网络结构(3DCNN)而非普通的二维卷积神经网络结构(2DCNN),如图5所示,其中上方是2DCNN,下方是3DCNN,二维卷积神经网络的卷积核是平面的,三维卷积神经网络的卷积核是立体的。三维卷积神经网络的优势在于,首先,三维的卷积核能够有效地将不同通道的信息有机整合起来。其次,三维卷积是在时间和空间两个维度上进行卷积,而二维卷积只能在空间维度上进行卷积,所以三维卷积具有更强的时空学习能力。因此,本发明实施例中使用3DCNN以深度融合进站流和出站流的信息,进而进出站客流不同模式的高维时空特征信息、以及远近车站之间的高维时空特征信息能够被有效提取出来。
三维卷积神经网络的输出进而被Flatten层展平,然后输出到全连接层中进行降维,全连接层用于对Flatten层进行降维,以逐渐降维到所需要的维度,如图6所示,以刻画高维时空特征信息和预测结果之间的非线性关系。经过反复试验,本发明使用了一层全连接层将展平后的高维时空特征信息降到所需要的维度。
相应地,本发明还提供一种基于图卷积神经网络的轨道交通短时客流预测系统,用于实现上述方法的一个方面或多个方面。例如,该系统包括:图结构构建模块,其用于以图结构G=(V,E,A)表征城市轨道交通网络,并以t时刻的特征矩阵F=(Xt,Xt-1,Xt-2,…Xt-m+1)表示t时刻之前m个时间间隔的历史客流情况,其中V表示地铁车站的数目,车站与车站之间有E条边,A∈Rn×n是表征车站之间是否相邻的邻接矩阵,F的维度为n×m,n为车站数目;深度学习模块,其用于构建深度学习模型,学习t时刻的特征矩阵F和邻接矩阵A与预测的t+1时刻各车站客流情况之间的映射关系,表示为Xt+1=f(A;Xt,Xt-1,Xt-2,…Xt-m+1)。
为进一步验证本发明的效果和可行性,使用北京连续五周的地铁卡数据进行试验,并与现有的几个经典的短时客流预测模型进行对比,具体实验过程包括以下方面。
1)、数据集
本发明使用的数据集为2016年2月29日至2016年4月3日连续5周工作日的北京地铁刷卡数据,包括17条线路和276个车站(不包括机场线),刷卡时间为05:00到23:00。每条数据记录包含卡号、进站时间、进站站点名称、出站时间、出站站点名称。预测的时间粒度为10分钟、15分钟和30分钟,前四周的数据用来训练模型,后一周的数据用来测试模型,数据集中包括276个车站,因此邻接矩阵A∈R276×276的维度为276*276,特征矩阵F∈R276×m的维度为276*m,m为时间步,其每一行代表一个车站,每一列代表所有车站在特定时间段的客流数据。所有的数据使用min-max scaler归一化到(0,1),结果评估时再反归一化到数据原始的量级。
2)、评价指标与损失函数
本发明使用的损失函数(Loss)为均方误差Mean Square Error(MSE),所使用的评价指标为均方根误差Root Mean Square Error(RMSE)、平均绝对误差Mean AbsoluteError(MAE)和加权平均绝对百分比误差weighted Mean Absolute Percentage Error(WMAPE),如公式(3)到(6)所示。
3)、模型对比
将本发明所提出的Conv-GCN模型与现有的几个模型进行对比,以证明本发明模型的有效性。所有的模型在一台带有i7-8700K处理器(12M缓存,频率最高4.7GHz),8GB运行内存,以及NVIDIA GeForce GTX 1070 Ti显卡的台式机进行运算。
所对比的现有模型包括:
HA:历史平均模型,其使用三种客流模式中最后一个时间步的客流平均值作为历史平均模型预测结果。
ARIMA:自回归移动平均模型,其使用SPSS软件中的专家建模器进行建模得到预测结果。
LSTM:长短时记忆网络模型,其使用的LSTM模型带有两层隐藏层。
2DCNN:二维卷积神经网络模型,其使用的2DCNN模型带有两层隐藏层。
ConvLSTM:卷积循环神经网络模型,其使用的ConvLSTM模型带有两层隐藏层。
ST-ResNet:时空残差网络模型,其使用其中的三个分支,不包含天气数据分支。
ResLSTM:融合了GCN、ResNet和注意力机制的LSTM模型的深度学习框架。
4)、模型超参数设置
本发明使用Keras和TensorFlow搭建提出的深度学习模型框架。经过反复试验,该模型框架包含两个分支,每个分支包含一层GCNlayer,主干包含一层3DCNN layer,一层Flatten layer以及一层全连接层。模型中含有几个重要的超参数:time step,batchsize,GCN层的kernelnumber,Conv3D层的filternumber。为了探索最佳超参数配置,本发明将timestep设置为[3,17],batch size设置为(4,8,16,32,64,128,256),Conv3D层的filternumber设置为(1,2,4,8,16,32,64),GCN层的kernel number设置为(6,9,12,15,18,21,24)。调参过程中使用控制变量法,调参结果如图7所示。根据不同超参数下的预测结果RMSE和MAE,time step,batch size,filter number和kernel number最终取值为10,64,16和15。对于超参数time step,在进行10分钟,15分钟和30分钟的预测过程中分别取值30,20和10。
5)、实验结果分析
实验结果如表1和图8所示。可以看出,本发明提出的Conv-GCN模型表现最好。传统的HA和ARIMA模型无论在哪个时间粒度下均表现较差,基于CNN和RNN的模型如LSTM和2DCNN,表现比传统模型提升很大。此外,ConvLSTM,ST-ResNet和ResLSTM混合模型比单一的LSTM模型和2DCNN模型表现较好。而本发明提出的Conv-GCN在所有情况下均表现最好(对应图8中各部分的最右侧的条形),展现出模型良好的鲁棒性和模型表现能力。
表1不同时间粒度下的模型表现结果
从表1可以看出,无论是稍短时的10分钟预测,还是稍长时的30分钟预测,本发明在任何情况下均表现最好,下文以本发明提出的深度学习模型和现有的ResLSTM模型为例,对三个评价指标分别加以说明。
对于RMSE,10分钟时间粒度下从28.3661下降到25.6992,15分钟时间粒度下从36.0444下降到33.2488,30分钟时间粒度下从56.9649下降到51.6925,效果分别提升9.402%,7.756%,9.256%。
对于MAE,10分钟时间粒度下从16.6318下降到15.5188,15分钟时间粒度下从20.8783下降到19.8687,30分钟时间粒度下从32.5819下降到30.7568,效果分别提升6.692%,4.836%,5.602%。
对于WMAPE,10分钟时间粒度下从9.352%下降到8.983%,15分钟时间粒度下从7.805%下降到7.678%,30分钟时间粒度下从6.134%下降到5.962%,效果分别提升3.946%,1.627%,2.804%。
实验证明,本发明所提出的基于图卷积神经网络的深度学习模型,大幅提高了短时客流的预测精度,对城市轨道交通运营管理部门进行全网水平的短时客流监测、实时管理和工程实践具有重要的指导意义。
综上所述,针对既有的短时客流预测模型不能有效地考虑网络的时空依赖以及网络的拓扑结构对预测精度的影响,本发明提出了一种新的深度学习模型框架,该模型框架融合了图卷积神经网络以及3D卷积神经网络,同时考虑了进站量和出站量对短时客流预测精度的影响,相对于现有模型,本发明对于不同时间粒度的客流预测均提高了预测准确度。
需要说明的是,上述实施例仅是示意性,在不违背本发明精神的情况下,本领域的技术人员可做适当的改变或变型,例如,设置不同的时间粒度、不同的客流模式等。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。
Claims (9)
1.一种基于图卷积神经网络的轨道交通短时客流预测方法,包括以下步骤:
以图结构G=(V,E,A)表征城市轨道交通网络,并以t时刻的特征矩阵F=(Xt,Xt-1,Xt-2,…Xt-m+1)表示t时刻之前m个时间间隔的历史客流情况,其中V表示地铁车站的数目,车站与车站之间有E条边,A∈Rn×n是表征车站之间是否相邻的邻接矩阵,F的维度为n×m,n为车站数目;
构建深度学习模型,学习t时刻的特征矩阵F和邻接矩阵A与预测的t+1时刻各车站客流情况之间的映射关系,表示为:
Xt+1=f(A;Xt,Xt-1,Xt-2,…Xt-m+1);
其中,所述深度学习模型包括依次连接的图卷积神经网络、三维卷积神经网络和全连接神经网络,所述图卷积神经网络用于捕捉城市轨道交通网络的拓扑结构信息以及进出站客流的时空特征信息,所述三维卷积神经网络用于将所述图卷积神经网络提取到的进站流和出站流信息进行深度融合,所述全连接神经网络用于降维并捕捉高维特征与客流预测结果之间的非线性关系。
2.根据权利要求1所述的方法,其中,所述图卷积神经网络包括分别处理进站流图和出站流图的第一图卷积神经网络层和第二图卷积神经网络层。
3.根据权利要求2所述的方法,其中,所述进站流图和所述出站流图分别包括邻近客流模式,日客流模式和周客流模式,所述邻近客流模式表示预测时段邻近的前多个时段的客流,所述日客流模式表示前一天同时段的客流,所述周客流模式表示上一周同时段的客流。
4.根据权利要求3所述的方法,其中,对于所述邻近客流模式、日客流模式和周客流模式的每一种模式,使用相同的时间步数目。
6.根据权利要求1所述的方法,其中,将所述时间间隔设置为10分钟、15分钟或30分钟。
7.根据权利要求1所述的方法,其中,所述全连接神经网络是一层全连接层,所述三维卷积神经网络的输出经压平层展平后,输出至该全连接层中进行降维。
8.一种基于图卷积神经网络的轨道交通短时客流预测系统,包括:
图结构构建模块:用于以图结构G=(V,E,A)表征城市轨道交通网络,并以t时刻的特征矩阵F=(Xt,Xt-1,Xt-2,…Xt-m+1)表示t时刻之前m个时间间隔的历史客流情况,其中V表示地铁车站的数目,车站与车站之间有E条边,A∈Rn×n是表征车站之间是否相邻的邻接矩阵,F的维度为n×m,n为车站数目;
深度学习模块:用于构建深度学习模型,学习t时刻的特征矩阵F和邻接矩阵A与预测的t+1时刻各车站客流情况之间的映射关系,表示为:
Xt+1=f(A;Xt,Xt-1,Xt-2,…Xt-m+1);
其中,所述深度学习模型包括依次连接的图卷积神经网络、三维卷积神经网络和全连接神经网络,所述图卷积神经网络用于捕捉城市轨道交通网络的拓扑结构信息以及进出站客流的时空特征信息,所述三维卷积神经网络用于将所述图卷积神经网络提取到的进站流和出站流信息进行深度融合,所述全连接神经网络用于降维并捕捉高维特征与客流预测结果之间的非线性关系。
9.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010316862.0A CN111667092B (zh) | 2020-04-21 | 2020-04-21 | 基于图卷积神经网络的轨道交通短时客流预测方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010316862.0A CN111667092B (zh) | 2020-04-21 | 2020-04-21 | 基于图卷积神经网络的轨道交通短时客流预测方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111667092A CN111667092A (zh) | 2020-09-15 |
CN111667092B true CN111667092B (zh) | 2023-06-23 |
Family
ID=72382656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010316862.0A Active CN111667092B (zh) | 2020-04-21 | 2020-04-21 | 基于图卷积神经网络的轨道交通短时客流预测方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111667092B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112329986A (zh) * | 2020-10-13 | 2021-02-05 | 厦门市交通研究中心 | 一种共享单车的停放管理方法、装置及设备 |
CN112598182B (zh) * | 2020-12-25 | 2022-11-29 | 卡斯柯信号有限公司 | 一种轨道交通智能调度方法及系统 |
CN113077090B (zh) * | 2021-04-09 | 2023-05-23 | 上海大学 | 客流预测方法、系统及计算机可读存储介质 |
CN113393017B (zh) * | 2021-05-07 | 2022-08-23 | 浙江警官职业学院 | 一种基于个体复杂关系的监管场所安全预警方法及装置 |
CN113298314B (zh) * | 2021-06-10 | 2023-09-01 | 重庆大学 | 一种考虑动态时空相关性的轨道交通客流预测方法 |
CN113537580B (zh) * | 2021-06-28 | 2024-04-09 | 中科领航智能科技(苏州)有限公司 | 一种基于自适应图学习的公共交通客流预测方法及系统 |
CN114061605B (zh) * | 2021-10-15 | 2024-04-26 | 交控科技股份有限公司 | 车站引导路径控制方法、电子设备及计算机可读存储介质 |
CN114626585B (zh) * | 2022-02-28 | 2023-09-08 | 北京交通大学 | 一种基于生成对抗网络的城市轨道交通短时客流预测方法 |
CN114881330A (zh) * | 2022-05-09 | 2022-08-09 | 华侨大学 | 一种基于神经网络的轨道交通客流预测方法及系统 |
CN114997543B (zh) * | 2022-08-03 | 2023-01-13 | 通号通信信息集团有限公司 | 人流量预测方法、电子设备、可读介质 |
CN116109234B (zh) * | 2022-12-01 | 2023-08-08 | 北京交通大学 | 一种基于预测与决策一体化的快递系统智能订单分配方法 |
CN117131999B (zh) * | 2023-09-14 | 2024-04-30 | 浙江非线数联科技股份有限公司 | 基于数字孪生的轨道交通客流量预测系统及其方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103394A (zh) * | 2017-05-27 | 2017-08-29 | 重庆大学 | 一种基于神经网络的轨道交通实时客流预测方法 |
CN107529651A (zh) * | 2017-08-18 | 2018-01-02 | 北京航空航天大学 | 一种基于深度学习的城市交通客流预测方法和设备 |
CN109886444A (zh) * | 2018-12-03 | 2019-06-14 | 深圳市北斗智能科技有限公司 | 一种交通短时客流预测方法、装置、设备和存储介质 |
-
2020
- 2020-04-21 CN CN202010316862.0A patent/CN111667092B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103394A (zh) * | 2017-05-27 | 2017-08-29 | 重庆大学 | 一种基于神经网络的轨道交通实时客流预测方法 |
CN107529651A (zh) * | 2017-08-18 | 2018-01-02 | 北京航空航天大学 | 一种基于深度学习的城市交通客流预测方法和设备 |
CN109886444A (zh) * | 2018-12-03 | 2019-06-14 | 深圳市北斗智能科技有限公司 | 一种交通短时客流预测方法、装置、设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
基于图卷积神经网络和注意力机制的短时交通流量预测;李志帅 等;交通工程;第19卷(第4期);15-20 * |
Also Published As
Publication number | Publication date |
---|---|
CN111667092A (zh) | 2020-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111667092B (zh) | 基于图卷积神经网络的轨道交通短时客流预测方法和系统 | |
Chu et al. | Deep multi-scale convolutional LSTM network for travel demand and origin-destination predictions | |
CN113905391B (zh) | 集成学习网络流量预测方法、系统、设备、终端、介质 | |
DE112021004908T5 (de) | Computerbasierte systeme, rechenkomponenten und rechenobjekte, die eingerichtet sind, dynamische ausreisser-verzerrungs-verringerung bei maschinenlernmodellen zu implementieren | |
CN111832570A (zh) | 一种图像语义分割模型训练方法及系统 | |
CN112863180B (zh) | 交通速度预测方法、装置、电子设备及计算机可读介质 | |
CN114781609B (zh) | 一种基于多模式动态残差图卷积网络的交通流预测方法 | |
CN114519932B (zh) | 一种基于时空关系抽取的区域交通状况集成预测方法 | |
Zhene et al. | Deep convolutional mesh RNN for urban traffic passenger flows prediction | |
CN114626585B (zh) | 一种基于生成对抗网络的城市轨道交通短时客流预测方法 | |
CN109635246B (zh) | 一种基于深度学习的多属性数据建模方法 | |
WO2023016159A1 (zh) | 智慧城市网络流量预测方法及系统 | |
CN115034496A (zh) | 基于GCN-Transformer的城市轨道交通节假日短时客流预测方法 | |
CN113902007A (zh) | 模型训练方法及装置、图像识别方法及装置、设备和介质 | |
Luo et al. | Stgin: A spatial temporal graph-informer network for long sequence traffic speed forecasting | |
CN114757389A (zh) | 一种基于联邦学习的城市交通流量时空预测方法 | |
Mokshin et al. | Simulation and optimization of the cargo terminal in the AnyLogic environment | |
CN109903075B (zh) | 基于dnn的回归分布模型及其训练方法、电子设备 | |
Li | Prediction of tourism demand in liuzhou region based on machine learning | |
Riboni et al. | Bayesian optimization and deep learning for steering wheel angle prediction | |
CN116934380A (zh) | 一种异常事件下的电商物资供需联合预测方法 | |
CN115392752B (zh) | 一种地铁短时客流预测方法、系统、电子设备及存储介质 | |
Lu et al. | A network traffic prediction model based on reinforced staged feature interaction and fusion | |
CN115762147A (zh) | 一种基于自适应图注意神经网络的交通流量预测方法 | |
CN114548572A (zh) | 城市路网交通状态的预测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |