CN115375020A - 一种轨道交通关键od对的流量预测方法及系统 - Google Patents
一种轨道交通关键od对的流量预测方法及系统 Download PDFInfo
- Publication number
- CN115375020A CN115375020A CN202210977354.6A CN202210977354A CN115375020A CN 115375020 A CN115375020 A CN 115375020A CN 202210977354 A CN202210977354 A CN 202210977354A CN 115375020 A CN115375020 A CN 115375020A
- Authority
- CN
- China
- Prior art keywords
- key
- pairs
- data
- pair
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 239000011159 matrix material Substances 0.000 claims abstract description 74
- 238000013528 artificial neural network Methods 0.000 claims abstract description 44
- 238000000605 extraction Methods 0.000 claims abstract description 24
- 238000001914 filtration Methods 0.000 claims abstract description 17
- 238000013075 data extraction Methods 0.000 claims abstract description 4
- 238000010276 construction Methods 0.000 claims abstract 2
- 230000000306 recurrent effect Effects 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000002776 aggregation Effects 0.000 claims description 6
- 238000004220 aggregation Methods 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 claims description 3
- 230000006735 deficit Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 abstract description 2
- 238000003860 storage Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000008520 organization Effects 0.000 description 2
- 238000007430 reference method Methods 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Mathematical Physics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Algebra (AREA)
- Operations Research (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明的实施例公开了一种轨道交通关键OD对的流量预测方法及系统。方法包括:获取原始客流数据,过滤得到乘车记录数据;将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵;设置阈值,提取关键OD对集合;利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系;采用图卷积神经网络和门控循环神经网络结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果。系统包括:原始数据提取模块、OD矩阵汇总模块、关键OD对抽取模块、虚拟图构建模块和建模预测模块。本发明能够解决城市轨道交通短期OD流量预测问题,为地铁运营和管理提供数据参考,同时辅助突发事件应急处置,降低突发事件造成的持续影响。
Description
技术领域
本发明涉及智能交通技术领域,特别涉及一种轨道交通关键OD对的流量预测方法及系统。
背景技术
近年来,城市轨道交通进入网络化运营时代,逐步承担起缓解大城市道路交通拥塞的责任。以深圳地铁为例,2018年单日地铁出行规模已突破500万人次,承担了整个城市三分之一以上的交通流量,在城市公共交通系统中占据重要地位。日益增加的出行需求给城市轨道交通带来了严重的运营压力,特别是在早、晚高峰时期,通勤需求量大,地铁的运行运营效率将直接影响城市的整体通勤效率。在此背景之下,客流预测类研究成为了研究人员关注的关键问题。
现有的研究大多针对于进出站客流量、日客流量、小时客流量及断面客流量的预测,其中OD预测的研究内容相对较少。而OD客流体现着进出站客流的流向和分布,是乘客出行需求的直观体现,蕴含着非常有价值的信息,是网络化运营条件下地铁行车组织、客运组织和乘客服务的基础支撑数据。但是由于OD数据维数高与数据稀疏性的问题,对于OD矩阵直接进行预测的难度很大,同时现有研究并没有提出OD对之间存在的隐含空间关系。
发明内容
有鉴于此,本发明实施例的目的在于提供一种轨道交通关键OD对的流量预测方法及系统,能够解决城市轨道交通短期关键OD对流量预测问题,为地铁运营和管理提供数据参考,同时辅助突发事件应急处置,降低突发事件造成的持续影响。
第一方面,本发明实施例提供了一种轨道交通关键OD对的流量预测方法,其中,包括:
获取原始客流数据,过滤得到乘车记录数据。
将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵。
设置阈值,提取关键OD对集合。
利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系。
采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述获取原始客流数据,过滤得到乘车记录数据,包括:
从轨道交通AFC系统获得原始刷卡数据。
设置数据过滤条件,从所述原始刷卡数据中提取包括卡号、进站时间、进站站点、出站站点、出站时间的乘车记录数据。
由于地铁在进出站时均需要刷卡,因此需要同时拥有一张交通卡的进出站记录才能构成一条完整的乘车记录,设置数据过滤条件提取原始数据中完整且合理的乘车记录。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述数据过滤条件包括:
每一条乘车记录数据均包含进站记录和出站记录。
每一条乘车记录数据的进站站点和出站站点不同。
每一条乘车记录数据的进站时间在6:00以后。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵,包括:
将过滤得到乘车记录数据,以固定的时间间隔T,基于进站时间,统计时段内由O站驶向D站的交通需求,进行汇总。
得到t时刻全网客流N*N的OD矩阵
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述设置阈值,提取关键OD对集合,包括:
设置零元素占比z、随机性判断值r、和大于随机性判断值的数据占比p三个阈值。
利用每个OD对的历史客流数据集合Hs作为筛选依据,Hs={h1,h2,...,hs},其中,s为选取的历史数据长度,hi代表该时间段OD客流量。
生成两个子集合Hs′和Hs″,关键OD对满足条件
其中,Hs′={hi|hi∈HS and hi=0,i=1,2,...,s}代表一个元素值均为0的OD对子集,Hs″={hi|hi∈HS and hi>r,i=1,2,...,s}代表一个集合中元素值均大于随机性判断值r的OD对子集。
提取得到关键OD对集合KOD={k1,k2,...,kn}。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系,包括:
计算皮尔逊相关系数
计算关键OD对之间的相关性矩阵Rn×n,
设置相关性阈值c,得到表示OD对之间虚拟连接关系的相关性矩阵A,
A用于表示OD对之间的虚拟连接关系,仅包含0和1的元素,如果节点之间没有连接,则Aij为0,否则为1。
本发明基于关键OD对进行预测,失去了基于现实站点物理图的依赖关系,但是OD对自身结合了起仡站点的空间性质,例如O站为居住区,D站为办公区,具有类似性质的OD对表现出相关性,即OD对之间可能因为具有相似的功能性而具有类似的流量分布特征,因此可以建立虚拟连接边生成邻接矩阵。
结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,所述采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果,包括:由输入层接收OD对表示的历史客流信息,对关键OD对进行提取,以关键OD对多个时间步长的历史流量信息形成特征矩阵其中,X代表全网全时段的关键OD对历史数据集合,xt表示各个关键OD对在t时刻采集的历史数据集合,xt=[x(k1),x(k2),...,x(kn)]T,再利用皮尔逊相关系数,构建虚拟图生成邻接矩阵A,并将特征矩阵X和邻接矩阵A作为特征提取层的输入。
特征提取层采用基于谱方法的图卷积神经网络GCN,对来自输入层的数据进行图卷积操作,对节点特征信息和结构信息进行端到端学习,获取节点信息聚合空间特征,
将包含空间信息的序列数据输入增加图卷积操作改进后的门控循环神经网络GRU中,捕捉时序特征,将第t-1个时刻的隐藏状态和当前的关键OD对流量信息作为输入,得到第t个时刻的流量状态
zt=σ(Wz[f(Xt,A),ht-1]+bz),
rt=σ(Wr[f(Xt,A),ht-1]+br),
其中,ht-1为第t-1个时刻的隐藏状态,Xt为第t个时刻所有关键OD对的流量信息,rt为GRU模型中的重置门,决定了如何将新的输入信息与前面的信息相结合,zt为GRU模型中的更新门,定义了前面信息保存到当前时间步的量,为第t个时刻存储的内存内容,ht为第t个时刻的输出状态。
由输出层输出预测结果。
结合第一方面,本发明实施例提供了第一方面的第七种可能的实施方式,其中,所述采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果,还包括:
通过损失函数对输出的预测值进行优化
第二方面,本发明实施例还提供了一种轨道交通OD对的流量预测系统,其中,包括:
原始数据提取模块,用于获取原始客流数据,过滤得到乘车记录数据。
OD矩阵汇总模块,用于将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵。
关键OD对抽取模块,用于设置阈值,提取关键OD对集合。
虚拟图构建模块,用于利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系。
建模预测模块,用于采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,所述关键OD对抽取模块包括:
阈值设置单元,用于设置零元素占比z、随机性判断值r、和大于随机性判断值的数据占比p三个阈值。
OD对筛选单元,用于利用每个OD对的历史客流数据集合Hs作为筛选依据,Hs={h1,h2,...,hs},其中,s为选取的历史数据长度,hi代表该时间段OD客流量,生成两个子集合Hs′和Hs″,关键对满足条件
其中,Hs′={hi|hi∈HS and hi=0,i=1,2,...,s}代表一个元素值均为0的OD对子集,Hs″={hi|hi∈HS and hi>r,i=1,2,...,s}代表一个集合中元素值均大于随机性判断值r的OD对子集。
关键OD对提取单元,用于提取得到关键OD对集合KOD={k1,k2,...,kn}。
结合第二方面,本发明实施例提供了第二方面的第二种可能的实施方式,其中,所述虚拟图构建模块包括:
结合第二方面,本发明实施例提供了第二方面的第三种可能的实施方式,其中,所述建模预测模块包括:
输入层单元,用于接收OD对表示的历史客流信息,对关键OD对进行提取,以关键OD对多个时间步长的历史流量信息形成邻接特征矩阵X=[x1,...,xt],其中,X代表全网全时段的关键OD对历史数据集合,xt表示各个关键OD对在t时刻采集的历史数据集合,xt=[x(k1),x(k2),...,x(kn)]T,再利用皮尔逊相关系数,构建虚拟图生成邻接矩阵A,并将特征矩阵X和邻接矩阵A作为特征提取层的输入。
特征提取层单元,包括图卷积神经网络GCN模块和门控循环神经网络GRU模块。
所述图卷积神经网络GCN模块采用基于谱方法的图卷积神经网络GCN,对来自输入层的数据进行图卷积操作,对节点特征信息和结构信息进行端到端学习,获取节点信息聚合空间特征,得到包含空间信息的序列数据Xt′=[x1′,...,xt′]。
所述门控循环神经网络GRU模块将包含空间信息的序列数据输入增加图卷积操作改进后的门控循环神经网络GRU中,捕捉时序特征。
输出层单元,用于由输出层输出预测结果。
本发明实施例的有益效果是:
本发明提供了一种轨道交通关键OD对的流量预测方法及系统,通过设置三个阈值提取关键OD对,解决了OD客流具有数据稀疏性和数据维数高的问题,利用皮尔逊相关系数计算关键OD对之间的相关性,建立关键OD对的虚拟图,使用GCN捕获这种关联关系,再通过GRU捕获时序信息,通过结合时间和空间信息增强了模型的灵活性和表达能力。目的在于解决城市轨道交通短期关键OD对流量预测问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明轨道交通OD对的流量预测方法的流程图;
图2为本发明轨道交通关键OD对的流量预测方法及系统模型预测框架示意图;
图3为本发明轨道交通OD对的流量预测方法的GCN和GRU结合的计算过程示意图;
图4为本发明轨道交通OD对的流量预测方法的10钟粒度的关键OD对流量数据的预测情况可视化展示示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件能够以各种不同的配置来布置和设计。
请参照图1至图4,本发明的第一个实施例提供一种轨道交通OD对的流量预测方法,获取原始客流数据,过滤得到乘车记录数据;将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵;设置阈值,提取关键OD对集合;利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系;采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果。本发明的目的是在给定前n个时间间隔的关键OD对历史客流数据的情况下,预测接下来m个时间间隔的客流量,可以表述为如下的学习函数:
其中XT代表T时间间隔内所有OD对的历史流量值,f是一个映射函数。具体步骤如下:
步骤S1,获取原始客流数据,过滤得到乘车记录数据。
从轨道交通AFC系统获得原始刷卡数据。
设置数据过滤条件,从所述原始刷卡数据中提取包括卡号、进站时间、进站站点、出站站点、出站时间的乘车记录数据。
由于地铁在进出站时均需要刷卡,因此需要同时拥有一张交通卡的进出站记录才能构成一条完整的乘车记录,设置数据过滤条件提取原始数据中完整且合理的乘车记录。
其中,所述数据过滤条件包括:
每一条乘车记录数据均包含进站记录和出站记录。
每一条乘车记录数据的进站站点和出站站点不同。
每一条乘车记录数据的进站时间在6:00以后。
步骤S2,将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵。
将过滤得到乘车记录数据,以固定的时间间隔T,基于进站时间,统计时段内由O站驶向D站的交通需求,进行汇总。
得到t时刻全网客流N*N的OD矩阵
步骤S3,设置阈值,提取关键OD对集合。
设置零元素占比z、随机性判断值r、和大于随机性判断值的数据占比p三个阈值。
利用每个OD对的历史客流数据集合Hs作为筛选依据,Hs={h1,h2,...,hs},其中,s为选取的历史数据长度,hi代表该时间段OD客流量。
生成两个子集合Hs′和Hs″,关键OD对满足条件
其中,Hs′={hi|hi∈HS and hi=0,i=1,2,...,s}代表一个元素值均为0的OD对子集,Hs″={hi|hi∈HS and hi>r,i=1,2,...,s}代表一个集合中元素值均大于随机性判断值r的OD对子集。
提取得到关键OD对集合KOD={k1,k2,...,kn}。
步骤S4,利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系。
本发明基于关键OD对进行预测,失去了基于现实站点物理图的依赖关系,但是OD对自身结合了起仡站点的空间性质,例如O站为居住区,D站为办公区,具有类似性质的OD对表现出相关性,即OD对之间可能因为具有相似的功能性而具有类似的流量分布特征,因此可以建立虚拟连接边生成邻接矩阵。
计算皮尔逊相关系数
计算关键OD对之间的相关性矩阵Rn×n,
设置相关性阈值c,得到表示OD对之间虚拟连接关系的相关性矩阵A,
A用于表示OD对之间的虚拟连接关系,仅包含0和1的元素,如果节点之间没有连接,则Aij为0,否则为1。
步骤S5,采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果。本发明采用的模型预测框架如图2所示。
由输入层接收OD对表示的历史客流信息,对关键OD对进行提取,以关键OD对多个时间步长的历史流量信息形成特征矩阵其中,X代表全网全时段的关键OD对历史数据集合,xt表示各个关键OD对在t时刻采集的历史数据集合,xt=[x(k1),x(k2),...,x(kn)]T,再利用皮尔逊相关系数,构建虚拟图生成邻接矩阵A,并将特征矩阵X和邻接矩阵A作为特征提取层的输入。
如图3所示,特征提取层采用基于谱方法的图卷积神经网络GCN,对来自输入层的数据进行图卷积操作,对节点特征信息和结构信息进行端到端学习,获取节点信息聚合空间特征,
将包含空间信息的序列数据输入增加图卷积操作改进后的门控循环神经网络GRU中,捕捉时序特征,将第t-1个时刻的隐藏状态和当前的关键OD对流量信息作为输入,得到第t个时刻的流量状态
zt=σ(Wz[f(Xt,A),ht-1]+bz),
rt=σ(Wr[f(Xt,A),ht-1]+br),
其中,ht-1为第t-1个时刻的隐藏状态,Xt为第t个时刻所有关键OD对的流量信息,rt为GRU模型中的重置门,决定了如何将新的输入信息与前面的信息相结合,zt为GRU模型中的更新门,定义了前面信息保存到当前时间步的量,为第t个时刻存储的内存内容,ht为第t个时刻的输出状态。
由输出层输出预测结果。
通过损失函数对输出的预测值进行优化
步骤S6,选择均方根误差(RMSE)、平均绝对误差(MAE)、和线性回归决定系数(R2)作为评估指标。具体来说,RMSE和MAE用于衡量预测误差:值越小,预测效果越好。R2计算相关系数,衡量预测结果代表实际数据的能力:值越大,预测效果越好。具体计算公式如下:
步骤S7:结果分析。选取以下五种基线方法与本文模型进行比较,包括三种传统的时间序列模型以及两种通用的深度学习模型(1)历史平均模型(HA),(2)自回归积分移动平均模型(ARIMA),(3)支持向量回归模型(SVR),(4)图卷积模型(GCN)和(5)门控循环单元模型(GRU)。将结果与基线方法进行比较是为了验证本发明模型在关键OD对流量预测任务中的有效性。
步骤S8:对于10分钟粒度的关键OD对流量数据的预测情况进行可视化展示。模型能很好的建模不同的客流需求,较为准确的预测可以为乘客出行提供有效的参考信息,同时对关键OD对客流的建模分析可以辅助突发事件发生时候的应急处置,降低突发事件造成的持续影响。
本发明的第二个实施例提供一种轨道交通关键OD对的流量预测系统,包括:
原始数据提取模块,用于获取原始客流数据,过滤得到乘车记录数据。
OD矩阵汇总模块,用于将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵。
关键OD对抽取模块,用于设置阈值,提取关键OD对集合。
虚拟图构建模块,用于利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系。
建模预测模块,用于采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果。
其中,所述关键OD对抽取模块包括:
阈值设置单元,用于设置零元素占比z、随机性判断值r、和大于随机性判断值的数据占比p三个阈值。
OD对筛选单元,用于利用每个OD对的历史客流数据集合Hs作为筛选依据,Hs={h1,h2,...,hs},其中,s为选取的历史数据长度,hi代表该时间段OD客流量,生成两个子集合Hs′和Hs″,关键对满足条件
其中,Hs′={hi|hi∈HS and hi=0,i=1,2...,s}代表一个元素值均为0的OD对子集,Hs″={hi|hi∈HS and hi>r,i=1,2,...,s}代表一个集合中元素值均大于随机性判断值r的OD对子集。
关键OD对提取单元,用于提取得到关键OD对集合KOD={k1,k2,...,kn}。
其中,所述虚拟图构建模块包括:
其中,所述建模预测模块包括:
输入层单元,用于接收OD对表示的历史客流信息,对关键OD对进行提取,以关键OD对多个时间步长的历史流量信息形成邻接特征矩阵X=[x1,...,xt],其中,X代表全网全时段的关键OD对历史数据集合,xt表示各个关键OD对在t时刻采集的历史数据集合,xt=[x(k1),x(k2),...,x(kn)]T,再利用皮尔逊相关系数,构建虚拟图生成邻接矩阵A,并将特征矩阵X和邻接矩阵A作为特征提取层的输入。
特征提取层单元,包括图卷积神经网络GCN模块和门控循环神经网络GRU模块。
所述图卷积神经网络GCN模块采用基于谱方法的图卷积神经网络GCN,对来自输入层的数据进行图卷积操作,对节点特征信息和结构信息进行端到端学习,获取节点信息聚合空间特征,得到包含空间信息的序列数据Xt′=[x1′,...,xt′]。
所述门控循环神经网络GRU模块将包含空间信息的序列数据输入增加图卷积操作改进后的门控循环神经网络GRU中,捕捉时序特征。
输出层单元,用于由输出层输出预测结果。
本发明的第三个实施例提供一种轨道交通关键OD对的流量预测方法的实际应用案例。
使用深圳地铁提供的真实数据,构建数据集MetroSZ2020,如表1所示。数据集中可以使用的车站数为205,我们使用2020年8月23日到2020年9月30日连续39天的轨道交通刷卡数据作为基础数据,每条记录包括卡号、进站编号、进站时间、出站编号和出站时间,运营时间段选取6:00-24:00,以10min为时间间隔汇总OD矩阵,总共42025个OD对。
类型 | MetroSZ2020 |
日期 | 2020年8月23日到2020年9月30日 |
运营时间段 | 6:00-24:00 |
车站数 | 205 |
矩阵维数 | 205*205 |
关键OD对个数 | 490 |
时间间隔 | 10min |
在数据集MetroSZ2020上使用步骤S1-S8进行关键OD对抽取与OD客流预测。针对本发明的有效性,进行了如下验证:
测试ST-VGCN模型在10分钟时间粒度下对关键OD对流量预测的性能,结果如表2所示:
表2
RMSE | MAE | R2 | |
HA | 15.134 | 5.787 | 0.360 |
ARIMA | 11.321 | 6.065 | 0.105 |
SVR | 8.416 | 3.748 | 0.802 |
GCN | 13.619 | 5.191 | 0.482 |
GRU | 12.071 | 5.015 | 0.593 |
ST-VGCN | 8.360 | 3.492 | 0.805 |
与ARIMA和SVR模型相比,ST-VGCN模型的RMSE分别降低了大约26.15%和0.6%。与只关注空间或时间关系的GCN和GRU相比,ST-VGCN模型的RMSE分别降低了约38.62%和30.74%,在其他评估指标上,ST-VGCN模型与其他模型相比也有明显优势。比较结果验证了所提出的ST-VGCN模型的有效性。
针对本实施例,进行10分钟粒度的关键OD对流量数据的预测情况可视化展示。结果如图4所示。可以看到三种不同的乘客出行模式,(a)和(c)具有明细的尖峰时刻,且(c)中的尖峰时刻晚于(a)中,经过分析得出,图(a)代表的OD对起讫站的性质为O站为居住区,D站为办公区,图(c)代表的OD对起讫站的性质为O站为办公区,D站为居住区,符合居民通勤规律,而(b)保持相对平缓的趋势,D站为机场站,所以全天保持一定的乘客出行需求。
本发明首先由轨道交通AFC系统获得原始客流数据,通过设置固定时间间隔汇总原始客流数据得到OD矩阵,设置阈值提取关键OD对,解决OD数据维数高与数据稀疏性问题,利用皮尔逊相关矩阵构建虚拟图建模OD对之间的虚拟连接关系,使用结合图卷积神经网络和门控循环神经网络的时空虚拟图网络(ST-VGCN)同时识别OD对之间的空间关联关系和客流时间模式,得到预测结果。通过与其他5种基准方法的比较,本发明在各项评估指标中均优于基准方法,能有效提高预测精度。同时,本发明具有较好的拓展性,通过采集实时AFC数据作为样本数据,可进行下一时段关键OD客流量的预测,预测结果将对地铁运营和管理提供重要见解。
本发明实施例所提供的轨道交通OD对的流量预测方法及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行前面方法实施例中的方法,具体实现可参见方法实施例,在此不再赘述。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述轨道交通OD对的流量预测方法,从而能够解决城市轨道交通短期关键OD对流量预测问题。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种轨道交通关键OD对的流量预测方法,其特征在于,包括:
获取原始客流数据,过滤得到乘车记录数据;
将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵;
设置阈值,提取关键OD对集合;
利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系;
采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果。
2.根据权利要求1所述的轨道交通关键OD对的流量预测方法,其特征在于,所述获取原始客流数据,过滤得到乘车记录数据,包括:
从轨道交通AFC系统获得原始刷卡数据;
设置数据过滤条件,从所述原始刷卡数据中提取包括卡号、进站时间、进站站点、出站站点、出站时间的乘车记录数据;
所述数据过滤条件包括:
每一条乘车记录数据均包含进站记录和出站记录;
每一条乘车记录数据的进站站点和出站站点不同;
每一条乘车记录数据的进站时间在预设时间以后。
4.根据权利要求1所述的轨道交通关键OD对的流量预测方法,其特征在于,所述设置阈值,提取关键OD对集合,包括:
设置零元素占比z、随机性判断值r、和大于随机性判断值的数据占比p三个阈值;
利用每个OD对的历史客流数据集合Hs作为筛选依据,Hs={h1,h2,...,hs},其中,s为选取的历史数据长度,hi代表该时间段OD客流量;
生成两个子集合Hs′和Hs″,关键OD对满足条件
其中,Hs′={hi|hi∈HSand hi=0,i=1,2,...,s}代表一个元素值均为0的OD对子集,Hs″={hi|hi∈HSand hi>r,i=1,2,...,s}代表一个集合中元素值均大于随机性判断值r的OD对子集;
提取得到关键OD对集合KOD={k1,k2,...,kn}。
6.根据权利要求1所述的轨道交通关键OD对的流量预测方法,其特征在于,所述采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果,包括:
由输入层接收OD对表示的历史客流信息,对关键OD对进行提取,以关键OD对多个时间步长的历史流量信息形成特征矩阵X,X=[x1,...,xt],其中,其中X代表全网全时段的关键OD对历史数据集合,xt表示各个关键OD对在t时刻采集的历史数据集合,xt=[x(k1),x(k2),...,x(kn)]T,再利用皮尔逊相关系数,构建虚拟图生成邻接矩阵A,并将特征矩阵X和邻接矩阵A作为特征提取层的输入;
特征提取层采用基于谱方法的图卷积神经网络GCN,对来自输入层的数据进行图卷积操作,对节点特征信息和结构信息进行端到端学习,获取节点信息聚合空间特征,
将包含空间信息的序列数据输入增加图卷积操作改进后的门控循环神经网络GRU中,捕捉时序特征,将第t-1个时刻的隐藏状态和当前的关键OD对流量信息作为输入,得到第t个时刻的流量状态
zt=σ(Wz[f(Xt,A),ht-1]+bz),
rt=σ(Wr[f(Xt,A),ht-1]+br),
通过损失函数对输出的预测值进行优化
由输出层输出预测结果。
7.一种轨道交通关键OD对的流量预测系统,其特征在于,包括:
原始数据提取模块,用于获取原始客流数据,过滤得到乘车记录数据;
OD矩阵汇总模块,用于将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵;
关键OD对抽取模块,用于设置阈值,提取关键OD对集合;
虚拟图构建模块,用于利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系;
建模预测模块,用于采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果。
8.根据权利要求7所述的轨道交通关键OD对的流量预测系统,其特征在于,所述关键OD对抽取模块包括:
阈值设置单元,用于设置零元素占比z、随机性判断值r、和大于随机性判断值的数据占比p三个阈值;
OD对筛选单元,用于利用每个OD对的历史客流数据集合Hs作为筛选依据,Hs={h1,h2,...,hs},其中,s为选取的历史数据长度,hi代表该时间段OD客流量,生成两个子集合Hs′和Hs″,关键对满足条件
其中,Hs′={hi|hi∈HSand hi=0,i=1,2,...,s}代表一个元素值均为0的OD对子集,Hs″={hi|hi∈HSand hi>r,i=1,2,...,s}代表一个集合中元素值均大于随机性判断值r的OD对子集;
关键OD对提取单元,用于提取得到关键OD对集合KOD={k1,k2,...,kn}。
10.根据权利要求7所述的轨道交通关键OD对的流量预测系统,其特征在于,所述建模预测模块包括:
输入层单元,用于接收OD对表示的历史客流信息,对关键OD对进行提取,以关键OD对多个时间步长的历史流量信息形成邻接特征矩阵X=[x1,...,xt],其中,X代表全网全时段的关键OD对历史数据集合,xt表示各个关键OD对在t时刻采集的历史数据集合,xt=[x(k1),x(k2),...,x(kn)]T,再利用皮尔逊相关系数,构建虚拟图生成邻接矩阵A,并将特征矩阵X和邻接矩阵A作为特征提取层的输入;
特征提取层单元,包括图卷积神经网络GCN模块和门控循环神经网络GRU模块;
所述图卷积神经网络GCN模块采用基于谱方法的图卷积神经网络GCN,对来自输入层的数据进行图卷积操作,对节点特征信息和结构信息进行端到端学习,获取节点信息聚合空间特征,得到包含空间信息的序列数据Xt′=[x1′,...,xt′];
所述门控循环神经网络GRU模块将包含空间信息的序列数据输入增加图卷积操作改进后的门控循环神经网络GRU中,捕捉时序特征;
输出层单元,用于由输出层输出预测结果;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210977354.6A CN115375020A (zh) | 2022-08-15 | 2022-08-15 | 一种轨道交通关键od对的流量预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210977354.6A CN115375020A (zh) | 2022-08-15 | 2022-08-15 | 一种轨道交通关键od对的流量预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115375020A true CN115375020A (zh) | 2022-11-22 |
Family
ID=84065412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210977354.6A Pending CN115375020A (zh) | 2022-08-15 | 2022-08-15 | 一种轨道交通关键od对的流量预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115375020A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116128122A (zh) * | 2023-01-03 | 2023-05-16 | 北京交通大学 | 一种考虑突发因素的城市轨道交通短时客流预测方法 |
-
2022
- 2022-08-15 CN CN202210977354.6A patent/CN115375020A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116128122A (zh) * | 2023-01-03 | 2023-05-16 | 北京交通大学 | 一种考虑突发因素的城市轨道交通短时客流预测方法 |
CN116128122B (zh) * | 2023-01-03 | 2023-09-12 | 北京交通大学 | 一种考虑突发因素的城市轨道交通短时客流预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111612206B (zh) | 一种基于时空图卷积神经网络的街区人流预测方法及系统 | |
Bao et al. | A spatiotemporal deep learning approach for citywide short-term crash risk prediction with multi-source data | |
Donovan et al. | Using coarse GPS data to quantify city-scale transportation system resilience to extreme events | |
CN114220271A (zh) | 基于动态时空图卷积循环网络的交通流预测方法、设备及存储介质 | |
CN116128122B (zh) | 一种考虑突发因素的城市轨道交通短时客流预测方法 | |
CN113034913A (zh) | 交通拥堵预测方法、装置、设备及存储介质 | |
CN111554408B (zh) | 城市内部登革热时空预测方法、系统及电子设备 | |
CN114692984B (zh) | 基于多步耦合图卷积网络的交通预测方法 | |
KR102357236B1 (ko) | 지역별 유동인구 및 감염병 확진인구에 따른 가용지수 예측시스템 | |
CN113077090A (zh) | 客流预测方法、系统及计算机可读存储介质 | |
CN107766636A (zh) | 一种基于极值理论与微观仿真的城市交叉口安全评价方法 | |
CN112561187B (zh) | 一种基于cnn-lstm的网约车目标订单预测方法 | |
CN112116149B (zh) | 一种考虑预报不确定性关联演化特征的多站中长期径流滚动概率预测方法 | |
Zhong et al. | Online prediction of network-level public transport demand based on principle component analysis | |
CN115375020A (zh) | 一种轨道交通关键od对的流量预测方法及系统 | |
Dhivya Bharathi et al. | Bus travel time prediction: a log-normal auto-regressive (AR) modelling approach | |
CN111985731B (zh) | 城市公共交通站点人数的预测方法及系统 | |
CN111145535B (zh) | 一种复杂场景下的行程时间可靠性分布预测方法 | |
CN117077843A (zh) | 基于CBAM-CNN-Transformer的时空注意力细粒度PM2.5浓度预测方法 | |
Jiao et al. | Multi-step traffic flow prediction method based on the Conv1D+ LSTM | |
Widiyaningtyas et al. | Use of ARIMA method to predict the number of train passenger in Malang City | |
Olmoguez et al. | Developing a dengue forecasting model: A case study in Iligan city | |
US11663448B2 (en) | Neural network systems and methods for event parameter determination | |
Li | Stochastic modeling and adaptive forecasting for parking space availability with drivers’ time-varying arrival/departure behavior | |
Rezazada et al. | What influences passenger’s arrival rate at stops in Melbourne: Wasea-Lstm, a novel deep learning model leveraging multi-source data fusion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |