CN115375020A - 一种轨道交通关键od对的流量预测方法及系统 - Google Patents

一种轨道交通关键od对的流量预测方法及系统 Download PDF

Info

Publication number
CN115375020A
CN115375020A CN202210977354.6A CN202210977354A CN115375020A CN 115375020 A CN115375020 A CN 115375020A CN 202210977354 A CN202210977354 A CN 202210977354A CN 115375020 A CN115375020 A CN 115375020A
Authority
CN
China
Prior art keywords
key
pairs
data
pair
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210977354.6A
Other languages
English (en)
Inventor
韩啸
张超
董雪茹
杨军
叶谈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Mining and Technology Beijing CUMTB
Original Assignee
China University of Mining and Technology Beijing CUMTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Mining and Technology Beijing CUMTB filed Critical China University of Mining and Technology Beijing CUMTB
Priority to CN202210977354.6A priority Critical patent/CN115375020A/zh
Publication of CN115375020A publication Critical patent/CN115375020A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Databases & Information Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Algebra (AREA)
  • Operations Research (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明的实施例公开了一种轨道交通关键OD对的流量预测方法及系统。方法包括:获取原始客流数据,过滤得到乘车记录数据;将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵;设置阈值,提取关键OD对集合;利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系;采用图卷积神经网络和门控循环神经网络结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果。系统包括:原始数据提取模块、OD矩阵汇总模块、关键OD对抽取模块、虚拟图构建模块和建模预测模块。本发明能够解决城市轨道交通短期OD流量预测问题,为地铁运营和管理提供数据参考,同时辅助突发事件应急处置,降低突发事件造成的持续影响。

Description

一种轨道交通关键OD对的流量预测方法及系统
技术领域
本发明涉及智能交通技术领域,特别涉及一种轨道交通关键OD对的流量预测方法及系统。
背景技术
近年来,城市轨道交通进入网络化运营时代,逐步承担起缓解大城市道路交通拥塞的责任。以深圳地铁为例,2018年单日地铁出行规模已突破500万人次,承担了整个城市三分之一以上的交通流量,在城市公共交通系统中占据重要地位。日益增加的出行需求给城市轨道交通带来了严重的运营压力,特别是在早、晚高峰时期,通勤需求量大,地铁的运行运营效率将直接影响城市的整体通勤效率。在此背景之下,客流预测类研究成为了研究人员关注的关键问题。
现有的研究大多针对于进出站客流量、日客流量、小时客流量及断面客流量的预测,其中OD预测的研究内容相对较少。而OD客流体现着进出站客流的流向和分布,是乘客出行需求的直观体现,蕴含着非常有价值的信息,是网络化运营条件下地铁行车组织、客运组织和乘客服务的基础支撑数据。但是由于OD数据维数高与数据稀疏性的问题,对于OD矩阵直接进行预测的难度很大,同时现有研究并没有提出OD对之间存在的隐含空间关系。
发明内容
有鉴于此,本发明实施例的目的在于提供一种轨道交通关键OD对的流量预测方法及系统,能够解决城市轨道交通短期关键OD对流量预测问题,为地铁运营和管理提供数据参考,同时辅助突发事件应急处置,降低突发事件造成的持续影响。
第一方面,本发明实施例提供了一种轨道交通关键OD对的流量预测方法,其中,包括:
获取原始客流数据,过滤得到乘车记录数据。
将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵。
设置阈值,提取关键OD对集合。
利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系。
采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述获取原始客流数据,过滤得到乘车记录数据,包括:
从轨道交通AFC系统获得原始刷卡数据。
设置数据过滤条件,从所述原始刷卡数据中提取包括卡号、进站时间、进站站点、出站站点、出站时间的乘车记录数据。
由于地铁在进出站时均需要刷卡,因此需要同时拥有一张交通卡的进出站记录才能构成一条完整的乘车记录,设置数据过滤条件提取原始数据中完整且合理的乘车记录。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述数据过滤条件包括:
每一条乘车记录数据均包含进站记录和出站记录。
每一条乘车记录数据的进站站点和出站站点不同。
每一条乘车记录数据的进站时间在6:00以后。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵,包括:
将过滤得到乘车记录数据,以固定的时间间隔T,基于进站时间,统计时段内由O站驶向D站的交通需求,进行汇总。
得到t时刻全网客流N*N的OD矩阵
Figure BDA0003798818960000031
其中,
Figure BDA0003798818960000032
代表第t个时间段内由i站向j站产生的客流需求总数,i为进站编号,j为出站编号。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述设置阈值,提取关键OD对集合,包括:
设置零元素占比z、随机性判断值r、和大于随机性判断值的数据占比p三个阈值。
利用每个OD对的历史客流数据集合Hs作为筛选依据,Hs={h1,h2,...,hs},其中,s为选取的历史数据长度,hi代表该时间段OD客流量。
生成两个子集合Hs′和Hs″,关键OD对满足条件
Figure BDA0003798818960000033
其中,Hs′={hi|hi∈HS and hi=0,i=1,2,...,s}代表一个元素值均为0的OD对子集,Hs″={hi|hi∈HS and hi>r,i=1,2,...,s}代表一个集合中元素值均大于随机性判断值r的OD对子集。
提取得到关键OD对集合KOD={k1,k2,...,kn}。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系,包括:
计算皮尔逊相关系数
Figure BDA0003798818960000034
其中,X,Y表示两个变量,
Figure BDA0003798818960000035
是平均值。
计算关键OD对之间的相关性矩阵Rn×n
Figure BDA0003798818960000041
其中,kij表示第i个和第j个OD对历史客流数据观测值序列之间的皮尔逊相关系数。
设置相关性阈值c,得到表示OD对之间虚拟连接关系的相关性矩阵A,
Figure BDA0003798818960000042
A用于表示OD对之间的虚拟连接关系,仅包含0和1的元素,如果节点之间没有连接,则Aij为0,否则为1。
本发明基于关键OD对进行预测,失去了基于现实站点物理图的依赖关系,但是OD对自身结合了起仡站点的空间性质,例如O站为居住区,D站为办公区,具有类似性质的OD对表现出相关性,即OD对之间可能因为具有相似的功能性而具有类似的流量分布特征,因此可以建立虚拟连接边生成邻接矩阵。
结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,所述采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果,包括:由输入层接收OD对表示的历史客流信息,对关键OD对进行提取,以关键OD对多个时间步长的历史流量信息形成特征矩阵
Figure BDA0003798818960000043
其中,X代表全网全时段的关键OD对历史数据集合,xt表示各个关键OD对在t时刻采集的历史数据集合,xt=[x(k1),x(k2),...,x(kn)]T,再利用皮尔逊相关系数,构建虚拟图生成邻接矩阵A,并将特征矩阵X和邻接矩阵A作为特征提取层的输入。
特征提取层采用基于谱方法的图卷积神经网络GCN,对来自输入层的数据进行图卷积操作,对节点特征信息和结构信息进行端到端学习,获取节点信息聚合空间特征,
Figure BDA0003798818960000051
其中,
Figure BDA0003798818960000052
表示邻接矩阵A与单位矩阵IN的和,
Figure BDA0003798818960000053
表示
Figure BDA0003798818960000054
的度矩阵,
Figure BDA0003798818960000055
表示对
Figure BDA0003798818960000056
进行归一化处理,W表示权重矩阵,σ为激活函数,得到包含空间信息的序列数据Xt′=[x1′,...,xt′]。
将包含空间信息的序列数据输入增加图卷积操作改进后的门控循环神经网络GRU中,捕捉时序特征,将第t-1个时刻的隐藏状态和当前的关键OD对流量信息作为输入,得到第t个时刻的流量状态
zt=σ(Wz[f(Xt,A),ht-1]+bz),
rt=σ(Wr[f(Xt,A),ht-1]+br),
Figure BDA0003798818960000057
Figure BDA0003798818960000058
其中,ht-1为第t-1个时刻的隐藏状态,Xt为第t个时刻所有关键OD对的流量信息,rt为GRU模型中的重置门,决定了如何将新的输入信息与前面的信息相结合,zt为GRU模型中的更新门,定义了前面信息保存到当前时间步的量,
Figure BDA0003798818960000059
为第t个时刻存储的内存内容,ht为第t个时刻的输出状态。
由输出层输出预测结果。
结合第一方面,本发明实施例提供了第一方面的第七种可能的实施方式,其中,所述采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果,还包括:
通过损失函数对输出的预测值进行优化
Figure BDA00037988189600000510
其中,yt
Figure BDA00037988189600000511
是真实OD值和预测值,n代表观测窗口的长度。
第二方面,本发明实施例还提供了一种轨道交通OD对的流量预测系统,其中,包括:
原始数据提取模块,用于获取原始客流数据,过滤得到乘车记录数据。
OD矩阵汇总模块,用于将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵。
关键OD对抽取模块,用于设置阈值,提取关键OD对集合。
虚拟图构建模块,用于利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系。
建模预测模块,用于采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,所述关键OD对抽取模块包括:
阈值设置单元,用于设置零元素占比z、随机性判断值r、和大于随机性判断值的数据占比p三个阈值。
OD对筛选单元,用于利用每个OD对的历史客流数据集合Hs作为筛选依据,Hs={h1,h2,...,hs},其中,s为选取的历史数据长度,hi代表该时间段OD客流量,生成两个子集合Hs′和Hs″,关键对满足条件
Figure BDA0003798818960000061
其中,Hs′={hi|hi∈HS and hi=0,i=1,2,...,s}代表一个元素值均为0的OD对子集,Hs″={hi|hi∈HS and hi>r,i=1,2,...,s}代表一个集合中元素值均大于随机性判断值r的OD对子集。
关键OD对提取单元,用于提取得到关键OD对集合KOD={k1,k2,...,kn}。
结合第二方面,本发明实施例提供了第二方面的第二种可能的实施方式,其中,所述虚拟图构建模块包括:
皮尔逊系数计算单元,用于计算皮尔逊相关系数
Figure BDA0003798818960000062
其中,X,Y表示两个变量,
Figure BDA0003798818960000071
是平均值。
OD对相关性计算单元,用于计算关键OD对之间的相关性矩阵Rn×n
Figure BDA0003798818960000072
其中,kij表示第i个和第j个OD对历史客流数据观测值序列之间的皮尔逊相关系数。
相关性矩阵建立单元,用于设置相关性阈值c,得到表示OD对之间虚拟连接关系的相关性矩阵A,
Figure BDA0003798818960000073
结合第二方面,本发明实施例提供了第二方面的第三种可能的实施方式,其中,所述建模预测模块包括:
输入层单元,用于接收OD对表示的历史客流信息,对关键OD对进行提取,以关键OD对多个时间步长的历史流量信息形成邻接特征矩阵X=[x1,...,xt],其中,X代表全网全时段的关键OD对历史数据集合,xt表示各个关键OD对在t时刻采集的历史数据集合,xt=[x(k1),x(k2),...,x(kn)]T,再利用皮尔逊相关系数,构建虚拟图生成邻接矩阵A,并将特征矩阵X和邻接矩阵A作为特征提取层的输入。
特征提取层单元,包括图卷积神经网络GCN模块和门控循环神经网络GRU模块。
所述图卷积神经网络GCN模块采用基于谱方法的图卷积神经网络GCN,对来自输入层的数据进行图卷积操作,对节点特征信息和结构信息进行端到端学习,获取节点信息聚合空间特征,得到包含空间信息的序列数据Xt′=[x1′,...,xt′]。
所述门控循环神经网络GRU模块将包含空间信息的序列数据输入增加图卷积操作改进后的门控循环神经网络GRU中,捕捉时序特征。
输出层单元,用于由输出层输出预测结果。
减损优化单元,用于通过损失函数
Figure BDA0003798818960000081
对输出的预测值进行优化,其中,yt
Figure BDA0003798818960000082
是真实OD值和预测值,n代表观测窗口的长度。
本发明实施例的有益效果是:
本发明提供了一种轨道交通关键OD对的流量预测方法及系统,通过设置三个阈值提取关键OD对,解决了OD客流具有数据稀疏性和数据维数高的问题,利用皮尔逊相关系数计算关键OD对之间的相关性,建立关键OD对的虚拟图,使用GCN捕获这种关联关系,再通过GRU捕获时序信息,通过结合时间和空间信息增强了模型的灵活性和表达能力。目的在于解决城市轨道交通短期关键OD对流量预测问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明轨道交通OD对的流量预测方法的流程图;
图2为本发明轨道交通关键OD对的流量预测方法及系统模型预测框架示意图;
图3为本发明轨道交通OD对的流量预测方法的GCN和GRU结合的计算过程示意图;
图4为本发明轨道交通OD对的流量预测方法的10钟粒度的关键OD对流量数据的预测情况可视化展示示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件能够以各种不同的配置来布置和设计。
请参照图1至图4,本发明的第一个实施例提供一种轨道交通OD对的流量预测方法,获取原始客流数据,过滤得到乘车记录数据;将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵;设置阈值,提取关键OD对集合;利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系;采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果。本发明的目的是在给定前n个时间间隔的关键OD对历史客流数据的情况下,预测接下来m个时间间隔的客流量,可以表述为如下的学习函数:
Figure BDA0003798818960000091
其中XT代表T时间间隔内所有OD对的历史流量值,f是一个映射函数。具体步骤如下:
步骤S1,获取原始客流数据,过滤得到乘车记录数据。
从轨道交通AFC系统获得原始刷卡数据。
设置数据过滤条件,从所述原始刷卡数据中提取包括卡号、进站时间、进站站点、出站站点、出站时间的乘车记录数据。
由于地铁在进出站时均需要刷卡,因此需要同时拥有一张交通卡的进出站记录才能构成一条完整的乘车记录,设置数据过滤条件提取原始数据中完整且合理的乘车记录。
其中,所述数据过滤条件包括:
每一条乘车记录数据均包含进站记录和出站记录。
每一条乘车记录数据的进站站点和出站站点不同。
每一条乘车记录数据的进站时间在6:00以后。
步骤S2,将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵。
将过滤得到乘车记录数据,以固定的时间间隔T,基于进站时间,统计时段内由O站驶向D站的交通需求,进行汇总。
得到t时刻全网客流N*N的OD矩阵
Figure BDA0003798818960000101
其中,
Figure BDA0003798818960000102
代表第t个时间段内由i站向j站产生的客流需求总数,i为进站编号,j为出站编号。
步骤S3,设置阈值,提取关键OD对集合。
设置零元素占比z、随机性判断值r、和大于随机性判断值的数据占比p三个阈值。
利用每个OD对的历史客流数据集合Hs作为筛选依据,Hs={h1,h2,...,hs},其中,s为选取的历史数据长度,hi代表该时间段OD客流量。
生成两个子集合Hs′和Hs″,关键OD对满足条件
Figure BDA0003798818960000103
其中,Hs′={hi|hi∈HS and hi=0,i=1,2,...,s}代表一个元素值均为0的OD对子集,Hs″={hi|hi∈HS and hi>r,i=1,2,...,s}代表一个集合中元素值均大于随机性判断值r的OD对子集。
提取得到关键OD对集合KOD={k1,k2,...,kn}。
步骤S4,利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系。
本发明基于关键OD对进行预测,失去了基于现实站点物理图的依赖关系,但是OD对自身结合了起仡站点的空间性质,例如O站为居住区,D站为办公区,具有类似性质的OD对表现出相关性,即OD对之间可能因为具有相似的功能性而具有类似的流量分布特征,因此可以建立虚拟连接边生成邻接矩阵。
计算皮尔逊相关系数
Figure BDA0003798818960000111
其中,X,Y表示两个变量,
Figure BDA0003798818960000112
是平均值。
计算关键OD对之间的相关性矩阵Rn×n
Figure BDA0003798818960000113
其中,kij表示第i个和第j个OD对历史客流数据观测值序列之间的皮尔逊相关系数。
设置相关性阈值c,得到表示OD对之间虚拟连接关系的相关性矩阵A,
Figure BDA0003798818960000114
A用于表示OD对之间的虚拟连接关系,仅包含0和1的元素,如果节点之间没有连接,则Aij为0,否则为1。
步骤S5,采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果。本发明采用的模型预测框架如图2所示。
由输入层接收OD对表示的历史客流信息,对关键OD对进行提取,以关键OD对多个时间步长的历史流量信息形成特征矩阵
Figure BDA0003798818960000115
其中,X代表全网全时段的关键OD对历史数据集合,xt表示各个关键OD对在t时刻采集的历史数据集合,xt=[x(k1),x(k2),...,x(kn)]T,再利用皮尔逊相关系数,构建虚拟图生成邻接矩阵A,并将特征矩阵X和邻接矩阵A作为特征提取层的输入。
如图3所示,特征提取层采用基于谱方法的图卷积神经网络GCN,对来自输入层的数据进行图卷积操作,对节点特征信息和结构信息进行端到端学习,获取节点信息聚合空间特征,
Figure BDA0003798818960000121
其中,
Figure BDA0003798818960000122
表示邻接矩阵A与单位矩阵IN的和,
Figure BDA0003798818960000123
表示
Figure BDA0003798818960000124
的度矩阵,
Figure BDA0003798818960000125
表示对
Figure BDA0003798818960000126
进行归一化处理,W表示权重矩阵,σ为激活函数,得到包含空间信息的序列数据Xt′=[x1′,...,xt′]。
将包含空间信息的序列数据输入增加图卷积操作改进后的门控循环神经网络GRU中,捕捉时序特征,将第t-1个时刻的隐藏状态和当前的关键OD对流量信息作为输入,得到第t个时刻的流量状态
zt=σ(Wz[f(Xt,A),ht-1]+bz),
rt=σ(Wr[f(Xt,A),ht-1]+br),
Figure BDA0003798818960000127
Figure BDA0003798818960000128
其中,ht-1为第t-1个时刻的隐藏状态,Xt为第t个时刻所有关键OD对的流量信息,rt为GRU模型中的重置门,决定了如何将新的输入信息与前面的信息相结合,zt为GRU模型中的更新门,定义了前面信息保存到当前时间步的量,
Figure BDA0003798818960000129
为第t个时刻存储的内存内容,ht为第t个时刻的输出状态。
由输出层输出预测结果。
通过损失函数对输出的预测值进行优化
Figure BDA00037988189600001210
其中,yt
Figure BDA00037988189600001211
是真实OD值和预测值,n代表观测窗口的长度。
步骤S6,选择均方根误差(RMSE)、平均绝对误差(MAE)、和线性回归决定系数(R2)作为评估指标。具体来说,RMSE和MAE用于衡量预测误差:值越小,预测效果越好。R2计算相关系数,衡量预测结果代表实际数据的能力:值越大,预测效果越好。具体计算公式如下:
Figure BDA0003798818960000131
Figure BDA0003798818960000132
Figure BDA0003798818960000133
其中,Yt表示真实OD信息,
Figure BDA0003798818960000134
表示预测的OD信息,
Figure BDA0003798818960000135
代表预测的OD信息的平均值,n为节点数。
步骤S7:结果分析。选取以下五种基线方法与本文模型进行比较,包括三种传统的时间序列模型以及两种通用的深度学习模型(1)历史平均模型(HA),(2)自回归积分移动平均模型(ARIMA),(3)支持向量回归模型(SVR),(4)图卷积模型(GCN)和(5)门控循环单元模型(GRU)。将结果与基线方法进行比较是为了验证本发明模型在关键OD对流量预测任务中的有效性。
步骤S8:对于10分钟粒度的关键OD对流量数据的预测情况进行可视化展示。模型能很好的建模不同的客流需求,较为准确的预测可以为乘客出行提供有效的参考信息,同时对关键OD对客流的建模分析可以辅助突发事件发生时候的应急处置,降低突发事件造成的持续影响。
本发明的第二个实施例提供一种轨道交通关键OD对的流量预测系统,包括:
原始数据提取模块,用于获取原始客流数据,过滤得到乘车记录数据。
OD矩阵汇总模块,用于将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵。
关键OD对抽取模块,用于设置阈值,提取关键OD对集合。
虚拟图构建模块,用于利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系。
建模预测模块,用于采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果。
其中,所述关键OD对抽取模块包括:
阈值设置单元,用于设置零元素占比z、随机性判断值r、和大于随机性判断值的数据占比p三个阈值。
OD对筛选单元,用于利用每个OD对的历史客流数据集合Hs作为筛选依据,Hs={h1,h2,...,hs},其中,s为选取的历史数据长度,hi代表该时间段OD客流量,生成两个子集合Hs′和Hs″,关键对满足条件
Figure BDA0003798818960000141
其中,Hs′={hi|hi∈HS and hi=0,i=1,2...,s}代表一个元素值均为0的OD对子集,Hs″={hi|hi∈HS and hi>r,i=1,2,...,s}代表一个集合中元素值均大于随机性判断值r的OD对子集。
关键OD对提取单元,用于提取得到关键OD对集合KOD={k1,k2,...,kn}。
其中,所述虚拟图构建模块包括:
皮尔逊系数计算单元,用于计算皮尔逊相关系数
Figure BDA0003798818960000142
其中,X,Y表示两个变量,
Figure BDA0003798818960000143
是平均值。
OD对相关性计算单元,用于计算关键OD对之间的相关性矩阵Rn×n
Figure BDA0003798818960000144
其中,kij表示第i个和第j个OD对历史客流数据观测值序列之间的皮尔逊相关系数。
相关性矩阵建立单元,用于设置相关性阈值c,得到表示OD对之间虚拟连接关系的相关性矩阵A,
Figure BDA0003798818960000145
其中,所述建模预测模块包括:
输入层单元,用于接收OD对表示的历史客流信息,对关键OD对进行提取,以关键OD对多个时间步长的历史流量信息形成邻接特征矩阵X=[x1,...,xt],其中,X代表全网全时段的关键OD对历史数据集合,xt表示各个关键OD对在t时刻采集的历史数据集合,xt=[x(k1),x(k2),...,x(kn)]T,再利用皮尔逊相关系数,构建虚拟图生成邻接矩阵A,并将特征矩阵X和邻接矩阵A作为特征提取层的输入。
特征提取层单元,包括图卷积神经网络GCN模块和门控循环神经网络GRU模块。
所述图卷积神经网络GCN模块采用基于谱方法的图卷积神经网络GCN,对来自输入层的数据进行图卷积操作,对节点特征信息和结构信息进行端到端学习,获取节点信息聚合空间特征,得到包含空间信息的序列数据Xt′=[x1′,...,xt′]。
所述门控循环神经网络GRU模块将包含空间信息的序列数据输入增加图卷积操作改进后的门控循环神经网络GRU中,捕捉时序特征。
输出层单元,用于由输出层输出预测结果。
减损优化单元,用于通过损失函数
Figure BDA0003798818960000151
对输出的预测值进行优化,其中,yt
Figure BDA0003798818960000152
是真实OD值和预测值,n代表观测窗口的长度。
本发明的第三个实施例提供一种轨道交通关键OD对的流量预测方法的实际应用案例。
使用深圳地铁提供的真实数据,构建数据集MetroSZ2020,如表1所示。数据集中可以使用的车站数为205,我们使用2020年8月23日到2020年9月30日连续39天的轨道交通刷卡数据作为基础数据,每条记录包括卡号、进站编号、进站时间、出站编号和出站时间,运营时间段选取6:00-24:00,以10min为时间间隔汇总OD矩阵,总共42025个OD对。
类型 MetroSZ2020
日期 2020年8月23日到2020年9月30日
运营时间段 6:00-24:00
车站数 205
矩阵维数 205*205
关键OD对个数 490
时间间隔 10min
在数据集MetroSZ2020上使用步骤S1-S8进行关键OD对抽取与OD客流预测。针对本发明的有效性,进行了如下验证:
测试ST-VGCN模型在10分钟时间粒度下对关键OD对流量预测的性能,结果如表2所示:
表2
RMSE MAE R2
HA 15.134 5.787 0.360
ARIMA 11.321 6.065 0.105
SVR 8.416 3.748 0.802
GCN 13.619 5.191 0.482
GRU 12.071 5.015 0.593
ST-VGCN 8.360 3.492 0.805
与ARIMA和SVR模型相比,ST-VGCN模型的RMSE分别降低了大约26.15%和0.6%。与只关注空间或时间关系的GCN和GRU相比,ST-VGCN模型的RMSE分别降低了约38.62%和30.74%,在其他评估指标上,ST-VGCN模型与其他模型相比也有明显优势。比较结果验证了所提出的ST-VGCN模型的有效性。
针对本实施例,进行10分钟粒度的关键OD对流量数据的预测情况可视化展示。结果如图4所示。可以看到三种不同的乘客出行模式,(a)和(c)具有明细的尖峰时刻,且(c)中的尖峰时刻晚于(a)中,经过分析得出,图(a)代表的OD对起讫站的性质为O站为居住区,D站为办公区,图(c)代表的OD对起讫站的性质为O站为办公区,D站为居住区,符合居民通勤规律,而(b)保持相对平缓的趋势,D站为机场站,所以全天保持一定的乘客出行需求。
本发明首先由轨道交通AFC系统获得原始客流数据,通过设置固定时间间隔汇总原始客流数据得到OD矩阵,设置阈值提取关键OD对,解决OD数据维数高与数据稀疏性问题,利用皮尔逊相关矩阵构建虚拟图建模OD对之间的虚拟连接关系,使用结合图卷积神经网络和门控循环神经网络的时空虚拟图网络(ST-VGCN)同时识别OD对之间的空间关联关系和客流时间模式,得到预测结果。通过与其他5种基准方法的比较,本发明在各项评估指标中均优于基准方法,能有效提高预测精度。同时,本发明具有较好的拓展性,通过采集实时AFC数据作为样本数据,可进行下一时段关键OD客流量的预测,预测结果将对地铁运营和管理提供重要见解。
本发明实施例所提供的轨道交通OD对的流量预测方法及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行前面方法实施例中的方法,具体实现可参见方法实施例,在此不再赘述。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述轨道交通OD对的流量预测方法,从而能够解决城市轨道交通短期关键OD对流量预测问题。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种轨道交通关键OD对的流量预测方法,其特征在于,包括:
获取原始客流数据,过滤得到乘车记录数据;
将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵;
设置阈值,提取关键OD对集合;
利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系;
采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果。
2.根据权利要求1所述的轨道交通关键OD对的流量预测方法,其特征在于,所述获取原始客流数据,过滤得到乘车记录数据,包括:
从轨道交通AFC系统获得原始刷卡数据;
设置数据过滤条件,从所述原始刷卡数据中提取包括卡号、进站时间、进站站点、出站站点、出站时间的乘车记录数据;
所述数据过滤条件包括:
每一条乘车记录数据均包含进站记录和出站记录;
每一条乘车记录数据的进站站点和出站站点不同;
每一条乘车记录数据的进站时间在预设时间以后。
3.根据权利要求1所述的轨道交通关键OD对的流量预测方法,其特征在于,所述将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵,包括:
将过滤得到乘车记录数据,以固定的时间间隔T,基于进站时间,统计时段内由O站驶向D站的交通需求,进行汇总;
得到t时刻全网客流N*N的OD矩阵
Figure FDA0003798818950000021
其中,
Figure FDA0003798818950000022
代表第t个时间段内由i站向j站产生的客流需求总数,i为进站编号,j为出站编号。
4.根据权利要求1所述的轨道交通关键OD对的流量预测方法,其特征在于,所述设置阈值,提取关键OD对集合,包括:
设置零元素占比z、随机性判断值r、和大于随机性判断值的数据占比p三个阈值;
利用每个OD对的历史客流数据集合Hs作为筛选依据,Hs={h1,h2,...,hs},其中,s为选取的历史数据长度,hi代表该时间段OD客流量;
生成两个子集合Hs′和Hs″,关键OD对满足条件
Figure FDA0003798818950000023
其中,Hs′={hi|hi∈HSand hi=0,i=1,2,...,s}代表一个元素值均为0的OD对子集,Hs″={hi|hi∈HSand hi>r,i=1,2,...,s}代表一个集合中元素值均大于随机性判断值r的OD对子集;
提取得到关键OD对集合KOD={k1,k2,...,kn}。
5.根据权利要求1所述的轨道交通关键OD对的流量预测方法,其特征在于,所述利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系,包括:
计算皮尔逊相关系数
Figure FDA0003798818950000024
其中,X,Y表示两个变量,
Figure FDA0003798818950000025
是平均值;
计算关键OD对之间的相关性矩阵Rn×n
Figure FDA0003798818950000031
其中,kij表示第i个和第j个OD对历史客流数据观测值序列之间的皮尔逊相关系数;
设置相关性阈值c,得到表示OD对之间虚拟连接关系的相关性矩阵A,
Figure FDA0003798818950000032
6.根据权利要求1所述的轨道交通关键OD对的流量预测方法,其特征在于,所述采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果,包括:
由输入层接收OD对表示的历史客流信息,对关键OD对进行提取,以关键OD对多个时间步长的历史流量信息形成特征矩阵X,X=[x1,...,xt],其中,其中X代表全网全时段的关键OD对历史数据集合,xt表示各个关键OD对在t时刻采集的历史数据集合,xt=[x(k1),x(k2),...,x(kn)]T,再利用皮尔逊相关系数,构建虚拟图生成邻接矩阵A,并将特征矩阵X和邻接矩阵A作为特征提取层的输入;
特征提取层采用基于谱方法的图卷积神经网络GCN,对来自输入层的数据进行图卷积操作,对节点特征信息和结构信息进行端到端学习,获取节点信息聚合空间特征,
Figure FDA0003798818950000033
其中,
Figure FDA0003798818950000034
表示邻接矩阵A与单位矩阵IN的和,
Figure FDA0003798818950000035
表示
Figure FDA0003798818950000036
的度矩阵,
Figure FDA0003798818950000037
表示对
Figure FDA0003798818950000038
进行归一化处理,W表示权重矩阵,σ为激活函数,得到包含空间信息的序列数据Xt′=[x1′,...,xt′];
将包含空间信息的序列数据输入增加图卷积操作改进后的门控循环神经网络GRU中,捕捉时序特征,将第t-1个时刻的隐藏状态和当前的关键OD对流量信息作为输入,得到第t个时刻的流量状态
zt=σ(Wz[f(Xt,A),ht-1]+bz),
rt=σ(Wr[f(Xt,A),ht-1]+br),
Figure FDA0003798818950000041
Figure FDA0003798818950000042
其中,ht-1为第t-1个时刻的隐藏状态,Xt为第t个时刻所有关键OD对的流量信息,rt为GRU模型中的重置门,zt为GRU模型中的更新门,
Figure FDA0003798818950000043
为第t个时刻存储的内存内容,ht为第t个时刻的输出状态;
通过损失函数对输出的预测值进行优化
Figure FDA0003798818950000044
其中,yt
Figure FDA0003798818950000045
是真实OD值和预测值,n代表观测窗口的长度;
由输出层输出预测结果。
7.一种轨道交通关键OD对的流量预测系统,其特征在于,包括:
原始数据提取模块,用于获取原始客流数据,过滤得到乘车记录数据;
OD矩阵汇总模块,用于将得到的乘车记录数据进行汇总,得到若干N*N的OD矩阵;
关键OD对抽取模块,用于设置阈值,提取关键OD对集合;
虚拟图构建模块,用于利用皮尔逊相关矩阵,构建虚拟图建模OD对之间的虚拟连接关系;
建模预测模块,用于采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型,对关键OD对的时空依赖关系进行建模,得到预测结果。
8.根据权利要求7所述的轨道交通关键OD对的流量预测系统,其特征在于,所述关键OD对抽取模块包括:
阈值设置单元,用于设置零元素占比z、随机性判断值r、和大于随机性判断值的数据占比p三个阈值;
OD对筛选单元,用于利用每个OD对的历史客流数据集合Hs作为筛选依据,Hs={h1,h2,...,hs},其中,s为选取的历史数据长度,hi代表该时间段OD客流量,生成两个子集合Hs′和Hs″,关键对满足条件
Figure FDA0003798818950000051
其中,Hs′={hi|hi∈HSand hi=0,i=1,2,...,s}代表一个元素值均为0的OD对子集,Hs″={hi|hi∈HSand hi>r,i=1,2,...,s}代表一个集合中元素值均大于随机性判断值r的OD对子集;
关键OD对提取单元,用于提取得到关键OD对集合KOD={k1,k2,...,kn}。
9.根据权利要求7所述的轨道交通关键OD对的流量预测系统,其特征在于,所述虚拟图构建模块包括:
皮尔逊系数计算单元,用于计算皮尔逊相关系数
Figure FDA0003798818950000052
其中,X,Y表示两个变量,
Figure FDA0003798818950000053
是平均值;
OD对相关性计算单元,用于计算关键OD对之间的相关性矩阵Rn×n
Figure FDA0003798818950000054
其中,kij表示第i个和第j个OD对历史客流数据观测值序列之间的皮尔逊相关系数;
相关性矩阵建立单元,用于设置相关性阈值c,得到表示OD对之间虚拟连接关系的相关性矩阵A,
Figure FDA0003798818950000055
10.根据权利要求7所述的轨道交通关键OD对的流量预测系统,其特征在于,所述建模预测模块包括:
输入层单元,用于接收OD对表示的历史客流信息,对关键OD对进行提取,以关键OD对多个时间步长的历史流量信息形成邻接特征矩阵X=[x1,...,xt],其中,X代表全网全时段的关键OD对历史数据集合,xt表示各个关键OD对在t时刻采集的历史数据集合,xt=[x(k1),x(k2),...,x(kn)]T,再利用皮尔逊相关系数,构建虚拟图生成邻接矩阵A,并将特征矩阵X和邻接矩阵A作为特征提取层的输入;
特征提取层单元,包括图卷积神经网络GCN模块和门控循环神经网络GRU模块;
所述图卷积神经网络GCN模块采用基于谱方法的图卷积神经网络GCN,对来自输入层的数据进行图卷积操作,对节点特征信息和结构信息进行端到端学习,获取节点信息聚合空间特征,得到包含空间信息的序列数据Xt′=[x1′,...,xt′];
所述门控循环神经网络GRU模块将包含空间信息的序列数据输入增加图卷积操作改进后的门控循环神经网络GRU中,捕捉时序特征;
输出层单元,用于由输出层输出预测结果;
减损优化单元,用于通过损失函数
Figure FDA0003798818950000061
对输出的预测值进行优化,其中,yt
Figure FDA0003798818950000062
是真实OD值和预测值,n代表观测窗口的长度。
CN202210977354.6A 2022-08-15 2022-08-15 一种轨道交通关键od对的流量预测方法及系统 Pending CN115375020A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210977354.6A CN115375020A (zh) 2022-08-15 2022-08-15 一种轨道交通关键od对的流量预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210977354.6A CN115375020A (zh) 2022-08-15 2022-08-15 一种轨道交通关键od对的流量预测方法及系统

Publications (1)

Publication Number Publication Date
CN115375020A true CN115375020A (zh) 2022-11-22

Family

ID=84065412

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210977354.6A Pending CN115375020A (zh) 2022-08-15 2022-08-15 一种轨道交通关键od对的流量预测方法及系统

Country Status (1)

Country Link
CN (1) CN115375020A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116128122A (zh) * 2023-01-03 2023-05-16 北京交通大学 一种考虑突发因素的城市轨道交通短时客流预测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116128122A (zh) * 2023-01-03 2023-05-16 北京交通大学 一种考虑突发因素的城市轨道交通短时客流预测方法
CN116128122B (zh) * 2023-01-03 2023-09-12 北京交通大学 一种考虑突发因素的城市轨道交通短时客流预测方法

Similar Documents

Publication Publication Date Title
CN111612206B (zh) 一种基于时空图卷积神经网络的街区人流预测方法及系统
Bao et al. A spatiotemporal deep learning approach for citywide short-term crash risk prediction with multi-source data
Donovan et al. Using coarse GPS data to quantify city-scale transportation system resilience to extreme events
CN114220271A (zh) 基于动态时空图卷积循环网络的交通流预测方法、设备及存储介质
CN116128122B (zh) 一种考虑突发因素的城市轨道交通短时客流预测方法
CN113034913A (zh) 交通拥堵预测方法、装置、设备及存储介质
CN111554408B (zh) 城市内部登革热时空预测方法、系统及电子设备
CN114692984B (zh) 基于多步耦合图卷积网络的交通预测方法
KR102357236B1 (ko) 지역별 유동인구 및 감염병 확진인구에 따른 가용지수 예측시스템
CN113077090A (zh) 客流预测方法、系统及计算机可读存储介质
CN107766636A (zh) 一种基于极值理论与微观仿真的城市交叉口安全评价方法
CN112561187B (zh) 一种基于cnn-lstm的网约车目标订单预测方法
CN112116149B (zh) 一种考虑预报不确定性关联演化特征的多站中长期径流滚动概率预测方法
Zhong et al. Online prediction of network-level public transport demand based on principle component analysis
CN115375020A (zh) 一种轨道交通关键od对的流量预测方法及系统
Dhivya Bharathi et al. Bus travel time prediction: a log-normal auto-regressive (AR) modelling approach
CN111985731B (zh) 城市公共交通站点人数的预测方法及系统
CN111145535B (zh) 一种复杂场景下的行程时间可靠性分布预测方法
CN117077843A (zh) 基于CBAM-CNN-Transformer的时空注意力细粒度PM2.5浓度预测方法
Jiao et al. Multi-step traffic flow prediction method based on the Conv1D+ LSTM
Widiyaningtyas et al. Use of ARIMA method to predict the number of train passenger in Malang City
Olmoguez et al. Developing a dengue forecasting model: A case study in Iligan city
US11663448B2 (en) Neural network systems and methods for event parameter determination
Li Stochastic modeling and adaptive forecasting for parking space availability with drivers’ time-varying arrival/departure behavior
Rezazada et al. What influences passenger’s arrival rate at stops in Melbourne: Wasea-Lstm, a novel deep learning model leveraging multi-source data fusion

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination