CN115375020A

CN115375020A - 一种轨道交通关键od对的流量预测方法及系统

Info

Publication number: CN115375020A
Application number: CN202210977354.6A
Authority: CN
Inventors: 韩啸; 张超; 董雪茹; 杨军; 叶谈
Original assignee: China University of Mining and Technology Beijing CUMTB
Current assignee: China University of Mining and Technology Beijing CUMTB
Priority date: 2022-08-15
Filing date: 2022-08-15
Publication date: 2022-11-22

Abstract

本发明的实施例公开了一种轨道交通关键OD对的流量预测方法及系统。方法包括：获取原始客流数据，过滤得到乘车记录数据；将得到的乘车记录数据进行汇总，得到若干N*N的OD矩阵；设置阈值，提取关键OD对集合；利用皮尔逊相关矩阵，构建虚拟图建模OD对之间的虚拟连接关系；采用图卷积神经网络和门控循环神经网络结合的模型，对关键OD对的时空依赖关系进行建模，得到预测结果。系统包括：原始数据提取模块、OD矩阵汇总模块、关键OD对抽取模块、虚拟图构建模块和建模预测模块。本发明能够解决城市轨道交通短期OD流量预测问题，为地铁运营和管理提供数据参考，同时辅助突发事件应急处置，降低突发事件造成的持续影响。

Description

一种轨道交通关键OD对的流量预测方法及系统

技术领域

本发明涉及智能交通技术领域，特别涉及一种轨道交通关键OD对的流量预测方法及系统。

背景技术

近年来，城市轨道交通进入网络化运营时代，逐步承担起缓解大城市道路交通拥塞的责任。以深圳地铁为例，2018年单日地铁出行规模已突破500万人次，承担了整个城市三分之一以上的交通流量，在城市公共交通系统中占据重要地位。日益增加的出行需求给城市轨道交通带来了严重的运营压力，特别是在早、晚高峰时期，通勤需求量大，地铁的运行运营效率将直接影响城市的整体通勤效率。在此背景之下，客流预测类研究成为了研究人员关注的关键问题。

现有的研究大多针对于进出站客流量、日客流量、小时客流量及断面客流量的预测，其中OD预测的研究内容相对较少。而OD客流体现着进出站客流的流向和分布，是乘客出行需求的直观体现，蕴含着非常有价值的信息，是网络化运营条件下地铁行车组织、客运组织和乘客服务的基础支撑数据。但是由于OD数据维数高与数据稀疏性的问题，对于OD矩阵直接进行预测的难度很大，同时现有研究并没有提出OD对之间存在的隐含空间关系。

发明内容

有鉴于此，本发明实施例的目的在于提供一种轨道交通关键OD对的流量预测方法及系统，能够解决城市轨道交通短期关键OD对流量预测问题，为地铁运营和管理提供数据参考，同时辅助突发事件应急处置，降低突发事件造成的持续影响。

第一方面，本发明实施例提供了一种轨道交通关键OD对的流量预测方法，其中，包括：

获取原始客流数据，过滤得到乘车记录数据。

将得到的乘车记录数据进行汇总，得到若干N*N的OD矩阵。

设置阈值，提取关键OD对集合。

利用皮尔逊相关矩阵，构建虚拟图建模OD对之间的虚拟连接关系。

采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型，对关键OD对的时空依赖关系进行建模，得到预测结果。

结合第一方面，本发明实施例提供了第一方面的第一种可能的实施方式，其中，所述获取原始客流数据，过滤得到乘车记录数据，包括：

从轨道交通AFC系统获得原始刷卡数据。

设置数据过滤条件，从所述原始刷卡数据中提取包括卡号、进站时间、进站站点、出站站点、出站时间的乘车记录数据。

由于地铁在进出站时均需要刷卡，因此需要同时拥有一张交通卡的进出站记录才能构成一条完整的乘车记录，设置数据过滤条件提取原始数据中完整且合理的乘车记录。

结合第一方面，本发明实施例提供了第一方面的第二种可能的实施方式，其中，所述数据过滤条件包括：

每一条乘车记录数据均包含进站记录和出站记录。

每一条乘车记录数据的进站站点和出站站点不同。

每一条乘车记录数据的进站时间在6：00以后。

结合第一方面，本发明实施例提供了第一方面的第三种可能的实施方式，其中，所述将得到的乘车记录数据进行汇总，得到若干N*N的OD矩阵，包括：

将过滤得到乘车记录数据，以固定的时间间隔T，基于进站时间，统计时段内由O站驶向D站的交通需求，进行汇总。

得到t时刻全网客流N*N的OD矩阵

其中，

代表第t个时间段内由i站向j站产生的客流需求总数，i为进站编号，j为出站编号。

结合第一方面，本发明实施例提供了第一方面的第四种可能的实施方式，其中，所述设置阈值，提取关键OD对集合，包括：

设置零元素占比z、随机性判断值r、和大于随机性判断值的数据占比p三个阈值。

利用每个OD对的历史客流数据集合H^s作为筛选依据，H^s＝{h¹，h²，...，h^s}，其中，s为选取的历史数据长度，hⁱ代表该时间段OD客流量。

生成两个子集合H^s′和H^s″，关键OD对满足条件

其中，H^s′＝{hⁱ|hⁱ∈H^S and hⁱ＝0，i＝1，2，...，s}代表一个元素值均为0的OD对子集，H^s″＝{hⁱ|hⁱ∈H^S and hⁱ＞r，i＝1，2，...，s}代表一个集合中元素值均大于随机性判断值r的OD对子集。

提取得到关键OD对集合K_OD＝{k₁，k₂，...，k_n}。

结合第一方面，本发明实施例提供了第一方面的第五种可能的实施方式，其中，所述利用皮尔逊相关矩阵，构建虚拟图建模OD对之间的虚拟连接关系，包括：

计算皮尔逊相关系数

其中，X，Y表示两个变量，

是平均值。

计算关键OD对之间的相关性矩阵R^n×n，

其中，k_ij表示第i个和第j个OD对历史客流数据观测值序列之间的皮尔逊相关系数。

设置相关性阈值c，得到表示OD对之间虚拟连接关系的相关性矩阵A，

A用于表示OD对之间的虚拟连接关系，仅包含0和1的元素，如果节点之间没有连接，则A_ij为0，否则为1。

本发明基于关键OD对进行预测，失去了基于现实站点物理图的依赖关系，但是OD对自身结合了起仡站点的空间性质，例如O站为居住区，D站为办公区，具有类似性质的OD对表现出相关性，即OD对之间可能因为具有相似的功能性而具有类似的流量分布特征，因此可以建立虚拟连接边生成邻接矩阵。

结合第一方面，本发明实施例提供了第一方面的第六种可能的实施方式，其中，所述采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型，对关键OD对的时空依赖关系进行建模，得到预测结果，包括：由输入层接收OD对表示的历史客流信息，对关键OD对进行提取，以关键OD对多个时间步长的历史流量信息形成特征矩阵

其中，X代表全网全时段的关键OD对历史数据集合,x^t表示各个关键OD对在t时刻采集的历史数据集合，x^t＝[x(k₁)，x(k₂)，...，x(k_n)]^T，再利用皮尔逊相关系数，构建虚拟图生成邻接矩阵A，并将特征矩阵X和邻接矩阵A作为特征提取层的输入。

特征提取层采用基于谱方法的图卷积神经网络GCN，对来自输入层的数据进行图卷积操作，对节点特征信息和结构信息进行端到端学习，获取节点信息聚合空间特征，

其中，

表示邻接矩阵A与单位矩阵IN的和，

表示

的度矩阵，

表示对

进行归一化处理，W表示权重矩阵，σ为激活函数，得到包含空间信息的序列数据X^t′＝[x^1′，...，x^t′]。

将包含空间信息的序列数据输入增加图卷积操作改进后的门控循环神经网络GRU中，捕捉时序特征，将第t-1个时刻的隐藏状态和当前的关键OD对流量信息作为输入，得到第t个时刻的流量状态

z_t＝σ(W_z[f(X^t，A)，h_t-1]+b_z)，

r_t＝σ(W_r[f(X^t，A)，h_t-1]+b_r)，

其中，h_t-1为第t-1个时刻的隐藏状态，X^t为第t个时刻所有关键OD对的流量信息，r_t为GRU模型中的重置门，决定了如何将新的输入信息与前面的信息相结合，z_t为GRU模型中的更新门，定义了前面信息保存到当前时间步的量，

为第t个时刻存储的内存内容，h_t为第t个时刻的输出状态。

由输出层输出预测结果。

结合第一方面，本发明实施例提供了第一方面的第七种可能的实施方式，其中，所述采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型，对关键OD对的时空依赖关系进行建模，得到预测结果，还包括：

通过损失函数对输出的预测值进行优化

其中，y_t和

是真实OD值和预测值，n代表观测窗口的长度。

第二方面，本发明实施例还提供了一种轨道交通OD对的流量预测系统，其中，包括：

原始数据提取模块，用于获取原始客流数据，过滤得到乘车记录数据。

OD矩阵汇总模块，用于将得到的乘车记录数据进行汇总，得到若干N*N的OD矩阵。

关键OD对抽取模块，用于设置阈值，提取关键OD对集合。

虚拟图构建模块，用于利用皮尔逊相关矩阵，构建虚拟图建模OD对之间的虚拟连接关系。

建模预测模块，用于采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型，对关键OD对的时空依赖关系进行建模，得到预测结果。

结合第二方面，本发明实施例提供了第二方面的第一种可能的实施方式，其中，所述关键OD对抽取模块包括:

阈值设置单元，用于设置零元素占比z、随机性判断值r、和大于随机性判断值的数据占比p三个阈值。

OD对筛选单元，用于利用每个OD对的历史客流数据集合H^s作为筛选依据，H^s＝{h¹，h²，...，h^s}，其中，s为选取的历史数据长度，hⁱ代表该时间段OD客流量，生成两个子集合H^s′和H^s″，关键对满足条件

关键OD对提取单元，用于提取得到关键OD对集合K_OD＝{k₁，k₂，...，k_n}。

结合第二方面，本发明实施例提供了第二方面的第二种可能的实施方式，其中，所述虚拟图构建模块包括:

皮尔逊系数计算单元，用于计算皮尔逊相关系数

其中，X，Y表示两个变量，

是平均值。

OD对相关性计算单元，用于计算关键OD对之间的相关性矩阵R^n×n，

相关性矩阵建立单元，用于设置相关性阈值c，得到表示OD对之间虚拟连接关系的相关性矩阵A，

结合第二方面，本发明实施例提供了第二方面的第三种可能的实施方式，其中，所述建模预测模块包括：

输入层单元，用于接收OD对表示的历史客流信息，对关键OD对进行提取，以关键OD对多个时间步长的历史流量信息形成邻接特征矩阵X＝[x¹，...，x^t]，其中，X代表全网全时段的关键OD对历史数据集合,x^t表示各个关键OD对在t时刻采集的历史数据集合，x^t＝[x(k₁)，x(k₂)，...，x(k_n)]^T，再利用皮尔逊相关系数，构建虚拟图生成邻接矩阵A，并将特征矩阵X和邻接矩阵A作为特征提取层的输入。

特征提取层单元，包括图卷积神经网络GCN模块和门控循环神经网络GRU模块。

所述图卷积神经网络GCN模块采用基于谱方法的图卷积神经网络GCN，对来自输入层的数据进行图卷积操作，对节点特征信息和结构信息进行端到端学习，获取节点信息聚合空间特征，得到包含空间信息的序列数据X^t′＝[x^1′，...，x^t′]。

所述门控循环神经网络GRU模块将包含空间信息的序列数据输入增加图卷积操作改进后的门控循环神经网络GRU中，捕捉时序特征。

输出层单元，用于由输出层输出预测结果。

减损优化单元，用于通过损失函数

对输出的预测值进行优化，其中，y_t和

是真实OD值和预测值，n代表观测窗口的长度。

本发明实施例的有益效果是：

本发明提供了一种轨道交通关键OD对的流量预测方法及系统，通过设置三个阈值提取关键OD对，解决了OD客流具有数据稀疏性和数据维数高的问题，利用皮尔逊相关系数计算关键OD对之间的相关性，建立关键OD对的虚拟图，使用GCN捕获这种关联关系，再通过GRU捕获时序信息，通过结合时间和空间信息增强了模型的灵活性和表达能力。目的在于解决城市轨道交通短期关键OD对流量预测问题。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明轨道交通OD对的流量预测方法的流程图；

图2为本发明轨道交通关键OD对的流量预测方法及系统模型预测框架示意图；

图3为本发明轨道交通OD对的流量预测方法的GCN和GRU结合的计算过程示意图；

图4为本发明轨道交通OD对的流量预测方法的10钟粒度的关键OD对流量数据的预测情况可视化展示示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件能够以各种不同的配置来布置和设计。

请参照图1至图4，本发明的第一个实施例提供一种轨道交通OD对的流量预测方法，获取原始客流数据，过滤得到乘车记录数据；将得到的乘车记录数据进行汇总，得到若干N*N的OD矩阵；设置阈值，提取关键OD对集合；利用皮尔逊相关矩阵，构建虚拟图建模OD对之间的虚拟连接关系；采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型，对关键OD对的时空依赖关系进行建模，得到预测结果。本发明的目的是在给定前n个时间间隔的关键OD对历史客流数据的情况下，预测接下来m个时间间隔的客流量，可以表述为如下的学习函数：

其中X^T代表T时间间隔内所有OD对的历史流量值，f是一个映射函数。具体步骤如下:

步骤S1，获取原始客流数据，过滤得到乘车记录数据。

从轨道交通AFC系统获得原始刷卡数据。

其中，所述数据过滤条件包括：

每一条乘车记录数据均包含进站记录和出站记录。

每一条乘车记录数据的进站站点和出站站点不同。

每一条乘车记录数据的进站时间在6：00以后。

步骤S2，将得到的乘车记录数据进行汇总，得到若干N*N的OD矩阵。

得到t时刻全网客流N*N的OD矩阵

其中，

步骤S3，设置阈值，提取关键OD对集合。

生成两个子集合H^s′和H^s″，关键OD对满足条件

提取得到关键OD对集合K_OD＝{k₁，k₂，...，k_n}。

步骤S4，利用皮尔逊相关矩阵，构建虚拟图建模OD对之间的虚拟连接关系。

计算皮尔逊相关系数

其中，X，Y表示两个变量，

是平均值。

计算关键OD对之间的相关性矩阵R^n×n，

步骤S5，采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型，对关键OD对的时空依赖关系进行建模，得到预测结果。本发明采用的模型预测框架如图2所示。

由输入层接收OD对表示的历史客流信息，对关键OD对进行提取，以关键OD对多个时间步长的历史流量信息形成特征矩阵

如图3所示，特征提取层采用基于谱方法的图卷积神经网络GCN，对来自输入层的数据进行图卷积操作，对节点特征信息和结构信息进行端到端学习，获取节点信息聚合空间特征，

其中，

表示邻接矩阵A与单位矩阵IN的和，

表示

的度矩阵，

表示对

z_t＝σ(W_z[f(X^t，A)，h_t-1]+b_z)，

r_t＝σ(W_r[f(X^t，A)，h_t-1]+b_r)，

为第t个时刻存储的内存内容，h_t为第t个时刻的输出状态。

由输出层输出预测结果。

通过损失函数对输出的预测值进行优化

其中，y_t和

是真实OD值和预测值，n代表观测窗口的长度。

步骤S6，选择均方根误差(RMSE)、平均绝对误差(MAE)、和线性回归决定系数(R2)作为评估指标。具体来说，RMSE和MAE用于衡量预测误差：值越小，预测效果越好。R2计算相关系数，衡量预测结果代表实际数据的能力：值越大，预测效果越好。具体计算公式如下：

其中，Y_t表示真实OD信息，

表示预测的OD信息，

代表预测的OD信息的平均值，n为节点数。

步骤S7：结果分析。选取以下五种基线方法与本文模型进行比较，包括三种传统的时间序列模型以及两种通用的深度学习模型(1)历史平均模型(HA),(2)自回归积分移动平均模型(ARIMA)，(3)支持向量回归模型(SVR)，(4)图卷积模型(GCN)和(5)门控循环单元模型(GRU)。将结果与基线方法进行比较是为了验证本发明模型在关键OD对流量预测任务中的有效性。

步骤S8：对于10分钟粒度的关键OD对流量数据的预测情况进行可视化展示。模型能很好的建模不同的客流需求，较为准确的预测可以为乘客出行提供有效的参考信息，同时对关键OD对客流的建模分析可以辅助突发事件发生时候的应急处置，降低突发事件造成的持续影响。

本发明的第二个实施例提供一种轨道交通关键OD对的流量预测系统，包括：

关键OD对抽取模块，用于设置阈值，提取关键OD对集合。

其中，所述关键OD对抽取模块包括:

其中，H^s′＝{hⁱ|hⁱ∈H^S and hⁱ＝0，i＝1，2...，s}代表一个元素值均为0的OD对子集，H^s″＝{hⁱ|hⁱ∈H^S and hⁱ＞r，i＝1，2，...，s}代表一个集合中元素值均大于随机性判断值r的OD对子集。

其中，所述虚拟图构建模块包括:

皮尔逊系数计算单元，用于计算皮尔逊相关系数

其中，X，Y表示两个变量，

是平均值。

其中，所述建模预测模块包括：

输出层单元，用于由输出层输出预测结果。

减损优化单元，用于通过损失函数

对输出的预测值进行优化，其中，y_t和

是真实OD值和预测值，n代表观测窗口的长度。

本发明的第三个实施例提供一种轨道交通关键OD对的流量预测方法的实际应用案例。

使用深圳地铁提供的真实数据，构建数据集MetroSZ2020，如表1所示。数据集中可以使用的车站数为205，我们使用2020年8月23日到2020年9月30日连续39天的轨道交通刷卡数据作为基础数据，每条记录包括卡号、进站编号、进站时间、出站编号和出站时间，运营时间段选取6:00-24:00，以10min为时间间隔汇总OD矩阵，总共42025个OD对。

类型	MetroSZ2020
		日期	2020年8月23日到2020年9月30日
运营时间段	6:00-24:00
		车站数	205
矩阵维数	205*205
		关键OD对个数	490
时间间隔	10min

在数据集MetroSZ2020上使用步骤S1-S8进行关键OD对抽取与OD客流预测。针对本发明的有效性，进行了如下验证：

测试ST-VGCN模型在10分钟时间粒度下对关键OD对流量预测的性能，结果如表2所示：

表2

	RMSE	MAE	R2
				HA	15.134	5.787	0.360
ARIMA	11.321	6.065	0.105
				SVR	8.416	3.748	0.802
GCN	13.619	5.191	0.482
				GRU	12.071	5.015	0.593
ST-VGCN	8.360	3.492	0.805

与ARIMA和SVR模型相比，ST-VGCN模型的RMSE分别降低了大约26.15％和0.6％。与只关注空间或时间关系的GCN和GRU相比，ST-VGCN模型的RMSE分别降低了约38.62％和30.74％，在其他评估指标上，ST-VGCN模型与其他模型相比也有明显优势。比较结果验证了所提出的ST-VGCN模型的有效性。

针对本实施例，进行10分钟粒度的关键OD对流量数据的预测情况可视化展示。结果如图4所示。可以看到三种不同的乘客出行模式，(a)和(c)具有明细的尖峰时刻，且(c)中的尖峰时刻晚于(a)中，经过分析得出，图(a)代表的OD对起讫站的性质为O站为居住区，D站为办公区，图(c)代表的OD对起讫站的性质为O站为办公区，D站为居住区，符合居民通勤规律，而(b)保持相对平缓的趋势，D站为机场站，所以全天保持一定的乘客出行需求。

本发明首先由轨道交通AFC系统获得原始客流数据，通过设置固定时间间隔汇总原始客流数据得到OD矩阵，设置阈值提取关键OD对，解决OD数据维数高与数据稀疏性问题，利用皮尔逊相关矩阵构建虚拟图建模OD对之间的虚拟连接关系，使用结合图卷积神经网络和门控循环神经网络的时空虚拟图网络(ST-VGCN)同时识别OD对之间的空间关联关系和客流时间模式，得到预测结果。通过与其他5种基准方法的比较，本发明在各项评估指标中均优于基准方法，能有效提高预测精度。同时，本发明具有较好的拓展性，通过采集实时AFC数据作为样本数据，可进行下一时段关键OD客流量的预测，预测结果将对地铁运营和管理提供重要见解。

本发明实施例所提供的轨道交通OD对的流量预测方法及装置的计算机程序产品，包括存储了程序代码的计算机可读存储介质，程序代码包括的指令可用于执行前面方法实施例中的方法，具体实现可参见方法实施例，在此不再赘述。

具体地，该存储介质能够为通用的存储介质，如移动磁盘、硬盘等，该存储介质上的计算机程序被运行时，能够执行上述轨道交通OD对的流量预测方法，从而能够解决城市轨道交通短期关键OD对流量预测问题。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种轨道交通关键OD对的流量预测方法，其特征在于，包括：

获取原始客流数据，过滤得到乘车记录数据；

将得到的乘车记录数据进行汇总，得到若干N*N的OD矩阵；

设置阈值，提取关键OD对集合；

利用皮尔逊相关矩阵，构建虚拟图建模OD对之间的虚拟连接关系；

2.根据权利要求1所述的轨道交通关键OD对的流量预测方法，其特征在于，所述获取原始客流数据，过滤得到乘车记录数据，包括：

从轨道交通AFC系统获得原始刷卡数据；

设置数据过滤条件，从所述原始刷卡数据中提取包括卡号、进站时间、进站站点、出站站点、出站时间的乘车记录数据；

所述数据过滤条件包括：

每一条乘车记录数据均包含进站记录和出站记录；

每一条乘车记录数据的进站站点和出站站点不同；

每一条乘车记录数据的进站时间在预设时间以后。

3.根据权利要求1所述的轨道交通关键OD对的流量预测方法，其特征在于，所述将得到的乘车记录数据进行汇总，得到若干N*N的OD矩阵，包括：

将过滤得到乘车记录数据，以固定的时间间隔T，基于进站时间，统计时段内由O站驶向D站的交通需求，进行汇总；

得到t时刻全网客流N*N的OD矩阵

其中，

4.根据权利要求1所述的轨道交通关键OD对的流量预测方法，其特征在于，所述设置阈值，提取关键OD对集合，包括：

设置零元素占比z、随机性判断值r、和大于随机性判断值的数据占比p三个阈值；

利用每个OD对的历史客流数据集合H^s作为筛选依据，H^s＝{h¹，h²，...，h^s}，其中，s为选取的历史数据长度，hⁱ代表该时间段OD客流量；

生成两个子集合H^s′和H^s″，关键OD对满足条件

其中，H^s′＝{hⁱ|hⁱ∈H^Sand hⁱ＝0，i＝1，2，...，s}代表一个元素值均为0的OD对子集，H^s″＝{hⁱ|hⁱ∈H^Sand hⁱ＞r，i＝1，2，...，s}代表一个集合中元素值均大于随机性判断值r的OD对子集；

提取得到关键OD对集合K_OD＝{k₁，k₂，...，k_n}。

5.根据权利要求1所述的轨道交通关键OD对的流量预测方法，其特征在于，所述利用皮尔逊相关矩阵，构建虚拟图建模OD对之间的虚拟连接关系，包括：

计算皮尔逊相关系数

其中，X，Y表示两个变量，

是平均值；

计算关键OD对之间的相关性矩阵R^n×n，

其中，k_ij表示第i个和第j个OD对历史客流数据观测值序列之间的皮尔逊相关系数；

6.根据权利要求1所述的轨道交通关键OD对的流量预测方法，其特征在于，所述采用图卷积神经网络GCN和门控循环神经网络GRU结合的模型，对关键OD对的时空依赖关系进行建模，得到预测结果，包括：

由输入层接收OD对表示的历史客流信息，对关键OD对进行提取，以关键OD对多个时间步长的历史流量信息形成特征矩阵X,X＝[x¹，...，x^t]，其中，其中X代表全网全时段的关键OD对历史数据集合,x^t表示各个关键OD对在t时刻采集的历史数据集合，x^t＝[x(k₁)，x(k₂)，...，x(k_n)]^T，再利用皮尔逊相关系数，构建虚拟图生成邻接矩阵A，并将特征矩阵X和邻接矩阵A作为特征提取层的输入；

其中，

表示邻接矩阵A与单位矩阵I_N的和，

表示

的度矩阵，

表示对

进行归一化处理，W表示权重矩阵，σ为激活函数，得到包含空间信息的序列数据X^t′＝[x^1′，...，x^t′]；

z_t＝σ(W_z[f(X^t，A)，h_t-1]+b_z)，

r_t＝σ(W_r[f(X^t，A)，h_t-1]+b_r)，

其中，h_t-1为第t-1个时刻的隐藏状态，X^t为第t个时刻所有关键OD对的流量信息，r_t为GRU模型中的重置门，z_t为GRU模型中的更新门，

为第t个时刻存储的内存内容，h_t为第t个时刻的输出状态；

通过损失函数对输出的预测值进行优化

其中，y_t和

是真实OD值和预测值，n代表观测窗口的长度；

由输出层输出预测结果。

7.一种轨道交通关键OD对的流量预测系统，其特征在于，包括:

原始数据提取模块，用于获取原始客流数据，过滤得到乘车记录数据；

OD矩阵汇总模块，用于将得到的乘车记录数据进行汇总，得到若干N*N的OD矩阵；

关键OD对抽取模块，用于设置阈值，提取关键OD对集合；

虚拟图构建模块，用于利用皮尔逊相关矩阵，构建虚拟图建模OD对之间的虚拟连接关系；

8.根据权利要求7所述的轨道交通关键OD对的流量预测系统，其特征在于，所述关键OD对抽取模块包括:

阈值设置单元，用于设置零元素占比z、随机性判断值r、和大于随机性判断值的数据占比p三个阈值；

9.根据权利要求7所述的轨道交通关键OD对的流量预测系统，其特征在于，所述虚拟图构建模块包括:

皮尔逊系数计算单元，用于计算皮尔逊相关系数

其中，X，Y表示两个变量，

是平均值；

10.根据权利要求7所述的轨道交通关键OD对的流量预测系统，其特征在于，所述建模预测模块包括：

输入层单元，用于接收OD对表示的历史客流信息，对关键OD对进行提取，以关键OD对多个时间步长的历史流量信息形成邻接特征矩阵X＝[x¹，...，x^t]，其中，X代表全网全时段的关键OD对历史数据集合,x^t表示各个关键OD对在t时刻采集的历史数据集合，x^t＝[x(k₁)，x(k₂)，...，x(k_n)]^T，再利用皮尔逊相关系数，构建虚拟图生成邻接矩阵A，并将特征矩阵X和邻接矩阵A作为特征提取层的输入；

特征提取层单元，包括图卷积神经网络GCN模块和门控循环神经网络GRU模块；

所述图卷积神经网络GCN模块采用基于谱方法的图卷积神经网络GCN，对来自输入层的数据进行图卷积操作，对节点特征信息和结构信息进行端到端学习，获取节点信息聚合空间特征，得到包含空间信息的序列数据X^t′＝[x^1′，...，x^t′]；

所述门控循环神经网络GRU模块将包含空间信息的序列数据输入增加图卷积操作改进后的门控循环神经网络GRU中，捕捉时序特征；

输出层单元，用于由输出层输出预测结果；

减损优化单元，用于通过损失函数

对输出的预测值进行优化，其中，y_t和

是真实OD值和预测值，n代表观测窗口的长度。