CN116432868B

CN116432868B - 基于节点查询集的地铁客流量预测方法、装置及存储介质

Info

Publication number: CN116432868B
Application number: CN202310689724.0A
Authority: CN
Inventors: 王浩; 何志浩; 贺钰昕; 曹文明
Original assignee: Shenzhen University
Current assignee: Shenzhen University
Priority date: 2023-06-12
Filing date: 2023-06-12
Publication date: 2023-09-19
Anticipated expiration: 2043-06-12
Also published as: CN116432868A

Abstract

本发明公开了一种基于节点查询集的地铁客流量预测方法、装置及计算机可读存储介质，其中，法包括：获取时间序列数据以及邻接矩阵；将时间序列数据输入编码器进行处理，以获得时序特征；将所述时序特征、所述邻接矩阵以及查询集输入解码器，以获得第二处理结果；将第二处理结果输入前馈网络，以获得预测结果以及训练后的客流量预测模型；基于预测结果、真实值以及训练后的客流量预测模型，确定目标客流量预测模型。本发明通过多头注意力操作采用查询集进行注意力计算分布的过程中可以学习到节点完整序列的特征表示，进而有效捕捉两个节点之间的空间依赖性，提高了客流量预测模型对地铁客流量进行预测的精度以及准确性，提升了模型训练的效率。

Description

基于节点查询集的地铁客流量预测方法、装置及存储介质

技术领域

本发明涉及模型训练技术领域，尤其涉及一种基于节点查询集的地铁客流量预测方法、装置及计算机可读存储介质。

背景技术

地铁客流量预测具体而言是根据历史地铁客流数据和其他相关因素，预测未来某个时间段内的地铁站点客流量情况的。通过分析历史地铁站客流量数据，建立数学模型，设计相应算法挖掘数据中潜在规律特征，并结合近期历史数据得到未来客流量的预测结果。到目前为止，对地铁客流量预测的研究，从数据特征的角度可分为以下几个方面：

时间特性，乘客在不同时间上的行为与出行习惯，使得地铁客流数据在时间上具有一定的规律性。在一天内随着时间的变化，地铁客流量的增加和降低具有一定的趋势性，即数据间存在时间依赖关系；地铁客流数据某段时间内会突然出现较高的峰值，如某些距离工作区相近的地铁站，在工作日上下班时段，这些地铁站的客流量会达到一个较高值，也就是客流高峰期；地铁客流量存在周期性，相近的两天或近期若干年内同一节假日的同一时间段内客流变化趋势可能相近。

空间特性方面，地铁站位于不同的地理位置会导致地铁客流数据存在地理空间的相关性，如地理位置上邻近的地铁站点之间的历史与未来的客流量变化趋势可能会存在一定的关联，能够有地铁直达的两个站点可能会比无法直达站点之间存在更多的客流量变化依赖关系；特定站点在特定时间段内也会存在较强的相关性，例如在工作日的下班时间各住宅区附近的若干地铁站客流数据彼此会存在较强的相关性。

总之，客流数据蕴含时空特征，地铁客流预测算法应能够有效捕捉并利用数据中潜在的时间与空间特性，完成相应的预测任务。

目前的客流预测以深度学习类方法为主。在这些基于深度学习的方法中，将捕捉时间相关性的算法模型与学习空间相关性的算法模型相互结合，是近期时空图预测方面的主要研究方向。

现有方法主要通过堆叠图卷积与序列模型的方式来构建的时空图预测模型，时空图预测模型的空间特征依靠图卷积捕获。而图卷积会根据当前不同节点的采样序列与图的拓扑结构来分析不同节点之间的相关性。但在时空图预测模型的数据准备阶段，通常会将时序数据按照一定的采样长度拆分成采样序列，由于采样序列长度的差异，可能会导致图卷积无法正确捕获到两个不同节点之间的空间依赖关系，且这种错误对时间依赖关系更长的地铁客流数据会更为显著。例如在两个乘坐地铁能够到达但距离较远的地铁站A与地铁站B，大量乘客从站A坐到站B，路程一小时五十分钟，但在采样时间为半小时的情况下，图卷积可能将难以捕捉这两个节点之间的空间依赖性，导致地铁客流量预测的精度低。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种基于节点查询集的地铁客流量预测方法、装置及计算机可读存储介质，旨在解决现有地铁客流量预测的精度低的技术问题。

为实现上述目的，本发明提供一种基于节点查询集的地铁客流量预测方法，所述基于节点查询集的地铁客流量预测方法包括以下步骤：

获取历史地铁客流数据对应的时间序列数据以及邻接矩阵；

将时间序列数据输入客流量预测模型的编码器进行处理，以获得所述时间序列数据对应的时序特征；

将所述时序特征、所述邻接矩阵以及查询集输入所述客流量预测模型的解码器，通过所述解码器的自适应空间编码器对查询集以及所述邻接矩阵进程处理，获得第一处理结果，通过所述解码器的多头注意力操作对所述时序特征以及所述第一处理结果进行处理，以获得第二处理结果；

将所述第二处理结果输入所述客流量预测模型的前馈网络，以获得所述历史地铁客流数据对应的预测结果以及训练后的客流量预测模型；

基于所述预测结果、所述历史地铁客流数据对应的真实值以及训练后的客流量预测模型，确定目标客流量预测模型。

进一步地，所述编码器包括多个依次连接的编码层，所述将时间序列数据输入客流量预测模型的编码器进行处理，以获得所述时间序列数据对应的时序特征的步骤包括：

对于每一个当前编码层，通过所述当前编码层获取第一输入信息，其中，若所述当前编码层为所述编码器的第一个编码层，则所述第一输入信息为所述时间序列数据，若所述当前编码层非第一个编码层，则所述第一输入信息为上一个编码层的第一输出信息；

通过当前编码层中参数不同的两个门控时序卷积网络分别对所述第一输入信息进行处理，以获得所述时间序列数据对应的门控值以及预测值，并通过所述当前编码层基于所述门控值以及预测值确定门控参数；

通过所述当前编码层对所述门控参数进行层归一化，并基于层归一化后的门控参数以及所述第一输入信息，确定第一中间数据；

通过所述当前编码层的第一前馈网络对所述第一中间数据进行处理，并基于处理后的第一中间数据以及所述第一中间数据，确定当前编码层的第一输出信息，其中，若所述当前编码层为所述编码器的最后一个编码层，则将所述当前编码层的第一输出信息作为所述时序特征。

进一步地，所述解码器包括多个依次连接的解码层，所述将所述时序特征、所述邻接矩阵以及查询集输入所述客流量预测模型的解码器，通过所述解码器的自适应空间编码器对查询集以及所述邻接矩阵进程处理，获得第一处理结果，通过所述解码器的多头注意力操作对所述时序特征以及所述第一处理结果进行处理，以获得第二处理结果的步骤包括：

对于每一个当前解码层，通过所述当前解码层获取第二输入信息所述邻接矩阵以及输入查询集；

通过所述解码器的自适应空间编码器对输入查询集以及所述邻接矩阵进程处理，获得第一处理结果；

通过所述解码器的多头注意力操作模块对所述时序特征以及所述第一处理结果进行处理，以获得多头注意力处理结果；

通过所述当前解码层对所述多头注意力处理结果进行层归一化，并基于层归一化后的多头注意力处理结果以及所述第一处理结果，确定第二中间数据；

通过所述当前解码层的第二前馈网络对所述第二中间数据进行处理，获得处理后的第二中间数据；

通过所述当前解码层对处理后的第二中间数据进行层归一化，并基于层归一化后的第二中间数据以及所述第二中间数据，确定当前解码层的第二输出信息，其中，若所述当前解码层为所述编码器的最后一个解码层，则将所述当前解码层的第二输出信息作为所述第二处理结果；

将所述第二输出信息输入所述当前解码层的查询解码器进行处理，获得补充查询集，并基于所述补充查询集以及所述输入查询集确定所述当前解码层的输出查询集。

进一步地，所述时间序列数据为四维张量，所述通过所述解码器的多头注意力操作模块对所述时序特征以及所述第一处理结果进行处理，以获得多头注意力处理结果的步骤包括：

通过所述多头注意力操作模块确定所述时序特征的第二维序列维度的均值，并基于所述均值以及所述时序特征，确定待处理时序特征；

通过所述多头注意力操作模块对所述待处理时序特征进行矩阵乘法映射，以获得键和值，

通过所述多头注意力操作模块将所述第一处理结果投影至键和值多对应的特征空间，以获得查询矩阵；

通过所述多头注意力操作模块基于所述查询矩阵以及键，确定注意力数据，并基于所述值以及所述注意力数据确定所述多头注意力处理结果。

进一步地，所述时间序列数据为四维张量，所述将所述第二输出信息输入所述当前解码层的查询解码器进行处理，获得补充查询集的步骤包括：

通过所述查询解码器对第一待混合数据进行通道混合操作，以获得第一混合数据，其中，第一待混合数据为所述第二输出信息中第三维序列维度的特征数据以及第四维度的特征数据；

通过所述查询解码器对待转置数据进行转置操作，以获得转置后的第一混合数据，其中，所述待转置数据为所述第一混合数据中第三维序列维度的特征数据以及第四维度的特征数据；

通过所述查询解码器对第二待混合数据进行节点混合操作，以获得第二混合数据，其中，第二待混合数据为转置后的第一混合数据中第三维序列维度的特征数据以及第四维度的特征数据；

通过所述查询解码器获取所述第二输出信息中第一维序列维度的特征数据的第一均值，以及第二维序列维度的特征数据第二均值；

通过所述查询解码器基于所述第一均值以及所述第二均值，对所述第二混合数据进行降维操作，以获得所述补充查询集。

进一步地，所述时间序列数据为四维张量，所述将所述第二处理结果输入所述客流量预测模型的前馈网络，以获得所述历史地铁客流数据对应的预测结果的步骤包括：

将所述第二处理结果输入所述客流量预测模型的前馈网络，通过所述前馈网络的第一全连接网络对所述第二处理结果中第四维度的特征数据进行线性变换，以获得变换数据；

通过所述前馈网络的ReLU激活函数对所述变换数据中第四维度的特征数据进行处理，以获得处理后的变换数据；

通过所述前馈网络的第二全连接网络对处理后的变换数据进行线性变换，以获得所述预测结果。

进一步地，所述基于所述预测结果、所述历史地铁客流数据对应的真实值以及训练后的客流量预测模型，确定目标客流量预测模型的步骤包括：

基于所述预测结果以及所述真实值，确定训练后的客流量预测模型对应的损失函数；

若所述损失函数小于预设损失值，则将训练后的客流量预测模型作为所述目标客流量预测模型；

若所述损失函数大于或等于预设损失值，将训练后的客流量预测模型作为所述客流量预测模型，并返回执行所述获取历史地铁客流数据对应的时间序列数据以及邻接矩阵的步骤。

进一步地，所述基于所述预测结果、所述历史地铁客流数据对应的真实值以及训练后的客流量预测模型，确定目标客流量预测模型的步骤之后，所述基于节点查询集的地铁客流量预测方法还包括：

获取待预测地铁客流数据对应的待预测时间序列数据以及待预测邻接矩阵；

将所述待预测时间序列数据以及待预测邻接矩阵输入所述目标客流量预测模型进行模型预测，以获得所述待预测地铁客流数据对应的预测地铁客流数据。

此外，为实现上述目的，本申请还提供一种基于节点查询集的地铁客流量预测装置，所述基于节点查询集的地铁客流量预测装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于节点查询集的地铁客流量预测程序，所述基于节点查询集的地铁客流量预测程序被处理器执行时实现如上所述的基于节点查询集的地铁客流量预测方法的步骤。

此外，为实现上述目的，本申请还提供一种计算机可读存储介质，所述可读存储介质上存储有基于节点查询集的地铁客流量预测程序，所述基于节点查询集的地铁客流量预测程序被处理器执行时实现如上所述的基于节点查询集的地铁客流量预测方法的步骤。

本发明通过获取历史地铁客流数据对应的时间序列数据以及邻接矩阵；接着将时间序列数据输入客流量预测模型的编码器进行处理，以获得所述时间序列数据对应的时序特征；而后将所述时序特征、所述邻接矩阵以及查询集输入所述客流量预测模型的解码器，通过所述解码器的自适应空间编码器对查询集以及所述邻接矩阵进程处理，获得第一处理结果，通过所述解码器的多头注意力操作对所述时序特征以及所述第一处理结果进行处理，以获得第二处理结果；然后将所述第二处理结果输入所述客流量预测模型的前馈网络，以获得所述历史地铁客流数据对应的预测结果以及训练后的客流量预测模型；最后基于所述预测结果、所述历史地铁客流数据对应的真实值以及训练后的客流量预测模型，确定目标客流量预测模型，通过多头注意力操作采用查询集进行注意力计算分布的过程中可以学习到节点完整序列的特征表示，进而有效捕捉两个节点之间的空间依赖性，提高了客流量预测模型对地铁客流量进行预测的精度以及准确性，提升了模型训练的效率。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的基于节点查询集的地铁客流量预测装置的结构示意图；

图2为本发明基于节点查询集的地铁客流量预测方法第一实施例的流程示意图；

图3为本发明基于节点查询集的地铁客流量预测方法中客流量预测模型一实施例的结构示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境的基于节点查询集的地铁客流量预测装置的结构示意图。

本发明实施例基于节点查询集的地铁客流量预测装置可以是PC，也可以是智能手机、平板电脑、电子书阅读器、MP3（Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3）播放器、MP4（Moving Picture Experts Group AudioLayer IV，动态影像专家压缩标准音频层面4）播放器、便携计算机等具有显示功能的可移动式终端设备。

如图1所示，该基于节点查询集的地铁客流量预测装置可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏（Display）、输入单元比如键盘（Keyboard），可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口（如WI-FI接口）。存储器1005可以是高速RAM存储器，也可以是稳定的存储器（non-volatile memory），例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，基于节点查询集的地铁客流量预测装置还可以包括摄像头、RF（RadioFrequency，射频）电路，传感器、音频电路、WiFi模块等等。其中，传感器比如光传感器、运动传感器以及其他传感器。当然，基于节点查询集的地铁客流量预测装置还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

本领域技术人员可以理解，图1中示出的终端结构并不构成对基于节点查询集的地铁客流量预测装置的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于节点查询集的地铁客流量预测程序。

在图1所示的基于节点查询集的地铁客流量预测装置中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端（用户端），与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的基于节点查询集的地铁客流量预测程序。

在本实施例中，基于节点查询集的地铁客流量预测装置包括：存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的基于节点查询集的地铁客流量预测程序，其中，处理器1001调用存储器1005中存储的基于节点查询集的地铁客流量预测程序时，执行以下各个实施例中基于节点查询集的地铁客流量预测方法的步骤。

本发明还提供一种基于节点查询集的地铁客流量预测方法，参照图2，图2为本发明基于节点查询集的地铁客流量预测方法第一实施例的流程示意图。

本实施例中，该基于节点查询集的地铁客流量预测方法包括：

步骤S101，获取历史地铁客流数据对应的时间序列数据以及邻接矩阵；

本实施例中，在进行模型训练时，先获取历史地铁客流数据，对历史地铁客流数据进行相应处理得到对应的时间序列数据以及邻接矩阵。

历史地铁客流数据为时空图数据，时空图数据是由图和一系列存在空间关系的时间序列数据构成。对于图，通常用V表示图的节点集合（例如地铁站点等），E表示图的边集合，则图可以被表达为G=（V，E），为便于存储与计算图网络，通常使用邻接矩阵A∈R^N×N的形式来表示图，N为图中的节点个数，对于图中v_i、v_j两个节点，若（v_i，v_j）∈E则表示v_i、v_j两个节点在图中存在一条边将彼此相互连接，则邻接矩阵A中元素A_ij=d，d表示图中v_i、v_j两个节点之间的先验空间关系，例如d为v_i、v_j两个节点之间的地理距离，若（v_i，v_j）∉E则表示v_i、v_j两个节点在图中不存在直接相连的边，则邻接矩阵A中元素A_ij=0，进而可根据历史地铁客流数据准确得到对应的邻接矩阵A。

时间序列数据X∈R^L×N×C为图中所有节点的序列数据即时空图数据，其中，L为时间序列数据的时间长度，N为图中的节点个数，C为时间序列数据的维度，在地铁客流量预测中是指某时刻的出站和进站人数，即C的维度是二维，若时间序列数据所有节点上采样长度为s、时间步t-s从第刻到时刻t的时序数据，则时间序列数据可表示为X^t-s：t，预测结果可表示为X^{(t+1)：(t+n)}，n为预测未来n个时间步。深度学习中，通常使用固定的小批量数据进行梯度下降训练，批量的大小表示为B，则时间序列数据X∈R^B×L×N×C。

步骤S102，将时间序列数据输入客流量预测模型的编码器进行处理，以获得所述时间序列数据对应的时序特征；

其中，如图3所示，客流量预测模型包括编码器、解码器以及前馈网络（图3未示出），其中，编码器包括多个编码层（N×），解码器包括多个解码层（N×）。

本实施例中，获取到时间序列数据之后，将时间序列数据输入客流量预测模型的编码器进行处理，以获得所述时间序列数据对应的时序特征，其中，编码器包括多个依次连接的编码层，将时间序列数据输入编码器的第一个编码层进行处理，并将处理结果输入第二个编码层，通过后续的编码层进行依次处理，在通过最后一个编码器进行处理后，该最后一个编码器的输出数据即为时序特征。

步骤S103，将所述时序特征、所述邻接矩阵以及查询集输入所述客流量预测模型的解码器，通过所述解码器的自适应空间编码器对查询集以及所述邻接矩阵进程处理，获得第一处理结果，通过所述解码器的多头注意力操作对所述时序特征以及所述第一处理结果进行处理，以获得第二处理结果；

本实施例中，该查询集Q_source∈R^N×Cq，Cq为查询集的特征维度，查询集可以通过随机初始化得到，该客流量预测模型包括解码器，解码器包括多个依次连接的解码层，获取到时序特征之后，将所述时序特征、所述邻接矩阵以及查询集输入所述客流量预测模型的解码器，第一个解码层的自适应空间编码器对查询集以及邻接矩阵进程处理，获得第一处理结果，第一个解码层的多头注意力操作对所述时序特征以及所述第一处理结果进行处理，得到第一个解码层的输出，第一个解码层同时输出补充查询集，将补充查询集以及输出输入后续的解码层进行处理，在最后一个解码层输出第二处理结果。

步骤S104，将所述第二处理结果输入所述客流量预测模型的前馈网络，以获得所述历史地铁客流数据对应的预测结果以及训练后的客流量预测模型；

本实施例中，在获取到第二处理结果时，通将第二处理结果输入该前馈网络，前馈网络对该第二处理结果进行处理得到历史地铁客流数据对应的预测结果，此时的客流量预测模型为训练后的客流量预测模型。

步骤S105，基于所述预测结果、所述历史地铁客流数据对应的真实值以及训练后的客流量预测模型，确定目标客流量预测模型。

本实施例中，在获取到预测结果之后，基于预测结果、所述历史地铁客流数据对应的真实值以及训练后的客流量预测模型，确定目标客流量预测模型，具体地，该步骤S105包括：

步骤S1051，基于所述预测结果以及所述真实值，确定训练后的客流量预测模型对应的损失函数；

步骤S1052，若所述损失函数小于预设损失值，则将训练后的客流量预测模型作为所述目标客流量预测模型；

步骤S1053，若所述损失函数大于或等于预设损失值，将训练后的客流量预测模型作为所述客流量预测模型，并返回执行所述获取历史地铁客流数据对应的时间序列数据以及邻接矩阵的步骤。

本实施例中，在获取到预测结果时，根据预测结果以及历史地铁客流数据对应的真实值，确定训练后的客流量预测模型对应的损失函数，损失函数可以为均方误差损失，历史地铁客流数据对应的真实值为历史地铁客流数据对应时刻之后未来n个时间步内的地铁客流数据，可根据现有的损失函数计算方式计算训练后的客流量预测模型对应的损失函数。并判断损失函数是否小于预设损失值。

若所述损失函数小于预设损失值，则将训练后的客流量预测模型作为所述目标客流量预测模型；若所述损失函数大于或等于预设损失值，将训练后的客流量预测模型作为所述客流量预测模型，并返回执行所述获取历史地铁客流数据对应的时间序列数据以及邻接矩阵的步骤，以实现客流量预测模型的迭代训练。

本实施例提出的基于节点查询集的地铁客流量预测方法，通过获取历史地铁客流数据对应的时间序列数据以及邻接矩阵；接着将时间序列数据输入客流量预测模型的编码器进行处理，以获得所述时间序列数据对应的时序特征；而后将所述时序特征、所述邻接矩阵以及查询集输入所述客流量预测模型的解码器，通过所述解码器的自适应空间编码器对查询集以及所述邻接矩阵进程处理，获得第一处理结果，通过所述解码器的多头注意力操作对所述时序特征以及所述第一处理结果进行处理，以获得第二处理结果；然后将所述第二处理结果输入所述客流量预测模型的前馈网络，以获得所述历史地铁客流数据对应的预测结果以及训练后的客流量预测模型；最后基于所述预测结果、所述历史地铁客流数据对应的真实值以及训练后的客流量预测模型，确定目标客流量预测模型，通过多头注意力操作采用查询集进行注意力计算分布的过程中可以学习到节点完整序列的特征表示，进而有效捕捉两个节点之间的空间依赖性，提高了客流量预测模型对地铁客流量进行预测的精度以及准确性，提升了模型训练的效率。

基于第一实施例，提出本发明基于节点查询集的地铁客流量预测方法的第二实施例，在本实施例中，编码器包括多个依次连接的编码层，步骤S102包括：

步骤S201，对于每一个当前编码层，通过所述当前编码层获取第一输入信息，其中，若所述当前编码层为所述编码器的第一个编码层，则所述第一输入信息为所述时间序列数据，若所述当前编码层非第一个编码层，则所述第一输入信息为上一个编码层的第一输出信息；

步骤S202，通过当前编码层中参数不同的两个门控时序卷积网络分别对所述第一输入信息进行处理，以获得所述时间序列数据对应的门控值以及预测值，并通过所述当前编码层基于所述门控值以及预测值确定门控参数；

步骤S203，通过所述当前编码层对所述门控参数进行层归一化，并基于层归一化后的门控参数以及所述第一输入信息，确定第一中间数据；

步骤S204，通过所述当前编码层的第一前馈网络对所述第一中间数据进行处理，并基于处理后的第一中间数据以及所述第一中间数据，确定当前编码层的第一输出信息，其中，若所述当前编码层为所述编码器的最后一个编码层，则所述当前编码层的第一输出信息为所述时序特征。

本实施例中，编码器包括多个依次连接的编码层，在将时间序列数据输入编码器进行处理时，编码器的每一个编码层会依次获取到第一输入信息，对于每一个当前编码层，若该当前编码层为该编码器的第一个编码层，则第一输入信息为所述时间序列数据即该第一个编码层将时间序列数据作为第一输入信息，若当前编码层非第一个编码层，则第一输入信息为上一个编码层的第一输出信息，即该当前编码层将上一个编码层的第一输出信息作为第一输入信息。

每一个编码层均设有参数不同的两个门控时序卷积网络，获取到第一输入信息之后，当前编码层中参数不同的两个门控时序卷积网络分别对第一输入信息进行处理，以获得时间序列数据对应的门控值以及预测值，该门控时序卷积网络为TCN网络，一个门控时序卷积网络采用sigmoid激活函数用于计算门控值，另一个门控时序卷积网络采用tanh激活函数用于计算预测值，而后通过当前编码层基于所述门控值以及预测值确定门控参数，其中，门控参数的公式具体为：

G（X）=sigmoid（T_a（X））⊙tanh（T_b（X））；

其中，此处的G（X）为门控参数，T_a、T_b为两个门控时序卷积网络的不同参数，X为第一输入信息，sigmoid（T_a（X））为门控值，tanh（T_b（X））为预测值，门控值分布在0到1的实数域内，预测值分布在-1到1的实数域内。

获取到门控参数之后，当前编码层对所述门控参数进行层归一化，并基于层归一化后的门控参数以及所述第一输入信息，确定第一中间数据，其中，当前编码采用现有的层归一化算法对门控参数进行层归一化，将层归一化后的门控参数与第一输入信息进行整合得到第一中间数据，即第一中间数据包括层归一化后的门控参数以及第一输入信息。

获取到第一中间数据之后，将该第一中间数据输入当前编码层的第一前馈网络对第一中间数据进行处理，第一前馈网络的处理过程与客流量预测模型的前馈网络的处理过程相同，参照第四实施例中客流量预测模型的前馈网络的处理过程，在将第一中间数据输入第一前馈网络进行处理之后，同样会获得第二个全连接网络的线性变换结果FFN（X），本实施例中，第一前馈网络输出的线性变换结果FFN（X）为处理后的第一中间数据。

获取到处理后的第一中间数据之后，当前编码层基于处理后的第一中间数据以及所述第一中间数据，确定当前编码层的第一输出信息，具体地，当前编码采用现有的层归一化算法对处理后的第一中间数据进行层归一化，获得层归一化后的第一中间数据，并将层归一化后的第一中间数据与第一中间数据进行整合得到第一输出信息，即第一输出信息包括层归一化后的第一中间数据以及第一中间数据。

本实施例中，若当前编码层为编码器的最后一个编码层，则将当前编码层的第一输出信息作为所述时序特征。

本实施例提出的基于节点查询集的地铁客流量预测方法，通过对于每一个当前编码层，通过所述当前编码层获取第一输入信息，其中，若所述当前编码层为所述编码器的第一个编码层，则所述第一输入信息为所述时间序列数据，若所述当前编码层非第一个编码层，则所述第一输入信息为上一个编码层的第一输出信息；接着通过当前编码层中参数不同的两个门控时序卷积网络分别对所述第一输入信息进行处理，以获得所述时间序列数据对应的门控值以及预测值，并通过所述当前编码层基于所述门控值以及预测值确定门控参数；而后通过所述当前编码层对所述门控参数进行层归一化，并将层归一化后的门控参数与所述第一输入信息的残差链接，获得第一中间数据；然后通过所述当前编码层的第一前馈网络对所述第一中间数据进行处理，并基于处理后的第一中间数据以及所述第一中间数据，确定当前编码层的第一输出信息，其中，若所述当前编码层为所述编码器的最后一个编码层，则将所述当前编码层的第一输出信息作为所述时序特征，可以通过编码器将多节点的时间序列视作多条时间序列，进而学习其中的时间相关性得到时序特征，可以准确得到时间序列数据对应的时序特征，进一步提升了模型训练的准确性以及效率。

基于第一实施例，提出本发明基于节点查询集的地铁客流量预测方法的第三实施例，在本实施例中，解码器包括多个依次连接的解码层，步骤S103包括：

步骤S301，对于每一个当前解码层，通过所述当前解码层获取第二输入信息、所述邻接矩阵以及输入查询集；

步骤S302，通过所述解码器的自适应空间编码器对输入查询集以及所述邻接矩阵进程处理，获得第一处理结果；

步骤S303，通过所述解码器的多头注意力操作模块对所述时序特征以及所述第一处理结果进行处理，以获得多头注意力处理结果；

步骤S304，通过所述当前解码层对所述多头注意力处理结果进行层归一化，并基于层归一化后的多头注意力处理结果以及所述第一处理结果，确定第二中间数据；

步骤S305，通过所述当前解码层的第二前馈网络对所述第二中间数据进行处理，获得处理后的第二中间数据；

步骤S306，通过所述当前解码层对处理后的第二中间数据进行层归一化，并基于层归一化后的第二中间数据以及所述第二中间数据，确定当前解码层的第二输出信息，其中，若所述当前解码层为所述编码器的最后一个解码层，则将所述当前解码层的第二输出信息作为所述第二处理结果；

步骤S307，将所述第二输出信息输入所述当前解码层的查询解码器进行处理，获得补充查询集，并基于所述补充查询集以及所述输入查询集确定所述当前解码层的输出查询集。

本实施例中，解码器包括多个依次连接的解码层，在将时序特征、邻接矩阵以及查询集输入解码器进行处理时，解码器的每一个解码层会依次获取到第二输入信息、所述邻接矩阵以及查询集，对于每一个当前解码层，若该当前解码层为该解码器的第一个解码层，则第二输入信息为所述时序特征，输入查询集为预设查询集，预设查询集Q_source∈R^N×Cq，Cq为预设查询集的特征维度，预设查询集可以通过随机初始化得到；若当前解码层非第一个解码层，则第二输入信息为上一个解码层的第二输出信息，输入查询集为上一个解码层的输出查询集。

通过所述解码器的自适应空间编码器对输入查询集以及所述邻接矩阵进程处理，获得第一处理结果，其具体公式为：

；

其中，为第一处理结果，X为查询集，A为邻接矩阵，Z为归一化矩阵，Z∈R^N×N，Z_i为无向图的归一化矩阵，A_i，j为邻接矩阵A第i行第j列的元素，Ã为归一化后的邻接矩阵，K为邻接矩阵A中节点的扩散步数，Ãⁱ为扩散步数为i时的归一化后的邻接矩阵，A_ada为自适应图对应的自适应邻接矩阵，/>为扩散步数为i时的自适应邻接矩阵，W_i1、W_i2均为自适应空间编码器的学习参数。通过静态图由先验的空间知识得到，另外加入自适应图进行组合，与代表节点完整序列特征的查询集进行空间相关性的捕捉，深入挖掘地铁客流数据中潜在的空间关系信息。

获取到第一处理结果之后，解码器的多头注意力操作模块对时序特征以及第一处理结果进行处理，以获得多头注意力处理结果；具体地，时间序列数据为四维张量，该步骤S303包括：

步骤S3031，通过所述多头注意力操作模块确定所述时序特征的第二维序列维度的均值，并基于所述均值以及所述时序特征，确定待处理时序特征；

步骤S3032，通过所述多头注意力操作模块对所述待处理时序特征进行矩阵乘法映射，以获得键和值；

步骤S3033，通过所述多头注意力操作模块将所述第一处理结果投影至键和值多对应的特征空间，以获得查询矩阵；

步骤S3034，通过所述多头注意力操作模块基于所述查询矩阵以及键，确定注意力数据，并基于所述值以及所述注意力数据确定所述多头注意力处理结果。

本实施例中，时间序列数据为四维张量，即时间序列数据X∈R^B×L×N×C，B为时间序列数据对应的小批量数据的批量的大小，L为时间序列数据的时间长度，N为图中的节点个数，C为时间序列数据的维度，时序特征同样为四维张量。多头注意力操作模块获取时序特征的第二维序列维度的均值，并基于所述均值以及所述时序特征，确定待处理时序特征，例如，时序特征为X∈R^B×L×N×C时，待处理时序特征∈R^B×1×N×C。

接着，多头注意力操作模块对待处理时序特征进行矩阵乘法映射，以获得键K和值V，多头注意力操作模块将第一处理结果投影至键和值多对应的特征空间，以获得查询矩阵Q，具体公式为：

K=W_K；V=/>W_V；Q=Q_sourceW_Q；

其中，K∈R^{B×1×N×dmodel}为键，V∈R^{B×1×N×dmodel}为值，Q∈R^N×dmodel为查询矩阵，W_K∈R^C ^×dmodel为多头注意力操作模块的学习参数，W_V∈R^C×dmodel为多头注意力操作模块的学习参数，W_Q∈R^Cq×dmodel为多头注意力操作模块的学习参数，Q_source∈R^N×Cq为第一处理结果，Cq为查询集合的特征维度，dmodel为一次自注意力操作的输出维度。

接着，多头注意力操作模块基于所述查询矩阵以及键，确定注意力数据，并基于所述值以及所述注意力数据确定所述多头注意力处理结果，具体公式为：

；

attention(Q，K，V)=VS；

其中，S为注意力数据，d为常数，attention(Q，K，V)为多头注意力处理结果。

本实施例中，经过多头自注意力操作后，对于单个查询节点特征而言，会逐渐捕获特定节点的序列变化趋势，模型收敛后查询集将获得完整节点序列的特征表示。即使在不同采样序列长度的情况下，自适应空间编码器对代表了时空图数据的完整节点序列的查询集进行操作，直接构建与捕捉空间相关性，一定程度上不会因为采样序列长短问题导致空间相关性的错误建立。

获取到多头注意力处理结果之后，当前解码层对多头注意力处理结果进行层归一化，并基于层归一化后的多头注意力处理结果以及所述第一处理结果，确定第二中间数据；其中，当前解码采用现有的层归一化算法对多头注意力处理结果进行层归一化，将层归一化后的多头注意力处理结果与第一处理结果进行整合得到第二中间数据，即第二中间数据包括层归一化后的多头注意力处理结果以及第一处理结果。

获取到第二中间数据之后，当前解码层的第二前馈网络对第二中间数据进行处理，获得处理后的第二中间数据，其中，第二前馈网络的处理过程与客流量预测模型的前馈网络的处理过程相同，参照第四实施例中客流量预测模型的前馈网络的处理过程，在将第二中间数据输入第二前馈网络进行处理之后，同样会获得第二个全连接网络的线性变换结果FFN（X），本实施例中，第二前馈网络输出的线性变换结果FFN（X）为处理后的第二中间数据。

获取到处理后的第二中间数据之后，当前解码层对处理后的第二中间数据进行层归一化，并基于层归一化后的第二中间数据以及所述第二中间数据，确定当前解码层的第二输出信息，当前解码采用现有的层归一化算法对处理后的第二中间数据进行层归一化，将层归一化后的第二中间数据与第二中间数据进行整合得到第二输出信息，即第二中输出信息包括层归一化后的第二中间数据以及第二中间数据。

获取到第二输出信息之后，将第二输出信息输入当前解码层的查询解码器进行处理，获得补充查询集，并基于补充查询集以及输入查询集确定所述当前解码层的输出查询集，具体地，该步骤S307包括：

步骤S3071，通过所述查询解码器对第一待混合数据进行通道混合操作，以获得第一混合数据，其中，第一待混合数据为所述第二输出信息中第三维序列维度的特征数据以及第四维度的特征数据；

步骤S3072，通过所述查询解码器对待转置数据进行转置操作，以获得转置后的第一混合数据，其中，所述待转置数据为所述第一混合数据中第三维序列维度的特征数据以及第四维度的特征数据；

步骤S3073，通过所述查询解码器对第二待混合数据进行节点混合操作，以获得第二混合数据，其中，第二待混合数据为转置后的第一混合数据中第三维序列维度的特征数据以及第四维度的特征数据；

步骤S3074，通过所述查询解码器获取所述第二输出信息中第一维序列维度的特征数据的第一均值，以及第二维序列维度的特征数据第二均值；

步骤S3075，通过所述查询解码器基于所述第一均值以及所述第二均值，对所述第二混合数据进行降维操作，以获得所述补充查询集。

其中，时间序列数据为四维张量，第二输出信息也是四维张量，将第二输出信息输入当前解码层的查询解码器之后，查询解码器获取第一待混合数据为，该第一待混合数据为所述第二输出信息中第三维序列维度的特征数据以及第四维度的特征数据，并对第一待混合数据进行通道混合操作，获得第一混合数据，具体公式为：

CM（X）=max（（XW₁+b₁），0）W₂+b₂；

其中，CM（X）为第一混合数据，X为第二输出信息，W₁、b₁、W₂、b₂为查询解码器的参数，其中，W₁∈R^N×N，W₂∈R^N×N，b₁∈R^N，b₂∈R^N。

获取到第一混合数据之后，查询解码器对待转置数据进行转置操作，以获得转置后的第一混合数据，其中，待转置数据为第一混合数据中第三维序列维度的特征数据以及第四维度的特征数据。

查询解码器获取第二处理结果中第一维序列维度的特征数据的第一均值，以及第二维序列维度的特征数据第二均值；并基于第一均值以及第二均值，对所述第二混合数据进行降维操作，以获得补充查询集∈R^1×1×N×C。通过查询集关注的特征进入自适应查询解码器，通过通道混合与节点混合操作，解码得到查询集对当前时序特征的补充。

本实施例中，若当前解码层为所述编码器的最后一个解码层，则将当前解码层的第二输出信息作为所述第二处理结果。

本实施例提出的基于节点查询集的地铁客流量预测方法，通过对于每一个当前解码层，通过所述当前解码层获取第二输入信息以及所述查询集；通过所述解码器的自适应空间编码器对查询集以及所述邻接矩阵进程处理，获得第一处理结果；通过所述解码器的多头注意力操作模块对所述时序特征以及所述第一处理结果进行处理，以获得多头注意力处理结果；通过所述当前解码层对所述多头注意力处理结果进行层归一化，并基于层归一化后的多头注意力处理结果以及所述第一处理结果，确定第二中间数据；通过所述当前解码层的第二前馈网络对所述第二中间数据进行处理，获得处理后的第二中间数据；通过所述当前解码层对处理后的第二中间数据进行层归一化，并基于层归一化后的第二中间数据以及所述第二中间数据，确定当前解码层的第二输出信息，其中，若所述当前解码层为所述编码器的最后一个解码层，则将所述当前解码层的第二输出信息作为所述第二处理结果；将所述第二输出信息输入所述当前解码层的查询解码器进行处理，获得补充查询集，并基于所述补充查询集以及所述查询集确定所述当前解码层的输出查询集，通过时序编码器和空间解码器结合的编码器-解码器结构来分离时间和空间相关性的捕捉过程。解码器每层用查询集重复地对编码器提取的时序特征进行多头注意力操作，注意力操作的结果经过前馈网络后，再使用自适应空间编码器得到查询集的补充，反复操作后通过前馈网络得到时空图的未来预测值。通过多头注意力操作采用查询集进行注意力计算分布的过程中可以学习到节点完整序列的特征表示，进而有效捕捉两个节点之间的空间依赖性，提高了客流量预测模型对地铁客流量进行预测的精度以及准确性，提升了模型训练的效率。

基于第一实施例，提出本发明基于节点查询集的地铁客流量预测方法的第四实施例，在本实施例中，时间序列数据为四维张量，步骤S104包括：

步骤S401，将所述第二处理结果输入所述客流量预测模型的前馈网络，通过所述前馈网络的第一全连接网络对所述第二处理结果中第四维度的特征数据进行线性变换，以获得变换数据；

步骤S402，通过所述前馈网络的ReLU激活函数对所述变换数据进行处理，以获得处理后的变换数据；

步骤S403，通过所述前馈网络的第二全连接网络对处理后的变换数据进行线性变换，以获得所述预测结果。

本实施例中，时间序列数据为四维张量，即时间序列数据X∈R^B×L×N×C，B为时间序列数据对应的小批量数据的批量的大小，L为时间序列数据的时间长度，N为图中的节点个数，C为时间序列数据的维度，第二处理结果同样为四维张量。

获取到第二处理结果之后，将第二处理结果输入客流量预测模型的前馈网络，前馈网络的第一全连接网络对第二处理结果中第四维度的特征数据进行线性变换，以获得变换数据；接着，前馈网络的ReLU激活函数对变换数据进行处理，以获得处理后的变换数据。

获取到处理后的变换数据之后，前馈网络的第二全连接网络对处理后的变换数据中第四维度的特征数据进行线性变换，以获得预测结果。

具体公式为：

FFN（X）=ReLU（W₁X+B₁）W₂+B₂；

其中，FFN（X）为预测结果，W₁X+B₁为变换数据，ReLU（W₁X+B₁）为处理后的变换数据，ReLU（）为激活函数，X为第二处理结果，W₁、W₂、B₁、B₂均为前馈网络的模块学习参数。

本实施例提出的基于节点查询集的地铁客流量预测方法，通过将所述第二处理结果输入所述客流量预测模型的前馈网络，通过所述前馈网络的第一全连接网络对所述第二处理结果中第四维度的特征数据进行线性变换，以获得变换数据；接着通过所述前馈网络的ReLU激活函数对所述变换数据进行处理，以获得处理后的变换数据；而后通过所述前馈网络的第二全连接网络对处理后的变换数据中第四维度的特征数据进行线性变换，以获得预测结果，能够根据前馈网络准确得到模型训练的预测结果，进一步提升模型训练的效率。

基于上述各个实施例，提出本发明基于节点查询集的地铁客流量预测方法的第五实施例，在本实施例中，步骤S105之后，该基于节点查询集的地铁客流量预测方法还包括：

步骤S501，获取待预测地铁客流数据对应的待预测时间序列数据以及待预测邻接矩阵；

步骤S502，将所述待预测时间序列数据以及待预测邻接矩阵输入所述目标客流量预测模型进行模型预测，以获得所述待预测地铁客流数据对应的预测地铁客流数据。

本实施例中，在获得目标客流量预测模型之后，需要进行客流量预测时，获取待预测地铁客流数据，并获取待预测地铁客流数据对应的待预测时间序列数据以及待预测邻接矩阵。

接着将待预测时间序列数据以及待预测邻接矩阵输入所述目标客流量预测模型进行模型预测，将目标客流量预测模型的输出作为待预测地铁客流数据对应的预测地铁客流数据。

本实施例提出的基于节点查询集的地铁客流量预测方法，通过获取待预测地铁客流数据对应的待预测时间序列数据以及待预测邻接矩阵；接着将所述待预测时间序列数据以及待预测邻接矩阵输入所述目标客流量预测模型进行模型预测，以获得所述待预测地铁客流数据对应的预测地铁客流数据，可以通过目标客流量预测模型实现地铁客流数据的准确预测，进而提升地铁客流数据的预测准确性。

此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有基于节点查询集的地铁客流量预测程序，所述基于节点查询集的地铁客流量预测程序被处理器执行时实现如上所述的基于节点查询集的地铁客流量预测方法的步骤。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于节点查询集的地铁客流量预测方法，其特征在于，所述基于节点查询集的地铁客流量预测方法包括以下步骤：

获取历史地铁客流数据对应的时间序列数据以及邻接矩阵；

将所述时序特征、所述邻接矩阵以及查询集输入所述客流量预测模型的解码器，通过所述解码器的自适应空间编码器对查询集以及所述邻接矩阵进行处理，获得第一处理结果，通过所述解码器的多头注意力操作对所述时序特征以及所述第一处理结果进行处理，以获得第二处理结果，其中，所述查询集为节点查询集，所述查询集通过随机初始化得到；

基于所述预测结果、所述历史地铁客流数据对应的真实值以及训练后的客流量预测模型，确定目标客流量预测模型；

将所述待预测时间序列数据以及待预测邻接矩阵输入所述目标客流量预测模型进行模型预测，以获得所述待预测地铁客流数据对应的预测地铁客流数据；

所述解码器包括多个依次连接的解码层，所述将所述时序特征、所述邻接矩阵以及查询集输入所述客流量预测模型的解码器，通过所述解码器的自适应空间编码器对查询集以及所述邻接矩阵进行处理，获得第一处理结果，通过所述解码器的多头注意力操作对所述时序特征以及所述第一处理结果进行处理，以获得第二处理结果的步骤包括：

通过所述解码器的自适应空间编码器对输入查询集以及所述邻接矩阵进行处理，获得第一处理结果，公式为：

；

其中，为第一处理结果，X为查询集，A为邻接矩阵，Z为归一化矩阵，Z∈R^N×N，Z_i为无向图的归一化矩阵，A_i，j为邻接矩阵A第i行第j列的元素，Ã为归一化后的邻接矩阵，K为邻接矩阵A中节点的扩散步数，Ãⁱ为扩散步数为i时的归一化后的邻接矩阵，A_ada为自适应图对应的自适应邻接矩阵，/>为扩散步数为i时的自适应邻接矩阵，W_i1、W_i2均为自适应空间编码器的学习参数；归一化矩阵Z第i行中的各个元素均为Z_i,:，N为历史地铁客流数据对应时空图数据中的节点个数；

2.如权利要求1所述的基于节点查询集的地铁客流量预测方法，其特征在于，所述编码器包括多个依次连接的编码层，所述将时间序列数据输入客流量预测模型的编码器进行处理，以获得所述时间序列数据对应的时序特征的步骤包括：

3.如权利要求1所述的基于节点查询集的地铁客流量预测方法，其特征在于，所述时间序列数据为四维张量，所述通过所述解码器的多头注意力操作模块对所述时序特征以及所述第一处理结果进行处理，以获得多头注意力处理结果的步骤包括：

通过所述多头注意力操作模块对所述待处理时序特征进行矩阵乘法映射，以获得键和值；

4.如权利要求1所述的基于节点查询集的地铁客流量预测方法，其特征在于，所述时间序列数据为四维张量，所述将所述第二输出信息输入所述当前解码层的查询解码器进行处理，获得补充查询集的步骤包括：

5.如权利要求1所述的基于节点查询集的地铁客流量预测方法，其特征在于，所述时间序列数据为四维张量，所述将所述第二处理结果输入所述客流量预测模型的前馈网络，以获得所述历史地铁客流数据对应的预测结果的步骤包括：

6.如权利要求1所述的基于节点查询集的地铁客流量预测方法，其特征在于，所述基于所述预测结果、所述历史地铁客流数据对应的真实值以及训练后的客流量预测模型，确定目标客流量预测模型的步骤包括：

7.如权利要求1至6任一项所述的基于节点查询集的地铁客流量预测方法，其特征在于，所述基于所述预测结果、所述历史地铁客流数据对应的真实值以及训练后的客流量预测模型，确定目标客流量预测模型的步骤之后，所述基于节点查询集的地铁客流量预测方法还包括：

8.一种基于节点查询集的地铁客流量预测装置，其特征在于，所述基于节点查询集的地铁客流量预测装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于节点查询集的地铁客流量预测程序，所述基于节点查询集的地铁客流量预测程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于节点查询集的地铁客流量预测方法的步骤。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有基于节点查询集的地铁客流量预测程序，所述基于节点查询集的地铁客流量预测程序被处理器执行时实现如权利要求1至7中任一项所述的基于节点查询集的地铁客流量预测方法的步骤。