CN116402237A - 客流预测方法、装置、电子设备及介质 - Google Patents

客流预测方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN116402237A
CN116402237A CN202310665164.5A CN202310665164A CN116402237A CN 116402237 A CN116402237 A CN 116402237A CN 202310665164 A CN202310665164 A CN 202310665164A CN 116402237 A CN116402237 A CN 116402237A
Authority
CN
China
Prior art keywords
result
module
prediction
obtaining
attention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310665164.5A
Other languages
English (en)
Other versions
CN116402237B (zh
Inventor
周文仲
王伟
郜春海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Traffic Control Technology TCT Co Ltd
Original Assignee
Traffic Control Technology TCT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Traffic Control Technology TCT Co Ltd filed Critical Traffic Control Technology TCT Co Ltd
Priority to CN202310665164.5A priority Critical patent/CN116402237B/zh
Publication of CN116402237A publication Critical patent/CN116402237A/zh
Application granted granted Critical
Publication of CN116402237B publication Critical patent/CN116402237B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种客流预测方法、装置、电子设备及介质,涉及客流预测领域,该方法包括:分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取短时OD预测模型中进站流向量预测模块输出的第二预测结果;输入第一预测结果以及第二预测结果至短时OD预测模型的第一加权模块,获取第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;OD矩阵数据是根据当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的。本发明能够解决现有OD预测方法难以高效捕捉长距离时空依赖关系的问题,提升预测精度。

Description

客流预测方法、装置、电子设备及介质
技术领域
本发明涉及客流预测领域,尤其涉及一种客流预测方法、装置、电子设备及介质。
背景技术
任何一个站点的客流变化不仅与其历史客流分布有关,而且还与其他站点相互依赖,从而使得(Origin-Destination,OD)源点至终点流数据具有复杂的时空依赖性,目前算法难以捕捉OD数据中的长距离时空依赖关系。
发明内容
本发明提供一种客流预测方法、装置、电子设备及介质,用以解决现有技术中客流的预测精度较低的技术缺陷,提供了一种利用短时OD预测模型提高预测精度的技术方案。
第一方面,本发明提供了一种客流预测方法,包括:
分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果;
输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;
所述OD矩阵数据是根据所述当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;
所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
根据本发明提供的客流预测方法,所述获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,包括:
输入所述OD矩阵数据至所述OD矩阵预测模块的第一二维卷积层,获取所述第一二维卷积层输出的第一低阶特征;
输入所述第一低阶特征至密集模块,获取所述密集模块输出的第一分结果,输入所述第一分结果至自注意力密集模块,获取所述自注意力密集模块输出的第二分结果;
再次输入所述第二分结果至所述密集模块,获取所述密集模块输出的第三分结果,再次输入所述第三分结果至所述自注意力密集模块,获取所述自注意力密集模块输出的第四分结果;
输入所述第四分结果至所述OD矩阵预测模块的第二二维卷积层,获取所述第二二维卷积层输出的第一预测结果。
根据本发明提供的客流预测方法,所述获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果,包括:
输入所述进站流向量数据至所述进站流向量预测模块中的一维卷积层,获取所述一维卷积层输出的第二低阶特征;
输入所述第二低阶特征至所述进站流向量预测模块中的维度扩充层,获取所述维度扩充层输出的维度扩充特征;
输入所述维度扩充特征至所述进站流向量预测模块中的第三二维卷积层,获取所述第三二维卷积层输出的第三低阶特征;
输入所述第三低阶特征至密集模块,获取所述密集模块输出的第五分结果,输入所述第五分结果至自注意力密集模块,获取所述自注意力密集模块输出的第六分结果;
再次输入所述第六分结果至所述密集模块,获取所述密集模块输出的第七分结果,再次输入所述第七分结果至所述自注意力密集模块,获取所述自注意力密集模块输出的第八分结果;
输入所述第八分结果至所述进站流向量预测模块中的第四二维卷积层,获取所述第四二维卷积层输出的第二预测结果。
根据本发明提供的客流预测方法,所述自注意力密集模块包括注意力图生成网络模块和非局部特征聚合网络模块;
所述输入所述第一分结果至自注意力密集模块,获取所述自注意力密集模块输出的第二分结果,包括:
分别输入所述第一分结果至所述自注意力密集模块的注意力图生成网络模块,获取所述注意力图生成网络模块输出的第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度;
根据第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度,获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果;
输入所述第一分结果至所述非局部特征聚合网络模块的第五二维卷积层,获取所述第五二维卷积层输出的特征提取结果;
输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果,输入所述特征提取结果至所述非局部特征聚合网络模块的垂直方向子网络模块,获取所述垂直方向子网络模块输出的垂直方向非局部时空聚合结果,输入所述特征提取结果至所述非局部特征聚合网络模块的通道方向子网络模块,获取所述通道方向子网络模块输出的通道方向非局部时空聚合结果;
输入所述水平方向非局部时空聚合结果、所述垂直方向非局部时空聚合结果以及所述通道方向子网络模块输出的通道方向非局部时空聚合结果至所述非局部特征聚合网络模块的第二加权模块,获取所述第二加权模块输出的所述第二分结果。
根据本发明提供的客流预测方法,所述获取所述注意力图生成网络模块输出的第一垂直方向和第一水平方向上任意两个平面之间的相关度,包括:
输入所述第一分结果至所述注意力图生成网络模块的第六二维卷积层,获取所述第六二维卷积层输出的卷积结果;
基于预设维度方向处理所述卷积结果,获取处理结果;
根据对偶矩阵乘法处理所述处理结果,获取第一垂直方向和第一水平方向上任意两个平面之间的相关度。
根据本发明提供的客流预测方法,所述根据第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度,获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果,包括:
根据第一垂直方向的相关度以及第二垂直方向的相关度确定所述垂直方向上注意力结果;
根据第一水平方向的相关度以及第二水平方向的相关度确定所述垂直方向上注意力结果;
根据第一通道方向的相关度以及第二通道方向的相关度确定所述垂直方向上注意力结果。
根据本发明提供的客流预测方法,所述输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果,包括:
输入所述特征提取结果至所述水平方向子网络模块的第一转置层,获取所述第一转置层输出的第一转置结果;
输入所述第一转置结果至所述水平方向子网络模块的第一重塑层,获取所述第一重塑层输出的第一重塑结果;
根据所述第一重塑结果以及所述水平方向上注意力结果,确定水平方向聚合结果;
输入所述水平方向聚合结果至所述水平方向子网络模块的第二重塑层,获取所述第二重塑层输出的第二重塑结果;
输入所述第二重塑结果至所述水平方向子网络模块的第二转置层,获取所述第二转置层输出的水平方向非局部时空聚合结果。
第二方面,本发明提供了一种客流预测装置,包括:
第一获取单元:用于分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果;
第二获取单元:用于输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;
所述OD矩阵数据是根据所述当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;
所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的客流预测方法。
第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述客流预测方法。
本发明提供了一种客流预测方法、装置、电子设备及介质,根据当前日期之前的所有历史日期中,每一历史日期在当前时段之前的所有历史时段所对应的客流数据确定OD矩阵数据,根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定进站流向量数据,输入OD矩阵数据及进站流向量数据至短时OD预测模型,获取第一预测结果及第二预测结果,再根据第一预测结果及第二预测结果获取当前时段之后的预设时段内的客流预测结果,本发明能够解决现有OD预测方法难以高效捕捉长距离时空依赖关系的问题,进一步提升预测精度和训练效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的客流预测方法的流程示意图;
图2是本发明提供的获取第一预测结果的流程示意图;
图3是本发明提供的获取第二预测结果的流程示意图;
图4是本发明提供的获取第二分结果的流程示意图;
图5是本发明提供的获取垂直方向和水平方向上任意两个平面之间的相关度的流程示意图;
图6是本发明提供的获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果的流程示意图;
图7是本发明提供的获取水平方向非局部时空聚合结果的流程示意图;
图8是本发明提供的短时OD预测时间关系示意图;
图9是本发明提供的并行时空自注意力网络总体架构示意图;
图10是本发明提供的时空自注意力模块总体结构示意图;
图11是本发明提供的注意力图生成网络结构示意图;
图12是本发明提供的非局部特征聚合网络结构示意图;
图13是本发明提供的客流预测装置的结构示意图;
图14是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
轨道交通由于其速度快、安全性高、准点率高、运量大等优点,已成为重要交通工具之一,在城市轨道交通运营中,短时OD预测非常重要。一方面,短时OD预测结果可以缓解城市轨道交通高峰时段的局部拥堵,提高城市轨道交通系统的运行效率;另一方面,短时OD预测可以为乘客提供准确的预测信息,便于乘客提前做好出行安排,进一步提升出行体验。
然而,城市轨道交通短时OD预测存在以下三个方面的挑战:
(1)数据可用性:对于城市轨道交通来说,乘客在进站和出站时都需要刷卡,且刷卡信息可以实时记录,因此可以实时获取乘客的进站和出站信息。由于乘客从进站到出站的旅行时间不同,因此每个乘客进站和出站之间都存在不同的时间延迟,由于获取城市轨道交通OD流需要每个乘客完整的进出刷卡信息,因此无法实时获得完整的OD流量信息;
(2)数据维数:OD数据通常以OD矩阵的形式表示,对于n个车站,OD矩阵的维数为n*n,可以看出,OD矩阵的数据量相比车站数量有明显的增加;
(3)复杂的时空依赖性:任何一个站点的客流变化不仅与其历史客流分布有关,而且还与其他站点相互依赖,从而使得OD流数据具有复杂的时空依赖性。上述挑战对OD预测精度的进一步提高造成了很大的障碍。
现有短时OD预测方法可分为三类:传统方法、机器学习方法和深度学习方法。其中,传统方法包括加权历史平均自适应模型、最小二乘法和概率分析模型等。机器学习方法包括基于主成分分析和奇异值分解的方法等。然而,传统方法和机器学习方法主要存在三个方面的问题,分别是对于大规模线网数据难以实时处理、复杂的时空非局部依赖关系难以有效捕获以及预测精度有待进一步提高。现有深度学习方法主要通过卷积神经网络和通道注意力模型来实现OD矩阵的预测,但是目前仍然难以高效捕捉OD数据中的长距离时空依赖关系。综上所述,目前深度学习方法相比传统方法和机器学习方法在实时性和预测精度上有了较为明显的提升,然而依然难以高效捕捉OD数据中的长距离时空依赖关系。因此,如何通过高效捕捉OD数据中长距离时空依赖关系来进一步提升OD预测精度是一个关键问题。
本发明为了解决上述技术问题,提供了一种客流预测方法、装置、电子设备及介质,图1是本发明提供的客流预测方法的流程示意图,提供了一种客流预测方法,包括:
步骤101、分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果;
步骤102、输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;
所述OD矩阵数据是根据所述当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;
所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
在步骤101中,根据所述当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定所述OD矩阵数据,所述OD矩阵数据为前几天已完成的OD矩阵,根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定所述进站流向量数据,所述进站流向量数据为当天已进站的进站流向量,本发明主要利用当天已进站的进站流向量和前几天已完成的OD矩阵来预测未来预设时间间隔的OD矩阵,确定OD短时客流。
假设给定数据的时间粒度为
Figure SMS_1
,在实际运营管理过程中,获取进站流数据之后不是实时的数据,而是会存在固定延迟/>
Figure SMS_2
,而假设需要预测的,当前时段之后的预设时段与当前时段之间的区间称为预测区间/>
Figure SMS_3
,则短时OD预测的时间关系如图8所示。
如图8所示,在最底排的当天中,显示有固定延迟
Figure SMS_4
、预测区间/>
Figure SMS_5
、当前时段以及当前时段之前的历史时段的时间关系,中间排记录有前一天的时间关系中各时段的时间关系,最上排记录的是前2天中各时段的时间关系。
此时,短时OD预测可表示为:
Figure SMS_6
(1)
在式(1)中,
Figure SMS_8
代表在第/>
Figure SMS_10
天的第/>
Figure SMS_17
个时间间隔的OD预测矩阵,其中
Figure SMS_11
,/>
Figure SMS_19
;/>
Figure SMS_14
代表第/>
Figure SMS_21
天的第/>
Figure SMS_13
个时间间隔的进站流向量,其中/>
Figure SMS_18
。在本发明中,/>
Figure SMS_7
代表并行时空自注意力网络的非线性映射,本发明为了表达简洁,在后面阐述过程中,将/>
Figure SMS_15
,/>
Figure SMS_12
Figure SMS_20
将分别用/>
Figure SMS_16
,/>
Figure SMS_22
和/>
Figure SMS_9
进行表示,在此不予赘述。
可选地,所述短时OD预测模型为并行时空自注意力网络,所述并行时空自注意力网络主要包含两种子网络,一种是以OD矩阵为输入的包含时空自注意力模块的深度学习网络,即OD矩阵预测模块;另一种是以进站流向量为输入的包含时空自注意力模块的深度学习网络,即进站流向量预测模块,本发明将OD矩阵和进站流向量输入并行时空自注意力网络,实现精确的OD矩阵预测。
可选地,所述时空自注意力模块是基于不同时间段的OD矩阵之间存在的复杂时空关系,并根据自注意力机制所构建的,本发明首先获取OD流数据集,并将所述OD流数据集转化成OD矩阵数据以及进站流向量数据,输入所述OD矩阵数据以及进站流向量数据至短时OD预测模型,基于OD矩阵预测模块处理所述OD矩阵数据,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,基于所述进站流向量预测模块处理所述进站流向量数据,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果。
在步骤102中,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果,可以参考如下公式:
Figure SMS_23
(2)
其中,式(2)中,
Figure SMS_26
和/>
Figure SMS_28
是预设权重值,可以在训练过程中进行自适应调整,以使/>
Figure SMS_31
更接近真实OD数据分布,/>
Figure SMS_25
为所述第一预测结果,/>
Figure SMS_29
为所述第二预测结果,本发明通过对/>
Figure SMS_30
和/>
Figure SMS_32
执行加权和操作得到最终的OD预测矩阵/>
Figure SMS_24
,并根据所述OD预测矩阵
Figure SMS_27
确定当前时段之后的预设时段内的客流预测结果。
图9是本发明提供的并行时空自注意力网络总体架构示意图,本发明通过获取OD流数据集,并将OD流信息转化成OD矩阵和进站流向量的形式,基于不同时间段的OD矩阵之间存在的复杂时空关系,根据自注意力机制,设计时空自注意力模块(Spatio-TemporalSelf-attention Module,STSM),在确定出时空自注意力模块后,设计并行时空自注意力网络(Parallel Spatio-Temporal Self-attention Network,PSTSN),如图9所示,所述并行时空自注意力网络主要包含两种子网络,一种是以OD矩阵为输入的包含时空自注意力模块的深度学习网络,另一种是以进站流向量为输入的包含时空自注意力模块的深度学习网络;以使得在将OD矩阵和进站流向量输入并行时空自注意力网络后,能够实现OD矩阵预测。通过本发明提供的时空自注意力模块,基于自注意力机制的城市轨道交通进行短时OD预测,解决了现有OD预测方法难以高效捕捉长距离时空依赖关系的问题,进一步提升预测精度和训练效率。
本发明提供了一种客流预测方法、装置、电子设备及介质,根据当前日期之前的所有历史日期中,每一历史日期在当前时段之前的所有历史时段所对应的客流数据确定OD矩阵数据,根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定进站流向量数据,输入OD矩阵数据及进站流向量数据至短时OD预测模型,获取第一预测结果及第二预测结果,再根据第一预测结果及第二预测结果获取当前时段之后的预设时段内的客流预测结果,本发明能够解决现有OD预测方法难以高效捕捉长距离时空依赖关系的问题,进一步提升预测精度和训练效率。
图2是本发明提供的获取第一预测结果的流程示意图,所述获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,包括:
步骤201、输入所述OD矩阵数据至所述OD矩阵预测模块的第一二维卷积层,获取所述第一二维卷积层输出的第一低阶特征;
步骤202、输入所述第一低阶特征至密集模块,获取所述密集模块输出的第一分结果,输入所述第一分结果至自注意力密集模块,获取所述自注意力密集模块输出的第二分结果;
步骤203、再次输入所述第二分结果至所述密集模块,获取所述密集模块输出的第三分结果,再次输入所述第三分结果至所述自注意力密集模块,获取所述自注意力密集模块输出的第四分结果;
步骤204、输入所述第四分结果至所述OD矩阵预测模块的第二二维卷积层,获取所述第二二维卷积层输出的第一预测结果。
在步骤201中,结合图9,本发明中的OD矩阵预测模块,以
Figure SMS_33
为输入,并以/>
Figure SMS_34
为输出,其中/>
Figure SMS_35
为使用的时间间隔数量,/>
Figure SMS_36
为车站数量,具体来说,输入所述OD矩阵数据至所述OD矩阵预测模块的第一二维卷积层,获取所述第一二维卷积层输出的第一低阶特征/>
Figure SMS_37
在步骤202中,依次使用密集模块(Dense Block)和自注意力密集模块(Self-attention Dense Block),输入所述第一低阶特征至密集模块,获取所述密集模块输出的第一分结果
Figure SMS_38
,输入所述第一分结果/>
Figure SMS_39
至自注意力密集模块,获取所述自注意力密集模块输出的第二分结果/>
Figure SMS_40
在步骤203中,为了得到更高阶的非局部特征信息,再次使用密集模块(DenseBlock)和自注意力密集模块(Self-attention Dense Block),再次输入所述第二分结果
Figure SMS_41
至所述密集模块,获取所述密集模块输出的第三分结果/>
Figure SMS_42
,再次输入所述第三分结果/>
Figure SMS_43
至所述自注意力密集模块,获取所述自注意力密集模块输出的第四分结果/>
Figure SMS_44
在步骤204中,输入所述第四分结果
Figure SMS_45
至所述OD矩阵预测模块的第二二维卷积层,获取所述第二二维卷积层输出的第一预测结果/>
Figure SMS_46
,所述第一预测结果/>
Figure SMS_47
为OD预测矩阵。
图3是本发明提供的获取第二预测结果的流程示意图,所述获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果,包括:
步骤301、输入所述进站流向量数据至所述进站流向量预测模块中的一维卷积层,获取所述一维卷积层输出的第二低阶特征;
步骤302、输入所述第二低阶特征至所述进站流向量预测模块中的维度扩充层,获取所述维度扩充层输出的维度扩充特征;
步骤303、输入所述维度扩充特征至所述进站流向量预测模块中的第三二维卷积层,获取所述第三二维卷积层输出的第三低阶特征;
步骤304、输入所述第三低阶特征至密集模块,获取所述密集模块输出的第五分结果,输入所述第五分结果至自注意力密集模块,获取所述自注意力密集模块输出的第六分结果;
步骤305、再次输入所述第六分结果至所述密集模块,获取所述密集模块输出的第七分结果,再次输入所述第七分结果至所述自注意力密集模块,获取所述自注意力密集模块输出的第八分结果;
步骤306、输入所述第八分结果至所述进站流向量预测模块中的第四二维卷积层,获取所述第四二维卷积层输出的第二预测结果。
在步骤301中,结合图9,所述进站流向量预测模块以
Figure SMS_48
为输入,以
Figure SMS_49
为输出,在所述进站流向量预测模块中,首先将所述进站流向量数据/>
Figure SMS_50
输入到所述一维卷积层中,得到所述一维卷积层输出的第二低阶特征/>
Figure SMS_51
,通过利用一维卷积强大的特征提取能力在时间维度上进行/>
Figure SMS_52
次卷积,生成OD数据的分布形式。
在步骤302中,输入所述第二低阶特征
Figure SMS_53
至所述进站流向量预测模块中的维度扩充层,获取所述维度扩充层输出的维度扩充特征/>
Figure SMS_54
,为了与最终要生成的OD预测矩阵维度保持一致,使用维度扩充层生成维度扩充特征/>
Figure SMS_55
在步骤303中,输入所述维度扩充特征
Figure SMS_56
至所述进站流向量预测模块中的第三二维卷积层,获取所述第三二维卷积层输出的第三低阶特征/>
Figure SMS_57
,本发明采取步骤201中,基于OD矩阵预测模块相类似的处理步骤,使用第三二维卷积层提取低阶特征,生成第三低阶特征/>
Figure SMS_58
在步骤304中,输入所述第三低阶特征
Figure SMS_59
至密集模块,获取所述密集模块输出的第五分结果/>
Figure SMS_60
,输入所述第五分结果/>
Figure SMS_61
至自注意力密集模块,获取所述自注意力密集模块输出的第六分结果/>
Figure SMS_62
在步骤305中,再次输入所述第六分结果
Figure SMS_63
至所述密集模块,获取所述密集模块输出的第七分结果/>
Figure SMS_64
,再次输入所述第七分结果/>
Figure SMS_65
至所述自注意力密集模块,获取所述自注意力密集模块输出的第八分结果/>
Figure SMS_66
在步骤306中,输入所述第八分结果
Figure SMS_67
至所述进站流向量预测模块中的第四二维卷积层,获取所述第四二维卷积层输出的第二预测结果/>
Figure SMS_68
,所述第二预测结果
Figure SMS_69
与所述第一预测结果/>
Figure SMS_70
相同,均为OD预测矩阵。
图4是本发明提供的获取第二分结果的流程示意图,所述自注意力密集模块包括注意力图生成网络模块和非局部特征聚合网络模块;
所述输入所述第一分结果至自注意力密集模块,获取所述自注意力密集模块输出的第二分结果,包括:
步骤401、分别输入所述第一分结果至所述自注意力密集模块的注意力图生成网络模块,获取所述注意力图生成网络模块输出的第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度;
步骤402、根据第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度,获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果;
步骤403、输入所述第一分结果至所述非局部特征聚合网络模块的第五二维卷积层,获取所述第五二维卷积层输出的特征提取结果;
步骤404、输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果,输入所述特征提取结果至所述非局部特征聚合网络模块的垂直方向子网络模块,获取所述垂直方向子网络模块输出的垂直方向非局部时空聚合结果,输入所述特征提取结果至所述非局部特征聚合网络模块的通道方向子网络模块,获取所述通道方向子网络模块输出的通道方向非局部时空聚合结果;
步骤405、输入所述水平方向非局部时空聚合结果、所述垂直方向非局部时空聚合结果以及所述通道方向子网络模块输出的通道方向非局部时空聚合结果至所述非局部特征聚合网络模块的第二加权模块,获取所述第二加权模块输出的所述第二分结果。
可选地,所述自注意力密集模块包括注意力图生成网络模块和非局部特征聚合网络模块,所述自注意力密集模块通过利用自注意力机制来高效聚合非局部时空上下文信息,进而提高训练效率和预测精度。所述自注意力密集模块由注意力图生成网络(Attention Map Generation Network)和非局部特征聚合网络(Non-Local FeatureAggregation Network)组成。
可选地,图4中的技术方案是以第一分结果作为输入,以第二分结果作为输出进行描述的,事实上,图4所记载的技术方案还可以适用于输入所述第三分结果至所述自注意力密集模块,获取所述自注意力密集模块输出的第四分结果;输入所述第五分结果至自注意力密集模块,获取所述自注意力密集模块输出的第六分结果;输入所述第七分结果至所述自注意力密集模块,获取所述自注意力密集模块输出的第八分结果,在此不予赘述。
在步骤401中,分别输入所述第一分结果
Figure SMS_71
至所述自注意力密集模块的注意力图生成网络模块,获取所述注意力图生成网络模块输出的第一垂直方向和第一水平方向上任意两个平面之间的相关度/>
Figure SMS_72
和/>
Figure SMS_73
、第二水平方向和第一通道方向上任意两个平面之间的相关度/>
Figure SMS_74
和/>
Figure SMS_75
以及第二通道方向和第二垂直方向上任意两个平面之间的相关度/>
Figure SMS_76
和/>
Figure SMS_77
,图11是本发明提供的注意力图生成网络结构示意图,在注意力图生成网络中,有三个平行的子网络,分别设为Network-4-1、Network-4-2和Network-4-3,根据三个平行的子网络生成三个不同方向上的注意力图。
在步骤402中,根据第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度,获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果,从以上三个平行的子网络可以看出,在水平方向、垂直方向和通道方向上,每个方向都生成了两个注意图,为了使最终的注意力图表现更准确,对相同方向上的注意力地图进行加权和计算,生成水平方向上注意力结果
Figure SMS_78
、垂直方向上注意力结果/>
Figure SMS_79
和通道方向上注意力结果/>
Figure SMS_80
在步骤403中,输入所述第一分结果至所述非局部特征聚合网络模块的第五二维卷积层,获取所述第五二维卷积层输出的特征提取结果,本发明首先将水平方向上注意力结果
Figure SMS_81
、垂直方向上注意力结果/>
Figure SMS_82
和通道方向上注意力结果/>
Figure SMS_83
输入到第五二维卷积层,进行初步特征提取,得到特征提取结果/>
Figure SMS_84
在步骤404中,输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果,输入所述特征提取结果至所述非局部特征聚合网络模块的垂直方向子网络模块,获取所述垂直方向子网络模块输出的垂直方向非局部时空聚合结果,输入所述特征提取结果至所述非局部特征聚合网络模块的通道方向子网络模块,获取所述通道方向子网络模块输出的通道方向非局部时空聚合结果,所述非局部特征聚合网络模块通过使用生成的水平方向上注意力结果
Figure SMS_85
、垂直方向上注意力结果/>
Figure SMS_86
和通道方向上注意力结果/>
Figure SMS_87
,可以有效聚合非局部时空上下文信息,图12是本发明提供的非局部特征聚合网络结构示意图,所述非局部特征聚合网络通过并行的三个子网络来分别实现不同方向上的非局部特征信息的聚合,例如Network-5-1、Network-5-2和Network-5-3。
在步骤405中,输入所述水平方向非局部时空聚合结果
Figure SMS_88
、所述垂直方向非局部时空聚合结果/>
Figure SMS_89
以及所述通道方向子网络模块输出的通道方向非局部时空聚合结果/>
Figure SMS_90
至所述非局部特征聚合网络模块的第二加权模块,获取所述第二加权模块输出的所述第二分结果,本发明为了能够进一步聚合非局部特征信息,对/>
Figure SMS_91
、/>
Figure SMS_92
和/>
Figure SMS_93
进行加权求和操作,得到最终输出特征/>
Figure SMS_94
,可以参考如下公式:
Figure SMS_95
(3)
在式(3)中,
Figure SMS_96
、/>
Figure SMS_97
和/>
Figure SMS_98
为可训练的权重值,/>
Figure SMS_99
聚合了水平、垂直和通道三个方向上复杂的非局部时空上下文信息。
可选地,本发明采用的损失函数为
Figure SMS_100
损失,表达式如下:
Figure SMS_101
(4)
式(4)中,
Figure SMS_102
和/>
Figure SMS_103
分别为OD真实矩阵和OD预测矩阵中第/>
Figure SMS_104
行第/>
Figure SMS_105
列的值。
图10是本发明提供的时空自注意力模块总体结构示意图,假设自注意力密集模块的输入和输出分别为
Figure SMS_109
和/>
Figure SMS_111
。首先,将/>
Figure SMS_114
输入注意力图生成网络模块,生成三个注意力图,分别是/>
Figure SMS_107
,/>
Figure SMS_110
和/>
Figure SMS_113
,其中/>
Figure SMS_116
、/>
Figure SMS_106
和/>
Figure SMS_112
分别包含沿着水平、垂直和通道方向的任何两个平面之间的相关性;然后,将生成的三个注意力图/>
Figure SMS_115
、/>
Figure SMS_117
和/>
Figure SMS_108
输入到非局部特征聚合网络模块,分别捕获水平、垂直和通道方向上的长距离依赖关系。
可选地,空间维度上的非局部特征信息可以用
Figure SMS_118
和/>
Figure SMS_119
来提取,时间维度上的非局部特征信息可以用/>
Figure SMS_120
来提取,由于/>
Figure SMS_121
、/>
Figure SMS_122
和/>
Figure SMS_123
的生成和时空非局部特征信息的聚合都不需要占用大量的GPU资源,因此体现出了时空自注意力模块在聚合复杂时空非局部上下文信息过程中的高效性。
图5是本发明提供的获取垂直方向和水平方向上任意两个平面之间的相关度的流程示意图,所述获取所述注意力图生成网络模块输出的第一垂直方向和第一水平方向上任意两个平面之间的相关度,包括:
步骤501、输入所述第一分结果至所述注意力图生成网络模块的第六二维卷积层,获取所述第六二维卷积层输出的卷积结果;
步骤502、基于预设维度方向处理所述卷积结果,获取处理结果;
步骤503、根据对偶矩阵乘法处理所述处理结果,获取第一垂直方向和第一水平方向上任意两个平面之间的相关度。
可选地,图5中获取所述注意力图生成网络模块输出的第一垂直方向和第一水平方向上任意两个平面之间的相关度的技术方案同样适用于第二水平方向和第一通道方向上任意两个平面之间的相关度的获取以及第二通道方向和第二垂直方向上任意两个平面之间的相关度的获取。
在步骤501中,在所述注意力图生成网络模块中,有三个平行的子网络生成三个不同方向上的注意图,对于Network-4-1,首先将所述第一分结果输入到所述注意力图生成网络模块的第六二维卷积层,获取所述第六二维卷积层输出的卷积结果
Figure SMS_124
在步骤502中,为了计算方便,基于预设维度方向处理所述卷积结果,获取处理结果,例如,去除维度为1的方向,得到
Figure SMS_125
在步骤503中,根据对偶矩阵乘法处理所述处理结果,获取第一垂直方向和第一水平方向上任意两个平面之间的相关度,本发明采用对偶矩阵乘法生成
Figure SMS_126
Figure SMS_127
,用公式表示如下:
Figure SMS_128
(5)
式(5)中,
Figure SMS_129
代表矩阵相乘操作,/>
Figure SMS_130
和/>
Figure SMS_131
分别表示垂直和水平方向上的任意两个平面之间的相关度。
可选地,对于Network-4-2和Network-4-3而言,其基本步骤相同,首先,输入所述第一分结果到两个并行的转置层中,分别在两个不同维度上进行转置运算,得到
Figure SMS_134
和/>
Figure SMS_137
,然后,对于Network-4-2,将/>
Figure SMS_140
分别输入一个二维卷积层、维度挤压层,并执行对偶矩阵乘法,得到/>
Figure SMS_133
和/>
Figure SMS_135
,其中/>
Figure SMS_138
和/>
Figure SMS_141
分别包含水平方向和通道方向上任意两个平面之间的相关性,同样,对于Network-4-3,通过以上相同步骤可以得到/>
Figure SMS_132
和/>
Figure SMS_136
,其中/>
Figure SMS_139
和/>
Figure SMS_142
分别包含通道方向和垂直方向上任意两个平面之间的相关性。
图6是本发明提供的获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果的流程示意图,所述根据第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度,获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果,包括:
步骤601、根据第一垂直方向的相关度以及第二垂直方向的相关度确定所述垂直方向上注意力结果;
步骤602、根据第一水平方向的相关度以及第二水平方向的相关度确定所述垂直方向上注意力结果;
步骤603、根据第一通道方向的相关度以及第二通道方向的相关度确定所述垂直方向上注意力结果。
在步骤601中,根据第一垂直方向的相关度以及第二垂直方向的相关度确定所述垂直方向上注意力结果,可以参考如下公式:
Figure SMS_143
(6)
在式(6)中,
Figure SMS_144
代表沿水平方向上的softmax操作,/>
Figure SMS_145
、/>
Figure SMS_146
为可训练的权重值,可以在训练过程中进行自适应调整以达到最佳匹配。
在步骤602中,根据第一水平方向的相关度以及第二水平方向的相关度确定所述垂直方向上注意力结果,可以参考如下公式:
Figure SMS_147
(7)
在式(7)中,
Figure SMS_148
代表沿水平方向上的softmax操作,/>
Figure SMS_149
、/>
Figure SMS_150
为可训练的权重值,可以在训练过程中进行自适应调整以达到最佳匹配。
在步骤603中,根据第一通道方向的相关度以及第二通道方向的相关度确定所述垂直方向上注意力结果,可以参考如下公式:
Figure SMS_151
(8)
在式(8)中,
Figure SMS_152
代表沿水平方向上的softmax操作,/>
Figure SMS_153
和/>
Figure SMS_154
为可训练的权重值,可以在训练过程中进行自适应调整以达到最佳匹配。
图7是本发明提供的获取水平方向非局部时空聚合结果的流程示意图,所述输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果,包括:
步骤701、输入所述特征提取结果至所述水平方向子网络模块的第一转置层,获取所述第一转置层输出的第一转置结果;
步骤702、输入所述第一转置结果至所述水平方向子网络模块的第一重塑层,获取所述第一重塑层输出的第一重塑结果;
步骤703、根据所述第一重塑结果以及所述水平方向上注意力结果,确定水平方向聚合结果;
步骤704、输入所述水平方向聚合结果至所述水平方向子网络模块的第二重塑层,获取所述第二重塑层输出的第二重塑结果;
步骤705、输入所述第二重塑结果至所述水平方向子网络模块的第二转置层,获取所述第二转置层输出的水平方向非局部时空聚合结果。
在步骤701中,所述输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果对应于Network-5-1,具体地,输入所述特征提取结果至所述水平方向子网络模块的第一转置层,获取所述第一转置层输出的第一转置结果
Figure SMS_155
在步骤702中,输入所述第一转置结果
Figure SMS_156
至所述水平方向子网络模块的第一重塑层,获取所述第一重塑层输出的第一重塑结果/>
Figure SMS_157
在步骤703中,根据所述第一重塑结果以及所述水平方向上注意力结果,确定水平方向聚合结果,可以参考如下公式:
Figure SMS_158
(9)
式(9)中,
Figure SMS_159
中的每个元素是特征提取结果在水平方向上非局部特征聚合的结果,/>
Figure SMS_160
为所述水平方向上注意力结果,/>
Figure SMS_161
为所述第一重塑结果,/>
Figure SMS_162
为矩阵相乘,将
Figure SMS_163
和/>
Figure SMS_164
进行矩阵相乘,得到/>
Figure SMS_165
在步骤704中,输入所述水平方向聚合结果
Figure SMS_166
至所述水平方向子网络模块的第二重塑层,获取所述第二重塑层输出的第二重塑结果/>
Figure SMS_167
步骤705中,输入所述第二重塑结果
Figure SMS_168
至所述水平方向子网络模块的第二转置层,获取所述第二转置层输出的水平方向非局部时空聚合结果/>
Figure SMS_169
,本发明为了与特征提取结果的维度保持一致,通过维度重塑和转置操作对/>
Figure SMS_170
进行维度恢复,分别得到/>
Figure SMS_171
和/>
Figure SMS_172
可选地,图7示出了输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果,图7中的技术方案同样适用于输入所述特征提取结果至所述非局部特征聚合网络模块的垂直方向子网络模块,获取所述垂直方向子网络模块输出的垂直方向非局部时空聚合结果;输入所述特征提取结果至所述非局部特征聚合网络模块的通道方向子网络模块,获取所述通道方向子网络模块输出的通道方向非局部时空聚合结果。
可选地,对于输入所述特征提取结果至所述非局部特征聚合网络模块的垂直方向子网络模块,获取所述垂直方向子网络模块输出的垂直方向非局部时空聚合结果而言,本发明采用Network-5-2,所述Network-5-2与Network-5-1在网络结构上基本相同,首先将特征提取结果
Figure SMS_174
通过转置和维度重塑操作依次生成/>
Figure SMS_177
和/>
Figure SMS_181
,然后,将
Figure SMS_175
和/>
Figure SMS_178
进行矩阵相乘,得到/>
Figure SMS_180
,可以看出,/>
Figure SMS_182
中的每个元素是输入特征在垂直方向上非局部特征聚合的结果,最后,通过维度重塑和转置操作对/>
Figure SMS_173
进行维度恢复,分别得到/>
Figure SMS_176
和/>
Figure SMS_179
可选地,对于输入所述特征提取结果至所述非局部特征聚合网络模块的通道方向子网络模块,获取所述通道方向子网络模块输出的通道方向非局部时空聚合结果而言,本发明采用Network-5-3,具体地,特征提取结果
Figure SMS_185
首先通过维度重塑操作,生成
Figure SMS_187
,然后,将/>
Figure SMS_189
和/>
Figure SMS_183
进行矩阵相乘,得到/>
Figure SMS_186
。可以看出,/>
Figure SMS_188
中的每个元素是输入特征在通道方向上非局部特征聚合的结果,最后,通过维度重塑操作对/>
Figure SMS_190
进行维度恢复,得到/>
Figure SMS_184
图13是本发明提供的客流预测装置的结构示意图,本发明提供了一种客流预测装置,包括第一获取单元1:用于分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果,所述第一获取单元1的工作原理可以参考前述步骤101,在此不予赘述。
所述客流预测装置还包括第二获取单元2:用于输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果,所述第二获取单元2的工作原理可以参考前述步骤102,在此不予赘述。
所述OD矩阵数据是根据所述当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;
所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
本发明提供了一种客流预测方法、装置、电子设备及介质,根据当前日期之前的所有历史日期中,每一历史日期在当前时段之前的所有历史时段所对应的客流数据确定OD矩阵数据,根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定进站流向量数据,输入OD矩阵数据及进站流向量数据至短时OD预测模型,获取第一预测结果及第二预测结果,再根据第一预测结果及第二预测结果获取当前时段之后的预设时段内的客流预测结果,本发明能够解决现有OD预测方法难以高效捕捉长距离时空依赖关系的问题,进一步提升预测精度和训练效率。
图14是本发明提供的电子设备的结构示意图。如图14所示,该电子设备可以包括:处理器(processor)110、通信接口(Communications Interface)120、存储器(memory)130和通信总线140,其中,处理器110,通信接口120,存储器130通过通信总线140完成相互间的通信。处理器110可以调用存储器130中的逻辑指令,以执行客流预测方法,该方法包括:分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果;输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;所述OD矩阵数据是根据所述当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
此外,上述的存储器130中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的一种客流预测方法,该方法包括:分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果;输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;所述OD矩阵数据是根据所述当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的客流预测方法,该方法包括:分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果;输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;所述OD矩阵数据是根据所述当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种客流预测方法,其特征在于,包括:
分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果;
输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;
所述OD矩阵数据是根据当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;
所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
2.根据权利要求1所述的客流预测方法,其特征在于,所述获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,包括:
输入所述OD矩阵数据至所述OD矩阵预测模块的第一二维卷积层,获取所述第一二维卷积层输出的第一低阶特征;
输入所述第一低阶特征至密集模块,获取所述密集模块输出的第一分结果,输入所述第一分结果至自注意力密集模块,获取所述自注意力密集模块输出的第二分结果;
再次输入所述第二分结果至所述密集模块,获取所述密集模块输出的第三分结果,再次输入所述第三分结果至所述自注意力密集模块,获取所述自注意力密集模块输出的第四分结果;
输入所述第四分结果至所述OD矩阵预测模块的第二二维卷积层,获取所述第二二维卷积层输出的第一预测结果。
3.根据权利要求2所述的客流预测方法,其特征在于,所述获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果,包括:
输入所述进站流向量数据至所述进站流向量预测模块中的一维卷积层,获取所述一维卷积层输出的第二低阶特征;
输入所述第二低阶特征至所述进站流向量预测模块中的维度扩充层,获取所述维度扩充层输出的维度扩充特征;
输入所述维度扩充特征至所述进站流向量预测模块中的第三二维卷积层,获取所述第三二维卷积层输出的第三低阶特征;
输入所述第三低阶特征至密集模块,获取所述密集模块输出的第五分结果,输入所述第五分结果至自注意力密集模块,获取所述自注意力密集模块输出的第六分结果;
再次输入所述第六分结果至所述密集模块,获取所述密集模块输出的第七分结果,再次输入所述第七分结果至所述自注意力密集模块,获取所述自注意力密集模块输出的第八分结果;
输入所述第八分结果至所述进站流向量预测模块中的第四二维卷积层,获取所述第四二维卷积层输出的第二预测结果。
4.根据权利要求2或3所述的客流预测方法,其特征在于,所述自注意力密集模块包括注意力图生成网络模块和非局部特征聚合网络模块;
所述输入所述第一分结果至自注意力密集模块,获取所述自注意力密集模块输出的第二分结果,包括:
分别输入所述第一分结果至所述自注意力密集模块的注意力图生成网络模块,获取所述注意力图生成网络模块输出的第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度;
根据第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度,获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果;
输入所述第一分结果至所述非局部特征聚合网络模块的第五二维卷积层,获取所述第五二维卷积层输出的特征提取结果;
输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果,输入所述特征提取结果至所述非局部特征聚合网络模块的垂直方向子网络模块,获取所述垂直方向子网络模块输出的垂直方向非局部时空聚合结果,输入所述特征提取结果至所述非局部特征聚合网络模块的通道方向子网络模块,获取所述通道方向子网络模块输出的通道方向非局部时空聚合结果;
输入所述水平方向非局部时空聚合结果、所述垂直方向非局部时空聚合结果以及所述通道方向子网络模块输出的通道方向非局部时空聚合结果至所述非局部特征聚合网络模块的第二加权模块,获取所述第二加权模块输出的所述第二分结果。
5.根据权利要求4所述的客流预测方法,其特征在于,所述获取所述注意力图生成网络模块输出的第一垂直方向和第一水平方向上任意两个平面之间的相关度,包括:
输入所述第一分结果至所述注意力图生成网络模块的第六二维卷积层,获取所述第六二维卷积层输出的卷积结果;
基于预设维度方向处理所述卷积结果,获取处理结果;
根据对偶矩阵乘法处理所述处理结果,获取第一垂直方向和第一水平方向上任意两个平面之间的相关度。
6.根据权利要求4所述的客流预测方法,其特征在于,所述根据第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度,获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果,包括:
根据第一垂直方向的相关度以及第二垂直方向的相关度确定所述垂直方向上注意力结果;
根据第一水平方向的相关度以及第二水平方向的相关度确定所述垂直方向上注意力结果;
根据第一通道方向的相关度以及第二通道方向的相关度确定所述垂直方向上注意力结果。
7.根据权利要求4所述的客流预测方法,其特征在于,所述输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果,包括:
输入所述特征提取结果至所述水平方向子网络模块的第一转置层,获取所述第一转置层输出的第一转置结果;
输入所述第一转置结果至所述水平方向子网络模块的第一重塑层,获取所述第一重塑层输出的第一重塑结果;
根据所述第一重塑结果以及所述水平方向上注意力结果,确定水平方向聚合结果;
输入所述水平方向聚合结果至所述水平方向子网络模块的第二重塑层,获取所述第二重塑层输出的第二重塑结果;
输入所述第二重塑结果至所述水平方向子网络模块的第二转置层,获取所述第二转置层输出的水平方向非局部时空聚合结果。
8.一种客流预测装置,其特征在于,包括:
第一获取单元:用于分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果;
第二获取单元:用于输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;
所述OD矩阵数据是根据当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;
所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的客流预测方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的客流预测方法。
CN202310665164.5A 2023-06-07 2023-06-07 客流预测方法、装置、电子设备及介质 Active CN116402237B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310665164.5A CN116402237B (zh) 2023-06-07 2023-06-07 客流预测方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310665164.5A CN116402237B (zh) 2023-06-07 2023-06-07 客流预测方法、装置、电子设备及介质

Publications (2)

Publication Number Publication Date
CN116402237A true CN116402237A (zh) 2023-07-07
CN116402237B CN116402237B (zh) 2023-09-01

Family

ID=87014476

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310665164.5A Active CN116402237B (zh) 2023-06-07 2023-06-07 客流预测方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN116402237B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012196987A (ja) * 2011-03-18 2012-10-18 Hitachi Ltd 旅客流動予測装置
CN112001548A (zh) * 2020-08-25 2020-11-27 北京交通大学 一种基于深度学习的od客流预测方法
CN114462520A (zh) * 2022-01-25 2022-05-10 北京工业大学 一种基于流量分类的网络入侵检测方法
CN115034496A (zh) * 2022-06-27 2022-09-09 北京交通大学 基于GCN-Transformer的城市轨道交通节假日短时客流预测方法
CN116128122A (zh) * 2023-01-03 2023-05-16 北京交通大学 一种考虑突发因素的城市轨道交通短时客流预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012196987A (ja) * 2011-03-18 2012-10-18 Hitachi Ltd 旅客流動予測装置
CN112001548A (zh) * 2020-08-25 2020-11-27 北京交通大学 一种基于深度学习的od客流预测方法
CN114462520A (zh) * 2022-01-25 2022-05-10 北京工业大学 一种基于流量分类的网络入侵检测方法
CN115034496A (zh) * 2022-06-27 2022-09-09 北京交通大学 基于GCN-Transformer的城市轨道交通节假日短时客流预测方法
CN116128122A (zh) * 2023-01-03 2023-05-16 北京交通大学 一种考虑突发因素的城市轨道交通短时客流预测方法

Also Published As

Publication number Publication date
CN116402237B (zh) 2023-09-01

Similar Documents

Publication Publication Date Title
CN111192292B (zh) 基于注意力机制与孪生网络的目标跟踪方法及相关设备
Song et al. Rethinking performance gains in image dehazing networks
Wu et al. Learned block-based hybrid image compression
CN111192211B (zh) 一种基于单个深度神经网络的多噪声类型盲去噪方法
CN111008938A (zh) 一种基于内容和连续性引导的实时多帧比特增强方法
CN116030537B (zh) 基于多分支注意力图卷积的三维人体姿态估计方法
CN103826125A (zh) 用于已压缩监控视频的浓缩分析方法和装置
CN113591674A (zh) 一种面向实时视频流的边缘环境行为识别系统
Mei et al. Greenbiqa: A lightweight blind image quality assessment method
CN117093830A (zh) 一种考虑局部与全局的用户负荷数据修复方法
CN116402237B (zh) 客流预测方法、装置、电子设备及介质
Zhou et al. Efficient Lightweight Image Denoising with Triple Attention Transformer
CN111260706B (zh) 一种基于单目相机的稠密深度图计算方法
CN117454119A (zh) 基于动态多图和多维注意力时空神经网络的城市轨道客流预测方法
CN117351234A (zh) 基于时空域和包围盒信息的三维运动目标追踪方法和装置
CN116843774A (zh) 点云数据压缩方法、装置、设备及存储介质
CN117746172A (zh) 基于域差异感知蒸馏的异构模型聚合方法及系统
CN104680174B (zh) 面向网格动画渐进传输的帧聚类方法
CN114663315A (zh) 基于语义融合生成对抗网络的图像比特增强方法及装置
CN117474956B (zh) 基于运动估计注意力的光场重建模型训练方法及相关设备
CN118333105B (zh) 数据处理方法、装置、设备及可读存储介质
CN112632208B (zh) 一种交通流轨迹变形方法及装置
CN116645566B (zh) 基于全加法脉冲式Transformer的分类方法
CN115204522B (zh) 区域发电功率预测方法、装置、设备及存储介质
Beibei et al. Spatial-temporal wavelet analysis video prediction based on differential attention mechanism

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant