CN116402237A - 客流预测方法、装置、电子设备及介质 - Google Patents
客流预测方法、装置、电子设备及介质 Download PDFInfo
- Publication number
- CN116402237A CN116402237A CN202310665164.5A CN202310665164A CN116402237A CN 116402237 A CN116402237 A CN 116402237A CN 202310665164 A CN202310665164 A CN 202310665164A CN 116402237 A CN116402237 A CN 116402237A
- Authority
- CN
- China
- Prior art keywords
- result
- module
- prediction
- obtaining
- attention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 239000011159 matrix material Substances 0.000 claims abstract description 91
- 239000013598 vector Substances 0.000 claims abstract description 81
- 238000004220 aggregation Methods 0.000 claims description 88
- 230000002776 aggregation Effects 0.000 claims description 87
- 238000000605 extraction Methods 0.000 claims description 36
- 230000017105 transposition Effects 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 10
- 238000007634 remodeling Methods 0.000 claims description 8
- 230000009977 dual effect Effects 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 16
- 125000003275 alpha amino acid group Chemical group 0.000 description 7
- 150000001875 compounds Chemical class 0.000 description 7
- 238000013135 deep learning Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001125 extrusion Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种客流预测方法、装置、电子设备及介质,涉及客流预测领域,该方法包括:分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取短时OD预测模型中进站流向量预测模块输出的第二预测结果;输入第一预测结果以及第二预测结果至短时OD预测模型的第一加权模块,获取第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;OD矩阵数据是根据当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的。本发明能够解决现有OD预测方法难以高效捕捉长距离时空依赖关系的问题,提升预测精度。
Description
技术领域
本发明涉及客流预测领域,尤其涉及一种客流预测方法、装置、电子设备及介质。
背景技术
任何一个站点的客流变化不仅与其历史客流分布有关,而且还与其他站点相互依赖,从而使得(Origin-Destination,OD)源点至终点流数据具有复杂的时空依赖性,目前算法难以捕捉OD数据中的长距离时空依赖关系。
发明内容
本发明提供一种客流预测方法、装置、电子设备及介质,用以解决现有技术中客流的预测精度较低的技术缺陷,提供了一种利用短时OD预测模型提高预测精度的技术方案。
第一方面,本发明提供了一种客流预测方法,包括:
分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果;
输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;
所述OD矩阵数据是根据所述当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;
所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
根据本发明提供的客流预测方法,所述获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,包括:
输入所述OD矩阵数据至所述OD矩阵预测模块的第一二维卷积层,获取所述第一二维卷积层输出的第一低阶特征;
输入所述第一低阶特征至密集模块,获取所述密集模块输出的第一分结果,输入所述第一分结果至自注意力密集模块,获取所述自注意力密集模块输出的第二分结果;
再次输入所述第二分结果至所述密集模块,获取所述密集模块输出的第三分结果,再次输入所述第三分结果至所述自注意力密集模块,获取所述自注意力密集模块输出的第四分结果;
输入所述第四分结果至所述OD矩阵预测模块的第二二维卷积层,获取所述第二二维卷积层输出的第一预测结果。
根据本发明提供的客流预测方法,所述获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果,包括:
输入所述进站流向量数据至所述进站流向量预测模块中的一维卷积层,获取所述一维卷积层输出的第二低阶特征;
输入所述第二低阶特征至所述进站流向量预测模块中的维度扩充层,获取所述维度扩充层输出的维度扩充特征;
输入所述维度扩充特征至所述进站流向量预测模块中的第三二维卷积层,获取所述第三二维卷积层输出的第三低阶特征;
输入所述第三低阶特征至密集模块,获取所述密集模块输出的第五分结果,输入所述第五分结果至自注意力密集模块,获取所述自注意力密集模块输出的第六分结果;
再次输入所述第六分结果至所述密集模块,获取所述密集模块输出的第七分结果,再次输入所述第七分结果至所述自注意力密集模块,获取所述自注意力密集模块输出的第八分结果;
输入所述第八分结果至所述进站流向量预测模块中的第四二维卷积层,获取所述第四二维卷积层输出的第二预测结果。
根据本发明提供的客流预测方法,所述自注意力密集模块包括注意力图生成网络模块和非局部特征聚合网络模块;
所述输入所述第一分结果至自注意力密集模块,获取所述自注意力密集模块输出的第二分结果,包括:
分别输入所述第一分结果至所述自注意力密集模块的注意力图生成网络模块,获取所述注意力图生成网络模块输出的第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度;
根据第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度,获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果;
输入所述第一分结果至所述非局部特征聚合网络模块的第五二维卷积层,获取所述第五二维卷积层输出的特征提取结果;
输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果,输入所述特征提取结果至所述非局部特征聚合网络模块的垂直方向子网络模块,获取所述垂直方向子网络模块输出的垂直方向非局部时空聚合结果,输入所述特征提取结果至所述非局部特征聚合网络模块的通道方向子网络模块,获取所述通道方向子网络模块输出的通道方向非局部时空聚合结果;
输入所述水平方向非局部时空聚合结果、所述垂直方向非局部时空聚合结果以及所述通道方向子网络模块输出的通道方向非局部时空聚合结果至所述非局部特征聚合网络模块的第二加权模块,获取所述第二加权模块输出的所述第二分结果。
根据本发明提供的客流预测方法,所述获取所述注意力图生成网络模块输出的第一垂直方向和第一水平方向上任意两个平面之间的相关度,包括:
输入所述第一分结果至所述注意力图生成网络模块的第六二维卷积层,获取所述第六二维卷积层输出的卷积结果;
基于预设维度方向处理所述卷积结果,获取处理结果;
根据对偶矩阵乘法处理所述处理结果,获取第一垂直方向和第一水平方向上任意两个平面之间的相关度。
根据本发明提供的客流预测方法,所述根据第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度,获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果,包括:
根据第一垂直方向的相关度以及第二垂直方向的相关度确定所述垂直方向上注意力结果;
根据第一水平方向的相关度以及第二水平方向的相关度确定所述垂直方向上注意力结果;
根据第一通道方向的相关度以及第二通道方向的相关度确定所述垂直方向上注意力结果。
根据本发明提供的客流预测方法,所述输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果,包括:
输入所述特征提取结果至所述水平方向子网络模块的第一转置层,获取所述第一转置层输出的第一转置结果;
输入所述第一转置结果至所述水平方向子网络模块的第一重塑层,获取所述第一重塑层输出的第一重塑结果;
根据所述第一重塑结果以及所述水平方向上注意力结果,确定水平方向聚合结果;
输入所述水平方向聚合结果至所述水平方向子网络模块的第二重塑层,获取所述第二重塑层输出的第二重塑结果;
输入所述第二重塑结果至所述水平方向子网络模块的第二转置层,获取所述第二转置层输出的水平方向非局部时空聚合结果。
第二方面,本发明提供了一种客流预测装置,包括:
第一获取单元:用于分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果;
第二获取单元:用于输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;
所述OD矩阵数据是根据所述当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;
所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的客流预测方法。
第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述客流预测方法。
本发明提供了一种客流预测方法、装置、电子设备及介质,根据当前日期之前的所有历史日期中,每一历史日期在当前时段之前的所有历史时段所对应的客流数据确定OD矩阵数据,根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定进站流向量数据,输入OD矩阵数据及进站流向量数据至短时OD预测模型,获取第一预测结果及第二预测结果,再根据第一预测结果及第二预测结果获取当前时段之后的预设时段内的客流预测结果,本发明能够解决现有OD预测方法难以高效捕捉长距离时空依赖关系的问题,进一步提升预测精度和训练效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的客流预测方法的流程示意图;
图2是本发明提供的获取第一预测结果的流程示意图;
图3是本发明提供的获取第二预测结果的流程示意图;
图4是本发明提供的获取第二分结果的流程示意图;
图5是本发明提供的获取垂直方向和水平方向上任意两个平面之间的相关度的流程示意图;
图6是本发明提供的获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果的流程示意图;
图7是本发明提供的获取水平方向非局部时空聚合结果的流程示意图;
图8是本发明提供的短时OD预测时间关系示意图;
图9是本发明提供的并行时空自注意力网络总体架构示意图;
图10是本发明提供的时空自注意力模块总体结构示意图;
图11是本发明提供的注意力图生成网络结构示意图;
图12是本发明提供的非局部特征聚合网络结构示意图;
图13是本发明提供的客流预测装置的结构示意图;
图14是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
轨道交通由于其速度快、安全性高、准点率高、运量大等优点,已成为重要交通工具之一,在城市轨道交通运营中,短时OD预测非常重要。一方面,短时OD预测结果可以缓解城市轨道交通高峰时段的局部拥堵,提高城市轨道交通系统的运行效率;另一方面,短时OD预测可以为乘客提供准确的预测信息,便于乘客提前做好出行安排,进一步提升出行体验。
然而,城市轨道交通短时OD预测存在以下三个方面的挑战:
(1)数据可用性:对于城市轨道交通来说,乘客在进站和出站时都需要刷卡,且刷卡信息可以实时记录,因此可以实时获取乘客的进站和出站信息。由于乘客从进站到出站的旅行时间不同,因此每个乘客进站和出站之间都存在不同的时间延迟,由于获取城市轨道交通OD流需要每个乘客完整的进出刷卡信息,因此无法实时获得完整的OD流量信息;
(2)数据维数:OD数据通常以OD矩阵的形式表示,对于n个车站,OD矩阵的维数为n*n,可以看出,OD矩阵的数据量相比车站数量有明显的增加;
(3)复杂的时空依赖性:任何一个站点的客流变化不仅与其历史客流分布有关,而且还与其他站点相互依赖,从而使得OD流数据具有复杂的时空依赖性。上述挑战对OD预测精度的进一步提高造成了很大的障碍。
现有短时OD预测方法可分为三类:传统方法、机器学习方法和深度学习方法。其中,传统方法包括加权历史平均自适应模型、最小二乘法和概率分析模型等。机器学习方法包括基于主成分分析和奇异值分解的方法等。然而,传统方法和机器学习方法主要存在三个方面的问题,分别是对于大规模线网数据难以实时处理、复杂的时空非局部依赖关系难以有效捕获以及预测精度有待进一步提高。现有深度学习方法主要通过卷积神经网络和通道注意力模型来实现OD矩阵的预测,但是目前仍然难以高效捕捉OD数据中的长距离时空依赖关系。综上所述,目前深度学习方法相比传统方法和机器学习方法在实时性和预测精度上有了较为明显的提升,然而依然难以高效捕捉OD数据中的长距离时空依赖关系。因此,如何通过高效捕捉OD数据中长距离时空依赖关系来进一步提升OD预测精度是一个关键问题。
本发明为了解决上述技术问题,提供了一种客流预测方法、装置、电子设备及介质,图1是本发明提供的客流预测方法的流程示意图,提供了一种客流预测方法,包括:
步骤101、分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果;
步骤102、输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;
所述OD矩阵数据是根据所述当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;
所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
在步骤101中,根据所述当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定所述OD矩阵数据,所述OD矩阵数据为前几天已完成的OD矩阵,根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定所述进站流向量数据,所述进站流向量数据为当天已进站的进站流向量,本发明主要利用当天已进站的进站流向量和前几天已完成的OD矩阵来预测未来预设时间间隔的OD矩阵,确定OD短时客流。
假设给定数据的时间粒度为,在实际运营管理过程中,获取进站流数据之后不是实时的数据,而是会存在固定延迟/>,而假设需要预测的,当前时段之后的预设时段与当前时段之间的区间称为预测区间/>,则短时OD预测的时间关系如图8所示。
此时,短时OD预测可表示为:
在式(1)中,代表在第/>天的第/>个时间间隔的OD预测矩阵,其中,/>;/>代表第/>天的第/>个时间间隔的进站流向量,其中/>。在本发明中,/>代表并行时空自注意力网络的非线性映射,本发明为了表达简洁,在后面阐述过程中,将/>,/>和将分别用/>,/>和/>进行表示,在此不予赘述。
可选地,所述短时OD预测模型为并行时空自注意力网络,所述并行时空自注意力网络主要包含两种子网络,一种是以OD矩阵为输入的包含时空自注意力模块的深度学习网络,即OD矩阵预测模块;另一种是以进站流向量为输入的包含时空自注意力模块的深度学习网络,即进站流向量预测模块,本发明将OD矩阵和进站流向量输入并行时空自注意力网络,实现精确的OD矩阵预测。
可选地,所述时空自注意力模块是基于不同时间段的OD矩阵之间存在的复杂时空关系,并根据自注意力机制所构建的,本发明首先获取OD流数据集,并将所述OD流数据集转化成OD矩阵数据以及进站流向量数据,输入所述OD矩阵数据以及进站流向量数据至短时OD预测模型,基于OD矩阵预测模块处理所述OD矩阵数据,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,基于所述进站流向量预测模块处理所述进站流向量数据,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果。
在步骤102中,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果,可以参考如下公式:
其中,式(2)中,和/>是预设权重值,可以在训练过程中进行自适应调整,以使/>更接近真实OD数据分布,/>为所述第一预测结果,/>为所述第二预测结果,本发明通过对/>和/>执行加权和操作得到最终的OD预测矩阵/>,并根据所述OD预测矩阵确定当前时段之后的预设时段内的客流预测结果。
图9是本发明提供的并行时空自注意力网络总体架构示意图,本发明通过获取OD流数据集,并将OD流信息转化成OD矩阵和进站流向量的形式,基于不同时间段的OD矩阵之间存在的复杂时空关系,根据自注意力机制,设计时空自注意力模块(Spatio-TemporalSelf-attention Module,STSM),在确定出时空自注意力模块后,设计并行时空自注意力网络(Parallel Spatio-Temporal Self-attention Network,PSTSN),如图9所示,所述并行时空自注意力网络主要包含两种子网络,一种是以OD矩阵为输入的包含时空自注意力模块的深度学习网络,另一种是以进站流向量为输入的包含时空自注意力模块的深度学习网络;以使得在将OD矩阵和进站流向量输入并行时空自注意力网络后,能够实现OD矩阵预测。通过本发明提供的时空自注意力模块,基于自注意力机制的城市轨道交通进行短时OD预测,解决了现有OD预测方法难以高效捕捉长距离时空依赖关系的问题,进一步提升预测精度和训练效率。
本发明提供了一种客流预测方法、装置、电子设备及介质,根据当前日期之前的所有历史日期中,每一历史日期在当前时段之前的所有历史时段所对应的客流数据确定OD矩阵数据,根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定进站流向量数据,输入OD矩阵数据及进站流向量数据至短时OD预测模型,获取第一预测结果及第二预测结果,再根据第一预测结果及第二预测结果获取当前时段之后的预设时段内的客流预测结果,本发明能够解决现有OD预测方法难以高效捕捉长距离时空依赖关系的问题,进一步提升预测精度和训练效率。
图2是本发明提供的获取第一预测结果的流程示意图,所述获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,包括:
步骤201、输入所述OD矩阵数据至所述OD矩阵预测模块的第一二维卷积层,获取所述第一二维卷积层输出的第一低阶特征;
步骤202、输入所述第一低阶特征至密集模块,获取所述密集模块输出的第一分结果,输入所述第一分结果至自注意力密集模块,获取所述自注意力密集模块输出的第二分结果;
步骤203、再次输入所述第二分结果至所述密集模块,获取所述密集模块输出的第三分结果,再次输入所述第三分结果至所述自注意力密集模块,获取所述自注意力密集模块输出的第四分结果;
步骤204、输入所述第四分结果至所述OD矩阵预测模块的第二二维卷积层,获取所述第二二维卷积层输出的第一预测结果。
在步骤201中,结合图9,本发明中的OD矩阵预测模块,以为输入,并以/>为输出,其中/>为使用的时间间隔数量,/>为车站数量,具体来说,输入所述OD矩阵数据至所述OD矩阵预测模块的第一二维卷积层,获取所述第一二维卷积层输出的第一低阶特征/>。
在步骤202中,依次使用密集模块(Dense Block)和自注意力密集模块(Self-attention Dense Block),输入所述第一低阶特征至密集模块,获取所述密集模块输出的第一分结果,输入所述第一分结果/>至自注意力密集模块,获取所述自注意力密集模块输出的第二分结果/>。
在步骤203中,为了得到更高阶的非局部特征信息,再次使用密集模块(DenseBlock)和自注意力密集模块(Self-attention Dense Block),再次输入所述第二分结果至所述密集模块,获取所述密集模块输出的第三分结果/>,再次输入所述第三分结果/>至所述自注意力密集模块,获取所述自注意力密集模块输出的第四分结果/>。
图3是本发明提供的获取第二预测结果的流程示意图,所述获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果,包括:
步骤301、输入所述进站流向量数据至所述进站流向量预测模块中的一维卷积层,获取所述一维卷积层输出的第二低阶特征;
步骤302、输入所述第二低阶特征至所述进站流向量预测模块中的维度扩充层,获取所述维度扩充层输出的维度扩充特征;
步骤303、输入所述维度扩充特征至所述进站流向量预测模块中的第三二维卷积层,获取所述第三二维卷积层输出的第三低阶特征;
步骤304、输入所述第三低阶特征至密集模块,获取所述密集模块输出的第五分结果,输入所述第五分结果至自注意力密集模块,获取所述自注意力密集模块输出的第六分结果;
步骤305、再次输入所述第六分结果至所述密集模块,获取所述密集模块输出的第七分结果,再次输入所述第七分结果至所述自注意力密集模块,获取所述自注意力密集模块输出的第八分结果;
步骤306、输入所述第八分结果至所述进站流向量预测模块中的第四二维卷积层,获取所述第四二维卷积层输出的第二预测结果。
在步骤301中,结合图9,所述进站流向量预测模块以为输入,以为输出,在所述进站流向量预测模块中,首先将所述进站流向量数据/>输入到所述一维卷积层中,得到所述一维卷积层输出的第二低阶特征/>,通过利用一维卷积强大的特征提取能力在时间维度上进行/>次卷积,生成OD数据的分布形式。
在步骤303中,输入所述维度扩充特征至所述进站流向量预测模块中的第三二维卷积层,获取所述第三二维卷积层输出的第三低阶特征/>,本发明采取步骤201中,基于OD矩阵预测模块相类似的处理步骤,使用第三二维卷积层提取低阶特征,生成第三低阶特征/>。
图4是本发明提供的获取第二分结果的流程示意图,所述自注意力密集模块包括注意力图生成网络模块和非局部特征聚合网络模块;
所述输入所述第一分结果至自注意力密集模块,获取所述自注意力密集模块输出的第二分结果,包括:
步骤401、分别输入所述第一分结果至所述自注意力密集模块的注意力图生成网络模块,获取所述注意力图生成网络模块输出的第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度;
步骤402、根据第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度,获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果;
步骤403、输入所述第一分结果至所述非局部特征聚合网络模块的第五二维卷积层,获取所述第五二维卷积层输出的特征提取结果;
步骤404、输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果,输入所述特征提取结果至所述非局部特征聚合网络模块的垂直方向子网络模块,获取所述垂直方向子网络模块输出的垂直方向非局部时空聚合结果,输入所述特征提取结果至所述非局部特征聚合网络模块的通道方向子网络模块,获取所述通道方向子网络模块输出的通道方向非局部时空聚合结果;
步骤405、输入所述水平方向非局部时空聚合结果、所述垂直方向非局部时空聚合结果以及所述通道方向子网络模块输出的通道方向非局部时空聚合结果至所述非局部特征聚合网络模块的第二加权模块,获取所述第二加权模块输出的所述第二分结果。
可选地,所述自注意力密集模块包括注意力图生成网络模块和非局部特征聚合网络模块,所述自注意力密集模块通过利用自注意力机制来高效聚合非局部时空上下文信息,进而提高训练效率和预测精度。所述自注意力密集模块由注意力图生成网络(Attention Map Generation Network)和非局部特征聚合网络(Non-Local FeatureAggregation Network)组成。
可选地,图4中的技术方案是以第一分结果作为输入,以第二分结果作为输出进行描述的,事实上,图4所记载的技术方案还可以适用于输入所述第三分结果至所述自注意力密集模块,获取所述自注意力密集模块输出的第四分结果;输入所述第五分结果至自注意力密集模块,获取所述自注意力密集模块输出的第六分结果;输入所述第七分结果至所述自注意力密集模块,获取所述自注意力密集模块输出的第八分结果,在此不予赘述。
在步骤401中,分别输入所述第一分结果至所述自注意力密集模块的注意力图生成网络模块,获取所述注意力图生成网络模块输出的第一垂直方向和第一水平方向上任意两个平面之间的相关度/>和/>、第二水平方向和第一通道方向上任意两个平面之间的相关度/>和/>以及第二通道方向和第二垂直方向上任意两个平面之间的相关度/>和/>,图11是本发明提供的注意力图生成网络结构示意图,在注意力图生成网络中,有三个平行的子网络,分别设为Network-4-1、Network-4-2和Network-4-3,根据三个平行的子网络生成三个不同方向上的注意力图。
在步骤402中,根据第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度,获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果,从以上三个平行的子网络可以看出,在水平方向、垂直方向和通道方向上,每个方向都生成了两个注意图,为了使最终的注意力图表现更准确,对相同方向上的注意力地图进行加权和计算,生成水平方向上注意力结果、垂直方向上注意力结果/>和通道方向上注意力结果/>。
在步骤403中,输入所述第一分结果至所述非局部特征聚合网络模块的第五二维卷积层,获取所述第五二维卷积层输出的特征提取结果,本发明首先将水平方向上注意力结果、垂直方向上注意力结果/>和通道方向上注意力结果/>输入到第五二维卷积层,进行初步特征提取,得到特征提取结果/>。
在步骤404中,输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果,输入所述特征提取结果至所述非局部特征聚合网络模块的垂直方向子网络模块,获取所述垂直方向子网络模块输出的垂直方向非局部时空聚合结果,输入所述特征提取结果至所述非局部特征聚合网络模块的通道方向子网络模块,获取所述通道方向子网络模块输出的通道方向非局部时空聚合结果,所述非局部特征聚合网络模块通过使用生成的水平方向上注意力结果、垂直方向上注意力结果/>和通道方向上注意力结果/>,可以有效聚合非局部时空上下文信息,图12是本发明提供的非局部特征聚合网络结构示意图,所述非局部特征聚合网络通过并行的三个子网络来分别实现不同方向上的非局部特征信息的聚合,例如Network-5-1、Network-5-2和Network-5-3。
在步骤405中,输入所述水平方向非局部时空聚合结果、所述垂直方向非局部时空聚合结果/>以及所述通道方向子网络模块输出的通道方向非局部时空聚合结果/>至所述非局部特征聚合网络模块的第二加权模块,获取所述第二加权模块输出的所述第二分结果,本发明为了能够进一步聚合非局部特征信息,对/>、/>和/>进行加权求和操作,得到最终输出特征/>,可以参考如下公式:
图10是本发明提供的时空自注意力模块总体结构示意图,假设自注意力密集模块的输入和输出分别为和/>。首先,将/>输入注意力图生成网络模块,生成三个注意力图,分别是/>,/>和/>,其中/>、/>和/>分别包含沿着水平、垂直和通道方向的任何两个平面之间的相关性;然后,将生成的三个注意力图/>、/>和/>输入到非局部特征聚合网络模块,分别捕获水平、垂直和通道方向上的长距离依赖关系。
可选地,空间维度上的非局部特征信息可以用和/>来提取,时间维度上的非局部特征信息可以用/>来提取,由于/>、/>和/>的生成和时空非局部特征信息的聚合都不需要占用大量的GPU资源,因此体现出了时空自注意力模块在聚合复杂时空非局部上下文信息过程中的高效性。
图5是本发明提供的获取垂直方向和水平方向上任意两个平面之间的相关度的流程示意图,所述获取所述注意力图生成网络模块输出的第一垂直方向和第一水平方向上任意两个平面之间的相关度,包括:
步骤501、输入所述第一分结果至所述注意力图生成网络模块的第六二维卷积层,获取所述第六二维卷积层输出的卷积结果;
步骤502、基于预设维度方向处理所述卷积结果,获取处理结果;
步骤503、根据对偶矩阵乘法处理所述处理结果,获取第一垂直方向和第一水平方向上任意两个平面之间的相关度。
可选地,图5中获取所述注意力图生成网络模块输出的第一垂直方向和第一水平方向上任意两个平面之间的相关度的技术方案同样适用于第二水平方向和第一通道方向上任意两个平面之间的相关度的获取以及第二通道方向和第二垂直方向上任意两个平面之间的相关度的获取。
在步骤501中,在所述注意力图生成网络模块中,有三个平行的子网络生成三个不同方向上的注意图,对于Network-4-1,首先将所述第一分结果输入到所述注意力图生成网络模块的第六二维卷积层,获取所述第六二维卷积层输出的卷积结果。
可选地,对于Network-4-2和Network-4-3而言,其基本步骤相同,首先,输入所述第一分结果到两个并行的转置层中,分别在两个不同维度上进行转置运算,得到和/>,然后,对于Network-4-2,将/>分别输入一个二维卷积层、维度挤压层,并执行对偶矩阵乘法,得到/>和/>,其中/>和/>分别包含水平方向和通道方向上任意两个平面之间的相关性,同样,对于Network-4-3,通过以上相同步骤可以得到/>和/>,其中/>和/>分别包含通道方向和垂直方向上任意两个平面之间的相关性。
图6是本发明提供的获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果的流程示意图,所述根据第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度,获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果,包括:
步骤601、根据第一垂直方向的相关度以及第二垂直方向的相关度确定所述垂直方向上注意力结果;
步骤602、根据第一水平方向的相关度以及第二水平方向的相关度确定所述垂直方向上注意力结果;
步骤603、根据第一通道方向的相关度以及第二通道方向的相关度确定所述垂直方向上注意力结果。
在步骤601中,根据第一垂直方向的相关度以及第二垂直方向的相关度确定所述垂直方向上注意力结果,可以参考如下公式:
在步骤602中,根据第一水平方向的相关度以及第二水平方向的相关度确定所述垂直方向上注意力结果,可以参考如下公式:
在步骤603中,根据第一通道方向的相关度以及第二通道方向的相关度确定所述垂直方向上注意力结果,可以参考如下公式:
图7是本发明提供的获取水平方向非局部时空聚合结果的流程示意图,所述输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果,包括:
步骤701、输入所述特征提取结果至所述水平方向子网络模块的第一转置层,获取所述第一转置层输出的第一转置结果;
步骤702、输入所述第一转置结果至所述水平方向子网络模块的第一重塑层,获取所述第一重塑层输出的第一重塑结果;
步骤703、根据所述第一重塑结果以及所述水平方向上注意力结果,确定水平方向聚合结果;
步骤704、输入所述水平方向聚合结果至所述水平方向子网络模块的第二重塑层,获取所述第二重塑层输出的第二重塑结果;
步骤705、输入所述第二重塑结果至所述水平方向子网络模块的第二转置层,获取所述第二转置层输出的水平方向非局部时空聚合结果。
在步骤701中,所述输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果对应于Network-5-1,具体地,输入所述特征提取结果至所述水平方向子网络模块的第一转置层,获取所述第一转置层输出的第一转置结果。
在步骤703中,根据所述第一重塑结果以及所述水平方向上注意力结果,确定水平方向聚合结果,可以参考如下公式:
步骤705中,输入所述第二重塑结果至所述水平方向子网络模块的第二转置层,获取所述第二转置层输出的水平方向非局部时空聚合结果/>,本发明为了与特征提取结果的维度保持一致,通过维度重塑和转置操作对/>进行维度恢复,分别得到/>和/>。
可选地,图7示出了输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果,图7中的技术方案同样适用于输入所述特征提取结果至所述非局部特征聚合网络模块的垂直方向子网络模块,获取所述垂直方向子网络模块输出的垂直方向非局部时空聚合结果;输入所述特征提取结果至所述非局部特征聚合网络模块的通道方向子网络模块,获取所述通道方向子网络模块输出的通道方向非局部时空聚合结果。
可选地,对于输入所述特征提取结果至所述非局部特征聚合网络模块的垂直方向子网络模块,获取所述垂直方向子网络模块输出的垂直方向非局部时空聚合结果而言,本发明采用Network-5-2,所述Network-5-2与Network-5-1在网络结构上基本相同,首先将特征提取结果通过转置和维度重塑操作依次生成/>和/>,然后,将和/>进行矩阵相乘,得到/>,可以看出,/>中的每个元素是输入特征在垂直方向上非局部特征聚合的结果,最后,通过维度重塑和转置操作对/>进行维度恢复,分别得到/>和/>。
可选地,对于输入所述特征提取结果至所述非局部特征聚合网络模块的通道方向子网络模块,获取所述通道方向子网络模块输出的通道方向非局部时空聚合结果而言,本发明采用Network-5-3,具体地,特征提取结果首先通过维度重塑操作,生成,然后,将/>和/>进行矩阵相乘,得到/>。可以看出,/>中的每个元素是输入特征在通道方向上非局部特征聚合的结果,最后,通过维度重塑操作对/>进行维度恢复,得到/>。
图13是本发明提供的客流预测装置的结构示意图,本发明提供了一种客流预测装置,包括第一获取单元1:用于分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果,所述第一获取单元1的工作原理可以参考前述步骤101,在此不予赘述。
所述客流预测装置还包括第二获取单元2:用于输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果,所述第二获取单元2的工作原理可以参考前述步骤102,在此不予赘述。
所述OD矩阵数据是根据所述当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;
所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
本发明提供了一种客流预测方法、装置、电子设备及介质,根据当前日期之前的所有历史日期中,每一历史日期在当前时段之前的所有历史时段所对应的客流数据确定OD矩阵数据,根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定进站流向量数据,输入OD矩阵数据及进站流向量数据至短时OD预测模型,获取第一预测结果及第二预测结果,再根据第一预测结果及第二预测结果获取当前时段之后的预设时段内的客流预测结果,本发明能够解决现有OD预测方法难以高效捕捉长距离时空依赖关系的问题,进一步提升预测精度和训练效率。
图14是本发明提供的电子设备的结构示意图。如图14所示,该电子设备可以包括:处理器(processor)110、通信接口(Communications Interface)120、存储器(memory)130和通信总线140,其中,处理器110,通信接口120,存储器130通过通信总线140完成相互间的通信。处理器110可以调用存储器130中的逻辑指令,以执行客流预测方法,该方法包括:分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果;输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;所述OD矩阵数据是根据所述当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
此外,上述的存储器130中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的一种客流预测方法,该方法包括:分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果;输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;所述OD矩阵数据是根据所述当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的客流预测方法,该方法包括:分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果;输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;所述OD矩阵数据是根据所述当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种客流预测方法,其特征在于,包括:
分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果;
输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;
所述OD矩阵数据是根据当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;
所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
2.根据权利要求1所述的客流预测方法,其特征在于,所述获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,包括:
输入所述OD矩阵数据至所述OD矩阵预测模块的第一二维卷积层,获取所述第一二维卷积层输出的第一低阶特征;
输入所述第一低阶特征至密集模块,获取所述密集模块输出的第一分结果,输入所述第一分结果至自注意力密集模块,获取所述自注意力密集模块输出的第二分结果;
再次输入所述第二分结果至所述密集模块,获取所述密集模块输出的第三分结果,再次输入所述第三分结果至所述自注意力密集模块,获取所述自注意力密集模块输出的第四分结果;
输入所述第四分结果至所述OD矩阵预测模块的第二二维卷积层,获取所述第二二维卷积层输出的第一预测结果。
3.根据权利要求2所述的客流预测方法,其特征在于,所述获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果,包括:
输入所述进站流向量数据至所述进站流向量预测模块中的一维卷积层,获取所述一维卷积层输出的第二低阶特征;
输入所述第二低阶特征至所述进站流向量预测模块中的维度扩充层,获取所述维度扩充层输出的维度扩充特征;
输入所述维度扩充特征至所述进站流向量预测模块中的第三二维卷积层,获取所述第三二维卷积层输出的第三低阶特征;
输入所述第三低阶特征至密集模块,获取所述密集模块输出的第五分结果,输入所述第五分结果至自注意力密集模块,获取所述自注意力密集模块输出的第六分结果;
再次输入所述第六分结果至所述密集模块,获取所述密集模块输出的第七分结果,再次输入所述第七分结果至所述自注意力密集模块,获取所述自注意力密集模块输出的第八分结果;
输入所述第八分结果至所述进站流向量预测模块中的第四二维卷积层,获取所述第四二维卷积层输出的第二预测结果。
4.根据权利要求2或3所述的客流预测方法,其特征在于,所述自注意力密集模块包括注意力图生成网络模块和非局部特征聚合网络模块;
所述输入所述第一分结果至自注意力密集模块,获取所述自注意力密集模块输出的第二分结果,包括:
分别输入所述第一分结果至所述自注意力密集模块的注意力图生成网络模块,获取所述注意力图生成网络模块输出的第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度;
根据第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度,获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果;
输入所述第一分结果至所述非局部特征聚合网络模块的第五二维卷积层,获取所述第五二维卷积层输出的特征提取结果;
输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果,输入所述特征提取结果至所述非局部特征聚合网络模块的垂直方向子网络模块,获取所述垂直方向子网络模块输出的垂直方向非局部时空聚合结果,输入所述特征提取结果至所述非局部特征聚合网络模块的通道方向子网络模块,获取所述通道方向子网络模块输出的通道方向非局部时空聚合结果;
输入所述水平方向非局部时空聚合结果、所述垂直方向非局部时空聚合结果以及所述通道方向子网络模块输出的通道方向非局部时空聚合结果至所述非局部特征聚合网络模块的第二加权模块,获取所述第二加权模块输出的所述第二分结果。
5.根据权利要求4所述的客流预测方法,其特征在于,所述获取所述注意力图生成网络模块输出的第一垂直方向和第一水平方向上任意两个平面之间的相关度,包括:
输入所述第一分结果至所述注意力图生成网络模块的第六二维卷积层,获取所述第六二维卷积层输出的卷积结果;
基于预设维度方向处理所述卷积结果,获取处理结果;
根据对偶矩阵乘法处理所述处理结果,获取第一垂直方向和第一水平方向上任意两个平面之间的相关度。
6.根据权利要求4所述的客流预测方法,其特征在于,所述根据第一垂直方向和第一水平方向上任意两个平面之间的相关度、第二水平方向和第一通道方向上任意两个平面之间的相关度以及第二通道方向和第二垂直方向上任意两个平面之间的相关度,获取垂直方向上注意力结果、水平方向上注意力结果以及通道方向上注意力结果,包括:
根据第一垂直方向的相关度以及第二垂直方向的相关度确定所述垂直方向上注意力结果;
根据第一水平方向的相关度以及第二水平方向的相关度确定所述垂直方向上注意力结果;
根据第一通道方向的相关度以及第二通道方向的相关度确定所述垂直方向上注意力结果。
7.根据权利要求4所述的客流预测方法,其特征在于,所述输入所述特征提取结果至所述非局部特征聚合网络模块的水平方向子网络模块,获取所述水平方向子网络模块输出的水平方向非局部时空聚合结果,包括:
输入所述特征提取结果至所述水平方向子网络模块的第一转置层,获取所述第一转置层输出的第一转置结果;
输入所述第一转置结果至所述水平方向子网络模块的第一重塑层,获取所述第一重塑层输出的第一重塑结果;
根据所述第一重塑结果以及所述水平方向上注意力结果,确定水平方向聚合结果;
输入所述水平方向聚合结果至所述水平方向子网络模块的第二重塑层,获取所述第二重塑层输出的第二重塑结果;
输入所述第二重塑结果至所述水平方向子网络模块的第二转置层,获取所述第二转置层输出的水平方向非局部时空聚合结果。
8.一种客流预测装置,其特征在于,包括:
第一获取单元:用于分别输入OD矩阵数据以及进站流向量数据至短时OD预测模型,获取所述短时OD预测模型中OD矩阵预测模块输出的第一预测结果,获取所述短时OD预测模型中进站流向量预测模块输出的第二预测结果;
第二获取单元:用于输入所述第一预测结果以及所述第二预测结果至所述短时OD预测模型的第一加权模块,获取所述第一加权模块输出的,当前时段之后的预设时段内的客流预测结果;
所述OD矩阵数据是根据当前日期之前的所有历史日期中,每一历史日期在所述当前时段之后的所述预设时段内所对应的客流数据确定的;
所述进站流向量数据是根据所述当前日期中,在所述当前时段之前的所有历史时段所对应的进站流向量确定的。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的客流预测方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的客流预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310665164.5A CN116402237B (zh) | 2023-06-07 | 2023-06-07 | 客流预测方法、装置、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310665164.5A CN116402237B (zh) | 2023-06-07 | 2023-06-07 | 客流预测方法、装置、电子设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116402237A true CN116402237A (zh) | 2023-07-07 |
CN116402237B CN116402237B (zh) | 2023-09-01 |
Family
ID=87014476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310665164.5A Active CN116402237B (zh) | 2023-06-07 | 2023-06-07 | 客流预测方法、装置、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116402237B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012196987A (ja) * | 2011-03-18 | 2012-10-18 | Hitachi Ltd | 旅客流動予測装置 |
CN112001548A (zh) * | 2020-08-25 | 2020-11-27 | 北京交通大学 | 一种基于深度学习的od客流预测方法 |
CN114462520A (zh) * | 2022-01-25 | 2022-05-10 | 北京工业大学 | 一种基于流量分类的网络入侵检测方法 |
CN115034496A (zh) * | 2022-06-27 | 2022-09-09 | 北京交通大学 | 基于GCN-Transformer的城市轨道交通节假日短时客流预测方法 |
CN116128122A (zh) * | 2023-01-03 | 2023-05-16 | 北京交通大学 | 一种考虑突发因素的城市轨道交通短时客流预测方法 |
-
2023
- 2023-06-07 CN CN202310665164.5A patent/CN116402237B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012196987A (ja) * | 2011-03-18 | 2012-10-18 | Hitachi Ltd | 旅客流動予測装置 |
CN112001548A (zh) * | 2020-08-25 | 2020-11-27 | 北京交通大学 | 一种基于深度学习的od客流预测方法 |
CN114462520A (zh) * | 2022-01-25 | 2022-05-10 | 北京工业大学 | 一种基于流量分类的网络入侵检测方法 |
CN115034496A (zh) * | 2022-06-27 | 2022-09-09 | 北京交通大学 | 基于GCN-Transformer的城市轨道交通节假日短时客流预测方法 |
CN116128122A (zh) * | 2023-01-03 | 2023-05-16 | 北京交通大学 | 一种考虑突发因素的城市轨道交通短时客流预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116402237B (zh) | 2023-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111192292B (zh) | 基于注意力机制与孪生网络的目标跟踪方法及相关设备 | |
Song et al. | Rethinking performance gains in image dehazing networks | |
Wu et al. | Learned block-based hybrid image compression | |
CN111192211B (zh) | 一种基于单个深度神经网络的多噪声类型盲去噪方法 | |
CN111008938A (zh) | 一种基于内容和连续性引导的实时多帧比特增强方法 | |
CN116030537B (zh) | 基于多分支注意力图卷积的三维人体姿态估计方法 | |
CN103826125A (zh) | 用于已压缩监控视频的浓缩分析方法和装置 | |
CN113591674A (zh) | 一种面向实时视频流的边缘环境行为识别系统 | |
Mei et al. | Greenbiqa: A lightweight blind image quality assessment method | |
CN117093830A (zh) | 一种考虑局部与全局的用户负荷数据修复方法 | |
CN116402237B (zh) | 客流预测方法、装置、电子设备及介质 | |
Zhou et al. | Efficient Lightweight Image Denoising with Triple Attention Transformer | |
CN111260706B (zh) | 一种基于单目相机的稠密深度图计算方法 | |
CN117454119A (zh) | 基于动态多图和多维注意力时空神经网络的城市轨道客流预测方法 | |
CN117351234A (zh) | 基于时空域和包围盒信息的三维运动目标追踪方法和装置 | |
CN116843774A (zh) | 点云数据压缩方法、装置、设备及存储介质 | |
CN117746172A (zh) | 基于域差异感知蒸馏的异构模型聚合方法及系统 | |
CN104680174B (zh) | 面向网格动画渐进传输的帧聚类方法 | |
CN114663315A (zh) | 基于语义融合生成对抗网络的图像比特增强方法及装置 | |
CN117474956B (zh) | 基于运动估计注意力的光场重建模型训练方法及相关设备 | |
CN118333105B (zh) | 数据处理方法、装置、设备及可读存储介质 | |
CN112632208B (zh) | 一种交通流轨迹变形方法及装置 | |
CN116645566B (zh) | 基于全加法脉冲式Transformer的分类方法 | |
CN115204522B (zh) | 区域发电功率预测方法、装置、设备及存储介质 | |
Beibei et al. | Spatial-temporal wavelet analysis video prediction based on differential attention mechanism |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |