CN116258253A - 一种基于贝叶斯神经网络的车辆od预测方法 - Google Patents
一种基于贝叶斯神经网络的车辆od预测方法 Download PDFInfo
- Publication number
- CN116258253A CN116258253A CN202310076207.6A CN202310076207A CN116258253A CN 116258253 A CN116258253 A CN 116258253A CN 202310076207 A CN202310076207 A CN 202310076207A CN 116258253 A CN116258253 A CN 116258253A
- Authority
- CN
- China
- Prior art keywords
- graph
- time
- bayesian
- network
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000013531 bayesian neural network Methods 0.000 title claims abstract description 38
- 238000009826 distribution Methods 0.000 claims abstract description 28
- 239000011159 matrix material Substances 0.000 claims abstract description 14
- 238000005096 rolling process Methods 0.000 claims abstract description 13
- 238000005070 sampling Methods 0.000 claims abstract description 8
- 230000003068 static effect Effects 0.000 claims abstract description 7
- 101100165323 Drosophila melanogaster bgcn gene Proteins 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 16
- 238000013398 bayesian method Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 230000007246 mechanism Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000003860 storage Methods 0.000 claims description 5
- 230000004931 aggregating effect Effects 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 3
- 238000005065 mining Methods 0.000 claims description 3
- 230000006978 adaptation Effects 0.000 claims 1
- 238000002474 experimental method Methods 0.000 abstract description 5
- 238000007430 reference method Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 11
- 238000013528 artificial neural network Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 5
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000013476 bayesian approach Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000013100 final test Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Marketing (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Chemical & Material Sciences (AREA)
- Evolutionary Computation (AREA)
- Analytical Chemistry (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于贝叶斯神经网络的车辆OD预测方法,包括如下步骤:对时间进行编码,构建不同时刻的时间编码表征不同的时间段信息;以时空多图卷积网络ST‑MGCN作为模型基础,将其中图结构从静态的邻接矩阵改为贝叶斯图嵌入,将时间编码作为输入送入线性映射的贝叶斯神经网络,将图嵌入输出为一个概率分布,通过每次从概率分布中采样得到对应的图嵌入,由此构建时空贝叶斯图卷积网络ST‑BGCN;通过时空贝叶斯图卷积网络ST‑BGCN来进行车辆OD预测。本发明使得OD预测结果能够展示出不同时间下地区间的联系,增强了预测结果的鲁棒性。实验证明,本发明的方法性能优于基准方法,同时能够给出不确定的方差。
Description
技术领域
本发明涉及智能交通领域,特别是涉及一种基于贝叶斯神经网络的车辆起点-终点(orient-destination,OD)预测方法。
背景技术
车辆OD预测指根据当前时段的起点-终点的订单数量,预测后一时段的订单情况。交通预测对城市交通有重要意义,车辆OD预测作为更为复杂的需求预测,更加强调了城市交通中人群出行的整体变化,这对研究道路交通情况和城市路网建设等具有重要意义。以出租车OD预测为例,出租车需求预测能够增加出租车营收,提高道路使用,缓解道路拥挤。
现有的车辆OD预测主要基于图卷积神经网络(graph convolution neuralnetwork,GCN)和一些时序预测的网络,例如循环神经网络(recurrent neural network,RNN)、长短时记忆网络(long-short term memory,LSTM)、门控循环单元(gated recurrentunit,GRU)等,共同构建时空联合网络进行预测。现有的方法一般首先使用GCN对交通图上周围节点的信息进行聚合和卷积,再将这些隐变量送入时序预测网络中预测未来的OD。其中GCN中用于卷积的图一般是静态图,不能很好的代表空间相关性随时间的变化。
如上所述,现有的出租车需求预测往往结合时空的相互关联进行建模。这些方法在空间上通常使用图卷积神经网络等来学习拓扑关系,然后在时间上使用时序预测的神经网络,如RNN、LSTM等,对未来的供需关系进行预测。其应用的空间信息往往基于固定的空间结构,如邻接矩阵、相似性矩阵等明确的图结构,对出租车需求进行预测。例如,有人采用了neighborhood、functional similarity、transportation connectivity三个先验图来表征图上的连接关系;有人使用了兴趣点(point of interest,POI)、天气等图的信息进行辅助工作。然而,这种方法往往丧失了对拓扑关系的不确定性和随时间变化性的描述。
需要说明的是,在上述背景技术部分公开的信息仅用于对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明的主要目的在于克服上述背景技术的缺陷,提供一种基于贝叶斯神经网络的车辆OD预测方法。
为实现上述目的,本发明采用以下技术方案:
一种基于贝叶斯神经网络的车辆OD预测方法,包括如下步骤:
对时间进行编码,构建不同时刻的时间编码表征不同的时间段信息;
以时空多图卷积网络ST-MGCN作为模型基础,将其中图结构从静态的邻接矩阵改为贝叶斯图嵌入(embedding),将时间编码作为输入送入线性映射的贝叶斯神经网络,将图嵌入输出为一个概率分布,通过每次从概率分布中采样得到对应的图嵌入,由此构建时空贝叶斯图卷积网络ST-BGCN;其中,基于贝叶斯神经网络构建随时间动态变化的图结构,使用贝叶斯方法将空间结构信息描述成与时间信息相关的概率分布,并且在过程中隐式地自适应学习和更新;
通过时空贝叶斯图卷积网络ST-BGCN来进行车辆OD预测,以使得OD预测结果能够展示出不同时间下地区间的联系。
进一步地,车辆OD预测问题简化为求解如下函数形式:
Xt=f(Xt-1,Xt-2,...Xt-T,O)
其中,Xt为t时刻下相应的OD需求,Xt-1,Xt-2,...Xt-T代表t时刻前的T个时间段下已知的OD情况,O代表其余的辅助数据,基于已知的信息预测未来的OD情况。
进一步地,先通过下文门控长短时记忆网络CG-LSTM,从原始特征中通过门控机制挖掘和挑选不同时刻下的特征信息;然后,将挖掘得到的相关信息作为贝叶斯图卷积网络BGCN的输入特征,送入BGCN做最后的预测。
进一步地,所述下文门控长短时记忆网络CG-LSTM模块加入了通道注意力的门控机制,给每个时刻引入了不同权重的注意力系数,其中,使用LSTM网络来学习和保存不同时段下的信息,由此,挖掘时间上的前后关联性,使得LSTM网络能保留更多有用的信息。
进一步地,OD预测使用的数据x1:T的形式为(batch_size(B),nodes(n),seq_len(T),features(F));首先聚合节点上的相关信息,得到每个节点的不同时刻下相关特征X1:T(B,N,T);使用图卷积部分学习数据在图上的关联性,图卷积中图的部分使用经过贝叶斯网络生成的图嵌入embedding;再与原始特征拼接的方式得到其在不同节点和时间上的注意力关系,其计算公式如下:
s1:T=σ(W2σ(W1z1:T))
其中,z1:T的数据格式为(B,T);
进一步地,贝叶斯图卷积网络BGCN中,通过一组时间编码来表示不同时刻,以日或者周进行编码反应其时间的循环性,并且使用一组线性的贝叶斯神经网络来构建上述时间编码以及图之间的关系,该关系表示成:
其中,T为根据时间段构建的one-hot编码,以周为例,编码为(7*24*d)的一维向量,d为单位小时内所设置数据的时间间隔个数,W和b分别代表需要学习的权重参数(7*24*d,N)和偏置参数N,。
进一步地,使用高斯分布描述先验分布;通过将上述one-hot编码的时间向量映射到节点个数N大小的图嵌入embedding向量,表征不同时间下各个节点得到的注意力强度,再使用图嵌入embedding的结果转置相乘得到节点间构成的图结构。
进一步地,贝叶斯图卷积网络BGCN中,保留部分原始先验的图结构以保持收敛过程后期的稳定性,形成最终图:
进一步地,将从CG-LSTM学习出的特征送入BGCN网络中,设定BGCN的input_size和output_size匹配LSTM中的hidden_dim和原始输入的Features,完成最终预测。
一种计算机可读存储介质,其存储有计算机程序,其特征在于,所述计算机程序由处理器执行时,实现所述的基于贝叶斯神经网络的车辆OD预测方法。
本发明具有如下有益效果:
本发明提出了一种基于贝叶斯神经网络的车辆OD预测方法,基于贝叶斯神经网络构建随时间变化的图结构,对时间进行编码再通过贝叶斯神经网络获取动态变化的图,使得OD预测结果能够展示出不同时间下地区间的联系,增强了预测结果的鲁棒性。通过使用贝叶斯方法将空间结构信息描述成与时间信息相关的概率分布,并且在过程中隐式地自适应学习和更新,实验证明,本发明的方法性能优于基准方法,同时能够给出不确定的方差。
附图说明
图1为本发明基于贝叶斯神经网络的车辆OD预测方法的流程图。
图2为本发明一种实施例的ST-BGCN结构示意图。
图3为本发明一种实施例的BGCN图构建方法示意图。
图4为本发明实施例与基准方法的RMSE指标和MAPE指标对比图。
具体实施方式
以下对本发明的实施方式做详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
参阅图1,本发明实施例提供一种基于贝叶斯神经网络的车辆OD预测方法,包括如下步骤:
对时间进行编码,构建不同时刻的时间编码表征不同的时间段信息;
以时空多图卷积网络ST-MGCN作为模型基础,将其中图结构从静态的邻接矩阵改为贝叶斯图嵌入,将时间编码作为输入送入线性映射的贝叶斯神经网络,将图嵌入输出为一个概率分布,通过每次从概率分布中采样得到对应的图嵌入,由此构建时空贝叶斯图卷积网络ST-BGCN;其中,基于贝叶斯神经网络构建随时间动态变化的图结构,使用贝叶斯方法将空间结构信息描述成与时间信息相关的概率分布,并且在过程中隐式地自适应学习和更新;
通过时空贝叶斯图卷积网络ST-BGCN来进行车辆OD预测,以使得OD预测结果能够展示出不同时间下地区间的联系。
贝叶斯方法认为事情之间的相互连接为一个概率分布,在假设先验分布的情况下,根据观测到的结果修正原本预期的分布,从而带给结果更强的置信性。结合贝叶斯方法中所带有的概率信息和不确定性的优点,贝叶斯神经网络特别适合应对变化情况剧烈的预测。本发明中,用一种全新的图嵌入方法来构建图卷积中所需要的邻接图结构。首先,构建不同时刻的时间编码表征不同的时间段信息,然后,把时间编码作为输入送入线性映射的贝叶斯神经网络,将embedding输出为一个概率分布,通过每次从概率分布中采样得到对应的图嵌入。为此,本发明采用了时空多图卷积网络(spatiotemporal multi-graphconvolution network,ST-MGCN)作为模型基础,将其中图结构从静态的邻接矩阵改为上述介绍的贝叶斯图嵌入。本发明将该网络结构称为时空贝叶斯图卷积网络(spatiotemporalBayesian graph convolution network,ST-BGCN)。
本发明实施例基于贝叶斯神经网络构建随时间变化的图结构,对时间进行编码再通过贝叶斯神经网络获取动态变化的图,使得OD预测结果能够展示出不同时间下地区间的联系,增强了预测结果的鲁棒性。通过使用贝叶斯方法将空间结构信息描述成与时间信息等相关的概率分布,并且在过程中隐式地自适应学习和更新,实验证明,本发明的方法性能优于基准方法,同时能够给出不确定的方差。
以下进一步描述本发明具体实施例。
问题描述
车辆OD预测问题一般可以简化为求解如下函数形式:
Xt=f(Xt-1,Xt-2,...Xt-T,O)
其中,Xt为t时刻下相应的OD需求(orient-destination),Xt-1,Xt-2,...Xt-T代表t时刻前的T个时间段下已知的OD情况,O代表其余的辅助数据,如天气、距离、突发事件等。基于上述已知的信息预测未来的OD情况。
OD预测网络
本发明提出的OD预测网络ST-BGCN主要分为两步。第一步是通过下文门控长短时记忆网络(contextual gated LSTM,CG-LSTM),从原始特征中通过门控机制挖掘和挑选不同时刻下的特征信息。第二步,将上述挖掘得到的相关信息作为BGCN的输入特征,送入BGCN做最后的预测。下面根据步骤分别对预测网络以及相关输入输出做详细说明。
CG-LSTM
CG-LSTM模块的主要特点是加入了通道注意力的门控机制,给每个时刻引入了不同权重的注意力系数,进一步的,本发明使用LSTM网络来学习和保存不同时段下的信息。这一步的主要作用是挖掘了时间上的前后关联性,使得LSTM能保留更多有用的信息。
基于OD预测的一般使用的数据情况,数据x1:的形式为(batch_size(B),nodes(n),seq_len(T),features(F))。首先聚合节点上的相关信息,得到每个节点的不同时刻下相关特征X1:(B,N,T)。使用图卷积部分学习数据在图上的关联性,图卷积中图的部分使用经过贝叶斯网络生成的embedding图,这一部分在BGCN部分进行详细介绍。再与原始特征拼接的方式得到其在不同节点和时间上的注意力关系。其计算公式如下:
s1:=σ(W2σ(W1z1:))
BGCN
图卷积的核心思想与一般的卷积神经网络类似,需要通过卷积核联系节点与其周围节点的关系,从而挖掘节点与节点的隐式关系。其公式一般表示为:
其中,代表了图的拉普拉斯矩阵,为N*N的矩阵,N为节点个数。Xl代表第l层的特征输入,Wl是第l层需要学习的参数。可以将/>进行正交分解为UTLU,因此可以得到Xl+1=σ(UTLUXlWl)。再根据谱图理论可以得到
Xl+1=σ(UTgθ(L)UXl)
需要求解的参数为卷积核gθ(L),考虑到需要求解L的特征值以及其高阶项的成本较高。根据切比雪夫多项式的分解方法将gθ(L)分解为切比雪夫多项式 为对应的切比雪夫多项式,/>其中I为单位矩阵。图卷积过程最后表示成
以上为切比雪夫多项式方法下的图卷积过程。由于原有方法中使用的图都是根据先验知识构建出的静态图,即为固定超参数,这样的方法不能很好地表征不同时刻下交通图节点之间的变化关系。因此,受相关对图注意力机制和图嵌入的启发,本发明增加使用图嵌入来表示不同输入下图的变化。
为此,本发明提出了BGCN,增加了两个部分来扩展图在不同时间上应用。
(1)增加一组时间编码来表示不同时刻,以日或者周进行编码反应其时间的循环性。并且使用一组线性的贝叶斯神经网络来构建上述时间编码以及图之间的关系。其中,它们的关系可以表示成:
其中,T为根据时间段构建的one-hot编码,以周为例,编码为(7*24*d)的一维向量,d为单位小时内所设置数据的时间间隔个数。W和b分别代表需要学习的权重参数(7*24*d,N)和偏置参数N,通常使用最常用的高斯分布去描述它们满足的先验分布。通过将上述one-hot编码的时间向量映射到节点个数N大小的embedding向量,表征不同时间下,各个节点得到的注意力强度。再使用embedding的结果转置相乘得到节点间构成的图结构。这样一方面减少了参数量,降低训练时间;另一方面能较好的符合在图卷积中所需矩阵的半正定性质。在最后的测试集的预测中,从学习到的W和b满足的分布中是采样得到相关的参数,通过上述计算过程得到最后不同的这样能够使得图的变化更为灵活,同时引入的贝叶斯方法还能给图的预测以一定的不确定性来表现不同时刻下图的随机性。
(2)保留大部分原始先验的图结构保持收敛过程后期的稳定性,形成最终图的公式为
其中,代表在最后图卷积中使用的图结构,大小与上述拉普拉斯矩阵一致。在实验中发现,单纯使用/>作为图卷积中使用的矩阵,能够一定程度上加快收敛过程,但最终学习到的结果相比上述方法学习出的结果性能有限。/>代表了原本的图结构,保留了大部分的固定的图结构能够使得结果更具有稳定性。
在具体使用过程中,将上述从CG-LSTM学习出的特征送入上述BGCN网络中,设定BGCN的input_size和output_size匹配LSTM中的hidden_dim和原始输入的Features,完成最终预测。
实例1
以纽约的出租车需求为例,数据集采用论文[4]中2015年纽约市全年的出租车OD需求。该数据集以半个小时为间隔,将整个曼哈顿地区的分为15*5的矩阵区域,统计每个区域内的OD需求情况。因为全年的数据量较大,选用前90天的数据作为训练集,其后30天以15天为间隔划分验证集和测试集,使用各个时间段的前5个时间段进行预测。以训练集为例,数据集结构为(90*24*2,75,5,75)。因为本发明立足于不同时刻的贝叶斯图结构进行预测,因此简单把batch_size设置为1。数据集中的元素按batch_size大小送入CG-LSTM,再使用BGCN网络学习经过门控网络后的特征,相关方法如第四节所示。其中,设置训练的epoch为500,以保证两种方法的结果都达到收敛。在最终的测试集中,采样100组权重参数的结果取平均得到最后的预测结果。
性能分析
在实验中,基准方法采用MSE进行监督学习。加入贝叶斯框架后的方法由于引入了对概率分布的估计和学习,因此需要计算其先验与后验的关系以及最终预测似然项的影响,因此loss加入了对权重均值和方差的监督。采用RMSE和MAPE来展示预测的效果。RMSE和MAPE的计算公式为:
Loss=MSE
Loss_bay=MSE+10-4(KL(q(w)/(w))
图2示出了本发明一种实施例的ST-BGCN结构。图3示出了本发明一种实施例的BGCN图构建方法示意图。图4示出了本发明实施例与基准方法的RMSE指标和MAPE指标对比。图4中展示了网络学习过程中预测结果中上述指标的变化。一方面,贝叶斯方法的加入使得网络能够更快的收敛,在设置early stop为100保证贝叶斯的方差能够收敛的情况下,贝叶斯方法在第205个epoch停止训练。从图中可以看出说明自适应的图嵌入结果能够一定程度合理表示图的结构变化,加速收敛过程。另一方面,可以看出在验证集上,相关指标的收敛过程有明显的波动。这正是权重采样结果下因为方差而产生的不确定性,这是原有固定图结构中所不存在的。在最后的测试中,贝叶斯方法ST-BMGCN下的RMSE和MAPE比ST-MGCN略高,这可能是在训练过程中使用重参数话方法采样的点相对较少导致整个收敛过程的方向存在一定的误差,但是MAE相比基准方法低,说明在真实数值上预测的结果更好一点,这说明预测结果是更加鲁棒的,结合剩下的指标是可以接受的。
表1测试集的验证结果
综上,本发明适于智能交通中起始点-终点的交通预测,在传统方法的基础上,本发明提出了一种高置信的贝叶斯神经网络来实现OD预测,经比较能够加快收敛速度,且基本不降低评价指标。本发明通过使用贝叶斯概率的方法赋予图神经网络中图结构以不确定性,使得预测结果更鲁棒。本发明通过时序特征来生成图,体现了空间与时间的密切关系。
本发明将贝叶斯方法引入到交通时序预测中,以往的贝叶斯方法预测往往与一维时序预测有关,往往其中没有空间上的信息,因此市场仍存在比较大的空白。贝叶斯方法在学习的过程中由于是在维护一个概率分布,因此其方差能够表征预测结果的置信度。本发明还能够加速OD预测的神经网络的收敛速度。
利用本发明进行交通OD情况的预测,可以给出租车行业或者提供车乘服务的相关企业以更加置信的预测结果,从而指导相应的交通调度和推荐。除了应用到出租车等司乘服务行业,也可以应用到地铁、公交等需求场景。前者可以降低空载率,提升司乘营收;后者可以增减高低峰的运行班次,以及后续公共交通的建设以及城市规划。本发明可以应用到滴滴出行、曹操出行等出租车服务行业,也可以应用到城市交通规划管理上。此外,还可以应用于共享单车等城市交通需求中的小方向,以及进一步预测航空、铁路等大型出行方式的需求变化。
本领域技术人员应理解,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明的背景部分可以包含关于本发明的问题或环境的背景信息,而不一定是描述现有技术。因此,在背景技术部分中包含的内容并不是申请人对现有技术的承认。
以上内容是结合具体/优选的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,其还可以对这些已描述的实施方式做出若干替代或变型,而这些替代或变型方式都应当视为属于本发明的保护范围。在本说明书的描述中,参考术语“一种实施例”、“一些实施例”、“优选实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。尽管已经详细描述了本发明的实施例及其优点,但应当理解,在不脱离专利申请的保护范围的情况下,可以在本文中进行各种改变、替换和变更。
Claims (10)
1.一种基于贝叶斯神经网络的车辆OD预测方法,其特征在于,包括如下步骤:
对时间进行编码,构建不同时刻的时间编码表征不同的时间段信息;
以时空多图卷积网络ST-MGCN作为模型基础,将其中图结构从静态的邻接矩阵改为贝叶斯图嵌入,将时间编码作为输入送入线性映射的贝叶斯神经网络,将图嵌入输出为一个概率分布,通过每次从概率分布中采样得到对应的图嵌入,由此构建时空贝叶斯图卷积网络ST-BGCN;其中,基于贝叶斯神经网络构建随时间动态变化的图结构,使用贝叶斯方法将空间结构信息描述成与时间信息相关的概率分布,并且在过程中隐式地自适应学习和更新;
通过时空贝叶斯图卷积网络ST-BGCN来进行车辆OD预测,以使得OD预测结果能够展示出不同时间下地区间的联系。
2.如权利要求1所述的基于贝叶斯神经网络的车辆OD预测方法,其特征在于,车辆OD预测问题简化为求解如下函数形式:
Xt=f(Xt-1,Xt-2,...Xt-T,O)
其中,Xt为t时刻下相应的OD需求,Xt-1,Xt-2,...Xt-T代表t时刻前的T个时间段下已知的OD情况,O代表其余的辅助数据,基于已知的信息预测未来的OD情况。
3.如权利要求1所述的基于贝叶斯神经网络的车辆OD预测方法,其特征在于,先通过下文门控长短时记忆网络CG-LSTM,从原始特征中通过门控机制挖掘和挑选不同时刻下的特征信息;然后,将挖掘得到的相关信息作为贝叶斯图卷积网络BGCN的输入特征,送入BGCN做最后的预测。
4.如权利要求3所述的基于贝叶斯神经网络的车辆OD预测方法,其特征在于,所述下文门控长短时记忆网络CG-LSTM模块加入了通道注意力的门控机制,给每个时刻引入了不同权重的注意力系数,其中,使用LSTM网络来学习和保存不同时段下的信息,由此,挖掘时间上的前后关联性,使得LSTM网络能保留更多有用的信息。
5.如权利要求4所述的基于贝叶斯神经网络的车辆OD预测方法,其特征在于,
OD预测使用的数据x1:T的形式为(batch_size(B),nodes(n),seq_len(T),features(F));首先聚合节点上的相关信息,得到每个节点的不同时刻下相关特征X1:(B,N,T);使用图卷积部分学习数据在图上的关联性,图卷积中图的部分使用经过贝叶斯网络生成的图嵌入embedding;再与原始特征拼接的方式得到其在不同节点和时间上的注意力关系,其计算公式如下:
s1:=σ(W2σ(W1z1:))
其中,z1:的数据格式为(B,T);
7.如权利要求6所述的基于贝叶斯神经网络的车辆OD预测方法,其特征在于,使用高斯分布描述先验分布;通过将上述one-hot编码的时间向量映射到节点个数N大小的图嵌入embedding向量,表征不同时间下各个节点得到的注意力强度,再使用图嵌入embedding的结果转置相乘得到节点间构成的图结构。
9.如权利要求3至5任一项所述的基于贝叶斯神经网络的车辆OD预测方法,其特征在于,将从CG-LSTM学习出的特征送入BGCN网络中,设定BGCN的input_size和output_size匹配LSTM中的hidden_dim和原始输入的Features,完成最终预测。
10.一种计算机可读存储介质,其存储有计算机程序,其特征在于,所述计算机程序由处理器执行时,实现如权利要求1至9任一项所述的基于贝叶斯神经网络的车辆OD预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310076207.6A CN116258253A (zh) | 2023-02-07 | 2023-02-07 | 一种基于贝叶斯神经网络的车辆od预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310076207.6A CN116258253A (zh) | 2023-02-07 | 2023-02-07 | 一种基于贝叶斯神经网络的车辆od预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116258253A true CN116258253A (zh) | 2023-06-13 |
Family
ID=86687347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310076207.6A Pending CN116258253A (zh) | 2023-02-07 | 2023-02-07 | 一种基于贝叶斯神经网络的车辆od预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116258253A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113469451A (zh) * | 2021-07-19 | 2021-10-01 | 杭州数知梦科技有限公司 | 基于启发式算法的定制公交线路生成方法 |
-
2023
- 2023-02-07 CN CN202310076207.6A patent/CN116258253A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113469451A (zh) * | 2021-07-19 | 2021-10-01 | 杭州数知梦科技有限公司 | 基于启发式算法的定制公交线路生成方法 |
CN113469451B (zh) * | 2021-07-19 | 2024-01-05 | 杭州数知梦科技有限公司 | 基于启发式算法的定制公交线路生成方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109887282B (zh) | 一种基于层级时序图卷积网络的路网交通流预测方法 | |
CN109635917B (zh) | 一种多智能体合作决策及训练方法 | |
US11842271B2 (en) | Multi-scale multi-granularity spatial-temporal traffic volume prediction | |
CN113487088A (zh) | 基于动态时空图卷积注意力模型的交通预测方法及装置 | |
CN114299723B (zh) | 一种交通流量预测方法 | |
CN111696355A (zh) | 动态图卷积交通速度预测方法 | |
CN110570035B (zh) | 同时建模时空依赖性和每日流量相关性的人流量预测系统 | |
CN110648527A (zh) | 一种基于深度学习模型的交通速度预测方法 | |
CN113313947A (zh) | 短期交通预测图卷积网络的路况评估方法 | |
CN112863180B (zh) | 交通速度预测方法、装置、电子设备及计算机可读介质 | |
CN112071062B (zh) | 一种基于图卷积网络和图注意力网络的行车时间估计方法 | |
CN112216101B (zh) | 一种基于弹性学习框架的交通预测方法及系统 | |
CN112489426A (zh) | 一种基于图卷积神经网络的城市交通流量时空预测方案 | |
CN115273464A (zh) | 一种基于改进的时空Transformer的交通流量预测方法 | |
CN113762338B (zh) | 一种基于多重图注意力机制的交通流预测方法、设备及介质 | |
CN114529081A (zh) | 一种时空联合的交通流量预测方法及装置 | |
CN116187555A (zh) | 基于自适应动态图的交通流预测模型构建方法及预测方法 | |
CN115796007A (zh) | 一种基于时空图网络的交通流量预测方法 | |
CN114780739A (zh) | 基于时间图卷积网络的时序知识图谱补全方法及系统 | |
CN116258253A (zh) | 一种基于贝叶斯神经网络的车辆od预测方法 | |
CN114021809A (zh) | 一种无人驾驶用交通流量预测的图层级卷积神经网络模型 | |
Xu et al. | AGNP: Network-wide short-term probabilistic traffic speed prediction and imputation | |
CN112559585A (zh) | 交通时空序列单步预测方法、系统及存储介质 | |
CN116311880A (zh) | 基于局部-全局时空特征融合的交通流量预测方法及设备 | |
Li et al. | Cycle-based signal timing with traffic flow prediction for dynamic environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |