CN115273472B - 一种基于图卷积网络表示道路的通行时间预测方法及系统 - Google Patents

一种基于图卷积网络表示道路的通行时间预测方法及系统 Download PDF

Info

Publication number
CN115273472B
CN115273472B CN202210892673.7A CN202210892673A CN115273472B CN 115273472 B CN115273472 B CN 115273472B CN 202210892673 A CN202210892673 A CN 202210892673A CN 115273472 B CN115273472 B CN 115273472B
Authority
CN
China
Prior art keywords
dimension information
road
network
sampling
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210892673.7A
Other languages
English (en)
Other versions
CN115273472A (zh
Inventor
王杜娟
殷允强
朱嘉诚
王大江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN202210892673.7A priority Critical patent/CN115273472B/zh
Publication of CN115273472A publication Critical patent/CN115273472A/zh
Application granted granted Critical
Publication of CN115273472B publication Critical patent/CN115273472B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0133Traffic data processing for classifying traffic situation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于图卷积网络表示道路的通行时间预测方法,涉及智能交通管理平台技术领域,解决了有的预测方法无法结合多类依赖信息的问题,其技术方案要点是:包括S100、获取初始行程数据,对所述初始行程数据进行预处理,得到路网关系图和多次行程记录;S200、构建组合模型,从所述路网关系图和多次行程记录中提取空间维度信息、时间维度信息和外部维度信息;S300、将所述空间维度信息、时间维度信息和外部维度信息通过回归器聚合,得到预测结果;通过组合模型针对空间、时间和外部信息不同的特征选择构建了不同的模型进行深度特征提取,克服了传统模型无法综合考虑影响因素的问题,提高了预测的准确性。

Description

一种基于图卷积网络表示道路的通行时间预测方法及系统
技术领域
本发明涉及智能交通管理平台技术领域,更具体地说,它涉及一种基于图卷积网络表示 道路的通行时间预测方法及系统。
背景技术
随着越来越多的车辆进入城市地区,交通拥堵已成为许多城市的一个重大问题。解决交 通拥堵的方案之一是开发智能公共交通系统。行程时间预测是智能公共交通系统中最基本的 任务之一。它测量两个确定位置之间的通行时间,并为交通系统提供基线信息。准确的通行时间预测对于智能交通系统中的车辆调度、路线规划、拥堵控制等问题具有重要意义。基于 模型的预测方法在过去的几十年中得到了广泛的研究,它侧重于模拟真实的交通行为来预测 通行时间,而数据驱动的预测方法则基于历史数据进行预测。随着基于位置的服务和叫车应 用程序的应用,产生了大量浮动汽车轨迹数据,数据驱动的方法变得越来越流行。经典时间序列分析是在通行时间预测中捕获时间信息的最广泛使用的数据驱动方法。它假设未来值取 决于历史值和随机噪声。广泛使用的时间序列模型包括季节性ARIMA模型、自回归移动平 均和广义自回归条件异方差模型。计机器学习算法经常被部署在这个领域。与时间序列模型 相比,统计机器学习算法往往具有非线性特征和更灵活的函数拟合能力,因此在通行时间预 测领域得到了广泛的应用。随着深度学习的发展,深度神经网络(DNN)被证明具有足够的 深度来处理大规模的高维数据。
随着大数据技术和机器学习的发展,支持向量机和深度神经网络等新方法已成功用于预 测通行时间。然而,现有的预测方法无法适应于具有多种依赖关系的通行时间预测任务,特 别对于路况复杂、动态程度高的城市路网短途出行时间预测,其包含道路网络关系的空间依赖,通行时间的时间依赖以及天气等外部依赖。现有的预测方法多考虑单个依赖信息,无法 结合多类依赖信息。
发明内容
本申请的目的是提供一种基于图卷积网络表示道路的通行时间预测方法及系统,在预测 时,克服多维度结合的困难,充分考虑多种不同的依赖信息,该方法通过构建组合模型,实 现多维度深度特征提取和城市路网中短途通行时间预测任务,解决传统预测方法的不足。
本申请的上述技术目的是通过以下技术方案得以实现的:包括
S100、获取初始行程数据,对所述初始行程数据进行预处理,得到路网关系图和多次行 程记录;
S200、构建组合模型,从所述路网关系图和多次行程记录中提取空间维度信息、时间维 度信息和外部维度信息;
S300、将所述空间维度信息、时间维度信息和外部维度信息通过回归器聚合,得到预测 结果。
采用上述技术方案,通过构建组合模型,同时考虑空间维度、时间维度以及外部维度的 信息,预测通行时间,组合模型针对空间、时间和外部信息不同的特征选择构建了不同的模 型进行深度特征提取,克服了传统模型无法综合考虑影响因素的问题,提高了预测的准确性。
进一步的,在步骤S200中,包括,构建图卷积网络从所述路网关系图和多次行程记录中 提取空间维度信息,构建长短期记忆网络从所述路网关系图和多次行程记录中提取时间维度 信息,构建宽深模型从所述路网关系图和多次行程记录中提取外部维度信息。
进一步的,所述构建图卷积网络从所述路网关系图和多次行程记录中提取空间维度信息, 包括:
S211、将所述多次行程记录作为所述图卷积网络的输入,将所述行程记录中的通过路段 作为所述图卷积网络的节点,对节点的邻居节点分配采样权重,根据采样权重在路网关系图 上进行采样,获取节点的采样邻居;
S212、聚合当前层节点的采样邻居的特征向量,得到当前层邻居特征向量;将当前层节 点特征向量和所述当前层邻居特征向量输入全连接层,进行维度变化,然后进行归一化处理, 得到下一层的节点特征向量;循环至深度K,得到第K层的节点特征向量作为空间维度信息。
进一步的,所述节点v的采样邻居,通过以下方法获得:通过转向关系赋予节点采样权 重,通过所述采样权重计算各个邻居节点的采样概率,设置邻居节点采样数量,按采样概率从 大至小采样邻居节点,得到节点的采样邻居。
进一步的,所述采样概率,通过以下公式计算得出:
Figure SMS_1
其中,R为0-1之间的随机数,Wi为邻居节点对应的采样权重,Si为邻居节点的采样概率。
进一步的,所述采样权重包括:直行采样权重Wstraight、右转采样权重Wright、左转采样 权重Wleft和掉头采样权重Wturn;所述直行采样权重Wstraight>右转采样权重Wright>左转采样权重Wleft>掉头采样权重Wturn
进一步的,所述构建长短期记忆网络从所述路网关系图和多次行程记录中提取时间维度 信息,包括以下步骤:
S221、取所述行程记录中的通过路段的静态特征为所述长短期记忆网络的输入;
S222、计算遗忘门、细胞状态更新值和更新门状态,通过所述遗忘门、细胞状态更新值 和更新门状态更新细胞状态;
S223、遍历各个通过路段,将所述长短期记忆网络的输出作为时间维度信息。
进一步的,所述构建宽深模型从所述路网关系图和多次行程记录中提取外部维度信息, 包括以下步骤:
S231、取所述行程记录中的通过路段的静态特征为所述宽深模型的输入,所述静态特征 分为:离散变量和连续变量;
S232、在宽模型中,对离散变量进行独热编码,获得独热离散变量,计算独热离散变量 的交叉特征,获得交叉变量,将所述连续变量和交叉变量合并得到宽模型变量,将所述宽模 型变量通过仿射转换,获得宽模型输出;在深模型中,将各个离散变量输入对应的嵌入层,获得各个离散变量的嵌入特征,将所述嵌入特征和连续变量输入多层感知机组,获得深模型 输出;
S233、将所述宽模型输出和深模型输出进行拼接,获得外部维度信息。
进一步的,还包括S400、将训练集数据输入所述组合模型,计算每次训练的损失函数, 根据计算得到的损失函数,反向传播梯度更新组合模型的采样权重和偏置,采用Adam优化 器优化网络参数,得到训练后的组合模型。
本申请另一方面还提供一种基于图卷积网络表示道路的通行时间预测系统,包括:
特征提取模块,用于获取初始行程数据,对所述初始行程数据进行预处理,得到路网关 系图和多次行程记录;
组合模型模块,用于构建组合模型,从所述路网关系图和多次行程记录中提取空间维度 信息、时间维度信息和外部维度信息;
预测输出模块,用于将所述空间维度信息、时间维度信息和外部维度信息通过回归器聚 合,得到预测结果。
与现有技术相比,本申请具有以下有益效果:
1.本申请通过构建组合模型,同时考虑空间维度、时间维度以及外部维度的信息,预测 通行时间,组合模型针对空间、时间和外部信息不同的特征选择构建了不同的模型进行深度 特征提取,克服了传统模型无法综合考虑影响因素的问题,提高了预测的准确性。
2.本申请在时间维度上,采用长短期记忆网络对片段的局部信息和序列的长期依赖关系 进行提取;在空间维度上,采用图卷积网络对路网关系进行建模,通过设置采样权重进行邻 居采样,克服了传统图卷积网络需要在整个图上学习的缺点,使得在大规模道路网络上的应用成为可能;在外部维度上,采用宽深模型深度提取,融合离散/连续特征,采用两层结构能 够增加模型提取复杂特征的学习和泛化能力。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不 构成对本发明实施例的限定。在附图中:
图1为本发明一实施例提供的预测方法流程示意图;
图2为本发明一实施例提供的组合模型的结构示意图;
图3为本发明一实施例提供的图卷积网络的结构示意图;
图4为本发明一实施例提供的长短期记忆网络的结构示意图;
图5为本发明一实施例提供的宽深模型的结构示意图。
具体实施方式
在下文中,可在本发明的各种实施例中使用的术语“包括”或“可包括”指示所发明的 功能、操作或元件的存在,并且不限制一个或更多个功能、操作或元件的增加。此外,如在 本发明的各种实施例中所使用,术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合,并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、 数字、步骤、操作、元件、组件或前述项的组合的可能性。
在本发明的各种实施例中使用的术语仅用于描述特定实施例的目的并且并非意在限制本 发明的各种实施例。除非另有限定,否则在这里使用的所有术语(包括技术术语和科学术语) 具有与本发明的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的 含义并且将不被解释为具有理想化的含义或过于正式的含义,除非在本发明的各种实施例中 被清楚地限定。
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明 作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本 发明的限定。
实施例1:一种基于图卷积网络表示道路的通行时间预测方法,
如图1所示,通行时间预测方法,包括:
S100、获取初始行程数据,对所述初始行程数据进行预处理,得到路网关系图和多次行 程记录;
S200、构建组合模型,从所述路网关系图和多次行程记录中提取空间维度信息、时间维 度信息和外部维度信息;
S300、将所述空间维度信息、时间维度信息和外部维度信息通过回归器聚合,得到预测 结果。
在步骤S100中,获取初始行程数据,具体地,获取某平台开放的“行程到达时间预估数 据集”为初始行程数据,初始行程数据中包含若干网约车的行程记录D,每一次行程记录 d(d∈D),包含该次行程记录的出发时间s,行程到达时间a,通过路段p,时间信息t,以及行 程发生时的外部信息o;其中,时间信息t包括:行程发生时的日期、时间和星期信息,外部 信息o包括:司机id、乘客id、天气、温度、交通拥挤度。
所有行程发生在路网G=(L,A)上;其中L={l1,…,lN}表示所有路段的集合,A=
Figure SMS_2
代表任意两个路段的连接关系,即:L包含所有行程记录d中的通 过路段p。本实施例的研究目标为:基于行程记录{s,p,t,o}和路网关系G,预测行程d的通行时 间,即a-s,即:构造基于{s,p,t,o,G}的回归模型,预测通行时间并最小化预测值与a-s的 误差。
在步骤S100中,对初始行程数据进行预处理,得到路网关系图和多次行程记录,具体的,
获取所有路段的集合以及任意两个路段的连接关系,构造路网关系图G=(L,A);假设初 始行程数据中包含M次行程记录,规范化初始行程数据,得到行程记录
Figure SMS_3
其中,通过路段
Figure SMS_4
loj表示行程 o中车辆通过的第j个路段的路段特征。
路段特征包含:静态特征st和动态特征dy,即:loj={st,dy};静态特征st={路段标号, 路段距离,平均速度,路段交通状态,路段行驶百分比},(注:在行程结束路段,行驶百分 比小于1);动态特征为人工构建,将一天分为288时间节点,相邻时间点相隔5分钟,计算 所有节点在每一时间节点的平均通行时间
Figure SMS_5
其中,
Figure SMS_6
表示第n条记录中 路段li在时间点x的行程时间,m是在时间点x通过路段li的记录总数。基于行程记录的出发 时间so确定时间点x并构造路段loj,(loj∈po)的动态特征
Figure SMS_7
Figure SMS_8
其中,
Figure SMS_9
表示路段loj在so五分钟、十分钟、十五分钟前的平均通行时间,
Figure SMS_10
表示路段loj在so一小时、两小时前的平均通行时间,
Figure SMS_11
表示路 段loj在so一天、两天前此时平均通行时间,
Figure SMS_12
表示路段loj在so一周前此时的平均通行 时间。
在步骤S200中,构建组合模型,从路网关系图G=(L,A)和多次行程记录
Figure SMS_13
Figure SMS_14
中提取空间维度信息、时间维度信息和外部维度信息;具体地,包括:
S210、构建图卷积网络从路网关系图和多次行程记录中提取空间维度信息;
S220、构建长短期记忆网络从所述路网关系图和多次行程记录中提取时间维度信息;
S230、构建宽深模型从所述路网关系图和多次行程记录中提取外部维度信息。
在S210中,包括,S211、将多次行程记录
Figure SMS_15
作为图卷积网络的 输入,将行程记录中的通过路段
Figure SMS_16
作为图卷积网络的节点,对节点分配采 样权重W,根据采样权重W在路网关系图G=(L,A)上进行采样,获取节点的采样邻居。
发明人发现,路段之间不同的转向关系和路口红绿灯的类型对其互相连通的紧密程度有 直接影响,因此可以分析转向关系和路口红绿灯的类型,设置采样权重W。例如,通常情况 下,直行权重Wstraight>右转权重Wright>左转权重Wleft>掉头权重Wturn
具体的,在本实施例中,我们仅根据转向关系设置权重,直行权重Wstraight=3, 右转权重Wright=2,左转权重Wleft=1,掉头权重Wturn=0.5,无连接关系权重W=0。
将行程记录d={(po,so,to,oo,ao)}∈D输入图卷积网络,将行程记录中的通过路段
Figure SMS_17
作为图卷积网络的节点,人工设置邻居聚合深度K和采样数量;首先遍 历通过路段loj∈po,在路网关系图G上,生成路段loj在聚合深度k(k∈K),的邻居节点集合
Figure SMS_18
并根据转向关系生成每个节点对应的采样权重
Figure SMS_19
Figure SMS_20
计算邻居节点的采样概率S=[Si,…Sn],其中
Figure SMS_21
为节点i的采样概率,R是 遍历样本时产生的0-1之间的随机数,Wi是节点i的采样权重,基于采样概率S对
Figure SMS_22
采 样得到采样邻居的集合N(loj)k。通过对邻居节点进行采样获得采样邻居,模型不必在完整的 路网关系图G上学习训练,能够提升训练速度,节省计算资源。
在S210中,包括,S212、聚合当前层节点的采样邻居的特征向量,得到当前层邻居特征 向量;将当前层节点特征向量和所述当前层邻居特征向量输入全连接层,进行维度变化,然 后进行归一化处理,得到下一层的节点特征向量;循环至深度K,得到第K层的节点特征向量作为空间维度信息。
具体地,循环深度k∈K,生成loj∈po在深度k的聚合向量,邻居节点在深度k的特征向量 为
Figure SMS_23
当k=1时,
Figure SMS_24
此处使用平均聚合算法,
Figure SMS_25
表示路段loj的邻居聚合向量,MEAN表示元素平均运算,其中 W为权重,U表示向量拼接操作,σ(·)为Sigmod激活函数。
当k>1时,首先拼接当前节点的向量和邻居节点向量得到当前层表示
Figure SMS_28
Figure SMS_30
Figure SMS_34
通过具有激活函数σ的全连接层转换:
Figure SMS_27
Figure SMS_31
作归一化处理:
Figure SMS_32
其中
Figure SMS_35
表示向量
Figure SMS_26
的模,
Figure SMS_29
表示路段u在深 度k的向量表示。循环聚合运算
Figure SMS_33
可得 下一深度的向量表示。
循环至深度K,输出节点loj∈po在K处的聚合向量
Figure SMS_36
作为空间维度 信息输出。
在S220中,包括以下步骤:
S221、取所述行程记录中的通过路段的静态特征st为所述长短期记忆网络的输入;
S222、计算遗忘门ft、细胞状态更新值gt和更新门状态it,通过所述遗忘门ft、细胞状态 更新值gt和更新门状态it更新细胞状态ct
S223、遍历各个通过路段loj,将所述长短期记忆网络的输出ht作为时间维度信息。
具体地,根据数据集分析,人工设置最大路段数量为200,对小于最大数量的行程数据 在末尾补0,对于超过最大数量的序列数据进行末尾截取。
第一步,遍历路径序列loj∈po中的每一个路段loj,记当前遍历次序为t,当前路段表示 为xt←loj,依次计算
ft=σ(Wf[xt;ht-1]+bf),
gt=tanh(Wg[xt;ht-1]+bg
it=σ(Wi[xt;ht-1]+bi)
ot=σ(Wo[xt;ht-1]+bo)
ct=ft⊙ct-1+it⊙gt
ht=ot⊙tan h(ct)
其中,W为权重向量,b为偏差,[·,·]代表向量拼接操作,σ为sigmod激活函数,tanh为 tanh激活函数,⊙表示逐元素乘法。
第二步,完成计算后,更新ct和ht,输入新路段loj∈po,xt←loj,循环计算。
第三步,遍历结束po后,选择最后一个路段loj的ht作为时间维度信息输出。
在步骤S230中,包括以下步骤:
S231、取所述行程记录中的通过路段静态特征st为所述长短期记忆网络的输入,所述静 态特征st分为:离散变量和连续变量;
S232、在宽模型中,对离散变量进行独热编码,获得独热离散变量,计算独热离散变量 的交叉特征,获得交叉变量,将所述连续变量和交叉变量合并得到宽模型变量,将所述宽模 型变量通过仿射转换,获得宽模型输出;在深模型中,将各个离散变量输入对应的嵌入层,获得各个离散变量的嵌入特征,将所述嵌入特征和连续变量输入多层感知机组,获得深模型 输出;
S233、将所述宽模型输出和深模型输出进行拼接,获得外部维度信息。
具体地,在宽模型中,输入变量x=[连续变量,离散变量],其中,连续变量={距离,历史平均速度,通过百分比,温度},离散变量={路段标号,路口标号,日期,时间点,晴雨,司机标号},上述的连续变量和离散变量均取自通过路段的静态特征st。
第一步,对离散变量做独热编码,然后对离散变量两两交叉计算得到交叉特征
Figure SMS_37
其中fx和fy表示两个one-hot编码的独热离散变量,M是人为区分这两个特征的参数,交叉特征代表任两特征的交叉关系。
第二步,将
Figure SMS_38
与x合并得到
Figure SMS_39
对xwide做仿 射变换降低维度得到Owide←ReLu(W×xwide+b)作为宽模型的输出。
在深模型中,输入变量x=[连续变量,离散变量],其中,连续变量={距离,历史平均速度,通过百分比,温度},离散变量={路段标号,路口标号,日期,时间点,晴雨,司机标号},上述的连续变量和离散变量均取自通过路段的静态特征st。
第一步,将各个离散变量输入各个嵌入层,得到各离散变量的嵌入表示xembed
第二步,拼接嵌入表示与连续变量,得到深模型变量xdeep=[连续变量,xembed]。
第三步,深模型变量xdeep输入双层256维的MLP非线性转换得到深模型输出,
Figure SMS_40
最后,拼接Odeep与Owide输出Output=[Odeep,Owide],得到外部维度信息。
通行时间预测方法,还包括S400、将训练集数据输入所述组合模型,计算每次训练的损 失函数,根据计算得到的损失函数,反向传播更新组合模型的采样权重和偏置,采用Adam优 化器优化网络参数,得到训练后的组合模型。
具体地,将图卷积网络、长短期记忆网络和宽深模型的输出连接起来并输入到1层回归 器以产生预测。然后共同训练宽深模型、图卷积网络和长短期记忆网络,以充分利用这三种 模型。使用平均误差百分比作为训练损失函数
Figure SMS_41
其中yi
Figure SMS_42
是第i条行程 记录中的真实出行时间和预测值,n是记录总数。模型中的所有参数在MAPE损失下使用反 向传播(BP)和链式求导法则联合训练。由于三个模块的组合,难以选择合适的全局学习率, 我们选择一种具有自适应步长和动量的随机梯度下降方法(Adam)来优化模型。划分数据为 训练集,交叉验证集与测试集,通过随机交叉验证优化模型超参数,最终在测试集上评估模 型效果。然后我们使用一组最新生成的数据进一步微调模型,以确保模型适应最新的数据分 布。
本实施例另一方面还提供一种基于图卷积网络表示道路的通行时间预测系统,包括:
特征提取模块,用于获取初始行程数据,对所述初始行程数据进行预处理,得到路网关 系图和多次行程记录;
组合模型模块,用于构建组合模型,从所述路网关系图和多次行程记录中提取空间维度 信息、时间维度信息和外部维度信息;
和预测输出模块,用于将所述空间维度信息、时间维度信息和外部维度信息通过回归器 聚合,得到预测结果。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说 明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护 范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本 发明的保护范围之内。

Claims (8)

1.一种基于图卷积网络表示道路的通行时间预测方法,其特征是:包括
S100、获取初始行程数据,对所述初始行程数据进行预处理,得到路网关系图和多次行程记录;
S200、构建组合模型,从所述路网关系图和多次行程记录中提取空间维度信息、时间维度信息和外部维度信息;
S300、将所述空间维度信息、时间维度信息和外部维度信息通过回归器聚合,得到预测结果;
在步骤S200中,包括,构建图卷积网络从所述路网关系图和多次行程记录中提取空间维度信息,构建长短期记忆网络从所述路网关系图和多次行程记录中提取时间维度信息,构建宽深模型从所述路网关系图和多次行程记录中提取外部维度信息;
所述构建宽深模型从所述路网关系图和多次行程记录中提取外部维度信息,包括以下步骤:
S231、取所述行程记录中的通过路段的静态特征为所述宽深模型的输入,所述静态特征分为:离散变量和连续变量;
S232、在宽模型中,对离散变量进行独热编码,获得独热离散变量,计算独热离散变量的交叉特征,获得交叉变量,将所述连续变量和交叉变量合并得到宽模型变量,将所述宽模型变量通过仿射转换,获得宽模型输出;在深模型中,将各个离散变量输入对应的嵌入层,获得各个离散变量的嵌入特征,将所述嵌入特征和连续变量输入多层感知机组,获得深模型输出;
S233、将所述宽模型输出和深模型输出进行拼接,获得外部维度信息;
所述连续变量包括:距离、历史平均速度、通过百分比和温度,所述离散变量包括:路段标号、路口标号、日期、时间点、晴雨和司机标号。
2.根据权利要求1所述的一种基于图卷积网络表示道路的通行时间预测方法,其特征是:所述构建图卷积网络从所述路网关系图和多次行程记录中提取空间维度信息,包括:
S211、将所述多次行程记录作为所述图卷积网络的输入,将所述行程记录中的通过路段作为所述图卷积网络的节点,对节点的邻居节点分配采样权重,根据采样权重在路网关系图上进行采样,获取节点的采样邻居;
S212、聚合当前层节点的采样邻居的特征向量,得到当前层邻居特征向量;将当前层节点特征向量和所述当前层邻居特征向量输入全连接层,进行维度变化,然后进行归一化处理,得到下一层的节点特征向量;循环至深度K,得到第K层的节点特征向量作为空间维度信息。
3.根据权利要求2所述的一种基于图卷积网络表示道路的通行时间预测方法,其特征是:所述节点v的采样邻居,通过以下方法获得:通过转向关系赋予节点采样权重,通过所述采样权重计算各个邻居节点的采样概率,设置邻居节点采样数量,按采样概率从大至小采样邻居节点,得到节点的采样邻居。
4.根据权利要求3所述的一种基于图卷积网络表示道路的通行时间预测方法,其特征是:所述采样概率,通过以下公式计算得出:
Figure FDA0004140975060000021
其中,R为0-1之间的随机数,Wi为邻居节点对应的采样权重,Si为邻居节点的采样概率。
5.根据权利要求4所述的一种基于图卷积网络表示道路的通行时间预测方法,其特征是:所述采样权重包括:直行采样权重Wstraight、右转采样权重Wright、左转采样权重Wleft和掉头采样权重Wturn;所述直行采样权重Wstraight>右转采样权重Wright>左转采样权重Wleft>掉头采样权重Wturn
6.根据权利要求1所述的一种基于图卷积网络表示道路的通行时间预测方法,其特征是:所述构建长短期记忆网络从所述路网关系图和多次行程记录中提取时间维度信息,包括以下步骤:
S221、取所述行程记录中的通过路段的静态特征为所述长短期记忆网络的输入;
S222、计算遗忘门、细胞状态更新值和更新门状态,通过所述遗忘门、细胞状态更新值和更新门状态更新细胞状态;
S223、遍历各个通过路段,将所述长短期记忆网络的输出作为时间维度信息。
7.根据权利要求1-6任一所述的一种基于图卷积网络表示道路的通行时间预测方法,其特征是:还包括S400、将训练集数据输入所述组合模型,计算每次训练的损失函数,根据计算得到的损失函数,反向传播更新组合模型的采样权重和偏置,采用Adam优化器优化网络参数,得到训练后的组合模型。
8.一种基于图卷积网络表示道路的通行时间预测系统,其特征在于,用于实现如权利要求1所述的一种基于图卷积网络表示道路的通行时间预测方法,包括:
特征提取模块,用于获取初始行程数据,对所述初始行程数据进行预处理,得到路网关系图和多次行程记录;
组合模型模块,用于构建组合模型,从所述路网关系图和多次行程记录中提取空间维度信息、时间维度信息和外部维度信息;
和预测输出模块,用于将所述空间维度信息、时间维度信息和外部维度信息通过回归器聚合,得到预测结果;
所述组合模型模块还用于,构建图卷积网络从所述路网关系图和多次行程记录中提取空间维度信息,构建长短期记忆网络从所述路网关系图和多次行程记录中提取时间维度信息,构建宽深模型从所述路网关系图和多次行程记录中提取外部维度信息;
所述构建宽深模型从所述路网关系图和多次行程记录中提取外部维度信息,包括以下步骤:
S231、取所述行程记录中的通过路段的静态特征为所述宽深模型的输入,所述静态特征分为:离散变量和连续变量;
S232、在宽模型中,对离散变量进行独热编码,获得独热离散变量,计算独热离散变量的交叉特征,获得交叉变量,将所述连续变量和交叉变量合并得到宽模型变量,将所述宽模型变量通过仿射转换,获得宽模型输出;在深模型中,将各个离散变量输入对应的嵌入层,获得各个离散变量的嵌入特征,将所述嵌入特征和连续变量输入多层感知机组,获得深模型输出;
S233、将所述宽模型输出和深模型输出进行拼接,获得外部维度信息;
所述连续变量包括:距离、历史平均速度、通过百分比和温度,所述离散变量包括:路段标号、路口标号、日期、时间点、晴雨和司机标号。
CN202210892673.7A 2022-07-27 2022-07-27 一种基于图卷积网络表示道路的通行时间预测方法及系统 Active CN115273472B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210892673.7A CN115273472B (zh) 2022-07-27 2022-07-27 一种基于图卷积网络表示道路的通行时间预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210892673.7A CN115273472B (zh) 2022-07-27 2022-07-27 一种基于图卷积网络表示道路的通行时间预测方法及系统

Publications (2)

Publication Number Publication Date
CN115273472A CN115273472A (zh) 2022-11-01
CN115273472B true CN115273472B (zh) 2023-05-02

Family

ID=83771849

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210892673.7A Active CN115273472B (zh) 2022-07-27 2022-07-27 一种基于图卷积网络表示道路的通行时间预测方法及系统

Country Status (1)

Country Link
CN (1) CN115273472B (zh)

Also Published As

Publication number Publication date
CN115273472A (zh) 2022-11-01

Similar Documents

Publication Publication Date Title
CN109919358B (zh) 一种基于神经网络时空注意力机制的实时站点流量预测方法
US11842271B2 (en) Multi-scale multi-granularity spatial-temporal traffic volume prediction
Bi et al. Daily tourism volume forecasting for tourist attractions
CN109697852B (zh) 基于时序交通事件的城市道路拥堵程度预测方法
CN109670277B (zh) 一种基于多模态数据融合与多模型集成的旅行时间预测方法
CN110889546B (zh) 一种基于注意力机制的交通流量模型训练方法
CN111860989B (zh) 一种基于蚁群算法优化的lstm神经网络短时交通流量预测方法
CN111582559B (zh) 一种到达时间的预估方法及装置
CN113762595B (zh) 通行时间预测模型训练方法、通行时间预测方法及设备
CN111553535B (zh) 一种基于ae-lstm-bo车流量预测的导航参考方法
CN115410372B (zh) 基于贝叶斯lstm的高速公路交通流量可靠预测方法
CN113205698A (zh) 一种基于igwo-lstm的短时交通流预测的导航提醒方法
Haputhanthri et al. Short-term traffic forecasting using LSTM-based deep learning models
CN113449905A (zh) 一种基于门控循环单元神经网络的交通拥堵预警方法
CN113537580A (zh) 一种基于自适应图学习的公共交通客流预测方法及系统
CN116663742A (zh) 基于多因素和模型融合的区域运力预测方法
CN117671979B (zh) 一种基于知识图谱的智慧城市数据管理系统与方法
CN112927507A (zh) 一种基于LSTM-Attention的交通流量预测方法
CN115273472B (zh) 一种基于图卷积网络表示道路的通行时间预测方法及系统
CN114372627B (zh) 基于混合深度学习框架的城市车辆旅行时间估计方法
CN115796030A (zh) 一种基于图卷积的交通流量预测方法
CN114912669A (zh) 基于多源数据的公交客流组合图神经网络预测方法
CN115909717A (zh) 一种基于深度学习的高速公路短时交通流预测方法
CN114267170A (zh) 基于考虑人类流动性的图时空Transformer模型的交通流预测方法
Afandizadeh et al. Prediction of traffic flow based on calendar data on suburban roads (case study: chalus road)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant