CN113936483B - 一种面向紧急车辆快速通行的车路协同调度方法 - Google Patents

一种面向紧急车辆快速通行的车路协同调度方法 Download PDF

Info

Publication number
CN113936483B
CN113936483B CN202111569706.6A CN202111569706A CN113936483B CN 113936483 B CN113936483 B CN 113936483B CN 202111569706 A CN202111569706 A CN 202111569706A CN 113936483 B CN113936483 B CN 113936483B
Authority
CN
China
Prior art keywords
intersection
vehicle
traffic
current
emergency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111569706.6A
Other languages
English (en)
Other versions
CN113936483A (zh
Inventor
佘红艳
马威
王松浩
王亮
欧阳波涛
荣少华
王月红
陈川
丁立戈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hualui Cloud Technology Co ltd
Original Assignee
Hua Lu Yun Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hua Lu Yun Technology Co ltd filed Critical Hua Lu Yun Technology Co ltd
Priority to CN202111569706.6A priority Critical patent/CN113936483B/zh
Publication of CN113936483A publication Critical patent/CN113936483A/zh
Application granted granted Critical
Publication of CN113936483B publication Critical patent/CN113936483B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/07Controlling traffic signals
    • G08G1/087Override of traffic control, e.g. by signal transmitted by an emergency vehicle
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/09Arrangements for giving variable traffic instructions
    • G08G1/0962Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
    • G08G1/0968Systems involving transmission of navigation instructions to the vehicle
    • G08G1/096833Systems involving transmission of navigation instructions to the vehicle where different aspects are considered when computing the route
    • G08G1/096844Systems involving transmission of navigation instructions to the vehicle where different aspects are considered when computing the route where the complete route is dynamically recomputed based on new data

Abstract

本发明提供了一种面向紧急车辆快速通行的车路协同调度方法,根据实时路径规划和交通信号进行迭代计算调度决策,每隔t时间段进行决策包括:根据当前路况、紧急车辆当前位置和目的地,计算当前交通状况下紧急车辆的最优行驶路径;构建动态有向图,并选取紧急车辆当前位置的top‑K关系邻居路口;利用多头图注意力网络,提取top‑K关系邻居路口的状态的重要性得分以及隐藏特征,对邻居对不同子空间中当前路口的整体影响进行建模,得到处理后的特征;计算当前状态下不同交通灯相位动作所能带来的最大长期奖励的交通灯相位动作。本发明可以在特殊车辆行驶过程中实时动态地调整行驶路线,同时沿着动态更新的路径协调控制交通信号,以更好地处理动态交通流。

Description

一种面向紧急车辆快速通行的车路协同调度方法
技术领域
本发明涉及车路协同系统技术领域,具体涉及一种通过联合调度交通信号灯和车辆行驶路径来帮助紧急车辆在拥堵的交通状况下快速到达目的地的方法。
背景技术
随着城市人口和车辆保有量的增加,城市面临着日益严重的交通拥堵问题。严重的交通拥堵不仅会造成额外的空气污染和能源/时间浪费,而且在发生意外事故时,还可能阻碍救护车、消防车和警车等紧急车辆的到达,从而对关键服务产生不利影响,甚至影响人的生命安全。因此,设计一种有效的调度方法来帮助紧急车辆更快到达目的地具有重要意义。
为了解决这个问题,一种技术路线是采用以车辆为中心的方法,其目的是使用路线优化技术,如A*算法、Dijkstra算法和进化算法,以调度车辆按照最佳路线行驶。然而,以车辆为中心的方法只是被动地避开拥堵的道路,而未能主动改善交通状况以缩短紧急车辆的行驶时间。另一条技术路线是采用以道路为中心的方法,旨在积极改善交通状况,通过控制交通信号灯来赋予紧急车辆在交叉路口的优先通行权。例如,经典的GreenWave方法允许紧急车辆路线中的所有交通灯变为绿色,以便紧急车辆可以连续通过交叉路口。然而,这些方法很少考虑整体交通状况,以及调度策略对普通车辆通行的影响。如果不考虑整体交通状况,一味地为到达路口的紧急车辆开绿灯,可能阻碍其他方向的车流,对整体交通状况造成更严重的负面影响,进而对紧急车辆的通行也造成负面影响。还有各种面向普通车辆的交通信号控制方法,这些方法可以与环境实时交互并应对动态交通流。然而,他们只专注于改善整体交通状况,而忽略了紧急车辆的优先级。
近年来,车路协同系统相关技术取得了巨大进步,其中传感器基础设施(如摄像头、GPS)实时监控交通状况和车辆位置,通信基础设施使车辆和道路基础设施能够交换实时信息,它为设计一种车路协同调度方法提供了一个新的机会,不仅可以帮助优化紧急车辆的行驶路线,而且能同时控制沿途的交通信号。沿着这条技术路线,最近的一些研究结合了以车辆为中心和以道路为中心的方法,但他们只是提前规划紧急车辆的路线,然后沿着预设路线优化交通信号,无法应对动态变化的交通环境。
因此,如何提供一种能够应对动态变化的交通环境,面向紧急车辆快速通行的车路协同调度方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了面向紧急车辆快速通行的车路协同调度方法,可以在特殊车辆行驶过程中实时动态地调整行驶路线,同时沿着动态更新的路径协调控制交通信号,以更好地处理动态交通流。
为了实现上述目的,本发明采用如下技术方案:
一种面向紧急车辆快速通行的车路协同调度方法,根据实时路径规划和交通信号进行迭代计算做出调度决策,每隔t时间段进行一次决策,每次决策包括如下步骤:
步骤一,根据当前路况、紧急车辆当前位置和目的地,计算不同路径的长期合力,得到当前交通状况下紧急车辆的最优行驶路径;
步骤二,根据所述最优行驶路径,构建动态有向图,并选取紧急车辆当前位置的top-K关系邻居路口;
步骤三,利用多头图注意力网络,提取top-K关系邻居路口的状态的重要性得分以及隐藏特征,对邻居对不同子空间中当前路口的整体影响进行建模,得到处理后的特征;
步骤四,利用基于强化学习的相位评测网络将所述步骤三处理后的特征作为输入,计算当前状态下不同交通灯相位动作所能带来的长期奖励,选取最大长期奖励的交通灯相位动作进行调度。
优选的,所述步骤一中计算不同路径的长期合力包括引力、即时斥力以及长期斥力的计算步骤:
引力表示紧急车辆向目的地移动的趋势,紧急车辆即将到达当前路口vc,并将前往最终目的地路口vd,vc的候选邻居路口vi对紧急车辆的引力计算如下:
Fg(vc,vi)=(dis(vc,vd)-dis(vi,vd))/S,
其中dis(vc,vd)表示路口vc与vd之间的路网距离,dis(vi,vd)表示路口vi与vd之间的路网距离,而S表示相应道路上所允许的最大行驶速度;
斥力表示候选路线的估计旅行时间,即时斥力包括在路段ec,i上的行驶时间tr(vc,vi)和在路口vi等待的时间tw(vc,vi)和,计算如下:
Figure GDA0003484671920000031
其中x(ec,i)表示路段ec,i上的交通流量,len为平均车辆长度,k为一个路段上的车道数,S′表示车辆通过交叉路口时允许的最大速度;
使用折扣因子λ迭代计算沿不同路线的长期斥力F′r(vc,vi)如下:
Figure GDA0003484671920000032
其中Ni表示vi的邻居路口集合,当搜索深度达到最大搜索深度限制Dep时,迭代计算停止。
优选的,所述步骤二包括:
基于特殊车辆的行驶路径将路网构建为有向图;
根据紧急车辆的行驶路线动态调整不同路口之间的关系距离dis_r:对于紧急车辆路线中的边ei,i+1,从交叉点vi到vi+1的关系距离dis_r(i,i+1)计算如下:
disr(i,i+1)=dis(i,i+1)·δ
其中dis(i,i+1)是从路口vi到vi+1的路网距离,δ为关系因子;
最后,根据动态关系距离获得路口vi的top-K关系邻居。
优选的,所述步骤三包括:
将路口vi的m维观测数据oi通过多层感知器转化为n维的隐藏特征
Figure GDA0003484671920000036
Figure GDA0003484671920000033
其中We和be是权重矩阵和偏差向量;
嵌入当前交叉路口vi和邻居vj的隐藏特征表示,以获得一个邻居的不同类型的重要性得分:
Figure GDA0003484671920000034
其中h是不同表示子空间的索引,
Figure GDA0003484671920000035
是邻居vj在子空间h中对当前路口vi的重要性得分;
通过归一化同一子空间中不同邻居的重要性分数来检索邻居和当前路口之间的一般注意力分数:
Figure GDA0003484671920000041
其中μ是温度因子,Ki是交叉点vi的前K个相关的关系邻居;
通过将所有前K个相关邻居的隐藏特征表示Hj与其各自的一般注意力分数
Figure GDA0003484671920000042
相结合,对邻居对不同子空间中当前路口的整体影响进行建模,得到处理后的特征hmi
Figure GDA0003484671920000043
其中H为子空间个数,
Figure GDA0003484671920000044
为该子空间中的权重矩阵,Wq和bq为该步需要进行训练的权重矩阵和偏差向量,σ为折扣因子。
优选的,所述top-K关系邻居路口的状态包括:当前路灯相位phi、该路口每个驶入车道
Figure GDA0003484671920000045
上的普通车辆数量xo(l)、该路口每个驶出车道上的普通车辆数量xo(l′)以及相应的驶入和驶出车道上的紧急车辆数量xs(l)和xs(l′)。
优选的,所述步骤四利用贝尔曼方程来估计一个动作的长期折扣累积奖励,所述动作为当前路口不同的红绿灯控制相位,包括:
交通信号控制动作的长期影响
Figure GDA0003484671920000046
定义如下:
Figure GDA0003484671920000047
其中
Figure GDA0003484671920000048
是基于在路口vi处的观察
Figure GDA0003484671920000049
采取动作
Figure GDA00034846719200000410
的即时奖励;
基于处理后的实时观测信息hmi,利用深度强化学习将给定状态-动作对
Figure GDA00034846719200000411
的预期奖励估计为
Figure GDA00034846719200000412
Figure GDA00034846719200000413
其中
Figure GDA00034846719200000414
和bp是要训练的参数,p是可选相位的数目,θ代表所有可训练参数;
算法将选择具有最大长期奖励的相位动作,具体通过最小化损失函数来优化控制策略,如下所示:
Figure GDA00034846719200000415
其中T是时间步长,I是路口的数量,yt是目标的Q值,定义为:
Figure GDA00034846719200000416
其中
Figure GDA0003484671920000051
是路口vi在t时刻获得的即时收益,
Figure GDA0003484671920000052
是基于路口vi在t+1时刻的观测
Figure GDA0003484671920000053
采取动作
Figure GDA0003484671920000054
的长期收益估计,γ为长期折扣因子。
优选的,利用普通车辆和紧急车辆在交通流量中的占比来分配奖励函数中的权重,将奖励ri定义为:
Figure GDA0003484671920000055
其中,Po(i)为路口vi的压力,即入车道和驶出车道之间的普通车辆密度差,当驶入驶出道路长度相同时,即为车辆数差值;Le(i)是路口vi的驶入车道上的紧急车辆的数目,而η是路网中特殊车辆的占比。
经由上述的技术方案可知,与现有技术相比,本发明的有益效果包括:
本发明用于帮助紧急车辆在拥堵的交通状况下快速到达目的地。通过考虑城市交通状况、交通信号灯信息,以及特殊车辆的出发地和目的地,实时动态地调整行驶路线,同时根据动态更新的路径协调控制沿途交通信号灯,以更好地处理动态交通流并帮助紧急车辆快速通行。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图;
图1为本发明实施例提供的一种面向紧急车辆快速通行的车路协同调度方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有的技术以车辆为中心或者以道路为中心,很少考虑车路协同条件下针对紧急车辆的协同调度。即使考虑,也是基于一般情况下的静态环境。本申请通过考虑城市交通状况、交通信号灯信息,以及特殊车辆的出发地和目的地,实时动态地调整行驶路线,同时根据动态更新的路径协调控制沿途交通信号灯,以更好地处理动态交通流并帮助紧急车辆快速通行。
本实施例中包括实时路径规划模块和交通信号控制模块,它们相互影响并迭代地做出决策。系统每隔t时间段进行一次决策,每次决策步骤如下:
步骤一:实时路径规划模块根据当前路况、紧急车辆当前位置和目的地,计算不同路径的长期合力,得到当前交通状况下紧急车辆的最优行驶路径。
步骤二:交通信号控制模块根据规划的紧急车辆行驶路径,构建动态有向图,并选取紧急车辆当前位置的top-K关系邻居路口。
步骤三:交通信号控制模块利用多头图注意力网络,提取top-K关系邻居路口的状态(排队长度,红绿灯状态等)的重要性以及隐藏特征。
步骤四:交通信号控制模块利用基于强化学习的相位评测网络将相关路口的隐藏特征以及重要性作为输入,评测当前状态下不同交通灯相位动作所能带来的长期奖励,最终选取能带来最大长期奖励的交通灯相位动作。
对于实时路径规划模块和交通信号控制模块的具体执行过程说明如下:
(1)实时路径规划模块
实时路径规划模块主要包括引力、即时斥力以及长期斥力的计算过程。引力表示紧急车辆向目的地移动的趋势。引力越大,表明紧急车辆到达目的地的时间就越短。假设一辆紧急车辆即将到达当前路口vc,并将前往最终目的地路口vd,那么vc的候选邻居路口vi对紧急车辆的引力计算如下:
Fg(vc,vi)=(dis(vc,vd)-dis(vi,vd))/S,
其中dis(vc,vd)表示路口vc与vd之间的路网距离,dis(vi,vd)表示路口vi与vd之间的路网距离,而S表示相应道路上所允许的最大行驶速度。
斥力表示候选路线的估计旅行时间,包含紧急车辆在路段上的行驶时间和沿途交叉路口的等待时间。假设一辆紧急车辆即将到达交叉路口vc,那么vc的候选邻居路口vi对紧急车辆的即时斥力包含了在路段ec,i上的行驶时间tr(vc,vi)和在路口vi等待的时间tw(vc,vi)和,计算如下:
Figure GDA0003484671920000061
其中x(ec,i)表示路段ec,i上的交通流量,len为平均车辆长度,k为一个路段上的车道数,S′表示车辆通过交叉路口时允许的最大速度。相应地,x(ec,i)·len/k为路段ec,i上一条车道的平均排队长度。即时斥力不能反映路径选择的长期影响。具体来说,一些即时斥力较小的路线可能会引导车辆移动到拥堵的路段。因此,扩展选择路径时的搜索深度来估计长期累积收益,并使用折扣因子λ迭代计算沿不同路线的长期斥力F′r(vc,vi)如下:
Figure GDA0003484671920000071
其中Ni表示vi的邻居路口集合,当搜索深度达到最大搜索深度限制Dep时,这个迭代计算就会停止。这种长期斥力可以帮助估计路线的最短旅行时间。长期斥力是根据当前交通状况估算的,当紧急车辆行驶到远离当前位置的相关路段时,斥力可能会发生变化。因此,路口之间的距离越大,估计所得的长期影响误差就越大。分配的折扣因子也越小,以减小误差。
最终,按照如下方式计算不同路径的长期合力B(vc,vi):
B(vc,vi)=Fg(Vc,vi)-F′r(vc,vi)
(2)交通信号控制模块
该模块主要介绍如何选择最优相位动作,包括智能体设计、动态有向图中的邻居选择、多头图注意力网络和基于强化学习的相位评测四个部分。智能体设计主要介绍需要提取处理的各个路口的特征,这些特征将作为输入传入多头图注意力网络用来提取隐藏特征,而隐藏特征则被传入深度强化学习网络,用来评测该状态下采取不同相位所能带来的长期奖励。
(i)智能体设计
状态:状态被定义为整个城市环境的交通状况,而多智能体强化学习中一个智能体的观测等于交叉路口的状态。一个智能体在路口vi的观察值oi,包括当前路灯相位phi、该路口每个驶入车道
Figure GDA0003484671920000072
上的普通车辆数量xo(l)、该路口每个驶出车道上的普通车辆数量xo(l′)以及相应的驶入和驶出车道上的紧急车辆数量xs(l)和xs(l′)。
动作:每个路口智能体选择不同的红绿灯控制相位作为自己的可选择动作。
奖励:首先介绍路口压力的定义。普通车辆的通行压力定义为驶入车道和驶出车道之间的普通车辆密度差,当驶入驶出道路长度相同时,即为车辆数差值。路口vi的压力Po(i)可以定义为:
Po(i)=∑(l,l′)∈i|xo(l)-xo(l′)|。
考虑到普通车辆和紧急车辆的不同交通优先级,利用它们在交通流量中的占比来分配奖励函数中的权重,将奖励ri定义为:
Figure GDA0003484671920000081
其中Le(i)是路口vi的驶入车道上的紧急车辆的数目,而η是路网中特殊车辆的占比。
(ii)动态有向图中的top-K关系邻居选择
在多路口信号灯控制问题中,一个路口的信号灯控制行为不仅受其自身状态的影响,还受到其他相关的相邻路口的影响,这可以通过关系距离进行过滤。将路网建模为图模型,其每条边的权为相邻两个交叉路口之间的路网距离dis。基于特殊车辆的行驶路径将路网构建为有向图,根据紧急车辆的行驶路线动态调整不同路口之间的关系距离dis_r。假设紧急车辆来自当前交叉口的上游,当前交叉口的交通信号控制策略需要更加关注上游交叉口的交通流量。相应地,与其他交叉口相比,上游交叉口与当前交叉口之间的关系距离变得更小,表示为路网距离dis与关系因子δ(<1)的乘积。具体来说,对于紧急车辆路线中的边ei,i+1,从交叉点vi到vi+1的关系距离dis_r(i,i+1)计算如下:
disr(i,i+1)=dis(i,i+1)·δ
其中dis(i,i+1)是从路口vi到vi+1的路网距离。最后,根据动态关系距离获得路口vi的top-K关系邻居。
(iii)多头图注意力网络
该部分利用多头图注意力机制来提取不同top-K关系邻居的重要性和影响。它可以看作是不同智能体之间的通信,可以帮助改善多智能体强化学习问题中的合作性能。通过多层感知器(MLP)将路口vi的m维观测数据oi通过MLP转化为n维的隐藏特征
Figure GDA0003484671920000082
Figure GDA0003484671920000083
其中We和be是权重矩阵和偏差向量。然后嵌入当前交叉路口vi和邻居vj的隐藏特征表示,以获得一个邻居的不同类型的重要性得分eij。具体来说,利用多头注意力机制,其中并行执行具有不同线性投影的注意力函数,以共同关注来自不同表示子空间的邻居,具体操作如下:
Figure GDA0003484671920000091
其中h是不同表示子空间的索引,
Figure GDA0003484671920000092
是邻居vj在子空间h中对当前路口vi的重要性得分。由于流量不同,eij通常与eji不同。通过归一化同一子空间中不同邻居的重要性分数来检索邻居和当前路口之间的一般注意力分数:
Figure GDA0003484671920000093
其中μ是温度因子,Ki是交叉点vi的前K个相关的关系邻居。最后,通过将所有前K个相关邻居的隐藏特征表示Hj与其各自的一般注意力分数
Figure GDA0003484671920000094
相结合,对邻居对不同子空间中当前路口的整体影响进行建模,处理后的特征hmi将被传入强化学习网络用来进行相位选择的相关评测:
Figure GDA0003484671920000095
(iv)基于强化学习的相位评测
这部分采用强化学习策略,关键思想是利用贝尔曼方程来估计一个动作的长期折扣累积奖励,这对于具有强时空相关性的交通系统具有重要意义。交通信号控制动作的长期影响
Figure GDA0003484671920000096
定义如下:
Figure GDA0003484671920000097
其中
Figure GDA0003484671920000098
是基于在路口vi处的观察
Figure GDA0003484671920000099
采取动作
Figure GDA00034846719200000910
的即时奖励。基于处理后的实时观测信息hmi,利用深度强化学习将给定状态-动作对
Figure GDA00034846719200000911
的预期奖励估计为
Figure GDA00034846719200000912
Figure GDA00034846719200000913
其中
Figure GDA00034846719200000914
和bp是要训练的权重矩阵和偏差向量参数,p是可选相位的数目(动作空间),而θ代表该深度强化学习模型中所有可训练参数,hmi是多头图注意力网络处理后的隐藏特征。算法将选择具有最大长期奖励的相位动作。通过最小化损失函数来优化控制策略,如下所示:
Figure GDA00034846719200000915
其中T是时间步长,I是路口的数量,yt是目标的Q值,定义为:
Figure GDA0003484671920000101
最终,有着最大Q值的相位动作被选作控制策略。
本发明方法分别基于不同地区的相关实验场景进行了验证,包括合肥、济南、杭州、纽约,在这些验证场景下将平均通行时间缩短到265.8s,160.2s,204.1s和634.5s。相比于一般场景(没有路径规划且交通灯基于固定计划调控)下的通行状况,通行效率提升了61.9%,75.6%,69.7%和70.7%。相比于最常用的GreenWave交通灯调控策略,由于本方法增加了动态路径规划模块,可以规避一些较为拥堵的城市区域,本方法将通行效率提高了16.1%,8.9%,11.2%和11.3%。相比于常用的路径规划算法Dijkstra,由于本方法动态调整紧急车辆路径沿线的交通灯调控策略来赋予紧急车辆更高的通行优先级,本方法将通行效率提升了60.2%,74.7%,46.5%和52.9%。
以上对本发明所提供的面向紧急车辆快速通行的车路协同调度方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (6)

1.一种面向紧急车辆快速通行的车路协同调度方法,其特征在于,根据实时路径规划和交通信号进行迭代计算做出调度决策,每隔t时间段进行一次决策,每次决策包括如下步骤:
步骤一,根据当前路况、紧急车辆当前位置和目的地,计算不同路径的长期合力,得到当前交通状况下紧急车辆的最优行驶路径;计算不同路径的长期合力包括引力、即时斥力以及长期斥力的计算步骤:
引力表示紧急车辆向目的地移动的趋势,紧急车辆即将到达当前路口vc,并将前往最终目的地路口vd,vc的候选邻居路口vi对紧急车辆的引力计算如下:
Fg(vc,vi)=(dis(vc,vd)-dis(vi,vd))/S,
其中dis(vc,vd)表示路口vc与vd之间的路网距离,dis(vi,vd)表示路口vi与vd之间的路网距离,而S表示相应道路上所允许的最大行驶速度;
斥力表示候选路线的估计旅行时间,即时斥力包括在路段ec,i上的行驶时间tr(vc,vi)和在路口vi等待的时间tw(vc,vi)和,计算如下:
Figure FDA0003484671910000011
其中x(ec,i)表示路段ec,i上的交通流量,len为平均车辆长度,k为一个路段上的车道数,S′表示车辆通过交叉路口时允许的最大速度;
使用折扣因子λ迭代计算沿不同路线的长期斥力F′r(vc,vi)如下:
Figure FDA0003484671910000012
其中Ni表示vi的邻居路口集合,当搜索深度达到最大搜索深度限制Dep时,迭代计算停止;
步骤二,根据所述最优行驶路径,构建动态有向图,并选取紧急车辆当前位置的top-K关系邻居路口;
步骤三,利用多头图注意力网络,提取top-K关系邻居路口的状态的重要性得分以及隐藏特征,对邻居对不同子空间中当前路口的整体影响进行建模,得到处理后的特征;
步骤四,利用基于强化学习的相位评测网络将所述步骤三处理后的特征作为输入,计算当前状态下不同交通灯相位动作所能带来的长期奖励,选取最大长期奖励的交通灯相位动作进行调度。
2.根据权利要求1所述的面向紧急车辆快速通行的车路协同调度方法,其特征在于,所述步骤二包括:
基于特殊车辆的行驶路径将路网构建为有向图;
根据紧急车辆的行驶路线动态调整不同路口之间的关系距离dis_r:对于紧急车辆路线中的边ei,i+1,从交叉点vi到vi+1的关系距离dis_r(i,i+1)计算如下:
disr(i,i+1)=dis(i,i+1)·δ
其中dis(i,i+1)是从路口vi到vi+1的路网距离,δ为关系因子;
最后,根据动态关系距离获得路口vi的top-K关系邻居。
3.根据权利要求1所述的面向紧急车辆快速通行的车路协同调度方法,其特征在于,所述步骤三包括:
将路口vi的m维观测数据oi通过多层感知器转化为n维的隐藏特征
Figure FDA0003484671910000021
Figure FDA0003484671910000022
其中We和be是权重矩阵和偏差向量;
嵌入当前交叉路口vi和邻居vj的隐藏特征表示,以获得一个邻居的不同类型的重要性得分:
Figure FDA0003484671910000023
其中h是不同表示子空间的索引,
Figure FDA0003484671910000024
是邻居vj在子空间h中对当前路口vi的重要性得分;
通过归一化同一子空间中不同邻居的重要性分数来检索邻居和当前路口之间的一般注意力分数:
Figure FDA0003484671910000025
其中μ是温度因子,Ki是交叉点vi的前K个相关的关系邻居;
通过将所有前K个相关邻居的隐藏特征表示Hj与其各自的一般注意力分数
Figure FDA0003484671910000026
相结合,对邻居对不同子空间中当前路口的整体影响进行建模,得到处理后的特征hmi
Figure FDA0003484671910000031
其中H为子空间个数,
Figure FDA0003484671910000032
为该子空间中的权重矩阵,Wq和bq为该步需要进行训练的权重矩阵和偏差向量,σ为折扣因子。
4.根据权利要求1所述的面向紧急车辆快速通行的车路协同调度方法,其特征在于,所述top-K关系邻居路口的状态包括:当前路灯相位phi、该路口每个驶入车道
Figure FDA0003484671910000033
上的普通车辆数量xo(l)、该路口每个驶出车道上的普通车辆数量xo(l′)以及相应的驶入和驶出车道上的紧急车辆数量xs(l)和xs(l′)。
5.根据权利要求4所述的面向紧急车辆快速通行的车路协同调度方法,其特征在于,所述步骤四利用贝尔曼方程来估计一个动作的长期折扣累积奖励,所述动作为当前路口不同的红绿灯控制相位,包括:
交通信号控制动作的长期影响
Figure FDA0003484671910000034
定义如下:
Figure FDA0003484671910000035
其中
Figure FDA0003484671910000036
是基于在路口vi处的观察
Figure FDA0003484671910000037
采取动作
Figure FDA0003484671910000038
的即时奖励;
基于处理后的实时观测信息hmi,利用深度强化学习将给定状态-动作对
Figure FDA0003484671910000039
的预期奖励估计为
Figure FDA00034846719100000310
Figure FDA00034846719100000311
其中
Figure FDA00034846719100000312
和bp是要训练的参数,p是可选相位的数目,θ代表所有可训练参数;
算法将选择具有最大长期奖励的相位动作,具体通过最小化损失函数来优化控制策略,如下所示:
Figure FDA00034846719100000313
其中T是时间步长,I是路口的数量,yt是目标的Q值,定义为:
Figure FDA00034846719100000314
其中
Figure FDA00034846719100000315
是路口vi在t时刻获得的即时收益,
Figure FDA00034846719100000316
是基于路口vi在t+1时刻的观测
Figure FDA00034846719100000317
采取动作
Figure FDA00034846719100000318
的长期收益估计,γ为长期折扣因子。
6.根据权利要求5所述的面向紧急车辆快速通行的车路协同调度方法,其特征在于,利用普通车辆和紧急车辆在交通流量中的占比来分配奖励函数中的权重,将奖励ri定义为:
Figure FDA0003484671910000041
其中,Po(i)为路口vi的压力,即入车道和驶出车道之间的普通车辆密度差,当驶入驶出道路长度相同时,即为车辆数差值;Le(i)是路口vi的驶入车道上的紧急车辆的数目,而η是路网中特殊车辆的占比。
CN202111569706.6A 2021-12-21 2021-12-21 一种面向紧急车辆快速通行的车路协同调度方法 Active CN113936483B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111569706.6A CN113936483B (zh) 2021-12-21 2021-12-21 一种面向紧急车辆快速通行的车路协同调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111569706.6A CN113936483B (zh) 2021-12-21 2021-12-21 一种面向紧急车辆快速通行的车路协同调度方法

Publications (2)

Publication Number Publication Date
CN113936483A CN113936483A (zh) 2022-01-14
CN113936483B true CN113936483B (zh) 2022-03-22

Family

ID=79289374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111569706.6A Active CN113936483B (zh) 2021-12-21 2021-12-21 一种面向紧急车辆快速通行的车路协同调度方法

Country Status (1)

Country Link
CN (1) CN113936483B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103760904A (zh) * 2014-02-13 2014-04-30 北京工业大学 一种语音播报式智能车辆路径规划装置与实施方法
CN105185141A (zh) * 2015-10-14 2015-12-23 浙江大学 一种基于引力场的车辆自动驾驶引导方法
CN107161143A (zh) * 2017-05-18 2017-09-15 江苏大学 一种采用人工势场法的车辆主动避撞方法
WO2019085955A1 (zh) * 2017-11-06 2019-05-09 华为技术有限公司 一种紧急车辆的调度方法及装置
CN111968396A (zh) * 2020-08-22 2020-11-20 刘秀萍 智能车联网驱动的应急救援车行驶优化方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103760904A (zh) * 2014-02-13 2014-04-30 北京工业大学 一种语音播报式智能车辆路径规划装置与实施方法
CN105185141A (zh) * 2015-10-14 2015-12-23 浙江大学 一种基于引力场的车辆自动驾驶引导方法
CN107161143A (zh) * 2017-05-18 2017-09-15 江苏大学 一种采用人工势场法的车辆主动避撞方法
WO2019085955A1 (zh) * 2017-11-06 2019-05-09 华为技术有限公司 一种紧急车辆的调度方法及装置
CN111968396A (zh) * 2020-08-22 2020-11-20 刘秀萍 智能车联网驱动的应急救援车行驶优化方法

Also Published As

Publication number Publication date
CN113936483A (zh) 2022-01-14

Similar Documents

Publication Publication Date Title
Wei et al. Colight: Learning network-level cooperation for traffic signal control
Bie et al. Dynamic headway control for high‐frequency bus line based on speed guidance and intersection signal adjustment
CN111785045B (zh) 基于演员-评论家算法的分布式交通信号灯联合控制方法
CN108847037B (zh) 一种面向非全局信息的城市路网路径规划方法
Balaji et al. Type-2 fuzzy logic based urban traffic management
CN107944605A (zh) 一种基于数据预测的动态交通路径规划方法
CN114283607B (zh) 一种基于分布式群智学习的多车协同规划方法
Ouallane et al. Overview of road traffic management solutions based on IoT and AI
CN110570672B (zh) 一种基于图神经网络的区域交通信号灯控制方法
KR20220102395A (ko) 자율주행 차량 군집 운행을 위한 비신호 교차로에서의 강화학습기반 통행 개선을 위한 장치 및 방법
CN109959388A (zh) 一种基于栅格扩展模型的智能交通精细化路径规划方法
Ding et al. Multivehicle coordinated lane change strategy in the roundabout under internet of vehicles based on game theory and cognitive computing
CN111724602B (zh) 一种城市非信控多交叉路口环境下的多车协同控制方法
Xu et al. Integrating public transit signal priority into max-pressure signal control: Methodology and simulation study on a downtown network
Li et al. A cooperative traffic control for the vehicles in the intersection based on the genetic algorithm
Shen et al. Study on road network traffic coordination control technique with bus priority
CN112017439A (zh) 一种自动驾驶交叉口行人过街摆渡车控制方法
Xu et al. V2X empowered non-signalized intersection management in the AI era: Opportunities and solutions
CN113936483B (zh) 一种面向紧急车辆快速通行的车路协同调度方法
Horng et al. Traffic congestion reduce mechanism by adaptive road routing recommendation in smart city
Wided et al. Traffic Management system and Traffic Light Control in Smart City to Reduce Traffic Congestion
CN113408189B (zh) 基于可变元胞的城市多点循环式紧急疏散与仿真推演方法
Maipradit et al. An adaptive traffic signal control scheme based on back-pressure with global information
Rouyer et al. A road intersection control in urban intelligent transportation systems
Habibi et al. Improvement of Multi-agent Routing Guidance with an Intelligent Traffic Light Scheduling and the Ability to Select Intermediate Destinations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 211500 third floor, Beidou building, No. 6, Huida Road, Jiangbei new area, Nanjing, Jiangsu

Patentee after: Hualui Cloud Technology Co.,Ltd.

Address before: 211500 third floor, Beidou building, No. 6, Huida Road, Jiangbei new area, Nanjing, Jiangsu

Patentee before: Hua Lu Yun Technology Co.,Ltd.

CP01 Change in the name or title of a patent holder