CN110111605A - 基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法 - Google Patents
基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法 Download PDFInfo
- Publication number
- CN110111605A CN110111605A CN201910507029.1A CN201910507029A CN110111605A CN 110111605 A CN110111605 A CN 110111605A CN 201910507029 A CN201910507029 A CN 201910507029A CN 110111605 A CN110111605 A CN 110111605A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- probability
- vehicles
- decision
- game
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000004891 communication Methods 0.000 claims abstract description 12
- 101001093748 Homo sapiens Phosphatidylinositol N-acetylglucosaminyltransferase subunit P Proteins 0.000 claims abstract 2
- 230000001133 acceleration Effects 0.000 claims description 47
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 4
- 230000004069 differentiation Effects 0.000 claims description 2
- 238000005303 weighing Methods 0.000 claims 1
- 230000002452 interceptive effect Effects 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 11
- 206010039203 Road traffic accident Diseases 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W30/00—Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
- B60W30/08—Active safety systems predicting or avoiding probable or impending collision or attempting to minimise its consequences
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/16—Anti-collision systems
- G08G1/166—Anti-collision systems for active traffic, e.g. moving vehicles, pedestrians, bikes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mechanical Engineering (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Transportation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Automation & Control Theory (AREA)
- Toys (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明属于汽车主动安全领域,涉及一种基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法。包括以下步骤:1、利用DSRC通讯方法识别目标车辆;2、判断两车之间是否存在冲突;应用冲突时间差△T来判断两车之间的冲突。3、建立博弈模型;应用子博弈完美纳什均衡动态博弈理论决策车辆交汇行为;4、计算均衡点;根据确定的各自的期望收益,计算复制动态方程,两车通过对方的复制动态方程不断调整自己的通行概率;5、判断均衡点的稳定性,来选择最佳的决策;6、按稳定均衡点的策略行驶;本发明利用动态博弈思想的概率期望与收益损失的概念,结合博弈均衡点,实时做出最佳的通行决策,为车辆交互决策开辟了高效简易的方法思路。
Description
技术领域
本发明属于汽车主动安全领域,利用子博弈完美纳什均衡动态博弈理论,基于匝道口两车交汇环境,设计一种涉及动态博弈与V2X智能网联汽车技术结合的行驶决策方法,具体涉及一种基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法。
背景技术
根据近年来的交通事故统计分析,车道交汇路口的交通事故对中国的交通事故和死亡事故总数有着重大的影响。此外,与现在可获得雷达和基于摄像机的前向碰撞系统的其他高百分比碰撞(例如道路偏离和后端受碰)不同,目前还没有成熟的技术来解决交汇路口的侧面冲突问题。通常情况下,作为一个相对独立的个体,对于如何安全地通过交汇危险区,司机很难通过主观判断做出准确的决定。缺乏对当前驾驶环境的全面意识是这种情况下最重要的原因之一。因此,需要应用一种有效的车辆防撞系统(CAS)算法来解决此类驾驶安全问题。基于智能网联化的V2V(车-车通信)与V2I(车-路通信)技术是当前研究与应用范围比较广泛的信息交互技术。其中,DSRC(Dedicated Short Range Communications)短程通信技术目前被广泛应用于主动安全性信息交互技术中。博弈论是经济学领域的重要应用理论,其基于完全信息的动态博弈思想也为车辆之间的交互决策开辟了新道路。当前的避免碰撞系统算法多基于复杂冲突区的计算,其时效性与可应用性目前还有待测试。而动态博弈思想引入概率期望与收益损失的概念,可简化车辆间通行决策的复杂计算过程,结合博弈均衡点,实时做出最佳的通行决策。因此,借助V2X网联技术,将动态博弈决策思想引入智能车主动安全的应用领域,是一项非常具有研究价值的应用思想。
发明内容
本发明基于两车匝道交汇场景提出了一种基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法。主要用途为通过博弈系统决策两车于匝道交汇路口的行车次序,以避免两车在冲突点处发生碰撞事故。
本决策基于现有的DSRC(专用短程通讯技术)通讯技术,使得两车之间能够达成完全信息的动态博弈系统。采用子博弈完美纳什均衡,每次决策均采用最优策略。主体博弈策略包括博弈模型的建立、均衡点的计算以及均衡点稳定性的判断。
在博弈系统中,当两辆机动车发生冲突时,每个个体需要判断对方选择通过的概率,来决策自己通过的概率,进而使整个博弈系统具有最大的收益。因此,需要通过对通行概率期望值进行计算以建立博弈模型。建立博弈模型,首先通过设定两车的加速通过以及减速让行的概率模型来建立博弈矩阵;再通过纯策略期望收益建立混合策略期望收益模型;根据收益模型建立复制动态方程;最后根据复制动态方程调整通过概率,使博弈系统达到均衡。
两辆冲突车辆通过博弈模型不断调整自己的通行概率,直到各自概率的调整量都为0,即系统达到均衡。此时两车的通行概率策略集内的点为均衡点。引入演化博弈中的演化稳定策略,联立两车的复制动态方程求出所有的均衡点,确定所有均衡点的策略集。
对于离散博弈系统,需对均衡点的稳定性进行判断。其中,需要参考纳什均衡理论学中的均衡点类型判别表判断均衡点是否为ESS(进化稳定策略)稳定点。即判断各均衡点对应的雅克比矩阵的秩和迹的符号判断。舍弃不稳定点,选取稳定点作为最终决策。
在整个博弈系统中,博弈决策系统的开启通过两车到达冲突点的时间差ΔT判断,并设定时间差阈值ΔTM作为临界时间差。并通过DSRC通讯进行两车之间的识别以及博弈策略的分享。
一种基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法,包括以下步骤:
步骤一,利用DSRC通讯方法识别目标车辆;
步骤二,判断两车之间是否存在冲突;两车以当前速度、加速度正常行驶是否会于同一时刻到达冲突点发生碰撞,冲突点为匝道与主路中心线的交点;应用冲突时间差ΔT来判断两车之间的冲突。
步骤三,建立博弈模型;应用子博弈完美纳什均衡动态博弈理论决策车辆交汇行为;
步骤四,计算均衡点;
根据步骤三中确定的各自的期望收益,计算复制动态方程,两车通过对方的复制动态方程不断调整自己的通行概率;
步骤五,判断均衡点的稳定性,来选择最佳的决策;
步骤六,按稳定均衡点的策略行驶。
技术方案中所述冲突时间差ΔT,是博弈系统开始时刻起,两车在保持当前车速以及加速度的情况下,到达冲突点的时间差,ΔT越小,则发生冲突的时间差越小,表示冲突可能性越大,当ΔT为0时,两车刚好在同一时刻到达冲突点发生碰撞;而ΔT越大,表示两车发生冲突的可能性越小;
取3.5s为冲突时间差阈值ΔTM对冲突时间差进行判断;ΔT小于ΔTM时,继续进行动态博弈,当ΔT大于ΔTM时,两车只需以当前行驶状态即可安全通过冲突点,则结束博弈系统;
ΔT的计算与主路A车以及匝道B车的速度v、加速度a以及从当前位置到达冲突点的距离L有关;计算公式如下:
式中,vA、vB分别为A、B两车速度,aA、aB分别为两车当前时刻的加速度,LA、LB为两车到达冲突点的距离。
技术方案中所述应用子博弈完美纳什均衡动态博弈理论决策车辆交汇行为,具体步骤如下:
首先,需要确定博弈体系三要素:
(1)博弈参与主体对象:主路机动车A与匝道机动车B;
(2)博弈主体策略集:{加速通过,减速避让};
(3)确定两博弈对象的收益变量;
其次,确定A、B两车的基础收益分别为G1、G2,根据不同情况下的等待时间确定各自的损失;其中,主要损失定义为避让损失、冲突损失以及互让损失;现有定义:A车选择加速通过,B车选择减速避让时,B车的避让损失为M;A车选择减速避让,B车选择加速通过时,A车的避让损失为N;当A、B两车均选择加速通过时,两车冲突损失分别为P、Q;当A、B两车均选择减速避让时,两车的互让损失分别为J、K;
A车选择加速通过的概率为x,选择减速避让的概率为1-x;B车选择加速通过的概率为y,选择减速避让的概率为1-y;以(x,y)来表示A、B两车进行动态博弈时,A车以x的概率选择加速通过,B车以y的概率选择加速通过;则(1,0)表示A车选择加速通过,B车选择减速等待;(0,1)表示A车选择减速避让,B车选择加速通过;
再次,对A车纯策略期望收益以及混合策略期望收益进行计算;定义A车选择加速通过的纯策略期望收益为EA1,选择减速避让的纯策略期望收益为EA2,计算公式如下:
EA1=(G1-P)y+G1(1-y)=G1-Py (2)
EA2=(G1-N)y+(G1-J)(1-y)=G1-J+(J-N)y (3)
A车以x的概率选择加速通过,以1-x的概率选择减速避让的混合策略期望收益为:
计算B车的加速通过以及减速避让的纯策略期望收益EB1、EB2公式如下:
EB1=(G2-Q)x+G2(1-x)=G2-Qx (5)
EB2=(G2-M)x+(G2-K)(1-x)=G2-K+(K-M)x (6)
B车以y的概率选择加速通过,以1-y的概率选择减速避让的混合策略期望收益为:
技术方案中所述计算复制动态方程,两车通过对方的复制动态方程不断调整自己的通行概率,具体步骤如下:
根据公式(2)和(4)计算A车选择加速通过的复制动态方程为:
根据公式(5)和(7)可计算B车选择加速通过的复制动态方程为:
A车的复制动态方程说明B车加速通过概率为y时,A车是如何调整自己的加速通过概率x来使系统达到平衡的;B车根据自己的复制动态方程来调整自己的加速通过概率y;
式(8)和式(9)组成了动态博弈系统,A车通过式(8)来调整自己的加速通行概率x,B车通过式(9)来调整自己的加速通行概率y,概率发生变化,复制动态方程也随之发生改变,此时两车再次对自己的通行概率进行修改,直至两车各自加速通过概率的调整量都变为0,此时系统达到均衡;
通过求解式(8)和式(9)的零点解,求解出整个动态博弈系统的均衡点,当系统中两车加速通过的概率达到这些点时,表示博弈系统已经达到均衡,概率不再发生变化。
技术方案中所述判断均衡点的稳定性,来选择最佳的决策;具体步骤如下:
应用演化博弈稳定策略,构造雅克比矩阵,并计算矩阵的秩和迹;构造的雅克比矩阵如下:
将所有均衡点代入雅克比矩阵中,分别计算矩阵的秩与迹,对于均衡点类型的判别,由博弈稳定策略理论,当雅克比矩阵的秩大于0,迹小于0时,该均衡点为进化稳定策略ESS稳定点,从多个计算出的均衡点中确定稳定均衡点。
技术方案中所述按稳定均衡点的策略行驶,具体内容如下:
通过步骤五确定出唯一稳定均衡点(x,y),两车根据稳定点策略集进行行驶,即稳定均衡点x>y时,A车加速通过,B车减速避让;稳定均衡点x<y时,A车减速避让,B车加速通过。
本发明有益技术效果:本发明相比于现有的算法决策主动安全技术,极大简化了复杂的计算过程。现有的主动安全技术多依赖于高精度的传感器以及复杂的感知决策控制算法,需要较高的成本以及科研投入,本发明引入了现有的经济学领域博弈论思想,通过现有理论决策的改进,利用动态博弈思想的概率期望与收益损失的概念,结合博弈均衡点,实时做出最佳的通行决策,为车辆交互决策开辟了高效简易的方法思路。同时应用智能网联,使信息交互更加的准确快速,简化了复杂的整车传感器系统。随着网联化的普及,动态博弈的车辆主动安全性思想可以拓展到各个驾驶场景,对未来智能汽车驾驶决策安全性的领域具有很大的研究价值。
附图说明
图1为基于动态博弈的自动驾驶车辆出入口匝道环境示意图;
图2为基于动态博弈的自动驾驶车辆出入口匝道行驶决策流程图。
具体实施方式
下面将结合附图对本发明进行具体说明。
参阅图2,本发明提出的基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法,包括以下决策流程:
步骤一,利用DSRC通讯方法识别目标车辆。本发明匝道场景中的两辆交汇车辆均配有车载OBU设备,利用DSRC无线通信技术,识别博弈目标的存在以及传输各种博弈信息。DSRC技术的特点为应用设备简单,技术较为成熟,目前可达约300m的通信范围。在本发明中,两车均采用非定向广泛式传播方式,即以自车为中心,半径300m的圆周范围内为通信识别区。当两车的通讯范围相交后,系统识别到博弈目标,开启博弈决策模块,进行动态博弈。
步骤二,判断两车之间是否存在冲突。博弈系统开启后,需先判断两车之间是否存在可碰撞的冲突,即两车以当前速度、加速度正常行驶是否会于同一时刻到达冲突点发生碰撞。这里的冲突点即为匝道与主路中心线的交点。为简明判断冲突的存在性。本发明应用冲突时间差ΔT来判断两车之间的冲突。
参阅图1,博弈系统开始时刻起,两车在保持当前车速以及加速度的情况下,到达冲突点的时间差,即为冲突时间差ΔT。ΔT越小,则发生冲突的时间差越小,表示冲突可能性越大,当ΔT为0时,两车刚好在同一时刻到达冲突点发生碰撞。而ΔT越大,则表示两车发生冲突的可能性越小。本发明取3.5s为冲突时间差阈值ΔTM对冲突时间差进行判断。即ΔT小于ΔTM时,继续进行动态博弈,当ΔT大于ΔTM时,两车只需以当前行驶状态即可安全通过冲突点,则结束博弈系统。
ΔT的计算与主路A车以及匝道B车的速度v、加速度a以及从当前位置到达冲突点的距离L有关。计算公式如下:
式中,vA、vB分别为A、B两车速度,aA、aB分别为两车当前时刻的加速度,LA、LB为两车到达冲突点的直线距离。
步骤三,建立博弈模型。本发明应用子博弈完美纳什均衡动态博弈理论决策车辆交汇行为。首先确定博弈体系三要素:
(4)博弈参与主体对象:主路机动车A与匝道机动车B。
(5)博弈主体策略集:{加速通过,减速避让}。
(6)确定两博弈对象的收益变量。
首先确定A、B两车的基础收益分别为G1、G2,根据不同情况下的等待时间确定各自的损失。其中,主要损失定义为避让损失、冲突损失以及互让损失。现有定义:A车选择加速通过,B车选择减速避让时,B车的避让损失为M;A车选择减速避让,B车选择加速通过时,A车的避让损失为N。当A、B两车均选择加速通过时,两车冲突损失分别为P、Q;当A、B两车均选择减速避让时,两车的互让损失分别为J、K。
A车选择加速通过的概率为x,选择减速避让的概率为1-x;B车选择加速通过的概率为y,选择减速避让的概率为1-y。以(x,y)来表示A、B两车进行动态博弈时,A车以x的概率选择加速通过,B车以y的概率选择加速通过。则(1,0)表示A车选择加速通过,B车选择减速等待;(0,1)表示A车选择减速避让,B车选择加速通过。
首先对A车纯策略期望收益以及混合策略期望收益进行计算。定义A车选择加速通过的纯策略期望收益为EA1,选择减速避让的纯策略期望收益为EA2,则其计算公式如下:
EA1=(G1-P)y+G1(1-y)=G1-Py (2)
EA2=(G1-N)y+(G1-J)(1-y)=G1-J+(J-N)y (3)
A车以x的概率选择加速通过,以1-x的概率选择减速避让的混合策略期望收益为:
同理计算B车的加速通过以及减速避让的纯策略期望收益乩1、乩2公式如下:
EB1=(G2-Q)x+G2(1-x)=G2-Qx (5)
EB2=(G2-M)x+(G2-K)(1-x)=G2-K+(K-M)x (6)
B车以y的概率选择加速通过,以1-y的概率选择减速避让的混合策略期望收益为:
步骤四,计算均衡点。根据步骤三中确定的各自的期望收益,计算复制动态方程,两车通过对方的复制动态方程不断调整自己的通行概率。根据公式(2)和(4)可计算A车选择加速通过的复制动态方程为:
同样,根据公式(5)和(7)可计算B车选择加速通过的复制动态方程为:
A车的复制动态方程说明B车加速通过概率为y时,A车是如何调整自己的加速通过概率x来使系统达到平衡的;同理,B车也根据自己的复制动态方程来调整自己的加速通过概率y。式(8)和式(9)组成了动态博弈系统,A车通过式(8)来调整自己的加速通行概率x,B车通过式(9)来调整自己的加速通行概率y,因为概率发生变化,复制动态方程也随之发生改变,此时两车再次对自己的通行概率进行修改,直至两车各自加速通过概率的调整量都变为0,此时系统达到均衡。
通过求解式(8)和式(9)的零点解,可求解出整个动态博弈系统的均衡点,当系统中两车加速通过的概率达到这些点时,表示博弈系统已经达到均衡,概率不再发生变化。
步骤五,均衡点稳定性判别。通过步骤四计算出的均衡点,未必都是稳定的,因为当处于均衡点的两车加速通过概率发生微小的扰动时,系统未必能恢复到这些点的位置。因此需判断这些均衡点的稳定性,来选择最佳的决策。均衡点稳定性的判别需要应用演化博弈稳定策略,即构造雅克比矩阵,并计算矩阵的秩和迹。构造的雅克比矩阵如下:
将所有均衡点代入雅克比矩阵中,分别计算矩阵的秩与迹,对于均衡点类型的判别,由博弈稳定策略理论,当雅克比矩阵的秩大于0,迹小于0时,该均衡点为ESS(进化稳定策略)稳定点。由此可从多个计算出的均衡点中确定稳定均衡点。
步骤六,按稳定均衡点的策略行驶。通过步骤五可确定出唯一稳定均衡点(x,y),则两车可根据稳定点策略集进行行驶,即稳定均衡点x>y时,A车加速通过,B车减速避让;稳定均衡点x<y时,A车减速避让,B车加速通过。
Claims (6)
1.一种基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法,其特征在于,包括以下步骤:
步骤一,利用DSRC通讯方法识别目标车辆;
步骤二,判断两车之间是否存在冲突;两车以当前速度、加速度正常行驶是否会于同一时刻到达冲突点发生碰撞,冲突点为匝道与主路中心线的交点;应用冲突时间差△T来判断两车之间的冲突;
步骤三,建立博弈模型;应用子博弈完美纳什均衡动态博弈理论决策车辆交汇行为;
步骤四,计算均衡点;
根据步骤三中确定的各自的期望收益,计算复制动态方程,两车通过对方的复制动态方程不断调整自己的通行概率;
步骤五,判断均衡点的稳定性,来选择最佳的决策;
步骤六,按稳定均衡点的策略行驶。
2.根据权利要求1所述的一种基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法,其特征在于:
所述冲突时间差△T,是博弈系统开始时刻起,两车在保持当前车速以及加速度的情况下,到达冲突点的时间差,△T越小,则发生冲突的时间差越小,表示冲突可能性越大,当△T为0时,两车刚好在同一时刻到达冲突点发生碰撞;而△T越大,表示两车发生冲突的可能性越小;
取3.5s为冲突时间差阈值△TM对冲突时间差进行判断;△T小于△TM时,继续进行动态博弈,当△T大于△TM时,两车只需以当前行驶状态即可安全通过冲突点,则结束博弈系统;
△T的计算与主路A车以及匝道B车的速度v、加速度a以及从当前位置到达冲突点的距离L有关;计算公式如下:
式中,vA、vB分别为A、B两车速度,aA、aB分别为两车当前时刻的加速度,LA、LB为两车到达冲突点的距离。
3.根据权利要求1所述的一种基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法,其特征在于:
所述应用子博弈完美纳什均衡动态博弈理论决策车辆交汇行为,具体步骤如下:
首先,需要确定博弈体系三要素:
(1)博弈参与主体对象:主路机动车A与匝道机动车B;
(2)博弈主体策略集:{加速通过,减速避让};
(3)确定两博弈对象的收益变量;
其次,确定A、B两车的基础收益分别为G1、G2,根据不同情况下的等待时间确定各自的损失;其中,主要损失定义为避让损失、冲突损失以及互让损失;现有定义:A车选择加速通过,B车选择减速避让时,B车的避让损失为M;A车选择减速避让,B车选择加速通过时,A车的避让损失为N;当A、B两车均选择加速通过时,两车冲突损失分别为P、Q;当A、B两车均选择减速避让时,两车的互让损失分别为J、K;
A车选择加速通过的概率为x,选择减速避让的概率为1-x;B车选择加速通过的概率为y,选择减速避让的概率为1-y;以(x,y)来表示A、B两车进行动态博弈时,A车以x的概率选择加速通过,B车以y的概率选择加速通过;则(1,0)表示A车选择加速通过,B车选择减速等待;(0,1)表示A车选择减速避让,B车选择加速通过;
再次,对A车纯策略期望收益以及混合策略期望收益进行计算;定义A车选择加速通过的纯策略期望收益为EA1,选择减速避让的纯策略期望收益为EA2,计算公式如下:
EA1=(G1-P)y+G1(1-y)=G1-Py (2)
EA2=(G1-N)y+(G1-J)(1-y)=G1-J+(J-N)y (3)
A车以x的概率选择加速通过,以1-x的概率选择减速避让的混合策略期望收益为:
计算B车的加速通过以及减速避让的纯策略期望收益EB1、EB2公式如下:
EB1=(G2-Q)x+G2(1-x)=G2-Qx (5)
EB2=(G2-M)x+(G2-K)(1-x)=G2-K+(K-M)x (6)
B车以y的概率选择加速通过,以1-y的概率选择减速避让的混合策略期望收益为:
4.根据权利要求1所述的一种基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法,其特征在于:
所述计算复制动态方程,两车通过对方的复制动态方程不断调整自己的通行概率,具体步骤如下:
根据公式(2)和(4)计算A车选择加速通过的复制动态方程为:
根据公式(5)和(7)可计算B车选择加速通过的复制动态方程为:
A车的复制动态方程说明B车加速通过概率为y时,A车是如何调整自己的加速通过概率x来使系统达到平衡的;B车根据自己的复制动态方程来调整自己的加速通过概率y;
式(8)和式(9)组成了动态博弈系统,A车通过式(8)来调整自己的加速通行概率x,B车通过式(9)来调整自己的加速通行概率y,概率发生变化,复制动态方程也随之发生改变,此时两车再次对自己的通行概率进行修改,直至两车各自加速通过概率的调整量都变为0,此时系统达到均衡;
通过求解式(8)和式(9)的零点解,求解出整个动态博弈系统的均衡点,当系统中两车加速通过的概率达到这些点时,表示博弈系统已经达到均衡,概率不再发生变化。
5.根据权利要求1所述的一种基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法,其特征在于:
所述判断均衡点的稳定性,来选择最佳的决策;具体步骤如下:
应用演化博弈稳定策略,构造雅克比矩阵,并计算矩阵的秩和迹;构造的雅克比矩阵如下:
将所有均衡点代入雅克比矩阵中,分别计算矩阵的秩与迹,对于均衡点类型的判别,由博弈稳定策略理论,当雅克比矩阵的秩大于0,迹小于0时,该均衡点为进化稳定策略ESS稳定点,从多个计算出的均衡点中确定稳定均衡点。
6.根据权利要求1所述的一种基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法,其特征在于:
所述按稳定均衡点的策略行驶,具体内容如下:
通过步骤五确定出唯一稳定均衡点(x,y),两车根据稳定点策略集进行行驶,即稳定均衡点x>y时,A车加速通过,B车减速避让;稳定均衡点x<y时,A车减速避让,B车加速通过。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910507029.1A CN110111605B (zh) | 2019-06-12 | 2019-06-12 | 基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910507029.1A CN110111605B (zh) | 2019-06-12 | 2019-06-12 | 基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110111605A true CN110111605A (zh) | 2019-08-09 |
CN110111605B CN110111605B (zh) | 2021-08-31 |
Family
ID=67494786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910507029.1A Active CN110111605B (zh) | 2019-06-12 | 2019-06-12 | 基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110111605B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110808851A (zh) * | 2019-10-16 | 2020-02-18 | 上海电力大学 | 一种基于博弈论的泛在电力物联网改革行为选择方法 |
CN110826192A (zh) * | 2019-10-15 | 2020-02-21 | 南京航空航天大学 | 一种基于纳什谈判准则的人-车合作型博弈控制方法 |
CN111038497A (zh) * | 2019-12-25 | 2020-04-21 | 苏州智加科技有限公司 | 自动驾驶控制方法、装置、车载终端及可读存储介质 |
CN111311947A (zh) * | 2020-03-02 | 2020-06-19 | 清华大学 | 一种网联环境下考虑驾驶人意图的行车风险评估方法和装置 |
CN111994090A (zh) * | 2020-09-02 | 2020-11-27 | 中国科学技术大学 | 基于混合策略博弈的驾驶人变道切入意图识别方法及系统 |
CN112348198A (zh) * | 2020-10-30 | 2021-02-09 | 上海对外经贸大学 | 一种人机混合决策的机器行为在冲突中的协调方法 |
CN112590791A (zh) * | 2020-12-16 | 2021-04-02 | 东南大学 | 一种基于博弈论的智能车换道间隙选择方法及装置 |
CN112907961A (zh) * | 2021-01-29 | 2021-06-04 | 中汽创智科技有限公司 | 一种基于车路协同的匝道汇入方法及系统 |
CN113306574A (zh) * | 2021-06-29 | 2021-08-27 | 中国科学院自动化研究所 | 一种自动驾驶路权归属决策方法、系统及设备 |
CN114261404A (zh) * | 2020-09-16 | 2022-04-01 | 华为技术有限公司 | 一种自动驾驶方法及相关装置 |
CN115131965A (zh) * | 2022-06-23 | 2022-09-30 | 重庆长安汽车股份有限公司 | 车辆控制方法、装置、系统、电子设备及存储介质 |
CN117227763A (zh) * | 2023-11-10 | 2023-12-15 | 新石器慧通(北京)科技有限公司 | 基于博弈论和强化学习的自动驾驶行为决策方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130141249A1 (en) * | 2011-12-02 | 2013-06-06 | Procongps, Inc. | Geospatial data based assessment of driver behavior |
CN103929777A (zh) * | 2014-05-08 | 2014-07-16 | 西安电子科技大学 | 基于拥塞博弈的车辆网络数据分发拥塞控制方法 |
CN104408306A (zh) * | 2014-11-24 | 2015-03-11 | 大连理工大学 | Vanet中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法 |
CN106997689A (zh) * | 2017-05-11 | 2017-08-01 | 重庆邮电大学 | 基于路口的v2p避免碰撞方法 |
CN108595823A (zh) * | 2018-04-20 | 2018-09-28 | 大连理工大学 | 一种联合驾驶风格和博弈理论的自主车换道策略的计算方法 |
CN109727470A (zh) * | 2019-01-08 | 2019-05-07 | 清华大学 | 一种分布式智能网联汽车交叉路口复杂场景通行决策方法 |
-
2019
- 2019-06-12 CN CN201910507029.1A patent/CN110111605B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130141249A1 (en) * | 2011-12-02 | 2013-06-06 | Procongps, Inc. | Geospatial data based assessment of driver behavior |
CN103929777A (zh) * | 2014-05-08 | 2014-07-16 | 西安电子科技大学 | 基于拥塞博弈的车辆网络数据分发拥塞控制方法 |
CN104408306A (zh) * | 2014-11-24 | 2015-03-11 | 大连理工大学 | Vanet中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法 |
CN106997689A (zh) * | 2017-05-11 | 2017-08-01 | 重庆邮电大学 | 基于路口的v2p避免碰撞方法 |
CN108595823A (zh) * | 2018-04-20 | 2018-09-28 | 大连理工大学 | 一种联合驾驶风格和博弈理论的自主车换道策略的计算方法 |
CN109727470A (zh) * | 2019-01-08 | 2019-05-07 | 清华大学 | 一种分布式智能网联汽车交叉路口复杂场景通行决策方法 |
Non-Patent Citations (2)
Title |
---|
冯明放著: "《中西部连片特困地区生态移民问题探索》", 31 December 2017 * |
刘小明等: "基于重复博弈的无灯控交叉口驾驶员行为模型", 《中国公路学报》 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110826192B (zh) * | 2019-10-15 | 2024-02-13 | 南京航空航天大学 | 一种基于纳什谈判准则的人-车合作型博弈控制方法 |
CN110826192A (zh) * | 2019-10-15 | 2020-02-21 | 南京航空航天大学 | 一种基于纳什谈判准则的人-车合作型博弈控制方法 |
CN110808851A (zh) * | 2019-10-16 | 2020-02-18 | 上海电力大学 | 一种基于博弈论的泛在电力物联网改革行为选择方法 |
CN111038497A (zh) * | 2019-12-25 | 2020-04-21 | 苏州智加科技有限公司 | 自动驾驶控制方法、装置、车载终端及可读存储介质 |
CN111311947A (zh) * | 2020-03-02 | 2020-06-19 | 清华大学 | 一种网联环境下考虑驾驶人意图的行车风险评估方法和装置 |
CN111994090A (zh) * | 2020-09-02 | 2020-11-27 | 中国科学技术大学 | 基于混合策略博弈的驾驶人变道切入意图识别方法及系统 |
CN111994090B (zh) * | 2020-09-02 | 2021-11-02 | 中国科学技术大学 | 基于混合策略博弈的驾驶人变道切入意图识别方法及系统 |
CN114261404A (zh) * | 2020-09-16 | 2022-04-01 | 华为技术有限公司 | 一种自动驾驶方法及相关装置 |
CN112348198A (zh) * | 2020-10-30 | 2021-02-09 | 上海对外经贸大学 | 一种人机混合决策的机器行为在冲突中的协调方法 |
CN112590791A (zh) * | 2020-12-16 | 2021-04-02 | 东南大学 | 一种基于博弈论的智能车换道间隙选择方法及装置 |
CN112907961A (zh) * | 2021-01-29 | 2021-06-04 | 中汽创智科技有限公司 | 一种基于车路协同的匝道汇入方法及系统 |
CN112907961B (zh) * | 2021-01-29 | 2022-04-15 | 中汽创智科技有限公司 | 一种基于车路协同的匝道汇入方法及系统 |
CN113306574A (zh) * | 2021-06-29 | 2021-08-27 | 中国科学院自动化研究所 | 一种自动驾驶路权归属决策方法、系统及设备 |
CN113306574B (zh) * | 2021-06-29 | 2022-11-08 | 中国科学院自动化研究所 | 一种自动驾驶路权归属决策方法、系统及设备 |
CN115131965B (zh) * | 2022-06-23 | 2023-07-07 | 重庆长安汽车股份有限公司 | 车辆控制方法、装置、系统、电子设备及存储介质 |
CN115131965A (zh) * | 2022-06-23 | 2022-09-30 | 重庆长安汽车股份有限公司 | 车辆控制方法、装置、系统、电子设备及存储介质 |
CN117227763A (zh) * | 2023-11-10 | 2023-12-15 | 新石器慧通(北京)科技有限公司 | 基于博弈论和强化学习的自动驾驶行为决策方法和装置 |
CN117227763B (zh) * | 2023-11-10 | 2024-02-20 | 新石器慧通(北京)科技有限公司 | 基于博弈论和强化学习的自动驾驶行为决策方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110111605B (zh) | 2021-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110111605A (zh) | 基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法 | |
CN109035862B (zh) | 一种基于车车通信的多车协同换道控制方法 | |
CN108806252B (zh) | 一种高速公路混合交通流协同优化控制方法 | |
CN108595823B (zh) | 一种联合驾驶风格和博弈理论的自主车换道策略计算方法 | |
Aycin et al. | Comparison of car-following models for simulation | |
US9799224B2 (en) | Platoon travel system | |
CN107340769A (zh) | 车辆控制系统、车辆控制方法以及车辆控制程序 | |
CN110070707A (zh) | 一种实现协同式自适应巡航控制车队组队与分离的方法 | |
CN110053619A (zh) | 车辆控制装置 | |
CN107272687A (zh) | 一种自动驾驶公交车辆的驾驶行为决策系统 | |
CN108885826A (zh) | 车辆控制系统、车辆控制方法及车辆控制程序 | |
CN108698592A (zh) | 车辆控制系统、车辆控制方法及车辆控制程序 | |
CN106573618A (zh) | 车辆的行驶控制装置及方法 | |
CN107310548A (zh) | 车辆控制系统、车辆控制方法以及车辆控制程序 | |
CN109074730A (zh) | 车辆控制系统、车辆控制方法及车辆控制程序 | |
CN114613142B (zh) | 一种基于规则的自动驾驶交叉口车辆换道控制方法 | |
CN106652564A (zh) | 车联网环境下的交通流元胞自动机建模方法 | |
CN108885828A (zh) | 车辆控制系统、车辆控制方法及车辆控制程序 | |
CN111768612A (zh) | 基于c-v2x的车辆编队行驶策略控制方法 | |
CN108701414A (zh) | 车辆控制装置、车辆控制方法及车辆控制程序 | |
CN112498351A (zh) | 一种基于v2v的自动驾驶优化系统及方法 | |
CN111845754A (zh) | 一种基于边缘计算和群智算法的自动驾驶车辆的决策预测方法 | |
Zhang et al. | A cruise control method for connected vehicle systems considering side vehicles merging behavior | |
Pan et al. | Research on the behavior decision of connected and autonomous vehicle at the unsignalized intersection | |
CN114611292A (zh) | 一种基于元胞自动机的混入acc和cacc车辆的交通流特性仿真方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |