CN110936954A - 一种考虑车辆双向交互的智能车预测决策融合方法 - Google Patents

一种考虑车辆双向交互的智能车预测决策融合方法 Download PDF

Info

Publication number
CN110936954A
CN110936954A CN202010002358.3A CN202010002358A CN110936954A CN 110936954 A CN110936954 A CN 110936954A CN 202010002358 A CN202010002358 A CN 202010002358A CN 110936954 A CN110936954 A CN 110936954A
Authority
CN
China
Prior art keywords
vehicle
state
ego
steps
intelligent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010002358.3A
Other languages
English (en)
Other versions
CN110936954B (zh
Inventor
黄云丰
赵万忠
邹松春
王春燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202010002358.3A priority Critical patent/CN110936954B/zh
Publication of CN110936954A publication Critical patent/CN110936954A/zh
Application granted granted Critical
Publication of CN110936954B publication Critical patent/CN110936954B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/08Active safety systems predicting or avoiding probable or impending collision or attempting to minimise its consequences
    • B60W30/095Predicting travel path or likelihood of collision
    • B60W30/0956Predicting travel path or likelihood of collision the prediction being responsive to traffic or environmental parameters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Automation & Control Theory (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Traffic Control Systems (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)

Abstract

本发明公开了一种考虑车辆双向交互的智能车预测决策融合方法,包括步骤如下:建立POMDP模型;通过车载感知系统获取自车及周围车辆的初始状态,得到初始状态和初始观察;将第k步观察输入IMM算法更新得到模型转移矩阵;预测周围车辆的纵向运动,计算得到第k步的置信状态;通过POMDP算法计算出最大状态‑动作值函数,并取相应的动作作为智能车第k步的动作;将k步的状态和动作代入状态转移函数计算得到k+1步的状态和观察;判断迭代次数是否达到最大迭代次数。本发明将IMM算法与POMPD算法相结合,解决了传统方法预测结果不准确,决策结果不满足安全性要求的问题。

Description

一种考虑车辆双向交互的智能车预测决策融合方法
技术领域
本发明属于智能车决策技术领域,具体指代一种考虑车辆双向交互的智能车预测决策融合方法。
背景技术
随着人工智能的发展,智能汽车的研究成为汽车领域的研究热点。智能车主要包括感知系统、决策系统以及执行系统。决策系统作为智能汽车的关键部分,可分为三个部分:周围车辆运动预测部分、决策部分和轨迹规划部分;周围车辆运动预测部分需要预测出周围车辆未来的行驶状态;决策部分需要根据车辆的行驶状态以及周围的车辆状态做出安全可行的意图决策;轨迹规划部分则根据决策结果给出相应的行驶轨迹。周围车辆运动状态的预测通常仅考虑周围车辆自车的状态参数而忽略智能车对其的影响,导致预测结果不准确,与实际相差较大。目前,大多数车辆的决策系统仅考虑周围车辆当前的状态,而没有考虑周围车辆未来行驶状态的变化,使决策系统做出危险的行为决策,导致智能车与周围车辆发生碰撞。因此,在决策过程中有必要对周围车辆未来的运动状态进行预测。
发明内容
针对于上述现有技术的不足,本发明的目的在于提供一种考虑车辆双向交互的智能车预测决策融合方法,以解决现有技术中车辆预测结果不准确,决策结果不可行的问题;本发明能够有效的对周围车辆的运动状态进行预测,同时使智能车决策出安全可行的行驶意图和行驶轨迹。
为达到上述目的,本发明采用的技术方案如下:
本发明的一种考虑车辆双向交互的智能车预测决策融合方法,包括步骤如下:
步骤1:建立POMDP(部分可观测马尔可夫决策)模型:{S,O,A,P,R},其中,S为车辆状态集合,O为观察集合,A为动作集合,P为状态转移函数,R为回报函数;
步骤2:通过车载感知系统获取自车及周围车辆的初始状态,得到初始状态s0和初始观察o0
步骤3:将第k步观察ok输入IMM(交互多模型)算法更新得到模型转移矩阵Tk,k=0,1,2,…,N;预测周围车辆的纵向运动,计算得到第k步的置信状态;
步骤4:通过POMDP算法计算出最大状态-动作值函数Q(sk,ak)max,并取相应的动作作为智能车第k步的动作Ak=ak
步骤5:将k步的状态sk和动作Ak代入状态转移函数P计算得到k+1步的状态sk+1和观察ok+1
步骤6:判断迭代次数是否达到最大迭代次数N;若达到最大迭代次数,则结束;若未达到迭代次数,则k=k+1并返回步骤3。
优选的,所述步骤1具体包括:
11)车辆状态集合S包括智能车状态以及周围车辆状态,具体为:
S={sego,s1,s2,…,sn}
式中,sego为智能车状态,si为第i辆周围车辆状态,i=1,2,…,n,n为周围车辆数目;
sego,si具体为:
sego={xego,yegoego,vego},
Figure BDA0002353959740000021
式中,xego为智能车x方向的坐标,yego为智能车y方向坐标,θego为智能车横摆角,vego为智能车质心速度,xi为第i辆周围车辆x方向的坐标,yi为第i辆周围车辆y方向的坐标,vi为第i辆周围车辆x方向的速度,
Figure BDA0002353959740000022
为第i辆周围车辆隐藏状态车辆加速度;
12)观察集合O具体为:
O={Δx1,Δv1,Δx2,Δv2,…,Δxi,Δvi}
式中,Δxi为智能车与第i辆周围车辆x方向的相对距离,Δvi为智能车与第i辆周围车辆x方向的相对速度;
Δxi,Δvi具体为:
Δxi=xego-xi-L,Δvi=vegocosθego-vi
式中,L为车辆长度;
13)动作集合A具体为:
A={LT,ST,RT};
式中,LT表示车辆横摆角向左转一个角度,ST表示横摆角不变,RT表示横摆角向右转一个角度;将驾驶动作参数化为:
LT=1°,ST=0,RT=-1°
14)状态转移函数P具体为:
Figure BDA0002353959740000031
式中,am为IMM算法中周围车辆第m个加速模型,m为加速模型的个数;
15)回报函数R具体为:
Figure BDA0002353959740000032
式中,
Figure BDA0002353959740000033
Figure BDA0002353959740000034
c0为车辆宽度的一半,Sr为道路条件参数。
优选的,所述步骤3具体包括:
31)周围车辆加速模型为:
Figure BDA0002353959740000035
32)第i辆周围车辆在k步模型转移矩阵
Figure BDA0002353959740000036
为3阶矩阵,具体为:
Figure BDA0002353959740000037
Figure BDA0002353959740000038
33)通过k-1步的模型预测概率
Figure BDA0002353959740000041
和加速度
Figure BDA0002353959740000042
更新得到k步的模型预测概率
Figure BDA0002353959740000043
即得到k步的置信状态
Figure BDA0002353959740000044
优选的,所述步骤5中的状态值函数Q(sk,ak)具体为:
Figure BDA0002353959740000045
式中,γ为折扣因子,R为回报值,sk为k步的状态,ak为k步的动作。
本发明的有益效果:
本发明将IMM算法与POMPD算法相结合,解决了传统方法预测结果不准确,决策结果不满足安全性要求的问题。在决策过程中采用POMDP算法,考虑了周围车辆未来运动状态对智能车的影响,在预测过程中,通过改进IMM算法中的模型转移矩阵,考虑了智能车对周围车辆的影响,使预测更加符合实际情况,预测结果更加准确,从而使决策部分的决策结果更加安全可行。
附图说明
图1为本发明预测决策融合方法整体框图。
具体实施方式
为了便于本领域技术人员的理解,下面结合实施例与附图对本发明作进一步的说明,实施方式提及的内容并非对本发明的限定。
参照图1所示,本发明的一种考虑车辆双向交互的智能车预测决策融合方法,包括步骤如下:
步骤1:建立POMDP(部分可观测马尔可夫决策)模型:{S,O,A,P,R},其中,S为车辆状态集合,O为观察集合,A为动作集合,P为状态转移函数,R为回报函数;其中,
11)车辆状态集合S包括智能车状态以及周围车辆状态,具体为:
S={sego,s1,s2,…,sn}
式中,sego为智能车状态,si为第i辆周围车辆状态,i=1,2,…,n,n为周围车辆数目;
sego,si具体为:
sego={xego,yegoego,vego},
Figure BDA0002353959740000046
式中,xego为智能车x方向的坐标,yego为智能车y方向坐标,θego为智能车横摆角,vego为智能车质心速度,xi为第i辆周围车辆x方向的坐标,yi为第i辆周围车辆y方向的坐标,vi为第i辆周围车辆x方向的速度,
Figure BDA0002353959740000051
为第i辆周围车辆隐藏状态车辆加速度;
12)观察集合O具体为:
O={Δx1,Δv1,Δx2,Δv2,…,Δxi,Δvi}
式中,Δxi为智能车与第i辆周围车辆x方向的相对距离,Δvi为智能车与第i辆周围车辆x方向的相对速度;
Δxi,Δvi具体为:
Δxi=xego-xi-L,Δvi=vegocosθego-vi
式中,L为车辆长度;
13)动作集合A具体为:
A={LT,ST,RT};
式中,LT表示车辆横摆角向左转一个角度,ST表示横摆角不变,RT表示横摆角向右转一个角度;将驾驶动作参数化为:
LT=1°,ST=0,RT=-1°
14)状态转移函数P具体为:
Figure BDA0002353959740000052
式中,am为IMM算法中周围车辆第m个加速模型,m为加速模型的个数;
15)回报函数R具体为:
Figure BDA0002353959740000061
式中,
Figure BDA0002353959740000062
Figure BDA0002353959740000063
c0为车辆宽度的一半,Sr为道路条件参数。
步骤2:通过车载感知系统获取自车及周围车辆的初始状态,得到初始状态s0和初始观察o0
步骤3:将第k步观察ok输入IMM(交互多模型)算法更新得到模型转移矩阵Tk,k=0,1,2,…,N;预测周围车辆的纵向运动,计算得到第k步的置信状态;
31)周围车辆加速模型为:
Figure BDA0002353959740000064
32)第i辆周围车辆在k步模型转移矩阵
Figure BDA0002353959740000065
为3阶矩阵,具体为:
Figure BDA0002353959740000066
Figure BDA0002353959740000067
33)通过k-1步的模型预测概率
Figure BDA0002353959740000068
和加速度
Figure BDA0002353959740000069
更新得到k步的模型预测概率
Figure BDA00023539597400000610
即得到k步的置信状态
Figure BDA00023539597400000611
步骤4:通过POMDP算法计算出最大状态-动作值函数Q(sk,ak)max,并取相应的动作作为智能车第k步的动作Ak=ak
步骤5:将k步的状态sk和动作Ak代入状态转移函数P计算得到k+1步的状态sk+1和观察ok+1
状态值函数Q(sk,ak)具体为:
Figure BDA0002353959740000071
式中,γ为折扣因子,R为回报值,sk为k步的状态,ak为k步的动作。
步骤6:判断迭代次数是否达到最大迭代次数N;若达到最大迭代次数,则结束;若未达到迭代次数,则k=k+1并返回步骤3。
本发明具体应用途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进,这些改进也应视为本发明的保护范围。

Claims (4)

1.一种考虑车辆双向交互的智能车预测决策融合方法,其特征在于,包括步骤如下:
步骤1:建立部分可观测马尔可夫决策模型:{S,O,A,P,R},其中,S为车辆状态集合,O为观察集合,A为动作集合,P为状态转移函数,R为回报函数;
步骤2:通过车载感知系统获取自车及周围车辆的初始状态,得到初始状态s0和初始观察o0
步骤3:将第k步观察ok输入交互多模型算法更新得到模型转移矩阵Tk,k=0,1,2,…,N;预测周围车辆的纵向运动,计算得到第k步的置信状态;
步骤4:通过部分可观测马尔可夫决策算法计算出最大状态-动作值函数Q(sk,ak)max,并取相应的动作作为智能车第k步的动作Ak=ak
步骤5:将k步的状态sk和动作Ak代入状态转移函数P计算得到k+1步的状态sk+1和观察ok+1
步骤6:判断迭代次数是否达到最大迭代次数N;若达到最大迭代次数,则结束;若未达到迭代次数,则k=k+1并返回步骤3。
2.根据权利要求1所述的考虑车辆双向交互的智能车预测决策融合方法,其特征在于,所述步骤1具体包括:
11)车辆状态集合S包括智能车状态以及周围车辆状态,具体为:
Figure FDA0002353959730000011
式中,sego为智能车状态,si为第i辆周围车辆状态,i=1,2,…,n,n为周围车辆数目;
sego,si具体为:
Figure FDA0002353959730000012
式中,xego为智能车x方向的坐标,yego为智能车y方向坐标,θego为智能车横摆角,vego为智能车质心速度,xi为第i辆周围车辆x方向的坐标,yi为第i辆周围车辆y方向的坐标,vi为第i辆周围车辆x方向的速度,
Figure FDA0002353959730000013
为第i辆周围车辆隐藏状态车辆加速度;
12)观察集合O具体为:
O={Δx1,Δv1,Δx2,Δv2,…,Δxi,Δvi}
式中,Δxi为智能车与第i辆周围车辆x方向的相对距离,Δvi为智能车与第i辆周围车辆x方向的相对速度;
Δxi,Δvi具体为:
Δxi=xego-xi-L,Δvi=vegocosθego-vi
式中,L为车辆长度;
13)动作集合A具体为:
A={LT,ST,RT};
式中,LT表示车辆横摆角向左转一个角度,ST表示横摆角不变,RT表示横摆角向右转一个角度;将驾驶动作参数化为:
LT=1°,ST=0,RT=-1°
14)状态转移函数P具体为:
Figure FDA0002353959730000021
式中,am为IMM算法中周围车辆第m个加速模型,m为加速模型的个数;
15)回报函数R具体为:
Figure FDA0002353959730000022
式中,
Figure FDA0002353959730000023
Figure FDA0002353959730000024
c0为车辆宽度的一半,Sr为道路条件参数。
3.根据权利要求1所述的考虑车辆双向交互的智能车预测决策融合方法,其特征在于,所述步骤3具体包括:
31)周围车辆加速模型为:
Figure FDA0002353959730000031
32)第i辆周围车辆在k步模型转移矩阵
Figure FDA0002353959730000032
为3阶矩阵,具体为:
Figure FDA0002353959730000033
Figure FDA0002353959730000034
33)通过k-1步的模型预测概率
Figure FDA0002353959730000035
和加速度
Figure FDA0002353959730000036
更新得到k步的模型预测概率
Figure FDA0002353959730000037
即得到k步的置信状态
Figure FDA0002353959730000038
4.根据权利要求1所述的考虑车辆双向交互的智能车预测决策融合方法,其特征在于,所述步骤5中的状态值函数Q(sk,ak)具体为:
Figure FDA0002353959730000039
式中,γ为折扣因子,R为回报值,sk为k步的状态,ak为k步的动作。
CN202010002358.3A 2020-01-02 2020-01-02 一种考虑车辆双向交互的智能车预测决策融合方法 Active CN110936954B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010002358.3A CN110936954B (zh) 2020-01-02 2020-01-02 一种考虑车辆双向交互的智能车预测决策融合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010002358.3A CN110936954B (zh) 2020-01-02 2020-01-02 一种考虑车辆双向交互的智能车预测决策融合方法

Publications (2)

Publication Number Publication Date
CN110936954A true CN110936954A (zh) 2020-03-31
CN110936954B CN110936954B (zh) 2020-12-01

Family

ID=69913764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010002358.3A Active CN110936954B (zh) 2020-01-02 2020-01-02 一种考虑车辆双向交互的智能车预测决策融合方法

Country Status (1)

Country Link
CN (1) CN110936954B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113511222A (zh) * 2021-08-27 2021-10-19 清华大学 场景自适应式车辆交互行为决策与预测方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107958269A (zh) * 2017-11-28 2018-04-24 江苏大学 一种基于隐马尔可夫模型的行车危险度预测方法
US20180286220A1 (en) * 2017-04-03 2018-10-04 Here Global B.V. Vehicle traffic state determination
CN109472984A (zh) * 2018-12-27 2019-03-15 苏州科技大学 基于深度强化学习的信号灯控制方法、系统和存储介质
CN109572550A (zh) * 2018-12-28 2019-04-05 西安航空学院 一种行车轨迹预测方法、系统、计算机设备及存储介质
CN109677341A (zh) * 2018-12-21 2019-04-26 深圳市元征科技股份有限公司 一种车辆信息融合决策方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180286220A1 (en) * 2017-04-03 2018-10-04 Here Global B.V. Vehicle traffic state determination
CN107958269A (zh) * 2017-11-28 2018-04-24 江苏大学 一种基于隐马尔可夫模型的行车危险度预测方法
CN109677341A (zh) * 2018-12-21 2019-04-26 深圳市元征科技股份有限公司 一种车辆信息融合决策方法及装置
CN109472984A (zh) * 2018-12-27 2019-03-15 苏州科技大学 基于深度强化学习的信号灯控制方法、系统和存储介质
CN109572550A (zh) * 2018-12-28 2019-04-05 西安航空学院 一种行车轨迹预测方法、系统、计算机设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113511222A (zh) * 2021-08-27 2021-10-19 清华大学 场景自适应式车辆交互行为决策与预测方法及装置
CN113511222B (zh) * 2021-08-27 2023-09-26 清华大学 场景自适应式车辆交互行为决策与预测方法及装置

Also Published As

Publication number Publication date
CN110936954B (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
CN110834644B (zh) 一种车辆控制方法、装置、待控制车辆及存储介质
CN108919795B (zh) 一种自动驾驶汽车换道决策方法及装置
CN110597245A (zh) 基于二次型规划和神经网络的自动驾驶换道轨迹规划方法
CN112249008B (zh) 针对复杂动态环境的无人驾驶汽车预警方法
CN107479547B (zh) 基于示教学习的决策树行为决策算法
CN106740846A (zh) 一种双模式切换的电动汽车自适应巡航控制方法
CN103754221A (zh) 一种车辆自适应巡航控制系统
US20220105934A1 (en) Trailing vehicle positioning system based on detected pressure zones
Zhang et al. Data-driven based cruise control of connected and automated vehicles under cyber-physical system framework
Zhang et al. Automatic vehicle parallel parking design using fifth degree polynomial path planning
CN112578672B (zh) 基于底盘非线性的无人驾驶汽车轨迹控制系统及其轨迹控制方法
CN114889625A (zh) 基于安全势场理论的道路弯道处车辆跟驰模型的建立方法
Liu et al. Application of optimal control method to path tracking problem of vehicle
CN115662131B (zh) 网联环境下道路事故路段的多车道协同换道方法
CN110936954B (zh) 一种考虑车辆双向交互的智能车预测决策融合方法
CN116758741A (zh) 一种多维度不确定性感知的智能汽车碰撞概率预测方法
Khalifa et al. Platooning of car-like vehicles in urban environments: Longitudinal control considering actuator dynamics, time delays, and limited communication capabilities
CN113033902B (zh) 一种基于改进深度学习的自动驾驶换道轨迹规划方法
CN114442630A (zh) 一种基于强化学习和模型预测的智能车规划控制方法
Zhao et al. Indirect shared control strategy for human-machine cooperative driving on hazardous curvy roads
Shen et al. Energy-efficient reactive and predictive connected cruise control
Hoekstra et al. Evolving Markov chain models of driving conditions using onboard learning
Li et al. Distributed MPC for multi-vehicle cooperative control considering the surrounding vehicle personality
Li et al. Lane‐keeping system design considering driver's nervousness via scene analysis
CN115140048A (zh) 一种自动驾驶行为决策与轨迹规划模型与方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant