CN116279484A - 一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法 - Google Patents

一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法 Download PDF

Info

Publication number
CN116279484A
CN116279484A CN202310305219.1A CN202310305219A CN116279484A CN 116279484 A CN116279484 A CN 116279484A CN 202310305219 A CN202310305219 A CN 202310305219A CN 116279484 A CN116279484 A CN 116279484A
Authority
CN
China
Prior art keywords
vehicle
lane change
change
lane
vehicles
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310305219.1A
Other languages
English (en)
Inventor
王晨
李梦芸
徐嗣轩
周威
施明亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202310305219.1A priority Critical patent/CN116279484A/zh
Publication of CN116279484A publication Critical patent/CN116279484A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/18Propelling the vehicle
    • B60W30/18009Propelling the vehicle related to particular drive situations
    • B60W30/18163Lane change; Overtaking manoeuvres
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/08Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to drivers or passengers
    • B60W40/09Driving style or behaviour
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0002Automatic control, details of type of controller or control system architecture
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0019Control system elements or transfer functions
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0019Control system elements or transfer functions
    • B60W2050/0028Mathematical models, e.g. for simulation
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0019Control system elements or transfer functions
    • B60W2050/0028Mathematical models, e.g. for simulation
    • B60W2050/0031Mathematical model of the vehicle
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法,该方法包括基于车辆轨迹数据提取表示换道车辆与周围车辆博弈状态的特征向量及车辆换道决策观测值,建立强制换道观测数据集;利用高斯混合聚类方法,将车辆分为两种驾驶风格,根据换道车辆和目标车道后车的不同驾驶风格,将换道博弈分为四类,将观测数据集划分为相对应的四个子集;根据四个子集的车辆轨迹数据,分别利用演化博弈论EGT及碰撞时间指标输出换道决策;建立融合演化博弈论和机器学习的强制换道模型EGT‑ML,将基于EGT的换道决策加入训练集中,并在训练集上进行模型训练,在观测数据集上评价预测效果,结果表明模型具有较高的准确率和较强的鲁棒性。

Description

一种融合演化博弈与机器学习的多风格驾驶者强制换道预测 方法
技术领域
本发明属于道路交通领域,尤其提出一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法。
背景技术
强制换道(MLC)指驾驶者由于交通政策或自身驾驶需求,必须将车辆由当前车道换道至目标车道的行为,强制换道通常发生在高速路交织区、上下匝道、交叉口进口道等路段。通常来说,相比于驾驶者为改善自身驾驶环境的自由换道行为(DLC),强制换道行为更容易引发交通震荡,会对交通效率以及交通安全产生较大的负面影响。因此,分析、建模、预测强制换道行为对于提高道路交通安全和效率具有重要意义。专利202210325865.X《一种基于复合模型的车辆换道意图的预测方法》公开了一种基于复合模型的车辆换道意图的预测方法,包括:采集本车和周围车辆的速度和位置信息,将换道车辆的轨迹信息构成训练集A;建立三个隐马尔可夫模型,分别为向左换道模型,车道保持模型,向右换道模型,将训练集A输入三个模型中进行初步预测,分别输出对应的概率;将换道车辆与周围车辆的纵向距离和模型输出概率结合形成训练集B,并输入多层感知机模型中,以换道车辆的真实换道意图作为标签,训练多层感知机模型;最终实时采集目标车辆以及周围车辆的速度和位置信息,输入训练后的模型预测车辆换道意图。
目前关于强制换道决策预测的方法已有较多研究成果,但现有方法的主要缺点包括:1.机器学习模型对换道决策的预测精度较高,但模型需要大量数据进行训练,容易受到数据噪声的影响,鲁棒性较低,且可解释性方面有所欠缺,无法解释驾驶者的驾驶行为随交通状态的变化而演变的机理;2.物理模型中的相关参数均具有物理含义,可解释性强,但其预先假设驾驶者的驾驶行为,模型仅包含对换道决策影响较为显著的部分因素,忽略了其余的潜在影响因素,并且没有考虑不同类型驾驶者的差异,预测准确率较低。
发明内容
发明目的:针对这些问题,本发明提供一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法。主要解决的技术问题是:1.基于车辆轨迹数据,使用高斯混合聚类方法,将驾驶者划分为两类驾驶风格。2.建立融合演化博弈论EGT(Evolutionary GameTheory)和机器学习ML(Machine Learning)的多风格驾驶者强制换道模型EGT-ML,模型具有较高的预测准确率和较强的鲁棒性。
技术方案:为了解决上述技术问题,本发明提出一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法,该方法包括以下步骤:
S1.基于车辆轨迹数据提取表示换道车辆与周围车辆博弈状态的特征向量X及车辆换道决策观测值
Figure BDA0004146507390000021
构建强制换道数据集/>
Figure BDA0004146507390000022
S2.基于S1中强制换道数据集提取车辆运行特征,输入高斯混合聚类算法,将车辆聚为两类,分别对应激进型和保守型两种驾驶风格;
S3.根据换道车辆和目标车道后车的不同驾驶风格,将换道博弈分为四种类型,并将S1中强制换道数据集划分为相应的四个子集;
S4.针对S3中的四种博弈类型,基于四个子集中的车辆轨迹数据,利用演化博弈论EGT及碰撞时间TTC输出换道决策YEGT
S5.针对S3中的四种博弈类型,将强制换道数据集划分为划分训练集和测试集,并将与训练集中的特征向量X相对应的YEGT加入训练集,在训练集
Figure BDA0004146507390000023
上进行模型训练,训练得到能够根据/>
Figure BDA0004146507390000024
作为输入,输出换道决策的神经网络模型;
S6.根据步骤S1-S4获得新的
Figure BDA0004146507390000025
并输入步骤S5训练的模型中输出得到换道策略。
进一步的,所述步骤S1中的构建强制换道数据集的方法如下:
S1.1特征向量提取
NGSIM的US-101数据集包含车辆每0.1s的速度、加速度、车头中心位置坐标、车头时距等车辆的轨迹数据,基于此,提取表示换道车辆与周围车辆博弈状态的特征向量X={VSV,ASV,LSV,ΔVCF,ΔVCB,ΔVTF,ΔVTB,GTF,GTB,TTCTF,TTCTB,Vs},其中,VSV,ASV,LSV分别表示换道车辆SV的速度、加速度以及与换道终点的距离;ΔVCF,ΔVCB,ΔVTF,ΔVTB分别表示SV与当前车道前车CF、当前车道后车CB、目标车道前车TF及目标车道后车TB的速度差;GTF,GTB分别表示SV与TF、TB的车头间距,TTCTF,TTCTB分别表示车辆SV与TF、TB的碰撞时间TTC,
Figure BDA0004146507390000031
表示空间平均速度;
S1.2换道决策确定
定义
Figure BDA0004146507390000032
表示车辆换道决策的观测值,规定/>
Figure BDA0004146507390000033
表示车辆换道,/>
Figure BDA0004146507390000034
表示车辆不换道,定义车辆横向速度大于0.2m/s且1s内有向相邻车道靠近的运动趋势的时刻为换道开始时刻;定义车辆横向速度小于0.2m/s且1s内在目标车道上的横向位置保持稳定的时刻为车辆换道结束时刻,将车辆在换道开始时刻和结束时刻内的轨迹数据的/>
Figure BDA0004146507390000035
标注为1,其余时刻的/>
Figure BDA0004146507390000036
标注为0。
进一步的,所述步骤S2中的车辆驾驶风格划分方法如下:
(2.1)定义车辆速度与空间平均速度
Figure BDA0004146507390000037
的比值为速度比r,基于车辆轨迹数据,计算车辆每0.1s的速度比r和加速度a,从而计算车辆速度比的均值E(r)和方差VAR(r)以及加速度的均值E(a),将这三个特征作为高斯混合聚类算法的输入,定义聚类中心数为2,将S1中观测数据集内的车辆聚为类别1和类别2;
(2.2)分别计算类别1和类别2聚类中心的E(r)、VAR(r)以及E(a)三个特征值的均值,将均值大的聚类中的车辆作为激进型驾驶风格,另外一个聚类中的车辆作为保守型驾驶风格。
进一步的,所述步骤S3的换道博弈类型划分方法如下:
SV在制定换道决策时与目标车道后车TB发生博弈,博弈参与者SV和TB的驾驶风格集为{激进型,保守型},根据SV和TB的不同驾驶风格,将强制换道博弈分为四种类型,分别为激进型SV-激进型TB、激进型SV-保守型TB、保守型SV-激进型TB以及保守型SV-保守型TB。
进一步的,所述步骤S4的换道决策YEGT的输出方法如下:
S4.1车辆收益计算
基于S3中四个子集中的车辆轨迹数据,分别计算四种换道博弈类型中车辆的速度收益、安全收益及换道需求收益,定义TB的速度收益为TB减速让行前后的速度差Δv;定义安全收益为SV与TB间的TTCTB;定义换道需求收益为SV与换道终点的距离LSV
S4.2收益矩阵建立
在换道博弈中,博弈参与者中SV的策略集为{换道,不换道},TB的策略集为{让行,不让行},共有四种博弈策略组合,分别为{SV换道,TB让行},{SV换道,TB不让行},{SV不换道,TB让行},{SV不换道,TB不让行},基于S4.1中的车辆收益,计算四种博弈策略组合下SV和TB的收益,在{SV换道,TB让行}策略组合下,SV和TB的收益分别为A:α1TTCTB1LSV和B:α2TTCTB2Δv;在{SV换道,TB不让行}策略组合下,SV和TB的收益分别为C:-α1TTCTB和D:β2Δv-α2TTCTB;在{SV不换道,TB让行}策略组合下,SV和TB的收益分别为E:-β1LSV和F:-β2Δv;在{SV不换道,TB不让行}策略组合下,SV和TB的收益分别为G:-β1LSV和H:β2Δv,其中,α1,β1,α2,β2为车辆收益的收益因子,取值范围均为(0,1),且满足α11=1,α22=1,建立换道博弈收益矩阵为
Figure BDA0004146507390000041
其中,A~H分别为SV和TB的收益;
S4.3车辆换道与让行概率计算
基于S4.2中的收益矩阵,建立SV的换道概率p1和TB的让行概率p2随时间演化的动态复制方程如下,据此计算每一时刻p1和p2的值;
Figure BDA0004146507390000042
其中,式①、式②分别为p1、p2随时间演化的的动态复制方程,SV换道期望收益为W1=Ap2+C(1-p2),不换道期望收益为W2=Ep2+G(1-p2),期望收益为WSV=W1p1+W2(1-p1),TB让行期望收益为w1=Bp1+F(1-p1),不让行期望收益为w2=Dp1+H(1-p1),期望收益为wTB=w1p2+w2(1-p2),其中,A~H分别为S4.2中收益矩阵中的收益,p1、p2的初始值分别为强制换道数据集中换道车辆数和让行车辆数与US-101数据集车辆数的比值;
S4.4换道决策输出
基于S3中四个子集中的车辆轨迹数据,计算SV与TF、TB间的TTCTF和TTCTB,结合S4.3中计算出的p1和p2的值,输出换道决策,规定当SV的换道概率p1和TB的让行概率p2均大于0.5,且TTCTF和TTCTB不小于保证安全的最小值时,输出YEGT=1,即SV采取换道行为,否则,输出YEGT=0,即SV不换道,保持原车道行驶;
Figure BDA0004146507390000051
其中,p1、p2分别为SV的换道概率和TB的让行概率,TTCTF、TTCTB分别是SV与TF、TB的TTC,
Figure BDA0004146507390000052
为保证安全的最小值。
进一步的,步骤S5中神经网络模型的损失函数如下:
Figure BDA0004146507390000053
其中,
Figure BDA0004146507390000054
为观测值,YEGT为基于EGT的输出值,p为模型输出车辆换道的概率,p>0.5时,模型输出值Y=1,否则,Y=0,α为衡量模型输出与YEGT之间损失的权重。
有益效果:与现有技术相比,本发明的技术方案具有以下有益效果:
1.基于车辆轨迹数据,使用高斯混合聚类算法将车辆分为两种驾驶风格,考虑了车辆驾驶风格的差异;
2.建立融合演化博弈论和机器学习的多风格驾驶者强制换道模型,相较于传统的ML模型,模型在保证预测准确率的前提下,具有较强的鲁棒性。
附图说明
图1融合演化博弈和机器学习训练流程图;
图2车辆换道概率及让行概率演化路径图;
图3融合演化博弈和机器学习在测试集上的ROC曲线及PR曲线图;
图4融合演化博弈和机器学习敏感性分析图。
具体实施方式
以下将结合附图和具体实施,对本发明的技术方案及效果进行详细说明。
如图1所示,本发明提出一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法,该方法包括以下步骤:
S1.基于车辆轨迹数据提取表示换道车辆与周围车辆博弈状态的特征向量X及车辆换道决策观测值
Figure BDA0004146507390000061
构建强制换道数据集/>
Figure BDA0004146507390000062
S2.基于S1中强制换道数据集提取车辆运行特征,输入高斯混合聚类算法,将车辆聚为两类,分别对应激进型和保守型两种驾驶风格;
S3.根据换道车辆和目标车道后车的不同驾驶风格,将换道博弈分为四种类型,并将S1中强制换道数据集划分为相应的四个子集;
S4.针对S3中的四种博弈类型,基于四个子集中的车辆轨迹数据,利用演化博弈论EGT及碰撞时间TTC输出换道决策YEGT
S5.针对S3中的四种博弈类型,将强制换道数据集划分为划分训练集和测试集,并将与训练集中的特征向量X相对应的YEGT加入训练集,在训练集
Figure BDA0004146507390000063
上进行模型训练,训练得到能够根据/>
Figure BDA0004146507390000064
作为输入,输出换道决策的神经网络模型;
S6.根据步骤S1-S4获得新的
Figure BDA0004146507390000065
并输入步骤S5训练的模型中输出得到换道策略。
所述步骤S1中强制换道数据集的构建方法如下:
S1.1特征向量提取
NGSIM的US-101数据集包含车辆每0.1s的速度、加速度、车头中心位置坐标、车头时距等车辆的轨迹数据,基于此,提取表示换道车辆与周围车辆博弈状态的特征向量
Figure BDA0004146507390000066
其中,VSV,ASV,LSV分别表示换道车辆SV的速度、加速度以及与换道终点的距离;ΔVCF,ΔVCB,ΔVTF,ΔVTB分别表示SV与当前车道前车CF、当前车道后车CB、目标车道前车TF及目标车道后车TB的速度差;GTF,GTB分别表示SV与TF、TB的车头间距,TTCTF,TTCTB分别表示车辆SV与TF、TB的碰撞时间(Time toCollision,TTC),/>
Figure BDA0004146507390000071
表示空间平均速度;
S1.2换道决策确定
定义
Figure BDA0004146507390000072
表示车辆换道决策的观测值,规定/>
Figure BDA0004146507390000073
表示车辆换道,/>
Figure BDA0004146507390000074
表示车辆不换道。定义车辆横向速度大于0.2m/s且1s内有向相邻车道靠近的运动趋势的时刻为换道开始时刻,以避免车辆横向位置波动对换道意图确定造成的干扰。定义车辆横向速度小于0.2m/s且1s内在目标车道上的横向位置保持稳定的时刻为车辆换道结束时刻。将车辆在换道开始时刻和结束时刻内的轨迹数据的/>
Figure BDA0004146507390000075
标注为1,其余时刻的/>
Figure BDA0004146507390000076
标注为0。
所述步骤S2中的车辆驾驶风格划分方法如下:
(2.1)定义车辆速度与空间平均速度
Figure BDA0004146507390000077
的比值为速度比r,基于车辆轨迹数据,计算车辆每0.1s的速度比r和加速度a,从而计算车辆速度比的均值E(r)和方差VAR(r)以及加速度的均值E(a),将这三个特征作为高斯混合聚类算法的输入,定义聚类中心数为2,将S1中观测数据集内的车辆聚为类别1和类别2;
(2.2)分别计算类别1和类别2聚类中心的E(r)、VAR(r)以及E(a)三个特征值的均值,将均值大的聚类中的车辆作为激进型驾驶风格,另外一个聚类中的车辆作为保守型驾驶风格。
所述步骤S3的换道博弈类型划分方法如下:
SV在制定换道决策时与目标车道后车TB发生博弈,博弈参与者SV和TB的驾驶风格集为{激进型,保守型},根据SV和TB的不同驾驶风格,将强制换道博弈分为四种类型,分别为激进型SV-激进型TB、激进型SV-保守型TB、保守型SV-激进型TB以及保守型SV-保守型TB。
所述步骤S4的换道决策YEGT的输出方法如下:
S4.1车辆收益计算
基于S3中四个子集中的车辆轨迹数据,分别计算四种换道博弈类型中车辆的速度收益、安全收益及换道需求收益,定义TB的速度收益为TB减速让行前后的速度差Δv;定义安全收益为SV与TB间的TTCTB;车辆越接近强制换道终点,换道需求越强烈,故定义换道需求收益为SV与换道终点的距离LSV
S4.2收益矩阵建立
在换道博弈中,博弈参与者中SV的策略集为{换道,不换道},TB的策略集为{让行,不让行}。因此,共有四种博弈策略组合,分别为{SV换道,TB让行},{SV换道,TB不让行},{SV不换道,TB让行},{SV不换道,TB不让行}。基于S4.1中的车辆收益,计算四种博弈策略组合下SV和TB的收益。在{SV换道,TB让行}策略组合下,SV和TB的收益分别为A:α1TTCTBiLsv和B:α2TTCTB2Δv;在{SV换道,TB不让行}策略组合下,SV和TB的收益分别为C:-α1TTCTB和D:β2Δv-α2TTCTB;在{SV不换道,TB让行}策略组合下,SV和TB的收益分别为E:-β1LSV和F:-β2Δv;在{SV不换道,TB不让行}策略组合下,SV和TB的收益分别为G:-β1LSV和H:β2Δv,其中,α1,β1,α2,β2为车辆收益的收益因子,取值范围均为(0,1),且满足α11=1,α22=1,建立换道博弈收益矩阵为
Figure BDA0004146507390000081
其中,A~H分别为SV和TB的收益。
S4.3车辆换道与让行概率计算
基于S4.2中的收益矩阵,建立SV的换道概率p1和TB的让行概率p2随时间演化的动态复制方程如下,据此计算每一时刻p1和p2的值;
Figure BDA0004146507390000082
其中,式①、式②分别为p1、p2随时间演化的的动态复制方程,SV换道期望收益为W1=Ap2+C(1-p2),不换道期望收益为W2=Ep2+G(1-p2),期望收益为WSV=W1p1+W2(1-p1),TB让行期望收益为w1=Bp1+F(1-p1),不让行期望收益为w2=Dp1+H(1-p1),期望收益为wTB=w1p2+w2(1-p2),其中,A~H分别为S4.2中收益矩阵中的收益,p1、p2的初始值分别为强制换道数据集中换道车辆数和让行车辆数与US-101数据集车辆数的比值;
S4.4换道决策输出
基于S3中四个子集中的车辆轨迹数据,计算SV与TF、TB间的TTCTF和TTCTB,结合S4.3中计算出的p1和p2的值,输出换道决策,规定当SV的换道概率p1和TB的让行概率p2均大于0.5,且TTCTF和TTCTB不小于保证安全的最小值时,输出YEGT=1,即SV采取换道行为,否则,输出YEGT=0,即SV不换道,保持原车道行驶;
Figure BDA0004146507390000091
其中,p1、p2分别为SV的换道概率和TB的让行概率,TTCTF、TTCTB分别是SV与TF、TB的TTC,
Figure BDA0004146507390000092
为保证安全的最小值。
所述步骤S5中,针对S3中的四种博弈换道类型,分定义模型的损失函数如下,模型训练流程如图1所示,
Figure BDA0004146507390000093
其中,
Figure BDA0004146507390000094
为观测值,YEGT为基于EGT的输出值,p为模型输出车辆换道的概率,p>0.5时,模型输出值Y=1,否则,Y=0,α为衡量模型输出与YEGT之间损失的权重。
二、实例结果
1.聚类结果如下:
表1聚类中心特征值
Figure BDA0004146507390000095
Figure BDA0004146507390000101
2.EGT相应结果如下:
表2EGT参数
Figure BDA0004146507390000102
EGT参数如表2所示,四种博弈类型中SV换道概率和TB让行概率随时间的演化图如图2所示。从图2(a)和图2(c)中可以看出,在博弈开始时刻,激进型后车与换道车辆间会存在明显的竞争,因此,其让行概率会先降低后逐渐增加,当换道车辆也为激进型时,两者间的竞争强度和持续时间更明显(图2(a))。从图2(b)和图2(d)中可以看出,保守型后车在博弈中更容易屈服于换道车辆,因此后车让行的概率会直接增加,当换道车辆为激进型时,后车的屈服程度更明显(图2(b))。
2.EGT-ML相应结果如下:
表3EGT-ML的预测结果评价
Figure BDA0004146507390000103
EGT-ML的预测结果评价如表3所示,在测试集上的ROC曲线及PR曲线图如图3所示。从表3和图3中可以看出,EGT-LightGBM在测试集上的预测效果优于其他模型。选取EGT-LightGBM进行模型敏感性分析,结果如图4所示。由图4(a)可以看出,当样本数量较小时,EGT-LightGBM比LightGBM的预测精度更高,表明EGT-LightGBM具有更高的鲁棒性。由图4(b)可以看出,当损失函数中权重α为0.1时,EGT-LightGBM的预测精度达到最高。
本发明的发明点在于:1.基于车辆轨迹数据,使用高斯混合聚类方法,将驾驶者划分为两类驾驶风格。2.建立融合演化博弈论和机器学习的多风格驾驶者强制换道模型EGT-ML,模型具有较高的预测准确率和较强的鲁棒性。
最后应说明的是,以上实施例仅用来说明本发明的技术方案,而非对其限制。凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围内。

Claims (6)

1.一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法,其特征在于,该方法包括以下步骤:
S1.基于车辆轨迹数据提取表示换道车辆与周围车辆博弈状态的特征向量X及车辆换道决策观测值
Figure FDA0004146507380000011
构建强制换道数据集/>
Figure FDA0004146507380000012
S2.基于S1中强制换道数据集提取车辆运行特征,输入高斯混合聚类算法,将车辆聚为两类,分别对应激进型和保守型两种驾驶风格;
S3.根据换道车辆和目标车道后车的不同驾驶风格,将换道博弈分为四种类型,并将S1中强制换道数据集划分为相应的四个子集;
S4.针对S3中的四种博弈类型,基于四个子集中的车辆轨迹数据,利用演化博弈论EGT及碰撞时间TTC输出换道决策YEGT
S5.针对S3中的四种博弈类型,将强制换道数据集划分为划分训练集和测试集,并将与训练集中的特征向量X相对应的YEGT加入训练集,在训练集
Figure FDA0004146507380000013
上进行模型训练,训练得到能够根据/>
Figure FDA0004146507380000014
作为输入,输出换道决策的神经网络模型;
S6.根据步骤S1-S4获得新的
Figure FDA0004146507380000015
并输入步骤S5训练的模型中得到换道策略。
2.根据权利要求1所述的一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法,其特征在于,所述步骤S1中的构建强制换道数据集的方法如下:
S1.1特征向量提取
NGSIM的US-101数据集包含车辆每0.1s的速度、加速度、车头中心位置坐标、车头时距等车辆的轨迹数据,基于此,提取表示换道车辆与周围车辆博弈状态的特征向量
Figure FDA0004146507380000016
其中,Vsv,Asv,Lsv分别表示换道车辆SV的速度、加速度以及与换道终点的距离;ΔVCF,ΔVCB,ΔVTF,ΔVTB分别表示SV与当前车道前车CF、当前车道后车CB、目标车道前车TF及目标车道后车TB的速度差;GTF,GTB分别表示SV与TF、TB的车头间距,TTCTF,TTCTB分别表示车辆SV与TF、TB的碰撞时间TTC,/>
Figure FDA0004146507380000021
表示空间平均速度;
S1.2换道决策确定
定义
Figure FDA0004146507380000022
表示车辆换道决策的观测值,规定/>
Figure FDA0004146507380000023
表示车辆换道,/>
Figure FDA0004146507380000024
表示车辆不换道,定义车辆横向速度大于0.2m/s且1s内有向相邻车道靠近的运动趋势的时刻为换道开始时刻;定义车辆横向速度小于0.2m/s且1s内在目标车道上的横向位置保持稳定的时刻为车辆换道结束时刻,将车辆在换道开始时刻和结束时刻内的轨迹数据的/>
Figure FDA0004146507380000025
标注为1,其余时刻的/>
Figure FDA0004146507380000026
标注为0。
3.根据权利要求1所述的一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法,其特征在于,所述步骤S2中的车辆驾驶风格划分方法如下:
(2.1)定义车辆速度与空间平均速度
Figure FDA0004146507380000027
的比值为速度比r,基于车辆轨迹数据,计算车辆每0.1s的速度比r和加速度a,从而计算车辆速度比的均值E(r)和方差VAR(r)以及加速度的均值E(a),将这三个特征作为高斯混合聚类算法的输入,定义聚类中心数为2,将S1中观测数据集内的车辆聚为类别1和类别2;
(2.2)分别计算类别1和类别2聚类中心的E(r)、VAR(r)以及E(a)三个特征值的均值,将均值大的聚类中的车辆作为激进型驾驶风格,另外一个聚类中的车辆作为保守型驾驶风格。
4.根据权利要求1所述的一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法,其特征在于,所述步骤S3的换道博弈类型划分方法如下:
SV在制定换道决策时与目标车道后车TB发生博弈,博弈参与者SV和TB的驾驶风格集为{激进型,保守型},根据SV和TB的不同驾驶风格,将强制换道博弈分为四种类型,分别为激进型SV-激进型TB、激进型SV-保守型TB、保守型SV-激进型TB以及保守型SV-保守型TB。
5.根据权利要求4所述的一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法,其特征在于,所述步骤S4的换道决策YEGT的输出方法如下:
S4.1车辆收益计算
基于S3中四个子集中的车辆轨迹数据,分别计算四种换道博弈类型中车辆的速度收益、安全收益及换道需求收益,定义TB的速度收益为TB减速让行前后的速度差Δv;定义安全收益为SV与TB间的TTCTB;定义换道需求收益为SV与换道终点的距离LSV
S4.2收益矩阵建立
在换道博弈中,博弈参与者中SV的策略集为{换道,不换道},TB的策略集为{让行,不让行},共有四种博弈策略组合,分别为{SV换道,TB让行},{SV换道,TB不让行},{SV不换道,TB让行},{SV不换道,TB不让行},基于S4.1中的车辆收益,计算四种博弈策略组合下SV和TB的收益,在{SV换道,TB让行}策略组合下,SV和TB的收益分别为A:α1TTCTB1LSV和B:α2TTCTB2Δv;在{SV换道,TB不让行}策略组合下,SV和TB的收益分别为C:-α1TTCTB和D:β2Δv-α2TTCTB;在{SV不换道,TB让行}策略组合下,SV和TB的收益分别为E:-β1LSV和F:-β2Δv;在{SV不换道,TB不让行}策略组合下,SV和TB的收益分别为G:-β1LSV和H:β2Δv,其中,α1,β1,α2,β2为车辆收益的收益因子,取值范围均为(0,1),且满足α11=1,α22=1,建立换道博弈收益矩阵为
Figure FDA0004146507380000031
其中,A~H分别为SV和TB的收益;
S4.3车辆换道与让行概率计算
基于S4.2中的收益矩阵,建立SV的换道概率p1和TB的让行概率p2随时间演化的动态复制方程如下,据此计算每一时刻p1和p2的值;
Figure FDA0004146507380000032
其中,式①、式②分别为p1、p2随时间演化的的动态复制方程,SV换道期望收益为W1=Ap2+C(1-p2),不换道期望收益为W2=Ep2+G(1-p2),期望收益为WSV=W1p1+W2(1-p1),TB让行期望收益为w1=Bp1+F(1-p1),不让行期望收益为w2=Dp1+H(1-p1),期望收益为wTB=w1p2+w2(1-p2),其中,A~H分别为S4.2中收益矩阵中的收益,p1、p2的初始值分别为强制换道数据集中换道车辆数和让行车辆数与US-101数据集车辆数的比值;
S4.4换道决策输出
基于S3中四个子集中的车辆轨迹数据,计算SV与TF、TB间的TTCTF和TTCTB,结合S4.3中计算出的p1和p2的值,输出换道决策,规定当SV的换道概率p1和TB的让行概率p2均大于0.5,且TTCTF和TTCTB不小于保证安全的最小值时,输出YEGT=1,即SV采取换道行为,否则,输出YEGT=0,即SV不换道,保持原车道行驶;
Figure FDA0004146507380000041
其中,p1、p2分别为SV的换道概率和TB的让行概率,TTCTF、TTCTB分别是SV与TF、TB的TTC,
Figure FDA0004146507380000042
为保证安全的最小值。
6.根据权利要求5所述的一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法,其特征在于,步骤S5中神经网络模型的损失函数如下:
Figure FDA0004146507380000043
其中,
Figure FDA0004146507380000044
为观测值,YEGT为输出的换道决策值,p为模型输出车辆换道的概率,p>0.5时,模型输出值Y=1,否则,Y=0,α为衡量模型输出与YEGT之间损失的权重。
CN202310305219.1A 2023-03-27 2023-03-27 一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法 Pending CN116279484A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310305219.1A CN116279484A (zh) 2023-03-27 2023-03-27 一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310305219.1A CN116279484A (zh) 2023-03-27 2023-03-27 一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法

Publications (1)

Publication Number Publication Date
CN116279484A true CN116279484A (zh) 2023-06-23

Family

ID=86818474

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310305219.1A Pending CN116279484A (zh) 2023-03-27 2023-03-27 一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法

Country Status (1)

Country Link
CN (1) CN116279484A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116767218A (zh) * 2023-08-18 2023-09-19 北京理工大学 一种无人驾驶车辆强制换道决策方法、计算机设备及介质
CN117227763A (zh) * 2023-11-10 2023-12-15 新石器慧通(北京)科技有限公司 基于博弈论和强化学习的自动驾驶行为决策方法和装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116767218A (zh) * 2023-08-18 2023-09-19 北京理工大学 一种无人驾驶车辆强制换道决策方法、计算机设备及介质
CN116767218B (zh) * 2023-08-18 2023-11-17 北京理工大学 一种无人驾驶车辆强制换道决策方法、计算机设备及介质
CN117227763A (zh) * 2023-11-10 2023-12-15 新石器慧通(北京)科技有限公司 基于博弈论和强化学习的自动驾驶行为决策方法和装置
CN117227763B (zh) * 2023-11-10 2024-02-20 新石器慧通(北京)科技有限公司 基于博弈论和强化学习的自动驾驶行为决策方法和装置

Similar Documents

Publication Publication Date Title
CN116279484A (zh) 一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法
CN112347567B (zh) 一种车辆意图和轨迹预测的方法
CN107492251B (zh) 一种基于机器学习与深度学习的驾驶员身份识别与驾驶状态监测方法
CN110949398B (zh) 一种车辆编队行驶中头车驾驶员异常驾驶行为检测方法
CN104951764B (zh) 基于二次谱聚类和hmm-rf混合模型的高速车辆行为识别方法
CN113486822B (zh) 一种基于驾驶意图的周围车辆轨迹预测方法及系统
CN112116100B (zh) 一种考虑驾驶员类型的博弈论决策方法
CN104835319B (zh) 一种高等级道路瓶颈区入匝道车辆汇入行为估计方法
CN112668779B (zh) 基于自适应高斯过程的前车运动状态预测方法
CN112863245B (zh) 基于深度神经网络的车辆换道轨迹实时预测方法
CN113076599A (zh) 一种基于长短时记忆网络的多模态车辆轨迹预测方法
Wirthmüller et al. Predicting the time until a vehicle changes the lane using LSTM-based recurrent neural networks
CN106682703A (zh) 一种基于obd数据的驾驶人出行模式识别方法
CN114169444B (zh) 车辆跟驰工况下考虑风险势场分布的驾驶风格分类方法
CN114926802B (zh) 基于双层lstm网络的车辆轨迹预测方法
CN113761715B (zh) 一种基于高斯混合和隐马尔可夫的个性化车辆跟驰模型的建立方法
CN115056798A (zh) 一种基于贝叶斯博弈的自动驾驶车辆换道行为车路协同决策算法
CN115285135A (zh) 融合驾驶风格的深度强化学习车辆跟驰模型的构建方法
CN111907523A (zh) 一种基于模糊推理的车辆跟驰寻优控制方法
CN113033902B (zh) 一种基于改进深度学习的自动驾驶换道轨迹规划方法
CN116946183A (zh) 一种考虑驾驶能力的商用车驾驶行为预测方法及车用设备
CN115171389B (zh) 基于gmm-hmm的高速公路他车超车换道意图识别方法
Wang et al. A data-driven estimation of driving style using deep clustering
Wang et al. Utilizing random forest and neural network to extract lane change events on shanghai highway
Ma et al. Lane change analysis and prediction using mean impact value method and logistic regression model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination