CN116279484A - 一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法 - Google Patents
一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法 Download PDFInfo
- Publication number
- CN116279484A CN116279484A CN202310305219.1A CN202310305219A CN116279484A CN 116279484 A CN116279484 A CN 116279484A CN 202310305219 A CN202310305219 A CN 202310305219A CN 116279484 A CN116279484 A CN 116279484A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- lane change
- change
- lane
- vehicles
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008859 change Effects 0.000 title claims abstract description 161
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000010801 machine learning Methods 0.000 title claims abstract description 24
- 238000012549 training Methods 0.000 claims abstract description 31
- 239000013598 vector Substances 0.000 claims abstract description 13
- 239000000203 mixture Substances 0.000 claims abstract description 10
- 230000008901 benefit Effects 0.000 claims description 46
- 230000001133 acceleration Effects 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 230000010076 replication Effects 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 238000003062 neural network model Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 4
- 230000009471 action Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000003137 locomotive effect Effects 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 4
- 230000006399 behavior Effects 0.000 description 6
- 230000004927 fusion Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000010206 sensitivity analysis Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W30/00—Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
- B60W30/18—Propelling the vehicle
- B60W30/18009—Propelling the vehicle related to particular drive situations
- B60W30/18163—Lane change; Overtaking manoeuvres
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W40/00—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
- B60W40/08—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to drivers or passengers
- B60W40/09—Driving style or behaviour
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W2050/0001—Details of the control system
- B60W2050/0002—Automatic control, details of type of controller or control system architecture
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W2050/0001—Details of the control system
- B60W2050/0019—Control system elements or transfer functions
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W2050/0001—Details of the control system
- B60W2050/0019—Control system elements or transfer functions
- B60W2050/0028—Mathematical models, e.g. for simulation
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W2050/0001—Details of the control system
- B60W2050/0019—Control system elements or transfer functions
- B60W2050/0028—Mathematical models, e.g. for simulation
- B60W2050/0031—Mathematical model of the vehicle
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Transportation (AREA)
- Mechanical Engineering (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法,该方法包括基于车辆轨迹数据提取表示换道车辆与周围车辆博弈状态的特征向量及车辆换道决策观测值,建立强制换道观测数据集;利用高斯混合聚类方法,将车辆分为两种驾驶风格,根据换道车辆和目标车道后车的不同驾驶风格,将换道博弈分为四类,将观测数据集划分为相对应的四个子集;根据四个子集的车辆轨迹数据,分别利用演化博弈论EGT及碰撞时间指标输出换道决策;建立融合演化博弈论和机器学习的强制换道模型EGT‑ML,将基于EGT的换道决策加入训练集中,并在训练集上进行模型训练,在观测数据集上评价预测效果,结果表明模型具有较高的准确率和较强的鲁棒性。
Description
技术领域
本发明属于道路交通领域,尤其提出一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法。
背景技术
强制换道(MLC)指驾驶者由于交通政策或自身驾驶需求,必须将车辆由当前车道换道至目标车道的行为,强制换道通常发生在高速路交织区、上下匝道、交叉口进口道等路段。通常来说,相比于驾驶者为改善自身驾驶环境的自由换道行为(DLC),强制换道行为更容易引发交通震荡,会对交通效率以及交通安全产生较大的负面影响。因此,分析、建模、预测强制换道行为对于提高道路交通安全和效率具有重要意义。专利202210325865.X《一种基于复合模型的车辆换道意图的预测方法》公开了一种基于复合模型的车辆换道意图的预测方法,包括:采集本车和周围车辆的速度和位置信息,将换道车辆的轨迹信息构成训练集A;建立三个隐马尔可夫模型,分别为向左换道模型,车道保持模型,向右换道模型,将训练集A输入三个模型中进行初步预测,分别输出对应的概率;将换道车辆与周围车辆的纵向距离和模型输出概率结合形成训练集B,并输入多层感知机模型中,以换道车辆的真实换道意图作为标签,训练多层感知机模型;最终实时采集目标车辆以及周围车辆的速度和位置信息,输入训练后的模型预测车辆换道意图。
目前关于强制换道决策预测的方法已有较多研究成果,但现有方法的主要缺点包括:1.机器学习模型对换道决策的预测精度较高,但模型需要大量数据进行训练,容易受到数据噪声的影响,鲁棒性较低,且可解释性方面有所欠缺,无法解释驾驶者的驾驶行为随交通状态的变化而演变的机理;2.物理模型中的相关参数均具有物理含义,可解释性强,但其预先假设驾驶者的驾驶行为,模型仅包含对换道决策影响较为显著的部分因素,忽略了其余的潜在影响因素,并且没有考虑不同类型驾驶者的差异,预测准确率较低。
发明内容
发明目的:针对这些问题,本发明提供一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法。主要解决的技术问题是:1.基于车辆轨迹数据,使用高斯混合聚类方法,将驾驶者划分为两类驾驶风格。2.建立融合演化博弈论EGT(Evolutionary GameTheory)和机器学习ML(Machine Learning)的多风格驾驶者强制换道模型EGT-ML,模型具有较高的预测准确率和较强的鲁棒性。
技术方案:为了解决上述技术问题,本发明提出一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法,该方法包括以下步骤:
S2.基于S1中强制换道数据集提取车辆运行特征,输入高斯混合聚类算法,将车辆聚为两类,分别对应激进型和保守型两种驾驶风格;
S3.根据换道车辆和目标车道后车的不同驾驶风格,将换道博弈分为四种类型,并将S1中强制换道数据集划分为相应的四个子集;
S4.针对S3中的四种博弈类型,基于四个子集中的车辆轨迹数据,利用演化博弈论EGT及碰撞时间TTC输出换道决策YEGT;
S5.针对S3中的四种博弈类型,将强制换道数据集划分为划分训练集和测试集,并将与训练集中的特征向量X相对应的YEGT加入训练集,在训练集上进行模型训练,训练得到能够根据/>作为输入,输出换道决策的神经网络模型;
进一步的,所述步骤S1中的构建强制换道数据集的方法如下:
S1.1特征向量提取
NGSIM的US-101数据集包含车辆每0.1s的速度、加速度、车头中心位置坐标、车头时距等车辆的轨迹数据,基于此,提取表示换道车辆与周围车辆博弈状态的特征向量X={VSV,ASV,LSV,ΔVCF,ΔVCB,ΔVTF,ΔVTB,GTF,GTB,TTCTF,TTCTB,Vs},其中,VSV,ASV,LSV分别表示换道车辆SV的速度、加速度以及与换道终点的距离;ΔVCF,ΔVCB,ΔVTF,ΔVTB分别表示SV与当前车道前车CF、当前车道后车CB、目标车道前车TF及目标车道后车TB的速度差;GTF,GTB分别表示SV与TF、TB的车头间距,TTCTF,TTCTB分别表示车辆SV与TF、TB的碰撞时间TTC,表示空间平均速度;
S1.2换道决策确定
定义表示车辆换道决策的观测值,规定/>表示车辆换道,/>表示车辆不换道,定义车辆横向速度大于0.2m/s且1s内有向相邻车道靠近的运动趋势的时刻为换道开始时刻;定义车辆横向速度小于0.2m/s且1s内在目标车道上的横向位置保持稳定的时刻为车辆换道结束时刻,将车辆在换道开始时刻和结束时刻内的轨迹数据的/>标注为1,其余时刻的/>标注为0。
进一步的,所述步骤S2中的车辆驾驶风格划分方法如下:
(2.1)定义车辆速度与空间平均速度的比值为速度比r,基于车辆轨迹数据,计算车辆每0.1s的速度比r和加速度a,从而计算车辆速度比的均值E(r)和方差VAR(r)以及加速度的均值E(a),将这三个特征作为高斯混合聚类算法的输入,定义聚类中心数为2,将S1中观测数据集内的车辆聚为类别1和类别2;
(2.2)分别计算类别1和类别2聚类中心的E(r)、VAR(r)以及E(a)三个特征值的均值,将均值大的聚类中的车辆作为激进型驾驶风格,另外一个聚类中的车辆作为保守型驾驶风格。
进一步的,所述步骤S3的换道博弈类型划分方法如下:
SV在制定换道决策时与目标车道后车TB发生博弈,博弈参与者SV和TB的驾驶风格集为{激进型,保守型},根据SV和TB的不同驾驶风格,将强制换道博弈分为四种类型,分别为激进型SV-激进型TB、激进型SV-保守型TB、保守型SV-激进型TB以及保守型SV-保守型TB。
进一步的,所述步骤S4的换道决策YEGT的输出方法如下:
S4.1车辆收益计算
基于S3中四个子集中的车辆轨迹数据,分别计算四种换道博弈类型中车辆的速度收益、安全收益及换道需求收益,定义TB的速度收益为TB减速让行前后的速度差Δv;定义安全收益为SV与TB间的TTCTB;定义换道需求收益为SV与换道终点的距离LSV;
S4.2收益矩阵建立
在换道博弈中,博弈参与者中SV的策略集为{换道,不换道},TB的策略集为{让行,不让行},共有四种博弈策略组合,分别为{SV换道,TB让行},{SV换道,TB不让行},{SV不换道,TB让行},{SV不换道,TB不让行},基于S4.1中的车辆收益,计算四种博弈策略组合下SV和TB的收益,在{SV换道,TB让行}策略组合下,SV和TB的收益分别为A:α1TTCTB+β1LSV和B:α2TTCTB-β2Δv;在{SV换道,TB不让行}策略组合下,SV和TB的收益分别为C:-α1TTCTB和D:β2Δv-α2TTCTB;在{SV不换道,TB让行}策略组合下,SV和TB的收益分别为E:-β1LSV和F:-β2Δv;在{SV不换道,TB不让行}策略组合下,SV和TB的收益分别为G:-β1LSV和H:β2Δv,其中,α1,β1,α2,β2为车辆收益的收益因子,取值范围均为(0,1),且满足α1+β1=1,α2+β2=1,建立换道博弈收益矩阵为其中,A~H分别为SV和TB的收益;
S4.3车辆换道与让行概率计算
基于S4.2中的收益矩阵,建立SV的换道概率p1和TB的让行概率p2随时间演化的动态复制方程如下,据此计算每一时刻p1和p2的值;
其中,式①、式②分别为p1、p2随时间演化的的动态复制方程,SV换道期望收益为W1=Ap2+C(1-p2),不换道期望收益为W2=Ep2+G(1-p2),期望收益为WSV=W1p1+W2(1-p1),TB让行期望收益为w1=Bp1+F(1-p1),不让行期望收益为w2=Dp1+H(1-p1),期望收益为wTB=w1p2+w2(1-p2),其中,A~H分别为S4.2中收益矩阵中的收益,p1、p2的初始值分别为强制换道数据集中换道车辆数和让行车辆数与US-101数据集车辆数的比值;
S4.4换道决策输出
基于S3中四个子集中的车辆轨迹数据,计算SV与TF、TB间的TTCTF和TTCTB,结合S4.3中计算出的p1和p2的值,输出换道决策,规定当SV的换道概率p1和TB的让行概率p2均大于0.5,且TTCTF和TTCTB不小于保证安全的最小值时,输出YEGT=1,即SV采取换道行为,否则,输出YEGT=0,即SV不换道,保持原车道行驶;
进一步的,步骤S5中神经网络模型的损失函数如下:
有益效果:与现有技术相比,本发明的技术方案具有以下有益效果:
1.基于车辆轨迹数据,使用高斯混合聚类算法将车辆分为两种驾驶风格,考虑了车辆驾驶风格的差异;
2.建立融合演化博弈论和机器学习的多风格驾驶者强制换道模型,相较于传统的ML模型,模型在保证预测准确率的前提下,具有较强的鲁棒性。
附图说明
图1融合演化博弈和机器学习训练流程图;
图2车辆换道概率及让行概率演化路径图;
图3融合演化博弈和机器学习在测试集上的ROC曲线及PR曲线图;
图4融合演化博弈和机器学习敏感性分析图。
具体实施方式
以下将结合附图和具体实施,对本发明的技术方案及效果进行详细说明。
如图1所示,本发明提出一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法,该方法包括以下步骤:
S2.基于S1中强制换道数据集提取车辆运行特征,输入高斯混合聚类算法,将车辆聚为两类,分别对应激进型和保守型两种驾驶风格;
S3.根据换道车辆和目标车道后车的不同驾驶风格,将换道博弈分为四种类型,并将S1中强制换道数据集划分为相应的四个子集;
S4.针对S3中的四种博弈类型,基于四个子集中的车辆轨迹数据,利用演化博弈论EGT及碰撞时间TTC输出换道决策YEGT;
S5.针对S3中的四种博弈类型,将强制换道数据集划分为划分训练集和测试集,并将与训练集中的特征向量X相对应的YEGT加入训练集,在训练集上进行模型训练,训练得到能够根据/>作为输入,输出换道决策的神经网络模型;
所述步骤S1中强制换道数据集的构建方法如下:
S1.1特征向量提取
NGSIM的US-101数据集包含车辆每0.1s的速度、加速度、车头中心位置坐标、车头时距等车辆的轨迹数据,基于此,提取表示换道车辆与周围车辆博弈状态的特征向量其中,VSV,ASV,LSV分别表示换道车辆SV的速度、加速度以及与换道终点的距离;ΔVCF,ΔVCB,ΔVTF,ΔVTB分别表示SV与当前车道前车CF、当前车道后车CB、目标车道前车TF及目标车道后车TB的速度差;GTF,GTB分别表示SV与TF、TB的车头间距,TTCTF,TTCTB分别表示车辆SV与TF、TB的碰撞时间(Time toCollision,TTC),/>表示空间平均速度;
S1.2换道决策确定
定义表示车辆换道决策的观测值,规定/>表示车辆换道,/>表示车辆不换道。定义车辆横向速度大于0.2m/s且1s内有向相邻车道靠近的运动趋势的时刻为换道开始时刻,以避免车辆横向位置波动对换道意图确定造成的干扰。定义车辆横向速度小于0.2m/s且1s内在目标车道上的横向位置保持稳定的时刻为车辆换道结束时刻。将车辆在换道开始时刻和结束时刻内的轨迹数据的/>标注为1,其余时刻的/>标注为0。
所述步骤S2中的车辆驾驶风格划分方法如下:
(2.1)定义车辆速度与空间平均速度的比值为速度比r,基于车辆轨迹数据,计算车辆每0.1s的速度比r和加速度a,从而计算车辆速度比的均值E(r)和方差VAR(r)以及加速度的均值E(a),将这三个特征作为高斯混合聚类算法的输入,定义聚类中心数为2,将S1中观测数据集内的车辆聚为类别1和类别2;
(2.2)分别计算类别1和类别2聚类中心的E(r)、VAR(r)以及E(a)三个特征值的均值,将均值大的聚类中的车辆作为激进型驾驶风格,另外一个聚类中的车辆作为保守型驾驶风格。
所述步骤S3的换道博弈类型划分方法如下:
SV在制定换道决策时与目标车道后车TB发生博弈,博弈参与者SV和TB的驾驶风格集为{激进型,保守型},根据SV和TB的不同驾驶风格,将强制换道博弈分为四种类型,分别为激进型SV-激进型TB、激进型SV-保守型TB、保守型SV-激进型TB以及保守型SV-保守型TB。
所述步骤S4的换道决策YEGT的输出方法如下:
S4.1车辆收益计算
基于S3中四个子集中的车辆轨迹数据,分别计算四种换道博弈类型中车辆的速度收益、安全收益及换道需求收益,定义TB的速度收益为TB减速让行前后的速度差Δv;定义安全收益为SV与TB间的TTCTB;车辆越接近强制换道终点,换道需求越强烈,故定义换道需求收益为SV与换道终点的距离LSV。
S4.2收益矩阵建立
在换道博弈中,博弈参与者中SV的策略集为{换道,不换道},TB的策略集为{让行,不让行}。因此,共有四种博弈策略组合,分别为{SV换道,TB让行},{SV换道,TB不让行},{SV不换道,TB让行},{SV不换道,TB不让行}。基于S4.1中的车辆收益,计算四种博弈策略组合下SV和TB的收益。在{SV换道,TB让行}策略组合下,SV和TB的收益分别为A:α1TTCTB+βiLsv和B:α2TTCTB-β2Δv;在{SV换道,TB不让行}策略组合下,SV和TB的收益分别为C:-α1TTCTB和D:β2Δv-α2TTCTB;在{SV不换道,TB让行}策略组合下,SV和TB的收益分别为E:-β1LSV和F:-β2Δv;在{SV不换道,TB不让行}策略组合下,SV和TB的收益分别为G:-β1LSV和H:β2Δv,其中,α1,β1,α2,β2为车辆收益的收益因子,取值范围均为(0,1),且满足α1+β1=1,α2+β2=1,建立换道博弈收益矩阵为其中,A~H分别为SV和TB的收益。
S4.3车辆换道与让行概率计算
基于S4.2中的收益矩阵,建立SV的换道概率p1和TB的让行概率p2随时间演化的动态复制方程如下,据此计算每一时刻p1和p2的值;
其中,式①、式②分别为p1、p2随时间演化的的动态复制方程,SV换道期望收益为W1=Ap2+C(1-p2),不换道期望收益为W2=Ep2+G(1-p2),期望收益为WSV=W1p1+W2(1-p1),TB让行期望收益为w1=Bp1+F(1-p1),不让行期望收益为w2=Dp1+H(1-p1),期望收益为wTB=w1p2+w2(1-p2),其中,A~H分别为S4.2中收益矩阵中的收益,p1、p2的初始值分别为强制换道数据集中换道车辆数和让行车辆数与US-101数据集车辆数的比值;
S4.4换道决策输出
基于S3中四个子集中的车辆轨迹数据,计算SV与TF、TB间的TTCTF和TTCTB,结合S4.3中计算出的p1和p2的值,输出换道决策,规定当SV的换道概率p1和TB的让行概率p2均大于0.5,且TTCTF和TTCTB不小于保证安全的最小值时,输出YEGT=1,即SV采取换道行为,否则,输出YEGT=0,即SV不换道,保持原车道行驶;
所述步骤S5中,针对S3中的四种博弈换道类型,分定义模型的损失函数如下,模型训练流程如图1所示,
二、实例结果
1.聚类结果如下:
表1聚类中心特征值
2.EGT相应结果如下:
表2EGT参数
EGT参数如表2所示,四种博弈类型中SV换道概率和TB让行概率随时间的演化图如图2所示。从图2(a)和图2(c)中可以看出,在博弈开始时刻,激进型后车与换道车辆间会存在明显的竞争,因此,其让行概率会先降低后逐渐增加,当换道车辆也为激进型时,两者间的竞争强度和持续时间更明显(图2(a))。从图2(b)和图2(d)中可以看出,保守型后车在博弈中更容易屈服于换道车辆,因此后车让行的概率会直接增加,当换道车辆为激进型时,后车的屈服程度更明显(图2(b))。
2.EGT-ML相应结果如下:
表3EGT-ML的预测结果评价
EGT-ML的预测结果评价如表3所示,在测试集上的ROC曲线及PR曲线图如图3所示。从表3和图3中可以看出,EGT-LightGBM在测试集上的预测效果优于其他模型。选取EGT-LightGBM进行模型敏感性分析,结果如图4所示。由图4(a)可以看出,当样本数量较小时,EGT-LightGBM比LightGBM的预测精度更高,表明EGT-LightGBM具有更高的鲁棒性。由图4(b)可以看出,当损失函数中权重α为0.1时,EGT-LightGBM的预测精度达到最高。
本发明的发明点在于:1.基于车辆轨迹数据,使用高斯混合聚类方法,将驾驶者划分为两类驾驶风格。2.建立融合演化博弈论和机器学习的多风格驾驶者强制换道模型EGT-ML,模型具有较高的预测准确率和较强的鲁棒性。
最后应说明的是,以上实施例仅用来说明本发明的技术方案,而非对其限制。凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围内。
Claims (6)
1.一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法,其特征在于,该方法包括以下步骤:
S2.基于S1中强制换道数据集提取车辆运行特征,输入高斯混合聚类算法,将车辆聚为两类,分别对应激进型和保守型两种驾驶风格;
S3.根据换道车辆和目标车道后车的不同驾驶风格,将换道博弈分为四种类型,并将S1中强制换道数据集划分为相应的四个子集;
S4.针对S3中的四种博弈类型,基于四个子集中的车辆轨迹数据,利用演化博弈论EGT及碰撞时间TTC输出换道决策YEGT;
S5.针对S3中的四种博弈类型,将强制换道数据集划分为划分训练集和测试集,并将与训练集中的特征向量X相对应的YEGT加入训练集,在训练集上进行模型训练,训练得到能够根据/>作为输入,输出换道决策的神经网络模型;
2.根据权利要求1所述的一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法,其特征在于,所述步骤S1中的构建强制换道数据集的方法如下:
S1.1特征向量提取
NGSIM的US-101数据集包含车辆每0.1s的速度、加速度、车头中心位置坐标、车头时距等车辆的轨迹数据,基于此,提取表示换道车辆与周围车辆博弈状态的特征向量其中,Vsv,Asv,Lsv分别表示换道车辆SV的速度、加速度以及与换道终点的距离;ΔVCF,ΔVCB,ΔVTF,ΔVTB分别表示SV与当前车道前车CF、当前车道后车CB、目标车道前车TF及目标车道后车TB的速度差;GTF,GTB分别表示SV与TF、TB的车头间距,TTCTF,TTCTB分别表示车辆SV与TF、TB的碰撞时间TTC,/>表示空间平均速度;
S1.2换道决策确定
3.根据权利要求1所述的一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法,其特征在于,所述步骤S2中的车辆驾驶风格划分方法如下:
(2.1)定义车辆速度与空间平均速度的比值为速度比r,基于车辆轨迹数据,计算车辆每0.1s的速度比r和加速度a,从而计算车辆速度比的均值E(r)和方差VAR(r)以及加速度的均值E(a),将这三个特征作为高斯混合聚类算法的输入,定义聚类中心数为2,将S1中观测数据集内的车辆聚为类别1和类别2;
(2.2)分别计算类别1和类别2聚类中心的E(r)、VAR(r)以及E(a)三个特征值的均值,将均值大的聚类中的车辆作为激进型驾驶风格,另外一个聚类中的车辆作为保守型驾驶风格。
4.根据权利要求1所述的一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法,其特征在于,所述步骤S3的换道博弈类型划分方法如下:
SV在制定换道决策时与目标车道后车TB发生博弈,博弈参与者SV和TB的驾驶风格集为{激进型,保守型},根据SV和TB的不同驾驶风格,将强制换道博弈分为四种类型,分别为激进型SV-激进型TB、激进型SV-保守型TB、保守型SV-激进型TB以及保守型SV-保守型TB。
5.根据权利要求4所述的一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法,其特征在于,所述步骤S4的换道决策YEGT的输出方法如下:
S4.1车辆收益计算
基于S3中四个子集中的车辆轨迹数据,分别计算四种换道博弈类型中车辆的速度收益、安全收益及换道需求收益,定义TB的速度收益为TB减速让行前后的速度差Δv;定义安全收益为SV与TB间的TTCTB;定义换道需求收益为SV与换道终点的距离LSV;
S4.2收益矩阵建立
在换道博弈中,博弈参与者中SV的策略集为{换道,不换道},TB的策略集为{让行,不让行},共有四种博弈策略组合,分别为{SV换道,TB让行},{SV换道,TB不让行},{SV不换道,TB让行},{SV不换道,TB不让行},基于S4.1中的车辆收益,计算四种博弈策略组合下SV和TB的收益,在{SV换道,TB让行}策略组合下,SV和TB的收益分别为A:α1TTCTB-β1LSV和B:α2TTCTB-β2Δv;在{SV换道,TB不让行}策略组合下,SV和TB的收益分别为C:-α1TTCTB和D:β2Δv-α2TTCTB;在{SV不换道,TB让行}策略组合下,SV和TB的收益分别为E:-β1LSV和F:-β2Δv;在{SV不换道,TB不让行}策略组合下,SV和TB的收益分别为G:-β1LSV和H:β2Δv,其中,α1,β1,α2,β2为车辆收益的收益因子,取值范围均为(0,1),且满足α1+β1=1,α2+β2=1,建立换道博弈收益矩阵为其中,A~H分别为SV和TB的收益;
S4.3车辆换道与让行概率计算
基于S4.2中的收益矩阵,建立SV的换道概率p1和TB的让行概率p2随时间演化的动态复制方程如下,据此计算每一时刻p1和p2的值;
其中,式①、式②分别为p1、p2随时间演化的的动态复制方程,SV换道期望收益为W1=Ap2+C(1-p2),不换道期望收益为W2=Ep2+G(1-p2),期望收益为WSV=W1p1+W2(1-p1),TB让行期望收益为w1=Bp1+F(1-p1),不让行期望收益为w2=Dp1+H(1-p1),期望收益为wTB=w1p2+w2(1-p2),其中,A~H分别为S4.2中收益矩阵中的收益,p1、p2的初始值分别为强制换道数据集中换道车辆数和让行车辆数与US-101数据集车辆数的比值;
S4.4换道决策输出
基于S3中四个子集中的车辆轨迹数据,计算SV与TF、TB间的TTCTF和TTCTB,结合S4.3中计算出的p1和p2的值,输出换道决策,规定当SV的换道概率p1和TB的让行概率p2均大于0.5,且TTCTF和TTCTB不小于保证安全的最小值时,输出YEGT=1,即SV采取换道行为,否则,输出YEGT=0,即SV不换道,保持原车道行驶;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310305219.1A CN116279484A (zh) | 2023-03-27 | 2023-03-27 | 一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310305219.1A CN116279484A (zh) | 2023-03-27 | 2023-03-27 | 一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116279484A true CN116279484A (zh) | 2023-06-23 |
Family
ID=86818474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310305219.1A Pending CN116279484A (zh) | 2023-03-27 | 2023-03-27 | 一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116279484A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116767218A (zh) * | 2023-08-18 | 2023-09-19 | 北京理工大学 | 一种无人驾驶车辆强制换道决策方法、计算机设备及介质 |
CN117227763A (zh) * | 2023-11-10 | 2023-12-15 | 新石器慧通(北京)科技有限公司 | 基于博弈论和强化学习的自动驾驶行为决策方法和装置 |
-
2023
- 2023-03-27 CN CN202310305219.1A patent/CN116279484A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116767218A (zh) * | 2023-08-18 | 2023-09-19 | 北京理工大学 | 一种无人驾驶车辆强制换道决策方法、计算机设备及介质 |
CN116767218B (zh) * | 2023-08-18 | 2023-11-17 | 北京理工大学 | 一种无人驾驶车辆强制换道决策方法、计算机设备及介质 |
CN117227763A (zh) * | 2023-11-10 | 2023-12-15 | 新石器慧通(北京)科技有限公司 | 基于博弈论和强化学习的自动驾驶行为决策方法和装置 |
CN117227763B (zh) * | 2023-11-10 | 2024-02-20 | 新石器慧通(北京)科技有限公司 | 基于博弈论和强化学习的自动驾驶行为决策方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116279484A (zh) | 一种融合演化博弈与机器学习的多风格驾驶者强制换道预测方法 | |
CN112347567B (zh) | 一种车辆意图和轨迹预测的方法 | |
CN107492251B (zh) | 一种基于机器学习与深度学习的驾驶员身份识别与驾驶状态监测方法 | |
CN110949398B (zh) | 一种车辆编队行驶中头车驾驶员异常驾驶行为检测方法 | |
CN104951764B (zh) | 基于二次谱聚类和hmm-rf混合模型的高速车辆行为识别方法 | |
CN113486822B (zh) | 一种基于驾驶意图的周围车辆轨迹预测方法及系统 | |
CN112116100B (zh) | 一种考虑驾驶员类型的博弈论决策方法 | |
CN104835319B (zh) | 一种高等级道路瓶颈区入匝道车辆汇入行为估计方法 | |
CN112668779B (zh) | 基于自适应高斯过程的前车运动状态预测方法 | |
CN112863245B (zh) | 基于深度神经网络的车辆换道轨迹实时预测方法 | |
CN113076599A (zh) | 一种基于长短时记忆网络的多模态车辆轨迹预测方法 | |
Wirthmüller et al. | Predicting the time until a vehicle changes the lane using LSTM-based recurrent neural networks | |
CN106682703A (zh) | 一种基于obd数据的驾驶人出行模式识别方法 | |
CN114169444B (zh) | 车辆跟驰工况下考虑风险势场分布的驾驶风格分类方法 | |
CN114926802B (zh) | 基于双层lstm网络的车辆轨迹预测方法 | |
CN113761715B (zh) | 一种基于高斯混合和隐马尔可夫的个性化车辆跟驰模型的建立方法 | |
CN115056798A (zh) | 一种基于贝叶斯博弈的自动驾驶车辆换道行为车路协同决策算法 | |
CN115285135A (zh) | 融合驾驶风格的深度强化学习车辆跟驰模型的构建方法 | |
CN111907523A (zh) | 一种基于模糊推理的车辆跟驰寻优控制方法 | |
CN113033902B (zh) | 一种基于改进深度学习的自动驾驶换道轨迹规划方法 | |
CN116946183A (zh) | 一种考虑驾驶能力的商用车驾驶行为预测方法及车用设备 | |
CN115171389B (zh) | 基于gmm-hmm的高速公路他车超车换道意图识别方法 | |
Wang et al. | A data-driven estimation of driving style using deep clustering | |
Wang et al. | Utilizing random forest and neural network to extract lane change events on shanghai highway | |
Ma et al. | Lane change analysis and prediction using mean impact value method and logistic regression model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |