CN107161155A - 一种基于人工神经网络的车辆协同换道方法及其系统 - Google Patents

一种基于人工神经网络的车辆协同换道方法及其系统 Download PDF

Info

Publication number
CN107161155A
CN107161155A CN201710285739.5A CN201710285739A CN107161155A CN 107161155 A CN107161155 A CN 107161155A CN 201710285739 A CN201710285739 A CN 201710285739A CN 107161155 A CN107161155 A CN 107161155A
Authority
CN
China
Prior art keywords
mrow
msub
vehicle
acceleration
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710285739.5A
Other languages
English (en)
Other versions
CN107161155B (zh
Inventor
谭国真
薛春铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN201710285739.5A priority Critical patent/CN107161155B/zh
Publication of CN107161155A publication Critical patent/CN107161155A/zh
Application granted granted Critical
Publication of CN107161155B publication Critical patent/CN107161155B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/0097Predicting future conditions
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/08Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to drivers or passengers
    • B60W40/09Driving style or behaviour
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/10Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to vehicle motion
    • B60W40/105Speed
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/0098Details of control systems ensuring comfort, safety or stability not otherwise provided for
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0019Control system elements or transfer functions
    • B60W2050/0022Gains, weighting coefficients or weighting functions
    • B60W2050/0025Transfer function weighting factor
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2520/00Input parameters relating to overall vehicle dynamics
    • B60W2520/10Longitudinal speed
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects
    • B60W2554/80Spatial relation or speed relative to objects
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects
    • B60W2554/80Spatial relation or speed relative to objects
    • B60W2554/801Lateral distance
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects
    • B60W2554/80Spatial relation or speed relative to objects
    • B60W2554/804Relative longitudinal speed

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Physics & Mathematics (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Traffic Control Systems (AREA)

Abstract

一种基于人工神经网络的车辆协同换道方法及其系统,S1:换道数据采集及换道需求判断;S2、博弈收益计算;S3、驾驶风格得分计算;S4、权重调整;S5、换道决策。本发明的换道方法通过量化车辆驾驶风格调整博弈收益,使无人驾驶汽车具备人类的行为能力,避免了因不了解人类驾驶风格造成的事故,以较低的计算时间开销在保证安全的前提下尽最大努力优化通行效率。

Description

一种基于人工神经网络的车辆协同换道方法及其系统
技术领域
本发明属于车联网安全技术领域,尤其是一种基于人工神经网络的车辆协同换道方法及其系统。
背景技术
交通事故是危害人类安全和社会发展的重要问题。据统计,多达90%的交通事故是由超速、醉驾、疲劳、操作不当等人为因素造成。因此,无人驾驶汽车受到越来越多学者和研究人员的关注。智能网联汽车根据智能化程度分为五个等级:驾驶辅助、部分自动驾驶、有条件自动驾驶、高度自动驾驶和完全自动驾驶。现阶段无人驾驶处于发展的起步阶段,实现了人与系统共同驾驶,距离完全自动驾驶还有很长的路,人类因素仍然会长期存在。况且,驾车乐趣是任何先进的技术无法取代的,传统人类驾驶汽车不会完全消失,在未来很长时间内,将会处于无人驾驶与人类驾驶并存的混合行驶环境。如果无人驾驶汽车缺少与人类驾驶汽车的有效协同机制,反而更容易发生事故。换道通常伴随超车,是影响车辆安全的主要行为之一。换道不仅受到交通法规的约束,还与驾驶员的驾驶风格紧密相关。不同驾驶员受自身心理、性格甚至情绪等因素影响会有不同的驾驶风格,具体表现为驾驶过程中的礼让、竞争甚至对抗,应对不同车辆应该选取不同的驾驶策略。驾驶心理是极其复杂的,影响竞争倾向的因素包括刺激、威胁、动机、信息交互等心理因素。因此,在混合行驶环境避免事故需要无人驾驶具有类人行为能力。
目前换道方法存在诸多问题:(1)传统方法模型主要依靠无人驾驶自身获取信息进行决策,缺少与人类驾驶之间的协作,不具备类人行为能力,不能适应混合行驶的新型交通环境;(2)传统换道方法追求车辆安全、行驶效率等“理性”因素,实际情况是车辆的行为同样受示威、较劲等“非理性”因素影响,而这些“非理性”因素更容易导致交通事故;(3)大部分研究人员在分析驾驶员风格时,仅仅通过调查取样分类,定性分析不能保证精度,缺少量化分析能力;(4)部分分析算法只是把监测数据与先前样本简单比对,缺少自学习能力,风格分析需要积累一定数量的经验知识才具备预判能力,自学习功能对预测有重要意义。
发明内容
本发明的目的是提供一种充分考虑理性和非理性因素,处理速度快、更加贴近真实场景的基于人工神经网络的车辆协同换道方法及其系统。
本发明解决现有技术问题所采用的技术方案:一种基于人工神经网络的车辆协同换道方法,包括以下步骤:
S1:换道数据采集及换道需求判断:
a1、换道数据采集:通过安装在车辆上的数据采集模块采集车辆在行驶过程中的路况信息,所述路况信息包括车辆在当前车道的速度及加速度、相邻车道中与当前车辆对应的前导车辆的速度及加速度、相邻车道中与当前车辆对应的滞后车辆的速度及加速度和周边限制要素的运动速度,以及当前车辆与所述前导车辆、滞后车辆以及周边限制要素之间的相对距离;所述前导车辆是位于当前车辆前方的车辆;所述滞后车辆是位于当前车辆后方的车辆;
a2、换道需求判断:根据换道需求判断条件,判断当前车辆是否有换道需求:若当前车辆同时不满足换道需求判断条件,则当前车辆不需要换道,即放弃换道;若当前车辆满足需求判断条件中的至少一条,则当前车辆需要换道;所述换道需求判断条件为:
其中,Δxi为当前车辆i与前导车辆或周边交通要素之间的相对距离,vi e为当前车辆i的预设期望速度,vi c为当前车辆i的速度,vi+1为与当前车辆i对应的前导车辆的速度,Tsafe为预设安全时距,Tmin为预设最小反应时间,vbar为周边限制要素的运动速度,i≥1;
S2、博弈收益计算:建立与换道行为相对应的博弈换道模型:将步骤a2中需要换道的车辆的可能行为策略作为行描述,将该车辆对应的滞后车辆的可能行为策略作为列描述,建立与换道行为相对应的博弈换道模型;并以博弈收益值数值对作为博弈换道模型的元素,每个博弈收益值数值对作为在对应行描述和列描述条件下的数值表示;提取博弈换道模型的元素构建成为博弈收益矩阵,博弈收益矩阵中的元素为(Pij,Qij),其中,Pij、Qij分别为在行描述i和列描述j的条件下,需要换道的车辆及与该车辆对应的滞后车辆的博弈收益值,且通过以下公式获得:
Pij(或Qij)=α*A+β*B
其中,α、β为权重系数,且满足α+β=1,α、β的初始值均为0.5;对于需要计算博弈收益的车辆VX,A、B分别由以下公式计算:
其中,vX为车辆VX的速度,aX为车辆VX的加速度,Δt为采集间隔时间,ΔxA为车辆VX与前导车辆的相对距离,ΔxB为车辆VX与滞后车辆的相对距离,vx accsafe为车辆VX加速时的安全速度,vx decsafe为车辆VX减速时的安全速度;
所述车辆VX加速时的安全速度vx accsafe的获取方法为:
当车辆VX加速时,设车辆VA为此时车辆VX的期望前导车辆,车辆VA与车辆VX的距离为Δx,通过数据采集模块得到期望前导车辆VA的速度、加速度分别为vA、aA,车辆VX的速度、加速度分别为vX、aX,采集间隔为Δt,最小反应时间tmin,则使车辆VX加速后经过T=Δt+tmin与VA碰撞的速度vmax满足以下条件:
求出vmax后,得到车辆VX加速的安全速度vX accsafe为:
车辆VX减速时的安全速度vx decsafe的获取方法为:
当车辆VX减速时,设车辆VC为此时车辆VX的期望前导车辆,通过步骤S1得到车辆VC与车辆VX的距离为ΔxC,期望前导车辆VC的速度、加速度分别为vC、aC,车辆VX的速度、加速度分别为vX、aX;采集间隔为Δt,最小反应时间tmin,则使VX减速后经过T=Δt+tmin与VC碰撞的速度vmax1满足以下条件:
同时,车辆VX需要避免与其滞后车辆VB发生碰撞,通过步骤S1采集到的车辆VX与车辆VB的相对距离为ΔxB,VB的速度、加速度分别为vB、aB,车辆VX的速度、加速度分别为vX、aX,采集间隔为Δt,最小反应时间tmin,则使车辆VX减速后经过T=Δt+tmin与VB碰撞的速度vmax2满足:
得到减速后的最大速度vmax、安全减速度asafe分别为:
vmax=max{vmax1,vmax2}
车辆VX减速的安全速度vX decsafe为:
S3、驾驶风格得分计算:通过人工神经网络使用反向传播算法,将步骤S1得到的速度、加速度和相对距离作为输入值计算速度得分、加速度得分、安全时距得分,并将上述得分作为输入值输入神经网络的输出函数中得到驾驶风格得分:
b1、计算速度得分:使用Krauss模型的安全速度公式分别计算需要换道车辆及与需要换道车辆相对应的前导车辆和滞后车辆的安全速度
速度得分EV为:
其中,vi safe(t+Δt)为待评分车辆i在t+Δt时刻的安全速度,Δt为观察时间,vi+1(t)为与待评分车辆i对应的前导车辆i+1在t时刻的速度,Δxi(t)为待评分车辆i与前导车辆i+1在t时刻的相对位移,Δvi(t)为待评分车辆i与前导车辆i+1在t时刻的相对速度差,T为预设反应时间,a为最大加速度,vmax为预设最高速度,vmin为预设最低速度;
b2、计算加速度得分:
利用以下公式分别计算需要换道车辆及与需要换道车辆相对应的前导车辆和滞后车辆加速度积分Ia
加速度得分EA为:
其中,Ia为加速度积分,a为待评分车辆的加速度值,Δt为自车辆决定换道到观察分析的时间差,|a|x为人类对加速度的主观感受函数,abrk为车辆最大制动加速度;
b3、计算安全时距得分:
利用以下公式计算安全时距Tsafe
安全时距得分ES为:
其中,Tsafe为安全时距;Δxsafe(vi)为使车辆vi完全停止的最小距离,L为车身长度,xbrk为制动距离,vi为当前车辆i的速度,Tmin为预设最小反应时间;
b4、计算驾驶风格得分:将得到的速度得分、加速度得分和安全时距得分作为输入值输入到神经网络的输出函数中得到驾驶风格得分,其中,采用非线性S型的Log-Sigmoid函数:
其中,为神经元激发函数:
其中,n为列描述的个数,xi为车辆i的速度得分、加速度得分、安全时距得分,wji、bj分别为激活函数的权重和偏置,权重和偏置为由人工神经网络自学习调整得到,的值域为(0,1);
整个神经网络的误差函数如下所示:
其中,d为真实值;
通过梯度下降法调整人工神经网络的权值:
其中,η为学习速度;
S4、权重调整:确定权重系数α、β:由α+β=1,权重即需换道车辆的前导车辆与滞后车辆驾驶风格得分在总分中的占比:
其中,OA为前导车辆的驾驶风格得分,OB为滞后车辆的驾驶风格得分;
S5、换道决策:根据步骤S4得到的调整后的权重重新计算步骤S2的博弈收益值,设p为当前车辆VC换道的概率,q1为滞后车辆VL加速的概率,q2为滞后车辆VL减速的概率,则VC、VL的混合概率期望收益EC、EL如下所示:
EC(p,q1,q2)=p[P'13-P'23+q1(P'11+P'23-P'13-P'21)+q2(P'12+P'23-P'13-P'22)]+[P'23+q1(P'21-P'23)+q2(P'22-P'23)]
EL(p,q1,q2)=Q'23+p(Q'13-Q'23)+q1[Q'21-Q'23+p(Q'11+Q'23-Q'13-Q'21)]+q2[Q'22-Q'23+p(Q'12+Q'23-Q'13-Q'22)]
其中,P'ij,Q'ij分别为使用步骤S4调整后的权重获得的车辆VC、VL的博弈收益值;通过对求解概率参数(p,q1,q2)的至少一个最优解(p*,q1 *,q2 *),使EC、EL达到最大,即满足:
车辆根据(p*,q1 *,q2 *)的值决定是否执行换道或放弃换道。
所述周边限制要素包括障碍物、重型车辆、应急车辆。
一种基于人工神经网络的车辆协同换道系统,包括以下模块:
换道数据采集及换道需求判断模块:包括以下模块:
换道数据采集模块:在车辆上安装数据采集模块用于采集并输出车辆在行驶过程中的路况信息,所述路况信息包括车辆在当前车道的速度及加速度、相邻车道中与当前车辆对应的前导车辆的速度及加速度、相邻车道中与当前车辆对应的滞后车辆的速度及加速度和周边限制要素的运动速度,以及当前车辆与所述前导车辆、滞后车辆以及周边限制要素之间的相对距离;所述前导车辆是位于当前车辆前方的车辆;所述滞后车辆是位于当前车辆后方的车辆;
换道需求判断模块:用于根据换道需求判断条件,判断当前车辆是否有换道需求:若当前车辆同时不满足换道需求判断条件,则当前车辆不需要换道,即放弃换道;若当前车辆满足需求判断条件中的至少一条,则当前车辆需要换道;所述换道需求判断条件为:
其中,Δxi为当前车辆i与前导车辆或周边交通要素之间的相对距离,vi e为当前车辆i的预设期望速度,vi c为当前车辆i的速度,vi+1为与当前车辆i对应的前导车辆的速度,Tsafe为预设安全时距,Tmin为预设最小反应时间,vbar为周边限制要素的运动速度,i≥1;
博弈收益计算模块:用于建立与换道行为相对应的博弈换道模型:将换道需求判断模块中需要换道的车辆的可能的行为策略作为行描述,将该车辆对应的滞后车辆可能的行为策略作为列描述,建立与换道行为相对应的博弈换道模型;并以博弈收益值数值对作为博弈换道模型的元素,每个博弈收益值数值对作为在对应行描述和列描述条件下的数值表示;提取博弈换道模型的元素构建成为博弈收益矩阵,博弈收益矩阵中的元素为(Pij,Qij),其中,Pij、Qij分别为在行描述i和列描述j的条件下,需要换道的车辆,及与该车辆对应的滞后车辆的博弈收益值,且通过以下公式获得:
Pij(或Qij)=α*A+β*B
其中,α、β为权重系数,且满足α+β=1,α、β的初始值均为0.5;对于需要计算博弈收益的车辆VX,A、B分别由以下公式计算:
其中,vX为车辆VX的速度,aX为车辆VX的加速度,Δt为采集间隔时间,ΔxA为车辆VX与前导车辆的相对距离,ΔxB为车辆VX与滞后车辆的相对距离,vx accsafe为车辆VX加速时的安全速度,vx decsafe为车辆VX减速时的安全速度;
所述车辆VX加速时的安全速度vx accsafe的获取方法为:
当车辆VX加速时,设车辆VA为此时车辆VX的期望前导车辆,车辆VA与车辆VX的距离为Δx,通过数据采集模块得到期望前导车辆VA的速度、加速度分别为vA、aA,车辆VX的速度、加速度分别为vX、aX,采集间隔为Δt,最小反应时间tmin,则使车辆VX加速后经过T=Δt+tmin与VA碰撞的速度vmax满足以下条件:
求出vmax后,得到车辆VX加速的安全速度vX accsafe为:
车辆VX减速时的安全速度vx decsafe的获取方法为:
当车辆VX减速时,设车辆VC为此时车辆VX的期望前导车辆,通过换道数据采集及换道需求判断模块得到车辆VC与车辆VX的距离为ΔxC,期望前导车辆VC的速度、加速度分别为vC、aC,车辆VX的速度、加速度分别为vX、aX;采集间隔为Δt,最小反应时间tmin,则使VX减速后经过T=Δt+tmin与VC碰撞的速度vmax1满足以下条件:
同时,车辆VX需要避免与其滞后车辆VB发生碰撞,通过换道数据采集及换道需求判断模块采集到的车辆VX与车辆VB的相对距离为ΔxB,VB的速度、加速度分别为vB、aB,车辆VX的速度、加速度分别为vX、aX,采集间隔为Δt,最小反应时间tmin,则使车辆VX减速后经过T=Δt+tmin与VB碰撞的速度vmax2满足:
得到减速后的最大速度vmax、安全减速度asafe分别为:
vmax=max{vmax1,vmax2}
车辆VX减速的安全速度vX decsafe为:
驾驶风格得分计算模块:用于通过人工神经网络使用反向传播算法,将换道数据采集及换道需求判断模块得到的速度、加速度和相对距离作为输入值计算速度得分、加速度得分、安全时距得分,并将上述得分作为输入值输入神经网络的输出函数中输出驾驶风格得分:包括以下模块:
速度得分计算模块:用于使用Krauss模型的安全速度公式分别输出需要换道车辆及与需要换道车辆相对应的前导车辆和滞后车辆的安全速度
速度得分EV为:
其中,vi safe(t+Δt)为待评分车辆i在t+Δt时刻的安全速度,Δt为观察时间,vi+1(t)为与待评分车辆i对应的前导车辆i+1在t时刻的速度,Δxi(t)为待评分车辆i与前导车辆i+1在t时刻的相对位移,Δvi(t)为待评分车辆i与前导车辆i+1在t时刻的相对速度差,T为预设反应时间,a为最大加速度,vmax为预设最高速度,vmin为预设最低速度。
加速度得分计算模块:
用于利用以下公式分别输出需要换道车辆及与需要换道车辆相对应的前导车辆和滞后车辆加速度积分Ia
加速度得分EA为:
其中,Ia为加速度积分,a为待评分车辆的加速度值,Δt为自车辆决定换道到观察分析的时间差,|a|x为人类对加速度的主观感受函数,abrk为车辆最大制动加速度;
安全时距得分计算模块:
用于利用以下公式计算安全时距Tsafe
安全时距得分ES为:
其中,Tsafe为安全时距;Δxsafe(vi)为使车辆vi完全停止的最小距离,L为车身长度,xbrk为制动距离,vi为当前车辆i的速度,Tmin为预设最小反应时间;
驾驶风格得分计算模块:将得到的速度得分、加速度得分和安全时距得分作为输入值输入到神经网络的输出函数中得到驾驶风格得分,其中,采用非线性S型的Log-Sigmoid函数:
其中,为神经元激发函数:
其中,n为列描述的个数,xi为车辆i的速度得分、加速度得分、安全时距得分,wji、bj分别为激活函数的权重和偏置,权重和偏置为由人工神经网络自学习调整得到,的值域为(0,1);
用于计算整个神经网络的误差函数:
其中,d为真实值;
用于通过梯度下降法调整人工神经网络的权值:
其中,η为学习速度;
权重调整模块:包括以下部分:
用于确定权重系数α、β:由α+β=1,权重即需换道车辆的前导车辆与滞后车辆驾驶风格得分在总分中的占比:
其中,OA为前导车辆的驾驶风格得分,OB为滞后车辆的驾驶风格得分;
换道决策模块:用于根据权重调整模块得到的调整后的权重重新计算博弈收益计算模块的博弈收益值,设p为当前车辆VC换道的概率,q1为滞后车辆VL加速的概率,q2为滞后车辆VL减速的概率,则车辆VC、VL的混合概率期望收益EC、EL如下所示:
EC(p,q1,q2)=p[P'13-P'23+q1(P'11+P'23-P'13-P'21)+q2(P'12+P'23-P'13-P'22)]+[P'23+q1(P'21-P'23)+q2(P'22-P'23)]
EL(p,q1,q2)=Q'23+p(Q'13-Q'23)+q1[Q'21-Q'23+p(Q'11+Q'23-Q'13-Q'21)]+q2[Q'22-Q'23+p(Q'12+Q'23-Q'13-Q'22)]
其中,P'ij,Q'ij分别为使用权重调整模块调整后的权重获得的VC、VL的博弈收益值;通过对求解概率参数(p,q1,q2)的至少一个最优解(p*,q1 *,q2 *),使EC、EL达到最大,即满足:
车辆根据(p*,q1 *,q2 *)的值输出是否执行换道或放弃换道。
所述周边限制要素包括障碍物、重型车辆、应急车辆。
(1)本发明的换道方法基于非合作博弈理论在交通环境建立博弈换道模型,与传统只考虑车辆安全和通行效率的方法相比,同时考虑了换道场景中的理性和非理性因素,更加贴近真实场景。(2)本发明的换道方法在计算博弈收益值时,加入了前导车辆、滞后车辆的驾驶风格参数参与计算,与传统的方法相比更加重视驾驶环节中的人类因素,既考虑到车辆的共性,同时兼顾不同驾驶风格的个性,无人驾驶汽车具备一定类人行为能力,对混合行驶场景有更强的适应力。(3)本发明的换道方法对驾驶风格进行量化分析,用于调整不同车辆的影响权重,与传统的人类主观分析样本方法相比,结果更加精确。(4)本发明的换道方法使用了收益再调整方案,按照换道需求、换道可能性、换道决策三部分建模,符合人类思考过程,为进一步提高无人驾驶汽车的类人行为能力奠定了基础。(5)本发明的换道方法使用人工神经网络处理车辆获取的信息,相比传统无人驾驶汽车直接处理信息,算法实现了基本的数据加工,通过神经网络的自学习能力,计算精度会随样本数量的增多更加精确,符合人类在认知过程中积累经验促进认知的学习过程。
附图说明
图1是本发明换道场景示意图。
图2是本发明的方法原理图。
图3是本发明的方法流程图。
图4是本发明的模块连接示意图。
具体实施方式
以下结合附图及具体实施例对本发明进行说明:
如图2-3所示,一种基于人工神经网络的车辆协同换道方法,包括以下步骤:
S1:换道数据采集及换道需求判断:
a1、换道数据采集:通过安装在车辆上的数据采集模块(如图像采集模块、测速传感器等)采集车辆在行驶过程中的路况信息,其中,如图1所示,路况信息包括当前车辆(如图1中的V1)在当前车道的速度及加速度、相邻车道中与当前车辆对应的前导车辆V2的速度及加速度、相邻车道中与当前车辆对应的滞后车辆V3的速度及加速度和周边要素的运动速度,以及当前车辆V1与前导车辆V2、滞后车辆V3以及周边要素(如障碍物、重型车辆、应急车辆等,如图1中的b点)之间的相对距离;前导车辆V2是位于当前车辆前方的车辆;滞后车辆V3是位于当前车辆后方的车辆。
a2、换道需求判断:根据换道需求判断条件,判断当前车辆是否有换道需求:若当前车辆同时不满足换道需求判断条件,则当前车辆不需要换道,即放弃换道;若当前车辆满足需求判断条件中的至少一条,则当前车辆需要换道;所述换道需求判断条件为:
其中,Δxi为当前车辆i与前导车辆或周边交通要素之间的相对距离,vi e为当前车辆i的预设期望速度,vi c为当前车辆i的速度,vi+1为与当前车辆i对应的前导车辆的速度,Tsafe为预设安全时距,Tmin为预设最小反应时间,vbar为周边限制要素的运动速度,i≥1;
S2、博弈收益计算:建立与换道行为相对应的博弈换道模型:将步骤a2中需要换道的车辆的可能的行为策略作为行描述,将该车辆对应的滞后车辆可能的行为策略作为列描述,建立与换道行为相对应的博弈换道模型;并以博弈收益值数值对作为博弈换道模型的元素,每个博弈收益值数值对作为在对应行描述和列描述条件下的数值表示;提取博弈换道模型的元素构建成为博弈收益矩阵,博弈收益矩阵中的元素为(Pij,Qij),其中,Pij、Qij分别为在行描述i和列描述j的条件下,需要换道的车辆及与该车辆对应的滞后车辆的博弈收益值,且通过以下公式获得:
Pij(或Qij)=α*A+β*B
其中,α、β为权重系数,且满足α+β=1,α、β的初始值均为0.5;对于需要计算博弈收益的车辆VX,A、B分别由以下公式计算:
其中,vX为车辆VX的速度,aX为车辆VX的加速度,Δt为采集间隔时间,ΔxA为车辆VX与前导车辆的相对距离,ΔxB为车辆VX与滞后车辆的相对距离,vx accsafe为车辆VX加速时的安全速度,vx decsafe为车辆VX减速时的安全速度;
所述车辆VX加速时的安全速度vx accsafe的获取方法为:
当车辆VX加速时,设车辆VA为此时车辆VX的期望前导车辆,车辆VA与车辆VX的距离为Δx,通过数据采集模块得到期望前导车辆VA的速度、加速度分别为vA、aA,车辆VX的速度、加速度分别为vX、aX,采集间隔为Δt,最小反应时间tmin,则使车辆VX加速后经过T=Δt+tmin与VA碰撞的速度vmax满足以下条件:
求出vmax后,得到车辆VX加速的安全速度vX accsafe为:
车辆VX减速时的安全速度vx decsafe的获取方法为:
当车辆VX减速时,设车辆VC为此时车辆VX的期望前导车辆,通过步骤S1得到车辆VC与车辆VX的距离为ΔxC,期望前导车辆VC的速度、加速度分别为vC、aC,车辆VX的速度、加速度分别为vX、aX;采集间隔为Δt,最小反应时间tmin,则使VX减速后经过T=Δt+tmin与VC碰撞的速度vmax1满足以下条件:
同时,车辆VX需要避免与其滞后车辆VB发生碰撞,通过步骤S1采集到的车辆VX与车辆VB的相对距离为ΔxB,VB的速度、加速度分别为vB、aB,车辆VX的速度、加速度分别为vX、aX,采集间隔为Δt,最小反应时间tmin,则使车辆VX减速后经过T=Δt+tmin与VB碰撞的速度vmax2满足:
得到减速后的最大速度vmax、安全减速度asafe分别为:
vmax=max{vmax1,vmax2}
车辆VX减速的安全速度vX decsafe为:
S3、驾驶风格得分计算:通过人工神经网络使用反向传播算法,将步骤S1得到的速度、加速度和相对距离作为输入值计算速度得分、加速度得分、安全时距得分,并将上述得分作为输入值输入神经网络的输出函数中得到驾驶风格得分:
b1、计算速度得分:使用Krauss模型的安全速度公式分别计算需要换道车辆及与需要换道车辆相对应的前导车辆和滞后车辆的安全速度
速度得分EV为:
其中,vi safe(t+Δt)为待评分车辆i在t+Δt时刻的安全速度,Δt为观察时间,vi+1(t)为与待评分车辆i对应的前导车辆i+1在t时刻的速度,Δxi(t)为待评分车辆i与前导车辆i+1在t时刻的相对位移,Δvi(t)为待评分车辆i与前导车辆i+1在t时刻的相对速度差,T为预设反应时间,a为最大加速度,vmax为预设最高速度,vmin为预设最低速度。
b2、计算加速度得分:
利用以下公式分别计算需要换道车辆及与需要换道车辆相对应的前导车辆和滞后车辆加速度积分Ia
加速度得分EA为:
其中,Ia为加速度积分,a为待评分车辆的加速度值,Δt为自车辆决定换道到观察分析的时间差,|a|x为人类对加速度的主观感受函数,abrk为车辆最大制动加速度;
b3、计算安全时距得分:
利用以下公式计算安全时距Tsafe
安全时距得分ES为:
其中,Tsafe为安全时距;Δxsafe(vi)为使车辆vi完全停止的最小距离,L为车身长度,xbrk为制动距离,vi为当前车辆i的速度,Tmin为预设最小反应时间;
b4、计算驾驶风格得分:将得到的速度得分、加速度得分和安全时距得分作为输入值输入到神经网络的输出函数中得到驾驶风格得分,其中,采用非线性S型的Log-Sigmoid函数:
其中,为神经元激发函数:
其中,n为列描述的个数,xi为车辆i的速度得分、加速度得分、安全时距得分,wji、bj分别为激活函数的权重和偏置,权重和偏置为由人工神经网络自学习调整得到,的值域为(0,1);
整个神经网络的误差函数如下所示:
其中,d为真实值;
通过梯度下降法调整人工神经网络的权值:
其中,η为学习速度;
S4、权重调整:确定权重系数α、β:由α+β=1,权重即需换道车辆的前导车辆与滞后车辆驾驶风格得分在总分中的占比:
其中,OA为前导车辆的驾驶风格得分,OB为滞后车辆的驾驶风格得分;
S5、换道决策:根据步骤S4得到的调整后的权重重新计算步骤S2的博弈收益值,设p为当前车辆VC换道的概率,q1为滞后车辆VL加速的概率,q2为滞后车辆VL减速的概率,则车辆VC、VL的混合概率期望收益EC、EL如下所示:
EC(p,q1,q2)=p[P'13-P'23+q1(P'11+P'23-P'13-P'21)+q2(P'12+P'23-P'13-P'22)]+[P'23+q1(P'21-P'23)+q2(P'22-P'23)]
EL(p,q1,q2)=Q'23+p(Q'13-Q'23)+q1[Q'21-Q'23+p(Q'11+Q'23-Q'13-Q'21)]+q2[Q'22-Q'23+p(Q'12+Q'23-Q'13-Q'22)]
其中,P'ij,Q'ij分别为使用步骤S4调整后的权重获得的VC、VL的博弈收益值;通过对求解概
率参数(p,q1,q2)的至少一个最优解(p*,q1 *,q2 *),使EC、EL达到最大,即满足:
车辆根据(p*,q1 *,q2 *)的值决定是否执行换道或放弃换道。
以下通过具体实施例实现上述换道方法:
实施例1:
以图1场景为例,具体步骤如下:
S1:换道数据采集及换道需求判断:
a1、换道数据采集:图1中车辆V1-V3在行驶过程中由换道数据采集模块收集路况信息,采集到车辆V1速度为10m/s,期望速度为13.9m/s,加速度为1.4m/s2,距离b点23m,距离前导车辆V2 16m,距离V34米,前导车辆V2速度为14.4m/s,加速度为0.6m/s2,滞后车辆V3速度为12.5m/s,加速度为0.9m/s2。;
a2、换道需求判断:根据以下公式判断车辆是否具有换道需求:
其中,Δxi表示当前车辆V1与前导车辆V2或周边要素的相对距离,vi e表示当前车辆V1的期望速度,vi c表示当前车辆V1的实际速度,vi+1表示前导车辆V2的速度,Tmin表示最小反应时间,取人类大脑作出反应时间约1.5s(下同),Tsafe表示安全时距,此处取Tmin的两倍3s(下同),vbar为周边限制要素的运动速度,图1中b点为周边限制要素,其运动速度为0。
此时,根据上述公式判断,V1满足公式(1-1),即当前车辆V1具有换道需求。
S2、博弈收益计算:建立与换道行为相对应的博弈换道模型:图1中,参与换道的车辆为并道行为中关系最为密切的需要换道的当前车辆V1与选定目标车道的滞后车辆V3,将步骤a2中需要换道的当前车辆V1的可能的行为策略作为行描述,将滞后车辆V3可能的行为策略作为列描述,建立与换道行为相对应的博弈换道模型,因该图1中只有两车道滞后车辆V3无法选择换道避让,因此滞后车辆V3只有两个行为策略,即V3加速和V3减速,得到的博弈换道模型如表1所示:
表1博弈收益模型
行为策略 V3加速 V3减速
V1换道 (P11,Q11) (P12,Q12)
V1不换道 (P21,Q21) (P22,Q22)
提取出的博弈收益矩阵为:
博弈收益矩阵中的元素为(Pij,Qij),其中,Pij、Qij分别为在行描述i和列描述j的条件下需要换道的当前车辆V1及滞后车辆V3的收益值,根据表1的博弈收益模型,P11,Q11表示在V1换道,V3加速的情况下,需要换道的当前车辆V1及滞后车辆V3的收益值,收益值的计算方法如下:
Pij(或Qij)=α*A+β*B (2-1)
其中,α、β为权重系数,且满足α+β=1,α、β的初始值均为0.5。对于需要计算博弈收益的车辆VX,A、B分别由以下公式计算:
其中,vX为VX的采集速度,aX为VX的采集加速度,Δt为采集间隔时间,ΔxA为VX与前导车辆的相对距离,ΔxB为VX与滞后车辆的相对距离,vx accsafe为VX选择加速的安全速度,vx decsafe为VX选择减速的安全速度。
vx accsafe的计算方法:
如果车辆VX加速,希望车辆VA作为它的前导车辆,它们的距离为Δx,VA的速度、加速度分别为vA、aA,VX的速度、加速度分别为vX、aX,采集间隔为Δt,最小反应时间tmin,则VX加速后经过(T=Δt+tmin)正好与VA碰撞的速度vmax满足:
求出vmax后,可得车辆VX的安全加速度asafe为:
车辆VX加速的安全速度vX accsafe为:
vx decsafe的计算方法:
如果车辆VX减速,希望换道车辆VC作为它的前导车辆,它们的距离为ΔxC,VC的速度、加速度分别为vC、aC,VX的速度、加速度分别为vX、aX,采集间隔为Δt,最小反应时间tmin,则VX减速后经过(T=Δt+tmin)正好与VC碰撞的速度vmax1满足:
如果车辆VX减速,还需要避免与其滞后车辆VB发生碰撞,它们的距离为ΔxB,VB的速度、加速度分别为vB、aB,VX的速度、加速度分别为vX、aX,采集间隔为Δt,最小反应时间tmin,则VX减速后经过(T=Δt+tmin)正好与VB碰撞的速度vmax2满足:
对于VX,上述两个条件均要满足,因此减速后的最大速度vmax、安全减速度asafe分别为:
vmax=max{vmax1,vmax2} (2-8)
车辆VX减速的安全速度vX decsafe为:
将步骤a1采集到当前车辆V1与前导车辆V2之间的相对距离、当前车辆V1与滞后车辆V3之间的相对距离、由当前车辆V1的速度、前导车辆V2的速度、滞后车辆V3的速度,可得出当前车辆V1与前导车辆V2的相对速度、当前车辆V1与滞后车辆V3的相对速度。
如果V3加速,即希望V2作为它的前导车辆,V3最快在下次数据采集时(1s后)完成加速,且V3加速后需要至少预留最小反应时间(1.5s)作为安全时间避免与V2碰撞,经计算,V3加速后的最大安全速度为21.02m/s,加速度为7.62m/s。
如果V3减速,即希望V1作为它的前导车辆,V3最快在下次数据采集时(1s后)完成减速,且V3减速后需要至少预留最小反应时间(1.5s)作为安全时间避免与V1碰撞,经计算,V3减速后的最大安全速度为13.18m/s,加速度为-0.22m/s。
利用公式(1-3)中可提取出博弈收益矩阵:
S3、驾驶风格得分计算:针对换道行为特点,驾驶风格得分计算:通过人工神经网络使用反向传播算法,将步骤S1得到的速度、加速度和相对距离作为输入值计算速度得分、加速度得分、安全时距得分,并将上述得分作为输入值输入神经网络的输出函数中得到驾驶风格得分:
b1、计算速度得分:使用Krauss模型的安全速度公式分别计算需要换道车辆及与需要换道车辆相对应的前导车辆和滞后车辆的安全速度
速度得分EV为:
其中,vi safe(t+Δt)为待评分车辆i在t+Δt时刻的安全速度,Δt为观察时间,vi+1(t)为与待评分车辆i对应的前导车辆i+1在t时刻的速度,Δxi(t)为待评分车辆i与前导车辆i+1在t时刻的相对位移,Δvi(t)为待评分车辆i与前导车辆i+1在t时刻的相对速度差,T为预设反应时间,a为最大加速度,vmax为预设最高速度,vmin为预设最低速度。
根据国家法规(GB12676),汽车的满载制动加速度要大于等于5m/s2(下同),vmax为法律规定的最高速度,取19.4m/s(70km/h),vmin为法律规定的最低速度。
将步骤S1中采集到的车辆V1速度为10m/s,前导车辆V2速度为14.4m/s,滞后车辆V3速度为12.5m/s,输入到公式(3-1)(3-2)中得到V1、V2和V3的速度得分分别为:0.515、0.742和0.967。
b2、计算加速度得分:
利用以下公式分别计算需要换道车辆及与需要换道车辆相对应的前导车辆和滞后车辆加速度积分Ia
加速度得分EA为:
其中,Ia为加速度积分,a为待评分车辆的加速度值,Δt为自车辆决定换道到观察分析的时间差,|a|x为人类对加速度的主观感受函数,abrk为车辆最大制动加速度;
本实施例采用Δt=1s后采集到V1、V2和V3的加速度分别为-1.5m/s2,0.7m/s2,1.1m/s2。得到V1、V2和V3的加速度得分分别为:0.01、0.01和0.04。
b3、计算安全时距得分:
根据车辆跟随模型(CFM)对于安全距离的定义可知,安全距离是车身长度、制动距离、车速与安全时距的乘积之和。因此利用以下公式计算安全时距Tsafe
安全时距得分ES为:
其中,Tsafe为安全时距;Δxsafe(vi)为使车辆vi完全停止的最小距离,L为车身长度,xbrk为制动距离,vi为当前车辆i的速度,Tmin为预设最小反应时间;
得到V1、V2和V3的安全时距得分分别为:0.083、0.574和0.354
b4、计算驾驶风格得分:基于反向传播算法设计人工神经网络模块计算输出值用于调整权重参数α、β。输出值即驾驶风格得分,分数越低表明驾驶风格越保守,反之,分数越高表明驾驶风格越激进。
将得到的速度得分、加速度得分和安全时距得分作为输入值输入到神经网络的输出函数中得到驾驶风格得分,其中,采用非线性S型的Log-Sigmoid函数:
其中,为神经元激发函数:
其中,n为列描述的个数,xi为车辆i的速度得分、加速度得分、安全时距得分,wji、bj分别为激活函数的权重和偏置,权重和偏置为由人工神经网络自学习调整得到,的值域为(0,1)。
整个神经网络的误差函数如下所示:
其中,d为真实值;
通过梯度下降法调整人工神经网络的权值:
其中,η为学习速度;
S4、权重调整:确定权重系数α、β:由α+β=1,权重即需换道车辆的前导车辆与滞后车辆驾驶风格得分在总分中的占比:
其中,OA为前导车辆的驾驶风格得分,OB为滞后车辆的驾驶风格得分;
若V1换道,V1调整后的α为0.416,β为0.584,V3调整后的α为1,β为0,因为V3跟驰车辆距离非常远,可忽略影响;
若V1不换道,V1调整后的α为1,β为0,V3调整后的α为1,β为0,因为V1、V3跟驰车辆距离非常远,可忽略影响。
S5、换道决策:根据步骤S4得到的调整后的权重重新计算步骤S2的博弈收益值,得到的新的博弈收益矩阵如下:
设p为当前车辆VC换道的概率,q1为滞后车辆VL加速的概率,q2为滞后车辆VL减速的概率,则VC、VL的混合概率期望收益EC、EL如下所示:
EC(p,q1,q2)=p[P'13-P'23+q1(P'11+P'23-P'13-P'21)+q2(P'12+P'23-P'13-P'22)]+[P'23+q1(P'21-P'23)+q2(P'22-P'23)] (4-3)
EL(p,q1,q2)=Q'23+p(Q'13-Q'23)+q1[Q'21-Q'23+p(Q'11+Q'23-Q'13-Q'21)]+q2[Q'22-Q'23+p(Q'12+Q'23-Q'13-Q'22)] (4-4)
其中,P'ij,Q'ij分别为使用步骤S4调整后的权重获得的VC、VL的博弈收益值;通过对求解概率参数(p,q1,q2)的至少一个最优解(p*,q1 *,q2 *),至此,将换道决策转换为寻找博弈均衡点的过程,即求解纳什均衡(p*,q1 *,q2 *),使EC、EL达到最大,即满足:
车辆根据(p*,q1 *,q2 *)的值决定是否执行换道或放弃换道。本实施例得到的最优混合概率解(p*,q1 *,q2 *)为(1,0,1),即V1应该选择换道避免与b点相撞,V3应该减速让行避免与V1碰撞。根据(p*,q1 *,q2 *)的值如表2所示:其中,p*为V1最优换道概率,q1*为V3最优加速概率,q2*为V3最优减速概率,计算值分别为(1,0,1),所以纳什均衡是V1换道,V3减速,即表2
表2换道策略决策表
纳什均衡 V1换道 V1不换道 V3加速 V3减速
1 1 0 0 1
本发明根据上述换道方法提供了一种基于人工神经网络的车辆协同换道系统,具体如下:
如图4所示,一种基于人工神经网络的车辆协同换道系统,包括以下模块:
换道数据采集及换道需求判断模块:包括以下模块:
换道数据采集模块:在车辆上安装数据采集模块用于采集并输出车辆在行驶过程中的路况信息,所述路况信息包括车辆在当前车道的速度及加速度、相邻车道中与当前车辆对应的前导车辆的速度及加速度、相邻车道中与当前车辆对应的滞后车辆的速度及加速度和周边限制要素的运动速度,以及当前车辆与所述前导车辆、滞后车辆以及周边限制要素之间的相对距离;所述前导车辆是位于当前车辆前方的车辆;所述滞后车辆是位于当前车辆后方的车辆;
换道需求判断模块:用于根据换道需求判断条件,判断当前车辆是否有换道需求:若当前车辆同时不满足换道需求判断条件,则当前车辆不需要换道,即放弃换道;若当前车辆满足需求判断条件中的至少一条,则当前车辆需要换道;所述换道需求判断条件为:
其中,Δxi为当前车辆i与前导车辆或周边交通要素之间的相对距离,vi e为当前车辆i的预设期望速度,vi c为当前车辆i的速度,vi+1为与当前车辆i对应的前导车辆的速度,Tsafe为预设安全时距,Tmin为预设最小反应时间,vbar为周边限制要素的运动速度,i≥1;
博弈收益计算模块:用于建立与换道行为相对应的博弈换道模型:将换道需求判断模块中需要换道的车辆的可能的行为策略作为行描述,将该车辆对应的滞后车辆可能的行为策略作为列描述,建立与换道行为相对应的博弈换道模型;并以博弈收益值数值对作为博弈换道模型的元素,每个博弈收益值数值对作为在对应行描述和列描述条件下的数值表示;提取博弈换道模型的元素构建成为博弈收益矩阵,博弈收益矩阵中的元素为(Pij,Qij),其中,Pij、Qij分别为在行描述i和列描述j的条件下,需要换道的车辆,及与该车辆对应的滞后车辆的博弈收益值,且通过以下公式获得:
Pij(或Qij)=α*A+β*B
其中,α、β为权重系数,且满足α+β=1,α、β的初始值均为0.5;对于需要计算博弈收益的车辆VX,A、B分别由以下公式计算:
其中,vX为车辆VX的速度,aX为车辆VX的加速度,Δt为采集间隔时间,ΔxA为车辆VX与前导车辆的相对距离,ΔxB为车辆VX与滞后车辆的相对距离,vx accsafe为车辆VX加速时的安全速度,vx decsafe为车辆VX减速时的安全速度;
所述车辆VX加速时的安全速度vx accsafe的获取方法为:
当车辆VX加速时,设车辆VA为此时车辆VX的期望前导车辆,车辆VA与车辆VX的距离为Δx,通过数据采集模块得到期望前导车辆VA的速度、加速度分别为vA、aA,车辆VX的速度、加速度分别为vX、aX,采集间隔为Δt,最小反应时间tmin,则使车辆VX加速后经过T=Δt+tmin与VA碰撞的速度vmax满足以下条件:
求出vmax后,得到车辆VX加速的安全速度vX accsafe为:
车辆VX减速时的安全速度vx decsafe的获取方法为:
当车辆VX减速时,设车辆VC为此时车辆VX的期望前导车辆,通过换道数据采集及换道需求判断模块得到车辆VC与车辆VX的距离为ΔxC,期望前导车辆VC的速度、加速度分别为vC、aC,车辆VX的速度、加速度分别为vX、aX;采集间隔为Δt,最小反应时间tmin,则使VX减速后经过T=Δt+tmin与VC碰撞的速度vmax1满足以下条件:
同时,车辆VX需要避免与其滞后车辆VB发生碰撞,通过换道数据采集及换道需求判断模块采集到的车辆VX与车辆VB的相对距离为ΔxB,VB的速度、加速度分别为vB、aB,车辆VX的速度、加速度分别为vX、aX,采集间隔为Δt,最小反应时间tmin,则使车辆VX减速后经过T=Δt+tmin与VB碰撞的速度vmax2满足:
得到减速后的最大速度vmax、安全减速度asafe分别为:
vmax=max{vmax1,vmax2}
车辆VX减速的安全速度vX decsafe为:
驾驶风格得分计算模块:用于通过人工神经网络使用反向传播算法,将换道数据采集及换道需求判断模块得到的速度、加速度和相对距离作为输入值计算速度得分、加速度得分、安全时距得分,并将上述得分作为输入值输入神经网络的输出函数中输出驾驶风格得分:包括以下模块:
速度得分计算模块:用于使用Krauss模型的安全速度公式分别输出需要换道车辆及与需要换道车辆相对应的前导车辆和滞后车辆的安全速度
速度得分EV为:
其中,vi safe(t+Δt)为待评分车辆i在t+Δt时刻的安全速度,Δt为观察时间,vi+1(t)为与待评分车辆i对应的前导车辆i+1在t时刻的速度,Δxi(t)为待评分车辆i与前导车辆i+1在t时刻的相对位移,Δvi(t)为待评分车辆i与前导车辆i+1在t时刻的相对速度差,T为预设反应时间,a为最大加速度,vmax为预设最高速度,vmin为预设最低速度。
加速度得分计算模块:
用于利用以下公式分别输出需要换道车辆及与需要换道车辆相对应的前导车辆和滞后车辆加速度积分Ia
加速度得分EA为:
其中,Ia为加速度积分,a为待评分车辆的加速度值,Δt为自车辆决定换道到观察分析的时间差,|a|x为人类对加速度的主观感受函数,abrk为车辆最大制动加速度;
安全时距得分计算模块:
用于利用以下公式计算安全时距Tsafe
安全时距得分ES为:
其中,Tsafe为安全时距;Δxsafe(vi)为使车辆vi完全停止的最小距离,L为车身长度,xbrk为制动距离,vi为当前车辆i的速度,Tmin为预设最小反应时间;
驾驶风格得分计算模块:将得到的速度得分、加速度得分和安全时距得分作为输入值输入到神经网络的输出函数中得到驾驶风格得分,其中,采用非线性S型的Log-Sigmoid函数:
其中,为神经元激发函数:
其中,n为列描述的个数,xi为车辆i的速度得分、加速度得分、安全时距得分,wji、bj分别为激活函数的权重和偏置,权重和偏置为由人工神经网络自学习调整得到,的值域为(0,1);
用于计算整个神经网络的误差函数:
其中,d为真实值;
用于通过梯度下降法调整人工神经网络的权值:
其中,η为学习速度;
权重调整模块:包括以下部分:
用于确定权重系数α、β:由α+β=1,权重即需换道车辆的前导车辆与滞后车辆驾驶风格得分在总分中的占比:
其中,OA为前导车辆的驾驶风格得分,OB为滞后车辆的驾驶风格得分;
换道决策模块:用于根据权重调整模块得到的调整后的权重重新计算博弈收益计算模块的博弈收益值,设p为当前车辆VC换道的概率,q1为滞后车辆VL加速的概率,q2为滞后车辆VL减速的概率,则车辆VC、VL的混合概率期望收益EC、EL如下所示:
EC(p,q1,q2)=p[P'13-P'23+q1(P'11+P'23-P'13-P'21)+q2(P'12+P'23-P'13-P'22)]+[P'23+q1(P'21-P'23)+q2(P'22-P'23)]
EL(p,q1,q2)=Q'23+p(Q'13-Q'23)+q1[Q'21-Q'23+p(Q'11+Q'23-Q'13-Q'21)]+q2[Q'22-Q'23+p(Q'12+Q'23-Q'13-Q'22)]
其中,P'ij,Q'ij分别为使用权重调整模块调整后的权重获得的VC、VL的博弈收益值;通过对求解概率参数(p,q1,q2)的至少一个最优解(p*,q1 *,q2 *),使EC、EL达到最大,即满足:
车辆根据(p*,q1 *,q2 *)的值输出是否执行换道或放弃换道以上内容是结合具体的优选技术方案对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (4)

1.一种基于人工神经网络的车辆协同换道方法,其特征在于,包括以下步骤:
S1:换道数据采集及换道需求判断:
a1、换道数据采集:通过安装在车辆上的数据采集模块采集车辆在行驶过程中的路况信息,所述路况信息包括车辆在当前车道的速度及加速度、相邻车道中与当前车辆对应的前导车辆的速度及加速度、相邻车道中与当前车辆对应的滞后车辆的速度及加速度和周边限制要素的运动速度,以及当前车辆与所述前导车辆、滞后车辆以及周边限制要素之间的相对距离;所述前导车辆是位于当前车辆前方的车辆;所述滞后车辆是位于当前车辆后方的车辆;
a2、换道需求判断:根据换道需求判断条件,判断当前车辆是否有换道需求:若当前车辆同时不满足换道需求判断条件,则当前车辆不需要换道,即放弃换道;若当前车辆满足需求判断条件中的至少一条,则当前车辆需要换道;所述换道需求判断条件为:
<mrow> <mfrac> <mrow> <msub> <mi>&amp;Delta;x</mi> <mi>i</mi> </msub> </mrow> <mrow> <msubsup> <mi>v</mi> <mi>i</mi> <mi>e</mi> </msubsup> <mo>-</mo> <msub> <mi>v</mi> <mrow> <mi>i</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> </mrow> </mfrac> <mo>&lt;</mo> <msup> <mi>T</mi> <mrow> <mi>s</mi> <mi>a</mi> <mi>f</mi> <mi>e</mi> </mrow> </msup> </mrow>
<mrow> <mfrac> <mrow> <msub> <mi>&amp;Delta;x</mi> <mi>i</mi> </msub> </mrow> <mrow> <msubsup> <mi>v</mi> <mi>i</mi> <mi>c</mi> </msubsup> <mo>-</mo> <msup> <mi>v</mi> <mrow> <mi>b</mi> <mi>a</mi> <mi>r</mi> </mrow> </msup> </mrow> </mfrac> <mo>&lt;</mo> <msup> <mi>T</mi> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msup> </mrow>
其中,Δxi为当前车辆i与前导车辆或周边交通要素之间的相对距离,vi e为当前车辆i的预设期望速度,vi c为当前车辆i的速度,vi+1为与当前车辆i对应的前导车辆的速度,Tsafe为预设安全时距,Tmin为预设最小反应时间,vbar为周边限制要素的运动速度,i≥1;
S2、博弈收益计算:建立与换道行为相对应的博弈换道模型:将步骤a2中需要换道的车辆的可能行为策略作为行描述,将该车辆对应的滞后车辆的可能行为策略作为列描述,建立与换道行为相对应的博弈换道模型;并以博弈收益值数值对作为博弈换道模型的元素,每个博弈收益值数值对作为在对应行描述和列描述条件下的数值表示;提取博弈换道模型的元素构建成为博弈收益矩阵,博弈收益矩阵中的元素为(Pij,Qij),其中,Pij、Qij分别为在行描述i和列描述j的条件下,需要换道的车辆及与该车辆对应的滞后车辆的博弈收益值,且通过以下公式获得:
Pij(或Qij)=α*A+β*B
其中,α、β为权重系数,且满足α+β=1,α、β的初始值均为0.5;对于需要计算博弈收益的车辆VX,A、B分别由以下公式计算:
其中,vX为车辆VX的速度,aX为车辆VX的加速度,Δt为采集间隔时间,ΔxA为车辆VX与前导车辆的相对距离,ΔxB为车辆VX与滞后车辆的相对距离,vx accsafe为车辆VX加速时的安全速度,vx decsafe为车辆VX减速时的安全速度;
所述车辆VX加速时的安全速度vx accsafe的获取方法为:
当车辆VX加速时,设车辆VA为此时车辆VX的期望前导车辆,车辆VA与车辆VX的距离为Δx,通过数据采集模块得到期望前导车辆VA的速度、加速度分别为vA、aA,车辆VX的速度、加速度分别为vX、aX,采集间隔为Δt,最小反应时间tmin,则使车辆VX加速后经过T=Δt+tmin与VA碰撞的速度vmax满足以下条件:
<mrow> <msub> <mi>v</mi> <mi>A</mi> </msub> <mo>*</mo> <mi>T</mi> <mo>+</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>*</mo> <msub> <mi>a</mi> <mi>A</mi> </msub> <mo>*</mo> <msup> <mi>T</mi> <mn>2</mn> </msup> <mo>+</mo> <mi>&amp;Delta;</mi> <mi>x</mi> <mo>=</mo> <mfrac> <mrow> <msub> <mi>v</mi> <mi>X</mi> </msub> <mo>+</mo> <msub> <mi>v</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> </mrow> <mn>2</mn> </mfrac> <mo>*</mo> <mi>T</mi> </mrow>
求出vmax后,得到车辆VX加速的安全速度vX accsafe为:
<mrow> <msubsup> <mi>v</mi> <mi>X</mi> <mrow> <mi>a</mi> <mi>c</mi> <mi>c</mi> <mi>s</mi> <mi>a</mi> <mi>f</mi> <mi>e</mi> </mrow> </msubsup> <mo>=</mo> <msub> <mi>v</mi> <mi>X</mi> </msub> <mo>+</mo> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>v</mi> <mi>X</mi> </msub> <mo>)</mo> </mrow> <mo>*</mo> <mfrac> <mrow> <mi>&amp;Delta;</mi> <mi>t</mi> </mrow> <mi>T</mi> </mfrac> <mo>;</mo> </mrow>
车辆VX减速时的安全速度vx decsafe的获取方法为:
当车辆VX减速时,设车辆VC为此时车辆VX的期望前导车辆,通过步骤S1得到车辆VC与车辆VX的距离为ΔxC,期望前导车辆VC的速度、加速度分别为vC、aC,车辆VX的速度、加速度分别为vX、aX;采集间隔为Δt,最小反应时间tmin,则使VX减速后经过T=Δt+tmin与VC碰撞的速度vmax1满足以下条件:
<mrow> <msub> <mi>v</mi> <mi>C</mi> </msub> <mo>*</mo> <mi>T</mi> <mo>+</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>*</mo> <msub> <mi>a</mi> <mi>C</mi> </msub> <mo>*</mo> <msup> <mi>T</mi> <mn>2</mn> </msup> <mo>+</mo> <msub> <mi>&amp;Delta;x</mi> <mi>C</mi> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>v</mi> <mi>X</mi> </msub> <mo>+</mo> <msub> <mi>v</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mn>1</mn> </mrow> </msub> </mrow> <mn>2</mn> </mfrac> <mo>*</mo> <mi>T</mi> </mrow>
同时,车辆VX需要避免与其滞后车辆VB发生碰撞,通过步骤S1采集到的车辆VX与车辆VB的相对距离为ΔxB,VB的速度、加速度分别为vB、aB,车辆VX的速度、加速度分别为vX、aX,采集间隔为Δt,最小反应时间tmin,则使车辆VX减速后经过T=Δt+tmin与VB碰撞的速度vmax2满足:
<mrow> <msub> <mi>v</mi> <mi>B</mi> </msub> <mo>*</mo> <mi>T</mi> <mo>+</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>*</mo> <msub> <mi>a</mi> <mi>B</mi> </msub> <mo>*</mo> <msup> <mi>T</mi> <mn>2</mn> </msup> <mo>=</mo> <mfrac> <mrow> <msub> <mi>v</mi> <mi>X</mi> </msub> <mo>+</mo> <msub> <mi>v</mi> <mrow> <mi>max</mi> <mn>2</mn> </mrow> </msub> </mrow> <mn>2</mn> </mfrac> <mo>*</mo> <mi>T</mi> <mo>+</mo> <msub> <mi>&amp;Delta;x</mi> <mi>C</mi> </msub> </mrow>
得到减速后的最大速度vmax、安全减速度asafe分别为:
vmax=max{vmax1,vmax2}
<mrow> <msub> <mi>a</mi> <mrow> <mi>s</mi> <mi>a</mi> <mi>f</mi> <mi>e</mi> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>v</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>v</mi> <mi>X</mi> </msub> </mrow> <mi>T</mi> </mfrac> </mrow>
车辆VX减速的安全速度vX decsafe为:
<mrow> <msubsup> <mi>v</mi> <mi>X</mi> <mrow> <mi>d</mi> <mi>e</mi> <mi>c</mi> <mi>s</mi> <mi>a</mi> <mi>f</mi> <mi>e</mi> </mrow> </msubsup> <mo>=</mo> <msub> <mi>v</mi> <mi>X</mi> </msub> <mo>+</mo> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mi>X</mi> </msub> <mo>-</mo> <msub> <mi>v</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>*</mo> <mfrac> <mrow> <mi>&amp;Delta;</mi> <mi>t</mi> </mrow> <mi>T</mi> </mfrac> <mo>;</mo> </mrow>
S3、驾驶风格得分计算:通过人工神经网络使用反向传播算法,将步骤S1得到的速度、加速度和相对距离作为输入值计算速度得分、加速度得分、安全时距得分,并将上述得分作为输入值输入神经网络的输出函数中得到驾驶风格得分:
b1、计算速度得分:使用Krauss模型的安全速度公式分别计算需要换道车辆及与需要换道车辆相对应的前导车辆和滞后车辆的安全速度
<mrow> <msubsup> <mi>v</mi> <mi>i</mi> <mrow> <mi>s</mi> <mi>a</mi> <mi>f</mi> <mi>e</mi> </mrow> </msubsup> <mrow> <mo>(</mo> <mi>t</mi> <mo>+</mo> <mi>&amp;Delta;</mi> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>v</mi> <mrow> <mi>i</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>+</mo> <mfrac> <mrow> <msub> <mi>&amp;Delta;x</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>v</mi> <mrow> <mi>i</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>*</mo> <mi>T</mi> </mrow> <mrow> <msub> <mi>&amp;Delta;v</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>/</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>*</mo> <mi>a</mi> <mo>+</mo> <mi>T</mi> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>
速度得分EV为:
其中,vi safe(t+Δt)为待评分车辆i在t+Δt时刻的安全速度,Δt为观察时间,vi+1(t)为与待评分车辆i对应的前导车辆i+1在t时刻的速度,Δxi(t)为待评分车辆i与前导车辆i+1在t时刻的相对位移,Δvi(t)为待评分车辆i与前导车辆i+1在t时刻的相对速度差,T为预设反应时间,a为最大加速度,vmax为预设最高速度,vmin为预设最低速度;
b2、计算加速度得分:
利用以下公式分别计算需要换道车辆及与需要换道车辆相对应的前导车辆和滞后车辆加速度积分Ia
Ia=∫t t+Δt|a|x(t)dt
加速度得分EA为:
其中,Ia为加速度积分,a为待评分车辆的加速度值,Δt为自车辆决定换道到观察分析的时间差,|a|x为人类对加速度的主观感受函数,abrk为车辆最大制动加速度;
b3、计算安全时距得分:
利用以下公式计算安全时距Tsafe
<mrow> <msup> <mi>T</mi> <mrow> <mi>s</mi> <mi>a</mi> <mi>f</mi> <mi>e</mi> </mrow> </msup> <mo>=</mo> <mfrac> <mrow> <msup> <mi>&amp;Delta;x</mi> <mrow> <mi>s</mi> <mi>a</mi> <mi>f</mi> <mi>e</mi> </mrow> </msup> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>L</mi> <mo>-</mo> <msup> <mi>x</mi> <mrow> <mi>b</mi> <mi>r</mi> <mi>k</mi> </mrow> </msup> </mrow> <msub> <mi>v</mi> <mi>i</mi> </msub> </mfrac> </mrow>
安全时距得分ES为:
其中,Tsafe为安全时距;Δxsafe(vi)为使车辆vi完全停止的最小距离,L为车身长度,xbrk为制动距离,vi为当前车辆i的速度,Tmin为预设最小反应时间;
b4、计算驾驶风格得分:将得到的速度得分、加速度得分和安全时距得分作为输入值输入到神经网络的输出函数中得到驾驶风格得分,其中,采用非线性S型的Log-Sigmoid函数:
<mrow> <msub> <mi>O</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mover> <mi>x</mi> <mo>&amp;OverBar;</mo> </mover> <mo>,</mo> <mover> <mi>w</mi> <mo>&amp;OverBar;</mo> </mover> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <msub> <mi>A</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mover> <mi>x</mi> <mo>&amp;OverBar;</mo> </mover> <mo>,</mo> <mover> <mi>w</mi> <mo>&amp;OverBar;</mo> </mover> <mo>)</mo> </mrow> </mrow> </msup> </mrow> </mfrac> </mrow> 3
其中,为神经元激发函数:
<mrow> <msub> <mi>A</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mover> <mi>x</mi> <mo>&amp;OverBar;</mo> </mover> <mo>,</mo> <mover> <mi>w</mi> <mo>&amp;OverBar;</mo> </mover> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>x</mi> <mi>i</mi> </msub> <msub> <mi>w</mi> <mrow> <mi>j</mi> <mi>i</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> </mrow>
其中,n为列描述的个数,xi为车辆i的速度得分、加速度得分、安全时距得分,wji、bj分别为激活函数的权重和偏置,权重和偏置为由人工神经网络自学习调整得到,的值域为(0,1);
整个神经网络的误差函数如下所示:
<mrow> <mi>E</mi> <mrow> <mo>(</mo> <mover> <mi>x</mi> <mo>&amp;OverBar;</mo> </mover> <mo>,</mo> <mover> <mi>w</mi> <mo>&amp;OverBar;</mo> </mover> <mo>,</mo> <mi>d</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&amp;Sigma;</mo> <mi>j</mi> </munder> <msup> <mrow> <mo>(</mo> <msub> <mi>O</mi> <mi>j</mi> </msub> <mo>(</mo> <mrow> <mover> <mi>x</mi> <mo>&amp;OverBar;</mo> </mover> <mo>,</mo> <mover> <mi>w</mi> <mo>&amp;OverBar;</mo> </mover> </mrow> <mo>)</mo> <mo>-</mo> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow>
其中,d为真实值;
通过梯度下降法调整人工神经网络的权值:
<mrow> <msub> <mi>&amp;Delta;w</mi> <mrow> <mi>j</mi> <mi>i</mi> </mrow> </msub> <mo>=</mo> <mo>-</mo> <mi>&amp;eta;</mi> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>E</mi> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>w</mi> <mrow> <mi>j</mi> <mi>i</mi> </mrow> </msub> </mrow> </mfrac> </mrow>
其中,η为学习速度;
S4、权重调整:确定权重系数α、β:由α+β=1,权重即需换道车辆的前导车辆与滞后车辆驾驶风格得分在总分中的占比:
<mrow> <mi>&amp;alpha;</mi> <mo>=</mo> <mfrac> <msub> <mi>O</mi> <mi>A</mi> </msub> <mrow> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mi>A</mi> <mo>,</mo> <mi>B</mi> </mrow> </msub> <msub> <mi>O</mi> <mi>i</mi> </msub> </mrow> </mfrac> </mrow>
<mrow> <mi>&amp;beta;</mi> <mo>=</mo> <mfrac> <msub> <mi>O</mi> <mi>B</mi> </msub> <mrow> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mi>A</mi> <mo>,</mo> <mi>B</mi> </mrow> </msub> <msub> <mi>O</mi> <mi>i</mi> </msub> </mrow> </mfrac> </mrow>
其中,OA为前导车辆的驾驶风格得分,OB为滞后车辆的驾驶风格得分;
S5、换道决策:根据步骤S4得到的调整后的权重重新计算步骤S2的博弈收益值,设p为当前车辆VC换道的概率,q1为滞后车辆VL加速的概率,q2为滞后车辆VL减速的概率,则VC、VL的混合概率期望收益EC、EL如下所示:
EC(p,q1,q2)=p[P'13-P'23+q1(P'11+P'23-P'13-P'21)+q2(P'12+P'23-P'13-P'22)]+[P'23+q1(P'21-P'23)+q2(P'22-P'23)]
EL(p,q1,q2)=Q'23+p(Q'13-Q'23)+q1[Q'21-Q'23+p(Q'11+Q'23-Q'13-Q'21)]+q2[Q'22-Q'23+p(Q'12+Q'23-Q'13-Q'22)]
其中,P'ij,Q'ij分别为使用步骤S4调整后的权重获得的车辆VC、VL的博弈收益值;通过对求解概率参数(p,q1,q2)的至少一个最优解(p*,q1 *,q2 *),使EC、EL达到最大,即满足:
<mrow> <msub> <mi>E</mi> <mi>C</mi> </msub> <mrow> <mo>(</mo> <msup> <mi>p</mi> <mo>*</mo> </msup> <mo>,</mo> <msubsup> <mi>q</mi> <mn>1</mn> <mo>*</mo> </msubsup> <mo>,</mo> <msubsup> <mi>q</mi> <mn>2</mn> <mo>*</mo> </msubsup> <mo>)</mo> </mrow> <mo>&amp;GreaterEqual;</mo> <msub> <mi>E</mi> <mi>C</mi> </msub> <mrow> <mo>(</mo> <mi>p</mi> <mo>,</mo> <msubsup> <mi>q</mi> <mn>1</mn> <mo>*</mo> </msubsup> <mo>,</mo> <msubsup> <mi>q</mi> <mn>2</mn> <mo>*</mo> </msubsup> <mo>)</mo> </mrow> </mrow>
<mrow> <msub> <mi>E</mi> <mi>L</mi> </msub> <mrow> <mo>(</mo> <msup> <mi>p</mi> <mo>*</mo> </msup> <mo>,</mo> <msubsup> <mi>q</mi> <mn>1</mn> <mo>*</mo> </msubsup> <mo>,</mo> <msubsup> <mi>q</mi> <mn>2</mn> <mo>*</mo> </msubsup> <mo>)</mo> </mrow> <mo>&amp;GreaterEqual;</mo> <msub> <mi>E</mi> <mi>L</mi> </msub> <mrow> <mo>(</mo> <msup> <mi>p</mi> <mo>*</mo> </msup> <mo>,</mo> <msub> <mi>q</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>q</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> </mrow>
车辆根据(p*,q1 *,q2 *)的值决定是否执行换道或放弃换道。
2.根据权利要求1所述的一种基于人工神经网络的车辆协同换道方法,其特征在于,所
述周边限制要素包括障碍物、重型车辆、应急车辆。
3.一种基于人工神经网络的车辆协同换道系统,其特征在于,包括以下模块:
换道数据采集及换道需求判断模块:包括以下模块:
换道数据采集模块:在车辆上安装数据采集模块用于采集并输出车辆在行驶过程中的路况信息,所述路况信息包括车辆在当前车道的速度及加速度、相邻车道中与当前车辆对应的前导车辆的速度及加速度、相邻车道中与当前车辆对应的滞后车辆的速度及加速度和周边限制要素的运动速度,以及当前车辆与所述前导车辆、滞后车辆以及周边限制要素之间的相对距离;所述前导车辆是位于当前车辆前方的车辆;所述滞后车辆是位于当前车辆后方的车辆;
换道需求判断模块:用于根据换道需求判断条件,判断当前车辆是否有换道需求:若当前车辆同时不满足换道需求判断条件,则当前车辆不需要换道,即放弃换道;若当前车辆满足需求判断条件中的至少一条,则当前车辆需要换道;所述换道需求判断条件为:
<mrow> <mfrac> <mrow> <msub> <mi>&amp;Delta;x</mi> <mi>i</mi> </msub> </mrow> <mrow> <msubsup> <mi>v</mi> <mi>i</mi> <mi>e</mi> </msubsup> <mo>-</mo> <msub> <mi>v</mi> <mrow> <mi>i</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> </mrow> </mfrac> <mo>&lt;</mo> <msup> <mi>T</mi> <mrow> <mi>s</mi> <mi>a</mi> <mi>f</mi> <mi>e</mi> </mrow> </msup> </mrow>
<mrow> <mfrac> <mrow> <msub> <mi>&amp;Delta;x</mi> <mi>i</mi> </msub> </mrow> <mrow> <msubsup> <mi>v</mi> <mi>i</mi> <mi>c</mi> </msubsup> <mo>-</mo> <msup> <mi>v</mi> <mrow> <mi>b</mi> <mi>a</mi> <mi>r</mi> </mrow> </msup> </mrow> </mfrac> <mo>&lt;</mo> <msup> <mi>T</mi> <mi>min</mi> </msup> </mrow>
其中,Δxi为当前车辆i与前导车辆或周边交通要素之间的相对距离,vi e为当前车辆i的预设期望速度,vi c为当前车辆i的速度,vi+1为与当前车辆i对应的前导车辆的速度,Tsafe为预设安全时距,Tmin为预设最小反应时间,vbar为周边限制要素的运动速度,i≥1;
博弈收益计算模块:用于建立与换道行为相对应的博弈换道模型:将换道需求判断模块中需要换道的车辆的可能的行为策略作为行描述,将该车辆对应的滞后车辆可能的行为策略作为列描述,建立与换道行为相对应的博弈换道模型;并以博弈收益值数值对作为博弈换道模型的元素,每个博弈收益值数值对作为在对应行描述和列描述条件下的数值表示;提取博弈换道模型的元素构建成为博弈收益矩阵,博弈收益矩阵中的元素为(Pij,Qij),其中,Pij、Qij分别为在行描述i和列描述j的条件下,需要换道的车辆,及与该车辆对应的滞后车辆的博弈收益值,且通过以下公式获得:
Pij(或Qij)=α*A+β*B
其中,α、β为权重系数,且满足α+β=1,α、β的初始值均为0.5;对于需要计算博弈收益的车辆VX,A、B分别由以下公式计算:
其中,vX为车辆VX的速度,aX为车辆VX的加速度,Δt为采集间隔时间,ΔxA为车辆VX与前导车辆的相对距离,ΔxB为车辆VX与滞后车辆的相对距离,vx accsafe为车辆VX加速时的安全速度,vx decsafe为车辆VX减速时的安全速度;
所述车辆VX加速时的安全速度vx accsafe的获取方法为:
当车辆VX加速时,设车辆VA为此时车辆VX的期望前导车辆,车辆VA与车辆VX的距离为Δx,通过数据采集模块得到期望前导车辆VA的速度、加速度分别为vA、aA,车辆VX的速度、加速度分别为vX、aX,采集间隔为Δt,最小反应时间tmin,则使车辆VX加速后经过T=Δt+tmin与VA碰撞的速度vmax满足以下条件:
<mrow> <msub> <mi>v</mi> <mi>A</mi> </msub> <mo>*</mo> <mi>T</mi> <mo>+</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>*</mo> <msub> <mi>a</mi> <mi>A</mi> </msub> <mo>*</mo> <msup> <mi>T</mi> <mn>2</mn> </msup> <mo>+</mo> <mi>&amp;Delta;</mi> <mi>x</mi> <mo>=</mo> <mfrac> <mrow> <msub> <mi>v</mi> <mi>X</mi> </msub> <mo>+</mo> <msub> <mi>v</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> </mrow> <mn>2</mn> </mfrac> <mo>*</mo> <mi>T</mi> </mrow>
求出vmax后,得到车辆VX加速的安全速度vX accsafe为:
<mrow> <msubsup> <mi>v</mi> <mi>X</mi> <mrow> <mi>a</mi> <mi>c</mi> <mi>c</mi> <mi>s</mi> <mi>a</mi> <mi>f</mi> <mi>e</mi> </mrow> </msubsup> <mo>=</mo> <msub> <mi>v</mi> <mi>X</mi> </msub> <mo>+</mo> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>v</mi> <mi>X</mi> </msub> <mo>)</mo> </mrow> <mo>*</mo> <mfrac> <mrow> <mi>&amp;Delta;</mi> <mi>t</mi> </mrow> <mi>T</mi> </mfrac> <mo>;</mo> </mrow>
车辆VX减速时的安全速度vx decsafe的获取方法为:
当车辆VX减速时,设车辆VC为此时车辆VX的期望前导车辆,通过换道数据采集及换道需求判断模块得到车辆VC与车辆VX的距离为ΔxC,期望前导车辆VC的速度、加速度分别为vC、aC,车辆VX的速度、加速度分别为vX、aX;采集间隔为Δt,最小反应时间tmin,则使VX减速后经过T=Δt+tmin与VC碰撞的速度vmax1满足以下条件:
<mrow> <msub> <mi>v</mi> <mi>C</mi> </msub> <mo>*</mo> <mi>T</mi> <mo>+</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>*</mo> <msub> <mi>a</mi> <mi>C</mi> </msub> <mo>*</mo> <msup> <mi>T</mi> <mn>2</mn> </msup> <mo>+</mo> <msub> <mi>&amp;Delta;x</mi> <mi>C</mi> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>v</mi> <mi>X</mi> </msub> <mo>+</mo> <msub> <mi>v</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mn>1</mn> </mrow> </msub> </mrow> <mn>2</mn> </mfrac> <mo>*</mo> <mi>T</mi> </mrow>
同时,车辆VX需要避免与其滞后车辆VB发生碰撞,通过换道数据采集及换道需求判断模块采集到的车辆VX与车辆VB的相对距离为ΔxB,VB的速度、加速度分别为vB、aB,车辆VX的速度、加速度分别为vX、aX,采集间隔为Δt,最小反应时间tmin,则使车辆VX减速后经过T=Δt+tmin与VB碰撞的速度vmax2满足:
<mrow> <msub> <mi>v</mi> <mi>B</mi> </msub> <mo>*</mo> <mi>T</mi> <mo>+</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>*</mo> <msub> <mi>a</mi> <mi>B</mi> </msub> <mo>*</mo> <msup> <mi>T</mi> <mn>2</mn> </msup> <mo>=</mo> <mfrac> <mrow> <msub> <mi>v</mi> <mi>X</mi> </msub> <mo>+</mo> <msub> <mi>v</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mn>2</mn> </mrow> </msub> </mrow> <mn>2</mn> </mfrac> <mo>*</mo> <mi>T</mi> <mo>+</mo> <msub> <mi>&amp;Delta;x</mi> <mi>C</mi> </msub> </mrow>
得到减速后的最大速度vmax、安全减速度asafe分别为:
vmax=max{vmax1,vmax2}
<mrow> <msub> <mi>a</mi> <mrow> <mi>s</mi> <mi>a</mi> <mi>f</mi> <mi>e</mi> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>v</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>v</mi> <mi>X</mi> </msub> </mrow> <mi>T</mi> </mfrac> </mrow>
车辆VX减速的安全速度vX decsafe为:
<mrow> <msubsup> <mi>v</mi> <mi>X</mi> <mrow> <mi>d</mi> <mi>e</mi> <mi>c</mi> <mi>s</mi> <mi>a</mi> <mi>f</mi> <mi>e</mi> </mrow> </msubsup> <mo>=</mo> <msub> <mi>v</mi> <mi>X</mi> </msub> <mo>+</mo> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mi>X</mi> </msub> <mo>-</mo> <msub> <mi>v</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>*</mo> <mfrac> <mrow> <mi>&amp;Delta;</mi> <mi>t</mi> </mrow> <mi>T</mi> </mfrac> </mrow>
驾驶风格得分计算模块:用于通过人工神经网络使用反向传播算法,将换道数据采集及换道需求判断模块得到的速度、加速度和相对距离作为输入值计算速度得分、加速度得分、安全时距得分,并将上述得分作为输入值输入神经网络的输出函数中输出驾驶风格得分:包括以下模块:
速度得分计算模块:用于使用Krauss模型的安全速度公式分别输出需要换道车辆及与需要换道车辆相对应的前导车辆和滞后车辆的安全速度
<mrow> <msubsup> <mi>v</mi> <mi>i</mi> <mrow> <mi>s</mi> <mi>a</mi> <mi>f</mi> <mi>e</mi> </mrow> </msubsup> <mrow> <mo>(</mo> <mi>t</mi> <mo>+</mo> <mi>&amp;Delta;</mi> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>v</mi> <mrow> <mi>i</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>+</mo> <mfrac> <mrow> <msub> <mi>&amp;Delta;x</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>v</mi> <mrow> <mi>i</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>*</mo> <mi>T</mi> </mrow> <mrow> <msub> <mi>&amp;Delta;v</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>/</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>*</mo> <mi>a</mi> <mo>+</mo> <mi>T</mi> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow> 6
速度得分EV为:
其中,vi safe(t+Δt)为待评分车辆i在t+Δt时刻的安全速度,Δt为观察时间,vi+1(t)为与待评分车辆i对应的前导车辆i+1在t时刻的速度,Δxi(t)为待评分车辆i与前导车辆i+1在t时刻的相对位移,Δvi(t)为待评分车辆i与前导车辆i+1在t时刻的相对速度差,T为预设反应时间,a为最大加速度,vmax为预设最高速度,vmin为预设最低速度;
加速度得分计算模块:
用于利用以下公式分别输出需要换道车辆及与需要换道车辆相对应的前导车辆和滞后车辆加速度积分Ia
Ia=∫t t+Δt|a|x(t)dt
加速度得分EA为:
其中,Ia为加速度积分,a为待评分车辆的加速度值,Δt为自车辆决定换道到观察分析的时间差,|a|x为人类对加速度的主观感受函数,abrk为车辆最大制动加速度;
安全时距得分计算模块:
用于利用以下公式计算安全时距:
Tsafe
<mrow> <msup> <mi>T</mi> <mrow> <mi>s</mi> <mi>a</mi> <mi>f</mi> <mi>e</mi> </mrow> </msup> <mo>=</mo> <mfrac> <mrow> <msup> <mi>&amp;Delta;x</mi> <mrow> <mi>s</mi> <mi>a</mi> <mi>f</mi> <mi>e</mi> </mrow> </msup> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>L</mi> <mo>-</mo> <msup> <mi>x</mi> <mrow> <mi>b</mi> <mi>r</mi> <mi>k</mi> </mrow> </msup> </mrow> <msub> <mi>v</mi> <mi>i</mi> </msub> </mfrac> </mrow>
安全时距得分ES为:
其中,Tsafe为安全时距;Δxsafe(vi)为使车辆vi完全停止的最小距离,L为车身长度,xbrk为制动距离,vi为当前车辆i的速度,Tmin为预设最小反应时间;
驾驶风格得分计算模块:将得到的速度得分、加速度得分和安全时距得分作为输入值输入到神经网络的输出函数中得到驾驶风格得分,其中,采用非线性S型的Log-Sigmoid函数:
<mrow> <msub> <mi>O</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mover> <mi>x</mi> <mo>&amp;OverBar;</mo> </mover> <mo>,</mo> <mover> <mi>w</mi> <mo>&amp;OverBar;</mo> </mover> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <msub> <mi>A</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mover> <mi>x</mi> <mo>&amp;OverBar;</mo> </mover> <mo>,</mo> <mover> <mi>w</mi> <mo>&amp;OverBar;</mo> </mover> <mo>)</mo> </mrow> </mrow> </msup> </mrow> </mfrac> </mrow>
其中,为神经元激发函数:
<mrow> <msub> <mi>A</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mover> <mi>x</mi> <mo>&amp;OverBar;</mo> </mover> <mo>,</mo> <mover> <mi>w</mi> <mo>&amp;OverBar;</mo> </mover> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>x</mi> <mi>i</mi> </msub> <msub> <mi>w</mi> <mrow> <mi>j</mi> <mi>i</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> </mrow>
其中,n为列描述的个数,xi为车辆i的速度得分、加速度得分、安全时距得分,wji、bj分别为激活函数的权重和偏置,权重和偏置为由人工神经网络自学习调整得到,的值域为(0,1);
用于计算整个神经网络的误差函数:
<mrow> <mi>E</mi> <mrow> <mo>(</mo> <mover> <mi>x</mi> <mo>&amp;OverBar;</mo> </mover> <mo>,</mo> <mover> <mi>w</mi> <mo>&amp;OverBar;</mo> </mover> <mo>,</mo> <mi>d</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&amp;Sigma;</mo> <mi>j</mi> </munder> <msup> <mrow> <mo>(</mo> <msub> <mi>O</mi> <mi>j</mi> </msub> <mo>(</mo> <mrow> <mover> <mi>x</mi> <mo>&amp;OverBar;</mo> </mover> <mo>,</mo> <mover> <mi>w</mi> <mo>&amp;OverBar;</mo> </mover> </mrow> <mo>)</mo> <mo>-</mo> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow>
其中,d为真实值;
用于通过梯度下降法调整人工神经网络的权值:
<mrow> <msub> <mi>&amp;Delta;w</mi> <mrow> <mi>j</mi> <mi>i</mi> </mrow> </msub> <mo>=</mo> <mo>-</mo> <mi>&amp;eta;</mi> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>E</mi> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>w</mi> <mrow> <mi>j</mi> <mi>i</mi> </mrow> </msub> </mrow> </mfrac> </mrow>
其中,η为学习速度;
权重调整模块:包括以下部分:
用于确定权重系数α、β:由α+β=1,权重即需换道车辆的前导车辆与滞后车辆驾驶风格得分在总分中的占比:
<mrow> <mi>&amp;alpha;</mi> <mo>=</mo> <mfrac> <msub> <mi>O</mi> <mi>A</mi> </msub> <mrow> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mi>A</mi> <mo>,</mo> <mi>B</mi> </mrow> </msub> <msub> <mi>O</mi> <mi>i</mi> </msub> </mrow> </mfrac> </mrow>
<mrow> <mi>&amp;beta;</mi> <mo>=</mo> <mfrac> <msub> <mi>O</mi> <mi>B</mi> </msub> <mrow> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mi>A</mi> <mo>,</mo> <mi>B</mi> </mrow> </msub> <msub> <mi>O</mi> <mi>i</mi> </msub> </mrow> </mfrac> </mrow>
其中,OA为前导车辆的驾驶风格得分,OB为滞后车辆的驾驶风格得分;
换道决策模块:用于根据权重调整模块得到的调整后的权重重新计算博弈收益计算模块的博弈收益值,设p为当前车辆VC换道的概率,q1为滞后车辆VL加速的概率,q2为滞后车辆VL减速的概率,则车辆VC、VL的混合概率期望收益EC、EL如下所示:
EC(p,q1,q2)=p[P'13-P'23+q1(P'11+P'23-P'13-P'21)+q2(P'12+P'23-P'13-P'22)]+[P'23+q1(P'21-P'23)+q2(P'22-P'23)]
EL(p,q1,q2)=Q'23+p(Q'13-Q'23)+q1[Q'21-Q'23+p(Q'11+Q'23-Q'13-Q'21)]+q2[Q'22-Q'23+p(Q'12+Q'23-Q'13-Q'22)]
其中,P'ij,Q'ij分别为使用权重调整模块调整后的权重获得的VC、VL的博弈收益值;通过对求解概率参数(p,q1,q2)的至少一个最优解(p*,q1 *,q2 *),使EC、EL达到最大,即满足:
<mrow> <msub> <mi>E</mi> <mi>C</mi> </msub> <mrow> <mo>(</mo> <msup> <mi>p</mi> <mo>*</mo> </msup> <mo>,</mo> <msubsup> <mi>q</mi> <mn>1</mn> <mo>*</mo> </msubsup> <mo>,</mo> <msubsup> <mi>q</mi> <mn>2</mn> <mo>*</mo> </msubsup> <mo>)</mo> </mrow> <mo>&amp;GreaterEqual;</mo> <msub> <mi>E</mi> <mi>C</mi> </msub> <mrow> <mo>(</mo> <mi>p</mi> <mo>,</mo> <msubsup> <mi>q</mi> <mn>1</mn> <mo>*</mo> </msubsup> <mo>,</mo> <msubsup> <mi>q</mi> <mn>2</mn> <mo>*</mo> </msubsup> <mo>)</mo> </mrow> </mrow>
<mrow> <msub> <mi>E</mi> <mi>L</mi> </msub> <mrow> <mo>(</mo> <msup> <mi>p</mi> <mo>*</mo> </msup> <mo>,</mo> <msubsup> <mi>q</mi> <mn>1</mn> <mo>*</mo> </msubsup> <mo>,</mo> <msubsup> <mi>q</mi> <mn>2</mn> <mo>*</mo> </msubsup> <mo>)</mo> </mrow> <mo>&amp;GreaterEqual;</mo> <msub> <mi>E</mi> <mi>L</mi> </msub> <mrow> <mo>(</mo> <msup> <mi>p</mi> <mo>*</mo> </msup> <mo>,</mo> <msub> <mi>q</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>q</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> </mrow>
车辆根据(p*,q1 *,q2 *)的值输出是否执行换道或放弃换道。
4.根据权利要求3所述的一种基于人工神经网络的车辆协同换道系统,其特征在于,所述周边限制要素包括障碍物、重型车辆、应急车辆。
CN201710285739.5A 2017-04-27 2017-04-27 一种基于人工神经网络的车辆协同换道方法及其系统 Expired - Fee Related CN107161155B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710285739.5A CN107161155B (zh) 2017-04-27 2017-04-27 一种基于人工神经网络的车辆协同换道方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710285739.5A CN107161155B (zh) 2017-04-27 2017-04-27 一种基于人工神经网络的车辆协同换道方法及其系统

Publications (2)

Publication Number Publication Date
CN107161155A true CN107161155A (zh) 2017-09-15
CN107161155B CN107161155B (zh) 2019-04-12

Family

ID=59813091

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710285739.5A Expired - Fee Related CN107161155B (zh) 2017-04-27 2017-04-27 一种基于人工神经网络的车辆协同换道方法及其系统

Country Status (1)

Country Link
CN (1) CN107161155B (zh)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107813820A (zh) * 2017-10-13 2018-03-20 江苏大学 一种仿优秀驾驶员的无人车换道路径规划方法
CN108595823A (zh) * 2018-04-20 2018-09-28 大连理工大学 一种联合驾驶风格和博弈理论的自主车换道策略的计算方法
CN108983771A (zh) * 2018-07-03 2018-12-11 天津英创汇智汽车技术有限公司 车辆换道决策方法及装置
CN109598934A (zh) * 2018-12-13 2019-04-09 清华大学 一种基于规则与学习模型的无人驾驶汽车驶离高速的方法
CN109712421A (zh) * 2019-02-22 2019-05-03 百度在线网络技术(北京)有限公司 自动驾驶车辆的速度规划方法、装置和存储介质
CN109760681A (zh) * 2017-11-02 2019-05-17 上海汽车集团股份有限公司 一种换道控制方法及装置
CN110297494A (zh) * 2019-07-15 2019-10-01 吉林大学 一种基于滚动博弈的自动驾驶车辆换道决策方法及系统
CN110347043A (zh) * 2019-07-15 2019-10-18 武汉天喻信息产业股份有限公司 一种智能驾驶控制方法及装置
CN110362910A (zh) * 2019-07-05 2019-10-22 西南交通大学 基于博弈论的自动驾驶车辆换道冲突协调模型建立方法
CN110614994A (zh) * 2018-12-29 2019-12-27 长城汽车股份有限公司 车辆自动驾驶时换道的控制方法、控制系统及车辆
CN110826192A (zh) * 2019-10-15 2020-02-21 南京航空航天大学 一种基于纳什谈判准则的人-车合作型博弈控制方法
CN110962853A (zh) * 2019-11-25 2020-04-07 浙江工业大学 一种车联网环境下车辆博弈换道协作方法
CN111137292A (zh) * 2018-11-01 2020-05-12 通用汽车环球科技运作有限责任公司 用于控制自主车辆的分层车道变换策略的基于空间和时间注意力的深度强化学习
CN111469847A (zh) * 2020-04-14 2020-07-31 宁波吉利汽车研究开发有限公司 一种变道路径规划的方法及系统
CN111994090A (zh) * 2020-09-02 2020-11-27 中国科学技术大学 基于混合策略博弈的驾驶人变道切入意图识别方法及系统
CN111994088A (zh) * 2020-09-02 2020-11-27 中国科学技术大学 基于混合策略博弈的驾驶人换道意图识别方法及系统
CN111994079A (zh) * 2020-09-18 2020-11-27 南京航空航天大学 考虑驾驶风格特性的非合作博弈换道辅助决策系统及方法
CN112348198A (zh) * 2020-10-30 2021-02-09 上海对外经贸大学 一种人机混合决策的机器行为在冲突中的协调方法
CN112406904A (zh) * 2020-08-27 2021-02-26 腾讯科技(深圳)有限公司 自动驾驶策略的训练方法、装置、自动驾驶方法、设备、车辆和计算机可读存储介质
CN112580149A (zh) * 2020-12-22 2021-03-30 浙江工业大学 基于生成对抗网络和驾驶时长的车辆跟驰模型生成方法
CN113386779A (zh) * 2021-06-23 2021-09-14 华人运通(江苏)动力电池系统有限公司 驾驶风格识别方法、设备及存储介质
US11192553B2 (en) * 2019-04-13 2021-12-07 Henry Schellhorn Method for autonomous cars to change lanes on motorways
CN113920740A (zh) * 2021-11-16 2022-01-11 重庆邮电大学 一种联合车辆关联度和博弈论的车路协同驾驶系统及方法
WO2022012217A1 (zh) * 2020-07-16 2022-01-20 华为技术有限公司 一种自适应巡航控制方法及装置
CN114882705A (zh) * 2022-05-30 2022-08-09 武汉理工大学 一种基于换道决策系统的货运车辆交互博弈换道决策方法
CN114919580A (zh) * 2021-12-29 2022-08-19 天翼数字生活科技有限公司 一种道路拥挤场景下实现自动驾驶车辆变道管理的方法与系统
US20230311949A1 (en) * 2022-03-29 2023-10-05 Honda Motor Co., Ltd. Systems and methods for speed and lane advisory

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE202006019689U1 (de) * 2006-12-27 2007-03-08 Brodersen, Tobias Warnsystem zur Erhöhung der Verkehrssicherheit im Straßenverkehr
CN101089917A (zh) * 2007-06-01 2007-12-19 清华大学 一种目标车换道工况下的快速识别方法
DE102007008517A1 (de) * 2007-02-21 2008-08-28 Siemens Ag Spurwechselgeschwindigkeitsassistent
CN101901547A (zh) * 2010-07-21 2010-12-01 浙江工业大学 一种可变车道自适应控制方法
JP2013109446A (ja) * 2011-11-18 2013-06-06 Mitsubishi Motors Corp 車線変更支援装置
CN104176054A (zh) * 2014-08-18 2014-12-03 大连理工大学 一种汽车主动防碰撞自动换道控制系统及其工作方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE202006019689U1 (de) * 2006-12-27 2007-03-08 Brodersen, Tobias Warnsystem zur Erhöhung der Verkehrssicherheit im Straßenverkehr
DE102007008517A1 (de) * 2007-02-21 2008-08-28 Siemens Ag Spurwechselgeschwindigkeitsassistent
CN101089917A (zh) * 2007-06-01 2007-12-19 清华大学 一种目标车换道工况下的快速识别方法
CN101901547A (zh) * 2010-07-21 2010-12-01 浙江工业大学 一种可变车道自适应控制方法
JP2013109446A (ja) * 2011-11-18 2013-06-06 Mitsubishi Motors Corp 車線変更支援装置
CN104176054A (zh) * 2014-08-18 2014-12-03 大连理工大学 一种汽车主动防碰撞自动换道控制系统及其工作方法

Cited By (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107813820A (zh) * 2017-10-13 2018-03-20 江苏大学 一种仿优秀驾驶员的无人车换道路径规划方法
CN109760681A (zh) * 2017-11-02 2019-05-17 上海汽车集团股份有限公司 一种换道控制方法及装置
CN109760681B (zh) * 2017-11-02 2020-09-29 上海汽车集团股份有限公司 一种换道控制方法及装置
CN108595823A (zh) * 2018-04-20 2018-09-28 大连理工大学 一种联合驾驶风格和博弈理论的自主车换道策略的计算方法
CN108595823B (zh) * 2018-04-20 2021-10-12 大连理工大学 一种联合驾驶风格和博弈理论的自主车换道策略计算方法
CN108983771A (zh) * 2018-07-03 2018-12-11 天津英创汇智汽车技术有限公司 车辆换道决策方法及装置
CN111137292B (zh) * 2018-11-01 2023-08-08 通用汽车环球科技运作有限责任公司 经执行器-评价网络架构学习车道变换策略的方法和系统
CN111137292A (zh) * 2018-11-01 2020-05-12 通用汽车环球科技运作有限责任公司 用于控制自主车辆的分层车道变换策略的基于空间和时间注意力的深度强化学习
CN109598934B (zh) * 2018-12-13 2020-11-06 北京超星未来科技有限公司 一种基于规则与学习模型的无人驾驶汽车驶离高速的方法
CN109598934A (zh) * 2018-12-13 2019-04-09 清华大学 一种基于规则与学习模型的无人驾驶汽车驶离高速的方法
CN110614994A (zh) * 2018-12-29 2019-12-27 长城汽车股份有限公司 车辆自动驾驶时换道的控制方法、控制系统及车辆
CN110614994B (zh) * 2018-12-29 2021-01-22 长城汽车股份有限公司 车辆自动驾驶时换道的控制方法、控制系统及车辆
US11718318B2 (en) 2019-02-22 2023-08-08 Apollo Intelligent Driving (Beijing) Technology Co., Ltd. Method and apparatus for planning speed of autonomous vehicle, and storage medium
CN109712421A (zh) * 2019-02-22 2019-05-03 百度在线网络技术(北京)有限公司 自动驾驶车辆的速度规划方法、装置和存储介质
US11192553B2 (en) * 2019-04-13 2021-12-07 Henry Schellhorn Method for autonomous cars to change lanes on motorways
CN110362910A (zh) * 2019-07-05 2019-10-22 西南交通大学 基于博弈论的自动驾驶车辆换道冲突协调模型建立方法
CN110362910B (zh) * 2019-07-05 2021-07-16 西南交通大学 基于博弈论的自动驾驶车辆换道冲突协调模型建立方法
CN110347043A (zh) * 2019-07-15 2019-10-18 武汉天喻信息产业股份有限公司 一种智能驾驶控制方法及装置
CN110297494A (zh) * 2019-07-15 2019-10-01 吉林大学 一种基于滚动博弈的自动驾驶车辆换道决策方法及系统
CN110347043B (zh) * 2019-07-15 2023-03-10 武汉天喻信息产业股份有限公司 一种智能驾驶控制方法及装置
CN110826192B (zh) * 2019-10-15 2024-02-13 南京航空航天大学 一种基于纳什谈判准则的人-车合作型博弈控制方法
CN110826192A (zh) * 2019-10-15 2020-02-21 南京航空航天大学 一种基于纳什谈判准则的人-车合作型博弈控制方法
CN110962853A (zh) * 2019-11-25 2020-04-07 浙江工业大学 一种车联网环境下车辆博弈换道协作方法
CN111469847A (zh) * 2020-04-14 2020-07-31 宁波吉利汽车研究开发有限公司 一种变道路径规划的方法及系统
CN111469847B (zh) * 2020-04-14 2022-06-14 宁波吉利汽车研究开发有限公司 一种变道路径规划的方法及系统
WO2022012217A1 (zh) * 2020-07-16 2022-01-20 华为技术有限公司 一种自适应巡航控制方法及装置
CN112406904A (zh) * 2020-08-27 2021-02-26 腾讯科技(深圳)有限公司 自动驾驶策略的训练方法、装置、自动驾驶方法、设备、车辆和计算机可读存储介质
CN112406904B (zh) * 2020-08-27 2022-02-01 腾讯科技(深圳)有限公司 自动驾驶策略的训练方法、自动驾驶方法、设备和车辆
CN111994088A (zh) * 2020-09-02 2020-11-27 中国科学技术大学 基于混合策略博弈的驾驶人换道意图识别方法及系统
CN111994090A (zh) * 2020-09-02 2020-11-27 中国科学技术大学 基于混合策略博弈的驾驶人变道切入意图识别方法及系统
CN111994090B (zh) * 2020-09-02 2021-11-02 中国科学技术大学 基于混合策略博弈的驾驶人变道切入意图识别方法及系统
CN111994079A (zh) * 2020-09-18 2020-11-27 南京航空航天大学 考虑驾驶风格特性的非合作博弈换道辅助决策系统及方法
CN112348198A (zh) * 2020-10-30 2021-02-09 上海对外经贸大学 一种人机混合决策的机器行为在冲突中的协调方法
CN112580149A (zh) * 2020-12-22 2021-03-30 浙江工业大学 基于生成对抗网络和驾驶时长的车辆跟驰模型生成方法
CN112580149B (zh) * 2020-12-22 2023-05-26 浙江工业大学 基于生成对抗网络和驾驶时长的车辆跟驰模型生成方法
CN113386779B (zh) * 2021-06-23 2022-10-18 华人运通(江苏)动力电池系统有限公司 驾驶风格识别方法、设备及存储介质
CN113386779A (zh) * 2021-06-23 2021-09-14 华人运通(江苏)动力电池系统有限公司 驾驶风格识别方法、设备及存储介质
CN113920740A (zh) * 2021-11-16 2022-01-11 重庆邮电大学 一种联合车辆关联度和博弈论的车路协同驾驶系统及方法
CN113920740B (zh) * 2021-11-16 2023-12-29 北京白龙马云行科技有限公司 一种联合车辆关联度和博弈论的车路协同驾驶系统及方法
CN114919580A (zh) * 2021-12-29 2022-08-19 天翼数字生活科技有限公司 一种道路拥挤场景下实现自动驾驶车辆变道管理的方法与系统
US20230311949A1 (en) * 2022-03-29 2023-10-05 Honda Motor Co., Ltd. Systems and methods for speed and lane advisory
US12065173B2 (en) * 2022-03-29 2024-08-20 Honda Motor Co., Ltd. System and methods for speed and lane advisory in evaluating lane change events and opportunities
CN114882705A (zh) * 2022-05-30 2022-08-09 武汉理工大学 一种基于换道决策系统的货运车辆交互博弈换道决策方法
CN114882705B (zh) * 2022-05-30 2024-04-26 武汉理工大学 一种基于换道决策系统的货运车辆交互博弈换道决策方法

Also Published As

Publication number Publication date
CN107161155B (zh) 2019-04-12

Similar Documents

Publication Publication Date Title
CN107161155B (zh) 一种基于人工神经网络的车辆协同换道方法及其系统
CN108595823B (zh) 一种联合驾驶风格和博弈理论的自主车换道策略计算方法
CN109367541B (zh) 一种基于驾驶员行为特性的智能车类人变道决策方法
CN110843789B (zh) 一种基于时序卷积网络的车辆换道意图预测方法
Kruber et al. Unsupervised and supervised learning with the random forest algorithm for traffic scenario clustering and classification
CN111785023A (zh) 一种车辆碰撞风险预警方法及系统
CN103531042A (zh) 基于驾驶人类型的车辆追尾预警方法
DE102009034096A1 (de) Adaptives Fahrzeugsteuerungssystem mit Fahrstilerkennung
CN115056798A (zh) 一种基于贝叶斯博弈的自动驾驶车辆换道行为车路协同决策算法
Guo et al. Improved car-following strategy based on merging behavior prediction of adjacent vehicle from naturalistic driving data
CN114516328B (zh) 一种智能网联环境下基于规则的车队跟驰模型方法
CN110288835A (zh) 一种基于运动学预测补偿机制的周边车辆行为实时识别方法
CN110619340B (zh) 一种自动驾驶汽车换道规则的生成方法
CN110320916A (zh) 考虑乘员感受的自动驾驶汽车轨迹规划方法及系统
CN108711285A (zh) 一种基于道路路口的混合交通模拟方法
CN113823118B (zh) 一种联合紧急程度和博弈论的智能网联车辆换道方法
CN114492043A (zh) 考虑感知受限特性的个性化驾驶员跟车建模方法
Bi et al. Inferring driver intentions using a driver model based on queuing network
Xie et al. A personalized curve driving model for intelligent vehicle
CN114179830A (zh) 一种自动驾驶车辆的自主超车方法和系统
CN116238544B (zh) 一种自动驾驶车辆的行驶控制方法及控制系统
Wei et al. Dilemma Zone: A Comprehensive Study of Influential Factors and Behavior Analysis
Levermore et al. A review of driver modelling
Chen et al. Platoon separation strategy optimization method based on deep cognition of a driver’s behavior at signalized intersections
Zhao et al. Choice of Lane-Changing Point in an Urban Intertunnel Weaving Section Based on Random Forest and Support Vector Machine

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190412

Termination date: 20210427

CF01 Termination of patent right due to non-payment of annual fee