CN114030485A - 一种考虑附着系数的自动驾驶汽车类人换道决策规划方法 - Google Patents

一种考虑附着系数的自动驾驶汽车类人换道决策规划方法 Download PDF

Info

Publication number
CN114030485A
CN114030485A CN202111569940.9A CN202111569940A CN114030485A CN 114030485 A CN114030485 A CN 114030485A CN 202111569940 A CN202111569940 A CN 202111569940A CN 114030485 A CN114030485 A CN 114030485A
Authority
CN
China
Prior art keywords
vehicle
lane change
lane
decision
track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111569940.9A
Other languages
English (en)
Other versions
CN114030485B (zh
Inventor
朱冰
孙一
赵健
宋东鉴
张伊晗
靳万里
李波
禚淞瑀
刘宇翔
姜景文
黄殷梓
李响
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN202111569940.9A priority Critical patent/CN114030485B/zh
Publication of CN114030485A publication Critical patent/CN114030485A/zh
Application granted granted Critical
Publication of CN114030485B publication Critical patent/CN114030485B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/02Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to ambient conditions
    • B60W40/06Road conditions
    • B60W40/064Degree of grip
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/15Vehicle, aircraft or watercraft design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Geometry (AREA)
  • Theoretical Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Traffic Control Systems (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)

Abstract

本发明涉及一种考虑附着系数的自动驾驶汽车类人换道决策规划方法,将三种常见附着系数下的驾驶人换道数据分别送入三个基于LSTM的神经网络决策规划模型,先使用神经网络决策模型深度学习的方法学习人类换道决策行为,再使用神经网络规划模型深度学习的方法学习人类换道轨迹,得到当前交通环境下每种附着下的预测轨迹输出;在驾驶任务中,接收实际路面附着系数的估计值,结合离散附着系数的输出轨迹进行轨迹融合,得到当前实时决策行为以及规划轨迹。本发明研究人类驾驶员的驾驶行为与驾驶习性机理,并使自动驾驶汽车理解人类驾驶方式、像人类一样进行驾驶,提升人对自动驾驶汽车的乘坐认同感,为提升智能驾驶汽车接受度提供了参考。

Description

一种考虑附着系数的自动驾驶汽车类人换道决策规划方法
技术领域
本发明涉及一种自动驾驶汽车换道决策规划方法,特别涉及一种考虑路面附着系数的自动驾驶汽车类人换道决策规划方法。
背景技术
自动驾驶汽车(Autonomous Vehicles,AV)是一项高速发展且日益成熟的技术,有可能通过提高汽车运输的安全性、可达性、效率和便利性来重塑移动出行概念,是世界汽车工业发展的必然趋势和主要赛场,也是我国汽车工业的战略制高点。自动驾驶车辆必须能够执行的安全关键任务包括在与其他车辆和行人共享的动态环境下进行合理运动规划,以及控制的鲁棒性。在现阶段,对单车来说,人类驾驶员和自动驾驶汽车共同完成驾驶任务的情况将共存;从多车角度来说,自动驾驶汽车与人类驾驶汽车共同构成混合交通局面。在未来,鉴于人类对驾驶活动的热情与对极致驾驶感受的追求,即使在高等级自动驾驶汽车普及的时代,人类驾驶汽车的情况也不会消失,故可以推断人机共驾和混合交通的情景将长期存在。人类具有出色的场景泛化,技能学习,紧急情况处理能力;因此研究人类驾驶员的驾驶行为与驾驶习性机理,并使自动驾驶汽车理解人类驾驶方式、像人类一样进行驾驶,提升人对AV的乘坐认同感,是智能驾驶汽车研究中不可忽视的方面。
在自动驾驶汽车技术体系中,决策规划是系统的中枢,承接感知与控制层,是提高车辆智能性、安全性、经济性、舒适性以及用户接受度和交通协调度的关键,因此,决策规划问题一直是自动驾驶汽车研究领域的热点和难点。当前自动驾驶汽车自主决策规划研究大多采用基于规则或基于学习的方法。随着人工智能技术的不断进步,基于数据学习的自动驾驶汽车决策规划策略引起了越来越多的关注,常用的学习算法有决策树、概率图模型、深度学习、强化学习等,但现有的换道决策规划方法缺少考虑实时的路面附着系数对于决策规划的影响,学习类方法存在泛化性较差、机理不明晰等问题。
发明内容
为了解决上述技术问题,本发明提供一种考虑路面附着系数的自动驾驶汽车类人换道决策规划方法,包括以下步骤:
步骤一、分别采集良好路面附着系数、中等路面附着系数和低路面附着系数下的熟练驾驶人换道数据;
步骤二、对所采集的换道数据进行预处理,以及统计学特征计算、特征构造,对良好路面附着下采集到的数据特征序列与特征值进行ANOVA相关性分析,得到对驾驶人换道行为具有显著影响的特征序列和特征值,后引入不同附着系数μ下采集得到的驾驶数据,分析μ是如何影响驾驶人的换道行为,得出映射关系;分析结果表明,当路面附着系数μ降低时相比于正常附着情况:
1、换道切入点远离前车;
2、换道过程自车侧向加速度峰值aymax降低;
3、换道时长增加;
步骤三、将三种常见附着系数μ=0.1、0.5、0.8下的驾驶人换道数据分别送入三个基于LSTM的神经网络决策规划模型,神经网络决策规划模型采用分层架构,先使用神经网络决策模型深度学习的方法学习人类换道决策行为,即左换道、右换道、保持跟车三种决策;再使用神经网络规划模型深度学习的方法学习人类换道轨迹,得到当前交通环境下每种附着下的预测轨迹输出,即μ=0.1、0.5、0.8下的三条轨迹;
步骤四、在驾驶任务中,决策规划系统实时接收由感知系统识别得到的实际路面附着系数的估计值
Figure BDA0003423282190000031
结合离散附着系数的输出轨迹,采用拉格朗日三次多项式插值法进行轨迹融合:
Figure BDA0003423282190000032
其中,x0、y0,x1、y1,x2、y2分别为μ=0.1、0.5、0.8下的轨迹坐标,x、y为融合后的轨迹坐标值;
最终得到当前实际路况下的实时决策行为以及规划轨迹,并将规划轨迹传递给控制层作为跟踪轨迹。
进一步的,步骤一中,搭建基于VI-grade软硬件平台的高精度高拟真驾驶模拟器数据采集平台进行驾驶人换道数据的采集;
软件环境中,采用VI-WorldSim作为场景软件,使用Unreal虚幻4渲染引擎,对车辆、车道、天气、路线等进行配置,视觉场景效果更加逼真;建立不同天气条件下的换道场景,并使附着系数产生对应的变化;采用VI-Simsound声学模块,提供NVH仿真级声效,提升声觉感受;首先建立用于数据采集及验证的高精度车辆动力学模型,对整车七个子系统包括转向、悬架、制动、转向、动力系统、轮胎、空气动力学系统分别建模,由于静态即使模拟器的反馈主要来自于转向系统反馈,故车辆转向建模用pfeffer的高级物理转向模型,详细描述了转向系统各运动副的摩擦和阻尼力,确保力反馈的真实,包括:
(1)指数弹簧摩擦(ESF)模型:
Figure BDA0003423282190000033
其中,FSF为摩擦力,Flim是摩擦力极限值,fESF为x为0时的刚度,如图6所示。
Figure BDA0003423282190000034
(2)指数弹簧摩擦模型结合平行麦克斯韦模型(ESFM):
ESFM单元采用并行非线性麦克斯韦模型进行增强,以覆盖动态效应;
FM=FM,lim·tanh(kM·v)
其中,FM为麦克斯韦摩擦力,FM,lim为最大的弹簧力,kM为弹簧刚度,如图7所示。
(3)伪库仑摩擦模型:为了将依赖于载荷的摩擦效应考虑到模型中(平移或旋转),可选用一个伪库仑类型的摩擦模型,根据方程摩擦力或力矩与施加的载荷有线性依赖关系:
Figure BDA0003423282190000041
其中,FC为伪库伦摩擦力,Fn是元素负载,Vs为元素相对速度;Vt是静摩擦与动摩擦之间的过渡速度,如图8所示。
然后在仿真软件中建立与实车道路试验相同的工况并进行仿真,通过与客观试验采集数据对标,确保该模型稳态和瞬态响应精度高达90%以上;
硬件部分的转向电机采用FanatecDD2直驱电机基座,其峰值扭矩达20N·m,具备1:1复现转向系统力反馈的能力;制动踏板总成采用FanatecV3踏板,方向盘盘体使用原车方向盘保证触感与原车一致,解算模块采用具有6个CPU核心的Concurrent实时仿真机,保证解算实时性,场景渲染采用搭载RTX3090的工作站保证画面流畅度。
进一步的,步骤一中所采集的换道数据包括:换道和超车过程中本车道前车车距df、本车道前车相对速度vf、本车道后车车距dr、本车道后车相对速度vr、换道时长tc、换道距离sc、换道过程自车侧向加速度峰值aymax、换道过程自车侧向加速度均值ayave、换道过程自车纵向加速度峰值axmax、换道过程自车纵向加速度均值axave、预计碰撞时间tttc
进一步的,步骤二中具体包括以下步骤:
第一步:标准差标准化(z-score):
z-score标准差标准化为类似正态分布,均值为0,标准差为1:
Figure BDA0003423282190000051
其中均值为
Figure BDA0003423282190000052
标准差为
Figure BDA0003423282190000053
第二步:对于所属范围未知或者所属范围是全体实数,同时不服从正态分布的数据进行非线性归一化:
tanh函数:
Figure BDA0003423282190000054
第三步:相似性度量,采用DTW对不同长度的数据进行比较分析,通过降低其时间和空间复杂度探究其内在特征:
设定向量C={c(1),c(1),...,c(N)},其中,c(n)=(i(n),j(n)),i,j为两个不同长度的序列,c(n)即为第n个匹配点对,d(xi(n),yj(n))为两个点的局部匹配距离;DTW即通过优化时间规整目标函数实现不同长度序列匹配点加权距离总和最小:
Figure BDA0003423282190000055
定义最小累计匹配函数g(i,j),表示所有匹配点对的最小累计匹配距离:
Figure BDA0003423282190000056
在计算的时候,首先令i(1)=j(1)=1,g(1,1)=2d(x1,y1)
Figure BDA0003423282190000057
其中,Reg为平行四边形约束区域,两条边的斜率为0.5和2,同时两个顶点坐标分别为(1,1)和(i,j);通过递推求解g(i,j)来确定下一匹配点:
Figure BDA0003423282190000061
其中,i=2,3,…,I;j=2,3,…,J;(i,j)∈Reg;
第四步:对良好附着下采集到的数据特征序列与特征值进行ANOVA相关性分析,得到对驾驶人换道行为具有显著影响的特征序列和特征值,后引入不同附着系数μ下采集得到的驾驶数据,分析μ是如何影响驾驶人的换道行为,得出映射关系。
进一步的,步骤三中所述的基于LSTM的神经网络决策规划模型输入向量定义为所提取的特征序列I、两个换道标志位M以及道路曲率ρ,输出即为自车在预测时域内的横纵向坐标序列以及速度序列,记为O;
网络框架如下,输入经过ReLU函数激活的全连接层处理后进入LSTM单元,LSTM共包含遗忘门(forget gate)ft、输入门(inputgate)it、输出门(outputgate)ot和一个类似于隐含层的细胞状态(Cell State)ct;其中,遗忘门以上一时刻的隐含层状态ht-1和当前时刻的输入量xt作为输入,以对上一时刻的细胞状态ct-1保留比例作为输出:
ft=σ(Wfxxt+Wfhht-1+bf)······················(3.1)
下一步即确定在细胞状态中保留哪些新信息,主要分为两部分,一部分是通过输入门确定哪些值需要进行更新:
it=σ(Wixxt+Wihht-1+bi)······················(3.2)
另一部分是通过一个tanh网络层来创建一个细胞状态更新部,用来添加到细胞状态;这两部分点乘运算的结果即为当前输入对网络状态的更新:
Figure BDA0003423282190000062
Figure BDA0003423282190000063
最后,通过输出门和更新后的细胞状态确定当前时刻隐含层的输出:
ot=σ(Wox xt+Woh ht-1+bo)·····················(3.5)
ht=ot⊙tanh(ct)························(3.6)
式中,⊙为哈达玛积(Hadamard product),Wfx、Wfh、Wix、Wih、Wcx、Wch、Wox、Woh为网络的权重矩阵,bf、bi、bc、bo为网络的偏置向量,tanh(·)和σ(·)分别是双曲正切函数和sigmoid函数:
Figure BDA0003423282190000071
Figure BDA0003423282190000072
通过这种方式学习历史轨迹序列中的规律,经softmax函数归一后输出换道意图概率向量Ω再经过one-hot编码后生成最终换道决策,换道概率超过80%的决策转化为100%;
同时,一个LSTM负责将被预测车辆的历史轨迹信息及其周围车辆的历史轨迹信息编码为一个固定长度的上下文向量r,该向量包含了编码器对历史轨迹特征的理解与记忆;
再经过一个LSTM网络后得到预测时域的输出轨迹。
本发明的有益效果:
本发明相比以往采用的驾驶模拟器作为数采工具的研究,模型和硬件可信度更高,采集轨迹更真实,本发明在充分发挥模拟器的场景一致性、安全性、经济性的同时,提升驾驶模拟器的沉浸感、真实感,确保采集数据的客观性、真实性,是领域内首次实现。
外界复杂动态场景的不确定性(以μ的变化为例)、环境驾驶人驾驶行为的多变性对换道行为的影响复杂,往往采用学习类方法解决;但学习类方法存在泛化性较差、机理不明晰等问题。本发明结合数据驱动和机理分析,实现优势互补。
人类具有出色的场景泛化,技能学习,紧急情况处理能力,本发明研究人类驾驶员的驾驶行为与驾驶习性机理,并使自动驾驶汽车理解人类驾驶方式、像人类一样进行驾驶,提升人对自动驾驶汽车的乘坐认同感,为提升智能驾驶汽车接受度提供了方法。
附图说明
图1为本发明整体流程示意图;
图2为本发明驾驶模拟器数据采集平台的结构示意图;
图3为本发明基于LSTM的神经网络决策规划模型结构示意图;
图4为本发明换道过程示意图;
图5为本发明换道过程中横摆角随时间变化示意图;
图6为本发明指数弹簧摩擦(ESF)模型示意图;
图7为本发明指数弹簧摩擦模型结合平行麦克斯韦模型(ESFM)模型示意图;
图8为本发明伪库伦摩擦模型示意图。
具体实施方式
请参阅图1-8所示:
本发明提供一种考虑路面附着系数的自动驾驶汽车类人换道决策规划方法,包括以下步骤:
步骤一、搭建基于VI-grade软硬件平台的高精度高拟真驾驶模拟器数据采集平台进行驾驶人换道数据的采集;
软件环境中,采用VI-WorldSim作为场景软件,使用Unreal虚幻4渲染引擎,对车辆、车道、天气、路线等进行配置,视觉场景效果更加逼真;建立不同天气条件下的换道场景,并使附着系数产生对应的变化;采用VI-Simsound声学模块,提供NVH仿真级声效,提升声觉感受;建立用于数据采集及验证的高精度车辆动力学模型,对整车七个子系统(转向、悬架、制动、转向、动力系统、轮胎、空气动力学系统)分别建模,车辆转向建模应用pfeffer的高级物理转向模型,详细描述了转向系统各运动副的摩擦和阻尼力,包括:
(1)指数弹簧摩擦(ESF)模型:
Figure BDA0003423282190000091
其中,FSF为摩擦力,Flim是摩擦力极限值,fESF为x为0时的刚度,如图6所示。
(2)指数弹簧摩擦模型结合平行麦克斯韦模型(ESFM):
ESFM单元采用并行非线性麦克斯韦模型进行增强,以覆盖动态效应;
FM=FM,lim·tanh(kM·v)
其中,FM为麦克斯韦摩擦力,FM,lim为最大的弹簧力,kM为弹簧刚度,如图7所示。
(3)伪库仑摩擦模型:为了将依赖于载荷的摩擦效应考虑到模型中(平移或旋转),可选用一个伪库仑类型的摩擦模型,根据方程摩擦力或力矩与施加的载荷有线性依赖关系:
Figure BDA0003423282190000092
其中,FC为伪库伦摩擦力,Fn是元素负载,Vs为元素相对速度;Vt是静摩擦与动摩擦之间的过渡速度,如图8所示。
然后在仿真软件中建立与实车道路试验相同的工况并进行仿真,通过与客观试验采集数据对标,确保该模型稳态和瞬态响应精度高达90%以上;
硬件部分的转向电机采用FanatecDD2直驱电机基座,其峰值扭矩达20N·m,具备1:1复现转向系统力反馈的能力;制动踏板总成采用FanatecV3踏板,方向盘盘体使用红旗原车方向盘保证触感与原车一致,解算模块采用具有6个CPU核心的Concurrent实时仿真机,保证解算实时性,场景渲染采用搭载RTX3090的工作站保证画面流畅度。
高精度高拟真驾驶模拟器数据采集平台搭建完成后,招募熟练驾驶员,首先进行至少30分钟的正常路面附着系数下的驾驶练习,随后开始实验,实验设计如下表:
表1实验设计表
Figure BDA0003423282190000101
依照上述实验设计分别采集路面附着系数μ=0.8、0.5、0.1下的熟练驾驶人换道数据;所采集的换道数据包括:在表1工况类别下的换道和超车过程中的本车道前车车距df、本车道前车相对速度vf、本车道后车车距dr、本车道后车相对速度vr、换道时长tc、换道距离sc、换道过程自车侧向加速度峰值aymax、换道过程自车侧向加速度均值ayave、换道过程自车纵向加速度峰值axmax、换道过程自车纵向加速度均值axave、预计碰撞时间tttc
步骤二、对所采集的换道数据进行数据清洗、数据变换等预处理,以及统计学特征计算、特征构造,得到特征序列与特征值的集合:
第一步:标准差标准化(z-score):
z-score标准化(标准差标准化)为类似正态分布,均值为0,标准差为1:
Figure BDA0003423282190000111
其中均值为
Figure BDA0003423282190000112
标准差为
Figure BDA0003423282190000113
第二步:对于所属范围未知或者所属范围是全体实数,同时不服从正态分布的数据进行非线性归一化:
tanh函数:
Figure BDA0003423282190000114
第三步:相似性度量,采用DTW对不同长度的数据进行比较分析,通过降低其时间和空间复杂度探究其内在特征:
设定向量C={c(1),c(1),...,c(N)},其中,c(n)=(i(n),j(n)),i,j为两个不同长度的序列,c(n)即为第n个匹配点对,d(xi(n),yj(n))为两个点的局部匹配距离;DTW即通过优化时间规整目标函数实现不同长度序列匹配点加权距离总和最小:
Figure BDA0003423282190000115
定义最小累计匹配函数g(i,j),表示所有匹配点对的最小累计匹配距离:
Figure BDA0003423282190000116
在计算的时候,首先令i(1)=j(1)=1,g(1,1)=2d(x1,y1)
Figure BDA0003423282190000117
其中,Reg为平行四边形约束区域,两条边的斜率为0.5和2,同时两个顶点坐标分别为(1,1)和(i,j);通过递推求解g(i,j)来确定下一匹配点:
Figure BDA0003423282190000121
其中,i=2,3,…,I;j=2,3,…,J;(i,j)∈Reg;
第四步:对良好附着下采集到的数据特征序列与特征值进行ANOVA相关性分析,得到对驾驶人换道行为具有显著影响的特征序列和特征值,后引入不同附着系数μ下采集得到的驾驶数据,分析μ是如何影响驾驶人的换道行为,得出映射关系如下表所示:
表2采集特征及映射关系列表
Figure BDA0003423282190000122
分析结果表明,当路面附着系数μ降低时相比于正常附着情况:
1、换道切入点远离前车;
2、换道过程自车侧向加速度峰值aymax降低;
3、换道时长增加;
步骤三、将三种常见附着系数μ=0.1、0.5、0.8下的驾驶人换道数据分别送入三个基于LSTM的神经网络决策规划模型,神经网络决策规划模型采用分层架构,先使用神经网络决策模型深度学习的方法学习人类换道决策行为,即左换道、右换道、保持跟车三种决策;再使用神经网络规划模型深度学习的方法学习人类换道轨迹,得到当前交通环境下每种附着下的预测轨迹输出,即μ=0.1、0.5、0.8下的三条轨迹;
所述的基于LSTM的神经网络决策规划模型输入向量定义为所提取的特征序列I、两个换道标志位M以及道路曲率ρ,输出即为自车在预测时域内的横纵向坐标序列以及速度序列,记为O;
网络框架如下,输入I经过ReLU函数激活的全连接层处理后进入LSTM单元,LSTM共包含遗忘门(forget gate)ft、输入门(inputgate)it、输出门(outputgate)ot和一个类似于隐含层的细胞状态(Cell State)ct;其中,遗忘门以上一时刻的隐含层状态ht-1和当前时刻的输入量xt作为输入,以对上一时刻的细胞状态ct-1保留比例作为输出:
ft=σ(Wfxxt+Wfhht-1+bf)······················(3.1)
下一步即确定在细胞状态中保留哪些新信息,主要分为两部分,一部分是通过输入门确定哪些值需要进行更新:
it=σ(Wixxt+Wihht-1+bi)······················(3.2)
另一部分是通过一个tanh网络层来创建一个细胞状态更新部,用来添加到细胞状态;这两部分点乘运算的结果即为当前输入对网络状态的更新:
Figure BDA0003423282190000131
Figure BDA0003423282190000132
最后,通过输出门和更新后的细胞状态确定当前时刻隐含层的输出:
ot=σ(Wox xt+Woh ht-1+bo)····················(3.5)
ht=ot⊙tanh(ct)·······················(3.6)
式中,⊙为哈达玛积(Hadamard product),Wfx、Wfh、Wix、Wih、Wcx、Wch、Wox、Woh为网络的权重矩阵,bf、bi、bc、bo为网络的偏置向量,tanh(·)和σ(·)分别是双曲正切函数和sigmoid函数:
Figure BDA0003423282190000141
Figure BDA0003423282190000142
通过这种方式学习历史轨迹序列中的规律,经softmax函数归一后输出换道意图概率向量Ω再经过one-hot编码后生成最终换道决策,换道概率超过80%的决策转化为100%;
同时,一个LSTM负责将被预测车辆的历史轨迹信息及其周围车辆的历史轨迹信息编码为一个固定长度的上下文向量r,该向量包含了编码器对历史轨迹特征的理解与记忆;
再经过一个LSTM网络后得到预测时域的输出轨迹。
步骤四、在驾驶任务中,决策规划系统实时接收由感知系统识别得到的实际路面附着系数的估计值
Figure BDA0003423282190000143
结合离散附着系数的输出轨迹,采用拉格朗日三次多项式插值法进行轨迹融合:
Figure BDA0003423282190000144
最终得到当前实际路况下的实时决策行为以及规划轨迹,并将规划轨迹传递给控制层作为跟踪轨迹,如图4,图5所示。

Claims (5)

1.一种考虑路面附着系数的自动驾驶汽车类人换道决策规划方法,其特征在于:包括以下步骤:
步骤一、分别采集良好路面附着系数、中等路面附着系数和低路面附着系数下的熟练驾驶人换道数据;
步骤二、对所采集的换道数据进行预处理,以及统计学特征计算、特征构造,对良好路面附着下采集到的数据特征序列与特征值进行ANOVA相关性分析,得到对驾驶人换道行为具有显著影响的特征序列和特征值,后引入不同附着系数μ下采集得到的驾驶数据,分析μ是如何影响驾驶人的换道行为,得出映射关系;分析结果表明,当路面附着系数μ降低时相比于正常附着情况:
(1)、换道切入点远离前车;
(2)、换道过程自车侧向加速度峰值aymax降低;
(3)、换道时长增加;
步骤三、将三种常见附着系数μ=0.1、0.5、0.8下的驾驶人换道数据分别送入三个基于LSTM的神经网络决策规划模型,神经网络决策规划模型采用分层架构,先使用神经网络决策模型深度学习的方法学习人类换道决策行为,即左换道、右换道、保持跟车三种决策;再使用神经网络规划模型深度学习的方法学习人类换道轨迹,得到当前交通环境下每种附着下的预测轨迹输出,即μ=0.1、0.5、0.8下的三条轨迹;
步骤四、在驾驶任务中,决策规划系统实时接收由感知系统识别得到的实际路面附着系数的估计值
Figure FDA0003423282180000011
结合离散附着系数的输出轨迹,采用拉格朗日三次多项式插值法进行轨迹融合:
Figure FDA0003423282180000012
其中,x0、y0,x1、y1,x2、y2分别为μ=0.1、0.5、0.8下的轨迹坐标,x、y为融合后的轨迹坐标值;
最终得到当前实际路况下的实时决策行为以及规划轨迹,并将规划轨迹传递给控制层作为跟踪轨迹。
2.根据权利要求1所述的一种考虑路面附着系数的自动驾驶汽车类人换道决策规划方法,其特征在于:步骤一中,搭建基于VI-grade软硬件平台的高精度高拟真驾驶模拟器数据采集平台进行驾驶人换道数据的采集;
软件环境中,采用VI-WorldSim作为场景软件,使用Unreal虚幻4渲染引擎,对车辆、车道、天气、路线等进行配置,视觉场景效果更加逼真;建立不同天气条件下的换道场景,并使附着系数产生对应的变化;采用VI-Simsound声学模块,提供NVH仿真级声效,提升声觉感受;首先建立用于数据采集及验证的高精度车辆动力学模型,对整车七个子系统包括转向、悬架、制动、转向、动力系统、轮胎、空气动力学系统分别建模,车辆转向建模应用pfeffer的高级物理转向模型,详细描述了转向系统各运动副的摩擦和阻尼力,包括:
(1)指数弹簧摩擦(ESF)模型:
Figure FDA0003423282180000021
其中,FSF为摩擦力,Flim是摩擦力极限值,fESF为x为0时的刚度;
(2)指数弹簧摩擦模型结合平行麦克斯韦模型(ESFM):
ESFM单元采用并行非线性麦克斯韦模型进行增强,以覆盖动态效应;
FM=FM,lim·tanh(kM·v)
其中,FM为麦克斯韦摩擦力,FM,lim为最大的弹簧力,kM为弹簧刚度;
(3)伪库仑摩擦模型:为了将依赖于载荷的摩擦效应考虑到模型中(平移或旋转),可选用一个伪库仑类型的摩擦模型,根据方程摩擦力或力矩与施加的载荷有线性依赖关系:
Figure FDA0003423282180000031
其中,FC为伪库伦摩擦力,Fn是元素负载,Vs为元素相对速度;Vt是静摩擦与动摩擦之间的过渡速度;
然后在仿真软件中建立与实车道路试验相同的工况并进行仿真,通过与客观试验采集数据对标,确保该模型稳态和瞬态响应精度高达90%以上;
硬件部分的转向电机采用FanatecDD2直驱电机基座,其峰值扭矩达20N·m,具备1:1复现转向系统力反馈的能力;制动踏板总成采用FanatecV3踏板,方向盘盘体使用原车方向盘保证触感与原车一致,解算模块采用具有6个CPU核心的Concurrent实时仿真机,保证解算实时性,场景渲染采用搭载RTX3090的工作站保证画面流畅度。
3.根据权利要求2所述的一种考虑路面附着系数的自动驾驶汽车类人换道决策规划方法,其特征在于:采集的换道数据包括:换道和超车过程中本车道前车车距df、本车道前车相对速度vf、本车道后车车距dr、本车道后车相对速度vr、换道时长tc、换道距离sc、换道过程自车侧向加速度峰值aymax、换道过程自车侧向加速度均值ayave、换道过程自车纵向加速度峰值axmax、换道过程自车纵向加速度均值axave、预计碰撞时间tttc
4.根据权利要求1所述的一种考虑路面附着系数的自动驾驶汽车类人换道决策规划方法,其特征在于:步骤二中具体包括以下步骤:
第一步:标准差标准化:
z-score标准差标准化为类似正态分布,均值为0,标准差为1:
Figure FDA0003423282180000032
其中均值为
Figure FDA0003423282180000033
标准差为
Figure FDA0003423282180000034
第二步:对于所属范围未知或者所属范围是全体实数,同时不服从正态分布的数据进行非线性归一化:
tanh函数:
Figure FDA0003423282180000041
第三步:相似性度量,采用DTW对不同长度的数据进行比较分析,通过降低其时间和空间复杂度探究其内在特征:
设定向量C={c(1),c(1),...,c(N)},其中,c(n)=(i(n),j(n)),i,j为两个不同长度的序列,c(n)即为第n个匹配点对,d(xi(n),yj(n))为两个点的局部匹配距离;DTW即通过优化时间规整目标函数实现不同长度序列匹配点加权距离总和最小:
Figure FDA0003423282180000042
定义最小累计匹配函数g(i,j),表示所有匹配点对的最小累计匹配距离:
Figure FDA0003423282180000043
在计算的时候,首先令i(1)=j(1)=1,g(1,1)=2d(x1,y1)
Figure FDA0003423282180000044
其中,Reg为平行四边形约束区域,两条边的斜率为0.5和2,同时两个顶点坐标分别为(1,1)和(i,j);通过递推求解g(i,j)来确定下一匹配点:
Figure FDA0003423282180000045
其中,i=2,3,…,I;j=2,3,…,J;(i,j)∈Reg;
第四步:对良好附着下采集到的数据特征序列与特征值进行ANOVA相关性分析,得到对驾驶人换道行为具有显著影响的特征序列和特征值,后引入不同附着系数μ下采集得到的驾驶数据,分析μ是如何影响驾驶人的换道行为,得出映射关系。
5.根据权利要求1所述的一种考虑路面附着系数的自动驾驶汽车类人换道决策规划方法,其特征在于:步骤三中所述的基于LSTM的神经网络决策规划模型输入向量定义为所提取的特征序列I、两个换道标志位M以及道路曲率ρ,输出即为自车在预测时域内的横纵向坐标序列以及速度序列,记为O;
网络框架如下,输入I经过ReLU函数激活的全连接层处理后进入LSTM单元,LSTM共包含遗忘门(forget gate)ft、输入门(inputgate)it、输出门(outputgate)ot和一个类似于隐含层的细胞状态(Cell State)ct;其中,遗忘门以上一时刻的隐含层状态ht-1和当前时刻的输入量xt作为输入,以对上一时刻的细胞状态ct-1保留比例作为输出:
ft=σ(Wfxxt+Wfhht-1+bf)·······················(3.1)
下一步即确定在细胞状态中保留哪些新信息,主要分为两部分,一部分是通过输入门确定哪些值需要进行更新:
it=σ(Wixxt+Wihht-1+bi)·······················(3.2)
另一部分是通过一个tanh网络层来创建一个细胞状态更新部,用来添加到细胞状态;这两部分点乘运算的结果即为当前输入对网络状态的更新:
Figure FDA0003423282180000051
Figure FDA0003423282180000052
最后,通过输出门和更新后的细胞状态确定当前时刻隐含层的输出:
ot=σ(Woxxt+Wohht-1+bo)·······················(3.5)
ht=ot⊙tanh(ct)··························(3.6)
式中,⊙为哈达玛积(Hadamard product),Wfx、Wfh、Wix、Wih、Wcx、Wch、Wox、Woh为网络的权重矩阵,bf、bi、bc、bo为网络的偏置向量,tanh(·)和σ(·)分别是双曲正切函数和sigmoid函数:
Figure FDA0003423282180000061
Figure FDA0003423282180000062
通过这种方式学习历史轨迹序列中的规律,经softmax函数归一后输出换道意图概率向量Ω再经过one-hot编码后生成最终换道决策,换道概率超过80%的决策转化为100%;
同时,一个LSTM负责将被预测车辆的历史轨迹信息及其周围车辆的历史轨迹信息编码为一个固定长度的上下文向量r,该向量包含了编码器对历史轨迹特征的理解与记忆;
再经过一个LSTM网络后得到预测时域的输出轨迹。
CN202111569940.9A 2021-12-21 2021-12-21 一种考虑附着系数的自动驾驶汽车类人换道决策规划方法 Active CN114030485B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111569940.9A CN114030485B (zh) 2021-12-21 2021-12-21 一种考虑附着系数的自动驾驶汽车类人换道决策规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111569940.9A CN114030485B (zh) 2021-12-21 2021-12-21 一种考虑附着系数的自动驾驶汽车类人换道决策规划方法

Publications (2)

Publication Number Publication Date
CN114030485A true CN114030485A (zh) 2022-02-11
CN114030485B CN114030485B (zh) 2023-11-03

Family

ID=80147074

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111569940.9A Active CN114030485B (zh) 2021-12-21 2021-12-21 一种考虑附着系数的自动驾驶汽车类人换道决策规划方法

Country Status (1)

Country Link
CN (1) CN114030485B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114550121A (zh) * 2022-02-28 2022-05-27 重庆长安汽车股份有限公司 一种基于聚类的自动驾驶换道场景分类方法及识别方法
CN115273514A (zh) * 2022-08-03 2022-11-01 西南交通大学 一种自动驾驶车辆多车道连续变道轨迹优化方法
CN116214527A (zh) * 2023-05-09 2023-06-06 南京泛美利机器人科技有限公司 一种增强人机协作适应性的三体协同智能决策方法和系统
CN118457609A (zh) * 2024-07-10 2024-08-09 吉林大学 一种驾驶交互场景下驾驶员社会价值取向计算方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110187639A (zh) * 2019-06-27 2019-08-30 吉林大学 一种基于参数决策框架的轨迹规划控制方法
CN111695418A (zh) * 2020-04-30 2020-09-22 上汽大众汽车有限公司 一种基于道路状况检测而进行安全驾驶的方法及系统
CN112904849A (zh) * 2021-01-18 2021-06-04 北京科技大学 一体式自动驾驶汽车换道轨迹规划和跟踪控制方法及系统
CN113753026A (zh) * 2021-10-21 2021-12-07 东南大学 一种考虑路面附着条件的大型营运车辆防侧翻决策方法
CN113799800A (zh) * 2021-10-08 2021-12-17 河南科技大学 一种无人驾驶车辆自动换道超车轨迹规划方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110187639A (zh) * 2019-06-27 2019-08-30 吉林大学 一种基于参数决策框架的轨迹规划控制方法
CN111695418A (zh) * 2020-04-30 2020-09-22 上汽大众汽车有限公司 一种基于道路状况检测而进行安全驾驶的方法及系统
CN112904849A (zh) * 2021-01-18 2021-06-04 北京科技大学 一体式自动驾驶汽车换道轨迹规划和跟踪控制方法及系统
CN113799800A (zh) * 2021-10-08 2021-12-17 河南科技大学 一种无人驾驶车辆自动换道超车轨迹规划方法
CN113753026A (zh) * 2021-10-21 2021-12-07 东南大学 一种考虑路面附着条件的大型营运车辆防侧翻决策方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114550121A (zh) * 2022-02-28 2022-05-27 重庆长安汽车股份有限公司 一种基于聚类的自动驾驶换道场景分类方法及识别方法
CN115273514A (zh) * 2022-08-03 2022-11-01 西南交通大学 一种自动驾驶车辆多车道连续变道轨迹优化方法
CN115273514B (zh) * 2022-08-03 2023-08-08 西南交通大学 一种自动驾驶车辆多车道连续变道轨迹优化方法
CN116214527A (zh) * 2023-05-09 2023-06-06 南京泛美利机器人科技有限公司 一种增强人机协作适应性的三体协同智能决策方法和系统
CN116214527B (zh) * 2023-05-09 2023-08-11 南京泛美利机器人科技有限公司 一种增强人机协作适应性的三体协同智能决策方法和系统
CN118457609A (zh) * 2024-07-10 2024-08-09 吉林大学 一种驾驶交互场景下驾驶员社会价值取向计算方法
CN118457609B (zh) * 2024-07-10 2024-09-03 吉林大学 一种驾驶交互场景下驾驶员社会价值取向计算方法

Also Published As

Publication number Publication date
CN114030485B (zh) 2023-11-03

Similar Documents

Publication Publication Date Title
CN106874597B (zh) 一种应用于自动驾驶车辆的高速公路超车行为决策方法
Li et al. Humanlike driving: Empirical decision-making system for autonomous vehicles
CN114030485B (zh) 一种考虑附着系数的自动驾驶汽车类人换道决策规划方法
Li et al. Survey on artificial intelligence for vehicles
CN110568760B (zh) 适用于换道及车道保持的参数化学习决策控制系统及方法
CN112232490B (zh) 一种基于视觉的深度模仿强化学习驾驶策略训练方法
Hecker et al. Learning accurate, comfortable and human-like driving
CN107813820A (zh) 一种仿优秀驾驶员的无人车换道路径规划方法
CN111045422A (zh) 一种自动驾驶导入“机智获得”模型的控制方法
CN112046489B (zh) 一种基于因子分析和机器学习的驾驶风格辨识算法
CN114926823B (zh) 基于wgcn的车辆驾驶行为预测方法
CN111645673B (zh) 一种基于深度强化学习的自动泊车方法
CN114368387B (zh) 一种基于注意力机制的驾驶员意图识别及车辆轨迹预测方法
CN110991523A (zh) 一种面向无人驾驶车辆检测算法性能的可解释性评估方法
CN111046710A (zh) 一种导入sdl模型的图像抽出的方法
CN115743179A (zh) 一种车辆概率多模态预期轨迹预测方法
Atakishiyev et al. Explaining autonomous driving actions with visual question answering
Xie et al. Modeling human-like longitudinal driver model for intelligent vehicles based on reinforcement learning
CN113033902B (zh) 一种基于改进深度学习的自动驾驶换道轨迹规划方法
CN114148349A (zh) 一种基于生成对抗模仿学习的车辆个性化跟驰控制方法
Ziegler et al. Modeling driving behavior of human drivers for trajectory planning
CN111038521A (zh) 一种自动驾驶“意识决定”模型的构成方法
Dubey et al. Autonomous braking and throttle system: A deep reinforcement learning approach for naturalistic driving
CN117734715A (zh) 基于强化学习的自动驾驶控制方法、系统、设备及存储介质
CN114580715B (zh) 一种基于生成对抗网络和长短期记忆模型的行人轨迹预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant