CN112633474A - 一种重型营运车辆的后向防撞驾驶决策方法 - Google Patents

一种重型营运车辆的后向防撞驾驶决策方法 Download PDF

Info

Publication number
CN112633474A
CN112633474A CN202011512719.5A CN202011512719A CN112633474A CN 112633474 A CN112633474 A CN 112633474A CN 202011512719 A CN202011512719 A CN 202011512719A CN 112633474 A CN112633474 A CN 112633474A
Authority
CN
China
Prior art keywords
vehicle
decision
backward
collision
substep
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011512719.5A
Other languages
English (en)
Other versions
CN112633474B (zh
Inventor
李旭
胡玮明
胡锦超
祝雪芬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202011512719.5A priority Critical patent/CN112633474B/zh
Publication of CN112633474A publication Critical patent/CN112633474A/zh
Priority to PCT/CN2021/086570 priority patent/WO2022126940A1/zh
Priority to US17/766,870 priority patent/US11964655B2/en
Application granted granted Critical
Publication of CN112633474B publication Critical patent/CN112633474B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/08Active safety systems predicting or avoiding probable or impending collision or attempting to minimise its consequences
    • B60W30/095Predicting travel path or likelihood of collision
    • B60W30/0956Predicting travel path or likelihood of collision the prediction being responsive to traffic or environmental parameters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/08Active safety systems predicting or avoiding probable or impending collision or attempting to minimise its consequences
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/092Reinforcement learning
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C5/00Registering or indicating the working of vehicles
    • G07C5/08Registering or indicating performance data other than driving, working, idle, or waiting time, with or without registering driving, working, idle or waiting time
    • G07C5/0808Diagnosing performance data
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2300/00Indexing codes relating to the type of vehicle
    • B60W2300/12Trucks; Load vehicles
    • B60W2300/125Heavy duty trucks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2420/00Indexing codes relating to the type of sensors based on the principle of their operation
    • B60W2420/40Photo, light or radio wave sensitive means, e.g. infrared sensors
    • B60W2420/408Radar; Laser, e.g. lidar
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2520/00Input parameters relating to overall vehicle dynamics
    • B60W2520/06Direction of travel
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects
    • B60W2554/40Dynamic objects, e.g. animals, windblown objects
    • B60W2554/404Characteristics
    • B60W2554/4041Position
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects
    • B60W2554/80Spatial relation or speed relative to objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种重型营运车辆的后向防撞驾驶决策方法。首先,建立交通环境模型,采集重型营运车辆及其后方车辆的运动状态信息。其次,建立基于后向距离碰撞时间的后向碰撞危险评估模型,将后向碰撞危险精确量化。最后,将后向防撞驾驶决策问题描述为一定奖励函数下的马尔科夫决策过程,建立基于深度强化学习的后向防撞驾驶决策模型,得到有效、可靠、具有自适应性的后向防撞驾驶决策策略。本发明提出的方法,克服了现有方法中缺乏重型营运车辆后向防撞驾驶决策研究的不足,可以定量输出合理的方向盘转角和节气门开度控制量,为驾驶员提供有效、可靠的后向防撞驾驶建议,减少后向碰撞事故的发生。

Description

一种重型营运车辆的后向防撞驾驶决策方法
技术领域
本发明涉及一种防碰撞驾驶决策方法,尤其是涉及一种重型营运车辆的后向防撞驾驶决策方法,属于汽车安全技术领域。
背景技术
营运车辆作为道路运输的主要承担者,其安全状况直接影响我国道路交通运输安全。车辆碰撞是道路运输过程中最主要的事故形态。以危险品运输罐车为代表的重型营运车辆,其罐内装载多为易燃易爆、剧毒(甲醇、丙烯腈)等危险化学品,相比于前向碰撞,后向碰撞更容易导致罐体破损,进而引发罐内危险品泄漏、燃烧、爆炸等严重后果,产生的次生伤害远远超过碰撞事故本身所造成的伤害,具有更高的危险性。驾驶决策作为后向碰撞主动防控的重要一环,如果能在后向碰撞事故发生前对驾驶员进行预警并提醒驾驶员采取合理的加速、变道等措施,可以大幅度降低因后向碰撞造成的交通事故发生频率或减轻其造成的伤害。因此,研究重型营运车辆的后向防撞驾驶决策方法,对于保障道路交通安全具有重要的社会意义和实用价值。
目前,已有标准、专利和文献对车辆后向防撞进行了研究。在标准方面,交通运输部发布了交通行业标准《营运车辆后向碰撞预警系统性能要求和测试规程》,对安装在营运车辆上的后向碰撞预警系统性能进行了规定,但仅限于碰撞预警层面,未涉及后向防撞驾驶决策。在专利文献方面,后向防撞研究大多面向小型乘用车辆。相比于乘用车辆,重型营运车辆具有质心位置较高、载重量较大等特点,在急转弯或紧急变道过程中,罐体或挂车的晃动会进一步增加车辆的不稳定性,极易失稳而发生侧翻。因此,针对乘用车辆的驾驶决策方法难以适用于重型营运车辆。总体而言,现有研究未涉及重型营运车辆后向防撞的驾驶决策,特别是缺乏有效、可靠、自适应交通环境特性的重型营运车辆后向防撞驾驶决策研究。
发明内容
发明目的:为了实现有效、可靠、自适应交通环境特性的重型营运车辆后向防撞驾驶决策方法,本发明公开了一种重型营运车辆的后向防撞驾驶决策方法。该方法克服了现有方法中缺乏重型营运车辆后向防撞决策策略的不足,可以定量输出合理的方向盘转角和节气门开度控制量,为驾驶员提供有效、可靠的后向防撞驾驶建议,实现了有效、可靠和自适应交通环境的重型营运车辆后向防撞驾驶决策。
技术方案:本发明针对重型营运车辆,如半挂罐车、半挂列车,提出了一种基于深度强化学习的后向防撞驾驶决策方法。首先,建立虚拟交通环境模型,采集重型营运车辆及其后方车辆的运动状态信息。其次,建立基于后向距离碰撞时间的后向碰撞危险评估模型,将后向碰撞危险精确量化。最后,将后向防撞驾驶决策问题描述为一定奖励函数下的马尔科夫决策过程,建立基于深度强化学习的后向防撞驾驶决策模型,得到有效、可靠、具有自适应性的后向防撞驾驶决策策略。包括以下步骤:
步骤一:建立虚拟交通环境模型
为了降低因后向碰撞造成的交通事故发生频率,提高重型营运车辆的安全性,本发明提出了一种后向防撞驾驶决策方法,其适用的场景为:在重型营运车辆行驶过程中,车辆前方无障碍物等干扰因素,为了防止与后方车辆发生后向碰撞,应有效、及时地为驾驶员提供加速、转向等决策策略,以避免碰撞事故的发生。
在实际道路试验过程中,重型营运车辆的相关试验具有较高的试验成本和危险性。为了降低试验成本和风险,同时兼顾试验效率,本发明面向高等级公路,建立虚拟交通环境模型,即包含直道和弯道的三车道虚拟环境模型。重型营运车辆在交通环境模型中运动,目标车辆(包含小型、中型和大型车辆3种类型)跟随车辆进行运动,期间包括加速、减速、匀速、变道4种不同的行驶工况。
通过安装在每辆车上的厘米级高精度差分GPS、惯性测量单元和毫米波雷达,可以实时地获取运动状态信息,包括:两车的位置、速度、加速度、相对间距、相对速度;通过安装在车辆尾部的视觉传感器,可以实时地获取目标车辆的类型;通过CAN总线可以读取驾驶员操控信息,包括:车辆的节气门开度、方向盘转角。
在本发明中,目标车辆是指位于重型营运车辆行驶道路后方,且位于同一车道线内、行驶方向相同、距离最近的车辆。
步骤二:建立后向碰撞危险评估模型
为了合理、有效地输出后向防撞决策策略,需准确、实时地评估重型营运车辆的后向碰撞危险程度。首先,计算重型营运车辆与目标车辆发生碰撞所需的时间:
Figure BDA0002846912980000021
式(1)中,RTTC(t)表示t时刻的后向距离碰撞时间,单位为秒,xc(t)为车间距离,单位为米,vF(t),vR(t)分别表示重型营运车辆和目标车辆的速度,vr(t)为两车的相对速度,单位均为米每秒,且vr(t)=vF(t)-vR(t)。
其次,计算后向碰撞危险程度。根据国家标准《营运车辆后向碰撞预警系统性能要求和测试规程》,当后向距离碰撞时间不小于2.1秒,且不大于4.4秒时发出后向碰撞报警,表示后向碰撞预警系统测试通过。基于此,对后向碰撞危险程度进行量化:
Figure BDA0002846912980000031
式(2)中,δw为后向碰撞危险的量化值。当δw≥1时,表示无后向碰撞危险;当0.5≤δw≤1时,表示存在后向碰撞危险;当0≤δw≤0.5时,表示后向碰撞危险程度非常高。
步骤三:建立重型营运车辆的后向防撞驾驶决策模型
为了实现有效、可靠、自适应交通环境的后向防撞驾驶决策,本发明综合考虑交通环境、车辆运行状态、后方车辆类型、后向碰撞危险程度对后向碰撞的影响,建立重型营运车辆的后向防撞驾驶决策模型。
常见的驾驶决策方法包括基于规则和基于数据学习的决策算法两类。(1)基于规则的决策算法,是利用有限的有向连通图描述不同的驾驶状态以及状态之间的转移关系,从而根据驾驶状态的迁移生成驾驶动作。然而,在车辆运动过程中,车辆运动参数、道路条件和后方交通状态均存在不确定性,制定的规则难以遍历所有场景,难以保证决策的有效性和适应性。(2)基于数据学习的决策算法,是利用算法模仿人类对知识或技能的学习过程,通过交互式的自学习机制实现自身学习性能的不断改进。其中,基于深度强化学习的方法将深度学习的感知能力和强化学习的决策能力相结合,对不确定性问题的适应性特点,满足防撞决策对于交通环境、行驶工况具有适应性的需求。因此,本发明采用深度强化学习算法建立后向防撞驾驶决策模型。
基于深度强化学习的决策方法主要包括:基于值函数、基于策略搜索和基于Actor-Critic架构的决策方法三类。基于值的深度强化学习算法不能处理连续输出的问题,无法满足防撞决策中连续输出驾驶策略的需求。基于策略搜索的方法,存在着对步长敏感、步长选择较为困难等不足。基于Actor-Critic架构的决策方法结合了值函数估计和策略搜索,具有较快的更新速度。其中的近端策略优化(Proximal Policy Optimization,PPO)解决了参数更新慢和步长难以确定的问题,在输出连续动作空间方面取得了较好的效果。因此,本发明采用PPO算法建立后向防撞驾驶决策模型,通过与目标车辆运动随机过程模型进行交互式迭代学习,得到后向防撞的最优决策。具体包括以下4个子步骤:
子步骤1:定义后向防撞驾驶决策模型的基础参数
首先,将后向防撞驾驶决策问题描述为一定奖励函数下的马尔科夫决策过程(S,A,P,r),其中,S为状态空间,A为后向防撞动作决策,P表示由于目标车辆运动不确定性而导致的状态转移概率,r为奖励函数。其次,对马尔科夫决策过程的基础参数进行定义,具体地:
(1)定义状态空间
利用步骤一输出的车辆运动状态信息和步骤二输出的后向碰撞危险程度,建立状态空间表达:
St=(vF_lon,aF_lon,vr_lon,ar_lonstr,pthr,Lrw,Tm) (3)
式(3)中,St为t时刻的状态空间,vF_lon,vr_lon分别表示车辆的纵向速度和两车的相对纵向速度,单位为米每秒,aF_lon,ar_lon分别表示车辆的纵向加速度和两车的相对纵向加速度,单位为米每二次方秒,θstr为车辆的方向盘转角,单位为度,pthr为节气门开度,单位为百分数,Lr为相对车间距,单位为米,δw,Tm分别表示后向碰撞危险程度和目标车辆类型,m=1,2,3分别表示目标车辆为大型车辆、中型车辆和小型车辆,在本发明中,取Tm=m。
(2)定义动作决策
为了综合考虑横向运动和纵向运动对后向碰撞的影响,本发明将方向盘转角和节气门开度作为控制量,定义决策模型输出的驾驶策略,即动作决策:
At=[θstr_out,pthr_out] (4)
式(4)中,At为t时刻的动作决策,θstr_out表示归一化后的方向盘转角控制量,范围为[-1,1],pthr_out表示归一化后的节气门开度控制量,范围为[0,1]。当pthr_out=0时,表示车辆未进行加速,当δbrake=1时,表示车辆以最大加速度进行加速。
(3)建立奖励函数
为了评价动作决策的优劣程度,通过建立回报函数的方式,将评价具体化和数值化。考虑到后向防撞驾驶决策是一个涉及安全性、舒适性等目标在内的多目标优化问题,本发明将奖励函数设计为:
rt=r1+r2+r3 (5)
式(5)中,rt为t时刻的奖励函数,r1为安全距离奖励函数,r2为舒适性奖励函数,r3为惩罚函数。
首先,设计安全距离奖励函数r1
Figure BDA0002846912980000041
式(6)中,Lr,Ls分别表示相对车间距和安全距离阈值,ωd为安全距离权重系数,在本发明中,取ωd=0.85。
其次,为了保证车辆的驾驶舒适性,应尽可能地避免出现过大的冲击度,设计舒适性奖励函数r2
r2=ωj|aF_lon(t+1)-aF_lon(t)| (7)
式(7)中,ωj为舒适性权重系数,在本发明中,取ωj=0.95。
最后,设计惩罚函数r3
Figure BDA0002846912980000051
(4)设计期望最大的策略
Figure BDA0002846912980000052
式(9)中,π*为期望最大的策略,π为后向防撞决策策略,γ为折扣因子,且γ∈(0,1),τ(π)表示在策略π下的轨迹分布。
子步骤2:设计后向防撞驾驶决策模型的网络架构
利用“Actor-Critic”网络框架搭建后向防撞驾驶决策网络,包括Actor网络和Critic网络两部分。其中,Actor网络将状态空间信息作为输入,输出动作决策,即重型营运车辆的节气门开度和方向盘转角控制量。Critic网络将状态空间信息和动作决策作为输入,输出当前“状态-动作”的价值。具体地:
(1)设计Actor网络
建立分层级编码器结构,分别对状态空间中的各类信息进行特征提取。首先,构建3个串行连接的卷积层(CF1,CF2,CF3)和1个最大池化层(P1),对车辆的运动状态信息(纵向速度、纵向加速度、方向盘转角、节气门开度)进行特征提取,并将其编码为中间特征向量h1;利用相同的结构,即3个串行连接的卷积层(CR1,CR2,CR3)和1个最大池化层(P2),对前后两车的相对运动状态信息(相对纵向速度、相对纵向加速度、相对车间距)进行特征提取,并将其编码为中间特征向量h2;利用卷积层CW1和最大池化层P3对碰撞危险程度和目标车辆类型进行特征提取,并将其编码为中间特征向量h3。其次,将特征h1,h2,h3结合并连接全连接层FC4和FC5,输出动作决策。
其中,设置卷积层CF1,CF2,CF3,CR1,CR2,CR3,CW1的神经元数量分别为20,20,10,20,20,10,20,设置全连接层FC4,FC5的神经元数量为200。各卷积层和全连接层的激活函数均为线性整流单元(Rectified Linear Unit,ReLU),其表达式为f(x)=max(0,x)。
(2)设计Critic网络
利用多个隐藏层结构的神经网络建立Critic网络。首先,将状态空间St输入到隐藏层FCC1中;同时,将动作决策At输入到隐藏层FCC2中。其次,隐藏层FCC1和FCC2通过张量相加的方式进行合并。最后,依次通过全连接层FCC3和FCC4后,输出Critic网络的值。
其中,设置FCC1层和FCC2层的神经元数量为400,其余隐藏层的神经元数量均为200,各层的激活函数均为ReLU。
子步骤3:训练后向防撞驾驶决策模型
利用损失函数Jactor和Jcritic对网络参数进行梯度更新,具体训练过程如下:
子步骤3.1:初始化Actor网络和Critic网络;
子步骤3.2:进行迭代求解,每一次迭代包括子步骤3.21至子步骤3.4,具体地:
子步骤3.21:进行迭代求解,每一次迭代包括子步骤3.211至3.213,具体地:
子步骤3.211:利用步骤一的虚拟交通环境模型得到车辆的运动控制操作;
子步骤3.212:利用Actor网络得到样本数据(St,At,rt);
子步骤3.213:结束循环,得到样本点集[(S1,A1,r1),(S2,A2,r2),...,(St,At,rt)];
子步骤3.22:计算优势函数;
Figure BDA0002846912980000061
式(10)中,
Figure BDA0002846912980000062
为优势函数,V(St)表示状态St的值函数;
Figure BDA0002846912980000063
表示应该增加采取当前动作的可能性,
Figure BDA0002846912980000064
表示应该减小采取该动作的可能性。
子步骤3.23:进行迭代求解,每一次迭代包括子步骤3.231至3.233,具体地:
子步骤3.231:计算Actor网络的目标函数;
子步骤3.232:更新Actor网络参数Jactor
Figure BDA0002846912980000065
式(11)中,pt(θ)表示在策略更新过程中新策略πθ与旧策略πθ_old在动作决策分布上的比值,且
Figure BDA0002846912980000066
clip(·)表示裁剪函数,ε为常数,在本发明中,取ε=0.25。
子步骤3.233:更新Critic网络参数Jcritic
Figure BDA0002846912980000067
子步骤3.234:结束循环。
子步骤3.3:按照子步骤3.2提供的方法进行迭代更新,使Actor网络和Critic网络逐步收敛。在训练过程中,若车辆发生后向碰撞或侧翻,则终止当前回合并开始新的回合进行训练。当迭代达到最大步数或模型能够稳定准确地进行后向防撞驾驶决策时,训练结束。
子步骤4:利用后向防撞决策模型输出决策策略
将厘米级高精度差分GPS、惯性测量单元、毫米波雷达、CAN总线获取的信息输入到已训练的后向防撞驾驶决策模型中,可以定量输出合理的方向盘转角和节气门开度控制量,为驾驶员提供有效、可靠的后向防撞驾驶建议,从而实现了有效、可靠、具有自适应性的重型营运车辆后向防撞驾驶决策。
有益效果
与现有技术相比,本发明的技术方案具有以下有益技术效果,具体体现在:
(1)本发明提出的方法实现了重型营运车辆的后向防撞驾驶决策,可以为驾驶员提供有效、可靠的后向防撞驾驶决策策略;
(2)本发明提出的方法综合考虑交通环境、车辆运行状态、后方车辆类型、后向碰撞危险程度对后向碰撞的影响,以数值的形式将方向盘转角、节气门开度等驾驶策略精确量化,输出的驾驶策略能够根据交通环境和驾驶员操作自适应调整,提高了重型营运车辆后向防撞驾驶决策的有效性、可靠性和环境适应性;
(3)本发明提出的方法无需考虑复杂的车辆动力学方程和车身参数,计算方法简单清晰。
附图说明
图1是本发明的技术路线示意图;
图2是本发明建立的后向防撞驾驶决策模型的网络架构示意图。
具体实施方式
下面结合附图对本发明的技术方案作进一步的说明。
为了建立有效、可靠、自适应交通环境的后向防撞决策策略,实现重型营运车辆的后向防撞驾驶决策,以填补实际应用中重型营运车辆后向防撞驾驶决策技术的空白。本发明针对重型营运车辆,如半挂罐车、半挂列车,提出了一种基于深度强化学习的后向防撞驾驶决策方法。首先,建立虚拟交通环境模型,采集重型营运车辆及其后方车辆的运动状态信息。其次,建立基于后向距离碰撞时间的后向碰撞危险评估模型,将后向碰撞危险精确量化。最后,将后向防撞驾驶决策问题描述为一定奖励函数下的马尔科夫决策过程,建立基于深度强化学习的后向防撞驾驶决策模型,得到有效、可靠、具有自适应性的后向防撞驾驶决策策略。本发明的技术路线如图1所示,具体步骤如下:
步骤一:建立虚拟交通环境模型
为了降低因后向碰撞造成的交通事故发生频率,提高重型营运车辆的安全性,本发明提出了一种后向防撞驾驶决策方法,其适用的场景为:在重型营运车辆行驶过程中,车辆前方无障碍物等干扰因素,为了防止与后方车辆发生后向碰撞,应有效、及时地为驾驶员提供加速、转向等决策策略,以避免碰撞事故的发生。
在实际道路试验过程中,重型营运车辆的防撞试验具有较高的试验成本和危险性。为了降低试验成本和风险,同时兼顾试验效率,本发明面向高等级公路,建立虚拟交通环境模型,即包含直道和弯道的三车道虚拟环境模型。重型营运车辆在交通环境模型中运动,目标车辆(包含小型、中型和大型车辆3种类型)跟随车辆进行运动,期间包括加速、减速、匀速、变道4种不同的行驶工况。
通过安装在每辆车上的厘米级高精度差分GPS、惯性测量单元和毫米波雷达,可以实时地获取运动状态信息,包括:两车的位置、速度、加速度、相对间距、相对速度信息;通过安装在车辆尾部的视觉传感器,可以实时地获取目标车辆的类型;通过CAN总线可以读取驾驶员操控信息,包括:车辆的节气门开度、方向盘转角。
在本发明中,目标车辆是指位于重型营运车辆行驶道路后方,且位于同一车道线内、行驶方向相同、距离最近的车辆。
步骤二:建立后向碰撞危险评估模型
为了合理、有效地输出后向防撞决策策略,需准确、实时地评估重型营运车辆的后向碰撞危险程度。首先,计算重型营运车辆与目标车辆发生碰撞所需的时间:
Figure BDA0002846912980000081
式(1)中,RTTC(t)表示t时刻的后向距离碰撞时间,单位为秒,xc(t)为车间距离,单位为米,vF(t),vR(t)分别表示重型营运车辆和目标车辆的速度,vr(t)为两车的相对速度,单位均为米每秒,且vr(t)=vF(t)-vR(t)。
其次,计算后向碰撞危险程度。根据国家标准《营运车辆后向碰撞预警系统性能要求和测试规程》,当后向距离碰撞时间不小于2.1秒,且不大于4.4秒时发出后向碰撞报警,表示后向碰撞预警系统测试通过。基于此,对后向碰撞危险程度进行量化:
Figure BDA0002846912980000082
式(2)中,δw为后向碰撞危险的量化值。当δw≥1时,表示无后向碰撞危险;当0.5≤δw≤1时,表示存在后向碰撞危险;当0≤δw≤0.5时,表示后向碰撞危险程度非常高。
步骤三:建立重型营运车辆的后向防撞驾驶决策模型
为了实现有效、可靠、自适应交通环境的后向防撞驾驶决策,本发明综合考虑交通环境、车辆运行状态、后方车辆类型、后向碰撞危险程度对后向碰撞的影响,建立重型营运车辆的后向防撞驾驶决策模型。
常见的驾驶决策方法包括基于规则和基于数据学习的决策算法两类。(1)基于规则的决策算法,是利用有限的有向连通图描述不同的驾驶状态以及状态之间的转移关系,从而根据驾驶状态的迁移生成驾驶动作。然而,在车辆运动过程中,车辆运动参数、道路条件和后方交通状态均存在不确定性,制定的规则难以遍历所有场景,难以保证决策的有效性和适应性。(2)基于数据学习的决策算法,是利用算法模仿人类对知识或技能的学习过程,通过交互式的自学习机制实现自身学习性能的不断改进。其中,基于深度强化学习的方法将深度学习的感知能力和强化学习的决策能力相结合,对不确定性问题的适应性特点,满足防撞决策对于交通环境、行驶工况具有适应性的需求。因此,本发明采用深度强化学习算法建立后向防撞驾驶决策模型。
基于深度强化学习的决策方法主要包括:基于值函数、基于策略搜索和基于Actor-Critic架构的决策方法三类。其中,基于值的深度强化学习算法不能处理连续输出的问题,无法满足防撞决策中连续输出驾驶策略的需求。基于策略搜索的方法,存在着对步长敏感、步长选择较为困难等不足。基于Actor-Critic架构的决策方法结合了值函数估计和策略搜索,具有较快的更新速度。其中的近端策略优化(Proximal PolicyOptimization,PPO)解决了参数更新慢和步长难以确定的问题,在输出连续动作空间方面取得了较好的效果。因此,本发明采用PPO算法建立后向防撞驾驶决策模型,通过与目标车辆运动随机过程模型进行交互式迭代学习,得到后向防撞的最优决策。具体包括以下4个子步骤:
子步骤1:定义后向防撞驾驶决策模型的基础参数
首先,将后向防撞驾驶决策问题描述为一定奖励函数下的马尔科夫决策过程(S,A,P,r),其中,S为状态空间,A为后向防撞动作决策,P表示由于目标车辆运动不确定性而导致的状态转移概率,r为奖励函数。其次,对马尔科夫决策过程的基础参数进行定义,具体地:
(1)定义状态空间
利用步骤一输出的车辆运动状态信息和步骤二输出的后向碰撞危险程度,建立状态空间表达:
St=(vF_lon,aF_lon,vr_lon,ar_lonstr,pthr,Lrw,Tm) (3)
式(3)中,St为t时刻的状态空间,vF_lon,vr_lon分别表示车辆的纵向速度和两车的相对纵向速度,单位为米每秒,aF_lon,ar_lon分别表示车辆的纵向加速度和两车的相对纵向加速度,单位为米每二次方秒,θstr为车辆的方向盘转角,单位为度,pthr为节气门开度,单位为百分数,Lr为相对车间距,单位为米,δw,Tm分别表示后向碰撞危险程度和目标车辆类型,m=1,2,3分别表示目标车辆为大型车辆、中型车辆和小型车辆,在本发明中,取Tm=m。
(2)定义动作决策
为了综合考虑横向运动和纵向运动对后向碰撞的影响,本发明将方向盘转角和节气门开度作为控制量,定义决策模型输出的驾驶策略,即动作决策:
At=[θstr_out,pthr_out] (4)
式(4)中,At为t时刻的动作决策,θstr_out表示归一化后的方向盘转角控制量,范围为[-1,1],pthr_out表示归一化后的节气门开度控制量,范围为[0,1]。当pthr_out=0时,表示车辆未进行加速,当δbrake=1时,表示车辆以最大加速度进行加速。
(3)建立奖励函数
为了评价动作决策的优劣程度,通过建立回报函数的方式,将评价具体化和数值化。考虑到后向防撞驾驶决策是一个涉及安全性、舒适性等目标在内的多目标优化问题,本发明将奖励函数设计为:
rt=r1+r2+r3 (5)
式(5)中,rt为t时刻的奖励函数,r1为安全距离奖励函数,r2为舒适性奖励函数,r3为惩罚函数。
首先,设计安全距离奖励函数r1
Figure BDA0002846912980000101
式(6)中,Lr,Ls分别表示相对车间距和安全距离阈值,ωd为安全距离权重系数,在本发明中,取ωd=0.85。
其次,为了保证车辆的驾驶舒适性,应尽可能地避免出现过大的冲击度,设计舒适性奖励函数r2
r2=ωj|aF_lon(t+1)-aF_lon(t)| (7)
式(7)中,ωj为舒适性权重系数,在本发明中,取ωj=0.95。
最后,设计惩罚函数r3
Figure BDA0002846912980000102
(4)设计期望最大的策略
Figure BDA0002846912980000111
式(9)中,π*为期望最大的策略,π为后向防撞决策策略,γ为折扣因子,且γ∈(0,1),τ(π)表示在策略π下的轨迹分布。
子步骤2:设计后向防撞驾驶决策模型的网络架构
利用“Actor-Critic”网络框架搭建后向防撞驾驶决策网络,包括Actor网络和Critic网络两部分。其中,Actor网络将状态空间信息作为输入,输出动作决策,即重型营运车辆的节气门开度和方向盘转角控制量。Critic网络将状态空间信息和动作决策作为输入,输出当前“状态-动作”的价值。网络架构如图2所示,具体地:
(1)设计Actor网络
建立分层级编码器结构,分别对状态空间中的各类信息进行特征提取。首先,构建3个串行连接的卷积层(CF1,CF2,CF3)和1个最大池化层(P1),对车辆的运动状态信息(纵向速度、纵向加速度、方向盘转角、节气门开度)进行特征提取,并将其编码为中间特征向量h1;利用相同的结构,即3个串行连接的卷积层(CR1,CR2,CR3)和1个最大池化层(P2),对前后两车的相对运动状态信息(相对纵向速度、相对纵向加速度、相对车间距)进行特征提取,并将其编码为中间特征向量h2;利用卷积层CW1和最大池化层P3对碰撞危险程度和目标车辆类型进行特征提取,并将其编码为中间特征向量h3。其次,将特征h1,h2,h3结合并连接全连接层FC4和FC5,输出动作决策。
其中,设置卷积层CF1,CF2,CF3,CR1,CR2,CR3,CW1的神经元数量分别为20,20,10,20,20,10,20,设置全连接层FC4,FC5的神经元数量为200。各卷积层和全连接层的激活函数均为线性整流单元(Rectified Linear Unit,ReLU),其表达式为f(x)=max(0,x)。
(2)设计Critic网络
利用多个隐藏层结构的神经网络建立Critic网络。首先,将状态空间St输入到隐藏层FCC1中;同时,将动作决策At输入到隐藏层FCC2中。其次,隐藏层FCC1和FCC2通过张量相加的方式进行合并。最后,依次通过全连接层FCC3和FCC4后,输出Critic网络的值。
其中,设置FCC1层和FCC2层的神经元数量为400,其余隐藏层的神经元数量均为200,各层的激活函数均为ReLU。
子步骤3:训练后向防撞驾驶决策模型
利用损失函数Jactor和Jcritic对网络参数进行梯度更新,具体训练过程如下:
子步骤3.1:初始化Actor网络和Critic网络;
子步骤3.2:进行迭代求解,每一次迭代包括子步骤3.21至子步骤3.4,具体地:
子步骤3.21:进行迭代求解,每一次迭代包括子步骤3.211至3.213,具体地:
子步骤3.211:利用步骤一的虚拟交通环境模型得到车辆的运动控制操作;
子步骤3.212:利用Actor网络得到样本数据(St,At,rt);
子步骤3.213:结束循环,得到样本点集[(S1,A1,r1),(S2,A2,r2),...,(St,At,rt)];
子步骤3.22:计算优势函数;
Figure BDA0002846912980000121
式(10)中,
Figure BDA0002846912980000122
为t时刻的优势函数,V(St)表示状态St的值函数;
Figure BDA0002846912980000123
表示应该增加采取当前动作的可能性,
Figure BDA0002846912980000124
表示应该减小采取该动作的可能性。
子步骤3.23:进行迭代求解,每一次迭代包括子步骤3.231至3.233,具体地:
子步骤3.231:计算Actor网络的目标函数;
子步骤3.232:更新Actor网络参数Jactor
Figure BDA0002846912980000125
式(11)中,pt(θ)表示在策略更新过程中新策略πθ与旧策略πθ_old在动作决策分布上的比值,且
Figure BDA0002846912980000126
clip(·)表示裁剪函数,ε为常数,在本发明中,取ε=0.25。
子步骤3.233:更新Critic网络参数Jcritic
Figure BDA0002846912980000127
子步骤3.234:结束循环。
子步骤3.3:按照子步骤3.2提供的方法进行迭代更新,使Actor网络和Critic网络逐步收敛。在训练过程中,若车辆发生后向碰撞或侧翻,则终止当前回合并开始新的回合进行训练。当迭代达到最大步数或模型能够稳定准确地进行后向防撞驾驶决策时,训练结束。
子步骤4:利用后向防撞决策模型输出决策策略
将厘米级高精度差分GPS、惯性测量单元、毫米波雷达和CAN总线获取的信息输入到已训练的后向防撞驾驶决策模型中,可以定量输出合理的方向盘转角和节气门开度控制量,为驾驶员提供有效、可靠的后向防撞驾驶建议,从而实现了有效、可靠、具有自适应性的重型营运车辆后向防撞驾驶决策。

Claims (1)

1.一种重型营运车辆的后向防撞驾驶决策方法,其特征在于:该方法包括如下步骤:
步骤一:建立虚拟交通环境模型:面向高等级公路,建立虚拟交通环境模型,即包含直道和弯道的三车道虚拟环境模型;重型营运车辆在交通环境模型中运动,目标车辆跟随重型营运车辆进行运动,期间包括加速、减速、匀速、变道4种不同的行驶工况;
所述建立虚拟交通环境模型的过程中通过安装在每辆车上的厘米级高精度差分GPS、惯性测量单元和毫米波雷达,实时地获取车辆运动状态信息,包括:两车的位置、速度、加速度、相对间距、相对速度;通过安装在车辆尾部的视觉传感器,实时地获取目标车辆的类型;通过CAN总线读取驾驶员操控信息,包括:车辆的节气门开度、方向盘转角;
所述目标车辆是指位于重型营运车辆行驶道路后方,且位于同一车道线内、行驶方向相同、距离最近的车辆,包含小型、中型和大型车辆3种类型;
步骤二:建立后向碰撞危险评估模型;具体包括:
首先,计算重型营运车辆与目标车辆发生碰撞所需的时间:
Figure FDA0002846912970000011
式(1)中,RTTC(t)表示t时刻的后向距离碰撞时间,单位为秒,xc(t)为车间距离,单位为米,vF(t),vR(t)分别表示重型营运车辆和目标车辆的速度,vr(t)为两车的相对速度,单位均为米每秒,且vr(t)=vF(t)-vR(t);
其次,计算后向碰撞危险程度;当后向距离碰撞时间不小于2.1秒,且不大于4.4秒时发出后向碰撞报警,表示后向碰撞预警系统测试通过;基于此,对后向碰撞危险程度进行量化:
Figure FDA0002846912970000012
式(2)中,δw为后向碰撞危险的量化值;当δw≥1时,表示无后向碰撞危险;当0.5≤δw≤1时,表示存在后向碰撞危险;当0≤δw≤0.5时,表示后向碰撞危险程度非常高;
步骤三:建立重型营运车辆的后向防撞驾驶决策模型:综合考虑交通环境、车辆运行状态、后方车辆类型、后向碰撞危险程度对后向碰撞的影响,建立重型营运车辆的后向防撞驾驶决策模型,采用PPO算法建立后向防撞驾驶决策模型,通过与目标车辆运动随机过程模型进行交互式迭代学习,得到后向防撞的最优决策,具体包括以下4个子步骤:
子步骤1:定义后向防撞驾驶决策模型的基础参数
首先,将后向防撞驾驶决策问题描述为一定奖励函数下的马尔科夫决策过程(S,A,P,r),其中,S为状态空间,A为后向防撞动作决策,P表示由于目标车辆运动不确定性而导致的状态转移概率,r为奖励函数;其次,对马尔科夫决策过程的基础参数进行定义,具体地:
(1)定义状态空间
利用步骤一输出的车辆运动状态信息和步骤二输出的后向碰撞危险程度,建立状态空间表达:
St=(vF_lon,aF_lon,vr_lon,ar_lonstr,pthr,Lrw,Tm) (3)
式(3)中,St为t时刻的状态空间,vF_lon,vr_lon分别表示重型营运车辆的纵向速度和两车的相对纵向速度,单位为米每秒,aF_lon,ar_lon分别表示重型营运车辆的纵向加速度和两车的相对纵向加速度,单位为米每二次方秒,θstr为车辆的方向盘转角,单位为度,pthr为节气门开度,单位为百分数,Lr为相对车间距,单位为米,δw,Tm分别表示后向碰撞危险程度和目标车辆类型,m=1,2,3分别表示目标车辆为大型车辆、中型车辆和小型车辆,在本发明中,取Tm=m;
(2)定义动作决策
为了综合考虑横向运动和纵向运动对后向碰撞的影响,本发明将方向盘转角和节气门开度作为控制量,定义决策模型输出的驾驶策略,即动作决策:
At=[θstr_out,pthr_out] (4)
式(4)中,At为t时刻的动作决策,θstr_out表示归一化后的方向盘转角控制量,范围为[-1,1],pthr_out表示归一化后的节气门开度控制量,范围为[0,1];当pthr_out=0时,表示车辆未进行加速,当δbrake=1时,表示车辆以最大加速度进行加速;
(3)建立奖励函数
为了评价动作决策的优劣程度,通过建立回报函数的方式,将评价具体化和数值化;考虑到后向防撞驾驶决策是一个涉及安全性、舒适性等目标在内的多目标优化问题,本发明将奖励函数设计为:
rt=r1+r2+r3 (5)
式(5)中,rt为t时刻的奖励函数,r1为安全距离奖励函数,r2为舒适性奖励函数,r3为惩罚函数;
首先,设计安全距离奖励函数r1
Figure FDA0002846912970000021
式(6)中,Lr,Ls分别表示相对车间距和安全距离阈值,ωd为安全距离权重系数,在本发明中,取ωd=0.85;
其次,设计舒适性奖励函数r2
r2=ωj|aF_lon(t+1)-aF_lon(t)| (7)
式(7)中,ωj为舒适性权重系数,在本发明中,取ωj=0.95;
最后,设计惩罚函数r3
Figure FDA0002846912970000031
(4)设计期望最大的策略
Figure FDA0002846912970000032
式(9)中,π*为期望最大的策略,π为后向防撞决策策略,γ为折扣因子,且γ∈(0,1),τ(π)表示在策略π下的轨迹分布;
子步骤2:设计后向防撞驾驶决策模型的网络架构
利用“Actor-Critic”网络框架搭建后向防撞驾驶决策网络,包括Actor网络和Critic网络两部分;其中,Actor网络将状态空间信息作为输入,输出动作决策,即重型营运车辆的节气门开度和方向盘转角控制量;Critic网络将状态空间信息和动作决策作为输入,输出当前“状态-动作”的价值;具体地:
(1)设计Actor网络
建立分层级编码器结构,分别对状态空间中的各类信息进行特征提取;首先,构建3个串行连接的卷积层(CF1,CF2,CF3)和1个最大池化层(P1),对车辆的运动状态信息(纵向速度、纵向加速度、方向盘转角、节气门开度)进行特征提取,并将其编码为中间特征向量h1;利用相同的结构,即3个串行连接的卷积层(CR1,CR2,CR3)和1个最大池化层(P2),对前后两车的相对运动状态信息(相对纵向速度、相对纵向加速度、相对车间距)进行特征提取,并将其编码为中间特征向量h2;利用卷积层CW1和最大池化层P3对碰撞危险程度和目标车辆类型进行特征提取,并将其编码为中间特征向量h3;其次,将特征h1,h2,h3结合并连接全连接层FC4和FC5,输出动作决策;
其中,设置卷积层CF1,CF2,CF3,CR1,CR2,CR3,CW1的神经元数量分别为20,20,10,20,20,10,20,设置全连接层FC4,FC5的神经元数量为200;各卷积层和全连接层的激活函数均为线性整流单元(Rectified Linear Unit,ReLU),其表达式为f(x)=max(0,x);
(2)设计Critic网络
利用多个隐藏层结构的神经网络建立Critic网络;首先,将状态空间St输入到隐藏层FCC1中;同时,将动作决策At输入到隐藏层FCC2中;其次,隐藏层FCC1和FCC2通过张量相加的方式进行合并;最后,依次通过全连接层FCC3和FCC4后,输出Critic网络的值;
其中,设置FCC1层和FCC2层的神经元数量为400,其余隐藏层的神经元数量均为200,各层的激活函数均为ReLU;
子步骤3:训练后向防撞驾驶决策模型
利用损失函数Jactor和Jcritic对网络参数进行梯度更新,具体训练过程如下:
子步骤3.1:初始化Actor网络和Critic网络;
子步骤3.2:进行迭代求解,每一次迭代包括子步骤3.21至子步骤3.4,具体地:
子步骤3.21:进行迭代求解,每一次迭代包括子步骤3.211至3.213,具体地:
子步骤3.211:利用步骤一的虚拟交通环境模型得到车辆的运动控制操作;
子步骤3.212:利用Actor网络得到样本数据(St,At,rt);
子步骤3.213:结束循环,得到样本点集[(S1,A1,r1),(S2,A2,r2),...,(St,At,rt)];
子步骤3.22:计算优势函数;
Figure FDA0002846912970000041
式(10)中,
Figure FDA0002846912970000042
为优势函数,V(St)表示状态St的值函数;
Figure FDA0002846912970000043
表示应该增加采取当前动作的可能性,
Figure FDA0002846912970000044
表示应该减小采取该动作的可能性;
子步骤3.23:进行迭代求解,每一次迭代包括子步骤3.231至3.233,具体地:
子步骤3.231:计算Actor网络的目标函数;
子步骤3.232:更新Actor网络参数Jactor
Figure FDA0002846912970000045
式(11)中,pt(θ)表示在策略更新过程中新策略πθ与旧策略πθ_old在动作决策分布上的比值,且
Figure FDA0002846912970000046
clip(·)表示裁剪函数,ε为常数,在本发明中,取ε=0.25;
子步骤3.233:更新Critic网络参数Jcritic
Figure FDA0002846912970000047
子步骤3.234:结束循环;
子步骤3.3:按照子步骤3.2提供的方法进行迭代更新,使Actor网络和Critic网络逐步收敛;在训练过程中,若车辆发生后向碰撞或侧翻,则终止当前回合并开始新的回合进行训练;当迭代达到最大步数或模型能够稳定准确地进行后向防撞驾驶决策时,训练结束;
子步骤4:利用后向防撞决策模型输出决策策略
将厘米级高精度差分GPS、惯性测量单元、毫米波雷达、CAN总线获取的信息输入到已训练的后向防撞驾驶决策模型中,可以定量输出合理的方向盘转角和节气门开度控制量,为驾驶员提供有效、可靠的后向防撞驾驶建议,从而实现了有效、可靠、具有自适应性的重型营运车辆后向防撞驾驶决策。
CN202011512719.5A 2020-12-20 2020-12-20 一种重型营运车辆的后向防撞驾驶决策方法 Active CN112633474B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202011512719.5A CN112633474B (zh) 2020-12-20 2020-12-20 一种重型营运车辆的后向防撞驾驶决策方法
PCT/CN2021/086570 WO2022126940A1 (zh) 2020-12-20 2021-04-12 一种重型营运车辆的后向防撞驾驶决策方法
US17/766,870 US11964655B2 (en) 2020-12-20 2021-04-12 Backward anti-collision driving decision-making method for heavy commercial vehicle

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011512719.5A CN112633474B (zh) 2020-12-20 2020-12-20 一种重型营运车辆的后向防撞驾驶决策方法

Publications (2)

Publication Number Publication Date
CN112633474A true CN112633474A (zh) 2021-04-09
CN112633474B CN112633474B (zh) 2022-04-05

Family

ID=75317728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011512719.5A Active CN112633474B (zh) 2020-12-20 2020-12-20 一种重型营运车辆的后向防撞驾驶决策方法

Country Status (3)

Country Link
US (1) US11964655B2 (zh)
CN (1) CN112633474B (zh)
WO (1) WO2022126940A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113460090A (zh) * 2021-08-18 2021-10-01 清华大学 自动驾驶车辆t型紧急避撞控制方法、系统、介质及设备
CN113954837A (zh) * 2021-11-06 2022-01-21 交通运输部公路科学研究所 一种基于深度学习的大型营运车辆车道变换决策方法
CN114379540A (zh) * 2022-02-21 2022-04-22 东南大学 考虑前方障碍物影响的大型营运车辆防侧翻驾驶决策方法
CN114407931A (zh) * 2022-02-21 2022-04-29 东南大学 一种高度类人的自动驾驶营运车辆安全驾驶决策方法
WO2022126940A1 (zh) * 2020-12-20 2022-06-23 东南大学 一种重型营运车辆的后向防撞驾驶决策方法
CN114863708A (zh) * 2022-05-09 2022-08-05 东南大学 一种面向营运车辆的道路合流区路侧实时精准诱导方法
CN115123159A (zh) * 2022-06-27 2022-09-30 重庆邮电大学 一种基于ddpg深度强化学习的aeb控制方法及系统
CN115291616A (zh) * 2022-07-25 2022-11-04 江苏海洋大学 一种基于近端策略优化算法的auv动态避障方法
CN116946162A (zh) * 2023-09-19 2023-10-27 东南大学 考虑路面附着条件的智能网联商用车安全驾驶决策方法
CN118163709A (zh) * 2024-05-15 2024-06-11 上海埃维汽车技术股份有限公司 一种汽车行驶途中后方来车预警方法及系统

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115273502B (zh) * 2022-07-28 2023-06-30 西安电子科技大学 一种交通信号协同控制方法
CN116823812B (zh) * 2023-08-25 2023-10-31 中国农业大学 一种青贮玉米田间生命检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103531042A (zh) * 2013-10-25 2014-01-22 吉林大学 基于驾驶人类型的车辆追尾预警方法
CN110969848A (zh) * 2019-11-26 2020-04-07 武汉理工大学 一种对向双车道下基于强化学习的自动驾驶超车决策方法
CN111238825A (zh) * 2020-01-10 2020-06-05 东南大学 面向组合试验路面的智能驾驶自动紧急制动性能测试方法
CN111696387A (zh) * 2020-05-21 2020-09-22 东南大学 一种基于前向障碍物识别的自适应防撞分级预警方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6690413B1 (en) * 1999-04-21 2004-02-10 Michael S. Moore Tractor-trailer viewing system
US6150932A (en) * 1999-10-04 2000-11-21 General Motors Corporation Vehicle operator alert process
JP4055656B2 (ja) * 2003-05-30 2008-03-05 トヨタ自動車株式会社 衝突予測装置
US8812226B2 (en) * 2009-01-26 2014-08-19 GM Global Technology Operations LLC Multiobject fusion module for collision preparation system
WO2018011953A1 (ja) * 2016-07-14 2018-01-18 ギガフォトン株式会社 光学素子角度調整装置及び極端紫外光生成装置
CN108725440B (zh) * 2018-04-20 2020-11-27 深圳市商汤科技有限公司 前向碰撞控制方法和装置、电子设备、程序和介质
CN108583571A (zh) * 2018-04-28 2018-09-28 深圳市商汤科技有限公司 碰撞控制方法及装置、电子设备和存储介质
US10919543B2 (en) 2019-01-30 2021-02-16 StradVision, Inc. Learning method and learning device for determining whether to switch mode of vehicle from manual driving mode to autonomous driving mode by performing trajectory-based behavior analysis on recent driving route
US11242050B2 (en) * 2019-01-31 2022-02-08 Honda Motor Co., Ltd. Reinforcement learning with scene decomposition for navigating complex environments
CN110027553B (zh) * 2019-04-10 2020-10-23 湖南大学 一种基于深度强化学习的防碰撞控制方法
EP4254122A3 (en) * 2019-10-01 2024-02-14 Elektrobit Automotive GmbH Deep learning based motion control of a vehicle
KR20220051070A (ko) * 2020-10-16 2022-04-26 현대자동차주식회사 교차로에서 자율주행차의 좌우회전 시 차량 제어 방법
KR20220081521A (ko) * 2020-12-09 2022-06-16 현대자동차주식회사 도로형상분류 기반 맵 매칭을 통한 고정밀 위치추정 방법 및 자율주행 자동차
CN112633474B (zh) 2020-12-20 2022-04-05 东南大学 一种重型营运车辆的后向防撞驾驶决策方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103531042A (zh) * 2013-10-25 2014-01-22 吉林大学 基于驾驶人类型的车辆追尾预警方法
CN110969848A (zh) * 2019-11-26 2020-04-07 武汉理工大学 一种对向双车道下基于强化学习的自动驾驶超车决策方法
CN111238825A (zh) * 2020-01-10 2020-06-05 东南大学 面向组合试验路面的智能驾驶自动紧急制动性能测试方法
CN111696387A (zh) * 2020-05-21 2020-09-22 东南大学 一种基于前向障碍物识别的自适应防撞分级预警方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张华强: "车辆主动性防撞专利技术综述", 《汽车零部件》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022126940A1 (zh) * 2020-12-20 2022-06-23 东南大学 一种重型营运车辆的后向防撞驾驶决策方法
US11964655B2 (en) 2020-12-20 2024-04-23 Southeast University Backward anti-collision driving decision-making method for heavy commercial vehicle
CN113460090B (zh) * 2021-08-18 2023-09-12 清华大学 自动驾驶车辆t型紧急避撞控制方法、系统、介质及设备
CN113460090A (zh) * 2021-08-18 2021-10-01 清华大学 自动驾驶车辆t型紧急避撞控制方法、系统、介质及设备
CN113954837B (zh) * 2021-11-06 2023-03-14 交通运输部公路科学研究所 一种基于深度学习的大型营运车辆车道变换决策方法
CN113954837A (zh) * 2021-11-06 2022-01-21 交通运输部公路科学研究所 一种基于深度学习的大型营运车辆车道变换决策方法
CN114407931A (zh) * 2022-02-21 2022-04-29 东南大学 一种高度类人的自动驾驶营运车辆安全驾驶决策方法
WO2023155231A1 (zh) * 2022-02-21 2023-08-24 东南大学 一种高度类人的自动驾驶营运车辆安全驾驶决策方法
CN114379540A (zh) * 2022-02-21 2022-04-22 东南大学 考虑前方障碍物影响的大型营运车辆防侧翻驾驶决策方法
CN114379540B (zh) * 2022-02-21 2024-04-30 东南大学 考虑前方障碍物影响的大型营运车辆防侧翻驾驶决策方法
CN114407931B (zh) * 2022-02-21 2024-05-03 东南大学 一种高度类人的自动驾驶营运车辆安全驾驶决策方法
CN114863708A (zh) * 2022-05-09 2022-08-05 东南大学 一种面向营运车辆的道路合流区路侧实时精准诱导方法
CN115123159A (zh) * 2022-06-27 2022-09-30 重庆邮电大学 一种基于ddpg深度强化学习的aeb控制方法及系统
CN115291616A (zh) * 2022-07-25 2022-11-04 江苏海洋大学 一种基于近端策略优化算法的auv动态避障方法
CN116946162A (zh) * 2023-09-19 2023-10-27 东南大学 考虑路面附着条件的智能网联商用车安全驾驶决策方法
CN116946162B (zh) * 2023-09-19 2023-12-15 东南大学 考虑路面附着条件的智能网联商用车安全驾驶决策方法
CN118163709A (zh) * 2024-05-15 2024-06-11 上海埃维汽车技术股份有限公司 一种汽车行驶途中后方来车预警方法及系统

Also Published As

Publication number Publication date
WO2022126940A1 (zh) 2022-06-23
CN112633474B (zh) 2022-04-05
US11964655B2 (en) 2024-04-23
US20230182725A1 (en) 2023-06-15

Similar Documents

Publication Publication Date Title
CN112633474B (zh) 一种重型营运车辆的后向防撞驾驶决策方法
CN112622886B (zh) 一种综合考虑前后障碍物的重型营运车辆防碰撞预警方法
CN111780981B (zh) 一种智能车辆编队变道性能测评方法
CN112580148B (zh) 基于深度强化学习的重型营运车辆防侧翻驾驶决策方法
CN110992695B (zh) 基于冲突消解的车辆城市交叉口通行决策多目标优化方法
CN111273668B (zh) 针对结构化道路的无人驾驶汽车运动轨迹规划系统及方法
CN113753026B (zh) 一种考虑路面附着条件的大型营运车辆防侧翻决策方法
CN114407931A (zh) 一种高度类人的自动驾驶营运车辆安全驾驶决策方法
CN113954837B (zh) 一种基于深度学习的大型营运车辆车道变换决策方法
CN114379540B (zh) 考虑前方障碍物影响的大型营运车辆防侧翻驾驶决策方法
CN113753034B (zh) 一种考虑路面附着条件的大型营运车辆防碰撞决策方法
CN113071490A (zh) 一种高速公路卡车编队系统
Zheng et al. Research on control target of truck platoon based on maximizing fuel saving rate
D'Amato et al. Development of a cruise controller based on current road load information with integrated control of variable velocity set-point and gear shifting
CN117141489B (zh) 一种基于最小作用量原理的智能车辆轨迹分层规划方法
Lin et al. Adaptive prediction-based control for an ecological cruise control system on curved and hilly roads
Bakibillah et al. Eco-driving on hilly roads using model predictive control
Lian et al. Multiagent deep reinforcement learning for automated truck platooning control
CN115131963A (zh) 一种基于激光雷达和毫米波雷达的矿车雷达协同方法、系统、装置及介质
Kanellakopoulos et al. Commercial trucks and buses in automated highway systems
Guo et al. Research on integrated decision control algorithm for autonomous vehicles under multi-task hybrid constraints in intelligent transportation scenarios
Zhu et al. A new driving condition identification method for heavy duty vehicles based on HHMM
Bentaleb et al. Enhanced energy efficiency of two-layer control approach for connected vehicles
Bostanian Fuzzy-GSA based control approach for developing adaptive cruise control
CN114407902B (zh) 一种基于道路水层深度估计的驾驶决策的系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant