CN108944930B - 一种基于lstm的模拟驾驶员特性的自动跟车方法及系统 - Google Patents
一种基于lstm的模拟驾驶员特性的自动跟车方法及系统 Download PDFInfo
- Publication number
- CN108944930B CN108944930B CN201810730555.XA CN201810730555A CN108944930B CN 108944930 B CN108944930 B CN 108944930B CN 201810730555 A CN201810730555 A CN 201810730555A CN 108944930 B CN108944930 B CN 108944930B
- Authority
- CN
- China
- Prior art keywords
- vehicle
- data
- input
- layer
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000008569 process Effects 0.000 claims abstract description 18
- 238000013528 artificial neural network Methods 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims description 69
- 238000012549 training Methods 0.000 claims description 68
- 230000001133 acceleration Effects 0.000 claims description 29
- 210000002569 neuron Anatomy 0.000 claims description 26
- 238000004364 calculation method Methods 0.000 claims description 20
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 12
- 230000006399 behavior Effects 0.000 claims description 9
- 210000004027 cell Anatomy 0.000 claims description 8
- 230000015654 memory Effects 0.000 claims description 8
- 230000007246 mechanism Effects 0.000 claims description 6
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 2
- 238000012216 screening Methods 0.000 claims description 2
- 230000006403 short-term memory Effects 0.000 claims description 2
- 230000007787 long-term memory Effects 0.000 claims 1
- 230000000306 recurrent effect Effects 0.000 abstract description 4
- 241000282414 Homo sapiens Species 0.000 abstract description 3
- 230000006978 adaptation Effects 0.000 abstract description 2
- 238000013507 mapping Methods 0.000 abstract description 2
- 238000003062 neural network model Methods 0.000 abstract description 2
- 238000012545 processing Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W30/00—Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
- B60W30/14—Adaptive cruise control
- B60W30/16—Control of distance between vehicles, e.g. keeping a distance to preceding vehicle
- B60W30/165—Automatically following the path of a preceding lead vehicle, e.g. "electronic tow-bar"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2520/00—Input parameters relating to overall vehicle dynamics
- B60W2520/10—Longitudinal speed
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2520/00—Input parameters relating to overall vehicle dynamics
- B60W2520/10—Longitudinal speed
- B60W2520/105—Longitudinal acceleration
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2554/00—Input parameters relating to objects
- B60W2554/80—Spatial relation or speed relative to objects
- B60W2554/801—Lateral distance
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2554/00—Input parameters relating to objects
- B60W2554/80—Spatial relation or speed relative to objects
- B60W2554/804—Relative longitudinal speed
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Automation & Control Theory (AREA)
- Transportation (AREA)
- Mechanical Engineering (AREA)
- Traffic Control Systems (AREA)
- Control Of Driving Devices And Active Controlling Of Vehicle (AREA)
Abstract
本发明提供一种基于LSTM的模拟驾驶员特性的自动跟车方法及系统,本发明引入LSTM循环神经网络模型,该模型应用优秀驾驶员稳态跟车过程中所采集的传感器信息时序数据和自车行驶时序数据等,对驾驶员跟车驾驶行为特征进行学习,建立起非线性输入输出映射关系知识库,进而预测车辆在跟车行驶过程中的纵向操作控制,实现系统对驾驶员特性的自动适应。本发明利用LSTM循环神经网络善于处理时序特征数据的特性来模拟驾驶员跟车行为特性,所设计的控制器输出在满足安全性、准确性以及舒适性的前提下更符合人类的驾驶行为特性,同时能够有效实现对驾驶员操作过程特性的自学习,实现了系统对驾驶员特性的自适应,具有普遍适用范围。
Description
技术领域
本发明属于智能驾驶技术领域,具体涉及一种基于LSTM的模拟驾驶员特性的自动跟车方法及系统。
背景技术
自动驾驶分为两个阶段,高级驾驶辅助阶段和自动驾驶阶段,高级驾驶辅助系统是自动驾驶的基础,虽然自动驾驶的发展如火如荼,但是目前市场量产车上搭载的大多还是高级驾驶辅助系统。自动跟车系统属于自适应巡航系统的重要组成部分之一,也是车辆高级辅助驾驶系统的必不可少的功能。
现有此类系统基于视觉或雷达传感系统输出自身车辆与前方车辆的距离和相对运动信息,控制自身车辆车速以实现与前方车辆的距离保持或车速保持。但是由于驾驶员跟车动作是个连续过程,目前已有的自动跟车系统基本都是采用单帧传感数据作为控制模型的考量因素,并未考虑数据时序特征的影响,因此设计出的控制系统并不能很好的模拟驾驶员的跟车行为。同时由于驾驶员个体之间的驾驶风格、行为趋向以及安全需求都存在很大的差异,目前已有的自动跟车系统基本都采用较为固定的控制策略,这种采用固定参数的跟车系统也难以保证不同驾驶员的适应性。
发明内容
为了解决现有技术中存在的上述技术问题,本发明提供一种基于LSTM(LongShort-Term Memory,长短期记忆网络)模型的模拟驾驶员特性的自动跟车方法及系统。本发明引入LSTM循环神经网络模型,该模型应用优秀驾驶员稳态跟车过程中所采集的传感器信息时序数据和自车行驶时序数据等,对驾驶员跟车驾驶行为特征进行学习,建立起非线性输入输出映射关系知识库,进而预测车辆在跟车行驶过程中的纵向操作控制,实现系统对驾驶员特性的自动适应。
本发明是通过以下技术方案实现的:
一种基于LSTM的模拟驾驶员特性的自动跟车方法,用于控制目标车辆自身车速以实现目标车辆与前方车辆的距离保持或车速保持;包括以下步骤:
步骤S101,根据不同地点、天气下采集的驾驶训练数据建立训练样本库;所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据;所述输入特征数据包括自车车速、前车车速、自车加速度、车间距,所述驾驶操纵数据包括油门踏板和制动踏板传感数据。
步骤S102,建立LSTM网络模型;所述LSTM网络模型包括1个输入层、2个隐藏层、1个输出层;其中:
输入层:定义输入向量Xt为4维向量,其中的4个元素分别表示车间距、自车车速与前车车速、以及自车加速度;将所有输入向量按时间序列展开;其中,所述输入向量Xt是指时间t处的输入。
第一隐藏层:设置为全连接层,包括32个神经元;所述第一隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元。
第二隐藏层:设置为全连接层,包括41个神经元;所述第二隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元。
输出层:设置为softmax分类器;输出向量Ot由当前时间t及之前部分记忆共同计算得到,对应离散纵向车辆操作向量;输出向量Ot中的车辆操作信息为41维向量,分别对应目标车辆的油门与制动踏板的操作状态,其中第1-20个元素表示油门操作,分别对应不同的油门踏板开度;第21个元素表示无操作;第22-41个元素表示制动操作,分别对应不同的制动踏板开度。
步骤S103,根据训练样本对所述LSTM网络模型进行离线训练;所述离线训练的过程具体包括:
步骤S1031,设置所述LSTM网络模型的超参数,所述超参数包括批量样本大小n、学习速率lr、权重衰退系数λ。
步骤S1032,从所述训练样本库中获取所需的样本数据,并将获取的样本数据生成批量样本;将所述批量样本进行批规范化,获得批规范样本;将所述批规范样本输入到所述LSTM网络模型进行前向传导运算。
步骤S1033,采用基于时间反向传播算法计算损失函数对参数的偏导,并用小批量梯度下降算法对损失求最优化解来更新并优化网络权重和偏置参数,直至预设的循环迭代次数完成或者达到预设的预测准确率,根据优化后神经网络权重和偏置参数完成对所述LSTM网络模型的训练;其中,损失计算公式如公式(1)所示:
公式(1)中,Si为t时刻所述输出层的输出向量Ot中第i个元素的值,yi为对应的实际驾驶操纵数据中第i个的值,λ为权重衰退系数,n为批量样本大小,w为网络中的权重。
步骤S104,将实时车况数据输入所述LSTM网络模型进行计算,输出对应的车辆操纵信号,实现自动跟车。
一种基于LSTM的模拟驾驶员特性的自动跟车系统,包括环境感知模块、训练样本库模块、自动跟车控制算法模块以及下位机执行模块;其中:
所述环境感知模块包括:车速传感器、加速度传感器和雷达系统模块;所述车速传感器用于实时获取目标车辆的自车车速v1,所述加速度传感器模块用于实时获取目标车辆的自车加速度a,所述雷达系统模块用于实时获取前车车速v2以及目标车辆与前方车辆之间的车间距s。
所述训练样本库模块用于根据不同地点、天气下采集的驾驶训练数据建立训练样本库;所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据;所述输入特征数据包括自车车速、前车车速、自车加速度、车间距,所述驾驶操纵数据包括油门踏板和制动踏板传感数据。
所述自动跟车控制算法模块用于建立LSTM网络模型,对所述LSTM网络模型进行离线训练和在线微调,并将所述环境感知模块采集的实时车况数据输入所述LSTM网络模型进行计算,输出车辆操纵信号;所述LSTM网络模型包括1个输入层、2个隐藏层、1个输出层;其中:
输入层:定义输入向量Xt为4维向量,其中的4个元素分别表示车间距、自车车速与前车车速、以及自车加速度;将所有输入向量按时间序列展开;其中,所述输入向量Xt是指时间t处的输入。
第一隐藏层:设置为全连接层,包括32个神经元;所述第一隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元。
第二隐藏层:设置为全连接层,包括41个神经元;所述第二隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元。
输出层:设置为softmax分类器;输出向量Ot由当前时间t及之前部分记忆共同计算得到,对应离散纵向车辆操作向量;输出向量Ot中的车辆操作信息为41维向量,分别对应目标车辆的油门与制动踏板的操作状态,其中第1-20个元素表示油门操作,第21个元素表示无操作,第22-41个元素表示制动操作。
所述下位机执行模块用于执行所述车辆操纵信号,实现自动跟车。
本发明相对于现有技术的有益效果在于:
(1)本发明利用LSTM循环神经网络善于处理时序特征数据的特性来模拟驾驶员跟车行为特性,考虑到了驾驶员跟车行为的时序特性,所设计的控制器输出在满足安全性、准确性以及舒适性的前提下更符合人类的驾驶行为特性;同时在实际操作只需通过不同驾驶员的实时行驶数据在线微调神经网络参数,能够有效实现对跟车过程中驾驶员操作特性的自学习,实现了系统对驾驶员特性的自适应,具有普遍适用范围。
(2)本发明中将车辆自身加速度作为输入特征之一,即将加速度作为考量因素,考虑了跟车过程中的乘坐舒适性,使得整个跟车控制过程更为平顺。
附图说明
图1是本发明基于LSTM的模拟驾驶员特性的自动跟车方法的流程示意图。
图2是本发明引入的LSTM网络模型的结构示意图。
图3是本发明基于LSTM的模拟驾驶员特性的自动跟车系统的结构示意图。
图4是本发明LSTM网络内部结构示意图。
图5是采用本发明基于LSTM的模拟驾驶员特性的自动跟车方法的实车实验结果图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
实施例1:
如图1所示,本实施例提供一种基于LSTM的模拟驾驶员特性的自动跟车方法,用于控制目标车辆自身车速以实现目标车辆与前方车辆的距离保持或车速保持;包括以下步骤:
步骤S101,根据不同地点、天气下采集的驾驶训练数据建立训练样本库;所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据;所述输入特征数据包括自车车速、前车车速、自车加速度、车间距,所述驾驶操纵数据包括油门踏板和制动踏板传感数据。在实际应用中,可以利用实验车辆采集真实的城市道路环境下驾驶训练数据。将采集到的上述经验数据作为后续对LSTM网络模型进行训练的训练样本。步骤S101训练样本库的具体建立方式有很多,本实施例给出一种具体实例,进一步包括以下步骤:
步骤S1011,在不同地点、天气下,用实验车辆采集城市道路环境下驾驶训练数据;所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据,所述输入特征数据包括自车车速、前车车速、自车加速度、车间距,所述驾驶操纵数据包括油门踏板和制动踏板传感数据。
步骤S1012,将输入特征数据与对应的驾驶操纵数据进行同步。
步骤S1013,筛选跟车操作部分的数据,离散化数据,生成数据样本,形成训练数据集和测试数据集,完成训练样本库的建立。
步骤S102,建立LSTM网络模型;所述LSTM网络模型的具体结构如图2所示,包括1个输入层、2个隐藏层、1个输出层;其中:
输入层:定义输入向量Xt为4维向量,其中的4个元素分别表示车间距、自车车速与前车车速、以及自车加速度;将所有输入向量按时间序列展开。时序持续长度可以根据实际情况进行选取,在本实施例中取时序持续长度128,此取值仅为举例说明,时序持续长度的取值没有具体要求,根据硬件配置可以选用不同的取值。其中,所述输入向量Xt是指时间t处的输入。
第一隐藏层:设置为全连接层,包括32个神经元;所述第一隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元。丢弃参数设置为0.5,即随机丢弃该层50%神经元权重系数。
第二隐藏层:设置为全连接层,包括41个神经元;所述第二隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元。丢弃参数设置为0.5,即随机丢弃该层50%神经元权重系数。
输出层:设置为softmax分类器;输出向量Ot由当前时间t及之前部分记忆共同计算得到,对应离散纵向车辆操作向量;输出向量Ot中的车辆操作信息为41维向量,分别对应目标车辆的油门与制动踏板的操作状态,其中第1-20个元素表示油门操作,分别对应不同的油门踏板开度;第21个元素表示无操作;第22-41个元素表示制动操作,分别对应不同的制动踏板开度。
作为一种优选方案,如图4所示,LSTM内部结构包括Cell单元以及三个门控单元结构,三个门控单元分别为遗忘门单元(Forget Gate)、外部输入门单元(Input Gate)、输出门单元(Output Gate)。因此前向传导运算公式如下:
ft=σ(Wf.[ut-1,xt]+bf) (2)
it=σ(Wi·[ut-1,xt]+bi) (3)
公式(3)中,it为输入门的输出,xt为网络输入,Wi和bi为输入门的权重和偏置。
公式(5)中,Ct为当前时刻最终Cell状态,Ct-1为上一个序列的Cell状态。
ut=σ(Wo·[ut-1,xt]+b0) (6)
公式(6)中,ut为输入到下一个时间序列的隐藏状态,Wo和b0为输出门的权重和偏置。
Ot=ut*tanh(Ct) (7)
公式(7)中,Ot为经前向传导运算后得到的输出。
步骤S103,根据训练样本对所述LSTM网络模型进行离线训练;所述离线训练的过程具体包括:
步骤S1031,设置所述LSTM网络模型的超参数,所述超参数包括批量样本大小n、学习速率lr、权重衰退系数λ。其中批量样本n可取用的最大值由内存上限决定,学习速率lr决定收敛速率,权重衰退系数λ防止过拟合。
步骤S1032,从所述训练样本库中获取所需的训练样本数据,并将获取的样本数据生成批量样本;将所述批量样本进行批规范化(Batch Normalization),获得批规范样本;将所述批规范样本输入到所述LSTM网络模型进行前向传导运算得到预测的输出值,具体运算过程参见公式(2)到公式(7)。
步骤S1033,采用基于时间反向传播算法(BPTT)计算损失函数对参数(整个网络的权重和偏置)的偏导,并用小批量梯度下降算法对损失求最优化解来更新并优化网络权重和偏置参数,直至预设的循环迭代次数完成或者达到预设的预测准确率,根据优化后神经网络权重和偏置参数完成对所述LSTM网络模型的训练;其中,损失计算公式如公式(1)所示:
公式(1)中,Si为t时刻所述输出层的输出向量Ot中第i个元素的值,yi为对应的实际驾驶操纵数据中第i个的值,λ为权重衰退系数,n为批量样本大小,w为网络中的权重。
上述公式(1)的推导过程如下:
softmax交叉熵损失计算公式如公式(8):
C0=-ΣiSilog(yi) (8)
其中,Si为t时刻该softmax层输出向量中第i个元素的值,yi为对应的实际样本标签中第i个的值。
为了防止过拟合,提高泛化能力,引入L2正则化,所以总的损失函数计算公式如公式(9)所示:
其中,λ为权重衰退系数,w为网络中的权重。
根据优化后神经网络权重和偏置参数完成对LSTM网络的训练。本步骤中小批量梯度下降方法即在每个循环内更新每一参数时都使用一部分样本来更新。
为了进一步提高自动跟车的效果,作为进一步优化的技术方案,在本实施例中,在对LSTM网络模型进行离线训练之后,可以进一步利用实时采集的驾驶训练数据对LSTM网络模型进行在线微调,具体步骤如下:
步骤S201,根据驾驶员驾驶行为对训练后LSTM网络进行在线微调;具体包括:
步骤S2041,实时采集所述驾驶训练数据,生成在线数据样本。这里的驾驶训练数据的定义和类型与步骤S103中离线训练使用的训练样本中的驾驶训练数据一致,区别在于本步骤中的驾驶训练数据是实时采集的驾驶训练数据,而步骤S103中的驾驶训练数据来源于预先建立的训练样本库。
步骤S2042,设置所述LSTM网络模型的超参数,将在线数据样本输入至训练后的LSTM网络中进行前向传导运算(与步骤S1032中的前向传导运算相同,见公式(2)至公式(7))。
步骤S2043,采用基于小批量梯度下降方法对损失求最优化解来更新和优化神经网络权重和偏置参数,直至设定的循环迭代次数完成,根据优化后神经网络权重和偏置参数完成对所述LSTM网络模型的微调;其中,损失计算公式如公式(1)所示:
本步骤根据驾驶员在线驾驶数据对LSTM网络进行微调,根据驾驶员的驾驶习惯微调全连接层参数,从而使得输出的车辆操作信息更加满足个人驾驶习惯。
步骤S104,将实时车况数据输入所述LSTM网络模型进行计算,输出对应的车辆操纵信号,实现自动跟车。
实时车况数据输入所述LSTM网络模型进行计算的过程如下,步骤S104进一步包括以下步骤:
步骤S1041,采集实时车况数据,所述实时车况数据包括:车间距、自车车速与前车车速、以及自车加速度。
步骤S1042,将所述实时车况数据经预处理后输入所述LSTM网络模型进行前向传导运算。
步骤S1043,将所述LSTM网络模型的输出向量Ot中的最大元素所在位置对应到车辆相应的操作状态,获得输出向量Ot所对应的车辆油门踏板或制动踏板开度。
步骤S1044,将所述输出向量Ot对应的油门踏板或制动踏板开度转化为当前时刻t的车辆控制信号,发送给对应的底层执行机构,所述底层执行机构根据所述车辆控制信号对车辆进行操纵,实现自动跟车。
所述底层执行机构,即下位机执行模块,具体将车辆控制信号发送给车辆整车控制器,从而由车辆整车控制器进一步控制电机和制动机构,以实现车辆的加速和减速。
实施例2:
如图3所示,一种基于LSTM的模拟驾驶员特性的自动跟车系统,包括环境感知模块1、训练样本库模块2、自动跟车控制算法模块3以及下位机执行模块4;其中:
所述环境感知模块1包括:车速传感器子模块11、加速度传感器子模块12和雷达系统子模块13;所述车速传感器子模块11(具体可选用霍尔齿轮转速传感器SC12-20K)用于实时获取目标车辆的自车车速v1,所述加速度传感器子模块12(具体可选用Xsens MTI-G-710惯性元件)用于实时获取目标车辆的自车加速度a,所述雷达系统子模块13(具体可选用IBEO LUX4L激光雷达)用于实时获取前车车速v2以及目标车辆与前方车辆之间的车间距s。
所述训练样本库模块2用于根据不同地点、天气下采集的驾驶训练数据建立训练样本库;所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据;所述输入特征数据包括自车车速、前车车速、自车加速度、车间距,所述驾驶操纵数据包括油门踏板和制动踏板传感数据。
所述自动跟车控制算法模块3用于建立LSTM网络模型,对所述LSTM网络模型进行离线训练和在线微调,并将所述环境感知模块采集的实时车况数据输入所述LSTM网络模型进行计算,输出车辆操纵信号;所述LSTM网络模型包括1个输入层、2个隐藏层、1个输出层;其中:
输入层:定义输入向量Xt为4维向量,其中的4个元素分别表示车间距、自车车速与前车车速、以及自车加速度;将所有输入向量按时间序列展开;其中,所述输入向量Xt是指时间t处的输入。
第一隐藏层:设置为全连接层,包括32个神经元;所述第一隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元。
第二隐藏层:设置为全连接层,包括41个神经元;所述第二隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元。
输出层:设置为softmax分类器;输出向量Ot由当前时间t及之前部分记忆共同计算得到,对应离散纵向车辆操作向量;输出向量Ot中的车辆操作信息为41维向量,分别对应目标车辆的油门与制动踏板的操作状态,其中第1-20个元素表示油门操作,第21个元素表示无操作,第22-41个元素表示制动操作。
所述下位机执行模块4用于执行所述车辆操纵信号,实现自动跟车。
本实施例提供的系统是与实施例1的自动跟车方法相对应的自动跟车系统,其相应的工作原理和工作流程与实施例1基本相同,在此不再赘述。
为了全面准确地评估本发明所提出方法的性能,进行自动跟车实车实验。本实验设计了两段跟车过程,分别模拟跟随前车加速-减速行驶工况以及跟随前车的起停工况。实验结果如图5所示,从结果可得出,本发明设计的自动跟车系统能够实现跟随前车的功能,并且跟随前车过程中,能够实现跟随前车匀速、加速、减速和起停行驶;而且在稳定跟车过程中,目标距离和实际距离之间的偏差在1m左右,整个跟车过程没有抖动,符合人类的驾驶行为特性,满足安全性和舒适性要求,同时也满足响应时间和精度的要求。综上所示,本发明提出的一种基于LSTM的模拟驾驶员特性的自动跟车系统能充分利用优秀驾驶员的历史操纵信息,并结合实时预处理得到的时序特征输入序列,预测出保证安全性、准确性以及舒适性等多目标的车辆操纵信息。基于实车实验测试,证明了本发明在保证可靠性和安全性的基础上,能很好地模拟驾驶员的驾驶操纵行为,实现自动跟车。
本领域的技术人员容易理解,以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于LSTM的模拟驾驶员特性的自动跟车方法,用于控制目标车辆自身车速以实现目标车辆与前方车辆的距离保持或车速保持;其中,所述LSTM是指长短期记忆网络;其特征在于,所述自动跟车方法包括以下步骤:
步骤S101,根据不同地点、天气下采集的驾驶训练数据建立训练样本库;所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据;所述输入特征数据包括自车车速、前车车速、自车加速度、车间距,所述驾驶操纵数据包括油门踏板和制动踏板传感器数据;
步骤S102,建立LSTM网络模型;所述LSTM网络模型包括1个输入层、2个隐藏层、1个输出层;其中:
输入层:定义输入向量Xt为4维向量,其中的4个元素分别表示车间距、自车车速与前车车速、以及自车加速度;将所有输入向量按时间序列展开;其中,所述输入向量Xt是指时间t处的输入;
第一隐藏层:设置为全连接层,包括32个神经元;所述第一隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元;
第二隐藏层:设置为全连接层,包括41个神经元;所述第二隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元;
输出层:设置为softmax分类器;输出向量Ot由当前时间t及之前部分记忆共同计算得到,对应离散纵向车辆操作向量;输出向量Ot中的车辆操作信息为41维向量,分别对应目标车辆的油门与制动踏板的操作状态,其中第1-20个元素表示油门操作,分别对应不同的油门踏板开度;第21个元素表示无操作;第22-41个元素表示制动操作,分别对应不同的制动踏板开度;
步骤S103,根据训练样本对所述LSTM网络模型进行离线训练;所述离线训练的过程具体包括:
步骤S1031,设置所述LSTM网络模型的超参数,所述超参数包括批量样本大小n、学习速率lr、权重衰退系数λ;
步骤S1032,从所述训练样本库中获取所需的样本数据,并将获取的样本数据生成批量样本;将所述批量样本进行批规范化,获得批规范样本;将所述批规范样本输入到所述LSTM网络模型进行前向传导运算;
步骤S1033,采用基于时间反向传播算法计算损失函数对参数的偏导,并用小批量梯度下降算法对损失求最优化解来更新并优化网络权重和偏置参数,直至预设的循环迭代次数完成或者达到预设的预测准确率,根据优化后神经网络权重和偏置参数完成对所述LSTM网络模型的训练;其中,损失计算公式如公式(1)所示:
公式(1)中,Si为t时刻所述输出层的输出向量Ot中第i个元素的值,yi为对应的实际驾驶操纵数据中第i个的值,λ为权重衰退系数,n为批量样本大小,w为网络中的权重;
步骤S104,将实时车况数据输入所述LSTM网络模型进行计算,输出对应的车辆操纵信号,实现自动跟车。
3.根据权利要求1所述的自动跟车方法,其特征在于,所述步骤S104进一步包括以下步骤:
步骤S1041,采集实时车况数据,所述实时车况数据包括:车间距、自车车速与前车车速、以及自车加速度;
步骤S1042,将所述实时车况数据经预处理后输入所述LSTM网络模型进行前向传导运算;
步骤S1043,将所述LSTM网络模型的输出向量Ot中的最大元素所在位置对应到车辆相应的操作状态,获得输出向量Ot所对应的车辆油门踏板或制动踏板开度;
步骤S1044,将所述输出向量Ot对应的油门踏板或制动踏板开度转化为当前时刻t的车辆控制信号,发送给对应的底层执行机构,所述底层执行机构根据所述车辆控制信号对车辆进行操纵,实现自动跟车。
4.根据权利要求1所述的自动跟车方法,其特征在于,所述步骤S101进一步包括以下步骤:
步骤S1011,在不同地点、天气下,用实验车辆采集城市道路环境下驾驶训练数据;所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据,所述输入特征数据包括自车车速、前车车速、自车加速度、车间距,所述驾驶操纵数据包括油门踏板和制动踏板传感数据;
步骤S1012,将输入特征数据与对应的驾驶操纵数据进行同步,
步骤S1013,筛选跟车操作部分的数据,离散化数据,生成数据样本,形成训练数据集和测试数据集,完成训练样本库的建立。
5.根据权利要求1所述的自动跟车方法,其特征在于,所述前向传导运算具体为:
LSTM内部结构包括Cell单元以及三个门控单元结构,三个门控单元分别为遗忘门单元、外部输入门单元、输出门单元;前向传导运算公式如下:
ft=σ(Wf.[ut-1,xt]+bf) (2)
it=σ(Wi.[ut-1,xt]+bi) (3)
公式(3)中,it为输入门的输出,xt为网络输入,Wi和bi为输入门的权重和偏置;
公式(5)中,Ct为当前时刻最终Cell状态,Ct-1为上一个序列的Cell状态;
ut=σ(Wo.[ut-1,xt]+b0) (6)
公式(6)中,ut为输入到下一个时间序列的隐藏状态,Wo和b0为输出门的权重和偏置;
Ot=ut*tanh(Ct) (7)
公式(7)中,Ot为经前向传导运算后得到的输出。
6.一种基于LSTM的模拟驾驶员特性的自动跟车系统,其中,所述LSTM是指长短期记忆网络;其特征在于,所述自动跟车系统包括环境感知模块、训练样本库模块、自动跟车控制算法模块以及下位机执行模块;其中:
所述环境感知模块包括:车速传感器、加速度传感器和雷达系统模块;所述车速传感器用于实时获取目标车辆的自车车速v1,所述加速度传感器模块用于实时获取目标车辆的自车加速度a,所述雷达系统模块用于实时获取前车车速v2以及目标车辆与前方车辆之间的车间距s;
所述训练样本库模块用于根据不同地点、天气下采集的驾驶训练数据建立训练样本库;所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据;所述输入特征数据包括自车车速、前车车速、自车加速度、车间距,所述驾驶操纵数据包括油门踏板和制动踏板传感数据;
所述自动跟车控制算法模块用于建立LSTM网络模型,对所述LSTM网络模型进行离线训练和在线微调,并将所述环境感知模块采集的实时车况数据输入所述LSTM网络模型进行计算,输出车辆操纵信号;所述LSTM网络模型包括1个输入层、2个隐藏层、1个输出层;其中:
输入层:定义输入向量Xt为4维向量,其中的4个元素分别表示车间距、自车车速与前车车速、以及自车加速度;将所有输入向量按时间序列展开;其中,所述输入向量Xt是指时间t处的输入;
第一隐藏层:设置为全连接层,包括32个神经元;所述第一隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元;
第二隐藏层:设置为全连接层,包括41个神经元;所述第二隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元;
输出层:设置为softmax分类器;输出向量Ot由当前时间t及之前部分记忆共同计算得到,对应离散纵向车辆操作向量;输出向量Ot中的车辆操作信息为41维向量,分别对应目标车辆的油门与制动踏板的操作状态,其中第1-20个元素表示油门操作,第21个元素表示无操作,第22-41个元素表示制动操作;
所述下位机执行模块用于执行所述车辆操纵信号,实现自动跟车。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810730555.XA CN108944930B (zh) | 2018-07-05 | 2018-07-05 | 一种基于lstm的模拟驾驶员特性的自动跟车方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810730555.XA CN108944930B (zh) | 2018-07-05 | 2018-07-05 | 一种基于lstm的模拟驾驶员特性的自动跟车方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108944930A CN108944930A (zh) | 2018-12-07 |
CN108944930B true CN108944930B (zh) | 2020-04-21 |
Family
ID=64485994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810730555.XA Active CN108944930B (zh) | 2018-07-05 | 2018-07-05 | 一种基于lstm的模拟驾驶员特性的自动跟车方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108944930B (zh) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7115276B2 (ja) * | 2018-12-10 | 2022-08-09 | トヨタ自動車株式会社 | 運転支援装置、ウェアラブル装置、運転支援システム、運転支援方法およびプログラム |
CN109927725B (zh) * | 2019-01-28 | 2020-11-03 | 吉林大学 | 一种具有驾驶风格学习能力的自适应巡航系统及实现方法 |
US11087175B2 (en) * | 2019-01-30 | 2021-08-10 | StradVision, Inc. | Learning method and learning device of recurrent neural network for autonomous driving safety check for changing driving mode between autonomous driving mode and manual driving mode, and testing method and testing device using them |
CN109878534B (zh) * | 2019-02-22 | 2021-05-04 | 初速度(苏州)科技有限公司 | 一种车辆的控制方法、模型的训练方法和装置 |
CN109795506B (zh) * | 2019-02-26 | 2021-04-02 | 百度在线网络技术(北京)有限公司 | 一种驾驶控制方法、装置及车辆 |
CN111738037B (zh) * | 2019-03-25 | 2024-03-08 | 广州汽车集团股份有限公司 | 一种自动驾驶方法及其系统、车辆 |
CN110188683B (zh) * | 2019-05-30 | 2020-06-16 | 北京理工大学 | 一种基于cnn-lstm的自动驾驶控制方法 |
CN110210126B (zh) * | 2019-05-31 | 2023-03-24 | 重庆大学 | 一种基于lstmpp的齿轮剩余寿命的预测方法 |
CN112026782B (zh) * | 2019-06-04 | 2022-05-03 | 广州汽车集团股份有限公司 | 一种基于开关式深度学习网络模型的自动驾驶决策方法及系统 |
CN110221611B (zh) * | 2019-06-11 | 2020-09-04 | 北京三快在线科技有限公司 | 一种轨迹跟踪控制方法、装置及无人驾驶车辆 |
US11364935B2 (en) * | 2019-07-22 | 2022-06-21 | Volvo Car Corporation | Robust autonomous drive design |
CN110688729B (zh) * | 2019-08-26 | 2023-07-14 | 南京航空航天大学 | 基于自适应卡尔曼滤波的lstm-idm跟驰特性融合方法、存储介质及设备 |
CN110509916B (zh) * | 2019-08-30 | 2021-06-29 | 的卢技术有限公司 | 一种基于深度神经网络的车身姿态稳定方法和系统 |
CN110745136B (zh) * | 2019-09-20 | 2021-05-07 | 中国科学技术大学 | 一种驾驶自适应控制方法 |
CN110867096B (zh) * | 2019-10-08 | 2021-07-20 | 江苏大学 | 一种适用于多种自动驾驶等级车辆的山区道路安全控制系统及方法 |
CN112863245B (zh) * | 2019-11-28 | 2022-07-05 | 南京理工大学 | 基于深度神经网络的车辆换道轨迹实时预测方法 |
CN111341102B (zh) * | 2020-03-02 | 2021-04-23 | 北京理工大学 | 运动基元库构建方法和装置、连接运动基元的方法和装置 |
CN111267852B (zh) * | 2020-03-18 | 2021-06-08 | 清华大学苏州汽车研究院(相城) | 一种车队协同驾驶巡航控制方法 |
CN111967087A (zh) * | 2020-07-16 | 2020-11-20 | 山东派蒙机电技术有限公司 | 基于神经网络的网联车辆决策控制模型建立及评估方法 |
CN112052905B (zh) * | 2020-09-11 | 2023-02-03 | 重庆科技学院 | 一种基于循环神经网络的驾驶人多操作疲劳特征提取方法 |
CN112201069B (zh) * | 2020-09-25 | 2021-10-29 | 厦门大学 | 基于深度强化学习的驾驶员纵向跟车行为模型构建方法 |
CN112158200B (zh) * | 2020-09-25 | 2022-04-01 | 厦门大学 | 基于驾驶员特性的智能电动汽车跟车控制系统及方法 |
CN112373483B (zh) * | 2020-11-23 | 2022-07-29 | 浙江天行健智能科技有限公司 | 一种基于前向神经网络的车辆速度和转向预测方法 |
CN112596388B (zh) * | 2020-12-18 | 2023-03-21 | 武汉理工大学 | 一种基于驾驶员数据的lstm神经网络aeb系统控制方法 |
CN113188807B (zh) * | 2021-02-05 | 2024-05-03 | 深圳大雷汽车检测股份有限公司 | 一种abs结果自动判定算法 |
CN113537002B (zh) * | 2021-07-02 | 2023-01-24 | 安阳工学院 | 一种基于双模神经网络模型的驾驶环境评估方法及装置 |
TWI780953B (zh) * | 2021-10-18 | 2022-10-11 | 財團法人車輛研究測試中心 | 基於雲端運算之隊列跟車決策系統及其決策方法 |
CN113968231B (zh) * | 2021-12-09 | 2022-08-09 | 吉林大学 | 一种符合驾驶员习惯的智能驾驶员模型参数确定方法 |
CN114394094A (zh) * | 2021-12-24 | 2022-04-26 | 华人运通(上海)自动驾驶科技有限公司 | 一种安全跟车的辅助驾驶方法、车辆 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107810508A (zh) * | 2015-06-26 | 2018-03-16 | 圣蒂安斯公众有限公司 | 根据传感器数据推导运动行为 |
KR20180003123A (ko) * | 2016-06-30 | 2018-01-09 | 삼성전자주식회사 | 메모리 셀 유닛 및 메모리 셀 유닛들을 포함하는 순환 신경망 |
US9977729B1 (en) * | 2016-11-23 | 2018-05-22 | Google Llc | Testing applications with a defined input format |
CN107031617B (zh) * | 2017-02-22 | 2019-06-14 | 湖北文理学院 | 一种汽车智能驾驶的方法及装置 |
CN107203134B (zh) * | 2017-06-02 | 2020-08-18 | 浙江零跑科技有限公司 | 一种基于深度卷积神经网络的前车跟随方法 |
-
2018
- 2018-07-05 CN CN201810730555.XA patent/CN108944930B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108944930A (zh) | 2018-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108944930B (zh) | 一种基于lstm的模拟驾驶员特性的自动跟车方法及系统 | |
CN109624986B (zh) | 一种基于模式切换的驾驶风格的学习巡航控制系统及方法 | |
CN106950956B (zh) | 融合运动学模型和行为认知模型的行车轨迹预测系统 | |
CN109927725B (zh) | 一种具有驾驶风格学习能力的自适应巡航系统及实现方法 | |
JP7287707B2 (ja) | 敵対的模倣学習に基づく無人運転車両車線変更決定方法及びシステム | |
CN107203134B (zh) | 一种基于深度卷积神经网络的前车跟随方法 | |
CN112162555B (zh) | 混合车队中基于强化学习控制策略的车辆控制方法 | |
Xu et al. | An automated learning-based procedure for large-scale vehicle dynamics modeling on baidu apollo platform | |
Kuutti et al. | End-to-end reinforcement learning for autonomous longitudinal control using advantage actor critic with temporal context | |
CN110688729B (zh) | 基于自适应卡尔曼滤波的lstm-idm跟驰特性融合方法、存储介质及设备 | |
WO2021129156A1 (zh) | 智能汽车的控制方法、装置和控制系统 | |
CN111338385A (zh) | 一种基于GRU网络模型与Gipps模型融合的车辆跟驰方法 | |
CN116134292A (zh) | 用于性能测试和/或训练自动驾驶车辆规划器的工具 | |
Chen et al. | ES-DQN: A learning method for vehicle intelligent speed control strategy under uncertain cut-in scenario | |
CN110103960B (zh) | 车辆自适应巡航控制方法、系统及车辆 | |
Wang et al. | Adaptive cruise control via adaptive dynamic programming with experience replay | |
CN115123159A (zh) | 一种基于ddpg深度强化学习的aeb控制方法及系统 | |
CN113391553B (zh) | 具有执行器饱和的异构cacc系统的自适应最优控制方法 | |
CN112124310A (zh) | 一种车辆的路径变换方法和装置 | |
CN114179830A (zh) | 一种自动驾驶车辆的自主超车方法和系统 | |
CN114987511A (zh) | 模拟人类驾驶行为以训练基于神经网络的运动控制器的方法 | |
CN114253274A (zh) | 基于数据驱动的网联混合车辆编队滚动优化控制方法 | |
Liu et al. | Driver lane changing behavior analysis based on parallel Bayesian networks | |
CN114278727B (zh) | 极限工况下的车辆自动换挡控制方法、系统、介质及设备 | |
CN112596388B (zh) | 一种基于驾驶员数据的lstm神经网络aeb系统控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210831 Address after: 230001 1101, building B, Xiangfeng Creative Park, 211 Xiangzhang Avenue, Hefei, Anhui Patentee after: Anhui Keda Qingtian Technology Co.,Ltd. Address before: Tunxi road in Baohe District of Hefei city of Anhui Province, No. 193 230009 Patentee before: Hefei University of Technology |