CN108944930B - 一种基于lstm的模拟驾驶员特性的自动跟车方法及系统 - Google Patents

一种基于lstm的模拟驾驶员特性的自动跟车方法及系统 Download PDF

Info

Publication number
CN108944930B
CN108944930B CN201810730555.XA CN201810730555A CN108944930B CN 108944930 B CN108944930 B CN 108944930B CN 201810730555 A CN201810730555 A CN 201810730555A CN 108944930 B CN108944930 B CN 108944930B
Authority
CN
China
Prior art keywords
vehicle
data
input
layer
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810730555.XA
Other languages
English (en)
Other versions
CN108944930A (zh
Inventor
程腾
曹聪聪
杜卿宇
蒋亚西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Keda Qingtian Technology Co.,Ltd.
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201810730555.XA priority Critical patent/CN108944930B/zh
Publication of CN108944930A publication Critical patent/CN108944930A/zh
Application granted granted Critical
Publication of CN108944930B publication Critical patent/CN108944930B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/14Adaptive cruise control
    • B60W30/16Control of distance between vehicles, e.g. keeping a distance to preceding vehicle
    • B60W30/165Automatically following the path of a preceding lead vehicle, e.g. "electronic tow-bar"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2520/00Input parameters relating to overall vehicle dynamics
    • B60W2520/10Longitudinal speed
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2520/00Input parameters relating to overall vehicle dynamics
    • B60W2520/10Longitudinal speed
    • B60W2520/105Longitudinal acceleration
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects
    • B60W2554/80Spatial relation or speed relative to objects
    • B60W2554/801Lateral distance
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects
    • B60W2554/80Spatial relation or speed relative to objects
    • B60W2554/804Relative longitudinal speed

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Traffic Control Systems (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)

Abstract

本发明提供一种基于LSTM的模拟驾驶员特性的自动跟车方法及系统,本发明引入LSTM循环神经网络模型,该模型应用优秀驾驶员稳态跟车过程中所采集的传感器信息时序数据和自车行驶时序数据等,对驾驶员跟车驾驶行为特征进行学习,建立起非线性输入输出映射关系知识库,进而预测车辆在跟车行驶过程中的纵向操作控制,实现系统对驾驶员特性的自动适应。本发明利用LSTM循环神经网络善于处理时序特征数据的特性来模拟驾驶员跟车行为特性,所设计的控制器输出在满足安全性、准确性以及舒适性的前提下更符合人类的驾驶行为特性,同时能够有效实现对驾驶员操作过程特性的自学习,实现了系统对驾驶员特性的自适应,具有普遍适用范围。

Description

一种基于LSTM的模拟驾驶员特性的自动跟车方法及系统
技术领域
本发明属于智能驾驶技术领域,具体涉及一种基于LSTM的模拟驾驶员特性的自动跟车方法及系统。
背景技术
自动驾驶分为两个阶段,高级驾驶辅助阶段和自动驾驶阶段,高级驾驶辅助系统是自动驾驶的基础,虽然自动驾驶的发展如火如荼,但是目前市场量产车上搭载的大多还是高级驾驶辅助系统。自动跟车系统属于自适应巡航系统的重要组成部分之一,也是车辆高级辅助驾驶系统的必不可少的功能。
现有此类系统基于视觉或雷达传感系统输出自身车辆与前方车辆的距离和相对运动信息,控制自身车辆车速以实现与前方车辆的距离保持或车速保持。但是由于驾驶员跟车动作是个连续过程,目前已有的自动跟车系统基本都是采用单帧传感数据作为控制模型的考量因素,并未考虑数据时序特征的影响,因此设计出的控制系统并不能很好的模拟驾驶员的跟车行为。同时由于驾驶员个体之间的驾驶风格、行为趋向以及安全需求都存在很大的差异,目前已有的自动跟车系统基本都采用较为固定的控制策略,这种采用固定参数的跟车系统也难以保证不同驾驶员的适应性。
发明内容
为了解决现有技术中存在的上述技术问题,本发明提供一种基于LSTM(LongShort-Term Memory,长短期记忆网络)模型的模拟驾驶员特性的自动跟车方法及系统。本发明引入LSTM循环神经网络模型,该模型应用优秀驾驶员稳态跟车过程中所采集的传感器信息时序数据和自车行驶时序数据等,对驾驶员跟车驾驶行为特征进行学习,建立起非线性输入输出映射关系知识库,进而预测车辆在跟车行驶过程中的纵向操作控制,实现系统对驾驶员特性的自动适应。
本发明是通过以下技术方案实现的:
一种基于LSTM的模拟驾驶员特性的自动跟车方法,用于控制目标车辆自身车速以实现目标车辆与前方车辆的距离保持或车速保持;包括以下步骤:
步骤S101,根据不同地点、天气下采集的驾驶训练数据建立训练样本库;所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据;所述输入特征数据包括自车车速、前车车速、自车加速度、车间距,所述驾驶操纵数据包括油门踏板和制动踏板传感数据。
步骤S102,建立LSTM网络模型;所述LSTM网络模型包括1个输入层、2个隐藏层、1个输出层;其中:
输入层:定义输入向量Xt为4维向量,其中的4个元素分别表示车间距、自车车速与前车车速、以及自车加速度;将所有输入向量按时间序列展开;其中,所述输入向量Xt是指时间t处的输入。
第一隐藏层:设置为全连接层,包括32个神经元;所述第一隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元。
第二隐藏层:设置为全连接层,包括41个神经元;所述第二隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元。
输出层:设置为softmax分类器;输出向量Ot由当前时间t及之前部分记忆共同计算得到,对应离散纵向车辆操作向量;输出向量Ot中的车辆操作信息为41维向量,分别对应目标车辆的油门与制动踏板的操作状态,其中第1-20个元素表示油门操作,分别对应不同的油门踏板开度;第21个元素表示无操作;第22-41个元素表示制动操作,分别对应不同的制动踏板开度。
步骤S103,根据训练样本对所述LSTM网络模型进行离线训练;所述离线训练的过程具体包括:
步骤S1031,设置所述LSTM网络模型的超参数,所述超参数包括批量样本大小n、学习速率lr、权重衰退系数λ。
步骤S1032,从所述训练样本库中获取所需的样本数据,并将获取的样本数据生成批量样本;将所述批量样本进行批规范化,获得批规范样本;将所述批规范样本输入到所述LSTM网络模型进行前向传导运算。
步骤S1033,采用基于时间反向传播算法计算损失函数对参数的偏导,并用小批量梯度下降算法对损失求最优化解来更新并优化网络权重和偏置参数,直至预设的循环迭代次数完成或者达到预设的预测准确率,根据优化后神经网络权重和偏置参数完成对所述LSTM网络模型的训练;其中,损失计算公式如公式(1)所示:
Figure BDA0001720770960000021
公式(1)中,Si为t时刻所述输出层的输出向量Ot中第i个元素的值,yi为对应的实际驾驶操纵数据中第i个的值,λ为权重衰退系数,n为批量样本大小,w为网络中的权重。
步骤S104,将实时车况数据输入所述LSTM网络模型进行计算,输出对应的车辆操纵信号,实现自动跟车。
一种基于LSTM的模拟驾驶员特性的自动跟车系统,包括环境感知模块、训练样本库模块、自动跟车控制算法模块以及下位机执行模块;其中:
所述环境感知模块包括:车速传感器、加速度传感器和雷达系统模块;所述车速传感器用于实时获取目标车辆的自车车速v1,所述加速度传感器模块用于实时获取目标车辆的自车加速度a,所述雷达系统模块用于实时获取前车车速v2以及目标车辆与前方车辆之间的车间距s。
所述训练样本库模块用于根据不同地点、天气下采集的驾驶训练数据建立训练样本库;所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据;所述输入特征数据包括自车车速、前车车速、自车加速度、车间距,所述驾驶操纵数据包括油门踏板和制动踏板传感数据。
所述自动跟车控制算法模块用于建立LSTM网络模型,对所述LSTM网络模型进行离线训练和在线微调,并将所述环境感知模块采集的实时车况数据输入所述LSTM网络模型进行计算,输出车辆操纵信号;所述LSTM网络模型包括1个输入层、2个隐藏层、1个输出层;其中:
输入层:定义输入向量Xt为4维向量,其中的4个元素分别表示车间距、自车车速与前车车速、以及自车加速度;将所有输入向量按时间序列展开;其中,所述输入向量Xt是指时间t处的输入。
第一隐藏层:设置为全连接层,包括32个神经元;所述第一隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元。
第二隐藏层:设置为全连接层,包括41个神经元;所述第二隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元。
输出层:设置为softmax分类器;输出向量Ot由当前时间t及之前部分记忆共同计算得到,对应离散纵向车辆操作向量;输出向量Ot中的车辆操作信息为41维向量,分别对应目标车辆的油门与制动踏板的操作状态,其中第1-20个元素表示油门操作,第21个元素表示无操作,第22-41个元素表示制动操作。
所述下位机执行模块用于执行所述车辆操纵信号,实现自动跟车。
本发明相对于现有技术的有益效果在于:
(1)本发明利用LSTM循环神经网络善于处理时序特征数据的特性来模拟驾驶员跟车行为特性,考虑到了驾驶员跟车行为的时序特性,所设计的控制器输出在满足安全性、准确性以及舒适性的前提下更符合人类的驾驶行为特性;同时在实际操作只需通过不同驾驶员的实时行驶数据在线微调神经网络参数,能够有效实现对跟车过程中驾驶员操作特性的自学习,实现了系统对驾驶员特性的自适应,具有普遍适用范围。
(2)本发明中将车辆自身加速度作为输入特征之一,即将加速度作为考量因素,考虑了跟车过程中的乘坐舒适性,使得整个跟车控制过程更为平顺。
附图说明
图1是本发明基于LSTM的模拟驾驶员特性的自动跟车方法的流程示意图。
图2是本发明引入的LSTM网络模型的结构示意图。
图3是本发明基于LSTM的模拟驾驶员特性的自动跟车系统的结构示意图。
图4是本发明LSTM网络内部结构示意图。
图5是采用本发明基于LSTM的模拟驾驶员特性的自动跟车方法的实车实验结果图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
实施例1:
如图1所示,本实施例提供一种基于LSTM的模拟驾驶员特性的自动跟车方法,用于控制目标车辆自身车速以实现目标车辆与前方车辆的距离保持或车速保持;包括以下步骤:
步骤S101,根据不同地点、天气下采集的驾驶训练数据建立训练样本库;所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据;所述输入特征数据包括自车车速、前车车速、自车加速度、车间距,所述驾驶操纵数据包括油门踏板和制动踏板传感数据。在实际应用中,可以利用实验车辆采集真实的城市道路环境下驾驶训练数据。将采集到的上述经验数据作为后续对LSTM网络模型进行训练的训练样本。步骤S101训练样本库的具体建立方式有很多,本实施例给出一种具体实例,进一步包括以下步骤:
步骤S1011,在不同地点、天气下,用实验车辆采集城市道路环境下驾驶训练数据;所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据,所述输入特征数据包括自车车速、前车车速、自车加速度、车间距,所述驾驶操纵数据包括油门踏板和制动踏板传感数据。
步骤S1012,将输入特征数据与对应的驾驶操纵数据进行同步。
步骤S1013,筛选跟车操作部分的数据,离散化数据,生成数据样本,形成训练数据集和测试数据集,完成训练样本库的建立。
步骤S102,建立LSTM网络模型;所述LSTM网络模型的具体结构如图2所示,包括1个输入层、2个隐藏层、1个输出层;其中:
输入层:定义输入向量Xt为4维向量,其中的4个元素分别表示车间距、自车车速与前车车速、以及自车加速度;将所有输入向量按时间序列展开。时序持续长度可以根据实际情况进行选取,在本实施例中取时序持续长度128,此取值仅为举例说明,时序持续长度的取值没有具体要求,根据硬件配置可以选用不同的取值。其中,所述输入向量Xt是指时间t处的输入。
第一隐藏层:设置为全连接层,包括32个神经元;所述第一隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元。丢弃参数设置为0.5,即随机丢弃该层50%神经元权重系数。
第二隐藏层:设置为全连接层,包括41个神经元;所述第二隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元。丢弃参数设置为0.5,即随机丢弃该层50%神经元权重系数。
输出层:设置为softmax分类器;输出向量Ot由当前时间t及之前部分记忆共同计算得到,对应离散纵向车辆操作向量;输出向量Ot中的车辆操作信息为41维向量,分别对应目标车辆的油门与制动踏板的操作状态,其中第1-20个元素表示油门操作,分别对应不同的油门踏板开度;第21个元素表示无操作;第22-41个元素表示制动操作,分别对应不同的制动踏板开度。
作为一种优选方案,如图4所示,LSTM内部结构包括Cell单元以及三个门控单元结构,三个门控单元分别为遗忘门单元(Forget Gate)、外部输入门单元(Input Gate)、输出门单元(Output Gate)。因此前向传导运算公式如下:
ft=σ(Wf.[ut-1,xt]+bf) (2)
公式(2)中,ft为遗忘门的输出,xt为网络输入,ut-1为上一个时间序列的隐藏状态,Wf和bf为遗忘门的权重和偏置。σ为sigmoid函数,表达式为
Figure BDA0001720770960000061
it=σ(W[ut-1,xt]+bi) (3)
公式(3)中,it为输入门的输出,xt为网络输入,Wi和bi为输入门的权重和偏置。
Figure BDA0001720770960000062
公式(4)中,
Figure BDA0001720770960000063
为由当前输入下Cell状态,xt为网络输入,Wc和bc为Cell状态的权重和偏置,tanh函数为双曲正切函数。
Figure BDA0001720770960000064
公式(5)中,Ct为当前时刻最终Cell状态,Ct-1为上一个序列的Cell状态。
ut=σ(Wo·[ut-1,xt]+b0) (6)
公式(6)中,ut为输入到下一个时间序列的隐藏状态,Wo和b0为输出门的权重和偏置。
Ot=ut*tanh(Ct) (7)
公式(7)中,Ot为经前向传导运算后得到的输出。
步骤S103,根据训练样本对所述LSTM网络模型进行离线训练;所述离线训练的过程具体包括:
步骤S1031,设置所述LSTM网络模型的超参数,所述超参数包括批量样本大小n、学习速率lr、权重衰退系数λ。其中批量样本n可取用的最大值由内存上限决定,学习速率lr决定收敛速率,权重衰退系数λ防止过拟合。
步骤S1032,从所述训练样本库中获取所需的训练样本数据,并将获取的样本数据生成批量样本;将所述批量样本进行批规范化(Batch Normalization),获得批规范样本;将所述批规范样本输入到所述LSTM网络模型进行前向传导运算得到预测的输出值,具体运算过程参见公式(2)到公式(7)。
步骤S1033,采用基于时间反向传播算法(BPTT)计算损失函数对参数(整个网络的权重和偏置)的偏导,并用小批量梯度下降算法对损失求最优化解来更新并优化网络权重和偏置参数,直至预设的循环迭代次数完成或者达到预设的预测准确率,根据优化后神经网络权重和偏置参数完成对所述LSTM网络模型的训练;其中,损失计算公式如公式(1)所示:
Figure BDA0001720770960000071
公式(1)中,Si为t时刻所述输出层的输出向量Ot中第i个元素的值,yi为对应的实际驾驶操纵数据中第i个的值,λ为权重衰退系数,n为批量样本大小,w为网络中的权重。
上述公式(1)的推导过程如下:
softmax交叉熵损失计算公式如公式(8):
C0=-ΣiSilog(yi) (8)
其中,Si为t时刻该softmax层输出向量中第i个元素的值,yi为对应的实际样本标签中第i个的值。
为了防止过拟合,提高泛化能力,引入L2正则化,所以总的损失函数计算公式如公式(9)所示:
Figure BDA0001720770960000072
其中,λ为权重衰退系数,w为网络中的权重。
根据优化后神经网络权重和偏置参数完成对LSTM网络的训练。本步骤中小批量梯度下降方法即在每个循环内更新每一参数时都使用一部分样本来更新。
为了进一步提高自动跟车的效果,作为进一步优化的技术方案,在本实施例中,在对LSTM网络模型进行离线训练之后,可以进一步利用实时采集的驾驶训练数据对LSTM网络模型进行在线微调,具体步骤如下:
步骤S201,根据驾驶员驾驶行为对训练后LSTM网络进行在线微调;具体包括:
步骤S2041,实时采集所述驾驶训练数据,生成在线数据样本。这里的驾驶训练数据的定义和类型与步骤S103中离线训练使用的训练样本中的驾驶训练数据一致,区别在于本步骤中的驾驶训练数据是实时采集的驾驶训练数据,而步骤S103中的驾驶训练数据来源于预先建立的训练样本库。
步骤S2042,设置所述LSTM网络模型的超参数,将在线数据样本输入至训练后的LSTM网络中进行前向传导运算(与步骤S1032中的前向传导运算相同,见公式(2)至公式(7))。
步骤S2043,采用基于小批量梯度下降方法对损失求最优化解来更新和优化神经网络权重和偏置参数,直至设定的循环迭代次数完成,根据优化后神经网络权重和偏置参数完成对所述LSTM网络模型的微调;其中,损失计算公式如公式(1)所示:
Figure BDA0001720770960000081
本步骤根据驾驶员在线驾驶数据对LSTM网络进行微调,根据驾驶员的驾驶习惯微调全连接层参数,从而使得输出的车辆操作信息更加满足个人驾驶习惯。
步骤S104,将实时车况数据输入所述LSTM网络模型进行计算,输出对应的车辆操纵信号,实现自动跟车。
实时车况数据输入所述LSTM网络模型进行计算的过程如下,步骤S104进一步包括以下步骤:
步骤S1041,采集实时车况数据,所述实时车况数据包括:车间距、自车车速与前车车速、以及自车加速度。
步骤S1042,将所述实时车况数据经预处理后输入所述LSTM网络模型进行前向传导运算。
步骤S1043,将所述LSTM网络模型的输出向量Ot中的最大元素所在位置对应到车辆相应的操作状态,获得输出向量Ot所对应的车辆油门踏板或制动踏板开度。
步骤S1044,将所述输出向量Ot对应的油门踏板或制动踏板开度转化为当前时刻t的车辆控制信号,发送给对应的底层执行机构,所述底层执行机构根据所述车辆控制信号对车辆进行操纵,实现自动跟车。
所述底层执行机构,即下位机执行模块,具体将车辆控制信号发送给车辆整车控制器,从而由车辆整车控制器进一步控制电机和制动机构,以实现车辆的加速和减速。
实施例2:
如图3所示,一种基于LSTM的模拟驾驶员特性的自动跟车系统,包括环境感知模块1、训练样本库模块2、自动跟车控制算法模块3以及下位机执行模块4;其中:
所述环境感知模块1包括:车速传感器子模块11、加速度传感器子模块12和雷达系统子模块13;所述车速传感器子模块11(具体可选用霍尔齿轮转速传感器SC12-20K)用于实时获取目标车辆的自车车速v1,所述加速度传感器子模块12(具体可选用Xsens MTI-G-710惯性元件)用于实时获取目标车辆的自车加速度a,所述雷达系统子模块13(具体可选用IBEO LUX4L激光雷达)用于实时获取前车车速v2以及目标车辆与前方车辆之间的车间距s。
所述训练样本库模块2用于根据不同地点、天气下采集的驾驶训练数据建立训练样本库;所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据;所述输入特征数据包括自车车速、前车车速、自车加速度、车间距,所述驾驶操纵数据包括油门踏板和制动踏板传感数据。
所述自动跟车控制算法模块3用于建立LSTM网络模型,对所述LSTM网络模型进行离线训练和在线微调,并将所述环境感知模块采集的实时车况数据输入所述LSTM网络模型进行计算,输出车辆操纵信号;所述LSTM网络模型包括1个输入层、2个隐藏层、1个输出层;其中:
输入层:定义输入向量Xt为4维向量,其中的4个元素分别表示车间距、自车车速与前车车速、以及自车加速度;将所有输入向量按时间序列展开;其中,所述输入向量Xt是指时间t处的输入。
第一隐藏层:设置为全连接层,包括32个神经元;所述第一隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元。
第二隐藏层:设置为全连接层,包括41个神经元;所述第二隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元。
输出层:设置为softmax分类器;输出向量Ot由当前时间t及之前部分记忆共同计算得到,对应离散纵向车辆操作向量;输出向量Ot中的车辆操作信息为41维向量,分别对应目标车辆的油门与制动踏板的操作状态,其中第1-20个元素表示油门操作,第21个元素表示无操作,第22-41个元素表示制动操作。
所述下位机执行模块4用于执行所述车辆操纵信号,实现自动跟车。
本实施例提供的系统是与实施例1的自动跟车方法相对应的自动跟车系统,其相应的工作原理和工作流程与实施例1基本相同,在此不再赘述。
为了全面准确地评估本发明所提出方法的性能,进行自动跟车实车实验。本实验设计了两段跟车过程,分别模拟跟随前车加速-减速行驶工况以及跟随前车的起停工况。实验结果如图5所示,从结果可得出,本发明设计的自动跟车系统能够实现跟随前车的功能,并且跟随前车过程中,能够实现跟随前车匀速、加速、减速和起停行驶;而且在稳定跟车过程中,目标距离和实际距离之间的偏差在1m左右,整个跟车过程没有抖动,符合人类的驾驶行为特性,满足安全性和舒适性要求,同时也满足响应时间和精度的要求。综上所示,本发明提出的一种基于LSTM的模拟驾驶员特性的自动跟车系统能充分利用优秀驾驶员的历史操纵信息,并结合实时预处理得到的时序特征输入序列,预测出保证安全性、准确性以及舒适性等多目标的车辆操纵信息。基于实车实验测试,证明了本发明在保证可靠性和安全性的基础上,能很好地模拟驾驶员的驾驶操纵行为,实现自动跟车。
本领域的技术人员容易理解,以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于LSTM的模拟驾驶员特性的自动跟车方法,用于控制目标车辆自身车速以实现目标车辆与前方车辆的距离保持或车速保持;其中,所述LSTM是指长短期记忆网络;其特征在于,所述自动跟车方法包括以下步骤:
步骤S101,根据不同地点、天气下采集的驾驶训练数据建立训练样本库;所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据;所述输入特征数据包括自车车速、前车车速、自车加速度、车间距,所述驾驶操纵数据包括油门踏板和制动踏板传感器数据;
步骤S102,建立LSTM网络模型;所述LSTM网络模型包括1个输入层、2个隐藏层、1个输出层;其中:
输入层:定义输入向量Xt为4维向量,其中的4个元素分别表示车间距、自车车速与前车车速、以及自车加速度;将所有输入向量按时间序列展开;其中,所述输入向量Xt是指时间t处的输入;
第一隐藏层:设置为全连接层,包括32个神经元;所述第一隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元;
第二隐藏层:设置为全连接层,包括41个神经元;所述第二隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元;
输出层:设置为softmax分类器;输出向量Ot由当前时间t及之前部分记忆共同计算得到,对应离散纵向车辆操作向量;输出向量Ot中的车辆操作信息为41维向量,分别对应目标车辆的油门与制动踏板的操作状态,其中第1-20个元素表示油门操作,分别对应不同的油门踏板开度;第21个元素表示无操作;第22-41个元素表示制动操作,分别对应不同的制动踏板开度;
步骤S103,根据训练样本对所述LSTM网络模型进行离线训练;所述离线训练的过程具体包括:
步骤S1031,设置所述LSTM网络模型的超参数,所述超参数包括批量样本大小n、学习速率lr、权重衰退系数λ;
步骤S1032,从所述训练样本库中获取所需的样本数据,并将获取的样本数据生成批量样本;将所述批量样本进行批规范化,获得批规范样本;将所述批规范样本输入到所述LSTM网络模型进行前向传导运算;
步骤S1033,采用基于时间反向传播算法计算损失函数对参数的偏导,并用小批量梯度下降算法对损失求最优化解来更新并优化网络权重和偏置参数,直至预设的循环迭代次数完成或者达到预设的预测准确率,根据优化后神经网络权重和偏置参数完成对所述LSTM网络模型的训练;其中,损失计算公式如公式(1)所示:
Figure FDA0002344255030000021
公式(1)中,Si为t时刻所述输出层的输出向量Ot中第i个元素的值,yi为对应的实际驾驶操纵数据中第i个的值,λ为权重衰退系数,n为批量样本大小,w为网络中的权重;
步骤S104,将实时车况数据输入所述LSTM网络模型进行计算,输出对应的车辆操纵信号,实现自动跟车。
2.根据权利要求1所述的自动跟车方法,其特征在于,在所述步骤S103和步骤S104之间,进一步包括以下步骤:
步骤S201,根据驾驶员驾驶行为对训练后LSTM网络进行在线微调;具体包括:
步骤S2011,实时采集所述驾驶训练数据,生成在线数据样本;
步骤S2012,设置所述LSTM网络模型的超参数,将在线数据样本输入至训练后的LSTM网络中进行前向传导运算;
步骤S2013,采用基于小批量梯度下降方法对损失求最优化解来更新和优化神经网络参数,直至设定的循环迭代次数完成,根据优化后神经网络权重和偏置参数完成对所述LSTM网络模型的微调;其中,损失计算公式如公式(1)所示:
Figure FDA0002344255030000022
3.根据权利要求1所述的自动跟车方法,其特征在于,所述步骤S104进一步包括以下步骤:
步骤S1041,采集实时车况数据,所述实时车况数据包括:车间距、自车车速与前车车速、以及自车加速度;
步骤S1042,将所述实时车况数据经预处理后输入所述LSTM网络模型进行前向传导运算;
步骤S1043,将所述LSTM网络模型的输出向量Ot中的最大元素所在位置对应到车辆相应的操作状态,获得输出向量Ot所对应的车辆油门踏板或制动踏板开度;
步骤S1044,将所述输出向量Ot对应的油门踏板或制动踏板开度转化为当前时刻t的车辆控制信号,发送给对应的底层执行机构,所述底层执行机构根据所述车辆控制信号对车辆进行操纵,实现自动跟车。
4.根据权利要求1所述的自动跟车方法,其特征在于,所述步骤S101进一步包括以下步骤:
步骤S1011,在不同地点、天气下,用实验车辆采集城市道路环境下驾驶训练数据;所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据,所述输入特征数据包括自车车速、前车车速、自车加速度、车间距,所述驾驶操纵数据包括油门踏板和制动踏板传感数据;
步骤S1012,将输入特征数据与对应的驾驶操纵数据进行同步,
步骤S1013,筛选跟车操作部分的数据,离散化数据,生成数据样本,形成训练数据集和测试数据集,完成训练样本库的建立。
5.根据权利要求1所述的自动跟车方法,其特征在于,所述前向传导运算具体为:
LSTM内部结构包括Cell单元以及三个门控单元结构,三个门控单元分别为遗忘门单元、外部输入门单元、输出门单元;前向传导运算公式如下:
ft=σ(Wf.[ut-1,xt]+bf) (2)
公式(2)中,ft为遗忘门的输出,xt为网络输入,ut-1为上一个时间序列的隐藏状态,Wf和bf为遗忘门的权重和偏置;σ为sigmoid函数,表达式为
Figure FDA0002344255030000031
it=σ(Wi.[ut-1,xt]+bi) (3)
公式(3)中,it为输入门的输出,xt为网络输入,Wi和bi为输入门的权重和偏置;
Figure FDA0002344255030000032
公式(4)中,
Figure FDA0002344255030000033
为由当前输入下Cell状态,xt为网络输入,Wc和bC为Cell状态的权重和偏置,tanh函数为双曲正切函数;
Figure FDA0002344255030000034
公式(5)中,Ct为当前时刻最终Cell状态,Ct-1为上一个序列的Cell状态;
ut=σ(Wo.[ut-1,xt]+b0) (6)
公式(6)中,ut为输入到下一个时间序列的隐藏状态,Wo和b0为输出门的权重和偏置;
Ot=ut*tanh(Ct) (7)
公式(7)中,Ot为经前向传导运算后得到的输出。
6.一种基于LSTM的模拟驾驶员特性的自动跟车系统,其中,所述LSTM是指长短期记忆网络;其特征在于,所述自动跟车系统包括环境感知模块、训练样本库模块、自动跟车控制算法模块以及下位机执行模块;其中:
所述环境感知模块包括:车速传感器、加速度传感器和雷达系统模块;所述车速传感器用于实时获取目标车辆的自车车速v1,所述加速度传感器模块用于实时获取目标车辆的自车加速度a,所述雷达系统模块用于实时获取前车车速v2以及目标车辆与前方车辆之间的车间距s;
所述训练样本库模块用于根据不同地点、天气下采集的驾驶训练数据建立训练样本库;所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据;所述输入特征数据包括自车车速、前车车速、自车加速度、车间距,所述驾驶操纵数据包括油门踏板和制动踏板传感数据;
所述自动跟车控制算法模块用于建立LSTM网络模型,对所述LSTM网络模型进行离线训练和在线微调,并将所述环境感知模块采集的实时车况数据输入所述LSTM网络模型进行计算,输出车辆操纵信号;所述LSTM网络模型包括1个输入层、2个隐藏层、1个输出层;其中:
输入层:定义输入向量Xt为4维向量,其中的4个元素分别表示车间距、自车车速与前车车速、以及自车加速度;将所有输入向量按时间序列展开;其中,所述输入向量Xt是指时间t处的输入;
第一隐藏层:设置为全连接层,包括32个神经元;所述第一隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元;
第二隐藏层:设置为全连接层,包括41个神经元;所述第二隐藏层为dropout层,用于防止模型过拟合,自动丢弃该全连接层内一定比例的神经元;
输出层:设置为softmax分类器;输出向量Ot由当前时间t及之前部分记忆共同计算得到,对应离散纵向车辆操作向量;输出向量Ot中的车辆操作信息为41维向量,分别对应目标车辆的油门与制动踏板的操作状态,其中第1-20个元素表示油门操作,第21个元素表示无操作,第22-41个元素表示制动操作;
所述下位机执行模块用于执行所述车辆操纵信号,实现自动跟车。
CN201810730555.XA 2018-07-05 2018-07-05 一种基于lstm的模拟驾驶员特性的自动跟车方法及系统 Active CN108944930B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810730555.XA CN108944930B (zh) 2018-07-05 2018-07-05 一种基于lstm的模拟驾驶员特性的自动跟车方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810730555.XA CN108944930B (zh) 2018-07-05 2018-07-05 一种基于lstm的模拟驾驶员特性的自动跟车方法及系统

Publications (2)

Publication Number Publication Date
CN108944930A CN108944930A (zh) 2018-12-07
CN108944930B true CN108944930B (zh) 2020-04-21

Family

ID=64485994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810730555.XA Active CN108944930B (zh) 2018-07-05 2018-07-05 一种基于lstm的模拟驾驶员特性的自动跟车方法及系统

Country Status (1)

Country Link
CN (1) CN108944930B (zh)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7115276B2 (ja) * 2018-12-10 2022-08-09 トヨタ自動車株式会社 運転支援装置、ウェアラブル装置、運転支援システム、運転支援方法およびプログラム
CN109927725B (zh) * 2019-01-28 2020-11-03 吉林大学 一种具有驾驶风格学习能力的自适应巡航系统及实现方法
US11087175B2 (en) * 2019-01-30 2021-08-10 StradVision, Inc. Learning method and learning device of recurrent neural network for autonomous driving safety check for changing driving mode between autonomous driving mode and manual driving mode, and testing method and testing device using them
CN109878534B (zh) * 2019-02-22 2021-05-04 初速度(苏州)科技有限公司 一种车辆的控制方法、模型的训练方法和装置
CN109795506B (zh) * 2019-02-26 2021-04-02 百度在线网络技术(北京)有限公司 一种驾驶控制方法、装置及车辆
CN111738037B (zh) * 2019-03-25 2024-03-08 广州汽车集团股份有限公司 一种自动驾驶方法及其系统、车辆
CN110188683B (zh) * 2019-05-30 2020-06-16 北京理工大学 一种基于cnn-lstm的自动驾驶控制方法
CN110210126B (zh) * 2019-05-31 2023-03-24 重庆大学 一种基于lstmpp的齿轮剩余寿命的预测方法
CN112026782B (zh) * 2019-06-04 2022-05-03 广州汽车集团股份有限公司 一种基于开关式深度学习网络模型的自动驾驶决策方法及系统
CN110221611B (zh) * 2019-06-11 2020-09-04 北京三快在线科技有限公司 一种轨迹跟踪控制方法、装置及无人驾驶车辆
US11364935B2 (en) * 2019-07-22 2022-06-21 Volvo Car Corporation Robust autonomous drive design
CN110688729B (zh) * 2019-08-26 2023-07-14 南京航空航天大学 基于自适应卡尔曼滤波的lstm-idm跟驰特性融合方法、存储介质及设备
CN110509916B (zh) * 2019-08-30 2021-06-29 的卢技术有限公司 一种基于深度神经网络的车身姿态稳定方法和系统
CN110745136B (zh) * 2019-09-20 2021-05-07 中国科学技术大学 一种驾驶自适应控制方法
CN110867096B (zh) * 2019-10-08 2021-07-20 江苏大学 一种适用于多种自动驾驶等级车辆的山区道路安全控制系统及方法
CN112863245B (zh) * 2019-11-28 2022-07-05 南京理工大学 基于深度神经网络的车辆换道轨迹实时预测方法
CN111341102B (zh) * 2020-03-02 2021-04-23 北京理工大学 运动基元库构建方法和装置、连接运动基元的方法和装置
CN111267852B (zh) * 2020-03-18 2021-06-08 清华大学苏州汽车研究院(相城) 一种车队协同驾驶巡航控制方法
CN111967087A (zh) * 2020-07-16 2020-11-20 山东派蒙机电技术有限公司 基于神经网络的网联车辆决策控制模型建立及评估方法
CN112052905B (zh) * 2020-09-11 2023-02-03 重庆科技学院 一种基于循环神经网络的驾驶人多操作疲劳特征提取方法
CN112201069B (zh) * 2020-09-25 2021-10-29 厦门大学 基于深度强化学习的驾驶员纵向跟车行为模型构建方法
CN112158200B (zh) * 2020-09-25 2022-04-01 厦门大学 基于驾驶员特性的智能电动汽车跟车控制系统及方法
CN112373483B (zh) * 2020-11-23 2022-07-29 浙江天行健智能科技有限公司 一种基于前向神经网络的车辆速度和转向预测方法
CN112596388B (zh) * 2020-12-18 2023-03-21 武汉理工大学 一种基于驾驶员数据的lstm神经网络aeb系统控制方法
CN113188807B (zh) * 2021-02-05 2024-05-03 深圳大雷汽车检测股份有限公司 一种abs结果自动判定算法
CN113537002B (zh) * 2021-07-02 2023-01-24 安阳工学院 一种基于双模神经网络模型的驾驶环境评估方法及装置
TWI780953B (zh) * 2021-10-18 2022-10-11 財團法人車輛研究測試中心 基於雲端運算之隊列跟車決策系統及其決策方法
CN113968231B (zh) * 2021-12-09 2022-08-09 吉林大学 一种符合驾驶员习惯的智能驾驶员模型参数确定方法
CN114394094A (zh) * 2021-12-24 2022-04-26 华人运通(上海)自动驾驶科技有限公司 一种安全跟车的辅助驾驶方法、车辆

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107810508A (zh) * 2015-06-26 2018-03-16 圣蒂安斯公众有限公司 根据传感器数据推导运动行为
KR20180003123A (ko) * 2016-06-30 2018-01-09 삼성전자주식회사 메모리 셀 유닛 및 메모리 셀 유닛들을 포함하는 순환 신경망
US9977729B1 (en) * 2016-11-23 2018-05-22 Google Llc Testing applications with a defined input format
CN107031617B (zh) * 2017-02-22 2019-06-14 湖北文理学院 一种汽车智能驾驶的方法及装置
CN107203134B (zh) * 2017-06-02 2020-08-18 浙江零跑科技有限公司 一种基于深度卷积神经网络的前车跟随方法

Also Published As

Publication number Publication date
CN108944930A (zh) 2018-12-07

Similar Documents

Publication Publication Date Title
CN108944930B (zh) 一种基于lstm的模拟驾驶员特性的自动跟车方法及系统
CN109624986B (zh) 一种基于模式切换的驾驶风格的学习巡航控制系统及方法
CN106950956B (zh) 融合运动学模型和行为认知模型的行车轨迹预测系统
CN109927725B (zh) 一种具有驾驶风格学习能力的自适应巡航系统及实现方法
JP7287707B2 (ja) 敵対的模倣学習に基づく無人運転車両車線変更決定方法及びシステム
CN107203134B (zh) 一种基于深度卷积神经网络的前车跟随方法
CN112162555B (zh) 混合车队中基于强化学习控制策略的车辆控制方法
Xu et al. An automated learning-based procedure for large-scale vehicle dynamics modeling on baidu apollo platform
Kuutti et al. End-to-end reinforcement learning for autonomous longitudinal control using advantage actor critic with temporal context
CN110688729B (zh) 基于自适应卡尔曼滤波的lstm-idm跟驰特性融合方法、存储介质及设备
WO2021129156A1 (zh) 智能汽车的控制方法、装置和控制系统
CN111338385A (zh) 一种基于GRU网络模型与Gipps模型融合的车辆跟驰方法
CN116134292A (zh) 用于性能测试和/或训练自动驾驶车辆规划器的工具
Chen et al. ES-DQN: A learning method for vehicle intelligent speed control strategy under uncertain cut-in scenario
CN110103960B (zh) 车辆自适应巡航控制方法、系统及车辆
Wang et al. Adaptive cruise control via adaptive dynamic programming with experience replay
CN115123159A (zh) 一种基于ddpg深度强化学习的aeb控制方法及系统
CN113391553B (zh) 具有执行器饱和的异构cacc系统的自适应最优控制方法
CN112124310A (zh) 一种车辆的路径变换方法和装置
CN114179830A (zh) 一种自动驾驶车辆的自主超车方法和系统
CN114987511A (zh) 模拟人类驾驶行为以训练基于神经网络的运动控制器的方法
CN114253274A (zh) 基于数据驱动的网联混合车辆编队滚动优化控制方法
Liu et al. Driver lane changing behavior analysis based on parallel Bayesian networks
CN114278727B (zh) 极限工况下的车辆自动换挡控制方法、系统、介质及设备
CN112596388B (zh) 一种基于驾驶员数据的lstm神经网络aeb系统控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210831

Address after: 230001 1101, building B, Xiangfeng Creative Park, 211 Xiangzhang Avenue, Hefei, Anhui

Patentee after: Anhui Keda Qingtian Technology Co.,Ltd.

Address before: Tunxi road in Baohe District of Hefei city of Anhui Province, No. 193 230009

Patentee before: Hefei University of Technology