CN108944930B

CN108944930B - 一种基于lstm的模拟驾驶员特性的自动跟车方法及系统

Info

Publication number: CN108944930B
Application number: CN201810730555.XA
Authority: CN
Inventors: 程腾; 曹聪聪; 杜卿宇; 蒋亚西
Original assignee: Hefei University of Technology
Current assignee: Anhui Keda Qingtian Technology Co.,Ltd.
Priority date: 2018-07-05
Filing date: 2018-07-05
Publication date: 2020-04-21
Anticipated expiration: 2038-07-05
Also published as: CN108944930A

Abstract

本发明提供一种基于LSTM的模拟驾驶员特性的自动跟车方法及系统，本发明引入LSTM循环神经网络模型，该模型应用优秀驾驶员稳态跟车过程中所采集的传感器信息时序数据和自车行驶时序数据等，对驾驶员跟车驾驶行为特征进行学习，建立起非线性输入输出映射关系知识库，进而预测车辆在跟车行驶过程中的纵向操作控制，实现系统对驾驶员特性的自动适应。本发明利用LSTM循环神经网络善于处理时序特征数据的特性来模拟驾驶员跟车行为特性，所设计的控制器输出在满足安全性、准确性以及舒适性的前提下更符合人类的驾驶行为特性，同时能够有效实现对驾驶员操作过程特性的自学习，实现了系统对驾驶员特性的自适应，具有普遍适用范围。

Description

一种基于LSTM的模拟驾驶员特性的自动跟车方法及系统

技术领域

本发明属于智能驾驶技术领域，具体涉及一种基于LSTM的模拟驾驶员特性的自动跟车方法及系统。

背景技术

自动驾驶分为两个阶段，高级驾驶辅助阶段和自动驾驶阶段，高级驾驶辅助系统是自动驾驶的基础，虽然自动驾驶的发展如火如荼，但是目前市场量产车上搭载的大多还是高级驾驶辅助系统。自动跟车系统属于自适应巡航系统的重要组成部分之一，也是车辆高级辅助驾驶系统的必不可少的功能。

现有此类系统基于视觉或雷达传感系统输出自身车辆与前方车辆的距离和相对运动信息，控制自身车辆车速以实现与前方车辆的距离保持或车速保持。但是由于驾驶员跟车动作是个连续过程，目前已有的自动跟车系统基本都是采用单帧传感数据作为控制模型的考量因素，并未考虑数据时序特征的影响，因此设计出的控制系统并不能很好的模拟驾驶员的跟车行为。同时由于驾驶员个体之间的驾驶风格、行为趋向以及安全需求都存在很大的差异，目前已有的自动跟车系统基本都采用较为固定的控制策略，这种采用固定参数的跟车系统也难以保证不同驾驶员的适应性。

发明内容

为了解决现有技术中存在的上述技术问题，本发明提供一种基于LSTM(LongShort-Term Memory，长短期记忆网络)模型的模拟驾驶员特性的自动跟车方法及系统。本发明引入LSTM循环神经网络模型，该模型应用优秀驾驶员稳态跟车过程中所采集的传感器信息时序数据和自车行驶时序数据等，对驾驶员跟车驾驶行为特征进行学习，建立起非线性输入输出映射关系知识库，进而预测车辆在跟车行驶过程中的纵向操作控制，实现系统对驾驶员特性的自动适应。

本发明是通过以下技术方案实现的：

一种基于LSTM的模拟驾驶员特性的自动跟车方法，用于控制目标车辆自身车速以实现目标车辆与前方车辆的距离保持或车速保持；包括以下步骤：

步骤S101，根据不同地点、天气下采集的驾驶训练数据建立训练样本库；所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据；所述输入特征数据包括自车车速、前车车速、自车加速度、车间距，所述驾驶操纵数据包括油门踏板和制动踏板传感数据。

步骤S102，建立LSTM网络模型；所述LSTM网络模型包括1个输入层、2个隐藏层、1个输出层；其中：

输入层：定义输入向量X_t为4维向量，其中的4个元素分别表示车间距、自车车速与前车车速、以及自车加速度；将所有输入向量按时间序列展开；其中，所述输入向量X_t是指时间t处的输入。

第一隐藏层：设置为全连接层，包括32个神经元；所述第一隐藏层为dropout层，用于防止模型过拟合，自动丢弃该全连接层内一定比例的神经元。

第二隐藏层：设置为全连接层，包括41个神经元；所述第二隐藏层为dropout层，用于防止模型过拟合，自动丢弃该全连接层内一定比例的神经元。

输出层：设置为softmax分类器；输出向量O_t由当前时间t及之前部分记忆共同计算得到，对应离散纵向车辆操作向量；输出向量O_t中的车辆操作信息为41维向量，分别对应目标车辆的油门与制动踏板的操作状态，其中第1-20个元素表示油门操作，分别对应不同的油门踏板开度；第21个元素表示无操作；第22-41个元素表示制动操作，分别对应不同的制动踏板开度。

步骤S103，根据训练样本对所述LSTM网络模型进行离线训练；所述离线训练的过程具体包括：

步骤S1031，设置所述LSTM网络模型的超参数，所述超参数包括批量样本大小n、学习速率lr、权重衰退系数λ。

步骤S1032，从所述训练样本库中获取所需的样本数据，并将获取的样本数据生成批量样本；将所述批量样本进行批规范化，获得批规范样本；将所述批规范样本输入到所述LSTM网络模型进行前向传导运算。

步骤S1033，采用基于时间反向传播算法计算损失函数对参数的偏导，并用小批量梯度下降算法对损失求最优化解来更新并优化网络权重和偏置参数，直至预设的循环迭代次数完成或者达到预设的预测准确率，根据优化后神经网络权重和偏置参数完成对所述LSTM网络模型的训练；其中，损失计算公式如公式(1)所示：

公式(1)中，S_i为t时刻所述输出层的输出向量Ot中第i个元素的值，y_i为对应的实际驾驶操纵数据中第i个的值，λ为权重衰退系数，n为批量样本大小，w为网络中的权重。

步骤S104，将实时车况数据输入所述LSTM网络模型进行计算，输出对应的车辆操纵信号，实现自动跟车。

一种基于LSTM的模拟驾驶员特性的自动跟车系统，包括环境感知模块、训练样本库模块、自动跟车控制算法模块以及下位机执行模块；其中：

所述环境感知模块包括：车速传感器、加速度传感器和雷达系统模块；所述车速传感器用于实时获取目标车辆的自车车速v1，所述加速度传感器模块用于实时获取目标车辆的自车加速度a，所述雷达系统模块用于实时获取前车车速v2以及目标车辆与前方车辆之间的车间距s。

所述训练样本库模块用于根据不同地点、天气下采集的驾驶训练数据建立训练样本库；所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据；所述输入特征数据包括自车车速、前车车速、自车加速度、车间距，所述驾驶操纵数据包括油门踏板和制动踏板传感数据。

所述自动跟车控制算法模块用于建立LSTM网络模型，对所述LSTM网络模型进行离线训练和在线微调，并将所述环境感知模块采集的实时车况数据输入所述LSTM网络模型进行计算，输出车辆操纵信号；所述LSTM网络模型包括1个输入层、2个隐藏层、1个输出层；其中：

输出层：设置为softmax分类器；输出向量O_t由当前时间t及之前部分记忆共同计算得到，对应离散纵向车辆操作向量；输出向量O_t中的车辆操作信息为41维向量，分别对应目标车辆的油门与制动踏板的操作状态，其中第1-20个元素表示油门操作，第21个元素表示无操作，第22-41个元素表示制动操作。

所述下位机执行模块用于执行所述车辆操纵信号，实现自动跟车。

本发明相对于现有技术的有益效果在于：

(1)本发明利用LSTM循环神经网络善于处理时序特征数据的特性来模拟驾驶员跟车行为特性，考虑到了驾驶员跟车行为的时序特性，所设计的控制器输出在满足安全性、准确性以及舒适性的前提下更符合人类的驾驶行为特性；同时在实际操作只需通过不同驾驶员的实时行驶数据在线微调神经网络参数，能够有效实现对跟车过程中驾驶员操作特性的自学习，实现了系统对驾驶员特性的自适应，具有普遍适用范围。

(2)本发明中将车辆自身加速度作为输入特征之一，即将加速度作为考量因素，考虑了跟车过程中的乘坐舒适性，使得整个跟车控制过程更为平顺。

附图说明

图1是本发明基于LSTM的模拟驾驶员特性的自动跟车方法的流程示意图。

图2是本发明引入的LSTM网络模型的结构示意图。

图3是本发明基于LSTM的模拟驾驶员特性的自动跟车系统的结构示意图。

图4是本发明LSTM网络内部结构示意图。

图5是采用本发明基于LSTM的模拟驾驶员特性的自动跟车方法的实车实验结果图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施方式仅仅用以解释本发明，并不用于限定本发明。

实施例1：

如图1所示，本实施例提供一种基于LSTM的模拟驾驶员特性的自动跟车方法，用于控制目标车辆自身车速以实现目标车辆与前方车辆的距离保持或车速保持；包括以下步骤：

步骤S101，根据不同地点、天气下采集的驾驶训练数据建立训练样本库；所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据；所述输入特征数据包括自车车速、前车车速、自车加速度、车间距，所述驾驶操纵数据包括油门踏板和制动踏板传感数据。在实际应用中，可以利用实验车辆采集真实的城市道路环境下驾驶训练数据。将采集到的上述经验数据作为后续对LSTM网络模型进行训练的训练样本。步骤S101训练样本库的具体建立方式有很多，本实施例给出一种具体实例，进一步包括以下步骤：

步骤S1011，在不同地点、天气下，用实验车辆采集城市道路环境下驾驶训练数据；所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据，所述输入特征数据包括自车车速、前车车速、自车加速度、车间距，所述驾驶操纵数据包括油门踏板和制动踏板传感数据。

步骤S1012，将输入特征数据与对应的驾驶操纵数据进行同步。

步骤S1013，筛选跟车操作部分的数据，离散化数据，生成数据样本，形成训练数据集和测试数据集，完成训练样本库的建立。

步骤S102，建立LSTM网络模型；所述LSTM网络模型的具体结构如图2所示，包括1个输入层、2个隐藏层、1个输出层；其中：

输入层：定义输入向量X_t为4维向量，其中的4个元素分别表示车间距、自车车速与前车车速、以及自车加速度；将所有输入向量按时间序列展开。时序持续长度可以根据实际情况进行选取，在本实施例中取时序持续长度128，此取值仅为举例说明，时序持续长度的取值没有具体要求，根据硬件配置可以选用不同的取值。其中，所述输入向量X_t是指时间t处的输入。

第一隐藏层：设置为全连接层，包括32个神经元；所述第一隐藏层为dropout层，用于防止模型过拟合，自动丢弃该全连接层内一定比例的神经元。丢弃参数设置为0.5，即随机丢弃该层50％神经元权重系数。

第二隐藏层：设置为全连接层，包括41个神经元；所述第二隐藏层为dropout层，用于防止模型过拟合，自动丢弃该全连接层内一定比例的神经元。丢弃参数设置为0.5，即随机丢弃该层50％神经元权重系数。

作为一种优选方案，如图4所示，LSTM内部结构包括Cell单元以及三个门控单元结构，三个门控单元分别为遗忘门单元(Forget Gate)、外部输入门单元(Input Gate)、输出门单元(Output Gate)。因此前向传导运算公式如下：

f_t＝σ(W_f.[u_t-1，x_t]+b_f) (2)

公式(2)中，f_t为遗忘门的输出，x_t为网络输入，u_t-1为上一个时间序列的隐藏状态，W_f和b_f为遗忘门的权重和偏置。σ为sigmoid函数，表达式为

i_t＝σ(W_i·[u_t-1，x_t]+b_i) (3)

公式(3)中，i_t为输入门的输出，x_t为网络输入，W_i和b_i为输入门的权重和偏置。

公式(4)中，

为由当前输入下Cell状态，x_t为网络输入，W_c和b_c为Cell状态的权重和偏置，tanh函数为双曲正切函数。

公式(5)中，C_t为当前时刻最终Cell状态，C_t-1为上一个序列的Cell状态。

u_t＝σ(W_o·[u_t-1，x_t]+b₀) (6)

公式(6)中，u_t为输入到下一个时间序列的隐藏状态，W_o和b₀为输出门的权重和偏置。

O_t＝u_t*tanh(C_t) (7)

公式(7)中，O_t为经前向传导运算后得到的输出。

步骤S1031，设置所述LSTM网络模型的超参数，所述超参数包括批量样本大小n、学习速率lr、权重衰退系数λ。其中批量样本n可取用的最大值由内存上限决定，学习速率lr决定收敛速率，权重衰退系数λ防止过拟合。

步骤S1032，从所述训练样本库中获取所需的训练样本数据，并将获取的样本数据生成批量样本；将所述批量样本进行批规范化(Batch Normalization)，获得批规范样本；将所述批规范样本输入到所述LSTM网络模型进行前向传导运算得到预测的输出值，具体运算过程参见公式(2)到公式(7)。

步骤S1033，采用基于时间反向传播算法(BPTT)计算损失函数对参数(整个网络的权重和偏置)的偏导，并用小批量梯度下降算法对损失求最优化解来更新并优化网络权重和偏置参数，直至预设的循环迭代次数完成或者达到预设的预测准确率，根据优化后神经网络权重和偏置参数完成对所述LSTM网络模型的训练；其中，损失计算公式如公式(1)所示：

公式(1)中，S_i为t时刻所述输出层的输出向量O_t中第i个元素的值，y_i为对应的实际驾驶操纵数据中第i个的值，λ为权重衰退系数，n为批量样本大小，w为网络中的权重。

上述公式(1)的推导过程如下：

softmax交叉熵损失计算公式如公式(8)：

C₀＝-Σ_iS_ilog(y_i) (8)

其中，S_i为t时刻该softmax层输出向量中第i个元素的值，y_i为对应的实际样本标签中第i个的值。

为了防止过拟合，提高泛化能力，引入L2正则化，所以总的损失函数计算公式如公式(9)所示：

其中，λ为权重衰退系数,w为网络中的权重。

根据优化后神经网络权重和偏置参数完成对LSTM网络的训练。本步骤中小批量梯度下降方法即在每个循环内更新每一参数时都使用一部分样本来更新。

为了进一步提高自动跟车的效果，作为进一步优化的技术方案，在本实施例中，在对LSTM网络模型进行离线训练之后，可以进一步利用实时采集的驾驶训练数据对LSTM网络模型进行在线微调，具体步骤如下：

步骤S201，根据驾驶员驾驶行为对训练后LSTM网络进行在线微调；具体包括：

步骤S2041，实时采集所述驾驶训练数据，生成在线数据样本。这里的驾驶训练数据的定义和类型与步骤S103中离线训练使用的训练样本中的驾驶训练数据一致，区别在于本步骤中的驾驶训练数据是实时采集的驾驶训练数据，而步骤S103中的驾驶训练数据来源于预先建立的训练样本库。

步骤S2042，设置所述LSTM网络模型的超参数，将在线数据样本输入至训练后的LSTM网络中进行前向传导运算(与步骤S1032中的前向传导运算相同，见公式(2)至公式(7))。

步骤S2043，采用基于小批量梯度下降方法对损失求最优化解来更新和优化神经网络权重和偏置参数，直至设定的循环迭代次数完成，根据优化后神经网络权重和偏置参数完成对所述LSTM网络模型的微调；其中，损失计算公式如公式(1)所示：

本步骤根据驾驶员在线驾驶数据对LSTM网络进行微调,根据驾驶员的驾驶习惯微调全连接层参数,从而使得输出的车辆操作信息更加满足个人驾驶习惯。

实时车况数据输入所述LSTM网络模型进行计算的过程如下，步骤S104进一步包括以下步骤：

步骤S1041，采集实时车况数据，所述实时车况数据包括：车间距、自车车速与前车车速、以及自车加速度。

步骤S1042，将所述实时车况数据经预处理后输入所述LSTM网络模型进行前向传导运算。

步骤S1043，将所述LSTM网络模型的输出向量O_t中的最大元素所在位置对应到车辆相应的操作状态，获得输出向量O_t所对应的车辆油门踏板或制动踏板开度。

步骤S1044，将所述输出向量O_t对应的油门踏板或制动踏板开度转化为当前时刻t的车辆控制信号，发送给对应的底层执行机构，所述底层执行机构根据所述车辆控制信号对车辆进行操纵，实现自动跟车。

所述底层执行机构，即下位机执行模块，具体将车辆控制信号发送给车辆整车控制器，从而由车辆整车控制器进一步控制电机和制动机构，以实现车辆的加速和减速。

实施例2：

如图3所示，一种基于LSTM的模拟驾驶员特性的自动跟车系统，包括环境感知模块1、训练样本库模块2、自动跟车控制算法模块3以及下位机执行模块4；其中：

所述环境感知模块1包括：车速传感器子模块11、加速度传感器子模块12和雷达系统子模块13；所述车速传感器子模块11(具体可选用霍尔齿轮转速传感器SC12-20K)用于实时获取目标车辆的自车车速v1，所述加速度传感器子模块12(具体可选用Xsens MTI-G-710惯性元件)用于实时获取目标车辆的自车加速度a，所述雷达系统子模块13(具体可选用IBEO LUX4L激光雷达)用于实时获取前车车速v2以及目标车辆与前方车辆之间的车间距s。

所述训练样本库模块2用于根据不同地点、天气下采集的驾驶训练数据建立训练样本库；所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据；所述输入特征数据包括自车车速、前车车速、自车加速度、车间距，所述驾驶操纵数据包括油门踏板和制动踏板传感数据。

所述自动跟车控制算法模块3用于建立LSTM网络模型，对所述LSTM网络模型进行离线训练和在线微调，并将所述环境感知模块采集的实时车况数据输入所述LSTM网络模型进行计算，输出车辆操纵信号；所述LSTM网络模型包括1个输入层、2个隐藏层、1个输出层；其中：

所述下位机执行模块4用于执行所述车辆操纵信号，实现自动跟车。

本实施例提供的系统是与实施例1的自动跟车方法相对应的自动跟车系统，其相应的工作原理和工作流程与实施例1基本相同，在此不再赘述。

为了全面准确地评估本发明所提出方法的性能，进行自动跟车实车实验。本实验设计了两段跟车过程，分别模拟跟随前车加速-减速行驶工况以及跟随前车的起停工况。实验结果如图5所示，从结果可得出，本发明设计的自动跟车系统能够实现跟随前车的功能，并且跟随前车过程中，能够实现跟随前车匀速、加速、减速和起停行驶；而且在稳定跟车过程中，目标距离和实际距离之间的偏差在1m左右，整个跟车过程没有抖动，符合人类的驾驶行为特性，满足安全性和舒适性要求，同时也满足响应时间和精度的要求。综上所示，本发明提出的一种基于LSTM的模拟驾驶员特性的自动跟车系统能充分利用优秀驾驶员的历史操纵信息，并结合实时预处理得到的时序特征输入序列，预测出保证安全性、准确性以及舒适性等多目标的车辆操纵信息。基于实车实验测试，证明了本发明在保证可靠性和安全性的基础上，能很好地模拟驾驶员的驾驶操纵行为，实现自动跟车。

本领域的技术人员容易理解，以上仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于LSTM的模拟驾驶员特性的自动跟车方法，用于控制目标车辆自身车速以实现目标车辆与前方车辆的距离保持或车速保持；其中，所述LSTM是指长短期记忆网络；其特征在于，所述自动跟车方法包括以下步骤：

步骤S101，根据不同地点、天气下采集的驾驶训练数据建立训练样本库；所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据；所述输入特征数据包括自车车速、前车车速、自车加速度、车间距，所述驾驶操纵数据包括油门踏板和制动踏板传感器数据；

输入层：定义输入向量X_t为4维向量，其中的4个元素分别表示车间距、自车车速与前车车速、以及自车加速度；将所有输入向量按时间序列展开；其中，所述输入向量X_t是指时间t处的输入；

第一隐藏层：设置为全连接层，包括32个神经元；所述第一隐藏层为dropout层，用于防止模型过拟合，自动丢弃该全连接层内一定比例的神经元；

第二隐藏层：设置为全连接层，包括41个神经元；所述第二隐藏层为dropout层，用于防止模型过拟合，自动丢弃该全连接层内一定比例的神经元；

输出层：设置为softmax分类器；输出向量O_t由当前时间t及之前部分记忆共同计算得到，对应离散纵向车辆操作向量；输出向量O_t中的车辆操作信息为41维向量，分别对应目标车辆的油门与制动踏板的操作状态，其中第1-20个元素表示油门操作，分别对应不同的油门踏板开度；第21个元素表示无操作；第22-41个元素表示制动操作，分别对应不同的制动踏板开度；

步骤S1031，设置所述LSTM网络模型的超参数，所述超参数包括批量样本大小n、学习速率lr、权重衰退系数λ；

步骤S1032，从所述训练样本库中获取所需的样本数据，并将获取的样本数据生成批量样本；将所述批量样本进行批规范化，获得批规范样本；将所述批规范样本输入到所述LSTM网络模型进行前向传导运算；

公式(1)中，S_i为t时刻所述输出层的输出向量O_t中第i个元素的值，y_i为对应的实际驾驶操纵数据中第i个的值，λ为权重衰退系数，n为批量样本大小，w为网络中的权重；

2.根据权利要求1所述的自动跟车方法，其特征在于，在所述步骤S103和步骤S104之间，进一步包括以下步骤：

步骤S2011，实时采集所述驾驶训练数据，生成在线数据样本；

步骤S2012，设置所述LSTM网络模型的超参数，将在线数据样本输入至训练后的LSTM网络中进行前向传导运算；

步骤S2013，采用基于小批量梯度下降方法对损失求最优化解来更新和优化神经网络参数，直至设定的循环迭代次数完成，根据优化后神经网络权重和偏置参数完成对所述LSTM网络模型的微调；其中，损失计算公式如公式(1)所示：

3.根据权利要求1所述的自动跟车方法，其特征在于，所述步骤S104进一步包括以下步骤：

步骤S1041，采集实时车况数据，所述实时车况数据包括：车间距、自车车速与前车车速、以及自车加速度；

步骤S1042，将所述实时车况数据经预处理后输入所述LSTM网络模型进行前向传导运算；

步骤S1043，将所述LSTM网络模型的输出向量O_t中的最大元素所在位置对应到车辆相应的操作状态，获得输出向量O_t所对应的车辆油门踏板或制动踏板开度；

4.根据权利要求1所述的自动跟车方法，其特征在于，所述步骤S101进一步包括以下步骤：

步骤S1011，在不同地点、天气下，用实验车辆采集城市道路环境下驾驶训练数据；所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据，所述输入特征数据包括自车车速、前车车速、自车加速度、车间距，所述驾驶操纵数据包括油门踏板和制动踏板传感数据；

步骤S1012，将输入特征数据与对应的驾驶操纵数据进行同步，

5.根据权利要求1所述的自动跟车方法，其特征在于，所述前向传导运算具体为：

LSTM内部结构包括Cell单元以及三个门控单元结构，三个门控单元分别为遗忘门单元、外部输入门单元、输出门单元；前向传导运算公式如下：

f_t＝σ(W_f.[u_t-1,x_t]+b_f) (2)

公式(2)中，f_t为遗忘门的输出，x_t为网络输入，u_t-1为上一个时间序列的隐藏状态，W_f和b_f为遗忘门的权重和偏置；σ为sigmoid函数，表达式为

i_t＝σ(W_i.[u_t-1,x_t]+b_i) (3)

公式(3)中，i_t为输入门的输出，x_t为网络输入，W_i和b_i为输入门的权重和偏置；

公式(4)中，

为由当前输入下Cell状态，x_t为网络输入，W_c和b_C为Cell状态的权重和偏置，tanh函数为双曲正切函数；

公式(5)中，C_t为当前时刻最终Cell状态，C_t-1为上一个序列的Cell状态；

u_t＝σ(W_o.[u_t-1,x_t]+b₀) (6)

公式(6)中，u_t为输入到下一个时间序列的隐藏状态，W_o和b₀为输出门的权重和偏置；

O_t＝u_t*tanh(C_t) (7)

公式(7)中，O_t为经前向传导运算后得到的输出。

6.一种基于LSTM的模拟驾驶员特性的自动跟车系统，其中，所述LSTM是指长短期记忆网络；其特征在于，所述自动跟车系统包括环境感知模块、训练样本库模块、自动跟车控制算法模块以及下位机执行模块；其中：

所述环境感知模块包括：车速传感器、加速度传感器和雷达系统模块；所述车速传感器用于实时获取目标车辆的自车车速v1，所述加速度传感器模块用于实时获取目标车辆的自车加速度a，所述雷达系统模块用于实时获取前车车速v2以及目标车辆与前方车辆之间的车间距s；

所述训练样本库模块用于根据不同地点、天气下采集的驾驶训练数据建立训练样本库；所述驾驶训练数据包括输入特征数据以及对应的驾驶操纵数据；所述输入特征数据包括自车车速、前车车速、自车加速度、车间距，所述驾驶操纵数据包括油门踏板和制动踏板传感数据；

输出层：设置为softmax分类器；输出向量O_t由当前时间t及之前部分记忆共同计算得到，对应离散纵向车辆操作向量；输出向量O_t中的车辆操作信息为41维向量，分别对应目标车辆的油门与制动踏板的操作状态，其中第1-20个元素表示油门操作，第21个元素表示无操作，第22-41个元素表示制动操作；