CN110941272B

CN110941272B - 自动驾驶控制方法和设备

Info

Publication number: CN110941272B
Application number: CN201911182934.0A
Authority: CN
Inventors: 李慧云; 方文其
Original assignee: Shenzhen Institute of Advanced Technology of CAS
Current assignee: Shenzhen Institute of Advanced Technology of CAS
Priority date: 2019-11-27
Filing date: 2019-11-27
Publication date: 2022-09-06
Anticipated expiration: 2039-11-27
Also published as: CN110941272A

Abstract

本发明提出了一种自动驾驶控制方法和设备，其中该方法包括：通过所述高斯过程模型基于所述车辆的当前的状态参数进行预测，得到预测控制参数；其中，所述高斯过程模型是基于预设的训练数据所建立；获取所述车辆上预设传感器检测到的相较于所述控制目标的控制偏差；基于所述控制偏差与所述预测控制参数进行运算反馈得到执行参数；基于所述执行参数进行车辆的自动驾驶控制。中基于高斯过程确定复杂系统中不能直接建模的部分，然后在高斯过程所确定结果的基础上给予反馈控制来处理实时的不确定性，以此结合了高斯过程与反馈控制两者的优点并应用在自动驾驶上，即使样本数据少，也起到了很好的自动控制的效果。

Description

自动驾驶控制方法和设备

技术领域

本发明涉及自动驾驶领域，特别涉及一种自动驾驶控制方法和设备。

背景技术

智能驾驶是未来车辆发展的必然趋势，是避免人为驾驶失误和提高交通效率的有效途径。且现有通信、电子与计算机技术的日新月异发展也为智能驾驶技术的开发奠定了坚实的基础。美国电气和电子工程师协会(IEEE)预测到2040年，75％的车辆将是智能驾驶汽车。智能驾驶车辆的市场增速将是其他车辆的10倍，并且智能驾驶车辆的出现将交通事故率降至10％。

为了实现无人车在真实道路上的安全行驶，不但需要车体感知端对物体进行精确的识别与追踪，而且需要决策控制端能够根据当前的道路状况做出合理的动作。它主要包括行为预测，避障，轨迹规划、动作规划和执行机构等部分。

由于驾驶场景相对复杂,驾驶员的行为通常又是复杂多变的，交通道路突发情况亦时有发生，难以进行准确而完整的建模。有限状态机模型曾被广泛的用于无人驾驶决策的建模，可支持动态建模，它将造成驾驶行为变化的事件进行归纳总结，分成有限个驾驶行为，每种行为对应于不同的车辆操控方式，基于规则或统计模型构建无人驾驶决策模型。基于规则的决策模型能够快速实现功能，但是不能够穷举所有的决策状态。

另外，随着Carla、Torcs等模拟器的推出，强化学习也逐渐用于无人驾驶决策的研究，尤其是在仿真环境下，能够完成从像素输入到执行输出的端到端效果。但是，与棋类运动和电脑游戏不同，目前强化学习要完全用于自动驾驶，还存在以下三个难点：

1.“高”，即状态和行为维数高。凭借具有深度、鱼眼和普通图像拍摄功能的实感TM摄像头获得图像，分析出车的方向、姿态以及障碍物，并通过分析状态决策出可行驶路径，并进行动作规划，从而控制车辆的方向盘角度与速度、加速度。这个过程所涉及的状态和行为的维数以百计，而对每个状态行为进行价值计算也非常困难。

2.“大”，即状态信息误差大。棋类运动中的状态(盘面)信息完全准确，但车辆所面对的状态信息，大多存在明显误差。如特殊工况路况场景中(雨雪雾，反光、阴影等)，车辆传感器所获得速度、角度、障碍物、路面坡度等信息都存在误差。误差可能是由机械振动或运动等因素造成，也可能是因为传感器精度不够高，存在噪声，亦或是对系统的非线性系统的简化。这些误差都增加了强化学习的难度。

3.“少”，即样本量少。不同于人脸等图像识别任务中动辄百万的训练样本，车辆无人驾驶强化学习可获得的样本数量少、成本高，主要原因是极端情况的再现困难

目前无人驾驶决策控制方法中由于环境为非线性系统，且不确定性高，无法采用传统控制方法对系统建模控制，另一方面，由于自动驾驶状态和行为维数高，状态信息误差大，样本数据量小，也无法直接采用机器学习。

发明内容

针对现有技术中的缺陷，本发明提出了一种自动驾驶控制方法和设备，基于高斯过程确定复杂系统中不能直接建模的部分，然后在高斯过程所确定结果的基础上给予反馈控制来处理实时的不确定性，以此结合了高斯过程与反馈控制两者的优点并应用在自动驾驶上，即使样本数据少，也起到了很好的自动控制的效果。

具体的，本发明提出了以下具体的实施例：

本发明实施例提测了一种自动驾驶控制方法，应用于车辆进行预设控制目标的自动驾驶控制，该方法包括：

通过所述高斯过程模型基于所述车辆的当前的状态参数进行预测，得到预测控制参数；其中，所述高斯过程模型是基于预设的训练数据所建立；

获取所述车辆上预设传感器检测到的相较于所述控制目标的控制偏差；

基于所述控制偏差与所述预测控制参数进行运算反馈得到执行参数；

基于所述执行参数进行车辆的自动驾驶控制。

在一个具体的实施例中，所述训练数据包括：作为样本的状态参数、与作为样本的状态参数对应的执行参数。

在一个具体的实施例中，所述控制偏差对应的项目包括：车辆前进方向与所在车道坐标系纵轴的夹角、车辆车体坐标系原点距离所在车道轴线的侧方偏移距离。

在一个具体的实施例中，所述“基于所述控制偏差与所述预测控制参数进行运算反馈得到执行参数”，包括：

基于相同项目下的所述控制偏差与所述预测控制参数进行运算反馈得到相同项目下的执行参数。

通过PID基于所述控制偏差与所述预测控制参数得到执行参数；或

通过MPC基于所述控制偏差与所述预测控制参数得到执行参数；或

通过LQR基于所述控制偏差与所述预测控制参数得到执行参数。

在一个具体的实施例中，所述“通过PID基于所述控制偏差与所述预测控制参数得到执行参数”是基于下述公式来进行的：

其中，U(t)为执行参数；kp为比例增益；Ti为积分时间常数；Td为微分时间常数；err(t)为所述控制偏差与所述预测控制参数的差值比例增益。

在一个具体的实施例中，所述比例增益、所述积分时间常数、所述微分时间常数均是通过输入预设的模拟环境下按照预设规则进行数值大小调整得到的；

其中，预设规则是，在预设的模拟环境下输出不振荡时，增大比例增益、或减小积分时间常数、或增大微分时间常数。

本发明实施例还提出一种自动驾驶控制设备，应用于车辆进行预设控制目标的自动驾驶控制，该设备包括：

预测模块，用于通过所述高斯过程模型基于所述车辆的当前的状态参数进行预测，得到预测控制参数；其中，所述高斯过程模型是基于预设的训练数据所建立；

获取模块，用于获取所述车辆上预设传感器检测到的相较于所述控制目标的控制偏差；

反馈模块，用于基于所述控制偏差与所述预测控制参数进行运算反馈得到执行参数；

执行模块，用于基于所述执行参数进行车辆的自动驾驶控制。

本发明实施例还提测了一种终端，应用于车辆进行预设控制目标的自动驾驶控制，该设备包括：

存储器；所述存储器存储有执行程序；

处理器，所述处理器执行所述执行程序，以执行下列流程：

基于所述执行参数进行车辆的自动驾驶控制。

本发明实施例还提出了一种存储介质，存储有应用于车辆进行预设控制目标的自动驾驶控制的控制程序，所述控制程序用于执行以下流程：

基于所述执行参数进行车辆的自动驾驶控制。

以此，本发明实施例中基于高斯过程确定复杂系统中不能直接建模的部分，然后在高斯过程所确定结果的基础上给予反馈控制来处理实时的不确定性，以此结合了高斯过程与反馈控制两者的优点并应用在自动驾驶上，即使样本数据少，也起到了很好的自动控制的效果。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明实施例提出的一种自动驾驶控制方法的流程示意图；

图2为本发明实施例提出的一种自动驾驶控制方法的框架流程示意图；

图3为本发明实施例提出的一种自动驾驶控制方法中仅基于高斯过程进行决策的效果示意图；

图4为本发明实施例提出的一种自动驾驶控制方法中状态信息的物理意义示意图；

图5为本发明实施例提出的一种自动驾驶控制方法的整体流程示意图；

图6为本发明实施例提出的一种自动驾驶控制方法的整体流程示意图；

图7为本发明实施例提出的一种自动驾驶控制方法的效果示意图；

图8为本发明实施例提出的一种自动驾驶控制设备的结构示意图。

具体实施方式

在下文中，将更全面地描述本公开的各种实施例。本公开可具有各种实施例，并且可在其中做出调整和改变。然而，应理解：不存在将本公开的各种实施例限于在此公开的特定实施例的意图，而是应将本公开理解为涵盖落入本公开的各种实施例的精神和范围内的所有调整、等同物和/或可选方案。

在本公开的各种实施例中使用的术语仅用于描述特定实施例的目的并且并非意在限制本公开的各种实施例。如在此所使用，单数形式意在也包括复数形式，除非上下文清楚地另有指示。除非另有限定，否则在这里使用的所有术语(包括技术术语和科学术语)具有与本公开的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义，除非在本公开的各种实施例中被清楚地限定。

实施例1

本发明实施例1公开了一种自动驾驶控制方法，应用于车辆进行预设控制目标的自动驾驶控制，如图1所示，该方法包括：

步骤101、通过所述高斯过程模型基于所述车辆的当前的状态参数进行预测，得到预测控制参数；其中，所述高斯过程模型是基于预设的训练数据所建立；

具体的，高斯过程模型是基于高斯过程生成，具体的，高斯过程(GaussianProcess，GP)作为一种非参数贝叶斯方法，它与神经网络、支持向量机等模型相比，具有明显的优势：(1)利用先验概率表示出过程的先验信息，并利用贝叶斯方法进行模型选择，提升模型回归性能；(2)预测具有概率性质，定量的给出输出预测的不确定性；(3)模型参数明显减少，且超参数自适应获取。

GP的全部统计特征f(t)完全由它的均值m(t)和协方差函数k(t,t')来确定，其定义式表示如下：

f(t)～GP(m(t),k(t,t'))(1)在此外，对GP回归模型进行说明如下。

假设有n个观察数据的训练集D＝{(x_i,y_i)|i＝1,...,n}，d维输入矢量x_i∈R^d，相应的输出标量y_i∈R，也即对应训练数据，包括输入参数，以及输出参数。如果X表示d×n维输入矩阵，y表示输出矢量，那么训练集D＝(X,y)，对于新的输入x^*，GP模型的任务是根据先验知识预测出与x^*相对应的输出值y^*。

假设观察目标值y被噪声腐蚀，它与真实输出值t相差ε：

y＝t+ε (2)

其中ε为独立的随机变量，符合高斯分布，均值为0，方差为

即

观察目标值y的先验分布为

式中：K＝K(X,X)为n×n阶对称正定的协方差矩阵，矩阵中的任一项K_ij度量了x_i和x_j的相关性。

n个训练样本输出y和1个测试样本输出y^*所形成的联合高斯先验分布。

根据贝叶斯原理在训练集的基础上预测出与x^*对应的最可能的输出值。采用贝叶斯原理的目的是利用观察到的真实数据不断更新概率预测分布，即给定新的输入x^*、训练集的输入值X和观察目标值y的条件下，推断出y^*的最大可能的预测后验分布p(y^*|x^*,X,y)，预测后验分布是高斯型的：

y^*的均值和方差为

对于无人驾驶，首先有一个高斯过程先验分布，观测到一些状态Sates与动作Action数据(也即训练数据)，基于先验和假设(联合高斯分布)计算得到高斯过程后验分布的均值和协方差。将此模型用于新的Sates，就可以得到预测的Action，其过程如图2所示。

在一个具体的实施例中，例如在车辆驾驶过程中，以前一百个有人驾驶下的waypoints(路径点)的states和action作为训练数据，预测后十个way points下已知states的action，在此选取训练数据中的方向盘转角弧度(steer)来进行处理，得到如图3所示的结果、图3中prediction value指高斯过程模型下的计算值、predict point则是指希望预测的值。

在一个具体的实施例中无人驾驶的状态(states)信息描述及其符号表示可以如下表所述：

表1状态信息

此外，如图3所示，图中的靠近边缘的实线表示车道边缘，中间德尔虚线表示车道的中轴线，汽车纵向速度v与车道中轴线的夹角即为

绿线表示的距离d₁为汽车与正前方车道边缘线的距离，蓝线表示的距离d₂为车体坐标系原点距离车道中轴线的距离。

下述为一个具体实施例中无人驾驶的动作(action)列表：

表2动作信息

基于高斯过程确定复杂系统中不能直接建模的部分，然后在高斯过程所确定结果的基础上给予反馈控制来处理实时的不确定性，以此结合了高斯过程与反馈控制两者的优点并应用在自动驾驶上，即使样本数据少，也起到了很好的自动控制的效果。

后续的反馈控制的过程如下：

步骤102、获取所述车辆上预设传感器检测到的相较于所述控制目标的控制偏差；

具体的，自动驾驶控制的车辆上设置有多种传感器，可以实时检测车辆的状态，传感器实时检测控制目标的某些参数(如车速、位置)，与控制目标(如车速巡航在80km/h、车辆保持在车道线中间)相比，得到控制偏差。将这个偏差经过某些运算反馈叠加到输入端，就可以达到特定的控制目标。

步骤103、基于所述控制偏差与所述预测控制参数进行运算反馈得到执行参数；

步骤104、基于所述执行参数进行车辆的自动驾驶控制。

在一个具体的实施例中，控制偏差对应的项目可以有很多种，例如上述表1中所述的参数，但是出于减少数据处理量且兼顾自动控制的需要(数据处理量减小导致处理速度快，车辆自动驾驶时对实时性的要求会更高一些些)，所述控制偏差对应的项目包括：车辆前进方向与所在车道坐标系纵轴的夹角、车辆车体坐标系原点距离所在车道轴线的侧方偏移距离。

具体的，后续对应的调整的参数就可以对应车辆前进方向与所在车道坐标系纵轴的夹角、车辆车体坐标系原点距离所在车道轴线的侧方偏移距离这两个来进行运算反馈调整。

具体的，所述“基于所述控制偏差与所述预测控制参数进行运算反馈得到执行参数”，包括：

具体的，例如项目为车辆前进方向与所在车道坐标系纵轴的夹角，再次情况下，会就基于车辆前进方向与所在车道坐标系纵轴的夹角的控制偏差以及车辆前进方向与所在车道坐标系纵轴的夹角的预测控制参数来进行运算反馈，从而得到车辆前进方向与所在车道坐标系纵轴的夹角下的执行参数。

通过PID(比例积分微分控制器)基于所述控制偏差与所述预测控制参数得到执行参数；或

通过MPC(线性二次型调节器)基于所述控制偏差与所述预测控制参数得到执行参数；或

通过LQR(模型预测控制)基于所述控制偏差与所述预测控制参数得到执行参数。

具体的，除了上述3种控制方法以外，还可以采用最优控制、自适应控制、模糊控制、鲁棒控制等方式来进行。具体的控制方法图如图5所示。

在此，以一个具体的例子来进行说明，所述“通过PID基于所述控制偏差与所述预测控制参数得到执行参数”是基于下述公式来进行的：

其中，U(t)为执行参数；kp比例增益为；Ti为积分时间常数；Td为微分时间常数；err(t)为所述控制误差与所述预测控制参数的差值比例增益。

在实际的应用中，kp，Ti，T_D均是PID控制中待调试参数.

具体的，PID调试的一般原则如下：

a.在输出不振荡时，增大比例增益kp。

b.在输出不振荡时，减小积分时间常数Ti。

c.在输出不振荡时，增大微分时间常数T_D。

更具体的步骤如下：

a.确定比例增益kp

确定比例增益kp时，首先去掉PID的积分项和微分项，一般是令Ti＝0、T_D＝0(具体见PID的参数设定说明)，使PID为纯比例调节。输入设定为系统允许的最大值的60％～70％，由0逐渐加大比例增益P，直至系统(也即模拟环境下)出现振荡；再反过来，从此时的比例增益P逐渐减小，直至系统振荡消失，记录此时的比例增益P。比例增益P调试完成。

b.确定积分时间常数Ti

比例增益kp确定后，按照经验设定一个较大的积分时间常数Ti的初值，然后逐渐减小Ti，直至模拟环境下出现振荡，之后在反过来，逐渐加大Ti，直至系统振荡消失。记录此时的Ti，积分时间常数Ti调试完成。

c.确定积分时间常数Td

积分时间常数Td一般不用设定，为0即可。若要设定，与确定P和Ti的方法相同。

d.系统空载、带载联调，再对PID参数进行微调，直至满足要求，在实际环境中逐项微调。

以转弯为例，在本方案的action中，方向盘角度(steering angle)，在高斯过程拟合后得到θ(t)，在驾驶环境中得到期望方向盘角度为误差θ*(t)，则误差为θerr(t)＝θ*(t)-θ(t)，通过PID控制器(这里简化到只用比例控制)，得到

如图8所示，从图中可以看出，除了部分剧烈震荡的部分，本方案能够近乎准确的捕捉到角度变化趋势，证明了本方案的有效性。

实施例2

本发明实施例2还公开了一种自动驾驶控制设备，应用于车辆进行预设控制目标的自动驾驶控制，如图该设备包括：

预测模块201，用于通过所述高斯过程模型基于所述车辆的当前的状态参数进行预测，得到预测控制参数；其中，所述高斯过程模型是基于预设的训练数据所建立；

获取模块202，用于获取所述车辆上预设传感器检测到的相较于所述控制目标的控制偏差；

反馈模块203，用于基于所述控制偏差与所述预测控制参数进行运算反馈得到执行参数；

执行模块204，用于基于所述执行参数进行车辆的自动驾驶控制。

具体的，本发明实施例2还公开有其他的特征，具体的请参见实施例1中的相关特征记载。

实施例3

本发明实施例还公开了一种终端，应用于车辆进行预设控制目标的自动驾驶控制，该设备包括：

存储器；所述存储器存储有执行程序；

处理器，所述处理器执行所述执行程序，以执行下列流程：

基于所述执行参数进行车辆的自动驾驶控制。

具体的，本发明实施例3还公开有其他的特征，具体的请参见实施例1中的相关特征记载。

实施例4

本发明实施例4还公开了一种存储介质，存储有应用于车辆进行预设控制目标的自动驾驶控制的控制程序，所述控制程序用于执行以下流程：

基于所述执行参数进行车辆的自动驾驶控制。

具体的，本发明实施例4还公开有其他的特征，具体的请参见实施例1中的相关特征记载。

本领域技术人员可以理解附图只是一个优选实施场景的示意图，附图中的模块或流程并不一定是实施本发明所必须的。

本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中，也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块，也可以进一步拆分成多个子模块。

上述本发明序号仅仅为了描述，不代表实施场景的优劣。

以上公开的仅为本发明的几个具体实施场景，但是，本发明并非局限于此，任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims

1.一种自动驾驶控制方法，其特征在于，应用于车辆进行预设控制目标的自动驾驶控制，该方法包括：

通过预设高斯过程模型基于所述车辆的当前的状态参数进行预测，得到预测控制参数；其中，所述高斯过程模型是基于预设的训练数据所建立；

通过PID基于所述控制偏差与所述预测控制参数进行运算反馈得到执行参数；

基于所述执行参数进行车辆的自动驾驶控制；

其中，通过PID基于所述控制偏差与所述预测控制参数得到执行参数是基于下述公式来进行的：

2.如权利要求1所述的一种自动驾驶控制方法，其特征在于，所述训练数据包括：作为样本的状态参数、与作为样本的状态参数对应的执行参数。

3.如权利要求1所述的一种自动驾驶控制方法，其特征在于，所述控制偏差对应的项目包括：车辆前进方向与所在车道坐标系纵轴的夹角、车辆车体坐标系原点距离所在车道轴线的侧方偏移距离。

4.如权利要求3所述的一种自动驾驶控制方法，其特征在于，所述“基于所述控制偏差与所述预测控制参数进行运算反馈得到执行参数”，包括：

5.如权利要求1所述的一种自动驾驶控制方法，其特征在于，所述比例增益、所述积分时间常数、所述微分时间常数均是通过输入预设的模拟环境下按照预设规则进行数值大小调整得到的；

6.一种自动驾驶控制设备，其特征在于，应用于车辆进行预设控制目标的自动驾驶控制，该设备包括：

预测模块，用于通过预设高斯过程模型基于所述车辆的当前的状态参数进行预测，得到预测控制参数；其中，所述高斯过程模型是基于预设的训练数据所建立；

反馈模块，用于通过PID基于所述控制偏差与所述预测控制参数进行运算反馈得到执行参数；

执行模块，用于基于所述执行参数进行车辆的自动驾驶控制；

7.一种终端，其特征在于，应用于车辆进行预设控制目标的自动驾驶控制，该终端包括：

存储器；所述存储器存储有执行程序；

处理器，所述处理器执行所述执行程序，以执行下列流程：

基于所述执行参数进行车辆的自动驾驶控制；

8.一种存储介质，其特征在于，存储有应用于车辆进行预设控制目标的自动驾驶控制的控制程序，所述控制程序用于执行以下流程：

基于所述执行参数进行车辆的自动驾驶控制；