CN111984018A

CN111984018A - 自动驾驶方法及装置

Info

Publication number: CN111984018A
Application number: CN202011025569.5A
Authority: CN
Inventors: 蔡俊杰; 张春晖; 刘荣; 吴俊�
Original assignee: Zebra Network Technology Co Ltd
Current assignee: Zebra Network Technology Co Ltd
Priority date: 2020-09-25
Filing date: 2020-09-25
Publication date: 2020-11-24

Abstract

本申请提供一种自动驾驶方法及装置，该方法包括：获取车辆周围的环境信息；将车辆周围的环境信息输入自动驾驶模型，并获取自动驾驶模型输出的自动驾驶策略，自动驾驶模型是使用样本集训练后生成的，样本集包括有车辆的历史环境信息和与历史环境信息对应的安全员输入的自动驾驶策略；根据自动驾驶策略控制车辆进行自动驾驶。与现有的自动驾驶方案相比，本申请使用通过样本集训练后生成的自动驾驶模型输出的自动驾驶策略控制车辆进行自动驾驶，提高了车辆自动驾驶的安全性。

Description

自动驾驶方法及装置

技术领域

本申请涉及车辆自动驾驶技术领域，尤其涉及一种自动驾驶方法及装置。

背景技术

自动驾驶汽车依靠人工智能、视觉计算、雷达、监控装置和全球定位系统协同合作，让电脑可以在没有任何人类主动的操作下，自动安全地操作机动车辆。

目前业界最先进的自动驾驶方案，从算法层面主要由感知、规划和决策构成。其中，感知是理解环境，极度依赖以深度学习为基础的人工智能技术，规划和决策，也由纯基于规则向规则和深度学习结合的方向演进。

但是，深度学习依赖大量数据的学习，对于没有处理过的数据，可能会产生错误的结论。在自动驾驶的场景里，这就意味着，对没遇到过的场景，自动驾驶车辆可能会做出不符合安全规则的危险动作。因此，现有的自动驾驶方案的安全性低。

发明内容

本申请提供一种自动驾驶方法及装置，以解决现有的自动驾驶方案安全性低的问题。

本申请的第一方面提供一种自动驾驶方法，包括：

获取车辆周围的环境信息；

将所述车辆周围的环境信息输入自动驾驶模型，并获取所述自动驾驶模型输出的自动驾驶策略，所述自动驾驶模型是使用样本集训练后生成的，所述样本集包括有车辆的历史环境信息和与所述历史环境信息对应的安全员输入的自动驾驶策略；

根据所述自动驾驶策略控制所述车辆进行自动驾驶。

在一种可选的实施方式中，在所述将所述车辆周围的环境信息输入自动驾驶模型之前，所述方法还包括：

使用所述样本集对所述自动驾驶模型进行训练。

在一种可选的实施方式中，在所述使用所述样本集对所述自动驾驶模型进行训练之后，所述方法还包括：

使用测试集确定所述自动驾驶模型的精度；

若所述自动驾驶模型的精度大于或等于精度阈值，则确定所述自动驾驶模型训练完成。

若所述自动驾驶模型的精度小于精度阈值，则继续使用所述样本集对所述自动驾驶模型进行训练。

在一种可选的实施方式中，所述使用所述样本集对所述自动驾驶模型进行训练，包括：

若所述样本集的数据量超过数据量阈值，则使用所述样本集对所述自动驾驶模型进行训练。

在一种可选的实施方式中，在所述使用所述样本集对所述自动驾驶模型进行训练之前，所述方法还包括：

检测所述车辆的行驶状态；

所述使用所述样本集对所述自动驾驶模型进行训练，包括：

若检测到所述车辆处于停车状态，则使用所述样本集对所述自动驾驶模型进行训练。

在一种可选的实施方式中，所述自动驾驶策略包括以下至少一项：纠正停车位置、规划行驶路线、清除误判障碍物和调整安全距离。

本申请的第二个方面提供一种自动驾驶装置，所述装置包括：

获取模块，用于获取车辆周围的环境信息；

处理模块，用于将所述车辆周围的环境信息输入自动驾驶模型，并获取所述自动驾驶模型输出的自动驾驶策略，所述自动驾驶模型是使用样本集训练后生成的，所述样本集包括有车辆的历史环境信息和与所述历史环境信息对应的安全员输入的自动驾驶策略；根据所述自动驾驶策略控制所述车辆进行自动驾驶。

在一种可选的实施方式中，所述装置还包括：

训练模块，用于使用所述样本集对所述自动驾驶模型进行训练。

在一种可选的实施方式中，所述训练模块，还用于使用测试集确定所述自动驾驶模型的精度；若所述自动驾驶模型的精度大于或等于精度阈值，则确定所述自动驾驶模型训练完成。

在一种可选的实施方式中，所述训练模块，还用于若所述自动驾驶模型的精度小于精度阈值，则继续使用所述样本集对所述自动驾驶模型进行训练。

在一种可选的实施方式中，所述训练模块，具体用于若所述样本集的数据量超过数据量阈值，则使用所述样本集对所述自动驾驶模型进行训练。

在一种可选的实施方式中，所述处理模块，还用于检测所述车辆的行驶状态；

所述训练模块，具体用于若检测到所述车辆处于停车状态，则使用所述样本集对所述自动驾驶模型进行训练。

本申请的第三方面提供一种电子设备，包括：至少一个处理器和存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述电子设备执行上述自动驾驶方法。

本申请的第四方面提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机执行指令，当所述计算机执行指令被处理器执行时，实现上述自动驾驶方法。

本申请提供的自动驾驶方法及装置，车载终端将车辆周围的环境信息输入自动驾驶模型，获取自动驾驶模型输出的自动驾驶策略，使用获取的自动驾驶策略控制车辆进行自动驾驶。其中，自动驾驶模型是使用车辆的历史环境信息和与历史环境信息对应的安全员输入的自动驾驶策略训练后生成的。与现有的自动驾驶方案相比，本申请使用车辆的历史环境信息和与历史环境信息对应的安全员输入的自动驾驶策略训练自动驾驶模型，并通过自动驾驶模型确定自动驾驶策略，从而控制车辆进行自动驾驶，提高了车辆自动驾驶的安全性。

附图说明

图1为本申请实施例提供的一种自动驾驶方法的场景示意图；

图2为本申请实施例提供的一种自动驾驶方法的流程示意图；

图3为本申请实施例提供的另一种自动驾驶方法的流程示意图；

图4为本申请实施例提供的一种车载终端自动驾驶模型训练方法的流程示意图；

图5为本申请实施例提供的一种服务器端的自动驾驶模型训练方法的流程示意图；

图6为本申请实施例提供的一种自动驾驶装置的结构示意图；

图7为本申请实施例提供的一种电子设备的结构示意。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请的实施例，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

自动驾驶汽车通过车载传感器接收外界驾驶环境的相关信息，将所探测到的信息输入到车载电脑的中央处理器(Central Processing Unit，CPU)进行逻辑推理和运算，然后将结果指令输出到执行器，通过改变汽车转向、速度等控制车辆的运行。汽车自动驾驶的目的是实现汽车在限定或非限定条件下代替人类驾驶员，进行部分自动或全自动安全、可靠地驾驶。自动驾驶技术主要涉及硬件系统和软件系统，硬件系统包括电源模块、感知模块、决策模块和控制模块，软件系统包括感知、融合、决策和控制四个方面，其中感知是理解环境，极度依赖以深度学习为基础的人工智能技术，决策也由纯基于规则逐渐转向规则和深度学习相结合的方向。

但是，深度学习依赖大量数据的学习，对于没有处理过的数据，可能会产生错误的结论。在自动驾驶的场景里，这就意味着，对没遇到过的场景，自动驾驶车辆可能会做出不符合安全规则的危险动作造成自动驾驶方案的安全性低的问题。

为解决上述问题，本申请实施例提供一种自动驾驶方法及装置，以提高自动驾驶的安全性。在本申请中，自动驾驶模型是通过车辆的历史环境信息和与历史环境信息对应的安全员输入的自动驾驶策略训练后生成的，车载终端使用训练后的自动驾驶模型确定自动驾驶策略，从而控制车辆进行自动驾驶。与现有方案相比，提高了车辆自动驾驶的安全性。

下面对本申请的应用场景进行说明。

图1为本申请实施例提供的一种自动驾驶方法的场景示意图。如图1所示，车载终端001和服务器002交互。车载终端001在本地完成自动驾驶模型的训练和更新后，上传车辆周围的环境信息和安全员输入的自动驾驶策略到服务器002，服务器002完成自动驾驶模型的训练和更新后，向车载终端001发送更新后的自动驾驶模型，车载终端使用更新后的自动驾驶模型生成的自动驾驶策略控制车辆实现自动驾驶。

在一种可选的实施方式中，车载终端001可以上传更新后的自动驾驶模型到服务器002。

其中，车载终端001所在的车辆可以是轿车、多用途汽车(Multi-PurposeVehicles，MPV)车型、运动型实用汽车(Sport Utility Vehicles，SUV)车型、皮卡、客车、载货车、半挂车、客车非完整车和载货非完整车等。服务器002可以是台式服务器、机架式服务器、机柜式服务器和刀片式服务器等。

本申请实施例中，对于自动驾驶模型的上传和发送的方式不做限制，具体的可以通过网络传输，示例性的，通过蓝牙、局域网和广域网等。

需要说明的是，本申请实施例中涉及应用场景并不构成限制，本申请实施例提供的自动驾驶方法也可以运用于其他任何自动驾驶的场景中。

可以理解，上述自动驾驶方法可以通过本申请实施例提供的自动驾驶装置实现，自动驾驶装置可以是某个设备的部分或全部，例如为上述车载终端或车载终端的处理器。本申请实施例中，用于实现自动驾驶的功能的装置可以是车载终端设备，也可以是能够支持车载终端实现该功能的装置，例如芯片系统，该装置可以被安装在终端设备中。本申请实施例中，芯片系统可以由芯片构成，也可以包括芯片和其他分立器件。

下面以车载终端为例，以具体地实施例对本申请实施例的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

图2为本申请实施例提供的一种自动驾驶方法的流程示意图，图2所示方法是本实施例涉及的自动驾驶方法的具体过程。如图2所示，该方法包括：

S101、车载终端获取车辆周围的环境信息。

其中，车辆周围的环境信息包括车辆所处位置周围的环境和车辆自身的状态。示例性的，车辆所处的位置的周围的环境可以分为静态环境和动态环境。其中，静态环境具体的可以是道路线、路灯、人行道线和路边设施等，动态环境具体的可以是人行道上行人的状态、周围车辆的行驶状态和红路灯的状态等。车辆自身的状态具体的可以是当前车辆是否在刹车、加速、减速或者停车状态、车辆的加速度和车辆当前的位置等。

本申请实施例对于车载终端如何获取环境信息不做限制，例如，车载终端通过车端的传感器获取车辆周围的环境信息。

示例性的，传感器可以是惯性测量单元(Inertial Measurement Unit，IMU)、智能探测及测距(Intelligent Detection and Ranging，IDAR)、摄像头、雷达和声呐等。

此外，在另一些实施例中，还可以通过全球定位系统(Global PositioningSystem,GPS)获取车辆的位置信息。

应理解，通过整合GPS和IMU数据，可以得到足够准确和实时的位置信息。IDAR将激光雷达和微光摄像机相结合，同时嵌入人工智能系统，可以优化数据采集流程，减少带宽，提高视觉感知能力，并且迅速为自动驾驶车辆制定运动规划。摄像头用于物体识别和跟踪，比如道线检测，路灯检测，人行道等。

S102、车载终端将车辆周围的环境信息输入自动驾驶模型，并获取自动驾驶模型输出的自动驾驶策略。在本步骤中，车载终端获取车辆周围的环境信息后，可以将车辆周围的环境信息输入自动驾驶模型，并获取自动驾驶模型输出的自动驾驶策略。

本申请实施例中，对于自动驾驶模型的类型不做限制，具体的可以是部分可观测马尔可夫决定过程模型(partially observable markov decision process，POMDP)、责任敏感安全模型(responsibility sensitive safety，RSS)、卷积神经网络模型(convolutional neural networks，CNN)、神经网络回归模型(quantile regressionneural network，QRNN)或者循环神经网络模型(recurrent neural network，RNN)等。

在本申请实施例中，自动驾驶策略包括以下至少一项：纠正停车位置、规划行驶路线、清除误判障碍物和调整安全距离。

示例性的，在RSS模型框架下，策略表示“想变道”，战术策略要决定需要给哪辆车让道，要哪辆车给让道，这两辆车之间的距离就是变道行驶的距离，战术策略是一种“瞬间性”的决策，它会随着情况的变化而变化。接下来是路径规划，它为执行战术策略而计划车辆行驶轨迹，这个轨迹必须是安全的。最后是控制，已经计划好轨迹之后，就需要对自动驾驶汽车进行控制，比如什么时候刹车。

在本申请实施例中，自动驾驶模型是使用样本集训练后生成的，样本集中包括有车辆的历史环境信息和与历史环境信息对应的安全员输入的自动驾驶策略。

本申请实施例中，涉及的安全员可以为车内安全员或者云端安全员。

在一些实施例中，自动驾驶模型训练的过程可以由成车载终端来进行。示例性的，当车载终端获取到车辆周围的环境信息时，可以将车辆周围的环境信息展示给安全员，再接收由安全员根据车辆周围的环境信息确定的自动驾驶策略。与此同时，车载终端可以将车辆周围的环境信息和安全员输入的自动驾驶策略作为样本集，对自动驾驶模型进行训练。

在另一种可选的实施方式中，自动驾驶模型训练的过程可以由服务器来进行。示例性的，在接收到由安全员根据车辆周围的环境信息确定的自动驾驶策略后，车载终端可以将车辆周围的环境信息和安全员输入的自动驾驶策略发送给服务器，服务器将车辆周围的环境信息和安全员输入的自动驾驶策略进行存储，服务器将车辆周围的环境信息和安全员输入的自动驾驶策略作为样本集，对自动驾驶模型进行训练。

需要说明的是，样本集是从全部的训练数据中随机选择的一部分，训练数据其余的部分作为测试集。测试集的作用是当通过样本集训练出模型后，计算模型的准确率。其中，训练数据可以为车辆周围的环境信息和安全员输入的自动驾驶策略。本申请实施例中对样本集和测试集的选取方式不做限制，示例性的，在简单的交叉验证(hold-out crossvalidation)方法中，从全部的训练数据中随机选择一部分的样例作为样本集，剩余的部分作为测试集。在k折交叉验证(k-fold cross validation)方法中，将全部训练数据S分成k个不相交的子集，假设S中的训练样例个数为m，那么每一个子集有m/k个训练样例，相应的子集称作{s1，s2，…，sk}，每次从分好的子集中里面，拿出一个作为测试集，其它k-1个作为样本集。在留一法(leave-one-out cross validation)中，每次只留下一个样本做测试集，其它样本做样本集。

本申请实施例对自动驾驶模型的训练方式不做限制，具体的自动驾驶模型的训练可以在仿真模拟器上进行，还可以通过程序代码进行训练。

S103、根据自动驾驶策略控制车辆进行自动驾驶。

在本步骤中，当获取车辆的环境信息后，车载终端可以将车辆周围的环境信息输入自动驾驶模型，并获取自动驾驶模型输出的自动驾驶策略，然后根据自动驾驶策略控制车辆进行自动驾驶。

本申请实施例中，车载终端根据自动驾驶策略确定对应的自动驾驶算法，再通过自动驾驶算法控制车辆自动驾驶。

本申请实施例中，自动驾驶算法根据车端传感器获取车辆的环境信息做出决策和规划并控制车辆执行决策和规划。

其中，自动驾驶算法是根据自动驾驶策略生成的。示例性的，当输入的自动驾驶策略为路径规划，则对应的算法可以是蚁群算法、双向搜索算法或者Lee算法等。

在一些实施例中，在确定自动驾驶算法后，车辆终端可以根据自动驾驶算法规划的路径，将车载终端所在的车辆行驶至目的地。

示例性的，车辆的路径规划算法，车辆的路径规划算法可以分为静态路径规划算法和动态路径算法。静态路径规划是以物理地理信息和交通规则等条件为约束来寻求最短路径。动态路径规划是在静态路径规划的基础上,结合实时的交通信息对预先规划好的最优行车路线进行适时的调整直至到达目的地最终得到最优路径。

示例性的，自动驾驶算法的运动控制模块，根据规划的行驶路径以及当前行驶的位置、姿态和速度，产生对油门、刹车、方向盘和变速杆等的控制命令，控制车辆进行自动驾驶。

本申请实施例提供的自动驾驶方法，通过将车载终端获取的车辆周围的环境信息输入自动驾驶模型，获取自动驾驶模型输出的自动驾驶策略，使用获取的自动驾驶策略控制车辆进行自动驾驶，其中，自动驾驶模型是使用样本集训练后生成的，样本集包括有车辆的历史环境信息和与历史环境信息对应的安全员输入的自动驾驶策略。与现有的自动驾驶方案相比，本申请使用车辆的历史环境信息和与历史环境信息对应的安全员输入的自动驾驶策略训练自动驾驶模型，并通过自动驾驶模型确定自动驾驶策略，从而控制车辆进行自动驾驶，提高了车辆自动驾驶的安全性。

在上述实施例的基础上，车载终端可以使用车辆的历史环境信息和与历史环境信息对应的安全员输入的自动驾驶策略对自动驾驶模型进行训练，训练后生成的自动驾驶模型可以识别和处理更加复杂的环境，车载终端使用训练后的自动驾驶模型输出的自动驾驶策略控制车辆进行自动驾驶。下面结合图3对本申请实施例提供的自动驾驶方法进行进一步的说明。图3为本申请实施例提供的另一种自动驾驶方法的流程示意图。如图3所示，本申请实施例的执行主体为车载终端，该方法包括：

S201、车载终端检测车辆的行驶状态。

本申请实施例中，在车辆的每次自动驾驶过程中，车载终端可以实时对车辆当前的状态进行检测。本申请对于如何检测车辆的行驶状态不做限制，示例性的，车载终端可以通过检测发动机的运行状态和油门、刹车和离合的状态等对车辆的行驶状态进行判断。

S202、若车载终端检测到车辆处于停车状态，则使用样本集对自动驾驶模型进行训练。

在本步骤中，当车载终端检测车辆的行驶状态后，若检测到车辆处于停车状态，则使用样本集对自动驾驶模型进行训练。

在一些可选的实施方式中，车载终端对于自动驾驶模型的训练是在车端处于停车状态下进行的。只有当车端处于停车状态时，车载终端才会根据行驶过程中存入样本集的环境信息和对应的自动驾驶策略对车端模型进行训练。

本申请实施例中，样本集中包含最新的车辆的环境信息和与环境信息对应的安全员输入的自动驾驶策略和车辆的历史环境信息和与历史环境信息对应的安全员输入的自动驾驶策略。

S203、若样本集中的数据辆超过数据量阈值，则使用样本集对自动驾驶模型进行训练。

在本步骤中，当检测到车辆处于停车状态后，若样本集中的数据量超过数据量阈值，则使用样本集对自动驾驶模型进行训练。

示例性的，若为车载终端的情况，则数据量阈值设为1，每次遇到新的环境信息就要在车端进行自动驾驶模型训练。若为服务器端，则数据量阈值可以设为1000、10000等，并且每种类型的车设置的数据量阈值可以不同。

S204、使用测试集确定自动驾驶模型的精度。

在本步骤中，当使用样本集对自动驾驶模型进行训练后，使用测试集确定自动驾驶模型的精度。

本申请实施例中，自动驾驶模型的精度用来标识样本集训练后的自动驾驶模型对环境信息的识别度和根据识别到的环境信息生成的自动驾驶策略的精确度。精度反应每一次独立的训练之后，其平均值与已知的真实数据之间的差距，即与理论值相符合的程度。

本申请实施例中，对于精度的取值大小不做限制，可以根据情况具体说明。示例性的，国家标注技术研究所的数据集(Mixed National Institute of Standards andTechnology database，MNIST)的精度为98％、3D物体图像识别数据集(NORB database)的精度为88％左右。

S205、若自动驾驶模型的精度小于精度阈值，则继续使用样本集对自动驾驶模型进行训练。

S206、若自动驾驶模型的精度大于或者等于精度阈值，则确定自动驾驶模型训练完成。

本申请实施例中，当自动驾驶模型的精度大于或者等于精度阈值时，才表示自动驾驶的模型训练完成，否则，若精度达不到要求，自动驾驶模型对于识别到的环境信息处理不了，可能会做出错误的选择。

在一种可选的实施方式中，车载终端的自动驾驶模型训练完成后，可以将自动驾驶模型发送给服务器端。

在一种可选的实施方式中，自动驾驶模型训练若是在服务器端进行的，训练完成后要发送给车载终端，更新车载终端所在车辆的自动驾驶模型。

S207、车载终端获取车辆的环境信息。

S208、车载终端将车辆的环境信息输入自动驾驶模型，并获取自动驾驶模型输出的自动驾驶策略。

S209、车载终端根据自动驾驶策略控制车辆进行自动驾驶。

S207-S209、的技术名词、技术效果和技术特征，以及可选实施方式，可参见图2所示的S101-S103理解，对于重复的内容，在此不再累述。

本申请中，车载终端或者服务器端使用样本集对自动驾驶模型进行训练，车载终端使用训练完成后自动驾驶模型进行自动驾驶，提高了车辆自动驾驶的安全性。

在上述实施例的基础上，自动驾驶模型的训练可以在车载终端和服务器上进行。

下面对于采用车载终端进行自动驾驶模型训练的情况进行说明。图4为本申请实施例提供的一种车载终端自动驾驶模型训练方法的流程示意图。如图4所示，该方法包括：

S301、检测车辆是否处于停车状态。

本步骤中，车载终端在进行一次自动驾驶之后，在要进行自动驾驶模型训练之前，为了不影响自动驾驶车辆的使用，车载终端要检测车辆是否处于停车状态。

本申请实施例中，对于车辆是否处于停车状态的检验由车端的自动驾驶算法进行。

本申请实施例中，车载终端在进行车辆是否处于停车状态的检测之前接收传感器获取的车辆周围的环境信息数据和与环境信息对应的安全员输入的自动驾驶策略，作为样本集。

S302、若车辆处于停车状态，则使用样本集对自动驾驶模型进行训练。

S303、若车辆没有处于停车状态，则等待直到车辆处于停车状态，在使用样本集对自动驾驶模型进行训练。

S304、使用测试集确定自动驾驶模型的精度。

S305、判断自动驾驶模型的精度是否大于或者等于精度阈值。

S306、当判断自动驾驶模型的精度是否大于或者等于精度阈值后，若是，则自动驾驶模型训练完成。

S307、当判断自动驾驶模型的精度是否大于或者等于精度阈值后，若否，则执行步骤S302。

S304-S307的技术名词、技术效果、技术特征，以及可选实施方式，可参照图3所示的S204-S206理解，对于重复的内容，在此不再累述。

下面对于采用服务器进行自动驾驶模型训练的情况进行说明。图5为本申请实施例提供的一种服务器端的自动驾驶模型训练方法的流程示意图。如图5所示，该方法包括：

S401、服务器端判断样本集中的数据量是否超过数据量阈值。

本申请实施例中，服务器端在判断样本集中的数据量是否超过数据量阈值之前接收车载终端发送的车端传感器获取的车辆周围的环境信息数据和与环境信息对应的安全员输入的自动驾驶策略，作为样本集。

S402、当服务器端判断样本集中的数据量是否超过数据量阈值后，若是，则使用样本集对自动驾驶模型进行训练。

S403、当服务器端判断样本集中的数据量是否超过数据量阈值后，若否，则等待直到样本数据集中的数据量超过数据量阈值，然后使用样本集对自动驾驶模型进行训练。

S404、使用测试集确定自动驾驶模型的精度。

本步骤中，当服务器端判断样本集中的数据量是否超过数据量阈值后，若是则使用样本集对自动驾驶模型进行训练，然后使用测试集确定自动驾驶模型的精度。

S405、判断自动驾驶模型的精度是否大于或者等于精度阈值。

S406、当判断自动驾驶模型的精度是否大于或者等于精度阈值后，若是，则自动驾驶模型训练完成。

S407、当判断自动驾驶模型的精度是否大于或者等于精度阈值后，若否，则执行步骤S402。

S405-S407的技术名词、技术效果和技术特征，以及可选实施方式，可参见图3所示的S204-S206理解，对于重复的内容，在此不再累述。

本申请实施例中，车载终端和服务器端使用样本集训练自动驾驶模型，车载终端将获取的车辆周围的环境信息输入自动驾驶模型，然后，获取自动驾驶模型输出的自动驾驶策略，车载终端根据自动驾驶策略控制车辆进行自动驾驶。

本申请提供的自动驾驶方法，车载终端将车辆周围的环境信息输入自动驾驶模型，获取自动驾驶模型输出的自动驾驶策略，使用获取的自动驾驶策略控制车辆进行自动驾驶。其中，自动驾驶模型是使用车辆的历史环境信息和与历史环境信息对应的安全员输入的自动驾驶策略训练后生成的。与现有的自动驾驶方案相比，本申请使用车辆的历史环境信息和与历史环境信息对应的安全员输入的自动驾驶策略训练自动驾驶模型，并通过自动驾驶模型确定自动驾驶策略，从而控制车辆进行自动驾驶，提高了车辆自动驾驶的安全性。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

图6为本申请实施例提供的一种自动驾驶装置的结构示意图。该自动驾驶装置可以通过软件、硬件或者两者的结合实现，以执行上述实施例中的自动驾驶方法。如图6所示，该自动驾驶装置500包括：

获取模块501，获取车辆周围的环境信息。

处理模块502，用于将车辆周围的环境信息输入自动驾驶模型，并获取自动驾驶模型输出的自动驾驶策略，自动驾驶模型是使用样本集训练后生成的，样本集包括有车辆的历史环境信息和与历史环境信息对应的安全员输入的自动驾驶策略；根据自动驾驶策略控制车辆进行自动驾驶。

一种可选的实施方式中，还包括训练模块503，用于使用样本集对自动驾驶模型进行训练。

一种可选的实施方式中，训练模块503，还用于使用测试集确定自动驾驶模型的精度；若自动驾驶模型的精度大于或等于精度阈值，则确定自动驾驶模型训练完成。

一种可选的实施方式中，训练模块503，还用于若自动驾驶模型的精度小于精度阈值，则继续使用样本集对自动驾驶模型进行训练。

一种可选的实施方式中，训练模块503，具体用于若样本集的数据量超过数据量阈值，则使用样本集对自动驾驶模型进行训练。

一种可选的实施方式中，处理模块502，还用于检测车辆的行驶状态；

训练模块503，具体用于若检测到车辆处于停车状态，则使用样本集对自动驾驶模型进行训练。

本实施例提供的自动驾驶装置与上述自动驾驶方法实现的原理和技术效果类似，在此不作赘述。

图7为本申请实施例提供的一种电子设备的结构示意，如图7所示，该电子设备可以包括：至少一个处理器601和存储器602。图7示出的是以一个处理器为例的电子设备。

存储器602，用于存放程序。具体地，程序可以包括程序代码，程序代码包括计算机操作指令。

存储器602可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

处理器601用于执行存储器602存储的计算机执行指令，以实现上述自动驾驶方法；

其中，处理器601可能是一个中央处理器(Central Processing Unit，简称为CPU)，或者是特定集成电路(Application Specific Integrated Circuit，简称为ASIC)，或者是被配置成实施本申请实施例的一个或多个集成电路。

可选的，在具体实现上，如果通信接口、存储器602和处理器601独立实现，则通信接口、存储器602和处理器601可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture，简称为ISA)总线、外部设备互连(Peripheral Component，简称为PCI)总线或扩展工业标准体系结构(Extended IndustryStandard Architecture，简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等，但并不表示仅有一根总线或一种类型的总线。

可选的，在具体实现上，如果通信接口、存储器602和处理器601集成在一块芯片上实现，则通信接口、存储器602和处理器601可以通过内部接口完成通信。

本申请实施例还提供了一种芯片，包括处理器和接口。其中接口用于输入输出处理器所处理的数据或指令。处理器用于执行以上方法实施例中提供的方法。该芯片可以应用于自动驾驶装置中。

本申请还提供了一种计算机可读存储介质，该计算机可读存储介质可以包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random AccessMemory)、磁盘或者光盘等各种可以存储程序代码的介质，具体的，该计算机可读存储介质中存储有程序信息，程序信息用于上述自动驾驶方法。

本申请实施例还提供一种程序，该程序在被处理器执行时用于执行以上方法实施例提供的自动驾驶方法。

本申请实施例还提供一种程序产品，例如计算机可读存储介质，该程序产品中存储有指令，当其在计算机上运行时，使得计算机执行上述方法实施例提供的自动驾驶方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时，全部或部分地产生按照本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种自动驾驶方法，其特征在于，包括：

获取车辆周围的环境信息；

根据所述自动驾驶策略控制所述车辆进行自动驾驶。

2.根据权利要求1所述的方法，其特征在于，在所述将所述车辆周围的环境信息输入自动驾驶模型之前，还包括：

使用所述样本集对所述自动驾驶模型进行训练。

3.根据权利要求1所述的方法，其特征在于，在所述使用所述样本集对所述自动驾驶模型进行训练之后，还包括：

使用测试集确定所述自动驾驶模型的精度；

4.根据权利要求3所述的方法，其特征在于，在所述使用所述样本集对所述自动驾驶模型进行训练之后，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述使用所述样本集对所述自动驾驶模型进行训练，包括：

6.根据权利要求2所述的方法，其特征在于，在所述使用所述样本集对所述自动驾驶模型进行训练之前，所述方法还包括：

检测所述车辆的行驶状态；

所述使用所述样本集对所述自动驾驶模型进行训练，包括：

7.根据权利要求1-6任一项所述的方法，其特征在于，所述自动驾驶策略包括以下至少一项：纠正停车位置、规划行驶路线、清除误判障碍物和调整安全距离。

8.一种自动驾驶装置，其特征在于，包括：

获取模块，用于获取车辆周围的环境信息；

9.根据权利要求8所述的装置，其特征在于，所述装置还包括：

10.根据权利要求8所述的装置，其特征在于，所述训练模块，还用于使用测试集确定所述自动驾驶模型的精度；若所述自动驾驶模型的精度大于或等于精度阈值，则确定所述自动驾驶模型训练完成。

11.根据权利要求10所述的装置，其特征在于，所述训练模块，还用于若所述自动驾驶模型的精度小于精度阈值，则继续使用所述样本集对所述自动驾驶模型进行训练。

12.根据权利要求8所述的装置，其特征在于，所述训练模块，具体用于若所述样本集的数据量超过数据量阈值，则使用所述样本集对所述自动驾驶模型进行训练。

13.根据权利要求8所述的装置，其特征在于，所述处理模块，还用于检测所述车辆的行驶状态；

14.根据权利要求8-13任一项所述的装置，其特征在于，所述自动驾驶策略包括以下至少一项：纠正停车位置、规划行驶路线、清除误判障碍物和调整安全距离。