CN113341941A

CN113341941A - 一种无人驾驶设备的控制方法及装置

Info

Publication number: CN113341941A
Application number: CN202110888653.8A
Authority: CN
Inventors: 周奕达; 黄庆; 任冬淳; 樊明宇; 丁曙光; 夏华夏; 熊方舟
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2021-08-04
Filing date: 2021-08-04
Publication date: 2021-09-03
Anticipated expiration: 2041-08-04
Also published as: CN113341941B

Abstract

本说明书公开了一种无人驾驶设备的控制方法及装置。涉及无人驾驶技术领域。根据障碍物与无人驾驶设备的交汇轨迹确定目标障碍物。根据无人驾驶设备的各轨迹点及其当前的速度，确定第一向量，并针对每个目标障碍物，根据该目标障碍物在预设时间内的各位置以及各位置的速度，确定第二向量。将两个向量输入预先训练的决策模型，得到该目标障碍物对应的决策。根据得到的至少部分决策确定下一时刻该无人驾驶设备的控制策略，以实现该无人驾驶设备与各目标障碍物交错通过相应的轨迹交汇位置。能够预测轨迹的交汇并基于决策确定下一时刻无人驾驶设备的控制策略，能够避免无人驾驶设备与障碍物在交汇位置同时出现，以避免碰撞，保障无人驾驶设备的安全。

Description

一种无人驾驶设备的控制方法及装置

技术领域

本说明书涉及无人驾驶技术领域，尤其涉及一种无人驾驶设备的控制方法及装置。

背景技术

通常，在无人驾驶设备自动驾驶时，由无人驾驶系统中的控制模块，根据决策模块确定出的无人驾驶设备下一刻的决策，控制无人驾驶设备行驶，以避开环境中的障碍物，尤其需要避开和无人驾驶设备可能存在碰撞风险的障碍物，使得无人驾驶设备能够安全驾驶。

在现有技术中，在确定无人驾驶设备下一刻的决策时，通过预先构建基于驾驶员的驾驶数据确定的状态决策合集，即由无人驾驶设备及其环境状态与驾驶员做出的决策构成的合集，并将得到的状态决策合集存储到经验池中。在无人驾驶设备自动驾驶时，根据无人驾驶设备当前的状态（速度、加速度以及转向角度等）以及环境状态（周围的各障碍物、车道线及二者与自身的距离等），从经验池中寻找匹配的决策，作为无人驾驶设备下一刻的决策。若无法从经验池中找到匹配的决策，则通过深度强化学习网络，基于上面两种状态计算并输出无人驾驶设备下一刻的决策。

但在现有技术中，由于无人驾驶设备的实际驾驶环境十分复杂多变，基于驾驶员的驾驶数据预先构建的状态决策合集，难以涵盖实际情况中各种复杂的状态与其对应的决策的组合情况，并且将当前的状态与状态决策合集进行匹配时也需要进行大量的计算，导致确定决策的效率较低。另外，在通过深度强化学习网络确定决策时，由于深度强化学习网络依赖奖励函数，且奖励函数的合理性影响着深度强化学习网络输出的决策的准确性。而奖励函数的设计较为困难，若奖励函数不合理，则可能会导致基于深度强化学习网络得到的无人驾驶设备的决策不准确，甚至出现重大失误，导致无人驾驶设备处于危险当中。

发明内容

本说明书提供一种无人驾驶设备的控制方法及装置，以部分的解决现有技术存在的上述问题。

本说明书采用下述技术方案：

本说明书提供了一种无人驾驶设备的控制方法，包括：

确定无人驾驶设备的规划轨迹、所述无人驾驶设备的速度以及环境中的各障碍物在预设时间内的运动轨迹；

将运动轨迹与所述规划轨迹有交汇的障碍物作为目标障碍物，并确定各目标障碍物的运动轨迹与所述规划轨迹的交汇位置；

根据所述无人驾驶设备的速度以及所述规划轨迹，确定所述无人驾驶设备的状态向量，作为第一向量；

针对每个目标障碍物，根据该目标障碍物的运动轨迹，确定该目标障碍物的各位置和各位置对应的速度，并根据确定出的各位置和各位置对应的速度，确定该目标障碍物的状态向量，作为第二向量；

将所述第一向量以及所述第二向量输入预先训练的决策模型，确定该目标障碍物对应的决策；

根据确定出的至少部分决策，确定下一时刻所述无人驾驶设备的控制策略，以实现所述无人驾驶设备与各目标障碍物交错通过相应的交汇位置。

可选地，根据所述无人驾驶设备的速度以及所述规划轨迹，确定所述无人驾驶设备的状态向量，具体包括：

以预设的距离间隔对所述规划轨迹进行采样，确定所述规划轨迹的各轨迹点；

根据所述无人驾驶设备的速度以及各轨迹点的位置，确定所述无人驾驶设备的状态向量。

可选地，所述决策包括避让决策以及超越决策，且二者互为关联决策；

根据确定出的至少部分决策，确定下一时刻所述无人驾驶设备的控制策略之前，所述方法还包括：

确定各目标障碍物当前的位置；

针对每个目标障碍物，验证该目标障碍物当前的位置与该目标障碍物对应的决策是否冲突，

若冲突，则对该目标障碍物对应的决策进行更新，重新确定该目标障碍物对应的决策的关联决策，作为该目标障碍物对应的决策；

根据更新后的至少部分决策，确定下一时刻所述无人驾驶设备的控制策略。

可选地，验证该目标障碍物当前的位置与该目标障碍物对应的决策是否冲突，具体包括：

将所述无人驾驶设备周围划分为若干区域；

根据该目标障碍物的位置，确定该目标障碍物所在的区域；

确定该目标障碍物对应的决策的冲突区域，并判断该目标障碍物所在的区域与所述冲突区域是否一致；

若是，则确定该目标障碍物的位置与所述决策冲突；

若否，则确定该目标障碍物的位置与所述决策不冲突。

可选地，所述方法还包括：

当该目标障碍物所在的区域与所述冲突区域不一致，确定该目标障碍物对应的历史决策；

从所述历史决策中，确定与该目标障碍物对应的决策相同的决策数量，作为历史数量；

根据所述历史决策的总数以及所述历史数量，确定该目标障碍物对应的决策的决策率；

判断所述决策率是否大于预设的决策阈值；

当所述决策率大于所述决策阈值时，确定该目标障碍物的位置与所述决策不冲突。

可选地，所述方法还包括：

当所述决策率不大于所述决策阈值时，确定该目标障碍物对应的决策的匹配区域；

判断该目标障碍物所在的区域是否与所述匹配区域一致；

若是，则确定该目标障碍物的位置与所述决策不冲突；

若否，则确定该目标障碍物的位置与所述决策冲突。

可选地，根据确定出的至少部分决策，确定下一时刻所述无人驾驶设备的控制策略，以实现所述无人驾驶设备与各目标障碍物交错通过相应的交汇位置，具体包括：

将距离所述无人驾驶设备最近的交汇位置作为目标交汇位置；

从确定出的决策中，确定与所述规划轨迹在所述目标交汇位置交汇的运动轨迹所属的目标障碍物对应的决策，作为目标决策；

根据至少部分所述目标决策，确定下一时刻所述无人驾驶设备的控制策略，以实现所述无人驾驶设备与各目标障碍物交错通过所述目标交汇位置。

本说明书提供了一种无人驾驶设备的控制装置，包括：

确定模块，用于确定无人驾驶设备的规划轨迹、所述无人驾驶设备的速度以及环境中的各障碍物在预设时间内的运动轨迹；

交汇确定模块，用于将运动轨迹与所述规划轨迹有交汇的障碍物作为目标障碍物，并确定各目标障碍物的运动轨迹与所述规划轨迹的交汇位置；

第一向量确定模块，用于根据所述无人驾驶设备的速度以及所述规划轨迹，确定所述无人驾驶设备的状态向量，作为第一向量；

第二向量确定模块，用于针对每个目标障碍物，根据该目标障碍物的运动轨迹，确定该目标障碍物的各位置和各位置对应的速度，并根据确定出的各位置和各位置对应的速度，确定该目标障碍物的状态向量，作为第二向量；

决策模块，用于将所述第一向量以及所述第二向量输入预先训练的决策模型，确定该目标障碍物对应的决策；

控制模块，用于根据确定出的至少部分决策，确定下一时刻所述无人驾驶设备的控制策略，以实现所述无人驾驶设备与各目标障碍物交错通过相应的交汇位置。

本说明书提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述无人驾驶设备的控制方法。

本说明书提供了一种无人驾驶设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述无人驾驶设备的控制方法。

本说明书采用的上述至少一个技术方案能够达到以下有益效果：

在本说明书提供的一种无人驾驶设备的控制方法中，根据障碍物与无人驾驶设备的交汇轨迹确定目标障碍物。根据无人驾驶设备的各轨迹点及其当前的速度，确定第一向量，并针对每个目标障碍物，根据该目标障碍物在预设时间内的各位置以及各位置的速度，确定第二向量。将两个向量输入预先训练的决策模型，得到该目标障碍物对应的决策。根据得到的至少部分决策确定下一时刻该无人驾驶设备的控制策略，以实现该无人驾驶设备与各目标障碍物交错通过相应的轨迹交汇位置。

从上述方法中可以看出，本方法能够基于该无人驾驶设备的规划轨迹以及对各障碍物的运动轨迹，确定每个障碍物分别对应的决策，无需预先构建状态决策合集，也无需在进行决策时进行大量计算以将当前状态与状态决策合集匹配，能够提高决策的效率，且摒弃了深度强化学习的方法，避免了奖励函数对决策准确性的影响。并且，本方法能够预测轨迹的交汇并基于决策确定下一时刻无人驾驶设备的控制策略，能够避免无人驾驶设备与障碍物在交汇位置同时出现，以避免碰撞，保障无人驾驶设备的安全。

附图说明

此处所说明的附图用来提供对本说明书的进一步理解，构成本说明书的一部分，本说明书的示意性实施例及其说明用于解释本说明书，并不构成对本说明书的不当限定。在附图中：

图1为本说明书中一种无人驾驶设备的控制方法的流程示意图；

图2为本说明书提供的一种决策模型的示意图；

图3为本说明书提供的一种交汇位置的示意图；

图4为本说明书提供的一种区域划分示意图；

图5为本说明书提供的一种决策的验证过程的示意图；

图6为本说明书提供的一种决策模型的训练过程示意图；

图7为本说明书提供的一种无人驾驶设备的控制装置的示意图；

图8为本说明书提供的一种无人驾驶设备的结构示意图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本说明书保护的范围。

以下结合附图，详细说明本说明书各实施例提供的技术方案。

图1为本说明书中一种无人驾驶设备的控制方法的流程示意图，具体包括以下步骤：

S100：确定无人驾驶设备的规划轨迹、所述无人驾驶设备的速度以及环境中的各障碍物在预设时间内的运动轨迹。

在本说明书中，该无人驾驶设备的控制方法可由无人驾驶设备自身执行。

在本说明书一个或多个实施例中，该无人驾驶设备以固定周期进行轨迹规划，以确定规划轨迹，针对每个周期，该无人驾驶设备在该周期内沿着该周期内规划好的规划轨迹运动，并在沿着该规划轨迹运动的过程中，执行该无人驾驶设备的控制方法。例如，该无人驾驶设备可在运动的过程中，以0.1s为周期，每0.1s规划一次轨迹，并沿着每个周期规划出的规划轨迹运动。当然，周期具体为多长，可根据需要设置，本说明书在此不做限制。另外，该无人驾驶设备进行决策以及执行决策的周期可与进行轨迹规划的周期相同。

需要说明的是，本说明书中所指的对无人驾驶设备的控制是纵向控制，即，在无人驾驶设备沿着规划轨迹运动的基础上，控制该无人驾驶设备的速度、加速度等，不改变无人驾驶设备的运动轨迹。

在本说明书一个或多个实施例中，该无人驾驶设备上可设置有传感器，该无人驾驶设备可实时通过该传感器获取环境数据，以根据自身当前的位置和运动状态，以及获取到的环境数据，对自身进行路径规划，得到规划轨迹。其中，该环境数据可以是传感器采集的图像和/或点云。该规划轨迹的长度可根据需要设置，例如，该无人驾驶设备在进行实时路径规划时，可实时规划运动方向前方40m内的规划轨迹。当然，40m仅为示例，也可以是50m、30m、80m等，具体可根据需要设置，本说明书在此不做限制。

由于在无人驾驶设备运动的过程中，其风险来源于环境中的障碍物，且环境中的障碍物与该无人驾驶设备的距离越近，该障碍物对该无人驾驶设备带来的风险越高。当障碍物的运动轨迹与该无人驾驶设备的规划轨迹有交汇时，则意味着该无人驾驶设备与该障碍物会出现在同一位置，当该障碍物与该无人驾驶设备同时逼近或出现在同一位置时，则可能发生碰撞。

为了避免该无人驾驶设备与和自身轨迹有交汇的障碍物发生碰撞，可通过控制该无人驾驶设备与障碍物交错通过轨迹的交汇位置，以保证该无人驾驶设备的安全。首先，则需要确定该无人驾驶设备的规划轨迹以及障碍物的运动轨迹，以便于后续步骤中确定运动轨迹与该无人驾驶设备会交汇的目标障碍物。

其中，该交错通过，包括时间上的交错和/或空间上的交错，通过控制该无人驾驶设备在二者的交汇位置避开障碍物，使该无人驾驶设备先于或晚于障碍物经过交汇位置，实现交错通过。

因此，在本说明书一个或多个实施例中，该无人驾驶设备可确定自身的规划轨迹、自身当前的速度以及环境中的各障碍物在预设时间内的运动轨迹。

其中，该无人驾驶设备当前的速度用于在后续步骤中确定该无人驾驶设备的状态向量。

至于怎样确定环境中的各障碍物并预测其在未来一段时间内的运动轨迹以及进行无人驾驶设备自身的轨迹规划已是较为成熟的技术，本说明书在此不进行赘述。

S102：将运动轨迹与所述规划轨迹有交汇的障碍物作为目标障碍物，并确定各目标障碍物的运动轨迹与所述规划轨迹的交汇位置。

由于该无人驾驶设备与障碍物的轨迹交汇会带来危险，是因为二者可能会在交汇位置相遇并发生碰撞，为了保证自身安全，该无人驾驶设备需要避开和自身轨迹有交汇的障碍物。而对于轨迹与该无人驾驶设备有交汇但与该无人驾驶设备出现在交汇位置的时间不同，且出现在交汇位置的时间不影响该无人驾驶设备的安全的障碍物，即使轨迹有交汇，该障碍物也不会给该无人驾驶设备带来危险。

因此，在本说明书一个或多个实施例中，在确定目标障碍物时，该无人驾驶设备可仅将与该无人驾驶设备同时出现在同一交汇位置的障碍物作为目标障碍物。

在本说明书一个或多个实施例中，在确定目标障碍物时，该无人驾驶设备还可以将与该无人驾驶设备出现在同一交汇位置的时间有重叠的障碍物，作为目标障碍物。

在本说明书一个或多个实施例中，在确定目标障碍物时，该无人驾驶设备还可以将与该无人驾驶设备出现在同一交汇位置的时间无重叠，但与该无人驾驶设备出现在同一交汇位置的最小时间差大于预设的时长的障碍物，作为目标障碍物。

在本说明书一个或多个实施例中，该交汇位置可以是属于该无人驾驶设备的规划轨迹的轨迹点，且同属于障碍物的运动轨迹的轨迹点的位置点，轨迹的实际交汇点。也可以是对该无人驾驶设备的规划轨迹的轨迹点，以预设的范围进行扩张后得到的区域。当障碍物的运动轨迹进入该区域后，则可确定该障碍物的运动轨迹与该无人驾驶设备的规划轨迹交汇。

另外，考虑到若无人驾驶设备与障碍物擦身而过也存在危险，因此，还可以确定无人驾驶设备与障碍物间的安全距离，并根据该无人驾驶设备与障碍物的体积以及该安全距离，确定对轨迹点进行扩张的范围，得到交汇位置对应的区域。

S104：根据所述无人驾驶设备的速度以及所述规划轨迹，确定所述无人驾驶设备的状态向量，作为第一向量。

在本说明书一个或多个实施例中，为了使该无人驾驶设备与目标障碍物交错通过二者轨迹的交汇位置，对于目标障碍物，该无人驾驶设备有两种可执行的决策：避让决策以及超越决策。且避让决策以及超越决策二者互为关联决策。

其中，避让决策，即基于目标障碍物的运动状态，通过控制该无人驾驶设备的速度，以使目标障碍物先于该无人驾驶设备通过二者轨迹的交汇位置为目标的决策。超越决策，即基于目标障碍物的运动状态，通过控制该无人驾驶设备的速度，以使该无人驾驶设备先于目标障碍物通过二者轨迹的交汇位置为目标的决策。

而针对每个目标障碍物，具体对该目标障碍物采取哪种决策更合理，取决于该目标物的运动轨迹以及运动状态，以及该无人驾驶设备自身的规划轨迹和运动状态。

因此，在本说明书一个或多个实施例中，该无人驾驶设备在确定出自身当前的速度以及当前的规划轨迹后，可根据确定出的速度以及规划轨迹，确定该无人驾驶设备自身的状态向量，作为第一向量。以便于在后续步骤中，结合目标障碍物的状态向量，确定目标障碍物对应的决策。

在本说明书一个或多个实施例中，在确定自身的状态向量时，具体的，该无人驾驶设备可以以预设的距离间隔对当前的规划轨迹进行采样，确定该规划轨迹的各轨迹点。并根据该无人驾驶设备当前的速度以及各轨迹点的位置，确定该无人驾驶设备的状态向量。

其中，该预设的距离间隔可根据需要设置，例如，假设该规划轨迹为40m的轨迹，且该距离间隔为0.5m。则通过以0.5m的间隔对该规划轨迹进行采样，可确定80个轨迹点。该位置可以坐标的形式表示，则该第一向量为80×2+1维，即该第一向量为161维的向量。

S106：针对每个目标障碍物，根据该目标障碍物的运动轨迹，确定该目标障碍物的各位置和各位置对应的速度，并根据确定出的各位置和各位置对应的速度，确定该目标障碍物的状态向量，作为第二向量。

在本说明书一个或多个实施例中，该无人驾驶设备在确定出各目标障碍物后，可针对每个目标障碍物，根据该目标障碍物的运动轨迹，确定该目标障碍物的各位置和各位置对应的速度，并根据确定出的各位置和各位置对应的速度，确定该目标障碍物的状态向量，作为第二向量。

其中，位置对应的速度即该无人驾驶设备预测得到的，当该目标障碍物处于该位置时，该目标障碍物的速度。

其中，该目标障碍物的各位置为以预设的时间间隔确定的该障碍物在自身对应的运动轨迹上的轨迹点的位置。

在本说明书一个或多个实施例中，该时间间隔可与该无人驾驶设备规划轨迹的周期一致。例如，假设该无人驾驶设备规划轨迹的周期为0.1s，则该预设的时间间隔同为0.1s，该无人驾驶设备每确定一次规划轨迹，也同步得到一个该目标障碍物的位置。并且，由于该目标障碍物的运动轨迹时在预设时间内的轨迹，假设该预设时间为5s，则该无人驾驶设备可以0.1s的时间间隔，确定出50个位置以及50个位置对应的速度。

S108：将所述第一向量以及所述第二向量输入预先训练的决策模型，确定该目标障碍物对应的决策。

在本说明书一个或多个实施例中，该无人驾驶设备在确定出该无人驾驶设备对应的第一向量以及该目标障碍物对应的第二向量后，可将该第一向量以及该第二向量，输入预先训练的决策模型，确定该目标障碍物对应的决策，即确定为了与该目标障碍物交错通过二者的交汇位置，该无人驾驶设备应当对该目标障碍物采取的决策。

在本说明书一个或多个实施例中，该决策模型可包括第一状态分析网络、第二状态分析网络以及融合决策网络。

在本说明书一个或多个实施例中，在根据该第一向量以及该第二向量，通过预先训练的决策模型，确定该障碍物对应的决策时，具体的，该无人驾驶设备可将该第一向量输入该第一状态分析网络，确定第一特征向量，并将该第二向量输入该第二状态分析网络，确定第二特征向量。之后，该无人驾驶设备可将该第一特征向量以及该第二特征向量一同输入该融合决策网络，确定该障碍物对应的决策。

图2为本说明书提供的一种决策模型的示意图。如图，该决策模型包括三个网络，分别是第一状态分析网络、第二状态分析网络以及融合决策网络。在将该第一向量以及该第二向量分别输入第一状态分析网络和第二状态分析网络后，分别得到该无人驾驶设备对应的第一特征向量以及障碍物对应的第二特征向量。将该第一特征向量以及该第二特征向量一同输入到该融合决策网络后，得到该障碍物对应的决策。

S110：根据确定出的至少部分决策，确定下一时刻所述无人驾驶设备的控制策略，以实现所述无人驾驶设备与各目标障碍物交错通过相应的交汇位置。

在本说明书一个或多个实施例中，该无人驾驶设备在确定出各障碍物对应的决策后，可根据确定出的至少部分决策，确定下一时刻该无人驾驶设备的控制策略，以实现该无人驾驶设备与各目标障碍物交错通过相应的交汇位置。

在本说明书一个或多个实施例中，由于该无人驾驶设备在以固定周期进行轨迹规划、预测障碍物轨迹以及确定目标障碍物，以确定各目标障碍物对应的决策。在不同周期，各目标障碍物对应的决策可能相同也可能不同。随着时间的流逝，各目标障碍物对应的决策在不断更新。不同时间确定出的交汇位置也可能会不同。

在本说明书一个或多个实施例中，各目标障碍物对应的决策，实际上相当于对各目标障碍物对应的交汇位置的决策，例如，对于障碍物A，该无人驾驶设备确定该障碍物A对应的决策为避让决策。避让，即该决策的目标为控制该无人驾驶设备避开障碍物A，使障碍物A先行经过二者的交汇位置。可见，对障碍物的决策，即对二者在交汇位置经过的先后顺序的决策。由于随着时间的流逝，各目标障碍物对应的决策在不断更新，因此，在无人驾驶设备运动到交汇位置，且达到先于或晚于该交汇位置对应的障碍物的目的的过程中，对于同一个交汇位置，其可能对应多个周期确定出的决策，且对应的决策一直在更新，不同周期确定出的决策也可能不同。

于是，在本说明书一个或多个实施例中，该无人驾驶设备在当前周期确定出各目标障碍物对应的决策，以根据其中的至少部分决策，确定下一时刻该无人驾驶设备的控制策略时，仅以实现上述至少部分决策为目标，确定下一时刻该无人驾驶设备的控制策略，而未必实际实现了先于障碍物经过二者交汇位置的动作（对应超越决策），或使障碍物先于自身经过二者交汇位置的动作（对应避让决策）。

例如，假设该无人驾驶设备确定各目标障碍物对应的决策的周期为0.1s，且确定自身当前的规划轨迹与目标障碍物A的运动轨迹在前方10m处交汇，即该无人驾驶设备与目标障碍物A的交汇位置处于前方10m处。若障碍物A对应的决策为超越决策，则该无人驾驶设备在确定下一时刻的控制策略时，以先于目标障碍物A抵达该交汇位置为目标，调整自身的运动状态，控制自身沿着规划轨迹向该交汇位置运动。在下一个周期确定各目标障碍物对应的决策时，该无人驾驶设备实际上可能还未抵达该交汇位置。

在本说明书一个或多个实施例中，该无人驾驶设备在根据确定出的至少部分决策，确定下一时刻所述无人驾驶设备的控制策略时，依然沿着规划轨迹运动，即在以实现决策对应的动作为目标，根据得到的无人驾驶设备的控制策略运动时，不脱离规划出的规划轨迹运动。该无人驾驶设备可仅通过改变自身速度、加速度等，实现在交汇位置对相应的目标障碍物的避让或超越。

图3为本说明书提供的一种交汇位置的示意图。如图，R1表示该无人驾驶设备当前的规划轨迹，R2、R3、R4分别表示目标障碍物A2、A3、A4的运动轨迹，灰色填充三角形表示该无人驾驶设备，各灰色填充矩形表示各目标障碍物。可见，目标障碍物A2、A3的运动轨迹与该无人驾驶设备的规划轨迹交汇于交汇位置1，目标障碍物A4与该无人驾驶设备的规划轨迹交汇于交汇位置2。交汇位置1为该无人驾驶设备与目标障碍物A2、A3相应的交汇位置，交汇位置2为该无人驾驶设备与目标障碍物A4相应的交汇位置。

在本说明书一个或多个实施例中，针对每个周期，当根据该周期确定出的决策，确定该无人驾驶设备的控制策略时，该无人驾驶设备可根据各目标障碍物与自身的距离，从距离该无人驾驶设备最近的目标障碍物开始，依次执行各目标障碍物对应的决策。在下一个周期确定出各目标障碍物对应的决策前，即在各目标障碍物对应的决策更新前，该无人驾驶设备可尽可能多的执行各目标障碍物对应的决策。

在本说明书一个或多个实施例中，针对每个周期，当根据该周期确定出的决策，确定该无人驾驶设备的控制策略时，该无人驾驶设备还可以根据各交汇位置与自身的距离，从距离该无人驾驶设备最近的交汇位置开始，依次执行各交汇位置对应的目标障碍物的决策。在下一个周期确定出各目标障碍物对应的决策前，即在各目标障碍物对应的决策更新前，该无人驾驶设备可尽可能多的执行各交汇位置对应的目标障碍物的决策。

由于对于该无人驾驶设备而言，距离该无人驾驶设备越近的交汇位置可能对其带来危害的风险越高。且随着时间流逝，决策在不断更新，因此，在本说明书一个或多个实施例中，该无人驾驶设备可确定距离自身最近的交汇位置，仅根据与距离自身最近的交汇位置相应的目标障碍物对应的决策，确定下一时刻该无人驾驶设备的控制策略。

具体的，该无人驾驶设备可将距离该无人驾驶设备自身最近的交汇位置作为目标交汇位置。并从确定出的决策中，确定与自身规划轨迹在目标交汇位置交汇的运动轨迹所属的目标障碍物对应的决策，作为目标决策。并根据至少部分目标决策，确定下一时刻该无人驾驶设备的控制策略，以实现该无人驾驶设备与各目标障碍物交错通过该目标交汇位置。

在本说明书一个或多个实施例中，当该目标交汇位置只对应一个目标障碍物时，该无人驾驶设备可直接根据该目标障碍物对应的决策，确定该无人驾驶设备的控制策略。当该目标交汇位置对应多个目标障碍物时，由于各目标障碍物在相同的或相邻的时间出现在该目标交汇位置，该无人驾驶设备可从各目标障碍物对应的决策中，该无人驾驶设备可确定一个目标障碍物对应的决策，作为该目标交汇位置对应的决策，以根据该目标交汇位置对应的决策，确定该无人驾驶设备的控制策略。

在本说明书一个或多个实施例中，当该无人驾驶设备确定出多个交汇位置时，还可以根据各交汇位置与自身的距离进行排序，并从中确定符合预设的数量的交汇位置作为目标交汇位置。并且，该无人驾驶设备在根据各目标交汇位置对应的目标障碍物的决策，确定下一时刻的控制策略时，可综合各目标交汇位置对应的决策，合理确定控制策略。

在本说明书一个或多个实施例中，当目标交汇位置有多个时，该无人驾驶设备仍然可以以距离自身最近的目标交汇位置对应的决策为主，来制定下一时刻的控制策略，但在制定下一时刻的控制策略的同时，可结合其他目标交汇位置对应的决策制定，避免为了实现距离自身最近的目标交汇位置对应的决策，而对实现其他目标交汇位置对应的决策造成干扰。

例如，假设该无人驾驶设备确定出L1、L2、L3，3个交汇位置，L1、L2、L3与自身的距离分别为10m、15m以及35m。假设预设的数量为2，则该无人驾驶设备可按照与自身距离从近到远的顺序，从中选取2个交汇位置作为目标交汇位置，即L1与L2。假设目标交汇位置L1对应的目标障碍物为障碍物A，目标交汇位置L2对应的目标障碍物为障碍物B。且障碍物A对应的决策为超越决策，障碍物B对应的决策为避让决策。可见，目标交汇位置L1与L2的距离较近，且对应的决策相反。该无人驾驶设备在根据障碍物A与障碍物B对应的决策，确定下一时刻的控制策略时，可以障碍物A对应的决策（即目标交汇位置L1对应的决策）为主制定下一时刻的控制策略，并参考障碍物B对应的决策（即目标交汇位置L2对应的决策），避免该无人驾驶设备在先于障碍物A经过目标交汇位置L1时，来不及在交汇位置L2对障碍物B进行避让。

如上所述，由于对于同一个目标交汇位置，轨迹与该无人驾驶设备在该目标交汇位置交汇的目标障碍物可能有一个也可能有多个。即，对于同一个目标交汇位置，与该目标交汇位置对应的目标障碍物可能有多个。而对于同一个目标交汇位置对应的多个目标障碍物，各目标障碍物对应的决策可能相同也可能不同。

因此，在本说明书一个或多个实施例中，当针对每个目标交汇位置，该目标交汇位置对应的多个目标障碍物各自对应的决策相同时，该无人驾驶设备可确定任意一个目标障碍物对应的决策，作为该目标交汇位置的依据决策，即该目标交汇位置对应的决策，并根据该依据决策确定该无人驾驶设备的控制策略。即，根据其中一个决策确定该无人驾驶设备的控制策略。由于各目标障碍物对应的决策相同，因此，根据该依据决策确定下一时刻的控制策略，也相当于根据该目标交汇位置对应的所有目标障碍物的决策，确定该无人驾驶设备的控制策略。

在本说明书一个或多个实施例中，当该目标交汇位置对应的多个目标障碍物各自对应的决策不同时，该无人驾驶设备可确定各决策的比例，从中确定占比最高的决策，并将占比最高的决策作为该目标交汇位置的依据决策，并根据得到的依据决策，确定该无人驾驶设备的控制策略。例如，假设有障碍物A、B、C、D四个障碍物的运动轨迹在目标交汇位置L3交汇，障碍物A、B、C、D对应的决策分别为：超越决策、超越决策、超越决策、避让决策。可见，超越决策占比3/4，避让决策占比1/4。因此，该无人驾驶设备可根据占比最高的超越决策作为依据决策，即确定该无人驾驶设备的控制策略的依据。

在本说明书一个或多个实施例中，当目标交汇位置对应的多个目标障碍物各自对应的决策不同，且各决策占比相同时，该无人驾驶设备可从中确定任意一个决策作为依据决策。沿用上例，假设障碍物A、B、C、D对应的决策分别为：超越决策、超越决策、避让决策、避让决策。可见，超越决策占比1/2，避让决策占比1/2。因此，该无人驾驶设备可根据超越决策和避让决策中的任意一种，作为依据决策。

在本说明书一个或多个实施例中，当目标交汇位置对应的多个目标障碍物各自对应的决策不同，且各决策占比相同时，该无人驾驶设备还可以从中确定距离自身最近的目标障碍物对应的决策，作为依据决策。继续沿用上例，假设障碍物A、B、C、D对应的决策分别为：超越决策、超越决策、避让决策、避让决策。可见，超越决策占比1/2，避让决策占比1/2。其中，障碍物B距离该无人驾驶设备最近，则该无人驾驶设备可根据障碍物B对应的决策，即超越决策作为依据决策，并根据该依据决策确定自身下一时刻的控制策略，以实现该无人驾驶设备与各目标障碍物交错通过目标交汇位置。

在本说明书一个或多个实施例中，当目标交汇位置有多个时，且存在对应多个目标障碍物的目标交汇位置时，该无人驾驶设备可将该对应多个目标障碍物的目标交汇位置，作为复杂交汇位置。当该复杂交汇位置对应的多个目标障碍物各自对应的决策不同，且各决策占比相同时。为了保证确定出的控制策略的平稳性，使得该无人驾驶设备能够平稳运动，减少在不同决策间进行切换带来的波动。该无人驾驶设备可确定与该复杂交汇位置相邻的目标交汇位置的依据决策，并从该复杂交汇位置对应的多个决策中，确定与上述相邻的目标交汇位置的依据决策相同的决策，作为该复杂交汇位置的依据决策。通过使相邻的交汇位置对应的决策一致，来减少该无人驾驶设备在不同决策间的切换，以平稳运动。

基于图1所示的无人驾驶设备的控制方法，根据障碍物与无人驾驶设备的交汇轨迹确定目标障碍物。根据无人驾驶设备的各轨迹点及其当前的速度，确定第一向量，并针对每个目标障碍物，根据该目标障碍物在预设时间内的各位置以及各位置的速度，确定第二向量。将两个向量输入预先训练的决策模型，得到该目标障碍物对应的决策。根据得到的至少部分决策确定下一时刻该无人驾驶设备的控制策略，以实现该无人驾驶设备与各目标障碍物交错通过相应的轨迹交汇位置。

另外，考虑到该决策模型输出的各障碍物对应的决策可能存在失误，即确定出的决策不准确。当该决策不准确时，若立即根据该决策，确定下一时刻的控制策略，可能会导致无法实现使该无人驾驶设备与各目标障碍物交错通过相应的交汇位置，或者，使得该无人驾驶设备与各目标障碍物交错通过相应的交汇位置的时间较为接近，仍可能存在危险。例如，对于与该无人驾驶设备在交汇位置L4轨迹交汇，且位于该无人驾驶设备正前方同向行驶的障碍物A，为了使障碍物A与该无人驾驶设备交错通过交汇位置L4，相比于超越决策，根据避让决策确定下一时刻的控制策略更为合理。障碍物A的位置与超越决策是冲突的。假如确定出的障碍物A的决策为超越决策，若该无人驾驶设备根据该决策，以先于障碍物A经过交汇位置L4为目标，确定下一时刻的控制策略，由于环境的复杂性和多变性，该无人驾驶设备反而可能会在超越障碍物A时遇到危险。

因此，在确定出各目标障碍物对应的决策之后，该无人驾驶设备还可以对各目标障碍物对应的决策进行验证，并修改不准确的决策。

于是，在本说明书提供的一个或多个实施例中，在步骤S108之前，该无人驾驶设备还可以确定各目标障碍物当前的位置。并针对每个目标障碍物，验证该目标障碍物当前的位置与该目标障碍物对应的决策是否冲突，即验证该目标障碍物对应的决策是否准确。若冲突，则对该目标障碍物对应的决策进行更新，重新确定该目标障碍物对应的决策的关联决策，作为该目标障碍物对应的决策。之后，该无人驾驶设备可根据更新后的至少部分决策，确定下一时刻所述无人驾驶设备的控制策略。

其中，更新后的至少部分决策，包括决策不准确，并对其进行更新后得到的决策，以及决策准确，无需对其进行更新的决策。

在本说明书提供的一个或多个实施例中，对于避让决策，当目标障碍物位于该无人驾驶设备前方时，该决策与该目标障碍物的位置不冲突。该无人驾驶设备前方可视为该避让决策的匹配区域，且该无人驾驶设备后方属于该避让决策的冲突区域。对于超越决策，当目标障碍物位于该无人驾驶设备后方时，该超越决策与该目标障碍物的位置不冲突。该无人驾驶设备后方可视为该超越决策的匹配区域，且该无人驾驶设备前方属于该决策的冲突区域。

在本说明书提供的一个或多个实施例中，该无人驾驶设备可针对每个目标障碍物，根据该目标障碍物对应的决策的冲突区域、匹配区域以及该目标障碍物实际所处的相对于该无人驾驶设备的区域，来验证该目标障碍物的位置与该决策是否冲突，即验证该目标障碍物对应的决策是否准确。

在本说明书提供的一个或多个实施例中，在验证该目标障碍物的当前位置与该目标障碍物对应的决策是否冲突时，该无人驾驶设备可将自身周围划分为若干区域。并根据该目标障碍物的位置，确定该目标障碍物所在的区域。之后，确定该目标障碍物对应的决策的冲突区域，并判断该目标障碍物所在的区域与所述冲突区域是否一致。若是，该无人驾驶设备则可确定该目标障碍物的位置与自身对应的决策冲突。若否，该无人驾驶设备则可确定该目标障碍物的位置与自身对应的决策不冲突，并根据该目标障碍物对应的决策，确定下一时刻的控制策略。

在本说明书提供的一个或多个实施例中，当确定当该目标障碍物所在的区域与自身对应的决策的冲突区域不一致时，该无人驾驶设备可确定该目标障碍物对应的历史决策。并从历史决策中，确定与该目标障碍物对应的决策相同的决策数量，作为历史数量。之后，可根据该历史决策的总数以及该历史数量，确定该目标障碍物对应的决策的决策率。并判断该决策率是否大于预设的决策阈值。

在本说明书提供的一个或多个实施例中，当该决策率大于该决策阈值时，该无人驾驶设备可确定该目标障碍物的位置与该决策不冲突。

在本说明书提供的一个或多个实施例中，当该决策率不大于该决策阈值时，该无人驾驶设备可确定该目标障碍物对应的决策的匹配区域，并判断该目标障碍物所在的区域是否与该匹配区域一致。若是，则确定该目标障碍物的位置与自身对应的决策不冲突。若否，则确定该目标障碍物的位置与自身对应的决策冲突。

其中，该历史决策即该无人驾驶设备记录的，在该无人驾驶设备运动的过程中，当前时刻前的历史时刻对各目标障碍物的决策。

在本说明书提供的一个或多个实施例中，在根据该历史决策的总数以及该历史数量，确定该目标障碍物对应的决策的决策率时，可将该历史数量与该历史决策的总数的比值，作为该目标障碍物对应的决策的决策率。

例如，假设当前时刻目标障碍物A对应的决策为避让决策，障碍物A的历史决策中避让决策对应的历史数量为3，历史决策的总数为4，则该障碍物A对应的决策的决策率为3/4。该决策阈值可根据需要设置，例如，该阈值可以是75%、80%、90%等，本说明书在此不做限制。

或者，在本说明书提供的一个或多个实施例中，还可以将该历史数量与该历史决策的总数和该历史数量的差值间的比值，作为该目标障碍物对应的决策的决策率。具体可根据需要设置，本说明书在此不做限制。

例如，假设当前时刻目标障碍物A对应的决策为避让决策，障碍物A的历史决策中避让决策对应的历史数量为5，历史决策的总数为8，则该障碍物A对应的决策的决策率为5/（8-5）=5/3。

在本说明书一个或多个实施例中，对该无人驾驶设备周围划分区域的范围以及各区域的大小可根据需要设置，本说明书在此不做限制。

图4为本说明书提供的一种区域划分示意图。如图，图中三角形表示该无人驾驶设备，各正方形表示对该无人驾驶设备周围进行区域划分后得到的各区域。图中的S0、S1、S2、S3、S4、S5、S6、S7表示与该无人驾驶设备相对位置不同的各区域。该无人驾驶设备在确定障碍物的位置时，可对各位置进行编码。例如，按照 S0~ S7的顺序，各位置对应的编码可以是00000001、00000010、00000100、00001000、00010000、00100000、01000000、10000000。当障碍物出现在区域S5时，则可用表示00100000表示该障碍物所在的区域，当障碍物的位置跨区域时，例如障碍物同时出现在S5和S6区域时，则障碍物的位置可表示为00101000。

图5为本说明书提供的一种决策的验证过程的示意图。该无人驾驶设备在针对每个目标障碍物，确定出该目标障碍物对应的决策后，可执行该验证过程，该验证过程包括以下步骤：

S400：判断该目标障碍物所在的区域与自身对应的决策的冲突区域是否一致，以验证该目标障碍物当前的位置与该目标障碍物对应的决策是否冲突，若是，执行步骤S401，若否，执行步骤S402。

S401：确定该目标障碍物当前的位置与该目标障碍物对应的决策冲突，并对该目标障碍物对应的决策进行更新。

S402：进行第二次判断，判断该决策的决策率是否大于预设的决策阈值，若是，则执行步骤S403，若否，则执行步骤S404。

S403：确定该目标障碍物当前的位置与该目标障碍物对应的决策不冲突，不对该决策进行更新。

S404：进行第三次判断，判断该障碍物所在的区域是否与该决策对应的匹配区域一致，若是，则执行步骤S405，若否，则执行步骤S406。

S405：确定该目标障碍物当前的位置与该目标障碍物对应的决策不冲突，不对该决策进行更新。

S406：确定该目标障碍物当前的位置与该目标障碍物对应的决策冲突，对该决策进行更新。

在本说明书一个或多个实施例中，对该决策模型进行训练的过程如图6所示：

图6为本说明书提供的一种决策模型的训练过程示意图。其中：

S200：获取先验驾驶数据以及驾驶员的先验决策数据，根据所述先验驾驶数据确定训练样本数据，并根据所述先验决策数据，确定所述训练样本数据的标注，其中，所述训练样本数据包括无人驾驶设备数据以及障碍物数据。

在本说明书一个或多个实施例中，该决策模型的训练过程可由服务器执行。该无人驾驶设备可以是具有自动驾驶功能的车辆。即，该无人驾驶设备可自动驾驶，也可由驾驶员驾驶。

由于之所以进行行为决策，确定该无人驾驶设备下一时刻对各障碍物执行的决策，是因为在无人驾驶设备处于无驾驶员协助驾驶的情况下，即自动驾驶的情况下，需要自行进行判断，确定各障碍物对应的决策，依靠各障碍物对应的决策排除各障碍物对自身安全造成的影响。通常，驾驶员的驾驶经验丰富，其对环境中各障碍物做出的决策足够合理，且能够保证自身安全。当在相同或相似的环境情况下，无人驾驶设备做出的决策越接近驾驶员，则其决策的准确性越高。因此，可基于驾驶员协助控制该无人驾驶设备驾驶时产生的无人驾驶设备的驾驶数据、环境中障碍物的障碍物数据，以及驾驶员的根据自身做出的决策，控制无人驾驶设备运动的数据（例如，速度、加速度等），来训练该决策模型，使该决策模型学习驾驶员在不同环境情况下对不同障碍物做出的决策。

在本说明书一个或多个实施例中，在驾驶员协助控制该无人驾驶设备运动时，驾驶员仅用于确定各障碍物对应的决策，并基于决策确定该无人驾驶设备的控制策略（例如，控制该无人驾驶设备加速、减速等），以确定该决策模型的训练样本数据的标注。

在本说明书一个或多个实施例中，在对该决策模型进行训练时，该服务器首先可先获取先验驾驶数据以及先验决策数据，以基于该先验驾驶数据确定训练样本数据，并根据该先验决策数据确定该训练样本数据的标注。

该先验驾驶数据即驾驶员协助控制该无人驾驶设备运动时产生的驾驶数据以及环境中的障碍物数据。驾驶员在驾驶无人驾驶设备运动时，由该无人驾驶设备以固定周期进行轨迹规划确定规划轨迹，并预测各障碍物在预设时间内的运动轨迹。驾驶员不干涉无人驾驶设备的运动轨迹，无人驾驶设备自行沿着规划轨迹运动，驾驶员仅用于确定各障碍物对应的决策，并确定该无人驾驶设备的控制策略。该无人驾驶设备可在驾驶员协助控制其运动时，记录驾驶过程中产生的驾驶数据，并记录各时刻根据传感器采集的环境数据确定的综合障碍物数据。

其中，该驾驶数据至少包括该无人驾驶设备各周期确定出的规划轨迹、各时刻的速度等。该综合障碍物数据可包括各时刻各障碍物的位置、速度、加速度、运动方向等数据，以及预测得到的各障碍物的运动轨迹。该先验决策数据即该驾驶员对各障碍物的决策。该决策包括避让决策以及超越决策。

在本说明书一个或多个实施例中，该服务器可通过特征工程对获取到的先验驾驶数据进行处理。得到训练样本数据。

其中，该训练样本数据包括无人驾驶设备数据以及障碍物数据。该无人驾驶设备数据为以预设的距离间隔，对该无人驾驶设备的规划轨迹进行采样后得到的各轨迹点以及得到该规划轨迹时该无人驾驶设备的速度。该障碍物数据为各障碍物在预设时间内的各位置和各位置对应的速度。

在本说明书一个或多个实施例中，该服务器可针对每个障碍物，根据该先验决策数据，确定该驾驶员对该障碍物的决策。并将该障碍物的障碍物数据以及该无人驾驶设备的无人驾驶设备数据作为训练样本数据。将驾驶员对该障碍物的决策，作为该训练样本数据的标注。

S202：针对每个训练样本数据，将该训练样本数据中的无人驾驶设备数据输入所述决策模型的第一状态分析网络，得到第一特征向量，并将该训练样本数据中的障碍物数据输入所述决策模型的第二状态分析网络，得到第二特征向量。

在本说明书一个或多个实施例中，该服务器在确定出各训练样本数据及其对应的标注后，可针对每个训练样本数据，将该训练样本数据中的无人驾驶设备数据输入待训练的决策模型的第一状态分析网络，得到第一特征向量，并将该训练样本数据中的障碍物数据输入该决策模型的第二状态分析网络，得到第二特征向量。

在本说明书一个或多个实施例中，该第一状态分析网络为循环神经网络（Recurrent Neural Network，RNN），该第二状态分析网络为多层感知器（MultilayerPerceptron，MLP）。该第一状态分析网络可为单层网络，该第二状态分析网络可为双层神经元构成的网络。

S204：将所述第一特征向量以及所述第二特征向量输入所述决策模型中的融合决策网络，得到所述融合决策网络输出的该训练样本数据对应的决策。

在本说明书一个或多个实施例中，该服务器在得到第一状态分析网络以及第二状态分析网络分别输出的第一特征向量以及第二特征向量之后，可将该第一特征向量以及该第二特征向量输入该决策模型中的融合决策网络，得到该融合决策网络输出的该训练样本数据对应的决策。

在本说明书一个或多个实施例中，通过该决策模型中的融合决策网络可得到预设数量的决策对应的概率，该服务器可将概率最高的决策作为该训练样本数据对应的决策。

在本说明书一个或多个实施例中，该融合决策网络可以为三层神经元构成的MLP网络。

S206：根据该训练样本对应的决策以及该训练样本的标注间的差异，确定该训练样本对应的损失，并以所述损失最小为目标，调整所述决策模型的参数。

在本说明书一个或多个实施例中，该服务器在得到该训练样本对应的决策后，可根据该训练样本对应的决策以及该训练样本的标注间的差异，确定该训练样本对应的损失，并以该损失最小为目标，调整该决策模型的参数。

以上为本说明书的一个或多个实施例提供的无人驾驶设备的控制方法，基于同样的思路，本说明书还提供了相应的无人驾驶设备的控制装置，如图7所示。

图7为本说明书提供的一种无人驾驶设备的控制装置的示意图，该装置包括：

确定模块300，用于确定无人驾驶设备的规划轨迹、所述无人驾驶设备的速度以及环境中的各障碍物在预设时间内的运动轨迹；

交汇确定模块301，用于将运动轨迹与所述规划轨迹有交汇的障碍物作为目标障碍物，并确定各目标障碍物的运动轨迹与所述规划轨迹的交汇位置；

第一向量确定模块302，用于根据所述无人驾驶设备的速度以及所述规划轨迹，确定所述无人驾驶设备的状态向量，作为第一向量；

第二向量确定模块303，用于针对每个目标障碍物，根据该目标障碍物的运动轨迹，确定该目标障碍物的各位置和各位置对应的速度，并根据确定出的各位置和各位置对应的速度，确定该目标障碍物的状态向量，作为第二向量；

决策模块304，用于将所述第一向量以及所述第二向量输入预先训练的决策模型，确定该目标障碍物对应的决策；

控制模块305，用于根据确定出的至少部分决策，确定下一时刻所述无人驾驶设备的控制策略，以实现所述无人驾驶设备与各目标障碍物交错通过相应的交汇位置。

可选地，所述第一向量确定模块302，还用于以预设的距离间隔对所述规划轨迹进行采样，确定所述规划轨迹的各轨迹点，根据所述无人驾驶设备当前的速度以及各轨迹点的位置，确定所述无人驾驶设备的状态向量。

所述装置还包括：验证模块306。

可选地，所述决策包括避让决策以及超越决策，且二者互为关联决策，所述验证模块306，用于确定各目标障碍物当前的位置，针对每个目标障碍物，验证该目标障碍物当前的位置与该目标障碍物对应的决策是否冲突，若冲突，则对该目标障碍物对应的决策进行更新，重新确定该目标障碍物对应的决策的关联决策，作为该目标障碍物对应的决策，根据更新后的至少部分决策，确定下一时刻所述无人驾驶设备的控制策略。

可选地，所述验证模块306，还用于将所述无人驾驶设备周围划分为若干区域，根据该目标障碍物的位置，确定该目标障碍物所在的区域，确定该目标障碍物对应的决策的冲突区域，并判断该目标障碍物所在的区域与所述冲突区域是否一致，若是，则确定该目标障碍物的位置与所述决策冲突，若否，则确定该目标障碍物的位置与所述决策不冲突。

可选地，所述验证模块306，还用于当该目标障碍物所在的区域与所述冲突区域不一致，确定该目标障碍物对应的历史决策，从所述历史决策中，确定与该目标障碍物对应的决策相同的决策数量，作为历史数量，根据所述历史决策的总数以及所述历史数量，确定该目标障碍物对应的决策的决策率，判断所述决策率是否大于预设的决策阈值，当所述决策率大于所述决策阈值时，确定该目标障碍物的位置与所述决策不冲突。

可选地，所述验证模块306，还用于当所述决策率不大于所述决策阈值时，确定该目标障碍物对应的决策的匹配区域，判断该目标障碍物所在的区域是否与所述匹配区域一致，若是，则确定该目标障碍物的位置与所述决策不冲突，若否，则确定该目标障碍物的位置与所述决策冲突。

可选地，所述控制模块305，还用于将距离所述无人驾驶设备最近的交汇位置作为目标交汇位置，从确定出的决策中，确定与所述规划轨迹在所述目标交汇位置交汇的运动轨迹所属的目标障碍物对应的决策，作为目标决策，根据至少部分所述目标决策，确定下一时刻所述无人驾驶设备的控制策略，以实现所述无人驾驶设备与各目标障碍物交错通过所述目标交汇位置。

本说明书还提供了一种计算机可读存储介质，该存储介质存储有计算机程序，计算机程序可用于执行上述图1提供的无人驾驶设备的控制方法。

本说明书还提供了图8所示的无人驾驶设备的结构示意图。如图8所示，在硬件层面，该无人驾驶设备包括处理器、内部总线、内存以及非易失性存储器，当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，以实现上述图1提供的无人驾驶设备的控制方法。

当然，除了软件实现方式之外，本说明书并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进（例如，对二极管、晶体管、开关等电路结构的改进）还是软件上的改进（对于方法流程的改进）。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件（Programmable Logic Device, PLD）（例如现场可编程门阵列（Field Programmable GateArray，FPGA））就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器（logic compiler）”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言（Hardware Description Language，HDL），而HDL也并非仅有一种，而是有许多种，如ABEL（Advanced Boolean Expression Language）、AHDL（Altera Hardware DescriptionLanguage）、Confluence、CUPL（Cornell University Programming Language）、HDCal、JHDL（Java Hardware Description Language）、Lava、Lola、MyHDL、PALASM、RHDL（RubyHardware Description Language）等，目前最普遍使用的是VHDL（Very-High-SpeedIntegrated Circuit Hardware Description Language）与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该（微）处理器执行的计算机可读程序代码（例如软件或固件）的计算机可读介质、逻辑门、开关、专用集成电路（Application Specific Integrated Circuit，ASIC）、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

Claims

1.一种无人驾驶设备的控制方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，根据所述无人驾驶设备的速度以及所述规划轨迹，确定所述无人驾驶设备的状态向量，具体包括：

3.如权利要求1所述的方法，其特征在于，所述决策包括避让决策以及超越决策，且二者互为关联决策；

确定各目标障碍物当前的位置；

针对每个目标障碍物，验证该目标障碍物当前的位置与该目标障碍物对应的决策是否冲突；

4.如权利要求3所述的方法，其特征在于，验证该目标障碍物当前的位置与该目标障碍物对应的决策是否冲突，具体包括：

将所述无人驾驶设备周围划分为若干区域；

根据该目标障碍物的位置，确定该目标障碍物所在的区域；

若是，则确定该目标障碍物的位置与所述决策冲突；

若否，则确定该目标障碍物的位置与所述决策不冲突。

5.如权利要求4所述的方法，其特征在于，所述方法还包括：

判断所述决策率是否大于预设的决策阈值；

6.如权利要求5所述的方法，其特征在于，所述方法还包括：

判断该目标障碍物所在的区域是否与所述匹配区域一致；

若是，则确定该目标障碍物的位置与所述决策不冲突；

若否，则确定该目标障碍物的位置与所述决策冲突。

7.如权利要求1所述的方法，其特征在于，根据确定出的至少部分决策，确定下一时刻所述无人驾驶设备的控制策略，以实现所述无人驾驶设备与各目标障碍物交错通过相应的交汇位置，具体包括：

8.一种无人驾驶设备的控制装置，其特征在于，包括：

9.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。

10.一种无人驾驶设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方法。