CN110286677A

CN110286677A - 一种用于数据采集的无人车控制方法和系统

Info

Publication number: CN110286677A
Application number: CN201910509290.5A
Authority: CN
Inventors: 刘驰
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2019-06-13
Filing date: 2019-06-13
Publication date: 2019-09-27
Anticipated expiration: 2039-06-13
Also published as: CN110286677B

Abstract

本发明涉及一种用于数据采集的无人车控制方法和系统，包括：采集无人车所在区域的整体环境观测数据；将无人车所在区域的整体环境观测数据代入预先训练的神经网络模型，获取无人车的移动位移指令；按照所述无人车的移动位移指令移动至数据站进行采集作业。本发明提出的技术方案无需远端控制中心，各无人车将其所在区域的整体环境观测数据代入其搭载的神经网络模型，获取其对应的移动位移指令并按照移动位移指令进行采集作业；消除了远端控制时产生的网络干扰风险，减少了远端控制建设成本；同时克服了主流无人干预采集方案中的规划难度大、耗时长和规划方案难以复用的缺点，提高了无人车的采集效率和采集精准度。

Description

一种用于数据采集的无人车控制方法和系统

技术领域

本发明涉及无人车数据采集领域，具体涉及一种用于数据采集的无人车控制方法和系统。

背景技术

智慧城市，无人工厂，智慧农场等场景中对数据的更新，采集即时性，完备性都有较高需求，即要求待采集区域内各类数据均被尽可能多，尽可能完整的采集；这对无人车路径的规划提出了极高的要求。

目前主流的方案使用一些无人车或无人机进行区域内的数据采集。在有人工干预的方案中，各个无人车需要人工的进行控制和操作，极大增加了采集任务的人工成本，同时，人工控制需要远端控制中心，增加建设成本和网络干扰的风险。

在无人干预的方案中，各个无人车根据事先设定的轨迹，按照设定速度进行采集任务。在此方案执行前，需要设计轨迹与运行速度，需要同时考虑采集任务的地理信息，和无人车的续航能力，移动速度等信息，以及传感器的有效范围。

针对不同的采集任务，不仅要考虑区域内数据分布，障碍物的位置，还需要考虑不同地形对无人车续航能力的影响，才可以规划出一个合理的轨迹。此规划过程耗时而且需要极高准确性，因为一旦开始执行采集任务，难以进行更新。即使是同一采集任务，无人车的信息一旦改变，例如续航时间，最高移动速度的变化，也需要重新规划轨迹和速度。

发明内容

针对现有技术的不足，本发明的目的是提出一种用于数据采集的无人车控制方法，该方法无需远端控制中心，各无人车将其所在区域的整体环境观测数据代入其搭载的神经网络模型，获取其对应的移动位移指令并按照移动位移指令进行高能效，高数据质量的采集作业。

本发明的目的是采用下述技术方案实现的：

本发明提供一种用于数据采集的无人车控制方法，其改进之处在于，所述方法包括：

采集无人车所在区域的整体环境观测数据；

将无人车所在区域的整体环境观测数据代入预先训练的神经网络模型，获取无人车的移动位移指令；

按照所述无人车的移动位移指令移动至数据站进行采集作业；

其中，所述无人车所在区域的整体环境观测数据包括：无人车所在区域中采集站的数据剩余信息、无人车所在位置信息和无人车所剩能量信息。

优选的，所述预先训练的神经网络模型的获取过程包括：

步骤1：初始化迭代次数t＝0；

步骤2：判断采集区域的历史样本库中历史样本的数量是否大于k₁.B(N+1)，若是，则在所述样本库中抽取B组历史样本；否则，返回步骤1；

步骤3：利用所述B组历史样本获取所述预先训练的神经网络模型；

步骤4：若所述预先训练的神经网络收敛,则结束任务；否则,令t＝t+1，并返回步骤2；

其中，所述B组历史样本中第b组历史样本为所述B组历史样本中第b组历史样本中第X_b+i时刻对应的样本；X_b为B组历史样本中第b组历史样本的起始时刻，X_b+N为B组历史样本中第b组历史样本的最终时刻，k₁为样本抽取比例系数。

进一步的，所述步骤3，包括：

步骤a.利用B组历史样本中各组历史样本中起始时刻对应的样本数据分别训练决策神经网络和评价神经网络；

步骤b.利用B组历史样本中各组历史样本中最终时刻对应的样本数据分别训练目标决策神经网络和目标评价神经网络；

步骤c.分别更新决策神经网络、目标决策神经网络、评价神经网络和目标评价神经网络输入层至隐含层间的权重。

进一步的，所述步骤a，包括：

分别将所述B组历史样本中各组历史样本中起始时刻对应的样本数据中的整体环境观测值和无人车的移动位移指令作为所述决策神经网络的输入层样本信息和输出层样本信息，训练所述决策神经网络；

将所述B组历史样本中各组历史样本中起始时刻对应的样本数据中的整体环境观测值和无人车的移动位移指令作为所述评价神经网络的输入层样本信息，将所述B组历史样本中各组历史样本中起始时刻对应的样本数据中的无人车累计奖励值作为所述评价神经网络的输出层样本信息，训练所述评价神经网络；

其中，所述样本数据中的无人车累计奖励值为从样本对应时刻开始到样本所在的采集任务结束时刻为止各时刻的无人车奖励值的总和。

进一步的，所述步骤b，包括：

分别将所述B组历史样本中各组历史样本中最终时刻对应的样本数据中的整体环境观测值和无人车的移动位移指令作为所述目标决策神经网络的输入层样本信息和输出层样本信息，训练所述目标决策神经网络。

将所述B组历史样本中各组历史样本中最终时刻对应的样本数据中的整体环境观测值和无人车的移动位移指令作为所述目标评价神经网络的输入层样本信息，将所述B组历史样本中各组历史样本中最终时刻对应的样本数据中的无人车累计奖励值作为所述目标评价神经网络的输出层样本信息，训练所述目标评价神经网络。

进一步的，所述步骤c中，决策神经网络的输入层至隐含层间的权重更新公式为：

式中，为第t次迭代决策神经网络的输入层至隐含层间的权重；为第t-1次迭代决策神经网络的输入层至隐含层间的权重；α₁为决策神经网络的学习率；π_t第t次迭代决策神经网络的输出层样本信息；为第t次迭代时B组历史样本中第b组历史样本中起始时刻对应的样本数据中的无人车累计奖励值；为第t次迭代时B组历史样本中第b组历史样本中起始时刻对应的样本数据中的无人车的移动位移指令；

目标决策神经网络的输入层至隐含层间的权重更新公式为：

式中，为第t次迭代目标决策神经网络的输入层至隐含层间的权重；为第t-1次迭代目标决策神经网络的输入层至隐含层间的权重；τ₁为目标决策神经网络的更新速率；

评价神经网络的输入层至隐含层间的权重更新公式为：

式中，为第t次迭代评价神经网络的输入层至隐含层间的权重；为第t-1次迭代评价神经网络的输入层至隐含层间的权重；α₂为评价神经网络的学习率；L(t)为第t次迭代神经网络模型的评价误差值；

目标评价神经网络的输入层至隐含层间的权重更新公式为：

式中，为第t次迭代目标评价神经网络的输入层至隐含层间的权重；为第t-1次迭代目标评价神经网络的输入层至隐含层间的权重；τ₂为目标评价神经网络的更新速率。

进一步的，按下式确定所述第t次迭代神经网络模型的评价误差值L(t)：

式中，为第t次迭代时B组历史样本中第b组历史样本中起始时刻对应的样本数据中的预计无人车累计奖励值；

按下式确定所述第t次迭代时B组历史样本中第b组历史样本中起始时刻对应的样本数据中的预计无人车累计奖励值

式中，ξ为衰减值；z为时间步长；为第t次迭代时B组历史样本中第b组历史样本中最终时刻对应的样本数据中的无人车累计奖励值；为第t次迭代时B组历史样本中第b组历史样本中第X_b+i时刻对应的样本数据中的无人车奖励值；X_b+i为B组历史样本中第b组历史样本的起始时刻后的第i个时刻；

按下式确定所述为第t次迭代时B组历史样本中第b组历史样本中第X_b+i时刻对应的样本数据中的无人车奖励值

式中，h_t(k)为第k个数据站到第t次迭代时累计被采集次数；A为数据站总数；为第t次迭代时B组历史样本中第b组历史样本中第X_b+i时刻对应的无人车能量消耗值；为第t次迭代时B组历史样本中第b组历史样本中第X_b+i时刻对应的无人车采集数据量。

本发明提供一种用于数据采集的无人车控制系统，其改进之处在于，所述系统包括：

第一采集模块，用于采集无人车所在区域的整体环境观测数据；

获取模块，用于将无人车所在区域的整体环境观测数据代入预先训练的神经网络模型，获取无人车的移动位移指令；

第二采集模块，用于按照所述无人车的移动位移指令移动至数据站进行采集作业；

优选的，所述预先训练的神经网络模型的获取过程包括：

步骤1：初始化迭代次数t＝0；

进一步的，所述步骤3，包括：

进一步的，所述步骤a，包括：

进一步的，所述步骤b，包括：

目标决策神经网络的输入层至隐含层间的权重更新公式为：

评价神经网络的输入层至隐含层间的权重更新公式为：

目标评价神经网络的输入层至隐含层间的权重更新公式为：

与最接近的现有技术相比，本发明具有的有益效果：

本发明提供的技术方案，采集无人车所在区域的整体环境观测数据；将无人车所在区域的整体环境观测数据代入预先训练的神经网络模型，获取无人车的移动位移指令；无需在无人车采集作业前对其行进路线进行规划，克服了主流无人干预采集方案中的规划难度大、耗时长和规划方案难以复用的缺点；按照所述无人车的移动位移指令移动至数据站进行采集作业；无需远端控制中心对无人车进行控制，消除了远端控制时产生的网络干扰风险，减少了远端控制建设成本；提高了无人车的采集效率和采集精准度。

附图说明

图1是一种用于数据采集的无人车控制方法流程图；

图2是一种用于数据采集的无人车控制系统结构示意图。

具体实施方式

下面结合附图对本发明的具体实施方式作进一步的详细说明。

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

本发明提供了一种用于数据采集的无人车控制方法，如图1所示，所述方法包括：

步骤101.采集无人车所在区域的整体环境观测数据；

在本发明的最佳实施例中，所述采集无人车所在区域的整体环境观测数据之前，包括：

确定待采集区域的尺寸、形状、所有无人车的总调度次数、区域内数据站的分布情况和区域内障碍物的分布情况，根据所述待采集区域的尺寸、形状、所有无人车的总调度次数、区域内数据站的分布情况和区域内障碍物的分布情况建立任务模型，并将其传输给各无人车；将搭载了神经网络模型的无人车部署到待采集区域中；

在本发明的最佳实施例中，建立的某任务模型为：给定待采集区域为长宽均为160m的矩形；以待采集区域最左下角为原点，10m为单位长度，建立直角坐标系；使用256数据点表征待采集区域内数据站和障碍物的分布情况；任务中设定所有无人车的总调度次数为400次。

在本发明的最佳实施例中，采集无人车所在区域的整体环境观测数据包括：部署到待采集区域中各无人车采集各自附近的局部环境观测数据，各无人车间通过车载的WIFI模块共享信息；获取采集无人车所在区域的整体环境观测数据。

步骤102.将无人车所在区域的整体环境观测数据代入预先训练的神经网络模型，获取无人车的移动位移指令；

在本发明的最佳实施例中，神经网络模型中决策神经网络和目标决策神经网络使用的是tensorflow搭建的隐含层为三层卷积神经网络和三层全连接层的深度神经网络；其中，卷积神经网络的卷积核感受野为长宽均为2的矩形，每一层全连接层的神经元数目为800，输出层节点数为2。

神经网络模型中评价神经网络和目标评价神经网络使用的是tensorflow搭建的隐含层为三层卷积神经网络和三层全连接层的深度神经网络；其中，卷积神经网络的卷积核感受野为长宽均为2的矩形，每一层全连接层的神经元数目为800，输出层节点数为1。

步骤103.按照所述无人车的移动位移指令移动至数据站进行采集作业；

在本发明的最佳实施例中，各无人车上均搭载一套神经网络模型，对于各无人车上搭载的神经网络模型的训练方法一致；无人车搭载了神经网络模型使得无人车无需远端人工干预，避免建立远端控制中心产生的费用；各无人车搭载的神经网络模型，一次训练，多次使用，可以减少每个采集任务路径规划的开销；同时这些神经网络模型可以根据实际环境观测值做出不同决策，提高了路径规划的动态性；在采集作业时各个无人车合作完成数据采集，保证整个区域内数据均匀性，提高数据采集量，降低能量消耗。

具体的，所述预先训练的神经网络模型的获取过程包括：

步骤1：初始化迭代次数t＝0；

在本发明的最佳实施例中，若采集区域的历史样本库中历史样本阈值大于20480时，在所述采集区域的历史样本库中抽取10组样本数据，每组样本数据有124个样本；共计1024个样本；此时样本抽取比例为1/20；时间步长为5；衰减值为0.95。

抽取1024个样本的方法为：

将采集区域的历史样本库中历史样本根据其自身的样本权重值所在区间分为10组，在任一组随机抽取一个样本；记录所抽取的样本对应的时刻，在数据库中抽取与所述抽取的样本时间上相邻的123个时刻对应的样本；

例如，在第8组样本中抽取的任一样本对应的时刻为t₁；则在数据库中再在抽取时刻t₁+1到时刻t₁+123对应的样本。

在本发明的最佳实施例中，获取采集区域的历史样本库中各历史样本的最大权重l；对采集区域的历史样本库中各历史样本的最大权重取整为l^*；将区间[0,l^*]均分为10份；获取各历史样本所属的区间。

在本发明的最佳实施例中，采集区域的历史样本库中各历史样本的样本权重设定方法为：令采集区域的历史样本库中第一个历史样本的样本权重为0；有历史样本存入数据库时，获取目前采集区域的历史样本库中最大的样本权重；在所述采集区域的历史样本库中最大的样本权重上加一个极小值ε作为目前要存入数据库中的历史样本的样本权重值。

进一步的，所述步骤3，包括：

在本发明的最佳实施例中，所述步骤c之后，包括：

更新所述B组历史样本中各组历史样本中起始时刻对应的样本的权重值，更新方法为：其中，为B组历史样本中各组历史样本中起始时刻对应的样本的权重值；为第t次迭代时B组历史样本中第b组历史样本中起始时刻对应的样本数据中的无人车累计奖励值；为第t次迭代时B组历史样本中第b组历史样本中起始时刻对应的样本数据中的预计无人车累计奖励值。

具体的，所述步骤a，包括：

具体的，所述步骤b，包括：

具体的，所述步骤c中，决策神经网络的输入层至隐含层间的权重更新公式为：

目标决策神经网络的输入层至隐含层间的权重更新公式为：

评价神经网络的输入层至隐含层间的权重更新公式为：

目标评价神经网络的输入层至隐含层间的权重更新公式为：

具体的，按下式确定所述第t次迭代神经网络模型的评价误差值L(t)：

本发明提供一种用于数据采集的无人车控制系统，如图2所示，所述系统包括：

具体的，所述预先训练的神经网络模型的获取过程包括：

步骤1：初始化迭代次数t＝0；

具体的，所述步骤3，包括：

具体的，所述步骤a，包括：

具体的，所述步骤b，包括：

目标决策神经网络的输入层至隐含层间的权重更新公式为：

评价神经网络的输入层至隐含层间的权重更新公式为：

目标评价神经网络的输入层至隐含层间的权重更新公式为：

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者等同替换，而未脱离本发明精神和范围的任何修改或者等同替换，其均应涵盖在本发明的权利要求保护范围之内。

Claims

1.一种用于数据采集的无人车控制方法，其特征在于，所述方法包括：

采集无人车所在区域的整体环境观测数据；

2.如权利要求1所述的方法，其特征在于，所述预先训练的神经网络模型的获取过程包括：

步骤1：初始化迭代次数t＝0；

3.如权利要求2所述的方法，其特征在于，所述步骤3，包括：

4.如权利要求3所述的方法，其特征在于，所述步骤a，包括：

5.如权利要求4所述的方法，其特征在于，所述步骤b，包括：

6.如权利要求3所述的方法，其特征在于，所述步骤c中，决策神经网络的输入层至隐含层间的权重更新公式为：

目标决策神经网络的输入层至隐含层间的权重更新公式为：

评价神经网络的输入层至隐含层间的权重更新公式为：

目标评价神经网络的输入层至隐含层间的权重更新公式为：

7.如权利要求6所述的方法，其特征在于，按下式确定所述第t次迭代神经网络模型的评价误差值L(t)：

8.一种用于数据采集的无人车控制系统，其特征在于，所述系统包括：

9.如权利要求8所述的系统，其特征在于，所述预先训练的神经网络模型的获取过程包括：

步骤1：初始化迭代次数t＝0；

10.如权利要求9所述的系统，其特征在于，所述步骤3，包括：