CN109976153A

CN109976153A - 控制无人驾驶设备及模型训练的方法、装置及电子设备

Info

Publication number: CN109976153A
Application number: CN201910154597.8A
Authority: CN
Inventors: 穆荣均; 夏华夏; 任冬淳; 郭潇阳; 付圣
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2019-03-01
Filing date: 2019-03-01
Publication date: 2019-07-05
Anticipated expiration: 2039-03-01
Also published as: WO2020177417A1; CN109976153B

Abstract

本申请提供一种控制无人驾驶设备及模型训练的方法、装置及电子设备，所述方法的一具体实施方式包括：获取目标设备当前的控制指导数据；获取预先确定的所述目标设备对应的目标隐变量；所述目标隐变量用于表示针对所述目标设备，控制指导数据与控制参数之间的转化影响因素；基于所述当前的控制指导参数及所述目标隐变量，得到当前的控制参数；根据所述当前的控制参数控制所述目标设备。该实施方式无需通过大量人工标定得到每个无人驾驶设备所对应的对应关系表，从而节省了大量的人力资源，并减小了控制参数的误差。

Description

控制无人驾驶设备及模型训练的方法、装置及电子设备

技术领域

本申请涉及无人驾驶技术领域，特别涉及一种控制无人驾驶设备及模型训练的方法、装置及电子设备。

背景技术

目前来说，在无人驾驶技术中，在确定了驾驶决策后，一般是参考驾驶决策得到当前的控制指导数据，并通过查表的方式(查询控制指导数据与控制参数的对应关系表)，得到当前的控制指导数据所对应的控制参数，以进行无人驾驶控制。但是，上述方式需要预先针对每个无人驾驶设备进行大量人工标定，从而得到每个无人驾驶设备所对应的对应关系表，因此，浪费了大量的人力资源。并且，上述对应关系表仅能表示查询控制指导数据与控制参数之间的离散关系，从而使得控制参数的误差增大。

发明内容

为了解决上述技术问题之一，本申请提供一种控制无人驾驶设备及模型训练的方法、装置及电子设备。

根据本申请实施例的第一方面，提供一种控制无人驾驶设备的方法，包括：

获取目标设备当前的控制指导数据；

获取预先确定的所述目标设备对应的目标隐变量；所述目标隐变量用于表示针对所述目标设备，控制指导数据与控制参数之间的转化影响因素；

基于所述当前的控制指导数据及所述目标隐变量，得到当前的控制参数；

根据所述当前的控制参数控制所述目标设备。

可选的，预先通过如下方式确定所述目标隐变量：

确定针对所述目标设备采集的多组样本数据，每组所述样本数据包括控制指导数据及控制参数；

将所述多组样本数据输入目标卷积神经网络，得到所述目标卷积神经网络输出的所述目标隐变量。

可选的，所述基于所述当前的控制指导数据及所述目标隐变量，得到当前的控制参数，包括：

将所述当前的控制指导数据及所述目标隐变量输入至目标循环神经网络，得到当前的控制参数。

可选的，所述目标卷积神经网络及所述目标循环神经网络通过如下方法训练而成：

执行以下目标操作：从样本集中选多组样本数据作为第一数据，以及选一组样本数据作为第二数据；将所述第一数据输入至当前的卷积神经网络，得到隐变量，所述隐变量用于表示控制指导数据与控制参数之间的转化影响因素；将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络，得到预测参数；

若基于所述预测参数与所述第二数据对应的控制参数，确定未满足预设条件，对所述卷积神经网络和所述循环神经网络的网络参数进行调整，并重新执行所述目标操作；

若基于所述预测参数与所述第二数据对应的控制参数，确定满足所述预设条件，输出经过调整后的目标卷积神经网络及目标循环神经网络。

可选的，所述第一数据和所述第二数据为针对同一无人驾驶设备而采集的数据；

所述目标操作还包括：

在将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络的同时，将随机生成的噪声信号也输入至当前的循环神经网络。

可选的，通过如下方式确定满足所述预设条件：

确定目标函数，所述目标函数为所述预测参数与所述第二数据对应的控制参数之间的ELBO证据下线函数；

当所述目标函数收敛时，确定满足所述预设条件。

根据本申请实施例的第二方面，提供一种用于控制无人驾驶设备的模型训练方法，包括：

执行以下目标操作：从样本集中选多组样本数据作为第一数据，以及选一组样本数据作为第二数据，每组所述样本数据包括控制指导数据及控制参数；将所述第一数据输入至当前的卷积神经网络，得到隐变量，所述隐变量用于表示控制指导数据与控制参数之间的转化影响因素；将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络，得到预测参数；

所述目标操作还包括：

根据本申请实施例的第三方面，提供一种控制无人驾驶设备的装置，包括：

获取模块，用于获取目标设备当前的控制指导数据，并获取预先确定的所述目标设备对应的目标隐变量；所述目标隐变量用于表示针对所述目标设备，控制指导数据与控制参数之间的转化影响因素；

确定模块，用于基于所述当前的控制指导数据及所述目标隐变量，得到当前的控制参数；

控制模块，用于根据所述当前的控制参数控制所述目标设备。

根据本申请实施例的第四方面，提供一种用于控制无人驾驶设备的模型训练装置，包括：

执行模块，用于执行以下目标操作：从样本集中选多组样本数据作为第一数据，以及选一组样本数据作为第二数据，每组所述样本数据包括控制指导数据及控制参数；将所述第一数据输入至当前的卷积神经网络，得到隐变量，所述隐变量用于表示控制指导数据与控制参数之间的转化影响因素；将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络，得到预测参数；

调整模块，用于在基于所述预测参数与所述第二数据对应的控制参数，确定未满足预设条件时，对所述卷积神经网络和所述循环神经网络的网络参数进行调整，并指示所述执行模块重新执行所述目标操作；

输出模块，用于在基于所述预测参数与所述第二数据对应的控制参数，确定满足所述预设条件时，输出经过调整后的目标卷积神经网络及目标循环神经网络。

根据本申请实施例的第五方面，提供一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面以及第二方面中任一项所述的方法。

根据本申请实施例的第六方面，提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述第一方面以及第二方面中任一项所述的方法。

本申请的实施例提供的技术方案可以包括以下有益效果：

本申请的实施例提供的控制无人驾驶设备的方法和装置，通过获取目标设备当前的控制指导数据，及获取预先确定的目标设备对应的目标隐变量，基于当前的控制指导数据及目标隐变量，得到当前的控制参数，并根据当前的控制参数控制目标设备。其中，目标隐变量用于表示针对目标设备，控制指导数据与控制参数之间的转化影响因素。本实施例无需通过大量人工标定得到每个无人驾驶设备所对应的对应关系表，从而节省了大量的人力资源，并减小了控制参数的误差。

本申请的实施例提供的用于控制无人驾驶设备的模型训练的方法和装置，执行以下目标操作：从样本集中选多组样本数据作为第一数据，以及选一组样本数据作为第二数据，每组样本数据包括控制指导数据及控制参数。将第一数据输入至当前的卷积神经网络，得到隐变量，该隐变量用于表示控制指导数据与控制参数之间的转化影响因素。将该隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络，得到预测参数。若基于预测参数与第二数据对应的控制参数，确定未满足预设条件，则对当前的卷积神经网络和循环神经网络的网络参数进行调整，并重新执行目标操作。若基于预测参数与第二数据对应的控制参数，确定满足上述预设条件，则输出经过调整后的目标卷积神经网络及目标循环神经网络。由于本实施例引入了表示控制指导数据与控制参数之间转化影响因素的隐变量，并同时对用于构建隐变量的卷积神经网络，和用于预测控制参数的循环神经网络进行训练，使得训练得到的目标卷积神经网络及目标循环神经网络在应用于无人驾驶控制时，所得的控制参数更加准确。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

图1是本申请根据一示例性实施例示出的一种控制无人驾驶设备的方法的流程图；

图2是本申请根据一示例性实施例示出的一种用于控制无人驾驶设备的模型训练的方法的流程图；

图3是本申请根据一示例性实施例示出的一种控制无人驾驶设备的装置的框图；

图4是本申请根据一示例性实施例示出的一种用于控制无人驾驶设备的模型训练的装置的框图；

图5是本申请根据一示例性实施例示出的一种电子设备的结构示意图；

图6是本申请根据一示例性实施例示出的另一种电子设备的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

在本申请使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本申请可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本申请范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

如图1所示，图1是根据一示例性实施例示出的一种控制无人驾驶设备的方法的流程图，该方法可以应用于无人驾驶设备中。本领域技术人员可以理解，该无人驾驶设备可以包括但不限于无人车、无人操作机器人、无人机、无人船等等。该方法包括以下步骤：

在步骤101中，获取目标设备当前的控制指导数据。

在步骤102中，获取预先确定的目标设备对应的目标隐变量，该目标隐变量用于表示针对目标设备，控制指导数据与控制参数之间的转化影响因素。

在步骤103中，基于当前的控制指导数据及目标隐变量，得到当前的控制参数。

在本实施例中，目标设备为待控制的无人驾驶设备，目标设备可以是无人车，或者是无人操作机器人，或者是无人机，或者是无人船等等，本申请对目标设备的具体类型方面不限定。

在本实施例中，当前的控制参数为当前用于对目标设备进行控制的参数，例如，以无人车为例，控制参数可以是无人车的底盘控制参数(如，油门或刹车的控制量等)等。可以理解，控制参数还可以是其它的控制参数，本申请对此方面不限定。目标设备当前的控制指导数据可以用于确定当前的控制参数，例如，以无人车为例，当前的控制指导数据可以包括无人车当前的运行速度以及当前准备施加的加速度。可以理解，控制指导数据还可以是其它任意能够用于确定当前的控制参数的数据，本申请对此方面不限定。

在本实施例中，目标设备对应的目标隐变量能够用于表示控制指导数据与控制参数之间的转化影响因素，并且，该转化影响因素为针对目标设备的转化影响因素。可以预先基于训练好的目标卷积神经网络，确定该目标隐变量，并将目标隐变量存储于目标设备中，当对目标设备进行无人驾驶控制时，可以从目标设备存储的数据中获取目标隐变量，并基于目标隐变量进行无人驾驶控制。

在本实施例中，目标卷积神经网络和目标循环神经网络均为预先训练好的模型，具体来说，可以通过如下方式训练得到目标卷积神经网络和目标循环神经网络：执行以下目标操作：从样本集中选多组样本数据作为第一数据，以及选一组样本数据作为第二数据，每组样本数据包括控制指导数据及控制参数。将第一数据输入至当前的卷积神经网络，得到隐变量，该隐变量用于表示控制指导数据与控制参数之间的转化影响因素。将该隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络，得到预测参数。若基于预测参数与第二数据对应的控制参数，确定未满足预设条件，则对当前的卷积神经网络和循环神经网络的网络参数进行调整，并重新执行目标操作。若基于预测参数与第二数据对应的控制参数，确定满足上述预设条件，则输出经过调整后的目标卷积神经网络及目标循环神经网络。

进一步地，在目标操作过程中，在将隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络的同时，还可以将随机生成的噪声信号也输入至当前的循环神经网络，并且，保证第一数据和第二数据为针对同一无人驾驶设备而采集的数据。

在步骤104中，根据当前的控制参数控制目标设备。

在本实施例中，可以将当前的控制指导数据及目标隐变量输入至目标循环神经网络，将目标循环神经网络输出的结果作为当前的控制参数。可以按照当前的控制参数控制目标设备。

本申请的上述实施例提供的控制无人驾驶设备的方法，通过获取目标设备当前的控制指导数据，及获取预先确定的目标设备对应的目标隐变量，基于当前的控制指导数据及目标隐变量，得到当前的控制参数，并根据当前的控制参数控制目标设备。其中，目标隐变量用于表示针对目标设备，控制指导数据与控制参数之间的转化影响因素。本实施例无需通过大量人工标定得到每个无人驾驶设备所对应的对应关系表，从而节省了大量的人力资源，并减小了控制参数的误差。

在另一些可选实施方式中，可以预先通过如下方式确定目标设备对应的目标隐变量：可以确定针对目标设备采集的多组样本数据，每组样本数据包括控制指导数据及控制参数，并将上述多组样本数据输入目标卷积神经网络，得到目标卷积神经网络输出的目标隐变量。

在本实施例中，首先，可以预先针对目标设备进行驾驶测试，在驾驶测试的过程中，采集多组样本数据，每组样本数据可以包括控制指导数据及该控制指导数据对应的控制参数。该样本数据的组数可以是任意合理的数量，例如，可以是3组，或者5组，或者10组等。可以理解，本申请对样本数据的具体组数方面不限定。

接着，可以确定预先针对目标设备采集的多组样本数据，并将上述多组样本数据输入至目标卷积神经网络中，将目标卷积神经网络输出的结果作为目标隐变量。

由于本实施例中，可以采用预先针对目标设备而采集的多组样本数据，通过预先训练的目标卷积神经网络，得到能够表示控制指导数据与控制参数之间转化影响因素的目标隐变量，该目标隐变量为针对目标设备的隐变量。因此，进一步提高了控制参数的准确度。

如图2所示，图2根据一示例性实施例示出的一种用于控制无人驾驶设备的模型训练的方法的流程图，该方法可以应用于终端设备中，也可以应用于服务器中。该方法包括以下步骤：

在步骤201中，从样本集中选多组样本数据作为第一数据，以及选一组样本数据作为第二数据，每组样本数据包括控制指导数据及控制参数。

在本实施例中，首先，可以预先针对型号相同的多个不同的无人驾驶设备进行驾驶测试，在驾驶测试的过程中，采集大量样本数据得到样本集(样本集中的样本数据均对应于相同型号的无人驾驶设备)。其中，样本集中的每组样本数据可以包括控制指导数据及该控制指导数据对应的控制参数。在进行模型训练时，可以从样本集中选多组样本数据作为第一数据，以及从样本集中选一组样本数据作为第二数据。

在步骤202中，将第一数据输入至当前的卷积神经网络，得到隐变量，该隐变量用于表示控制指导数据与控制参数之间的转化影响因素。

在步骤203中，将该隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络，得到预测参数。

在本实施例中，首先，可以将第一数据输入至当前的卷积神经网络中，得到该卷积神经网络输出的隐变量。接着，可以将该隐变量和第二数据所对应的控制指导数据输入至当前的循环神经网络，得到该循环神经网络输出的预测参数。

在步骤204中，基于该预测参数与第二数据所对应的控制参数，确定当前是否满足预设条件。

在本实施例中，可以基于该预测参数与第二数据所对应的控制参数，确定目标函数是否收敛，当目标函数收敛时，可以确定当前满足预设条件。当目标函数未收敛时，可以确定当前未满足预设条件。其中，目标函数可以是上述预测参数与第二数据对应的控制参数之间的ELBO证据下线函数。具体来说，预测参数的分布与第二数据所对应的控制参数的分布服从正态分布，则可以根据ELBO的定义式以及极大似然估计方法，得到预测参数与第二数据对应的控制参数之间的ELBO证据下线函数。可以理解，目标函数还可以是其它任意合理的函数，本申请对此方面不限定。

在步骤205中，若未满足预设条件，则对上述卷积神经网络和上述循环神经网络的网络参数进行调整，并重新执行步骤201。

在本实施例中，当确定未满足预设条件时，则可以对上述卷积神经网络和上述循环神经网络的网络参数进行调整。具体来说，可以根据该预测参数与第二数据所对应的控制参数，确定上述卷积神经网络和上述循环神经网络的网络参数的调整方向(如，将参数调大，或者将参数调小)，然后按照该调整方向调整上述卷积神经网络和上述循环神经网络的网络参数。从而使得调整后，预测参数与第二数据所对应的控制参数之间的差异尽可能减小。

在步骤206中，若满足预设条件，则输出经过调整后的目标卷积神经网络及目标循环神经网络。

在本实施例中，当确定满足预设条件时，可以输出当前经过调整后的卷积神经网络及循环神经网络作为目标卷积神经网络及目标循环神经网络。

需要说明的是，通过上述方式训练得到的目标卷积神经网络及目标循环神经网络可以用于无人驾驶控制。具体来说，可以首先基于目标卷积神经网络获取目标设备对应的目标隐变量，并确定目标设备当前的控制指导数据。然后，将当前的控制指导数据及目标隐变量输入至目标循环神经网络中，得到目标循环神经网络的结果作为当前的控制参数。最后，可以按照当前的控制参数对目标进行设备控制。其中，可以通过如下方式确定目标隐变量：首先，确定针对目标设备采集的多组样本数据，每组样本数据包括控制指导数据及控制参数。接着，将多组样本数据输入至目标卷积神经网络，得到目标卷积神经网络输出的结果作为目标隐变量。

本申请的上述实施例提供的用于控制无人驾驶设备的模型训练的方法，执行以下目标操作：从样本集中选多组样本数据作为第一数据，以及选一组样本数据作为第二数据，每组样本数据包括控制指导数据及控制参数。将第一数据输入至当前的卷积神经网络，得到隐变量，该隐变量用于表示控制指导数据与控制参数之间的转化影响因素。将该隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络，得到预测参数。若基于预测参数与第二数据对应的控制参数，确定未满足预设条件，则对当前的卷积神经网络和循环神经网络的网络参数进行调整，并重新执行目标操作。若基于预测参数与第二数据对应的控制参数，确定满足上述预设条件，则输出经过调整后的目标卷积神经网络及目标循环神经网络。由于本实施例引入了表示控制指导数据与控制参数之间转化影响因素的隐变量，并同时对用于构建隐变量的卷积神经网络，和用于预测控制参数的循环神经网络进行训练，使得训练得到的目标卷积神经网络及目标循环神经网络在应用于无人驾驶控制时，所得的控制参数更加准确。

在另一些可选实施方式中，在目标操作过程中，在将隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络的同时，还可以将随机生成的噪声信号也输入至当前的循环神经网络，并且，保证第一数据和第二数据为针对同一无人驾驶设备而采集的数据。

一般来说，相同型号的无人驾驶设备通常具有一定的共性，通常可以将相同型号的无人驾驶设备归为一类进行样本数据采集并进行模型训练。但是，通过上述方式进行训练得到的模型只能体现相同型号的无人驾驶设备的共性特性。实际上，每个无人驾驶设备又具有其独特的特性，因此，相同型号的不同无人驾驶设备也是具有不同特性的。

在本实施例中，在每轮训练中，可以从样本集中选多组样本数据作为第一数据，以及选一组样本数据作为第二数据。其中，第一数据和第二数据均为针对同一无人驾驶设备而采集的数据，使得每轮训练均对应同一无人驾驶设备。并且，在目标操作过程中，可以随机生成噪声信号，并将噪声信号与隐变量和第二数据对应的控制指导数据一起输入至当前的循环神经网络中。由于每轮训练对应同一无人驾驶设备，并在每轮训练引入随机噪声信号(随机噪声信号可以为循环神经网络提供预设的自由度)，不同轮次的训练对应不同的无人驾驶设备。因此，最终训练得到的目标卷积神经网络能够针对每个无人驾驶设备，得到能反映其独特特性的隐变量。

由于本实施例中，在目标操作过程中，在将隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络的同时，还将随机生成的能为循环神经网络提供预设自由度的噪声信号也输入至当前的循环神经网络，并且，第一数据和第二数据为针对同一无人驾驶设备而采集的数据。因此，无需对每个无人驾驶设备进行大量样本数据的采集，即可使训练得到的目标卷积神经网络能够针对每个无人驾驶设备，得到反映其独特特性的隐变量，提高了模型训练的效率以及精确度。

应当注意，尽管在上述实施例中，以特定顺序描述了本申请方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。相反，流程图中描绘的步骤可以改变执行顺序。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

与前述控制无人驾驶设备及模型训练的方法实施例相对应，本申请还提供了控制无人驾驶设备及模型训练的装置的实施例。

如图3所示，图3是本申请根据一示例性实施例示出的一种控制无人驾驶设备的装置框图，该装置可以包括：获取模块301，确定模块302和控制模块303。

其中，获取模块301，用于获取目标设备当前的控制指导数据，并获取预先确定的目标设备对应的目标隐变量。目标隐变量用于表示针对目标设备，控制指导数据与控制参数之间的转化影响因素。

确定模块302，用于基于当前的控制指导数据及目标隐变量，得到当前的控制参数。

控制模块303，用于根据当前的控制参数控制目标设备。

在一些可选实施方式中，可以预先通过如下方式确定目标隐变量：确定针对目标设备采集的多组样本数据，每组样本数据包括控制指导数据及控制参数。并将多组样本数据输入目标卷积神经网络，得到目标卷积神经网络输出的目标隐变量。

在另一些可选实施方式中，确定模块302被配置用于：将当前的控制指导数据及目标隐变量输入至目标循环神经网络，得到当前的控制参数。

在另一些可选实施方式中，目标卷积神经网络及目标循环神经网络通过如下方法训练而成：

执行以下目标操作：从样本集中选多组样本数据作为第一数据，以及选一组样本数据作为第二数据，每组样本数据包括控制指导数据及控制参数。将第一数据输入至当前的卷积神经网络，得到隐变量，该隐变量用于表示控制指导数据与控制参数之间的转化影响因素。将隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络，得到预测参数。

若基于预测参数与第二数据对应的控制参数，确定未满足预设条件，对卷积神经网络和循环神经网络的网络参数进行调整，并重新执行目标操作。

若基于预测参数与第二数据对应的控制参数，确定满足预设条件，输出经过调整后的目标卷积神经网络及目标循环神经网络。

在另一些可选实施方式中，第一数据和第二数据为针对同一无人驾驶设备而采集的数据。

目标操作还可以包括：在将隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络的同时，将随机生成的噪声信号也输入至当前的循环神经网络。

在另一些可选实施方式中，可以通过如下方式确定满足预设条件：

确定目标函数，目标函数为上述预测参数与第二数据对应的控制参数之间的ELBO证据下线函数。当目标函数收敛时，确定满足预设条件。

应当理解，上述装置可以预先设置在无人驾驶设备中，也可以通过下载等方式而加载到无人驾驶设备中。上述装置中的相应模块可以与无人驾驶设备中的模块相互配合以实现无人驾驶控制的方案。

如图4所示，图4是本申请根据一示例性实施例示出的一种用于控制无人驾驶设备的模型训练装置框图，该装置可以包括：执行模块401，调整模块402和输出模块403。

其中，执行模块401，用于执行以下目标操作：从样本集中选多组样本数据作为第一数据，以及选一组样本数据作为第二数据，每组样本数据包括控制指导数据及控制参数。将第一数据输入至当前的卷积神经网络，得到隐变量，该隐变量用于表示控制指导数据与控制参数之间的转化影响因素，将隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络，得到预测参数。

调整模块402，用于在基于预测参数与第二数据对应的控制参数，确定未满足预设条件时，对上述卷积神经网络和上述循环神经网络的网络参数进行调整，并指示执行模块401重新执行目标操作。

输出模块403，用于在基于预测参数与第二数据对应的控制参数，确定满足预设条件时，输出经过调整后的目标卷积神经网络及目标循环神经网络。

执行模块401还用于：在将隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络的同时，将随机生成的噪声信号也输入至当前的循环神经网络。

应当理解，上述装置可以预先设置在终端设备或服务器中，也可以通过下载等方式而加载到终端设备或服务器中。上述装置中的相应模块可以与无人驾驶设备中的模块相互配合以实现用于控制无人驾驶设备的模型训练的方案。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

本申请实施例还提供了一种计算机可读存储介质，该存储介质存储有计算机程序，计算机程序可用于执行上述图1至图2任一实施例提供的控制无人驾驶设备及模型训练的方法。

对应于上述的控制无人驾驶设备的方法，本申请实施例还提出了图5所示的根据本申请的一示例性实施例的电子设备的示意结构图。请参考图5，在硬件层面，该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器，当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成控制无人驾驶设备的装置。当然，除了软件实现方式之外，本申请并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

对应于上述的用于控制无人驾驶设备的模型训练方法，本申请实施例还提出了图6所示的根据本申请的一示例性实施例的电子设备的示意结构图。请参考图6，在硬件层面，该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器，当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成用于控制无人驾驶设备的模型训练装置。当然，除了软件实现方式之外，本申请并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本申请的真正范围和精神由下面的权利要求指出。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims

1.一种控制无人驾驶设备的方法，其特征在于，所述方法包括：

获取目标设备当前的控制指导数据；

根据所述当前的控制参数控制所述目标设备。

2.根据权利要求1所述的方法，其特征在于，预先通过如下方式确定所述目标隐变量：

3.根据权利要求2所述的方法，其特征在于，所述基于所述当前的控制指导数据及所述目标隐变量，得到当前的控制参数，包括：

4.根据权利要求3所述的方法，其特征在于，所述目标卷积神经网络及所述目标循环神经网络通过如下方法训练而成：

5.根据权利要求4所述的方法，其特征在于，所述第一数据和所述第二数据为针对同一无人驾驶设备而采集的数据；

所述目标操作还包括：

6.根据权利要求4所述的方法，其特征在于，通过如下方式确定满足所述预设条件：

当所述目标函数收敛时，确定满足所述预设条件。

7.一种用于控制无人驾驶设备的模型训练方法，其特征在于，所述方法包括：

8.根据权利要求7所述的方法，其特征在于，所述第一数据和所述第二数据为针对同一无人驾驶设备而采集的数据；

所述目标操作还包括：

9.一种控制无人驾驶设备的装置，其特征在于，所述装置包括：

确定模块，用于基于所述当前的控制指导参数数据及所述目标隐变量，得到当前的控制参数；

10.一种用于控制无人驾驶设备的模型训练装置，其特征在于，所述装置包括：

11.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1-8中任一项所述的方法。

12.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述权利要求1-8中任一项所述的方法。